Análise de Variância

Análise de Variância

(Parte 1 de 3)

1 - DELINEAMENTOS UNI-FACTORIAIS2
1.1 - DELINEAMENTO COMPLETAMENTE ALEATÓRIO2
1.2 - DELINEAMENTO EM BLOCOS COMPLETOS ALEATÓRIOS4
1.3 - DELINEAMENTO EM QUADRADO LATINO7
2 - DELINEAMENTOS MULTI-FACTORIAIS10
COMPLETOS ALEATÓRIOS10
2.2 - DELINEAMENTO EM BLOCOS SUB-DIVIDIDOS (SPLIT-PLOT)1

ÍNDICE 2.1 - DELINEAMENTO BI-FACTORIAL EM BLOCOS BIBLIOGRAFIA.............................................................................................................14

1 - DELINEAMENTOS UNI-FACTORIAIS

1.1 - DELINEAMENTO COMPLETAMENTE ALEATÓRIO

O delineamento completamente aleatório utiliza-se quando se pretende distribuir de um modo completamente casual ou aleatório os tratamentos pelas diversas unidades experimentais, que deverão ser totalmente homogéneas, ou assumidas como tal. Quaisquer diferenças ocorridas entre as diversas repetições do mesmo tratamento são consideradas como devidas ao acaso, constituindo na sua totalidade a parcela designada por erro experimental ou variação residual.

Assim, este delineamento deverá utilizar-se em situações em que as diversas unidades experimentais são homogéneas, tais como ensaios laboratoriais em as condições ambientais são facilmente controláveis.

Nos ensaios de campo, por muito idênticas que sejam as diversas unidades experimentais, existe sempre alguma variabilidade ambiental impossível de controlar, e que vai de algum modo afectar os resultados do ensaio. Assim, a parcela do erro experimental ou residual engloba variação que não é apenas a variação casual admitida dentro de uma mesma amostra, mas devida também ao conjunto de todos os factores ambientais (tipo de solo, fertilidade do solo, exposição, drenagem, etc) que não se incluiram no delineamento experimental, mas que na realidade podem ocasionar variabilidade. Por isso, este delineamento não é muito usual em situações de ensaios de campo ou onde é pressuposto que as unidades experimentais não são rigorosamente homogéneas.

A maior vantagem deste delineamento reside na sua implantação nas unidades experimentais (talhões de terreno, animais, etc), e na facilidade de interpretação dos resultados (assumindo que sejam correctos), pois toda a variação é atribuída aos tratamentos ou ao erro experimental. Além disso, este delineamento é caracterizado pela sua grande flexibilidade, isto é, permite que o ensaio contenha qualquer número de tratamentos (ou modalidades do mesmo factor), e que cada tratamento tenha qualquer número de repetições, podendo eventualmente ser diferentes de tratamento para tratamento (muito embora, sempre que possível, todos os tratamentos devam ter o mesmo número de repetições, pois a existência de diferentes números de repetições entre os tratamentos pode ser uma causa de variabilidade dos resultados).

Outra vantagem inerente ao delineamento completamente aleatório é que, para o mesmo número de tratamentos em ensaio, maximiza o número de graus de liberdade atribuídos à estimativa do erro experimental, isto é, tende a aumentar a estatística F (razão entre a variância atribuída ao efeito tratamento e a variância residual ou erro experimental), podendo detectar mais facilmente a existência de diferenças significativas entre os tratamentos.

A distribuição das repetições dos vários tratamentos pelas diversas unidades experimentais é feita totalmente ao acaso. Para garantir a aleatoridade da distribuição das unidades experimentais, deverá recorrer-se a um processo de aleatorização, isto é, uma regra que atribua um determinado tratamento a uma determinada unidade experimental de um modo completamente ao acaso ou aleatório, tal como o resultado de lançamento de dados, a carta retirada de um baralho, um número retirado ao acaso de tabela de números aleatórios. Isto é, já que se assume que as unidades experimentais não são rigorosamente homogéneas, o experimentador deverá abster-se completamente de, conscientemente, poder estar a atribuir determinado tratamento às unidades experimentais.

Em situações em que as características do ensaio façam prever a existência de muitas falhas nas repetições dos tratamentos, ou mesmo a supressão completa de alguns tratamentos (por exemplo, em ensaios de germinação ou de enraizamento, em que é frequente haver alguns tratamentos que conduzem a taxas nulas de germinação ou enraízamento), o delineamento completamente aleatório é o mais eficaz, pois a não exigência a priori do mesmo número de repetições por tratamento, permite ultrapassar as falhas (ou inexistência de resultados) para algumas repetições. Noutros tipos de delineamento, que exigem o mesmo número de repetições por tratamento, em situações de falhas de algumas unidades experimentais, há que recorrer a metodologias estatísticas a fim de ultrapassar essas falhas (missing data); este aspecto está desde já assegurado no delineamento completamente aleatório

Exemplo da implantação do ensaio

De seguida exemplifica-se como se pode dispor um ensaio em que se pretendem comparar T = 4 tratamentos (designemo-los genericamente como T1, T2, T3, T4), cada um com R = 5 repetições. O exemplo é sufiicentemente genérico para se poder traduzir num ensaio prático de cariz agrícola (implantação no terreno de um ensaio de experimentação de 4 níveis de adubação azotada) ou de caríz pecuário (distribuição dos animais num ensaio de experimentação de 4 tipos de suplementação proteica na alimentação animal).

O número total de unidades experimentais é N = T x R, e corresponde ao número de talhões de terreno ou de animais necessários para proceder ao ensaio em causa.

Como previamente foi dito, é pressuposto que estas unidades experimentais (no caso, N=20) devem ser suficientemente homogéneas, de modo que possam ser consideradas todas iguais.

Identifiquem-se como sendo as unidades 1, 2, 3,, 19, 20.

Cada uma destas unidades experimentais deve ser numerada para identificação.

De seguida há que atribuir a cada uma das unidades experimentais um determinado tratamento, de modo que hajam R (no caso, R=5) repetições para cada tratamento.

Esta atribuição deve ser feita de modo completamente aleatório. Par tal, ilustraremos com dois métodos aleatórios que podem ser usados numa situação deste género, não querendo fixar estes métodos como sendo os únicos válidos. O que se pretende reafirmar é que a atribuição dos tratamentos às unidades experimentais deve ser feito de um modo completamente aleatório, sem a intervenção da vontade do experimentador.

a) Método dos cartões i) Numeram-se N (no caso, N=20) cartões com as identificações das unidades experimentais. Os cartões são dobrados de modo a impossibilitar a identificação, e metem-se numa caixa, misturando-se bem. i) Numeram-se 5 cartões com o tratamento T1; 5 cartões com o tratamento T2, etc.

Isto é, para cada tratamento, fazem-se tantos cartões quantas as repetições. Estes cartões são dobrados de modo a impossibilitar a sua identificação, e são metidos numa caixa, misturando bem. i) Retira-se ao acaso um cartão de identificação da unidade experimental; suponhase que saiu o número 7. Retira-se um cartão de identificação dos tratamentos. Imagine-se que saiu um cartão com a identificação T1. Assim, à unidade experimental identificada com o número 7 vai ser atribuido o tratamento T1. iv) Repete-se o passo i) até esgotar todos os cartões. Assim, e de um modo completamente aleatório e alheio à vontade do experimentador, a cada uma das N unidades experimentais foi atribuido um tratamento.

b) Método das cartas i) Identificam-se as N (no caso, N=20) unidades experimentais. i) Fixa-se uma correspondência entre os naipes e os tratamentos. Por exemplo,

T1=ouros; T2=copas; T3=paus; T4=Espadas. i) De um baralho de cartas, tiram-se N (no caso, N=20) cartas, sendo R (no caso,

R=5) de cada naipe. Estas N cartas são baralhadas. iv) Retira-se uma destas cartas. O tratamento que identificar será atribuído à unidade experimental 1. A carta não é recolocada, sendo as restantes baralhadas. v) Repete-se sucessivamente o passo iv) até atribuir um tratamento a cada uma das N unidades experimentais.

Após a conclusão da parte experimental do ensaio, recolhem-se os dados e procede-se à análise de variância a fim de decidir se existem ou não diferenças significativas entre as médias dos diferentes tratamentos ou modalidades do ensaio. Caso a anova indique a existência de diferenças significativas, procede-se a um teste de comparações múltiplas a fim de decidir entre quais tratamentos existem as diferenças significativas.

1.2 - DELINEAMENTO EM BLOCOS COMPLETOS ALEATÓRIOS

Este delinaemento é, segundo vários autores, um dos mais frequentemente utilizados em investigação agrária, quando o ensaio envolve apenas um factor (GOMEZ & GOMEZ, 1984).

Este delineamento em blocos completos aleatórios ou casualizados é especialmente apropriado para ensaios de campo em que o número de tratamentos não é grande, e as unidades experimentais estão sujeitas a uma evidente variabilidade de produtividade ou de outros factores alheios ao delineamento em causa.

Por exemplo, num ensaio envolvendo ovelhas (que são as unidades experimentais), em que estas não são todas da mesma idade, ou se têm diferentes progenitores machos (poderiam citar-se muitas outras características não uniformes nas ovelhas em ensaio, e que constituem um gradiente ou evolução tendencial numa determinada direcção), devem agrupar-se as ovelhas em blocos ou grupos, em que cada um destes blocos inclui todas as ovelhas da mesma idade, ou com o mesmo progenitor macho. Em cada um destes blocos existirá uma repetição de cada um dos tratamentos em ensaio.

No caso de um ensaio envolvendo uma determinada cultura agrícola a experimentar em diversas modalidades ou tratamentos num terreno cujas características produtivas têm uma distribuição de evolução segundo uma das dimensões (por exemplo o comprimento) da parcela onde se irá implantar o ensaio, esta parcela deverá ser dividida em blocos ao longo dessa dimensão; cada um destes blocos será posteriormente subdividido em tantos talhões quantos os tratamentos. Deste modo, resulta que cada um destes blocos conterá todos os tratamentos.

É também o caso de um ensaio agrícola em que, pelas características da cultura em ensaio, ou devido a condicionantes diversas, o ensaio é para ser executado em mais do que um local (por exemplo, em várias explorações), ou em anos distintos. Assim, cada um dos diferentes locais (explorações) ou dos diferentes anos, constituirá um bloco, onde existirão todos os tratamentos.

No delineamento em blocos completos aleatórios ou casualizados, as unidades experimentais são agrupadas em blocos; em cada um dos blocos existirá uma repetição de cada um dos tratamentos. São constituídos tantos blocos quantas as repetições que se pretendem efectuar para cada tratamento.

O objectivo principal do agrupamento das unidades experimentais em blocos é reduzir o erro experimental pela eliminação de causas conhecidas de variação (se estas se distribuem segundo um gradiente ou padrão conhecido). Isto é conseguido agrupando as unidades experimentais em blocos tal que a variação entre as diversas unidades incluídas no mesmo bloco é minimizada, e a variabilidade entre as unidades experimentais incluídas em blocos distintos é maximizada.

Este delineamento permite estimar a variabilidade dentro dos blocos e eliminá-la da parcela da variabilidade designada por erro experimental. Isto é, utilizando a metodologia do delineamento em blocos completos aleatórios, estima-se a variabilidade ocasionada por uma causa externa ao ensaio e elimina-se do erro experimental, aumentando assim o rigor da decisão estatística, já que na análise de variância a estatística F é a razão entre a variância devida aos tratamentos e a variância residual ou erro experimental.

Já que o erro experimental ou variação residual é constituída pela variabilidade dentro de cada um dos blocos, o delinemaneto por blocos é mais efectiva quando existe um padrão ou gradiente conhecido de variabilidade. Conhecendo este padrão ou gradiente, é mais fácil decidir qual a disposição e tamanho dos blocos, de modo a que no interior de cada bloco as unidades experimentais sejam tão homogéneas quanto possível.

No delineamento em blocos completos aleatórios ou casualizados, há que decidir previamente:

i) Qual a causa de variabilidade que está sujeita a um padrão ou gradiente conhecido; i) Qual a a disposição e o tamanho dos blocos.

A causa de variabilidade usada como base na definição dos blocos é por vezes facilmente identificável, e presumivelmente aceite como uma causa alheia ao ensaio mas que pode influenciar os resultados. São exemplos destas causas:

• heterogeneidade do solo, em características tais como o declive, a textura, drenagem, exposição ao sol, fertilidade, proximidade de lençóis freáticos, etc, factores estes que existem no solo, e que não estão a ser contemplados como o factor de produção em análise; • a necessidade de efectuar o ensaio em diversos locais da mesma exploração, ou em explorações distintas; • ensaios envolvendo animais de idades diferentes, ou com progenitores distintos;

Após identificada a causa específica de variabilidade a ser usada como base na constituição dos blocos, a disposição e tamanho dos blocos devem ser decididos de modo a maximizar a variabilidade entre os blocos e a minimizar a variabilidade no interior de cada bloco. De seguida apresentam-se algumas idéias base que podem servir de pistas a esta distribuição das unidades experimentais pelos blocos:

• em situações de ensaios de campo em que o gradiente de variabilidade é unidireccional (isto é, existe um padrão nítido de variação de uma determinada causa em determinada direcção do terreno), devem constituir-se blocos compridos e estreitos, em que o maior comprimento do bloco é perpendicular à direcção do gradiente. Cada um destes blocos será dividido transversalmente em tantos talhões quantos os tratamentos do ensaio. Por exemplo, se o gradiente de variação é o declive do solo, os blocos serão constituídos segundo as curvas de nível. Cada um dos blocos é dividido transversalmente em talhões. • se o gradiente é segundo duas direcções, mas mais forte segundo uma das direcções, deve ignorar-se simplesmente o gradiente menos intenso, e proceder como na situação anterior; • se o gradiente é segundo duas direcções bem conhecidas, e igualmente forte segundo cada uma das direcções, então deverão usar-se blocos com a forma quadrada, ou preferencialmente fazer o delineamento segundo o quadrado latino; • se o gradiente de variabilidade são situações tais como a existência de animais com idades diferentes, progenitores diferentes, explorações diferentes, então o critério de constituição dos blocos será a homogneidade de idades, os mesmos progenitores, ou os animais da mesma exploração.

Como já atrás de referiu, cada um dos blocos conterá uma repetição de cada um dos tratamentos; isto que dizer que cada um dos blocos terá tantas unidades experimentais quantos os tratamentos em análise. Os blocos constituem assim as diversas repetições. Assim, no delineamento em blocos completos aleatórios ou casualizados, todos os tratamentos têm o mesmo número de repetições (aparte de eventuiais falhas de algumas das unidades experimentais, e que terão de ser suplantadas por metodologias estatísticas referentes a situações de falta de dados - missing data - cuja abordagem não cabe no âmbito deste curso).

Como cada um dos blocos recebe todos os tratamentos, a casualização (isto é, a distribuição ao acaso dos tratamentos pelas unidades experimentais) terá de fazer-se dentro de cada um dos blocos. Para tal, em cada um dos blocos deverá proceder-se a um método aleatório de atribuição de tratamentos à unidades experimentais. Pode usar-se qualquer método estatístico (por exemplo, os descritos para o delineamento completamente aleatório) que garanta a isenção do experimentador.

1.3 - DELINEAMENTO EM QUADRADO LATINO

O delineamento em quadrado latino é uma extensão do delineamento em blocos completos aleatórios ou casualizados, mas em que existem tantas repetições quantos os tratamentos, resultando de dois critérios simultâneos de agrupamento em blocos, genericamente designados pelos blocos-linha e blocos-coluna.

O quadrado latino é o delineamento típico numa situação em que existem dois gradientes ou padrões simultâneos e da mesma intensidade, de causas estranhas ao ensaio, cuja variabilidade se pretende eliminar do erro experimental.

Para tal faz-se um agrupamento em blocos seguindo um dos padrões ou gradientes (designados por blocos-linha), e outro agrupamento em blocos segundo o outro dos gradientes (blocos-coluna). Como em cada um dos blocos devem existir todos os tratamentos, resulta que o número de blocos-linha é igual ao número de blocos-coluna; assim, em cada linha e em cada coluna existem todos os tratamentos, de onde resulta que o número de repetições é igual ao número de tratamentos.

Este delineamento permite estimar a variabilidade ao dentro dos blocos-linha e a variabilidade dentro dos blocos-coluna, e eliminá-la da parcela da variabilidade designada por erro experimental. Isto é, utilizando a metodologia do quadrado latino conseguem-se estimar as variabilidades ocasionadas por duas causas externas ao ensaio e eliminá-las do erro experimental, aumentando assim o rigor da decisão estatística, já que na análise de variância a estatística F é a razão entre a variância devida aos tratamentos e a variância residual ou erro experimental.

De seguida apresentam-se algumas situações de utilização do delineamento em quadrado latino:

• ensaios de campo em que na área de terreno onde se irá implantar o ensaio existem dois gradientes evidentes de variabilidade das características do solo; • ensaios repetidos ao longo de vários anos ou ao longo de vários períodos de tempo (tantos quantos os tratamentos); • ensaios em que se utilizam animais de diferentes idades (um dos gradientes) e de diferentes progenitores (outro dos gradientes); • ensaios laboratoriais repetidos ao longo do tempo, em que as diferenças entre as unidades experimentais utilizadas num mesmo instante e as diferenças entre as unidades experimentais utilizadas em instantes diferentes são as duas causas externas de variabilidade.

O maior óbice à utilização do delineamento em quadrado latino reside precisamente no mesmo aspecto em que se baseia a sua maior vantagem, isto é, no facto de o delineamento pressupor tantas repetições quantos os tratamentos.

Num ensaio em que se testam 8 diferentes modalidades ou tratamentos, necessitam-se para cada tratamento de 8 repetições, o que obriga a dispor de 64 unidades experimentais, (com 9 tratamentos, necessitar-se-iam de 81 unidades experimentais) cujo acompanhamento e recolha de informação não é de modo algum fácil.

(Parte 1 de 3)

Comentários