ANOVA 2 fatores

ANOVA 2 fatores

(Parte 1 de 4)

ANOVA 2 fatores (two-way) Introdução ♥

Em muitos trabalhos que envolvem a realização de experimentos, é comum os pesquisadores se depararem com a questão: como avaliar se os resultados obtidos são confiáveis? Sabemos que qualquer medida realizada é sempre afetada por erros. Erros muito pequenos não trarão grandes implicações. Contudo, se forem significativos, poderão prejudicar seriamente os resultados levando a falsas conclusões. Portanto conhecer a natureza dos erros e preparar planejamentos que possam minimizá-los é uma estratégia que deve estar presente no dia-a-dia de todo pesquisador.

Existem dois tipos de erros, o erro sistemático e o erro aleatório. O primeiro tem como característica afetar os resultados dos experimentos sempre na mesma direção, seja para mais ou para menos. Um exemplo simples deste tipo de situação é o caso de uma balança descalibrada que pode indicar sempre massas maiores que as reais. Mas vale notar que os erros sistemáticos podem ser identificados e, portanto, evitados. Por outro lado, há um tipo de erro que afeta as medidas sem nenhuma tendência clara. As medidas podem oscilar, ora para mais, ora para menos. Este tipo e erro é chamado de erro aleatório e, infelizmente, sempre estará presente em maior ou menor grau.

Ao fazer um estudo é sempre interessante fazer replicatas, repetições, pois permite que o erro presente nas medidas seja investigado. Além disso, com a realização de várias replicatas aumentam as chances de se aproximar mais do valor exato. Isto é evidenciado por um importante princípio da estatística: o teorema do limite central, que comprova que o erro no valor médio é menor que o erro de uma observação individual (referência: Barros Neto, B,

Scarminio, I.S., Bruns, R.E. Como fazer experimentos: pesquisa e desenvolvimento na ciência e na indústria. Ed. da Unicamp; Campinas, 2001).

Muitas vezes as características do procedimento experimental dificultam muito a execução de replicatas autênticas. Não é correto simplesmente realizar duas medidas do mesmo experimento de forma seqüencial, pois um erro que afetar a primeira medida certamente irá, de forma sistemática, afetar a seguinte.

Não são raros os casos em que o ajuste das condições experimentais é extremamente trabalhoso ou lento. Portanto, parece haver um dilema, realizar medidas com duplicatas e arcar

I nessa introdução as idéias expostas foram copiadas do artigo: Conseqüências da análise incorreta de experimentos blocados, sob autoria de João Alexandre Bortoloti e Roy Edward Bruns. Artigo publicado na revista Química Nova, vol. 30, nº 2, págs. 436-440, 2007.

com o custo do trabalho envolvido, mas garantir a qualidade das medidas, ou evitar um grande esforço no laboratório, mas correr o risco de ter todo o seu trabalho prejudicado. É neste contexto que surge uma interessante possibilidade, a blocagem dos experimentos.

continuação da aula sobre Anova 1 fator Ao analisar os dados classificados em dupla-entrada, temos de aplicar o método da classificação 1 fator duas vezes: - uma vez para cada sistema de classificação. Em resumo, a anova 1 fator duas vezes (uma vez para o fator na coluna e uma vez para o fator na linha).

Veremos a aplicação desse método (anova 2 fatores) em dois tipos de delineamentos:

CRD e CRBD sob presença ou ausência de repetições, replicatas. Por repetição (replicata) se entende um teste completo de todos os tratamentos no experimento (a replication is a complete run for all treatments to be tested in the experiment).

1º) experimento inteiramente ao acaso (completely randomized design, CRD) sem repetições;

2º) experimento em blocos ao acaso (randomized complete block design (CRBD) sem repetições;

3º) experimento em blocos ao acaso (CRBD) com repetições; 4º) experimento inteiramente casualizado (CRD) com repetições.

1º) CRD. Experimento inteiramente ao acaso ♣ , sem repetições.

Exemplo 1. Por exemplo, 12 jovens foram classificados em três grupos de acordo com a idade deles.

Ao mesmo tempo eles foram classificados de acordo com o sexo em dois grupos: masculino e feminino. Assim, cada jovem esteve sujeito a dois sistemas de classificação simultaneamente, Tabela 1. Tabela 1. Dados obtidos no experimento tipo CRD.

colunas

linhas efeito linha

♠ (-1) = efeito coluna = média coluna 1(=6) – média geral (=7) ♥ (+3) = efeito linha = média linha 2(=10) – média geral (=7)

Cálculo da Soma de Quadrados Total

Cálculo da Soma de Quadrados Resíduo (há dois métodos) a) por meio da diferença (método mais fácil)

SQ Total = SQ LINHA + SQ COLUNA + SQ RESÍDUO

I Denomina-se experimento inteiramente ao acaso quando os tratamentos (fatores) são designados às unidades experimentais sem qualquer restrição. Esse tipo de delineamento só pode ser conduzido quando as unidades experimentais (corpos-de-prova, pessoas, etc...) são similares. Por similares deve-se entender: não no sentido de igualdade, mas no sentido de que essas unidades respondem ao tratamento da mesma forma.

assim, SQ RESÍDUO = SQ Total – (SQ LINHA + SQ COLUNA)

SQ RESÍDUO = 120 – (56+42) = 120 – 98 = 2

Cálculo dos Graus de Liberdade (gl) Fator Linha = Blocos = b-1 e no nosso exemplo é 3 – 1 = 2 Fator Coluna = G-1 e no nosso exemplo é 4 – 1 = 3 Total é N-1 e no nosso exemplo é 12 – 1 = 1 Resíduo é ( N-1 ) - [ (B-1) +(G-1) ] = ( BK-1 ) - [ (B-1) +(G-1) ] = (B-1)(G-1) e no nosso exemplo o gl resíduo é igual a 1-(2+3) = 6 = (3-1)(4-1) = (2)(3)

Tabela 2. ANOVA 2 fatores para os dados da Tabela 1.

Efeito (ou fonte de variação) gl SQ QM razão F p-valor

Conclusão. Apenas o efeito fator (Linhas) é estatisticamente significante. Os valores médios dos três níveis diferem. Há pelo menos uma diferença entre as três médias. Não temos condições, por meio do teste anova, de dizer se a diferença se encontra entre a linha 1 e a linha 2 ou entre a 1 e a 3 ou entre a 2 e a 3. O teste de comparação múltipla de Tukey, por exemplo, poderá nos indicar qual desses três pares de médias apresenta diferença estatística.

2º) CBRD. Experimento em blocos ao acaso • , sem repetições.

Vamos considerar, agora, os experimentos casualizados. Nesse delineamento os tratamentos são designados às unidades experimentais com certa restrição: são sorteados dentro de cada bloco.

Neste item ao considerar os CBRD vamos estudar os casos sem repetição, ou seja, com apenas uma aplicação dos tratamentos às unidades experimentais.

Para a análise dos dados em planejamentos desse tipo, convém recordar o que foi dito anteriormente: “ao analisar os dados classificados em dupla-entrada, temos de aplicar o método da classificação 1 fator duas vezes: - uma vez para cada sistema de classificação. Em resumo, a anova 1 fator duas vezes (uma vez para o fator na coluna e uma vez para o fator na linha)”.

Quando as unidades experimentais não são similares, devia ser intuitivamente claro que as variações nas unidades por si mesmas poderiam ofuscar (obscurecer) os verdadeiros efeitos do tratamento. O método de blocagem considera forma de avaliar as unidades heterogêneas em todos os tipos de experimentação.

I O CBRD é um delineamento no qual as unidades - às quais os tratamentos são aplicados - são subdivididas em grupos homogêneos (chamados de blocos), de modo que o número de unidades em um bloco seja igual ao número (ou algum múltiplo do número) de tratamentos que esteja sendo estudado. Os tratamentos são então designados ao acaso às unidades experimentais dentro de cada bloco. Deve-se enfatizar que cada tratamento aparece em cada um dos blocos, e cada bloco recebe cada um dos tratamentos em estudo. Assim, cada um dos blocos inclui todos os tratamentos. Dentro de cada bloco os tratamentos são atribuídos às parcelas inteiramente ao acaso. Para que o experimento seja eficiente (aumente em precisão, diminuição da variância erro ou resíduo), deverá cada bloco ser tão uniforme quanto possível, mas os blocos poderão diferir bastante uns dos outros. O pesquisador só deve optar por experimento tipo CRD quando dispõe de número suficientemente grande de unidades experimentais similares. Como isso nem sempre acontece na prática, é preciso um delineamento que permita comparar adequadamente os tratamentos, mesmo que as unidades apresentem certa heterogeneidade. Unidades similares são agrupadas (dá-se o nome de blocos a esse conjunto de unidades similares). Os experimentos em blocos ao acaso surgiram na área agrícola. O campo era dividido em blocos e os blocos eram divididos em parcelas que recebiam os tratamentos (adubo, por exemplo) em investigação. Então o termo bloco designava originalmente, uma faixa de terra de mesma fertilidade. Esse tipo de delineamento surgiu em 1925 na Inglaterra por R. A. Fisher que foi, também, o idealizador do método ANOVA. O bloco pode ser uma faixa de terra, uma ala de estufa, um período de tempo, uma ninhada, uma partida de produtos industriais, uma faixa de idade – tudo depende do que está em experimentação. O CBRD pode ser empregado de forma muito eficiente quando um experimento deve ser efetuado em mais de um laboratório (blocos) ou quando vários dias (blocos) são necessários para a sua realização. O essencial é que os blocos reúnem unidades similares e que haja variabilidade entre blocos. Não teria sentido organizar esses blocos se não houvesse variabilidade entre eles. Quem vai decidir se a variabilidade entre as unidades justifica ou não a formação de blocos é o pesquisador, não o estatístico. Embora o bloco deva reunir unidades similares, isso não significa que essa reunião deva ser física. Por exemplo, se um médico pretende comparar duas drogas hipotensoras, A e B, e considerar que a pressão arterial do paciente, no início do tratamento, é importante na resposta do paciente à droga, deve organizar blocos. Cada bloco será formado por um par de pacientes com pressões arteriais similares, mas, para formar os blocos, o médico não precisa colocar seus pacientes em fila, nem juntá-los aos pares. Basta reunir os dados numéricos. Dois pacientes do mesmo bloco não precisam nem mesmo se conhecer. O objetivo do CBRD é isolar e remover do termo resíduo (erro) a variação atribuível aos blocos, aumentando assim a precisão do experimento sem aumentar o número de unidades experimentais.

Historicamente, os blocos casualizados é o primeiro delineamento válido para estimar o erro experimental e testar a significância dos efeitos de tratamento apesar da heterogeneidade das unidades experimentais sobre as quais as observações são realizadas. Esse delineamento revolucionou os experimentos na agricultura no mundo todo. Não seria um exagero afirmar que ele é ainda a espinha dorsal do delineamento da ciência experimental. Porém, nenhum delineamento torna-se popular e aceito para uso geral, não importa quão bem fundamentado do ponto de vista estatístico que ele seja, se for complicado e difícil de empreendê-lo. A beleza desse planejamento em blocos é a feliz combinação de validade, simplicidade e flexibilidade.

O planejamento em blocos consiste de duas etapas. A primeira é a de coletar, reunir, as unidades afins, similares para juntas formarem um grupo homogêneo; esse grupo formado é chamado de bloco. Essa operação é conhecida como blocagem. A segunda etapa é a de designar os vários tratamentos ao acaso às unidades dentro de cada bloco. Essa é a principal diferença entre o delineamento em blocos e o delineamento inteiramente casualizado. Em termos de casualização pode-se considerar que, em blocos, há uma restrição.

Veremos, a seguir, a aplicação desse método para um experimento onde a unidade experimental é “a pessoa que vira bloco”. Ela recebe, sob aplicação aleatória, dois tratamentos A e B. Convém recordar que, experimentos desse tipo, onde a unidade experimental é a pessoa que recebe todos os tratamentos em comparação, é um caso especial de experimento em blocos casualizados♠. “Toda vez que a pessoa que participa do experimento recebe todos os tratamentos em comparação, essa pessoa é um bloco – não uma unidade”. Esse tipo de experimento é muito criticado. Por exemplo, a diferença que se mede na pessoa, antes e depois de uma série de exercícios físicos, só seria explicada pelos próprios exercícios físicos? De qualquer forma, são feitos experimentos em que cada pessoa é um bloco. O pesquisador precisa apenas estar alerta para o fato – que é possível – de a pessoa se modificar por qualquer outro motivo, que não o tratamento. Embora os experimentos em que se toma cada indivíduo como bloco sejam bastante comuns é preciso muito senso crítico para planejá-los. Muitas vezes esses experimentos não têm qualquer validade.

O pesquisador planeja um experimento em blocos ao acaso quando pretende eliminar uma causa de variação. Por exemplo, para testar o efeito de um hormônio sobre o crescimento

I Muitas idéias aqui apresentadas foram selecionadas do livro: Estatística Experimental. Autores: S. Vieira & R. Hoffmann. Ed. Atlas. Ano 1989.

de ratos – se os ratos disponíveis são de diferentes idades – o pesquisador deve organizar blocos que correspondam às idades.

Os blocos também ampliam a validade da conclusão. Por exemplo, se um entomologista quer comparar a eficiência de diversos inseticidas, tanto pode usar insetos de uma única espécie como fazer a comparação usando insetos de várias espécies. O experimento seria em blocos ap acaso se cada espécie fosse um bloco. Os blocos teriam a vantagem de ampliar a validade da conclusão. Isto porque o entomologista poderia, com base em um só experimento, estabelecer conclusões para várias espécies.

Em termos de eficiência, ou seja, de uma comparação de tratamentos qual seria o melhor delineamento: CRD ou CBRD? Qual seria a conseqüência de uma má escolha? Para responder temos de considerar o número de graus de liberdade do resíduo. Vamos, então, realizar uma comparação entre o número de graus de liberdade do resíduo de um experimento CRD frente a um experimento tipo CRBD. Na tabela ANOVA obtém-se um valor igual a (k-1)(r-1) para um experimento em blocos; enquanto, para um experimento CRD, o gl do resíduo será igual a k(r- 1), onde r é o número de réplicas (ou repetições). Se k for igual a 3 e r = 20, então, o gl de resíduo do CBRD seria igual a (3-1)(20-1) = 2 x 19 = 38 e o gl do CRD seria igual a 3(20-1) = 3 x 19 = 57. Essa diferença de 57 – 38 = 19 representa r-1 graus de liberdade, em geral.

Em termos de notação, temos inicialmente no CRD k(r-1) e depois no CBRD (k-1)(r-1), isto é, k(r-1) – (k-1)(r-1) = r-1 graus de liberdade a menos sob a escolha de um possível mau delineamento. Como o valor de F na tabela (F, de valores críticos) aumenta quando diminui o número de graus de liberdade de resíduo, é fácil entender que o uso indevido de blocos torna o teste menos sensível.

Fcalculado = QM Trat / QM resíduo ; assim, quanto menor ↓Fcalc e maior o ↑F tabela mais difícil para que se estabeleça a condição de rejeitar Ho, ou seja, de que Fcalc > F tabelado .

QM resíduo = SQ res / gl res ; assim, quanto menor ↓gl res implica ⇒ aumento de↑ QM resíduo que traz como conseqüência uma diminuição de ↓ Fcalc.

Exemplo 1. Experimento em blocos (CBRD), sem repetições. Numa pesquisa sobre o efeito do óleo de milho no teor de colesterol do sangue, o médico Dr. Bem Hur obteve os seguintes dados, de 7 pacientes, Tabela 3.

Tabela 3. Teor de colesterol no sangue, em mg por 100g, de sete pacientes.

(Parte 1 de 4)

Comentários