# ANOVA e o Delineamento Experimental

ANOVA e o Delineamento Experimental

(…) Statistically, in any study involving the comparison of two groups of individuals, there are three sources of variation (or error). These are 'between group' representing real differences between the two samples, 'between individual', representing biological variation and 'within individual', representing the measurement error. Although it is the first of these which is normally of interest, any measurement of it will be influenced by the other two. The best measure of between groups variation is the difference between means, with uncertainty (due to sampling) quantified by the standard error of this difference. The appropriate measure of within group variability is the standard deviation between individuals, whilst the appropriate measure of measurement error is the within patient standard deviation. A general framework encompassing all three is the analysis of variance. Fonte: A comparative assessment of cephalometric errors.

Joanna M. Battagel. European Journal of Orthodontics 15 (1993) 305-314 (página 305)

(…) Statistically, in any study involving the comparison of two groups of individuals, there are three sources of variation (or error).

(1º) These are 'between group' representing real differences between the two samples, (2º)'between individual', representing biological variation and (3º) 'within individual', representing the measurement error.

Although it is the first of these ('between group') which is normally of interest, any measurement of it will be influenced by the other two ('between individual' com biological variation e 'within individual com ‘ measurement error ').

The best measure of between groups variation is the difference between means, with uncertainty (due to sampling) quantified by the standard error of this difference.

The appropriate measure of within group variability ('between individual') is the standard deviation between individuals,

Whilst the appropriate measure of measurement error is the within patient standard deviation.

ANOVA e o Delineamento Experimental

#1) Com a assimilação de conceitos básicos de estatística experimental, o pesquisador saberá que ao planejar um experimento terá de decidir: terá três decisões:

(1) quais medições devem ser feitas (a resposta);

(2) quais condições a estudar (os tratamentos); (3) qual material experimental vai empregar (as unidades).

E, ainda, identificará as três principais fontes de variabilidade que correspondem às três decisões acima, sobre o conteúdo:

(1) variabilidade devido às condições de interesse (que desejamos);

A variabilidade está em toda parte na ciência, e, assim, o pensamento estatístico é a principal razão dos cientistas, necessitarem tanto no planejamento de seus estudos quanto para a análise dos resultados. Um bom delineamento e análise permitem conhecer a variabilidade devida às condições de interesse, mesmo na presença da variabilidade de outras fontes que afetem esses dados.

A variabilidade nas condições de interesse é a fonte de variabilidade que queremos e a sua estimativa constitui o principal objetivo do experimento. A variabilidade nas respostas é o erro de medição. Não é a fonte de variabilidade que desejamos, mas é um fato da vida na ciência que se você faz duas medições sob condições que são quase as mesmas, o número que conseguimos quase nunca é exatamente igual. A variabilidade no material experimental, como a variabilidade das respostas, não é o que procuramos, mas é inevitável. Nem sempre dois hamsters são biologicamente os mesmos; alguns apresentam naturalmente, por exemplo, concentrações de enzima maiores que outros.

#2) A fim de obtermos conclusões sobre os dados teremos de saber responder à pergunta:- quão grande é a variabilidade? O problema de medição dos erros se faz difícil por uma questão óbvia, mas um fato incômodo, porque simplesmente não podemos vê-los; apenas podemos ver as medições. O método comumente empregado para medir o tamanho do erro se chama análise de variância (ANOVA), cuja idéia é comparar a variação devido aos tratamentos, variabilidade devido às condições de interesse (que desejamos), com a variação devido ao acaso ou resíduo, que é inevitável.

Enfim, com a assimilação de conceitos básicos de estatística experimental, o pesquisador saberá que ao planejar um experimento para medir o tamanho do erro experimental terá de considerar dois princípios essenciais de um experimento: a casualização e a repetição. Segundo Sonia Vieira1, a idéia em experimentação é comparar grupos, não apenas unidades. As unidades experimentais do mesmo grupo recebem em estatística o nome de repetições ou réplicas. Para formar grupos tão iguais quanto possíveis é fundamental que os tratamentos sejam sorteados às unidades experimentais. É o que os estatísticos chamam de casualização.

Um experimento estará planejado quando estão definidos: (a) a unidade experimental; (b) a variável em análise; (c) os tratamentos em comparação; (d) a forma como os tratamentos serão designados às unidades experimentais.

#3) Se os dados obtidos não procedem de um estudo casualizado2, no caso de tratamentos serem sorteados às unidades experimentais, é difícil responder a qualquer justificativa para uso de um modelo de probabilidade, e, portanto, fica difícil justificar a relevância dos métodos usuais de inferência. Vale o slogan: “se não foi aplicada uma técnica de casualização (sorteio aleatório) então não se pode generalizar”.

1 Sonia Vieira e R. Hoffmann. Estatística Experimental. Ed. Atlas 1989, página 12-14. 2 G.W. Cobb em http://mathfprum.org/kb/plaintext.jspa?messageID=721741

Quando os dados vêem de um processo de casusalização, temos uma receita para produção de dados que permite (em princípio) repetir o processo de produção de dados uma e outra vez, que faz possível a pergunta: - “o que aconteceria se fosse repetido esse experimento muitas vezes?” Se “isto” corresponde a “produzir os dados e calcular um resumo das estatísticas”, então a distribuição de amostragem é a resposta à pergunta “o que aconteceria se eu fosse produzir esse conjunto de dados e calculasse essas estatísticas (média, por exemplo) muitas vezes?”. A distribuição de amostragem dá uma forma de relacionar dados observados às hipóteses e possíveis valores de parâmetros, ao perguntar quão provável é um determinado valor observado.

No estudo de delineamento experimental há um elo (link) entre o delineamento e a inferência, assim: delineamento→casualização→modelo probabilístico→inferência. Toda inferência se justifica por uma referência de como o estudo foi delineado. Se não houver casualização, não há base para um modelo de probabilidade, e qualquer tipo de inferência formal é especulativo. Toda inferência formal depende do modelo de probabilidade, e de que o modelo deva se ajustar ao que foi realmente efetuado na produção dos dados.

#4) Que os princípios básicos no delineamento são cinco:

Princípio 1: Seleção aleatória, processo de selecionar aleatoriamente as unidades experimentais que serão incluídas no experimento;

Princípio 2: Designação aleatória, processo de designar aleatoriamente as unidades experimentais aos tratamentos para criar grupos de tratamentos que serão similares (exceto quanto às variações casuais) antes dos tratamentos serem aplicados;

Princípio 3: Quando as observações forem coletadas seqüencialmente, a ordem de execução do experimento deve ser aleatória. Ordem de execução do experimento é o processo de designar de forma aleatória unidades à ordem de coleção dos dados;

Princípio 4: Controle dos efeitos dos fatores que não são de interesse;

Princípio 5: Replicação, processo de repetir os tratamentos ao conjunto de unidades experimentais.

Quando as diferenças observadas nos efeitos do tratamento são enormes para razoavelmente terem ocorrido por puro acaso, diremos que a diferença é estatisticamente significante. Se forem encontradas diferenças significantes entre os tratamentos após um experimento bem delineado ter sido executado, diremos que as diferenças são causadas pelos tratamentos.

#5) Toda inferência formal pertence a uma das quatro categorias3:

Os Tratamentos foram designados de forma aleatória?

Sim Não

Sim I I Não IIIIV

I: ambos os tipos de generalização se justificam;

I: a generalização da amostra à população se justifica, mas não conclusões referentes à causa;

I: as conclusões acerca das causas são justificadas, mas a generalização além da amostra é especulativa, e não se justifica pelo método de inferência;

IV: não há base alguma para o modelo de probabilidade, e assim, exceto em circunstâncias não usuais, não há justificativa alguma para uma inferência formal.

3 G.W. Cobb em http://mathfprum.org/kb/plaintext.jspa?messageID=745477