(Parte 1 de 2)

Delineamento em Blocos Casualizados

Estatística Experimental

1. DELINEAMENTO EM BLOCOS CASUALIZADOS (DBC) Suponha que um experimentador esteja interessado em estudar os efeitos de 3 diferentes dietas. A primeira providência do pesquisador foi a de se inteirar a respeito da natureza do material experimental disponível. Feito isto, constatou que ele disporia de 12 animais com aproximadamente o mesmo peso. Entretanto, estes 12 animais eram provenientes de 4 ninhadas, cada uma contendo três animais. Dentro de uma ninhada, os três animais foram sorteados às três dietas. Os animais foram colocados em 12 baias idênticas e alimentados com as dietas sorteadas, em idênticas condições. Mediu-se, então, o ganho de peso desses animais depois de 12 semanas. Os dados obtidos são apresentados no quadro abaixo:

12 3 4

Dieta Ninhada Total

O delineamento experimental para este ensaio de dietas é um exemplo de um Delineamento em Blocos Casualizados com três tratamentos e quatro blocos. Os tratamentos são níveis de um fator experimental, as três dietas; os blocos são os níveis do fator confundido, as ninhadas. Dado que os animais em diferentes ninhadas respondem diferentemente a uma dada dieta, a ninhada é considerada, um fator de confundimento. As 12 unidades experimentais (animais) são agrupados em 4 blocos de tal forma que, dentro de cada grupo, três unidades são afetadas pelo mesmo nível do fator de confundimento. Por causa da porção das características inerentes aos animais dentro de uma mesma ninhada (bloco), suas respostas serão muito similares, enquanto que as respostas dos animais pertencentes a diferentes ninhadas irão variar muito; isto é, as unidades experimentais são mais homogêneas dentro dos blocos do que entre os blocos. Assim, resumidamente, podemos definir que um DBC é um delineamento no qual as unidades (unidades experimentais) às quais os tratamentos são aplicados são subdivididos em grupos homogêneos, denominados de blocos, tal que o número de unidades experimentais em um bloco é igual ao número (ou algum múltiplo do número) de tratamentos estudados. Os tratamentos são então sorteados às unidades experimentais dentro de cada bloco. Deve-se ressaltar que cada tratamento aparece em cada bloco, e todo bloco recebe todos os tratamentos. Quando se usa o DBC, o objetivo é isolar e remover do termo de erro (resíduo) a variação atribuída ao bloco, garantindo assim, que as médias dos tratamentos estão livres do efeito dos blocos. A efetividade deste delineamento depende da habilidade em se obter blocos homogêneos de unidades experimentais. A habilidade para formar blocos homogêneos depende do conhecimento que o pesquisador tem do material experimental. Quando os blocos são usados adequadamente, o QMR (quadrado médio do resíduo) no quadro da ANOVA será reduzido, a estatística F aumentará, e a chance de se rejeitar H0 (hipótese de nulidade) será maior. Em experimentos com animais, quando acredita-se que diferentes raças de animais responderá diferentemente ao mesmo tratamento, a raça do animal pode ser usada como um fator a ser considerado na formação dos blocos. O DBC pode, também, ser

Delineamento em Blocos Casualizados

Estatística Experimental empregado efetivamente quando um experimento deve ser conduzido em mais de um laboratório (bloco) ou quando vários dias (blocos) são requeridos para a realização do experimento. No DBC temos os três princípios básicos da experimentação: repetição, casualização e controle local.

• Com o agrupamento das parcelas, geralmente se obtém resultados mais precisos que aqueles obtidos num DIC.

• Desde exista material experimental suficiente, o delineamento será sempre balanceado, podendo-se incluir qualquer número de tratamentos.

• A análise estatística é bastante simples.

• Se a variância do erro experimental é maior para alguns tratamentos que para outros, pode-se obter um erro não viesado para testar qualquer combinação específica das médias dos tratamentos.

PRINCIPAL DESVANTAGEM Aparece quando da perda de parcela(s) em algum tratamento. Apesar de existir um método apropriado de estimação desses valores, há a perda de eficiência na comparação de médias envolvendo esses tratamentos.

2. ORGANIZAÇÃO DOS DADOS NO DBC. Vamos considerar k -tratamentos; r – blocos e ijyé o valor observado na parcela que recebeu o tratamento i e se encontra no bloco j. Assim, um quadro para representar os valores amostrais de um DBC pode ser da forma abaixo:

TRAT. 1 2 3j ... r TOTAL MÉDIA
Y1r Y1+
Y2r Y2+
Y3r Y3+

Yij .

k Yk1 Yk2 Yk3Ykr Yk+

+kY

Y+j
Y+r Y++

TOTAL Y+1 Y+2 Y+3 3. MODELO MATEMÁTICO

Delineamento em Blocos Casualizados

Estatística Experimental

65 • sendo:

aleatórioerrodoefeitooé 0comtratamentoésimoidoefeitoé

0comblocoésimojdoefeitooé sobservaçõeastodasacomumgeralmédiaé blocoésimojnotratamentoésimoiorecebeuqueobservaçãoay

1j i

1j j

4. SUPOSIÇÕES DO MODELO. Neste modelo,

• cada ijyobservado constitui uma amostra aleatória independente de tamanho 1 de cada uma das kr populações

• os ijε são independentes e normalmente distribuídos com média 0 e variância

2σ, ou seja, ),(~2 ij0Nσε. Isto implica em que as kr populações são normalmente distribuídas com média ijµ e a mesma variância 2σ, ou seja,

• os efeitos de blocos e tratamentos são aditivos. Esta suposição pode ser interpretada como não existe interação entre tratamentos e blocos. Em outras palavras, uma particular combinação bloco-tratamento não produz um efeito que é maior que ou menor que a soma dos efeitos individuais.

5. HIPÓTESE ESTATÍSTICA. Podemos testar

0ostodosnemH k21icom0H

Geralmente o teste de hipótese com relação aos efeitos de blocos não é feito por dois motivos: primeiro o interesse principal é testar os efeitos de tratamento, o propósito usual dos blocos é eliminar fontes estranhas de variação. Segundo, embora as unidades experimentais sejam distribuídas aleatoriamente aos tratamentos, os blocos são obtidos de uma maneira não aleatória.

Delineamento em Blocos Casualizados

Estatística Experimental

6. PARTIÇÃO DA SOMA DE QUADRADOS. Voltemos ao quadro de representação das observações no DBC

TRAT. 1 2 3j ... r TOTAL MÉDIA
Y1r Y1+
Y2r Y2+
Y3r Y3+

Yij .

k Yk1 Yk2 Yk3Ykr Yk+

+kY

Y+j
Y+r Y++
jY++++
rY++++

Podemos identificar os seguintes desvios:

• ++++++++−−−−yyij, como o desvio de uma observação em relação a média amostral geral;

• ++++−−−−iijyy, como o desvio da observação em relação à média de seu grupo ou do i-ésimo tratamento;

• ++++++++++++−−−−yyi, como o desvio da média do i-ésimo tratamento em relação á média geral.

• ++++++++++++−−−−yyj como o desvio da média do j-ésimo bloco em relação á média geral.

Consideremos a identidade a qual representa a “ a variação de uma observações em relação à média geral amostral como uma soma da variação desta observação em relação à média de seu grupo, com a variação desta observaçãoem relação à média do j-ésimo bloco em que se encontra esta observação, com a variação do erro experimental “. Elevando-se ao quadrado os dois membros da identidade acima e somando em relação aos índices i e j, obtemos:

2 jiij iij2 ij

O termo

Delineamento em Blocos Casualizados

Estatística Experimental é denominado de Soma de Quadrados Total e vamos denotá-lo por SQT.O número de graus de liberdade associado à SQT é kr - 1, ou N – 1, pois temos N observações e a restrição

O termo:

é denominado de Soma de quadrados de tratamentos, representada por SQTr, e é uma medida da variabilidade entre os tratamentos. Quanto mais diferentes entre si forem as médias dos tratamentos, maior será a SQTr. Desde que temos k tratamentos e a restrição de que

0yy k a SQTr está associada a k-1 graus de liberdade. O termo

É denominado de Soma de quadrados de blocos, representada por SQB, e é uma medida da variabilidade entre os blocos. Quanto mais diferentes entre si forem as médias dos blocos, maior será a SQB, justificando assim, a utilização do delineamento em blocos. Desde que temos r blocos e a restrição de que

0yy k a SQB está associada a r-1 graus de liberdade. Finalmente, o termo

2 jiijyyyy

Notem que a magnitude da SQR não depende da diferença entre as médias dos tratamentos. Os graus de liberdade associada à SQR é (k-1)(r-1), isto é, o produto dos graus de liberdade dos tratamentos e blocos e os graus de liberdade associados a cada membro da equação acima fica

totalblocos tratamentos resíduo

kr-1 = (r-1) + (k-1) + (k-1)(r-1)

Delineamento em Blocos Casualizados

Estatística Experimental

7. QUADRADOS MÉDIOS. Dividindo a SQB, SQTr e SQR pelos correspondentes graus de liberdade, obtemos, respectivamente o Quadrado Médio Blocos (QMB), o Quadrado Médio Entre Tratamentos (QMTr) e o Quadrado Médio Resíduo, isto é,

SQRQMRe 1k

8. ESTATÍSTICA E REGIÃO CRÍTICA DO TESTE. A estatística para o teste é a qual, deve ser próximo de 1 se H0 for verdadeira, enquanto que valores grandes dessa estatística são uma indicação de que H0 é falsa. A teoria nos assegura que Fc tem, sob H0 distribuição F – Snedecor com (k -1) e (k-1)(r-1) graus de liberdade no numerador e no denominador, respectivamente. Resumidamente, indicamos:

Rejeitamos H0 para o nível de significância α se o quantil de ordem )(α−−−−1 da distribuição F-Snedecor com (k -

1) e (k-1)(r-1) graus de liberdade no numerador e no denominador.

9. QUADRO DA ANÁLISE DE VARIÂNCIA (ANOVA). Dispomos as expressões necessárias ao teste na Tabela abaixo, denominada de Quadro de Análise de Variância (ANOVA).

de variaçãogl SQ QM F

Fonte

Blocos r – 1 krYk

−−−−∑∑∑∑

Tratamentos k - 1 krYr

−−−−∑∑∑∑

SQTr −−−− QMR QMTr

TOTAL kr – 1 ij kr

Pode-se provar que:

Delineamento em Blocos Casualizados

Estatística Experimental

• 2QMREσ====)(, ou seja, QMR é um estimador não viesado da variância 2σ;

1k rQMTrEτσ)()(, ou seja, QMTr é um estimador não viesado da

10. DETALHES COMPUTACIONAIS. Apresentaremos alguns passos que facilitam os cálculos das somas de quadrados da ANOVA.

• Calcule a correção para a média N

• Calcule a Soma de Quadrados dos Totais (SQT) CMySQT k

• Calcule a Soma de Quadrados Entre os Tratamentos (SQTr)

CMr YSQTr

• Calcule a Soma de Quadrados de blocos (SQB) CM k YSQB

• Calcule a Soma de Quadrados Residual (SQR) pela diferença, isto é, SQBSQTrSQTSQR −−−−−−−−==== ;

• Calcule os Quadrados Médios Entre os Tratamentos (QMTr) e o Quadrado

Médio Residual (QMR) ))((, 1r1k

SQRQMRe 1k

• Calcule Fc para tratamentos QMR QMBFeQMR

1. EXEMPLO 1: Vamos considerar os dados apresentados no item1. Os cálculos para montar-mos o quadro da ANOVA são: k = 3, r = 4, e kr = N =(3)(4) =12. Então

• Graus de liberdade:

Delineamento em Blocos Casualizados

Estatística Experimental

QMTrF cBlcTr , ,

Fonte deg.l. SQ QM Fc

Organizando estes resultados no Quadro da ANOVA, temos: variação valor FcTr = 26,64 é maior do que estes valores tabelados, então rejeitamos a hipótese nula H0 para um nível %,,1ou010====α de probabilidade (se é significativo a 1%, também é significativo a 5%), e concluímos que existe uma diferença entre as três dietas. As conclusões sobre ás diferenças entre os efeitos de ninhadas (blocos) podem ser baseadas no Fc para blocos (FcBl = 2,98 com p=0,118). Parece que não existe uma variação significativa entre as ninhadas nos ganhos de peso. O teste F da ANOVA para os blocos é um teste aproximado mesmo quando as suposições são satisfeitas. Alguns pesquisadores sugerem que não se considere o efeito colocado nos blocos em futuros estudos similares, somente se o valor mínimo significativo (valor de p) associado à estatística calculada for maior ou igual a 0,25 ),(250p≥≥≥≥. Para estes dados, FcBl = 2,9 tem um p = 0,118. Portanto, mesmo que existe insuficientes evidências para rejeitar 0Hj0====β:, ou seja, não existe efeito de ninhada, não é uma boa idéia ignorar os efeitos de ninhada em futuros estudos.

Resultados fornecidos pelo Minitab

Analysis of Variance for Peso
SourceDF S MS F P
Dieta2 6.06 3.03 26.75 0.001
Ninhada3 1.07 3.69 2.9 0.18
Error6 7.41 1.23

Total 1 84.54

Delineamento em Blocos Casualizados

Estatística Experimental

Individual 95% CI
DietaMean ----+---------+---------+---------+-------
128.70 (------*-----)
23.15 (------*------)
334.08 (-----*------)
----+---------+---------+---------+-------
28.0 30.0 32.0 34.0

12. ESTIMAÇÃO DE PARCELA PERDIDA. Um problema relativamente sério deste tipo de delineamento ocorre quando perdemos uma (ou mais) parcela(s) durante o desenvolvimento do experimento. Vamos considerar o seguinte exemplo:

Exemplo:

Classe de idade (Blocos)

Trat. 1 2 3 4 Total

A generalização destes dados pode ser representada no quadro abaixo

Trat. 1 2 3j ... r Total

Blocos

Y1r
Y2r

ijYˆ

K Yk1 Yk2 Yk3Ykr
Total 1Y++++2Y++++
jY++++rY++++

sendo:

.tan ;tan perdidaparcelaaocorreuondebloconotesresparcelasdastotaloY perdidaparcelaaocorreuondetratamentonotesresparcelasdastotaloY sdisponíveiparcelasdastotaloY blodenúmeroorestratamentodenúmerook perdidaparceladaestimativaaY j I

Delineamento em Blocos Casualizados

Estatística Experimental

Uma solução interessante para o caso da perda de uma parcela consiste em estimar seu valor usando a fórmula:

YrYkYY jI ij

No exemplo acima, temos uma parcela perdida no tratamento C no bloco 3 (classe de idade). Nestes dados temos:

• a estimativa da parcela é dado por 1744

Este valor deve ser substituído no lugar do dado perdido e a análise é feita como anteriormente. A única diferença é que se perde um grau de liberdade no resíduo, obtendo-se o seguinte quadro de análise de variância:

Fonte deg.l. SQ QM Fc

Variação

Observação: Nessa última análise, o quadrado médio do resíduo está corretamente estimado, mas aquele correspondente a tratamento está ligeiramente exagerado. Para corrigi-lo, basta subtrair da SQTr a seguinte quantidade:

Então, temos: 5935

Fc = 9,93. Como o valor de ),:,(050114cFF>>>>a conclusão sobre a presença de pelo menos um efeito de tratamento não nulo, continua valendo. OBS: Muitas vezes, dispensa-se o uso dessa correção, já que nem sempre ela altera os resultados. Entretanto, na dúvida, devemos aplicar essa correção. Fazendo esta mesma análise no MiniTab, com asterisco no lugar da parcela perdida temos o seguinte resultado

Delineamento em Blocos Casualizados

Estatística Experimental

FactorType Levels Values
Blocofixed 4 1 2 3 4
Tratfixed 5 A B C D E
SourceDF Seq S Adj S Adj MS F P
Bloco3 3.40 400.48 133.49 4.23 0.032
Trat4 1253.42 1253.42 313.35 9.93 0.001
Error1 347.18 347.18 31.56
Total18 1934.0

General Linear Model: Y versus Bloco; Trat Analysis of Variance for Y, using Adjusted S for Tests

Reparem que a SQTr já esta corrigida, ou seja, quando se usa o MiniTab ou o SAS não é necessário estimar a parcela e depois substituí-la nos dados e fazer a ANOVA. Nestes programas a correção da SQTr é feita automaticamente. No MiniTab é necessário seguir os seguintes passos:

• Stat/ANOVA/General Linear Models e nesta janela colocar os termos do modelo em “Model” na ordem apresentada.

• Antes de acionar o OK nesta janela vá à janela “General Model – Options” marcar na Sum of Square a Adjusted (Type I) e OK

Delineamento em Blocos Casualizados

Estatística Experimental

13. ANÁLISE DE VARIÂNCIA DE MEDIDAS REPETIDAS. Um delineamento experimental de medidas repetidas é aquele no qual, várias medidas são feitas na mesma unidade experimental (geralmente animal), e estas medidas repetidas constituem as repetições. Para ilustrar melhor esta característica vamos considerar o exemplo 2, item 1 da Aula 3 , pg 35. Neste exemplo tínhamos 4 amostras independentes de animais e todos os animais de cada grupo foram alimentados, depois do sorteio, com uma das 4 dietas. Nos delineamentos de medidas repetidas não existe amostras independentes de animais; ao contrário, cada um dos 5 animais terão seus pesos medidos depois que foram submetidos a uma determinada dieta, depois de um certo período de tempo, os mesmos cinco animais terão seus pesos avaliados depois de terem sidos submetidos a outra dieta, e assim sucessivamente, até serem submetidos a todas as dietas. A tabulação dos dados pode ser bem parecida com a representação dos dados do DBC. Neste exemplo podemos ter:

Dietas

Animais 1 2 3 4 TOTAL

Os resultados dos cálculos da ANOVA de um delineamento de medidas repetidas são os mesmos de uma análise de um DBC. A grande vantagem deste tipo de delineamento é o seu econômico requerimento de unidades experimentais (animais). Este delineamento tem desvantagens se existe um efeito por causa da seqüência em que os tratamentos são administrados (dietas no presente exemplo) aos animais. Uma outra desvantagem surge se o tempo entre a aplicação de diferentes tratamentos é insuficiente para evitar a sobreposição de efeitos do tratamento anterior. EXEMPLO. Considere o conjunto de dados abaixo os quais se referem a níveis de concentração de colesterol (mg/dl) em sangue de 7 animais experimentais, depois que foram tratados cada um com uma das três drogas, com suficiente tempo entre as aplicações das drogas para que seu efeito desaparecesse do animal.

(Parte 1 de 2)

Comentários