Apostila Planejamento Fatorial - Estatística

Apostila Planejamento Fatorial - Estatística

(Parte 3 de 12)

O simbolo > indica a linha de comando (“prompt”) na qual serão digitados os comandos para a execusão das análises.

O R tem um sistema de ajuda on-line que permite que a documentação seja exibida em um browser (explorer,mozilla,ou similar). Para iniciar este sistema on-line clique em “help” depois “html help”.

Para uma consulta rápida, quando já se sabe o nome da função, basta digitar help(nome_da_função).

Para conhecer ou lembrar os parâmetros ou argumentos da função utilize o comando args(nome_da_função).

Quando se quer listar todas as funções que possuem um determinado termo utiliza-se o comando apropos(termo). Por Exemplo:

> apropos(vector)

[1] ".__C__vector" "as.data.frame.vector" "as.vector"

[4] "as.vector.factor" "is.vector" "vector"

Por ser gratuito, o R não possui suporte oficial. Existe uma lista de discussão através do endereço http://www.r-project.org/mail.html, que se tem mostrado um suporte interativo bastante eficiente.

3.4.2Aplicação do Software R na analise de dados para o planejamento de experimentos completamente aleatorizado com único fator.

Para ilustrarmos a aplicação desse modelo, utilizamos o problema proposto em Werkema & Aguiar (1996) descrito abaixo:

Os técnicos de uma indústria metalúrgica, desejam avaliar a dureza de peças de aço após diferentes banhos de têmpera. O experimento consistiu em submeter nove peças de aço a cada tipo de banho de têmpera (água, óleo A e óleo B), a seguir medir a dureza no centro das peças temperadas e comparar as durezas médias obtidas, com o objetivo de identificar o meio de têmpera mais adequado. Este é um exemplo de um experimento com um único fator (banho de têmpera) com níveis (água, óleo A e óleo B) e = 9 réplicas. Neste experimento, os 27 ensaios ou testes foram realizados em ordem aleatória. Na Tabela 9, apresenta-se os resultados do experimento.

Tabela 3.3 : Dados do experimento com a ordem dos ensaios.

Neste caso a matriz de planejamento de experimento pode ser montada com a seguinte seqüência de comandos para entrar com os dados do experimento:

Montando as colunas resposta e ordem:

>y<- scan() : Depois do comando o próximo passo é digitar os valores da resposta seguidos de enter e para encerrar digite enter duas vezes.

>or<- scan() : Depois do comando o próximo passo é entrar com os dados da ordem do ensaio da mesma forma anterior.

Montando a variável tratamento:

>x<-rep(1:3,each=9) : no caso temos 3 tratamentos com 9 repetições, ou,

>x1<-factor(rep(1:3,each=9),labels=c("agua","oleoA","oleoB"))

Montando o data.frame ( matriz de dados e fatores)

bt<-data.frame(resp=y, ordem=or, trat=x1)

Assim, a matriz de planejamento terá a seguinte forma:

resp ordem trat

1 36.7 24 agua

2 38.9 12 agua

*

*

*

26 35.8 6 oleoB

27 35.5 27 oleoB

Para a análise descritiva o primeiro passo é indicar o caminho das variáveis no data.frame, isso é feito com o comando attach(bt) . O comando tapply, possibilita a manipulação de dados no data.frame. Para um resumo descritivo usamos a seqüência:

tapply(resp,trat,summary)

$água

Min. 1st Qu. Median Mean 3rd Qu. Max.

36.70 37.20 38.00 37.99 38.80 38.90

$óleoA

Min. 1st Qu. Median Mean 3rd Qu. Max.

35.30 35.70 36.00 36.21 36.80 37.50

$óleoB

Min. 1st Qu. Median Mean 3rd Qu. Max.

34.20 35.00 35.30 35.28 35.70 36.50

O comando resultou em um resumo descritivo das respostas por tratamento.

Uma inspeção gráfica pode ser obtida pelo Gráfico de Box-Cox.

>plot(resp~trat,xlab="Banho de Têmpera",ylab="Dureza", col ="red")

Figura 3.5: Box-Plot para os Valores de Dureza Obtidos em cada Banho de Têmpera.

Pela Figura 3.5 e medidas descritivas acima, pode-se observar que parece haver uma diferença entre os banhos de óleo e o de água, sendo que a maior dureza média foi observada no banho de água.

O problema agora é verificar se essas diferenças de fato são significativas ou podem ser de origem aleatória. Para constatarmos se de fato as diferenças são significativas utilizaremos à análise de variância.

Para a Análise de Variância temos a seguinte seqüência de comandos:

aov(formula, data = NULL, projections = FALSE, qr = TRUE,

contrasts = NULL, ...)

Este comando efetua e guarda todos os resultados da ANOVA do modelo (formula)

av<-aov(resp~trat) :

O comando names(av) lista todos os vetores de resultados gerados pela ANOVA como por exemplo o vetor de resíduos.

> names(av)

[1] "coefficients" "residuals" "effects" "rank" "fitted.values" "assign" "qr"

[8] "df.residual" "contrasts" "xlevels" "call" "terms" "model"

Para utilizar esses vetores deve-se referenciar como por exemplo av$res ou av$fitt , aqui será listado o vetor de resíduos e o vetor de valores ajustados pelo modelo proposto.

Agora utiliza-se o comando summary(av) ou anova(av) , que geram a Tabela da ANOVA abaixo:

Analysis of Variance Table

Response: resp

Df SumSq Mean Sq F value Pr(>F)

trat 2 34.145 17.073 28.389 4.732e-07 ***

Residuals 24 14.433 0.601

---

Signif. codes: 0 `***' 0.001 `**' 0.01 `*' 0.05 `.' 0.1 ` ' 1

Assim, como é um valor bem maior que 1, temos evidências significativas para concluir que pelo menos um tratamento difere dos demais. Essa evidência é mais facilmente verificado pelo p-value que neste caso é dado por Pr(>F)=4.732e-07 , ou seja, a diferença é significativa a um nível de abaixo de 0.001.

Dessa forma verifica-se que as médias diferem, isto é, que o tipo de banho utilizado afeta a dureza das peças temperadas.

(Parte 3 de 12)

Comentários