Docsity
Docsity

Prepare-se para as provas
Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity


Ganhe pontos para baixar
Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium


Guias e Dicas
Guias e Dicas

Planejamento de experimentos - Apostilas - Química Industrial Parte1, Notas de estudo de Química Industrial

Apostilas de Química Industrial sobre o estudo das técnicas de planejamento de experimentos, Elementos Básicos da Experimentação, Planejamento Completamente Aleatorizado com Único Fator.

Tipologia: Notas de estudo

2013

Compartilhado em 29/04/2013

Wanderlei
Wanderlei 🇧🇷

4.5

(131)

383 documentos

1 / 21

Documentos relacionados


Pré-visualização parcial do texto

Baixe Planejamento de experimentos - Apostilas - Química Industrial Parte1 e outras Notas de estudo em PDF para Química Industrial, somente na Docsity! 1 Capitulo 1- Introdução Praticamente em todas as áreas do conhecimentos o uso da estatística em especial das técnicas de planejamento de experimentos são imprecendiveis para as tomadas de decisão visando a avaliação de novos procedimentos ou a otimização de processos e produtos. Segundo Montegomery(2001), um experimento planejado é um teste, ou série de testes, no qual são feitas mudanças propositais nas variáveis de entrada de um processo, de modo a podermos observar e identificar mudanças correspondentes na resposta de saída. Figura 1.1: Modelo geral de um processo O processo, como mostra a Figura 1, pode ser visualizado como uma combinação de máquinas, métodos e pessoas, que transforma um material de entrada em um produto de saída. Este produto de saída pode ter uma ou mais características da qualidade observáveis ou respostas. Algumas das variáveis do processo pxxx ,,, 21  são controláveis, enquanto outras, qzzz ,,, 21  são não-controláveis(embora possam ser controláveis para efeito de teste). Algumas vezes, esses fatores não-controláveis são chamados fatores de ruído. Os objetivos do experimento podem incluir 1. Determinação de quais variáveis são mais influentes na resposta y . 2. Determinação do valor a ser atribuído aos x ’s influentes de modo que y esteja perto da exigência nominal. 3. Determinação do valor a ser atribuído aos x ’s influentes de modo que a variabilidade em y seja pequena. 4. Determinação do valor a ser atribuído aos x ’s influentes de modo que os efeitos das variáveis não-controláveis sejam minimizados. Assim, métodos de planejamento experimental podem ser usados tanto no desenvolvimento do processo quanto na solução de problemas do processo, para melhorar o seu desempenho ou obter um processo que seja robusto ou não-sensível a fontes externas de variabilidade. 2 Aplicação dos Planejamentos Experimentais na Industria são fundamentais para desenvolvimento de novos produtos e para o controle de processos. Nesta área é comum aparecer problemas em que se precisa estudar várias propriedades ao mesmo tempo e estas, por sua vez, são afetadas por um grande número de fatores experimentais. È papel de técnicas de planejamento de experimentos, auxiliar na fabricação de produtos com melhores características, na diminuição do seu tempo de desenvolvimento, aumentar a produtividade de processos e minimizar a sensibilidade a fatores externos (NETO et al., 2001). A análise de dados para os modelos de planejamento de experimentos fica praticamente inviabilizada sem o uso de softwares específicos. Neste material é apresentado as possíbilidades de análise de dados para modelos de planejamento pelo software R. O software R, que é uma linguagem e ambiente para computação estatística e gráfica de domínio público (VENABLES e SMITH, 2001), atualmente muito difundido nos grandes centros, contudo pouco conhecido em Goiás. Este software pode ser uma ótima alternativa para o trabalho com Análise de Experimentos, pois, tem apresentado igual ou superior eficiência para análise de dados, além de haver material disponível na internet e listas de discussão que servem como guia de suporte e aprendizagem. Nesta apostila serão apresentados um resumo dos principais modelos de planejamento de experimentos, dentre os quais destacamos: Planejamento completamente aleatorizado com único fator, Planejamento completamente aleatorizado com blocos, Planejamento Fatoriais e Planejamentos Hierarquicos e para cada modelo apresentou-se a sequencia de comandos em R para a análise estatística dos modelos, que geram os resultados finais como o Quadro da ANOVA, as Comparações Multiplas e a Análise de Resíduos. 5 Vamos considerar um exemplo apresentado em Werkema & Aguiar (1996) para ilustrar melhor os princípios básicos do planejamento de experimentos: Exemplo 2.1- Suponha que um engenheiro esteja interessado em estudar o efeito produzido por três diferentes banhos(meios) de têmpera: têmpera em água, em óleo e em solução aqüosa de cloreto de sódio (água salgada) na dureza de um determinado tipo de aço. Aqui o propósito era determinar qual banho de têmpera produziria a dureza máxima do aço. Com este objetivo ele decidiu submeter um determinado número de amostras da liga, que denominaremos corpos de prova, a cada meio de têmpera e a seguir mediu a dureza da liga. Vamos ilustrar a aplicação dos princípios do planejamento neste problema. Réplica: Neste caso uma réplica do experimento completo consiste em medir a dureza de um corpo de prova submetido à têmpera em água, de um segundo corpo de prova submetido à têmpera em óleo e de um terceiro temperado em solução de cloreto de sódio.Isto é, realizar uma réplica do experimento completo significa coletar uma observação da variável resposta em cada condição experimental considerada no estudo. Portanto, se seis corpos de prova são temperados em cada banho (água, óleo e água salgada), sendo feita a seguir a medida da dureza de cada um destes corpos de prova, dizemos que foram realizadas seis réplicas do experimento(sendo realizados dessa forma 6x3=18 ensaios). Aleatorização: Neste experimento a aleatorização deve-se fazer presente pela distribuição ao acaso dos corpos de prova entre os banhos de têmpera. Este procedimento atenua por exemplo situações onde a espessura dos corpos de prova são ligeiramente diferentes, assim de todas as amostras com espessura maior foram submetidas a um mesmo banho de têmpera este provavelmente estará em situação vantajosa e os resultados do experimento estarão tendenciosos. Blocos: Supor que os corpos de prova são provenientes de corridas diferentes ( ou matérias primas diferentes), se planejarmos um experimento onde estes corpos de prova sejam distribuídos ao acaso entre os diferentes banhos de têmpera, as diferenças entre os corpos de prova irão acrescentar uma variabilidade adicional às medidas de dureza, o que poderá mascarar os efeitos devidos ao fator de interesse (banho de têmpera). Para eliminar do erro experimental a variabilidade devida ao fato de os corpos de prova terem sido produzidos em corridas diferentes, deve-se realizar o experimento da seguinte maneira: cada corpo de prova será dividido em três partes iguais, sendo cada parte submetida a um diferente banho de têmpera. Deste modo, dentro de cada terno formado pelas três partes de um mesmo corpo de prova, a influência devida às características particulares de cada corpo de prova deverá ocorrer de forma aproximadamente igual para cada um dos banhos de têmpera. Dentro da terminologia básica temos que: Unidade Experimental: Corpo de prova do aço utilizado no estudo. Fatores: Banhos de têmpera. Níveis do Fator: água, água salgada e óleo 6 Ensaio: Cada ensaio consiste em tratar um corpo de prova em um determinado banho de têmpera. Variável Resposta: É a dureza do corpo de prova medida após a realização da têmpera. 2.1.5- Roteiro para a Realização de um Bom Experimento. Para usar a abordagem estatística no planejamento e na análise de um experimento é necessário que as pessoas envolvidas na experimentação tenham, antecipadamente, uma idéia clara do que será estudado e da forma como os dados serão coletados. Também é recomendado que se tenha uma idéia qualitativa de como os dados serão analisados. Um roteiro para a realização de um bom experimento é apresentado a seguir: 1. Reconhecimento e relato do problema. Na prática, geralmente é difícil perceber que existe um problema que exige experimentos planejados formais, de maneira que não pode ser fácil obter-se um relato claro de problema que é aceito por todos. No entanto é de primordial importância desenvolver todas as idéias do problema e definir de forma clara os objetivos específicos do experimento. 2. Escolha dos fatores e dos níveis. Devem ser escolhidos os fatores que devem variar, os intervalos sobre os quais esses fatores variarão e os níveis específicos nos quais cada rodada será feita. Exige-se conhecimento do processo para fazer isso, esse conhecimento em geral é uma combinação de experiência prática e conhecimento teórico. É importante a investigação de todos os fatores que possam ser importantes e evitar ser excessivamente influenciado pela experiência passada. 3. Escolha da variável resposta: Na escolha da variável resposta, o experimentador deve ter certeza de que aquela variável realmente fornece informação útil sobre o processo em estudo e a capacidade de medida dessa variável. Se a capacidade do medidor é baixa, então apenas grandes efeitos dos fatores serão detectados pelo experimento, ou será necessário muitas réplicas. 4. Escolha do planejamento experimental. A escolha do planejamento envolve consideração sobre o tamanho da amostra(número de replicações), seleção de uma ordem adequada de rodadas para as tentativas experimentais, ou se a formação de blocos ou outras restrições de aleatorização estão envolvidas. 5. Realização do experimento. Quanto da realização do experimento, é de vital importância monitorar o processo, para garantir que tudo esteja sendo feito de acordo com o planejamento. Erros no procedimento experimental nessa etapa, em geral comprometem a validade do experimento. 6. Análise dos dados. Métodos estatísticos devem ser usados para analisar os dados, de modo que os resultados e conclusões sejam objetivos e não de opinião. Se o experimento foi planejado corretamente o método estatístico para análise não será um problema. A análise de resíduos e a verificação da validade do modelo são importantes e devem ser feitas. 7. Conclusões e recomendações. Uma vez analisados os dados, o experimento deve acarretar conclusões práticas sobre os resultados e recomendar um curso de ação. Deve-se auxiliar de métodos gráficos, particularmente na apresentação dos resultados para outras pessoas. Seqüências de acompanhamento e testes de confirmação devem ser também realizados para validar as conclusões do experimento. 7 2.2 – Exercícios do Capítulo 1. Planeje um experimento para comparar quatro drogas no alívio de cefaléias, supondo que você dispõe de um conjunto de pacientes similares. 2. Planeje um experimento para comparar três fórmulas de adubação no crescimento de Pinus, supondo que você dispõe de um terreno heterogêneo que deve ser dividido em cinco blocos e que em cada bloco podem ser alocadas nove parcelas. 3. Planeje um experimento para comparar dois testes de inteligência tomando cada criança como um bloco. 4. Planeje um experimento para comparar o desempenho(tempo de realização da tarefa) de três máquinas empacotadeiras, dispondo de 5 operadores. 10 Mas pode-se particionar TSQ de forma que:             k i n j k i k i n j iijiij yyyynyy 1 1 1 1 1 2 . 2 ... 2 .. )( (3.4) Demonstração: Ver Montogomery 2001. A relação em (3.4), mostra que a variabilidade total nos dados, medida pela soma de quadrados total, pode ser particionada em uma soma de quadrados das diferenças entre as médias dos tratamentos e a média geral, e na soma de quadrados das diferenças entre as observações dentro de cada tratamento e a média do respectivo tratamento. Diferenças entre médias de tratamentos observadas e a média geral quantificam diferenças entre tratamentos, enquanto diferenças das observações dentro de um tratamento e a média do tratamento podem ser devidas apenas a um erro aleatório. Dessa forma, reescrevemos (3.4) como ETratT SQSQSQ  , onde:      k i n j ijT yySQ 1 1 2 .. : Soma dos quadrados total.     k i iTrat yynSQ 1 2 ... : Soma dos quadrados devido aos tratamentos.      k i n j iijE yySQ 1 1 2 . : Soma dos quadrados dos erros. Calculando os valores esperados de TratSQ e ESQ tem-se :    k i iTrat nkSQE 1 22)1()(  (3.5) Demonstração: Ver Montgomery (2001) Sob oH verdadeira, temos que 2 )1( 1        Trat SQ k E Se 1H é verdadeira, então 1)1( 1 1 2 2           k n SQ k E k i i Trat   11 A razão 1  k SQ QM TratTrat é chamada média quadrática dos tratamentos. Logo, se oH é verdadeira, TratQM é um estimador não-viciado de 2 , enquanto que, se 1H é verdadeira, TratQM estima 2 mais um termo positivo que incorpora a variação devida à diferença entre as médias dos tratamentos. Da mesma forma, tem-se que 2)1()(  nkSQE E (3.6) Então a média quadrática dos erros )1(   nk SQ QM EE é um estimador não-viciado de 2 , independente de oH ser ou não verdadeira. Analisaremos também a partição dos graus de liberdade. SQT : tem 11  knN graus de liberdade TratSQ : tem 1k graus de liberdade ESQ : tem )1( nk graus de liberdade Supondo que cada uma das k populações possa ser modelada com uma distribuição normal. Com essa suposição pode-se mostrar que, sob oH , então:  )1(,1~ )1( 1    nkk E Trat E Trat o FQM QM nk SQ k SQ F (3.7) Se oH é verdadeira TratQM e EQM são estimadores não viciados de 2 , mas se oH é falsa então  TratQME será maior que )( EQME , assim sob a hipótese alternativa, oF será grande. Dessa forma um teste de hipótese é construído. Devemos rejeitar oH se o valor da estatística é grande, isso implica em uma região crítica unilateral superior. Então rejeita-se oH se )1(),1(,  nkko FF  . No geral utiliza-se o seguinte quadro para ANOVA. Tabela 3.2 - Quadro da Anova Fonte de Variação SQ LG. QM oF Entre Tratamentos TratSQ 1k TratQM E Trat o QM QM F  Dentro dos Tratamentos (Erro) ESQ )1( nk EQM Total SQT 1kn 12 Estimativas dos efeitos dos tratamentos: ...ˆ yyii  , ki ,...,2,1 3.2 Análise de Resíduos. O modelo matemático de um planejamento completamente aleatorizado, considera que as observações sejam distribuidas de forma normal, com mesma variância. Essas suposições podem ser verificadas através da análise de resíduos. Um resíduo é a diferença entre uma observação ijy e seu valor estimado (ou ajustado) a partir do modelo estatístico que esta sendo utilizado, denotado por ijŷ . Para o modelo específico temos que .ˆ iij yy  , com cada resíduo sendo .iijij yy  , ou seja, a diferença entre uma observação e a média correspondente observada do tratamento. Para identificar se as suposições estão sendo violadas utilizamos básicamente três tipos de gráficos: Resíduos X Ordem de Coleta, Resíduos X Tratamentos (médias .iy ) e Gráfico de probabilidade normal dos Resíduos. O gráfico de Resíduos X Ordem de Coleta busca identificar algum tipo de associação dos resíduos com a ordem de coleta das observações. A identificação de algum tipo de associação viola a suposição de indepêndencia entre os dados, portanto espera-se em uma análise de resíduos que não haja associoação entre resíduos e ordem de coleta. O gráfico deve apresentar uma configuração aleatória entre resíduos e ordem de coleta. Figura 3.1: Gráfico Resíduo X Ordem Na Figura 3.1, tem-se uma típica configuração aleatória entre ordem X resíduos, validando a suposição de independência entre as observações. 15 e   TyyTyy jijiji  .... , ji  respectivamente. 3.4- Análise Estatística de um Planejamento Completamente Aleatorizado com o uso do Software R. Neste tópico vamos ilustrar a utilização do software R na análise de dados para o modelo de planejamento de experimento completamente aleatorizado. 3.4.1- Descrição do Programa O software R, que é uma linguagem e ambiente para computação estatística e gráfica de domínio público (VENABLES e SMITH, 2001), atualmente muito difundido nos grandes centros. A linguagem R é derivada da linguagem do Software S-plus. Sua sintaxe é semelhante com a linguagem C, e sua estrutura é de linguagem funcional. A tela inicial do programa está ilustrada na figura abaixo: Figura 3.4 : Tela Inicial do Software R. O simbolo > indica a linha de comando (“prompt”) na qual serão digitados os comandos para a execusão das análises. 16 Ordem Água Ordem Óleo A Ordem Óleo B 24 36,7 11 36 4 35,3 12 38,9 26 36,4 14 35 25 38,7 9 35,3 15 34,3 22 38,8 23 36,8 17 35,7 21 37,6 2 36,9 20 35,2 8 37,2 18 37,5 3 34,2 13 38,8 1 35,3 5 36,5 16 38 10 36 6 35,8 7 37,2 19 35,7 27 35,5 O R tem um sistema de ajuda on-line que permite que a documentação seja exibida em um browser (explorer,mozilla,ou similar). Para iniciar este sistema on-line clique em “help” depois “html help”. Para uma consulta rápida, quando já se sabe o nome da função, basta digitar help(nome_da_função). Para conhecer ou lembrar os parâmetros ou argumentos da função utilize o comando args(nome_da_função). Quando se quer listar todas as funções que possuem um determinado termo utiliza-se o comando apropos(termo). Por Exemplo: > apropos(vector) [1] ".__C__vector" "as.data.frame.vector" "as.vector" [4] "as.vector.factor" "is.vector" "vector" Por ser gratuito, o R não possui suporte oficial. Existe uma lista de discussão através do endereço http://www.r-project.org/mail.html, que se tem mostrado um suporte interativo bastante eficiente. 3.4.2 – Aplicação do Software R na analise de dados para o planejamento de experimentos completamente aleatorizado com único fator. Para ilustrarmos a aplicação desse modelo, utilizamos o problema proposto em Werkema & Aguiar (1996) descrito abaixo: Os técnicos de uma indústria metalúrgica, desejam avaliar a dureza de peças de aço após diferentes banhos de têmpera. O experimento consistiu em submeter nove peças de aço a cada tipo de banho de têmpera (água, óleo A e óleo B), a seguir medir a dureza no centro das peças temperadas e comparar as durezas médias obtidas, com o objetivo de identificar o meio de têmpera mais adequado. Este é um exemplo de um experimento com um único fator (banho de têmpera) com 3k níveis (água, óleo A e óleo B) e n = 9 réplicas. Neste experimento, os 27 ensaios ou testes foram realizados em ordem aleatória. Na Tabela 9, apresenta-se os resultados do experimento. Tabela 3.3 : Dados do experimento com a ordem dos ensaios. Neste caso a matriz de planejamento de experimento pode ser montada com a seguinte seqüência de comandos para entrar com os dados do experimento: 17 Montando as colunas resposta e ordem: >y<- scan() : Depois do comando o próximo passo é digitar os valores da resposta seguidos de enter e para encerrar digite enter duas vezes. >or<- scan() : Depois do comando o próximo passo é entrar com os dados da ordem do ensaio da mesma forma anterior. Montando a variável tratamento: >x<-rep(1:3,each=9) : no caso temos 3 tratamentos com 9 repetições, ou, >x1<-factor(rep(1:3,each=9),labels=c("agua","oleoA","oleoB")) Montando o data.frame ( matriz de dados e fatores) bt<-data.frame(resp=y, ordem=or, trat=x1) Assim, a matriz de planejamento terá a seguinte forma: resp ordem trat 1 36.7 24 agua 2 38.9 12 agua * * * 26 35.8 6 oleoB 27 35.5 27 oleoB Para a análise descritiva o primeiro passo é indicar o caminho das variáveis no data.frame, isso é feito com o comando attach(bt) . O comando tapply, possibilita a manipulação de dados no data.frame. Para um resumo descritivo usamos a seqüência: tapply(resp,trat,summary) $água Min. 1st Qu. Median Mean 3rd Qu. Max. 36.70 37.20 38.00 37.99 38.80 38.90 $óleoA Min. 1st Qu. Median Mean 3rd Qu. Max. 35.30 35.70 36.00 36.21 36.80 37.50 $óleoB Min. 1st Qu. Median Mean 3rd Qu. Max. 34.20 35.00 35.30 35.28 35.70 36.50 O comando resultou em um resumo descritivo das respostas por tratamento. Uma inspeção gráfica pode ser obtida pelo Gráfico de Box-Cox. 20 Figura 3.6: Comparações Múltiplas. O resultado pode ser melhor ilustrado pela Figura 3.6, que é gerado através do comado: > plot(TukeyHSD(av)) O modelo de análise de variância assume que as observações são independentes, com distribuição normal de mesma variância em cada tratamento. Dessa forma devemos analisar o comportamento dos resíduos através dos seguintes gráficos:  Gráfico de resíduos contra ordem de coleta das observações (tempo)  Gráfico de resíduos contra Valores Ajustados  Gráfico de probabilidade normal. Para o Gráfico de resíduos contra ordem de coleta das observações (tempo), utiliza-se o comando: >plot (ordem,av$res,xlab="Ordem",ylab="Resíduos",col="red") Aqui “ordem” é o vetor associado a ordem de realização do experimento, “av$res” é o vetor relacionado com os resíduos gerados pelo modelo, xlab é o nome da coordenada x, ylab é o nome da coordenada y e col é a cor desejada. Da mesma forma para Resíduos X Valores Ajustados temos: Figura 3.7 – Gráficos: Resíduos X Ordem e Resíduos X Valores Ajustados 21 >plot(av$fit,av$res, xlab="Valores Ajustados",ylab="Resíduos",col="blue") Para o Gráfico Normal tem-se a seqüência de comando: >qqnorm(av$res,xlab="Quantil da Normal",ylab="Resíduos") Este comando plot os quantis da distribuição normal contra os valores dos resíduos ordenados >qqline(av.$res) Este comando ajusta a reta entre os pontos. Neste caso espera-se que os dados se alinhem em torno da reta ajustada. Figura 3.8 – Gráfico Normal de Probabilidade dos Resíduos Considerando o gráfico dos Resíduos X ordem, não se identifica nenhum relação existente, validando dessa forma a suposição de independência entre os resíduos. Para o gráfico de resíduos X valores ajustados (médias) a suposição testada era a de variação igual para ambos os tratamentos, neste caso também parece não haver ocorrido violação da suposição. No gráfico normal de probabilidade (QQ-Plot) os dados também parecem não terem violado de forma comprometedora a suposição de normalidade. Abaixo apresenta-se os testes de Bartlett para homogeneidade de variâncias nos tratamentos e Shapiro-Wilk para normalidade dos resíduos.
Docsity logo



Copyright © 2024 Ladybird Srl - Via Leonardo da Vinci 16, 10126, Torino, Italy - VAT 10816460017 - All rights reserved