Estimação de parâmetros

Estimação de parâmetros

(Parte 1 de 2)

10 ESTIMAÇÃO DE PARÂMETROS

10.1 Inferência Estatística

O campo da inferência estatística consiste naqueles métodos usados para tomar decisões ou tirar conclusões acerca de uma população. Esses métodos utilizam a informação contida em uma amostra dapopulação para extrair conclusões.

A inferência estatística pode ser dividida em duas grandes áreas: estimação de parâmetros e testes de hipóteses. Como exemplo de um problema de estimação de parâmetros, suponha que um engenheiro de estruturas esteja analisando a resistência à tensão de um componente usado em um chassi de automóvel. Uma vez que a variabilidade da resistência à tração está naturalmente presente entre os componentes individuais, devido as diferenças nas bateladas da matéria-prima nos processos de fabricação e nos procedimentos de medidas (por exemplo), o engenheiro está interessado na estimação da resistência média à tração dos componentes. Na prática o engenheiro usará dados da amostra para calcular um número que é, de algum modo, um valor razoável (ou tentativa) da média verdadeira. Este número é chamado de estimativa.

10.2 Amostragem Aleatória

Na maioria dos problemas de estatística, é necessário usar uma amostra de observações a partir de uma população de interesse, de modo a tirar conclusões relativas à população.

A População consiste natotalidade das observações em que estamos interessados enquanto que Amostra é um subconjunto de observações selecionadas a partir de uma determinada população.

Para que nossas inferências sejam válidas, a amostra tem de ser representativa da população. A seleção de uma amostra é um experimento aleatório e cada observação na amostra é o valor observado de uma variável aleatória. As observações na população determinam a distribuição de probabilidades da variável aleatória.

10.3 Erro-Padrão estimado

Quando o valor numérico ou a estimativa de um parâmetro é reportado, geralmente é desejável dar alguma idéia da precisão da estimação. A medida de precisão geralmente empregada é o erro padrão do estimador que está sendo usado.

Suponha que estejamos amostrando a partir de uma distribuição normal com média e desvio padrão . Agora, a distribuição é normal, com média e desvio padrão ; assim, o erro padrão estimado de é :

(10.1)

Se não conhecermos, e substituirmos o desvio padrão S da amostra na equação (10.1), então o erro padrão estimado de será:

(10.2)

Exemplo:

Num artigo do Journal of Heat Transfer (1974) é apresentado um novo método de medir a condutividade térmica de ferro Armco. Usando uma temperatura de 100 oF e uma potência de 550W, as 10 medidas de condutividade térmica (em BTU/h.ft.-oF) obtidas conforme valores a seguir:

41,60 41,48 42,34 41,95 41,86 42,18 41,72 42,26 41,81 42,04

Uma estimativa da condutividade térmica média a 100 oF e 50 W é a média amostral ou

= 41,924 BTU/h.ft.-oF.

O erro padrão da média amostral e sendo desconhecido, podemos trocá-lo pelo desvio padrão da amostra S = 0,284, de modo a obter o erro padrão estimado de como

== 0,0898

10.4 Distribuições Amostrais

A inferência estatística trata como tomar decisões acerca de uma população baseando-se na informação contida em uma amostra aleatória proveniente daquela população. Por exemplo, podemos estar interessados no volume médio de enchimento de uma lata de refrigerante.

Um engenheiro considera uma amostra aleatória de 25 latas e calcula o volume médio amostral de enchimento como ml . O engenheiro decidirá, provavelmente, que a média da população é 300 ml, muito embora a média amostral tenha sido 298 ml, porque ele sabe que a média amostral é uma estimativa razoável de e que a média amostral de 298 ml é muito provável de ocorrer, mesmo se a média verdadeira da população for =300 ml . De fato, se a média verdadeira for 300ml, então os testes de 25 latas feitos repetidamente, talvez a cada 5 minutos, produzirão valores de que variarão acima e abaixo de =300 ml.

A média amostral é uma estatística; isto é, ela é uma variável aleatória que depende dos resultados obtidos em cada amostra particular. Uma vez que uma estatística é uma variável aleatória, ela tem uma distribuição de probabilidades.

A distribuição de probabilidades de uma estatística é chamada de uma distribuição amostral. Por exemplo, a distribuição de probabilidades, de é chamada de distribuição amostral da média.

A distribuição amostral de uma estatística depende da distribuição da população, do tamanho da amostra e do método de seleção da amostra.

10.5 Distribuições Amostrais das Médias

Considere a determinação da distribuição amostral da média da amostra. Suponha que uma amostra aleatória de tamanho n seja rejeitada de uma população normal com média e desvio padrão . Então, pela propriedade da distribuição normal, concluímos que a média da amostra tem uma distribuição normal com média

e desvio padrão .

10.6 Teorema do Limite Central

Se for uma amostra aleatória de tamanho n, retirada de uma população (finita ou infinita), com média e desvio padrão , e se for a média da amostra, então a forma limite da distribuição de quando n é a distribuição normal padrão.

A aproximação normal de depende do tamanho n da amostra. Em muitos casos de interesse prático, se n 30, a aproximação normal será satisfatória, independente da forma da população. Se n<30, o teorema central do limite funcionará, se a distribuição da população não for muito diferente da normal.

Exemplo:

Uma companhia eletrônica fabrica resistores que têm uma resistência média de 100 e um desvio padrão de 10.A distribuição de resistências é normal. Encontre a probabilidade de uma amostra aleatória de n=25 resistores ter uma resistência média menor que 95.

Solução:

Note que a distribuição amostral de é normal , com média =100 e um desvio padrão

=

Conseqüentemente, a probabilidade desejada corresponde à área sombreada da figura 10.1. Padronizando o ponto de =95 na figuras 10.1, encontramos que

(0,4938) e deste modo, P(< 95 ) = 0,5- 0,4938 = 0,0062 (0,62 %)

Se tivermos duas populações independentes, com medias e e desvios padrão e , e se e forem as médias amostrais de duas amostras independentes de tamanho n1 e n2 dessas populações, então, a distribuição amostral de

(10.3)

é aproximadamente normal padrão, se as condições do teorema central do limite se aplicarem. Se as duas populações forem normais, então a distribuição amostral de Z será exatamente a normal padrão.

Exemplo:

A vida efetiva de um componente usado em um motor de uma turbina de um avião a jato é uma variável aleatória, com média de 5000 h e desvio padrão de 40 h. A distribuição da vida efetiva é razoavelmente próxima da distribuição normal. O fabricante do motor introduz uma melhoria no processo de fabricação para esse componente, que aumenta a vida média para 5050 h e diminui o desvio padrão para 30 h. Suponha que uma amostra aleatória de n1 =16 componentes seja selecionada do processo “antigo” e uma amostra de n2 =25 seja selecionada do processo “melhorado”. Qual a probabilidade de que a diferença entre as duas médias amostrais seja no mínimo 25 h? Considere que os processos antigo e melhorado possam ser considerados como populações independentes.

Solução:

Dados: n1 =16; n2 =25; ;

= -2,14 ( Z=0,4838)

P(= 0,5 + 0,4838 = 0,9838 (98,38%)

Aplicações:

1) Um tubo de PVC é fabricado com um diâmetro médio de 1,010 cm e um desvio padrão de 0,003 cm. Encontre a probabilidade de uma amostra aleatória n=9 seções do tubo ter um diâmetro médio amostral maior que 1,009 cm e menor que 1,012 cm.

2) Uma fibra sintética, usada na fabricação de carpete, tem uma resistência à tração que é normalmente distribuída, com média 75,5 psi e desvio padrão 3,5 psi. Encontre a probabilidade de uma amostra aleatória de n=6 corpos de prova de fibra ter uma resistência média amostral à tração que exceda a 75,75 psi.

3) Considere a fibra sintética do exercício anterior. Qual o erro padrão da média amostral?

4) A elasticidade de um polímero é afetada pela concentração de um regente.Quando baixa a concentração é usada, a média verdadeira da elasticidade que é 55 e quando aumenta a concentração é usada a elasticidade média de 60. O desvio padrão da elasticidade é 4, independente da concentração.Se duas amostras aleatórias de tamanho 16 forem retiradas, encontre a probabilidade de .

10.7 Estimação de Parâmetros

Estimação é o processo que consiste em utilizar dados amostrais para estimar valores para a média e o desvio padrão de uma população e a proporção populacional.de parâmetros populacionais desconhecidos. Essencialmente, qualquer característica de uma população pode ser estimada a partir de uma amostra aleatória. Entre os mais comuns

As estatísticas amostrais são utilizadas como estimativas de parâmetros populacionais que podem ser classificadas em pontual ou intervalar.

Estimativa pontual: estimativa única de parâmetro populacional.

Estimativa intervalar: estimativa que especifica um intervalo de valores possíveis, no qual se admite esteja o parâmetro populacional.

10.8 Intervalos de Confiança

O intervalo de confiança é uma estimativa intervalar que inclui uma afirmação probabilística que indica a percentagem de intervalos que podemos esperar abranger o verdadeiro valor do parâmetro em seus limites. A amplitude de um intervalo de confiança depende de quatro itens: a dispersão dos valores populacionais, o nível de confiança indicado, o erro tolerável e o tamanho da amostra.

10. 9 Estimativa do Intervalo de Confiança da Média Aritmética ( conhecido)

Na inferência estatística, devemos tomar os resultados de uma única amostra e tirar conclusões sobre a população, e não o inverso. Na prática, a média aritmética da população é a quantidade desconhecida que está para ser estimada. Em geral, pode-se interpretar que uma estimativa do intervalo de confiança de95% significa que, se todas as amostras possíveis de um mesmo tamanho igual a n fossem retiradas, 95 % delas iriam conter a verdadeira média aritmética da população, em algum lugar dentro do intervalo em torno de suas médias aritméticas de amostras, e somente 5% delas estariam fora do intervalo. Uma vez que, na prática, somente uma amostra é selecionada e é desconhecida, nunca sabemos ao certo se determinado intervalo obtido contém uma média aritmética da população. No entanto, podemos afirmar que temos uma confiança de 95% de que selecionamos uma amostra cujo intervalo efetivamente inclui a média aritmética da população.

Em geral, o nível de confiança é simbolizado por (1- ) X 100% , onde é a proporção de caudas da distribuição que estão fora do intervalo de confiança. Portanto, para obter a estimativa do intervalo de confiança da média aritmética de (1- ) X 100% com conhecido, teremos:

(10.4)

(10.5)

onde Z é o valor correspondente a uma área (1-)/2 desde o centro de uma distribuição normal padronizada

Exemplo:

Um fabricante de papel para impressoras possui um processo de produção que opera de maneira contínua, através de um turno completo de produção. É esperado que o papel tenha um comprimento de 11 polegadas, e o desvio padrão conhecido seja 0,02 polegada. A intervalos periódicos, são selecionadas amostras para determinar se o comprimento médio do papel ainda se mantém iguala 11 polegadas ou se algo de errado ocorreu no processo de produção para que tenha sido modificado o comprimento do papel produzido. Se tal situação tiver ocorrido, deve-se adotar uma ação corretiva. Uma amostra aleatória de 100 folhas foi selecionada e verificou-se que o comprimento médio do papel era 10,998 polegadas. Estime o comprimento médio de todo o papel deste processo de produção usando um nível de confiança

(Parte 1 de 2)

Comentários