Estimação de parâmetros utilizando a média amostral

Estimação de parâmetros utilizando a média amostral

Probabilidade e

Estatística

Aula 12

Estimação de Parâmetros Utilizando a Média Amostral

Leitura Prévia

•Capítulo 7 do livro do Yates –Seções 7.1, 7.4.

•Capítulo 7 da apostila do Ynoguti

Introdução

•Capítulos anteriores apresentaram propriedades dos modelos de probabilidade.

•Nas aplicações da teoria da probabilidade assumimos que o modelo de probabilidade que representa as saídas do experimento era conhecido.

•Há muitas situações nas quais o modelo não é conhecido e devemos coletar dados com o objetivo de aprender sobre o modelo. Esta área de estudo é denominada de inferência estatística.

Média Amostral

Assuma que ntentativas repetidas e independentes de um experimento foram executadas. Cada tentativa resulta na observação de uma variável aleatória, X.

aleatórias X1, X2,, Xn, todas com a mesma PDF de X.

Após ntentativas temos valores amostrais de nvariáveis

Deve-se notar que a média amostral é uma V.A. e não um número. Ou seja, não confundir Mn(X) com E(X).

Valor Esperado da Média Amostral

n XXXEXME n

Variância da Média Amostral

XXXVarXMVar n

21 n XnVarn

XVarXVarXVarXMVar n = ++=

Valor Esperado e Variância da Média Amostral

O valor esperado não depende de n.

A variância varia com o inverso de n. Se ntende a infinito a variância tende a zero.

Ou seja, se ntende a infinito, torna-se altamente provável que

Mn(X) seja arbitrariamente próximo a seu valor esperado, E[X]. Ou seja, a média amostral converge para o valor esperado quando o número de amostras tende a infinito.

Exemplo 1

•Seja X uma V.A. exponencial com valor esperado igual a 1. Seja Mn(X) a média amostral de namostras independentes de X.

Quantas amostras são necessárias para garantir que a variância da média amostral seja menor ou igual a 0.01?

Solução

Como X é exponencial, Var(X) = 1. Logo são necessárias pelo menos 100 amostras.

Intervalo de Confiança e Coeficiente de Confiança

Intervalo de Confiança e Coeficiente de Confiança

A média amostral dista do valor esperado no máximo c(para mais ou para menos). O comprimento do intervalo, 2c, é denominado de intervalo de confiança.

A probabilidade da média amostral estar no intervalo de confiança é pelo menos 1 −α. O parâmetro αé denominado de coeficiente de confiança (segurança).

Intervalo de Confiança e Coeficiente de Confiança

Se o coeficiente de segurança é pequeno, podemos ter grande confiança de que Mn(X) esteja no intervalo

Exemplo 2

Associando X = 1 se o eleitor apoiar o candidato José da Silva e X = 0 em caso contrário, temos uma variável aleatória de Bernoulli com valor esperado E[X] = pe variância Var(X) = p(1-p).

Com c= 0.03 (3%) tem-se:

Solução O coeficiente de confiança é dado por

A confiança no resultado aumenta à medida em que αdiminui. Como não sabemos o valor de p, vamos tentar tornar o resultado independente de p.

Para tal, vamos investigar a curva p(1 –p).

Solução

A curva tem um máximo para p= ½, que vale ¼. Logo, podemos escrever:

Como utilizou-se um universo de tamanho n= 1103 amostras, temos que a estimativa de pestá dentro de 3 pontos percentuais com probabilidade de pelo menos 0.75 . Se quisermos aumentar o coeficiente de confiança devemos aumentar o número de amostras.

Lei Fraca dos Grandes Números Lei Fraca dos Grandes Números

Exemplo 3

Realizamos ntentativas independentes de um experimento e estamos interessados em estimar a probabilidade de um evento A ocorrer. Calcular o menor valor de ntal que nossa estimativa esteja em um intervalo de confiança igual a 0.02 com coeficiente de confiança igual a 0.9.

Solução

Vamos fazer X = 1 quando o evento A ocorrer e X = 0 em caso contrário. Podemos utilizar a frequência relativa, Mn(X), como estimativa da probabilidade do evento A ocorrer. Vamos denominar esta estimativa de P’[A]

X é uma variável aletarória de Bernoulli com valor esperado E[X] = p = probabilidade do evento A ocorrer –P[A]

Solução De novo, p(1-p) é menor ou igual a 0.25, logo:

Como queremos um intervalo de confiança de 0.02, temos c= 0.01. Como queremos um coeficiente de segurança de 0.9 temos

n= 2.5 x 106tentativas.

Comentários