Estimativa Estatística-Media

Estimativa Estatística-Media

(Parte 1 de 6)

6 – Estimativa da Média

A estimativa é um processo em que uma amostra é selecionada, mede-se as estatísticas necessárias, como por exemplo, a altura média e desvio padrão da amostra. Então é feita uma inferência, ou seja, um processo de generalização, dizendo que a partir da média da amostra será possível concluir que ela será a média da população. Em outras palavras, com os dados da amostra tira-se conclusão da população.

Neste processo de inferência, quando se retira uma amostra da população, deseja-se obter uma amostra que seja representativa da população, então temos dois casos distintos de processo de retirada: com reposição e sem reposição. O que mais interessa em inferência é o processo de amostragem sem reposição.

No processo de amostragem sem reposição quando o tamanho da amostra é muito menor do que o tamanho da população e no processo de amostragem com reposição, considera-se o caso de população infinita. Neste caso, de um modo geral, as probabilidades de retirada de cada elemento da população se mantêm inalteradas.

No processo de amostragem sem reposição quando o tamanho da amostra é considerável em relação ao tamanho da população, considera-se o caso de população finita. Neste caso, de um modo geral, as probabilidades de retirada de cada elemento da população modificam-se e para corrigir esta distorção, utiliza-se o fator de correção finita.

Existem dois tipos de estimativa, a estimativa pontual e a estimativa intervalar. Por exemplo, quando se fala que o brasileiro tem uma altura média de 1,72 m, estamos falando da estimativa pontual. Quando se fala que o brasileiro tem uma altura média que está entre 1,70 m e 1,74 m, estamos falando da estimativa intervalar.

6.1 – Estimativa Pontual da Média

Na estimativa pontual usamos os dados da amostra para calcular um valor de uma estatística que serve como uma estimativa de um parâmetro da população.

A média da amostra x é um estimador pontual da média populacional μ.

x=μ

Exemplo 1 Vamos supor que para a população de estagiários na área de Administração, tenhamos selecionado uma amostra aleatória simples de 12 deles, em que desejamos saber qual a idade em que eles conseguiram o seu primeiro estágio em Administração, sabendo-se que a população tem um comportamento normal.

20 21 21 2 2 2 23 23 23 23 24 25 Qual a estimativa pontual da média da população? Solução

Primeiro devemos calcular a média aritmética da amostra, então precisamos de n e ∑x.

A média amostral será:4,2212269n

A estimativa pontual da média populacional é de 2,4 anos, ou seja, supõe-se que os estagiários fazem o seu primeiro estágio em Administração com uma média de 2,4 anos.

6.2 – Estimativa Intervalar da Média

Existem dois casos de estimativa intervalar da média. - Quando do desvio padrão da população não é conhecido.

- Quando do desvio padrão da população é conhecido

Quando se fala em estimativa intervalar, deseja-se criar um intervalo da média da população a partir dos dados da amostra. É preciso encontrar o limite inferior da média (Li) e o limite superior da média (Ls) para um dado intervalo de confiança, que é a probabilidade da média da população estar dentro deste intervalo. Os valores de intervalo de confiança mais comuns são: 90%, 95% e 9%. O intervalo de confiança é também chamado de nível de confiança.

Fixando um nível de confiança: 1 – α (probabilidade da média da população estar dentro do intervalo), tem-se que a média populacional estará entre um limite inferior (Li) e um limite superior (Ls), e α é o nível de significância (probabilidade da média estar fora do intervalo de confiança), conforme a figura a seguir.

O estudo de estimativa intervalar da média geralmente é dividido em três etapas:

a) Estimativa intervalar para a média populacional quando o desvio padrão da população não é conhecido para pequenas amostras (n ≤ 30): distribuição t b) Estimativa intervalar para a média populacional quando o desvio padrão da população não é conhecido para grandes amostras (n > 30): distribuição normal c) Estimativa intervalar para a média populacional quando o desvio padrão da população é conhecido: distribuição normal a) Estimativa intervalar para a média populacional quando o desvio padrão da população não é conhecido para pequenas amostras (n ≤ 30): distribuição t

Para fazer estimativa intervalar, precisaremos dos seguintes dados da amostra:

- Média da amostra: n x∑=

- Desvio padrão da amostra:

)x(S2−−=∑ou

- Tamanho da amostra: n

Para o caso de tamanho de amostra pequeno, geralmente menor ou igual a 30 e desvio padrão da população desconhecido, utiliza-se a distribuição t, que é a distribuição correta para este caso em que se têm somente os dados da amostra.

A distribuição t é uma distribuição do tipo normal e existe uma distribuição t para cada grau de confiança (1 – α) e grau de liberdade (GL). Quando o tamanho da amostra é maior do que 30, pode utilizar com uma boa aproximação a distribuição normal.

O Anexo A traz, em forma de tabela, os valores de t em função dos graus de liberdade e em função da área α. Note que a distribuição t é função de duas variáveis: o número de graus de liberdade GL e a área α. Neste nosso caso, o número de graus de liberdade é o tamanho da amostra menos um (GL = n – 1). Onde GL é o grau de liberdade. A área α é igual a 1 menos o intervalo de confiança, ou seja, se o intervalo de confiança vale 95% (0,95), então a área α vale 0,05. Se o intervalo de confiança vale 9% (0,9), então a área α vale 0,01.

Distribuição t = função(graus de liberdade; área α)

A área (1 - α) é o intervalo de confiança, onde a verdadeira média deverá estar e a área (α) é onde a média não deverá estar.

Lembrando: GL= n – 1 é o número de graus de liberdade, ou seja, o tamanho da amostra menos um.

Intervalo de confiança

Podem ser definidos os intervalos de confiança de 95%, 90% ou outros, mediante o emprego da tabela de distribuição t. Dessa maneira, a média da população, μ, pode ser avaliada dentro dos limites de confiança especificados.

Vamos construir o intervalo de confiança. A estimativa da média da população é a média da amostra mais ou menos o erro.

Este erro é chamado de margem de erro ou erro máximo de estimativa, ou seja, é o afastamento máximo da média amostral em torno da média populacional.

Margem de erro Æ μ−=xerro

A fórmula acima é a definição geral da margem de erro quando se conhece a média da população, mas quando não se conhece a média da população, a margem de erro é dada pela fórmula abaixo para o caso de σ desconhecido e n ≤ 30.

O erro é dado porÆ

n Sterro=

Então: n Stx±=μ

Limite inferior ÆerroxLi−= Æ

StxLi−=

Limite superior ÆerroxLs+= Æ

StxLs+=

Lembrando que na tabela, os seguintes dados de entrada são necessários:

GL = n – 1 é o grau de liberdade e α é a probabilidade de erro na estimação A distribuição t supõe que a população submetida à amostragem seja normal. Essa hipótese é particularmente importante para n ≤ 30.

A probabilidade de a média populacional estar entre o limite inferior (Li) e o limite superior (Ls) é o intervalo de confiança (1 – α).

α−=≤μ≤1)L(PsiÆ α−=⎟⎟⎠⎞⎜⎜⎝

StxP

Exemplo 2 Vamos supor que para a população de estagiários na área de Administração, tenhamos selecionado uma amostra aleatória simples de 12 deles, em que desejamos saber qual a idade em que eles conseguiram o seu primeiro estágio em Administração, sabendo-se que a população tem um comportamento normal.

a) Construa um intervalo de confiança de 95% para a verdadeira idade média dos estagiários. b) Calcule o erro máximo de estimativa para um intervalo de confiança de 95%.

Tem-se:∑ ∑ n = 12 =269X=051.6X2

S = 1,379 a) Intervalo de confiança de 95%.

Estimativa da média Æ n Stx±=μ

Só falta encontrar o valor de t que é função de α e do grau de liberdade. GL = n – 1 = 12 – 1 = 1 Se 1 – α = 0,95, então α = 0,05 Para GL = 1 e α = 0,05, o valor de t = 2,2010. (Anexo A) Substituindo os valores na estimativa da média, teremos:

(Parte 1 de 6)

Comentários