ESTIMAÇAO e INTERVALO DE CONFIANCA.by Belmiro

ESTIMAÇAO e INTERVALO DE CONFIANCA.by Belmiro

(Parte 1 de 2)

Introdução

Em estatística queremos estudar fenómenos de natureza aleatória e, em particular, determinar um conjunto de propriedades que os caracterizam. Esses fenómenos estão associados a população que podem ser finitas ou infinitas. Enquanto, no caso de populações finitas, pode ser possível (mas raramente aconselhável) obter a informação pretendida através de uma enumeração completa da população, já no caso de populações infinitas tal não é possível, restando-nos como alternativa recorrer à amostragem.

O aspecto essencial da estatística inferencial é que, a partir da análise dos resultados em uma amostra, permite a generalização dos dados para população. Mas, enquanto a população é estável, as amostras variam, não constituindo uma réplica em miniaturas da população. De tal constatação decorre o facto de que a estatística inferencial é essencialmente incerta, pois há sempre a possibilidade de se tomar decisão errada, uma vez que os resultados da amostra são parcialmente fortuitos. A estatística inferencial, devido a seus resultados incertos, apoia-se na teoria de probabilidade. Desejamos óptima atenção e bom proveito

Desenvolver o intervalo de confiança 1.1.2.Objectivo específico Mostrar os Intervalo de confiança para as média e as variáncias

Descrever Intervalo de confiança para o desvio padrão

Identificar os Intervalo de confiança para a média com desvio desconhecido

Estimativa Pontual para a Média O que é estimador e estimativa?

Um estimador é uma estatística amostral utilizada para obter uma aproximação de um parâmetro populacional. Mesmo que não se encontre exactamente o valor verdadeiro, este será aproximado.

Uma estimativa é um valor específico, ou um intervalo de valores, usado para aproximar um parâmetro populacional.

Estimadores

Estimativa pontual: É um valor único (número) usado para aproximar um parâmetro populacional;

Estimativa intervalar: Intervalo que tem uma probabilidade de conter o verdadeiro valor da população.

Utilizamos a média amostral x como a melhor estimativa da média populacional µ . Como a média amostral x é um valor único que corresponde a um ponto na escala numérica, ela é chamada de estimativa pontual.

Há duas razões importantes que explicam por que uma média amostral é um melhor estimador de uma média populacional µ do que quaisquer outros estimadores, como a mediana ou a moda.

Para muitas populações, a distribuição de médias amostrais x tende a ser mais consistente (apresentar menor variação) do que as distribuições de outras estatísticas amostrais.

Para todas as populações, dizemos que a média amostral x é um estimador não tendencioso para a média populacional µ .

Portanto, a média amostral x é a melhor estimativa pontual para a média populacional µ .

Exemplo: A temperatura do corpo humano é realmente 37,2º C?

Com os dados de 106 adultos saudáveis, vamos verificar a média amostral x .

Pelos dados fornecidos, chegamos às seguintes informações:

106=n elementos;

Com os dados fornecidos, a melhor estimativa para a média populacional x seria 36,8º C.

Mas se só tivéssemos os 10 primeiros elementos?

Neste caso, a média seria de 36,9º C. Estimação Pontual.

seja uma amostra aleatória de uma variável aleatória X com distribuição exponencial de parâmetroλ

. Sabemos que o primeiro momento de X é igual a

e o primeiro momento da amostra é i iXnM 1

. O método dos momentos consiste em resolver a equação λ1 1=Mou λ1=X

Xn X

Se X é uma variável aleatória cuja função de densidade depende de sua média µ de sua variância 2σ , então obtemos os estimadores dos parâmetros obtidos pelo método dos momentos conforme segue

( ) 2 µσα +=X Daí, resolvemos o sistema

i iX n 1 i i ni n i i XXnXnXn

Obs: Se o enésimo momento de X independente do parâmetro θ, toma-se o momento de ordem imediatamente superior, para estabelecer o estimador correspondente. O exemplo que se segue, esclarece esta questão. Exemplo 4.3

Suponha X uniformemente distribuída no intervalo independente de θ , calcularemos o segundo momento de X e o igualaremos ao momento de segunda ordem da amostra:

dxxX

Assim, o estimador de θ pelo método dos momentos é

Estimação pelo Método de Máxima Verossimilhança

O Director de uma Escola, no início de um certo dia, inquiriu sua bibliotecária sobre o número médio de retiradas de publicações para consulta, por dia. Alertou-a que precisava da informação no início do dia seguinte. Não dispondo de dados históricos, ela resolveu registrar o valor observado naquele dia, e a partir desta única observação, inferir o número desejado pelo Diretor. Ao final do dia a bibliotecária registrou x = 5 “retiradas para consulta”, e, com base em sua experiência, decidiu informar este próprio valor como sendo o número médio desejado.

Suponhamos que o número de retiradas X, tenha distribuição de Poisson (λ), cuja função de

probabilidade é

Recordemos que ( ) λ=XE , isto é, o próprio parâmetro de ( )kXP = .

Segue abaixo um extracto da tabela de Probabilidades de Poisson, contida no Apêndice

O quadro mostra na realidade, uma função f (5,λ), do parâmetro λ, assumindo valores no intervalo (0,1). Esta função assume seu valor máximo no ponto λ= 5.

A solução proposta pela bibliotecária, embora rápida, simples e baseada numa única observação do fenómeno, tem seu valor, na medida que o valor k = 5 é mais provável de ocorrer se o parâmetro da população é igual a λ= 5.

Estimador de máxima verosimilhança

Passaremos à descrição de um método, de aplicação geral, para calcular estimadores de Parâmetros, ao qual se dá o nome de método da máxima verosimilhança.

Se nXXX ,...,, 21 forem os elementos de uma amostra aleatória, tirada de uma distribuição com f.d.p. ( )θ;xf

(função do parâmetro θ que se pretende estimar), então a f.d.p. conjunta de nXXX ,...,, 21 é ( ) ( ) ( )θθθ ;...;; 21 nXfXfXf uma vez que as variáveis são estatisticamente independentes. A esta função, dá-se o nome de função de verosimilhança da amostra aleatória, e representa-se da seguinte maneira,

Se for possível encontrar uma função ( )nXXXt ,...,, 21 (dos elementos da amostra

), tal que, quando o parâmetro θ é substituído pelo valor de função de verosimilhança ( )nXXXL ,...,,; 21θ atinge uma valor máximo, então a estatística

, chama-se estatística de máxima verosimilhança para θ . É

Na maior parte dos casos, existe uma única estatística de máxima verosimilhança θ~ , para o parâmetro θ , sendo quase sempre calculada por diferenciação, o valor da variável que maximiza esta função L , também maximiza o

( )Lln e anula a sua primeira derivada.

Em alguns casos, a função de verosimilhança não tem derivada contínua e noutros a estatística que maximiza a função

( )( )LouL ln não é um zero da primeira derivada.

Estimador da média Para estimar a média da população, usando os elementos de uma amostra aleatória, parece lógico usar-se a média da amostra, X

. O parâmetro da população θ é agora a média µ e o estimador θ~ é X , os momentos de X são:

= n XEXE n

EXE1... 1

VarXVar n n 2

121 var...var1σ

Se a v.a. X segue a distribuição normal, também X segue a mesma distribuição.

Quando o tamanho da amostra é considerado suficientemente grande, a variável X tem uma distribuição assimptótica normal (Teorema do Limite Central) com média µ e desvio padrão n σ

. Já se viu que X é um estimador não tendencioso para µ .

De acordo com a figura abaixo, que dá a distribuição aproximadamente normal da variável

X , pode concluir-se que, com probabilidade 0.954, o erro da estimativa µ+X não excede

Figura: Distribuição do estimador X

Não sendo conhecido o valor da variância da população, 2σ , pode usar-se a variância da amostra 2s

(desvio padrão = s). Assim o erro padrão do estimador X é

. Estimador da variância

O estimador mais usado para a variância da população, é a variância da amostra, 2s .

9 Usando a seguinte definição:

i i XXns 1

Obtemos um estimador não tendencioso, uma vez que [ ] 2 σ=sE ;

A variância deste estimador é, para uma distribuição normal,

, No entanto, se usarmos, como definição de variância da amostra, a estatística

é possível determinar os momentos:

Intervalo de confiança

O segundo tipo de estimação sobre o qual nos vamos debruçar mais, denomina-se estimação por intervalo. Ela estabelece um intervalo de valor e dentro do qual um parâmetro populacional provavelmente caia a um determinado nível de confiança. O intervalo de confiança, é o intervalo dentro do qual um parâmetro populacional é esperado ocorrer. Os intervalos de confiança que são em geral usados são os de 95 %, 98% e 9 %. Um intervalo de confiança de 98 % significa que cerca de 98 % dos intervalos construídos similarmente conterão o parâmetro que está sendo estimado. Se tomarmos 95%, poder-se-á dizer que 95 % das médias amostrais para um tamanho de amostra especificado cairão a uma distância máxima de 1,96 desvios padrões da média populacional.

Intervalo de confiança para a média

Para casos referentes a média é necessário destacar três casos: Intervalo de confiança para a média, se o desvio é conhecido, o que é tratado pela distribuição normal;

Intervalo de confiança para a média, se o desvio não é conhecido e a amostra é grande, o que é tratado pela distribuição normal com desvio amostral no lugar do desvio populacional e Intervalo de confiança para a média, se o desvio não é conhecido e tamanho da amostra pequeno, o que é tratado pela distribuição t-Student com 1−n graus de liberdade.

Erro padrão da média amostral

nx σ σ

Usado para situações em que a população é finita, isto é para os casos em que a população é infinita, isto é, 05,0≤N ai usa-se nX σ σ = a)Intervalo de confiança para a média com desvio conhecido e ∀n. Estamos sob presença de uma distribuição normal.

Determinemos a respectiva probabilidade que é dada por zxP

e que o respectivo intervalo de confiança será

n zxn

. O valor de z que é tabelado devera ser consultado para o nível de confiança. O respectivo erro padrão de estimativa será z σ ε = a amplitude

e o tamanho da amostra

Exemplo: Quando certos dados foram submetidos a análise por uma equipa que se dedica a revisão curricular de certa faculdade descobriu-se que todos tinham o mesmo erro de estimativa (no valor de 3,52) numa amplitude de 6. Qual deveria ter sido o tamanho da amostra, sabendo que tomaram 6=σ a um nível de significância de 95%.

nnA Znn n n zA b)Intervalo de confiança para a média com desvio desconhecido e amostra grande n> 30 (Distribuição Normal) Determinemos a respectiva probabilidade que é dada por szXP

e o respectivo intervalo de confiança será

n szxn

. o valor de z que é tabelado, devera ser consultado para

é o nível de confiança. O respeito erro padrão de estimativa será a amplitude

e o tamanho da amostra zsn neste caso deve obter-se o s a partir de calculo a ser feito com base nos recolhidos e que compõem a amostra.

Exemplo: Uma universidade quer estimar o número médio de horas trabalhadas por semana por seus estudantes. Uma amostra de 49 estudantes mostrou uma média de 24 horas com um desvio padrão de 4 horas. A estimativa por ponto do número médio de horas trabalhadas por semana é 24 horas (média amostral). Qual é o intervalo de confiança de 95 % para o número médio de horas trabalhadas por semana?

Respostas: usando a formula anterior temos ou 2, 8 a 25, 12.

O limite de confiança inferior é 2,8. O limite superior de confiança é 25,12. O grau de confiança (nível de confiança) utilizado é 0,95.

Se nós tivéssemos tempo para seleccionar aleatoriamente 100 amostras de tamanho 49 da população de alunos do campus universitário e calcular as médias amostrais, os intervalos de confiança para cada uma destas 100 amostras, a média populacional (parâmetro) do número de horas trabalhadas estariam contidos em cerca de 95 dos 100 intervalos de confiança. Cerca de 5 dos 100 intervalos de confiança não conteriam a média populacional.

c)Intervalo de confiança para a média com desvio desconhecido e amostra pequena n ≤ 30 (Distribuição t-Student)

13 Determinemos a respectiva probabilidade que é dada por stxP

e que o respectivo intervalo de confiança será stx µ

. O valor de t que é tabelado, devera ser consultado para

é o nível de confiança e 1−n graus de liberdade. O respeito erro padrão de

estimativa será stε

, a amplitude stA o tamanho da amostra

=− µX tsn caso deve obter-se o s a partir de cálculo a ser feito com base nos dados recolhidos e que compõem a amostra.

Exemplo: tempo que uma máquina leva a executar determinada operação numa peça está sujeito a variações. Para verificar se as condições de funcionamento da máquina estão dentro das normas, registou-se 12 vezes o referido tempo. Os resultados (em segundos) foram os seguintes: 29 3 36 35 36 40 32 37 31 35 30 36. Construa um intervalo de confiança a 95% para o tempo médio de execução da tarefa pela máquina em análise, sabendo que esta segue uma distribuição aproximadamente normal.

Resolução: Podemos definir a nossa variável X como o “tempo, em segundos, que uma máquina leva a executar uma tarefa”. Sabemos que X segue uma distribuição normal. Como desconhecemos os parâmetros da distribuição e n é pequeno, vamos usar distribuição t-student.

Consultamos na tabela, o em anexo a linha 1, coluna 975,0t e encontramos o valor de 2,201.

Substituindo na fórmula teremos a probabilidade .

e o intervalo será] 32,15;36,19 [ ppzpp

Um intervalo de confiança para uma proporção populacional é dado por:

pzp σ± Onde:

é a proporção amostral pσ é o erro padrão da proporção amostral e

é dado por:

n p respectivo intervalo de confiança é dado por

n ppzppn onde: p é a proporção amostral Z é o valor de z que tabelado, deverá ser consultado para

. O respectivo erro padrão de estimativa sera

a amplitude e o tamanho da amostra p pZpn

Neste caso deve obter-se o s a partir de cálculo a ser feito com base nos dados recolhidos e que compõem a amostra.

Factor de Correcção de População Finita

Uma População denomina-se finita quando

(ou seja, quando a fracção amostral é maior do que 5 %).

Erro padrão da proporção amostral

N nNn p pσ usado para situações em que a

população é finita, isto é

. Para os casos em que a população é infinita, isto é,

aí usa-se n p

Exemplo: Uma amostra aleatória de 100 eleitores do Município de Maputo dá 5% como favoráveis a um certo candidato. Determine os limites de confiança para a proporção global de eleitores favoráveis ao candidato assumindo 95% de confiança.

pqp

n ppZppn ppZpP α

Intervalo de confiança para uma variância Intervalo de confiança para uma variância se a média é conhecida

Para o caso da variância, se conhecemos a média, podemos determinar a probabilidade como

sendo nin i i XxX

X p onde α−1 é o nível de confiança. O

respectivo intervalo de confiança será i a i i X em que o tem graus α−1 de liberdade.

Intervalo de confiança para a diferença de médias Intervalo de confiança para a diferença de médias se os dois desvios são conhecidos

Para o caso em que todos parâmetros são dados excepto a diferença de médias que se pretende estimar, a respectiva probabilidade é dada por:

ealBABA BBA ealBA n ZXX n ZXXP é o grau de confiança, e o respectivo intervalo de confiança é dado por

ealBABA BBA ealBA n ZXX n ZXX

Exemplo: Uma amostra de 150 lâmpadas eléctricas da marca A apresenta uma vida média de 1400h e um desvio padrão de 120h. Uma amostra de 200 lâmpadas da marca B apresenta média 1200h e desvio padrão de 80h. Determine os limites de confiança a 95 % para a diferença das vidas médias das lâmpadas das duas marcas.

(Parte 1 de 2)

Comentários