Estatística Descritiva

Estatística Descritiva

ESTATÍSTICA

INFERÊNCIA ESTATÍSTICA

DISTRIBUIÇÕES, ESTIMATIVAS E HIPÓTESES

Prof. Marcelo Silva

  1. INTRODUÇÃO

Até agora vimos como resumir (ou descrever) um conjunto de dados e como construir tabelas estatísticas para descrever alguns fenômenos. Agora vamos conhecer o real objetivo da estatística, que é, antes de tudo, poupar o tempo das pessoas e auxiliá-las na tomada de decisões.

Fazer inferência é fazer afirmações sobre características de uma população (todo) com base nos resultados de uma amostra (parte). Quando uma cozinheira verifica se o prato que está cozinhando está bom de sal, ela está fazendo inferência. O mesmo acontece quando você vai tirar sangue para fazer um exame: toma-se uma parte e, a partir da parte, tiram-se conclusões sobre o todo.

A inferência estatística aborda dois problemas fundamentais: a ESTIMAÇÃO DE PARÂMETROS DE UMA POPULAÇÃO E O TESTE DE HIPÓTESES.

Um exemplo de estimação de parâmetro e a verificação da vida útil das lâmpadas fluorescentes de uma fabricante, a partir de amostras periódicas retiradas da linha de produção.

Um exemplo de teste de hipótese seria investigar se a duração de vida de lâmpadas produzidas por outro processo de fabricação é maior (ou menor) do que as fabricadas atualmente, a partir de uma amostra do novo processo.

Veremos que o raciocínio da inferência estatística apóia-se na pergunta:

COM QUE FREQÜÊNCIA ESSE MÉTODO FORNECERIA UMA RESPOSTA CORRETA SE EU UTILIZASSE UM GRANDE NUMERO DE VEZES”

    1. PARÂMETROS E ESTIMADORES

Quando começamos a usar amostras para tirar conclusões a respeito de uma população mais ampla, precisamos ter o cuidado de esclarecer se um número descreve uma amostra ou uma população.

Objetivo: tirar conclusões sobre uma população com base na informação de uma amostra.

Parâmetro: É uma media estatística da população que foi estimada a partir de um estimador amostral.

Estimador: É também conhecido como estatística; é o valor numérico de uma característica da amostra e, por conseguinte, da população

Estimativa: Valor numérico assumido pelo estimador.

Exemplo 1:

A renda média da amostra de domicílios é de = US$ 58.208. O número “58.208” é um estimador, pois descreve essa amostra específica do governo. A população sobre a qual a pesquisa quer tirar conclusões são todos os 110 milhões de domicílios. O parâmetro de interesse é a renda média de todos os domicílios.

Enquanto estávamos apenas fazendo análise dos dados, a distinção entre populações e amostra não era importante. Agora, porém, é fundamental. A notação que usamos deve refletir essa distinção. Denotamos (a letra grega mi) a MÉDIA DE UMA POPULAÇÃO.

A MÉDIA DA AMOSTRA é a já familiar, a média das observações na amostra. Essa é uma estatística que quase certamente assumiria um valor diferente se escolhêssemos outra amostra de população. A média amostral de uma amostra ou de um experimento é uma estimativa da média da população subjacente.

  1. TEOREMA CENTRAL DO LIMITE

À medida que se aumenta o tamanho da amostra, a distribuição amostral da média se aproxima de uma distribuição normal, qualquer que seja a forma da distribuição da população. Na prática, a distribuição de amostragem da média pode ser considerada como aproximadamente normal sempre que o tamanho da amostra for maior ou igual a 30.

Isto que dizer que, a média da amostra será igual à média da população.

  1. PROPRIEDADES DOS ESTIMADORES

    1. ESTIMAÇÃO POR PONTO

A estimação por ponto tem por finalidade verificar a melhor estimativa para o parâmetro a ser determinado. Desta forma produzirá um valor único (estimativa) para o parâmetro a ser determinado.

Podem ser determinados por este método a média da população, sua variância, seu desvio padrão e a proporção de uma população com as mesmas características da amostra.

Devido ao fato que as amostras na maior parte das aplicações, são suficientemente grandes e, portanto agrupadas em classes, preferimos abordar a Estimação por intervalos de Confiança com maior detalhamento

    1. ESTIMAÇÃO POR INTERVALO

Para que seja possível a estimação por intervalo, a suposição inicial é que a distribuição amostral do estimador (média amostral) é normal. Isto ocorrerá se a distribuição de probabilidade da população for normal ou se a amostra for suficientemente grande.

Deve construir um intervalo em torno da média amostral , de tal forma que esse intervalo contenha o valor da estimativa (parâmetro a ser estimado) com um nível de confiança de . A forma como o intervalo de confiança é construído será vista adiante.

  1. DISTRIBUIÇÃO AMOSTRAL DOS ESTIMADORES

Os estimadores amostrais mais utilizados para estimar parâmetros populacionais são a media amostral (média das médias das amostras retiradas de uma população), a distribuição amostral de freqüências simples e relativas, a distribuição amostral da variância (Qui-quadrado), a distribuição F de Snedecor, e a distribuição T-student.

Em resumo, estuda-se a distribuição amostral dos estimadores para inferir quão próxima da estatística do estimador estudado, estará à mesma estatística da população.

Para efeito do curso, serão estudadas a distribuição amostral da média e a distribuição amostral da variância, para populações infinitas (numero total não conhecido) e finitas (numero total conhecido).

    1. DISTRIBUIÇÃO AMOSTRAL DA MÉDIA

Como visto estatísticas são os valores calculados a partir dos elementos de uma amostra. A distribuição de probabilidade de uma estatística é chamada de distribuição amostral.

Podemos ter a distribuição amostral da média, distribuição amostral do desvio-padrão ou variância.

As notações abaixo serão utilizadas para identificar:

A propriedade mais importante da distribuição amostral da média é que se quando inúmeras amostras são extraídas de uma população infinita ou muito grande, podem se consideradas contendo uma distribuição de probabilidade da população e, portanto a mesma média e variância, isto que dizer que, a média das médias amostrais se iguala à média da população.

Exemplo 2

Seja uma população de variáveis X = {14,16,18,20,22}, cuja média é =18

Formando amostras de tamanho n = 2, teremos:

Tabela I – Amostra de Tamanho 2

AMOSTRAS

MÉDIA

(14;16)

15

(14;18)

16

(14;20)

17

(14;22)

18

(16;18)

17

(16;20)

18

(16;22)

19

(18;20)

19

(18;22)

20

(18;24)

21

Como existem 10 combinações possíveis n = 10, e cada uma delas possui a sua média, a distribuição amostral das médias será dada pela probabilidade de cada um exemplo ou, .

Tabela II – Combinações possíveis

Média

15

16

17

18

19

20

21

fi

1

1

2

2

2

1

1

Distribuição

0,1

0,1

0,2

0,2

0,2

0,1

0,1

A média Amostral (média das médias das amostras) será dada por:

Tabela II – Cálculo da Média Amostral

Média

(15 x 0,1)

(16 x 0,1)

(17 x 0,2)

(18 x 0,2)

(19 x 0,2)

(20 x 0,1)

(21 x 0,1)

Amostral

1,5

1,6

3,4

3,6

3,8

2

2,1

Portanto somando-se os valores acima, a média amostral será: = 18.

Isto nos da à liberdade de utilizarmos na fórmula do IC (intervalo de Confiança) que será visto mais adiante, a própria média da população como sendo a média da amostra.

    1. DISTRIBUIÇÃO AMOSTRAL DA VARIÂNCIA

O mesmo ocorre com a variância (para população infinita ou muito grande). A média das variâncias das amostras (média da variância amostral) é dada por:

      1. VISUALIZAÇÃO GRÁFICA DO SIGNIFICADO DE INTERVALO DE CONFIANÇA

6

Comentários