Estatistica Basica

Estatistica Basica

(Parte 1 de 9)

SÉRIE: Estatística Básica Texto 4: TESTES DE HIPÓTESES

Prof. Lorí Viali - viali@mat.pucrs.br- http://w.mat.pucrs.br/~lori/ 2
1. INTRODUÇÃO3
1.1. GENERALIDADES3
1.2. METODOLOGIA DO TESTE DE HIPÓTESES3
1.3. AS HIPÓTESES3
1.4. A ESCOLHA DO TESTE ESTATÍSTICO4
1.5. CONCEITOS ADICIONAIS DO TESTE DE HIPÓTESES4
1.6. A DISTRIBUIÇÃO AMOSTRAL7
1.7. TESTES ESTATÍSTICOS PARAMÉTRICOS7
1.8. ETAPAS DO TESTE DE HIPÓTESES7
2. TIPOS DE TESTES PARAMÉTRICOS9
2.1. TESTES PARA UMA AMOSTRA9
2.1.1. Teste para a média de uma população9
2.1.2. Teste para a proporção1
2.1.3. Teste para a variância12
2.2. TESTES PARA DUAS AMOSTRAS INDEPENDENTES13
2.2.1. Teste para a igualdade entre as variâncias de duas populações13
2.2.2. Teste para a diferença entre duas médias populacionais15
2.3. DUAS AMOSTRAS RELACIONADAS (DEPENDENTES)19
2.3.1. Teste para a diferença entre duas proporções20
3. EXERCÍCIOS2
4. RESPOSTAS27

SUMÁRIO 5. REFERÊNCIAS ................................................................................................................. .............................................. 29

SÉRIE: Estatística Básica Texto 4: TESTES DE HIPÓTESES

Prof. Lorí Viali - viali@mat.pucrs.br- http://w.mat.pucrs.br/~lori/ 3

1. INTRODUÇÃO

Um dos principais assuntos da Estatística moderna é a inferência estatística. A inferência estatística é dividida em dois grandes tópicos: a estimação de parâmetros e os testes de hipóteses.

No desenvolvimento dos métodos da estatística moderna, as primeiras técnicas de inferência que apareceram foram as que faziam diversas hipóteses sobre a natureza da população da qual se extraíram os dados. Como os valores relacionados com a população são denominados “parâmetros”, tais técnicas estatísticas foram denominadas de paramétricas.

Nas ciências do comportamento, efetua-se levantamentos a fim de determinar o grau de aceitação de hipóteses baseadas em teorias do comportamento. Formulada uma determinada hipótese particular é necessário coletar dados empíricos e com base nestes dados decide-se então sobre a validade ou não da hipótese. A decisão sobre a hipótese pode levar a rejeição, revisão ou aceitação da teoria que a originou.

Para se chegar a conclusão que uma determinada hipótese deverá ser aceita ou rejeitada, baseado em um particular conjunto de dados, é necessário dispor de um processo objetivo que permita decidir sobre a veracidade ou falsidade de tal hipótese.

A objetividade deste processo deve ser baseada na informação proporcionada pelos dados, e como estes dados, em geral, envolvem apenas parte da população que se pretende atingir, no risco que se está disposto a correr de que a decisão tomada não esteja correta.

A metodologia para a decisão sobre a veracidade ou falsidade de uma determinada hipótese envolve algumas etapas.

4. Determinar (ou supor determinada) a distribuição amostral da prova estatística sob a hipótese de nulidade.

5. Definir a região de rejeição.

6. Calcular o valor da prova estatística, utilizando os valores obtidos na(s) amostra(s). Se tal valor estiver na região de rejeição, rejeitar, então a hipótese nula, senão a decisão será que a hipótese nula não poderá ser rejeitada ao nível de significância determinado.

Uma hipótese estatística é uma suposição ou afirmação que pode ou não ser verdadeira, relativa a uma ou mais populações. A veracidade ou falsidade de uma hipótese estatística nunca é conhecida com certeza, a menos que, se examine toda a população, o que é impraticável na maior parte das situações.

Desta forma, toma-se uma amostra aleatória da população de interesse e com base nesta amostra é estabelecido se a hipótese é provavelmente verdadeira ou provavelmente falsa. A decisão de que a hipótese é provavelmente verdadeira ou falsa é tomada com base em distribuições de probabilidade denominadas de “distribuições amostrais”. Em estatística trabalha-se com dois tipos de hipótese.

SÉRIE: Estatística Básica Texto 4: TESTES DE HIPÓTESES

Prof. Lorí Viali - viali@mat.pucrs.br- http://w.mat.pucrs.br/~lori/ 4

A hipótese nula é a hipótese de igualdade. Esta hipótese é denominada de hipótese de nulidade e é representada por H0 (lê-se h zero). A hipótese nula é normalmente formulada com o objetivo de ser rejeitada. A rejeição da hipótese nula envolve a aceitação de outra hipótese denominada de alternativa. Esta hipótese é a definição operacional da hipótese de pesquisa que se deseja comprovar. A natureza do estudo vai definir como deve ser formulada a hipótese alternativa. Por exemplo, se o teste é do tipo paramétrico, onde o parâmetro a ser testado é representado por θ, então a hipótese nula seria: H0 : θ = θ0 e as hipóteses alternativas seriam:

H1 : θ = θ1 (Hipótese alternativa simples) ou H1: θ ≠ θ0 ; θ > θ0 ou θ < θ0. (Hipóteses alternativas compostas)

No primeiro caso, H1: θ ≠ θ0, diz-se que o teste é bilateral (ou bicaudal), se H1: θ > θ0, diz-se que o teste é unilateral (ou unicaudal) à direita e se H1: θ < θ0, então, diz-se que o teste é unilateral (ou unicaudal) à esquerda.

Existem inúmeros testes estatísticos tanto paramétricos quanto não paramétricos. Alguns itens devem ser levados em conta na escolha da prova estatística para determinada situação. A maneira como a amostra foi obtida, a natureza da população da qual se extraiu a amostra e o tipo de mensuração ou escala empregado nas definições operacionais das variáveis envolvidas, isto é, o conjunto de valores numéricos e ainda o tamanho da amostra disponível.

Uma vez determinados a natureza da população e o método de amostragem ficará estabelecido o modelo estatístico. Associado a cada teste estatístico tem-se um modelo estatístico e condições de mensuração, o teste é válido sob as condições especificadas no modelo e pelo nível da escala de mensuração. Nem sempre é possível verificar se todas as condições do modelo foram satisfeitas e neste caso tem-se que admitir que estas condições foram satisfeitas. Estas condições do modelo estatístico são denominadas suposições ou hipóteses do teste. Qualquer decisão tomada através de um teste estatístico somente terá validade se as condições do modelo forem válidas.

É óbvio que quanto mais fracas forem as suposições do modelo mais gerais serão as conclusões. No entanto, as provas mais poderosas, isto é, as que apresentam maior probabilidade de rejeitar H0 quando for falsa, são as que exigem as suposições mais fortes ou mais amplas.

1.5. CONCEITOS ADICIONAIS DO TESTE DE HIPÓTESES

Além dos conceitos já vistos para o teste de hipóteses é necessário ainda definir os erros envolvidos e as regiões de rejeição e de aceitação.

Para ilustrar estes conceitos será suposto o seguinte teste a ser feito: Dispõem-se de duas moedas com aparência idêntica, só que uma (M1) é equilibrada, isto é, P(Cara) = P(Coroa) = 50%, enquanto que a outra (M2) é viciada de tal forma que favorece cara na proporção de 80%, ou seja, P(Cara) = 80% enquanto que P(Coroa) = 20%. Supõem-se que uma das moedas é lançada e que com base na variável X = número de caras, deve-se decidir qual delas foi lançada. Neste caso o teste a ser feito envolve as seguintes hipóteses:

H0: A moeda lançada é a equilibrada (M1), ou seja, p = 50%

H1: A moeda lançada é a viciada (M2), ou seja p = 80%, onde “p” é a proporção de caras.

Tem-se que tomar a decisão de apontar qual foi a moeda lançada, baseado apenas em uma amostra, por exemplo 5 lançamentos, de uma população infinita de lançamentos possíveis. A decisão, é claro, estará sujeita a erros, pois se está tomando a decisão em condições de incerteza.

SÉRIE: Estatística Básica Texto 4: TESTES DE HIPÓTESES

Prof. Lorí Viali - viali@mat.pucrs.br- http://w.mat.pucrs.br/~lori/ 5

A decisão será baseada nas distribuições amostrais das duas moedas. A tabela 01 mostra as probabilidades de se obter os valores: 0, 1, 2, 3, 4 e 5, da variável X = número de caras, em 5 lançamentos de cada uma das moedas.

Tabela 01 - Probabilidades de se obter cara em 5 lançamentos de uma moeda

1 5/32 → 15,625%20/3125 → 0,640% 210/32 → 31,250%160/3125 → 5,120% 310/32 → 31,250%640/3125 → 20,480% 4 5/32 → 15,625%1280/3125 → 40,960% 5 1/32 → 3,125%1024/3125 → 32,768%

Para poder aceitar ou rejeitar H0 e como conseqüência, rejeitar ou aceitar H1, é necessário estabelecer uma regra de decisão, isto é, é necessário estabelecer para que valores da variável X vai-se rejeitar H0, ou seja, afirmar H1, e para que valores da variável X, vai-se aceitar H0, ou seja, nesta situação particular, afirmar H0.

Desta forma, estabelecendo-se que se vai rejeitar H0, se a moeda lançada der um número de caras igual a 3, 4 ou 5, pode-se então determinar as probabilidades de tomar as decisões corretas ou as probabilidades dos erros envolvidos. Assim o conjunto de valores que levará a rejeição da hipótese nula será denominado de região crítica (RC) e, neste caso, este conjunto é igual a: RC = { 3, 4, 5 }

A faixa restante de valores da variável é denominada de região de aceitação (RA) e, neste caso, este conjunto vale: RA = { 0, 1, 2 }

Evidentemente esta regra como qualquer outra permitirá decidir sob a H0, mas estará sujeita a erro. Está se tomando a decisão de aceitar ou rejeitar H0 com base no número X de caras obtidas em 5 lançamentos, que é apenas uma amostra, muito pequena, do número infinito de lançamentos possíveis.

Com base em resultados amostrais, não é possível tomar decisões definitivamente corretas.

Entretanto, pode-se calcular a probabilidade da decisão estar errada. Neste caso foi decidido rejeitar H0 se X = “número de caras” assumir um dos valores do conjunto RC. No entanto, tais valores podem ocorrer sob H0, isto é, tais valores podem ocorrer quando se lança a moeda M1, conforme tabela. Então se H0 for rejeitada porque X assumiu o valor 3, 4 ou 5, pode-se estar cometendo um erro. A probabilidade deste erro é igual a probabilidade de ocorrência destes valores sob H0, isto é, quando a moeda M1 é lançada, que é conforme tabela igual a:

10/32 + 5/32 + 1/32 = 16/32 = 50%

Lembrando que rejeitar H0 é apenas uma das duas situações possíveis num teste de hipóteses, tem-se que se X assumir um valor do conjunto RA se aceitará Ho. Mas tais valores podem ocorrer sob

H1, isto é, quando a moeda M2 é lançada. Então se Ho for aceita porque X assumiu um dos valores: 1, 2 ou 3, pode-se estar cometendo um outro tipo de erro, cuja probabilidade é igual a da ocorrência destes valores sob H1 que é de: 1/3125 + 20/3125 + 160/3125 = 181/3125 = 5,79%

A probabilidade de que a variável (número de caras) assuma um valor do conjunto RC é denominada de nível de significância do teste. O nível de significância do teste é, na realidade, a probabilidade de se rejeitar a hipótese nula, quando ela é verdadeira, sendo então a probabilidade de se cometer um erro. Como este é apenas um dos dois tipos de erro possível de ser cometido num teste de hipóteses, ele é denominado de erro do tipo I. O outro tipo de erro possível de ser cometido é aceitar

SÉRIE: Estatística Básica Texto 4: TESTES DE HIPÓTESES

Prof. Lorí Viali - viali@mat.pucrs.br- http://w.mat.pucrs.br/~lori/ 6

H0 quando ela é falsa e é denominado de erro do tipo I. Em resumo pode-se ter as seguintes situações em um teste de hipóteses:

Tabela 02 - Possibilidades envolvidas em um teste de hipóteses

Realidade DecisãoAceitar H0Rejeitar H0

H0 é verdadeira Decisão correta

1 - α = P(Aceitar H0 / H0 é V) = P(H0 / H0)

Erro do Tipo I αααα = P(Erro do tipo I) =

P(Rejeitar H0 / H0 é V) = Nível de significância do teste = P(H1 / H0)

(Parte 1 de 9)

Comentários