teste - hipoteses

teste - hipoteses

(Parte 1 de 4)

Embora com pouco tempo, devido à preparação da 3ª edição do livro Estatística – ESAF, preocupado com os candidatos que farão a prova para Fiscal-RS em 19/08, resolvi, mesmo em cima da hora, fazer um resumo sobre o assunto Teste de Hipóteses (que servirá também para outros concursos), contando com a colaboração do meu filho, Márcio Bello, na digitação.

Definição: É uma regra de decisão utilizada para aceitar ou rejeitar uma hipótese estatística com base em elementos amostrais.

Hipóteses: Teremos sempre duas hipóteses, H0 (Agá-zero), que é a hipótese nula ou hipótese probanda e H1 ou HA (hipótese alternativa). Geralmente a hipótese alternativa (H1) representa a suposição que o pesquisador quer provar, sendo a hipótese nula (H0) formulada com o expresso propósito de ser rejeitada. Conseguindo rejeitar H0, a hipótese alternativa terá de ser aceita, conseguindo então o pesquisador provar o que queria. A hipótese nula é sempre a hipótese a ser examinada. Se a aceitarmos, implicitamente estaremos rejeitando H1 e se rejeitarmos H0, então não podemos rejeitar H1, devendo esta ser aceita. Tipos de erro: Dois tipos de erro podem ser cometidos num Teste de Hipóteses:

Erro Tipo I (α) Æ A hipótese nula é verdadeira e o pesquisador a rejeita.

Erro Tipo I (β) Æ A hipótese nula é falsa e o pesquisador a aceita.

Qual dos dois tipos de erro é o mais grave e que deve ser evitado? Façamos uma analogia com a decisão de um Juiz de Direito: o que será mais grave? Condenar um inocente ou absolver um culpado? É claro que será mais grave a condenação de um inocente. Rejeitar a hipótese nula sendo ela verdadeira equivale a condenar um inocente, logo o Erro Tipo I é o mais grave e deverá ser minimizada a probabilidade deste tipo de erro ser cometido. Essa probabilidade chama-se Nível de Significância do Teste, dado por α. Já a probabilidade de β do

Erro Tipo I não pode ser calculada, a menos que se especifique um valor alternativo para μ. O poder ou potência do teste é dado por (1 − β). Podemos resumir as possibilidades do Teste num quadro:

Se a Hipótese Nula (H0) é: VERDADEIRA FALSA

Teste de Hipóteses Pedro Bello Página 1

1) Bicaudal ou Bilateral

H0: μ = μ0 H1: μ ≠ μ0

Onde: μ é a média populacional e μ0 é o valor suposto para a média populacional. Gráfico do teste bilateral:

Onde: R.A. é a região de aceitação (da hipótese nula) e R.C. é a região crítica ou região de rejeição. A fronteira entre essas regiões será dada por um valor tabelado (Tabela da Distribuição Normal ou da Tabela da Distribuição t-Student) como veremos mais adiante.

2) Teste Unicaudal ou Unilateral à direita

H1: μ > μ0 Gráfico do teste:

Teste de Hipóteses Pedro Bello Página 2

3) Teste Unicaudal ou Unilateral à esquerda

H1: μ < μ0 Gráfico do teste:

OBS: Repare que na hipótese nula sempre temos uma igualdade (=) e na hipótese alternativa uma desigualdade (<, > ou ≠).

Distribuição Normal ou t-Student?

Qual usar para arbitrar o valor tabelado que será a fronteira entre as regiões de aceitação e rejeição? Para esclarecer melhor, vamos fazer o seguinte quadro:

POPULACIONAL (σ2) USO A DISTRIBUIÇÃO

É CONHECIDA NORMAL É GRANDE (n ≥ 30) É DESCONHECIDA NORMAL

É CONHECIDA NORMAL É PEQUENO (n < 30) É DESCONHECIDA t-STUDENT

Vemos então, que só iremos utilizar a Distribuição t-Student (chamada de distribuição das pequenas amostras) quando a amostra for pequena (o número de elementos é inferior a 30) e a variância populacional for desconhecida. Se a amostra for grande (a partir de 30 elementos), pouco importará ser conhecida a variância populacional e usaremos a Tabela da Distribuição

Normal para arbitrar o valor ZTAB (ZTABELADO).

Teste de Hipóteses Pedro Bello Página 3

Assim, vemos que na maior parte dos casos usaremos a Distribuição Normal, pois basta que uma das condições seja atendida: amostra grande (n ≥ 30) ou variância populacional conhecida.

Já para usar a Distribuição t-Student, duas condições terão de acontecer simultaneamente: amostra pequena (n < 30) e variância populacional desconhecida.

Para procedermos ao teste, além de conhecer o valor tabelado (ZTAB se usarmos

Distribuição Normal ou t TAB se usarmos Distribuição t-Student), temos que encontrar o valor calculado (ZCALC ou tCALC), dado por:

XZCALC σ μ−= se o desvio padrão populacional (σ) for conhecido ou;

XZCALC μ−=, pois se a amostra for grande (n ≥ 30) e não soubermos o valor do desvio padrão populacional (σ), usaremos o desvio padrão amostral (S).

Se a amostra for pequena (n < 30) e o desvio padrão populacional for desconhecido, usaremos a Distribuição t-Student e teremos a estatística teste:

XtCALC μ−=

Supondo que usaremos a Distribuição Normal Padrão (Z): 1) Para o teste bilateral:

Se – ZTAB < ZCALC < ZTAB, aceitaremos H0.

Caso ZCALC < - ZTAB, ou ZTAB < ZCALC, rejeitaremos H0. ZTAB- ZTAB

Teste de Hipóteses Pedro Bello Página 4

2) Para o teste unilateral à direita: Se ZCALC < ZTAB, aceitaremos H0.

Se ZTAB < ZCALC, rejeitaremos H0. ZTAB

3) Para o teste unilateral à esquerda: Se –ZTAB < ZCALC, aceitaremos H0.

-ZTAB Se ZCALC < ZTAB, rejeitaremos H0.

O mesmo raciocínio vale para os casos em que usarmos a Distribuição t-Student, com a diferença que compararemos tCALC com tTAB.

Teste de Hipóteses Pedro Bello Página 5

Para facilitar, vamos fazer o seguinte roteiro (receitinha de bolo, passo a passo) para resolução de questões de Teste de Hipóteses e a seguir aplicá-lo em alguns exemplos:

1º Passo: Pelo enunciado do problema, estabelecer a Hipótese Nula (H0) e a Hipótese

Alternativa (H1); 2º Passo: Também pelos dados do enunciado, definir a distribuição a ser utilizada

(Normal ou t-Student); 3º Passo: Utilizando a Tabela Normal Padrão ou a Tabela t-Student, encontrar o valor de

ZTAB ou tTAB; 4º Passo: Fazer o desenho da curva, plotando no eixo das abscissas o valor tabelado, que será a fronteira entre a área de aceitação (RA) e a(s) área(s) de rejeição (RC-Região Crítica);

(Parte 1 de 4)

Comentários