aula parte9 testes de hipoteses com duas amostras

aula parte9 testes de hipoteses com duas amostras

(Parte 1 de 2)

O teste de hipóteses da diferença das médias de duas populações é freqüentemente utilizado para determinar se é ou não razoável concluir que as médias das duas populações são diferentes. Por exemplo:

É de interesse do controle de qualidade determinar se o mesmo produto oferecido por dois fornecedores diferentes apresenta a mesma quantidade de peças com defeitos.

Ao médico do laboratório farmacêutico interessa determinar se o novo remédio para controle de diabetes é eficiente acompanhando dois grupos de pacientes, o primeiro grupo que recebeu o remédio e o outro que recebeu apenas placebo, produto com a mesma forma, porém sem o elemento ativo.

O gerente de compras pode estar interessado em determinar se o mesmo produto oferecido por dois fornecedores diferentes apresenta o mesmo prazo real de entrega.

Da mesma forma, o gerente de salários necessita conhecer se os salários da mesma categoria de trabalhadores têm o mesmo valor em duas cidades diferentes.

Os exemplos mostram o objetivo do analista em determinar se há diferença entre as médias de duas populações independentes considerando que as respostas de um grupo são independentes das respostas do outro grupo.

TH – Diferenças entre Médias TH – Diferenças entre Médias

Amostras Grandes

Qual é a forma da distribuição da diferença de duas médias?

A resposta é dada pelo teorema central do limite, que foi apresentado anteriormente. Se for retirado um numero grande de amostras das duas populações, a distribuição da diferença das duas médias será aproximadamente normal.

Para amostras grandes, n>30, o Z observado Zo é obtido da normalização da diferença entre as duas médias utilizando a expressão:

X Z o

Sendo as variâncias das populações desconhecidas, as variâncias das amostras fornecerão uma boa aproximação, sendo o denominador da fórmula seguinte o erro amostral.

nSn S

X Z o

Na célula F12 o modelo registra o Z observado, resultado obtido com:

Na célula F13 é calculado o p-value para duas caudas da distribuição. Como o p-value é maior que o nível de significância α=0,05, a hipótese nula deve ser aceita, pois há evidencias de que a diferença de médias não seja significativa.

Na célula F14 é apresentada a decisão por extenso, Aceitar Ho ou Rejeitar Ho.

Esse procedimento com a distribuição Z deve ser aplicado quando as variâncias das populações são conhecidas, o que, na prática, é difícil de ocorrer.

Daí que se o tamanho de uma das amostras for igual ou menor que trinta e um, o modelo não apresentará os títulos e resultados relevantes.

Como em geral as variâncias das populações não são conhecidas, é recomendado utilizar o procedimento com a distribuição t.

FdeA - Teste Z: Duas amostras para Médias FdeA - Teste Z: Duas amostras para Médias

Amostras Pequenas Variâncias das Populações Iguais

FdeA - Teste T: Duas amostras Variâncias Eq. FdeA - Teste T: Duas amostras Variâncias Eq.

Amostras Pequenas Variâncias das Populações Diferentes

O procedimento do teste de hipóteses da diferença das médias de duas populações com variâncias desconhecidas, ou presumindo que sejam diferentes, tem as mesmas premissas do procedimento do teste de hipóteses com variâncias iguais, incluindo as seguintes alterações de cálculo:

Deve ser utilizada a estatística teste t* definida com a expressão:

nSn S

X t

O teste t* pode ser aproximado ao teste t obtendo o número de graus de liberdade gl com a expressão:

Como, em geral, o resultado de gl não é um número inteiro, deve ser adotado o número inteiro mais próximo.

n S n S nSn S

FdeA - Teste T: Duas amostras Variâncias Dif. FdeA - Teste T: Duas amostras Variâncias Dif.

Amostras Emparelhadas

Quando for necessário comparar, por exemplo, as vendas diárias de duas filiais que operam com os mesmos produtos, ou os resultados de um treinamento, confrontando o conhecimento antes e depois do treinamento, os procedimentos de teste de hipóteses para diferença das médias utilizados até este momento não podem ser aplicados, pois se referem a duas populações independentes.

Agora, necessitamos analisar duas populações relacionadas, isto é, duas populações dependentes.

Neste caso, a variável de interesse será a diferença entre os pares das duas amostras, no lugar das próprias amostras, que devem ter o mesmo tamanho.

Como premissa, a população das diferenças tem distribuição aproximadamente normal e a amostra das diferenças é extraída aleatoriamente da população das diferenças.

O procedimento é o seguinte:

X12,X1n e X21, X22, ... X2n é formada a nova variável D das
diferenças entre esses valoresD1= X11- X21, ... , Dj=
X1j- X2j,, Dn= X1n- X2n.

Das duas variáveis X1 e X2 definidas pelos valores X11, Na variável D é calculada a média D e a variância

O t observado é calculado com a fórmula:

t D o

Definido o nível de significância α, é realizado o teste de hipóteses.

FdeA – Teste T: Duas amostras em Par para Médias FdeA – Teste T: Duas amostras em Par para Médias

Distribuição F

O teste de hipóteses para a diferença das médias é utilizado para determinar se é ou não razoável concluir que as médias das duas populações são diferentes.

Também é freqüente verificar se é ou não razoável concluir que as variâncias das duas populações são diferentes.

variâncias das amostras

Para verificar se duas populações independentes têm a mesma variância é utilizada a estatística da relação das retiradas de duas populações. 2221/S

relação

Se as distribuições das duas populações forem normais, então a

tem distribuição F.

(Parte 1 de 2)

Comentários