Docsity
Docsity

Prepare-se para as provas
Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity


Ganhe pontos para baixar
Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium


Guias e Dicas
Guias e Dicas

Estatistica Basica, Notas de estudo de Estatística

Apostila 4

Tipologia: Notas de estudo

Antes de 2010
Em oferta
30 Pontos
Discount

Oferta por tempo limitado


Compartilhado em 07/12/2009

flavia-mckenzie-1
flavia-mckenzie-1 🇧🇷

4.6

(8)

18 documentos

Pré-visualização parcial do texto

Baixe Estatistica Basica e outras Notas de estudo em PDF para Estatística, somente na Docsity! Material Didático Série Estatística Básica Texto INV Testes de Hipóteses Enfoque “Eq H — E XaAatas Prof. Lori Viali, Dr. S É R I E : E s t a t í s t i c a B á s i c a T e x t o 4 : T E S T E S D E H I P Ó T E S E S Prof. Lorí Viali - viali@mat.pucrs.br - http://www.mat.pucrs.br/~lori/ 2 SUMÁRIO 1. INTRODUÇÃO.................................................................................................................................................................. 3 1.1. GENERALIDADES........................................................................................................................................................... 3 1.2. METODOLOGIA DO TESTE DE HIPÓTESES........................................................................................................................ 3 1.3. AS HIPÓTESES................................................................................................................................................................ 3 1.4. A ESCOLHA DO TESTE ESTATÍSTICO ............................................................................................................................... 4 1.5. CONCEITOS ADICIONAIS DO TESTE DE HIPÓTESES .......................................................................................................... 4 1.6. A DISTRIBUIÇÃO AMOSTRAL.......................................................................................................................................... 7 1.7. TESTES ESTATÍSTICOS PARAMÉTRICOS .......................................................................................................................... 7 1.8. ETAPAS DO TESTE DE HIPÓTESES ................................................................................................................................... 7 2. TIPOS DE TESTES PARAMÉTRICOS.......................................................................................................................... 9 2.1. TESTES PARA UMA AMOSTRA ........................................................................................................................................ 9 2.1.1. Teste para a média de uma população................................................................................................................. 9 2.1.2. Teste para a proporção ...................................................................................................................................... 11 2.1.3. Teste para a variância........................................................................................................................................ 12 2.2. TESTES PARA DUAS AMOSTRAS INDEPENDENTES......................................................................................................... 13 2.2.1. Teste para a igualdade entre as variâncias de duas populações ....................................................................... 13 2.2.2. Teste para a diferença entre duas médias populacionais................................................................................... 15 2.3. DUAS AMOSTRAS RELACIONADAS (DEPENDENTES) ..................................................................................................... 19 2.3.1. Teste para a diferença entre duas proporções ................................................................................................... 20 3. EXERCÍCIOS .................................................................................................................................................................. 22 4. RESPOSTAS .................................................................................................................................................................... 27 5. REFERÊNCIAS ............................................................................................................................................................... 29 S É R I E : E s t a t í s t i c a B á s i c a T e x t o 4 : T E S T E S D E H I P Ó T E S E S Prof. Lorí Viali - viali@mat.pucrs.br - http://www.mat.pucrs.br/~lori/ 5 A decisão será baseada nas distribuições amostrais das duas moedas. A tabela 01 mostra as probabilidades de se obter os valores: 0, 1, 2, 3, 4 e 5, da variável X = número de caras, em 5 lançamentos de cada uma das moedas. Tabela 01 - Probabilidades de se obter cara em 5 lançamentos de uma moeda x P(X = x) sob H0 P(X = x) sob H1 0 1/32 → 3,125% 1/3125 → 0,032% 1 5/32 → 15,625% 20/3125 → 0,640% 2 10/32 → 31,250% 160/3125 → 5,120% 3 10/32 → 31,250% 640/3125 → 20,480% 4 5/32 → 15,625% 1280/3125 → 40,960% 5 1/32 → 3,125% 1024/3125 → 32,768% Total 1 → 100% 1 → 100% Para poder aceitar ou rejeitar H0 e como conseqüência, rejeitar ou aceitar H1, é necessário estabelecer uma regra de decisão, isto é, é necessário estabelecer para que valores da variável X vai-se rejeitar H0, ou seja, afirmar H1, e para que valores da variável X, vai-se aceitar H0, ou seja, nesta situação particular, afirmar H0. Desta forma, estabelecendo-se que se vai rejeitar H0, se a moeda lançada der um número de caras igual a 3, 4 ou 5, pode-se então determinar as probabilidades de tomar as decisões corretas ou as probabilidades dos erros envolvidos. Assim o conjunto de valores que levará a rejeição da hipótese nula será denominado de região crítica (RC) e, neste caso, este conjunto é igual a: RC = { 3, 4, 5 } A faixa restante de valores da variável é denominada de região de aceitação (RA) e, neste caso, este conjunto vale: RA = { 0, 1, 2 } Evidentemente esta regra como qualquer outra permitirá decidir sob a H0, mas estará sujeita a erro. Está se tomando a decisão de aceitar ou rejeitar H0 com base no número X de caras obtidas em 5 lançamentos, que é apenas uma amostra, muito pequena, do número infinito de lançamentos possíveis. Com base em resultados amostrais, não é possível tomar decisões definitivamente corretas. Entretanto, pode-se calcular a probabilidade da decisão estar errada. Neste caso foi decidido rejeitar H0 se X = “número de caras” assumir um dos valores do conjunto RC. No entanto, tais valores podem ocorrer sob H0, isto é, tais valores podem ocorrer quando se lança a moeda M1, conforme tabela. Então se H0 for rejeitada porque X assumiu o valor 3, 4 ou 5, pode-se estar cometendo um erro. A probabilidade deste erro é igual a probabilidade de ocorrência destes valores sob H0, isto é, quando a moeda M1 é lançada, que é conforme tabela igual a: 10/32 + 5/32 + 1/32 = 16/32 = 50% Lembrando que rejeitar H0 é apenas uma das duas situações possíveis num teste de hipóteses, tem-se que se X assumir um valor do conjunto RA se aceitará Ho. Mas tais valores podem ocorrer sob H1, isto é, quando a moeda M2 é lançada. Então se Ho for aceita porque X assumiu um dos valores: 1, 2 ou 3, pode-se estar cometendo um outro tipo de erro, cuja probabilidade é igual a da ocorrência destes valores sob H1 que é de: 1/3125 + 20/3125 + 160/3125 = 181/3125 = 5,79% A probabilidade de que a variável (número de caras) assuma um valor do conjunto RC é denominada de nível de significância do teste. O nível de significância do teste é, na realidade, a probabilidade de se rejeitar a hipótese nula, quando ela é verdadeira, sendo então a probabilidade de se cometer um erro. Como este é apenas um dos dois tipos de erro possível de ser cometido num teste de hipóteses, ele é denominado de erro do tipo I. O outro tipo de erro possível de ser cometido é aceitar S É R I E : E s t a t í s t i c a B á s i c a T e x t o 4 : T E S T E S D E H I P Ó T E S E S Prof. Lorí Viali - viali@mat.pucrs.br - http://www.mat.pucrs.br/~lori/ 6 H0 quando ela é falsa e é denominado de erro do tipo II. Em resumo pode-se ter as seguintes situações em um teste de hipóteses: Tabela 02 - Possibilidades envolvidas em um teste de hipóteses Realidade Decisão Aceitar H0 Rejeitar H0 H0 é verdadeira Decisão correta 1 - α = P(Aceitar H0 / H0 é V) = P(H0 / H0) Erro do Tipo I α = P(Erro do tipo I) = P(Rejeitar H0 / H0 é V) = Nível de significância do teste = P(H1 / H0) H0 é falsa Erro do Tipo II β = P(Erro do tipo II) = = P(Aceitar H0 / H0 é falsa) = P(Aceitar H0 /H1 é V) = P(H0 /H1) Decisão correta 1 - β = P(Rejeitar H0 / H0 é falsa) = P(H1 / H1) = Poder do teste. Pode-se, agora, determinar as probabilidades de se cometer os erros dos tipos I e II e como conseqüência as probabilidades de se tomar as decisões corretas. A probabilidade de se cometer erro do tipo II, pode ser determinada aqui, porque o teste é do tipo simples, isto é, a hipótese alternativa envolve um único valor (neste caso p = 80%). Geralmente, a hipótese alternativa é do tipo composto (p < 80% ou p > 80% ou ainda p ≠ 80%), e então a determinação do erro do tipo II só poderá ser feita mediante suposições à respeito dos valores que ela pode assumir. Existirão, na realidade, infinitas opções para o erro do tipo II. Para este caso, tem-se: α = nível de significância do teste = P(Erro do tipo I) = P(rejeitar H0 / H0 é verdadeira) = P( x ∈ RC / p = 50%) = P( x ∈ { 3, 4, 5 }/ p = 50%) = 10/32 + 5/32 + 1/32 = 16/32 = 50% 1 - α = P(Decisão correta) = P(Aceitar H0 / H0 é verdadeira) = P( x ∈ RA / p = 50%) = P( x ∈ { 0, 1, 2 }/ p = 50%) = 1/32 + 5/32 + 10/32 = 16/32 = 50% β = P(Erro do tipo II) = P(Aceitar H0 / H0 é falsa) = P( x ∈ RA / p = 80%) = P( x ∈ { 0, 1, 2 }/ p = 80%) = 1/3125 + 20/3125 + 160/3125 = 181/3125 = 5,69% 1 - β = Poder do teste = P(Decisão correta) = P(Rejeitar H0 / H0 é falsa) = P( x ∈ RC / p = 80%) = P( x ∈ { 3, 4, 5 }/ p = 80%) = 640/3125 + 1280/3125 + 1024/3125 = 2944/3125 = 94,31% Por estes resultados pode-se verificar, que o erro do tipo II poderia ser aceitável, mas o erro do tipo I não, pois é um valor igual a probabilidade de se decidir corretamente. Neste caso, uma opção para diminuir o erro do tipo I seria mudar a região de rejeição. Se a região crítica escolhida tivesse sido RC = { 5 }, isto é, rejeitar a hipótese nula somente se em 5 lançamentos da moeda fosse obtida 5 caras as probabilidades acima ficariam: α = nível de significância do teste = P(Erro do tipo I) = P(Rejeitar H0 / H0 é verdadeira) = P( x ∈ RC / p = 50%) = P( x ∈ { 5 }/ p = 50%) = 1/32 = 3,12%. 1 - α = 1 - P(Erro do tipo I) = P(Aceitar H0 / H0 é verdadeira) = P( x ∈ RA / p = 50%) = P( x ∈ { 0, 1, 2, 3, 4 } / p = 50%) = 1/32 + 5/32 + 10/32 + 10/32 + 5/32 = 31/32 = 96, 88%. β = P(Erro do tipo II) = P(Aceitar H0 / H0 é falsa) = P( x ∈ RA / p = 80%) = P(x ∈ { 0, 1, 2, 3, 4}/ p = 80%) = 1/3125 + 20/3125 + 160/3125 + 640/3125 + 1280/3125 = 2101/3125 = 67,33%. 1 - β = 1 - P(Erro do tipo II) = P(Rejeitar H0 / H0 é falsa) = P( x ∈ RC / p = 80%) = P( x ∈ { 5 }/ p = 80%) = 1024/3125 = 32,77% = Poder do teste. S É R I E : E s t a t í s t i c a B á s i c a T e x t o 4 : T E S T E S D E H I P Ó T E S E S Prof. Lorí Viali - viali@mat.pucrs.br - http://www.mat.pucrs.br/~lori/ 7 Pode-se ver então que o erro do tipo I diminui sensivelmente, mas em compensação tivemos um aumento substancial do erro do tipo II. Isto sempre vai ocorrer. A única forma de reduzir os dois tipos de erro simultaneamente é pelo aumento do tamanho da amostra. Neste caso, está se considerando uma amostra de apenas 5 lançamentos dos infinitos possíveis. É natural que os erros associados sejam grandes, pois a amostra é muito pequena. Aumentado-se o tamanho da amostra é possível com a mesma região crítica diminuir sensivelmente os dois tipos de erro. 1.6. A DISTRIBUIÇÃO AMOSTRAL A distribuição amostral é uma distribuição de probabilidade, isto é, é uma distribuição teórica que descreve o comportamento de uma determinada estatística ou estimador. As principais estatísticas utilizadas nos testes de hipóteses possuem modelos conhecidos. Têm-se a distribuição normal, a distribuição t (de Student) a distribuição χ2 (qui-quadrado), a distribuição F (de Snedkor) como as principais. 1.7. TESTES ESTATÍSTICOS PARAMÉTRICOS Em termos gerais, uma hipótese é uma conjectura sobre algum fenômeno ou conjunto de fatos. Em estatística inferencial o termo hipótese tem um significado bastante especifico. É uma conjectura sobre uma ou mais parâmetros populacionais. O teste de hipóteses paramétrico envolve fazer inferências sobre a natureza da população com base nas observações de uma amostra extraída desta população. Em outras palavras, testar hipóteses, envolve determinar a magnitude da diferença entre um valor observado de uma estatística, por exemplo a proporção p, e o suposto valor do parâmetro (π) e então decidir se a magnitude da diferença justifica a rejeição da hipótese. O processo segue o esquema da figura 01. 1.8. ETAPAS DO TESTE DE HIPÓTESES Qualquer teste de hipóteses paramétrico segue os seguintes passos: Questão a ser feita Decisão a ser tomada µ = 455 Diferença pequena Selecionada Aleatoriamente Diferença grande x = 435 Figura 01 - A lógica dos testes de hipóteses População Valor hipotético do parâmetro. Qual é a magnitude da diferença entre o valor observado da estatística e o valor hipotético da parâmetro? Não rejeitar a hipótese Amostra Valor observado da estatística. Rejeitar a hipótese S É R I E : E s t a t í s t i c a B á s i c a T e x t o 4 : T E S T E S D E H I P Ó T E S E S Prof. Lorí Viali - viali@mat.pucrs.br - http://www.mat.pucrs.br/~lori/ 10 Tabela 03 - Valores de z para alguns níveis de significância α = Nível de significância = P(Erro do Tipo I) 10% 5% 1% Teste bilateral 1,64 1,96 2,57 Teste unilateral 1,28 1,64 2,33 Exemplo A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo perdido em acidentes de trabalho, cuja média, nos últimos tempos, tem sido da ordem de 60 hora /homens por ano com desvio padrão de 20 horas/homem. Tentou-se um programa de prevenção de acidentes e, após o mesmo, tomou-se uma amostra de 9 indústrias e mediu-se o número de horas/homem perdidas por acidente, que foi de 50 horas. Você diria, ao nível de 5%, que há evidência de melhoria? Solução As hipóteses a serem testadas são: H0: µ = 60 hora/homens H1: µ < 60 hora/homens A evidência amostral para sugerir que a média baixou é dada através da amostra de n = 9 (elementos) que forneceu x = 50 horas/homens. Vamos testar se esta diferença de 10 horas/homens é ou não significativa ao nível de 5%. Para isto é necessário padronizar o resultado amostral. Z = (X - Xµ ) / Xσ = (X - µ) / σ/ n = (50 - 60) / 20/ 9 = -1,50 Para saber se este valor (-1,50) é pouco provável é necessário compará-lo com o valor crítico - zα (pois se trata de um teste unilateral à esquerda), que neste caso vale -1,64, já que o nível de significância foi fixado em 5%. Vê-se portanto que o valor amostral não é inferior ao valor crítico, não estando portanto na região de rejeição. Isto quer dizer que a diferença apresentada na amostra não é suficientemente grande para provar que a campanha de prevenção deu resultado. Então a conclusão é: “Não é possível ao nível de 5% de significância afirmar que a campanha deu resultado, isto é, rejeitar H0. ” Convém lembrar que o fato de não rejeitar a hipótese nula, não autoriza a fazer afirmações a respeito da veracidade dela. Ou seja, não se provou H0, pois no momento que se aceita a hipótese nula, o risco envolvido é o do Tipo II, e este neste caso não está fixado (controlado). O teste de hipóteses é feito para rejeitar a hipótese nula e sua força está na rejeição. Assim quando se rejeita se prova algo, mas quando se aceita, nada se pode afirmar. (b) σ desconhecido A distribuição t de Student Quando o desvio padrão populacional (σ) é desconhecido é necessário estimá-lo através do desvio padrão da amostra (s). Mas ao substituir o desvio padrão da população na expressão: Z = (X - Xµ ) / Xσ = (X - µ) / σ/ n não teremos mais uma distribuição normal. De fato, conforme demonstrado por W. S. Gosset (Student) a distribuição da variável: (X - Xµ ) / Xσ = (X - µ) / s/ n S É R I E : E s t a t í s t i c a B á s i c a T e x t o 4 : T E S T E S D E H I P Ó T E S E S Prof. Lorí Viali - viali@mat.pucrs.br - http://www.mat.pucrs.br/~lori/ 11 Não é mais normal padrão. Ao substituir σ por s na expressão teremos uma distribuição parecida com a normal, isto é, simétrica em torno de zero, porém com uma variabilidade maior. Desta forma a distribuição “t” é mais baixa no centro do que a normal padrão, mas mais alta nas caudas. Assim: (X - Xµ ) / Xσ = (X - µ) / s/ n = tn-1, onde “n - 1” indica a distribuição “t” considerada, pois cada tamanho de amostra produz uma distribuição de Student diferente. A distribuição t de Student encontra-se tabelada em função de n = tamanho da amostra ou então em função de n - 1 denominado de graus de liberdade da distribuição. Neste caso cada linha de uma tabela se refere a uma distribuição particular e cada coluna da tabela a um determinado nível de significância. Conforme a tabela o nível de significância poderá ser unilateral ou bilateral. Em todo caso é necessário sempre ler no cabeçalho ou no rodapé da tabela as explicações sobre como ela está estruturada. Desta forma a diferença entre o teste para a média de uma população com σ conhecido e um com σ desconhecido é que é necessário trocar a distribuição normal padrão pela distribuição “t “ de Student. Exemplo O tempo médio, por operário, para executar uma tarefa, tem sido 100 minutos. Introduziu-se uma modificação para diminuir este tempo, e, após certo período, sorteou-se uma amostra de 16 operários, medindo-se o tempo de execução gasto por cada um. O tempo médio da amostra foi 85 minutos com desvio padrão de 12 minutos. Este resultado evidencia uma melhora no tempo gasto para realizar a tarefa? Apresente as conclusões aos níveis de 5% e 1% de significância e diga quais as suposições teóricas necessárias que devem ser feitas para resolver o problema. Solução A suposição teórica necessária é admitir que a distribuição da população de onde foi extraída a amostra segue uma normal pois n < 30. H0: µ = 100 H1: µ < 100 Considerando, então, um teste unilateral à esquerda e tendo α = 5% (α = 1%) tem-se que a região de rejeição é constituída por RC = [-∞, -1,753].(RC = [-∞, -2,602]) O valor de teste é: t15 = X s n − µ = 85 10012 4 − = -5 Como este valor pertence as duas regiões críticas, pode-se rejeitar a hipótese nula, aos níveis de 5% e 1% de significância, isto é, neste caso, pode-se afirmar que a modificação diminuiu o tempo de execução da tarefa. 2.1.2. TESTE PARA A PROPORÇÃO O teste para a proporção populacional é normalmente baseado na seguinte suposição: tem-se uma população e tem-se uma hipótese sobre a proporção π de elementos da população que possuem uma determinada característica. Esta proporção é supostamente igual a um determinado valor π0. Assim a hipótese nula é: H0 : π = π0 O problema fornece informações sobre a alternativa, que pode ser uma das seguintes: S É R I E : E s t a t í s t i c a B á s i c a T e x t o 4 : T E S T E S D E H I P Ó T E S E S Prof. Lorí Viali - viali@mat.pucrs.br - http://www.mat.pucrs.br/~lori/ 12 H1 : π ≠ π0 H1 : π > π0 H1 : π < π0 A estatística teste a ser utilizada é a proporção amostral “P”, que para amostras grandes (n > 50) tem uma distribuição aproximadamente normal com média: µP = π, e desvio padrão P nσ π π = −( )1 Exemplo As condições de mortalidade de uma região são tais que a proporção de nascidos que sobrevivem até 60 anos é de 0,60. Testar esta hipótese ao nível de 5% de significância se em 1000 nascimentos amostrados aleatoriamente, verificou-se 530 sobreviventes até os 60 anos. Solução H1: π = 0,60 H0: π ≠ 0,60 Considerando, então, um teste bilateral e tendo α = 5% tem-se que a região de aceitação é constituída pelo intervalo RA = [-1,96, 196]. O valor de teste é: z = p n − − π π π( )1 = 0 53 0 60 060(1 0 60 1000 , , , ) − − = -4,52. Como este valor não pertence a região de aceitação, pode-se rejeitar a hipótese nula, ao nível de 5% de significância, isto é, neste caso, pode-se afirmar que a taxa dos que sobrevivem até os 60 anos é menor do que 60%. Neste caso, também poderia ser realizado um teste unilateral à esquerda. Este teste também rejeitaria a hipótese nula, pois para ele o valor crítico zα = -1645. 2.1.3. TESTE PARA A VARIÂNCIA Para aplicar o teste para a variância é necessário supor a normalidade da população de onde será extraída a amostra. As hipóteses são: H0: σ2 = 02σ contra H1: σ2 ≠ 02σ σ2 > 02σ σ2 < 02σ A estatística teste é ( )n s− 1 2 0 2σ ∼ n−1 2χ Quer dizer o quociente acima tem uma distribuição qui-quadrado com “n-1” graus de liberdade. A qui-quadrado é uma distribuição assimétrica positiva que varia de zero a mais infinito. Esta distribuição é tabelada também em função dos número de graus de liberdade, isto é, cada grau de liberdade (n -1) representa uma distribuição diferente. As colunas das tabelas representam diferentes níveis de significância, isto é, área sob a curva acima do valor tabelado. S É R I E : E s t a t í s t i c a B á s i c a T e x t o 4 : T E S T E S D E H I P Ó T E S E S Prof. Lorí Viali - viali@mat.pucrs.br - http://www.mat.pucrs.br/~lori/ 15 Qc = X Y S S 2 2 = 40 / 37 = 1,08. Por estes resultados não é possível rejeitar a hipótese de igualdade entre as variâncias a um nível de significância de 10%. (Como o teste é bilateral, ele envolve uma área de 5% em cada cauda da distribuição, logo a significância total é de 10%). 2.2.2. TESTE PARA A DIFERENÇA ENTRE DUAS MÉDIAS POPULACIONAIS (a) Supondo as variâncias ( σ2X e σ2Y )conhecidas As hipóteses são: H0: µX - µY = ∆ contra H1: µX - µY ≠ ∆ ou µX - µY > ∆ ou ainda µX - µY < ∆ Se ∆ = 0, então µX - µY = 0, isto é, µX = µY. Como as variâncias são conhecidas, tem-se então que, para n, m ≥ 30 ou para amostras extraídas de populações normais, que a variável D = X - Y terá uma distribuição aproximadamente normal com média E(D ) = µX - µY e variância V(D ) = mn σσ 2Y2X + . A variável teste será, então: z = m + n YX σσ 2Y2X ∆−− Assim fixando o nível de significância “α“, a hipótese nula será rejeitada se: |z| > zα/2 no teste bilateral; z > zα, no teste unilateral à direita e z < zα no teste unilateral à esquerda. Exemplo: Um fabricante produz dois tipos de pneus. Para o pneu do tipo A o desvio padrão é de 2500 km e para o pneu do tipo B é de 3000 km. Uma cia de táxis testou 50 pneus do tipo A e 40 do tipo B, obtendo 24000 km de média para o “A” e 26000 para o tipo “B”. Adotando α = 4% testar a hipótese de que a duração média dos dois tipos é a mesma. Solução: As hipóteses são: H0: µA - µB = 0 ( µA = µB ) contra H1: µA - µB ≠ 0 ( µA ≠ µB ) Como α = 4%, então zα/2 = -2,05. O valor da variável teste será: z = 24000 26000− 2 22500 50 + 3000 40 = -3,38 S É R I E : E s t a t í s t i c a B á s i c a T e x t o 4 : T E S T E S D E H I P Ó T E S E S Prof. Lorí Viali - viali@mat.pucrs.br - http://www.mat.pucrs.br/~lori/ 16 Portanto, rejeita-se a hipótese de igualdade entre as durações médias dos dois tipos de pneus. Com base nestas amostras, pode-se afirmar, ao nível de 4% de significância, que os dois tipos de pneus diferem quanto a durabilidade média. (b) Variâncias σ2X e σ2Y desconhecidas mas supostamente iguais Vamos supor que as duas populações tenham a mesma variância σ2 = σ2X = σ2Y , porém desconhecidas. As hipóteses são: H0: µX - µY = ∆ contra H1: µX - µY ≠ ∆ ou µX - µY > ∆ ou ainda µX - µY < ∆ A variável teste anterior, para esta situação, será: Z = m + n YX σσ 2Y2X ∆−− , mas neste caso X2σ = Y2σ = σ 2 (por suposição), então: Z = m + n YX σσ 2Y2X ∆−− = m + n YX σσ 22 ∆−− = m 1+ n 1σ YX ∆−− , como o valor σ2 não é conhecido, deverá ser substituído por um estimador não-tendencioso. Como S2X e S2Y são estimadores não tendenciosos do mesmo parâmetro σ2, então, a média ponderada: 2mn S)1m(S)1n(S 2 Y 2 X2 −+ −+−= , também será um estimador não-tendencioso de σ2. Logo a expressão acima poderá ser escrita como: m 1+ n 1S YX ∆−− , que terá uma distribuição não mais normal mas sim “t” com “n + m – 2” graus de liberdade, desde que n, m sejam maiores ou iguais a 30, ou então que as amostras tenham sido extraídas de populações que tenham distribuições normais. Desta forma, a expressão para testar a diferença entre duas médias populacionais, nesta situação será: tc = tn+m-2 = m 1+ n 1S YX ∆−− Assim fixando o nível de significância “α“, a hipótese nula será rejeitada se: |tc| > tα/2 no teste bilateral; tc > tα, no teste unilateral à direita e tc < tα no teste unilateral à esquerda. Exemplo: As resistências de dois tipos de concreto foram medidas, mostrando os resultados da tabela. Fixado um nível de significância de 5%, existe evidência de que o concreto do tipo A seja mais resistente do que o concreto do tipo B. S É R I E : E s t a t í s t i c a B á s i c a T e x t o 4 : T E S T E S D E H I P Ó T E S E S Prof. Lorí Viali - viali@mat.pucrs.br - http://www.mat.pucrs.br/~lori/ 17 Tipo A 54 55 58 51 57 Tipo B 50 54 56 52 53 Solução: Antes de mais nada vamos testar se as duas populações possuem a mesma variância. Para tanto aplica-se o teste de igualdade de variâncias, utilizando as amostras acima e uma significância de 5%. Tem-se: Graus de liberdade: 4 (numerador), 4 (denominador) F = 7,5/5,0 = 1,50. F2,5% = 0,10 F97,5% = 9,60 Significância do resultado obtido: 35,20%. Neste caso, não é possível afirmar que as variâncias populacionais são diferentes. As hipóteses são: H0: µA - µB = 0 ( µA = µB ) contra H1: µA - µB > 0 ( µA > µB ) Os dados obtidos da tabela são: X = 55,0 e Y = 53,0 XS2 = 7,50 e YS2 = 5,0, então S 2 = 2mn )1m()1n( SS 2Y2X −+ −+− = 255 0,5).15(5,7).15( −+ −+− = 6,25. O valor da variável teste será: tc = 5 1+ 5 1.50,2 5355 − = 1,265 Como α = 5%, e o grau de liberdade n - m - 2 = 10 - 2 = 8, então o valor de “t” tabelado será: 1,86. Neste caso, com estas amostras não é possível afirmar que o concreto do tipo A seja mais resistente do que o concreto do tipo B. (c) Variâncias σ2X e σ2Y desconhecidas e supostamente desiguais As hipóteses são: H0: µX - µY = ∆ contra H1: µX - µY ≠ ∆ ou µX - µY > ∆ ou ainda µX - µY < ∆ Como as variâncias são desconhecidas é necessária estimá-las através das variâncias amostrais XS2 e YS2 . Neste caso, ao se substituir as variâncias populacionais pelas amostrais na expressão: m + n YX σσ 2Y2X ∆−− não se terá mais uma distribuição normal, mas sim uma distribuição “t” com o grau de liberdade fornecido pela seguinte expressão: S É R I E : E s t a t í s t i c a B á s i c a T e x t o 4 : T E S T E S D E H I P Ó T E S E S Prof. Lorí Viali - viali@mat.pucrs.br - http://www.mat.pucrs.br/~lori/ 20 resultados estão na tabela ao lado. Ao nível de 10% é possível afirmar que a tarefa realizada na máquina X demora mais do que na máquina Y? Solução: As hipóteses são: H0: µX - µY = 0 (µX = µY) contra H1: µX - µY > 0 (µX > µY ) Pela tabela vê-se que: di: 5, 2, 5, 6 e 7 Logo: d = 5 e SD = 1,8708, logo t = 5,98. Como α = 10%, então tα = 1,54, pois o número de graus de liberdade é n - 1 = 4. Portanto, rejeita-se a hipótese nula, isto é, a 10% de significância pode-se afirmar que com a máquina X se demora mais do que com a máquina Y. 2.3.1. TESTE PARA A DIFERENÇA ENTRE DUAS PROPORÇÕES As hipóteses são: H0: π1 - π2 = π contra H1: π1 - π2 ≠ π ou π1 - π2 > π ou ainda π1 - π2 < π Se π = 0, então π1 - π2 = 0, isto é, π1 = π2. Extraídas uma amostra de cada uma das duas populações a variável P1 - P2 terá uma distribuição aproximadamente normal com média E(P1 - P2) = π1 - π2 e variância 1 2 2 p P−σ = 1 1 2 21 1π π π π( ) ( )− + − n m , desde que nP1 > 5 e mP2 > 5. A variável teste será, então: z = 1 2 1 1 1 2 1 2 P P n m − − − − π π π π π( () )+ Como os valores de π1 e π2 não são conhecidos, deve-se utilizar suas estimativas P1 e P2. Desta forma, o valor de z será: z = ( ) ( ) 1 2 1 1 2 21 1 P P P P n P P m − − − − π + Assim fixando o nível de significância “α“, a hipótese nula será rejeitada se: |z| > zα/2 no teste bilateral; z > zα, no teste unilateral à direita e z < zα no teste unilateral à esquerda. Exemplo: Em uma pesquisa de opinião, 32 dentre 80 homens declararam apreciar certa revista, acontecendo o mesmo com 26 dentre 50 mulheres. Ao nível de 5% de significância os homens e as mulheres apreciam igualmente a revista? Operador Fabricante 1 Fabricante 2 1 80 75 2 72 70 3 65 60 4 78 72 5 85 78 S É R I E : E s t a t í s t i c a B á s i c a T e x t o 4 : T E S T E S D E H I P Ó T E S E S Prof. Lorí Viali - viali@mat.pucrs.br - http://www.mat.pucrs.br/~lori/ 21 Solução: As hipóteses são: H0: π1 - π2 = 0 (π1 = π2) contra H1: π1 - π2 ≠ 0 (π1 ≠ π2) Tem-se que P1 = 32 / 80 = 0,40 e P2 = 26 / 50 = 52% O valor da variável teste será: z = 0 40 0 52 80 , ,− 0,40.0,60 + 0,52.0,48 50 = -1,34 Como α = 5%, então zα/2 = -1,96. Portanto, aceita-se a hipótese de igualdade entre as preferências de homens e mulheres, isto é, a este nível de significância não é possível afirmar que exista diferença entre as preferências de homens e mulheres quanto à revista. S É R I E : E s t a t í s t i c a B á s i c a T e x t o 4 : T E S T E S D E H I P Ó T E S E S Prof. Lorí Viali - viali@mat.pucrs.br - http://www.mat.pucrs.br/~lori/ 22 3. EXERCÍCIOS (01) Pretende-se lançar uma moeda 5 vezes e rejeitar a hipótese de que a moeda é não-tendenciosa, isto é, pretende-se rejeitar Ho: π = 0,50, se em 5 (cinco) jogadas ocorrerem 5 coroas ou 5 caras. Qual é a probabilidade de se cometer erro do tipo I? (02) (Bussab, pg. 249) Se, ao lançarmos 3 vezes uma moeda, supostamente equilibrada, aparecerem 3 caras decide-se rejeitar a hipótese de que a moeda é “honesta”, qual a probabilidade de se cometer erro do tipo I? Se a moeda favorece cara em 80% das vezes, qual a probabilidade de se cometer erro do tipo II? (03) Você suspeita que um dado é viciado, isto é, você suspeita que a probabilidade de obter face 6 é maior do que 1/6. Você decide testar a hipótese de que o dado é não-viciado, jogando-o cinco vezes e rejeitando essa hipótese se ocorrer a face 6 (seis), 4 ou 5 vezes. Qual o nível de significância do teste? (04) Nas faces de dois tetraedros regulares, aparentemente idênticos, estão marcados os valores: 0, 1, 2 e 3. Ao lançar um destes tetraedros o resultado observado é o valor da face que fica em contato com a superfície. Os dois tetraedros são “chumbados”, de tal maneira que, ao jogá-los, as probabilidades de cada uma das faces ficar em contato com a superfície são as da tabela. Tomando ao acaso um dos tetraedros tem-se duas hipóteses: H0 : Trata-se do tetraedro A; H1 : Trata-se do tetraedro B. (04.1) Para testar H0 contra H1, o tetraedro escolhido é lançado duas vezes. Adota-se a seguinte regra de decisão: rejeitar H0 se a soma dos resultados dos dois lançamentos for maior ou igual a 5. Determinar o nível de significância e o poder do teste. (04.2) Determinar o nível de significância e o poder do teste se a regra de decisão for: rejeitar H0 se sair o valor 3 (três) em ao menos um dos lançamentos e o outro resultado não for o valor 0 (zero). (05) Em cada uma das quatro faces de dois tetraedros regulares, aparentemente idênticos, estão marcados os valores: 1, 2, 3 e 4. Entretanto, um dos tetraedros é feito de material homogêneo (tetraedro A) , de maneira que, ao lançá-lo a probabilidade de qualquer uma das 4 faces fique em contato com a superfície é 0,25. O outro tetraedro (tetraedro B) é “chumbado”, de tal maneira que, ao jogá-lo, a face com o valor 4 (quatro) tem probabilidade de 0,50 de ficar em contato com a superfície, enquanto que qualquer uma das outras três tem probabilidade igual a 1/6. Suponha que um dos tetraedros é lançado 48 vezes, para testar a hipótese H0 de que foi lançado o tetraedro A, contra a hipótese H1 de que foi lançado o tetraedro B. Supõem-se ainda a seguinte regra de decisão: “se nos 48 lançamentos, a face com o valor 4 (quatro), for obtida 20 ou mais vezes, rejeita-se H0 em favor de H1. Determine o nível de significância e o poder do teste. (06) Uma urna contém 6 fichas, das quais θ são brancas e 6 - θ são pretas. Para testar a hipótese de nulidade de que θ = 3, contra a alternativa de que θ ≠ 3, são retiradas 2 (duas) fichas da urna ao acaso e sem reposição. Rejeita-se a hipótese nula se as duas fichas forem da mesma cor. (06.1) Determine P(Erro do Tipo I). (06.2) Determine o poder do teste para os diferentes valores de θ. (06.3) Considere, agora, que a segunda ficha é retirada após a reposição da primeira. Calcule, novamente, o nível de significância e os valores do poder do teste. (06.4). Compare os dois procedimentos (com e sem reposição da segunda ficha retirada). Qual a conclusão? Face Tetraedro A Tetraedro B 0 0,40 0,20 1 0,20 0,20 2 0,20 0,20 3 0,20 0,40 Total 1 1 S É R I E : E s t a t í s t i c a B á s i c a T e x t o 4 : T E S T E S D E H I P Ó T E S E S Prof. Lorí Viali - viali@mat.pucrs.br - http://www.mat.pucrs.br/~lori/ 25 (21) Diversas políticas, em relação às filiais de uma rede de supermercados, estão associadas ao gasto médio dos clientes em cada compra. Deseja-se comparar estes parâmetros de duas novas filiais, através de duas amostras de 50 clientes, selecionados ao acaso, de cada uma das novas filiais. As médias obtidas foram 62 e 71 unidades monetárias. Supondo que os desvios padrões sejam idênticos e iguais a 20 um, teste a hipótese de que o gasto médio dos clientes não é o mesmo nas duas filiais. Utilize uma significância de 2,5%? (22) Uma fábrica de embalagens para produtos químicos está estudando dois processos diferentes de combate a corrosão nas latas usadas para embalagem. Para verificar o efeito dos dois processos foram utilizadas duas amostras aleatórias que apresentaram os valores da tabela, quanto a variável “duração da embalagem (em meses) antes da primeira mancha de corrosão aparecer”. Ao nível de significância de 5% é possível afirmar que um tratamento é melhor do que o outro? (23) Você recebe a informação de que a diferença entre duas médias amostrais é “estatisticamente significativa ao nível de 1%”. Dizer se as afirmações abaixo estão certas ou erradas e justificar. (23.1) Há pelo menos 99% de probabilidade de existir uma diferença real entre as médias das duas populações. (23.2) Se não houvesse diferença entre as médias das duas populações, a probabilidade de detectar uma tal diferença (ou diferença maior) entre as médias amostrais seria de 1% ou menos. (23.3) A informação constituí uma evidência sólida de que realmente exista diferença entre as médias populacionais. Todavia, por si só, não constituí evidência suficiente de que tal diferença seja suficientemente grande para ter importância prática. Isto ilustra a diferença entre os conceitos “significância estatística” e “significância prática”. (23.4) O valor da estatística teste (valor calculado) é exatamente 1%. (23.5) A probabilidade de que as médias das duas amostras sejam diferentes é de 1%. (24) Foram levantadas quatro hipóteses sobre a média salarial anual de engenheiros mecânicos e civis: (i) Engenheiros mecânicos e civis ganham em média o mesmo salário. (ii) Os engenheiros mecânicos ganham, em média R$ 500 a mais do que os civis. (iii) Os engenheiros mecânicos ganham, em média R$ 1000 a mais do que os civis. (iv) Os engenheiros mecânicos ganham, em média R$ 2000 a mais do que os civis. Para testar a hipótese foram extraídas duas amostras aleatórias dos salários dos dois tipos de profissionais que apresentaram os valores da tabela. Com base, nos valores, responda, justificando, as seguintes questões: (24.1) Sem quaisquer, cálculos detalhados, podemos verificar imediatamente, qualquer uma das hipóteses. (24.2) Se aplicarmos um teste bilateral a cada uma das hipóteses, quais seriam rejeitadas ao nível de 5%? (24.3) Se aplicarmos um teste unilateral a cada uma das hipóteses, quais seriam rejeitadas ao nível de 5%? Processo Tamanho da amostra Média Desvio padrão A 15 48 10 B 12 52 15 Engenheiros Tamanho da amostra Média Desvio padrão Mecânicos 250 38000 8000 Civis 200 36000 10000 S É R I E : E s t a t í s t i c a B á s i c a T e x t o 4 : T E S T E S D E H I P Ó T E S E S Prof. Lorí Viali - viali@mat.pucrs.br - http://www.mat.pucrs.br/~lori/ 26 (24.4) Várias hipóteses foram consideradas aceitáveis, ao nível de 5% de significância. Se você tivesse que escolher apenas uma delas para publicar como conclusão do estudo, por qual optaria? Por quê? (25) Calculadoras eletrônicas utilizam dois métodos diferentes de entrada e processamento numérico. Vamos denominar um dos métodos de “método algébrico” (MA) e o outro de “método polonês” (MP). Para comparar qual deles é mais eficaz é feito um teste com 20 usuários sem experiência prévia com calculadoras, onde 10 vão utilizar calculadoras de um tipo e o outros 10 as de outro tipo. A tabela mostra o tempo em segundos que cada operador gastou para realizar um conjunto padrão de cálculos. Testar a hipótese de que não existe diferença entre os dois métodos no que se refere ao tempo de operação, utilizando uma significância de 5%. (26) Num ensaio para testar a proteção de dois tipos de tinta em superfícies metálicas, 55 painéis foram pintados com a tinta PK12 e 75 com a tinta PK15. Decorridos dois anos de exposição dos painéis ao ar livre, verificou-se que, dos painéis pintados com PK12, 6 apresentaram problemas enquanto que dos 75 painéis pintados com PK15, 19 apresentaram problemas. Pode-se concluir, destes valores, com 5% de significância, que as duas marcas de tintas diferem quanto a capacidade de proteção? (27) Um psicólogo defende a idéia de que a autorização para dirigir só deve ser dada a maiores do que 21 anos de idade. Para tanto argumentou que os jovens entre 18 e 21 causam no mínimo 15% a mais acidentes dos que os de mais de 21 anos. Suas conclusões são baseadas em uma amostra de 150 pessoas entre os 18 e 21 anos, dos quais 60 já haviam se envolvido em algum tipo de acidente. Já entre os motoristas maiores de 21 anos de 200 observados, 30 já haviam se envolvido em algum tipo de acidente. (a) Teste a argumentação do psicólogo a um nível de 5% de significância. (b) Qual o problema que as amostras coletadas pelo psicólogo apresentam? (28) Em dois anos consecutivos foi feito um levantamento de mercado sobre a preferência dos consumidores pelo por um determinado produto. No primeiro ano o produto era anunciado com freqüência semanal nos veículos de comunicação e no segundo ano com freqüência mensal. No levantamento foram utilizados duas amostras independentes de 400 consumidores cada. No primeiro ano o percentual de compradores ficou em 33% e no segundo ano em 29%. Considerando o nível de significância de 5%, teste a hipótese de que a freqüência do anúncio tem influência na manutenção da fatia de mercado. (29) Uma das maneiras de medir o grau de satisfação dos empregados de uma mesma categoria quanto a política salarial é através do desvio padrão de seus salários. A fábrica A diz ser mais coerente na política salarial do que a fábrica B. Para verificar essa afirmação, sorteou-se uma amostra de 10 funcionários não especializados de A e 15 de B, obtendo-se os desvios padrões: sA = 1,0 s.m. e sB = 1,6 s.m. Qual a sua conclusão a um nível de 5% de significância? (30) (BUSSAB - pg. 277) Deseja-se comparar a qualidade de um produto produzido por dois fabricantes. Esta qualidade está sendo medida pela uniformidade com que é produzido o produto por cada fábrica. Tomaram-se duas amostras, uma de cada fábrica, medindo-se o comprimento dos produtos. A qualidade da produção das duas fábricas é a mesma a um nível de 5%? Operador 1 2 3 4 5 6 7 8 9 10 MA 12 16 15 13 16 10 15 17 14 12 MP 10 17 18 16 19 12 17 15 17 14 Estatísticas Fábrica A Fábrica B Amostra 21 17 Média 21,15 21,12 Variância 0,0412 0,1734 S É R I E : E s t a t í s t i c a B á s i c a T e x t o 4 : T E S T E S D E H I P Ó T E S E S Prof. Lorí Viali - viali@mat.pucrs.br - http://www.mat.pucrs.br/~lori/ 27 4. RESPOSTAS (01) RC = { 0, 5} α = P(RC) = P{ X = 0 ou X = 5 / π = 0,50} = (1/2)5+ (1/2)5 = 1/16 = 6,25% (02) RC = { 3 } α = P({ 3 }) = (1/2)3 = 1/8 = 12,50% β = P(Ac. H0 / H0 é Falsa} = P(X = 0, 1, 2 / π = 0,8} = (1/5)3 + 3(4/5)1 (1/5)2 + 3(4/5)2 (1/5)1 = 48,80% (03) RC { 4, 5} α = P(RC) = P({ X = 4 ou X = 5 / π = 1/6}) = 13/3888 = 0, 33% (04) (04.1) RC = { (2, 3), (3, 2), ( 3, 3) } α = P(RC) = 0,20.0,20 + 0,20.0,20 + 0,20.0,20 = 12% Poder do Teste = 1 - β = P(Rej. H0 / H0 é Falsa} = 0,20.0,40 + 0,20.0,40 + 0,40.0,40 = 32% (04.2) RC = { (3, 1), (3, 2), ( 3, 3), (1, 3), (2, 3) } α = P(RC) = 5.0,04 = 0,20 = 20% Poder do Teste = 1 - β = P(Rej. H0 / H0 é Falsa} = 4.0,08 + 0,16 = 0,48 = 48% (05) RC = { X ≥ 20 / Tetraedro A) α = P(RC) = P({ X ≥ 20 / Tet. A}) ≅ P( Z ≥ (19,5 - 12) / 3) = 0,62% β = P(Ac. H0 / H0 é Falsa} = P(X < 20 / Tet. B} = 9,68% Poder = 1 - β = 100% - 9,68% = 90,32% (06) (06.1) n = 2 S/R RC = {BB, PP} α = P(RC) =(3/6).(2/5) + (3/6).(2/5) = 1/5 + 1/5 = 0,40 = 40% (06.2) n = 2 S/R 1 - β = P(Rejeitar H0 / H0 é falsa) θ = 0 ou θ = 6 1 - β = P(RC / θ = 0 ) = 1 = 100% = P(R / θ = 6) θ = 1 ou θ = 5 1 - β = P(RC / θ = 1 ) = (1/6).(0/5) + (5/6).(4/5) = 2/3 = 66,67% = P(RC / θ = 5) θ = 2 ou θ = 4 1 - β = P(RC / θ = 2 ) = (2/6).(1/5) + (4/6).(3/5) = 7/15 = 46,67% = P(RC / θ = 4) (06.3) n = 2 C/R RC = {BB, PP} α = P(RC) =(3/6).(3/6) + (3/6).(3/6) = 1/4 + 1/4 = 0,50 = 50% θ = 0 ou θ = 6 1 - β = P(RC / θ = 0 ) = 0 + 1 = 100% = P(RC / θ = 6) θ = 1 ou θ = 5 1 - β = P(RC / θ = 1 ) = (1/6).(1/6) + (5/6).(5/6) = 13/18 = 72,22% = P(RC / θ = 5) θ = 2 ou θ = 4 1 - β = P(RC / θ = 2 ) = (2/6).(2/6) + (4/6).(4/6) = 5/9 = 55,56% = P(RC / θ = 4) (06.4) Com reposição o NS (α) é maior do que SR. Por outro lado, repondo o poder do teste é maior ou igual a quando não se faz reposição. (07) (07.1) P(Erro I) = P( AX > 176) = P(Z > 176 - 175) = P(Z > 1) = 15,87% P(Erro II) = P( BX < 176) = P(Z < 176 - 177) = P(Z < -1) = 15,87% (07.2) P(Erro I) = P( AX > 176) = P[Z > (176 - 175)/0,5] = P(Z > 2) = 2,28% P(Erro II) = P( BX < 176) = P[Z < (176 - 177)/2] = P(Z < -2) = 2,28% (07.3) 5% = P(Erro I) = P( AX > 176) = P(Z > 176 - 175)  P(Z > x - 175) = 5%  x = 176,645. Neste caso, deve-se rejeitar H0 somente se a média for superior a 176,645. P(Erro II) = P( BX < 176,645 - 177) = P(Z < -0,36) = 35,94% (07.4) µB = 178 P(Erro II) = P( BX < 176 - 178) = P(Z < -2) = 2,28% µB = 180 P(Erro II) = P( BX < 176 - 180) = P(Z < -4) = 0,00% (08) (08.1) α = P(Rej. H0 / H0 é V) = P( X > 1170 / µ = 1150) = P[Z > (1170 - 1150) / 15)] = P(Z > 1,33) = 9,18% (08.2) β = P(Ac H0 / H1 é V) = P( X < 1170 / µ = 1200) = P[Z < (1170 - 1200) / 20)] = P(Z < -1,50) = 6,68%
Docsity logo



Copyright © 2024 Ladybird Srl - Via Leonardo da Vinci 16, 10126, Torino, Italy - VAT 10816460017 - All rights reserved