Estatística Básica-Testes de Hipóteses

Estatística Básica-Testes de Hipóteses

(Parte 3 de 5)

Exemplo: (BUS81 - pg. 275)

Quer se verificar se duas máquinas produzem peças com a mesma homogeneidade quanto à resistência à tensão. Para tal, sorteiam-se duas amostras de 6 peças de cada uma das máquinas e observa-se as resistências. Os resultados estão na tabela.

Solução: Como n = m = 6, tem-se que:

Q = XYSS2 2 = F(5, 5) = 5,05

A região crítica RC será: RC = (0; 1/5,05) U (5,05; ∝) = (0; 0,20) U (5,05; ∝) As amostras fornecem:

XS2 = 40 e YS2 = 37, portanto a distribuição do quociente Q calculado será:

SÉRIE: Estatística Básica Texto 4: TESTES DE HIPÓTESES

Prof. Lorí Viali - viali@mat.pucrs.br- http://w.mat.pucrs.br/~lori/ 15

Qc = XYSS2 2 = 40 / 37 = 1,08.

Por estes resultados não é possível rejeitar a hipótese de igualdade entre as variâncias a um nível de significância de 10%. (Como o teste é bilateral, ele envolve uma área de 5% em cada cauda da distribuição, logo a significância total é de 10%).

2.2.2. TESTE PARA A DIFERENÇA ENTRE DUAS MÉDIAS POPULACIONAIS

(a) Supondo as variâncias (σ2X e σ2Y)conhecidas As hipóteses são:

H0: µX - µY = ∆ contra H1: µX - µY ≠ ∆ ou µX - µY > ∆ ou ainda µX - µY < ∆

Se ∆ = 0, então µX - µY = 0, isto é, µX = µY.

Como as variâncias são conhecidas, tem-se então que, para n, m ≥ 30 ou para amostras extraídas de populações normais, que a variável D = X - Y terá uma distribuição aproximadamente normal com média E(D) = µX - µY e variância V(D) = mn

A variável teste será, então:

z =

Assim fixando o nível de significância “α“, a hipótese nula será rejeitada se:

|z| > zα/2 no teste bilateral; z > zα, no teste unilateral à direita e z < zα no teste unilateral à esquerda. Exemplo:

Um fabricante produz dois tipos de pneus. Para o pneu do tipo A o desvio padrão é de 2500 km e para o pneu do tipo B é de 3000 km. Uma cia de táxis testou 50 pneus do tipo A e 40 do tipo B, obtendo 24000 km de média para o “A” e 26000 para o tipo “B”. Adotando α = 4% testar a hipótese de que a duração média dos dois tipos é a mesma.

Solução: As hipóteses são:

H0: µA - µB = 0 ( µA = µB ) contra H1: µA - µB ≠ 0 ( µA ≠ µB )

SÉRIE: Estatística Básica Texto 4: TESTES DE HIPÓTESES

Prof. Lorí Viali - viali@mat.pucrs.br- http://w.mat.pucrs.br/~lori/ 16

Portanto, rejeita-se a hipótese de igualdade entre as durações médias dos dois tipos de pneus.

Com base nestas amostras, pode-se afirmar, ao nível de 4% de significância, que os dois tipos de pneus diferem quanto a durabilidade média.

(b) Variâncias σ2X e σ2Y desconhecidas mas supostamente iguais

Vamos supor que as duas populações tenham a mesma variância σ2 = σ2X = σ2Y, porém desconhecidas.

As hipóteses são:

H0: µX - µY = ∆ contra H1: µX - µY ≠ ∆ ou µX - µY > ∆ ou ainda µX - µY < ∆ A variável teste anterior, para esta situação, será:

substituído por um estimador não-tendencioso. Como S2X e S2Y são estimadores não tendenciosos do mesmo parâmetro σ2, então, a média ponderada:

−+− =, também será um estimador não-tendencioso de σ2.

Logo a expressão acima poderá ser escrita como:

YX∆−−, que terá uma distribuição não mais normal mas sim “t” com “n + m – 2” graus de liberdade, desde que n, m sejam maiores ou iguais a 30, ou então que as amostras tenham sido extraídas de populações que tenham distribuições normais.

Desta forma, a expressão para testar a diferença entre duas médias populacionais, nesta situação será:

tc = tn+m-2 =

Assim fixando o nível de significância “α“, a hipótese nula será rejeitada se:

|tc| > tα/2 no teste bilateral; tc > tα, no teste unilateral à direita e tc < tα no teste unilateral à esquerda. Exemplo:

As resistências de dois tipos de concreto foram medidas, mostrando os resultados da tabela.

Fixado um nível de significância de 5%, existe evidência de que o concreto do tipo A seja mais resistente do que o concreto do tipo B.

SÉRIE: Estatística Básica Texto 4: TESTES DE HIPÓTESES

Prof. Lorí Viali - viali@mat.pucrs.br- http://w.mat.pucrs.br/~lori/ 17

Solução:

Antes de mais nada vamos testar se as duas populações possuem a mesma variância. Para tanto aplica-se o teste de igualdade de variâncias, utilizando as amostras acima e uma significância de 5%.

Tem-se: Graus de liberdade: 4 (numerador), 4 (denominador) F = 7,5/5,0 = 1,50.

F97,5% = 9,60 Significância do resultado obtido: 35,20%.

Neste caso, não é possível afirmar que as variâncias populacionais são diferentes. As hipóteses são:

H0: µA - µB = 0 ( µA = µB ) contra

H1: µA - µB > 0 ( µA > µB ) Os dados obtidos da tabela são:

X = 5,0 e Y = 53,0

O valor da variável teste será:

tc =

Como α = 5%, e o grau de liberdade n - m - 2 = 10 - 2 = 8, então o valor de “t” tabelado será: 1,86.

Neste caso, com estas amostras não é possível afirmar que o concreto do tipo A seja mais resistente do que o concreto do tipo B.

(c) Variâncias σ2X e σ2Y desconhecidas e supostamente desiguais As hipóteses são:

H0: µX - µY = ∆ contra H1: µX - µY ≠ ∆ ou µX - µY > ∆ ou ainda µX - µY < ∆ Como as variâncias são desconhecidas é necessária estimá-las através das variâncias amostrais

XS2 e YS2. Neste caso, ao se substituir as variâncias populacionais pelas amostrais na expressão:

grau de liberdade fornecido pela seguinte expressão:

SÉRIE: Estatística Básica Texto 4: TESTES DE HIPÓTESES

Prof. Lorí Viali - viali@mat.pucrs.br- http://w.mat.pucrs.br/~lori/ 18

mSn S mSn S desde que n, m sejam maiores ou iguais a 30, ou então que as amostras tenham sido extraídas de populações que tenham distribuições normais.

Assim fixando o nível de significância “α“, a hipótese nula será rejeitada se:

|tc| > tα/2 no teste bilateral; tc > tα, no teste unilateral à direita e t < tα no teste unilateral à esquerda, onde t =

Exemplo:

As resistências de dois tipos de concreto foram medidas, mostrando os resultados da tabela.

Fixado um nível de significância de 5%, existe evidências de que o concreto do tipo A seja mais resistente do que o concreto do tipo B.

Solução:

Antes de mais nada vamos testar se as duas populações possuem a mesma variância. Para tanto aplica-se o teste de igualdade de variâncias, utilizando as amostras acima e uma significância de 10%.

Tem-se: Graus de liberdade: 4 (numerador), 4 (denominador). F = 17,3/2,5 = 6,92. Significância do resultado obtido: 4,38%. F crítico: 6,39. Neste caso, é possível afirmar que as variâncias populacionais são diferentes. As hipóteses são:

H0: µA - µB = 0 ( µA = µB ) contra

H1: µA - µB > 0 ( µA > µB ) Os dados obtidos da tabela são:

X = 5,6 e Y = 53,0

XS2 = 17,3 e YS2 = 2,5 O valor da variável teste será:

SÉRIE: Estatística Básica Texto 4: TESTES DE HIPÓTESES

Prof. Lorí Viali - viali@mat.pucrs.br- http://w.mat.pucrs.br/~lori/ 19

t =

Com α = 5%, e o grau de liberdade ν = mSn S mSn S então o valor de “t” tabelado será: 2,57.

Neste caso, com estas amostras não é possível afirmar que o concreto do tipo A seja mais resistente do que o concreto do tipo B.

Quando se compara as médias de duas populações, pode ocorrer uma diferença significativa por causa de fatores externos não-controláveis. Um modo de contornar este problema é coletar observações aos pares, de modo que os dois elementos de cada par sejam homogêneos em todos os sentidos, exceto naquele que se quer comparar.

Por exemplo, para testar dois métodos de ensino A e B, pode-se usar pares de gêmeos, sendo que um recebe o método de ensino A e o outro o método de ensino B. Este procedimento controla a maioria dos fatores externos que afetam a aprendizagem e se houver diferença deve-se realmente ao método.

Outra forma é fazer as observações das duas amostras no mesmo indivíduo. Por exemplo, medindo uma característica do indivíduo antes e depois dele ser submetido a um tratamento.

duas amostras: X1, X2,, Xn e Y1, Y2, ..., Yn, só que agora as observações estão emparelhadas, isto é, a

A exemplo da comparação de duas médias com amostras independentes, neste caso, tem-se amostra é formada pelos pares:

(X1, Y1), (X2, Y2),, (Xn, Yn)

Define-se a variável D = X - Y.

Como resultado tem-se a amostra: D1, D2,, Dn

11n D n X Yi i i i

Terá uma distribuição: NnDD(,)µσ. Definindo:

DnD n

− =, tem-se que a estatística:

n SDD

Dµ− tem uma distribuição “t” com “n - 1” graus de liberdade.

Exemplo:

Cinco operadores de máquinas são treinados em duas máquinas de diferentes fabricantes, para verificar qual delas apresentava maior facilidade de aprendizagem. Mediu-se o tempo que cada um dos operadores gastou na realização de uma mesma tarefa com cada um dos dois tipos de máquinas. Os

SÉRIE: Estatística Básica Texto 4: TESTES DE HIPÓTESES

Prof. Lorí Viali - viali@mat.pucrs.br- http://w.mat.pucrs.br/~lori/ 20

resultados estão na tabela ao lado. Ao nível de 10% é possível afirmar que a tarefa realizada na máquina X demora mais do que na máquina Y?

Solução: As hipóteses são:

H0: µX - µY = 0 (µX = µY) contra

H1: µX - µY > 0 (µX > µY ) Pela tabela vê-se que:

di: 5, 2, 5, 6 e 7

Logo: d = 5 e SD = 1,8708, logo t = 5,98. Como α = 10%, então tα = 1,54, pois o número de graus de liberdade é n - 1 = 4.

Portanto, rejeita-se a hipótese nula, isto é, a 10% de significância pode-se afirmar que com a máquina X se demora mais do que com a máquina Y.

2.3.1. TESTE PARA A DIFERENÇA ENTRE DUAS PROPORÇÕES

As hipóteses são:

H0: π1 - π2 = π contra H1: π1 - π2 ≠ π ou π1 - π2 > π ou ainda π1 - π2 < π

Se π = 0, então π1 - π2 = 0, isto é, π1 = π2.

Extraídas uma amostra de cada uma das duas populações a variável P1 - P2 terá uma distribuição aproximadamente normal com média E(P1 - P2) = π1 - π2 e variância

A variável teste será, então: z = 12 1 1 2 1 2

PPnm −−−−

Como os valores de π1 e π2 não são conhecidos, deve-se utilizar suas estimativas P1 e P2. Desta forma, o valor de z será:

P n P m

Assim fixando o nível de significância “α“, a hipótese nula será rejeitada se:

|z| > zα/2 no teste bilateral; z > zα, no teste unilateral à direita e z < zα no teste unilateral à esquerda. Exemplo:

Em uma pesquisa de opinião, 32 dentre 80 homens declararam apreciar certa revista, acontecendo o mesmo com 26 dentre 50 mulheres. Ao nível de 5% de significância os homens e as mulheres apreciam igualmente a revista?

OperadorFabricante 1Fabricante 2

SÉRIE: Estatística Básica Texto 4: TESTES DE HIPÓTESES

Prof. Lorí Viali - viali@mat.pucrs.br- http://w.mat.pucrs.br/~lori/ 21

Solução: As hipóteses são:

Tem-se que P1 = 32 / 80 = 0,40 e P2 = 26 / 50 = 52% O valor da variável teste será:

= -1,34

Como α = 5%, então zα/2 = -1,96.

Portanto, aceita-se a hipótese de igualdade entre as preferências de homens e mulheres, isto é, a este nível de significância não é possível afirmar que exista diferença entre as preferências de homens e mulheres quanto à revista.

SÉRIE: Estatística Básica Texto 4: TESTES DE HIPÓTESES

Prof. Lorí Viali - viali@mat.pucrs.br- http://w.mat.pucrs.br/~lori/ 2

3. EXERCÍCIOS

(01) Pretende-se lançar uma moeda 5 vezes e rejeitar a hipótese de que a moeda é não-tendenciosa, isto é, pretende-se rejeitar Ho: π = 0,50, se em 5 (cinco) jogadas ocorrerem 5 coroas ou 5 caras. Qual é a probabilidade de se cometer erro do tipo I?

(02) (Bussab, pg. 249) Se, ao lançarmos 3 vezes uma moeda, supostamente equilibrada, aparecerem 3 caras decide-se rejeitar a hipótese de que a moeda é “honesta”, qual a probabilidade de se cometer erro do tipo I? Se a moeda favorece cara em 80% das vezes, qual a probabilidade de se cometer erro do tipo I?

(03) Você suspeita que um dado é viciado, isto é, você suspeita que a probabilidade de obter face 6 é maior do que 1/6. Você decide testar a hipótese de que o dado é não-viciado, jogando-o cinco vezes e rejeitando essa hipótese se ocorrer a face 6 (seis), 4 ou 5 vezes. Qual o nível de significância do teste?

(04) Nas faces de dois tetraedros regulares, aparentemente idênticos, estão marcados os valores: 0, 1, 2 e 3. Ao lançar um destes tetraedros o resultado observado é o valor da face que fica em contato com a superfície. Os dois tetraedros são “chumbados”, de tal maneira que, ao jogá-los, as probabilidades de cada uma das faces ficar em contato com a superfície são as da tabela. Tomando ao acaso um dos tetraedros tem-se duas hipóteses: H0 : Trata-se do tetraedro A; H1 : Trata-se do tetraedro B.

(04.1) Para testar H0 contra H1, o tetraedro escolhido é lançado duas vezes. Adota-se a seguinte regra de decisão: rejeitar H0 se a soma dos resultados dos dois lançamentos for maior ou igual a 5. Determinar o nível de significância e o poder do teste.

(04.2) Determinar o nível de significância e o poder do teste se a regra de decisão for: rejeitar H0 se sair o valor 3 (três) em ao menos um dos lançamentos e o outro resultado não for o valor 0

(zero).

(05) Em cada uma das quatro faces de dois tetraedros regulares, aparentemente idênticos, estão marcados os valores: 1, 2, 3 e 4. Entretanto, um dos tetraedros é feito de material homogêneo (tetraedro A) , de maneira que, ao lançá-lo a probabilidade de qualquer uma das 4 faces fique em contato com a superfície é 0,25. O outro tetraedro (tetraedro B) é “chumbado”, de tal maneira que, ao jogá-lo, a face com o valor 4 (quatro) tem probabilidade de 0,50 de ficar em contato com a superfície, enquanto que qualquer uma das outras três tem probabilidade igual a 1/6. Suponha que um dos tetraedros é lançado

48 vezes, para testar a hipótese H0 de que foi lançado o tetraedro A, contra a hipótese H1 de que foi lançado o tetraedro B. Supõem-se ainda a seguinte regra de decisão: “se nos 48 lançamentos, a face com o valor 4 (quatro), for obtida 20 ou mais vezes, rejeita-se H0 em favor de H1. Determine o nível de significância e o poder do teste.

(06) Uma urna contém 6 fichas, das quais θ são brancas e 6 - θ são pretas. Para testar a hipótese de nulidade de que θ = 3, contra a alternativa de que θ ≠ 3, são retiradas 2 (duas) fichas da urna ao acaso e sem reposição. Rejeita-se a hipótese nula se as duas fichas forem da mesma cor.

(06.3) Considere, agora, que a segunda ficha é retirada após a reposição da primeira. Calcule, novamente, o nível de significância e os valores do poder do teste.

(06.4). Compare os dois procedimentos (com e sem reposição da segunda ficha retirada). Qual a conclusão?

FaceTetraedro ATetraedro B

SÉRIE: Estatística Básica Texto 4: TESTES DE HIPÓTESES

Prof. Lorí Viali - viali@mat.pucrs.br- http://w.mat.pucrs.br/~lori/ 23

(07) Para decidirmos se os habitantes de uma ilha são descendentes da civilização A ou B, iremos proceder da seguinte forma: (i) Selecionamos uma amostra aleatória de 100 moradores adultos da ilha e determinamos a altura média; (i) Se a altura média for superior a 176 cm, diremos que os habitantes são descendentes de B, caso contrário, admitiremos que são descendentes de A.

Os parâmetros das duas civilizações são: A: µA = 175 cm e σA = 10 cm e B: µB = 177 cm e σB = 10 cm. Define-se ainda: erro do tipo I como sendo “dizer que os habitantes são descendentes de B quando, na realidade, são de A” e erro do tipo I “dizer que os habitantes são de A quando, na realidade, são descendentes de B”. (07.1) Qual a probabilidade de erro do tipo I e do tipo I?

(07.2) Se σA = σB = 5, como ficariam os valores dos erros do tipo I e I?

(07.3) Qual deve ser a regra de decisão se quisermos fixar a a probabilidade de Erro I em 5%. Qual a probabilidade de erro I neste caso?

(07.4) Quais as probabilidades de Erro I, se as médias forem: µA = 178 e se µB = 180?

(08) Fazendo o teste H0: µ = 1150 (σ = 150) contra H1: µ = 1200 (σ = 200) e com n = 100, estabeleceuse a seguinte região crítica: RC = [1170, +∞).

(08.1) Qual a probabilidade α de rejeitar H0 quando verdadeira?

(08.2) Qual a probabilidade β de Aceitar H0 quando H1 é verdadeira? (09) Dados os valores: 4, 6, 3, 6 e 6, de uma amostra aleatória de 5 (cinco) observações de uma variável X, estime a média e a variância de X e admitindo que X tenha uma distribuição normal, teste, a 5%, a hipótese de que a média da população é 1 (um), contra a hipótese alternativa de que é maior do que 1 (um).

(10) Sabe-se que o consumo mensal per capita de determinado produto tem distribuição normal, com desvio padrão de 2 kg. A diretoria da empresa que fabrica esse produto resolveu que retiraria o produto da linha de produção se a média de consumo per capita fosse menor do que 8 kg, caso contrário, continuaria a fabricá-lo. Foi realizado uma pesquisa de mercado, tomando-se uma amostra aleatória de 25 pessoas e verificou-se um consumo total de 180 kg do produto.

(Parte 3 de 5)

Comentários