Intervalo de Confiança

Intervalo de Confiança

7

Estatística Indutiva Juliana Brassolatti Gonçalves

TAMANHO DA AMOSTRA

Depois de construir o intervalo de confiança, é importante que o resultado seja corretamente interpretado. Voltando no último exemplo dado, onde n = 40, ,e c = 90%, conseguimos determinar o intervalo de confiança para a média populacional. Uma vez que já existe, ou ela está no intervalo ou não.

É incorreto afirmar que há 90% de probabilidade de que a média real da vida útil das baterias esteja no intervalo (32.11, 32.89)”. A maneira correta é “há 90% de probabilidade que o intervalo de confiança descrito contenha a média real da vida útil das baterias”. Isso também significa, naturalmente, que existem 10% de probabilidade de que o intervalo de confiança não contenha .

Observe que, quanto maior o nível de confiança, maior será o intervalo. Aumentando o intervalo, a precisão da estimativa diminui. Uma forma de aumentar a precisão de uma estimativa sem a redução do nível de confiança c é ampliar o tamanho da amostra. Mas quão grande precisa ser o tamanho da amostra para assegurar certo nível de confiança para um determinado erro máximo?

Os segmentos horizontais representam intervalos de confiança de 90% para amostras diferentes, com o mesmo tamanho.

Definição: Dados um nível de confiança c e um erro máximo de estimativa E, o tamanho mínimo da amostra necessária para estimar a média populacional é:

Se é desconhecido, você pode estimá-lo usando s, desde que tenha uma amostra preliminar com no mínimo 30 elementos.

Exemplo: Sabendo que e que E = 1, suponha que você deseje calcular o tamanho requerido de uma amostra para assegurar que, com confiança de 95%, a média amostral esteja dentro do intervalo de confiança. Qual deve ser o tamanho da amostra?

.

INTERVALO DE CONFIANÇA PARA MÉDIA – AMOSTRAS PEQUENAS ()

A distribuição t de Student

Willian S. Gosset (1876 - 1937) desenvolveu a distribuição t em Dublin, Irlanda. Gosset publicou seus achados usando o pseudônimo de Student.

Em muitas situações da vida real, o desvio padrão populacional é desconhecido. Além disso, em função de fatores como tempo e custo, não é prático colher amostras de tamanho 30 ou mais. Nesse caso, como construir intervalos de confiança para a média populacional?

Se a variável aleatória é normalmente distribuída, a distribuição amostral para é uma distribuição t.

Vamos imaginar um exemplo prático: “A biela do compressor da geladeira tem um tamanho de projeto. É fabricado por dia milhares de bielas. É possível medir cada uma para saber se o tamanho é o ideal? Claro que não! O que o controle de qualidade faz então é, em horários distintos do dia, colher amostras dessas bielas. Calcula-se então a média das amostras coletadas. Lembre-se que o tamanho das amostras nesse caso é . O próximo passo é tentar obter um intervalo de confiança para essas médias amostrais que garanta, por exemplo, uma confiança de 95% de que o intervalo contenha a média populacional, ou seja, que a maioria das medidas das bielas produzidas tenha o tamanho de projeto desejado”. Acontece que quando , as médias amostrais seguem uma distribuição conhecida como distribuição t de Student. E é através dessa distribuição que o intervalo de confiança será determinado.

Suponha que foram selecionadas naquele dia 15 amostras das bielas e que o nível de confiança desejado seja de 95%. Sabendo que a média amostral é mm e que o desvio padrão amostral é s = 10 mm, de acordo com a tabela t de Student, conseguimos determinar que o intervalo de confiança nesse caso é (Veremos como determinar esse intervalo a seguir).

Portanto, há 95% de probabilidade que o intervalo de confiança contenha a média real das medidas das bielas do compressor da geladeira que é a medida desejada do projeto.

A distribuição t de Student

Definição: Se a distribuição de uma variável aleatória x é aproximadamente normal e , então a distribuição amostral de é uma distribuição t de Student, onde .

Os valores críticos de t são denotados por . Diversas propriedades da distribuição t estão relacionadas a seguir:

  1. A distribuição t tem a forma de sino e é simétrica em torno da média.

  2. A distribuição t é uma família de curvas, cada uma delas determinada por um parâmetro chamado grau de liberdade (g.l). Os graus de liberdade são os números de escolhas livre deixada após uma amostra estatística tal como ter sido calculada. Quando se usa uma distribuição t para estimar uma média populacional, o número de graus de liberdade é igual ao tamanho da amostra menos 1, ou seja, g.l = n – 1.

  3. A área total sob uma curva t é 1 ou 100%.

  4. A média, a moda e a mediana da distribuição t são iguais a zero.

  5. Quando o número de graus de liberdade cresce, a distribuição tende para a distribuição normal. Após 30 graus de liberdade a distribuição t está muito próxima da distribuição normal padrão z.

Vamos aprender agora como determinar o intervalo de confiança se .

ORIENTAÇÕES GERAIS

Construindo um intervalo de confiança para a média: distribuição t

  1. Obtenha as estatísticas amostrais n e e s. Lembre que ou e ou .

  2. Identifique o grau de liberdade g.l = n – 1 , o nível de confiança c e o valor critico .

  3. Determine o erro máximo de estimativa .

  4. Determine o extremo esquerdo e o extremo direito e forme o intervalo de confiança para a média .

Exemplo: Você seleciona ao acaso 16 restaurantes e mede a temperatura do café vendido em cada uma. A temperatura média amostral é de 162°F, com um desvio padrão amostral de 10°F. Obtenha o intervalo de confiança de 95% para a temperatura média.

Solução: Uma vez que o tamanho da amostra é 16 < 30, pode-se usar a distribuição t de Student.

  1. n = 16, e .

  2. g.l = 16 – 1 = 15; c = 0,95;

  3. .

O intervalo de confiança para a média populacional é .

Portanto, com 95% de confiança, pode-se afirmar que a temperatura média do café está entre 32,11 e 32,89.

INTERVALO DE CONFIANÇA PARA VARIÂNCIA E DESVIO PADRÃO

A distribuição qui – quadrado ()

Na produção industrial, é necessário controlar o tamanho da variação de um processo. Um fabricante de peças automobilísticas deve produzir, por exemplo, milhares de peças para serem usadas no processo de fabricação. É importante que essas partes variem muito pouco ou nada. Como medir e, consequentemente, controlar o tamanho da variação nas peças?

A distribuição qui - quadrado

Definição: Se a distribuição de uma variável aleatória x é aproximadamente normal, então a distribuição formará uma distribuição qui – quadrado para amostras de qualquer tamanho . Diversas propriedades da distribuição qui – quadrado está relacionado a seguir:

  1. Todos os valores de qui – quadrado são maiores ou iguais a zero.

  2. A distribuição qui – quadradoé uma família de curvas, cada uma delas determinada pelos graus de liberdade. Para formar um intervalo de confiança para a variância , use a distribuição com um número de graus de liberdade igual ao tamanho da amostra menos 1, ou seja, g.l = n – 1.

  3. A área total sob cada uma das curvas qui – quadrado é 1 ou 100%.

  4. As distribuições qui – quadrado são aproximadamente assimétricas.

Existem dois valores críticos para cada intervalo de confiança. O valor representa o valor crítico da cauda à direita, enquanto representa o valor crítico da cauda à esquerda. A área a direita de é dada por e a área a direita de é dada por . (Ver desenho da página 52 e 53 da apostila)

Exemplo: Obtenha os valores críticos e para um intervalo de confiança de 90% quando n = 20.

Definição: Um intervalo de confiança c para a variância e desvio padrão estão dados a seguir.

Intervalo de Confiança para variância

Intervalo de Confiança para desvio padrão

ORIENTAÇÕES GERAIS

Construindo um intervalo de confiança para a variância e para o desvio padrão

  1. Obtenha a estatística amostral n e o grau de liberdade g.l = n – 1.

  2. Obtenha a estimativa pontual . Lembre que ou .

  3. Obtenha os valores críticos e que correspondem ao nível de confiança c dado.

  1. Obtenha os extremos esquerdo e direito e forme o intervalo de confiança para a variância populacional .

  2. Obtenha os extremos esquerdo e direito e forme o intervalo de confiança para a variância populacional

Exemplo: Você seleciona aleatoriamente e pesa 29 amostras de um determinado antialérgico. O desvio padrão da amostra é de 1,2 miligramas. Supondo que os pesos tenham uma distribuição normal, construa um intervalo de confiança de 99% para a variância e para o desvio padrão populacionais.

Os exercícios propostos 3, 4 e 5 da página 58 da apostila serão feitos na sala de aula.

Comentários