(Parte 1 de 7)

UniversidadeFederal da Bahia

Instituto de Matemática Departamento de Estatística

Estatística IV (MAT027) e Introdução à Estatística (MAT050)

1I NTRODUÇÃO

Até o presente momento, nós aprendemos a descrever uma amostra através das medidas de tendência central e de dispersão, que são parte da chamada “estatística descritiva”. Com a utilização da “inferência estatística”, desejamos inferir indutivamente propriedades de uma população (ou universo) com base nos resultados obtidos com a amostra (ou subconjunto do inverso ) o que constitui uma ferramenta muito importante no desenvolvimento de uma disciplina científica. Toda a inferência na Estatística está baseada na “teoria das probabilidades”, que nós acabamos de ver.

Freqüentemente, devemos tomar decisões sobre populações com base em informações obtidas em amostras das mesmas. Tais decisões chamam-se decisões estatísticas. Por exemplo, com base em resultados amostrais, podemos querer decidir se determinada droga é eficiente na cura de determinada doença, se um processo educacional é melhor do que outro, se um determinado número de caixas de um banco é suficiente para um atendimento rápido ao cliente, etc. Para a tomada de tais decisões utilizaremos a inferência estatística.

Nesta etapa do nosso curso, iniciaremos a discussão falando sobre aspectos fundamentais da amostragem, após a qual introduziremos as noções sobre distribuição amostral da média e da proporção, intervalos de confiança e testes de hipóteses para médias e proporções, finalizando com um método para avaliação de relações entre variáveis qualitativas, que é o teste qui-quadrado de independência.

2A MOSTRAGEM

Amostragem é o ato de obter uma amostra de uma população, podendo-se definir população como um conjunto de elementos, cada um deles apresentando uma ou mais características em comum. Amostra é, simplesmente, uma parte da população.

O levantamento por amostragem, quando comparado com o levantamento total, apresenta certas vantagens:

• custo menor; • resultado em menor tempo;

• objetivos mais amplos;

• dados mais fidedignos.

Há situações em que a amostragem se impõe. Assim, pode-se ter o caso de a população de estudo ser muito grande, sendo impraticável o levantamento total. Em casos em que o processo de investigação das características de cada elemento for destrutivo (teste de resistência de materiais, por exemplo), só tem sentido trabalhar-se com amostras. Há também os problemas de ordem ética: novas drogas, vacinas, técnicas cirúrgicas devem ser testadas inicialmente em amostras, antes de seu uso amplo na população.

2.1 ETAPAS DE UM LEVANTAMENTOPORAMOSTRAGEM

Quer a amostragem seja feita dentro de um laboratório (por exemplo, para selecionar ratos que serão usados em um experimento sobre agentes cancerígenos), quer a amostragem seja feita sobre a população geral (por exemplo, para obter informações sobre aspectos de fertilidade de mulheres moradoras em uma grande cidade, como São Paulo), existem etapas que devem ser seguidas, intimamente ligadas aos princípios de metodologia de pesquisa científica. Tais itens serão comentados com linguagem mais dirigida a levantamentos objetivando estimar parâmetros de populações reais de seres humanos. Tais comentários, todavia, são aplicáveis a qualquer situação em que se requeira amostragem, bastando para isso pequenos ajustes, basicamente de forma e não de conteúdo. As principais etapas de um levantamento por amostragem são:

1. Explicitação dos objetivos com bastante clareza, a fim de evitar dúvidas posteriores ou mesmo esquecimentos, devendo ficar bem definida qual a unidade elementar (elemento) ou unidade de análise a ser trabalhada.

2. Definição da população a ser amostrada.

(a) Em certas situações isto pode ser relativamente fácil, como no caso de se desejar tomar uma amostra de uma população de crianças que estejam matriculadas e freqüentando certo grupo escolar. Terse-ia uma situação mais complexa para se estudar gestantes que procuram centros de saúde para fazer pré-natal.

3. Escolha das variáveis a serem observadas em cada unidade de análise.

(a) Deve ser verificado se todos os dados que vão ser levantados são relevantes para a pesquisa e se nenhum dado relevante foi omitido. Existe uma tendência, particularmente ao se trabalhar com populações humanas, usando questionário, de se fazer muitas perguntas, um grande número das quais nunca são analisadas. Questionários longos, em geral, levam a diminuir a qualidade da resposta.

4. Especificação do grau de precisão desejado.Os resultados de levantamento por amostragem são sujeitos a incerteza, devido a erros de medida e ao fato de apenas parte da população ser examinada. O grau de incerteza pode ser diminuído tomando-se amostras maiores e empregando-se melhores técnicas ou aparelhos de medida.

5. Escolha dos instrumentos de medida e da forma de abordagem.

(a) Em caso de inquéritos sobre nutrição, por exemplo, poderá haver escolha entre observação única ou observação durante sete dias; em estudos antropométricos será decidido o tipo de balança, calibrador e outros aparelhos a serem usados. Questionários podem ser preenchidos pelo próprio indivíduo ou serem aplicados a cada indivíduo por um entrevistador treinado.

6. Escolha da unidade amostral, que é definida como a menor parte distinta e identificável da população, para fins de enumeração e sorteio da amostra.

(a) Uma unidade amostral pode ser o próprio elemento de estudo (criança, cobaia, cidade, trecho da estrada) ou um conjunto de elementos (classe de escola, ninhada, Estado, conjunto de trechos continuados de estrada). As unidades amostrais devem cobrir toda a população e não podem apresentar transvariação, ou seja, um elemento de estudo não pode pertencer ao mesmo tempo a mais de uma unidade amostral. À relação, lista ou mapa contendo todas as unidades amostrais dá-se o nome de sistema de referência ou fundamentos da pesquisa.

7. Execução de prova experimental, prova-piloto ou pré-teste.

(a) Nesta etapa é feito um verdadeiro ensaio do trabalho a ser desenvolvido, sendo testados os instrumentos de medida, questionário, pessoal de campo, a sistemática proposta, a reação da população. Orienta os reajustes necessários e pode dar informações valiosas sobre possível duração e custo da pesquisa e indicações sobre a variabilidade do fenômeno pesquisado, o que permite calcular melhor o tamanho da amostra.

8. Seleção da amostra após decidido qual deve ser o respectivo tamanho. Esta seleção deve ser feita, de preferência, por meio de sorteio do tipo lotérico.

2.2 TIPOS DE AMOSTRAGEM

A amostragem é probabilística quando cada unidade amostral na população tem uma probabilidade conhecida e diferente de zero de pertencer à amostra. De outra forma, a amostragem é dita não-probabilística.

Admita-se, por exemplo, que seja definida uma população de dez grupos escolares, cada qual com certo número de alunos, desejando-se uma amostra de tamanho igual a cinco grupos escolares. Se o pesquisador decidiu simplesmente escolher os grupos escolares A, B, C, I, J, ter-se-ia uma amostragem não-probabilística. É possível, no entanto (e mesmo desejável), que o investigador obtenha o número de alunos de cada grupo escolar e faça um sorteio para obtenção das cinco escolas, cada escola tendo uma probabilidade de ser sorteada proporcionalmente ao seu número de alunos; será uma amostragem probabilística.

A amostragem não-probabilística pode prejudicar sensivelmente a validade externa de um estudo, pois muitos fatores podem influir na escolha de uma unidade amostral para pertencer à amostra, prejudicando sua representatividade em relação à população. Mesmo assim, existem situações em que ela é usada, havendo então interesse em se conhecer algumas formas de amostragem não-probabilística:

• por voluntários, que é bastante usada em ensaios clínicos para teste de novos medicamentos;

• intencional, quando as unidades que compõe a amostra são escolhidas pelo pesquisador; é usada na verificação de poluição de praias;

• por acesso mais fácil, em que as unidades são escolhidas por estarem em melhores condições de acessibilidade. Veja-se, por exemplo, o caso em que se defina para estudo todo o conjunto de habitantes de uma área rural, tendo o domicílio como unidade amostral; se o entrevistador escolheu os dez primeiros domicílios do seu caminho, teremos este tipo de amostragem, tendo sido desconsideradas as outras unidades amostrais que também pertencem à população.

2.3 AMOSTRAGEM PROBABILÍSTICA 2.3.1 AMOSTRAGEM CASUAL SIMPLES

Também conhecida por amostragem ocasional, acidental, casual, randômica, etc. A amostragem simples ao acaso destaca-se por ser um processo de seleção bastante fácil e muito usado. Neste processo, todos os elementos da população tem igual probabilidade de serem escolhidos, não só antes de ser iniciado, como também até completar-se o processo de coleta. Eis o procedimento para seu uso:

1. Devemos numerar todos os elementos da população. Se, por exemplo, nossa população tem 5.000elementos, devemos numerá-los de 0 a 4999 ou, como acontece geralmente, usamos um número que já identifica oe lemento.

2. Devemos efetuar sucessivos sorteios com reposição (ou não) até completar o tamanho da amostra (n).

Para realizar este sorteio, podemos usar as “tábuas de números aleatórios” ou ainda preferencialmente, o uso de programas computacionais próprios para estes fins.

Se, durante o sorteio, unidades amostrais já sorteadas poderem ser novamente sorteadas, sendo representadas uma, duas ou mais vezes na amostra, ter-se-á a chamada amostragem casual simples com reposição.

Em geral, dar-se preferência ao tipo de amostragem casual simples sem reposição, principalmente quando se trata de populações com reduzido número de unidades amostrais.

2.3.2 AMOSTRAGEM SISTEMÁTICA

Trata-se de uma variação da amostragem simples ao acaso, muito conveniente quando a população está naturalmente ordenada, como fichas em um fichário, listas telefônicas, etc. Procedimento:

Seja N o tamanho da população e n o tamanho da amostra. Então, calcula-se o intervalo de amostragem N n ou o inteiro mais próximoque chamaremos de “a”. Sorteia-se um número entre 1 e “a”e seja x esse número.

Formamos, assim, a amostra dos elementos correspondentes aos números: x;(x+a);(x+2a);...;[x+(n−1)a]. Exemplos:

3;13;23;3;serão os componentes da amostra.

Sorteia-se um número de 1 a 10. Seja 3 (x =3 ) o número sorteado. Logo, os elementos numerados por

2. Para uma população de tamanho N =3 2, numerada seqüencialmente de 1 a 32, e amostra de tamanho n =8 ,t em-se a =4 .

O início casual “x” deve ser sorteado entre 1,2,3 e 4; admita-se que tenha sido x =3 . Aa mostra fica constituída das unidades amostrais de número (ou ordem): 3;7;1;15;19; 23;27;31. Pode ser visto que o resultado é obtido somando-se sucessivamente o intervalo de amostragem a =4 a cada número obtido imediatamente antes.

(Parte 1 de 7)

Comentários