Introdução a Amostragem Estatística

Introdução a Amostragem Estatística

(Parte 1 de 2)

PABLO CARVALHO SILVA SOUSA Prof. José Hamilton da Costa Filho

JUAZEIRO - BA SETEMBRO 2011

1.0 – Introdução 3 2.0 – População e Amostra 4 3.0 – Tamanho da Amostra 5 3.1 - Tamanho da Amostra a partir da Estimação da Média de População

Infinita (µ) 6

3.2 – Tamanho da amostra a partir da Estimação da Proporção Populacional de uma População Infinita 7

3.3 – Tamanho da Amostra a partir da Estimação da Média de População (µ)

Finita 9

3.4 – Tamanha da Amostra a partir da Estimação da Proporção Populacional

(p) de uma População Finita 9

4.0 – Amostragens Probabilísticas 10 4.1 – Amostragem Aleatória Simples 1 4.1.1 – Amostragem Aleatória Simples Com Reposição 1 4.1.2 – Amostragem Aleatória Simples Sem Reposição 12 4.2 – Amostragem Aleatória Estratificada 13 4.2.1 – Amostragem Estratificada Uniforme 13 4.2.2 – Amostragem Estratificada Proporcional 13 4.2.3 – Amostragem Estratificada Ótima 13 4.3 – Amostragem Sistemática 14 4.4 – Amostragem por Conglomerado 15 5.0 – Amostragem Não-probabilística 16 5.1 – Amostragem Acidental 17 5.2 – Amostragem Por Julgamento 17 5.3 – Amostragem Intencional 17 5.4 – Amostragem Por Quotas 18 6.0 – Considerações finais 19 7.0 – Referências Bibliográficas 20

1.0 - INTRODUÇÃO

Dentro do campo de atuação das engenharias a estatística é uma ferramenta matemática de grande importância, sendo ela utilizada para desde o controle de processos até o planejamento de novas estratégias. Esse texto trata do conteúdo relacionado à Amostragem, sendo seu objetivo principal apresentar de forma simples e concisa a importância da amostragem em um trabalho estatístico e quais os tipos e técnicas de amostragem utilizadas pelos pesquisadores para obtenção de resultados idôneos e representativos.

“Os levantamentos por amostragem têm a finalidade de reproduzir a realidade estudada. [...] Os dados São coletados em amostras da população de estudo e as medidas calculadas (estimativas) passam a ser as informações disponíveis para os valores populacionais desconhecidos (parâmetros).” (FERREIRA, D. F. Estatística Básica, 2005, p. 57)

Daniel Furtado mostra em suas palavras que a partir de uma amostra da população é possível obter dados que são capazes de representar as características que se deseja estudar de toda uma população que talvez fosse impossível de ser analisada devido a diversos fatores.

BOLFARINE & BUSSAB (2005, p.1) nos mostram que existem uma grande quantidade de maneiras de se obter uma amostra, “mas todos têm o mesmo objetivo, obter informações sobre o todo se baseando no resultado de uma amostra.” E eles ainda lembram “[...], o uso inadequado de um procedimento amostral pode levar a um viés de interpretação do resultado.” É preciso então que se tome uma série de medidas preventivas no procedimento de seleção das unidades elementares da amostra para que ás mesmas sejam representativas e forneçam resultados exatos.

As técnicas e métodos de amostragem, que serão aqui apresentados, foram desenvolvidos justamente com o propósito de possibilitar um controle na obtenção desses dados.

2.0 – POPULAÇÃO E AMOSTRA

Segundo BUNCHAFT & KELLNER (2001, p. 28) “A população é constituída por todos os elementos que o pesquisador deseja investigar e é determinada pelos objetivos particulares da investigação”. Ou seja, a população é compõem todos os elementos que possuem pelo menos uma característica comum entre si que seja objetivo de alguma pesquisa.

O estudo de todos os elementos de uma população é chamado de censo, é o estudo que o IBGE realiza de tempos em tempos para conhecer uma série de características da sociedade brasileira. Porém muitas vezes a realização de um censo se torna inviável devido ao tempo ou recursos disponíveis ou à dificuldade em se estudar toda a população.

“As populações de interesse são em geral, muito grandes ou até mesmo infinitas, embora algumas vezes possam ser bem pequenas. [...] nas situações reais de interesse da pesquisa científica as populações de interesse são muito grandes para permitirem que sejam obtidas todas as medidas. Nessas situações é razoável obter um subconjunto de todas as medias dessa população.” (FERREIRA, D. F. Estatística Básica, 2005, p. 2 e 3).

Devido ao fato de existirem populações de tamanhos consideravelmente grandes como quando se pretende estudar o perfil de todas as pessoas que decidiram prestar concurso para algum cargo público, estaremos estudando aqueles que já estão atuando no cargo, os que estão aguardando para serem convocados e os que ainda irão prestar o concurso e nesse caso temos uma população infinita. Ou talvez queira-se testar a qualidade do sabor de uma barra de chocolate, se o teste for realizado em toda a população o estoque irá se acabar tendo em vista que o teste de qualidade consome o produto.

Esses dois exemplos demonstram a importância do estudo através de uma amostra. Daniel Furtado define amostra como sendo o subconjunto da população e ainda nos diz que a partir das conclusões obtidas com a amostra o pesquisador pode realizar uma extrapolação para as características da população da qual a amostra foi obtida.

O processo de escolha dos elementos que comporão a amostra é denominado Amostragem. São dois os tipos de amostragem a amostragem probabilística e a não-probabilística e dentro desses dois tipos existem técnicas diferentes para a realização do mesmo.

3.0 – TAMANHO DA AMOSTRA

É fato que uma amostra não representa perfeitamente uma população, logo a utilização de uma amostra implica na aceitação de uma margem de erro, chamado de erro amostral. O erro amostral é a diferença entre o resultado amostral e o resultado populacional, o erro é considerado amostral quando é proveniente de flutuações amostrais aleatórias. Porém podem ainda ocorrer erros não-amostrais devido à utilização de instrumentos defeituosos, dados manipulados incorretamente ou até mesmo de forma tendenciosa.

O erro amostral não pode ser evitado, mas pode ser limitado através da escolha de uma amostra de tamanho adequado. BOLFARINE & BUSSAB (2005, p.20) escrevem sobre o erro amostral, “O erro padrão do estimador, como será visto em capítulos posteriores, decresce a medida que aumenta o tamanho da amostra. Assim um ponto-chave de um levantamento amostral é a fixação do tamanho da amostra”. A necessidade da definição de um tamanho adequado para a amostra não está apenas na diminuição do erro amostral, uma amostra muito maior do que o necessário acarreta custos desnecessários e perda de investimento, por sua vez uma amostra muito menor do que o necessário pode não ser o suficiente para responder os questionamentos da pesquisa.

Muitas vezes na realidade o que impõem o tamanho de uma amostra são os custos de um levantamento. Porém cientificamente falando a determinação do tamanho da amostra será realizado considerando os aspectos de precisão estatística.

3.1 – Tamanho da Amostra a partir da Estimação da Média de População Infinita (µ)

Muitas vezes é possível determinar o tamanho mínimo de uma amostra para estimar um parâmetro com, por exemplo, a média populacional (µ) através da equação 3.1:

Onde:

n: é o número de elementos na amostra;

Z: Valor crítico que corresponde ao grau de confiança desejado; σ: Desvio padrão populacional da variável estudada; d: Erro máximo de estimativa. Identifica a diferença máxima entre a média amostral e a verdadeira média populacional.

Os valores do grau de confiança mais utilizados estão listados na tabela a seguir:

Tabela 1 - Valores críticos para o grau de confiança na amostra

Grau de Confiança Z

Na equação 3.1 é também necessário que se conheça o σ (desvio padrão), se ele não for conhecido deve ser obtido um valor através de um estudo piloto adquirindo uma quantidade inicial de elementos e calcular o desvio padrão amostral (S) desses elementos e então utilizá-lo na equação 3.1 no lugar de σ.

Considere o exemplo a seguir Um economista deseja estimar a renda média para o primeiro ano de trabalho de um engenheiro eletricista. Quantos valores de renda devem ser tomados, se o economista deseja ter 95% de confiança em que a média amostral esteja a menos de R$50,0 da verdadeira média populacional? Suponha que saibamos, por um estudo prévio, que para tais rendas, σ = R$6250,0.

Queremos determinar o tamanho n da amostra, dado que a α = 0,05 (95% de confiança). Desejamos que a média amostral seja a menos de R$ 500 da média populacional, de forma que E = 500. Supondo σ = 6250, aplicamos a equação 3.1, obtendo:

Devemos, portanto, obter uma amostra de ao menos 601 rendas de primeiro ano, selecionadas aleatoriamente, de formandos que tenham feito um curso de Engenharia Elétrica. Com tal amostra teremos 95% de confiança em que a média amostral x difira em menos de R$50,0 da verdadeira média populacional m.

3.2 – Tamanho da amostra a partir da Estimação da Proporção Populacional de uma População Infinita

A proporção populacional é um parâmetro estatístico que influencia no tamanho da amostra. Imagine por exemplo que é preciso determinar a proporção de pessoas atendidas por um PSF em um município. MARTINS (2005, p. 188) nos fornece uma maneira de calcular o tamanho da amostra relacionada com a proporção populacional. Essa fórmula é apresentada pela equação 3.2 a seguir:

Onde: n: é o número de elementos na amostra;

Z: Valor crítico que corresponde ao grau de confiança desejado (os possíveis valores de Z já foram apresentados na Tabela 1) p: Proporção populacional dos elementos pertencentes à categoria estudada; q: Proporção populacional dos elementos não pertencentes à categoria estudada (q = 1-p); d: Erro máximo de estimativa. É a diferença máxima entre a proporção amostral e a proporção populacional(p).

Os valores de p e q serão expressos em decimais, por exemplo, se p = 43% então utilizaremos p = 0,43. A equação 3.2 pede que sejam substituídos os valores populacionais de p e q, caso eles não sejam conhecidos MARTINS (2005, p.188) observa que p deve assumir o valor de 50% (p = 0,5), logo q = 0,5, dessa forma p obtém o maior tamanho possível para a amostra.

Considere o seguinte exemplo:

Um assistente social deseja saber o tamanho da amostra (n) necessário para determinar a proporção da população atendida por uma Unidade de Saúde, que pertence ao município de Juazeiro. Não foi feito um levantamento prévio da proporção amostral e, portanto, seu valor é desconhecido. Ela quer ter 90% de confiança que sua o erro máximo de estimativa (E) seja de ±5% (ou 0,05). Quantas pessoas necessitam ser entrevistadas?

Considerando que o valor da proporção amostral de atendimentos para pessoas de Juazeiro não é conhecida. Utilizamos a equação 3.2 para determinar o tamanho da amostra. Sabemos que, para 90% de confiança teremos o valor crítico (Za/2 ) = 1,645, conforme Tabela 1

Devemos, portanto, obter uma amostra de 271 pessoas para determinar a proporção da população atendida na Unidade de Saúde, que se origina do município de Juazeiro.

3.3 – Tamanho da Amostra a partir da Estimação da Média de População (µ) Finita

As equações anteriores trabalham com a idéia de uma população infinita, a determinação do tamanho da amostra para uma população finita deve receber um fator de correção. A equação 3.3 nos fornece os meios para obtenção do tamanho da amostra:

Onde:

n: é o número de elementos na amostra;

N: é o tamanho da população;

Z: Valor crítico que corresponde ao grau de confiança desejado (os possíveis valores para Z estão na Tabela 1); σ: Desvio padrão populacional da variável estudada (Na seção 3.1 explica como obter os valores do desvio padrão caso ele não seja conhecido); d: Erro máximo de estimativa. Identifica a diferença máxima entre a média amostral e a verdadeira média populacional.

3.4 – Tamanha da Amostra a partir da Estimação da Proporção Populacional (p) de uma População Finita

Assim como na seção 3.3, para se determinar o tamanho da amostra utilizando a proporção populacional para uma população finita é necessário utilizar-se de um fator de correção. Dessa forma a equação 3.4 possibilita o cálculo do tamanho da amostra de uma população finita utilizando-se da proporção populacional (p):

Onde:

n: quantidade de elementos na amostra;

N: quantidade de elementos na população; p: estimativa da proporção (Veja mais detalhes na seção 3.2); q = 1-p (Veja mais detalhes na seção 3.2);

Z: Valor crítico que corresponde ao grau de confiança desejado (os possíveis valores de Z já foram apresentados na Tabela 1); d: erro amostral (Veja mais detalhes na seção 3.2);

4.0 – AMOSTRAGENS PROBABILÍSTICAS

O processo de amostragem no qual se retira elementos da população para composição das amostras de forma aleatória onde todo elemento tem possibilidades de ser amostrado é dito amostragem probabilística.

Segundo DANIEL FURTADO (2005, p.58) “a amostragem probabilística caracteriza-se por garantir, a priori, que todo elemento pertencente ao universo de estudo possua probabilidade, conhecida e diferente de zero, de pertencer à amostra sorteada”.

De acordo com BUNCHAFT & KELLNER (2001, p. 28) “O fato de a aleatoriedade interferir em algum estágio da seleção da amostra tem algumas implicações importantes. A principal é que as leis da probabilidade matemática regem o modelo de distribuição amostral, ou seja, a distribuição de todas as amostras de determinado tamanho possíveis de serem extraídas da população.”

BUNCHAFT & KELLNER mostram então que devido ao fato de a seleção dos elementos da amostras terem sido aleatória é possível aplicar nessa amostra um modelo de distribuição, possível apenas as amostras probabilísticas.

Uma amostragem probabilística é a mais recomendável sempre que possível, pois dessa forma pode-se garantir a representatividade da amostra e as possíveis discrepâncias entre a população e a amostra será apenas obra do acaso. São muitas as técnicas de amostragem, serão apresentadas a seguir algumas delas.

4.1 – Amostragem Aleatória Simples

A amostragem aleatória simples é dita em muitas literaturas como uma das técnicas de amostragem mais básicas e mais importantes para seleção de uma amostra. Nela todos os elementos da população têm igual probabilidade de pertencer à amostra, e todas as possíveis amostras também tem probabilidade igual de ocorrer.

“A amostragem casual simples é o processo de amostragem probabilística na qual, qualquer combinação dos n elementos da amostra, retirada dos N elementos populacionais que compõem a população, tem igual probabilidade de vir a ser sorteada.” (FERREIRA, D. F. Estatística Básica, 2005, p. 59 apud COCHRAN, 1977)

São duas as formas de executar a amostragem aleatória simples. O processo de amostragem pode ou não ser executado com a reposição do elemento amostrado na população. BOLFARINE & BUSSAB (2005, p.62) escrevem que é mais prático e interessante utilizar-se da amostragem aleatória simples sem reposição visto que mesmo que um elemento seja amostrado mais de uma vez ele não irá acrescentar informações a mais. Porém a amostragem aleatória simples com reposição traz vantagens matemáticas não obtidas na sem reposição como, por exemplo, o fato de que dessa forma os elementos da amostra serão independentes, o que facilita a determinação das propriedades dos estimadores. É claro que caso a amostra seja muito grande, a técnica de amostragem aleatória simples utilizada não vai fazer muita diferença visto mesmo quando ocorre a reposição a chance de um elemento ser sorteado mais de uma vez é muito pequena.

(Parte 1 de 2)

Comentários