(Parte 2 de 5)

3.3.2. Amostragem Sistemática (AS)

É utilizada quando a população está naturalmente ordenada, como listas telefônicas, fichas de cadastramento, produção de garrafas da cervejas, etc.

Procedimento para o uso deste método:

1) Seja N o tamanho da população e n o tamanho amostral. Calcula-se o intervalo da amostragem i = N/n (considera-se apenas a parte inteira do número).

amostra: x, (x + i), (x + 2*i),, (x + (n-1)*i).

2) Sorteia-se, utilizando a tabela de números aleatórios, um número x entre 1 e i formando a

Exemplo: Numa turma com N = 36 alunos, deseja-se retirar uma amostra de n = 5 elementos para verificar uma característica de interesse. Utilize a técnica de amostragem sistemática para retirar essa amostra.

1) Calcular: i = N/n = 36/5 = 7,2. Considerando a parte inteira do número, temos que i = 7;

composta dos elementos:{06, 13, 20, 27, 34}

2) Sortear um número entre 1 e 7 da Tabela de Números Aleatórios. Escolhendo a última linha e a primeira coluna, temos que o primeiro número que está entre 1 e 7 é 6. Logo a amostra será

Exemplo: Considere agora, uma população com 500 elementos e, deseja-se retirar dessa população 10 elementos. Obtenha uma AS utilizando a primeira linha da Tabela de Números Aleatórios, quando for necessário.

3.3.3. Amostragem Estratificada (AE)

A população é dividida em subgrupos, denominados estratos (por exemplo, por sexo, renda, bairro, etc.) e a AAS é utilizada na seleção de uma amostra de cada estrato. Esses estratos devem ser internamente mais homogêneos do que a população toda, com respeito às variáveis em estudo. Aqui, um conhecimento prévio sobre a população em estudo é fundamental.

Estrato 1 Subgrupo 1 da amostra Estrato 2 Subgrupo 2 da amostra Estrato k Subgrupo k da amostra

Amostra Estratificada

A AE tem as seguintes características: • dentro de cada estrato há uma grande homogeneidade (pequena variabilidade);

• entre os estratos há uma grande heterogeneidade (grande variabilidade).

Em geral, utiliza-se a AE proporcional. Neste caso, a proporcionalidade do tamanho da amostra de cada estrato da população é mantida na amostra. Por exemplo, se um estrato corresponde a 20% do tamanho da população, ele também deve corresponder a 20% da amostra.

Exemplo: Com o objetivo de realizar uma pesquisa de opinião sobre a gestão atual da reitoria em uma determinada universidade, realizaremos um levantamento por amostragem. A população é composta por 100 professores, 100 servidores técnicos administrativos e 300 alunos, que identificaremos da seguinte forma:

População

Professores P001 P002 … P100

Servidores S001 S002S100

Alunos A001 A002 ... A300

Supondo que a opinião sobre a gestão atual da reitoria possa ser relativamente homogêneo dentro de cada categoria, realizaremos uma amostragem estratificada proporcional por categoria, para obter uma amostra global de tamanho n = 10. A tabela a seguir mostra as relações de proporcionalidade.

Estrato Proporção na PopulaçãoTamanho do subgrupo na amostra

Para selecionar aleatoriamente dois professores, podemos usar a Tabela de Números

Aleatórios, tomando dois números com três algarismos. Usando, por exemplo a primeira linha da tabela de números aleatórios, temos os seguintes professores selecionados: {P045, P020}. Para os servidores, usando a segunda linha da tabela, temos: {S055, S058}. Usando a terceira linha da tabela, temos a seguinte amostra de alunos: {A050, A136, A270, A152, A247, A004}. A amostra {P045, P020, S055, S058, A050, A136, A270, A152, A247, A004} é uma amostra estratificada proporcional da comunidade da universidade. Cada indivíduo desta amostra deverá ser pesquisado para se obter a opinião em relação à gestão atual da reitoria.

3.3.4. Amostragem por Conglomerado (AC)

A população é dividida em subpopulações (conglomerados) distintas (quarteirões, residências, famílias, bairros, etc.). Alguns dos conglomerados são selecionados segundo a AAS e todos os indivíduos nos conglomerados selecionados são observados. Em geral, é menos eficiente que a AAS ou AE, mas por outro lado é bem mais econômica. Tal procedimento amostral é adequado quando é possível dividir a população em um grande número de pequenas subpopulações.

A AC tem as seguintes características:

• dentro de cada conglomerado há uma grande heterogeneidade (grande variabilidade);

• entre os conglomerados há uma pequena variabilidade (grande homogeneidade).

Exemplo: Realização de uma pesquisa eleitoral em uma cidade com 12 zonas eleitorais. Usando a técnica de amostragem por conglomerados, podemos selecionar aleatoriamente 2 zonas eleitorais e, em seguida, entrevistar todos os eleitores dessas zonas selecionadas

Zona 1

Entrevistar todos os eleitores dessas zonas

Zona 1

Zona 1

Entrevistar todos os

Obs.: É fácil confundir amostragem estratificada com amostragem por conglomerado, porque ambas envolvem a formação de subgrupos. A diferença é que a amostragem por conglomerado usa todos os membros de uma amostra de conglomerados, enquanto a amostragem estratificada usa uma amostra de membros de todos os estratos.

Curiosidade

Também podemos encontrar na prática a Técnica de Amostragem de Conveniência que simplesmente usa resultados que sejam muito fáceis de obter.

3.4. Exercícios – Parte I – A1

1) Um administrador especialista em avaliar através de sistemas informatizados as ações da BOVESPA, está interessado em fazer uma pesquisa nos preços das ações, para indicar aos seus clientes se hoje é um dia favorável a fazer investimentos. Ele sabe que existe N = 500 ações em venda. Como o tempo de estudo de cada ação é de aproximadamente 10 minutos, decidiu-se verificar apenas n = 25 ações. Utilizando as técnicas de amostragem aleatória simples, quais ações serão selecionadas (Use a primeira linha da tabela de números aleatórios)?

2) Um gerente de controle de qualidade estudará fontes de computador que passam numa esteira transportadora dentro da empresa onde trabalha. Sabendo que por dia passam N = 85 fontes e na amostra deverá ter n = 10 fontes, quais serão as fontes selecionadas utilizando a técnica de amostragem sistemática? (Quando for necessário utilizar a Tabela de Números Aleatórios utilize a primeira linha)

3) Num depósito em uma determinada empresa produtora de materiais eletrônicos possui N = 100 computadores que estão separados em duas qualidades. N1 = 40 computadores Pentium 3 e N2 = 60 computadores Pentium 4. O custo para verificar se cada computador está sob controle é muito alto. O administrador responsável disse que a empresa tem condições de verificar apenas n = 12 computadores. Utilizando a técnica de amostragem estratificada proporcional, quais computadores serão selecionados? (Quando for necessário utilizar a Tabela de Números Aleatórios utilize a primeira linha)

Ei! Você é a favor da pena de morte? Ei! Você é a favor

4. TABULAÇÃO DE VARIÁVEIS

4.1. Variáveis Qualitativas Unidimensionais

Quando se estuda uma variável, o maior interesse do pesquisador é conhecer o comportamento dessa variável, analisando a ocorrência de seus possíveis resultados.

A tabela a seguir apresenta a distribuição de freqüências da variável grau de instrução dos dados da Tabela 2.1.

Tabela 4.1: Freqüências e Porcentagens dos 36 empregados da seção de orçamentos da Companhia MB segundo o grau de instrução.

Grau de Instrução Freqüência (ni) Proporção (fi) Porcentagem (100 x fi) Fundamental 12

Médio 18 Superior 6

Interpretação da Tabela 4.1.: Nota-se que dos 36 empregados da seção de orçamentos, 3,3% tem nível fundamental, 50% nível médio e apenas 16,67% nível superior.

Notação: Usaremos a notação ni para indicar a freqüência (absoluta) de cada classificação ou categoria da variável. A notação fi = ni/n para indicar a proporção (ou freqüência relativa) de cada categoria, sendo o “n” o número total de observações.

As proporções são muito úteis quando se querem comparar resultados de duas pesquisas distintas. O próximo exemplo ilustra este fato.

Exemplo: Suponhamos que se queira comparar a variável grau de instrução para empregados da seção de orçamentos com a mesma variável para todos os empregados da Companhia MB. Digamos que a empresa tenha 2000 empregados e que a distribuição de freqüências seja a tabela abaixo:

Tabela 4.2: Freqüências e Porcentagens dos 2000 empregados da Companhia MB, segundo o grau de instrução.

Grau de Instrução Freqüência (ni) Proporção (fi) Porcentagem (100 x fi) Fundamental 650

Superior

Total n = 2000 1,0 Fonte: Bussab e Morettin (2002)

Comparação entre a Tabela 4.1. e a Tabela 4.2.: Não podemos comparar diretamente as colunas das freqüências (ni) das duas tabelas pois os totais de empregados são diferentes nos dois casos (n = 36 e n = 2000). Mas as colunas das porcentagens (ou proporções) são comparáveis, pois reduzimos as freqüências relativas a um mesmo total.

4.2. Variáveis Quantitativas Unidimensionais

A construção de tabelas de freqüências para variáveis quantitativas necessita de certos cuidados. Por exemplo, a construção da tabela de freqüências para a variável Salário da Tabela 2.1., usando o mesmo procedimento que o grau de instrução, não resumirá as 36 observações num grupo menor, pois não existem observações iguais.

Solução: Agrupar os dados por faixas de salário. Assim, construímos uma tabela chamada Tabela de Classes de Freqüências.

Exemplo: Distribuição de Freqüências dos salários dos 36 empregados da seção de orçamentos da Companhia MB por faixas de salário:

Tabela 4.3: Freqüências e Porcentagens dos 36 empregados da seção de orçamentos da Companhia MB por faixas de salário.

08 |-- 12 12 12 |-- 16 8 16 |-- 20 5 20 |-- 24 1 Total 36 1,0

Obs.: Procedendo desse modo, ao resumir os dados referentes a uma variável quantitativa, perde-se alguma informação. Por exemplo, não sabemos quais são os oito salários da classe de 12 a 16, a não ser que investiguemos a tabela original. Sem perda de muita precisão, poderíamos supor que todos os oito salários daquela classe fossem iguais ao ponto médio da referida classe, isto é, 14.

Número de Classes

A escolha dos intervalos é arbitrária. A familiaridade do pesquisador com os dados é que lhe indicará quantas e quais classes (intervalos) devem ser usadas. Entretanto, deve-se observar que, com um número pequeno de classes, perde-se informação, e com um número grande de classes, o objetivo de resumir os dados fica prejudicado.

Solução: Normalmente, sugere-se o uso de 4 a 8 classes com a mesma amplitude.

Dentre muitas regras citadas na literatura, duas tem sido universalmente adotadas, caso o pesquisador não tenha idéia alguma sobre o número de classes adotar. O número ideal de classes é um número inteiro próximo de:

Regra 1: nlogx2,31C+= Regra 2: nC= onde n é o número de elementos pesquisado.

As duas regras são equivalentes para n ≤ 80. A partir daí, a Regra 2 fornece valores que crescem rapidamente e desse modo a Regra 1, proposta por Sturges tem sido preferida.

4.3. Variáveis Qualitativas e Quantitativas Bidimensionais

As tabelas usadas neste caso são conhecidas como tabela de dupla entrada, tabela de associação, tabela de contingência ou distribuições conjuntas de freqüências.

Tabela 4.4: Distribuição dos funcionários da empresa MB, segundo o conceito em Metodologia e a Seção a que pertence.

Conceito em Metodologia Seção A B C

Total por Seção

Dep. Pessoal 3 1 3 7 Séc. Técnica 0 4 3 7 Sec. Venda 4 3 4 1

Total por Conceito 7 8 10 25

Tabela 4.5: Vendas dos Produtos A, B, C, no supermercado Glória, no Primeiro semestre de 2005.

Vendas em 1000 R$ Meses A B C

Total por Mês

Tabela 4.6: Distribuição dos alunos da Faculdade Vitória, segundo suas notas em Matemática e Estatística.

Matemática Estatística 0 |- 4 4 |- 7 7 |- 10

Totais em Estatística

Totais em Matemática 59 235 106 400

Fonte: Dados Hipotéticos.

4.4. Exercícios – Parte I – A1

Tabela 4.7: Conjuntos de dados da empresa MB Indústria e Comércio

(*) P = Departamento Pessoal; T = Seção Técnica e V = Seção de Vendas. Fonte: Bussab e Morettin (2002)

1) Baseado na Tabela 4.7., construa a distribuição de freqüências da variável Metodologia, com as freqüências absoluta e relativa, as porcentagens, dê um título e interprete.

2) Ainda baseado na Tabela 4.7., construa uma Tabela de Classes de Freqüências para a variável Redação, com as freqüências absoluta e relativa, as porcentagens, dê um título e interprete.

3) Construa uma tabela de dupla entrada para as variáveis “seção” e conceito tirado em “Inglês” da Tabela 4.7.

4) Construa uma tabela de contingência para as variáveis “seção” e “notas em estatística” da Tabela 4.7.

5) Construa uma tabela de contingência para as variáveis “notas em redação” e “política” da Tabela 4.7.

5. MEDIDAS DE POSIÇÃO

5.1. Mínimo e Máximo

O mínimo é a menor observação do conjunto de dados, enquanto que o máximo é a maior observação.

Min =e Max = _.

Exemplo: Considere o seguinte conjunto de dados: 4, 5, 4, 6, 5, 8, 4. Logo,

5.2. Moda

Exemplo (a): 2, 5, 2, 7, 8 Moda =
Exemplo (b): 3, 4, 2, 2, 4, 5 Moda = _ e“Conjunto _ _ _ _ _ _ _”
Exemplo (c): 1, 2, 3, 4, 5 Moda = não tem “Conjunto

Valor ou atributo que ocorre com maior freqüência.

Moda para dados agrupados em Tabelas de Freqüências

Exemplo: Uma empresa de segurança deseja estudar qual o número de ligações a cobrar mais freqüentes que são recebidas em um determinado bairro de classe alta da cidade de São Paulo no mês de março. Foram selecionadas 30 residências e observadas 10 ligações em cada residência. O resultado foi:

Números de Ligações a Cobrar (xi) Número de Residências (ni) 0 2

Total 30

Moda =

Interpretação: _ ligações a cobrar foi o que ocorreu com maior freqüência.

5.3. Média

Considere n observações de um conjunto de dados representados por x1, x2,, xn. A média

Valor que representa o centro do conjunto de dados. desse conjunto é obtida pela soma das n observações dividido por n, ou seja,

nx n x n i in ∑

Exemplo: Considere o seguinte conjunto de notas: 2, 5, 3, 7, 8. A média das notas é _.

Média para dados agrupados em Tabelas de Freqüências

Exemplo: Considere novamente o exemplo da empresa de segurança, mas suponha que o interesse seja estudar o número médio de ligações a cobrar recebido em um determinado bairro de classe alta da cidade de São Paulo no mês de março.

Números de Ligações a Cobrar (xi) Número de Residências (ni) 0 2

Total 30

Nesse caso, a média é calculada levando em conta as freqüências de cada valor da variável, da seguinte forma:

x v i

onde v é a quantidade de resultados que a variável contém e ni a respectiva freqüência da i-ésima classe. Assim, para o exemplo temos:

n nxx i i _.

cidade de São Paulo no mês de março é

Logo, o número médio de ligações a cobrar recebido em um determinado bairro de classe alta da

5.4. Mediana

É o valor que divide os dados, isto é, metade dos dados será maior ou igual que a mediana e metade será menor ou igual.

Considere a seguinte série de valores: 5, 2, 6, 13, 9, 15, 10. De acordo com a definição de mediana, o primeiro passo a ser dado é ordenar o conjunto de valores: 2, 5, 6, 9, 10, 13, 15. O valor que divide a série em duas partes iguais é 9. Logo, a mediana é 9.

1) Ordenar os valores do menor para o maior, isto é, x(1),, x(n), onde x(1) é o mínimo e x(n) é o

Método prático para o cálculo da Mediana para dados em Rol máximo.

2) Calcular em que posição estará a mediana nos dados ordenados através da fórmula: 2 1np+=.

3) O valor da mediana será:

(a) Se p for um número inteiro, então a mediana será o valor que está na posição p nos dados ordenados, isto é

Mediana = x(p)

(b) Se p não for inteiro, considere p- e p+ os inteiros imediatamente abaixo e acima de p, respectivamente. A mediana será a média dos valores que estão nas posições p- e p+ nos dados ordenados, ou seja,

1º ordenar a série: _, _, _, _, _, _, _, _,
n =Logo, P = (n + 1)/2 é dado por P = (_+1)/2 = 5, ou seja, o 5º elemento da série ordenada
será a mediana. Assim, mediana =

Exemplo: Calcule a mediana da seguinte série de dados: 1, 3, 0, 0, 2, 4, 1, 2, 5

(Parte 2 de 5)

Comentários