(Parte 1 de 2)

Estatística Juliana Brassolatti Gonçalves

1 CONCEITOS BÁSICOS

    1. INTRODUÇÃO

Se pudéssemos medir as alturas de todos os brasileiros adultos, teríamos de obter sua distribuição exata e daí, produzir os correspondentes parâmetros (média e desvio padrão). Nessa situação não teríamos necessidade de usar a inferência estatística. Raramente se consegue obter a distribuição exata de alguma variável, ou porque isso é muito demorado ou às vezes porque consiste num processo destrutivo.

Exemplo 1: observar a durabilidade de lâmpadas e testá-las até queimarem todas, não restaria nenhuma para ser vendida.

Exemplo 2: População de Fósforos:

Se quisermos avaliar na população de fósforos a porcentagem de falhas, temos dois caminhos:

  1. Riscar um por um e ao cabo de algum tempo concluir que a falha é da ordem de 2% por exemplo, o que significa queimar todo estoque.

  2. Colher uma amostra com critério, riscar um por um da amostra e ao cabo de algum tempo concluir que a falha é, por exemplo, da ordem de 1,8% ou 2,2%. A aparente diferença de 0,2% para mais ou para menos fica compensada pelo fato de que o estoque de fósforos foi preservado bem como o bolso.

Portanto a solução é selecionar uma amostra, analisá-la e inferir propriedades para toda população.

População: Conjunto de indivíduos ou objetos que apresentam em comum determinadas características definidas para o estudo.

Amostra: Redução da população à dimensões menores sem perda das características essenciais.

É compreensível que o estudo de todos os elementos da população possibilita preciso conhecimento das variáveis que estão sendo pesquisadas; todavia, nem sempre é possível obter as informações de todos os elementos da população. Limitações de tempo, custo e vantagens do uso de técnicas de inferência justifica o uso de amostras. Torna-se claro que a representatividade da amostra dependerá do seu tamanho e da forma como é coletada visando obter uma amostra significativa que de fato represente toda a população.

Se uma população for muito grande, o pesquisador poderá ter um trabalho astronômico para estudá-la e em alguns casos os resultados serão sempre falhos. É só pensar, por exemplo, no número de nascimentos e mortes diários, isto é, na entrada e saída de informações, para avaliar a dificuldade e a imprecisão do trabalho.

    1. COMO RETIRAR UMA AMOSTRA:

Devemos levar em conta duas questões importantes na retirada de uma amostra: Representatividade e Imparcialidade.

Suponha que estivéssemos interessados em conhecer o grau de instrução dos habitantes do Estado de São Paulo. Considere uma amostra de 400 moradores de regiões com difícil acesso a uma escola ou a uma universidade. Logicamente, esta amostra não é representativa de toda população do Estado de São Paulo. Assim, a média calculada com a amostra de 400 alunos não seria confiável podendo dizer que se trata de uma amostra tendenciosa. Para coletar dados não-tendenciosos é importante que amostra seja representativa da população. Técnicas de amostragem apropriadas devem ser usadas para garantir que as inferências sobre a população sejam válidas.

REPRESENTATIVIDADE: Uma amostra para ser boa tem que ser representativa, ou seja, deve conter em proporção tudo o que a população possui.

IMPARCIALIDADE: Todos os elementos da população devem ter igual oportunidade de fazer parte da amostra.

2 ETAPAS DE UMA PESQUISA

Para que os resultados de uma análise estatística de dados produzam informações úteis, os dados precisam ser coletados de forma planejada.

    1. ETAPAS DE UMA PESQUISA:

Proposta e Objetivos

Planejamento da Pesquisa

Configuração da População

Delineamento da amostra

Tamanho da amostra

Método de coleta de dados

Planejamento do questionário

Dados

Análise exploratória

Resultados

Conclusões

Mais detalhadamente, a meta de todo estudo estatístico é coletar dados e então usá-los para uma tomada de decisão. Para isso é importante um bom planejamento, ou seja:

  1. Identificar a variável de interesse e a população que forem objetos de estudo.

  2. Desenvolver um plano para a coleta de dados. Se for usar uma amostra, assegure-se de que ela é representativa da população.

  3. Coletar os dados.

  4. Descrever os dados fazendo o uso das técnicas da estatística descritiva.

  5. Interpretar os dados e tomar decisões acerca da população usando a inferência estatística.

  6. Identificar todos os possíveis erros.

      1. COLETA DE DADOS

Há várias maneiras de coletar dados. Apresentaremos aqui um resumo de 4 métodos: Censo, Amostra, Simulação e Experimento.

  1. Censo: Um censo é a contagem de toda uma população. Fornece informações completas, mas é difícil de ser realizado.

  2. Amostra: É uma contagem ou medição de parte de uma população. O uso da amostra é mais prático do que a realização de um censo.

  3. Simulação: É o uso de um modelo matemático ou físico para reproduzir as condições de uma situação ou de um processo. Permite estudar situações que seria pouco prático ou perigoso. Por exemplo: fabricantes de automóveis usam simulações com bonecos para estudar os efeitos que as colisões têm em seres humanos.

  4. Experimento: É aplicado um tratamento a uma parte da população e observadas as respostas.

      1. DELINEAMENTO DA AMOSTRA:

Amostragem: é uma técnica de seleção de uma amostra que possibilita o estudo das características de uma população.

Erro Amostral: é o erro que ocorre na utilização de uma amostra.

Existem dois métodos para composição de uma amostra: probabilístico e não-probabilístico.

Métodos Probabilísticos: Cada elemento da população tem a mesma chance de ser selecionado. Trata-se do método que garante cientificamente a aplicação de técnicas estatísticas. Somente com base em amostragens probabilísticas é que se podem realizar inferências ou induções sobre a população a partir do conhecimento de uma amostra. Existem alguns tipos de amostragens probabilísticas que garantem a imparcialidade acima discutida:

Amostragem Aleatória Simples: todos os elementos da população têm a mesma chance de serem selecionados. Atribui-se a cada elemento da população um número distinto. Efetuam-se sucessivos sorteios até completar o tamanho da amostra n. Para realizar o sorteio, utilizar a tábua de números aleatórios (anexo) que consistem em tabelas que apresentam dígitos de 0 à 9 distribuídos aleatoriamente.

    • Se estivermos interessados na altura dos alunos basta numerar a sala, sortear e anotar as estaturas dos alunos sorteados.

Exemplo:

Número sorteado

Aluno

Estatura

16

Antonio Rezende

140

09

Flavio Teixeira

167

13

Humberto Rodrigues

150

Amostragem Sistemática: Conveniente quando a população está ordenada segundo algum critério como fichas, lista telefônica.

Exemplo 1: Em uma produção diária de peças automotivas, podemos, a cada 20 peças produzidas, retirar uma para pertencer a uma amostra da produção de um dia.

Exemplo 2:

Se N = 5.000 é o tamanho da população e precisamos de uma amostra de n = 250, dividimos N/n = 20. Selecionamos ao acaso um número de 1 à 20. Suponha que saiu o número 7:

    • 1a unidade a ser selecionada 7a

    • 2a unidade a ser selecionada 20 + 7 = 27a

    • 3a unidade a ser selecionada 27 + 20 = 47a

    • 67a, 87a,..., 4987a dando um total de 250 unidades.

Amostragem Estratificada: No caso da população em que se podem distinguir subpopulações mais ou menos homogêneas denominadas estratos. Após a determinação dos estratos, seleciona-se uma amostra aleatória simples de cada estrato. As varáveis de estratificação mais comuns são: classe social, idade, sexo, profissão.

Amostragem Estratificada Proporcional: A proporcionalidade do tamanho de cada estrato da população é mantida na amostra. Exemplo: Se um estrato abrange 20% da população, ele também deve abranger 20% da amostra.

Amostragem Estratificada Uniforme: Selecionamos o mesmo número de elementos em cada estrato. É o processo usual quando se deseja comparar os diversos extratos.

Exemplo: Número de pessoas que vivem nos domicílios de Ribeirão Preto. Dividir os domicílios em níveis socioeconômicos e depois selecionar domicílios em cada nível aleatoriamente (Renda baixa, média, alta).

Amostragem por conglomerados: Há subdivisão da área à ser pesquisada por bairros, quarteirões, domicílios, famílias que serão sorteados para composição dos elementos da amostra e a pesquisa será realizada de forma sistemática ou simples.

(Parte 1 de 2)

Comentários