Trabalho de Estatística

Trabalho de Estatística

(Parte 1 de 4)

Universidade Estadual do Ceará - UECE

Faculdade de Educação de Crateús – FAEC

Curso de Licenciatura Plena em Química

Prof.: Fabiano

Disciplina: Introdução à Estatística

Alunos: Adriana Maria Lima Virgílio,

Debora Bezerra de Sousa,

Maria Regina Rufino Barbosa,

Francisco Jonas Xavier,

Jéssica Rodrigues Sousa

Estatística

05/01/2011

Crateús/Ce

CONCEITOS DE ESTATÍSTICA

A Estatística é ma parte da matemática que fornece métodos para a coleta, organização, descrição, análise e interpretação de dados e para a utilização dos mesmos na tomada de decisões. Seu aspecto essencial é o de proporcionar métodos inferenciais, que permitam conclusões que transcendam os dados obtidos inicialmente.

A Estatística se divide em duas áreas:

  • ESTATÍSTICA DESCRITIVA: trata-se da coleta, da organização e da descrição dados numéricos referentes a uma população ou amostra.

  • ESTATÍSTICA INDUTIVA OU INFERENCIAL: trata-se da coleção de métodos e técnicas utilizados para se estudar uma população baseados em amostras probabilísticas desta mesma população.

POPULAÇÃO

Denomina-se população ou universo estatístico um conjunto formado por elementos portadores de, pelo menos, ma característica em comum ou que satisfazem uma mesma propriedade, sendo objetos de interesse para estudo.

Na estatística o termo população é mais abrangente do que o usado na linguagem comum, o qual significa o conjunto dos habitantes de certo lugar.

Exemplos de população: o conjunto de funcionários da Empresa Alpha, o conjunto dos alunos de uma escola etc.

Quanto ao tipo, as populações podem ser:

  • Finitas: São aquelas populações que apresentam um número limitado de indivíduos. Pode ser feita a contagem exata dos elementos que as compõem

  • Infinitas: Essas normalmente estão associadas a processos em que o número de observações não tem fim. Uma população infinita deverá, portanto, ser concebida apenas como um esquema conceitual e teórico.

Na prática, quando uma população é finita com um úmero grande de elementos, considera-se como população infinita.

AMOSTRA

Entende-se por amostra uma parte ou subconjunto representativo da população que se quer estudar.

Considerando-se a possibilidade, na maioria das vez do tratamento de todos os elementos da população, limita-se as observações referente s a uma determinada pesquisa à apenas uma amostra dela. No entanto, é preciso garantir que a amostra possua as mesmas características básicas da população, no que diz respeito ao fenômeno que se deseja inferir.

O LEVANTAMENTO ESTATÍSTICO

Censo: Um levantamento censitário consiste no levantamento efetuado sobre toda uma população, o que sempre muito difícil. Isso se deve a vários fatores: como o tempo, o custo, entre outros, por isso é um levantamento estatístico pouco utilizado.

Amostragem: É o método de trabalho estatístico mais comumente utilizado quando s e quer realizar, por exemplo, uma pesquisa eleitoral.

A amostragem consiste numa técnica para recolher amostras, que garante, tanto quanto possível, o acaso na escolha dentre a população, garantindo, portanto, que cada elemento tenha a mesma chance de ser escolhido (caráter de representatividade). Geralmente, é o tipo de levantamento estatístico mais utilizado pelo seu baixo custo e pela praticidade de tempo.

AS FASES DO LEVANTAMENTO ESTATÍSTICO

  1. Coleta de dados: Após cuidadoso planejamento e a devida determinação das características mesuráveis do fenômeno que se quer pesquisar, inicia-se a coleta de dados numéricos necessários à sua descrição. A coleta pode ser direta ou indireta.

A coleta é direta quando os dados são coletados pelo o próprio pesquisador através de inquéritos e questionários, como é o caso das notas de verificação e de exames, do censo demográfico etc.

A coleta se diz indireta quando é inferida de elementos conhecidos e / ou do conhecimento de outros fenômenos relacionados com o fenômeno estudado.

Como exemplo, pode se citar a pesquisa sobre a mortalidade infantil, que é feita através de dados colhidos por uma coleta direta.

  1. Processamento: Fase em que os dados são organizados através de uma classificação ou de uma ordenação para permitir sua análise e apresentação. Poe exemplo, numa pesquisa de intenção de votos, pode-se aproveitar e fazer perguntas acerca da idade, escolaridade, profissão e sexo dos entrevistados. Após uma análise destes dados, pode-se traçar um perfil do eleitor que vota no candidato A, no candidato B, e assim por diante.

  2. Interpretação: Fase em que os dados são analisados, previsões anteriores são ou não, novas previsões são efetuadas, dados são confrontados. Nesta fase os dados são analisados e podemos encontrar justificativas para as medidas encontradas.

  3. Apresentação ou exposição dos dados: Por diversa que seja a finalidade que se tenha em vista os dados devem ser apresentados sobre formas adequadas (tabelas ou gráficos), tornando mais fácil o exame daquilo que esta sendo o objeto de tratamento estatístico ulterior obtenção de medidas típicas.

  4. Análise dos resultados: Finalmente, faz-se uma análise dos resultados obtidos, através dos métodos de estatística indutiva, que tem por base a indução ou inferência, e tira-se desses resultados conclusões e previsões.

AMOSTRAGEM: COMPOSIÇÃO DA AMOSTRA

Basicamente existem dois métodos para composição da amostra: amostragem não probabilística e amostragem probabilística.

  1. Amostragem acidental: Trata-se de uma amostra formada por aqueles elementos que vão aparecendo, que são possíveis de se obter até completar o número de elementos da amostra. Geralmente utilizada em pesquisas de opinião, em que os entrevistados são acidentalmente escolhidos.

  2. Amostragem intencional: de acordo com determinado critério, é escolhido intencionalmente um grupo de elementos que irão compor uma amostra. O investigador se dirigir intencionalmente ao grupo de elementos dos quais deseja saber a opinião. Por exemplo, numa pesquisa sobre o grau de escolaridade dos funcionários da Empresa Alpha o pesquisador se dirige ao grupo em questão.

  3. Amostragem por cotas: é um dos métodos de amostragem mais comumente usado em levantamentos de mercado e em prévias eleitorais.

Amostragem não probabilística

Consiste de amostragens em que ha uma escolha deliberada dos elementos da amostra. Não é possível generalizar os resultados das pesquisas para a população, pois as amostras não probabilísticas não garantem a representatividade da população.

AMOSTRAGEM PROBABILÍSTICA

Esse método exige que cada elemento da população possua determinada probabilidade de ser selecionado. Normalmente possuem a mesma probabilidade. Trata-se do método que garante cientificamente a aplicação das técnicas estatísticas de inferências.

  1. Amostragem aleatória simples: Este tipo de amostragem é equivalente a um sorteio lotérico.

Na prática, pode ser realizado numerando-se a população de 1 a n e sorteando-se, a seguir, por meio de um dispositivo aleatório qualquer, k números dessa seqüência, dos quais corresponderam aos elementos pertencentes à amostra.

Quando o número de elementos da amostra é grande, esse tipo de sorteio torna-se muito trabalhoso. A fim de facilitá-lo, foi elaborada uma tabela de números aleatórios, construída de modo que os dez algarismos (0 a 9) são distribuídos ao acaso nas linha e colunas.

  1. Amostragem estratificada proporcional: muitas vezes a população se divide em estratos ou subpopulações. Como é provável que a variável em estudo apresente, de estrato em estrato, um comportamento heterogêneo e, dentro de cada estrato, um comportamento homogêneo, convém que o sorteio dos elementos da amostra leve em consideração tais estratos. Este método, além de considerar a existência dos estratos, obten-se os elementos da amostra proporcional ao número de elementos dos mesmos.

  2. Amostragem sistemática: quando os elementos da população já se acham ordenados, não há necessidade de construir o sistema de referência. Nestes casos a seleção dos elementos que constituirão a amostra pode ser feita por um sistema imposto pelo pesquisador. A esse tipo de amostragem denomina-se sistemática.

  3. Amostragem por conglomerados (ou agrupamento): algumas populações não permitem ou tornam extremamente difícil que se identifiquem seus elementos. Não obstante isso pode ser relativamente fácil identificar alguns subgrupos da população. Em tais casos, uma amostra aleatória simples desses subgrupos (conglomerados) pode ser colhida, e uma contagem completa deve ser feita para o conglomerado sorteado. Agregados típicos são quarteirões, famílias organizações agências etc.

Assim, por exemplo, no levantamento da população de ma cidade, podemos dispor do mapa indicando cada quarteirão e não dispor de uma relação atualizada de seus moradores. Pode-se, então colher uma amostra dos quarteirões e fazer a contagem completa de todos os residem naqueles quarteirões sorteados.

Variável e Dado

Tipos de variáveis

Variáveis Quantitativas

Quando os dados são de caráter quantitativo, e o conjunto dos resultados possui estrutura numérica. Podem ser Discretas ou Contínuas.

- Contínua

Característica mensurável em que a escala numérica de seus valores corresponde ao conjunto de números Reais R, ou seja, valores fracionários fazem sentido pois esse tipo de variável pode assumir qualquer valor entre dois limites.

Ex.: Peso, altura, tempo, pressão arterial, salário (em salários mínimos) etc.

- Discreta (ou descontínua)

Pode assumir apenas um número finito ou infinito contável de valores, sendo assim, seus valores são expressos através de números inteiros não negativos. Normalmente o resultado é obtido por contagem.

Ex.: Número de filhos, Número de alunos presentes na aula etc.

Exemplo retirado da Tabela 1

UNIDADE DE

INVESTIGAÇÃO

NÚMERO DE

FILHOS

SALÁRIO (EM

SALÁRIOS MINÍMOS)

1

0

1,00

2

2

1,25

3

5

2,00

Nesse exemplo está sendo representado os dois tipos de variáveis explicados anteriormente. A Variável Quantitativa Contínua esta sendo representada pelo salário, enquanto que, a Variável Quantitativa Discreta está sendo representada pelo número de filhos de alguns funcionário da Empresa Alpha.

Variáveis Qualitativas (ou categóricas)

Seus valores são representados por atributos, representando uma classificação dos indivíduos. Podem sem Nominais ou Ordinais.

- Nominal

Não existe ordenação dentre os atributos.

Ex.: Sexo, cor dos olhos, cor da pele etc.

- Ordinal

Existe uma ordenação entre as categorias.

Ex.: Escolaridade (1°, 2°, 3° graus), mês de coleta (janeiro, fevereiro, março,..., dezembro) etc.

Exemplo retirado da Tabela 1

UNIDADE DE

INVESTIGAÇÃO

GRAU DE INSTRUÇÃO

(EM GRAUS)

GRAU DE

INSTRUÇÃO

16

1° GRAU

MÉDIO

18

2° GRAU

FUND.

19

3° GRAU

SUPERIOR

Nesse exemplo foi apresentado o grau de instrução de alguns funcionários da Empresa Alpha. O grau de instrução representado numericamente em graus (2ª coluna) é um tipo de Variável Qualitativa Ordinal, enquanto que, o mesmo tipo de dado, representado categoricamente (3ª coluna) esta classificado como Variável Qualitativa Nominal.

Tipos de dados

- Dados absolutos

São dados estatísticos resultantes da coleta direta da fonte, sem manipulação além a de contagem ou medida. Esse tipo de dado traduz um resultado exato e fiel mas não tem a virtude de ressaltar imediatamente suas conclusões numéricas, ou seja, a leitura dos seus valores é sempre enfadonha.

- Dados relativos

São obtidos pelo resultado de comparações por quociente que se estabelecem entre os dados absolutos, seu objetivo é o de facilitar as comparações entre quantidades. São representados, em geral, por meio de porcentagens, índices, coeficientes e taxas. A frequência relativa é o quociente entre a frequência absoluta de uma variável e o total de variáveis.

Organização e apuração dos dados

As séries estatísticas

São qualquer tabela que apresente a distribuição de um conjunto de dados estatísticos em função da época, do local ou da espécie.

- Série histórica (ou temporal)

Este tipo de série é identificado pelo caráter variável do fator cronológico, temporal. O local e a espécie são elementos fixos.

- Série geográfica (ou Série de localização)

Apresenta como variável o fator geográfico. A época e o fato são elementos fixos.

- Série específica (ou categórica)

Apresenta como variável apenas a espécie ou fato.

Exemplo retirado da Tabela 1

UNIDADE DE

INVESTIGAÇÃO

LOCAL DE

MORADIA

1

ABC

2

CAPITAL

3

GUARULHOS

Representação tabular e gráfica dos dados

Os dados podem ser apresentados e representados por meio de Tabelas ou por meio de Gráficos.

- Tabela

Quadro que resume um conjunto de dados dispostos em linhas e colunas.

Exemplo retirado da Tabela 1

UNIDADE DE

INVESTIGAÇÃO

IDADE

(EM ANOS)

1

26

2

32

3

36

- Gráficos

Representação visual de dados estatísticos que devem corresponder as tabelas. Nesse tipo de representação percebe-se o uso de escalas, sistemas de coordenadas e os dados devem ser mostrados de maneira simples e clara para que não tragam uma falsa idéia.

Podem ser classificados em:

Diagramas

Gráficos dispostos em 2 dimensões. É o tipo de gráfico mais utilizado na representação de séries estatísticas. Podem ser:

Gráficos em barras horizontais

Gráficos em barras verticais (colunas)

Gráficos em linhas

Gráficos em setores (pizzas)

Gráficos em radar (polar)

Gráficos em polígono de freqüência

Histogramas

Pictogramas

São representados por figuras representativas, assim sendo, desperta a atenção do público leigo, pois sua forma é atraente e sugestiva mas mostram apenas uma visão geral do fenômeno e não detalhes minuciosos.

Cartogramas

Possui ilustrações relativas a cartas geográficas. Tem como objetivo figurar os dados diretamente relacionados com áreas geográficas ou políticas.

Estereogramas

Gráficos dispostos em 3 dimensões, representa volume. Em alguns casos este tipo de gráfico fica difícil de ser interpretado.

Distribuição de Freqüência

Dados Brutos

Feita a coleta, os dados originais ainda não se encontram prontos para análise, por estarem desordenados. Por essa razão, são chamados de dados brutos. Tomando por exemplo o número de filhos dos funcionários da Empresa Alpha da cidade de São Paulo e anotando-se os resultados em uma tabela da qual constem o número de funcionários em ordem crescente, ninguém garantirá que o número de filhos correspondentes a cada funcionário observarão uma determinada ordem numérica, crescente ou decrescente. Mais provável é que estejam desorganizados, uma vez que a ordem não corresponde necessariamente à ordem de número de funcionários. A tabela é portanto, uma tabela de dados brutos, a que se chegou pela simples coleta, sem qualquer preocupação quanto à sua ordenação.

Rol

O rol é uma lista em que os valores estão dispostos em uma determinada ordem, crescente ou decrescente.

Número de filhos dos funcionários da Empresa Alpha

da Cidade de São Paulo.

0 0 0 1 1 2 2 2 3 3

0 0 1 1 1 2 2 3 3 4

0 0 1 1 2 2 2 3 3 5

Essa classificação dos dados proporciona algumas vantagens concretas com relação à sua forma original. Ela torna possível visualizar, de forma bem ampla, as variações nos números de filhos, uma vez que os valores extremos são percebidos de imediato. Apesar de o rol propiciar ao analista mais informação e com menos esforço de concentração do que os dados brutos, ainda assim persiste o problema de à analise ter que se basear nas 30 observações individuais. O problema se agravará quando o número de dados for muito grande.

Tabela de Freqüências

Considere o número de filhos dos funcionários da Empresa Alpha.

0 1 0 0 1 2 0 0 2 3

2 2 1 3 3 3 4 0 3 2

3 2 2 0 1 1 2 3 1 1

Os dados brutos apresentados acima, não informam muita coisa sobre o número de filhos dos funcionários sendo difícil extrair deles muitas conclusões, sem esforço de concentração. Observa-se, entretanto aparecem repetidos, como o 0(zero) por exemplo. Esse fato irá sugerir naturalmente que se condensem todos os resultados em uma tabela, estabelecendo a correspondência entre o valor individual e o respectivo número de vezes que ele foi observado. O número de repetições de um valor ou de uma modalidade em um levantamento qualquer, é chamado freqüência desse valor ou dessa modalidade. Uma tabela de freqüências é uma tabela onde se procura fazer corresponder os valores observados da variável em estudo e as respectivas freqüências. A tabela de freqüências proporciona uma apresentação esteticamente mais vantajosa dos dados facilitando ainda a verificação do comportamento do fenômeno. É possível, por outro lado, com a utilização de uma tabela de freqüências, a obtenção de estatísticas (medidas) com menos cálculo e conseqüentemente, em menos tempo do que se esse trabalho fosse realizado a partir dos dados brutos.

As tabelas de freqüências podem representar tanto valores individuais como valores agrupados em classes.

Para se construir uma distribuição de freqüências é comum fazer a distinção entre dois tipos de variáveis.

A variável (ou conjunto) discreta (valores que são resultados de contagem) e a variável contínua (valores que são resultados de uma medida). Em geral variáveis discretas são agrupadas em distribuição por ponto ou valores e variáveis contínuas em distribuições por classes ou intervalos. A separação não é rígida e depende basicamente dos dados considerados. Poderá ser necessário usar uma distribuição por classes ou intervalos mesmo quando a variável é discreta.

(Parte 1 de 4)

Comentários