Estatística descritiva

Estatística descritiva

(Parte 1 de 2)

ESTATÍSTICA DESCRITIVA

1. INTRODUÇÃO:

A palavra estatística é comumente associada a pesquisas de opinião pública, recenseamentos, índices governamentais. Na realidade engloba vários outros aspectos como veremos a seguir, sendo fundamental na análise de dados provenientes de processos onde exista variabilidade. Exemplos:

  • O número médio de filhos no Brasil é 2,6.

  • 26% das crianças de rua de Porto Alegre consomem solventes (loló,cola,...).

  • A taxa de desemprego é de 7,5%.

  • O setor de Vestuário demitiu 21,9% de empregados no primeiro trimestre de 1996.

  • O salário médio de Assistente Administrativo, em empresas médias, é de R$ 717,00.

  • O número de acidentes de trânsito nas estradas gaúchas no verão foi 15.

ESTATÍSTICA é a ciência que tem por objetivo orientar a coleta, organização, apresentação, análise e interpretação dos dados para tomar decisões.

Divide-se em:

ESTATÍSTICA DESCRITIVA: está envolvida com o resumo e a apresentação dos dados.

ESTATÍSTICA INFERENCIAL: ajuda a concluir sobre conjuntos maiores de dados (populações) quando apenas partes destes conjuntos (amostras) foram estudados.

Alguns conceitos:

  • POPULAÇÃO:

É um conjunto de elementos com alguma característica comum.

Exemplos: habitantes de P.Alegre; alunos da PUCRS; sócios de um clube; pinheiros do município de Canela.

  • CENSO:

É o levantamento efetuado em toda a população. Todos os sócios de um clube são pesquisados, por exemplo, e não apenas uma parte deles. Geralmente pesquisas em toda a população implicam em custo elevado e muito tempo, sendo necessário o estudo de apenas parte da população, ou amostra.

  • AMOSTRA:

É apenas uma parte da população.

Exemplos de pesquisas amostrais: a) pesquisas de opinião para conhecer o provável eleito em eleições; b) o IBGE faz, periodicamente, pesquisas sobre emprego, desemprego, inflação, etc.; c) redes de rádio e televisão realizam pesquisas para conhecer a popularidade dos programas; d) biólogos marcam pássaros, peixes, etc. para uma previsão sobre hábitos de migração; e) os dirigentes de uma empresa de ônibus precisam determinar o consumo de óleo diesel.; f) verificar as causas de uma doença.

  • AMOSTRAGEM:

É o processo que estabelece critérios para a seleção de uma amostra. Quando não é possível realizar um estudo sobre todos os elementos da população utiliza-se a amostragem.

  • PARÂMETRO:

Descreve uma informação sobre uma população. Por exemplo: a idade média de todos os alunos de uma escola de 2o grau é 16,5 anos.

  • ESTATÍSTICA AMOSTRAL (ou apenas estatística):

Descreve a informação contida em uma amostra.Por exemplo: a idade média de uma amostra de alunos de uma escola de 2o grau é 17 anos.

  • VARIÁVEL:

É toda característica que pode variar de um indivíduo para outro.

Pode ser qualitativa ou quantitativa.

Variável qualitativa (var.categóricas ou atributos): é aquela que fornece dados de natureza não numérica. Mesmo que os dados possam ser codificados numericamente (masculino = 1; feminino = 2), os números são apenas símbolos sem valor quantitativo.

A variável encontra-se no nível nominal quando diferencia-se uma categoria da outra somente através da denominação da categoria. Os dados são identificados pela atribuição de um “nome”, não existindo nenhuma relação de ordem entre as categorias.

Por exemplo: profissão, curso, sexo, nacionalidade.

Ao nível ordinal é possível além de identificar diferentes categorias, reconhecer graus de intensidade entre elas. Indivíduos podem ser classificados como mais perturbado; mais agressivo; mais imaturo.

Outros exemplos: grau de instrução, conceitos, dias da semana.

Variável quantitativa: é aquela em que os dados são numéricos e expressam quantidades.

A variável é denominada discreta quando assume apenas valores determinados dentro de certo intervalo. Geralmente são números inteiros.

Por exemplo: número de irmãos; número de acertos; número de acidentes.

A variável é contínua quando pode assumir infinitos valores em certo intervalo.

Por exemplo: peso, altura, temperatura, diâmetro.

2. ORGANIZAÇÃO PARA UM PEQUENO CONJUNTO DE DADOS:

Para facilitar o estudo da Estatística Descritiva os conjuntos de valores serão considerados como pequenos e grandes. Assim se um conjunto tiver 30 ou menos valores a análise será feita sem o agrupamento. Caso o conjunto tenha mais do que 30 valores, então, primeiramente será feito o agrupamento de acordo com o tipo de variável considerada. O valor 30 é apenas um ponto de referência escolhido arbitrariamente e dependendo da situação pode-se considerar o agrupamento com mais ou menos valores envolvidos.

Para um pequeno conjunto de dados a tabela pode ser como a que segue:

Número de faltas dos alunos da turma 120-Escola XYZ em março/2005

Nome do aluno

No de faltas

Marcos

Daniela

Lucas

Michele

3

2

0

3

Fonte: Secretaria da escola.

Um conjunto de dados, de qualquer tamanho, pode ser resumido de acordo com as seguintes medidas:

1. Medidas de tendência central ou posição.

2. Medidas de dispersão ou variablidade.

  • Medidas de tendência central ou de posição:

a) Média aritmética:

É a soma dos valores da variável dividida pelo número de valores. Ou seja:

onde: n = é o tamanho da amostra.

O símbolo da média depende dos dados constituírem uma amostra ou uma população. Na população utilizam-se letras gregas, geralmente, para representar as medidas. Portanto a fórmula para a média na população será:

onde: N = é o tamanho da população.

b) Moda:

A moda de um conjunto de valores é definida como sendo o valor (ou valores) do conjunto que mais se repete. A moda pode não ser única, isto é, um conjunto pode ser bimodal, trimodal, etc. ou mesmo amodal (sem moda).

Exemplo:

Dado o conjunto: 1 2 2 3 3 4 4 4 7 9 15

A moda é 4.

Se a variável for qualitativa nominal, como por exemplo, estado civil, a moda será o estado civil que mais se repetiu.

c) Mediana:

A mediana de um conjunto ordenado de valores é definida como sendo o valor que separa o conjunto em dois subconjuntos do mesmo tamanho. Assim se “n” (número de elementos) é ímpar a mediana é o valor central do conjunto. Caso contrário a mediana é a média dos valores centrais do conjunto.

Exemplo:

Para o conjunto: 15 18 21 32 45 46 49

A mediana é:

Me = 32

Ou seja, a mediana é o quarto valor na seqüência ordenada de elementos.

Se o conjunto fosse: 15 18 21 32 45 46

A mediana seria:

Me = 26,50

  • Medidas de DISPERSÃO OU VARIABILIDADE:

Indicam a dispersão dos valores da variável em relação a sua média.

  1. Variância absoluta

  2. Desvio padrão

  3. Coeficiente de variação

(Parte 1 de 2)

Comentários