Estatistíca

Estatistíca

(Parte 1 de 10)

Projeto de Ensino Aprender Fazendo Estatística

Drª Terezinha Aparecida GuedesMsc. Ana Beatriz Tozzo Martins,
Msc. Clédina Regina Lonardan AcorsiMsc. Vanderly Janeiro 1

Estatística Descritiva

em interpretações equivocadas e muitas vezes errôneas

A Estatística é uma ciência cujo campo de aplicação estende-se a muitas áreas do conhecimento humano. Entretanto, um equívoco comum que deparamos nos dias atuais é que, em função da facilidade que o advento dos computadores nos proporciona, permitindo desenvolver cálculos avançados e aplicações de processos sofisticados com razoável eficiência e rapidez, muitos pesquisadores consideram-se aptos a fazerem análises e inferências estatísticas sem um conhecimento mais aprofundado dos conceitos e teorias. Tal prática, em geral, culmina

Em sua essência, a Estatística é a ciência que apresenta processos próprios para coletar, apresentar e interpretar adequadamente conjuntos de dados, sejam eles numéricos ou não. Podese dizer que seu objetivo é o de apresentar informações sobre dados em análise para que se tenha maior compreensão dos fatos que os mesmos representam. A Estatística subdivide-se em três áreas: descritiva, probabilística e inferencial. A estatística descritiva, como o próprio nome já diz, se preocupa em descrever os dados. A estatística inferencial, fundamentada na teoria das probabilidades, se preocupa com a análise destes dados e sua interpretação.

A palavra estatística tem mais de um sentido. No singular se refere à teoria estatística e ao método pelo qual os dados são analisados enquanto que, no plural, se refere às estatísticas descritivas que são medidas obtidas de dados selecionados.

A estatística descritiva, cujo objetivo básico é o de sintetizar uma série de valores de mesma natureza, permitindo dessa forma que se tenha uma visão global da variação desses valores, organiza e descreve os dados de três maneiras: por meio de tabelas, de gráficos e de medidas descritivas.

A tabela é um quadro que resume um conjunto de observações, enquanto os gráficos são formas de apresentação dos dados, cujo objetivo é o de produzir uma impressão mais rápida e viva do fenômeno em estudo.

Para ressaltar as tendências características observadas nas tabelas, isoladamente, ou em comparação com outras, é necessário expressar tais tendências através de números ou estatísticas. Estes números ou estatísticas são divididos em duas categorias: medidas de posição e medidas de dispersão.

Projeto de Ensino Aprender Fazendo Estatística

Drª Terezinha Aparecida GuedesMsc. Ana Beatriz Tozzo Martins,
Msc. Clédina Regina Lonardan AcorsiMsc. Vanderly Janeiro 2

Para se obter bons resultados numa análise estatística, além dos métodos aplicados, também é necessário ter clareza nos conceitos utilizados. A seguir são apresentados alguns desses conceitos.

1.1 CONCEITOS FUNDAMENTAIS E DEFINIÇÕES

A estatística trabalha com dados, os quais podem ser obtidos por meio de uma população ou de uma amostra, definida como:

População: conjunto de elementos que tem pelo menos uma característica em comum.

Esta característica deve delimitar corretamente quais são os elementos da população que podem ser animados ou inanimados.

Amostra: subconjunto de elementos de uma população. Este subconjunto deve ter dimensão menor que o da população e seus elementos devem ser representativos da população. A seleção dos elementos que irão compor a amostra pode ser feita de várias maneiras e irá depender do conhecimento que se tem da população e da quantidade de recursos disponíveis. A estatística inferencial é a área que trata e apresenta a metodologia de amostragem.

Em se tratando de conjuntos-subconjuntos, estes podem ser: Finitos: possuem um número limitado de elementos. Infinitos: possuem um número ilimitado de elementos. Segundo Medronho (2003), elemento significa cada uma das unidades observadas no estudo.

Após a determinação dos elementos pergunta-se: o que fazer com estes? Pode-se medilos, observá-los, contá-los surgindo um conjunto de respostas que receberá a denominação de variável.

Variável: é a característica que vai ser observada, medida ou contada nos elementos da população ou da amostra e que pode variar, ou seja, assumir um valor diferente de elemento para elemento.

Não basta identificar a variável a ser trabalhada, é necessário fazer-se distinção entre os tipos de variáveis:

Variável qualitativa: é uma variável que assume como possíveis valores, atributos ou qualidades. Também são denominadas variáveis categóricas.

Variável quantitativa: é uma variável que assume como possíveis valores, números. Cada uma dessas variáveis pode ser sub-classificada em: Variável qualitativa nominal: é uma variável que assume como possíveis valores,

Projeto de Ensino Aprender Fazendo Estatística

Drª Terezinha Aparecida GuedesMsc. Ana Beatriz Tozzo Martins,
Msc. Clédina Regina Lonardan AcorsiMsc. Vanderly Janeiro 3

atributos ou qualidades e estes não apresentam uma ordem natural de ocorrência. Exemplo 01: meios de informação utilizados pelos alunos da disciplina Inferência Estatística do curso de Estatística da UEM: televisão, revista, internet, jornal.

Variável qualitativa ordinal: é uma variável que assume como possíveis valores atributos ou qualidades e estes apresentam uma ordem natural de ocorrência. Exemplo 02: estado civil dos alunos da disciplina Inferência Estatística do curso de Estatística da UEM: solteiro, casado, separado.

do curso de Estatística da UEM: 0, 1, 2,

Variável quantitativa discreta: é uma variável que assume como possíveis valores números, em geral inteiros, formando um conjunto finito ou enumerável. Exemplo 03: número de reprovas, por disciplina, dos alunos da disciplina Inferência Estatística

Variável quantitativa contínua: é uma variável que assume como possíveis valores números, em intervalos da reta real e, em geral, resultantes de mensurações. Exemplo 04: peso (quilogramas) dos alunos da disciplina Inferência Estatística do curso de Estatística da UEM: 58, 59, 63.....

Projeto de Ensino Aprender Fazendo Estatística

Drª Terezinha Aparecida GuedesMsc. Ana Beatriz Tozzo Martins,
Msc. Clédina Regina Lonardan AcorsiMsc. Vanderly Janeiro 4

2 TABELA

É muito comum nos dias de hoje, devido ao uso de computadores, realizarem pesquisas em que a coleta de dados resulta em grandes coleções (quantidades) de dados para análise e torna-se quase impossível entendê-los, quanto ao(s) particular(es) objetivo(s) de estudo, se estes dados não estiverem resumidos. Em outras palavras, os dados na forma em que foram coletados não permitem, de maneira fácil e rápida, que se extraia informações. Torna-se difícil detectar a existência de algum padrão. É necessário “trabalhar os dados para transformá-los em informações, para compará-los com outros resultados, ou ainda para julgar sua adequação a alguma teoria” (Bussab, 2003, p.1). Montgomery (2003, p.14) afirma que “sumários e apresentações de dados bem constituídos são essenciais ao bom julgamento estatístico, porque permitem focar as características importantes dos dados ou ter discernimento acerca do tipo de modelo que deveria ser usado na solução do problema em questão”.

Com o objetivo de levantar dados, para exemplificar a maioria das técnicas apresentadas, no dia 21/03/2005, um questionário (vide anexo I) foi aplicado aos alunos do 2º ano do curso de Estatística da Universidade Estadual de Maringá (UEM) matriculados na disciplina Inferência Estatística. As variáveis que compõem o questionário são:

Sexo: com categorias (1) se masculino e (2) se feminino Id: idade em anos Altura: altura em metros e centímetros Peso: peso em quilos Est.Civil: estado civil com categorias (1) se solteiro, (2) se casado e (3) se separado Nºir.: número de irmãos Transp.: meio de transporte mais utilizado com categorias (1) de coletivo e (2) se próprio Procedência: município de procedência com categorias (1) se Maringá, (2) se outro município do Paraná e (3) se de outro Estado

Trabalho: relação do trabalho com o curso com categorias (1) não trabalho, (2) completamente relacionado, (3) parcialmente relacionado e (4) não relacionado

Inform: meio de informação mais utilizado com categorias (1) se TV, (2) jornal, (3) rádio, (4) revista e (5) internet

Disc.: número de disciplinas reprovadas no 1º ano da UEM. Para se trabalhar estes dados são necessários, em primeiro lugar, tabulá-los e apresentá-

Projeto de Ensino Aprender Fazendo Estatística

Drª Terezinha Aparecida GuedesMsc. Ana Beatriz Tozzo Martins,
Msc. Clédina Regina Lonardan AcorsiMsc. Vanderly Janeiro 5

los na forma em que foram coletados (dados brutos) como na Tabela 01. Em geral, a 1ª coluna da tabela deve conter a identificação do respondente.

Tabela 01 - Informações sobre sexo, idade (anos), altura (metro e centímetro), peso (kg), estado civil, número de irmãos, transporte, procedência, relação do trabalho com o curso de Estatística, meio de informação e número de disciplinas reprovadas dos alunos da disciplina Inferência Estatística do curso de Estatística da UEM - 21/03/2005.

Nº Sexo Id AlturaPeso Est.CivilNºir. Transp. ProcedênciaTrabalho InformDisc.

1 F 20 1,60 58 Solteiro 1 Próprio Maringá Não Rel. TV 2 2 F 26 1,65 59 Solteiro 2 ColetivoFora do Pr Não trab. Revista0 3 F 18 1,64 5 Solteiro 2 Próprio Maringá Não trab. TV 0 4 F 25 1,73 60 Solteiro 2 ColetivoOutro no PrNão Rel. TV 2 5 M 35 1,76 83 Casado 6 ColetivoOutro no PrNão Rel. TV 2 6 F 20 1,62 58 Solteiro 2 ColetivoOutro no PrNão Rel. Rádio 5 7 F 29 1,72 70 Solteiro 3 ColetivoMaringá Não trab. TV 0 8 M 23 1,71 62 Separado2 Próprio Outro no PrNão Rel. Internet2 9 F 20 1,63 63 Solteiro 2 Próprio Maringá Não trab. TV 1 10 M 20 1,79 75 Solteiro 2 Próprio Fora do Pr Não trab. Internet2 1 M 20 1,82 6 Solteiro 1 Próprio Fora do Pr Não trab. TV 2 12 F 30 1,68 46 Solteiro 3 Próprio Outro no PrParc.Rel. TV 4 13 F 18 1,69 64 Solteiro 1 Próprio Maringá Parc.Rel. TV 0 14 M 37 1,82 80 Casado 2 Próprio Maringá Não Rel. TV 3 15 M 25 1,83 62 Solteiro 1 Próprio Outro no PrNão Rel. TV 2 16 F 20 1,63 68 Solteiro 2 ColetivoMaringá Não trab. TV 2 17 M 21 1,71 80 Solteiro 2 ColetivoMaringá Não Rel. Internet0 18 M 25 1,80 82 Casado 1 Próprio Outro no PrNão Rel. Internet3 19 F 24 1,62 5 Solteiro 2 Próprio Maringá Não trab. Jornal 2 20 M 19 1,74 58 Solteiro 2 Próprio Maringá Com.Rel. TV 3 21 F 21 1,5 65 Solteiro 1 Próprio Maringá Não trab. TV 1

2 M 2 1,73 62 Solteiro 0 Próprio Maringá Não trab. Jornal 4 Fonte: Departamento de Estatística (DES)/UEM.

De acordo com Magalhães (2000), pode-se observar que a Tabela 01, tabela de dados brutos, contém muita informação, porém pode não ser muito rápido e prático obter estas informações. Por exemplo, não é imediato afirmar que existem mais homens que mulheres. Neste sentido, pode-se construir outra tabela para cada uma das variáveis que resumirá as informações ali contidas.

Segundo o mesmo autor, observa-se também que, ao usar programas computacionais e para facilitar/agilizar a digitação do banco de dados, às variáveis qualitativas associam-se valores numéricos e nem por isso a variável deixa de ser qualitativa. Cabe ao bom senso lembrar da natureza da variável.

Projeto de Ensino Aprender Fazendo Estatística

Drª Terezinha Aparecida GuedesMsc. Ana Beatriz Tozzo Martins,
Msc. Clédina Regina Lonardan AcorsiMsc. Vanderly Janeiro 6

Embora um certo volume de informação seja perdido quando os dados são resumidos, um grande volume pode também ser ganho. “Uma tabela talvez seja o meio mais simples de se resumir um conjunto de observações” (Pagano, 2004, p.10). “Deve ser usada quando é importante a apresentação dos valores” (Medronho, 2003, p.227), e sua leitura depende de quem a lê.

Todas as variáveis podem ser resumidas através de uma tabela, mas a construção é diferenciada dependendo do tipo de variável.

Denomina-se Tabela Simples à tabela que resume os dados de uma única variável qualitativa e Distribuição de Freqüências ao resumo de uma única variável quantitativa.

2.1 ELEMENTOS DA TABELA

Toda tabela deve ser simples, clara, objetiva e auto-explicativa. Segundo Milone (2004, p.25), os elementos fundamentais da tabela são: título, cabeçalho, coluna indicadora e corpo. O título aponta o fenômeno, época e local de ocorrência; o cabeçalho explica o conteúdo das colunas; a coluna indicadora detalha as linhas; o corpo mostra os dados. Complementarmente, tem-se: fonte, notas e chamadas. A fonte cita o informante (caracterizando a confiabilidade dos dados); as notas esclarecem o conteúdo e indicam a metodologia adotada na obtenção ou elaboração da informação; as chamadas clarificam pontos específicos da tabela.

A disposição de uma tabela pode ser generalizada como mostra a Figura 01 a seguir.

Tabela rs – Título respondendo as perguntas: o quê, onde e quando? Coluna indicadora Cabeçalho

(Parte 1 de 10)

Comentários