Estatistica aula I

Estatistica aula I

(Parte 2 de 3)

População

Amostra Tratamento de dados

Inferência

7 Apontamentos de Aula - Probabilidade e Estatística - Prof. Rubens A Requena

Diante da população de interesse, uma ou mais amostras são coletada e os dados são analisados descritivamente. Se o objetivo for estender o resultado para toda a população devemos utilizar técnicas de inferência adequadas.

Organização dos dados

Considere um conjunto de dados, onde devemos extrair informações a respeito de uma ou mais características.

Basicamente, definimos as variáveis de interesse e obtemos os dados brutos. O próximo passo é resumir os dados em tabelas de freqüências e gráficos e descrever sobre o comportamento desses dados.

Com o objetivo de investigar a ocorrência de acidentes de trabalho em um canteiro de obras um pesquisador selecionou aleatoriamente 20 trabalhadores envolvidos em acidentes para um estudo. As variáveis selecionadas para estudo são:

Idade (I): (em anos) Escolaridade (Ec): Fundamental (F), Médio (M), Superior (S) Sexo: M (masculino), F (feminino) Estado civil: Solteiro (S), Casado(C), Divorciado (D). Renda: (em salários mínimos) T.Trabalho: (em anos) H.Trabalho até a ocorrência do acidente: (em horas inteiras)

Cada uma das características apontadas é chamada de variável.

O conjunto de informações obtidas após a tabulação dos dados é denominado tabela de dados brutos. Note que as variáveis podem assumir valores numéricos ou não. Podemos então classificar essas variáveis em:

Nominal - ex.: sexo (masculino ou feminino (não tem uma ordem natural) Ordinal - ex: escolaridade (fundamental, médio, superior) (ordem natural)

Discreta: ex.: horas de trabalho (valores inteiros) Contínua: ex.: renda (assumem valores em intervalos reais)

A tabela de dados brutos (Tabela 1), mostra revela algumas informações a respeito da amostra selecionada

Qualitativas (valores não numéricos)

Quantitativas (valores numéricos)

8 Apontamentos de Aula - Probabilidade e Estatística - Prof. Rubens A Requena

Tabela 1: Dados Brutos Idade Escolaridade Sexo E.Civil Renda T.Trabalho H.Trabalho

Note que torna-se difícil uma análise da tabela de dados brutos e para facilitar o estudo resumimos as informações em tabelas de freqüências.

Tabela 2: Variável Escolaridade i Escolaridade ni fr

Para as variáveis quantitativas em geral, pode ser relevante a inclusão de uma nova coluna contendo a freqüência acumulada (fac). Este valor pode ser obtido pela soma de todos os valores menores ou iguais ao valor considerado. A freqüência acumulada pode ajudar a eliminar valores não expressivos da variável.

9 Apontamentos de Aula - Probabilidade e Estatística - Prof. Rubens A Requena

Tabela 3: Variável Tempo de trabalho i T.Trabalho ni fr fac

A variável renda é classificada como quantitativa contínua e assim, teoricamente, pode assumir qualquer valor real em determinado intervalo. A tabela de dados brutos mostra que os valores variam entre 1,4 e 5,2 salários e para organizá-la vamos dividi-la em intervalos menores.

O numero de intervalos, em geral, variam de 5 a 8 faixas. Embora adotamos a mesma amplitude de classe, em alguns casos podem ser convenientes amplitudes desiguais. A tabela 4 mostra a tabela de freqüência para a variável renda.

Tabela 4: Variável Renda

1 1,02,0 1 0,5 0,5
2 2,03,0 4 0,2 0,75
3 3,04,0 2 0,1 0,85
4 4,05,0 1 0,05 0,9
5 5,06,0 2 0,1 1

i Renda ni fr fac - Total N=20 1 -

liLi
ex.: da classe 1 temos: 1,02,0 (li = 1,0 e Li = 2,0)

Da tabela 4 podemos observar as seguintes informações: li = limite inferior da classe Li = limite superior da classe Menor renda observada - Mínimo = 1,4 Maior renda observada - Máximo = 5,2 Amplitude total – AT = 5,2 – 1,4 = 3,8 Amplitude de classe - AC = Li – li. Todas as cinco classes da variável renda em estudo têm amplitude de classe AC = 1,0

Uma análise das tabelas de freqüências mostra que 60% dos acidentados possuem nível de escolaridade fundamental, 60% têm até 2 anos de trabalho na função e 5% têm renda entre 1,0 e 2,0

10 Apontamentos de Aula - Probabilidade e salários mínimos. Com base no estudo das variáveis apresentadas é possível propor estratégias para redução dos acidentes como cursos de formação ou outras

Obs.: A organização dos dados em tabelas consiste em ordenar os dados em linhas e colunas. As normas de apresentação são editadas pela Fundação Brasileira de Geografia e Estatística (IBGE) e obedece à Resolução no 886, de 26 de outubro de 1966, do Conselho Nacional de Estatística..

A organização dos dados em tabelas de freqüência proporciona uma forma eficaz na análise preliminar dos dados, porém os dados contidos nestas tabelas podem ser melhores visualizadas graficamente. Os meios de comunicação apresentação de dados. Com o desenvolvimento de softwares específicos é possível a construção de uma infinidade de formas gráficas para a representação dos dados. É preciso, no entanto certo cui recursos visuais, pois um gráfico desproporcional pode levar a erros de interpretação dos dados. Vamos discutir três tipos básicos de gráficos: barras, setores e histograma.

O gráfico de barras utiliza o plano cartesiano com valores da variá freqüências ou porcentagens no eixo das ordenadas. Este tipo de gráfico se adapta melhor às variáveis discretas ou qualitativas ordinais. Na figura 1 temos o gráfico de barras para a variável escolaridade.

O gráfico de setores, ou pizza, se adapta bem às variáveis qualitativas nominais. As dimensões das fatias podem ser calculadas multiplicando circunferência). A figura 2 mostra a representação gráfica da variável sexo em estudo.

Figura 2 – Gráfico de setores para variável sexo.

F ni

Escolaridade

Figura 1 – Gráfico de barras para variável escolaridade e Estatística - Prof. Rubens A Requena salários mínimos. Com base no estudo das variáveis apresentadas é possível propor estratégias para redução dos acidentes como cursos de formação ou outras ações.

Obs.: A organização dos dados em tabelas consiste em ordenar os dados em linhas e colunas. As normas de apresentação são editadas pela Fundação Brasileira de Geografia e Estatística (IBGE) e obedece à Resolução o Conselho Nacional de Estatística..

A organização dos dados em tabelas de freqüência proporciona uma forma eficaz na análise dos dados, porém os dados contidos nestas tabelas podem ser melhores visualizadas graficamente. Os meios de comunicação, órgãos públicos e empresas utilizam esse meio como forma de apresentação de dados. Com o desenvolvimento de softwares específicos é possível a construção de uma infinidade de formas gráficas para a representação dos dados. É preciso, no entanto certo cui recursos visuais, pois um gráfico desproporcional pode levar a erros de interpretação dos dados. Vamos discutir três tipos básicos de gráficos: barras, setores e histograma.

O gráfico de barras utiliza o plano cartesiano com valores da variável nos eixos das abscissas e as freqüências ou porcentagens no eixo das ordenadas. Este tipo de gráfico se adapta melhor às variáveis discretas ou qualitativas ordinais. Na figura 1 temos o gráfico de barras para a variável escolaridade.

O gráfico de setores, ou pizza, se adapta bem às variáveis qualitativas nominais. As dimensões das fatias podem ser calculadas multiplicando-se a freqüência relativa (fi) por 360 (uma volta inteira da circunferência). A figura 2 mostra a representação gráfica da variável sexo em estudo.

setores para variável sexo.

M S Grau de Escolaridade

Escolaridade

Tamanho do setor

Sexo ni fi Graus M 13 0,65 234o

Gráfico de barras para variável escolaridade salários mínimos. Com base no estudo das variáveis apresentadas é possível propor estratégias para redução

Obs.: A organização dos dados em tabelas consiste em ordenar os dados em linhas e colunas. As normas de apresentação são editadas pela Fundação Brasileira de Geografia e Estatística (IBGE) e obedece à Resolução

(Parte 2 de 3)

Comentários