Livro - Estatística aplicada

Livro - Estatística aplicada

(Parte 4 de 4)

Exemplo 2.4: Em um determinado mês, foi computado o número de faltas ao trabalho, por motivos de saúde, que cada funcionário de uma determinada empresa teve. Os dados estão apresentados na tabela abaixo: Tabela 2.4 – Número de faltas ao trabalho, por motivos de saúde.

Encontre a média aritmética, a mediana e a moda para este conjunto de dados e interprete os resultados. Resolução:

Média Aritmética i i i k

i i x f x f ou seja, nesta empresa ocorreram, em média, 0,84 faltas por funcionário, por motivo de saúde.

Estatística Aplicada

Quando os dados estiverem dispostos numa distribuição de frequências, o cálculo da média aritmética pode ser feito acrescentando uma coluna na distribuição de frequências. Esta coluna é denominada xi x fi e é obtida multiplicando cada valor da variável (xi ) pela sua respectiva frequência (fi ). A média aritmética é obtida dividindo a soma dos valores desta colu- na pela soma dos valores da coluna da frequência.

Mediana Como os dados estão tabelados, eles já se encontram ordenados. Para ficar mais fácil encontrar o valor da mediana, vamos incluir na distribuição de frequências uma coluna com as frequências acumuladas.

Número de faltasffa 0

Para encontrar o valor da mediana, seguimos os seguintes passos:

1º Passo: identificaremos a frequência acumulada imediatamente superior à metade do somatório das frequências absolutas:

2º Passo: a mediana será o valor da variável associado à frequência acumulada imediatamente superior ao valor encontrado no 1º Passo.

Então, a frequência acumulada imediatamente superior a 31,5 é fa = 51

Portanto, o valor da mediana é o valor da variável associado à fa = 51, ou seja,

Md = 1 falta

Neste conjunto de dados, pelo menos 50% das observações são maiores ou iguais a 1 falta.

Distribuição de Frequências e Medidas de Posição Central. – Capítulo 2

As medidas resumo calculadas quando os dados estiverem agrupados em intervalos de classes são apenas aproximações dos verdadeiros valores, pois substituímos os valores das observações pelo ponto do médio do intervalo de classe.

Moda A resposta que aparece com maior frequência neste conjunto de dados é o 0 (com frequência 31), ou seja, é mais frequente encontrar funcionários que não faltam.

No caso do exemplo 2.5 veremos que os dados estão agrupados em intervalos de classes. Quando o conjunto de dados for apresentado sob a forma agrupada perdemos a informação dos valores das observações. Neste caso, vamos supor que todos os valores dentro de uma classe tenham seus valores iguais ao ponto médio desta classe.

Os cálculos da média, da moda e da mediana para distribuição de frequências agrupadas em classes estão apresentados a seguir.

Vale ressaltar que, sempre que possível, as medidas de posição e dispersão devem ser calculadas antes dos dados serem agrupados.

Exemplo 2.5: A tabela abaixo apresenta a distribuição de frequências do tempo de vida de 60 componentes eletrônicos (medido em dias) submetidos à experimentação num laboratório especializado. Calcular as medidas de posição.

No caso do valor

12 ser exatamente igual a uma das frequências acumu ladas fa, o cálculo da mediana será a média aritmética entre dois valores da variável: xi e xi + 1.

O valor da variável xi será aquele cujo ffi i

12 e o valor da variável xi + 1 sera aquele que está imediatamente após xi na distribuição de frequência.

Estatística Aplicada

Tabela 2.5 – Tempo de vida de componentes eletrônicos.

Tempo de vida (dias)fPonto Médio (xi) 3├18

Resolução: Neste tipo de tabela, como temos classes de frequências, devemos encontrar um valor que represente cada classe, para que possamos efetuar os cálculos. Por exemplo, considerando a primeira classe de frequência,

sabemos que 3 componentes eletrônicos tiveram tempo de vida entre 3 e 18 dias, porém, não sabemos exatamente qual foi o tempo de vida de cada um. Se considerarmos o limite inferior da classe (3) para efetuarmos os cálculos estaremos subestimando as estimativas. Por outro lado, se considerarmos o limite superior da classe (18) estaremos superestimando as estimativas. Portanto, vamos utilizar o ponto médio de cada classe para podermos fazer os cálculos sem grandes prejuízos. A terceira coluna da tabela acima contém os pontos médios calculados para cada intervalo de classe. O valor do ponto médio passa a ser o nosso valor xi a ser utilizado nos cálculos. Vamos aprender como se faz:

Distribuição de Frequências e Medidas de Posição Central. – Capítulo 2 Média Aritmética x x f i i i i i

Podemos dizer, através da média aritmética, que os componentes eletrônicos têm uma duração média de 69 dias e 6 horas (69,25 dias).

Mediana Como os dados estão tabelados em classes de frequências, calculamos a mediana através da seguinte fórmula:

M X h X F

Fe e onde

Xe o limite inferior da classe que contém a mediana; Xm: metade do valor da frequência total;

Fiaa: frequência acumulada da classe anterior à classe que contém a mediana;

Fi: número de observações na classe que contém a mediana; h: amplitude da classe que contém a mediana.

No cálculo da mediana para os dados da tabela 2.5 temos que primeiramente encontrar a classe que contém a mediana. Esta classe corresponde à classe associada à frequência acumulada imediatamente superior

30, temos que a classe que contém a mediana é de 78├93 (pois fa = 57).

Estatística Aplicada

Tempo de vidaffa

Total 115,5

P. M xi

Classe que contém a mediana fa da classe anterior a classe que contém a Md.

Nº de observações da classe que contém a mediana

∑ fi

Além disso, temos:

Xe 78; Xm: 30; Fiaa: 29;

Fi: 28; h: 15

Agora, basta substituirmos todos os valores encontrados na fórmula 2.6 e encontramos o valor da mediana:

Através da mediana podemos dizer que pelo menos 50% dos componentes eletrônicos avaliados têm duração igual ou inferior a 78 dias e 12 horas.

Para calcularmos a moda para distribuições de frequências com intervalos de classes, utilizaremos a seguinte fórmula:

Mo X h F F

2F - F Fo m a m a p

Distribuição de Frequências e Medidas de Posição Central. – Capítulo 2 onde

Xo o limite inferior da classe que contém a moda; Fm: frequência máxima; Fa: frequência anterior à frequência máxima;

Fp: frequência posterior à frequência máxima; h: amplitude da classe que contém a moda.

No cálculo da moda para os dados da Tabela 2.5 temos que primeiramente encontrar a classe que contém a moda. Esta classe corresponde à classe que possui a frequência máxima. Então, a classe que contém a moda é de 78├93 (pois f = 28).

Além disso, temos:

Xo 78; Fm: 28; Fa: 10;

Fp: 2; h: 15.

Agora, basta substituirmos todos os valores encontrados na fórmula 2.7 e encontramos o valor da moda:

Portanto, é comum encontrar componentes eletrônicos que durem, aproximadamente, 84 dias e 2 horas.

Atividades

01. Abaixo temos as idades dos funcionários de uma determinada empresa. Construir uma distribuição de frequências, agrupando os dados em classes.

Conexão:

Sugerimos os vídeos:

“Novo Telecurso – E. Fundamental – Matemática – Aula 34 (parte 1)” e “Novo Telecurso – E. Fundamental –

Matemática – Aula 34 (parte 2)” disponíveis, respectimante em <http://w.youtube.com/ watch?v=SyWbYOtAIYc&NR=1> e <http:// w.youtube.com/watch?v=ejMyWfuSO5k>. que apresenta de modo bem prático a utilização das medidas de posição.

Estatística Aplicada

OBS.: A tabela de distribuição de frequências deve ser completa com f, fr e fa. Idades (dados brutos)

Baseado na distribuição de frequências construída, responda: a) Quantos são os funcionários com idade inferior a 3 anos? b) Que porcentagem de funcionários tem idade igual ou superior a 47 anos? c) Quantos são os funcionários com idade maior ou igual a 26 anos e não tenham mais que 40 anos? d) Qual a porcentagem de funcionários com idade abaixo de 40 anos? e) Qual a porcentagem de funcionários que têm no mínimo 40 anos?

02. Um consultor estava interessado em saber quanto, geralmente, cada pessoa gastava em um determinado supermercado no primeiro sábado após receberem seus pagamentos (salários). Para isso ele entrevistou 50 clientes que passaram pelos caixas entre 13h e 18h, e anotou os valores gastos por cada um deles. Estes valores estão listados abaixo:

Distribuição de Frequências e Medidas de Posição Central. – Capítulo 2

Analisando o conjunto de dados, responda os seguintes itens: a) Qual é a variável em estudo? Classifique-a.

b) Construa uma tabela de frequências a partir do conjunto de dados brutos.

03. Os dados abaixo referem-se ao número de horas extras de trabalho que uma amostra de 64 funcionários de uma determinada empresa localizada na capital paulista.

Pede-se: a) Calcule e interprete as seguintes medidas descritivas calculadas para os dados brutos (dados não tabulados): média aritmética; mediana; moda.

b) Construir uma distribuição de frequências completa (com freq. absoluta, freq. relativa, freq. acumulada e ponto médio).

c) Com a tabela construída no item b), encontre as seguintes medidas: média aritmética, mediana, moda. Interprete os resultados.

Estatística Aplicada

04. Os dados abaixo representam as vendas mensais (em milhões de reais) de vendedores de gênero alimentícios de uma determinada empresa.

Vendas mensais (em milhões de reais) Número de vendedores 0 |– 1

1 |– 2 2 |– 3 3 |– 4 4 |– 5 5 |– 6

a) Qual a variável em estudo? Que tipo de variável é esta? b) Encontre a média, mediana e moda e interprete os resultados.

c) Qual a porcentagem de vendedores com vendas mensais inferior a 2 milhões de reais? d) Qual a porcentagem de vendedores com vendas mensais superior a 4 milhões de reais? e) Qual a porcentagem de vendedores com vendas mensais entre 3 (inclusive) e 5 (exclusive) milhões de reais? f) Qual a porcentagem de vendedores que vendem, pelo menos, 3 milhões de reais mensais?

Distribuição de Frequências e Medidas de Posição Central. – Capítulo 2

05. Numa pesquisa realizada com 91 famílias, levantaram-se as seguintes informações com relação ao número de filhos por família:

Calcule e interprete os resultados da: a) média aritmética b) mediana c) moda

06. Define-se a média aritmética de n números dados como o resultado da divisão por n da soma dos n números dados. Sabe-se que 4,2 é a média aritmética de 2.7; 3.6; 6.2; e x. Determine o valor de x.

Leitura recomendada

Recomendamos a leitura do texto “Como analisar de forma simples um grande número de dados?”, disponível no endereço: <http://w. klick.com.br/conteudo/pagina/0,6313,POR-1453--1453,0.html>, que aborda de maneira clara alguns procedimentos que podem ser utilizados quando nos deparamos com situações em que precisamos resumir as informações de grandes conjuntos de dados.

Referências

ANDERSON, David R.; SWEENEY, Denis J.; WILLIAMS, Thomas A. Estatística aplicada à administração e economia. São Paulo: Pioneira Thomson Learning, 2003.

BUSSAB, Wilton de O.; MORETTIN, Pedro A.. Estatística básica. São Paulo: Saraiva, 2003.

COSTA NETO, Pedro Luiz de Oliveira. Estatística, São Paulo: Edgard Blucher, 2002.

Estatística Aplicada

DOWNING, Douglas; CLARK, Jeffrey. Estatística aplicada. São Paulo: Saraiva, 2002.

FARIAS, Alfredo Alves de; SOARES, José Francisco; CÉSAR, Cibele Comini. Introdução à estatística. Rio de Janeiro: LTC, 2003.

TRIOLA, Mario F.. Introdução à estatística. Rio de Janeiro: LTC, 1999.

VIEIRA, Sonia. Elementos de estatística. São Paulo: Atlas, 2003.

No próximo capCtuCo

Se até agora vimos como organizar os dados (informações) em distribuições de frequências e como resumir as informações numéricas em medidas de posição central, iremos incrementar esse processo através da inserção de medidas de ordenamento e dispersão. As medidas de ordenamento nos fornecem uma ideia sobre a distribuição dos dados ordenados e apresentam a vantagem de não serem afetadas pela forma da distribuição dos dados ou por valores discrepantes. Para que tenhamos informações mais completas do conjunto de dados, é necessário estudar a sua variabilidade. As estatísticas que têm essa função são denominadas medidas de variabilidade ou de dispersão. Finalizaremos o capítulo apresentando vários tipos de gráficos que representam de maneira adequada as informações contidas em um conjunto de dados.

CapCtuCo 3

Medidas de Ordenamento e Forma, Medidas de

Dispersão e Gráficos

Nesse terceiro capítulo estudaremos, primeiramente, as medidas de ordenamento, que são usadas para comparação de valores dentro do conjunto de dados. Estas medidas apresentam a vantagem de não serem afetadas pela presença de valores extremos no conjunto de dados. Estudaremos, também, as medidas de dispersão, que servem para indicar o quanto os dados se apresentam dispersos em torno da região central. Fornecem, portanto, o grau de variação existente no conjunto de dados. Dois ou mais conjuntos de dados podem, por exemplo, ter a mesma média, porém, os valores poderão estar muito mais dispersos num conjunto do que no outro. Ou seja, podem ter maior ou menor grau de homogeneidade. E, para finalizar, apresentaremos os principais tipos de gráficos utilizados para representar a distribuição de uma variável.

Objetivos da sua aprendizagem Calcular e interpretar as medidas de ordenamento e de dispersão; Saber escolher representações gráficas mais apropriadas para variáveis qualitativas e quantitativas.

será que as notas das duas turmas foram iguais?

Você se lembra? Você se lembra de, após ter feito uma prova bimestral, algum professor ter informado que o desempenho médio da turma ficou em torno de 7,2? Para efeito de comparação, ele também pode ter calculado a média de outra turma, e verificado que o desempenho médio também ficou em torno de 7,2. Surgem os seguintes questionamentos: • será que as notas das turmas estão próximas da média ou dispersas?

Utilizaremos os conceitos deste capítulo para responder a estas perguntas.

Estatística Aplicada

Perceba que o 2º quartil, o 5º decil e o 50º percentil representam a própria mediana, ou seja, todas estas medidas

madamente 50% dos dados abaixo delas e 50% acima.

3.C Medidas de ordenamento

Os quartis, decis e percentis são muito similares à mediana, uma vez que também subdividem a distribuição de dados de acordo com a proporção das frequências observadas. Já vimos que a mediana divide a distribuição em duas partes iguais, então, os quartis (Q1, Q2 e Q3), como o próprio nome sugere, divide a distribuição dos dados ordenados em quatro partes, sendo, Q1 o quartil que separa os 25% valores inferiores dos 75% superiores, Q2 o que divide o conjunto ao meio (é igual à mediana) e Q3 o que separa os 75% valores inferiores dos 25% superiores. Não há um consenso universal sobre um procedimento único para o cálculo dos quartis, e diferentes programas de computador muitas vezes produzem resultados diferentes.

Os decis, por sua vez, dividem a distribuição dos dados em

10 partes (Di, i = 1, 2,, 9) e os

percentis dividem a distribuição em

100 partes (Pi = 1, 2,, 9).

As medidas separatrizes, geralmente, só são calculadas para grandes quantidades de dados.

No Excel, por exemplo, temos a opção de pedir o cálculo de tais medidas.

Com os cálculos dos quartis, juntamente com os valores mínimo e máximo do conjunto de dados, podemos construir um gráfico chamado desenho esquemático ou boxplot. A análise deste gráfico é bastante útil no sentido de informar, entre outras coisas, a variabilidade e a simetria dos dados.

Conexão:

Para se entender quais são os procedimentos utilizados na construção de um boxplot, bem como sua interpretação, leia o texto: “Diagramas de Caixa (Boxplots)” em: TRIOLA, Mario F. Introdução à estatística. 10.ed. Rio de Janeiro: LTC, 2008. p. 98 a 102.

(Parte 4 de 4)

Comentários