E s t a t i s t i c a d e s c r i t i V a

E s t a t i s t i c a d e s c r i t i V a

(Parte 6 de 10)

2. Determinação da Moda para Valores Tabulados.

No caso de dados tabelados não agrupados em classe, a determinação da moda é imediata, bastando para isso, consultar a tabela, localizando o valor que apresenta a maior frequência.

Exemplo:

Tabela 7: Indivíduos segundo o tipo sanguíneo. Tipo de Sangue Frequência

O 417 A 292 B 94 AB 17 TOTAL 820 Fonte: (dados hipotéticos)

Os dados apresentados mostram que na amostra o sangue tipo O ocorreu com maior frequência. Então, para esta amostra, a moda é sangue do tipo O.

Tratando-se de uma tabela de frequências com valores tabulados e agrupados em classes, o procedimento não é imediato, sendo disponíveis alguns métodos de cálculo distintos. Qualquer que seja o método adotado, o primeiro passo para determinar a moda é localizar a classe que apresenta a maior frequência, comumente chamada de classe modal.

Nesse curso definiremos apenas o método da moda bruta, que consiste em tomar o ponto médio da classe modal como sendo a moda. A classe modal será aquela que apresentar a maior frequência absoluta simples. Exemplo:

Tabela 8: Notas da 1a Avaliação dos Alunos de Estatística IV da UFBA. 1996.1

TOTAL 2

Para este exemplo temos que a terceira classe é a classe modal (fi =7 )e a moda bruta será seu ponto médio:

Mo =5 . Interpretação: A nota mais frequente na 1aavaliação foi 5,0.

2.6 SEPARATRIZES

São as medidas que separam o rol ou a distribuição de frequências em partes iguais. Vimos que a mediana divide a distribuição em duas partes iguais quanto ao número de elementos de cada parte. Agora vamos estudar outras medidas que dividem a distribuição em partes iguais, que serão as chamadas separatrizes. São elas:

2.6.1 Quartis (Qi): Os quartis dividem um conjunto de dados em quatro partes iguais. Assim:

Q1: 1o quartil. Deixa 25% dose lementos antesd o seu valor Q2: 2o quartil. Deixa 50% dos elementos antes do seu valor. Coincide com a mediana

Q3: 3o quartil. Deixa 75% dose lementos antesd o seu valor. Genericamente, para determinar a ordem ou posição do quartil a ser calculado, usaremos a seguinte expressão:

onde: i= número do quartil a ser calculado n= número de observações.

Para dados agrupados em classes, encontraremos os quartis de maneira semelhante à usada para o cálculo da mediana:

onde, l = limite inferior da classe que contém o quartil desejado h = amplitude do intervalo de classe

EQi = elemento quartílico Fant = frequência acumulada até a classe anterior à classe mediana f Qi = frequência absoluta simples da classe quartílica.

2.6.2 Decis(Di): Os decis dividem um conjunto de dados em dez partes iguais. Assim:

De maneira geral, para calcular os decis, recorreremos à expressão que define a ordem em que o decil se encontra:

Para dados agrupados em classes, encontraremos os decis de maneira semelhante à usada para cálculo da mediana e dos quartis.

2.6.3 Percentis ou Centis (Ci): São as medidas que dividem a amostra em 100 partes iguais. Assim:

0%1% 2% 3% 50% 97% 98% 9%100% O elemento que definirá a ordem do centil será encontrado pelo emprego da expressão:

onde: i =n úmeroi dentificador do centil n = número total de observações Para dados agrupados em classes, encontraremos os centis de maneira semelhante à utilizada para cálculo da mediana, dos quartis e dos decis.

Exemplo: Com base na tabela de distribuição de frequências abaixo encontre: a) Primeiro quartil ; b) Septuagésimo quinto centil ; c) Nono decil

Resolução:

a) Q1 Encontrar a posição do primeiro quartil:

Tabela 9: Consumo médio de eletricidade (kw/hora) entre usuários. Rio de Janeiro. 1980.

TOTAL 80

EQ1 = n4 = 804 =2 0 O Q1 está localizado na 20aposição, logo encontra-se na 3aclasse. Com base nesses dados, calcularemos

Q1 da seguinte forma:

somem mais de 59,59 kwh.

b) C75 Encontrar a posição do centil 75:

O C75 está localizado na 60aposição, logo encontra-se na 5aclasse. Com base nesses dados, calcularemos

C75 da seguinte forma:

somem mais de 9,29 kwh.

c) D9 Encontrar a posição do 9odecil:

ED9 =9 n10 =9 (80)10 =7 2 O D9 está localizado na 72aposição, logo encontra-se na 6aclasse. Com base nesses dados, calcularemos

D9 da seguinte forma:

D9 = 105 + 20[72−64]8 =1 25 Interpretação: 90% dos usuários consomem até 125 kwh. De maneira análoga, 10% dos usuários consomem mais de 125 kwh.

2.7 MEDIDAS DE DISPERSÃO

Para avaliar o grau de variabilidade ou dispersão dos valores de um conjunto de números, lançaremos mão das estatísticas denominadas medidas de dispersão. Essas nos proporcionarão um conhecimento mais completo do fenômeno a ser analisado, permitindo estabelecer comparações entre fenômenos da mesma natureza e mostrando até que ponto os valores se distribuem acima ou abaixo da medida de tendência central.

2.7.1 TIPOS DE MEDIDAS DE DISPERSÃO 1. Amplitude Total ou Intervalo Total (A) =>É a diferença entre os valores extremos da série.

A amplitude nos dá a idéia do campo de variação dos valores da série. No entanto, devemos frisar que a amplitude não é uma boa medida de dispersão porque seu cálculo se baseia apenas nos valores extremos da amostra e não em todos os dados.

2. Desvio-Padrão (S) => É a medida de dispersão mais usada e mais importante. Mede a concentração dos dados em torno da média. É dado pela soma dos quadrados dos desvios dividido pelo número total de observações.

(a) Desvio-padrão de dados brutos:

S = s nP

Tabela 10: Cálculo do Desvio Padrão.

TOTALP

(b) Desvio-padrão de dados tabulados:

(Parte 6 de 10)

Comentários