Matemática-Noções de Estatística

Matemática-Noções de Estatística

ELIETY T.S.CAMARGO

ELCIMERY

TERESA CRISTINA PIMENTEL

ALUNAS DO CURSO DE PÓS GRADUAÇÃO DE MATEMÁTICA DA UCB

NOÇÕES DE ESTATÍSTICA

MEDIDAS DE DISPERSÃO

Trabalho do curso de Pós Graduação em Matemática da Universidade Castelo Branco para o módulo de Análise de Dados e Probabilidade, sob orientação dos profs. Vicente e Leandro.

Rio de Janeiro, Ago. 2009.

NOÇÕES DE ESTATÍSTICA

1. Introdução

A palavra Estatística vem de status (estado em latim) e, na antigüidade, referiam-se as informações sobre terras, proprietários, uso da terra, empregados, animais, e etc., ou seja, o registro de número de habitantes e riquezas individuais, servindo aos interesses do Estado (base para o cálculo de impostos). No início do século XVIII, a palavra estatística foi cunhada pelo alemão Gottfried Achenwal, que definiu o objeto material e formal da Estatística e, por essa razão, foi denominado o “pai da Estatística”.

2. O que é Estatística?

Durante um telejornal, o repórter divulgou uma pesquisa segundo a qual apenas 5% dos brasileiros têm o hábito de ler jornal diariamente.

Você já pensou em como são feitas pesquisas como essa? Como é possível entrevistar toda a população brasileira para se saber a porcentagem de leitores de jornal?

Veremos, neste breve estudo, que não é necessário entrevistar toda a população para se chegar a uma determinada conclusão sobre ela. Chegar a esse tipo de conclusão é objeto da estatística.

Como uma primeira idéia, podemos entender a Estatística como sendo um método de estudo de comportamentos coletivos cujas conclusões são traduzidas em resultados numéricos.

3. Medidas de Dispersão

São medidas obtidas de uma amostra de números que caracterizam um afastamento ou uma aproximação dos dados em torno da média.

Exemplo:

Às vésperas de uma partida decisiva, o técnico de uma equipe de basquetebol prepara a escalação da equipe e depara-se com a seguinte dúvida: escalar o jogador A ou o jogador B, sendo que ambos estão em boas condições físicas. Para decidir, estuda os últimos cinco jogos de que participou o jogador A e os últimos cinco jogos de que participou o jogador B e percebe que A e B tem a mesma média de pontos por jogo. A decisão do técnico pode ser tomada apenas com essa informação?

Veremos que tal informação não é suficiente para essa tomada de decisão, pois duas amostras de números x1, x2, x3, ... , xn e y1, y2, y3, ..., yn podem ter a mesma média aritmética e, no entanto, apresentar características muito diferentes.

As medidas de dispersão dividem- se em:

  • Amplitude Total ou Range de uma distribuição

  • Desvio Relativo

  • Desvio Médio Absoluto

  • Desvio Padrão

  • Variância

  • Coeficiente de variação

3.1- Amplitude Total ou Range

Podemos dizer que não é uma boa medida, pois, sendo apenas a diferença entre o maior e o menor valor observado, não dá a noção de quanto os valores intermediários estão afastados ou concentrados.

Exemplo:

Suponhamos duas distribuições, A e B:

A → 2; 3; 4; 13; 18 => RA = 18 – 2= 16

B → 2; 4; 7; 9; 18 => RB = 18 – 2 = 16

Ambas as distribuições tem a mesma amplitude total, mas em qual delas a dispersão é maior?

3.2- Desvio Relativo

Chama-se “desvio relativo de um elemento xi de uma amostra de números x1, x2, x3, ..., xn”o número:

Dr(xi )= xi – x,

onde x é a média aritmética dos números x1, x2 , x3, ..., xn.

Exemplo:

As idades das jogadoras do time de basquetebol de um determinado Colégio X são: 15; 16; 14; 17; 18. Dessa amostra, temos que:

  • A média aritmética (em anos) é x = 15+16+14+17+18 = 16;

5

  • O desvio relativo (em anos) do elemento 15 da amostra é Dr(15) = 15 – 16 = -1;

  • O desvio relativo (em anos) do elemento 18 da amostra é Dr(18) = 18 – 16 = 2;

  • O desvio relativo (em anos) do elemento 16 da amostra é Dr(16) = 16 – 16 = 0.

NOTA:

Observe que, se o desvio relativo de um elemento xi é:

  1. positivo, então xi está acima da média;

  2. negativo, então xi está abaixo da média;

  3. zero, então xi é igual a própria média.

3.3- Desvio Médio Absoluto

Chama-se “desvio médio absoluto (Dma) de uma amostra de números x1, x2, x3, ..., xn” a média aritmética entre os desvios absolutos de todos os seus elementos. Isto é:

Dma = ni=1 |xi - x|

n

Exemplo:

As idades das jogadoras de basquetebol de um determinado Colégio X são: 15; 16; 14; 17; 18. Dessa amostra temos:

x = 16 anos.

Pela fórmula do desvio médio absoluto, calculamos:

Dma=|15 -16| + |16 -16| + |14-16| + |17-16| + |18-16|

5

.: Dma = 1+0+2+1+2 = 1,2.

5

Logo, o desvio médio absoluto é 1,2 ano.

NOTA:

O desvio médio absoluto é a medida associada à amostra como um todo; quando no exemplo anterior dizemos que Dma = 1,2 ano, estamos afirmando que, em média, os elementos da amostra se afastam 1,2 ano da média aritmética para cima ou para baixo.

3.4- Desvio Padrão

Uma das medidas mais usadas para aferir a dispersão dos elementos de uma amostra de números em relação à média aritmética é o desvio padrão, simbolizado pela letra grega σ (sigma).

Chama-se “desvio padrão de uma amostra de números x1, x2, x3, ..., xn”o número σ dado por:

Σ = ni =1 (xi – x)2 ,

n

onde x é a média aritmética dos números x1, x2 , x3, ..., xn.

Exemplo:

As idades das jogadoras do time de basquetebol de um determinado Colégio X são: 15; 16; 14; 17; 18. Dessa amostra temos:

x = 16 anos e

σ = √(15-16)2+ (16-16)2+(14-16)2+(17-16)2+ (18-16)2

5

.: σ = √(-1)2+ 02 + (-2)2+ (1)2+ (2)2

5

.: σ ≈ 1,41 ano.

NOTA:

O desvio padrão, assim como o desvio médio absoluto, é uma medida associada à amostra como um todo, e não a cada elemento individualmente. O desvio padrão, assim como o desvio médio absoluto, mede o quanto os elementos estão próximos ou afastados da média.

3.5- Variância

Chama-se “variância de uma amostra de números x1, x2, x3, ..., xn”o quadrado do desvio padrão, isto é:

σ 2= √n i=1(xi – x)2

n

Exemplo:

Na amostra 184, 179, 190, 181, 178 das massas, em gramas, de cinco barras de chocolate, temos que:

x = 184+179+190+181+178 = 182,4

5

.: x = 182,4 g e

σ 2 = [(184 – 182,4)2 + (179 - 182,4)2 + (190 - 182,4)2 + (181-182,4)2 + (178 -182,4)2]/ 5

.: σ 2 = 2,56 +11,56+57,76+ 1,96 + 19,36 = 18,64

5

.: σ 2 =18,64g2.

NOTA:

A desvantagem em se usar a variância como medida de dispersão é que, se os elementos da amostra se apresentam numa unidade u (grama, g, por exemplo), a variância se apresenta na unidade u2, o que pode causar dificuldade de interpretação. No exemplo anterior como interpretar g2? Para contornar essa dificuldade, é mais conveniente, nesse caso, usarmos o desvio padrão, cuja unidade de medida é a mesma dos elementos da amostra.

3.6- Coeficiente de Variação

A última medida de dispersão que veremos é o Coeficiente de Variação (CV), que nada mais é do que o valor positivo da raiz quadrada da variância. Logo:

CV = √VR = σ2= σ

x2 x

Então, o CV também pode ser expresso como sendo o resultado da divisão do desvio padrão pela média.

NOTA:

Vemos que se trata igualmente de uma medida relativa de dispersão, útil para a comparação em termos relativos do grau de concentração em torno da média de séries distintas. Portanto, é uma medida que serve para avaliar a homogeneidade de séries estatísticas e pode ser expressa na forma unitária ou porcentual.

Exemplo:

Numa empresa o salário médio dos homens é de R$400,00 com desvio padrão de R$ 150,00, enquanto a média salarial das mulheres é R$300,00 com desvio padrão de R$ 120,00. Qual dos grupos apresenta maior dispersão relativa?

Podemos notar que, embora haja maior dispersão absoluta para o salário dos homens, a dispersão relativa será maior para o salário das mulheres, pois:

CVH = 150/400 = 0,375 ou 37,5%

CVM = 120/300 = 0,40 ou 40%

Considera-se que um CV superior a 50% indica alto grau de dispersão e, conseqüentemente, pequena representatividade da média, enquanto para um CV inferior a 50% a média será tanto mais representativa quanto menor for o valor da CV, ou seja, quanto menor for o CV, mais homogênea será considerada a série e quanto maior for o CV, mais heterogênea.

Exercício de Fixação:

A distribuição de freqüência das estaturas, em centímetros, de uma amostra de estudantes é dada por:

Classe

(estatura em centímetros)

Freqüência

(número de estudantes)

159,5 ________ 164,5

5

164,5 ________ 169,5

10

169,5 ________ 174,5

5

a) Calcule a estatura média desses estudantes.

b) Calcule o desvio médio absoluto dessa distribuição.

c) Calcule o desvio padrão dessa distribuição.

d) Calcule a variância dessa distribuição.

e) Calcule e avalie o coeficiente de variação.

Bibliografia

FONSECA, Jairo Simon e MARTINS, Gilberto de Andrade – Curso de Estatística, Editora Atlas, 1982.

FONSECA, Jairo Simon e MARTINS, Gilberto de Andrade – Estatística Aplicada, Editora Atlas, 1976.

TOLEDO, Geraldo Luciano e OVALLE, Ivo Isidoro – Estatística Básica, Editora Atlas, 1983.

SPIEGEL, Murray R. – Estatística, Editora Mcgraw-Hill do Brasil, 1981.

STEVENSON, Willian J. – Estatística Aplicada à Administração, Editora Habra, 1986.

BUSSAB, Wilton de O. e MORETTIN, Pedro A. – Estatística Básica,

Editora Saraiva, 2002.

PAIVA, Manoel – Matemática Volume 2, Editora Moderna, 2004

14

Comentários