Docsity
Docsity

Prepare-se para as provas
Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity


Ganhe pontos para baixar
Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium


Guias e Dicas
Guias e Dicas

princípios básicos de estatística, Notas de estudo de Comércio Exterior

princípios básicos de estatística

Tipologia: Notas de estudo

2013
Em oferta
30 Pontos
Discount

Oferta por tempo limitado


Compartilhado em 24/03/2013

diego-de-sousa-carneiro-1
diego-de-sousa-carneiro-1 🇧🇷

5

(9)

26 documentos

1 / 221

Documentos relacionados


Pré-visualização parcial do texto

Baixe princípios básicos de estatística e outras Notas de estudo em PDF para Comércio Exterior, somente na Docsity! UNIVERSIDADE FEDERAL DE PELOTAS INSTITUTO DE FÍSICA E MATEMÁTICA DEPARTAMENTO DE MATEMÁTICA E ESTATÍSTICA Estatística Básica Versão Preliminar Clause Fátima de Brum Piana Amauri de Almeida Machado Lisiane Priscila Roldão Selau Pelotas, 2009. Sumário Unidade T. Introdução 1.1. Considerações gerais.................. ereta 5 1.2. População e amostra... sereias aeee tati 5 1.3. Conceito e divisão.................. eee erre eretas 5 1.4. Informações históricas................ eira 6 1.5. Conceitos fundamentais.. 7 1.5.1. Característica e variável 1.5.2. Escalas de medida. 1.5.3. Classificação de variávei 10 1.5.4. Observação e conjunto de dados... 10 1.6. Bibliografia... eee teresa crer eeeeeeea aereas 12 Unidade TI. Estatística Descritiva 2.1. Apresentação de dados... teeeeeeeeeeeeecaeeeeaeienatatnene 14 2.1.1. Séries estatísticas............. ienes reeeemeeeeeeeeeaeea taste 14 2.1.2 Tabelas... errantes roer are reeeaeaeararerasaeaeaereraeieo 18 2.1.3. Gráficos.......... 21 2.2. Distribuições de frequências e gráficos.................... ia 24 2.2.1. Tabelas de classificação simples.................. ea 24 2.2.2. Tabelas de classificação cruzada................ ia 33 2.3. Medidas descritivas................ reatar aeee nata 36 2.3.1. Medidas de localização ou tendência central.................iiiis 37 2.3.2. Medidas separatrizes............... erre eee raeertaea 43 2.3.3. Medidas de variação ou dispersão................. e 45 2.3.4. Medidas de formato... eternas aereas teares 49 2.3.6. Medidas descritivas para dados agrupados em classe... 52 2.4. Análise exploratória de dados... enaa 57 2.5. Bibliografia............... eee aeee aereas ereaeaenrea 64 141. 1.2. 1.3. 1.4. 1.5. 1.6. Unidade I Introdução Considerações gerais... ericeira eres 5 População e amostra. 5 Conceito e divisão... seesriee eee eeereres aerea eretas 5 Informações históricas.................. iii seeaeeiaaaiasiia 6 Conceitos fundamentais... ienes aereas aeee 7 1.5.1. Característica e variável... ie reeerereeeeeeeee serasa 7 1.5.2. Escalas de medida... 7 1.5.3. Classificação de variáveis......... 10 1.5.4. Observação e conjunto de dados. 10 Bibliografia... ereta er ererer ereta er eerena 12 Piana, Machado e Selau Introdução 1.1. Considerações gerais A coleta, o processamento, a interpretação e a apresentação de dados numéricos pertencem todos aos domínios da estatística. Essas atribuições compreendem desde o cálculo de pontos em esportes, a coleta de dados sobre nascimentos e mortes, a avaliação da eficiência de produtos comerciais, até a previsão do tempo. A informação estatística é apresentada constantemente em todos os meios de comunicação de massa: jornais, televisão, rádio e internet. Observamos uma abordagem crescentemente quantitativa utilizada em todas as ciências, na administração e em muitas atividades que afetam diretamente nossas vidas. Isto inclui o uso de técnicas matemáticas nas decisões econômicas, públicas ou privadas; na avaliação de controles de poluição; na análise de problemas de tráfego; no estudo dos efeitos de vários medicamentos; na adoção de novas técnicas agrícolas e novas cultivares; em estudos demográficos como crescimento populacional e migração. A partir destes poucos exemplos, podemos notar a importância da Estatística como ferramenta necessária para a compreensão dos fenômenos que ocorrem nas mais diferentes áreas. 1.2. População e amostra É difícil encontrar duas coisas exatamente iguais. Há um pouco de variabilidade em quase tudo. De modo bem geral, podemos dizer que o objetivo da Estatística é fornecer métodos para se conviver, de modo racional, com a variabilidade. Isto é feito através da descoberta de regularidade nos dados relativos às situações em estudo. Para isso, duas ideias são de fundamental importância. Primeiramente, embora as observações sejam variáveis é sempre possível associar a elas a ideia de regularidade e expressar essa regularidade matematicamente. Por outro lado, devido à variabilidade inerente aos indivíduos, os pontos de interesse da Estatística são referentes aos grupos de indivíduos, ou seja, estudamos os indivíduos através dos grupos. Quando estudamos uma determinada característica, geralmente, queremos obter conclusões para o conjunto de todos os indivíduos que apresentam tal característica. Chamamos de população o conjunto de todos os indivíduos ou objetos que apresentam uma característica em comum. Na maioria dos casos, ao estudarmos uma população, não temos acesso a todos os seus elementos. O estudo é feito, então, a partir de uma parte desta população, denominada amostra, que tem por objetivo representá-la. 1.3. Conceito e divisão A Estatística, durante muitos séculos, esteve relacionada apenas com as informações a respeito do Estado. Hoje em dia, o conjunto de teorias, conceitos e métodos denominado Estatística está associado ao processo de descrição e inferência, debruçando-se, de modo particular, sobre questões relativas a sumarização eficiente de dados, planejamento e análise de experimentos e levantamentos e natureza de erros de medida e de outras causas de variação em um conjunto de dados. A estatística pode ser dividida em duas partes principais: a Estatística Descritiva e a Inferência Estatística ou Estatística Analítica. Enquanto a Estatística Descritiva cuida do resumo e da apresentação de dados de observação por meio de tabelas, gráficos e medidas, sem se preocupar com as populações de onde esses dados foram retirados, a Inferência Estatística tem como objetivo fornecer métodos que possibilitem a realização de inferência sobre populações a partir de amostras delas provenientes. A Inferência Estatística tem por base o cálculo de probabilidades e compreende dois grandes tópicos: a estimação de parâmetros e os testes de hipóteses. Embora a Estatística Descritiva seja um ramo fundamental da Estatística, em muitos casos ela se torna insuficiente. Isto ocorre porque quase sempre as informações são obtidas de amostras e, consequentemente, sua análise exige generalizações que ultrapassam os 5 Piana, Machado e Selau Introdução dados disponíveis. Essa necessidade, aliada ao desenvolvimento dos métodos probabilísticos, promoveu o crescimento da Estatística pela ênfase aos métodos generalizadores (Inferência Estatística), em acréscimo aos métodos puramente descritivos. Alguns exemplos ilustram a necessidade dos métodos generalizadores: — prever a duração média da vida útil de uma calculadora, com base no desempenho de muitas dessas calculadoras; — comparar a eficiência de duas dietas para reduzir peso, com base nas perdas de peso de pessoas que se submeteram às dietas; — determinar a dosagem ideal de um novo medicamento, com base em testes feitos em pacientes voluntários de hospitais selecionados aleatoriamente; — prever o fluxo de tráfego de uma rodovia ainda em construção, com base no tráfego observado em rodovias alternativas. Em todas essas situações existe incerteza porque dispomos apenas de informações parciais, incompletas ou indiretas. A Inferência Estatística trata de problemas onde a incerteza é inerente, utilizando métodos que se fundamentam na teoria das probabilidades. Os métodos de inferência tornam-se necessários para avaliar a confiabilidade dos resultados observados. 1.4. Informações históricas Embora a palavra estatística ainda não existisse, existem indícios de que há 3000 anos a.C. já se faziam censos na Babilônia, China e Egito. A própria Bíblia leva-nos a esse resgate histórico: - o livro quarto do Velho Testamento, intitulado “Números”, começa com a seguinte instrução a Moisés: "Fazer um levantamento dos homens de Israel que estivessem aptos para guerrear”; — ha época do Imperador César Augusto, saiu um edito para que se fizesse o censo em todo o Império Romano. Por isso Maria e José teriam viajado para Belém. A Estatística teve origem na necessidade do Estado Político em conhecer os seus domínios. Sob a palavra estatística, provavelmente derivada da palavra “status” (estado, em latim), acumularam-se descrições e dados relativos ao Estado. Nas mãos dos governantes, a Estatística passou a constituir-se verdadeira ferramenta administrativa. Em 1085, Guilherme, o Conquistador, ordenou que se fizesse um levantamento estatístico da Inglaterra, que deveria incluir informações sobre terras, proprietários, uso da terra, empregados, animais e que serviria também de base para o cálculo de impostos. Esse levantamento originou um volume intitulado “Domesday Book” (Livro do dia do juízo final). No século XVII, ganhou destaque na Inglaterra, a partir das Tábuas de mortalidade de Jonh Graunt e William Petty, a aritmética política que consistiu de exaustivas análises de nascimentos e mortes. Dessas análises resultou a conclusão, entre outras, de que a percentagem de À mu nascimentos de crianças do sexo Jonh Graunt masculino era ligeiramente superior à William Petty (1620 - 1674) de crianças do sexo feminino. (1623 - 1687) Em 1708, foi organizado o primeiro curso de Estatística na Universidade de Yena, na Alemanha. Piana, Machado e Selau Introdução Escala intervalar Uma variável de escala intervalar, além de ordenar as unidades quanto à característica mensurada, possui uma unidade de medida constante. A escala intervalar, ou escala de intervalo, aproxima-se da concepção comum de medida, mas não possui uma origem (ou ponto zero) única. O ponto zero dessa escala é arbitrário e não expressa ausência de quantidade. Os exemplos mais comuns de escala de intervalo são as escalas Celsius e Fahrenheit, usadas para medir a temperatura. Cada uma dessas escalas assinala um zero arbitrário e diferenças de temperatura iguais são determinadas através da identificação de volumes iguais de expansão no líquido usado no termômetro. Dessa forma, a escala de intervalo permite inferências referentes a diferenças entre unidades a serem medidas, mas não se pode dizer que um valor em um intervalo específico da escala seja um múltiplo de outro. Por exemplo, a mensuração da temperatura de unidades permite determinar quanto uma é mais quente do que outra, mas não é correto dizer que um objeto com 30ºC está duas vezes mais quente que um com temperatura de 15ºC. Segundo a fórmula de conversão de graus Celsius para graus Fahrenheit, F=9/5C+32, essas temperaturas, 30ºC e 15ºC, expressas em graus Fahrenheit são, respectivamente 86ºF e 59ºF, que não estão na razão 2:1. Pode-se dizer, entretanto, que uma diferença entre dois valores em uma escala é um múltiplo de uma diferença entre dois outros valores. Por exemplo, a diferença 30ºC-0ºC é o dobro da diferença 15ºC-0ºC. As correspondentes diferenças na escala Fahrenheit são 86ºF -32ºC e 59ºF-32ºC, que estão na mesma razão 2:1. A escala intervalar é invariante sob transformações lineares positivas (ou seja, transformações da forma y=a+bx,b >0). Isso significa que uma escala de intervalo pode ser transformada em outra por meio de uma transformação linear positiva. A transformação de graus Celsius em Fahrenheit é um exemplo de transformação linear. A maioria das medidas descritivas, tais como média, desvio padrão, coeficiente de correlação, requer apenas escala de intervalo. Entretanto, algumas medidas, como o coeficiente de variação, podem ser enganosas quando aplicadas a dados de variável de escala intervalar. Se o que pode ser dito sobre um objeto é que ele é tantas unidades maior que outro, então a escala de medida é intervalar. Escala de razão Uma variável de escala de razão ou racional ordena as unidades quanto à característica mensurada, possui uma unidade de medida constante e sua origem (ou ponto zero) é única. Nessa escala o valor zero expressa ausência de quantidade. A escala de razão, ou escala racional, é a mais elaborada das escalas de medida, no sentido de que permite todas as operações aritméticas. É a escala de medida mais comum nas ciências físicas, tais como as escalas para a medida de comprimento, peso, etc. Conforme a designação sugere, razões iguais entre valores da escala racional correspondem a razões iguais entre as unidades mensuradas. Dessa forma, escalas de razão são invariantes sob transformações de proporção positivas, ou seja, transformações da forma y=cx, x>0. Por exemplo, se uma unidade tem 3m e a outra 1m, pode-se dizer que a primeira unidade tem altura 3 vezes superior a da segunda. Isso porque, se as alturas das duas unidades forem transformadas em centímetros, suas medidas serão, respectivamente, 300cm e 100cm, que estão na mesma razão 3:1. Pode-se efetuar a transformação das medidas de uma escala racional para outra escala racional meramente pela multiplicação por uma constante apropriada. Se puder ser dito que um objeto é tantas vezes maior, mais pesado, etc. que outro, então a escala de medida é de razão. A escala racional contém toda a informação das escalas de nível mais baixo, ou seja, igualdade de classe, ordem e igualdade de diferenças, e mais ainda. Todas as medidas descritivas podem ser determinadas para dados de uma variável expressa em escala racional. Piana, Machado e Selau Introdução 1.5.3. Classificação de variáveis De modo geral, as variáveis podem ser divididas em dois grupos: variáveis categóricas e variáveis numéricas. As variáveis categóricas, também denominadas fatores de classificação ou simplesmente fatores, são aquelas cujos valores representam categorias ou classes. Caracterizam-se por possuir um conjunto limitado de valores (níveis) que usualmente se repetem entre as unidades. As variáveis categóricas podem ser qualitativas ou quantitativas. Variáveis categóricas qualitativas descrevem qualidades e, de acordo com a escala de medida, são classificadas em: — Nominais: quando não houver um sentido de ordenação entre os seus possíveis valores. Exemplos: sexo (com os níveis masculino e feminino), raça de cavalos (com os níveis manga-larga, crioulo e árabe, por exemplo), região geográfica (com os níveis norte, sul, sudeste e leste), estado civil (com os níveis solteiro, casado e divorciado, por exemplo), linhagens de uma cultivar em um processo de melhoramento vegetal, etc. — Ordinais: quando houver um sentido de ordenação entre os seus possíveis valores. Exemplos: faixas de idade (criança, adolescente, adulto, idoso), intensidade de cor (claro, escuro), intensidade de infestação (forte, média, fraca), grau de instrução (fundamental, médio, graduação, pós-graduação) etc. Variáveis categóricas quantitativas descrevem quantidades. Possuem os mesmos atributos das variáveis qualitativas, mas, uma vez que seus níveis expressam quantidade, a cada nível está associado um valor, denominado valor do nível. Por exemplo, se uma variável exprime a quantidade de um tranquilizante utilizado contra a insônia, então os níveis poderão ser Dose 1, Dose 2 e Dose 3 e as quantidades (valores) associadas poderão ser 0, 2e 4mg. As variáveis numéricas são aquelas cujos valores são números reais, de modo que cada valor representa um valor da variável e não uma categoria ou uma classe. De acordo com o processo de obtenção dos seus dados (valores), as variáveis numéricas são classificadas em: — Discretas: descrevem dados discretos ou de enumeração, ou seja, obtidos por processo de contagem. As variáveis discretas só podem assumir valores do conjunto dos números inteiros não negativos (0, 1, 2, 3, ...). Exemplos: número de sementes germinadas, número de pacientes que se recuperam, número de frutos estragados, número de filhos de um casal, etc. — Contínuas: descrevem dados contínuos ou de mensuração, ou seja, obtidos por processo de medição. As variáveis contínuas podem assumir qualquer valor do conjunto dos reais (-10, 0, 2, 7). Exemplos: peso, altura, tempo de sono, teor de umidade, temperatura corporal, etc. Observemos que variáveis categóricas quantitativas são, de certa forma, variáveis numéricas, mas, nesse caso, os valores representam quantidades associadas a categorias (níveis do fator). A classificação correta de uma variável é fundamental, uma vez que esta discriminação é que irá indicar a possibilidade e a forma de utilização dos procedimentos estatísticos disponíveis. 1.5.4. Observação e conjunto de dados Os números, taxas e outras informações coletados em experimentos ou levantamentos são denominamos dados. Todo dado é um valor de uma variável (numérico ou não numérico). A unidade da população em que são medidas as variáveis de interesse é chamada de unidade de observação. Uma planta, por exemplo, pode ser a unidade de 10 Piana, Machado e Selau Introdução observação em uma determinada pesquisa. Os valores obtidos para a variável medida nas unidades de observação (nas plantas) são os dados. Observação é o conjunto de valores referentes a todas as variáveis medidas em uma unidade de observação. Por exemplo, os valores referentes ao peso de matéria seca, à estatura e ao número de perfilhos de uma planta constituem uma observação. O conjunto de todas as observações, ou seja, todos os valores referentes a todas as unidades de observação, constituem o conjunto de dados. As variáveis são representadas por letras maiúsculas (X, Y, Z, etc) e os seus valores (dados) por letras minúsculas (x, y, z, etc.). Assim, se uma variável é representada por X (xis maiúsculo), todos os seus valores serão representados por x (xis minúsculo). Para diferenciar ou individualizar os valores de uma variável, acrescenta-se um índice i=1,2,..., n, que representa a unidade ou a observação. Assim, um conjunto de n valores de uma variável X será representado por X«, X2, Xa, ..., Xn. Como exemplo, tomemos o conjunto de dados apresentado na tabela abaixo. Esse conjunto é constituído por 19 unidades ou observações (i), uma variável identificadora (nome), uma variável do tipo fator (sexo) e três variáveis numéricas contínuas (idade, estatura e peso). i Nome Sexo Idade Estatura Peso 1 Alfredo M 14 1,75 51,03 2 Carol F 14 1,60 46,49 3 Jane F 12 1,52 38,33 4 João M 12 1,50 45,13 5 Luísa F 12 1,43 34,93 6 Roberto M 12 1,65 58,06 7 William M 15 1,69 50,80 8 Bárbara F 13 1,66 44,45 9 Juca M 12 1,46 37,65 10 Joca M 13 1,59 38,10 11 Judite F 14 1,63 40,82 12 Felipe M 16 1,83 68,04 13 Tomas M 11 1,46 38,56 14 Alice F 13 1,44 38,10 15 Herrique M 14 1,61 46,49 16 Janete F 15 1,59 51,03 17 | Joice F 11 1,30 22,91 18 Maria F 15 1,69 50,80 19 | Ronaldo M 15 1,70 60,33 Este conjunto de dados é representado simbolicamente na tabela abaixo. i A B x Y Z 1 a b; x Y Z 2 a, bz Xx2 y2 Z2 3 as ba Xa y3 Z3 19 aro bio X19 Yr9 2Z19 1 Piana, Machado e Selau Estatística Descritiva 2. Estatística Descritiva O método científico, quando aplicado para solução de um problema científico, frequentemente gera dados em grande quantidade e de grande complexidade. Desse modo, a análise da massa de dados individuais, na maioria das vezes, não revela a informação subjacente, gerando a necessidade de algum tipo de condensação ou resumo dos dados. A Estatística Descritiva é a parte da Estatística que desenvolve e disponibiliza métodos para resumo e apresentação de dados estatísticos com o objetivo de facilitar a compreensão e a utilização da informação ali contida. Em resumo, a Estatística Descritiva tem por finalidade a utilização de tabelas, gráficos, diagramas, distribuições de frequência e medidas descritivas para: * examinar o formato geral da distribuição dos dados; * verificar a ocorrência de valores atípicos; e identificar valores típicos que informem sobre o centro da distribuição; e verificar o grau de variação presente nos dados. Evidentemente, a validade do resumo dos dados está intimamente ligada à quantidade de informação disponível e à qualidade da obtenção dos dados. Pode-se pensar que todo método descritivo possui uma entrada, os dados, e uma saída, que pode ser uma medida descritiva ou um gráfico. Se a entrada é deficiente a saída também será de má qualidade. 2.1. Apresentação de dados 2.1.1. Séries Estatísticas A reunião ou agrupamento de dados estatísticos, quando apresentados em tabelas ou em gráficos, para apreciação ou investigação, determina o surgimento das séries estatísticas. As séries estatísticas resumem um conjunto ordenado de observações através de três fatores fundamentais: a) tempo: refere-se a data ou a época em que o fenômeno foi investigado; b) espaço: refere-se ao local ou região onde o fato ocorreu; c) espécie: refere-se ao fato ou fenômeno que está sendo investigado e cujos valores numéricos estão sendo apresentados. As séries estatísticas são classificadas de acordo com o fator que estiver variando, podendo ser simples ou mistas. * Séries simples: são aquelas em que apenas um fator varia. Podem ser de três tipos: — Série histórica (temporal ou cronológica ou evolutiva): onde varia o tempo permanecendo fixos o espaço e a espécie do fenômeno estudado. Exemplo: Tabela 2.1. Casos de sarampo notificados no Brasil de 1987 a 1992. Ano Número de casos 1987 65.459 1988 26.173 1989 55.556 1990 61.435 1991 45.532 1992 7.934 Fonte: Anuários estatísticos — IBGE. 14 Piana, Machado e Selau Estatística Descritiva — Série geográfica (territorial ou regional): onde varia o espaço permanecendo fixos o tempo e a espécie do fenômeno estudado. Exemplo: Tabela 2.2. Necessidades médias de energia em alguns países, em 1973. País kcal/per capita/dia Brasil 2.174 Estados Unidos 2.397 Etiópia 2.120 Japão 1.125 México 2114 Fonte: Necessidades Humanas de Energia — IBGE. — Série especificativa (qualitativa ou categórica): onde varia a espécie do fenômeno estudado permanecendo fixos o tempo e espaço. Exemplo: Tabela 2.3. Abate de animais, por espécie, no Brasil, em 1993. Espécie Número de cabeças Aves 1.232.978.796 Bovinos 14.951.359 Suínos 13.305.932 Ovinos 926.818 Caprinos 803.188 Equinos 165.691 Fonte: Anuário Estatístico do Brasil (1994). * Séries mistas: são aquelas em que mais de um fator varia ou um fator varia mais de uma vez. Exemplos: — Série histórica geográfica (ou geográfica histórica) Tabela 2.4. Taxa de atividade feminina urbana (em percentual) em três regiões do Brasil, 1981/90. x Ano Região 1981 1984 1986 1990 Norte 28,9 30,3 34,0 37,1 Nordeste 30,2 32,6 34,3 37,8 Sudeste 34,9 37,2 40,1 40,7 Fonte: Anuário Estatístico do Brasil (1992). 15 Piana, Machado e Selau Estatística Descritiva — Série especificativa geográfica (ou geográfica especificativa) Tabela 2.5. Consumo per capita anual de alguns tipos de alimentos, em algumas regiões metropolitanas do Brasil, no ano de 1988. Cidade Consumo (kg) Hortaliças Cames Pescado Belo Horizonte 44,5 21,6 1,3 Rio de Janeiro 543 24,7 4,9 São Paulo 46,7 26,1 2,9 Curitiba 36,2 241 1,7 Porto Alegre 48,9 34,2 1,5 Fonte: Anuário Estatístico do Brasil (1992). — Série especificativa histórica (ou histórica especificativa) Tabela 2.6. Taxa de mortalidade (em percentual) de menores de um ano no Brasil, segundo as três principais causas, no período de 1984 a 1987. Causa 1984 1985 1986 1987 Doenças infecciosas intestinais 20,6 17,3 17,9 16,8 Pneumonia 12,1 11,7 12,0 10,8 Perinatal 42,4 45,8 45,3 48,0 Fonte: Informe Epidemiológico SUS. — Série especificativa histórica geográfica Tabela 2.7. Número de vítimas em acidentes, segundo as grandes regiões do Brasil, nos anos de 1991 e 1992. a Vítimas fatais Vítimas não fatais Região 1991 1992 1991 1992 Norte 1.188 1.165 10.229 9.739 Nordeste 3.857 3.843 23.774 23.942 Sudeste 11.555 10.217 130.938 159.669 Sul 4.402 4.213 61.797 58.832 Centro-Oeste 2.220 1.949 22.147 22.086 Brasil 23.222 21.387 248.885 274.268 Fonte: Anuário Estatístico do Brasil (1994). 16 Piana, Machado e Selau Estatística Descritiva a) — (traço): indica dado numérico igual a zero não resultante de arredondamento; b).. (dois pontos): indica que não se aplica dado numérico; c)... (três pontos): indica dado numérico não disponível; d) x (xis): indica dado numérico omitido a fim de evitar a individualização da 0, 0,0 ou 0,00: indica dado numérico igual a zero resultante de arredondamento. f) ? (interrogação): quando há dúvida sobre a veracidade da informação. Quando uma tabela contiver sinais convencionais, estes deverão ser apresentados em nota geral com seus respectivos significados. * Arredondamento Quando o primeiro algarismo a ser abandonado for 0, 1, 2, 3 ou 4, fica inalterado o último algarismo a permanecer. Exemplo: 48,23 — 48,2. Quando o primeiro algarismo a ser abandonado for 5, 6, 7, 8 ou 9, aumenta-se de uma unidade o último algarismo a permanecer. Exemplo: 23,87 — 23,9. + Unidade de medida Uma tabela deve ter unidade de medida, inscrita no cabeçalho ou nas colunas indicadoras, sempre que houver necessidade de se indicar, complementarmente ao título, a expressão quantitativa ou metrológica a dos dados numéricos. Esta indicação deve ser feita com símbolos ou palavras, entre parênteses. Exemplos: (m) ou (metros), (t) ou (toneladas), (R$) ou (reais). uando os dados numéricos forem divididos por uma constante, esta deve ser indicada por algarismos arábicos, símbolos ou palavras, entre parênteses, precedendo a unidade de medida, quando for o caso. Exemplos: (1.000 t): indica dados numéricos em toneladas que foram divididos por mil; (1.000 R$): indica dados numéricos em reais que foram divididos por mil; (%) ou (percentual): indica dados numéricos proporcionais a cem; (1/1.000): indica dados numéricos divididos por 1/1.000, ou seja, multiplicados por mil. + Classe de frequência A classe de frequência é cada um dos intervalos não superpostos em que se divide uma distribuição de frequências. Toda classe deve ser apresentada, sem ambiguidade, por extenso ou com notação. Toda a classe que inclui o extremo inferior do intervalo (El) e exclui o extremo superior (ES), deve ser apresentada de uma destas duas formas: EI--ES ou [EI ES) + Apresentação de tempo Toda a série histórica consecutiva deve ser apresentada por seus pontos inicial e final, ligados por hífen (-). Exemplos: 1892-912: quando varia o século; 1960-65: quando variam os anos dentro do século; out 1991 - mar 1992: quando variam os meses dentro de anos. Toda a série histórica não consecutiva deve ser apresentada por seus pontos inicial e final, ligados por barra (/). Exemplos: 1981/85: indica dados não apresentados para pelo menos um ano do intervalo; out 1991 / mar 1992: indica dados não apresentados para pelo menos um mês do intervalo. 19 Piana, Machado e Selau Estatística Descritiva + Apresentação da tabela — O corpo da tabela deve ser delimitado, no mínimo, por três traços horizontais. - Recomenda-se não delimitar as tabelas à direita e à esquerda por traços verticais. É facultativo o uso de traços verticais para a separação de colunas no corpo da tabela. —- Quando, por excessiva altura, a tabela tiver que ocupar mais de uma página, não deve ser delimitada inferiormente, repetindo-se o cabeçalho na página seguinte. Deve-se usar no alto do cabeçalho a palavra continuação ou conclusão, conforme o caso. — Se possuir muitas linhas e poucas colunas, poderá ser apresentada em duas ou mais partes dispostas lado a lado e separadas por traço duplo. — A disposição da tabela deve estar na posição normal de leitura. Caso isso não seja possível, a apresentação será feita de forma que a rotação da página seja no sentido horário. Exemplo: Tabela 2.10. Total de estabelecimentos, pessoal ocupado, valor da produção e valor da transformação industrial das indústrias metalúrgicas, por Unidade da Federação do Brasil, 1982. Unidade da Federação Total de Pessoal. Valor da produção e Valor da transformação estabelecimentos ocupado (1.000 Cr$) industrial (1.000 Cr$) Rondônia 1 x x x Acre 2 x x x Amazonas 31 1.710 21.585 10.103 Roraima 2 x x x Pará 43 1.675 6.492 3.287 Amapá — — — — Maranhão 14 328 498 251 Piauí 12 193 454 159 Ceará 74 5.336 21.732 10.878 Rio Grande do Norte 1 343 1.267 383 Paraíba 30 794 2.089 1.265 Pernambuco 105 5171 44.673 14.506 Alagoas 20 439 4.101 1.768 Sergipe 20 423 1.447 534 Bahia 116 5.527 89.072 27.679 Minas Gerais 736 54.264 954.258 306.856 Espírito Santo 42 2.281 22.923 6.297 Rio de Janeiro 847 40.768 635.731 177.358 São Paulo 4.699 272.983 2.531.363 939.032 Paraná 449 11.118 43.797 22.014 Santa Catarina 305 10.816 84.294 41.894 Rio Grande do Sul 706 30.103 156.680 74.316 Mato Grosso do Sul 29 485 1.643 623 Mato Grosso 13 528 884 686 Goiás 106 2.686 9.860 4.800 Distrito Federal 28 843 2.577 1.301 Brasil 8.452 448.932 4.637.512 1.646.043 Fonte: Pesquisa Industrial - 1982-1984. Dados gerais, Brasil. Rio de Janeiro: IBGE, v.9, 410p. Nota: Sinais convencionais utilizados: x Dado numérico omitido a fim de evitar a individualização da informação. - Dado numérico igual a zero não resultante de arredondamento. O Em 31.12.1982. (2 Inclui o valor dos serviços prestados a terceiros e a estabelecimentos da mesma empresa. 20 Piana, Machado e Selau Estatística Descritiva 2.1.3. Gráficos Outro modo de apresentar dados estatísticos é sob uma forma ilustrada, comumente chamada de gráfico. Os gráficos constituem-se numa das mais eficientes formas de apresentação de dados. Um gráfico é, essencialmente, uma figura construída a partir de uma tabela; mas, enquanto a tabela fornece uma ideia mais precisa e possibilita uma inspeção mais rigorosa aos dados, o gráfico é mais indicado para situações que visem proporcionar uma impressão mais rápida e maior facilidade de compreensão do comportamento do fenômeno em estudo. Os gráficos e as tabelas se prestam, portanto, a objetivos distintos, de modo que a utilização de uma forma de apresentação não exclui a outra. Para a confecção de um gráfico, algumas regras gerais devem ser observadas: * Normas para representação gráfica — Os gráficos, geralmente, são construídos num sistema de eixos chamado sistema cartesiano ortogonal. A variável independente é localizada no eixo horizontal (abscissas), enquanto a variável dependente é colocada no eixo vertical (ordenadas). No eixo vertical, o início da escala deverá ser sempre zero, ponto de encontro dos eixos. — Iguais intervalos para as medidas deverão corresponder a iguais intervalos para as escalas. Exemplo: Se ao intervalo 10-15 kg corresponde 2 cm na escala, ao intervalo 40-45 kg também deverá corresponder 2 cm, enquanto ao intervalo 40-50 kg corresponderá 4 cm. — O gráfico deverá possuir título, fonte, notas e legenda, ou seja, toda a informação necessária à sua compreensão, sem auxílio do texto. - O gráfico deverá possuir formato aproximadamente quadrado para evitar que problemas de escala interfiram na sua correta interpretação. * Tipos de gráficos Podemos considerar quatro tipos principais de representação gráfica: Estereogramas: são gráficos onde as grandezas são representadas por volumes. Geralmente são construídos num sistema de eixos bidimensional, mas podem ser construídos hum sistema tridimensional para ilustrar a relação entre três variáveis. Exemplo: E Hortaliças ECames E Pescado Belo Riode São Paulo Curitiba Porto Horizonte Janeiro Alegre Figura 2.1. Consumo, em kg, de alguns tipos de alimentos “per capita” anual em algumas regiões metropolitanas do Brasil, em 1988. Fonte: Anuário Estatístico do Brasil (1992). 21 Piana, Machado e Selau Estatística Descritiva 1% Privado EB Público BUniversitário Figura 2.6. Hospitalizações pagas pelo SUS, segundo a natureza do prestador de serviço — 1993. Fonte: Anuário Estatístico do Brasil (1994). 2.2. Distribuição de frequências e gráficos Um grande número de dados necessita de uma forma eficiente de sumarização. Uma das formas mais comuns de resumir e apresentar dados é através de tabelas de distribuição de frequências. Estas tabelas podem ser de dois tipos: de classificação simples ou de classificação cruzada. 2.2.1. Tabelas de classificação simples As tabelas de classificação simples são tabelas de frequências relativas a uma variável. As características dessas tabelas variam de acordo com o tipo de variável em estudo. Se a variável é do tipo categórica (fator), então são obtidas as frequências de ocorrência de cada nível dessa variável. Se a variável é do tipo numérica contínua, primeiro são obtidos intervalos de mesma amplitude e depois contados os valores que ocorrem em cada intervalo. 2.2.1.1. Distribuição de frequências de variáveis categóricas Quando a variável em estudo for categórica ou, em alguns casos, numérica discreta, a tabela de distribuição de frequências apresentará a seguinte característica: cada valor da variável constituirá uma classe. * Construção da tabela A construção da tabela de distribuição de frequência para variáveis categóricas envolve apenas dois passos bastante simples: 1º passo: ordenar os níveis do fator, ou seja, colocá-los em ordem crescente de grandeza (rol). Cada nível constituirá uma classe. O número de cada classe da distribuição será representado por j, tal que j = 1,2,...,k. 2º passo: contar o número de elementos em cada classe, ou seja, contar quantas vezes o dado está repetido. 24 Piana, Machado e Selau Estatística Descritiva Veremos, por meio de exemplos, como construir uma tabela de distribuição de frequências para os dados de uma variável categórica (Exemplo 1) e de uma variável numérica discreta (Exemplo 2). Exemplo 1: Seja a variável em estudo o conceito obtido por 60 estudantes na disciplina de Estatística, para o qual os dados observados foram os seguintes: ruim, médio, bom, médio, ruim, médio, ruim, médio, ruim, bom, médio, médio, bom, médio, médio, médio, ótimo, médio, bom, ótimo, bom, ótimo, médio, ótimo, médio, ruim, médio, ótimo, médio, médio, bom, ruim, bom, bom, médio, ruim, médio, médio, ótimo, médio, bom, ruim, ruim, bom, médio, médio, ruim, bom, médio, médio, bom, bom, bom, médio, ruim, bom, médio, médio, ruim, médio Podemos observar que esta variável categórica qualitativa ordinal apresenta quatro níveis (ruim, médio, bom e ótimo). Como cada nível deve constituir uma classe da distribuição de frequências, já está determinado que o número total de classes (Kk) é quatro. O primeiro passo é a ordenação dos níveis da variável. Assim, temos Número da classe (j) Classe 1 Ruim 2 Médio 3 Bom 4 Ótimo O passo seguinte é a contagem do número de estudantes em cada nível. Estes valores são denotados por F, e chamados de frequências absolutas das classes. A partir da frequência absoluta podemos obter outras frequências de interesse numa distribuição, tais como: — frequência absoluta acumulada na classe j, denotada por Fi, que expressa o número de elementos (observações) acumulados até a classe j; — frequência relativa da classe j, denotada por f,, que expressa a proporção de elementos (observações) na classe j; — frequência relativa acumulada na classe j, denotada por fj, que expressa a proporção de elementos (observações) acumulados até a classe j. As frequências obtidas são então apresentadas na forma tabular. Tabela 2.11. Frequência do conceito obtido por estudantes na disciplina de Estatística. UFPel, 2001. j |Classe F E í f 1 | Ruim 12 12 0,2 0,2 2 | Médio 27 39 0,45 0,65 3 |Bom 15 54 0,25 0,9 4 | Ótimo 6 60 0,1 1 L 60 - 1 - 25 Piana, Machado e Selau Estatística Descritiva Exemplo 2: Muito frequentemente, as tabelas de distribuição de frequência de variáveis numéricas discretas são construídas da mesma forma que as das variáveis categóricas. Consideremos agora que a variável em estudo seja o número de animais portadores de brucelose em 350 propriedades rurais. Os valores observados para esta variável foram: 2,5,6,0,44,3,4,2,2,3,3,5,3,5,1,2,4,2,3,5,4,3,3,2,3,0,4,4,3,4,0,3,1,2,4,2,... Como cada valor da variável deve constituir uma classe e foram observados apenas sete valores diferentes para esta variável, a tabela de distribuição de frequências terá sete classes. Número da Classe classe (j) 1 0 2 1 3 2 4 3 5 4 6 5 7 6 Através da contagem do número de vezes que cada valor apareceu, ou seja, do número de observações em cada classe, obtemos as frequências absolutas, relativas e acumuladas, apresentadas na tabela a seguir. Tabela 2.12. Frequência do número de animais portadores de brucelose em 350 propriedades rurais. UFPel, 2001. j | Classe F FE í f 1 0 55 55 0,1571 0,1571 2 1 60 115 0,1714 0,3286 3 2 112 227 0,32 0,6486 4 3 82 309 0,2343 0,8829 5 4 31 340 0,0886 0,9714 6 5 8 348 0,0229 0,9943 7 6 2 350 0,0057 1,0000 L 350 - 1,0000 - Devemos observar, ainda, que tão importante quanto saber construir uma tabela é saber interpretar os seus valores. Vejamos, como exemplo, o significado de alguns valores da tabela: F,= 82 > significa que, das 350 propriedades rurais consultadas, 82 possuem três animais portadores de brucelose. F;= 227 — signífica que, das 350 propriedades rurais consultadas, 227 possuem menos de três animais portadores de brucelose. f,= 0,1714 > significa que a proporção de propriedades rurais que possuem apenas um animal portador de brucelose é de 0,1714 (em percentual: 17,14). f;= 0,9714 > signífica que a proporção de propriedades rurais que possuem menos de quatro animais portadores de brucelose é de 0,9714 (em percentual: 97,14). 26 Piana, Machado e Selau Estatística Descritiva Para a obtenção das frequências absolutas das classes, contamos quantos valores (observações) do conjunto de dados pertencem a cada intervalo. As demais frequências, como já vimos anteriormente, derivam da frequência absoluta. Em distribuições de frequências de variáveis contínuas, geralmente existe interesse em uma outra quantidade conhecida como ponto médio ou centro de classe, denotada por c;. Os centros de classe são calculados da seguinte forma: EI+ES, cj= 2" onde: El,= extremo inferior da classe j Es, = extremo superior da classe j No exemplo, temos: o -16tIAS 353 47 og 2 2 = 19,3+22,6 . 41,9 -20,95 2 2 | B8B+30A TAS 745 2 2 A tabela de frequências completa é apresentada a seguir. Tabela 2.13. Frequência do peso ao nascer (em kg) de 60 bovinos machos da raça Ibagé. UFPel, 2001. j Classes F F í 1 Cc; 1 16|--19,3 7 7 0,1167 0,1167 17,65 2 193|-226 9 16 0,15 0,2667 20,95 3 226|-25,9 15 31 0,25 0,5167 24,25 4 259|--292 12 43 0,2 0,7167 27,55 5 292|--325 9 52 0,15 0,8667 30,85 6 325|--35,8 6 58 0,1 0,9667 34,15 7 3581391 2 60 0,0333 1,0000 37,45 L 60 - 1,0000 - - A interpretação das frequências da tabela é exemplificada através de alguns valores: F,= 15 > significa que 15 dos 60 bovinos nasceram com peso entre 22,6 e 25,9 kg (exclusive). F;= 52 > significa que 52 dos 60 bovinos nasceram com peso entre 16,0 e 32,5 kg (exclusive). f,= 0,15 - significa que a proporção de bovinos que nasceram com peso entre 19,3 e 22,6 kg (exclusive) é de 0,15 (em percentual: 15). fs= 0,9667 — significa que a proporção de bovinos que nasceram com peso entre 16 e 35,8 kg (exclusive) é de 0,9667 (em percentual: 96,67). 29 Piana, Machado e Selau Estatística Descritiva Exercícios propostos: 2.1. Os dados a seguir se referem aos números de pães não vendidos em uma certa padaria até a hora do encerramento do expediente: Construa a distribuição de frequências para esses dados. ona o “000 4 0 0 0 [o RR) Nono o0 0a ows o NON Na oo a“os 2.2. Os dados em rol (ordenação horizontal) abaixo se referem aos valores gastos (em reais) pelas primeiras 50 pessoas que entraram em um determinado supermercado, no dia 01/01/2000. 3,11 18,36 24,58 38,98 50,39 Faça a distribuição de frequências desses dados. 8,88 18,43 25,13 38,64 52,75 9,26 19,27 26,24 39,16 54,80 10,81 19,50 26,26 41,02 59,07 12,69 19,54 27,65 42,97 61,22 13,78 20,16 28,06 44,08 70,32 15,23 20,59 28,08 44,67 82,70 15,62 22,22 28,38 45,40 85,76 17,00 23,04 32,03 46,69 86,37 17,39 24,47 36,37 48,65 93,34 30 Piana, Machado e Selau Estatística Descritiva 2.2.1.3. Representação gráfica das distribuições de frequências As distribuições de frequências podem ser representadas graficamente de duas formas distintas e exclusivas, são elas: o histograma e o polígono de frequências. + Histograma O histograma consiste de um conjunto de retângulos contíguos cuja base é igual à amplitude do intervalo e a altura proporcional à frequência das respectivas classes. Na figura abaixo podemos observar o histograma da distribuição de frequências da Tabela 2.13. om sa 160 193 228 259 292 325 358 391 Classes Figura 2.6. Peso ao nascer (em kg) de 60 bovinos machos da raça Ibagé. UFPel, 2001. Quando trabalhamos com variáveis discretas, os retângulos dos histogramas se reduzem a retas e, consequentemente, deixam de ser contíguos. Vejamos um exemplo na figura a seguir que representa a distribuição da Tabela 2.12. F, 120 100 - o 1 2 3 4 5 8 Classes Figura 2.7. Número de animais portadores de brucelose em 350 propriedades rurais. UFPel, 2001. 31 Piana, Machado e Selau Estatística Descritiva Número de & Ruim ie de E Fumante duros qa uddo unos 18 E Bom 16 E Não Fumante 16 o 44 útimo 14 12 12 10 10 8 8 6 6 4 4 2 2 0 fe 0 Ruim Médio Bom ótimo Cesto Fumante Não Fumante Figura 2.9. Distribuição dos alunos da escola Figura 2.10. Distribuição dos alunos da E, segundo o hábito de fumar e conceito em escola E, segundo o hábito de fumar e Estatística. conceito em Estatística. A observação atenta destes gráficos já pode fornecer uma ideia da possível associação existente entre os fatores. Por exemplo, se o um fator apresenta o mesmo comportamento dentro de todos os níveis do outro, podemos supor que eles não estão associados, ou seja, comportam-se independentemente um do outro. Devemos observar, entretanto, que os gráficos fornecem apenas indicações, para verificar tais hipóteses (suposições) devemos utilizar os testes apropriados que serão vistos posteriormente. — Gráficos tridimensionais (estereogramas): compostos por paralelogramos, dispostos em eixos tridimensionais, separados entre si, cujas bases são determinadas pelos níveis dos fatores e as alturas pelas suas respectivas frequências (Figura 2.11). EPE 2] a ini 5 E ARE 2 pe E E = to ECEcrE E REGE CEUEtECTES Dezodarodãoo: Não Fumante o Fumante Figura 2.11. Distribuição dos alunos da escola E, segundo o hábito de fumar e conceito em Estatística. 34 Piana, Machado e Selau Estatística Descritiva 2.2.2.2. Frequências cruzadas de variáveis numéricas Ao estudarmos conjuntamente duas variáveis numéricas, as tabelas de classificação cruzada são, agora, denominadas tabelas de correlação. As ideias básicas sobre a construção dessas tabelas já foram vistas em seções anteriores. As tabelas de frequências cruzadas de duas variáveis contínuas também são construídas de modo similar às de classificação simples, ou seja, seguindo todos os passos já descritos na Seção 2.2.1.2. Primeiramente, procedemos à classificação das observações segundo uma das variáveis, para em seguida, dentro de cada classe da primeira, classificá-las de acordo com a outra variável. Por exemplo, na Tabela 2.15, observamos a classificação dos 400 alunos do Colégio C, segundo duas variáveis contínuas: Nota em Estatística e Nota em Matemática. Tabela 2.15. Distribuição dos alunos do Colégio C, segundo suas notas em Estatística e Matemática. a Matemática . Estatística Totais o-H4 4-7 7H10 0-4 32 25 5 62 4-7 20 183 82 285 T|—1o 7 27 19 53 Totais 59 235 106 400 Os gráficos geralmente utilizados para descrever dados como estes são os histogramas em três dimensões (estereogramas), nos quais os retângulos cedem lugar aos paralelogramos. Agora, a base de cada paralelogramos é definida pelas amplitudes das classes das variáveis envolvidas. Este tipo de gráfico é pouco utilizado em trabalhos científicos pela dificuldade de execução e interpretação através dos meios disponíveis. A relação entre duas variáveis contínuas também é comumente representada por diagramas de dispersão. Tomemos outro exemplo: para estudar o relacionamento entre as variáveis Peso do pai (X) e Peso do filho (Y), foram medidos os pesos (em kg) de dez alunos do Colégio C e de seus respectivos pais. Os resultados são apresentados numa tabela de correlação: Observação (i) 1 23 4 5 6 7/8 9 10 Peso dospais (x) | 78 65 86 68 83 68 75 80 82 66 Peso dosfilhos (y) | 60 52 68 53 65 57 58 62 66 53 Esta tabela possibilita a construção do diagrama de dispersão de pontos (Figura 2.12). Este tipo de gráfico pode fomecer uma indicação do tipo de relacionamento que existe entre as duas variáveis. Por exemplo, se os pontos apresentarem a forma de elipse indicam a existência de uma relação linear (positiva ou negativa) entre as variáveis. A Figura 2.12 parece evidenciar um relacionamento linear positivo entre os pesos dos dez alunos e os pesos dos seus respectivos pais, sugerindo um estudo mais aprofundado desta correlação. Através da análise de regressão linear, que será abordada mais adiante, é possível obter uma equação do tipo Y = a + bX, que descreve o peso dos filhos (Y) como uma função linear do peso dos pais (X). 35 Piana, Machado e Selau Estatística Descritiva Peso dos filhos só [55] 70 75 so 85 so Peso dos pais Figura 2.12. Dispersão dos pesos (em kg) de dez alunos do Colégio C e de seus respectivos pais. 2.3. Medidas Descritivas As medidas descritivas têm o objetivo de reduzir um conjunto de dados observados (numéricos) a um pequeno grupo de valores que deve fornecer toda a informação relevante a respeito desses dados. Estas medidas são funções dos valores observados e podem ser classificadas em quatro grupos: — Medidas de localização, também denominadas medidas de tendência central ou medidas de posição: indicam um ponto central onde, em muitas situações importantes, está localizada a maioria das observações. — Medidas separatrizes: indicam limites para proporções de observações em um conjunto, podendo ser utilizadas para construir medidas de dispersão. — Medidas de variação também denominadas medidas de dispersão: informam sobre a variabilidade dos dados. — Medidas de formato: informam sobre o modo como os valores se distribuem. Compreendem as medidas de assimetria, que indicam se a maior proporção de valores está no centro ou nas extremidades, e as medidas de curtose, que descrevem grau de achatamento da distribuição. Existe uma enorme variedade de medidas descritivas, muitas delas competidoras entre si. Um guia geral para escolha da medida mais adequada pode ser visto a seguir: * Com que objetivo a medida está sendo obtida? + A medida é fácil de interpretar? E intuitiva? + Existem valores atípicos que podem afetá-la exageradamente? + O propósito da análise é meramente descritivo ou planeja-se fazer inferências? Uma medida descritiva deverá, sempre que possível, possuir as seguintes características: ser representativa, ser de fácil interpretação e prestar-se bem a tratamento matemático e/ou estatístico em etapas posteriores. 36 Piana, Machado e Selau Estatística Descritiva É possível demonstrar esta propriedade aplicando as propriedades do somatório: LG-D=Lx-D% =5x,-nX, sendo x 2%, temos - Ex =5x-n : -Lx-5x-0 5º propriedade: A soma dos quadrados dos desvios em relação a uma constante c, S (x -c)?, é minima quando c=X. Podemos demonstrar esta propriedade, somando e subtraindo do desvio uma constante de interesse (X) e aplicando as propriedades do somatório: =(x-0=5 (x -c+X-3? =D 6x, -3)+ o]? =D (x? +2(,-0(K-0) + (K-0)?] =5(x-3+5 26x JK -0)+ 5 (Ko)? =5 (x +2(K-0)5 (x, 9 +n(X-c)?, sendo 3 (x, -X)=0, temos Ly en(R-e)? Observamos que > (x, — c) assumirá o menor valor quando c=X, pois, neste caso, n(x-c2-0. Podemos verificar a 3º e a 4º propriedades da média aritmética no seguinte conjunto de dados: i Xi (=) (x, =>) (x, - 6)? (4-9)? 1 9 2 4 9 0 2 7 0 0 1 4 3 5 -2 4 1 16 4 10 3 9 16 1 5 4 -3 9 4 25 z 35 0 26 31 46 Verificamos, assim, que: — 5 (x-X)=0 (terceira propriedade da média) -D(x-0?-26 < 5(x-62-31 (quarta propriedade da média) -L(g-M?=26 < E(x-9)-46 39 Piana, Machado e Selau Estatística Descritiva * Mediana A mediana, representada por Md, é a medida que divide um conjunto de dados ordenado em duas partes iguais: 50% dos valores ficam abaixo e 50% ficam acima da mediana. Existem dois casos diferentes para o cálculo da mediana, mas em ambos o primeiro passo a ser tomado é a ordenação dos dados. 1º caso: quando n é ímpar Determinamos, primeiramente, a posição mais central (p) do conjunto de dados ordenado A mediana será o valor do conjunto de dados que ocupa a posição p, ou seja, Md = xp. Exemplo: Se X = tempo (h) Para x; = 4, 5, 7,9, 10, temos n+1 5+1 = = =3 P 2 2 logo, Md=xX,=X3=7h 2º caso: quando n é par Neste caso, temos duas posições centrais no conjunto de dados ordenado, denotadas = x n+1 ais A por p« e pz. Ao utilizarmos a expressão p= 2" obtemos um valor não inteiro. As posições p, e p> são os dois inteiros mais próximos do valor de p. A mediana será a média aritmética simples dos valores do conjunto de dados que ocupam as posições p« e p>, ou seja, Md = Set Xe 2 Exemplo: Se X = tempo (h) Para x; = 4,5, 7,9, 10, 12, temos n+1 6+1 p,=3 =D as P=2 "2 <S po=4 Md = *e1$ Xpa 2X + .1+9 2 2 logo, =8h. 40 Piana, Machado e Selau Estatística Descritiva * Moda A moda, representada por Mo, é o valor de maior ocorrência num conjunto de dados. E a única medida que pode não existir e, existindo, pode não ser única. Exemplos: X= peso (kg) 1. Parax=2,3,7,5,7,5,8,7,9, temos Mo=7kg 2. Parax;= 1,3,4,5,4,8,6,8, temos Mo = 4kg e 8kg (conjunto bimodal) 3. Parax=5,7,8,3,9,1,4, não existe Mo (conjunto amodal) 4. Parax;= 1,3,4,4,5,1,3,5, não existe Mo (conjunto amodal) 4 Piana, Machado e Selau Estatística Descritiva — Para Q,, temos: p= no, 2(n+ 1) — Para Q», temos: p= A ; 3(n+ 1) — Para Qs, temos: p= Z 2º caso: quando n é par — Para Q,, temos: p= 2. — Para Q», temos: p= 2n+2 : — Para Qs, temos: p= EA . O quartil Q; será o valor do conjunto de dados que ocupa a posição p, ou seja, Q = Xp. No caso de p não ser um número inteiro, o quartil será a média aritmética dos dois valores que ocupam as posições correspondentes ao menor e ao maior inteiros mais próximos de p. Por exemplo, se p=7,5, o quartil será a média aritmética dos valores que ocupam as posições 7 e 8. Exemplos: 1º caso: quando n é impar Seja X= peso (kg) e x=3,3,4,6,7,9,9,11e12 — Para Q,, temos po SA o 4 4 Como p não é um número inteiro, Q, será a média aritmética dos valores que ocupam as posições 2 e 3, ou seja, Xo+X 3+4 q- =3,5kg — Para Q;», temos p= ao: 1) . ao 1) -5 Como p é inteiro, Q> = xp, OU seja, Q,=x,=7kg — Para Qs, temos . 3(n+1) . 3(9+1) -75 4 4 Como p não é inteiro, Q; será a média aritmética dos valores que ocupam as posições 7 e 8, ou seja, 44 Piana, Machado e Selau Estatística Descritiva =XrtXa D+ og 2 2 Q, 2º caso: quando n é par Seja X=Peso(kg) e x=3,3,4,6,7,9,9,11,12€e14 — Para Q,, temos .n+ 2 . 10+2 -3 4 4 Sendo p um número inteiro, então, Q,=x,=4kg — Para Q», temos p-2+2 201042 4 4 5,5 Como p não é inteiro, Q> será a média aritmética dos valores que ocupam as posições 5 e 6, ou seja, X+X 7+9 Q->5"De CTT gk 2 2 2 g — Para Qs, temos po 012 31042. «DE. 8 Sendo p um número inteiro, então, Q,=x,=11kg 2.3.3. Medidas de variação ou dispersão As medidas de variação ou dispersão complementam as medidas de localização ou tendência central, indicando quanto as observações diferem entre si ou o grau de afastamento das observações em relação à média. As medidas de variação mais utilizadas são: a amplitude total, a variância, o desvio padrão e o coeficiente de variação. + Amplitude total A amplitude total, denotada por a,, fornece uma ideia de variação e consiste na diferença entre o maior valor e o menor valor de um conjunto de dados. Assim, temos a =ES-EI, onde: ES: extremo superior do conjunto de dados ordenado; El: extremo inferior do conjunto de dados ordenado. A amplitude total é uma medida pouco precisa, uma vez que utiliza apenas os dois valores mais extremos de um conjunto de dados. Também por esta razão é extremamente 45 Piana, Machado e Selau Estatística Descritiva influenciada por valores discrepantes. É utilizada quando apenas uma ideia rudimentar da variabilidade dos dados é suficiente. Exemplo: Se X = tempo (h) Para x;=9, 7,5, 10, 4, temos a,-ES-El-=10-4-6h. Significado: todos os valores do conjunto de dados diferem, no máximo, em 6h. + Amplitude interquartílica A amplitude interquartílica, denotada por a, é a diferença entre o terceiro quartil (Qs) e o primeiro quartil (Q+). Assim, temos Apesar de ser uma medida pouco utilizada, a amplitude interquartílica apresenta uma característica interessante que é a resistência, ou seja, esta medida, ao contrário da amplitude total, não sofre nenhuma influência de valores discrepantes. Exemplo: Seja X= peso (kg) e x=3,3,4,6,7,9,9,11,12, onde: Q;= 10kg e Q,= 3,5 kg., temos a,=Q,-Q,=10-3,5=6,5kg Significado: 50% dos valores (mais centrais) estão dentro deste intervalo, portanto, diferem, no máximo, em 6,5 kg. + Variância A variância, denotada por s?, é a medida de dispersão mais utilizada, seja pela sua facilidade de compreensão e cálculo, seja pela possibilidade de emprego na inferência estatística. A variância é definida como sendo a média dos quadrados dos desvios em relação à média aritmética. Assim, temos s2- » (x; =? n-1 onde: n-1: é o número de graus de liberdade ou desvios independentes. A utilização do denominador n— 1, em vez den, tem duas razões fundamentais: 1. Como a soma dos desvios é nula, ou seja, 5:(x-X)=0, existe n-1 desvios independentes, isto é, conhecidos n-1 desvios o último está automaticamente determinado, pois a soma é zero. 2. O divisor n- 1 faz com que a variância possua melhores propriedades estatísticas. 46 Piana, Machado e Selau Estatística Descritiva Holandesa: x,=25kg, s,= 4,2kg, CV, = 16,8% x % = 13kg, 8, =3,4kg, CV, = 26,2% Jersey: Podemos observar que se utilizássemos o desvio padrão para comparar as variações dos conjuntos de dados, concluiriamos que o grupo das vacas holandesas é mais variável, pois apresenta o maior valor para esta medida. Entretanto, não podemos deixar de considerar que o desvio padrão 4,2, mesmo sendo o maior, quando relacionado à média 25, representa uma porção menor deste valor do que o desvio padrão 3,4 quando relacionado à média 13. Sendo assim, quando as médias são muito desiguais, devemos utilizar na comparação dos conjuntos de valores o CV que é uma medida relativa. 2. Consideremos, agora, que x; e y; são conjuntos de valores referentes a alturas (em m) e pesos (em kg), respectivamente, de um grupo de estudantes, para os quais foram obtidas as seguintes medidas: Altura: X=165cm, sy=30cm, CV, = 18,2% Peso: Y-58kg, s,-9kg, CV,=15,5% Verificamos, neste caso, que para a comparação de conjuntos de valores expressos em diferentes unidades de medida, o CV é a única medida que pode ser utilizada por ser desprovida de unidade de medida. Se utilizássemos qualquer outra medida de variação estaríamos comparando centímetros com quilogramas, o que não seria possível, uma vez que tais grandezas não são comparáveis. 2.3.4. Medidas de formato O formato é um aspecto importante de uma distribuição. Embora mudanças em uma medida de variação também provoquem alterações no aspecto visual, o formato de uma distribuição se relaciona com as ideias de simetria e curtose. Várias medidas têm o objetivo de informar sobre o formato de uma distribuição. Entre as mais precisas estão os coeficientes de assimetria e de curtose, que são calculados a partir dos momentos da distribuição. + Momentos Os momentos, denotados por m,, são medidas calculadas com o propósito de estudar a distribuição. De um modo geral, tanto mais conhecemos uma distribuição quanto mais conhecermos sobre os seus momentos. O momento de ordem r centrado num valor a é dado por m-Lecar n Dois valores de a geram momentos importante num conjunto de dados: — Quando a=0, temos os momentos centrados na origem, denominados momentos ordinários de ordem r e representados por my. Assim, temos r EX n 49 Piana, Machado e Selau Estatística Descritiva Exemplos: Parar = 1, temos: my = =— Parar = 2, temos: m, = Parar = 3, temos: m; = Parar = 4, temos: my = =+— — Quando a =X, temos os momentos de ordem r centrados na média e representados por m, . Assim, temos Dam n m r Exemplos: Parar = 1, temos: m, = D (6-5) n Parar = 2, temos: m, = Dx? n Lg? Parar = 3, temos: m, = n Et” n Parar = 4, temos: m, = + Coeficiente de assimetria Entre as várias medidas de assimetria que devem informar se a maioria dos valores se localiza à esquerda, ou à direita, ou se estão uniformemente distribuídos em torno da média aritmética, temos o coeficiente de assimetria, denotado por a, . Esta medida indica o grau e o sentido do afastamento da simetria e é obtida utilizando o segundo e o terceiro momentos centrados na média, através da seguinte expressão a.= 5 = . m, V ma A classificação da distribuição quanto a simetria é feita de acordo com o valor do a, : - Se a,< 0, a distribuição é classificada como assimétrica negativa, indicando que a maioria dos valores são maiores ou se localizam à direita da média aritmética. - Se a,= 0, a distribuição é classificada como simétrica, indicando os valores estão uniformemente distribuídos em torno da média aritmética. - Se a,> 0, a distribuição é classificada como assimétrica positiva, indicando que a maioria dos valores são menores ou se localizam à esquerda da média aritmética. 50 Piana, Machado e Selau Estatística Descritiva x lh alo, Assimétrica negativa Simétrica Assimétrica positiva * Coeficiente de curtose As medidas de curtose indicam o grau de achatamento de uma distribuição. O coeficiente de curtose, denotado por a, , é calculado a partir do segundo e do quarto momentos centrados na média, através da seguinte expressão A curtose está relacionada com o grau de concentração das observações no centro e nas caudas da distribuição e não tem interpretação tão intuitiva quanto a simetria. A classificação da distribuição é feita de acordo com o valor do a,, tendo por base a curtose que ocorre na distribuição normal, que é classificada como mesocúrtica. - Se a,<3, a distribuição é classificada como platicúrtica, indicando que ocorre baixa concentração de valores no centro, tornando a distribuição mais achatada que a distribuição normal. A concentração de valores nos eixos média mais ou menos o desvio padrão é maior que na distribuição normal. - Se a,=3, a distribuição é classificada como mesocúrtica, indicando que a concentração das observações ocorre de forma semelhante à da distribuição normal. A concentração de valores nos eixos média mais ou menos o desvio padrão é maior que na distribuição normal. - Se a,>3, a distribuição é classificada como leptocúrtica, indicando que ocorre alta concentração de valores no centro e nas caudas, o que provoca um pico maior que o da distribuição normal. A concentração de valores em torno dos eixos média mais ou menos o desvio padrão é menor do que na distribuição normal. Rand assa Platicúrtica Mesocúrtica Leptocúrtica As medidas de curtose são muito pouco utilizadas, exceto em algumas áreas específicas como vendas, onde geralmente existe interesse no estudo da extensão dos picos das distribuições. 51 Piana, Machado e Selau Estatística Descritiva Como n é par, existem duas posições centrais no conjunto. Sendo pH sos, as posições p, e p> são os inteiros mais próximos de 30,5, ou seja, 30 e 31, respectivamente. A primeira classe a apresentar frequência absoluta acumulada igual à posição (de maior valor, no caso de n par) da mediana é a terceira, F/=31, significando que os valores que ocupam as posições 30 e 31 pertencem a esta classe. Portanto, a classe mediana é a terceira. A classe com maior frequência absoluta também é a terceira, F, = 15. Assim, a classe modal é a terceira. = 1664,54kg? 60-1 Variância: s? = =28,21kg? Desvio padrão: s = Js? =/28,21kgº = 5,331kg Coeficiente de variação: CV = 100- = 5,33 1kg — 100 = 20,37% x, 26,07kg Momentos centrados na média: F(c,-X)? 2 | LHC) 1664 64h0! o ça n 60 F(c,-X)* Ê | LHC) t65TAZHO aa n 60 F(c-X) é (AME 106406 10. qe rrygf n Coeficientes de assimetria e curtose: o meg mar” 27,74kg' (PT TAkO, : a,-M4 - MS6TTkO 83 -, indica que a distribuição é platicúrtica ma (2774k9º) = 0,189 — indica que a distribuição é simétrica Devemos salientar que as medidas para dados agrupados em classe vêm sendo cada vez menos utilizadas. A obtenção de medidas descritivas a partir de distribuições de frequências tem como principal objetivo facilitar o processo de cálculo, pois, quando se trata de conjuntos de dados muito grandes, essa tarefa é bastante trabalhosa. Outra razão que justifica o uso dessas medidas é a falta de acesso aos dados originais (não agrupados). Contudo, sabe-se que medidas obtidas a partir de dados agrupados em classe, na maioria das vezes, 54 Piana, Machado e Selau Estatística Descritiva não são exatas. Com o advento da computação e o desenvolvimento de programas estatísticos, o problema da dificuldade no processo de cálculo foi superado, uma vez que estes programas executam cálculos trabalhosos com rapidez e exatidão. Sendo assim, não havendo mais a dificuldade para a obtenção das medidas exatas, não há razão para continuarmos utilizando as medidas aproximadas. No quadro abaixo podemos observar os valores das medidas calculadas a partir dos dados não agrupados e a partir da tabela de distribuição de frequências. Dados não agrupados Dados agrupados em classe X= 25,78 kg X= 26,07 kg Md = 25 kg Classe mediana: [22,6 ; 25,9) Mo = 23 kg Classe modal: [22,6 ; 25,9) s?= 28,64 kg? s?= 28,21 kg? s=5,352kg s=5,331kg CV= 20,76% CV= 20,37% mo = 28,16kg? mo=27,74kg? ma = 32,48 kg? ma=27,62kg? ma = 1.875,62 kg? ma = 1.756,77 kg? as = 0,218 as = 0,189 a,= 2,365 a,= 2,283 Comparando os valores das medidas calculadas pelos dois processos, podemos verificar que as medidas obtidas dos dados agrupados em classe são aproximações daquelas obtidas a partir dos dados não agrupados, que são as medidas exatas. Tanto maior será esta aproximação, quanto mais simétrica for a distribuição dos valores dentro dos intervalos de classe. * Medida descritiva e escala de medida Algumas medidas descritivas exigem uma escala de medida mínima para serem obtidas. A tabela relaciona a escala necessária para algumas medidas. Medida Escala mínima Moda Escala nominal Percentis Escala ordinal Média aritmética Escala intervalar 55 Piana, Machado e Selau Estatística Descritiva Exercícios propostos: 2.5. Os valores que seguem são os tempos (em segundos) de reação a um alarme de incêndio, após a liberação de fumaça de uma fonte fixa: 129117914 6 10 Calcule as medidas de localização (média, mediana e moda) e as medidas de variação (amplitude total, variância, desvio padrão e coeficiente de variação) para o conjunto de dados. 2.6. Foram registrados os tempos de frenagem para 21 motoristas que dirigiam a 30 milhas por hora. Os valores obtidos foram: 60 58 70 80 46 61 65 74 75 55 67 56 70 72 61 66 58 68 70 68 58 Para este conjunto de valores, calcule os quartis e a amplitude interquartílica e interprete esses valores. 2.7. Calcule as medidas descritivas para o conjunto de dados referente ao número de pães não vendidos em uma certa padaria até a hora do encerramento do expediente j Classes F F [e Fc, -%) Fc, o)? Fc; o) 1 0 20 2 1 7 3 2 7 4 3 3 5 4 2 6 5 1 L 40 - 2.8. Calcule as medidas descritivas para o conjunto de dados agrupados em classes, apresentado na tabela abaixo. Frequência do valor gasto (em reais) pelas primeiras 50 pessoas que entraram em um determinado supermercado, no dia 01/01/2000. j Classes S; F F ch Fi(c; -*) Fi(c; o) Fc; o) 1 3,11 | 16,00 8 2 16,00 |--28,89 20 3 28,89|-41,78 6 4 41,78|--54,67 8 5 54,67 |-67,56 3 6 67,56 |-80,45 1 7 80,45 |-193,34 4 L — 50 - 56 Piana, Machado e Selau Estatística Descritiva EI O Md O Es 16 2 25 30 45 (e! aç=0 [eo 22 30 EL Dl=g Md Ds=20 Es 15 25 45 O resumo de cinco números permite verificar que a distribuição não é simétrica, pois as distâncias entre esses valores são diferentes. Veremos a seguir que, através dos quartis e da amplitude interquartílica, também é possível identificar a presença de valores discrepantes no conjunto de dados. Identificação de valores discrepantes Um critério objetivo para a identificação de valores discrepantes num conjunto de dados utiliza duas medidas denominadas cerca inferior (Cl) e cerca superior (CS). A cerca inferior é calculada subtraindo-se do primeiro quartil uma e meia amplitude interquartílica, e a cerca superior, somando-se esta mesma quantidade ao terceiro quartil. Assim, temos: Cl=Q,-1,5a, e CS-Q,+1,5a, São considerados discrepantes os valores que estivem fora do seguinte intervalo: [Q,-1,58,;0,+1,5a,]. Valores menores que a cerca inferior são denominados discrepantes inferiores e os valores maiores que a cerca superior são os discrepantes superiores. No exemplo, serão considerados discrepantes os valores que estiverem fora dos limites da cerca superior e da cerca inferior: Cl=Q,-1,5a,=22-1,5x8=10 CS-Q,+1,5a,=30+1,5x8=42 Verificamos que o valor 45 ultrapassa a cerca superior, portanto, é classificado como discrepante superior. + Gráfico em caixa (box plot) A informação dada pelo resumo de cinco números pode ser apresentada em forma de um gráfico em caixa, que agrega uma série de informações a respeito da distribuição, tais como localização, dispersão, assimetria, caudas e dados discrepantes. Antes de construir o gráfico precisamos definir o que são valores adjacentes. São adjacentes o menor e o maior valores não discrepantes de um conjunto de dados, ou seja, o maior valor que não ultrapassa a cerca superior e o menor valor que não ultrapassa a cerca inferior. Se num conjunto de dados 59 Piana, Machado e Selau Estatística Descritiva nenhum valor é considerado discrepante, os valores adjacentes são os próprios extremos. Para construir o gráfico em caixa, consideraremos um retângulo onde estarão representados os quartis e a mediana. A partir do retângulo, para cima e para baixo, seguem linhas, denominadas bigodes, que vão até os valores adjacentes. Os valores discrepantes recebem uma representação individual através de uma letra ou um símbolo. Assim, obtemos uma figura que representa muitos aspectos relevantes de um conjunto de dados, como podemos observar na ilustração abaixo. 45 * = Discrepante superior = Adjacente superior 40 35 Terceiro quartil 30 Mediana 25 Primeiro quartil 20 = Adjacente inferior 15 + = Discrepante inferior A posição central dos valores é dada pela mediana e a dispersão pela amplitude interquartílica (a). As posições relativas da mediana e dos quartis e o formato dos bigodes dão uma noção da simetria e do tamanho das caudas da distribuição. Na figura abaixo podemos observar o gráfico em caixa representando diferentes tipos de distribuições: a) distribuição assimétrica positiva, com três valores discrepantes superiores, b) distribuição simétrica, com um valor discrepante inferior; c) distribuição assimétrica negativa, sem valores discrepantes. 45 as 45 * * 40 40 a * EO 35 35 0 30 30 o 25 25 20 l 20 20 o 15 * 15 a) assimétrica positiva b) simétrica c) assimétrica negativa 60 Piana, Machado e Selau Estatística Descritiva Vale lembrar que quando encontramos um valor discrepante num conjunto de dados, a sua origem deve ser investigada. Muitas vezes, os valores discrepantes, de fato, fazem parte do conjunto de dados, reforçando a característica assimétrica da distribuição. Mas, eventualmente, estes valores podem ser oriundos de erros na aferição ou no registro dos dados. Em geral, distribuições com caudas longas (indicadas por bigodes longos no gráfico), característica comum de distribuições assimétricas, apresentam uma tendência maior de produzir valores discrepantes. Nas figuras acima, os bigodes de diferentes tamanhos indicam distribuições assimétricas. O valor discrepante parece ser uma anomalia maior na figura b, pois se trata de uma distribuição simétrica e com caudas curtas. De qualquer modo, uma cuidadosa inspeção nos dados e nas eventuais causas da ocorrência desse(s) valor(es) é sempre uma providência necessária antes que qualquer atitude seja tomada em relação a esses dados. A seguir temos o gráfico em caixa representando o conjunto de dados do exemplo, que se refere aos pesos ao nascer de bovinos machos da raça Ibagé. 45 * ao 35 30 + Diagrama de ramo e folhas Trata-se de uma ferramenta exploratória útil para descrever pequenos conjuntos de dados. O método fornece uma boa visão geral dos dados sem que haja uma perda de informação detectável. Cada valor retém sua identidade e a única informação perdida é a ordem em que foram obtidos os dados. Eventualmente, alguns algarismos podem ser desprezados para facilitar a representação do conjunto. O diagrama de ramos e folhas é um procedimento alternativo para resumir um conjunto de valores, que fornece uma ideia da forma de sua distribuição, semelhante a um histograma. Este gráfico é uma boa opção quando temos em mãos somente os dados, caneta e papel. Para ilustrar a montagem do diagrama de ramo e folhas, consideremos os seguintes dados relativos às notas de 40 alunos em uma prova de Estatística. O primeiro passo é a separação dos dados, combinando todos os valores que começam com 4, todos que começam com 5, todos que começam com 6, e assim por diante. Assim, temos 61 Piana, Machado e Selau Estatística Descritiva 2.5. Bibliografia ANDRES, A.M., CASTILLO, J. de D.L. del Bioestadistica para las Ciências de la Salud. Madrid: Ediciones Norma, 1988. 614 p. BOTELHO, E.M.D., MACIEL, A.J. Estatística Descritiva (Um Curso Introdutório) Viçosa: Universidade Federal de Viçosa, 1992. 65p. COSTA, S.F. Introdução Ilustrada à Estatística (com muito humor!). 2.ed., São Paulo: Harbra, 1992. 303p. FARIA, E.S. de Estatística Edição 97/1. (Apostila) FERREIRA, D.F. Estatística Básica. Lavras: Editora UFLA, 2005, 664p. FREUND, JE, SIMON, GA. Estatística Aplicada. Economia, Administração e Contabilidade. 9.ed., Porto Alegre: Bookman, 2000. 404p. PIMENTEL GOMES, F. Iniciação à Estatística São Paulo: Nobel, 1978. 211p. SILVEIRA JÚNIOR, P., MACHADO, A.A., ZONTA, E.P., SILVA, J.B. da Curso de Estatística v.1, Pelotas: Universidade Federal de Pelotas, 1989. 135p. SPIEGEL, M.R. Estatística São Paulo: McGraw-Hill, 1972. 520p. Sistema Galileu de Educação Estatística. Disponível em: <http:/Avww .galileu.esalq.usp.br> 84 3.1. 3.2. 3.3. 3.3. Unidade III Elementos de Probabilidade Introdução à teoria das probabilidades.....................ii 66 3.1.1. Introdução... ires iecaa aaa anca aaa aneaeaa anna 66 3.1.2. Conceitos fundamentais... 68 3.1.3. Conceitos de probabilidade.. 69 3.1.4. Teoremas para o cálculo de probabilidades. 69 3.1.5. Probabilidade condicional e independência..................i 73 Variáveis aleatórias................ sete aceeee ceramica 7 3.2.1. Introdução e conceito. mm 3.2.2. Variáveis aleatórias discreta: 79 3.2.3. Variáveis aleatórias contínuas................. eee eeesesrieenees 86 Distribuições de probabilidade.................... re 92 3.3.1. Distribuições de probabilidade de variáveis discretas. 92 3.3.2. Distribuições de probabilidade de variáveis contínuas. . 104 Bibliografia. 117 Piana, Machado e Selau Elementos de Probabilidade 3.1. Introdução à teoria das probabilidades 3.1.1. Introdução A Estatística, desde as suas origens (antigo Egito — 2000 anos a.C.) até meados do século XIX, se preocupava apenas com a organização e a apresentação de dados de observação coletados empiricamente (Estatística Descritiva). Somente com o desenvolvimento da teoria das probabilidades foi possível que a Estatística se estruturasse organicamente e ampliasse seu campo de ação, através da criação de técnicas de amostragem mais adequadas e de formas de relacionar as amostras com as populações de onde provieram (Inferência Estatística). A probabilidade é uma área relativamente nova da matemática (considerando a idade da matemática) que tem como finalidade a modelagem de fenômenos aleatórios. Modelar significa conhecer matematicamente. Uma das funções da matemática é a criação de modelos que possibilitem o estudo dos fenômenos da natureza. Ao estudar um fenômeno, temos sempre o interesse de tornar a sua investigação mais precisa e, para isso, tentamos formular um modelo matemático que melhor o explique. Na formulação do modelo matemático mais adequado deve-se levar em conta que certos pormenores sejam desprezados com o objetivo de simplificar o modelo. Deste modo, tanto maior será a representatividade do modelo quanto menor foi a importância destes detalhes na elucidação do fenômeno considerado. A verificação da adequação do modelo escolhido não pode ser feita sem que alguns dados de observação sejam obtidos. Através da comparação dos resultados previstos pelo modelo com um determinado número de valores observados, poderemos concluir se o modelo é ou não adequado para explicar o fenômeno em estudo. Dependendo do fenômeno que está sendo estudado, os modelos matemáticos podem ser de dois tipos: a) Modelo determinístico: é aquele em que ao conhecer as variáveis de entrada, ou seja, as condições do experimento, é possível determinar as variáveis de saída, isto é, os seus resultados. Para os fenômenos determinísticos existe a certeza do resultado que ocorrerá. Na física clássica, a maioria dos fenômenos estudados são determinísticos. Exemplo: Se o deslocamento de um objeto é definido pela expressão s=vt e são conhecidos os valores de v (velocidade) e t (tempo), então o valor de s fica implicitamente determinado. b) Modelo estocástico, probabilístico ou aleatório: é aquele em que, mesmo conhecendo as condições do experimento, não é possível determinar o seu resultado final. Neste modelo, é introduzido um componente aleatório e só é possível determinar a chance de ocorrência de um resultado. Na biologia, os fenômenos são probabilísticos. Exemplo: O nascimento de um bovino. Não é possível determinar o sexo do recém nascido, somente a sua probabilidade de ocorrência: 0,5 para fêmea e 0,5 para macho. A modelagem de um experimento aleatório implica em responder três questões fundamentais: — Quais as possíveis formas de ocorrência? - Quais são as chances de cada ocorrência? — De que forma se pode calcular isso? 66 Piana, Machado e Selau Elementos de Probabilidade + Ponto amostral: é qualquer resultado particular de um experimento aleatório. Todo espaço amostral e todo evento são constituídos por pontos amostrais. + Eventos especiais Evento impossível: é aquele evento que nunca irá ocorrer, é também conhecido como o conjunto vazio (2). E um evento porque é subconjunto de qualquer conjunto, portanto é subconjunto de S(Z c S). Exemplo: A, = ((x, y). x2+y? < 0) Evento certo: é aquele evento que ocorre toda vez que se realiza o experimento, portanto, esse evento é o próprio S. E evento porque todo conjunto é subconjunto de si mesmo (Scs). Exemplo: A, = ((x, y);x2+y? > 0) Eventos mutuamente exclusivos Dois eventos A e B associados a um mesmo espaço amostral S, são mutuamente exclusivos quando a ocorrência de um impede a ocorrência do outro. Na teoria dos conjuntos, correspondem aos conjuntos disjuntos, que não possuem elementos comuns (A n B = 2). Exemplos: Experimento 1: Lançamento de uma moeda e observação do resultado. S = (c, k), se definimos A = Ocorrência de cara A=(c) B= Ocorrência de coroa B=(k), então A e B são mutuamente exclusivos. Experimento 2: Lançamento de um dado e observação da face superior. S=(1,2,3,4,5, 6), se definimos A = Ocorrência de número ímpar A=(1,3,5) B = Ocorrência de maior do que 4 B=(5,6) AnB= (5), logo, os eventos A e B não são mutuamente exclusivos. 3.1.3. Conceitos de probabilidade 3.1.3.1. Conceito clássico ou probabilidade “a priori” Como a teoria das probabilidades está historicamente ligada aos jogos de azar, esta associação gerou, inicialmente, um conceito chamado conceito clássico ou probabilidade “a priori”, devido a Laplace. Definição: Seja E um experimento aleatório e S o espaço amostral a ele associado, com n pontos amostrais, todos equiprováveis. Se existe, em 8, m pontos favoráveis à realização de um evento A, então a probabilidade de A, indicada por P(A), será: Pierre-Simon Laplace (1749 - 1827) m &A 69 Piana, Machado e Selau Elementos de Probabilidade Notemos, entretanto, que, para que este conceito tenha validade, duas pressuposições básicas devem ser atendidas: 1. O espaço amostral S é enumerável e finito. 2. Os elementos do espaço amostral S são todos equiprováveis. Exemplo: Consideremos o seguinte experimento: lançamento de uma moeda honesta duas vezes e observação do lado superior. O espaço amostral deste experimento é S = (cc, ck, kc, kk) e todos os seus pontos amostrais são equiprováveis: 1 p(cc) = p(kc) = p(ck) = p(kk) = Z Define-se o evento A = ocorrência de uma cara, então A= (ck, kc) e p(aj=M ZA 2 1 n 48 4 2 pois S possui quatro pontos amostrais, dos quais dois são favoráveis à ocorrência de A. Consideremos, agora, outra situação onde o espaço amostral S refere-se ao número de caras obtido nos dois lançamentos da moeda honesta. O espaço amostral passa a ser S = (0, 1, 2) e o evento A = ocorrência de uma cara, ou seja, A = (1). Observamos, nesta situação, que os pontos amostrais de S (0, 1 e 2) não são todos equiprováveis, pois 1 e p(2)= poor À. P(O) = p(kk)= —, p(1)= p(kc) + p(ck) = 2 Z Portanto, embora o evento A seja o mesmo, como uma das pressuposições básicas não foi atendida, o conceito clássico não pode ser imediatamente aplicado para calcular a sua probabilidade. + pls pls pls Podemos observar, a seguir, que a aplicação do conceito clássico, nesta situação, não conduz ao um resultado incorreto: P(A)= - A 1 “Ss 3 Recomendamos, então, partir sempre do espaço amostral original do experimento para aplicar o conceito clássico. 3.1.3.2. Frequência relativa ou probabilidade “a posteriori” O conceito de frequência relativa como estimativa de probabilidade ou probabilidade “a posterior” surgiu através de Richard Von Mises. Definição: Seja E um experimento aleatório e A um evento. Se após n realizações do experimento E (sendo n suficientemente grande), forem observados m resultados favoráveis ao evento A, então uma estimativa da probabilidade P(A) é dada pela frequência relativa Richard Von Mises f= m n” (1883- 1953) 70 Piana, Machado e Selau Elementos de Probabilidade Este conceito é baseado no princípio estatístico da estabilidade, ou seja, a medida que o número de repetições do experimento (n) aumenta, a frequência relativa f = m se aproxima n de P(A). O n deve ser suficientemente grande para que se possa obter um resultado com margem de erro razoável. Define-se o erro desta estimativa pela expressão f- P(A) = erro. A Figura 3.1 ilustra o princípio da estabilidade, tomando-se por base o número crescente de lançamentos de uma moeda e a probabilidade de se obter cara. f 1 ia aos 0 n D14 23 4 5 6 7 8 914041 1421314 1516 147 181920 ckkockocckkokEkkococaokock Figura 3.1. Estabilização da frequência relativa f quando n cresce. Exemplo: Em Sobral (CE), observaram-se seis anos de seca no período de 1901-66 (66 anos). Qual é a probabilidade de ser seco o próximo ano? A frequência relativa f será uma estimativa da probabilidade de ocorrer seca no próximo ano: pen 81 n 66 11 3.1.3.3. Conceito moderno ou axiomático Já no século XX, como a conceituação até então não era apropriada a um tratamento matemático mais rigoroso, Andrei Nikolaevich Kolmogorov conceituou probabilidade através de axiomas rigorosos, tendo por base a teoria da medida. Definição: Se A é um evento do espaço amostral S, então o número real P(A) será denominado probabilidade da ocorrência de A se satisfizer os seguintes axiomas: Axioma 1. 0< P(A) <1. Axioma 2. P(S) = 1. Axioma 3. Se A e B são eventos de S mutuamente exclusivos, então P(A U B)= P(A) + P(B). Andrei N. Kolmogorov 1 Piana, Machado e Selau Elementos de Probabilidade Experimento: Uma caixa contém cinco bolas equiprováveis, sendo três azuis e duas brancas. Duas bolas são retiradas uma a uma e sua cor é observada. Definimos, então, dois eventos: Ay: a primeira bola retirada é azul. A»: a segunda bola retirada é branca. As probabilidades dos eventos A, e A, serão calculadas em duas situações. Situação 1. Consideremos que a primeira bola retirada não é reposta (retirada sem reposição). Sendo o espaço amostral enumerável, finito e equiprovável, podemos calcular probabilidade dos eventos através do conceito clássico. Deste modo, MA, 3 PAd-ss Entretanto, a probabilidade do A, vai depender da ocorrência ou não do Aí Se ocorreu A,, então P(A,/A,)= BAIA, = 2 &S 4 Se não ocorreu A, então P(A, )= th, = 1 Ss 4 Observamos, nesta situação, que, se a bola não for reposta, a probabilidade de ocorrência do A, fica alterada pela ocorrência ou não de A,. Podemos definir, então: + Eventos condicionados: dois eventos quaisquer, A e B, são condicionados quando a ocorrência de um altera a probabilidade de ocorrência do outro. A probabilidade condicional de A é denotada por P(A/B) (lê-se probabilidade de A dado que ocorreu B). Situação 2. Consideremos que a primeira bola retirada é reposta antes de tirar a segunda (retirada com reposição). — HA, PAd=s 3 5 Como a primeira bola é reposta, independente de ter ocorrido ou não A, a probabilidade de ocorrência de A, será a mesma. Se ocorreu A,, então P(A,/A,)= FALA, = 2 &S 5 Se não ocorreu A,, então P(A, )= th, = 2 E) Podemos verificar agora que, se a bola for reposta, a probabilidade de ocorrência do A, não é alterada pela ocorrência ou não do A,, ou seja, P(A,) = P(A/A.). Podemos definir, então: * Eventos independentes: dois eventos quaisquer, A e B, são independentes quando a ocorrência de um não altera a probabilidade de ocorrência do outro, ou seja, P(A)= P(A/B) e P(B)= P(BIA). 74 Piana, Machado e Selau Elementos de Probabilidade Teorema do produto das probabilidades Se A e B são dois eventos quaisquer, então P(A n B)=P(A) P(B/A) = P(B) P(A/B). Definimos, também P(A NB) P(B) Se A e B são dois eventos independentes, então P(AB)- P(A NB) e P(B/A)= P(A)= P(A/B) e P(B)= P(B/A). Logo, P(A n B)=P(A) P(B). Teorema de Bayes Se S é um espaço amostral, com n=4 partições, onde está definido o evento A BUB,UB,UB,-S Bo Ss A BnB,=9 B, Bs BnB,=9 BnB,-9 Eu = BnB,-9 podemos definir o evento A como Thomas Bayes A=(ANB)ANB)MANB; UA NB,), logo, (702476) p(aj-[P(ANB)UP(ANB,JUP(ANB,JUP(AMB,). Utilizando o terceiro axioma, temos P(A)=P(ANB)+P(A nB,)+P(ANB;)+P(ANB,). Utilizando o teorema do produto, temos P(A)=P(B,)P(AB,)+ P(B, )P(AIB, ) + P(B, )P(A/B, )+P(B, )P(A/B,) = 5 P(B)P(A/B,) ia p(B/A)- PAOB). PB)PIAB) PA) SPB)PAB) Definimos, a partir desse exemplo, o teorema de Bayes: 75 Piana, Machado e Selau Elementos de Probabilidade Seja S um espaço amostral e B,, B,,..., B,, uma de suas partições possíveis, tal que n BnB,=2 e [JB=S. Se A é um evento de S, então: PA-SPBP(AB) e p(B/4)-PEDMABO º DP(B)P(AB,) Exercícios propostos: 3.1. Em 660 lançamentos de uma moeda, foram observadas 310 caras. Qual é a probabilidade de, num lançamento dessa moeda, obter-se coroa? 3.2. Se os registros indicam que 504, dentre 813 lavadoras automáticas de pratos vendidas por uma grande loja de varejo, exigiram reparos dentro da garantia de um ano, qual é a probabilidade de uma lavadora dessa loja não exigir reparo dentro da garantia? 3.3. Um grupo de pessoas é constituído de 60 homens e 40 mulheres. Sabe-se que 45 desses homens e 30 dessas mulheres votaram numa determinada eleição. Tomando-se, aleatoriamente, uma dessas pessoas, calcule a probabilidade de: a) ser homem; b) ser mulher; c) ter votado; d) não ter votado; e) ser homem, sabendo-se que votou; f) ser mulher, sabendo-se que não votou; 9) ter votado, sabendo-se que é mulher; h) não ter votado, sabendo-se que é homem. 3.4. Em uma fábrica de parafusos, as máquinas A, B e C produzem 25 %, 35 % e 40 % do total produzido. Da produção de cada máquina, 5 %, 4 % e 2%, respectivamente, são defeituosos. Escolhe-se ao acaso um parafuso e verifica-se que ele é defeituoso. Qual é a probabilidade de que seja da máquina A, da máquina B e da máquina C? 3.5. Em um estado (dos Estados Unidos) onde os automóveis devem ser testados quanto à emissão de poluentes, 25% de todos os carros emitem quantidades excessivas de poluentes. Ao serem testados, 99% de todos os carros que emitem excesso de poluentes são reprovados, mas 17% dos que não acusam emissão excessiva de poluentes também são reprovados. Qual é a probabilidade de um carro reprovado no teste acusar efetivamente excesso de emissão de poluentes? 3.6. Em uma certa comunidade, 6 % de todos os adultos com mais de 45 anos têm diabetes. Um novo teste diagnostica corretamente 84% das pessoas que têm diabetes e 98% das que não tem a doença. a) Qual é a probabilidade de uma pessoa diagnosticada como diabética no teste, ter de fato a doença? b) Qual é a probabilidade de uma pessoa que faça o teste, seja diagnosticada como não diabética? 76 Piana, Machado e Selau Elementos de Probabilidade 3.2.2. Variáveis aleatórias discretas Definição: São discretas todas as variáveis cujo espaço amostral Sx é enumerável finito ou infinito. Assim se X é uma variável aleatória discreta, então Sx é um subconjunto dos inteiros. Tomemos como exemplo o seguinte experimento: Lançamento de uma moeda até que ocorra face cara. O espaço amostral básico deste experimento será S=(c,kc, kkc, kkkc, kkkkc, kkkkkc, ...). Se definimos a variável aleatória X como o número de lançamentos até que ocorra cara, então, temos s-X58,-(12,345.) Se definimos outra variável aleatória Y como o número de coroas até que ocorra cara, então temos s58,=/0,1,23,4.3 Observamos que X e Y são variáveis aleatórias discretas, pois seus espaços amostrais são enumeráveis. 3.2.2.1. Função de probabilidade Definição: Seja X uma variável aleatória discreta e Sx o seu espaço amostral. A função de probabilidade P(X =x), ou simplesmentep(x), será a função que associa a cada valor de X a sua probabilidade de ocorrência, desde que satisfaça duas condições: 1. p0)>20,Vxe Sx 2. 5 p(g)=1 xeSx Existem três formas distintas de representar uma função: — Representação tabular: consiste em relacionar em uma tabela os valores da função de probabilidade. - Representação gráfica: consiste em representar graficamente a relação entre os valores da variável e suas probabilidades. - Representação analítica: estabelece uma expressão geral para representar o valor da função num ponto genérico da variável. Para exemplificar as formas de representação de uma função de probabilidade, vamos considerar o seguinte experimento aleatório. Exemplo: De uma uma com três bolas pretas e duas brancas, retiram-se, de uma vez, duas bolas. Se X é o número de bolas pretas retiradas, determine a função de probabilidade P(X =x). 79 Piana, Machado e Selau Elementos de Probabilidade Observamos que o espaço amostral básico do experimento é um conjunto não numérico S=(P,B, P,B,, P5B,, PBo, P5B,, P5Bo, PiPo, P4P5, PoP5, B,Bo) e que a variável X transforma este espaço num conjunto numérico Sx=(0, 1,2) Como o espaço amostral básico S é enumerável, finito e equiprovável, podemos obter as probabilidades associadas aos valores de X através do conceito clássico. Já vimos anteriormente que, neste tipo de experimento, o número de elementos do espaço e o número de pontos favoráveis à ocorrência do evento desejado podem ser obtidos através da combinação. Daí, temos: CiCê 1 P(X=0)-P(BB,)-252-—-0,1=0,1 (X=0)=P(BB,) cio cici 6 PX=1)=HPB)+PPB,)+ PPB) +P(PB,)+ PRB) + PPB) = 597 08 5 cics 3 P(X=2)=P(PP,)+P(PP)+P(PP;)= cê “070º 5 Obtidas as probabilidades, podemos fazer a representação tabular da função. X=x 0 1 2 z P(X=x) | 0,1 0,6 03 |1 Da mesma forma, é possível construir o gráfico para a função. Observamos que P(X= x) é uma função contínua para todo o xeSx, ou seja, a função P(X =x) assume o valor zero para todo o xeSx. A representação analítica da função é feita através da generalização da expressão utilizada para o cálculo da probabilidade de cada valor de X: Cx c2x PK=0-. para Sx = (0, 1, 2) 5 80 Piana, Machado e Selau Elementos de Probabilidade 3.2.2.2. Função de distribuição ou probabilidade acumulada Definição: Seja X uma variável aleatória discreta e Sx o seu espaço amostral. A função de distribuição, definida por F(x) ou P(X <x) é a função que associa a cada valor de X a probabilidade P(X < x). Desta forma, temos F()=P(X<x)= E P(X=t) tex Para o exemplo anterior, temos: F(0)=P(X<0)= S P(X=x)=P(X-=0)-0,1 x<0 F(D=PX<9)=LP(X=2)=P(X=0)+P(X=1)=0,1+0,6=0,7 xa F(2)=P(X<2)= S P(X=x)=P(X=0)+P(X=1)+P(X=2)=0,1+0,6+0,3=1 x<2 Podemos também representar a função de distribuição acumulada de três formas: — representação tabular X=x 0 1 2 z P(X=X)| 0,1 0,6 0,3 1 F(x) 0,1 0,7 1 - — representação gráfica — representação analítica FO)=P(X<)=T tsx para Sx = (0, 1,2) tt CC; 2 5 81 Piana, Machado e Selau Elementos de Probabilidade 3º propriedade: Se X é uma variável aleatória e k uma constante, ao multiplicarmos a variável pela constante a variância da variável fica multiplicada pelo quadrado constante. V(KX) = K2 V(X) 4º propriedade: Se X e Y são duas variáveis aleatórias independentes, a variância da soma (ou diferença) das duas variáveis é igual à soma de suas variâncias. V(X+Y)= V(X) + V(Y), se Xe Y são independentes + Desvio padrão A partir da variância podemos obter o desvio padrão, denotado por o e definido como a raiz quadrada da variância: c=Vo?. No exemplo: o = Jo? =0,36 = 0,6bolas. * Momentos Já vimos anteriormente que os momentos são quantidades que auxiliam na descrição de um conjunto de valores. Da mesma forma, aqui, essas medidas são utilizadas para descrever as distribuições de probabilidade de variáveis aleatórias. A expressão geral do momento de ordem r de uma variável aleatória é a seguinte: 1 =EX-a/ Os tipos mais importantes de momentos são dois: — Quando a = 0, temos os momentos centrados na origem ou momentos ordinários de ordemr: E =E(X-O/ =E(X) Parar = 1, temos É,=EO)= > xp(x) xeSy Para r = 2, temos n5=E(X?)= 57 xºp(x) xeS, Parar = 3, temos 15 =E(X*)= 5 xºp(x) xeS, Para r = 4, temos 4 =E(X*)= 5 x*p(x) xXESk E Piana, Machado e Selau Elementos de Probabilidade — Quando a = 4, temos os momentos de ordem H=EX-ny Parar = 1, temos m=E(X-u) H4=E(X)-E(n) m=4-4=0 Para r = 2, temos => (x-n?p(x) xeSy -22+p Parar = 3, temos =EX-uP = 5 (x-nPpOo xeSx Hs 3 X-n) Xº-3Xu+2Xu2-pº) x? x? 3uE(X?) + 342E(X)- pe? 3uE(X?) + 3un nº 3uE(X?)+ 3uº — uu? 3uE(X2) +20? 3 x x? x? mommmmmm ( ( (X)- (X)- (X- (X)- (X)- Para r = 4, temos E(X-n)'= 5 (x-n)'p(x) xeSx Hg = Ha + Coeficiente de assimetria =E(X*)- 4uE(X)+ Gu2E(X?)- But r centrados na média (Fórmula de definição) (Fórmula de definição) E(3X2u)+ E(3Xu2)- E(u?) (Fórmula prática) (Fórmula de definição) (Fórmula prática) a- Ha Ma Hola nº * Coeficiente de curtose Ha a, tt “a 85 Piana, Machado e Selau Elementos de Probabilidade 3.2.3. Variáveis aleatórias contínuas Vamos considerar agora o seguinte experimento: tomar aleatoriamente uma peça de uma linha de fabricação, colocá-la em funcionamento e medir por quanto tempo ela funciona. Um possível espaço amostral básico para este experimento seria a anotação do dia e da hora em que a peça parou de funcionar. Um procedimento equivalente (e mais adequado do ponto de vista das aplicações) seria associar a cada ponto desse espaço amostral o tempo de funcionamento decorrido. Assim, teríamos uma variável aleatória X definida como o tempo de funcionamento da peça. Esta variável X seria uma variável aleatória contínua, visto que o conjunto dos seus valores não poderia ser enumerado, e o seu espaço amostral poderia ser representado como (x; x > 0). Observamos também que, sendo X uma variável contínua, entre quaisquer dois valores distintos de X sempre existirão infinitos valores. A partir deste exemplo, podemos definir uma variável aleatória contínua. Definição: São contínuas todas as variáveis cujo espaço amostral Sx é infinito não enumerável. Assim, se X é uma variável aleatória contínua, então X pode assumir qualquer valor num intervalo [a; b] ou no intervalo (-; +) e o conjunto Sx será sempre definido como um intervalo. São exemplos de variáveis aleatórias contínuas: o tempo de vida de um animal, a vida útil de um componente eletrônico, o peso de uma pessoa, a produção de leite de uma vaca, a quantidade de chuva que ocorre numa região. 3.2.3.1. Função densidade de probabilidade Definição: Seja X uma variável aleatória contínua e Sx o seu espaço amostral. Uma função f associada à variável X é denominada função densidade de probabilidade se satisfizer duas condições: 1. f(00)>0, Vxe Sx A área sob a função f(x) no intervalo Sx é 2. Tfogax =1=P(XeS,) “ | um, pois corresponde à probabilidade de a 5, variável X pertencer ao espaço amostral Sx. x Consideremos agora dois exemplos resolvidos. Exemplo 1. Seja a função f(x) = 2x, no intervalo Sx =[0,1]. Verifique se f(x) é uma função densidade de probabilidade. Primeira condição: f(x) >0, Vx e Sx Como a função f(x) = 2x é linear, apenas dois pontos são suficientes para traçar a reta que representa a relação entre x e f(x). Podemos obter, então, os valores da função f(x) nos pontos O e 1 que são os limites do intervalo Sx: — para x = 0, temos f(0) =2x0=0, — parax = 1, temos f(1)=2x1=2. A partir desses dois pontos é possível construir o gráfico da função 86 Piana, Machado e Selau Elementos de Probabilidade Sendo Sx =[a, b]., temos Consideremos o Exemplo 1. Para a função densidade de probabilidade f(x) = 2x, no intervalo Sx =[0,1], definem-se os seguintes eventos: A=(x0<x< 1/2) B=(X 12<x< 3/4) As probabilidades dos eventos A e B correspondem às suas respectivas áreas: 12 112 x? [2 1 2 1 P(A)= área de A= [2xdx=2 [xdx=2] 5 (5) -Q=— y , 2h 42 4 9-4 5 a14 314 2 A 2 2 P(B)=áreadeB= [ou 2 nua] (5) 5) «81 4 Ex 2 |n la) 2) 16 416 “16 Para f(x) = 2x, a função de distribuição acumulada F(x) será x 2 F(x) = Pr <= [att 2] 5] =x2-02-x2. 0 2h As probabilidades dos eventos A e B podem ser obtidas de outra forma através da função de distribuição acumulada F(x) = P(X <x)=x2. Assim, temos F(112) = P(X < 1/2) = (3) 5 e F(2/4) = P(X < 3/4) = (5) = = donde resulta P(A) = F(1/2) 4 9145 P(B) = F(3/4)- F(1/2) =“ =D (B)=F(/4)- (12) = Para o Exemplo 2: Seja f(x) = 6x — 6x? uma função densidade de probabilidade definida no intervalo Sx=[0,1]. Para f(x) a função de distribuição acumulada F(x) será 89 Piana, Machado e Selau Elementos de Probabilidade x x x ? x P x F(x)= [(6t- 6t? it = [6tat- [6tidt=6]— | -6)> | =3x2 2%, war aeja-ja jora-e/5) ceja| cat 3.2.3.3. Medidas descritivas + Média ou valor esperado Definição: Seja X uma variável aleatória continua e Sx o seu espaço amostral. O valor médio de X, representado por E(X) ou |, será dado por E(X)= p= [ xfogdx S Sempre que a função for par e, portanto, simétrica, F(u) = 1/2. + Variância Definição: Seja X uma variável aleatória contínua e Sx o seu espaço amostral. A variância de X, representada por V(X) ou 6?, será dada por V(X)=02= E(X-u2= fex-HProgdx (Fórmula de definição) Sx ou Sx V(X)= 02= E(X?)-q?= ! vga - u2 (Fórmula prática) Para o Exemplo 1: f(x) = 2x, Sx =[0,1], temos: 1 1 1 X u 2 E(X)=E=E(X)=u= [x2xdx= [2x0x=2[xºdx= 25] -(5-5)-5 o o o 3 o 3 V(X)- o? = [hezas p- Í 2x | p- ps) (5) 5 * (6x - 6x?) a p= lo -6X*) o -u 1 focar - focar | ue - |] a|X] (8) -3.8. 1, 20-28, 1 ó ê 4h |[5hb|/l2) 254 20 20 V(X)=62= Piana, Machado e Selau Elementos de Probabilidade * Momentos Segundo momento: m=E(X-uy = f (x-uf(x)dx — (Fórmula de definição) Sx Terceiro momento: 1 =E(X-u) = f (x-u)f(x)dx — (Fórmula de definição) S Hs =E(Xº)-3uE(X2) + 29º = | Í erga 4) vo | 2uº? (Fórmula prática) Sx Sx Quarto momento: n,=EX-u) = f (x-)*f(x)dx — (Fórmula de definição) & H,=E(X*)- 4uE(Xº)+ Gu?E(X?) - 3ut = ! no - a] ro eu? ! e - 3u* (Fórmula prática) Sx Sx Sx * Coeficiente de assimetria * Coeficiente de curtose 91 Piana, Machado e Selau Elementos de Probabilidade — Representação analítica P(X=)=1"(1-1)*, para Sx= (0, 1) + Parâmetros A distribuição de Bernoulli tem apenas um parâmetro: n = probabilidade de sucesso Dizemos, então, que X- Ber (1). + Medidas descritivas — Média ou valor esperado: E(X)= = > xp(x) xeSy E(X)=0x(t-n)+1xn=n Teorema: E(X)=u=7 — Variância: V(X)= 02 =E(X2)-u? Como EX?)= 5 xp()=0"x(1-n)+ Pxn=7, xeSy temos V(X)=E(X?)-u2=1-n2=7(1-7). Teorema: V(X)=0?=7(1-7) a tea. Hs — Coeficiente de Assimetria: a, = Havia onde: mo =EX-nf=E(X?)-p? 1 =EX-uP=EX)-3nE(X?)+ 24º (1=1)-7 Teorema: a, => vm(t-n 3.3.1.2. Distribuição binomial Definição: modelo que descreve probabilisticamente os resultados de uma sequência de experimentos de Bernoulli independentes, ou seja, onde a probabilidade de sucesso é sempre a mesma. 94 Piana, Machado e Selau Elementos de Probabilidade Podemos dizer que, se XY + Yo ++ Y, onde: Y,- Ber(n) e Y,, são independentes, então X tem distribuição binomial. Exemplo: Em uma estância 60% dos bovinos foram vacinados contra uma determinada doença. Se um bovino dessa estância for escolhido ao acaso, então, teremos um experimento de Bernoulli com S = (vacinado, não vacinado), onde: P(vacinado) = 0,6 e P(não vacinado) = 0,4. Se três bovinos forem escolhidos ao acaso, então teremos uma sequência de três experimentos de Bernoulli independentes uma vez que, a cada escolha, a probabilidade de sucesso permanecerá inalterada. O espaço amostral deste experimento será S = (VVV, VVN, VNV; NVV, NNV, NVN, VNN, NNNy, onde: V=vacinado e N=não vacinado. Se a variável X é definida como o número de sucessos em n experimentos de Bemoulli independentes, com probabilidade de sucesso igual a x, então, no exemplo, onde n = 3e7m = 0,6 (se considerarmos sucesso = vacinado), o espaço amostral da variável X será Sx = (0, 1,2, 3) e as probabilidades P(X = x) será: P(X=0)=1xm"x(1-n)=1x.0,6ºx0,4'= 0,064 P(X=1)=3xn'x(1-n2=3x. 0,6!x0,42= 0,288 P(X=2)=3xmx(1-n)'=3x0,62x 0,4! = 0,432 PX=3)=1xmx(1-n/=1x0,6ºx0,4º = 0,216 Sendo assim, a distribuição de probabilidade da variável X será x=x | 0 1 2 3 | sz P(X=x) [0,064 0,288 0,432 0,216 | 1 + Função de probabilidade De modo geral, se X é uma variável que tem distribuição binomial, então a sua função de probabilidade será: P(X=3)=P HM (1-n)P*, para Sy= (0, 1,...,n) + Parâmetros A distribuição binomial tem dois parâmetros: n= número de repetições do experimento de Bernoulli n = probabilidade de sucesso Dizemos, então, que X- Bin (n, 7). 95 Piana, Machado e Selau Elementos de Probabilidade * Medidas descritivas — Média ou valor esperado: E(X)= = > xp(x) xeSx Considerando que uma variável X com distribuição binomial pode ser definida como a soma de variáveis de n variáveis Y independentes, podemos utilizar as propriedades da média. Sendo X=Y,+Y,+...+Yn, temos EM)= EM, + Yo ++ Y,) EM)=E()+E(Y,)+...+ E(Y,) EX)=n+n+..+1=n7 Teorema: E(X)= u=na — Variância: V(X)= 02 =E(X2)-u? Sendo X=Y,+Y,+...+Yn, temos VOO= VV + Yo +... +Y,) VOO) = VOY D+ VOY ++ MY) VM =n(1-=n)+n(1-n)+..+m(1-n)=nm(1-7n) 2 Teorema: V(X)=o“=nn(1-7). Ma Haia — Coeficiente de assimetria: a, = (1=1)-n na(1-7) Interpretação do coeficiente de assimetria: Teorema: a, = Se x > (1-7), a distribuição binomial é assimétrica negativa. Se x= (1-7) = 0,5, a distribuição binomial é simétrica. Se x< (1-x), a distribuição binomial é assimétrica positiva. — Coeficiente de curtose: a, = Pe Hz Fazendo aí, =a, - 3, temos: Teorema: aí, = 1-6n(i-m) na(i-=n) Interpretação do coeficiente de curtose aí: Se a, <0, a distribuição binomial é platicúrtica. Sea, =0, a distribuição binomial é mesocúrtica. Se a, >0, a distribuição binomial é leptocúrtica. 96
Docsity logo



Copyright © 2024 Ladybird Srl - Via Leonardo da Vinci 16, 10126, Torino, Italy - VAT 10816460017 - All rights reserved