APO STILA ES TAT STICA
Luis Felipe Dias Lopes, Dr.
lflopes@smail.ufsm.br, phil.zaz@zaz.com.br
D E - UFSM 2003
Sum rio
1 Conceitos b sicos 1.1 Popula o x Amostra 1.2 Censo x Amostragem 1.3 Dado x Vari vel 1.4 Par metros x estat sticas 1.5 Arredondamento de dados 1.6 Fases do m todo estat stico 2 Representa o tabular 2.1 Representa o esquem tica 2.2 Elementos de uma tabela 2.3 S ries estat sticas 2.4 Distribui o de freq ncia 3 Representa o gr fica 3.1 Gr ficos de Linhas 3.2 Gr ficos de colunas ou barras 3.3 Gr ficos circulares ou de Setores (Pie Charts) 3.4 Gr fico Pictorial - Pictograma 3.5 Gr fico Polar 3.6 Cartograma 3.7 Gr ficos utilizados para a an lise de uma distribui o de freq ncia 4 Medidas descritivas 4.1 Medidas de posi o 4.2 Medidas de variabilidade ou dispers o 4.3 Medidas de dispers o relativas 4.4 Momentos, assimetria e curtose 4.5 Exerc cios 5 Probabilidade e vari veis aleat rias 5.1 Modelos matem ticos 5.2 Conceitos em probabilidade 5.3 Conceitos de probabilidade 5.4 Exerc cios 5.5 Teorema de Bayes 5.6 Vari veis aleat rias 5.7 Fun o de probabilidade
5.8 Exemplos 5.9 Exerc cios 6 Distribui es de Probabilidade 6.1 Distribui es discretas de probabilidade 6.2 Exerc cios 6.2 Distribui es cont nuas de probabilidade 6.4 Exerc cios 7 Amostragem 7.1 Conceitos em amostragem 7.2 Planos de amostragem 6.3 Tipos de amostragem 7.4 Amostragem com e sem reposi o 7.5 Representa o de uma distribui o amostral 7.6 Distribui es amostrais de probabilidade 7.7 Exerc cios 7.8 Estat sticas amostrais 7.9 Tamanho da amostra 8 Estima o de par metros 8.1 Estima o pontual 8.2 Estima o intervalar 8.3 Exerc cios 9 Testes de hip teses 9.1 Principais conceitos 8.2 Teste de signific ncia 9.3 Exerc cios 9.4 Testes do Qui-quadrado 9.5 Exerc cios 10 Regress o e Correla o 10.1 Introdu o 10.2 Defini o 10.3 Modelo de Regress o 10.4 M todo para estima o dos par metros e 10.5 Decomposi o da vari ncia Total 10.6 An lise de Vari ncia da Regress o 10.7 Coeficiente de Determina o (r ) 10.8 Coeficiente de Correla o (r) 10.9 Exerc cios 11 Refer ncias bibliogr ficas
1 Conceitos B sicos
1.1 Popula o x Amostra Popula o (N): Conjunto de todos os elementos relativos a um determinado fen meno que possuem pelo menos uma caracter stica em comum, a popula o o conjunto Universo, podendo ser finita ou infinita.
Finita - apresenta um n mero limitado de observa es, que pass vel de contagem. Infinita - apresenta um n mero ilimitado de observa es que imposs vel de contar e geralmente esta associada a processos.
Amostra (n): um subconjunto da popula o e dever ser considerada finita, a amostra deve ser selecionada seguindo certas regras e deve ser representativa, de modo que ela represente todas as caracter sticas da popula o como se fosse uma fotografia desta.
Uma popula o pode, mediante processos operacionais, ser considerada infinita, pois a mesma ir depender
do tamanho da amostra. Se a freq ncia relativa entre amostra e popula o for menor do que 5% ela considerada infinita, se a freq ncia relativa for maior do 5% ela considerada finita.
1.2 Censo x Amostragem Pesquisa Estat stica: qualquer informa o retirada de uma popula o ou amostra, podendo ser atrav s de Censo ou Amostragem. Censo: a coleta exaustiva de informa es das "N" unidades populacionais. Amostragem: o processo de retirada de informa es dos "n" elementos amostrais, no qual deve seguir um m todo criterioso e adequado (tipos de amostragem).
1.3 Dado x Vari vel Dados estat sticos: qualquer caracter stica que possa ser observada ou medida de alguma maneira. As mat rias-primas da estat stica s o os dados observ veis. Vari vel: aquilo que se deseja observar para se tirar algum tipo de conclus o, geralmente as vari veis para estudo s o selecionadas por processos de amostragem. Os s mbolos utilizados para representar as vari veis s o as letras mai sculas do alfabeto, tais como X, Y, Z, . que pode assumir qualquer valor de um conjunto de dados. As vari veis podem ser classificadas dos seguintes modos:
1
- Qualitativas (ou atributos): S o caracter sticas de uma popula o que n o pode ser medidas. Nominal : s o utilizados s mbolos, ou n meros, para representar determinado tipo de dados, mostrando, assim, a qual grupo ou categoria eles pertencem. Ordinal ou por postos: quando uma classifica o for dividida em categorias ordenadas em graus convencionados, havendo uma rela o entre as categorias do tipo "maior do que", "menor do que", "igual a", os dados por postos consistem de valores relativos atribu dos para denotar a ordem de primeiro, segundo, terceiro e, assim, sucessivamente. - Quantitativas: S o caracter sticas populacionais que podem ser quantificadas, sendo classificadas em discretas e cont nuas. Discretas: s o aquelas vari veis que pode assumir somente valores inteiros num conjunto de valores. gerada pelo processo de contagem, como o n mero de ve culos que passa em um posto de gasolina, o n mero de estudantes nesta sala de aula. Cont nuas: s o aquelas vari veis que podem assumir um valor dentro de um intervalo de valores. gerada pelo processo de medi o. Neste caso serve como exemplo o volume de gua em um reservat rio ou o peso de um pacote de cereal. 1.4 Par metros x Estat sticas Par metros: s o medidas populacionais quando se investiga a popula o em sua totalidade, neste caso imposs vel fazer infer ncias, pois toda a popula o foi investigada. Estat sticas ou Estimadores: s o medidas obtidas da amostra, torna-se poss vel neste caso utilizarmos as teorias infer ncias para que possamos fazer conclus es sobre a popula o.
2
1.5 Arredondamento de Dados Regras: Portaria 36 de 06/07/1965 - INPM Instituto Nacional de Pesos e Medidas. 1 a) Se o primeiro algarismo ap s aquele que formos arredondar for de 0 a 4, conservamos o algarismo a ser arredondado e desprezamos os seguintes.
Ex.: 7,34856 (para d cimos) 7,3
2 a) Se o primeiro algarismo ap s aquele que formos arredondar for de 6 a 9, acrescenta-se uma unidade no algarismo a ser arredondado e desprezamos os seguintes.
Ex.: 1,2734 (para d cimos) 1,3
3 a) Se o primeiro algarismo ap s aquele que formos arredondar for 5, seguido apenas de zeros, conservamos o algarismo se ele for par ou aumentamos uma unidade se ele for mpar, desprezando os seguintes.
Ex.: 6,2500 (para d cimos) 6,2 12,350 (para d cimos) 12,4
Se o 5 for seguido de outros algarismos dos quais, pelo menos um diferente de zero, aumentamos uma
unidade no algarismo e desprezamos os seguintes. Ex.: 8,2502 (para d cimos) 8,3 8,4503 (para d cimos) 8,5
4 a) Quando, arredondarmos uma s rie de parcelas, e a soma ficar alterada, devemos fazer um novo arredondamento (por falta ou por excesso), na maior parcela do conjunto, de modo que a soma fique inalterada. Ex.: 17,4% + 18,4% + 12,3% + 29,7% + 22,2% = 100%
arredondando para inteiro: 17% 17% + + 18% 18% + + 12% 12% + + 30% 31% + + 22% 22% = = 99% 100%
3
1.6 Fases do m todo estat stico O m todo estat stico abrange as seguintes fases: a) Defini o do Problema Consiste na: - formula o correta do problema; - examinar outros levantamentos realizados no mesmo campo (revis o da literatura); - saber exatamente o que se pretende pesquisar definindo o problema corretamente (vari veis, popula o, hip teses, etc.) b) Planejamento Determinar o procedimento necess rio para resolver o problema: - Como levantar informa es; - Tipos de levantamentos: Por Censo (completo); Por Amostragem (parcial). - Cronograma, Custos, etc. c) Coleta ou levantamento dos dados Consiste na obten o dos dados referentes ao trabalho que desejamos fazer. A coleta pode ser: Direta - diretamente da fonte; Indireta - feita atrav s de outras fontes. Os dados podem ser obtidos pela pr pria pessoa (prim rios) ou se baseia no registro de terceiros (secund rios). d) Apura o dos Dados ou sumariza o Consiste em resumir os dados, atrav s de uma contagem e agrupamento. um trabalho de coordena o e de tabula o. Apura o: manual, mec nica, eletr nica e eletromec nica. e) Apresenta o dos dados a fase em que vamos mostrar os resultados obtidos na coleta e na organiza o. Esta apresenta o pode ser: Tabular (apresenta o num rica) Gr fica (apresenta o geom trica) f) An lise e interpreta o dos dados a fase mais importante e tamb m a mais delicada. Tira conclus es que auxiliam o pesquisador a resolver seu problema.
4
2 Repre se nta o tab ular
Consiste em dispor os dados em linhas e colunas distribu das de modo ordenado. A elabora o de tabelas obedece Resolu o no 886, de 26 de outubro de 1966, do Conselho Nacional de Estat stica. As normas de apresenta o s o editadas pela Funda o Brasileira de Geografia e Estat stica (IBGE). 2.1 Representa o esquem tica T tulo Cabe alho Corpo
Rodap
2.2 Elementos de uma tabela T tulo: O t tulo deve responder as seguintes quest es: - O que? (Assunto a ser representado (Fato)); - Onde? (O lugar onde ocorreu o fen meno (local)); - Quando? (A poca em que se verificou o fen meno (tempo)). Cabe alho: parte da tabela na qual designada a natureza do conte do de cada coluna. Corpo: parte da tabela composta por linhas e colunas. Linhas: parte do corpo que cont m uma seq ncia horizontal de informa es. Colunas: parte do corpo que cont m uma seq ncia vertical de informa es. Coluna Indicadora: coluna que cont m as discrimina es correspondentes aos valores distribu dos pelas colunas num ricas. Casa ou c lula: parte da tabela formada pelo cruzamento de uma linha com uma coluna. Rodap : o espa o aproveitado em seguida ao fecho da tabela, onde s o colocadas as notas de natureza informativa (fonte, notas e chamadas). Fonte: refere-se entidade que organizou ou forneceu os dados expostos. Notas e Chamadas: s o esclarecimentos contidos na tabela (nota - conceitua o geral; chamada - esclarecer min cias em rela o a uma c lula).
5
2.3 S ries Estat sticas Uma s rie estat stica um conjunto de dados ordenados segundo uma caracter stica comum, as quais servir o posteriormente para se fazer an lises e infer ncias. S rie Temporal ou Cronol gica: a s rie cujos dados est o dispostos em correspond ncia com o tempo, ou seja, varia o tempo e permanece constante o fato e o local. Produ o de Petr leo Bruto no Brasil de 1976 a 1980 (x 1000 m ) Anos 1976 1977 1978 1979 1980 Produ o 9 702 9 332 9 304 9 608 10 562
Fonte: Conjuntura Econ mica (fev. 1983)
S rie Geogr fica ou Territorial: a s rie cujos dados est o dispostos em correspond ncia com o local, ou seja, varia o local e permanece constante a poca e o fato. Popula o Urbana do Brasil em 1980 (x 1000) Regi o Norte Nordeste Sudeste Sul Centro-Oeste Total Popula o 3 037 17 568 42 810 11 878 5 115 80 408
Fonte: Anu rio Estat stico (1984)
S rie Espec fica ou Qualitativa: a s rie cujos dados est o dispostos em
correspond ncia com a esp cie ou qualidade, ou seja, varia o fato e permanece constante a poca e o local. Popula o Urbana e Rural do Brasil em 1980 (x 1000) Localiza o Urbana Rural Total Popula o 80 408 38 566 118 974
Fonte: Anu rio Estat stico (1984)
6
S rie Mista ou Composta: A combina o entre duas ou mais s ries constituem novas s ries denominadas compostas e apresentadas em tabelas de dupla entrada. O nome da s rie mista surge de acordo com a combina o de pelo menos dois elementos. Local + poca = S rie Geogr fica Temporal Popula o Urbana do Brasil por Regi o de 1940 a 1980 (x 1000) REGI ES NE SE S 3 381 7 232 1 591 4 745 10 721 2 313 7 517 17 461 4 361 11 753 28 965 7 303 17 567 42 810 11 878
Anos 1940 1950 1960 1970 1980
N 406 581 958 1 624 3 037
CO 271 424 1 007 2 437 5 115
Fonte: Anu rio Estat stico (1984)
2.4 Distribui o de Freq ncia o tipo de s rie estat stica na qual permanece constante o fato, o local e a poca. Os dados s o colocados em classes preestabelecidas, registrando a freq ncia de ocorr ncia. Uma distribui o de freq ncia pode ser classificada em discreta e intervalar. a) Distribui o de Freq ncia Discreta ou Pontual: uma s rie de dados agrupados na qual o n mero de observa es est relacionado com um ponto real. Notas do Aluno "X" na Disciplina de Estat stica segundo crit rios de avalia o do DE da UFSM 1990 Xi 6.3 8.4 5.3 9.5 6.5 fi 2 3 2 3 5 15
Fonte: Departamento de Estat stica (1990)
7
b) Distribui o de Freq ncias Intervalar: Na distribui o de freq ncia, os intervalos parciais dever o ser apresentados de maneira a evitar d vidas quanto classe a que permanece determinado elemento. O tipo de intervalo mais usado do tipo fechado a esquerda e aberto a direita, representado pelo s mbolo: -. Altura em cent metros de 160 alunos do Curso de Administra o da UFSM - 1990 Altura (cm) 150 - 158 158 - 166 166 - 174 174 - 182 182 - 190 190 - 198 Xi 154 162 170 178 186 194 -fi 18 25 20 52 30 15 160
Fonte: Departamento de Estat stica (1990)
Elementos de uma Distribui o de Freq ncias: Classe ou Classe de Freq ncia (K): cada subintervalo (linha) na qual dividimos o fen meno. Para determinar o n mero de classes a partir dos dados n o tabelados, podemos usar a F rmula de Sturges, mas deve-se saber que existem outros m todos de determina o do n mero de classes em uma tabela de freq ncia. O que se deseja fazer apenas comprimir um conjunto de dados em uma tabela, para facilitar a visualiza o e interpreta o dos mesmos.
n(K) = 1 + 3.3 log n , onde "n" no de informa es.
Al m da Regra de Sturges, existem outras f rmulas emp ricas para resolver o problema para determina o
do n mero de classes [n(k)], h quem prefira n ( k) n . Entretanto, a verdade que essas f rmulas n o nos levam a uma decis o final; esta vai depender na realidade de um julgamento pessoal, que dever estar ligado a natureza dos dados, procurando, sempre que poss vel, evitar classes com freq ncias nulas ou freq ncias relativas exageradamente grandes.
Limite de Classe (li ou Li): S o os valores extremos de cada classe. li = limite inferior da i- sima classe; Li = limite superior da i- sima classe;
8
Amplitude do intervalo de classe (h): a diferen a entre dois limites inferiores ou superiores consecutivos. h = l n - l n -1 ou h = L n - L n -1
A amplitude do intervalo de classe deve ser constante em todo a distribui o de freq ncias intervalar.
Amplitude total (H): a diferen a entre o limite superior da ltima classe e o limite inferior da 1 classe, ou a diferen a entre ltimo e o primeiro elemento de um conjunto de dados postos em ordem crescente. H = L n - l1 Ponto m dio de classe (X i): a m dia aritm tica simples do limite inferior com o limite superior de uma mesma classe.
Xi = li + Li 2
ou a partir do X1 os demais pontos m dios pode ser determinado por: Xn = Xn-1 + h
Quando substituirmos os intervalos de classes pelos pontos m dios (Xi), ter-se - uma distribui o de
freq ncia pontual.
Freq ncia absoluta (fi): a quantidade de valores em cada classe
n = f i = f 1 + f 2 + . + f n
i =1
n
Freq ncia Acumulada (Fi): o somat rio da freq ncia absoluta da i- sima classe com a freq ncia absoluta das classes anteriores, ou a freq ncia acumulada da classe anterior.
Fn =
f
i =1
n
i
=n
Freq ncia Relativa (fr i): o quociente entre a freq ncia absoluta da i- sima classe com o somat rio das freq ncias.
fri = fi
f
i =1
n
Obs.:
fr
i=1
n
i
=1
i
Freq ncia Relativa Acumulada (Fri): o somat rio da freq ncia relativa da i- sima classe com as freq ncias relativas das classes anteriores.
Frn = fri = 1
i =1
n
9
3 Represen ta o gr fica
Os gr ficos s o uma forma de apresenta o visual dos dados. Normalmente, cont m menos informa es que as tabelas, mas s o de mais f cil leitura. O tipo de gr fico depende da vari vel em quest o 3.1 Gr ficos de Linhas Usado para ilustrar uma s rie temporal. Produ o de Petr leo Bruto no Brasil de 1976 a 1980 (x 1000 m )
11000 10500 10000 Produ o 9500 9000 8500 1976
1977
1978 Anos
1979
1980
Fonte: Conjuntura Econ mica (Fev. 1983)
3.1.1 Gr fico de linhas comparativas Popula o Urbana do Brasil por Regi o de 1940 a 1980 (x 1000)
45000 40000 35000 30000 25000 20000 15000 10000 5000 0 1940 1950 1960 1970 1980 NE N SE S CO
Fonte: Anu rio Estat stico (1984)
10
3.2 Gr ficos de colunas ou barras Representa o gr fica da distribui o de freq ncias. Este gr fico utilizado para vari veis nominais e ordinais. Caracter sticas: - todas as barras devem ter a mesma largura - devem existir espa os entre as barras 3.2.1 Gr fico de Colunas Usado para ilustrar qualquer tipo de s rie. Popula o Urbana do Brasil em 1980 (x 1000)
50000 40000 Pop. 30000 20000 10000 0 N NE SE Regi es S CO 3037 17568 11878 5115 42810
Fonte: Anu rio Estat stico (1984)
As larguras das barras que dever o ser todas iguais podendo ser adotado qualquer dimens o, desde que seja
conveniente e desde que n o se superponham. O n mero no topo de cada barra pode ou n o omitido, se forem conservados, a escala vertical pode ser omitida.
3.2.2.1 Gr fico de colunas comparativas a) Colunas Justapostas (gr fico comparativo) Popula o Urbana do Brasil por Regi o de 1940 a 1980 (x 1000)
45000 40000 35000 30000 25000 20000 15000 10000 5000 0
N NE SE S CO
1940
1950
1960
1970
1980
Fonte: Anu rio Estat stico (1984)
11
b) Colunas Sobrepostas (gr fico comparativo) Popula o Urbana do Brasil por Regi o de 1940 a 1980 (x 1000)
100000 80000 60000 40000 20000 0 1940 1950 1960 1970 1980 CO S SE N NE
Fonte: Anu rio Estat stico (1984)
3.2.2 Gr fico de Barras As regras usadas para o gr fico de barras s o igua is as usadas para o gr fico de colunas. Popula o Urbana do Brasil em 1980 (x 1000)
CO S Regi es SE NE N 0 3037 10000 20000 30000 40000 50000 Popula o 17568 5115 11878 42810
Fonte: Anu rio Estat stico (1984)
Assim como os gr ficos de Colunas podem ser constru dos gr ficos de barras comparativas.
3.3 Gr ficos circulares ou de Setores (Pie Charts) Representa o gr fica da freq ncia relativa (percentagem) de cada categoria da vari vel. Este gr fico utilizado para vari veis nominais e ordinais. uma op o ao gr fico de barras quando se pretende dar nfase compara o das percentagens de cada categoria. A constru o do gr fico de setores segue uma regra de 3 simples, onde as freq ncias de cada classe correspondem ao ngulo que se deseja representar em rela o a freq ncia total que representa o total de 360 .
12
Caracter sticas: - A rea do gr fico equivale totalidade de casos (360o = 100%); - Cada "fatia" representa a percentagem de cada categoria Popula o Urbana e Rural do Brasil em 1980 (x 1000)
32% Urbana Rural 68%
Fonte: Anu rio Estat stico (1984)
3.4 Gr fico Pictorial - Pictograma Tem por objetivo despertar a aten o do p blico em geral, muito desses gr ficos apresentam grande dose de originalidade e de habilidade na arte de apresenta o dos dados. Evolu o da matricula no Ensino Superior no Brasil de 1968 a 1994 (x 1000)
1500
1250
1000
750
500
250
0 1968 1974 1980 1986 1990 1994
Fonte: Grandes n meros da educa o brasileira mar o de 1996
13
3.4.1 Exemplos de pictogramas Evolu o da frota nacional de carros lcool de 1979 1987
3.631.647
1987
2.473.581
1985
1.277.107
1983
9.645
1979
Os m todos mais eficientes para deixar de fumar segundo 30.000 fumantes entrevistados no Canad
Goma de mascar com nicotina mais sess es de apoio psicol gico Internamento em hospital e uso de drogas relaxantes Acumpuntura Hipnose Inje o de Clonidina, droga que reduz os efeitos da abstin ncia
36% 30% 27% 19,5% 18,5%
Devasta o Selvagem: extra o de madeiras no Brasil
Pinus
6,8%
Eucalipto
24,4%
Madeira nativa
68,8%
14
3.5 Gr fico Polar o tipo de gr fico ideal para representar s ries temporais c clicas, ou seja, toda a s rie que apresenta uma determinada periodicidade. 4.5.1 Como construir um gr fico polar 1) Tra a-se uma circunfer ncia de raio arbitr rio (preferencialmente, a um raio de comprimento proporcional a m dia dos valores da s rie); 2) Constr i-se uma semi-reta (de prefer ncia horizontal) partindo do ponto 0 (p lo) e com uma escala (eixo polar); 3) Divide-se a circunfer ncia em tantos arcos forem as unidades temporais; 4) Tra a -se semi-retas a partir do ponto 0 (p lo) passando pelos pontos de divis o; 5) Marca-se os valores correspondentes da vari vel, iniciando pela semi-reta horizontal (eixo polar); 6) Ligam-se os pontos encontrados com segmentos de reta; 7) Para fechar o pol gono obtido, emprega-se uma linha interrompida.
Precipita o pluviom trica do munic pio de Santa Maria RS- 1999 Meses Precipita o (mm) Janeiro 174,8 Fevereiro 36,9 Mar o 83,9 Abril 462,7 Maio 418,1 Junho 418,4 Julho 538,7 Agosto 323,8 Setembro 39,7 Outubro 66,1 Novembro 83,3 Dezembro 201,2 Fonte: Base A rea de Santa Maria Precipita o pluviom trica do munic pio de Santa Maria RS- 1999
Fonte: Base A rea de Santa Maria
M dia = 237,31 mm
15
3.6 Cartograma a representa o de uma carta geogr fica. Este tipo de gr fico empregado quando o objetivo o de figurar os dados estat sticos diretamente relacionados com as reas geogr ficas ou pol ticas Dados absolutos (popula o) usa-se pontos proporcionais aos dados. Dados relativos (densidade) usa-se hachaduras. Exemplo:
Popula o da Regi o Sul do Brasil - 1990 Estado Paran Santa Catarina Rio Grande do Sul Fonte: IBGE Popula o (hab.) 9.137.700 4.461.400 9.163.200 rea (m 2) 199.324 95.318 280.674 Densidade 45,8 46,8 32,6
Popula o da Regi o Sul do Brasil 1990
Densidade populacional da Regi o Sul do Brasil 1990
Fonte: IBGE
Fonte: IBGE
16
3.7 Gr ficos utilizados para a an lise de uma distribui o de freq ncia 3.7.1 Histograma
Altura em cent metros de 160 alunos do Curso de Administra o da UFSM - 1990
Fonte: Departamento de Estat stica (1990)
3.7.2 Pol gono de Freq ncias Altura em cent metros de 160 alunos do Curso de Administra o da UFSM - 1990
Fonte: Departamento de Estat stica (1990)
17
3.6.3 Ogivas Altura em cent metros de 160 alunos do Curso de Administra o da UFSM 1990
Ogiva Crescente Ogiva Decrescente
3.7.4 Gr fico em segmentos de reta vertical utilizado para representar uma distribui o de freq ncia pontual, onde os segmentos de reta s o proporcionais s respectivas freq ncias absolutas.
Altura em cent metros de 160 alunos do Curso de Administra o da UFSM - 1990
Fonte: Departamento de Estat stica (1990)
3.7.5 Como se interpreta um histograma? A representa o gr fica da distribui o da vari vel, por histogramas. Este gr fico utilizado para vari veis cont nuas. Caracter sticas: - Cada barra representa a freq ncia do intervalo respectivo; - Os intervalos devem ter a mesma amplitude; - As barras devem estar todas juntas.
18
A simples observa o da forma do histograma permite algumas conclus es. Veja a figura 4.1. A medida dos dados est no centro do desenho. As freq ncias mais altas tamb m est o no centro da figura. Nos processos industriais, esta a forma desej vel.
.1 Histograma 60 50 40 30 20 10 0
A figura 4.2 apresenta um histograma com assimetria positiva. A m dia dos dados est localizada esquerda do centro da figura e a cauda direita alongada. Esta ocorre quando o limite inferior controlado ou quando n o podem ocorrer valores abaixo de determinado limite.
.2 Histograma com assimetria positiva 60 50 40 30 20 10 0 .3 Histograma com assimetria negativa 60 50 40 30 20 10 0
A figura 4.3 apresenta um histograma com assimetria negativa. A m dia dos dados est localizada direita do centro da figura e a cauda esquerda alongada. Esta forma ocorre quando o limite superior controlado ou quando n o podem ocorrer valores acima de certo limite
19
.4 Histograma em plateau A figura 4.4 mostra um histograma em plateau, Isto , com exce o das primeiras e das ltimas classes, todas as outras t m freq ncias quase iguais. Essa forma ocorre quando se misturam v rias distribui es com diferentes m dias. 60 50 40 30 20 10 0 .5 Histograma com dois picos 60 50 40 30 20 10 0
A figura 4.5 mostra um histograma com dois picos, ou duas modas. As freq ncias s o baixas no centro da figura, mas existem dois picos fora do centro. Esta forma ocorre quando duas distribui es com m dias bem diferentes se misturam. Podem estar misturados, por exemplo, os produtos de dois turnos de trabalho.
Os histogramas tamb m mostram o grau de dispers o da vari vel. Veja a figura 4.6. O histograma esquerda mostra pouca dispers o, mas o histograma direita mostra grande dispers o. .6 Histogramas com dispers es diferentes Freq ncia 60 50 40 30 20 10 0 Freq ncia 60 50 40 30 20 10 0
20
3.7.6 Curva de freq ncia curva polida Como, em geral, os dados coletados pertencem a uma amostra extra da de uma popula o, pode-se imaginar as amostras tornando-se cada vez mais amplas e a amplitude das classes ficando cada vez menor, o que nos permite concluir que o contorno do pol gono de freq ncias tende a se transformar numa curva (curva de freq ncia), mostrando, de modo mais evidente, a verdadeira natureza da distribui o da popula o. Pode-se dizer, ent o, que, enquanto que o pol gono de freq ncia nos d a imagem real do fen meno estudado, a curva de freq ncia nos d a imagem tendenciosa. Assim, ap s o tra ado de um pol gono de freq ncia, desej vel, muitas vezes, que se fa a um polimento, de modo a mostrar o que seria tal pol gono com um n mero maior de dados. Esse procedimento claro, n o nos dar certeza absoluta que a curva polida seja tal qual a curva resultante de um grande n mero de dados. Por m, pode-se afirmar que ela assemelha-se mais a curva de freq ncia que o pol gono de freq ncia obtido de uma amostra limitada. O polimento, geometricamente, corresponde elimina o dos v rtices da linha poligonal. Consegue-se isso com a seguinte f rmula: f ant. + 2f i + f post. fc i = 4 onde: fc i = freq ncia calculada da classe considerada; fi = freq ncia absoluta da classe i; fant. = freq ncia absoluta da classe anterior a i; fpost. = freq ncia absoluta da classe posterior a i;
Quando for em fazer o uso da curva polida conv m mostrar as freq ncias absolutas, por meio de
um pequeno circulo, de modo que qualquer interessado possa julgar se esse ponto se o ponto um dado original ou um dado polido.
Altura em cent metros de 40 alunas do Curso de Enfermagem da UFSM - 1996 Altura (cm) - - - - - - Xi 152 156 160 164 168 172 -fi 4 9 11 8 5 3 40 fci (0+ 2 x 4 + 9)/4 = 4,25 (4 + 2 x 9 + 11)/4 = 8,25 (9 + 2 x 11 + 8)/4 = 9,75 (11 + 2 x 8 + 5)/4 = 8,00 (8 + 2 x 5 + 3)/4 = 5,25 (5 + 2 x 3 + 0)/4 = 2,75 -
150 154 158 162 166 170
154 158 162 166 170 174
Fonte: Departamento de Estat stica (1997)
21
Altura em cent metros de 40 alunas do Curso de Enfermagem da UFSM - 1996
Fonte: Departamento de Estat stica (1997)
3.7.7 Curvas em forma de sino As curvas em forma de sino caracterizam-se pelo fato de apresentarem um valor m ximo na regi o central. Distinguem-se as curvas em forma de sino em: sim trica e assim trica a) Curva sim trica Esta curva caracteriza-se por apresentar o valor m ximo no ponto central e os pontos eq idistantes desse ponto terem a mesma freq ncia.
31
b) Curvas assim tricas Na pr tica, n o se encontram distribui es perfeitamente sim tricas. As distribui es obtidas de medidas reais s o mais ou menos assim tricas, em rela o freq ncia m xima. Assim, as curvas correspondentes a tais distribui es apresentam a cauda de um lado da ordenada m xima mais longa do que o outro. Se a cauda mais longa fica a direita chamada assim trica positiva ou enviesada direita, se a cauda se alonga a esquerda, a curva chamada assim trica negativa ou enviesada esquerda. Assim trica Positiva Assim trica Negativa
32
4 Medidas Descritivas
Tem por objetivo descrever um conjunto de dados de forma organizada e compacta que possibilita a visualiza o do conjunto estudado por meio de suas estat sticas, o que n o significa que estes c lculos e conclus es possam ser levados para a popula o. Podemos classificar as medidas de posi o conforme o esquema abaixo: 4.1 Medidas de Posi o Representativas M dias M dia Aritm tica M dia Geom trica M dia Harm nica
Separatrizes
Mediana Quartis Decis Centis ou Percentis Moda de Czuber Moda de King Moda de Pearson
Dominantes
4.1.1 Representativas (M dias) S o medidas descritivas que tem por finalidade representar um conjunto de dados. a) M dia Aritm tica: Amostral ( X ); Populacional ( ) Dados N o Tabelados
X=
Xi
i =1
n
n
ou =
X
i =1
N
i
N
33
Dados Tabelados com Valores Ponderados M dia Aritm tica Ponderada ( X w ), (onde Wi o peso) Nota do aluno "X" 1 semestre de 1994 - UFSM Notas (Xi) 7.8 8.3 8.2 5.8 Pesos (Wi) 2 3 2 3 10
Xw =
X .W
i =1 i
n
i
W
i=1
n
i
Fonte: Dados Hipot ticos
Distribui o de freq ncias - M dia Aritm tica ( X ) Altura em cent metros de 160 alunos do Curso de Administra o da UFSM - 1990 Altura (cm) Xi fi Xi . fi 150 158 166 174 182 190 - - - - - - 158 166 174 182 190 198 154 162 170 178 186 194 -18 25 20 52 30 15 160 2763,0 4037,5 3390,0 9230,0 5565,0 2917,55 27903
X=
X .f
i i =1
n
i
f
i=1
n
i
Fonte: Departamento de Estat stica (1990)
-
Caracter sticas da M dia Aritm tica Simples 1a) A M dia Aritm tica Simples dever estar entre o menor e o maior valor observado,
Xmin. X Xmax.
2 a) A soma alg brica dos desvios calculados entre os valores observados e a m dia aritm tica igual a zero; desvios = d = x i -
d = ( x i - ) = zero
i =1 i =1
n
n
34
3 a) Somando-se ou subtraindo-se todos os valores (Xi) da s rie por uma constante "k" (k 0), a nova m dia aritm tica ser igual a m dia original somada ou subtra da por esta constante "k". xi yi = x i k
X
Y =X k
4 a) Multiplicando-se ou dividindo-se todos os valores (Xi) da s rie por uma constante "k" (k 0), a nova m dia aritm tica ser igual a m dia original multiplicada ou dividida por esta constante "k". xi yi = xi k yi = x i k
X Y = X k
b) M dia Geom trica: (Xg):
Y = X k
A aplica o da m dia geom trica deve ser feita, quando os valores do conjunto de dados considerado se comportam segundo uma progress o geom trica (P.G.)ou dela se aproximam. Dados N o Tabelados
Xg = n
Dados Tabelados
X
i =1
n
i
= n X 1.X 2 . . .X n
Xg
=
n i =1
fi
X
i=1
n
fi
i
=
n i =1
fi
X1 1 .X2 2 . .Xn n
f
f
f
Usando um artif cio matem tico, pode-se usar para calcular a m dia geom trica a seguinte f rmula:
1
fi Xg = 10i=1
n
( f1. log X1+f2 . logX2 +.+f n. logX n )
1
n
fi i =1 = 10 i=1
f i .logXi
n
35
c) M dia Harm nica (Xh) usada para dados inversamente proporcionais. Ex.: Velocidade M dia, Pre o de Custo M dio 4.1.2 Emprego da m dia 1) Deseja-se obter a medida de posi o que possui a maior estabilidade; 2) Houver necessidade de um tratamento alg brico ulterior. Dados N o Tabelados
X
h
=
n
n
i =1
1 Xi
n
=
n 1 1 1 + + . + X1 X2 Xn
Dados Tabelados
Xh =
i= 1
i =1 n
fi fi Xi
=
f 1 + f 2 + . . + f n f1 f f + 2 + . . + n X1 X2 Xn
Deve-se observar esta propriedade entre as m dias
X X g Xh
4.1.3 Separatrizes (Mediana, Quartis, Decis e Centis ou Percentis) S o medidas de posi o que divide o conjunto de dados em partes proporcionais, quando os mesmos s o ordenados. a) Dados n o tabelados Antes de determinarmos as separatrizes devemos em primeiro lugar encontrar a posi o da mesma. - Se o n mero de elementos for par ou mpar, as separatrizes seguem a seguinte ordem:
Posi o = i(n + 1) S
i =1 se for mediana S = 2
1 i 3 se for quartis S=4
36
1 i 9 se for decis S = 10
1 i 99 se for centis S = 100
Dados Tabelados b) Distribui o de freq ncias pontual: segue a mesma regra usada para dados n o tabelados c) Distribui o de freq ncias intervalar
i.n - Fant .h S + f Si
S i = l Si
onde:
Si = Md i = 1;
S i = Q i 1 i 3; Si = Di 1 i 9 ; Si = C i ou Pi 1 i 99
l Si
i.n S
limite inferior da classe que cont m a separatriz; posi o da separatriz; freq ncia acumulada da classe anterior a que cont m a separatriz; amplitude do intervalo de classe; freq ncia absoluta da classe que cont m a separatriz;
Fant
h
fSi
4.1.4 Emprego da mediana 1) Quando se deseja obter um ponto que divide a distribui o em partes iguais; 2) H valores extremos que afetam de uma maneira acentuada a m dia; 3) A vari vel em estudo sal rio.
4.1.5 Dominantes - Moda (Mo) definida como sendo a observa o de maior freq ncia.
37
a) Dados n o tabelados Ex.: 3 5 1 5 5 4 6 1 5 5 4 7 2 6 6 4 8 2 6 6 5 9 3 7 7 5 6 6 7 8 9 Mo = 4 (unimodal) / 10 11 12 13 Mo = (amodal) 3 3 4 5 5 5 Mo1 = 3 Mo 2 = 5 (bimodal) / 7 8 8 Mo = (amodal) 7 8 Mo1 = 5 Mo2 = 6 Mo3 = 7 (multimodal)
Acima de 3 modas usamos o termo multimodal.
Dados Tabelados a) Distribui o de freq ncias pontual - Moda Bruta (Mo b): o ponto m dio da classe de maior freq ncia
Mo b = X i
b) Distribui o de freq ncias intervalar - Moda de Czuber (Mo c ): O processo para determinar a moda usado por Czuber leva em considera o as freq ncias anteriores e posteriores classe modal.
1 Mo c = lMo + + .h 1 2
onde:
1 = f Mo - f ant 2 = f Mo - f pos
l Mo fMo
h
limite inferior da classe modal; freq ncia absoluta da classe modal; amplitude do intervalo de classe; freq ncia absoluta da classe anterior a classe modal; freq ncia absoluta da classe posterior a classe modal;
fant
fpos
- Moda de King (Mo k ): O processo proposto por King considera a influ ncia existente das classes anterior e posterior sobre a classe modal. A inconveni ncia deste processo justamente n o levar em considera o a freq ncia m xima.
f pos Mo k = l Mo + f +f ant pos
.h
38
- Moda de Pearson (Mo p): O processo usado por Pearson pressup e que a distribui o seja aproximadamente sim trica, na qual a m dia aritm tica e a mediana s o levadas em considera o.
Mop = 3 Md - 2 X
Um distribui o considerada sim trica quando X Md Mo .
4.1.6 Emprego da moda 1) Quando se deseja obter uma medida r pida e aproximada de posi o; 2) Quando a medida de posi o deve ser o valor mais t pico da distribui o. 4.1.7 Posi o relativa da m dia, mediana e moda Quando uma distribui o sim trica, as tr s medidas coincidem. Por m, a assimetria torna -as diferentes e essa diferen a tanto maior quanto maior a assimetria. Assim, em uma distribui o temos:
x = Md = Mo curva sim trica
x Md Mo curva assim trica negativa Mo Md x curva assim trica positiva
x = Md = Mo
M od a
M e d ian a M di a
Mo Md x
x Md
Mo
39
4.1.8 Exerc cios Para os dados abaixo calcule: Md; Q1; Q3 ; D 3; C70 1) 3 4 2) Alturas dos alunos da Turma "X" no 1o sem. de 1994 - UFSM Alturas fi 63 15 75 25 84 30 91 20 90 Fonte: Dados Hipot ticos Alturas dos alunos da Turma "Y" no 1 o sem. de 1994 UFSM Alturas fi Fi 61 -65 12 12 65 -69 23 35 69 -73 34 69 73 -77 26 95 77 -81 15 110 110 110 Fonte: Dados Hipot ticos 4.2 Medidas de Variabilidade ou Dispers o Visam descrever os dados no sentido de informar o grau de dispers o ou afastamento dos valores observados em torno de um valor central representativo chamado m dia. Informa se um conjunto de dados homog neo (pouca variabilidade) ou heterog neo (muita variabilidade). As medidas de dispers o podem ser: Absoluta - Desvio extremo - amplitude - Desvio M dio - Desvio Padr o - Desvio quadr tico - Vari ncia 40 7 6 8 8 10 11 12 13 13 14 15 17 17 18 18 19 21 22 25
3)
Para estudarmos as medidas de variabilidade para dados n o tabelados usaremos um exemplo pr tico. Supomos que uma empresa esteja querendo contratar um funcion rio, e no final da concorr ncia sobraram dois candidatos para uma nica vaga. Ent o foi dado 4 tarefas para cada um, onde as mesmas tiveram como registro o tempo (em minutos) de execu o. TAREFAS OPER RIO 1 (TEMPO) OPER RIO 2 (TEMPO - An lise Gr fica 1 55 30 2 45 70 3 52 40 4 48 60
- Medidas de dispers o Absoluta: - Desvio Extremo ou Amplitude de Varia o (H): a diferen a entre o maior e o menor valor de um conjunto de dados
H = Xmax- Xmin
- Desvio M dio (d ): Em virtude do (X i - X ) = 0 , usamos para calcular o desvio
n i =1
m dio
X - X = 0 , assim ficando:
i =1 i
n
Para dados n o tabelados
d=
X
i =1
n
i
-X =
X 1 - X + X2 - X +. + X n - X n
n
Para dados tabelados
41
d =
(f
n i =1
i n
Xi - X
i
)
f
i =1
=
f1 X 1 - X + f 2 X 2 - X + . + f n X n - X
f
i=1
n
i
- Desvio Quadr tico ou Vari ncia : S 2 (amostra) ou 2 (popula o) Para dados n o tabelados:
2=
(X
n i =1
i
- X)
2
n
=
(X
(X
1
- X ) + ( X 2 - X ) + . + ( X n - X ) n
2 2
2
S2 =
(X
n i =1
i
- X)
2
n -1
=
1
- X ) + (X 2 - X ) + . + (X n - X ) n -1
2 2
2
Para dados tabelados
2 =
f (X
n i =1 i n i =1
i
-X)
i
2
f
n i i
=
f1 ( X 1 - X ) + f 2 (X 2 - X ) + . + f n (X n - X )
2 2
2
f
i =1
n
i
S2 =
f (X
i =1
- X) -1
2
f
i =1
n
=
f1 (X 1 - X ) + f 2 ( X 2 - X ) + . + f n ( X n - X )
2 2
2
i
f
i=1
n
i
-1
42
- Desvio Padr o: S (amostra) ou (popula o) Para dados n o tabelados:
=
(X
n i =1
i
- X)
2
n
=
(X (X
1
- X ) + (X 2 - X ) + . + (X n - X ) n
2 2
2
S=
(X
n i =1
i
-X)
2
n -1
=
1
- X ) + ( X 2 - X ) + . + ( X n - X ) n -1
2 2
2
Para dados tabelados
=
f (X
n i i =1 n i =1
i
-X)
i
2
f
=
f 1 (X 1 - X ) + f 2 (X 2 - X ) + . + f n ( X n - X )
2 2
2
f
i =1
n
i
S=
f (X
n i =1 i
i
-X) -1
2
f
i =1
n
=
f1 ( X 1 - X ) + f 2 ( X 2 - X ) + . + f n ( X n - X )
2 2
2
i
f
i =1
n
i
-1
(n - 1) usado como um fator de corre o, onde devemos considerar a vari ncia amostral como uma
estimativa da vari ncia populacional.
- Propriedades da Vari ncia
1 ) Somando-se ou subtraindo-se uma constante k a cada valor observado a vari ncia n o ser alterada; 2 ) Multiplicando-se ou dividindo-se por uma constante k cada valor observado a vari ncia ficar multiplicada ou dividida pelo quadrado dessa constante.
Outra forma de calcular o desvio padr o O desvio padr o mede bem a dispers o de um conjunto de dados, mas dif cil de calcular. Ent o, voc pode obter o desvio padr o atrav s da seguinte rela o:
=
R d2
onde R a amplitude e o valor de d2 , que depende do tamanho da amostra, encontrado na tabela a seguir. Este m todo de calcular o desvio padr o fornece boas estimativas para amostras de pequeno tamanho (n=4, 5 ou 6), mas perde a efici ncia se n 10. De qualquer
43
forma, essa rela o entre a amplitude e o desvio padr o de uma amostra que permite fazer gr ficos de controle X - R . TABELA 1: - Fatores para construir um gr fico de controle
n 2 3 4 5 6 7 8 9 10 d2 1,128 1,693 2,059 2,326 2,534 2,704 2,847 2,970 3,078 n 15 16 17 18 19 20 21 22 234 d2 0,347 3,532 3,532 3,640 3,689 3,735 3,778 3,819 3,858 Fonte: Montgomery, D.C. Statical Quality Control. Nova York, Wyley. 1991. 11 12 3,173 3,258 24 25 3,391 3,391 13 3,336 -14 3,407 -
4.3 Medidas de Dispers o Relativa
Relativa
- Vari ncia relativa - Coeficiente de Varia o (Pearson)
a medida de variabilidade que em geral expressa em porcentagem, e tem por fun o determinar o grau de concentra o dos dados em torno da m dia, geralmente utilizada para se fazer a compara o entre dois conjuntos de dados em termos percentuais, esta compara o revelar o quanto os dados est o pr ximos ou distantes da m dia do conjunto de dados. - Vari ncia Relativa
V. R .= 2 S2 ou 2 2 X
- Coeficiente de Varia o de Pearson
C.V. = S ou x 100 X
C.V. 50% a m dia representativa
C.V. 0 a maior representatividade da m dia (S = 0)
4.4 Momentos, assimetria e curtose As medidas de assimetria e curtose complementam as medidas de posi o e de dispers o no sentido de proporcionar uma descri o e compreens o mais completa das distribui es de freq ncias. Estas distribui es n o diferem apenas quanto ao valor m dio e variabilidade, mas tamb m quanto a sua forma (assimetria e curtose).
44
Para estudar as medidas de assimetria e curtose, necess rio o conhecimento de certas quantidades, conhecidas como momentos. 4.4.1 Momentos S o medidas descritivas de car ter mais geral e d o origem s demais medidas descritivas, como as de tend ncia central, dispers o, assimetria e curtose. Conforme a pot ncia considerada tem-se a ordem ou o grau do momento calculado. - Momentos simples ou centrados na origem (mr) O momento simples de ordem "r" definido como:
mr
X =
n
r i
,
i
para dados n o tabelados;
mr
onde:
X f = f
r i i
,
para dados tabelados.
r um n mero inteiro positivo; m0 = 1; m1 = m dia aritm tica. - Momentos centrados na m dia (Mr) O momento de ordem "r" centrado na m dia, definido como:
Mr
(X =
i
- X)
r
n
r i
=
d
n
r i
, para dados n o-tabelados
r i
Mr
(X - X) = f
i
fi
=
d
n
fi
, para dados tabelados
onde: M0 = 1; M1 = 0; M2 = vari ncia (s2).
45
- Momentos abstratos (r) S o definidos da seguinte forma:
r =
onde: s = desvio padr o. 4.4.2 Assimetria
Mr sr
Uma distribui o de valores sempre poder ser representada por uma curva (gr fico). Essa curva, conforme a distribui o, pode apresentar v rias formas. Se considerarmos o valor da moda da distribui o como ponto de refer ncia, vemos que esse ponto sempre corresponde ao valor de ordenada m xima, dando-nos o ponto mais alto da curva representativa da distribui o considerada, logo a curva ser analisada quanto sua assimetria. - Distribui o Sim trica: aquela que apresenta a X Mo Md e os quartis Q1 e Q3 eq idistantes do Q2 .
X Mo Md
- Distribui o Assim trica Assim trica Positiva Assim trica Negativa
Mo Md X
X Md Mo
Podemos medir a assimetria de uma distribui o, calculando os coeficientes de assimetria. Sendo o mais utilizado o Coeficiente de Assimetria de Pearson. X - Mo As = S - Se As 0 a distribui o ser Assim trica Negativa ; - Se As 0 a distribui o ser Assim trica Positiva; - Se As = 0 a distribui o ser Sim trica. 46
Quando n o tivermos condi es de calcularmos o desvio padr o podemos usar a seguinte f rmula:
As = Q 3 + Q 1 - 2 Md Q 3 - Q1
- Coeficiente momento de assimetria ( 3): o terceiro momento abstrato.
3 =
M3 s3
O campo de varia o do coeficiente de assimetria : -1 3 +1 - Intensidade da assimetria: 3 0,2 0,2 3 1,0 3 1,0 4.4.3 Curtose J apreciamos as medidas de tend ncia central, de dispers o e de assimetria. Falta somente examinarmos mais uma das medidas de uso comum em Estat stica, para se positivarem as caracter st icas de uma distribui o de valores: s o as chamadas Medidas de Curtose ou de Achatamento, que nos mostra at que ponto a curva representativa de uma distribui o a mais aguda ou a mais achatada do que uma curva normal, de altura m dia. - Curva Mesoc rtica (Normal): considerada a curva padr o. - Curva Leptoc rtica: uma curva mais alta do que a normal. Apresenta o topo relativamente alto, significando que os valores se acham mais agrupados em torno da moda. - Curva Platic rtica: uma curva mais baixa do que a normal. Apresenta o topo achatado, significando que v rias classes apresentam freq ncias quase iguais. simetria; assimetria fraca; assimetria forte.
47
- Coeficiente de Curtose
K= Q 3 - Q1 2( P90 - P10 )
- Se K 0.263 a distribui o ser Platic rtica. - Se K = 0.263 a distribui o ser Mesoc rtica; - Se K 0.263 a distribui o ser Leptoc rtica; Coeficiente momento de curtose ( 4 ): Corresponde ao momento abstrato de quarta ordem. M 4 = 44 s onde: M4 = momento centrado de quarta ordem. Interpreta o: - Se 4 3 curva Platic rtica; - Se 4 = 3 curva Mesoc rtica; - Se 4 3 curva Leptoc rtica. 4.5 Exerc cios Para os exerc cios abaixo construa uma tabela de dispers o o suficiente para determinar as medidas de posi o (m dia aritm tica, mediana e moda de czuber), dispers o (desvio padr o e vari ncia, coeficiente de varia o de Pearson), assimetria (coeficiente de assimetria, e coeficiente de curtose). Fa a um relat rio referente ao comportamento dos dados em fun o dos resultados obtidos. 1) De um exame final de Estat stica, aplicado a 50 alunos da Universidade Luterana,Ano 1999 resultaram as seguintes notas: 4,0 5,3 6,6 8,0 9,3 4,2 5,3 6,7 8,3 9,4 4,3 5,5 6,8 8,5 9,4 4,4 5,7 6,9 8,6 9,5 4,5 5,8 7,0 8,8 9,5 4,5 6,0 7,2 8,9 9,6 4,6 6,1 7,5 9,0 9,7 5,0 6,3 7,6 9,1 9,8 5,1 6,4 7,7 9,2 9,9 5,2 6,5 7,9 9,3 10,0
48
2) Os dados a seguir refere-se a altura em cent metros de 70 alunos da PUCC, turma 6, ano 2000. 153 162 168 172 179 188 193 154 162 168 173 179 188 194 155 163 169 173 180 189 194 156 163 169 174 182 189 195 158 164 170 174 183 190 197 160 164 170 175 184 191 197 160 165 170 175 185 192 199 161 166 171 176 186 192 200 161 167 171 177 186 192 201 161 167 172 178 187 192 205
3) Os dados a seguir referem-se aos sal rios anuais pagos em d lares a 60 funcion rios da Empresa "PETA S.A." em 1997. 50,00 58,50 66,00 77,00 90,00 100,10 52,50 59,00 66,25 78,00 91,35 100,20 53,50 60,30 67,50 80,00 92,10 101,00 54,00 61,50 68,00 81,50 93,20 102,00 54,20 62,00 68,70 82,50 94,00 103,40 55,50 62,90 69,50 83,50 95,25 104,30 56,30 63,50 70,00 85,00 96,00 105,00 56,50 64,00 72,00 87,30 97,00 107,00 57,00 64,30 75,00 88,00 98,00 108,00 58,10 65,00 76,50 89,10 99,80 109,10
49
5 P roba bilid ad e e Va ri veis Aleat ria s
5.1 Modelos Matem ticos Podem-se destinguir dois tipos de modelos matem ticos: 6.1.1 Modelos Determin sticos Refere -se a um modelo que estipule que as condi es sob as quais um experimento seja executado determinem o resultado do experimento. O modelo determin stico requer o uso de par metros pr -determinados em equa es que definem processos precisos. Em outras palavras, um modelo determin stico emprega "Considera es F sicas" para prever resultados. 6.1.2 Modelos N o Determin sticos ou Probabil sticos S o aqueles que informam com que chance ou probabilidade os acontecimentos podem ocorrer. Determina o "grau de credibilidade" dos acontecimentos. (Modelos Estoc sticos). Em outras palavras, um modelo probabil stico emprega uma mesma esp cie de considera es para especificar uma distribui o de probabilidade.
5.2 Conceitos em Probabilidade Os conceitos fundamentais em probabilidade s o experimentos aleat rios, espa o amostral e eventos. 5.2.1 Experimento aleat rio ( ) Qualquer processo aleat rio, capaz de produzir observa es, os resultados surgem ao acaso, podendo admitir repeti es no futuro. Um experimento aleat rio apresenta as seguintes caracter sticas: a - os resultados podem repetir-se n vezes ( n ) ;
50
b - embora n o se possa prever que resultados ocorrer o, pode-se descrever o conjunto de resultados poss veis; c - a medida que se aumenta o n mero de repeti es, aparece uma certa regularidade nos resultados. 5.2.2 Espa o Amostral (S) o conjunto de resultados poss veis, de um experimento aleat rio. Quanto ao n mero de elementos pode ser: 5.2.2.1 Finito N mero limitado de elementos; Ex.: S = {1, 2, 3, 4, 5, 6} 5.2.2.2 Infinito N mero ilimitado de elementos, pode ser sub-dividido em: a - Enumer vel Quando os poss veis resultados puderem ser postos em concord ncia biun voca com o conjunto dos n meros naturais (N) (caso das vari veis aleat rias discretas). Ex.: N b - N o Enumer vel Quando os poss veis resultados n o puderem ser postos em concord ncia biun voca com o conjunto dos n meros naturais (caso das vari veis aleat rias cont nuas). Ex.: R 5.2.3 Evento (E) Um evento (E) qualquer subconjunto de um espa o amostral (S). Pode-se ter opera es entre eventos da mesma forma que com conjuntos, como mostra a seguir. 5.2.4 Opera es com Eventos 5.2.4.1 A uni o B S mbolo utilizado "U ", o evento que ocorrer se, e somente se, A ou B ou ambos ocorrerem; 51
S
A
B
FIGURA 6.1 - Evento A uni o B 5.2.4.2 A interse o B S mbolo utilizado "I ", o evento que ocorrer se, e somente se, A e B ocorrem simultaneamente.
S
A A B
FIGURA 6.2 - Evento A interse o B 5.2.4.3 Complementar de A Simbologia " A ", o evento que ocorrer se, e somente se A n o ocorrer.
S
A
FIGURA 6.3 - Evento complementar de A (A )
52
U
B
5.2.5 Tipos de eventos 5.2.5.1 Eventos Mutuamente Excludentes S o ditos eventos mutuamente excludentes, quando a ocorr ncia de um implica ou n o ocorr ncia de outro, isto , n o pode ocorrer juntos, e conseq entemente, A I B o conjunto vazio ().
FIGURA 6.4 - Eventos mutuamente excludentes 5.2.5.2 Eventos N o Excludentes ou Quaisquer S o ditos eventos n o excludentes quando a ocorr ncia de um implica na ocorr ncia do outro, isto , s o aqueles que ocorrem ao mesmo tempo, A I B .
FIGURA 6.5 - Evento n o excludentes 5.2.5.3 Eventos Independentes S o aqueles cuja ocorr ncia de um evento, n o possui efeito algum na probabilidade de ocorr ncia do outro.
53
A I B , se A e B forem Quaisquer;
A I B = , se A e B forem Mutuamente Excludentes.
logo,
P (A I B) = P( A ) . P(B)
Ex.: A e B eventos Quaisquer S = { 1, 2, 3, 4 } A = {1, 2 } B = { 2, 4 }
A I B = { 2}
P(A I B ) = P( A ) . P(B)
P (A ) =
2 4
P( B) =
2 4
P(A I B ) =
1 4
5.2.5.4 Eventos Dependentes ou Condicionados Existem varias situa es onde a ocorr ncia de um evento pode influenciar fortemente na ocorr ncia de outro. Assim, se (A) e (B) s o eventos, deseja-se definir uma quantidade denominada probabilidade condicional do evento (A) dado que o evento (B) ocorre, ou sob a forma simb lica P A . B Assim, d -se a seguinte defini o:
( )
PA
( B) = P(A I B) P(B)
( )
onde P(B) 0. Se P(B) = 0, tem-se que P A B n o definida. 5.2.5.5 Eventos Coletivamente Exaustivos S o aqueles que ocorrem se nenhum outro ocorrer.
54
AI BICID = FIGURA 6.6 - Evento coletivamente exaustivos
5.3 Conceitos de Probabilidade 5.3.1 Conceito Emp rico de Probabilidade O problema fundamental da probabilidade consiste em atribuir um n mero a cada evento (E), o qual avaliar qu o poss vel ser a ocorr ncia de "E", quando o experimento for realizado. Uma poss vel maneira de tratar a quest o seria determinar a freq ncia relativa do evento E (fr(E)),
f r ( E) = n mero de ocorr ncias do evento (E) . n mero de repeti
Beleza de material!!!!
gostei muito deste arquivo porque eu sou estudande deestatistica e gestao de infomaçao e nele existe muito que aprender...
Cooool!
muito bom,
po valeu pela apostila isso vai ser muito fundamental nos meus estudos...!!!!!!
Muito obrigado pela apostila... ótima qualidade do material
Baixar Arquivo
3994 visitas | 1501 downloads
CEDERJ - Aula 17.2 - (Módulo 02) - Física Estatística
Aula do CEDERJ sobre Física Estatística: Introdução à Física da Matéria Condensada
CEDERJ - Aula 18.2 - (Módulo 02) - Física Estatística
Aula do CEDERJ sobre Física Estatística: Introdução à Física da Matéria Condensada
DICIONÃ?RIO DE TERMOS EQUIVALENTES EM SILVICULTURA E CONSERVACAO PORT-INGL
Pesquisadores da lingua inglesa usualmente nao tern tido um bom preparo em linguas estrangeiras. 0 pensamento, ainda que verbalmente manifesto, era de que qualquer literatura importante seria publicada em ingles ou que pelo menos seria traduzida para o ingles. Outro fator complicante e que o portugues está em prioridade inferior em relação ao espanhol, ao francês, e ao alemão, e poucos pesquisadores estrangeiros encontran tempo para estuda-lo. Pesquisadores e conservacionistas de lingua portuguesa, por outro lado, se encontram em desvantagem por estarem limitados a uma literatura publicada em portugues e a um vocabulario tecnico que ainda não está completamente desenvolvido.Várias foram as fontes usadas na coleta dos termos incluidos nesta publicação.A maiorfa dos termos incluidos foram coletados da literatura tecnica publicada em portugues. 0 context0 do uso destes termos sugeriu o seu equivalente na lingua inglesa. Termos adicionais foram definidos em contatos pessoais com profissionais que falam português.
INTRODUÇÃO À PESQUISA OPERACIONAL - Simulação
Neste capítulo final, estamos prontos para nos concentrarmos na última das técnicaschave da pesquisa operacional. A simulação se destaca entre essas técnicas sendo a mais usada delas. Além disso, por ser uma ferramenta tão flexível, poderosa e intuitiva, ela continua a ganhar rapidamente popularidade. Essa técnica envolve o uso de um computador para imitar (simular) a operação de um inteiro processo ou sistema. Por exemplo, a simulação é freqüentemente usada para realizar análises de risco em processos financeiros, imitando repetidamente a evolução das transações envolvidas para gerar um perfil de possíveis resultados. A simulação também é amplamente usada para analisar sistemas estocásticos que continuarão a operar indefinidamente. Para tais sistemas, o computador gera e registra, aleatoriamente, as ocorrências dos vários eventos que dirigem o sistema como se eles estivessem operando fisicamente. Em virtude de sua velocidade, o computador pode simular até mesmo anos de operação em uma questão de segundos. Registrar o desempenho da operação simulada do sistema para uma série de projetos ou procedimentos operacionais alternativos habilita então a avaliação e a comparação dessas alternativas antes de escolher uma. A Seção 20.1 descreve e ilustra a essência da simulação. A Seção 20.2 apresenta uma série de aplicações comuns de simulação. As Seções 20.3 e 20.4 se concentram em duas ferramentas- chave da simulação: a geração de números aleatórios e a geração de observações aleatórias a partir das distribuições de probabilidades. A Seção 20.5 descreve o procedimento geral para aplicação da simulação. A Seção 20.6 mostra como as simulações agora podem ser executadas de forma eficiente em planilhas e, depois, a Seção 20.7 estende essa metodologia baseada em planilhas em busca de uma solução ótima para modelos de simulação. Um suplemento do capítulo contido no CD-ROM introduz algumas técnicas especiais para melhorar a precisão das estimativas das medidas de desempenho do sistema simulado. Um segundo suplemento no CD-ROM apresenta um método estatístico inovador para analisar a saída de uma simulação.
Exercicios resolvidos calculo A cap. 2 parte 2
Resolução dos exercios do calculo A capitulo 2 parte 2
As Estratégias representam caminhos escolhidos para concentrar esforços com o objetivo de tornar real a visão da organização, tendo em vista a definição e a obtenção de fins determinados. Compõem processos decisórios de articulação e sistematização de idéias, recursos e pessoas, de modo abrangente e sensível às contingências ambientais, traduzindo compromissos de longo prazo com as partes interessadas - clientes, força de trabalho, acionistas e proprietários, fornecedores e a sociedade. Essas atividades são geralmente executadas pela liderança da organização e, dependendo do porte da mesma, envolvem outros níveis da estrutura. É comum, ainda, a organização se municiar de informações e pareceres de consultorias e especialistas para proporcionar uma visão de fora da organização e facilitar o processo de definição dos rumos para o futuro. Os planos são elaborados para cada área da organização que têm atribuição de executar as estratégias, detalhando as ações ao longo do tempo e os alvos a serem atingidos.