Apostila Estatística II CE003 UFPR

Apostila Estatística II CE003 UFPR

(Parte 1 de 9)

CE003 ESTATISTICA I (Notas de Aula)

Curitiba, 27 de fevereiro de 2009

Sumario

1.1 Introducao1
1.1.1 Estatıstica descritiva x estatıstica inferencial3
1.1.2 Populacao e amostra5
1.1.3 Variaveis e suas classificacoes8
1.2 Tecnicas de estatıstica descritiva9
1.2.1 Tabelas de frequencias10
1.2.2 Medidas-resumo13
1.2.3 Graficos21

1 Conceitos Basicos e Tecnicas de Estatıstica Descritiva 1

2.1 Introducao3
2.2 Conceitos Basicos de Probabilidade3
2.2.1 Definicao classica de probabilidade34
2.2.2 Aproximacao da Probabilidade pela frequencia relativa35
2.2.3 Propriedades de probabilidades35
2.2.4 Teorema da soma35
2.2.5 Probabilidade condicional36
2.2.6 Teorema do produto38
2.2.7 Teorema da probabilidade total38
2.2.8 Teorema de Bayes39

2 Teoria das Probabilidades 3

3.1 Introducao40
3.2 Variavel Aleatoria Discreta40
3.3 Variavel Aleatoria Contınua41
3.4 Esperanca Matematica41
3.5 Variancia42
3.6 Principais Distribuicoes de Probabilidades42
3.6.1 Distribuicao de Bernoulli42
3.6.2 Distribuicao Binomial42
3.6.3 Distribuicao de Poisson4

3 Variaveis Aleatorias 40 i

3.6.4 Distribuicao Normal4
3.6.5 Distribuicao Normal Padrao45
3.6.6 Uso da tabela da Normal Padrao45

i SUMARIO

4.1 Introducao48
4.2 Propriedades dos Estimadores51
4.3 Distribuicoes Amostrais53
4.3.1 Introducao53
4.3.2 Distribuicao amostral de X53
4.3.3 Teorema central do limite (TCL)5
4.4 Estimacao da Media Populacional (µ)57
4.5 Estimacao de µ em Amostras Pequenas60
4.6 Estimacao da Diferenca entre Duas Medias Populacionais ( µ1 e µ2)61
4.7 Estimacao de µ1 − µ2 em Amostras Pequenas62
4.8 Estimacao de uma Proporcao Populacional (p)64
4.8.1 TCL para proporcao amostral64
4.8.2 Intervalo de Confianca para p65
4.9 Determinacao do Tamanho da Amostra (n)6

4 Inferencia Estatıstica - Teoria da Estimacao 48

5.1 Introducao70
5.2 Conceitos Estatısticos dos Testes de Hipoteses71
5.2.1 Hipoteses estatısticas parametricas71
5.2.2 Testes72
5.2.3 Tipos de erros cometidos ao se tomar uma decisao72
5.2.4 Regiao crıtica (RC) e regra de decisao (RD)73
5.2.5 Procedimentos para realizacao de um teste de significancia73
5.3 Exemplos74
5.4 Alguns Testes Parametricos mais Utilizados85
5.4.1 Teste para a media (µ) com σ2 desconhecida85
5.4.2 Teste para a comparacao de duas medias populacionais (µ1 e µ2)89
5.4.3 Teste para amostras independentes com σ21 = σ290
5.4.4 Teste para amostras independentes com σ21 6= σ292
5.4.5 Teste para amostras dependentes93
5.5 Teste para Proporcao Populacional (p)94
5.6 Teste para a Comparacao de duas Proporcoes Populacionais (p1 e p2)96
5.7 Testes nao Parametricos97
5.7.1 Teste de aderencia97

5 Testes de Hipoteses 70 5.7.2 Teste qui-quadrado para tabelas de contingencia . . . . . . . . . . . 9

SUMARIO i

6.1 Introducao103
6.2 Coeficiente de Correlacao de Pearson103
6.2.1 Teste de significancia para ρ105
6.3 Regressao Linear Simples105
6.3.1 Estimacao dos parametros por MQO107
6.3.2 Adequacao do modelo de regressao linear ajustado108
6.3.3 Interpretacao dos parametros do modelo110

6 Correlacao e Regressao Linear 103

7.1 Introducao112
7.2 Conceitos Basicos sobre Experimentacao112
7.2.1 Tratamento112
7.2.2 Unidade experimental ou parcela113
7.2.3 Repeticao113
7.2.4 Variavel resposta ou variavel dependente114
7.2.5 Delineamento experimental (Design)114
7.2.6 Modelo e analise de variancia115
7.2.7 Delineamento experimental116
7.3 Analise de Variancia116
7.4 Teste de Tukey para Comparacao de Medias118
7.5 Teste de Kruskal-Wallis120

7 Analise de Variancia 112

8.1 Introducao122
8.1.1 Graficos de controle122
8.1.2 Construcao do grafico123
8.1.3 Analise do padrao de graficos de controle124
8.2 Graficos de Controle para Variaveis127
8.2.1 Graficos de controle para x e R128
8.2.2 Graficos de controle para x e s129
8.2.3 Exemplos131

8 Controle Estatıstico de Qualidade 122 Tabelas 136

1.1 Resumo de tecnicas de estatıstica descritiva3
1.2 Resumo de tecnicas de estatıstica inferencial4
1.3 Frequencias de estado civil em uma amostra de 385 indivıduos10
1.4 Tabela de frequencias para a variavel Idade1
1.5 Tabela de frequencias para a variavel horas semanais de atividade fısica12
1.6 Tabela de frequencias para a variavel Peso12
1.7 Tipos sanguıneos de 1000 pacientes16
1.8 Medidas de tendencia central para as notas das turmas A e B17
1.9 Principais medidas de dispersao18
1.10 Peso de 10 nascidos vivos19
1.1 Intencao de votos para os partidos A,B,C e D2
1.12 Numero de criancas por famılia23
1.13 Nıvel de estresse em 70 funcionarios de uma empresa25
1.14 Resumo de 5 numeros para o numero de laranjas por caixas27
1.15 Alturas de criancas do sexo masculino (m) e feminino (f)29
2.1 Gosto pela disciplina de estatıstica segundo sexo37
4.1 Populacao de alunos49

Lista de Tabelas

2, da populacao de alunos50
4.3 Distribuicao amostral da idade media53
5.1 Erros cometidos na tomada de decisao72
5.2 Algumas ocorrencias, implicacoes e decisoes apos a retirada da amostra74
5.3 Distribuicao de probabilidades das possıveis amostras75
5.4 Resumo das decisoes para o Exemplo 5.176
5.5 Resumo das decisoes para o novo experimento7

4.2 Todas as possıveis amostras aleatorias simples com reposicao de tamanho

o nıvel de significancia e a distribuicao de probabilidade81

5.6 Algumas tomadas de decisao e regras de decisao conforme a hipotese nula,

n e µ∗85

5.7 Valores de 1 − β(µ∗) para o exemplo 5.2 de acordo com os prametros α, σ, iv

5.8 Resistencia (kgf) de dois tipos de concreto92
5.9 Pressao antes e apos seis meses da adiminstracao do medicamento94
5.10 Tabela auxiliar97
5.1 .Numero de acidentes por dia da semana98
5.12 Quadro auxiliar com as frequencias esperadas9
5.13 Renda e numero de filhos por famılia em uma cidade100
5.14 Representacao de duas caracterısticas (A e B)100
5.15 Numero esperado para numero de filhos e renda102
6.1 Tempo de reacao ao estımulo em funcao da idade106
7.1 Tabela da analise de variancia116
7.2 Crescimento de explantes de morangos em gramas117
7.3 Analise de variancia do exemplo 7.1118
7.4 Consumo de energia eletrica de tres motores durante uma hora121
8.1 Dados de espessura (m) de uma peca de metal132
no processo134
1 Distribuicao Normal: P(0 ≤ Z ≤ zc)137
2 Distribuicao Normal padrao com valores de P[−∞ ≤ Z ≤ Zc]138

LISTA DE TABELAS v 8.2 Dados de espessura (m) de uma peca de metal avaliados apos intervencao

3 Distribuicao Normal padrao com valores de P[−∞ ≤ Z ≤ Zc] (continuacao). 139 4 Limites unilaterais de F ao nıvel de 5% de probabilidade

liberdade do denominador140
liberdade do denominador141
6 Valores de t em nıveis de 10% a 0,1% de probabilidade142

n1=numero de graus de liberdade do numerador, n2= numero de graus de 5 Limites unilaterais de F ao nıvel de 1% de probabilidade n1=numero de graus de liberdade do numerador, n2= numero de graus de 7 Valores da amplitude total estudentizada (q), para uso no teste de Tukey, ao nıvel de 5% de probabilidade. I=numero de tratamentos, GLRES= numero de graus de liberdade do resıduo.143 8 Distribuicao de Qui-quadrado.

Valor crıtico de χ2 tal que P(χ2k > χ20) = α144
9 Constantes utilizadas em graficos de controle145
1.1 Grafico de setores para a intencao de votos nos partidos A,B,C e D2
1.2 Grafico de barras para o numero de filhos por famılia24
1.3 Histograma para o nıvel de estresse25
1.4 Desenho esquematico do box-plot com base no resumo de 5 numeros26
1.5 Box-plot do numero de laranjas nas 20 caixas27

Lista de Figuras

lores atıpicos28
1.7 Altura de criancas conforme o sexo30
1.8 Variacao mensal na Taxa Selic no perıodo de 1995 a 200531
1.9 Grafico sequencial das vendas ao longo dos meses32
3.1 Densidade Normal45
4.1 Analogia entre as propriedades dos estimadores e o jogo de dardos52

1.6 Desenho esquematico do box-plot com base nos quartis e criterio para va-

nhos de amostra54
4.3 Densidades de T e Z5
4.4 Densidade de Z e o quantil z58
4.5 Maximo de p(1 − p)6
5.1 Area hachurada relativa ao P-Valor do teste80
5.2 Probabilidade de nao rejeitar H0 quando ela e falsa84
5.3 Regiao crıtica associada a estatıstica t87
5.4 Regiao crıtica associada a estimativa da media8
5.6 Grafico da distribuicao χ2101
6.1 Graficos de dispersao e coeficientes de correlacao associados104
6.2 Idade versus tempo de reacao a um estımulo107
6.3 Analise grafica dos resıduos associados ao modelo ajustado109
6.4 QQplot dos resıduos110
6.5 Tempos de reacao em funcao da idade e MRLS ajustado1

4.2 Distribuicao de X quando X tem distribuicao normal, para alguns tama- 5.5 Probabilidade associada a ocorrencia de estimativas da media menores do que 495 g. 8 vi

8.1 Grafico de controle: ideia basica123
8.2 Grafico de controle: limites de aviso125
8.3 Grafico de controle: processo tendencioso125
8.4 Grafico de controle: processo cıclico126
limite inferior de especificacao e LSE= limite superior de especificacao)127
8.6 Grafico de controle para media - sem problemas (Tabela 8.1)132
8.7 Grafico de controle para amplitude - dados da Tabela 8.1133
8.8 Grafico de controle para o desvio padrao - dados da Tabela 8.1133

LISTA DE FIGURAS vii 8.5 Efeito da media e desvio padrao em relacao aos limites de especificacao (LIE= 8.9 Grafico de controle para media - com problemas (Tabela 8.2). . . . . . . . . . . . 135

Capıtulo 1

Conceitos Basicos e Tecnicas de Estatıstica Descritiva

A estatıstica torna-se a cada dia uma importante ferramenta de apoio a decisao.

O objetivo deste capıtulo e apresentar importantes conceitos de estatıstica e trabalhar a intuicao do aluno para que este raciocine em cima de problemas que sao tipicamente solucionados com o uso de tecnicas estatısticas.

Para iniciar toda a discussao, primeiramente e necessario conhecer melhor o conceito de estatıstica. As pessoas comumente escutam falar sobre estatıstica na mıdia. Diariamente sao divulgadas informacoes tais como: ındices de inflacao, taxa de mortalidade, ındice de desenvolvimento humano, proporcao de eleitores, dentre outras.

O primeiro cuidado que devemos tomar e distinguir as estatısticas (valores numericos que resumem informacoes) da Estatıstica que ganhou status de ciencia. Nesta introducao, esta distincao sera feita da seguinte forma, a Estatıstica como ciencia tera sempre a primeira letra maiuscula , enquanto a estatıstica que transmite uma informacao numerica sera mencionada com a primeira letra minuscula.

No dicionario Aurelio, podemos encontrar como a primeira definicao para Estatıstica:

[Do fr. statistique.] S. f. 1. Parte da matematica em que se investigam os processos de obtencao, organizacao e analise de dados sobre uma populacao ou sobre uma colecao de seres quaisquer, e os metodos de tirar conclusoes e fazer ilacoes ou predicoes com base nesses dados.

Nesta definicao, a Estatıstica e definida como parte da matematica. Entretanto, a

Estatıstica ja se desenvolveu o bastante para ocupar um campo no cenario cientıfico como ciencia que possui metodos e tecnicas proprias. O famoso matematico John Tukey, que muito contribuiu para a Estatıstica, a caracterizou como:

”E uma ciencia e nao apenas um ramo da matematica, embora ferramentas da matematica sejam essenciais”.

2 Conceitos Basicos e Tecnicas de Estatıstica Descritiva Correa da Rosa, J. M.

Em um rapido levantamento e possıvel encontrar varias definicoes para Estatıstica, das quais citaremos algumas interessantes.

”Ciencia que utiliza metodos rıgidos para lidar com incertezas”. ”Ciencia que procura estabelecer os limites da incerteza”.

”Ciencia que coleta, classifica e avalia numericamente fatos que servirao de base para inferencia”.

”Ciencia da Incerteza”.

Outras definicoes de conteudo metaforico sao: ”...e a arte de torturar os dados ate que eles confessem a verdade”.

”...nada mais e do que o bom senso expresso em numeros”.

Embora todas as definicoes apresentadas contenham elementos importantes, a Estatıstica a ser apresentada neste material estara mais relacionada a definicao a seguir:

A Estatıstica e um conjunto de metodos e tecnicas que auxiliam a tomada de decisao sob a presenca de incerteza.”‘

Na maioria das definicoes apresentadas, verificamos a presenca da palavra incerteza.

De fato, o conceito de incerteza esta vinculado a aplicacao dos metodos e tecnicas de analise estatıstica.

A incerteza

A incerteza permea varias areas do conhecimento: fısica, ciencias sociais, comportamento humano, economia e ciencias naturais. O tratamento quantitativo adequado a incerteza e obtido por meio do estudo de probabilidades.

A incerteza e consequencia da variabilidade de um fenomeno e dificulta a tomada de decisoes. Considere um simples exemplo da vida cotidiana: a ida de uma pessoa a uma agencia bancaria. Em torno deste fenomeno ha uma serie de incertezas, por exemplo: a quantidade de pessoas na fila, o numero de atendentes, o tempo de atendimento, as condicoes do tempo, a cotacao da moeda,etc.

Mesmo que um indivıduo procure informacoes previas sobre todos estes elementos, sob os quais paira a incerteza, ainda assim nao sera possıvel predizer o desfecho. Podemos, por exemplo, analisar as condicoes do tempo, obter informacoes sobre o trafego, ligar para a agencia bancaria e, ainda assim, nao conseguimos precisar o horario em que receberemos o desejado atendimento bancario.

(Parte 1 de 9)

Comentários