Docsity
Docsity

Prepare-se para as provas
Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity


Ganhe pontos para baixar
Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium


Guias e Dicas
Guias e Dicas

Apostila de Introdução a Probabilidade, Notas de estudo de Engenharia de Materiais

UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus I UNIDADE ACADÊMICA DE MATEMÁTICA E ESTATÍSTICA Disciplina: Probabilidade e Estatística (6 créditos) Período 2009.2 Prof. Gilberto Matos e Areli Mesquita

Tipologia: Notas de estudo

2010
Em oferta
30 Pontos
Discount

Oferta por tempo limitado


Compartilhado em 17/05/2010

debora-braga-gama-6
debora-braga-gama-6 🇧🇷

4.4

(5)

2 documentos

Pré-visualização parcial do texto

Baixe Apostila de Introdução a Probabilidade e outras Notas de estudo em PDF para Engenharia de Materiais, somente na Docsity! UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus I UNIDADE ACADÊMICA DE MATEMÁTICA E ESTATÍSTICA Disciplina: Probabilidade e Estatística (6 créditos) Período 2009.2 Prof. Gilberto Matos e Areli Mesquita Aluno(a): . 1 a NOTA DE AULA 1 Introdução à Estatística 1.1 A Ciência Estatística O conceito de Estatística pode ser considerado de duas maneiras. O primeiro conceito, logo relaciona a Estatística com tabelas e gráficos nos quais os dados obtidos são represen- tados, ou melhor, relaciona à números específicos. Ouvimos, assim, falar em estatísticas do IBGE, estatísticas relacionadas à saúde e educação, índices econômicos, pesquisas de opinião, etc. Um segundo conceito refere-se ao conjunto de processos ou técnicas em- pregadas na investigação e análise de fenômenos. Neste caso, a Estatística é a ciência ou método científico que estuda os fenômenos aleatórios e, procura inferir as leis que os mesmos obedecem. Assim, um conceito mais abrangente e absoluto deve englobar tanto o primeiro conceito, o qual é o mais popular, quanto o segundo, o qual normalmente escapa à noção corrente. Definição 1.1 (Estatística). A Estatística é uma ciência que se preocupa com a coleta, organização, descrição, análise e interpretação dos dados, a fim de extrair in- formações a respeito de uma população. Dentro dessa idéia, podemos considerar a Ciência Estatística como dividida basica- mente em duas partes: 1. Estatística Descritiva - que se preocupa com a organização e descrição dos dados experimentais; 2. Estatística Inferencial - que, a partir da observação de alguns dados experimentais, realiza a análise e interpretação de dados com o objetivo de generalizar e prever resultados, utilizando-se para isto da Teoria das Probabilidades. Nesta disciplina, serão abordados tópicos referentes à estatística descritiva, conceitos fundamentais de probabilidade e os modelos probabilísticos mais importantes para o estudo da inferência estatística. 1 1.2 Estatística: Uma Visão Sistêmica (Desenhar figura representando uma visão sistêmica da estatística) 1.3 Conceitos Fundamentais Um dos principais conceitos utilizados na estatística é o de população. 1.3.1 População e Amostra Definição 1.2 (População). A população é um conjunto de todos os elementos (pessoas, objetos, etc) que possuem pelo menos uma característica em comum, a(s) qual(is) os relacionam ao problema que está sendo estudado. Exemplo 1. Se o problema a ser pesquisado está relacionado com a qualidade de um certo produto produzido numa indústria, a população pode ser composta por todas as peças produzidas numa determinada hora, turno, dia ou mês, dependendo dos objetivos; Exemplo 2. Se o objetivo de um estudo é pesquisar o nível de renda familiar de uma certa cidade, a população seria todas as famílias desta população. Mas, se o objetivo fosse pesquisar apenas a renda mensal do chefe da família, a população a ser pesquisada seria composta por todos os chefes de família desta cidade. 2 (b) As variáveis quantitativas contínuas - são variáveis numéricas cujos valores são obtidos por um procedimento de mensuração, podendo assumir quaisquer valores num intervalo dos números reais, como por exemplo, a temperatura, altura, salário, etc.. Observação 1. O fato de uma variável poder ser expressa por números não significa que ela seja necessariamente quantitativa, por que a classificação da variável depende de como foi medida. Por exemplo, para a variável peso de um lutador de boxe, se for anotado o peso marcado na balança, a variável é quantitativa contínua; por outro lado, se esse peso for classificado segundo as categorias do boxe, a variável é qualitativa ordinal. 1.4 Fases do Método Estatístico Assim como qualquer ciência, a estatística utiliza o método científico, que consiste das cinco etapas básicas seguintes: 1. Definir cuidadosamente o problema. Nesta etapa o pesquisador deve certificar-se de que é clara a finalidade de um estudo ou análise. Ao definir o que se quer estudar, ou seja, o problema, é necessário que se faça um levantamento sobre quais estudos já realizados no campo de pesquisa abordado. Deve-se também especificar quem ou o quê será observado no estudo, ou seja, a população a ser pesquisada. 2. Formular um plano para a coleta dos dados adequados. Nesta fase, o pesquisador deverá listar as variáveis (características ou dados) que sejam relevantes para se atingir os objetivos propostos pela pesquisa. Além disso, deve-se decidir se a coleta dos dados será realizada através de um censo ou amos- tragem, ou seja, se todos os elementos da população serão observados ou se apenas uma parte da população é que será observada e neste último caso deve-se decidir por alguma técnica de amostragem, podendo ser probabilística ou não. Os dados podem ser classificados quanto à forma de coleta, como: a. Dados primários - quando o próprio pesquisador é quem elabora e aplica os instrumentos necessários para a coleta dos dados, ou seja, quando a Coleta é Direta; b. Dados secundários - quando o pesquisador utiliza informações já colhidas por outrem, retirando-as de livros, revistas, mapas anuários, etc. 3. Coligir ou apurar os dados. Esta fase consiste em resumir os dados, através de sua contagem e agrupamento. É possível que nesta fase seja identificado a presença de dados absurdos fazendo-se necessário a eliminação ou correção destes tipos de dados. 4. Analisar e interpretar os dados. 5. Relatar as conclusões de maneira que sejam facilmente entendidas por quem as for usar na tomada de decisões. 5 1 a LISTA DE EXERCÍCIOS 1 - Defina e/ou explique com suas próprias palavras, o que você entende por Ciência Estatística e quais os principais ramos (partes) da Estatística. 2 - Através de um exemplo, defina: População e Amostra. 3 - Considere as seguintes situações: 1) Em uma pesquisa, feita pela EMPETUR com 1015 pousadas escolhidas aleato- riamente, 269 (ou 26,5%) possuíam Home-page na Internet para divulgação e prestação de serviços ao turista. 2) Outra pesquisa feita entre as 50 Agências de Viagens de uma certa localidade mostra que 42 (ou 84%) prestam serviços pela Internet. Identifique em qual das situações nós temos um exemplo de Parâmetro e outro de Estatística (no sentido de medida). Justifique sua resposta. 4 - O que você entende por variável? Justifique a sua resposta por intermédio de um exemplo. 5 - Como você diferencia uma variável discreta de uma variável contínua? Utilize um exemplo para melhor ilustrar. 6 - Defina e/ou explique com suas próprias palavras, o que você entende por amostragem. 7 - Qual é o principal objetivo de qualquer plano de amostragem? 8 - As estatísticas geradas por intermédio de uma amostra devem ser representativas desta amostra ou da população de origem? Justifique a sua resposta. 9 - Para que uma amostra seja representativa, é necessário apenas que a mesma tenha um tamanho apropriado? Justifique a sua resposta. 10 - A Revista dos Eventos, N 13, tentando sanar, ao menos parcialmente, a carência de informações precisas sobre a indústria de eventos, promoveu a 1a PESQUISA - O Mercado de Congressos no Brasil. Os resultados desta pesquisa se baseiam em 40 questionários respondidos sobre um total de 1000, os quais foram encaminhados por entrega pessoal a dirigentes de entidades integrantes do cadastro da própria Revista dos Eventos. Qual é o problema ou a limitação desta pesquisa? Pelo menos teoricamente, qual seria o melhor procedimento para este tipo de pesquisa, já que a empresa possui um cadastro das entidades? 11 - Classifique cada uma das informações (variáveis) abaixo, de acordo com os tipos de variáveis. a) Nome b) Nível de satisfação c) Idade d) Número de dias hospedado 6 UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus I UNIDADE ACADÊMICA DE MATEMÁTICA E ESTATÍSTICA Disciplina: Probabilidade e Estatística (6 créditos) Período 2009.2 Prof. Gilberto Matos e Areli Mesquita Aluno(a): . 2 a NOTA DE AULA 2 Análise Exploratória de Dados / Estatística Des- critiva 2.1 Introdução A estatística pode ser considerada como um instrumento ou um conjunto de métodos matemáticos que devem ser utilizados quando se pretende transformar dados em informação. Para ilustrar este processo, veja a Figura 1: 12 15 18 15 12 18 18 15 18 17 19 20 Conjunto de dados ⇒ Média Moda Mediana Proporção Quantis Conjunto de informações Figura 1: No primeiro retângulo, tem-se um conjunto de observações da variável idade de um grupo de 12 pessoas e, no segundo retângulo, as estatísticas (informações) que podem representar esses números. 2.2 Organização de dados: Tabelas e Gráficos 2.2.1 Distribuição de Frequências O primeiro passo para se resumir um conjunto de dados é ordená-los em ordem cres- cente ou decrescente, e proceder a contagem do número de ocorrência (freqüência) de cada dado. À ordenação dos dados denominamos de Rol. Assim, o rol para o conjunto de dados da Figura 1 fica: Rol de dados: (Organize!) 7 Exercício de Fixação 1 - O seguinte conjunto de dados é referente ao número de acidentes por dia em certo trecho de rodovia no mês de setembro de certo ano: 2 0 1 2 3 1 6 1 0 0 1 2 2 1 2 0 1 4 2 3 0 1 0 2 1 2 4 1 1 1 Responda as seguintes questões: a) Qual o número mínimo de acidentes, num certo dia? E o número máximo? b) Freqüêntemente, ocorreram quantos acidentes por dia? E o que isso representa em termos de percentuais? c) Represente graficamente a distribuição de frequência da variável número de acidentes por dia, no mês de setembro. d) Faça um gráfico de colunas para o percentual acumulado. 2.2.2 Distribuição de Frequências para Dados Agrupados em Classes Em algumas situações, é necessário o agrupamento de dados em categorias ou classes para se proceder a construção de uma tabela de freqüências. Por exemplo, em um conjunto de dados contínuos, um mesmo valor não ocorrerá com grande freqüência, ou até mesmo, não se repetirá por mais de uma vez. Uma vantagem em agrupar os dados em classes consiste na organização de grandes conjuntos de dados de forma mais clara e objetiva. Por outro lado, uma desvantagem, consiste na perda de informações por não se saber exatamente quais os valores ocorridos dentro de cada classe. Para ilustrar como proceder a construção de uma tabela de freqüências em classes, considere o seguinte conjunto de dados: Tabela 2: Dados referentes às notas no 1o estágio de 20 estudantes de estatística. Código do aluno 1 2 3 4 5 6 7 8 9 10 Nota 7,5 8,0 9,0 7,3 6,0 5,8 10,0 3,5 4,0 6,0 Código do aluno 11 12 13 14 15 16 17 18 19 20 Nota 7,5 7,0 8,5 6,8 9,5 9,8 10,0 4,8 5,5 7,0 Note que, não haverá vantagem alguma se organizarmos estes dados numa tabela de freqüências, uma vez que os dados pouco se repetem. Assim, torna-se útil o agrupamento dos dados, que, de um modo geral, pode ser feito de acordo com os seguintes passos: 1. Organizar os dados num Rol. 10 2. Estabelecer o Número de Intervalos (categorias ou classes) para se dividir o con- junto de dados. A escolha do número de classes é arbitrária, a qual pode ser estabelecida de acordo com o bom senso do pesquisador ou obtido por alguma fórmula matemática construída para este fim. Uma sugestão prática é a escolha entre 5 e 15 classes com a mesma amplitude e duas fórmulas matemáticas que podem orientar na escolha do número de classes, são: (a) k = √ n (b) k = 1 + 3, 3 × log(n) Onde k é o número de classes e n é o número total de observações. 3. Calcular a Amplitude Total: ATot = xmáx − xmín Onde xmáx e xmín é o valor máximo e mínimo observado no conjunto de dados. 4. Determinar a Amplitude de Classe: h = ATot k 5. A partir do menor valor observado no conjunto de dados, ou de algum valor imedia- tamente inferior e adequadamente escolhido, delimitar as classes, ou seja, determinar os limites inferiores e superiores de cada classe. Neste momento, os seguintes símbolos são úteis: (a) li −−−−| Li - para indicar que o valor extremo inferior (li) não pertence à i-ésima classe, enquanto que o valor extremo superior (Li) pertence. (b) li |−−−− Li - para indicar que o valor extremo inferior (li) pertence à i-ésima classe, enquanto que o valor extremo superior (Li) não pertence. 6. Após todos estes passos, só resta proceder a contagem do número de observações pertencentes à cada uma das classes e organizar estas informações numa tabela de freqüências para dados agrupados. De acordo com estes passos, o conjunto de dados anterior pode ser organizado como: 11 (Construir a tabela de freqüências para dados agrupados) Representação Gráfica de uma Variável Quantitativa Contínua - Histograma Para a representação gráfica de variáveis quantitativas contínuas é necessário alguma adaptação do gráfico de colunas, uma vez que, em geral, é necessário agrupar os dados em classes e conseqüentemente há perda de informações. Histograma - é um gráfico indicado para representar dados agrupados em classes. Este gráfico é uma adaptação do gráfico de colunas, onde as bases correspondem aos intervalos de classe e as alturas são proporcionais às freqüências de classe. Veja como fica o histograma para a distribuição das notas: (Construir o histograma para a distribuição de freqüências em classes) 12 Exemplo 1: A partir do conjunto de dados 1, pode-se obter o seguinte rol de dados: 1 2 2 ︸︷︷︸ mediana 3 5 Note que, o número de observações, n = 5, é ímpar, logo o valor da mediana (valor central) está na posição PMd = n+12 = 5+1 2 = 3, que é igual a Md = 2. Exemplo 2: Ordenando em ordem crescente o conjunto de dados 2, teremos o seguinte rol de dados: 1 2 2 3 ︸︷︷︸ dois valores centrais 5 5 Agora, neste caso, o número de observações, n = 6, é par, e, portanto, existem dois valores centrais localizados nas posições P1Md = n2 = 6 2 = 3 e P2Md = n2 + 1 = 3 + 1 = 4. Assim, a mediana será a média aritmética dos valores que se encontram nestas duas posições, dada por: Md = xP1Md + xP2Md 2 = 2 + 3 2 = 2, 5. Observação: Pode-se, também, obter a posição da mediana através dos seguintes passos: 1◦) Obter o valor que representa a metade do total de observações: PMd = n2 ; 2◦) Utilizar a seguinte regra: (a) Se PMd for um número não inteiro, então, arredonda-se o valor de PMd para o maior inteiro mais próximo, e, assim, o valor da mediana estará nesta nova posição obtida. (b) Se PMd for um número inteiro, então o valor da mediana será a média aritmética dos valores que estão nas posições PMd e PMd + 1. Exemplo 3: Utilizando-se os procedimentos descritos na observação acima, temos que, para o conjunto de dados 1, PMd = n2 = 5 2 = 2, 5 (não inteiro), logo o valor da mediana estará na posição PMd = 3 (maior inteiro mais próximo), que é dado por Md = 2. Exemplo 4: No conjunto de dados 2, temos PMd = n2 = 6 2 = 3 (inteiro), assim, de acordo com o procedimento descrito na observação acima, temos que a mediana é dada pela média aritmética dos valores observados nas posições PMd = 3 e PMd+1 = 3 + 1 = 4: Md = xP1Md + xP2Md 2 = 2 + 3 2 = 2, 5. 15 2. Moda - é o valor (ou os valores) no conjunto de dados que ocorre(m) com maior freqüência. Notação: Mo ou Mo(X). Exemplo 5: O primeiro conjunto de dados, 1 2 2 3 5, é dito ser unimodal, tendo em vista que um único valor ocorre com maior frequência. Assim, a moda é Mo = 2. Exemplo 6: O segundo conjunto de dados, 1 2 2 3 5 5, é dito ser bimodal, tendo em vista que, neste caso, dois valores ocorrem com maior frequência, assim, os valores modais são: Mo = 2 e Mo = 5. 3. Média Aritmética (Média) - é obtida a partir da razão entre a soma dos valores observados e o total de observações: Média = soma dos valores total de observações (n) Notação: Me, Me(X) ou x. Exemplo 7: A partir do conjunto de dados 1, a média é obtida por: Me(X) = x = soma dos valores total de observações (n) = 1 + 2 + 2 + 3 + 5 5 = 2, 6. Observação: 1) A média aritmética pode ser expressa através do uso do símbolo de somatório ∑ (sigma). Por exemplo, se x1, x2, . . . , xk são k valores distintos da variável X, podemos escrever: Me(X) = x = x1 + x2 + . . . + xk k = 1 k k∑ i=1 xi Agora, se, de um total de n valores observados (ou observações), x1 ocorreu n1 vezes, x2 ocorreu n2 vezes, etc., xk ocorreu nk vezes, então a média de X pode ser reescrita como: Me(X) = x = x1.n1 + x2.n2 + . . . + xk.nk n = 1 n k∑ i=1 xi.ni (1) = k∑ i=1 xi. ni n (2) = k∑ i=1 xi.fi. (3) Onde: 16 • ni é freqüência absoluta do valor observado xi, • n = ∑k i=1 ni é o total de observações, e, • fi é freqüência relativa do valor observado xi. Exemplo 8: A partir do segundo conjunto de dados, 1 2 2 3 5 5, temos: Me(X) = x = 1 n k∑ i=1 xi.ni = 1 6 (1 × 1 + 2 × 2 + 3 × 1 + 5 × 2) = 18 6 = 3. Exercícios de Fixação 1 - Dado o seguinte conjunto de dados: 12 12 15 15 15 17 18 18 18 18 19 20 Determine a média, moda e mediana. Solução: 17 2.3.3 Medidas de Dispersão ou de Variabilidade Na sumarização de um conjunto de dados, uma única medida representativa da posição central, esconde toda a informação sobre a variabilidade dos dados. Veja, por exemplo, os seguintes dados: Variável X : 3 4 5 6 7 Variável Y : 4 5 5 6 Variável Z : 5 5 5 5 Note que a média Me(X) = Me(Y ) = Me(Z) = 5, a qual nada informa sobre a variação dos valores nos dois grupos. Assim, torna-se importante o conhecimento de uma medida que forneça este tipo de informação. Na prática, existem várias medidas que expessam a variabilidade de um conjunto de dados, sendo que as mais utilizadas baseam-se na idéia que consiste em verificar a distância de cada valor observado em relação à média. Estas distâncias são denominadas de desvios em relação à média. Definição 2.1 (Variância). - é uma medida que representa a variabilidade de um conjunto de dados e, é obtida pelo cálculo da média dos quadrados dos desvios em relação à média: V ar(X) = s2 = 1 n k∑ i=1 (xi − x)2 × ni = k∑ i=1 (xi − x)2 × ni n = k∑ i=1 (xi − x)2 × fi Exercício 1. Mostre que: k∑ i=1 (xi − x)2 × ni = k∑ i=1 x2i ni − nx2 E, por isso, a variância também pode ser obtida pela seguinte fórmula: V ar(X) = s2 = 1 n k∑ i=1 x2i ni − x2 20 Vejamos, agora, como fica a variância para as variáveis X, Y e Z: Assim, de acordo com a variância, podemos dizer que a variável X apresenta ... Observação: Para o cálculo da variância, quando os dados estão agrupados em classes, basta substituir os verdadeiros valores observados xi pelo ponto médio da i-ésima classe si. Definição 2.2 (Desvio Padrão). - é a raiz quadrada da variância. D.P.(X) = s = √ s2 = √ √ √ √ k∑ i=1 (xi − x)2 × fi O uso do desvio padrão como medida de variabilidade é preferível pelo fato de ser expresso na mesma unidade de medida dos valores observados. Pois, a variância pode causar problemas de interpretação por ser expressa em termos quadráticos. Definição 2.3 (Coeficiente de Variação). - O coeficiente de variação (CV) é uma medida relativa de variabilidade. O seu valor é determinado por intermédio do quociente entre o desvio padrão e a média aritmética dos dados. CV (X) = s x × 100 (expresso em porcentagem (%)) A utilidade imediata do coeficiente de variação é a possibilidade de avaliar o grau de representatividade da média. Esta medida também é bastante útil na comparação entre conjunto de dados, em relação à variabilidade; ainda que as unidades de medida nos conjuntos de dados sejam distintas. Por exemplo, comparar a variabilidade das distribuições da variável peso expressa em quilogramas (Kg) e altura expressa em metros (m). Um critério de decisão sobre a representatividade ou não da média, pode ser dada pela seguinte linha de corte: Se CV ≥ 50%, a média não é representativa. Se CV < 50%, a média é representativa. 21 Exemplos: a) Obtenha o desvio padrão das variáveis X, Y e Z além dos coeficientes de variação CV (X), CV (Y ) e CV (Z). b) Considere os quilômetros rodados por 3 carros: 30 Km, 40 Km e 50 Km. Calcule a média, a variância, o desvio padrão e o CV. Interprete essas medidas. Exercícios de Fixação 1 - Dado o seguinte conjunto de dados: 12 12 15 15 15 17 18 18 18 18 19 20 Determine o desvio padrão e o CV. Solução: 22 Figura 3: Box-plot para a variável Peso Figura 4: Box-plot da variável Peso para cada sexo 25 UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus I UNIDADE ACADÊMICA DE MATEMÁTICA E ESTATÍSTICA Disciplina: Probabilidade e Estatística (6 créditos) Período 2009.2 Prof. Gilberto Matos e Areli Mesquita Aluno(a): . 2 a LISTA DE EXERCÍCIOS 1 - Considere uma distribuição de freqüências qualquer representada por (x1, n1), (x2, n2), . . . , (xk, nk). Mostre que a soma dos desvios em relação à média é igual zero, ou seja, que ∑k i=1(xi − x) × ni = 0. 2 - Obtenha a média e a mediana para o seguinte conjunto de dados: 20 30 40 a) Se substituímos o valor 40 por 70, os valores da média e da mediana serão os mesmos? Justifique? b) Analisando os resultados acima, ressalte uma característica vantajosa da medi- ana em relação à média. 3 - Na turma A do curso normal da Escola X, estão matriculados 50 alunos no cor- rente ano. O levantamento das fichas biométricas revelou as seguintes estaturas em centímetros: 165 164 151 160 155 169 153 156 165 160 170 157 162 162 155 154 151 155 162 150 168 160 154 151 168 155 156 158 166 155 154 152 163 156 170 158 171 159 175 154 159 158 153 158 156 162 165 156 161 157 a) Elabore uma distribuição de freqüências, fazendo o limite inferior da primeira classe igual a 150 (inclusive) e amplitudes dos intervalos de classe igual a 5 cm. b) Baseado na distribuição de freqüência calcule: a média, a mediana e a moda. 4 - As taxas de juros recebidas por 10 ações durante certo período foram (medidas em porcentagem): 2.59; 2.64; 2.60; 2.62; 2.57; 2.55; 2.61; 2.50; 2.63; 2.64. Calcule a média e a mediana. 26 5 - Dados os conjuntos de números: A = {1000; 1001; 1002; 1003; 1004; 1005} e B = {0, 1, 2, 3, 4, 5} podemos afirmar que: a) o desvio-padrão de A é igual a 100 vezes o desvio-padrão de B. b) o desvio-padrão de A é igual ao desvio-padrão de B. c) o desvio-padrão de A é igual ao desvio-padrão de B multiplicado pelo quadrado de 1000. d) o desvio-padrão de A é igual ao desvio-padrão de B dividido por 1000. e) o desvio-padrão de A é igual ao quadrado do desvio-padrão de B. 27 Tabela 3 - Freqüências percentuais da distribuição conjunta das variáveis X e Y , em relação ao total de linha (freqüência marginal de X). Y 1◦ Grau 2◦ Grau Superior Total marginal de X X Capital 100% Interior 100% Outra 100% Total marginal de Y 100% Tabela 4 - Freqüências percentuais da distribuição conjunta das variáveis X e Y , em relação ao total de coluna (freqüência marginal de Y ). Y 1◦ Grau 2◦ Grau Superior Total marginal de X X Capital Interior Outra Total marginal de Y 100% 100% 100% 100% 3.3 Independência de Variáveis Ocorre com bastante freqüência em análises de distribuição conjunta o questionamento sobre a existência de dependência ou não entre as variáveis, além da necessidade de se saber o grau de dependência entre elas, caso exista. De modo geral, o grau de dependência entre duas variáveis é quantificado pelos co- eficientes de associação ou correlação. Usualmente, esses coeficientes variam de zero até um, sendo que, às vezes, variam de -1 a 1. Desta maneira, valores próximos de zero dão indícios de independência entre as variáveis e, valores próximos de 1 (ou -1) indicam um alto grau de dependência positiva (ou negativa). 3.3.1 Medidas de Associação entre duas Variáveis Qualitativas Uma medida de dependência bastante utilizada para variáveis qualitativas é o coeficiente de contingência, o qual é dado por C = √ χ2 χ2 + n , onde n é o número de observações e χ2 é uma medida conhecida por qui-quadrado, a qual é obtida a partir da seguinte soma 30 χ2 = r∑ i=1 s∑ j=1 (oij − eij)2 eij , onde o somatório é estendido a todas as caselas de frequências conjuntas em uma tabela de dupla entrada, e • oij é a freqüência observada na i-ésima casela; • eij é a freqüência esperada na i-ésima casela, caso houvesse independência entre as variáveis, ou seja, quando a proporção em cada categoria de uma variável (fixada o total em linha ou coluna) é igual ou próxima a proporção marginal. No entanto, o valor máximo de C depende de r e s e, para evitar esse inconveniente, costuma-se definir um outro coeficiente, que varia entre 0 e 1, dado por T = √ χ2/n (r − 1)(s − 1) . 3.3.2 Medidas de Associação entre duas Variáveis Quantitativas Neste caso, pode-se aplicar um procedimento análogo ao realizado para a análise de variáveis qualitativas. E, por se tratar de variáveis quantitativas, antes de construir uma tabela de dupla entrada, os dados marginais podem ser agrupados em intervalos de classe, assim como no caso de uma única variável. Em análises de associação entre variáveis quantitativas, são possíveis procedimentos analíticos mais refinados, como veremos a seguir. Diagrama de Dispersão O diagrama (ou gráfico) de dispersão nada mais é que a representação de pares dos valores observados (x, y) num sistema cartesiano. Vejamos a ilustração de alguns gráficos que podem surgir na prática: 31 Coeficiente de Correlação (Linear) Ao ser observada uma associação entre variáveis quantitativas, seria muito útil saber- mos sobre a intensidade desta associação. Aqui, veremos apenas uma medida referente ao tipo de associação linear, ou seja, ao tipo de relação em que os pontos do gráfico de dispersão aproximam-se de uma reta. Definição: Dados n pares de valores (x1, y1), (x2, y2), ..., (xn, yn), chama-se coefici- ente de correlação entre as variáveis X e Y o valor obtido por corr(X, Y ) = 1 n n∑ i=1 (xi − x)(yi − y) dp(X)dp(Y ) ou seja, a média dos produtos dos valores reduzidos (ou padronizados) das variáveis. Enquanto o coeficiente T para variáveis qualitativas só assume valores ente 0 e 1, o coeficiente de correlação pode assumir qualquer valor entre -1 e 1. Uma fórmula alternativa e mais operacional para o coeficiente de correlação é dada por corr(X, Y ) = ∑ xiyi − nxy √ ( ∑ x2i − nx2)( ∑ y2i − ny2) O numerador da expressão acima, que mede o total de concentração dos pontos pelos quatro quadrantes, dá origem à covariância que é uma medida bastante usada. Definição: Dados n pares de valores (x1, y1), (x2, y2), ..., (xn, yn), chamamos de co- variância entre as variáveis X e Y à medida dada por cov(X, Y ) = n∑ i=1 (xi − x)(yi − y) n . Ou seja, a média dos produtos dos valores centrados das variáveis. Alternativamente o coeficiente de correlação também pode ser escrito como corr(X, Y ) = cov(X, Y ) dp(X)dp(Y ) . Exercício de Aplicação Numa amostra de cinco operários de uma dada empresa foram observadas duas variá- veis. X: anos de experiência num dado cargo e Y: tempo, em minutos, gasto na execução de uma tarefa relacionada com esse cargo. As observações são apresentadas na tabela abaixo. X 1 2 4 4 5 Y 7 8 3 2 2 Obs.: ∑ x = 16, ∑ x2 = 62, ∑ y = 22, ∑ y2 = 130, ∑ xy = 53. Você diria que a variável X pode ser usada para explicar a variação de Y? Justifique. 32 4.2 Definições Básicas Definição 4.1 (Experimentos Aleatórios ou Fenômenos Aleatórios). são aque- les onde o processo de experimentação está sujeito a influências de fatores casuais e conduz a resultados incertos. Notação: E. Exemplos: E1 : Jogar uma moeda e observar a face superior. E2 : Lançar um dado e observar o número da face superior. E3: Uma lâmpada é fabricada. Em seguida é testada a duração da vida útil dessa lâmpada. Observações: a) Cada experimento poderá ser repetido um grande número de vezes sob as mesmas condições; b) Não podemos afirmar que resultado particular ocorrerá, porém podemos descrever o conjunto de todos os possíveis resultados do experimento; c) Quando o experimento é repetido um grande número de vezes, surgirá uma regula- ridade nos resultados. Esta regularidade, chamada de regularidade estatística, é que torna possível construir um modelo matemático preciso com o qual se analisará o experimento. Definição 4.2 (Espaço Amostral). é o conjunto de todos os possíveis resultados de um experimento aleatório. Notação: S ou Ω. Exemplos: Os espaços amostrais associados aos experimentos aleatórios E1, E2 e E3 são: S1 = S2 = S3 = 35 Definição 4.3 (Evento). Dado um espaço amostral S associado a um experimento E, definimos como evento, qualquer subconjunto desse espaço amostral, ou seja, é qualquer coleção de resultados do experimento E. Notação: A, B, C, D, etc. Exemplos: 1 - Considerando o espaço amostral S2, exemplos de eventos seriam: A: Ocorre face par = B: Ocorre um número menor que 4 = C: Ocorre um número maior que 0 = D: Ocorre o número 10 = 2 - Considerando o espaço amostral S3, um exemplo de evento seria: A: A vida útil de uma lâmpada é menor que 10 horas = Observação: Como os eventos de um espaço amostral são conjuntos, todas as operações da teoria dos conjuntos são válidas para obter novos eventos. Considere, por exemplo, dois eventos A e B, então o evento: a) A ∪ B ocorrerá se, e somente se, A ocorrer, ou B ocorrer, ou ambos ocorrerem; b) A ∩ B ocorrerá se, e somente se, A e B ocorrerem simultaneamente; c) A ocorrerá se, e somente se, A não ocorrer; Um recurso gráfico, conhecido como Diagrama de Venn, poderá ser vantajosamente empregado quando estivermos combinando conjuntos. Para ilustrar, vejamos como fica este diagrama representando os eventos descritos nos itens a, b e c: (Desenhar os Diagramas de Venn, para cada evento) 36 Definição 4.4 (Eventos Mutuamente Excludentes). Dois eventos, A e B, são denominados, mutuamente excludentes, se eles não puderem ocorrer simultaneamente, ou seja, A ∩ B = φ. Exercício: Esboce um Diagrama de Venn, representando dois eventos mutuamente exclu- dentes. Exemplo: Ao lançar um dado e observar o número da face superior temos que o evento A: observar face par é mutuamente excludente do evento B: observar face ímpar, pois é impossível observar a ocorrência simultânea destes dois eventos, ou seja, A∩B = φ. Observação: Leis de D’Morgan (i) A ∪ B = A ∩ B (ii) A ∩ B = A ∪ B Exemplos: 1 - Lança-se um dado e observa-se o número da face superior. Considerando este expe- rimento aleatório e os eventos: A: Ocorre face par = B: Ocorre um número menor que 4 = Determine em notação de conjuntos os seguintes eventos: a) C: ocorre face menor que 7 = b) D: ocorre face cujo valor é maior que 6 = c) A ∪ B d) A ∩ B e) A f) B g) A ∪ B h) A ∩ B i) A ∪ B j) A ∩ B k) A − B = A ∩ B l) B − A = B ∩ A 37 4.3.2.2 Noções Básicas de Técnicas de Contagem Nem sempre a tarefa de calcular a probabilidade de um evento aleatório, da forma P (A) = r/n, é simples. Em algumas situações é necessário alguns procedimentos sistemá- ticos de contagem ou enumeração para se obter o número de maneiras, r, pelas quais A pode ocorrer, bem como o número total de maneiras, n, pelas quais o espaço amostral S pode ocorrer. É no contexto descrito acima, que as técnicas de contagem são de fundamental im- portância. Neste curso, veremos apenas alguns dos principais procedimentos de contagem. 4.3.2.2.1 Princípio Fundamental da Contagem - Regra da Multiplicação Suponha que um experimento possa ser realizado em k etapas, de modo que, para a primeira etapa existem n1 resultados possíveis, para a segunda etapa n2 resultados possíveis, e assim sucessivamente, até que para a k − ésima etapa existem nk resultados possíveis. Então, existe um total de n1 × n2 × .... × nk resultados possíveis para este experimento. Exemplos: 1 - Ao lançar um dado e uma moeda, quantos resultados possíveis podem ser obtidos? Resp.: 12 2 - Uma companhia produz fechaduras que usam segredos numéricos para serem abertas. Se cada segredo consiste de três números distintos, escolhidos dentre os inteiros de 0 a 9, quanto segredos diferentes poderão ser fabricados? Resp.: 720 3 - Quantos números naturais de 4 algarismos podem ser formados usando-se apenas os algorismos 2, 3, 4 e 5, de forma que sejam menores do que 5000 e divisíveis por 5? Resp.: 48 4.3.2.2.2 Combinação Quando uma amostra de k elementos for retirada (sem importar a ordem entre si) de um conjunto de n elementos. O número de diferentes amostras possíveis é denotado por( n k ) e é igual a: ( n k ) = n! k!(n − k)! onde o símbolo ! significa que: n! = n(n − 1)(n − 2)(n − 3) . . . (3)(2)(1) Por exemplo, 5! = 5.4.3.2.1 [Nota: A quantidade 0! é definida como sendo igual a 1.] 40 Exemplos: 1 - Qual é o número de possíveis empreendimentos quando desejamos selecionar dois dentre quatro? Resp: 6 2 - Suponha que num lote com 20 peças existem cinco defeituosas. Escolhemos 4 peças do lote ao acaso, ou seja, uma amostra de 4 elementos, de modo que a ordem dos elementos seja irrelevante: a) Quantas amostras possíveis existem? Resp: 4845 b) Dentre todos os possíveis resultados, quantos levam à escolha de duas peças defeituosas? Resp.: 1050 c) Qual é a probabilidade de sair duas peças defeituosas? Resp.: 0,217 41 4.3.3 Definição Axiomática de Probabilidade Definição 4.8 (Definição Axiomática de Probabilidade). Dado um espaço amos- tral S, a probabilidade de um evento A ocorrer, representado por P (A) , é uma função definida em S, que associa a cada evento A um número real, satisfazendo os seguintes axiomas: (i) 0 ≤ P (A) ≤ 1; (ii) P (S) = 1; (iii) Se A e B forem mutuamente excludentes (A ∩ B = φ), então P (A ∪ B) = P (A) + P (B) . Observação: A probabilidade de um evento A, denotada por P (A) , indica a chance de ocorrência do evento A. Quanto mais próxima de 1 é P (A), maior é a chance de ocorrência do evento A, e quanto mais próxima de zero, menor é a chance de ocorrência do evento A. Principais Teoremas: T1. Se φ denota o conjunto vazio (Evento Impossível), então P (φ) = 0. T2. Se A é o evento complementar de A, então P (A) = 1 − P (A) . T3. Se A e B são dois eventos quaisquer, então P (A ∪ B) = P (A) + P (B) − P (A ∩ B) . Exemplo: Considere um experimento aleatório com espaço amostral S e os eventos A e B associados tais que: P (A) = 1/2, P (B) = 1/3 e P (A ∩ B) = 1/4. Determine: a) P (A) b) P (B) c) P (A ∪ B) d) P (A ∩ B) e) P (A ∪ B) 42 6 - Um terço dos eleitores de certa comunidade é constituido de mulheres, e 40% dos eleitores votaram na última eleição presidencial. Supondo que esses dois eventos sejam independentes, determine a probabilidade de escolher um eleitor da lista geral, que seja mulher e que tenha votado na última eleição presidencial. 7 - Uma urna contém duas bolas brancas e cinco pretas. Qual a probabilidade de sair duas bolas pretas supondo que os sorteios são feitos com reposição? 8 - Se cada carta de um baralho de 52 cartas tem a mesma chance de ser escolhida, então qual é a probabilidade de: a) se extrair cada uma delas? b) de se extrair uma dama? 9 - Qual a probabilidade de se obter três ou menos pontos no lançamento de um dado? 10 - Uma urna contém duas bolas brancas, três pretas e cinco azuis. a) Qual a probabilidade de se extrair uma bola branca? b) Qual a probabilidade de se extrair uma bola preta ou uma azul? 11 - No lançamento de dois dados qual a probabilidade de sair o par (5,2)? 45 4.5 Probabilidade Condicional Em algumas situações, a probabilidade de ocorrência de um certo evento pode ser afetada se tivermos alguma informação sobre a ocorrência ou não de um outro evento. Considere, por exemplo, o seguinte experimento: E : Lançar um dado. Seja o evento A: sair o no 3 = Então, P (A) = Considere, agora, o seguinte evento: B: sair um número ímpar = Logo, P (B) = Suponha, agora, que soubéssemos da ocorrência de B e que quiséssemos calcular a probabilidade de A. Iremos denotar essa probabilidade como P (A | B). Assim, P (A | B) = Formalmente definimos probabilidade condicional da maneira a seguir. Definição 4.10 (Probabilidade Condicional). Dados dois eventos, A e B, deno- taremos P (A | B) a probabilidade condicionada do evento A, quando B tiver ocorrido, por: P (A | B) = P (A ∩ B) P (B) com P (B) 6= 0. Exemplo: Dois dados são lançados e os seguintes eventos são considerados: A = {(x1, x2); x1 + x2 = 10}, e B = {(x1, x2); x1 > x2}. Baseado nestas informações, obtenha as seguintes probabilidades: a) P (A) c) P (A ∩ B) e) P (B | A) b) P (B) d) P (A | B) 46 4.5.1 Teorema do Produto A partir da definição de probabilidade condicional, poderemos enunciar o teorema do produto: Teorema 1.2 (Teorema do Produto) P (A | B) = P (A∩B) P (B) ⇒ P (A ∩ B) = P (B)P (A | B). Analogamente, P (B | A) = P (A∩B) P (A) ⇒ P (A ∩ B) = P (A)P (B | A). Exemplos: 1 - Em um lote de 12 peças, 4 são defeituosas. Se duas peças são retiradas uma após a outra sem reposição, qual a probabilidade de que: a) ambas sejam boas? b) ambas sejam defeituosas? c) pelo menos uma seja defeituosa? 2 - Uma urna contém duas bolas brancas, três vermelhas e cinco azuis. Qual a pro- babilidade de se retirar sem reposição uma bola azul, uma branca e uma vermelha exatamente nessa ordem? 4.6 Eventos Independentes Um evento A é considerado independente de um outro evento B se a probabilidade condi- cional de A dado B é igual a probabilidade de A, isto é, se P (A | B) = P (A). É evidente que se A é independente de B, então B é independente de A. Assim, P (B | A) = P (B). Logo, considerando o Teorema do Produto, observamos que a probabilidade da ocor- rência de dois eventos simultaneamente, P (A ∩ B), depende da natureza dos eventos, ou seja, se eles são independentes ou não e no caso dos eventos serem independentes já sabemos que P (A ∩ B) = P (A)P (B). Observação: A recíproca é verdadeira, isto é, se P (A ∩ B) = P (A)P (B), então A e B são eventos independentes. 47 UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus I UNIDADE ACADÊMICA DE MATEMÁTICA E ESTATÍSTICA Disciplina: Probabilidade e Estatística (6 créditos) Período 2009.2 Prof. Gilberto Matos e Areli Mesquita Aluno(a): . 4 a LISTA DE EXERCÍCIOS Independência Estatística, Probabilidade Condicional, Teorema da Probabilidade Total e de Bayes 1 - Suponha que a probabilidade de que ambas crianças gêmeas sejam meninos é 0,30 e que a probabilidade de que sejam meninas é 0,26. Dado que a probabilidade de uma criança seja menino é 0.52, qual é a probabilidade de que: a) A segunda criança seja um menino, sabendo-se que o primeiro é um menino? Resp.: 0,577. b) A segunda criança seja uma menina, sabendo-se que a primeira é uma menina? Resp.: 0,542. 2 - Uma urna contém duas bolas brancas, três verdes e cinco azuis. Se três bolas são retiradas ao acaso, sem reposição, determine a probabilidade de: a) três bolas verdes ocorrerem. Resp.: 0,0083. b) exatamente uma bola verde ocorrer.Resp.: 0,175. 3 - A probabilidade de que um time de futebol vença seu próximo oponente é estimada em 0,7 se não chover, mas só em 0,5 se chover. Se os registros meteorológicos mostrarem que choveu 40 por cento das vezes, na data do jogo, nos anos passados, qual a probabilidade de que o time vença seu próximo oponente? Resp.: 0,62. 4 - Suponhamos que seja de 0,005 a probabilidade de que o motor de um monomotor de combate falhe na decolagem e que a taxa de falha técnica do motor de um bimotor de combate seja de 0,003. Se o bimotor não puder decolar a não ser que ambos os motores estejam operando adequadamente, que avião é mais seguro na decolagem? Resp.: P (bimotor falhar na decolagem) = 0, 006. 5 - Empregados de certa firma são submetidos a um teste de aptidão quando empregados pela primeira vez. A experiência mostrou que dos 60 por cento que passaram no teste, 80 por cento deles eram bons trabalhadores, enquanto dos 40 por cento dos que não conseguiram passar só 30 por cento foram avaliados como bons trabalhadores. Qual a probabilidade de que um empregado escolhido ao acaso seja um bom trabalhador? Use aqui a técnica da árvore. Resp.: 0,60. 6 - Suponhamos que seja p a probabilidade de que o tempo (com sol ou nublado) seja o mesmo do dia anterior. Se hoje for dia de sol, qual a probabilidade de que depois de amanhã tenhamos também um dia de sol? Resp.: 2p2 − 2p + 1 50 Teorema de Bayes 7 - Um saco contém três moedas, uma das quais foi cunhada com duas caras, enquanto as outras duas são normais e não viciadas. Uma moeda é retirada ao acaso e jogada. Dado que o resultado foi cara, qual a probabilidade de que essa seja a moeda de duas caras? Resp.: 0,5. 8 - As probabilidades de que três homens atinjam um alvo são, respectivamente, 1 6 , 1 4 e 1 3 . Cada um atira uma vez em direção ao alvo. a) Determine a probabilidade p de que exatamente um deles atinja o alvo. Resp.: 0,431. b) Se apenas um atinge o alvo, qual a probabilidade de ele ser o primeiro homem? Resp.: 0,194. 51 UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus I UNIDADE ACADÊMICA DE MATEMÁTICA E ESTATÍSTICA Disciplina: Probabilidade e Estatística (6 créditos) Período 2009.2 Prof. Gilberto Matos e Areli Mesquita Aluno(a): . 6 a NOTA DE AULA 5 Variáveis Aleatórias: Discretas e Contínuas 5.1 Introdução Ao descrever um espaço amostral S associado a um experimento E, podemos obser- var que os resultados possíveis não são, necessariamente, núméricos. Consideremos, por exemplo, o seguinte experimento: E1: Lançar duas moedas e observar a face superior de cada uma. Neste experimento, temos S = {CC, CK, KC, KK} e, na prática, o que realmente podemos estar interessados em observar é, por exemplo, o número de vezes que ocorre cara (K), ou seja, temos interesse num número real que está associado a cada resultado do espaço amostral S. Definição 5.1 (Variável Aleatória). Seja E um experimento aleatório e S um espaço amostral associado ao experimento. Dizemos que a função X é uma variável aleatória quando associa a cada elemento do espaço amostral, s ∈ S, um número real, x = X(s). Notação: X, Y , Z, etc. Esquematicamente, temos: (Esboçar a função (ou variável aleatória) que associa a cada elemento do espaço amostral, s ∈ S, um número real, x = X(s) ) 52 a ) Mostre que X tem realmente uma distribuição de probabilidades. b ) Faça um gráfico representando o comportamento desta distribuição. c ) Obtenha: i . P (X ser par) ii . P (X ≥ 3) iii . P (X ser múltiplo de 3) 5.3 Variáveis Aleatórias Contínuas Definição 5.7 (Variável Aleatória Contínua). A variável aleatória X é contínua se existir uma função f , denominada função densidade de probabilidade (f.d.p.) de X que satisfaça às seguintes condições: a) f(x) ≥ 0 para todo x; b) ∫ +∞ −∞ f(x)dx = 1. Observações: Se X é uma variável aleatória contínua, então: (i) P (X = k) = 0, onde k é qualquer valor real. (ii) Para quaisquer a, b, com −∞ < a < b < +∞, teremos P (a ≤ X ≤ b) = P (a < X ≤ b) = P (a ≤ X < b) = P (a < X < b) = ∫ b a f(x)dx. Probabilidade essa, que pode ser representada pela área sob o gráfico da função f no intervalo [a, b], tal como ilustrado abaixo: 55 (Esboçar o gráfico representando a área definida por P (a < X < b) = ∫ b a f(x)dx) Exemplos: 1 - Suponha que estamos atirando dardos em um alvo circular de raio de 10 cm, e seja X a distância do ponto atingido pelo dardo ao centro do alvo. A f.d.p. de X é f(x) = { kx, 0 ≤ x ≤ 10 0, c.c a) Qual a probabilidade de acertar a mosca, se ela é um círculo de raio 1 cm? b) Mostre que a probabilidade de acertar qualquer círculo concêntrico é proporci- onal a sua área. 2 - Uma variável aleatória contínua X é dita ter distribuição uniforme se a sua f.d.p. é da forma f(x) = { k, se a < x < b 0, caso contrário a) Encontre o valor de k para que a função f seja realmente uma f.d.p. b) Esboce o gráfico da distribuição de X. 5.4 Função de Distribuição Acumulada Definição 5.8 (Função de Distribuição Acumulada - f.d.a.). A função de distri- buição acumulada F , ou simplesmente função de distribuição (f.d.) de uma variável aleatória X qualquer é definida como F (x) = P (X ≤ x), ∀ x ∈ ℜ. Observação: a) Se a variável aleatória X for discreta, então a função de distribuição será dada por F (x) = P (X ≤ x) = ∑ i ; xi≤x p(xi), b) Se a variável aleatória X for contínua, então a função de distribuição será dada por F (x) = P (X ≤ x) = ∫ x −∞ f(t)dt. 56 Exemplos: 1 - Suponhamos que a variável aleatória X tome os três valores 0,1 e 2, com proba- bilidades 1/3, 1/6 e 1/2, respectivamente. Encontre a função de distribuição F e represente-a graficamente. 2 - Encontre a função de distribuição de X cuja f.d.p. é dada por f(x) = { 2x, 0 < x < 1, 0, c.c. Esboçe os gráficos da f.d.p., f(x), e da função de distribuição F . 3 - Se a variável aleatória X tem distribuição uniforme obtenha a função de distribuição de X e represente-a graficamente. 57 UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus I UNIDADE ACADÊMICA DE MATEMÁTICA E ESTATÍSTICA Disciplina: Probabilidade e Estatística (6 créditos) Período 2009.2 Prof. Gilberto Matos e Areli Mesquita Aluno(a): . 7 a NOTA DE AULA 6 Caracterização Adicional das Variáveis Aleatórias 6.1 Introdução De maneira análoga ao que acontece na estatística descritiva (resumo de dados), no estudo de variáveis aleatórias precisamos de algumas características numéricas que possam nos fornecer uma idéia sobre o comportamento da distribuição de probabilidade. A estas características denominamos de parâmetros da distribuição. Dois dos principais parâmetros são: o valor esperado e a variância. O valor esperado de uma distribuição de probabilidades nos dá uma idéia de um valor médio ou central da distribuição. Por outro lado, a medida que nos dá o grau de dispersão (ou de concentração) dos valores assumidos pela variável em torno da média é a variância. 6.2 O Valor Esperado ou Esperança de Uma Variável Aleatória Definição 6.1 (Valor Esperado de uma Variável Aleatória). Caso 1: Variável Aleatória Discreta Seja X uma variável aleatória discreta, com valores possíveis x1, x2, ..., xn, ... Seja p(xi) = P (X = xi), i = 1, 2, ..., n, ... Então, o valor esperado de X (ou esperança matemática de X), denotado por E(X) é definido como E(X) = Σ∞i=1xip(xi), se a série definida acima convergir absolutamente, isto é, se Σ∞i=1 |xi| p(xi) < ∞. Este número é também denominado o valor médio de X, ou expectância de X. 60 Caso 2: Variável Aleatória Contínua Seja X uma variável aleatória contínua com f.d.p. f . Então, o valor médio de X ou o valor esperado de X é definido como E(X) = ∫ +∞ −∞ xf(x)dx. Pode acontecer que esta integral (imprópria) não convirja. Conseqüentemente, diremos que E(X) existirá se, e somente se, ∫ +∞ −∞ |x| f(x)dx for finita. Exemplos: 1 - Um fabricante produz peças tais que 10% delas são defeituosas e 90% delas são não-defeituosas. Se uma peça defeituosa for produzida, o fabricante perde R$ 1, enquanto uma peça não-defeituosa lhe dá um lucro de R$ 5. Se X for o lucro líquido por peça, qual o valor esperado de X? 2 - Uma variável aleatória contínua X definida num intervalo [a, b] é dita ter distribuição uniforme se possui a seguinte f.d.p. f(x) = { 1 b−a , a ≤ x ≤ b, 0, c.c. Encontre a esperança dessa variável aleatória. 3 - Seja a variável aleatória X definida como segue. Suponha que X seja o tempo (em minutos) durante o qual um equipamento elétrico seja utilizado em carga máxima, em um certo período de tempo especificado. Suponha ainda, que X seja uma variável aleatória contínua com a seguinte f.d.p.: f(x) =    x 15002 , 0 ≤ x ≤ 1500, −(x−3000) 15002 , 1500 < x ≤ 3000, 0, c.c. Encontre o tempo médio (em minutos) que o equipamento elétrico é utilizado em carga máxima. 61 6.3 Esperança de uma Função de uma Variável Aleatória É intuitivamente evidente a idéia de que qualquer função de uma variável aleatória X, Y = H(X), também é uma variável aleatória, pois qualquer resultado aleatório, X = x, resultará num resultado também aleatório Y = h(x) = y. Desta forma, terá sentido calcular E(Y ). Para se obter o valor esperado de Y = H(X) existem duas maneiras que se mostram equivalentes. A primeira requer que se obtenha primeiramente a distribuição de Y ; problema este que será abordado posteriormente. Uma segunda maneira requer, simplesmente, o conhecimento da distribuição de probabilidade de X. Definição 6.2 (Esperança de uma Função de uma de uma Variável Aleatória). Seja X uma variável aleatória e seja Y = H(X). Então, (a) Se Y for uma variável aleatória discreta com valores possíveis y1, y2, ... e se q(yi) = P (Y = yi), o valor esperado de Y é definido por E(Y ) = Σ∞i=1yiq(yi). (b) Se Y for uma variável aleatória contínua com f.d.p. g, o valor esperado de Y é definido por E(Y ) = ∫ +∞ −∞ yg(y)dy. Teorema 6.1. Seja X uma variável aleatória e seja Y = H(X). Então, (a) Se X for uma variável aleatória discreta e p(xi) = P (X = xi), tem-se que o valor esperado de Y será dado por E(Y ) = E[H(X)] = Σ∞j=1H(xj)p(xj). (b) Se X for uma variável aleatória contínua com f.d.p. f , tem-se que o valor esperado de Y será dado por E(Y ) = E[H(X)] = ∫ +∞ −∞ H(x)f(x)dx. 62 4 - Se X é uma variável aleatória contínua com f.d.p. f(x) = { 1 + x, −1 ≤ x ≤ 0, 1 − x. 0 ≤ x ≤ 1. Obtenha a variância de X. 6.6 Propriedades da variância Se X é uma v.a. e k é um valor qualquer, constante, então: 1. V ar(k) = 0. 2. V ar(X + k) = V ar(X). 3. V ar(kX) = k2V ar(X). Demonstrações: 65 UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus I UNIDADE ACADÊMICA DE MATEMÁTICA E ESTATÍSTICA Disciplina: Probabilidade e Estatística (6 créditos) Período 2009.2 Prof. Gilberto Matos e Areli Mesquita Aluno(a): . 6 a LISTA DE EXERCÍCIOS Valor Esperado e Variância de Variáveis Aleatórias 1 - Uma urna contém 4 bolas brancas e 6 pretas. 3 bolas são retiradas com reposição. Seja X o número de bolas brancas. Calcular E(X) e D.P.(X). Resp.: E(X) = 1, 2. 2 - A função de probabilidade da variável aleatória X é: P (X = x) = 1 5 , para X = 1, 2, 3, 4, 5. Calcular E(X) e E(X2), e usando esses resultados calcular: a) E(X + 3)2; b) V ar(3X − 2). Resp.: E(X) = 3, V ar(X) = 2, a) 38 b) 18. 3 - Um investidor julga que tem 0, 40 de probabilidade de ganhar R$25.000,00 e 0, 60 de probabilidade de perder R$15.000,00 num investimento. a) Qual é o ganho esperado deste investidor? b) Se G é o ganho líquido do investidor, qual será o ganho esperado de Y = 10G − 1000? 4 - Uma seguradora paga R$30.000,00 em caso de acidente de carro e cobra uma taxa de R$1.000,00. Sabe-se que a probabilidade de que um carro sofra acidente é de 3%. Quanto espera a seguradora ganhar por carro segurado? Resp.: E(L) = 100, 00 5 - Num jogo de dados, o jogador J1 paga R$ 20,00 ao jogador J2 e lança 3 dados. E a seguinte regra é adotada: (A) Se sair face 1 em um dos dados apenas, J1 ganha R$ 20,00 (B) Se sair face 1 em dois dados apenas, J1 ganha R$ 50,00 (C) Se sair 1 nos três dados, J1 ganha R$ 80,00 (A) Se nenhuma face 1 sair, J1 não recebe valor algum. Nestas condições, qual o lucro líquido esperado pelo jogador J1 em uma jogada? Você considera este jogo honesto? Por que? Resp.: R$ − 9, 21 66 6 - Um banco pretende aumentar a eficiência de seus caixas. Para isto, o banco está oferecendo um prêmio de R$ 150,00 para cada cliente atendido, além de 42 clientes por dia. O banco tem um ganho operacional de R$ 100,00 para cada cliente atendido além de 41. As probabilidades de atendimento são: node clientes Até 41 42 43 44 45 46 Probabilidade 0,88 0,06 0,04 0,01 0,006 0,004 Qual o ganho esperado do banco, se este novo sistema for implantado? O sistema é vantajoso para o banco? Resp.: E(X) = 7, 30. 7 - Suponhamos que dez cartas estejam numeradas de 1 até 10. Das dez cartas, retira-se uma de cada vez, ao acaso e sem reposição, até retirar-se o primeiro número par. Se X é uma variável aleatória que expressa o número de retiradas necessárias. a) Qual é a função de probabilidade de X? b) Em quantas retiradas espera-se obter o primeiro número par? 8 - Um vendedor de equipamentos pesado pode visitar, num dia, um ou dois clientes, com probabilidade de 1/3 ou 2/3, respectivamente. De cada contato, pode resultar a venda de um equipamento por R$ 50.000,00(com probalidade 1/10) ou nenhuma venda (com probabilidade 9/10). Indicando por Y o valor total de vendas diárias desse vendedor: a) Escreva a função de probabilidade de Y ; b) Qual é o valor total esperado de vendas diárias? Resp.: a) Y = {0, 50.000, 100.000} com probabilidades 126/150, 23/150, 1/150. b) E(Y ) = 8.333, 33 9 - Calcule a variância do problema anterior. 10 - O tempo T , em minutos, necessário para um operário processar certa peça é uma v.a. com a seguinte distribuição de probabilidade. T = t 2 3 4 5 6 7 P (T = t) 0,1 0,1 0,3 0,2 0,2 0,1 a) Calcule o tempo médio de processamento. Para cada peça processada, o operário ganha um fixo de R$ 2,00, mas, se ele processa a peça em menos de seis minutos, ganha R$ 0,50 em cada minuto poupado. Por exemplo, se ele processa a peça em quatro minutos, recebe a quantia adicional de R$ 1,00. b) Encontre a distribuição, a média e a variância da v.a. G: quantia ganha por peça. 67 UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus I UNIDADE ACADÊMICA DE MATEMÁTICA E ESTATÍSTICA Disciplina: Probabilidade e Estatística (6 créditos) Período 2009.2 Prof. Gilberto Matos e Areli Mesquita Aluno(a): . Relação de Exercícios para o 2◦ Estágio Livro: "Estatística Básica". Wilton O. Bussab e Pedro A. Morettin. 5a. Edicão. Capítulo 5 (Probabilidades): Problema Página 1 e 2 105 5 e 6 106 8, 10 e 12 110 15, 16, 18, 19 e 21 115 25 121 26, 27, 28 e 30 122 34 e 36 123 40 e 41 124 Capítulo 6 (Variáveis Aleatórias Discretas): Problema Página 1, 2 e 3 135 13 e 14 139 19 140 29 e 30 157 Capítulo 7 (Variáveis Aleatórias Contínuas): Problema Página 2 166 5 171 10 172 28 194 70 UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus I UNIDADE ACADÊMICA DE MATEMÁTICA E ESTATÍSTICA Disciplina: Probabilidade e Estatística (6 créditos) Período 2009.2 Prof. Gilberto Matos e Areli Mesquita Aluno(a): . 8 a NOTA DE AULA 7 Modelos Probabilísticos para Variáveis Aleatórias Discretas Introdução Em muitas situações, alguns experimentos aleatórios apresentam características bas- tante peculiares. Este fato possibilita que, uma vez identificadas estas características, um particular modelo probabilístico seja proposto para modelar o fenômeno em estudo. É neste contexto, que passaremos ao estudo de alguns dos principais modelos proba- bilísticos. 7.1 Distribuição de Bernoulli Em muitos experimentos os resultados são tais que ocorre ou não ocorre determinada característica. Por exemplo: 1. Ao lançar uma moeda: o resultado ou é cara, ou não (ocorrendo, então, coroa); 2. Ao lançar um dado: ocorre número par ou não (ocorrendo número ímpar); 3. Uma pessoa é escolhida ao acaso dentre 1000: ou ela é do sexo masculino ou não (é do sexo feminino); 4. Uma pessoa é escolhida ao acaso dentre 1000: ou ela é favorável a um determinado projeto governamental ou não. Em todas estes casos, estamos interessados na ocorrência (sucesso) ou não (fracasso) de determinada característica. Então, para cada experimento acima podemos definir uma v.a. X, que assume valores: 1, se ocorrer sucesso, e 0, se ocorrer fracasso. E, indicaremos por p a probabilidade de sucesso, isto é, P (sucesso) = P (S) = p, 0 < p < 1. 71 Definição 7.1 (Distribuição de Bernoulli). Uma variável aleatória X, que assume apenas os valores 0 e 1; é dita ter distribuição de Bernoulli com parâmetro p, 0 < p < 1, se sua função de probabilidade é dada por P (X = x) = { p, se x = 1 1 − p, se x = 0 Notação: X ∼ Ber(p). Observação: Experimentos que resultam numa v.a. de Bernoulli são chamados en- saios de Bernoulli. Propriedades: E(X) = p V ar(X) = p(1 − p) Exemplo: 1 - Ao lançar um dado perfeito, considere a variável X: ocorre número menor que 3. Qual a distribuição de X. Obtenha os valores de E(X) e V ar(X). 7.2 Distribuição Binomial Definição 7.2 (Experimento Binomial). Um experimento binomial consiste de n ten- tativas independentes de um mesmo experimento aleatório, onde cada tentativa adimite apenas dois resultados: sucesso com probabilidade p e fracasso com probabilidade 1−p. Pode-se dizer ainda, que um experimento binomial consiste de n ensaios independentes de Bernoulli, cuja probabilidade de sucesso em cada ensaio é constante e igual a p, 0 < p < 1. Definição 7.3 (Variável Aleatória Binomial). Uma variável aleatória definida como X: número de sucessos num experimento binomial é dita ser uma Variável aleatória Binomial com parâmetros n e p. Teorema 7.1. Se X é uma variável aleatória binomial com parâmetros n e p. Então P (X = k) = ( n k ) pk(1 − p)n−k, k = 0, 1, ..., n. Notação: X ∼ B(n, p). Propriedades: E(X) = np V ar(X) = np(1 − p) 72 1 - Num livro de 800 páginas há 800 erros de impressão. Qual a probabilidade de que uma página contenha pelo menos 3 erros? 2 - Seja X ∼ B(200, 0, 01). Calcular P (X = 10) usando a distribuição binomial e compare com o valor aproximado pela Poisson. 75 UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus I UNIDADE ACADÊMICA DE MATEMÁTICA E ESTATÍSTICA Disciplina: Probabilidade e Estatística (6 créditos) Período 2009.2 Prof. Gilberto Matos e Areli Mesquita Aluno(a): . 7 a LISTA DE EXERCÍCIOS Modelos Probabilísticos Discretos 1 - Se X tem distribuição binomial com parâmetros n e p, utilize o fato de X ser a soma de n ensaios de Bernoulli para calcular a média e a variância de X. 2 - Sabendo-se que doze por cento dos que reservam lugar num vôo sistematicamente faltam ao embarque e que o avião comporta 15 passageiros: a) Determine a probabilidade de que todos os 15 que reservaram lugar compareçam ao embarque. b) Se houve 16 pedidos de reserva, determine a probabilidade: i) de uma pessoa ficar de fora; ii) de nenhuma ficar de fora; iii) de mais de uma ficar de fora. 3 - Se 3% dos habitantes de uma grande cidade são empregados do Governo, determine a probabilidade de: a) Nenhum ser empregado do Governo numa amostra aleatória de 50 habitantes? b) Encontrar no máximo 3 empregados do governo na amostra do item anterior? 4 - Um fabricante de peças de automóvel garante que uma caixa de suas peças conterá, no máximo, duas defeituosas. Se a caixa contém 20 peças, e a experiência tem demonstrado que, em seu processo de fabricação, 6% das peças são defeituosas, qual é a probabilidade de que uma caixa satisfaça a garantia? 76 UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus I UNIDADE ACADÊMICA DE MATEMÁTICA E ESTATÍSTICA Disciplina: Probabilidade e Estatística (6 créditos) Período 2009.2 Prof. Gilberto Matos e Areli Mesquita Aluno(a): . 8 a LISTA DE EXERCÍCIOS Distribuição Binomial 1 - Para os exercícios (a) a (e) abaixo, considere o enunciado: Das variáveis abaixo descritas, assinale quais são binomiais, e para essas dê os respec- tivos campos de definição e função de probabilidade. Quando julgar que a variável não é binomial, aponte as razões de sua conclusão. a) De uma urna com dez bolas brancas e 20 pretas, vamos extrair, com reposição, cinco bolas. X é o número de bolas brancas nas cinco extrações. b) Refaça o problema anterior, mas dessa vez as n extrações são sem reposição. c) Temos cinco urnas com bolas pretas e brancas e vamos extrair uma bola de cada urna. Suponha que X seja o número de bolas brancas obtidas no final. d) Vamos realizar uma pesquisa em dez cidades brasileiras, escolhendo ao acaso um habitante de cada uma delas e classificando-o em pró ou contra um certo projeto federal. Suponha que X seja o número de indivíduos contra o projeto no final da pesquisa. e) Em uma indústria existem 100 máquinas que fabricam determinada peça. Cada peça é classificada como boa ou defeituosa. escolhemos ao acaso um instatnte de tempo e verificamos uma peça de cada uma das máquinas. Suponha que X seja o número de peças defeituosas. 2 - Numa certa cidade, nascem por ano 40% de crianças do sexo masculino. Nas famílias com 4 crianças, qual a probabilidade de: a) todas serem homens; b) todas serem mulheres; c) todas serem do mesmo sexo; d) haver a mesma quantidade de homens e mulheres. 3 - De acordo com as estimativas de uma companhia de seguros, a probabilidade de incêndio numa casa é de 1% ao ano. A firma segura 400 casas. a) Se muitos dos segurados vivem em casas adjacentes, por que tal circunstância pode invalidar o uso da distribuição binomial? b) Suponha que os segurados morem em casas distantes umas das outras. Qual a probabilidade de: 77 UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus I UNIDADE ACADÊMICA DE MATEMÁTICA E ESTATÍSTICA Disciplina: Probabilidade e Estatística (6 créditos) Período 2009.2 Prof. Gilberto Matos e Areli Mesquita Aluno(a): . 9 a NOTA DE AULA 8 Modelos Probabilísticos para Variáveis Aleatórias Contínuas 8.1 Distribuição Uniforme Definição 8.1 (Distribuição Uniforme). Uma variável aleatória contínua X é dita ter distribuição uniforme se a sua f.d.p. é da forma f(x) = { 1 b−a , se a < x < b 0, caso contrário Notação: X ∼ U(a, b). Propriedades: E(X) = a+b 2 e V ar(X) = (b−a) 2 12 (Construa um gráfico que ilustre a forma da f.d.p. de uma uniforme qualquer) Exemplo: Suponha que uma pane pode ocorrer em qualquer ponto de uma rede elétrica de 10 Km. Obtenha a probabilidade de que uma pane ocorra em um ponto cuja distância seja no máximo 1 Km das extremidades. 80 8.2 Distribuição Exponencial Definição 8.2 (Distribuição Exponencial). Uma variável aleatória contínua X, as- sumindo todos os valores não negativos, terá distribuição exponencial com parâmetro α > 0, se sua f.d.p. é dada por f (x) = { αe−αx, x > 0 0, c.c. Notação: X ∼ Exp(α). Propriedades: (i) E(X) = 1 α e V ar(X) = 1 α2 (ii) A função de distribuição acumulada F de uma exponencial com parâmetro α é dada por F (x) = 1 − e−αx, x > 0. (iii) (Falta de memória) Para todo s, t > 0, teremos P (X > s + t | X > s) = P (X > t) . (Construa um gráfico que ilustre a forma da f.d.p. de uma exponencial qualquer) Exemplo: O tempo de vida (em horas) de um transistor pode ser considerado uma variável aleatória com distribuição exponencial cuja média é igual a 500 horas. De acordo com essas características, qual é a probabilidade de que um determinado transistor dure mais do que a média? 81 8.3 Distribuição Normal (Gaussiana) A distribuição Normal é talvez a mais importante das distribuições de probabilidade, por razões que possivelmente ficarão claras ao longo deste curso. Erros de mensuração de fenômenos físicos ou econômicos são freqüentemente modelados pela distribuição Normal, mas esta não é a única aplicação desta densidade. Por exemplo, a distribuição dos pesos, alturas e QI’s das pessoas numa população também já foram modelados com sucesso por esta distribuição. A distribuição Normal tem a forma de um sino, e possui dois parâmetros, µ e σ2. A distribuição Normal é também chamada de Gaussiana em homenagem ao matemático Carl Friederich Gauss (1777 - 1855), que a utilizou pela primeira vez na modelagem de erros de medida. A distribuição Normal também funciona como uma boa aproximação para outras densidades. Por exemplo, sob algumas condições pode-se provar que a densidade Binomial pode ser aproximada pela Normal. Definição 8.3 (Densidade Normal com média µ e variância σ2). Seja X uma variável aleatória contínua definida nos números reais. Dizemos que X tem densidade Normal com média µ e variância σ2 se a densidade de X é: f(x) = 1√ 2πσ e− 1 2 (x−µ σ )2 . Notação: X ∼ N(µ, σ2) Devemos dizer que o primeiro parâmetro, µ (lê-se: mi), é a média ou o valor esperado de X, enquanto que o segundo parâmetro, σ2 (lê-se: sigma dois), é a variância de X. A seguir exibimos gráfico das distribuições Normais com média zero e variâncias 1, 2 e 4. (Esboçar o gráfico de Distribuições Normais com média zero e variâncias 1, 2 e 4) Note que o máximo das densidades é encontrado quando x = 0, isto é, quando x é igual à média da distribuição. Isto vale para qualquer distribuição Normal: o máximo de f(x) é obtido fazendo-se x = µ, onde µ é a média da Normal. Também, quanto maior o valor da variância σ2, mais “espalhada” é a distribuição. 82 UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus I UNIDADE ACADÊMICA DE MATEMÁTICA E ESTATÍSTICA Disciplina: Probabilidade e Estatística (6 créditos) Período 2009.2 Prof. Gilberto Matos e Areli Mesquita Aluno(a): . 9 a LISTA DE EXERCÍCIOS Distribuição Normal 1 ) Se a variável Z tem distribuição normal padrão, isto é, Z ∼ N(0; 1), obtenha: a) P (0 ≤ Z ≤ 1, 96); b) P (Z < 1, 64); c) P (Z < −2, 57); d) o valor z, na tabela da normal padrão, tal que, P (Z < z) = 0, 025. Resp.: a) 2 ) Seja X uma v.a, tal que, X ∼ N(100; 25), determinar: a) P (X ≥ 108); b) P (X = 100); c) P (89 ≤ X ≤ 107); d) P (12 < X − µ < 16); e) P (112 < X < 116); f) P (X < 100 ou X > 106); Resp.: a) 3 ) Uma v.a X tem Distribuição Normal, com média 50 e desvio padrão 10, i.é, X ∼ N(50; 102), determine o valor de A, B e C, nos seguintes casos: a) P(X > A) = 0, 0228; b) P(X < B) = 0, 0668; c) P(|X − µ| < C) = 0, 6826; Resp.: a) 85 4 ) Uma fábrica de carros sabe que a duração (X) dos motores de sua fabricação tem distribuição aproximadamente normal, com média de 150.000 km e desvio padrão de 5.000 km, ou seja, X ∼ N(150.000; 5.0002). Qual a probabilidade de que um carro, escolhido ao acaso, dos fabricados por essa firma, tenha um motor que dure: a) menos de 170.000 km? b) entre 140.000 km e 165.000 km? c) se a fábrica substitui o motor que apresenta duração inferior à garantia (g), qual deve ser esta garantia, para que a porcentagem de motores substituídos seja inferior a 0, 2%? Resp.: a) 5 ) Foi feito um estudo sobre a altura (X) dos alunos de uma faculdade, observando-se que ela se distribuia com média 160 cm e variância 64 cm2. Determinar: a) P (X ≤ 176) ; b) P(|X − 160| ≤ 8) ; c) a porcentagem dos alunos com altura acima de 180 cm. Resp.: a) 6 ) Um fabricante de máquinas de lavar sabe, por longa experiência, que a duração de suas máquinas tem distribuição normal com média 1000 dias e desvio padrão de 200 dias. Se este fabricante oferece uma garantia de 1 ano (365 dias) e produz mensalmente 2000 máquinas, quantas máquinas ele espera trocar pelo uso da garantia dada, mensalmente? 7 ) Avaliou-se que o tempo médio desperdiçado em cirurgias de longa duração (mais de 4 horas) é uma variável aleatória Normal com média de 90 min. e desvio padrão de 50 min. a) Qual é a probabilidade de uma determinada cirurgia ter um desperdício de tempo de mais de 60 min. ? b) Qual é a probabilidade de haver um desperdício de tempo de no máximo 50 min.? c) 15% das cirurgias tem um tempo de desperdício muito alto. Acima de que valor esse tempo é considerado muito alto? d) Em 100 cirurgias de longa duração realizadas em um certo mês, quantas espe- ramos encontrar com um desperdício superior a 2 horas? e) Em um determinado dia, foram realizadas 4 cirurgias de longa duração. Qual é a probabilidade de nenhuma ter tido um desperdício superior a 50 min.? f) Cada hora ou fração da hora desperdiçada em uma cirurgia custa ao hospital R$ 56,00. Sabendo que acima de 2 horas de desperdício o prejuízo é fixo no valor de R$ 200,00, obtenha o prejuízo esperado. 86 8 ) Numa fábrica foram instaladas 1.000 lâmpadas novas. Sabe-se que a duração média das lâmpadas é de 800 horas e desvio padrão de 100 horas, com distribuição normal. Qual a quantidade de lâmpadas que durarão: a) menos de 500 horas; b) mais de 700 horas; c) entre 516 e 814. Resp.: a) 9 ) O preço de um produto se distribui normalmente com preço médio µ e desvio padrão σ. Sabe-se que 81,98% dos preços estão situados entre (µ−10) e (µ+10), sendo que, 42,07% dos preços são superiores a 600g. Baseado nessas informações, determine µ e σ. Resp.: a) 10 ) A vida útil (em anos) de um computador pessoal tem distribuição aproximadamente normal com média de 2,9 anos e desvio padrão de 1,96 anos. a) Que proporção dos computadores falhará no primeiro ano? b) Que proporção dos computadores durará quatro anos ou mais? c) Que proporção dos computadores durará no mínimo dois anos? d) Que proporção dos computadores durará mais de 2,5 anos, porém menos de quatro anos? e) Se o fabricante adota uma política de garantia segundo a qual apenas 5% dos computadores têm de ser substituídos, qual é o período dessa garantia? Resp.: a) 11 ) Mostre que, em qualquer distribuição normal, a área sob a curva, determinada pelos intervalos abaixo, é sempre a mesma e independe dos parâmetros da distribuição: a) (µ − σ; µ + σ); b) (µ − 2σ; µ + 2σ); c) (µ − 3σ; µ + 3σ); Esboce um gráfico para cada uma dessas situações. Resp.: a) 87 X | Y Total Total Dessa forma, fica facilitada a tarefa de obter a tabela de freqüência individual para cada variável que, pela posição em que seus valores aparecem na tabela de dupla entrada, é chamada de tabela marginal de freqüência da variável X (ou Y ), ou simplesmente marginal de X (ou Y ). Temos então para as variáveis X e Y , do exemplo anterior, as seguintes tabelas de freqüência: X freqüência Total Y freqüência Total Observe que podemos construir as mesmas tabelas considerando as freqüências relati- vas. 9.1.1 Função de Probabilidade Conjunta Iremos considerar agora o caso de variáveis aleatórias discretas, definidas a partir das suas funções de probabilidades. Iniciamos estendendo a definição de função de probabilidade para o caso de duas variáveis. Definição 9.1 (Função de probabilidade conjunta(bidimensional)). Seja X uma variável aleatória que assume os valores x1, x2, ..., xm e Y variável aleatória que assume os valores y1, y2, ..., yn. A função de probabilidade conjunta é definida, para todos os possíveis pares de valores (xi, yj), i = 1, 2, ..., m e j = 1, 2, ..., n, da seguinte forma: p(xi, yj) = P [(X = xi) ∩ (Y = yj)] = P (X = xi, Y = yj), isto é, p(xi, yj) representa a probabilidade de (X, Y ) ser igual a (xi, yj). Definição 9.2 (Distribuição conjunta(bidimensional) de probabilidades). Ao conjunto de pares {(xi, yj), p(xi, yj), i = 1, 2, ..., m j = 1, 2, ..., n}, damos o nome de distribuição conjunta de probabilidades da variável aleatória bidimen- sional (X, Y ), onde: m∑ i=1 n∑ j=1 p(xi, yj) = 1 90 A distribuição conjunta de probabilidades da variável (X, Y ) pode ser representada, também, através de uma tabela de dupla entrada. Exemplo 3. Uma região foi subdividida em 10 sub-regiões. Em cada uma delas, foram observadas duas variáveis: número de poços artesianos (X) e número de riachos ou rios presentes na sub-região (Y ). Os resultados são apresentados na tabela a seguir: Sub-região 1 2 3 4 5 6 7 8 9 10 X 0 0 0 0 1 2 1 2 2 0 Y 1 2 1 0 1 0 0 1 2 2 Considerando que escolhemos uma das sub-regiões ao acaso, isto é, cada sub-região tem mesma probabilidade 1/10 de ser escolhida, podemos construir a distribuição de probabilidades conjunta de (X, Y ), tal como: (X, Y ) P (X, Y ) Total Cuja tabela de dupla entrada é dada por: X | Y Total Total 9.1.2 Distribuições Marginais de Probabilidades Quando trabalhamos com uma variável aleatória bidimensional podemos ter o interesse em estudar o comportamento de uma única variável; ou seja; em conhecer a distribuição de probabilidade de X ou de Y . Para isto precisamos considerar a distribuição de probabilidades conjunta de (X, Y ) representada em uma tabela de dupla entrada, tal como: 91 Tabela 1: tabela de dupla entrada para apresentar a distribuição conjunta de (X,Y). Y y1 ... yn X Total x1 p(x1, y1) ... p(x1, yn) p(x1) x2 p(x2, y1) ... p(x2, yn) p(x2) ... ... ... ... ... ... ... ... ... ... xm p(xm, y1) ... p(xm, yn) p(xm) Total p(y1) ... p(yn) 1,0 Desta maneira, a distribuição de X ou comumente denominada de distribuição marginal de X, pode ser obtida a partir de p(xi) = P [(X = xi, Y = y1)ou(X = xi, Y = y2)ou...ou(X = xi, Y = yn)] = Σ n j=1p(xi, yj). De modo análogo, a distribuição marginal de Y é obtida a partir de p(yj) = P [(X = x1, Y = yj)ou(X = x2, Y = yj)ou...ou(X = xm, Y = yj)] = Σ m i=1p(xi, yj). Exemplo 4. Considerando o exemplo das sub-regiões, podemos calcular, através da distribuição conjunta, as seguintes distribuições marginais: X = xi 0 1 2 P (X = xi) Y = yj 0 1 2 P (Y = yj) 9.1.3 Função de Variáveis Aleatórias Em algumas situações poderá surgir o interesse em estudar o comportamento de uma função das variáveis aleatórias, tal como: soma, produto ou alguma outra relação entre elas. Para melhor compreender os procedimentos para se realizar tal estudo, consideremos o seguinte exemplo: Em uma cidade do Estado de São Paulo, admite-se que o número de anos para com- pletar o ensino fundamental (variável F ) e o número de anos para completar o ensino médio (variável M) têm distribuição conjunta dada por: (F, M) p(f, m) (8,3) 3/10 (8,4) 1/10 (8,5) 1/10 (9,3) 2/10 (9,4) 1/20 (9,5) 1/10 (10,4) 1/10 (10,5) 1/20 Total 1 92 Propriedade 1: Para variáveis aleatórias X e Y , vale sempre que E(X + Y ) = E(X) + E(Y ). No caso do produto de duas variáveis aleatórias nem sempre é válido que o valor esperado do produto é o produto dos valores esperados. Neste caso temos o seguinte resultado: Propriedade 2: Se X e Y são duas variáveis aleatórias independentes, então E(XY ) = E(X)E(Y ). Obs: A recíproca desta propriedade não é verdadeira, ou seja, se E(XY ) = E(X)E(Y ), então não necessariamente é verdade que X e Y são independentes. Exemplo 6. Considere as variáveis X e Y tendo distribuição conjunta dada por: X | Y 2 3 4 -1 2/12 0 3/12 0 0 1/12 1/12 1 1/12 2/12 2/12 Calcule, E(X), E(Y ) e E(XY ). Depois determine se X e Y são independentes. Definição 9.5. Uma medida de dependência linear entre X e Y é dada pela covari- ância: Cov(X, Y ) = E[(X − E(X))(Y − E(Y ))]. Em palavras, a covariância é o valor esperado do produto dos desvios de cada variável em relação à sua média. Desenvolvendo a equação acima chegaremos em uma definição mais usual, que é dada pela seguinte expressão: Cov(X, Y ) = E(XY ) − E(X)E(Y ). Observe que, se X e Y são independentes, então a Cov(X, Y ) = 0; mas a recíproca nem sempre é verdadeira. A partir da covariância, definimos uma nova medida de dependência linear. 95 Definição 9.6 (Coeficiente de correlação linear). O coeficiente de correlação linear entre as variáveis aleatórias X e Y é calculado pela seguinte expressão: ρX,Y = Cov(X, Y ) σXσY . Onde, σX e σY são respectivamente os desvios-padrão das variáveis X e Y . A divisão pelo produto dos desvios-padrão, tem a função de padronizar a medida e tornar possível a comparação com outras variáveis. Pode-se mostrar que |ρX,Y | ≤ 1. A interpretação de sua expressão segue os mesmos passos da covariância, sendo que valores de ρX,Y próximos de ±1 indicam correlação forte. Propriedade 3: Sejam X e Y variáveis aleatórias quaisquer, então V ar(X + Y ) = V ar(X) + V ar(Y ) + 2Cov(X, Y ). Se X e Y são independentes, então V ar(X + Y ) = V ar(X) + V ar(Y ). Exemplo 7. Calcule a Cov(F, M) e ρF,M onde F e M são as variáveis aleatórias encontradas na Sub-sub-Seção 9.1.3. 96 UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus I UNIDADE ACADÊMICA DE MATEMÁTICA E ESTATÍSTICA Disciplina: Probabilidade e Estatística (6 créditos) Período 2009.2 Prof. Gilberto Matos e Areli Mesquita Aluno(a): . 10 a LISTA DE EXERCÍCIOS 1 - O setor de emergência de um pronto socorro infantil anotou o número de crianças atendidas (C), de médicos (M) e de auxiliares (A) de plantão em 15 dias de atividades. Os dados são apresentados na tabela abaixo: Dia 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 C 5 7 5 6 5 5 7 5 6 6 7 5 5 6 6 M 1 1 2 2 2 1 2 1 1 2 2 2 2 2 2 A 4 4 5 6 7 7 6 5 5 6 7 7 6 6 7 a) Determine as tabelas de freqüência marginais de C, M e A. b) Obtenha a tabela de freqüência conjunta entre (C, M), (C, A) e (M, A). c) Calcule a média das variáveis M e A. 2 - Para famílias de um certo bairro de São Paulo, apresentamos abaixo a tabela de freqüência conjunta das variáveis: número de automóveis (A) e de TVs (T). A\ T 0 1 2 total 0 110 235 120 465 1 51 122 178 351 2 15 84 162 261 total 176 441 460 1077 a) Calcule as marginais de A e T. b) Determine as médias destas variáveis. 3 - Uma moeda equilibrada é lançada duas vezes de forma independente. Ao final dos lançamentos, duas variáveis aleatórias são anotadas: o número total de caras (C) e o número de coroas no 2ž lançamento (K). a) Construa uma tabela com a distribuição conjunta das variáveis C e K. b) Determine o valor esperado de C. 4 - A função conjunta de probabilidade entre as variáveis X e Y é apresentada abaixo (com algumas entradas faltando): X\ Y -1 0 2 4 P (X) -2 3/64 1/32 5/16 -1 1/16 1/16 0 1 1/64 11/64 1/64 5/16 2 5/64 3/64 1/32 P (Y ) 5/16 1/4 1 97
Docsity logo



Copyright © 2024 Ladybird Srl - Via Leonardo da Vinci 16, 10126, Torino, Italy - VAT 10816460017 - All rights reserved