Probabilidade

Probabilidade

(Parte 1 de 3)

Probabilidades e Estatística

Licenciatura em Engenharia Geográfica

Licenciatura em Meteorologia, Oceanografiae Geofísica Licenciatura em Engenharia daEnergiae do Ambiente

Programa:Probabilidade.Variáveisaleatórias.Algumasdistribuiçõesimportantes. Distribuiçõesde amostragem. Estatísticadescritiva.Estimação. Intervalosde confiança. Testes de hipóteses.IntroduçãoàAnálisede Regressão.Bibliografia: Docente:Maria Isabel Barão, DEIO-FCUL mibarao@fc.ul.pt

Nos mais variados aspectos da nossa vida, encontramos fenómenos em que estápresentea incertezae quenãopodemosprevercom exactidão.

FENÓMENOS ALEATÓRIOS Como decidirnum mundode incerteza?

As Probabilidadese a Estatísticarespondema estanecessidadede conhecero queéaleatório, desenvolvendométodospara poderextrairinformaçãoe conclusões, DECIDIR, mesmosob incerteza.

A InferênciaEstatísticafundamenta-se na Teoriadas Probabilidades, supondoqueos dados constituemumaamostrade umapopulaçãomaisvasta, e procuramtirar conclusõessobrea população, a partirda amostra.

Probabilidade

Frequentemente somos confrontados com situações em que estápresente a incertezae em que, perante várias possibilidades, énecessário tomar decisões

•Num dia em que o céu estácheio de nuvens cinzentas, dizemos que é muito provável que váchover. Devemos levar o guarda-chuva ou não?

•Foram encontradas algumas peças defeituosas numa amostra extraída de um grande lote de peças produzidas por uma máquina. Háuma certa probabilidade de que a máquina esteja avariada. Seránecessário interromper a produção, o que provocaráelevados prejuízos?

•Foi desenvolvido um novo medicamento para determinada doença, que se espera tenha maior probabilidade de cura que o medicamento habitual. Seráde facto mais eficaz e dever-se-áiniciar a sua comercialização?

A Teoria das Probabilidadesengloba os métodos para estudo de fenómenos aleatórios

Aleatóriosignifica “de resultado incerto, devido àintervenção do acaso”

Os métodos baseados no conceito de Probabilidade, ou seja,os métodos probabilísticos, permitem quantificar a incerteza, indicando qual das várias possibilidades éa mais verosímil.

fenómenos aleatórios: são fenómenos influenciados pelo acaso, cujo comportamento futuro não estácompletamente determinado, mas relativamente aos quais podemosfazer certas previsões de índole global.

Uma experiência aleatória tem as seguintes características:

•Obtém-se um resultado de entre um conjunto de resultados possíveis, conhecidos antes da realização da experiência

•De entre os resultados possíveis, não se sabe qual vai ser obtido

Entende-se por experiência aleatóriaqualquer processo ou conjunto de circunstâncias capaz de produzir resultados observáveis, estando esse processo sujeito àinfluência do acaso

Experiência aleatória

Espaço de resultados Ω: conjunto de todos os resultados possíveis de uma experiência aleatória

Ex 1: lançamento de duas moedas e observação do lado que fica para cima Ω ={F, FC, CF, C}

Ex 2: lançamento de um dado e registo do número de pontos obtidos Ω= {1, 2, 3, 4, 5, 6}

Ex 3: Registo do número de telefonemas recebidos por hora num callcentre Ω= {0,1, 2,...}

Ex 5: Observação da duração de uma componente electrónica de certo tipo Ω= {x: x > 0}

Ex 4: Registo do número de mensagens que são transmitidas correctamente, por dia, numa rede de computadores

Acontecimentoéum subconjunto do espaço de resultados Ω⊆A

Diz-se que se realizou o acontecimento A quando o resultado da experiência pertence a A: A∈ω

Acontecimentos elementares são os acontecimentos constituídos por um único elemento do espaço de resultados

Ωdesigna-se por acontecimento certo; realiza-se sempre !

Acontecimento impossíveléo acontecimento que nunca se realiza; é representado pelo símbolo ∅

Conceito de Probabilidade Definição clássica ou de Laplace: a probabilidade de um acontecimento A é

Ω== ##º º)( A possíveisresultadosden AafavoráveisresultadosdenAP desde que os resultados possíveis sejam equiprováveis(ou igualmente possíveis)

Definição frequencista: a probabilidade de um acontecimento A éo valor para que tende a frequência relativa da realização de A, num grande número de repetições da experiência aleatória.

Nem sempre se pode repetir a experiência o número de vezes necessário de modo a obter a convergência pretendida.

Definição axiomática:uma definição mais rigorosa de Probabilidade éfeita introduzindo um conjunto de axiomas (axiomática de Kolmogorov)

Axiomática de Kolmogorov

1.Qualquer que seja o acontecimento A, P(A) ≥0 2.P(Ω) = 1 3.Se os acontecimentos A e B forem disjuntos ou mutuamente exclusivos, ou seja, A ∩B = ∅, então P(A ∪B) = P(A) + P(B)

3*. Mais geralmente, se A, A,…forem acontecimentos disjuntos dois a dois, ou seja, j APAP ∪

=jiAA∩∅para i≠j, então

A definição clássica e a definição frequencistade Probabilidade verificam os axiomas anteriores.

Propriedades da Probabilidade

A propriedade 6. generaliza-se imediatamente para três ou mais acontecimentos. Para três acontecimentos A, B e C vem

O acontecimento impossível tem probabilidade igual a zero. No entanto, podem existir acontecimentos com probabilidade nula e que não sejam impossíveis.

Probabilidade condicional

Por vezes estamos interessados em calcular a probabilidade de umacontecimento A quando jádispomos de alguma informação quanto ao resultado da experiência aleatória: sabemos que o resultado obtido éum elemento de um subconjunto B do espaço de resultados, sendo P(B)>0. Isto significa que pretendemos calcular a probabilidade de um acontecimento A se realizar, sabendo que um outro acontecimento B se realizou.

Probabilidade condicional de A dado B, ou seja, probabilidade do acontecimento A, sabendo que o acontecimento B se realizou, representa-se por P(A|B) e édefinidapor

P(A):probabilidade de A, sem qualquer informação

P(A|B): probabilidade de A, com a informação de que B se realizou

A probabilidade condicional éuma Probabilidade visto que verifica a axiomática de Kolmogorove portanto também são válidas as Propriedades da Probabilidade referidas anteriormente.

Probabilidade da intersecção dos acontecimentos A e B ou probabilidade conjunta dos acontecimentos A e B

P(A∩B) = P(A|B) P(B), com P(B)>0ou P(A∩B) = P(B|A) P(A), com P(A)>0

Da definição de probabilidade condicional vem

Generalizando para três ou mais acontecimentos definidos no mesmo espaço Ω, tem-se

Acontecimentos independentes

O conceito de probabilidade condicional permite-nos definir acontecimentos independentes como sendo aqueles em que a informação acerca da realização de um deles não altera a probabilidade de ocorrência do outro.

A éindependente de B se P(A|B) = P(A), com P(B)>0 B éindependente de A se P(B|A) = P(B), com P(A)>0

Dois acontecimentosA e B, definidos no mesmo espaço Ω, são independentes se e sóse P(A∩B) = P(A) P(B)

Dados dois acontecimentos A e B, tais que P(A)>0 e P(B)>0, tem-se que •se A e B são acontecimentos disjuntos, então A e B não são independentes

•se A e B são acontecimentos independentes, então A e B não são disjuntos (i.e. épossível realizarem-se ambos)

Dois acontecimentos sópodem ser simultaneamente disjuntos e independentes quando pelo menos um deles tem probabilidade nula.

Se os acontecimentos A e B são independentes, também o são os acontecimentos BeABeABeA ,,

Partição do espaço de resultados

Os acontecimentos A, A, …, Aconstituem uma partição do espaço de resultados Ωsse

Éobvio que, para qualquer partição de Ω,

Teorema da Probabilidade Total

SejaA, A, …Auma partição do espaço de resultados Ω, em que P(A) > 0 (j=1, 2, …,n). Então, para qualquer acontecimento B, tem-se que

Dem:

Como as probabilidades P(A) podem ser encaradas como pesos (visto que são números positivos cuja soma é1), a probabilidade de B écalculada como uma média ponderadadas probabilidades condicionais P(B|A).

Caso particular:considerando a partição {A,Ā} de Ω

Dado um acontecimento A tal que P(A)>0, tem-se , para um acontecimento B, P(B) = P(B|A)P(A) + P(B|Ā)P(Ā)

Teorema de Bayes

acontecimentos de uma partição A, A,,A. Pretende-se então saber qual a
realização do acontecimento B
Os acontecimentos da partição A, A,, Asão as hipóteses ou causas

Por vezes, após a experiência aleatória, observa-se um acontecimento B que sabemos ser susceptível de ter sido ocasionado por qualquer um dos probabilidade de ter sido um determinado acontecimentoAa ocasionar a antecedendo ou explicando o acontecimento B e este pode considerar-se o efeito de uma e uma sódessas causas.

O Teorema de Bayestem grande interesse em aplicações práticas, nomeadamente nos chamados testes “screening”ou de triagem, habitualmente associados aos testes de diagnóstico nas ciências biomédicas, mas também com aplicação noutras áreas: controlo de qualidade na indústria, testes de dopping no desporto, etc.

Teorema de Bayes

SejaA, A, …, Auma partição do espaço de resultados Ω, com P(A)>0 (i=1,2,…,n). Então, para qualquer acontecimento B tal que P(B)>0, vem que, para i=1,2,…,n j j i i

Em Informática, éfácil demonstrar o imenso poder do Teorema de Bayes: éa base de quase todos os filtros de spamque são utilizados actualmente.

A filtragem bayesianade spamfoi proposta em 1998 e rapidamente se tornou num método muito popular para distinguir entre e-mail verdadeiro e spam. O teorema de Bayespermite calcular a probabilidade de que uma mensagem seja realmente spam, dado que contém certas palavras:

() ()spamPspampalavrasPspamPspampalavrasPpalavrasP palavrasP spamPspampalavrasPpalavrasspamP

Certas palavras têm determinadas probabilidades de ocorrer em spame em verdadeiro e-mail. O filtro não sabe inicialmente quais são essas probabilidades e por isso deve ser “treinado”, o que pode ser feito de acordo com o perfil do utilizador.

Variáveis aleatórias

Uma variável aleatória pode ser entendida como uma variável quantitativa, cujo valor depende de factores aleatórios.

•número obtido no lançamento de um dado •número de peças defeituosas numa amostra retirada ao acaso de um lote

•número de pessoas que visitam um determinado site, num certo período de tempo •volume de água perdido, por dia, num sistema de abastecimento

•tempo de resposta de um sistema computacional

A uma experiência aleatória pode-se associar um modelo de probabilidade que pressupõe a construção de um espaço de resultados e a atribuição de uma probabilidade a cada um dos acontecimentos elementares. Ora, nemsempre os resultados de uma experiência aleatória são numéricos (e.g. lançamento de uma moeda: cara ou coroa). Além disso, frequentemente épreferível sintetizar os aspectos mais significativos dos resultados da experiência aleatória.

Vejamos então uma forma de associar valores numéricos aos resultados de uma experiência aleatória, introduzindo formalmente o conceito de variável aleatória.

Uma variável aleatória(v.a.) X éuma função que associa a cada elemento do espaço de resultados um número real

Se X for uma v.a. representamos por x um valor observado dessa v.a., ou seja, um valor que a v.a. pode assumir.

Ex: lançamento de uma moeda equilibradaΩ= {cara, coroa}

Defina-se a v.a. X tal que X(cara) = 0 e X(coroa) = 1 Então P(X = 0) = P(saircara) = 1/2P(X = 1) = P(saircoroa) = 1/2

As variáveis aleatórias podem ser classificadas como discretas ou contínuas.

Uma v.a. diz-se discretase apenas assume um número finito ou infinito numerável de valores distintos. Uma v.a. diz-se contínuase pode assumir todos os valores de um intervalo da recta real, sendo nula a probabilidade de assumir valores isolados.

Função de distribuição

Uma forma de definir uma v.a., discreta ou contínua, consiste na utilização de uma função real de variável real designada por função de distribuição.

Função de distribuição(f.d.) de uma v.a. X (discreta ou contínua) éa função definida por F(x) = P(X ≤x)∀x∈ℜ

∀x∈ℜ, X ≤x refere-se ao acontecimento constituído pelos elementos de Ωtais que os valores da v.a. X são menores ou iguais a x.

Propriedades da função de distribuição

1.F(-∞) = 0; F(+∞) = 1 2.F éuma função não decrescente 3.F éuma função contínua àdireita

Para qualquer função de distribuição F de uma v.a. X, vem que

•Se a v.a. X édiscreta, a função de distribuição édescontínua (éapenas contínua àdireita); éuma função em escada, com saltos nos pontos onde a v.a. assume valores com probabilidade não nula.

O valor do salto no ponto xép= P(X = x)

•Se a v.a. X écontínua, a função de distribuição écontínua (étambém contínua àe squerda) ℜ∈== aaXP qualquer para0)(

Seja X uma v.a. com f.d. F(x). Então dados os pontos a e b, tais que a<b, tem-se que P(a<X≤b) = F(b) –F(a)

Dem: Sabe-se que P(B-A) =P(B) –P(A∩B). Se A⊂B, então P(B-A) =P(B) –P(A). Então sendo A = (-∞,a] e B = (-∞,b] vem que P(a<X≤b) = P(X≤b) –P(X≤a).

O conhecimento da função de distribuição possibilita, de forma expedita, o cálculo da probabilidade de uma v.a. assumir valores num dado intervalo.

P(a<X<b) = F(b) –F(a) –P(X = b)

P(a≤X≤b) = F(b) –F(a) + P(X = a) P(a≤X<b) = F(b) –F(a) + P(X = a) –P(X = b) Se a v.a. X for contínua, estas probabilidades são todas iguais a F(b) –F(a).

Variável aleatória discreta

Énatural definir a probabilidade de uma v.a. assumir um determinado valor como sendo a probabilidade do acontecimento que fez com que a v.a. tivesse esse valor.

Chama-se função massa de probabilidade(f.m.p.) àfunção que, a cada valor numérico que a v.a. assume, faz corresponder a probabilidade associada a esse valor.

Uma v.a. X discreta fica perfeitamente identificada pela sua f.m.p., i.e., pelos valores xque a v.a. assume e pelas probabilidades de assumir esses valores

xXPp x X

Atendendo àdefinição de Probabilidade, éimediato que qualquer f.m.p. goza das seguintes propriedades:

∑i i p

Notemos que

Ax i x i

(i) Supondo que a extracção éfeita com reposição

Ex: Uma urna contém quatro bolas numeradas de 1 a 4. Extraem-se ao acaso duas bolas da urna. Defina a v.a. que representa a soma dos números observados nas bolas extraídas.

Função de distribuição da v.a. Y

x x x x x x xFY

Variável aleatória contínua

Define-se função densidade de probabilidade (f.d.p.) de uma v.a. X contínua, e representa-se por f(x), como sendo a derivada, se existir, da função de distribuição F(x) o que éequivalente a

Propriedades da f.d.p.

Nos pontos em que não existe derivada da f.d., éhabitual considerar que f(x) = 0. Quando a v.a. assume valores apenas num subconjunto de ℜ, admite-se que f(x)=0 no exterior daquele subconjunto.

Notemos que, para a<b,

O cálculo do integral anterior éequivalente a calcular o valor da área compreendida entre o eixo das abcissas, o gráfico da f.d.p. e as rectas x=a e x=b.

F(a) corresponde àárea compreendida entre o eixo das abcissas e o gráfico da f.d.p., desde -∞atéàrecta x=a.

Características populacionais

Vamos agora definir medidas de localização e dispersão que permitem identificar muitas das características fundamentais de uma população representada pela v.a. X. São os chamados parâmetros populacionais, dos quais depende a distribuição de X.

Parâmetro: quantidade numérica fixa, embora por vezes seja desconhecida

Valor médio

Define-se valor médio ou valor esperado de X e representa-se por E(X) ou μ como sendo:

•Seja X uma v.a. discreta que assume valores xcom probabilidade p,

•Seja X uma v.a. contínua com f.d.p. f(x). Então

O valor médio corresponde ao centro de gravidade da distribuição de probabilidades. Éum parâmetro de localização do centro da distribuição.

O valor esperado de uma v.a. discreta não énecessariamente um valor que a v.a. pode assumir com probabilidade não nula.

(Parte 1 de 3)

Comentários