Probabilidade

Probabilidade

(Parte 2 de 3)

Ex: Seja X a v.a. que representa o número de pontos obtidos no lançamento de um dado equilibrado.

Valor médio de uma função de uma variável aleatória

Seja X uma v.a. e Y = ψ(X) uma v.a. que éfunção de X. Então, •Se X éuma v.a. discreta que assume valores xcom probabilidade p, i=1,2,…

•Se X éuma v.a. contínua com f.d.p. f(x) e supondo que ψ(X) éainda uma v.a. contínua

Supomos em ambos os casos que o valor médio de Y = ψ(X) existe. Notemos que a existência de E(X) não implica a existência de E[ψ(X)] e inversamente.

Propriedades do valor médio

1.Dadas as v.a. X e Y com valores médios E(X) e E(Y), respectivamente, então

E(X + Y) = E(X) + E(Y) 2.Dada a v.a. X e as constantes a e b, tem-se E(aX+ b) = a E(X) + b

3.Generalizando as propriedades anteriores, se existir E[ψ(X)], j=1,…, n, então

j j j j XEaXaE 1

Quantilde probabilidade p

Define-se quantilde probabilidade p(0<p<1) da v.a. X e representa-se por χ como sendo o menor valor de X que satisfaz a condição p ≤F(χ) ≤p + P(X = χ) onde F(x) éa f.d. da v.a. X.

•se X éuma v.a. discreta, χéo menor valor de X tal que F(χ) ≥p

•se X éuma v.a. contínua, χéo valor tal que F(χ) = p

Étambém uma medida de localização. Os quantisreferentes a v.a. contínuas são os que têm mais interesse do ponto de vista prático.

•quando p = ½obtem-sea medianade X •quando p = ¼obtem-seo 1ºquartilde X

•quando p = ¾obtem-seo 3ºquartilde X

Variância (populacional)

Define-se variância da v.a. X e representa-se por var(X) ou σcomo sendo var(X) = E[(X –E(X))]

Facilmente daqui se deduz uma expressão mais simples para o cálculo da variância: var(X) = E(X) –E(X)

Propriedades da variância:

1.var(X) ≥0 2.Dadas as constantes a e b, tem-se quevar(aX+b) = avar(X)

A variância de X éuma medida da dispersão da distribuição de X relativamente ao seu valor médio.

Desvio padrão (populacional)

Épor vezes mais conveniente usar como parâmetro de dispersão a raiz quadrada da variância, visto que assim estaremos a usar uma medida que se exprime nas mesmas unidades da variável.

Então, define-se desvio padrão da v.a. X como sendo

O desvio padrão mede a variabilidade da população relativamente ao seu valor médio.

Coeficiente de variação(populacional)

O coeficiente de variação (CV) da v.a. X éigual, se existir, ao quociente entre o desvio padrão e o valor médio de X. Tem-se então que CV = σ/μ.

O coeficiente de variação éuma grandeza que não depende de qualquer unidade de medida e é, portanto, muito utilizada para comparar a dispersão relativa de várias variáveis aleatórias.

Por vezes, énecessário descrever o resultado de uma experiência aleatória recorrendo a mais do que uma variável. Vamos considerar o caso de duas variáveis aleatórias discretase vamos estudar o comportamento conjunto dessas variáveis.

Sejam X e Y as duas v.a.’s discretas de interesse. Chama-sefunção massa de probabilidade (f.m.p.) do par (X,Y) àfunção que, a cada valor numérico (x,y)que o par de v.a.’s assume, faz corresponder a probabilidade associada a esse valor.

Par aleatório discreto

Um par aleatório discreto fica perfeitamente identificado pela sua f.m.p. conjunta, i.e., pelos valores que o par de v.a.’s assume e pelas probabilidades de assumir esses valores.

ppppx ppppx ppppx yyyYX

"" A f.m.p. do par aleatório (X,Y) costuma representar-se numa tabela:

A f.m.p. do par (X,Y) goza das seguintes propriedades:

∑∑ p jip

As f.m.p. marginaisdas v.a.’s X e Y são, respectivamente ikx jmy Y pP Y y p

Função massa de probabilidade condicional Sendo (X,Y) um par aleatório discreto tal que P(Y = y) > 0, a f.m.p. condicional de X dado Y = yédada porpp yYP

para i=1,…, k.De modo análogo se pode definir a f.m.p. condicional de Y dado X = x, desde que P(X = x) > 0.

Valor médio de uma função de um par aleatório discreto Seja g(X,Y) uma função das v.a.’s X e Y que têm f.m.p. conjunta dada por

Variáveis aleatórias independentes X e Y são variáveis aleatórias independentes se e sóse

),( yYxXPp === ou seja, para todo o par de valores (x,y) em que (X,Y) estádefinido.

Propriedades da covariância Sejam X e Y v.a.’s e sejam a, b, c e d constantes reais. Então:

Define-se covariânciaentre X e Y, e representa-se por cov(X,Y), como sendo cov(X,Y) = E[(X −E(X)) (Y −E(Y))]

Facilmente daqui se deduz uma expressão mais simples para o cálculo da covariância: cov(X,Y) = E(XY) −E(X)E(Y) Notemos que

Covariância var(X+Y) = var(X) + var(Y) + 2 cov(X,Y) var(X-Y) = var(X) + var(Y) -2 cov(X,Y)

Se as v.a.’s X e Y são independentes, então cov(X,Y) = 0 Resultado muito importante:

Note-se que a recíproca não éverdadeira. Pode haver variáveis aleatórias com covariâncianula e que não sejam independentes.

Dos resultados anteriores deduz-se que, se X e Y sãov.a.’s independentes, então

•E(XY) = E(X) E(Y) •var(X+Y) = var(X) + var(Y)

A covariânciaéum parâmetro que permite avaliar a variação conjunta de duas variáveis aleatórias. Se X e Y variam essencialmente no mesmo sentido, então a covariânciaépositiva; caso contrário, a covariânciaénegativa.

Coeficiente de correlação

A covariânciadepende das unidades em que se exprimem as v.a.’s X e Y. Assim, éconveniente introduzir um novo parâmetro, não dependente dessas unidades, para medir o grau de associação linearentre X e Y.

O coeficiente de correlaçãoentre as v.a.’s X e Y édado por

Pode demonstrar-se que ρtoma valores no intervalo [-1,1]. Além disso,

•um valor de ρpróximo de 1 significa uma forte associação linear, positiva, entre X e Y •um valor de ρpróximo de -1 significa uma forte associação linear, negativa, entre X e Y •um valor de ρpróximo de zero significa que a associação linear entre X e Y não existe ou émuito fraca. As v.a.’s podem estar correlacionadas não linearmente.

Notemos que ρ= ±1 quandoe sóquandoexiste(com probabilidadeiguala um) umarelaçãolinear entre as variáveis.

Seja Y = aX+ b. Então ρ= -1 se a < 0; ρ= 1 se a > 0.

Modelos Discretos

Distribuição Binomial

Consideremos uma experiência aleatória com as seguintes características:

•a experiência éconstituída por n provas, entendendo-se por prova uma repetição em condições idênticas •as provas são independentes

•em cada prova ocorre apenas um de dois resultados possíveis, designados por sucesso e insucesso. A probabilidade de sucesso mantém-se constante de prova para prova e representa-se por p.

Uma sucessão de provas com estas características designa-se por sucessão de provas de Bernoulli.

Vamos agora estudar alguns modelos probabilísticos com grande aplicação na prática

Exemplos: •lançamento de uma moeda: cara (sucesso), coroa (insucesso)

•transmissão de um dígito binário através de um canal de comunicação: dígito recebido correctamente (sucesso), dígito recebido incorrectamente (insucesso)

Seja X a v.a. que representa o número de sucessos em n provasde Bernoulli, em que a probabilidade de sucesso ép. Então, a sua f.m.p. é nkpp k

X éuma v.a. Binomial de parâmetros n e p e representa-se por ),( pnBiX ∩

Mostra-se que E(X) = npevar(X) = np(1-p)

Caso particular: quando n=1, X édesignada por v.a. de Bernoulli

Amostragem com reposição

Consideremos o processo de amostragem em que, para cada indivíduo recolhido aleatoriamente na população, se verifica se tem ou não uma determinada característica, repondo o elemento recolhido antes de proceder a nova extracção. Então, estamos em condições de aplicar o modelo Binomial quando se quer estudar a v.a. que representa o número de indivíduos da amostra assim obtida que têm a dita característica.

Distribuição geométrica

Uma v.a. X diz-se geométrica de parâmetro p se representa o número de provas necessárias atéàobtenção do 1ºsucesso(inclusive), numa sucessão de provas de Bernoulliem que a probabilidade de sucesso ép.

A f.m.p. de X édada por P(X = K) = p(1-p) k = 1, 2, …

Distribuição de Poisson

Vamos agora considerar um modelo discreto que se aplica em situações em que interessa estudar o número de ocorrências de um certo acontecimento, num determinado intervalo de tempo ou espaço

Suponhamos que se verificam as seguintes hipóteses: •a probabilidade de ocorrência do acontecimento éa mesma para quaisquer dois intervalos de igual amplitude •a ocorrência (ou não) do acontecimento num determinado intervalo é independente da ocorrência (ou não) do acontecimento em qualqueroutro intervalo

Seja X a v.a. que representa o número de ocorrências do acontecimento, num determinado intervalo de tempo. Então dizemos que X tem distribuição de Poissonde parâmetro λ, com f.m.p. dada por ekXP

Representa-se por

O parâmetro λéo número médio de ocorrências por intervalo de tempo. E(X) = λ evar(X) = λ

Ex: de aplicação da distribuição de Poisson

•número de consultas a uma base de dados por minuto •número de pedidos a um servidor num certo intervalo de tempo

•número de clientes que chegam a um balcão de atendimento num certo intervalo de tempo •número de chamadas telefónicas recebidas num callcenternuma hora

•número de bactérias num determinado volume de água

Distribuição hipergeométrica

Quando se procede a extracções sem reposiçãonuma população finita, o que podemos dizer quanto àv.a. que representa o número de elementos da amostra assim obtida que possuem determinada característica?

Consideremos uma população de N elementos dos quais M possuem determinada característica (sucesso), enquanto que os restantes N-M elementos não a têm. Seja n a dimensão de uma amostra extraída da população (sem reposição) e X a v.a. que representa número de elementos da amostra que possuem a dita característica.

Então a v.a. X tem distribuição Hipergeométricacom f.m.p. dada por kn MNk

Os parâmetros são N, n e p = M/N (que éa probabilidade de que um elemento extraído ao acaso da população possua a característica) nNpnpXnpXE

O modelo Hipergeométricoéadequado quando se procede a extracções sem reposição: •as extracções não são independentes

•a probabilidade de sucesso varia de extracção para extracção

No entanto, quando se procede a extracções sem reposição, se a dimensão N da população for muito maior que a dimensão n da amostra, o modelo Binomial pode ser usado para representar o número de elementos da amostra que possuem determinada característica. De facto, neste caso, as sucessivas extracções podem ser consideradas independentes e a probabilidade de sucesso não se altera substancialmente de extracção para extracção.

Soma de variáveis aleatórias independentes com distribuição Binomial Dadas as v.a.’s X, …, Xindependentes com distribuição Binomial kipnBiX ,,1),( …=∩ a soma S=X+…+ Xtambém tem distribuição Binomial

Soma de variáveis aleatórias independentes com distribuição de Poisson Dadas as v.a.’s X, …, Xindependentes com distribuição de Poisson a soma S=X+…+ Xtambém tem distribuição de Poisson

Modelos Contínuos

Distribuição Uniforme X tem distribuição Uniforme no intervalo (a,b) se a sua f.d.p. for dada por bxa abxf ou0

A função de distribuição édada por

bxa ab

Simbolicamente, representa-se por ),(baUX∩

Então, se ),(baUX∩, temos que

Distribuição Exponencial X tem distribuição Exponencial de parâmetro θ> 0 se a sua f.d.p. édada por xe xf θ

A função de distribuição é x xF

O modelo Exponencial aplica-se frequentemente no estudo do tempo de vida de componentes electrónicas, do tempo de vida de seres vivos, etc.

Quando o número de ocorrências de um acontecimento num determinado intervalo segue um modelo de Poisson, o tempo decorrido entre ocorrências sucessivas tem distribuição Exponencial.

A distribuição Exponencial não tem “memória”e éo único modelo contínuo que possui esta propriedade:

P(X > t+s|X > t) = P(X > s)para qualquer t>0, s>0

Distribuição Normal (ou Gaussiana)

A distribuição normal éa mais conhecida das distribuições contínuas e uma das mais importantes. Foi obtida matematicamente por Gausscomo a distribuição dos erros de medida de grandezas físicas, tendo-lhe dado o nome sugestivo de “lei normal dos erros”.

Do ponto de vista das aplicações empíricas, tem-se comprovado que muitas características observáveis de determinada população são bem representadas por variáveis aleatórias que seguem uma distribuição normal.

Ex: distribuição da altura ou do peso dos indivíduos em populações razoavelmente homogéneas

Por outro lado, prova-se que a distribuição da soma (ou da média) de um número suficientemente grande de variáveis aleatórias i.i.d. ébem aproximada pela distribuição normal, o que permite justificar a sua utilização em muitas situações. Tem também um papel importante no âmbito da Inferência Estatística.

Uma v.a. X tem distribuição normal de parâmetros μe σse a sua f.d.p. é

Vejamos algumas propriedades da f.d.p. da normal relativamente àsua representação gráfica:

1.Ésimétrica relativamente ao seu valor médio μ, de modo que duas curvas correspondentes a duas distribuições com o mesmo desvio padrão σtêm a mesma forma, diferindo apenas na localização.

achatamento.(,) ()var()XNEXXμσμσ∩⇒==e,,

2.Étanto mais achatada quanto maior for o valor de σ, de modo que duas curvas correspondentes a duas distribuições com o mesmo valor médio são simétricas relativamente ao mesmo ponto μ, diferindo apenas no grau de x xfx μσ

A distribuição normal com valor médio μ= 0 e desvio padrão σ= 1 édesignada por distribuição normal “standard”ou padrão e representa-se por N(0,1).

)1,0(),(NXZNX∩−=∩σμσμentão Se

abbXaPbXaP bbZPbXPbXP NX

A função de distribuição da normal “standard”tem uma notação especial. )()()1,0( zzZPNZ Φ=≤⇒∩

Uma propriedade importanteda f.d. da Normal(0,1): pela simetria da f.d.p. relativamente ao valor médio 0 deduz-se que

Existem tabelas para a f.d. da normal “standard”. Pela propriedade acima referida, constata-se que basta haver tabelas para valores positivos ou negativos.

O quantilde probabilidade αda N(0,1) representa-se por ze étal queαα−= z zZPz que se-Note

Distribuições de amostragem POPULAÇÃO AMOSTRA

Ex: Considere-se os estudantes matriculados na FCUL no ano lectivo 2007/2008, entre os quais háuma proporção p (desconhecida) que pratica desporto. Escolhem-se ao acaso 30 estudantes. A proporção de praticantes de desporto nessa amostra seráusada para tirar conclusões sobre a proporção de praticantes na população dos estudantes da FCUL de onde foi retirada a amostra.

Ex: Admite-se que a distribuição exponencial Exp(θ) éadequada para modelar o tempo de vida das unidades de uma população de componentes electrónicas, mas θédesconhecido. Tendo sido registado o tempo de vida de várias componentes, escolhidas ao acaso, a média dos tempos observados seráusada para tirar conclusões sobre o verdadeiro tempo médio de vida das componentes.

Quando se dispõe de uma amostra de n observações (x,…,x), supõe-se que essa amostra éuma realização do vector aleatório (X,…,X).

Quando as variáveis aleatórias X,…,Xsão independentes e identicamente distribuídas (i.i.d.) diz-se que (X,…,X) éuma amostra aleatória.

Uma estatísticaéuma v.a., função da amostra aleatória (X,…,X), que não envolve qualquer parâmetro desconhecido.

Distribuição de amostragem de uma estatísticaéa distribuição dos valores que a estatística assume para todas as possíveis amostras, da mesma dimensão, extraídas da população.

() ()aestatístic uma é não do,desconheci com asestatístic são

XXn

SXn X 1

Distribuição de amostragem da média

1)A distribuição de amostragem da média depende da distribuição da população subjacente às amostras. 2)Nem sempre épossível obter a distribuição exacta da média; por vezes, apenas se consegue obter uma distribuição aproximada, designada por distribuição assintótica.

(Parte 2 de 3)

Comentários