Tópicos de Matrizes e Distribuição Normal Multivariada

Tópicos de Matrizes e Distribuição Normal Multivariada

(Parte 3 de 4)

As figuras a1 e a2 mostram as distribuicoes de duas binormais, na primeira X1 e X2 sao independentes, na segunda X1 e X2 tem correlacao de 0,75. As figuras b1 e b2 sao contornos de 50% e 90% para duas N2(µ,Σ), X1 e X2 independentes ou correlacionadas. A figura b3 mostra contorno de densidade constante para uma normal bivariada com σ1 = σ2 e ρ12 > 0.

(1−α), para X ∼ Np(µ,Σ) e χ2p sendo o α−quantil superior da qui-quadrado com p graus de liberdade.

3.1.3 Propriedades da Distribuicao normal multivariada

Seja X ∼ Np(µ,Σ) , entao sao verdades 1. Combinacoes lineares de componentes de X sao distribuıdas normalmente :

X ∼ Np(µ,Σ) ⇒ atX ∼ N(atµ,atΣa) 2. Todo subconjunto de componentes de X tem distribuicao normal multivariada.

3. Covariancia zero implica que as correspondentes componentes sao independentemente distribuıdas.

Funcao caracterıstica

Seja X um vetor aleatorio (p×1). A funcao caracterıstica de X e definida como :

4. Seja Xt = (Xt1,Xt2). Os vetores aleatorios X1 e X2 sao independentes se, e somente se,

DENSIDADE E PROPRIEDADES DA DISTRIBUICAO NORMAL MULTIVARIADA 17

stΣs

7. Dois vetores conjuntamente multinormais sao independentes se, e somente se sao nao correlacionados.

8. Se X ∼ Np(µ,Σ) entao AX e BX sao independentes se, e somente se AΣBt = 0. 9. Distribuicoes condicionais das componentes sao multinormais :

10. X ∼ Np(µ,Σ),d um vetor de constantes ⇒ (X + d) ∼ Np(µ + d,Σ). 1. Todos os subconjuntos de componentes de X sao normalmente distribuıdas. Se particionamos X, seu vetor de medias µ e matriz de covariancia Σ. Seja X1 e X2 com dimensao q e p-q respectivamente, isto e

Σ12
Σ2
0
0Σ2

tem probabilidade (1−α), com χ2p(α) sendo o α−quantil superior da distribuicao qui-quadrado com p graus de liberdade.

sao conjuntamente normais multivariadas com matriz de covariancias( (∑n j=1 c2j)Σ btcΣ

DENSIDADE E PROPRIEDADES DA DISTRIBUICAO NORMAL MULTIVARIADA 18

Consequentemente V1 e V2 sao independentes se btc = ∑n j=1 bjcj = 0,isto e , os vetores b e c sao perpendiculares.

Considerando todos os possıveis valores de x2, podemos escrever a variavel µ1 +

entre X1 e a predicao da media da distribuicao condicional de X1 e o vetor X1.2 e chamado de conjunto de variaveis residuais.

Em populacoes multinormais as variaveis residuais e as fixadas sao distribuidas independentemente.

LISTA 2 DE EXERCıCIOS DE ANALISE MULTIVARIADA 19 3.2 Lista 2 de exercıcios de Analise Multivariada

(a) Escreva a densidade desta normal (b) Apresente a expressao da distancia quadrada generalizada (x−µ)tΣ−1(x−µ) como uma funcao de x1 e x2. (c) Determine o contorno de densidade constante que contem 50% de probabilidade. Esboce o grafico do contorno.

(d) Especifique a distribuicao condicional de X1, dado X2 = x2 para a distribuicao

X1 , em outro caso.

(a) Mostre que X2 tem tambem distribuicao normal (b) Mostre que X1 e X2 nao tem distribuicao normal bivariada

)] sao independentes.

(c) Determine a distribuicao de X3 dado X1 = x1 e X2 = x2 (d) Verifique que na questao acima (X1,X2) e independente da variavel residual.

CAPITULO 4 Amostras Aleatorias

4.1 Introducao

Uma observacao multivariada e o conjunto de medidas de p diferentes variaveis na mesma unidade de analise. Tomando-se n observacoes, a massa de dados pode ser arranjada em uma matriz de dados X como

· · · · · ·· · ·
x1, x2,xn

Cada coluna de X representa uma observacao multivariada e a matriz X e uma amostra de tamanho n de uma populacao n de uma populacao p−variada. Cada coluna reoresenta um ponto num espaco p−dimensional, fornecendo informacao sobre sua locacao e variabilidade alem de associacao linear.

O vetor media amostral x e obtido como combinacao linear das colunas de X, ou seja,

1/n 1/n

Se os pontos sao considerados esferoıdes o vetor de medias, x, e o centro de gravidade. A matriz S de variancia e covariancias amostral indica a variacao nas varias direcoes do sistema. O determinante da matriz de variancia e covariancias amostral e uma medida numerica da variabilidade total.

xixti − nxxt] =

A matriz de covariancia amostral contem p variancias e 12 p(p − 1) covariancias.

A variancia amostral generalizada e o determinande de S e representa a variacao

AMOSTRAS ALEATORIAS DE UMA DISTRIBUICAO MULTINORMAL 21 expressa em S. A fragilidade da variancia generalizada pode ser mostrada nas seguintes tres matrizes de covariancias as quais tem mesma variancia generalizada e diferente estrutura de correlacao, nao detectada por det(S),

f(x1).f(x2)f(xn) onde f(xj) = f(x1j, x2j, . . . , xpj)

As medidas das p variaveis em uma uınica observacao Xtj = (X1j,...,Xpj), serao em geral correlacionadas.

As medidas de diferentes observacoes devem ser no entanto independentes. A violacao da hipotese de independencia entre cada observacao pode causar serios impactos na qualidade da inferencia estatıstica. Observacoes atraves do tempo sao um exemplo desta situacao.

1. Em qualquer analise estatıstica, |S| = 0 significa que as medidas de algumas variaveis devem ser removidas do estudo.

2. Se n ≤ p ( isto e, o numero de observacoes e menor ou igual ao numero de variaveis observadas), entao |S| = 0 para todas as amostras.

3. Se a combinacao linear atXj tem variancia positiva para cada vetor constante a 6= 0 e se p < n, entao S tem posto completo com probabilidade 1 e |S| > 0.

4.1.2 Variancia Total Amostral

Outra generalizacao da variancia e definida como a soma dos elementos sa diagonal

i=1 sii = s11 + s12 ++ spp.

principal e e chamada de variancia total amostral, ∑p

4.2 Amostras Aleatorias de uma Distribuicao Multinormal

Seja X1,X2,...,Xn uma amostra aleatoria de uma populacao p−variada com o vetor de medias µ e matriz de covariancia Σ. Desde que X1,X2,...,Xn sao mu-

ESTIMAC AO DE MAXIMA VEROSSIMILHACA DE µ E Σ PARA NP(µ,Σ). 2 tuamente independentes e com uma distribuicao comum Np(µ,Σ), a funcao de densidade conjunta de todas as observacoes e o produto das densidades normais marginais,

(Parte 3 de 4)

Comentários