modelaçao de serie stemporais -´parte 2

modelaçao de serie stemporais -´parte 2

Departamento de Matem atica

Universidade do Minho 2005/2006

S eries Temporais Licenciatura em Matem atica

IV. Modelac ~ao de s eries temporais Segunda parte - Identi ca c~ao, estima c~ao e avalia c~ao

Um dos objectivos fundamentais do estudo de s eries temporais e a constru c~ao de modelos adequados para a descri c~ao da s erie. Dada uma s erie temporal temporal observada e ap os uma an alise descritiva inicial, a modela c~ao e habitualmente efectuada em 3 etapas:

• Identi ca c~ao - selec c~ao de um modelo que pare ca adequado para os dados em quest~ao, aplicando metodologias de estacionariza c~ao da variancia, da m edia ou outras transforma c~oes, se necess ario

Estima c~ao - dos parametros (coe cientes) do modelo escolhido

Avalia c~ao do diagn ostico - procedendo-se a avalia c~ao da qualidade estat stica das estimativas obtidas para os parametros, e da adequa c~ao do modelo estimado aos dados (an alise de res duos)

O conjunto destas etapas e conhecido como metodologia de Box-Jenkins uma vez que foi proposta por estes autores. Se um modelo for considerado n~ao satisfat orio, quer por m a qualidade da estima c~ao, quer pela an alise dos res duos, e rejeitado e voltamos a primeira etapa. Assim, na pr atica e habitual seleccionarem-se v arios modelos alternativos e escolher o melhor a luz de crit erios de avalia c~ao/compara c~ao.

Esta etapa consiste essencialmente na transforma c~ao dos dados de forma a poderem ser modelados como um processo SARIMA(p;d;q)X(P;D;Q) e na escolha dos parametros a utilizar. Dadas as di culdades e falta de precis~ao de muitos m etodos de estima c~ao e conveniente a utiliza c~ao do menor n umero de coe cientes poss vel. Assim, um bom modelo dever a n~ao s o descrever adequadamente os dados, mas tamb em ter o menor n umero de parametros n~ao nulos, com os valores mais baixos necess arios para essa descri c~ao.

Primeiramente deve decidir-se a transforma c~ao dos dados para estabilizar a variancia (transforma c~ao de Box-Cox), caso necess ario, baseada na an alise descritiva efectuada. Poder a ser ainda adequada uma transforma c~ao de redu c~ao da escala, por exemplo (x(t) − x)= x, para reduzir problemas de estima c~ao que surgem quando os dados tem ordem de grandeza muito elevada. A transforma c~ao de Box-Cox por si s o j a efectua uma redu c~ao de escala, pelo que muitas vezes n~ao e necess ario efectuar explicitamente este passo.

Em seguida s~ao identi cados os parametros d, S e D procedendo as diferencia c~oes necess arias. O operador diferencia c~ao pode introduzir a varia c~oes esp urias e leva a perda de informa c~ao (redu c~ao do tamanho da s erie) pelo que deve ser empregado com modera c~ao. Para al em da informa c~ao obtida na an alise descritiva (em particular no cronograma) a FACa pode tamb em fornecer indica c~oes sobre que transforma c~oes ser~ao adequadas, a partir das caracter sticas da estrutura de dependencia, ajudando por exemplo na escolha da ordem da diferencia c~ao.

Como foi visto, a fun c~oes FAC e FACP tem comportamentos caracter sticos para cada modelo. Assim, a selec c~ao de um modelo, identi cando os parametros p, q, P e Q, e baseada na compara c~ao da FACa e da FACPa estimadas.

Tendo identi cado o modelo SARIMA(p;d;q)X(P;D;Q) adequado para modelar os dados em an alise falta ainda encontrar o modelo ajustado. E ent~ao necess ario estimar :

os coe cientes dos polin omios autorregressivos fp(B) e P(BS) num total de p + P + q + Q + 1 coe cientes. Caso o parametro 0 (num modelo ARIMA) n~ao seja nulo a sua estima c~ao ter a tamb em de ser considerada.

2.1 Estimadores para os coe cientes

Os m etodos de estima c~ao mais utilizados baseiam-se em abordagens de m nimos quadrados, baseadas nos momentos e de m axima verosimilhan ca.

Admitam-se N observa c~oes de x(t) e as condi c~oes iniciais x(t) = 0;t 0. Pensando no processo ARMA(p;q)X(P;Q) como uma regress~ao linear m ultipla de x(t)

os coe cientes dos v arios polin omios podem ser estimados por m nimos quadrados minimizando

ou seja, minimizando a soma do quadrado dos res duos 1.

O m etodo dos momentos e aplicado substituindo nas rela c~oes de Yule-Walker as FAC te oricas pelas estimadas e resolvendo o sistema em rela c~ao aos coe cientes (estimadores de Yule-Walker). Para N su cientemente grande estes estimadores n~ao diferem substancialmente dos de m nimos quadrados, podendo no entanto conduzir a estimadores n~ao e cientes para os coe cientes dos polin omios m edia m ovel.

Exemplos

tomar-se o sinal que garante a invertibilidade.

Para um processo AR(2) vem

resultando em

em que 2wV 1P e a matriz de autocorrela c~oes de x(t). O logaritmo de (2) vem

1 SSR - Sum of Squared Residual

2Esta e uma condi c~ao habitual no contexto das estimativas de m axima verosimilhan ca

Quando n e grande, o termo ln[|VPj] e desprez avel e os estimadores de m axima verosimilhan ca condicional podem obter-se minimizando SSR, que domina a express~ao. Veri ca-se ent~ao que, para w(t) e ru do gaussiano, o estimador pelo m etodo dos m nimos quadrados corresponde ao estimador de m axima verosimilhan ca condicionada.

No caso da estima c~ao de um modelo em que os polin omios MA s~ao n~ao nulos, em particular se o n umero de observa c~oes e pequeno, as estimativas de m axima verosimilhan ca condicionada podem ser m as. Para estes casos devem estabelecer-se os estimadores de m axima verosimilhan ca n~ao condicionais utilizando retrovis~ao: obtem-se os valores de x(t);t < 1 \prevendo-os" a custa da informa c~ao x(t);t = 1;:::;N. Esta metodologia admite que se um valor subsequente x(N +k+1) da s erie x(t) se encontra relacionado com a sucess~ao de valores x(1);x(2);:::;x(N), ent~ao o valor precedente x( k) mant em a mesma rela c~ao com a sucess~ao invertida x(N);x(N 1);:::;x(1).

Exemplo

Para a0 uma primeira estimativa de de a, pode-se utilizar a informa c~ao adicional para reestimar a obtendo a1 e assim sucessivamente at e se veri car a convergencia das estimativas.

2.2 Propriedades assimpt oticas para os estimadores dos coe cientes [MMT93]

Considere-se um processo ARMA(p;q) e seja # o vector dos coe cientes a estimar e # o correspondente vector dos estimadores de m axima verosimilhan ca (ou de m nimos quadrados).

segue assimptoticamente uma distribui c~ao gaussiana multidimensional p + q variada, com vector de m edias nulas e matriz de variancias-covariancias

Exemplos • para um MA(1) vem

logo

para um AR(1) vem

logo

para um AR(2) vem

para um ARMA(1) vem

Para # um coe ciente gen erico de um dos polin omios, 2ii(#) o i- esimo elemento da diagonal principal da matriz V (#) e tendo em conta a distribui c~ao assimpt otica dos estimadores, tem-se

2.3 Estimadores para a variancia dos res duos O estimador de m axima verosimilhan ca condicional da variancia dos res duos vem

No caso de um modelo autorregressivo, a teoria da regress~ao linear m ultipla permite estabelecer que um estimador alternativo, n~ao condicional, que considera o facto de se usarem N − p observa c~oes para estimar p parametros. O estimador de m axima verosimilhan ca condicional da variancia dos res duos vem

No caso de o modelo envolver polin omios m edia m ovel o problema de minimiza c~ao deixa de ser linear e este resultado n~ao se aplica. No entanto e por analogia, alguns autores consideram o estimador

Os estimadores de m axima verosimilhan ca (ou m nimos quadrados) correspondem na maioria dos casos a minimiza c~ao de express~oes n~ao lineares sendo necess ario recorrer a algoritmos de optimiza c~ao num erica (t ecnicas iterativas). As estimativas obtidas pelo m etodo dos momentos s~ao muitas vezes utilizadas como valores iniciais para os m etodos de optimiza c~ao num erica. Assim a implementa c~ao da estima c~ao n~ao e simples, sendo muitas vezes necess ario recorrer a t ecnicas de an alise num erica e calculo computacional. Diversos pacotes inform aticos disp~oe de algoritmos adequados que, dado o modelo identi cado e os dados, estimam o modelo ajustado.

Tendo estimado um modelo e necess ario avaliar a sua qualidade estat stica e o seu ajustamento aos dados em estudo. Se o modelo for considerado n~ao adequado e rejeitado, sendo necess ario identi car e estimar um outro modelo, eventualmente utilizando a informa c~ao obtida nos testes efectuados sobre o modelo rejeitado.

3.1 Qualidade estat stica do modelo estimado

S~ao v arios os factores que podem indicar m a qualidade de um modelo estimado. Devem ser rejeitados modelos que:

Apresentem redundancia (ou quase redundancia) entre estimativas, resultante de factores comuns aos polin omios autorregressivos e m edia m ovel.

• Apresentem problemas de estabilidade, causados por estimadores muito correlacionados. Elevada correla c~ao entre estimadores permite que as estimativas variem simultaneamente de forma relevante sem que o SSR varie muito. Assim pequenas varia c~oes na s erie temporal podem levar a estimativas muito diferentes, ou seja os modelos s~ao inst aveis. Como regra, estimadores com coe ciente de correla c~ao em m odulo acima de 0.7 s~ao considerados correlacionados e os modelos estimados rejeitados.

Apresentem baixa signi cancia estat stica dos coe cientes estimados, que pode ser avaliada recorrendo a teste de hip oteses (assumindo a distribui c~ao assimpt otica dos estimadores). Coe cientes que n~ao possam ser considerados signi cativamente n~ao nulos devem ser eliminados do modelo.

N~ao sejam claramente invert veis e estacion arios. Quando os valores estimados dos parametros colocam o modelo na fronteira da regi~ao com estas propriedades e necess ario testar a hip otese de estabilidade/invertibilidade (teste de hip oteses sobre o valor dos coe cientes).

3.2 Qualidade do ajustamento

Num problema de ajustamento entende-se por res duos as diferen cas entre as observa c~oes e os valores ajustados. No contexto de s eries temporais os res duos correspondem a s erie de ru do estimada w(t), que se o modelo estimado descrever bem a s erie em estudo, corresponde a ru do branco de m edia zero. Em seguida apresentam-se alguns testes que avaliam se w(t) e

Teste de Bartlett - Baseia-se no facto que se os res duos s~ao uma realiza c~ao de um processo aproximadamente iid ent~ao as autocorrela c~oes amostrais dos res duos tem uma

Teste de Jenkins ou Daniels - Neste caso usa-se o facto de que se os res duos s~ao uma realiza c~ao de um processo aproximadamente iid ent~ao as autocorrela c~oes parciais amos- trais dos res duos tem uma distribui c~ao N(0;1=√ (n)). Consiste em testar a hip otese

Testes portmanteau (de conjunto) - prop~oem uma unica estat stica para testar a hip otese de que os res duos s~ao uma realiza c~ao de uma sequencia de vari aveis iid. Testa-

Q=n mX em que n = N d para um ARIMA(p;d;q). H0 e rejeitada se Q exceder a signi cancia escolhida para o teste. Em geral considera-se m N4 .

• Teste de Ljung-Box - E um re namento do anterior no sentido de que a distribui c~ao χ2 m−p q aproxima melhor a distribui c~ao de

Teste de McLeod-Li - baseia-se no facto de que se os dados s~ao iid ent~ao os seus quadrados tamb em o s~ao e as autocorrela c~oes amostrais dos dados s~ao substitu das

QML = n mX

Teste dos pontos de viragem (teste n~ao param etrico) - Se Y1;:::;Yn e uma sequencia de observa c~oes, dizemos que existe um ponto de viragem em i se (Yi 1 < Yi e Yi > Yi+1) ou se (Yi 1 > Yi e Yi < Yi+1:) A probabilidade de um ponto de viragem em i e 2=3: O n umero esperado de pontos de viragem T de uma sequencia iid de dimens~ao n; e

Teste do sinal das diferen cas (teste n~ao param etrico) - Seja S o n umero de valores

Teste das ordens - Este teste n~ao param etrico e particularmente util para detectar uma tendencia linear nos dados. Seja P o n umero de pares (i;j) tais que Yj > Yi e

Para al em dos enumerados outros testes estat sticos podem ser utilizados para avaliar a veracidade das v arias propriedades inerentes a uma sequencia de vari aveis iid.

Nota:

Estes testes para avaliar avaliam se existe alguma estrutura de dependencia nos res duos. Assim s~ao tamb em uteis para a avaliar a necessidade de construir ou n~ao um modelo para uma s erie temporal. Se ap os a aplica c~ao da decomposi c~ao cl assica ou outras estrat egias para elimina c~ao/estima c~ao de componentes das componentes n~ao estoc asticas "(t) passar os testes acima an alise da s erie est a completa uma vez que a componente residual e ru do branco. Caso contr ario deve ser modelada por um modelo estacion ario para s eries temporais.

4 Crit erios de selec c~ao entre modelos

Como atr as foi referido e habitual seleccionarem-se v arios modelos alternativos na etapa da identi ca c~ao. Assim sendo e supondo que v arios modelos s~ao considerados v alidos (passando os v arios testes de avalia c~ao de qualidade) e necess ario estabelecer um crit erio de escolha entre eles.

Uma possibilidade e a utiliza c~ao do crit erio de Akaike anteriormente referido. Este crit erio data dos anos 70 e tem sido amplamente utilizado, tendo ainda sido propostas v arias extens~oes visando a sua melhoria ou resolver problemas em particular (por exemplo quando o n umero de observa c~oes e reduzido).

O objectivo da maioria das an alises de s eries temporais e a previs~ao. A pr atica tem demonstrado que nem sempre o melhor modelo a luz dos crit erios habituais e o que produz melhores previs~oes. Assim, uma estrat egia muito utilizada e de compara modelos alternativos pelo erro de previs~ao estimado num per odo posterior n~ao utilizado na estima c~ao.

Referencias

[MMT93] BJF Murteira, DA Muller, and KF Turkman. An alise de sucess~oes cronologicas. McGrawHill, 1993.

Comentários