Análise de Séries Temporais

Análise de Séries Temporais

(Parte 1 de 5)

Primeira publicacao 2003

Segunda edicao publicada em 2004 Terceira edicao publicada em 2005

Quarta edicao publicada em 2007RICARDO SANDES EHLERS 2003-2007

Sumario

1 Introducao 1

2.1 Decomposicao Classica6
2.2 Series com Tendencia6
2.3 Series Sazonais1
2.4 Autocorrelacao1
2.4.1 O Correlograma13

2 Tecnicas Descritivas 6

3.1 Introducao18
3.2 Processos Estacionarios19
3.3 A Funcao de Autocorrelacao20
3.4 Alguns Processos Estocasticos20
3.4.1 Sequencia Aleatoria20
3.4.2 Passeio Aleatorio21
3.4.3 Processos de Media Moveis2
3.4.4 Processos Autoregressivos24
3.4.5 Modelos Mistos ARMA29
3.4.6 Modelos ARMA Integrados30

3 Modelos Probabilısticos 18

4.1 Autocovariancia e autocorrelacao34
4.2 Ajustando Processos Autoregressivos35
4.3 Ajustando Processos Medias Moveis39
4.4 Ajustando Processos ARMA40
4.5 Modelos Sazonais41
4.6 Adequacao do Modelo43
4.6.1 Analise dos Resıduos43
4.6.2 Testes sobre os resıduos4
5.1 Metodos Univariados de Previsao52
5.1.1 Alisamento Exponencial Simples52

5 Previsao 52 i

5.1.2 Metodo de Holt-Winters56
5.2 Previsao em Modelos ARMA58
5.3 Performance Preditiva62
5.4 Criterios de Informacao64
5.5 Previsoes Usando Todos os Modelos67
5.6 Previsao Bayesiana68

i SUMARIO

6.1 Introducao73
6.2 Modelos ARCH74
6.3 Modelos GARCH80
6.3.1 Estimacao81
6.3.2 Adequacao82
6.4 Volatilidade Estocastica83

6 Modelando a Variancia 73

7.1 Introducao86
7.2 Modelos Polinomiais8
7.2.1 Analise Sequencial e Previsoes89
7.2.2 Variancias de Evolucao e das Observacoes91
7.3 Modelo de Crescimento Linear94
7.4 Modelos Sazonais95
7.4.1 Modelos sem Crescimento95
7.4.2 Modelos com Crescimento96
7.5 Representacao de Fourier96
7.6 Ilustracao97
7.7 Modelos de Regressao98
7.8 Monitoramento9

7 Modelos Lineares Dinamicos 86

A.1 Distribuicao Normal105
A.2 Distribuicao Gama105
A.3 Distribuicao Wishart106
A.4 Distribuicao Gama Inversa106
A.5 Distribuicao Wishart Invertida106
A.6 Distribuicao Beta106
A.7 Distribuicao de Dirichlet107
A.8 Distribuicao t de Student107
A.9 Distribuicao F de Fisher107
A.10 Distribuicao Binomial108
A.1 Distribuicao Multinomial108
A.12 Distribuicao de Poisson108

SUMARIO i References 110

Capıtulo 1 Introducao

Uma serie temporal e uma colecao de observacoes feitas sequencialmente ao longo do tempo. A caracterıstica mais importante deste tipo de dados e que as observacoes vizinhas sao dependentes e estamos interessados em analisar e modelar esta dependencia. Enquanto em modelos de regressao por exemplo a ordem das observacoes e irrelevante para a analise, em series temporais a ordem dos dados e crucial. Vale notar tambem que o tempo pode ser substituido por outra variavel como espaco, profundidade, etc.

Como a maior parte dos procedimentos estatısticos foi desenvolvida para analisar observacoes independentes o estudo de series temporais requer o uso de tecnicas especıficas. Dados de series temporais surgem em varios campos do conhecimento como Economia (precos diarios de acoes, taxa mensal de desemprego, producao industrial), Medicina (eletrocardiograma, eletroencefalograma), Epidemiologia (numero mensal de novos casos de meningite), Meteorologia (precipitacao pluviometrica, temperatura diaria, velocidade do vento), etc.

Algumas caracterısticas sao particulares a este tipo de dados, por exemplo,Observacoes correlacionadas sao mais difıceis de analisar e requerem tecnicas especıficas.Precisamos levar em conta a ordem temporal das observacoes.Fatores complicadores como presenca de tendencias e variacao sazonal ou cıclica podem ser difıceis de estimar ou remover.A selecao de modelos pode ser bastante complicada, e as ferramentas podem ser de difıcil interpretacao.

E mais difıcil de lidar com observacoes perdidas e dados discrepantes devido a natureza sequencial.

Terminologia

Uma serie temporal e dita ser contınua quando as observacoes sao feitas continuamente no tempo. Definindo o conjunto T = {t : t1 < t < t2} a serie temporal sera denotada

2 CAPITULO 1. INTRODUCAO por {X(t) : t ∈ T}. Uma serie temporal e dita ser discreta quando as observacoes sao feitas em tempos especıficos, geralmente equiespacados. Definindo o conjunto

T = {t1,...,tn} a serie temporal sera denotada por {Xt : t ∈ T}. Por simplicidade podemos fazer T = {1,2,...,n}.

Note que estes termos nao se referem a variavel observada X, esta pode assumir valores discretos ou contınuos. Em muitas situacoes X pode ser discreta por definicao (e.g. o numero de casos notificados de AIDS) porem para efeito de analise estatıstica pode ser tratada como continua se os seus valores observados nao forem muito pequenos.

Por outro lado, series temporais discretas podem surgir de varias formas. Series contınuas podem ser discretizadas, i.e. seus valores sao registrados a certos intervalos de tempo. Series de valores agregados ou acumulados em intervalos de tempo, por exemplo exportacoes medidas mensalmente ou quantidade de chuva medida diariamente. Finalmente, algumas series sao inerentemente discretas, por exemplo dividendos pagos por uma empresa aos seus acionistas em anos sucessivos.

Uma serie temporal tambem pode ser multivariada. Se k variaveis sao observadas a cada tempo (por exemplo discreto) denota-se por {X1t,...,Xkt,t ∈ T}. Neste caso varias series correlacionadas devem ser analisadas conjuntamente, ou seja em cada tempo tem-se um vetor de observacoes.

Objetivos

Em algumas situacoes o objetivo pode ser fazer previsoes de valores futuros enquanto em outras a estrutura da serie ou sua relacao com outras series pode ser o interesse principal. De um modo geral, os principais objetivos em se estudar series temporais podem ser os seguintes,Descricao. Descrever propriedades da serie, e.g. o padrao de tendencia, existencia de variacao sazonal ou cıclica, observacoes discrepantes (outliers), alteracoes estruturais (e.g. mudancas no padrao da tendencia ou da sazonalidade), etc.Explicacao. Usar a variacao em uma serie para explicar a variacao em outra serie.Predicao: predizer valores futuros com base em valores passados. Aqui assumese que o futuro envolve incerteza, ou seja as previsoes nao sao perfeitas. Porem devemos tentar reduzir os erros de previsao.Controle. Os valores da serie temporal medem a “qualidade” de um processo de manufatura e o objetivo e o controle do processo. Um exemplo e o controle estatıstico de qualidade aonde as observacoes sao representadas em cartas de controle. Este topico nao sera abordado nestas notas de aula.

3 AbordagensTecnicas Descritivas. Tecnicas graficos, identificacao de padroes, etc.Modelos Probabilısticos. Selecao, comparacao e adequacao de modelos, estima- cao, predicao. Ferramenta basica e a funcao de autocorrelacao.Analise espectral.Metodos nao parametricos (alisamento ou suavizacao).Outras Abordagens. Modelos de espaco de estados, modelos nao lineares, series multivariadas, estudos longitudinais, processos de longa dependencia, modelos para volatilidade, etc.

Sazonalidade

Muitas series temporais exibem um comportamento que tende a se repetir a cada s perıodos de tempo. Por exemplo, e natural esperar que as vendas mensais de brinquedos terao um pico no mes de dezembro e talvez um pico secundario em outubro. Este padrao possivelmente se repetira ao longo de varios anos. Vejamos alguns possıveis modelos sazonais,

1. Sazonalidade deterministica. Variaveis dummies (binarias). O coeficiente de cada variavel dummy representa o fator sazonal do respectivo mes, trimestre, etc.

2. Funcoes trigonometricas. 3. Sazonalidade estocastica:

(a) Variavel endogena com defasagem sazonal no modelo (modelos ARMA periodicos),

(b) modelo ARMA sazonal.

Tipos de SazonalidadeAditiva. A serie apresenta flutuacoes sazonais mais ou menos constantes nao importando o nıvel global da serie.Multiplicativa. O tamanho das flutuacoes sazonais varia dependendo do nıvel global da serie.

No exemplo dos brinquedos, suponha que o aumento esperado nas vendas nos meses de dezembro e de 1 milhao de reais em relacao a media anual. Entao as previsoes para os meses de dezembro dos proximos anos deve somar a quantia de 1 milhao de reais a uma media anual para levar em conta esta flutuacao sazonal. Isto e o que se chama de sazonalidade aditiva.

4 CAPITULO 1. INTRODUCAO

Suponha agora que o aumento esperado nos meses de dezembro seja de 30%.

Entao o aumento esperado (em valor absoluto) de vendas em dezembro sera pequeno ou grande dependendo da media anual de vendas ser baixa ou alta. Nas previsoes para os proximos meses de dezembro deve-se multiplicar a media anual pelo fator 1,3. Isto e o que se chama de sazonalidade multiplicativa.

Tendencia Globalmente, uma serie pode exibir tendencia de crescimento (ou decrescimento) com varios possıveis padroes.Crescimento linear. Por exemplo, a cada ano o aumento esperado nas vendas de um certo brinquedo e de 1 milhao de reais.Crescimento exponencial. Por exemplo, a cada ano as vendas de um certo brinquedo aumentam de um fator 1,3.Crescimento amortecido. Por exemplo, as vendas de um certo brinquedo tem uma aumento esperado de 70% sobre o ano anterior. Se o aumento esperado for de 1 milhao de reais no primeiro ano, no segundo ano sera de 700 mil reais, no terceiro ano sera de 490 mil reais e assim por diante.

Exemplos de Series Temporais

Como primeira ilustracao sao apresentadas na Figura 1.1 quatro series temporais disponıveis no pacote R. Nos eixos horizontais aparecem os anos de observacao e nos eixos verticais os nomes das series (mesmos nomes do R). A Figura 1.1a mostra totais mensais de passageiros em linhas aereas internacionais nos EUA entre 1949 e 1960. Existe uma clara tendencia de crescimento bem como um padrao sazonal ao longo dos anos. A Figura 1.1b mostra a serie com o numero anual de linces capturados em armadilhas entre 1821 e 1934 no Canada. Existe um padrao cıclico em torno de 10 ou 1 anos. A Figura 1.1c mostra a serie com as medicoes anuais de vazoes do Rio Nilo em Ashwan entre 1871 e 1970. Parece haver alguma alteracao estrutural em torno do ano de 1900. Finalmente a Figura 1.1d mostra a serie trimestral do consumo de gas no Reino Unido entre o primeiro trimestre de 1960 e o quarto trimestre de 1986. Ha uma tendencia de crescimento porem a amplitude do padrao sazonal aumenta bastante a partir de 1971.

Exercıcios

1. Classifique as seguintes series temporais quanto ao tempo e quanto a variavel observada.

(a) Registros de mare durante 1 dia. (b) Medidas de temperatura em uma estacao meteorologica.

AirPassengers

500 lynx

Nile

UKgas

Figura 1.1: (a) Totais mensais de passageiros em linhas aereas internacionais nos EUA entre 1949 e 1960, (b) numero anual de linces capturados em armadilhas entre 1821 e 1934 no Canada, (c) medicoes anuais de vazoes do Rio Nilo em Ashwan entre 1871 e 1970, (d) consumo de gas no Reino Unido entre o primeiro trimestre de 1960 e o quarto trimestre de 1986.

(c) O ındice diario da bolsa de valores de Sao Paulo. (d) A inflacao mensal medida pelo ındice de precos ao consumidor.

(e) Variacao diaria de um determinado ındice financeiro, 1 para variacao positiva, -1 para variacao negativa ou zero se nao ocorreu variacao.

(f) Numero mensal de novos casos de Dengue em uma determinada regiao.

2. De exemplos de series temporais continuas que poderiam ser discretizadas (e de que forma).

Capıtulo 2 Tecnicas Descritivas

Ao se analisar uma ou mais series temporais a representacao grafica dos dados sequencialmente ao longo do tempo e fundamental e pode revelar padroes de comportamento importantes. Tendencias de crescimento (ou decrescimento), padroes cıclicos, alteracoes estruturais, observacoes aberrantes, etc. sao muitas vezes facilmente identificados. Sendo assim, o grafico temporal deve ser sempre o primeiro passo e antecede qualquer analise. Outras ferramentas serao descritas ao longo deste capıtulo.

2.1 Decomposicao Classica

Muitas das propriedades observadas em uma serie temporal Xt podem ser captadas assumindo-se a seguinte forma de decomposicao

Xt = Tt +Ct +Rt onde Tt e uma componente de tendencia, Ct e uma componente cıclica ou sazonal e

Rt e uma componente aleatoria ou ruıdo (a parte nao explicada, que espera-se ser puramente aleatoria). A componente cıclica se repete a cada intervalo fixo s, i.e.

· = Ct−2s = Ct−s = Ct = Ct+s = Ct+2s =

Assim, variacoes periodicas podem ser captadas por esta componente.

2.2 Series com Tendencia

Nao existe uma definicao precisa de tendencia e diferentes autores usam este termo de diferentes formas. Podemos pensar em tendencia como uma mudanca de longo prazo no nıvel medio da serie. A dificuldade aqui e definir longo prazo. A forma mais simples de tendencia e onde α e β sao constantes a serem estimadas e ǫt denota um erro aleatorio com media zero. O nıvel medio da serie no tempo t e dado por mt = α+βt que e algumas vezes

2.2. SERIES COM TENDENCIA 7 chamado de termo de tendencia. Porem alguns autores preferem chamar a inclinacao β de tendencia, ou seja a mudanca no nıvel da serie por unidade de tempo ja que β = mt − mt−1. Note que a tendencia na equacao (2.1) e uma funcao determinıstica do tempo e algumas vezes e chamada de tendencia global (i.e. vale para toda a serie), em oposicao a tendencia local.

De um modo geral, uma forma de se lidar com dados nao sazonais que contenham uma tendencia consiste em ajustar uma funcao polinomial,

Uma funcao linear ou quadratica seria apropriada no caso de uma tendencia monotonicamente crescente ou decrescente. Caso contrario polinomios de ordem mais alta devem ser ajustados.

Outras possıveis formas de tendencia sao os crescimentos descritos por uma curva Gompertz, logxt = a + brt onde a, b e r sao parametros com 0 < r < 1, ou uma curva Logıstica, onde a, b e c sao parametros. Estas duas ultimas sao chamadas curvas S e se aproximam de uma assıntota quando t → ∞. Neste caso o ajuste pode levar a equacoes nao lineares.

Seja qual for a curva utilizada, a funcao ajustada fornece uma medida da tendencia da serie, enquanto os resıduos (valores observados – valores ajustados) fornecem uma estimativa de flutuacoes locais.

Exemplo 2.1: A Figura 2.1 mostra as medicoes anuais de vazoes do Rio Nilo em Ashwan entre 1871 e 1970 juntamente com polinomios de graus 3 e 6 superimpostos. Os polinomios foram ajustados por mınimos quadrados usando os comandos do R a seguir. A serie original com as tendencias estimadas aparecem na Figura (2.1).

> mypolytrend = function(y, degree = 1) { + n = length(y)

+ X = matrix(NA, n, degree)

+ return(ts(out, start = start(y), freq = frequency(y)))

8 CAPITULO 2. TECNICAS DESCRITIVAS

Vazoes observado tendencia grau 3 tendencia grau 6

Figura 2.1: Medicoes anuais de vazoes do Rio Nilo em Ashwan entre 1871 e 1970 (pontos), com polinomios de graus 3 e 6 ajustados por minimos quadrados.

Regressao Local

A ideia aqui e estimar para cada t uma equacao de regressao polinomial diferente, por exemplo

Note que as estimativas de α e β dependem do tempo o que da o carater local das retas de regressao.

O procedimento conhecido como loess e um procedimento iterativo que a cada passo aplica a regressao local anterior, calcula os resıduos xt − xt e aplica novamente a regressao local dando peso menor as observacoes com resısuos maiores. Este proce- dimento se repete ate atingir convergencia.

Exemplo 2.2: A Figura 2.2 apresenta os mesmos dados da Figura 2.1 sendo que as curvas superimpostas foram obtidas usando regressao local com os comandos do R a seguir.

2.2. SERIES COM TENDENCIA 9

Vazoes observado tendencia f=1 tendencia f=0.25

Figura 2.2: Medicoes anuais de vazoes do Rio Nilo em Ashwan entre 1871 e 1970 (pontos), tendencia estimada via funcao lowess.

Filtragem

Outro procedimento para analisar series com tendencia e atraves de filtros lineares.

Um filtro linear converte uma serie {xt} em outra {yt} atraves da seguinte operacao linear

j=−q ajxt+j onde {aj} e um conjunto de pesos. Alem disso, como queremos estimar a media local os pesos devem ser tais que ∑s j=−q aj = 1, garantindo assim que min{xt} < yt < max{xt}. Neste caso a operacao e chamada media movel.

Medias moveis sao em geral simetricas com s = q e a−r = ar. Por exemplo, se s = q = 2 temos que

O caso mais simples e quando todos os pesos aj tem o mesmo valor e devido a restricao de soma 1 segue que aj = 1/(2q+1), para j = −q,...,q. Neste caso, o valor suavizado

10 CAPITULO 2. TECNICAS DESCRITIVAS de xt e dado por

Qualquer que seja o filtro utilizado, yt e uma estimativa da tendencia no tempo t e xt − yt e uma serie livre de tendencia.

Exemplo 2.3: A Figura 2.3 apresenta a serie com os totais mensais de passageiros de linhas aereas internacionais nos EUA, entre 1949 e 1960 (Box, Jenkins and Reinsel, 1976) juntamente com a tendencia “estimada” superimposta. Foram aplicados filtros lineares com medias moveis aproximadamente trimestrais (q = 2) e medias moveis aproximadamente anuais (q = 5). Os seguintes comandos do R foram usados.

Anos

Numero de passageiros (em milhares) dados Media Movel q=2 Media Movel q=5

Figura 2.3: Totais mensais de passageiros de linhas aereas internacionais nos EUA, com a tendencia superimposta aplicando medias moveis aproximadamente trimestrais (q = 2) e medias moveis aproximadamente anuais (q = 5).

(Parte 1 de 5)

Comentários