( PDF ) Estudos de modelos ARIMA com variáveis angulares para utilização na perfuração de poços de Petróleo

Download PDF

ads:

Universidade Federal de Campina Grande

Centro de Ciências e Teconologia

Programa de Pós-Graduação em Matemática

Curso de Mestrado em Matemática

Estudo de Modelos ARIMA com

Variáveis Angulares para Utilização

na Perfuração de Poços Petrolíferos

por

Areli Mesquita da Silva

sob orientação do

Prof. Dr. Francisco Antônio Morais de Souza

Dissertação apresentada ao Corpo Docente do Programa

de Pós-Graduação em Matemática - CCT - UFCG, como

requisito parcial para obtenção do título de Mestre em

Matemática.

Campina Grande - PB

Julho/2007

ads:

Livros Grátis

http://www.livrosgratis.com.br

Milhares de livros grátis para download.

Estudo de Modelos ARIMA com

Variáveis Angulares para Utilização

na Perfuração de Poços Petrolíferos

por

Areli Mesquita da Silva

Dissertação apresentada ao Corpo Docente do Programa de Pós-Graduação em

Matemática - CCT - UFCG, como requisito parcial para obtenção do título de Mestre

em Matemática.

Área de Concentração: Probabilidade e Estatística

Aprovada por:

Prof. Dr. André Gustavo Campos Pereira

Prof. Dr. Antonio José da Silva

Prof. Dr. Francisco Antônio Morais de Souza

Orientador

Universidade Federal de Campina Grande

Centro de Ciências e Tecnologia

Programa de Pós-Graduação em Matemática

Curso de Mestrado em Matemática

Julho/2007

ads:

Agradecimentos

A Deus p o r mais essa dádiva em minha vida!

A meus pais, Eri e Manoel, pelo investimento e incentivo dados em todos os

momentos.

A Fúlvio (Vinho) pelo apoio, companheirismo e por sempre procurar deixar meu

ego nas alturas!

Ao meu orientador, professor Francisco Antônio Morais de Souza, por todos os

ensinamentos, pacientemente, compartilhados, sem os quais, teria sido inviável desen-

volver este trabalho.

À ANP (Agência Nacional do Petróleo, Gás e Biocombustíveis) e aos demais

orgãos ﬁnanciadores pela concessão da bolsa.

Aos professores André Gustavo Campos Pereira e Antonio José da Silva por terem

aceito participar da banca.

Ao professor Brandão por suas brilhantes sugestões (veja como o Apêndice B

ﬁcou lindo!).

A todos os professores de graduação e pós-graduação da UAME/UFCG que es-

tiveram sempre na torcida!

A todos os funcionários da UAME/UFCG que nunca economizam esforços na

hora de ajudar!

A Joelma (Joca) por acreditar que, um dia, daria tudo certo...(nunca esquecerei

da pergunta: E a integral?).

A Cris, Grayci (minhas irmãs acadêmicas), a Rosângela (Rosinha), Tatiana (Chaty),

Juliana, Jacqueline, Hallyson, Jesualdo (Nash), Josea ne, Leomaques,..., pelo carinho e

convivência.

A todos que, com simples gestos, contribuíram para que este trabalho foss e con-

cluído.

Dedicatória

A minha família.

“A grandeza de um ser humano não está no quanto ele

sabe, mas no quanto ele tem consciência que não sabe. O

destino não é freqüentemente inevitável, mas uma ques-

tão de escolha. Quem faz escolha, escreve sua própria

história, constrói seus próprios caminhos.”

Augusto Cury

Resumo

Séries temporais envolvendo dados angulares aparecem nas mais diversas áreas

do conhecimento. Por exemplo, na perfuração de um poço petrolífero direcional, o

deslocamento da broca de perfuração, ao longo da trajetória do poço, pode ser consi-

derado uma realização de uma série temporal de dados angulares. Um dos interesses,

neste contexto, consiste em realizar previsões de posicionamentos futuros da broca de

perfuração, as quais darão mais apoio ao engenheiro de petróleo na tomada de deci-

são de quando e como interferir na trajetória de um poço, de modo que este siga o

curso planejado. Neste trabalho, estudamos algumas classes de modelos que podem

ser utilizados para a modelagem desse tipo de série.

Abstract

Time series involving angular data appear in many diverse areas of scientiﬁc

knowledge. For example, in the drilling of a directional oil well, the displacement of

the drill, along the path of the well, can b e considered a s an a ngular data time series.

One of the objectives, in this context, consists in carrying out forecasts of the future

positions of the drill, which will give more support to the petroleum engineer in the

decision-making of when and how interfere in the path of a well, so that this follows

the planned course. In this work, we study some classes of models that can be utilized

for the modeling of that kind of series.

Sumário

Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1 Quantiﬁcação de Incertezas de Subsuperfície 4

1.1 Incertezas de Subsup erfície . . . . . . . . . . . . . . . . . . . . . . . . . 5

1.2 Impacto de Incertezas Dinâmicas sobre um Prog rama de Perfuração . . 6

1.3 Justiﬁcativa da Aquisição de Dados Complementares . . . . . . . . . . 7

2 Séries Temporais 9

2.1 Modelos Lineares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

2.1.1 Modelos Auto-Regressivos . . . . . . . . . . . . . . . . . . . . . 16

2.1.2 Modelos de Médias Móveis . . . . . . . . . . . . . . . . . . . . . 18

2.1.3 Modelos Auto-Regressivos e de Médias Móveis . . . . . . . . . . 19

2.1.4 Modelos Auto-Regressivos Integrados e de Médias Móveis . . . . 20

2.2 A Função de Autocorrelação Parcial . . . . . . . . . . . . . . . . . . . . 22

2.3 Alguns Casos Particulares de Modelos Lineares . . . . . . . . . . . . . 24

2.3.1 Modelo Auto-Regressivo de Ordem 1 - AR(1) . . . . . . . . . . 24

2.3.2 Modelo Auto-Regressivo de Ordem 2 - AR(2) . . . . . . . . . . 24

2.3.3 Modelo de Médias Móveis de Ordem 1 - MA(1) . . . . . . . . . 26

2.3.4 Modelo de Médias Móveis de Ordem 2 - MA(2) . . . . . . . . . 26

2.3.5 Modelo Auto-Regressivo e de Médias Móveis de Ordem (1,1) -

ARMA(1,1) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

2.4 Identiﬁcação de Modelos ARIMA . . . . . . . . . . . . . . . . . . . . . 29

2.4.1 Procedimentos de Identiﬁcação . . . . . . . . . . . . . . . . . . 29

2.4.2 Estimativas Preliminares . . . . . . . . . . . . . . . . . . . . . . 34

2.5 Estimação de Modelos ARIMA . . . . . . . . . . . . . . . . . . . . . . 35

2.5.1 Método dos Momentos . . . . . . . . . . . . . . . . . . . . . . . 35

2.5.2 Método de Máxima Verossimilhança . . . . . . . . . . . . . . . 37

2.5.3 Variância dos Estimadores . . . . . . . . . . . . . . . . . . . . . 40

2.6 Diagnóstico de Modelos ARIMA . . . . . . . . . . . . . . . . . . . . . . 41

2.6.1 Teste de Autocorrelação Residual . . . . . . . . . . . . . . . . . 41

2.6.2 Teste de Box-Pierce . . . . . . . . . . . . . . . . . . . . . . . . . 42

2.6.3 Teste da Autocorrelação Cruzada . . . . . . . . . . . . . . . . . 42

2.7 Previsão com Modelos ARIMA . . . . . . . . . . . . . . . . . . . . . . 43

2.7.1 Previsão de Erro Quadrático Médio (EQM) mínimo . . . . . . . 44

2.7.2 Formas Básicas de Previsão . . . . . . . . . . . . . . . . . . . . 45

2.7.3 Equação de Previsão . . . . . . . . . . . . . . . . . . . . . . . . 46

2.7.4 Atualização das Previsões . . . . . . . . . . . . . . . . . . . . . 47

2.7.5 Intervalos de Conﬁança . . . . . . . . . . . . . . . . . . . . . . . 47

3 Séries Temporais Envolvendo Dados Angulares 49

3.1 Modelos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

3.1.1 Processo Gaussiano Transformado . . . . . . . . . . . . . . . . . 50

3.1.2 Processo Arqueado . . . . . . . . . . . . . . . . . . . . . . . . . 51

3.1.3 Processos Baseados em Funções de Ligação . . . . . . . . . . . . 52

3.2 Seleção do Modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

3.3 Identiﬁcação do Modelo . . . . . . . . . . . . . . . . . . . . . . . . . . 54

3.4 Ajuste do Modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

3.4.1 Modelo Gaussiano Arqueado . . . . . . . . . . . . . . . . . . . . 55

3.4.2 Modelo Gaussiano Transformado . . . . . . . . . . . . . . . . . 56

3.4.3 Modelos com Ligação Direta e Inversa . . . . . . . . . . . . . . 57

Conclusão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

Apêndices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

A Demonstração da Desiguadade (3.1) 59

A.1 Resultados Utilizados . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

A.2 Demostração da Desigualdade (3.1) . . . . . . . . . . . . . . . . . . . . 59

iii

B Demonstração do Teorema (3.1) 61

B.1 Deﬁnições . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61

B.2 Propriedades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62

B.3 Demonstração do Teorema (3.1) . . . . . . . . . . . . . . . . . . . . . . 62

Bibliograﬁa 71

Introdução

A perfuração de poços direcionais na indústria de petróleo, é uma técnica utilizada

de forma cada vez mais freqüente, tanto para atingir formaçõ es produtoras situadas

abaixo de locaçõ es verticalmente inacessíveis, como também para perfurar vários poços

a partir de um mesmo ponto [Thomas, 2001]. Sua utilização se dá, em particular, em

poços oﬀshore.

A primeira etapa no projeto de um poço direcional é determinar o tipo de tra-

jetória a ser seguida para se atingir o alvo desejado, que pode ser uma formação com

acúmulo de hidrocarbonetos. Nessa etapa são levados em consideração os seguintes

elementos:

- A profundidade do(s) ponto(s) de mudança de trajetória;

- O afastamento horizontal;

- A direção/locação do objetivo;

- A profundidade vertical ﬁnal do poço;

- As inclinações dos diversos trechos.

A mudança de orientação da trajetória do poço é uma operação dispendiosa que

envolve a retirada da coluna de perfuração e a introdução de uma ferramenta especial

contendo um motor de fundo [Lima], que tem a ﬁnalidade de iniciar a deﬂexão do poço e

orientá-lo para a direção desejada. Feita a deﬂexão, a ferramenta com o motor de fundo

é retirada e retorna-se com a coluna normal de perfuração, continuando até um próximo

desvio ou até atingir o alvo desejado (formação com acúmulo de hidrocarbonetos).

Sob o ponto de vista operacional, em cada mudança da direção do poço, a sua

nova orientação é feita a partir de informações obtidas em superfície, sobre a inclinação

e direção do poço [Thomas, 2001]. Essas informações podem ser enviadas pelo ﬂuido

de perfuração ou através de um cabo elétrico e são registradas de forma contínua e

instantânea (no caso do cabo elétrico). É com base nessas informações que o engenheiro

de petróleo toma a decisão sobre interferências na trajetória do poço.

O deslocamento da broca de perfuração, ao longo da trajetória do poço, pode

ser visto como uma realização de uma série temp oral, onde a componente aleatória

corresponde à posição real da broca em cada momento. Por mais controle que se tenha

do processo, essa posição não é determinística, isto é, po de ser vista como uma variável

aleatória seguindo uma determinada distribuição de probabilidade.

Uma série temporal consiste de um co njunto de observações ordenadas no tempo

[Morettin e Toloi, 2004]. São exemplos de séries temporais:

- Cotações diárias do barril de petróleo;

- Índice de poluição de uma região produtora de petróleo;

- Registros de marés em um porto marítimo;

- Preços diários das ações de uma empresa de petróleo, por exemplo, a Petrobras.

Em geral, na análise de uma série temporal, estamos interessados em:

- Investigar o mecanismo gerador dessa série;

- Fazer previsões para va lores futuros da série;

- Procurar periodicidade relevantes nos dados.

Considerando essa abordagem do poço direcional como uma série temporal, o

nosso interesse consiste em estudar modelos adequados para fazer previsões de posi-

cionamentos futuros da broca, ou seja, previsões sobre a inclinação e direção do poço.

Essas previsões podem ser feitas a partir dos registros obtidos contínua e instantanea-

mente, além da litologia da rocha atravessada pelo próprio poço ou das litologias das

rochas atravessadas por outros poços do campo em desenvolvimento.

Como proposta de modelo para fazer as previsões, temos o modelo ARIMA (Auto-

Regressivo Integrado e de Médias Móveis), dada a sua ampla divulgação e utilização

[Morettin e Toloi, 2004].

Estatisticamente falando, estamos tratando de uma modelagem através de um

modelo ARIMA, aplicada à inclinação e direção de um poço direcional. O desaﬁo

e a contribuição desse trabalho co nsiste na utilização de uma variável a ngular como

variável resposta, uma vez que na literatura são utilizadas variáveis lineares.

No Capítulo 1, discutimos sobre a quantiﬁcação de incertezas de subsuperfície,

bem como o impacto dessas incertezas sobre um programa de perfuração de poços

petrolíferos.

No Capítulo 2, apresentamos um estudo sobre séries temporais, enfatizando a

classe de modelos Auto-Regressivos Integrados e de Médias Móveis (ARIMA), utiliza-

dos para descrição, interpretação e previsão de séries temporais.

Dedicamos o Capítulo 3 a análise de séries temporais envolvendo dados circulares,

já que a variável de interesse é a posição da broca ao longo da trajetória de um poço

petrolífero.

Nos Apêndices, recordamos algumas deﬁnições e enunciamos os principais resul-

tados utilizados nas demonstrações.

Capítulo 1

Quantiﬁcação de Incertezas de

Subsuperfície

A modelagem de reservatórios é uma tarefa bastante árdua, devido à complexida-

de física envolvida na predição do escoamento e à diﬁculdade de se obter dados para a

modelagem [Charles et al., 2001]. Com isso, as atividades relacionadas à predição dos

parâmetros de interesse econômico, tais como: o volume total da rocha, a localização

do óleo, perﬁs de produção e estimativas de reservas, são de difícil realização.

Os responsáveis por tomadas de decisão devem realizar uma quantiﬁcação siste-

mática dos riscos técnicos associados a qualquer desenvolvimento recente. Além disso,

uma quantiﬁcação do impacto das diversas incertezas de subsuperfície (estruturais,

geológicas e dinâmicas) sobre os parâmetros de interesse econômico, pode auxiliar a

justiﬁcar a aquisição e processamento de mais dados e, com isso, reduzir a incerteza

inerente ao processo de tomada de decisão.

A seguir, discutiremos o valor da quantiﬁcação de incertezas de subsuperfície

no processo de tomada de decisões de investimentos, apresentaremos uma experiência

relativa ao impacto das incertezas dinâmicas sobre o programa de perfuração e, por

ﬁm, veremos como utilizar a quantiﬁcação de incertezas estruturais para justiﬁcar a

aquisição de dados complementares.

1.1 Incertezas de Subsuperfície

Atualmente, existem ferramentas para a co nstrução de modelos geológico s 3D

e para a quantiﬁcação de incertezas sobre os parâmetros associados a esses modelos

[Charles et al., 2001]. Tais ferramentas têm facilitado a co mpreensão do impacto de

cada uma da s incertezas de subsuperfície sobre o campo de produção. Por exemplo,

existe uma cadeia de ferramentas desenvolvidas para lidar com a quantiﬁcação de

incertezas de subsuperfície cujo suporte é constituído po r três softwares principais, a

saber, ALEA, JACT A

T M

e EST.

A partir de mapas de incerteza produzidos por intérpretes sísmicos, o ALEA si-

mula diversos modelos estruturais do reservatório, calcula os correspondentes volumes

totais de rochas, além de exportar estas superfícies para o JACT A

T M

. Com isso,

é possível quantiﬁcar o impacto das incertezas oriundas, por exemplo, da conversão

tempo-profundidade sobre as incertezas associadas ao volume total da ro cha.

Após identiﬁcar os parâmetros que afetam as propriedades do reservatório, pode-

se simular diversos modelos geológicos de reservatórios, bem como calcular seus res-

pectivos volumes.

O software JACT A

T M

realiza uma combinação entre ambientes deposicionais,

tipos de rochas e simulações de parâmetros petrofísicos e permite que as incertezas que

afetam os parâmetros geo e statísticos sejam incorporadas. As realizações resultantes

podem ser visualizadas em 3D, analisadas e exp ortadas para um simulador de ﬂuxo.

O software EST possibilita a simulaçã o de ﬂuxo para cada realização geoestatís-

tica proveniente do JACT A

T M

, no entanto, estas simulações podem ser muito dispen-

diosas e incompletas, já que o ALEA e o JACT A

T M

consideram apenas as incertezas

estáticas (estruturais e geológicas), não levando em conta as incertezas dinâmicas, tais

como: permeabilidade relativa, transmissividade defeituosa, ou qualquer parâmetro

de ﬂuxo. Assim, para minimizar a quantidade de operações de simulação de ﬂuxo,

é necessário utilizar ferramentas e métodos para incorporar incertezas dinâmicas na

quantiﬁcação de incertezas associadas a perﬁs de produção ou a estimativas de reser-

vas.

Após identiﬁcar as principais incertezas de subsuperfície, pode-se utilizar os três

softwares ALEA, JACT A

T M

e EST para transformar essas incertezas de subsuperfície

em incertezas dos parâmetros de interesse, durante o proc esso de tomada de decisão.

Lembrando que a qualidade do resultado dependerá da conﬁabilidade das incertezas

de subsuperfície.

1.2 Impacto d e Incertezas Dinâmicas sobre um Pro-

grama de Perfuração

A seguir descreveremos uma experiência, relatada em [Charles et al., 2001], que

foi realizada em dois campos petrolíferos, denotados por campo X e campo Y (por

motivos relacionados a sigilo).

Um determinado campo X, desenvolvido recentemente, possui um campo satélite

Y, ambos de alta pressão e temperatura e separados por uma falha principal e por

uma falha tectônica contendo um ﬂuido desconhecido. A produção do campo X pode

reduzir o volume de ﬂuidos do campo Y. Tal redução precisa ser quantiﬁcada, já que

é impossível perfurar qualquer poço após uma depleção de 100 barris. Surge, então,

um questionamento: após o início da produção do campo X, por quanto tempo o

desenvolvimento do campo Y pode ser adiado?

Há duas alternativas para o desenvolvimentto do campo Y: ou a realização de

uma perfuração vertical a partir de uma nova plataforma ou uma perfuração direcional

a partir de uma plataforma já existente no campo X.

Como o interesse é modelar apenas a depleção, basta considerar somente as incer-

tezas dinâmicas, ou seja , não é necessário fazer uma representação das heterogeneidades

ou estruturas do campo Y.

Com a utilização de um modelo de simulação de ﬂuxo, construído pelo operador,

foi possível realizar as seguintes atividades:

1 - Deﬁnição da variável resposta: depleção média em todas as camadas do campo

2 - Identiﬁcação dos principais parâmetros de incerteza: valor da permeabilidade

absoluta da falha tectônica e do aqüífero; permeabilidade relativa; tamanho do

aqüífero a oeste; variação de porosidade dentro do aqüífero a norte; principais

falhas de transmissividade; faixas de permeabilidade no reservatório; anisotropia

vertical e ﬂuido acumulado na falha tectônica;

3 - Identiﬁcação da ordem de incerteza dos parâmetros selecionados;

4 - Estimação da função densidade de probabilidade (fdp) associada a cada parâme-

tro (tratado como variável aleatória);

5 - Utilização da metodologia experimental para identiﬁcar os parâmetros de im-

pacto mais signiﬁcativo na depleção. Os únicos parâmetros que interferiram na

depleção foram: a permeabilidade relativa, o ﬂuido acumulado na falha tectô-

nica e a transmissividade defeituosa. A partir da simulação da variável resposta,

construiu-se uma superfície resposta como função dos valores assumidos por esses

três parâmetros;

6 - Realização de uma simulação Monte Carlo utilizando, tanto as fdp’s associadas

aos parâmetros, como o modelo analítico da superfície de resposta, fornecendo

perﬁs de prováveis depleções.

Para cada uma das hipóteses (distribuição triangular da transmissividade defei-

tuosa e falha de escoa mento) foi construído um perﬁl de depleção. No primeiro caso,

ocorreu uma depleção de 100 barris, após 1,7 ano de produção no campo X, enquanto

que, no segundo caso, o tempo de depleção foi de 1,2 ano.

Com base no cenário mais pessimista, decidiu-se desenvolver o campo Y, a partir

de uma plataforma já existente no campo X. Associado a esta decisão, admitiu-se um

risco de 5% (após 1,3 ano de produção do campo X).

1.3 Justiﬁcativa da Aquisição de Dados Complemen-

tares

A partir da interpretação de dados sísmicos 2D migrados no tempo e de 50 poços

disponíveis em um campo maduro, construíram-se mapas de profundidade do nível do

reservatório [Charles et al., 2001]. Esses mapas facilitaram a estimativa do possível

volume total da rocha e a compreensão dos parâmetros de maior incerteza, tornando

possível justiﬁcar uma aquisição de dados sísmicos e deﬁnir um processamento mais

ajustado.

Os parâmetros de incerteza mais sig niﬁcativos foram registrados e ordenados da

seguinte maneira:

- Campo de velocidade utilizado para a migração sísmica no tempo;

- Interpolação de dados sísmicos 2D e valores de poços;

- Conversão tempo-profundidade;

- OWC (ponto de contato água-óleo).

A combinação de todas estas incertezas gerou um intervalo de conﬁança em torno

da profundidade do topo do reservatório. Além disso, a simulação de 200 mapas de

possíveis profundidades em torno do mapa base, e dentro do interva lo de conﬁança,

resultou numa série de possíveis valores para o volume total da rocha. Porém, para

melhor estimar o potencial deste campo, as duas maiores incertezas deveriam ser re-

duzidas.

Portanto, mesmo quando se trata de um campo maduro com muitos poços, as

incertezas geométricas podem inﬂuenciar no volume total da rocha. Assim, os parâ-

metros a ser melhorados precisam ser identiﬁcados, a ﬁm de reduzir essas incertezas.

Recomenda-se, também, a aquisição de dados sísmicos 3D e que esses tais dados sejam

processados utilizando-se uma migração de profundidade melhor do que uma migração

de tempo clássica.

Capítulo 2

Séries Temporais

Uma série temporal pode ser vista como um conjunto de observações Z

, geradas

sequencialmente no tempo [Box e Jenkins, 1976]. Fazemos referência ao parâmetro t

como sendo o tempo, mas a série Z

poderá ser função de algum outro parâmetro fí-

sico, como espaço , volume, profundidade, etc. Se o conjunto de instantes de tempo for

discreto (enumerável) ou não-enumerável, a série será discreta ou contínua, respectiva-

mente. De um modo mais formal, uma série temporal é uma realização ou trajetória

de um pro ce sso estocástico.

Um processo estocástico é uma família de variáveis aleatórias {Z

; t ∈ T } deﬁnidas

num mesmo espaço de probabilidades. Ou seja, para cada t ∈ T , Z

é uma variável

aleatória deﬁnida sobre o espaço amostral Ω. Portanto, Z

é uma função de dois

argumentos, Z(t, w), onde t ∈ T e w ∈ Ω.

Na Figura 2.1, podemo s observar que, para cada t ∈ T , Z(t, w) é uma variável

aleatória com uma distribuição de probabilidade. Por outro lado, para cada w ∈ Ω

ﬁxado, obtemos uma função do tempo, ou seja, uma realização do processo.

São exemplos de séries temporais:

1- Valores diários de poluição numa região produtora de petróleo;

2- Preços diários das ações de uma empresa de petróleo;

3- Cotações diária s do barril de petróleo;

4- Rendimento anual per capita;

Figura 2.1: Processo estocástico como uma família de variáveis aleatórias.

5- Inﬂação mensal de uma determinada cidade;

6- Intensidade da corrente elétrica num dado ponto;

7- Intensidade do som num determinado local;

8- Registro de marés em um porto marítimo;

As séries 1 a 5 são discretas, enquanto que, as séries 6 a 8 são contínuas.

Os principais objetivos da análise de uma série temporal são

- Investigar o mecanismo gerador dessa série;

- Descrever o comportamento da série;

- Procurar periodicidades relevantes nos dados;

- Realizar previsões de valores futuros da série.

Para atingir esses objetivos, lançamos mão de modelos estocásticos (ou proba-

bilísticos). Uma classe importante de modelos estocásticos para descrição de séries

temporais é a dos modelos estacionários, que são baseados na hipótese de que o pro-

cesso permanece em equilíbrio em torno de um nível médio consta nte. Em outras

palavras, o processo evolui no tempo de modo que a escolha de uma origem dos tem-

pos não é importante, ou seja, as características de Z

t+k

, para todo k, são as mesmas

de Z

[Morettin e Toloi, 2004]. Desta forma, a média µ(t) e a variância V (t) de Z

são

constantes para todo t ∈ T , ou seja,

µ(t) = E[Z

] = µ e V (t) = Var[Z

] = E[(Z

− µ)

] = σ

A covariância entre Z

e Z

t+k

, é denominada função de autocovariância (facv), e

é deﬁnida por

= Cov[Z

, Z

t+k

] = E[(Z

− µ)(Z

t+k

− µ)].

Pela própria deﬁnição de γ

, temos que γ

= Var[Z

] = σ

e, sendo o processo

estacionário, |γ

| → 0 quando k → ∞. Este comportamento pode ser observado na

Figura 2.2.

Figura 2.2: Representação da função de auto covariância.

Como a facv pode ser sensíve l às unidades em que são medidas as observações, é

comum utilizarmos a função de autocorrelação (fac), dada por

Cov[Z

, Z

t+k

]



Var[Z

]Var[Z

t+k

])

, k ∈ T.

Se o processo for estacionário, então a variância σ

= γ

é a mesma, tanto no

tempo t + k co mo em t. Assim,

, k ∈ T.

Observe que a fac é simétrica em torno do zero e ρ

= ρ

−k

, para todo k. A Figura

2.3 mostra a fac como um gráﬁco dos valores localizados nas diagonais da matriz de

autocorrelação.

Figura 2.3: Uma matriz de autocorrelação e a fac corresp ond ente.

A fac ρ

pode ser estimada através da expressão:

onde

N−k



t=1

− Z)(Z

t+k

− Z) , k = 0, 1, ..., N − 1

é a estimativa da função de autocovariância γ

e Z é a média amostral da série temporal.

Para que seja viável descrever uma série temp o ral através de modelos estacioná-

rios, devemos supor que tal série é estacionária. No entanto, na prática, a maioria das

séries que encontramos apresentam algum tipo de não-estacionariedade, por exemplo,

existem séries não-estacionárias quanto ao nível e outras quanto ao nível e à inclinação,

como mostram as Figuras 2.4 e 2.5. Outro tipo de não-estacionariedade é a explosiva,

que surge em séries que representam o crescimento de uma colônia de bactérias, por

exemplo.

Figura 2.4: Representação de uma série não-estacionária quanto ao nível.

Figura 2.5: Representação de uma série não-estacionária quanto ao nível e à inclinação.

Mais adiante abordaremos a classe de modelos ARIMA, que será útil para des-

crever de maneira satisfatória séries estacionárias e séries não-estacionárias que não

apresentam comportamento explosivo.

A ﬁm de facilitar a manipulação dos modelos abo rdados mais adiante, utilizare-

mos o operador translação para o passa do, denotado por B e deﬁnido por

= Z

t−1

= Z

t−m

, 2 ≤ m < t.

Mesmo quando uma série é não-estacionária, podemos transformar os dado s ori-

ginais, a ﬁm de tentar obter uma série estacionária. O procedimento mais utilizado

consiste em diferenciar sucessivamente a série original, até se obter uma série estacio-

nária. Diferenciar, aqui, signiﬁca considerar diferenças sucessivas da série original.

A primeira diferença de Z

é deﬁnida por

∆Z

= Z

− Z

t−1

= Z

− BZ

= (1 − B)Z

onde B é o operador translação para o passado.

A segunda diferença é

∆

= ∆[∆Z

] = ∆[Z

− Z

t−1

] = Z

− 2Z

t−1

+ Z

t−2

= (1 − 2B + B

= (1 − B)

A n-ésima diferença de Z

é deﬁnida por

∆

= ∆[∆

n−1

] .

Em geral, pode-se considerar vários modelos diferentes para descrever o com-

portamento de uma série. No entanto, devemos utilizar critérios de comparaçã o en-

tre eles, a ﬁm de escolher o modelo mais parcimonioso, ou seja, aquele com uma

quantidade mínima de parâmetros e que forneça previsões bastante precisas. A es-

colha do modelo a dequado baseia-se num ciclo iterativo do método de Box e Jenkins

[Morettin e Toloi, 2004], cujas etapas consistem em:

1- Fazer uma descrição da série, através do cálculo de estatísticas resumo e da

representação gráﬁca dos dados e, a partir daí, escolher uma classe de modelos

para a análise;

2- Identiﬁcar um modelo através da análise de autocorrelações, dentre o utros crité-

rios;

3- Estimar os parâmetros do modelo identiﬁcado;

4- Realizar uma análise de resíduos, a ﬁm de veriﬁcar se o modelo ajustado é ade-

quado para fazer previsões de valores futuros da série.

Se o modelo identiﬁcado não for adequado, o ciclo deve ser repetido a partir da

etapa 2.

2.1 Modelos Lineares

Os modelos abordados a seguir são casos particulares de um modelo de ﬁltro

linear. A principal suposição deste modelo é que a série temporal tenha sido gerada a

partir de um ﬁltro linear, ilustrado na Figura 2.6, cuja entrada é um ruído branco a

ou seja, para cada t ∈ T , a

é uma variável aleatória com

E[a

] = 0, ∀t,

Var[a

] = σ

, ∀t,

E[a

] = 0, s = t.

Assim, a série pode ser expressa da seguinte maneira

= µ + a

+ ψ

t−1

+ ψ

t−2

+ ···

= µ + ψ(B)a

, (2.1)

onde µ, em geral, é o pa râmetro que determina o nível da série e

ψ(B) = 1 + ψ

B + ψ

+ ···

é o operador linear, cuja ﬁnalidade é tranformar a

em Z

, denominado função de

transferência do ﬁltro.

Figura 2.6: Série temp oral gerada por um ﬁltro linear.

Quando a série de pesos ψ

, ψ

, . . . for ﬁnita ou inﬁnita convergente, então Z

estacionária com média µ. Caso contrário, Z

é não-estacionária e µ não tem signiﬁcado

especíﬁco [Morettin e Toloi, 2004].

Lembrando que a

é um ruído branco e supondo que



∞

k=0

< ∞, temos que a

facv de Z

pode ser escrita da seguinte maneira

= σ

∞



k=0

i+k

com ψ

= 1. Assim, para k = 0, obtemos a variância de Z

= Var[Z

] = σ

∞



k=0

A série

= Z

− µ, pode ser escrita como uma soma de valores passados mais

um ruído a

, ou seja,

= π

t−1

+ π

t−2

+ ··· + a

ou ainda,

− π

t−1

− π

t−2

− ··· = a

donde segue que

π(B)

= a

, (2.2)

onde π(B) = 1 − π

B − π

− ··· .

Comparando as expressões (2.1) e (2.2), temos que

π(B)ψ(B)a

= a

daí,

π(B) = ψ

−1

(B) , (2.3)

mostrando que os pesos π

podem ser obtidos a partir dos pesos ψ

e vice-versa.

Quanto às condições de estacionariedade e invertibilidade, um processo linear será

estacionário se a série ψ(B) convergir para |B| ≤ 1 e será invertível se π(B) convergir

para |B| ≤ 1 [Morettin e Toloi, 2004].

2.1.1 Modelos Auto-Regressivos

Considerando o caso especial de (2.2), em que π

= 0, k > p, e renomeando os pesos

de π

para φ

, obtemos o modelo auto-regressivo de ordem p, denotado por AR(p)

= φ

t−1

+ φ

t−2

+ ··· + φ

t−p

+ a

, (2.4)

ou equivalentemente,

φ(B)

= a

, (2.5)

onde

φ(B) = 1 − φ

B − φ

− ··· − φ

é chamado operador auto-regressivo de ordem p.

De (2.5) temos que

φ(B)

= φ

−1

(B)a

ou seja, o modelo AR(p) pode ser visto como a saída

de um ﬁltro linear, com função

de transferência φ

−1

(B), desde que a entrada a

seja um ruído branco.

Para que o processo Z

seja estacionário, a série ψ(B) = φ

−1

(B) deve convergir

para |B|  1, ou seja, as raízes de φ(B) = 0 devem cair fora do círculo unitário.

Por outro lado, como a série π(B) = φ(B) = 1 −φ

B −φ

−···−φ

é ﬁnita,

conseqüentemente, π(B) é convergente para |B|  1, então não há restrições sobre os

parâmetros de um processo auto-regressivo para garantir a invertibilidade de Z

Para encontrar a fac de um processo AR(p), devemos, primeiramente, multiplicar

ambos os membros de (2.4) por Z

t−k

e, em seguida, calcular o valor esperado

t−k

] = φ

t−1

t−k

] + φ

t−2

t−k

] + ···+ φ

t−p

t−k

] + E[a

t−k

] (2.6)

Mas, para k > 0, temos E[a

t−k

] = 0, pois

t−k

envolve ruídos apenas até a

t−k

não-correlacionados. Com isso,

= φ

k−1

+ φ

k−2

+ ··· + φ

k−p

, k > 0 .

Assim, dividindo ambos os membros dessa expressão por γ

= Var[Z

], obtemos a fac

= φ

k−1

+ φ

k−2

+ ··· + φ

k−p

, k > 0 . (2.7)

Segundo Box e Jenkins, a fac de um processo AR(p), consiste de uma mistura de

exponenciais e senóides amortecidas.

A va riância do processo pode ser o btida fazendo k = 0 na expressão (2.6), obtendo

Var(

) = Var(Z

) = γ

= φ

+ ··· + φ

+ σ

Dividindo ambos os membros por γ

, obtemos

1 = φ

+ ··· + φ

donde segue que

= σ

/(1 − φ

− ··· − φ

) . (2.8)

Os parâmetros auto-regressivos φ

, . . . , φ

podem ser escritos em termos de ρ

, . . . , ρ

. Para tanto, basta substituir k = 1, 2, . . . , p em (2.7), obtendo um sistema

com p equações lineares, chamadas equações de Yule-Walker,

= φ

+ φ

+ ··· + φ

p−1

= φ

+ φ

+ ··· + φ

p−2

= φ

p−1

+ φ

p−2

+ ··· + φ

cuja representação matricial é

φ = ρ

onde







1 ρ

··· ρ

p−1

1 ··· ρ

p−2

p−1

p−2

··· 1







, φ =













e ρ













Donde segue que,

φ = P

−1

. (2.9)

Utilizando a expressão (2.9) podemos estimar os coeﬁcientes φ

, . . . , φ

, substi-

tuindo as fac teóricas ρ

por suas estimativas r

2.1.2 Modelos de Médias Móveis

Se ψ

= 0, k > q, na expressão (2.1), obtemos o modelo de médias móveis de ordem q,

denotado por MA(q). Renomeando os pesos de ψ

para −θ

, temos

= µ + a

− θ

t−1

− θ

t−2

− ··· − θ

t−q

ou ainda,

= Z

− µ = (1 − θ

B − θ

− ··· − θ

= θ(B)a

onde θ(B) = 1 − θ

B − θ

− ··· − θ

é chamado operador de médias móveis de

ordem q.

Como a série ψ(B) = θ(B) = 1 − θ

B − θ

−··· − θ

é ﬁnita, então não há

restrições sobre os parâmetros de um processo MA(q) para garantir a estacionariedade

de Z

A condição de invertibilidade para um processo MA(q) é que π(B) = θ

−1

(B)

convirja para |B| ≤ 1, isto é, as raízes de θ(B) = 0 devem cair fora do círculo unitário.

A facv de um modelo MA(q) é

= E[(a

− θ

t−1

− ··· − θ

t−q

)(a

t−k

− θ

t−k−1

− ··· − θ

t−k−q

)]

= E



−



i=1

t−i



t−k

−



j=1

t−k−j



= E[a

t−k

] −



i=1

E[a

t−k

t−i

] −



j=1

E[a

t−k−j

] +



i=1



j=1

E[a

t−j

t−k−j

] .

Sabendo que

E[a

t−k

] =







, k = 0

0, k = 0 ,

obtemos

= Var[Z

] = (1 + θ

+ θ

+ ··· + θ

)σ

(2.10)







(−θ

+ θ

k+1

+ ··· + θ

q−k

)σ

, k = 1, 2, ··· , q

0, k > q .

Donde segue que a fac de Z







−θ

+θ

k+1

+···+θ

q−k

1+θ

+θ

+···+θ

, k = 1, 2, ··· , q

0, k > q .

(2.11)

Ao contrário do que ocorre com um modelo AR(p), a fac de um modelo MA(q)

se anula para lags maiores do que q.

2.1.3 Modelos Auto-Regressivos e de Médias Móveis

Uma das maneiras de tornar um modelo mais parcimonioso, consiste em considerar,

simultaneamente, termos auto-regressivos e termos de médias móveis. Com isso, surge

uma classe de modelos mistos, denominados modelos auto-regressivos e de médias mó-

veis de ordem (p, q), denotados por ARMA(p,q)

= φ

t−1

+ ··· + φ

t−p

+ a

− θ

t−1

− ··· − θ

t−q

isto é,

φ(B)

= θ(B)a

onde φ(B) e θ(B) são os operadores auto-regressivos e de médias móveis, respectiva-

mente.

As condições de estacio nariedade e invertibilidade para um processo ARMA(p,

q) é que as raízes de φ(B) = 0 e de θ(B) = 0 caiam fora do círculo unitário.

A facv de um modelo ARMA(p, q) é

= E{(φ

t−1

+ ··· + φ

t−p

+ a

− θ

t−1

− ··· − θ

t−q

)

t−k

Lembrando que

t−k

depende apenas de choques a

t−k

, ocorridos até o tempo t−k,

temos que a covariância cruzada entre

e a

, deﬁnida p o r

(k) = E[a

t−k

] ,

se anula para valores de k > 0 e é diferente de zero para k ≤ 0. Daí, a facv ﬁca na

forma

= φ

k−1

+ ··· + φ

k−p

+ γ

(k) − θ

(k − 1) − ··· − θ

(k − q) . (2.12)

Para k > q, obtemos

= φ

k−1

+ φ

k−2

+ ··· + φ

k−p

, k > q .

Portanto, a fa c do modelo é

= φ

k−1

+ φ

k−2

+ ··· + φ

k−p

, k > q ,

mostrando que as autocorrelações, para k > q, se comportam como nos modelos auto-

regressivos.

2.1.4 Modelos Auto-Regressivos Integrados e de Médias Móveis

A seguir, abordaremos uma classe de modelos apropriados para descrever séries tem-

porais não-estacionárias homogêneas, ou seja, séries que, apesar de não evoluirem

em torno de uma média constante ao longo do tempo, quando diferenciadas d ve-

zes, tornam-se estacionárias. Por exemplo, se a série for não-estacionária quanto ao

nível, então d = 1. Isto signiﬁca que basta ca lcular sua primeira diferença para torná-la

estacionária. Já séries não -esta cionárias quanto à inclinação, devem ser diferenciadas

duas vezes (d = 2), para obter a estacionariedade [Morettin e Toloi, 2004].

Se W

= ∆

for estacionária, podemos representá-la através de um modelo

ARMA(p, q)

φ(B)W

= θ(B)a

Neste caso, dizemos que Z

é uma integral de W

, já que diferenciando Z

(no sentido

de diferenção sucessivas) obtemos W

. Dizemos, ainda, que Z

segue um modelo auto-

regressivo integrado de médias móveis de ordem (p, d, q), denotado p o r ARIMA(p, d,

φ(B)∆

= θ(B)a

. (2.13)

Sendo W

estacionária, então todas as raízes de φ(B) = 0 caem fora do círculo

unitário.

Uma forma alternativa de escrever a expressão (2.13) é

ϕ(B)Z

= θ(B)a

, (2.14)

em que

ϕ(B) = φ(B)∆

= φ(B)(1 − B)

é um operador auto-regressivo não-estacionário de ordem p + d, com d raízes sobre o

círculo unitário e as p restantes, fora do círculo unitário.

Com essa notação, o modelo ARIMA pode ser representado pela seguinte expres-

são

= ϕ

t−1

+ ··· + ϕ

p+d

t−p−d

+ a

− θ

t−1

− ··· − θ

t−q

, (2.15)

que é denominada equação de diferenças, bastante útil para o cálculo de previsões.

Quando o interesse é calcular a variância dos erros de previsão, é conveniente

expressar o modelo ARIMA na forma de choques aleatórios, ou seja, em termos do

valor atual e prévios de a

, ou seja,

= a

+ ψ

t−1

+ ψ

t−2

+ ··· = ψ(B)a

. (2.16)

Outra maneira de representar o modelo ARIMA é a forma invertida, que consiste

em expressar Z

em termos de seus valores prévios e do valor atual de a

, isto é,

= π

t−1

+ π

t−2

+ ··· + a

. (2.17)

Às vezes, é útil considerar uma extensão do modelo ARIMA, acrescentando um termo

constante θ

na expressão (2.13), obtendo

ϕ(B)Z

= φ(B)∆

= θ

+ θ(B)a

. (2.18)

Se θ

= 0, o modelo (2.18) pode ser usado para representar séries com tendências

estocásticas, ou seja , séries que apresentam mudanças aleatórias no nível e/ou na in-

clinação. Se θ

= 0, então o modelo (2.18 ) é capaz de representar séries com tendência

polinomial determinística de grau d. Além disso,

E(W

) = µ

= θ

/(1 − φ

− φ

− ··· − φ

) .

O modelo ARIMA é uma generalização dos modelos vistos anteriormente, já que

ARIMA(p, 0, 0) = AR(p) ,

ARIMA(0, 0, q) = MA(q) e

ARIMA(p, 0, q) = ARMA(p, q) .

2.2 A Função de Autocorrelação Parcial

A função de autocorrelação parcial (facp) é um instrumento bastante útil durante

a etapa de identiﬁcação do modelo a ser ajustado aos dados observados. Vejamos, a

seguir, como essa função é construída.

Denotando por φ

o j-ésimo coeﬁciente de um modelo AR(k), temos que φ

o último coeﬁciente. Utilizando essa notação, as equações de Yule-Walker po dem ser

escritas da seguinte maneira:







1 ρ

··· ρ

k−1

1 ··· ρ

k−2

k−1

k−2

··· 1































Resolvendo, sucessivamente, estas equações para k = 1, 2, . . . , obtemos

= ρ

, φ



1 ρ



1 ρ



− ρ

1 − ρ

, φ



1 ρ



1 ρ



, ···

De modo geral, para ρ

, a matriz no numerador é a mesma que a matriz no

denominador, exceto pela última coluna, que é substituída pelo vetor de autocorrelação

= (ρ

, . . . , ρ

)

A função de autocorrelação parcial é deﬁnida como sendo a quantidade φ

, en-

carada como função de k.

Para um processo AR(p), a facp se anula para todos as defasagens maiores do

que p, isto é, o seu gráﬁco apresenta um "corte" após o defasagem p. Portanto, o

gráﬁco dessa função permite identiﬁcar o grau do polinômio auto-regressivo. Já para

o processo MA(q), a facp é dominada por uma mistura de exponenciais e/ou senóides

amortecidas. Tal comportamento é semelhante ao da fac de um processo AR(p). Por

ﬁm, a facp de um processo ARMA(p,q), comporta-se de maneira similar à facp de um

processo MA puro [Morettin e Toloi, 2004].

Durante o estágio de identiﬁcação do modelo precisaremos calcular estimativas

das facp, a ﬁm de compará-las com as respectivas facp teóricas. Por exemplo, no caso

dos modelos AR, tais estimativas podem ser feitas, ajustando-se, sucessivamente, pro-

cessos auto-regressivos de ordem p = 1, 2, 3, . . . por mínimos quadrados e considerando

as estimativas

, . . . do último coeﬁciente de cada ordem. A facp estimada

pode ser obtida, de modo alternativo, substituindo-se, nas equações de Yule-Walker,

as fac ρ

por suas estimativas r

, isto é,

j−1

j−2

+ ··· +

j−k

, j = 1, . . . , k

e resolvendo-se essas e quações para k = 1, 2, . . . .

2.3 Alguns Casos Particulares de Modelos Lineares

2.3.1 Modelo Auto-Regressivo de Ordem 1 - AR(1)

O modelo AR(1) é dado por

= φ

t−1

+ a

ou equivalentemente,

φ(B)

= a

onde φ(B) = 1 − φ

Para que o processo seja estacionário é necessário que −1 < φ

< 1.

Por (2.7), a fac de um processo AR(1) é da forma

= φ

k−1

, k > 0

cuja solução é

= φ

, k ≥ 0 .

Donde seg ue que, se φ

> 0, a fac decai exponencialmente e, caso φ

< 0, ela também

decai exponencialmente, alternando valores positivos e negativos. A Figura 2.7 ilustra

esse comportamento para φ

= 0, 8 e φ

= −0, 8.

Por (2.8) a variância de um processo AR(1) é

1 − ρ

⇒ γ

1 − φ

2.3.2 Modelo Auto-Regressivo de Ordem 2 - AR(2)

O modelo AR(2) é dado por

= φ

t−1

+ φ

t−2

+ a

ou ainda,

φ(B)

= a

onde φ(B) = 1 − φ

B − φ

Para que o processo seja estacionário é preciso que

+ φ

< 1 , φ

− φ

< 1 , −1 < φ

< 1 .

Figura 2.7: Processos AR(1) e suas correspondentes funções de autocorrelação.

A fac de um processo AR(2) é

= φ

k−1

+ φ

k−2

, k > 0.

Substituindo p = 2 nas equações de Yule-Walker, obtemos

= φ

+ φ

= φ

+ φ

donde segue que

= ρ

(1 − ρ

)/(1 − ρ

) e φ

= (ρ

− ρ

)/(1 − ρ

) .

Utilizando as equações de Yule-Walker, podemos também expressar ρ

e ρ

função de φ

e φ

, da seguinte maneira

= φ

/(1 − φ

) e ρ

= φ

+ φ

/(1 − φ

) .

A Figura 2.8 ilustra a fac de um processo AR(2) para φ

= 1, φ

= 0, 89 e

= −1, φ

= −0, 89.

Figura 2.8: Funções de auto correlação para um processo AR(2).

Para obter a variância de um processo AR(2), basta substituir p = 2 em (2.8),

obtendo

1 − φ

− φ

2.3.3 Modelo de Médias Móveis de Ordem 1 - MA(1)

O modelo MA(1) é representado por

= a

− θ

t−1

= θ(B)a

onde θ(B) = 1 − θ

O processo é invertível se −1 < θ

< 1.

Substituindo q = 1 na expressão (2 .10), obtemos a variância do processo

= (1 + θ

)σ

Utilizando (2.11), encontramos a função de autocorrelação







−θ

1+θ

, k = 1

0, k > 1 .

A Figura 2.9 apresenta a fac de um processo MA(1) para θ

= 0, 8.

2.3.4 Modelo de Médias Móveis de Ordem 2 - MA(2)

O modelo MA(2) é dado por

= a

− θ

t−1

− θ

t−2

= θ(B)a

onde θ(B) = 1 − θ

B − θ

Figura 2.9: Função de autocorrelação de um processo MA(1).

Para que o processo seja invertível é necessário que as raízes de θ(B) = 0 caiam

fora do círculo unitário, ou seja, devemos ter

+ θ

< 1 , θ

− θ

< 1 , −1 < θ

< 1 .

Observe que essas condições são equivalentes às condições de estacionariedade

para um processo AR(2).

A partir de (2.10) e (2.11) o btemos

= (1 + θ

+ θ

)σ

−θ

(1−θ

)

1+θ

+θ

−θ

1+θ

+θ

= 0 , k > 2 .

A Figura 2.10 apresenta a fac de um processo MA(2) para θ

= 0, 5, θ

= −0, 3.

Figura 2.10: Função de autocorrelação de um processo MA(2).

2.3.5 Modelo Auto-Regressivo e de Médias Móveis de Ordem

(1,1) - ARMA(1,1)

O modelo ARMA(1,1) é dado por

= φ

t−1

+ a

− θ

t−1

Ou equivalentemente,

φ(B)

= θ(B)a

onde φ(B) = 1 − φ

B e θ(B) = 1 − θ

O processo é estacionário se −1 < φ

< 1 e invertível se −1 < θ

< 1.

A partir de (2.12) podemos obter

= φ

+ γ

(1) − θ

(0) ,

= φ

+ γ

(0) − θ

(−1) .

Mas,

(1) = 0 ,

(0) = E[a

] = E[a

(φ

t−1

+ a

− θ

t−1

)] = E[a

] = σ

(−1) = E[a

t+1

] = E[a

(φ

+ a

t+1

− θ

)] = φ

E[a

] + E[a

t+1

] − θ

E[a

]

= φ

E[a

] − θ

E[a

] = (φ

− θ

)σ

Portanto,

= φ

− θ

e γ

= θ

+ σ

− θ

(φ

− θ

)σ

donde segue que

(1 + θ

− 2φ

)σ

1 − φ

e γ

(1 − φ

)(φ

− θ

)σ

1 − φ

Para valores de k > 1, a fac do processo é

= φ

k−1

A Figura 2.11 ilustra a fac de um processo ARMA(1,1), com φ

= 0, 8 e θ

= 0, 3.

Figura 2.11: Função de autocorrelação de um processo ARMA(1,1).

2.4 Identiﬁcação de Modelos ARIMA

A identiﬁcação do particular modelo ARIMA a ser ajustado aos dados é uma

das etapas mais críticas do ciclo iterativo do método de Box e Jenkins, pois, vários

pesquisadores, usando a mesma série, podem identiﬁcar modelos diferentes.

O principal objetivo da identiﬁcação é encontrar os valores p, d e q do mo-

delo ARIMA(p,d,q), bem como determinar estimativas preliminares dos parâmetros,

as quais serão úteis durante o estágio de estimação.

2.4.1 Procedim entos de Identiﬁcação

A primeira etapa do processo de identiﬁcação consiste em veriﬁcar se é necessário

transformar a série original, a ﬁm de estabilizar sua variância. Neste sentido, a trans-

formação de Box-Cox é bastante útil

(λ)







− c

λ = 0

logZ

λ = 0 ,

onde λ e c são parâmetros a serem estimados.

Para se ter uma noção do tipo de transformação a ser utilizada, pode-se construir

um gráﬁco que traz no eixo das abscissas, médias de subconjuntos de observações da

série original e no eixo das ordenadas, a amplitude de cada um desses conjuntos, isto

é, se Z

, Z

, . . . , Z

for um tal subconjunto, o gráﬁco será constituído por pontos da

forma (

Z, w), onde

Z =



i=1

e w = max(Z

) − min(Z

) .

Se w independer de Z, os pontos desse gráﬁco ﬁcarão espalhados em torno de

uma reta paralela ao eixo das abscissas; neste caso, não é necessário aplicar nenhuma

transformação à série original. Caso w seja diretamente proporcional a Z, a transfor-

mação logarítmica é adequada. A Figura 2 .12 apresenta alguns gráﬁcos que podem

ocorrer na prática e os respectivos valores de λ.

Figura 2.12: Gráﬁcos amplitude × média, ilustrando alguns valores possíveis de λ.

A segunda etapa do processo de identiﬁcação consiste em diferenciar a série, ob-

tida na primeira etapa, até conseguir sua estacionariedade, ou seja, até que o processo

= ∆

se reduza a um ARMA(p,q). Uma maneira de saber a quantidade de dife-

renças, d, necessárias para tornar o processo estacionário consiste em observar quando

a fac amostral de W

decresce rapidamente para zero. Na prática, d = 0, 1 ou 2

[Morettin e Toloi, 2004].

A terceira etapa do processo de identiﬁcação consiste em analisar o comporta-

mento das autocorrelações e autocorrelações parciais estimadas, as quais devem re-

presentar adequadamente as respectivas quantidades teóricas desconhecidas. Através

dessa análise, devemos identiﬁcar o processo ARMA(p,q). A Tabela 2.1 apresenta um

resumo das principais características dos modelos mais usuais.

Na literatura, podemos encontrar outras propostas de identiﬁcação de modelos

ARMA(p,q). Existem, por exemplo, os métodos baseados em uma função penalizadora,

cuja idéia é escolher as ordens k e l que minimizem a seguinte quantidade

P (k, l) = lnˆσ

k,l

+ (k + l)

C(N)

Tabela 2.1 : Características das fac e facp de um processo ARIMA(p,d,q).

Ordem (1, d, 0) (0, d, 1)

comportamento de ρ

decai exponencialmente somente ρ

= 0

comportamento de φ

somente φ

= 0 decaimento exponencial

dominante

estimativas iniciais φ

= ρ

= −θ

/(1 + θ

)

região de admissibilidade −1 < φ

< 1 −1 < θ

< 1

Ordem (2, d, 0) (0, d, 2)

comportamento de ρ

mistura de exponenciais

ou ondas senóides amor-

tecidas

somente ρ

= 0 e ρ

= 0

comportamento de φ

somente φ

= 0 e φ

= 0 dominada por mistura de

exponenciais ou senóides

amortecidas

estimativas iniciais



(1−ρ

)

1−ρ

−ρ

1−ρ



= −

(1−θ

)

1+θ

+θ

= −

1+θ

+θ

região de admissibilidade











−1 < φ

< 1

− φ

< 1

+ φ

< 1











−1 < θ

< 1

− θ

< 1

+ θ

< 1

Ordem (1, d, 1)

comportamento de ρ

decai exponencialmente após o lag 1

comportamento de φ

dominada por decaimento exponencial ap ós o lag 1

estimativas iniciais ρ

= (1 − φ

)(φ

− θ

)/(1 + θ

− 2φ

) , ρ

= ρ

região de admissibilidade −1 < φ

< 1, −1 < θ

< 1

onde ˆσ

k,l

é uma estimativa da variância residual obtida ajustando um modelo ARMA(k,l)

às N observações da série e C(N) é uma função do tamanho da série.

Quando o número de parâmetros aumenta, o termo penalizador (k + l)

C(N )

au-

menta e a variância diminui. Portanto, minimizar P (k, l) é equivalente a identiﬁcar as

ordens k e l que equilibrem tal comportamento [Morettin e Toloi, 2004].

A seguir, citaremos alguns procedimentos de identiﬁcação baseados em funções

penalizadoras particulares.

- Critério de Informação de Akaike

Akaike (1973,19 74 ) propôs que as ordens k e l do modelo deveriam ser escolhidas

de modo a minimizar o seguinte critério

AIC(k, d, l) = Nlnˆσ

k,l

N − d

2(k + l + 1 + δ

) + Nln2π + N , (2.19)

onde







1, d = 0

0, d = 0 ,

e ˆσ

k,l

é o estimador de máxima verossimilhança de σ

Se o interesse for comparar vários modelos, com N ﬁxado, então os dois últimos

termos de (2.19) podem ser desconsiderados. Nestes casos, supondo d = 0, o critério

para determinação das ordens p e q, se reduz a

AIC(k, l) = N



lnˆσ

k,l

(k + l + 2)



, (2.20)

que ainda pode ser reescrito da seguinte maneira

AIC(k, l) = lnˆσ

k,l

(k + l) , (2.21)

já que os valores k e l que minimizam (2.21) são os mesmos que minimizam (2.20), pois



lnˆσ

k,l

(k + l)



< N



lnˆσ

k,l

(k + l + 2)



Para os modelos AR(p), o critério AIC se reduz a

AIC(k) = Nlnˆσ

+ 2k .

Com o intuito de diminuir a probabilidade de selecionar uma ordem maior do que

a verdadeira, Hurvich e Tsa i (1989) sugeriram uma correção para o AIC, dada por

AIC

(k) = AIC(k) +

2(k + 1)(k + 2)

N − k + 2

- Critério de Informação Bayesiano

Akaike (1977), Rissanem (1978) e Schwarz (1978), sugerem escolher o modelo

cujas ordens k e l minimizam o Critério de Informação Bayesiano, dado por

BIC(k, l) = lnˆσ

k,l

+ (k + l)

lnN

onde ˆσ

k,l

é a estimativa de máxima vero ssimilhança da variância residual do modelo

ARMA(k,l).

Para os modelos AR(p), o critério se reduz a

BIC(k) = lnˆσ

lnN .

- Critério de Hannan e Quinn

A proposta de Hannan e Quinn (1979) é minimizar a seguinte quantidade

HQC(k, l) = lnˆσ

k,l

+ 2(k + l)c

lnlnN

, c > 1 .

Para modelos AR(p), o critério pode ser escrito da seguinte forma

HQC(k) = lnˆσ

+ 2ck

lnlnN

, c > 1 .

- Critério FPE (Final Predictor Error)

Supondo que a série é representada por um modelo AR(p), Akaike (1969) propôs

minimizar a seguinte quantidade

FPE(k) =









1 +



ˆσ

, µ conhecido



1 +

2k+1



ˆσ

, µ desconhecido ,

onde ˆσ

= c

−



j=1

Pode-se mostrar que o FPE é um estimador assintoticamente não-viciado e con-

sistente para o erro quadrático médio da previsão de Z

N+1

[Morettin e Toloi, 2004].

- Critério CAT (Criterion Autoregressive Transfer Function) - Método de Parzen

Este critério é baseado numa ﬁlosoﬁa diferente das anteriores. Primeiramente,

deve-se assumir que o verdadeiro modelo é um AR(∞)

π(B)Z

= a

O próximo passo consiste em estimar a função de transferência π(B). Daí, a or-

dem selecionada ˆp é vista como uma aproximação ﬁnita ótima para o processo AR(∞).

A seleção de uma função de transferência ótima é feita a partir do valor de k que

minimiza a expressão

CAT(k) =











−



1 +



, k = 0



j=1

ˆσ

−2

− ˆσ

−1

, k = 1, 2, . . . ,

onde ˆσ

é a variância residual estimada para o modelo ajustado de ordem j.

2.4.2 Estimativas Prel im inare s

A seguir, veremos como obter, a partir das autocorrelações amostrais da série W

∆

, estimativas preliminares dos parâmetros do modelo identiﬁcado, a s quais se-

rão utilizadas como valores iniciais para o processo iterativo de estimação de máxima

verossimilhança.

Para processos AR(p) devemos resolver as equações de Yule-Walker, substituindo

as autocorrelações teóricas ρ

por suas estimativas r

, com isso, obteremos

, . . . ,

Uma estimativa inicial da variância residual de um processo AR(p), pode ser

obtida substituindo-se, na expressão (2.8), γ

por c

, os φ

por

e o s ρ

por r

obtendo

ˆσ

= c

(1 −

−

− ··· −

) .

Para processos MA(q), estimativas iniciais para θ

, θ

, . . . , θ

, podem ser obtidas,

substituindo-se ρ

, . . . , ρ

por r

, . . . , r

na expressão (2.11) e resolvendo as q equações

não-lineares resultantes.

A variância residual pode ser estimada, inicialmente, através da expressão (2.10),

substituindo-se γ

por c

e os θ

por suas estimativas iniciais, obtendo

ˆσ

= c

/(1 +

+ ··· +

) .

Para os processos ARMA(p,q), resolvemos as p equações

= φ

k−1

+ ··· + φ

k−p

, k = q + 1, . . . , q + p ,

substituindo ρ

por r

, a ﬁm de obter estimativas preliminares para φ

, . . . , φ

. Em

seguida, através da expressão (2.12), obtemos

, . . . ,

e ˆσ

Quando utilizamos o modelo ARIMA, com µ

= 0, isto é,

φ(B)W

= θ

+ θ(B)a

com µ

= θ

/(1−φ

−···−φ

), podemos obter uma estimativa inicial de θ

, substituindo

por W e os φ

por

, obtendo

= W (1 −

− ··· −

) .

2.5 Estimação de Modelos ARIMA

Após identiﬁcar um modelo provisório a ser ajustado à série temporal, devemos

obter estimativas eﬁcientes para os seus parâmetros.

Vamos denotar por ξ = (φ, θ, σ

) o vetor com os p + q + 1 parâmetros de um

modelo ARIMA(p,d,q), onde φ = (φ

, . . . , φ

) e θ = (θ

, . . . , θ

). A seguinte notação

também será útil: η = (φ, θ).

Suponha que a série o riginal Z = (Z

, Z

, . . . , Z

) tenha sido gerada por um

processo ARIMA(p,d,q). A partir daí, considerando d diferenças, podemos gerar uma

série W

estacionária: W = (W

, W

, . . . , W

), o nde W

= ∆

e n = N − d. Com

isso, o problema de estimar os parâmetros do modelo ARIMA é equivalente a estimar

os parâmetros do modelo modelo ARMA(p,q) estacionário e invertível, representado

por

− φ

t−1

− φ

t−2

− ··· − φ

t−p

+ θ

t−1

+ θ

t−2

+ ··· + θ

t−q

, (2.22)

em que W

= ∆

= W

− µ

e µ

= E[W

] .

Quando d > 0, é conveniente considerar µ

= 0. Caso contrário, µ

será mais

um parâmetro a ser estimado.

A seguir, vamos descrever alguns métodos que possibilitam a obtenção de esti-

madores para os parâmetros do modelo identiﬁcado.

2.5.1 Método dos Momentos

O método dos momentos é um dos métodos de estimação mais simples e antigo. Este

método consiste em substituir, nas equações que relacionam as autocorrelações e os

parâmetros do modelo, os momentos teóricos (média, variância e autocorrelação) pelos

respectivos momentos amostrais e, em seguida, resolver as equações resultantes.

As estimativas preliminares descritas em 5.4.2 são obtidas através do método dos

momentos.

Para o modelo AR(p), o estimador de φ, pelo método dos momentos é dado por

= (

1,MM

, . . . ,

p,MM

)

= R

−1

onde







1 r

. . . r

p−1

1 r

. . . r

p−2

p−1

p−2

p−3

. . . 1







e r

= (r

, r

, . . . , r

)

Utilizando

, podemos também estimar σ

, através do método dos momentos,

obtendo

ˆσ

= c

(1 −

1,MM

− ··· −

p,MM

)

= c

(1 − r

) = c

(1 − r

−1

) .

Em particular, para p = 1, temos que

1,MM

= r

e ˆσ

= c

(1 − r

) .

Para o modelo MA(q), o estimador de

θ, utilizando o método dos momentos, é

obtido resolvendo as equações

−

k,M M

1,MM

k+1,M M

+ ··· +

q−k,MM

q,MM

1 +

1,MM

2,MM

+ ··· +

q,MM

, k = 1, 2, . . . , q .

A variância residual estimada através do método dos momentos é

ˆσ

= c

/(1 +

1,MM

2,MM

+ ··· +

q,MM

) .

Em particular, para q = 1, temos que

−

1,MM

1 +

1,MM

e ˆσ

1 +

1,MM

Para o modelo ARMA(p,q), os parâmetros

φ e

θ, são estimados, através do

método dos momentos, em duas etapas:

(1) estimação de φ, através da solução

= (φ

1,MM

, . . . , φ

p,MM

) da seguinte equa-

ção

1,MM

k−1

+ ··· +

p,MM

k−p

, k = q + 1, . . . , q + p ;

(2) estimação de θ, através da solução

= (θ

1,MM

, . . . , θ

q,MM

) da equação (2.12),

utilizando as autocovariâncias amostrais c

e os estimadores

obtidos na

etapa anterior.

Em particular, para p = q = 1, obtemos

1,MM

= c

= (1 −

1,MM

)(

1,MM

−

1,MM

)/(1 +

1,MM

− 2

1,MM

) .

2.5.2 Método de Máxima Verossimilhança

Vamos denotar por f(z|ξ) a função densidade (ou de probabilidade) conjunta de Z =

, Z

, . . . , Z

). Fixado ξ, a função f(z|ξ) associa um determinado valor a cada

conjunto de observações z observado. Ago ra, quando ﬁxamos z e variamos ξ, obtemos a

função de verossimilhança, denotada por L(ξ|z). Essa função é de grande importância

na teoria de estimação, devido ao "princípio da verossimilhança", que diz o seguinte:

dado que o modelo adotado é correto, toda a informação sobre ξ presente na amostra

está contida na função de verossimilhança; o s outros aspectos dos dados são irrelevantes

[Box e Jenkins, 1976]. Em geral, é conveniente trabalharmos com o logaritmo natural

de L(ξ|z), denota do por l(ξ|z) e denominado função de log-verossimilhança.

Os valores dos parâmetros que maximizam a função de verossimilhança (ou equi-

valentemente, a função de log-verossimilhança) são chamados estimadores de máxima

verossimilhança (EMV).

Observe que só é possível calcular os a

em (2.22) se tivermos valores iniciais para

W ’s e para os a’s. Tais valores podem ser obtidos através de dois procedimentos:

um condicional e o outro incondicional.

- Procedimento Condicional

O procedimento condicional consiste em substituir os valores iniciais desconhe-

cidos por valores supostamente razoáveis, ou seja, supomos que são dados p valores

e q valores a

, que serão denotados por w

∗

e a

∗

, respectivamente. A partir daí, os

valores a

, a

, . . . , a

, condicionais à escolha dos valores iniciais w

∗

e a

∗

, poderão ser

calculados através da expressão (2.22).

Supondo que os a

’s são normalmente distribuídos, a função densidade conjunta

de a

, a

, . . . , a

é dada por

f(a

, a

, . . . , a

) =



t=1

f(a

) = (2π)

−n/2

(σ

)

−n

exp



−



t=1

/2σ



. (2.23)

Dada uma amostra particular w, a função de verossimilhança associada ao vetor

de parâmetros ξ e condicional à escolha de w

∗

e a

∗

, pode ser obtida a partir das

expressões (2.22) e (2.23)

L(ξ|w, w

∗

, a

∗

) = (2π)

−n/2

(σ

)

−n

exp



−

2σ



t=1

(

− φ

t−1

− ···−

t−p

+ θ

t−1

+ ··· + θ

t−q

)



Considerando o logaritmo de L, obtemos

l(ξ |w, w

∗

, a

∗

) = −

log(2π) − nlog(σ

) −

2σ



t=1

(

− φ

t−1

− ···−

t−p

+ θ

t−1

+ ··· + θ

t−q

)

Isto é,

l(ξ |w, w

∗

, a

∗

) ∝ −nlog(σ

) −

2σ

S(η|w, w

∗

, a

∗

) , (2.24)

onde

S(η|w, w

∗

, a

∗

) =



t=1

(

− φ

t−1

− ··· − φ

t−p

+ θ

t−1

+ ··· + θ

t−q

)



t=1

(η|w, w

∗

, a

∗

) . (2.25)

é a soma de quadrados condicional.

Utilizando um asterisco para denotar l e S condicionais a w, w

∗

, a

∗

, podemos

escrever (2.24) e (2.25) da seguinte maneira

∗

(ξ)  −nlog(σ

) −

2σ

∗

(η) ,

∗

(η) =



t=1

(η|w, w

∗

, a

∗

) .

Nosso interesse é maximizar l

∗

(ξ), que é equivalente a minimizar S

∗

(η). Portanto,

estimadores de máxima verossimilhança serão estimadores de mínimos quadrados e o

estudo de l

∗

(ξ) é equivalente ao de S

∗

(η).

Os valores iniciais w

∗

e a

∗

podem ser escolhidos de duas formas:

(1) um procedimento consiste em substituir os elementos de w

∗

e a

∗

por suas es-

peranças. Temos que E(a

) = 0 e, se o modelo não tiver parte determinística,

E(W

) = 0. Caso o modelo tenha parte determinística, s ubstituímos cada ele-

mento de w

∗

por w ;

(2) se o processo estiver próximo da não-estaciona riedade, ou seja, se alguma raiz

de φ(B) estiver próxima do círculo unitário, um pro ce dimento adequado consiste

em utilizar a expressão (2.22) para calcular a

p+1

, a

p+2

, . . . , colocando os valores

anteriores de a

iguais a zero.

Com isso, teríamos

p+1

− φ

− ··· − φ

+ θ

+ ··· + θ

p−q+1

e assim por diante.

- Procedimento Não-Condicional

O procedimento não-condicional consiste em estimar os valores iniciais para os

W ’s e para os a’s através de um método chamado backforecasting ("previsão para o

passado"), a ﬁm de gerar valores antes do início da série.

Segundo [Morettin e Toloi, 2004], a função de log-verossimilhança não-condicional

pode ser aproximada por

l(ξ )  −nlogσ

−

S(η)

2σ

onde

S(η) = S(φ, θ) =



t=−∞

(η, W)]

(2.26)

é a soma de quadrados não-condicional e

(η, W)] = E(a

|η, W) . (2.27)

Pode-se obter boas aproximações para os estimadores de máxima verossimilhança

através dos estimadores de mínimos quadrados, obtidos minimizando-se a expressão

(2.26). Dado η, o cálculo da soma de quadrados (2.26) é feito através do cálculo das

esperanças condicionais (2.27) e através da expressão (2.22). Os valores [W

−j

] e [a

−j

j = 0, 1, 2, . . . são calculados utilizando-se o procedimento backforecasting.

Supondo que os W

’s tenham sido gerados por um processo ARIMA usual

φ(B)W

= θ(B)a

, (2.28)

então eles poderiam ter sido, igualmente, gerados pelo pro cesso

φ(F )W

= θ(F )e

, (2.29)

onde F é o operador translação para o futuro e e

é um ruído branco com a mesma va-

riância que a

[Box e Jenkins, 1976]. A representação (2.28) é chamada forma forward

do processo e a representação (2.29) é denominada forma backward. Assim, fazer

previsões antes que a série se inicie é equivalente a prever a série reversa.

2.5.3 Variância dos Estimadores

A precisão dos estimadores encontradas deve ser avaliada através da co nstrução de

intervalos de conﬁança para os parâmetros. Considerando o vetor de parâmetros η =

(φ, θ), cuja ordem é p + q.

Supondo n suﬁcientemente grande, os estimadores de máxima verossimilhança

têm uma distribuição assintótica normal, isto é,

−→ N

p+q

(η, V),

V = 2σ







∂

S(η)

∂η

···

∂

S(η)

∂η

∂

S(η)

∂η

···

∂

S(η)

∂η







. (2.30)

Além disso, o estimador de máxima verossimilhança de σ

é dado por

ˆσ

η)

e, para n suﬁcientemente grande, ˆσ

η são não-correlacionados [Morettin e Toloi, 2004].

As estimativas das variâncias dos estimadores e covariâncias entre os estimadores

são obtidas substituindo-se σ

em (2.30) por ˆσ

e calculando-se as derivadas

∂

S(η)

∂η

numericamente. Utilizando as estimativas das variâncias, podemos obter intervalos de

conﬁança para os parâmetros η

, i = 1, 2, . . . , p + q.

2.6 Diagnóstico de Modelos ARIMA

Após identiﬁcar o modelo e estimar seus parâmetros, devemos veriﬁcar se ele

representa, satisfatoriamente, os dados observados. Esta veriﬁcação pode ser feita

através de uma técnica chamada superajustamento, a qual consiste em estimar um

modelo com parâmetros extras e examinar, primeiramente, se eles são signiﬁcativos e,

em seg uida, se a inclusão dos mesmos diminue signiﬁcativamente a variância residual.

Para tanto, precisamos ana lisar os resíduos do modelo ajustado. Se o modelo ajustado

φ(B)W

= θ(B)a

com W

= ∆

, for verdadeiro, então os "erros verdadeiros" a

= θ

−1

(B)φ(B)W

serão um ruído branco [Morettin e Toloi, 2004].

A seguir, descreveremos alguns testes de diagnósticos de um mo delo ajustado a

uma série temp o ral, baseados nas autocorrelações estimadas dos resíduos.

2.6.1 Teste de Autocorrelação Residual

Após estimar φ e θ, calculamos os resíduos estimados (ou simplesmente resíduos)

através da seguinte expressão

ˆa

−1

(B)

φ(B)W

Se o modelo ajustado for adequado, os resíduos estimados ˆa

deverão estar pró-

ximos dos resíduos verdadeiros a

, conseqüentemente, deverão ser aproximadamente

não-correlacionados. Ou seja, denotando por ˆr

as autocorrelações dos resíduos ˆa

deveríamos ter ˆr

 0. Em particular, supondo que o modelo ajustado é adequado,

deveríamos ter, aproximadamente,

ˆr

∼ N(0, 1/n) .

O cálculo das autocorrelações ˆr

é feito através da expressão

ˆr



t=k+1

ˆa

t−k



t=1

ˆa

Para valores "grandes" de k, podemos obter uma indicação de uma possível

quebra de comportamento de ruído branco em a

, comparando ˆr

com os limites ±2/

√

[Morettin e Toloi, 2004].

2.6.2 Teste de Box-Pierce

Box e Pierce (1970) propuseram um teste bastante útil para indicar se os valores das

autocorrelações dos resíduos estimados são muito altos. Se o modelo for apropriado, a

estatística

Q(K) = n(n + 2)



j=1

ˆr

n − j

terá, aproximadamente, uma distribuição χ

com K − p − q graus de liberdade. Para

valores grandes de Q(K) rejeitamos a hipótese de ruído branco para os resíduos.

2.6.3 Teste da Autocorrelação Cruzada

Novos termos de médias móveis podem ser incluídos no modelo, a partir da veriﬁcação

das autocorrelaçõ es ˆr

. Por exemplo, se |ˆr

| > 2/

√

n, então um termo θ

t−5

deve

ser inserido no modelo. Uma maneira alternativa, consiste em investigar a função de

correlação cruzada (fcc), baseada na correlação cruzada entre valores passados da série

e o valor presente do ruído, e deﬁnida por



t−k

−





− Z)

, k = 1, 2, 3, . . .

Como os verdadeiros a

são desconhecidos, utilizamos os resíduos estimados ˆa

e subs-

tituímos s

por

ˆs



ˆa

t−k

− Z)





ˆa



− Z)

, k = 1, 2, 3, . . .

Se o modelo for apropriado, então a

e Z

t−k

devem ser não-correlacionados, para

k ≥ 1, ou seja,

Cov[a

, Z

t−k

] = γ

(k) = 0, k ≥ 1 .

Daí, se para um certo k

, s

assumir um valor "grande", o modelo deverá ser

considerado inadequado.

Se |s

| > 2/

√

n, então γ

(k) é signiﬁcativamente diferente de zero. É razoável,

portanto, para k suﬁcientemente grande, julgar s

signiﬁcante quando |ˆs

| > 2/

√

[Morettin e Toloi, 2004].

Os resíduos podem ser utilizados para modiﬁcar o modelo da seguinte maneira:

se os resíduos b

do modelo ajustado

(B)∆

= θ

(B)b

(2.31)

não forem aleatórios, podemos utilizar o método de identiﬁcação visto na seção 5.4,

para descrevê-los através do modelo

φ(B)∆

= θ(B)a

. (2.32)

Daí, substituindo (2.32) em (2.31), obtemos um novo modelo que deverá ser ajustado

aos dados

(B)φ(B)∆

∆

= θ

(B)θ(B)a

cujos resíduos são aleatórios. Este ciclo de identiﬁcação, estimação e veriﬁcação deve

ser repetido até que um modelo adequado seja encontrado.

2.7 Previsão com Modelos ARIMA

Nas seções 5.4, 5.5 e 5.6 seg uimos as etapas do ciclo iterativo de identiﬁcação,

estimação e diagnóstico, com o objetivo de construir um modelo ARIMA(p, d, q) que

representasse adequadamente os dados observados. Agora, vamos utilizar esse modelo

para fazer previsões.

Supondo que temos as observações . . . , Z

t−2

, Z

t−1

, Z

, até o instante t, nosso in-

teresse é prever um valor Z

t+h

, h ≥ 1. Dizemos que t é a origem das previsões e h o

horizonte e denotamos por

(h) a previsão de Z

t+h

(ver Figura 2.13).

Figura 2.13: Observações de uma série temporal com previsões de origem t e horizonte h.

Primeiramente, vamos assumir que W

= (1 − B)

é estacionário e invertível e

que os parâmetros do modelo são conhecidos.

Substituindo t por t + h nas expressões (2.1 5), (2.16) e (2.17), obtemos o modelo

ARIMA(p, d, q) nas três formas básicas:

(i) forma de equação de diferenças

t+h

= ϕ

t+h−1

+ ···+ ϕ

p+d

t+h−p−d

−θ

t+h−1

−···−θ

t+h−q

+ a

t+h

; (2.33)

(ii) forma de choques aleatórios

t+h

= a

t+h

+ψ

t+h−1

+ψ

t+h−2

+··· =

∞



j=0

t+h−j

t+h



j=−∞

t+h−j

; (2.34)

(iii) forma invertida

t+h

= π

t+h−1

+ π

t+h−2

+ ··· + a

t+h

∞



j=1

t+h−j

+ a

t+h

. (2.35)

2.7.1 Previsão de Erro Quadrático Médio (EQM) mínimo

Supondo que

(h) seja uma função linear das observações até o instante t, então, por

(2.34), também será uma função de a

, a

t−1

, . . . .

Indicando a melhor previsão por

(h) = ψ

∗

+ ψ

∗

h+1

t−1

+ ψ

∗

h+2

t−2

+ ··· =

∞



j=0

∗

h+j

t−j

nosso objetivo é encontrar os pesos ψ

∗

que minimizem o EQM de previsão, dado por

E[Z

t+h

−

(h)]

= E



∞



j=0

t+h−j

−

∞



j=0

∗

h+j

t−j



. (2.36)

Observando que



∞

j=0

t+h−j



∞

j=−h

h+j

t−j

, temos que o erro de previsão é

(h) = Z

t+h

−

(h) = ψ

t+h

+ ψ

t+h−1

+ ··· + ψ

h−1

t+1

−

∞



j=0

(ψ

h+j

− ψ

∗

h+j

t−j

Substituindo essa última expressão em (2.36) e usando o fato de que os a

são não-

correlacionados, podemos reescrever o EQM de previsão da seguinte forma

E[e

(h)]

= (1 + ψ

+ ··· + ψ

h−1

)σ

∞



j=0

(ψ

h+j

− ψ

∗

h+j

)

que é minimizado se ψ

∗

h+j

= ψ

h+j

, j = 0, 1, 2, . . . , h ﬁxo. Assim, a previsão de EQM

mínimo é dada por

(h) = ψ

+ ψ

h+1

t−1

+ ψ

h+2

t−2

+ ··· =

∞



j=0

h+j

t−j

Conseqüentemente, o erro de previsão é

(h) = a

t+h

+ ψ

t+h−1

+ ··· + ψ

h−1

t+1

Logo,

t+h

= e

(h) +

(h) , h ≥ 1 .

Utilizando a notação

t+h

] = E[Z

t+h

, Z

t−1

, . . . ] ,

temos que:

(a) a previsão de EQM mínimo é a esperança condicional de Z

t+h

, da das as observa-

ções passadas da série, ou seja,

(h) = [Z

t+h

];

(b) [e

(h)] = 0 e a va riância do erro de previsão é dada por

V (h) = (1 + ψ

+ ψ

+ ··· + ψ

h−1

)σ

; (2.37)

(1) = Z

t+1

−

(1) = a

t+1

;

(d) os erros de previsão para intervalos de tempo maiores que um são correlacionados,

bem como os erros de previsão para o mesmo horizonte h, de diferentes origens t

e t − j [Morettin e Toloi, 2004].

2.7.2 Formas Básicas de Previsão

A previsão

(h) pode ser calculada de três formas, utilizando as diversas representa-

ções do modelo ARIMA.

(i) Previsão utilizando a equação de diferenças

Considerando a esperança condicional em (2.33), temos que

(h) = ϕ

t+h−1

] + ··· + ϕ

p+d

t+h−p−d

]

−θ

t+h−1

] − ··· − θ

t+h−q

] + [a

t+h

] , h ≥ 1 ,

onde devemos usar os seguintes fatos:

t+k

] =

(k), k > 0,

t+k

] = Z

t+k

, k ≤ 0,

t+k

] = 0, k > 0,

t+k

] = a

t+k

, k ≤ 0,

(ii) Previsão utilizando a forma de choques aleatórios

Tomando a esperança condicional em (2.34), obtemos

(h) = ψ

t+h−1

] + ψ

t+h−2

] + ··· + ψ

h−1

t+h

] + ψ

] + ··· + [a

t+h

] .

(iii) Previsão utilizando a forma invertida

Considerando a esperança condicional em (2.35), temos que

(h) = π

t+h−1

] + π

t+h−2

] + ··· + [a

t+h

] .

2.7.3 Equação de Previsão

Por 2.7.2(i), a equação de previsão, vista como uma função de h, com origem t ﬁxa,

satisfaz a equação de diferenças

(h) =

p+d



i=1

(h − 1) , h > q ,

ou ainda,

ϕ(B)

(h) = (1 − B)

φ(B)

(h) = 0 , h > q ,

com ϕ(B) operando sobre h.

A função

(h), para h > q − p − d, consiste de uma mistura de polinômios,

exponenciais e senóides amortecidas [Morettin e Toloi, 2004].

2.7.4 Atualização das Previsões

Calculando as previsões de Z

t+h+1

a pa rtir de duas origens t + 1 e t, obtemos, respec-

tivamente,

t+1

(h) = ψ

t+1

+ ψ

h+1

+ ψ

h+2

t−1

+ ··· (2.38)

(h + 1) = ψ

h+1

+ ψ

h+2

t−1

+ ··· (2.39)

Subtraindo (2.39) de (2.38), temos que

t+1

(h) =

(h + 1) + ψ

t+1

Portanto, quando um novo dado for observado, podemos atualizar a previsão de

t+h+1

, feita no instante t. Essa atualização consiste em prever o valor de Z

t+h+1

, na

origem t+1, adicionando à

(h+ 1) um múltiplo do erro de previsão a

t+1

= Z

t+1

−

(1).

2.7.5 Intervalos de Conﬁança

Para obtermos um intervalo de conﬁança para Z

t+h

, vamos supor que os erros satisfazem

as seguintes condições:

E[a

] = 0, ∀t,

Var[a

] = σ

, ∀t,

E[a

] = 0, s = t,

∼ N(0, σ

), ∀t.

Dado que conhecemos os valores passados e presente da série, Z

, Z

t−1

, Z

t−2

, . . . ,

a distribuição condicional de Z

t+h

será N(

(h), V (h)), onde V (h) é a variâ ncia do erro

de previsão, calculada através da expressão (2.37).

Assim, temos que

U =

t+h

−

(h)



V (h)

∼ N(0, 1)

Portanto, ﬁxado o coeﬁciente de conﬁança γ, é possível encontrar um valor u

distribuição se U, tal que P(−u

< U < u

) = γ. Em outras palavras,



(h) − u



V (h) ;

(h) + u



V (h)



(2.40)

é um intervalo (aleatório) que contém Z

t+h

com probabilidade γ.

O cálculo de V (h) é feito, substituindo-se σ

por sua estimativa ˆσ

(obtida na

etapa de estimação dos parâmetros do modelo), ou seja,

V (h) = (1 + ψ

+ ψ

+ ··· + ψ

h−1

)ˆσ

= ˆσ



1 +

h−1



j=1



. (2.41)

Substituindo (2.41) em (2.40), obtemos

(h) − u

ˆσ







1 +

h−1



j=1

≤ Z

t+h

≤

(h) + u

ˆσ







1 +

h−1



j=1

Capítulo 3

Séries Temporais Envolvendo Dados

Angulares

Em diversas áreas de conhecimento aparecem dados da forma (θ

, t

), . . . , (θ

, t

onde θ

, . . . , θ

consistem de direções em tempos t

, t

, . . . , t

[Mardia e Jupp, 2000].

Em outras palavras, esses dados constituem uma série temporal de dados angulares

(circulares ou direcionais).

São exemplos de séries temporais de dados circulares:

1- Direção de ventos e correntes marinhas;

2- Direção de migrações de animais;

3- Posição da broca durante a perfuração de um poço petrolífero.

3.1 Modelos

Existem diversos modelos para descrição e análise de séries temporais de dados

angula res, muitos deles construídos a partir de modelos para séries temp o rais lineares.

A escolha do modelo mais adequado é feita em várias etapas: escolha de uma classe geral

de modelos; identiﬁcação; estimação dos parâmetros do modelo identiﬁcado; ajuste e,

por ﬁm, segue a etapa de previsão.

A seguir faremos uma descrição de quatro classes de modelos para séries temporais

de dados angulares, propostos por [Fisher e Lee, 1994].

3.1.1 Processo Gaussiano Transformado

Seja {(X

, Y

); t ∈ T } um processo no plano, onde T é um conjunto de índices, então a

projeção radial sobre o círculo unitário gera um processo correspondente Θ

sobre esse

círculo, deﬁnido p o r

= R

cosΘ

, Y

= R

senΘ

Quando {(X

, Y

); t ∈ T } é um processo Gaussiano bivariado estacionário en-

tão Θ

tem uma distribuição Gaussiana transformada. Além disso, se {X

; t ∈ T }

e {Y

; t ∈ T } sã o duas realizações independentes de um processo Gaussiano estacio-

nário de média zero e variância unitária então Θ

tem distribuição uniforme circular

[Fisher e Lee, 1994].

O ajuste de tais modelos apresenta um problema de falta de dados, já que a

parte radial {R

; t ∈ T } de um processo Gaussia no transformado não é observada. No

entanto, esse problema pode ser contornado através da utilização do algoritmo EM, o

qual será abordado na seção 3.2.

A estrutura de correlação de um processo {Θ

; t ∈ T } pode ser quantiﬁcada atra-

vés de uma medida de correlação entre duas variáveis circulares Θ

e Φ

, denominada

coeﬁciente de correlação, introduzido por [Fisher e Lee, 1983] e deﬁnido por

E[sen(Θ

− Θ

)sen(Φ

− Φ

)]



E[sen

(Θ

− Θ

)]E[sen

(Φ

− Φ

)]

onde (Θ

, Φ

) e (Θ

, Φ

) são realizações independentes de (Θ, Φ).

De modo análogo ao caso linear, pode-se mostrar que (vide Apêndice A)

−1 ≤ ρ

≤ 1. (3.1)

Além disso, se Θ e Φ forem independentes, então ρ

= 0. A seguir veremos um

resultado importante envolvendo correlação circular.

Teorema 3.1 Sejam (X

, Y

) e (X

, Y

) vetores aleatórios independentes com uma

distribuição normal bivariada com variâncias iguais a σ

e correlação ρ. Sejam Θ

variáveis aleatórias angulares deﬁnidas por

, Y

) = R

(cos Θ

, senΘ

), i = 1, 2.

Então a correlação circular entre Θ

e Θ

é dada por

(1 − ρ

)





, 2; ρ



onde

é a função hipergeométrica (vide Apêndice B).

A partir desse resultado pode-se deﬁnir a função de a utocorrelação do processo

{Θ

; t ∈ T } da seguinte maneira

(k) =

ρ(k)

(1 − ρ

(k))





, 2; ρ

(k)



, (3.2)

onde ρ(k) é a função de autocorrelação comum dos processos X

e Y

3.1.2 Processo Arqueado

Seja X

uma série temporal univariada de dados lineares. O arqueamento de X

torno do círculo unitário gera uma série temporal arqueada Θ

deﬁnida por

= X

(mod 2π),

ou sej a, Θ

é o resto da divisão de X

por 2π. Assim, um processo linear {X

; t ∈ T },

que dá origem a um processo arqueado {Θ

; t ∈ T }, pode ser decomposto da seguinte

maneira

= Θ

+ 2πk

onde k

é um inteiro não observado. Desta forma, o ajuste desse modelo também

apresenta um problema de falta de dados, que poderá ser solucionado a través do uso

do algoritmo EM.

O arqueamento de um processo {X

; t ∈ T } auto-regressivo AR(p) produz um

processo auto-regressivo arqueado (wrapped), denotado por WAR(p).

Segundo [Fisher e Lee, 1983], se (X, Y ) segue uma distribuição normal bivariada

com variâncias σ

e σ

e correlação ρ, então o co eﬁciente de correlação circular ρ

entre Θ = X(mod 2π) e Φ = Y (mod 2π) é dado por

senh(2ρσ

)



senh(2σ

)senh(2σ

)

Daí, segue que, se {X

; t ∈ T } é um processo AR(p), então a f unção de autocorrelação

circular do processo WAR(p) {Θ

; t ∈ T } é dada por

senh[2ρ

/(1 − φ

− φ

)]

senh[2σ

/(1 − φ

− φ

)]

onde ρ

é a autocorrelação de defasagem k do processo {X

; t ∈ T }, σ

/(1−φ

−φ

)

é a variância do processo e σ

, φ

, . . . , φ

são os seus parâmetros.

3.1.3 Processos Baseados em Funções de Ligação

Uma forma alternativa de se construir um processo angular, a partir de um processo

linear, consiste em utilizar uma função de ligação, isto é, uma função g bijetiva e

monótona que projete a reta real sobre o intervalo (−π, π) e de modo que g(0) = 0.

Duas funções de ligação bastante utilizadas são

g(x) = 2tg

−1

(x)

e a função obtida a partir da probit, que é

g(x) = 2x{Φ(x) − 0, 5},

onde Φ(·) é a função de distribuição da normal padrão.

Se g é uma função de ligação e X uma variável linear então Θ = g(X) é uma

variável angular e, de modo recíproco, para uma variável angular Θ, X = g

−1

(Θ) é

uma variável linear.

A seguir veremos dois modelos circulares construídos a partir de um modelo linear

ARMA(p, q): o modelo com ligação direta - LARMA, o nde os ângulos transformados

seguem um modelo linear ARMA e o modelo com ligação inversa - IAR, utilizando

médias condicionais e a distribuição von Mises [Fisher, 1993].

3.1.3.1 Processo com Ligação Direta - LARMA

Sendo {X

; t ∈ T } um processo linear, g uma função de ligaç ão e µ um ponto no círculo

então o processo angular correspondente {Θ

; t ∈ T } é deﬁnido por

= g(X

) + µ.

Dizemos que um processo angular estacionário {Θ

; t ∈ T } com média direciona l

µ é um processo auto-regressivo e de médias móveis com ligação (LARMA) quando o

seu processo linear com ligação X

= g

−1

(Θ

−µ) for um processo ARMA(p,q). Neste

caso, a autocorrelação circular de Θ

é dada por

(k) = ρ

{g(X

), g(X

t+k

)},

onde ρ

é o coeﬁciente de correlação circular deﬁnido na seção 3.1.1.

As principais vantagens de um mo delo linear com ligação são as seguintes:

- Se o processo {Θ

; t ∈ T } for estacionário então o processo resultante {X

; t ∈ T }

também é;

- Os parâmetros são facilmente estimados utilizando-se um software.

3.1.3.2 Processo com Ligação Inversa - IAR

Para processos AR, pode-se deﬁnir um modelo alternativo através do uso de distribui-

ções condicionais.

Se g é uma função de ligação, µ é um ponto do círculo, κ > 0 e ω

, . . . , ω

são

coeﬁcientes reais, então o processo com ligação inversa - IAR(p) é deﬁnido por

|(θ

t−1

, . . . , θ

t−p

) ∼ VM(µ

, κ)

onde

= µ + g{ω

−1

(θ

t−1

− µ) + . . . + ω

−1

(θ

t−p

− µ)},

ou seja, Θ

dado θ

t−1

, . . . , θ

t−p

segue uma distribuição von Mises com média direcional

e parâmetro de concentração κ constante. Este processo é bas tante utilizado para

modelar séries dispersas (κ < 2).

3.2 Seleção do Modelo

Em geral, a escolha de uma classe de modelos deve ser feita levando-se em con-

sideração as características observáveis dos dados.

No contexto de séries temporais envolvendo dados ang ulares temos quatro clas-

ses de modelos à nossa disposição (vide seção 3.1), diferentemente do caso de séries

temporais lineares, em que usávamos uma única família de modelos, a saber, os auto-

regressivos integrados e de médias móveis (ARIMA).

A seguir descreveremos algumas características especíﬁcas de cada classe de mo-

delos, as quais auxiliarão na escolha do modelo mais adequado.

A principal característica do modelo Gaussiano transformado é a distribuição

uniforme de suas marginais. Caso o processo linear que está sendo transformado tenha

correlação alta, então o processo Gaussiano transformado tenderá a ocupar diferentes

arcos do círculo correspondendo ao grau de variações observado no processo linear

altamente correlacionado. Por outro lado, para graus baixos de correlação, o processo

circular tenderá a se espalhar sobre todo o círculo.

A aparência do processo arqueado é afetada tanta pela correlação quanto pela

variância. Se a variância for grande, o processo circular tenderá a se espalhar unifor-

memente sobre o círculo, enquanto que, para valores pequenos da variância, o processo

tenderá a ocupar um arco do círculo.

No caso do processo com ligação direta, valores altos do processo linear tendem

a ser transformados em torno do arco µ + π, gerando um "vazio" na forma como os

dados se distribuem em torno do círculo.

Por ﬁm, para o processo com ligação inversa, quanto menor o valor do parâmetro

de concentração κ, os dados estarão espalhados mais uniformemente sobre o círculo e,

quanto maior for ω, os dados tenderão a permanecer sobre um pequeno arco em torno

da média direcional µ.

Com base nessas características, recomenda-se que, se os dados angulares estive-

rem distribuídos uniformemente sobre o círculo, então o modelo Gaussiano transfor-

mado ou o modelo arqueado são adequados, sendo que para este último, o processo

linear arqueado deverá apresentar variância alta. Se, pelo contrário, os dados tendem

a se agrupar em torno de um arco, então os modelos com ligação direta ou inversa são

mais adequados.

Vale salientar que todos as quatro classes de modelos são bastante ﬂexíveis e

capazes de modelar uma diversidade de comportamento de séries temporais de dados

angulares.

3.3 Identiﬁcação do Modelo

Após selecionar uma classe de modelos, devemos identiﬁcar um modelo particular

pertencente a essa classe. Uma ferramenta bastante útil nessa etapa é o correlograma

amostral da série. No caso dos modelos Gaussiano transformado, arqueado e com

ligação inversa, o correlograma amostral pode ser calculado utilizando-se a seguinte

expressão para as autocorrelações amostrais

ˆρ

(k) =

det



τ−k



t=1



t−τ





det



τ−k



t=1





det





t=k+1





, (3.3)

onde X

= (cos θ

, sen θ

)



. A idéia é comparar o correlograma amostral com as au-

tocorrelações teóricas de vários mo delos, a ﬁm de identiﬁcar um modelo experimental

que se ajuste satisfatoriamente aos dados.

Para o processo Gaussiano transformado, pode-se estimar a função de autocor-

relação ρ(k) do processo linear correspondente, a partir da resolução da equação (3.2)

com ρ

(k) substituído por sua estimativa ˆρ

(k), calculada por (3.3).

Para o processo arqueado, a autocorrelação pode ser estimada através da seguinte

expressão

(k) = senh(2c

ˆρ

)/senh(2c

)

onde c

é a variância do pro cesso linear, a qual poderá ser estimada através da relação

R = exp(−c

/2), em que

R é o comprimento médio resultante de θ

No caso do modelo com ligação direta, o cálculo da média direcional da série

circular é uma estimativa preliminar ˆµ de µ. Utilizando essa estimativa, a série trans-

formada X

= g

−1

(Θ

− ˆµ) pode ser identiﬁcada da maneira usual, isto é, através dos

procedimentos de identiﬁcação de séries temporais lineares.

3.4 Ajuste do Modelo

3.4.1 Modelo Gaussiano Arqueado

O processo linear arqueado X

pode ser parametrizado através da média µ, da variância

do processo c

e das p primeiras cova riâncias, c

, . . . , c

. O vetor de estatísticas s

= (



, . . . ,



t−p

)



é conjuntamente suﬁciente para estimar o vetor de

parâmetros (µ, c

, c

, . . . , c

)



[Fisher e Lee, 1994].

Considerando uma série temporal, θ

, . . . , θ

, o algoritmo EM deve ser utilizado

em duas etapas:

 Passo E → dada uma estimativa γ

de (µ, c

, c

, . . . , c

)



calcula-se

= E[s|γ

, θ

, . . . , θ

] ;

 Passo M → calcula-se a estimativa atualizada γ

N+1

, bem como a solução de

= E[s|γ

N+1

A maior diﬁculdade na aplicação deste algoritmo encontra-se no cálculo da espe-

rança condicional apresentada no passo E. Para s e ter uma idéia dessa diﬁculdade,

basta observar a quantidade de cálculos computacionais necessários para determi-

nar E[



t−1

|θ

, . . . , θ

]. Por exemplo, a esperança condicional de X

t+1

dados

, . . . , θ

é dada por

∞



=−∞

. . .

∞



=−∞

(θ

+ 2πm

)(θ

t−1

+ 2πm

t−1

) f(θ

+ 2πm

, . . . , θ

+ 2πm

)

∞



=−∞

. . .

∞



=−∞

f(θ

+ 2πm

, . . . , θ

+ 2πm

)

onde f á densidade do processo AR(p). Como, à medida que j cresce, a inﬂuência

de θ

t−j

sobre θ

decresce rapidamente, então E[X

t+1

|θ

, . . . , θ

], no caso do processo

AR(1), pode ser aproximada por E[X

t+1

|θ

, θ

t−1

], cuja expressão é, computacional-

mente, mais tratável

∞



=−∞

∞



t−1

=−∞

(θ

+ 2πm

)(θ

t−1

+ 2πm

t−1

) f

t,t−1

(θ

+ 2πm

, . . . , θ

t−1

+ 2πm

t−1

)

∞



=−∞

∞



t−1

=−∞

t,t−1

(θ

+ 2πm

, . . . , θ

t−1

+ 2πm

t−1

)

onde f

t,t−1

é a densidade conjunta de (X

t+1

). Essa aproximação é aplicável apenas

para modelos AR de ordem baixa [Fisher e Lee, 1994].

3.4.2 Modelo Gaussiano Transformado

De modo análogo ao processo arqueado, podemos parametrizar os processos lineares X

e Y

em termos da média µ, da variância do processo c

e das p primeiras covariâncias,

, . . . , c

. Novamente, na a plicação do algoritmo EM, a maior diﬁculdade encontra-se

no cálculo da esperança condicional.

Considerando a representação polar (R

cos Θ

, R

senΘ

) do vetor (X

, Y

), temos

E[X

t−j

|θ

, . . . , θ

] = E[R

cos Θ

t−j

cos Θ

t−j

|θ

, . . . , θ

]

= cos θ

cos θ

t−j

E[R

t−j

|θ

, . . . , θ

]

Se X e Y têm distribuição normal τ-variada com média zero e matriz de covari-

âncias Σ e se (R

, θ

) á representação polar de (X

, Y

), então a esperança condicional

de R

t−j

dados θ

, . . . , θ

E[R

t−j

|θ

, . . . , θ

] =



∞

···



∞

t−j



s=1

exp



−





. . . dr



∞

···



∞



s=1

exp



−





. . . dr

onde A = (a

), a

= σ

cos(θ

−θ

) e Σ

−1

= (σ

) [Fisher e Lee, 1994]. Para processos

AR de ordem baixa pode-se aproximar E[R

t−j

|θ

, . . . , θ

] por E[R

t−j

|θ

, θ

t−j

]. Em

particular, para p = 1, E[R

t−1

|θ

, . . . , θ

] pode ser aproximada por



∞

···



∞

exp



−

2σ

+ r

− 2φ

cos(θ

− θ

t−1

)}





∞

···



∞

exp



−

2σ

+ r

− 2φ

cos(θ

− θ

t−1

)}



3.4.3 Modelos com Ligação Dir eta e Inversa

Após estimar a média através da média direcional amostral da série, pode-se utilizar

um software para realizar o ajuste do processo AR(p) com ligação direta.

Para ajustar processos AR(p) com ligação inversa, assume-se uma distribuição

marginal para Θ

, . . . , Θ

. Vamos supor que esta distribuição seja o produto de distri-

buições VM(µ, κ).

A densidade conjunta de θ

, . . . , θ

é dada por



t=p+1



− µ − g[ ω

−1

{(θ

t−1

− µ)/2} + . . . + ω

−1

{(θ

t−p

− µ)/2}]





t=1

f(θ

− µ) ,

onde f é a densidade VM(0, κ).

Conclusão

A análise se séries temporais envolvendo dados angulares é feita de maneira li-

geiramente semelhante à análise de séries temporais envolvendo dados lineares. Vários

modelos utilizados para descrever, analisar e interpretar séries temporais angulares são

obtidos a partir de modelos para séries temporais envolvendo dados lineares, daí a ne-

cessidade de se ter domínio da teoria desenvolvida para a análise de séries temporais

lineares. Os modelos estudados têm ampla aplicação na perfuração de poços petrolífe-

ros direcionais e podem ser utilizados para modelar a posição da broca de perfuração

ao longo da trajetória de um poço petrolífero, considerada como uma série temporal

de dados angulares.

Apêndice A

Demonstração da Desiguadade (3.1)

Para demonstrar essa desigualdade utilizamos dois resultados, enunciados a se-

guir, cujas demonstrações podem ser encontradas em [James, 2002].

A.1 Resultados Utilizados

Desigualdade de Jensen - Seja X uma variável aleatória com E(X) < ∞ e g uma

função convexa. Então

g(E(X)) ≤ E(g(X)).

Desigualdade de Cauchy-Schwarz - Sejam X e Y variáveis aleatórias com segundo

momento ﬁnito. Então

E(|XY |) ≤



E(X

)E(Y

A.2 Demostração da Desigualdade (3.1)

Podemos expressar o coeﬁciente de correlação da seguinte forma

E(XY )



E(X

)E(Y

)

com X = sen(Θ

− Θ

) e Y = sen(Φ

− Φ

Pela desigualdade de Jensen temos que

|E(XY )| ≤ E(|XY |) , (A.1)

já que E(XY ) < ∞ e a função modular é convexa.

Por outro lado, usando a desigualdade de Cauchy-Schwarz, obtemos

E(|XY |) ≤



E(X

)E(Y

) . (A.2)

De (A.1) e (A.2), segue que

|E(XY )| ≤



E(X

)E(Y

daí,

−



E(X

)E(Y

) ≤ E(XY ) ≤



E(X

)E(Y

) ,

logo,

−1 ≤

E(XY )



E(X

)E(Y

)

≤ 1 ,

ou seja,

−1 ≤ ρ

≤ 1 .

Apêndice B

Demonstração do Teorema (3.1)

Antes de demonstrar esse teorema, vamos apresentar algumas deﬁnições e pro-

priedades, que serão úteis durante a demonstração.

B.1 Deﬁnições

Deﬁnição 1 A função densidade de probabilidade de um vetor aleatório (X,Y) com

distribuição normal padrão bivariada é dada por

f(x, y) =

2πσ

(1 − ρ

)

1/2

exp



−

2(1 − ρ

)



+ y

− 2ρxy





onde ρ é a correlação entre X e Y.

Deﬁnição 2 A função gama, é denotada por Γ(·) e deﬁnida por

Γ(α) =

∞



α−1

exp(−t)dt , α > 0 .

Deﬁnição 3 A função hipergeométrica, com argumentos α, β, γ e x, é deﬁnida por

(α, β, γ; x) =

∞



m=0

[m]

= 1 +

αβ

α(α + 1)β(β + 1)

γ(γ + 1)

+ . . . ,

onde

[m]







1 se m = 0 ,

m−1



i=0

(h + i) se m > 0 .

B.2 Propriedades

1) A função gama satisfaz

(i) Γ(α + 1) = αΓ(α), α > 0 ;

(ii) Γ(n) = (n − 1)! , para qualquer inteiro positivo n ;

(iii) Γ





√

π .

2) Para quaisquer inteiros positivos p e q valem as seguintes fórmulas de integração

(i)



sen

x cos

x dx = −

sen

p−1

x cos

q+1

p + q

p−1

p+q



sen

p−2

x cos

x dx + c ;

(ii)



cos

x dx =

cos

q−1

x senx

q−1



cos

q−2

x dx + c .

B.3 Demonstração do Teorema (3.1)

Seja (R

, Θ

) a representação polar de (X

, Y

), ou seja,

, Y

) = (R

cos Θ

, R

sen Θ

), i = 1, 2 .

Como a distribuição de Θ

e Θ

é uniforme, podemos escrever ρ

da seguinte

maneira

= 4(E[senΘ

senΘ

]E[cosΘ

cosΘ

] − E[senΘ

cosΘ

]E[senΘ

cosΘ

]) .

Para calcular cada valor esperado, precisamos encontrar a função densidade con-

junta de (R

, Θ

, R

, Θ

). Para tanto, utilizamos o método do jacobiano.

Sendo X = R cos Θ e Y = R sen Θ, f

(X,Y )

e f

(R,Θ)

as densidades de (X, Y ) e

(R, Θ), respectivamente, então

(R,Θ)

(r, θ) = f

(X,Y )

(rcosθ, rsenθ) |J|,

onde J é o jacobiano da transformação, calculado da seguinte forma

J =



∂x

∂r

∂x

∂θ

∂y

∂r

∂y

∂θ



cos θ −rsenθ

senθ r cos θ



= r cos

θ + r sen

θ = r ,

assim,

(R,Θ)

(r, θ) =

2π(1 − ρ

)

1/2

exp



−1

2(1 − ρ

)

cos

θ + r

sen

θ − 2ρ r

cos θ sen θ]



2π(1 − ρ

)

1/2

exp



−1

2(1 − ρ

)

− 2ρ r

cos θ sen θ]



Por hipótese, (X

, Y

) e (X

, Y

) são independentes, donde segue que (R

, Θ

)

e (R

, Θ

) também são independentes. Daí, a densidade conjunta de (R

, Θ

, R

, Θ

)

pode ser encontrada da seguinte maneira

,Θ

)

, θ

, r

, θ

) = f

,Θ

)

, θ

) f

,Θ

)

, θ

)

2π(1 − ρ

)

1/2

exp



−1

2(1 − ρ

)

− 2ρ r

cos θ

sen θ

]



2π(1 − ρ

)

1/2

exp



−1

2(1 − ρ

)

− 2ρ r

cos θ

sen θ

]



Após algumas manipulações algébricas, obtemos

,Θ

)

, θ

, r

, θ

) =

(2π)

(1 − ρ

)

exp



−1

2(1 − ρ

)

+ r

cos(θ

− θ

)]



(2π)

(1 − ρ

)

exp



−r

2(1 − ρ

)



exp



−r

2(1 − ρ

)



×exp



ρr

cos(θ

− θ

)

(1 − ρ

)



(2π)

(1 − ρ

)

exp



−r

2(1 − ρ

)



exp



−r

2(1 − ρ

)



∞



n=0



(1 − ρ

)

cos(θ

− θ

)



(2π)

(1 − ρ

)

∞



n=0

n+1

exp



−r

2(1 − ρ

)



×exp



−r

2(1 − ρ

)



(1 − ρ

)



cos

(θ

− θ

)

• Cálculo de E(senΘ

cos Θ

)

Por deﬁnição de valor esperado, temos que

E(senΘ

cos Θ

) =



−π



−π

senθ

cos θ

(Θ

,Θ

)

(θ

, θ

)dθ

dθ



−π



−π

senθ

cos θ





∞



∞



,Θ

)

, θ

, r

, θ

)dr





dθ

= C

∞



n=0

∞



n+1

exp



−r

2(1 − ρ

)



∞



n+1

exp



−r

2(1 − ρ

)





(1 − ρ

)





−π



−π

senθ

cos θ

cos

(θ

− θ

)dθ

dθ

  

onde C = 1/[(2π)

(1 − ρ

)].

- Cálculo da integral I

Fazendo a seguinte mudança de variáveis

= x + y

= y

obtemos



sen(x + y) cos y cos

x dx dy =



(senx cos y + seny cos x) cos y cos

x dx dy



cos

x senx cos

y dx dy



 



cos

n+1

x seny cos y dx dy



 

onde S é a nova região de integração devido à mudança de variáveis.

- Cálculo da integral I



−2π



−x−π

cos

x senx cos

y dy dx +



2π



−x+π

−π

cos

x senx cos

y dy dx



−2π

cos

x senx



sen2y



−x−π

dx +



2π

cos

x senx



sen2y



−x+π

−π



−2π

cos

x senx



π +

sen2x



dx +



2π

cos

x senx



π −

−

sen2x



= π



−2π

cos

x senx dx +



−2π

x cos

x senx dx +



−2π

cos

x senx sen2x dx

+ π



2π

cos

x senx dx −



2π

x cos

x senx dx −



2π

cos

x senx sen2x dx

como as funções (x cos

x senx) e (cos

x senx sen2x) são pares, segue que

= π



−2π

cos

x senx dx + π



2π

cos

x senx dx

= π





−2π

cos

x senx dx +



2π

cos

x senx dx



= π



2π

−2π

cos

x senx dx = π.0 = 0 ,

já que a função (cos

x senx) é ímpar.

- Cálculo da integral I



−2π



−x−π

cos

n+1

x seny cos y dy dx +



2π



−x+π

−π

cos

n+1

x seny cos y dy dx



−2π

cos

n+1



sen



−x−π

dx +



2π

cos

n+1



sen



−x+π

−π

= −



−2π

cos

n+1

x sen

xdx +



2π

cos

n+1

x sen

xdx = 0 ,

pois a função (cos

n+1

x sen

x) é uma função par. Portanto,

= 0, ∀n ,

donde segue que

E(senΘ

cos Θ

) = 0 .

• Cálculo de E(cos Θ

cos Θ

)

Por deﬁnição de valor esperado, temos que

E(cos Θ

cos Θ

) =



−π



−π

cos θ

(Θ

,Θ

)

(θ

, θ

)dθ

dθ



−π



−π

cos θ





∞



∞



,Θ

)

, θ

, r

, θ

)dr





dθ

= C

∞



n=0

∞



n+1

exp



−r

2(1 − ρ

)



  

∞



n+1

exp



−r

2(1 − ρ

)



  



(1 − ρ

)





−π



−π

cos θ

cos

(θ

− θ

)dθ

dθ

  

- Cálculo da integral I

, k = 2, 3

Fazendo a substituição t = r

/[2(1 − ρ

)], segue que

= [2(1 − ρ

)]

1/2

⇒ dr

[2(1 − ρ

)]

1/2

dt .

Daí,



∞



[2(1 − ρ

)]

1/2



n+1

exp(−t)

[2(1 − ρ

)]

1/2

[2(1 − ρ

)]

n+2



∞

(

)

−1

exp(−t) dt

[2(1 − ρ

)]

n+2



n + 2



, k = 2, 3.

Ou seja,

= I

[2(1 − ρ

)]

n+2



n + 2



- Cálculo da integral I

Fazendo a seguinte mudança de variáveis

= x + y

= y

obtemos



cos(x + y) cos y cos

x dx dy =



(cos x cos y + senx seny) cos y cos

x dx dy



cos

n+1

x cos

y dx dy



 

−



cos

n+1

x cos

y dx dy



 

onde S é a nova região de integração devido à mudança de variáveis.

- Cálculo da integral I



−2π



−x−π

cos

x senx seny cos y dy dx +



2π



−x+π

−π

cos

x senx seny cos y dy dx



−2π

cos

x senx



sen



−x−π

dx +



2π

cos

x senx



sen



−x+π

−π

= −



−2π

cos

x sen

xdx +



2π

cos

x sen

xdx



2π

cos

x sen

xdx +



2π

cos

x sen

xdx =



2π

cos

x sen

xdx



−

sen

x cos

n+1

n + 3



2π

n + 3



2π

cos

x senxdx =

n + 3



−

cos

n+1

n + 1



2π

= 0.

- Cálculo da integral I



−2π



−x−π

cos

n+1

x cos

y dy dx +



2π



−x+π

−π

cos

n+1

x cos

y dy dx



−2π

cos

n+1



sen2y



−x−π

dx +



2π

cos

n+1



sen2y



−x+π

−π



−2π

cos

n+1



π +

sen2x



dx +



2π

cos

n+1



π −

−

sen2x



= π



−2π

cos

n+1

x dx +



−2π

x cos

n+1

x dx +



−2π

cos

n+2

x senx dx

+ π



2π

cos

n+1

x dx −



2π

x cos

n+1

x dx −



2π

cos

n+2

x senx dx

= 2π



−2π

cos

n+1

x dx +



−2π

x cos

n+1

x dx +



−2π

cos

n+2

x senx dx



−2π

(x + 2π) cos

n+1

x dx +



−

cos

n+3

n + 3



−2π



−2π

(x + 2π) cos

n+1

x dx .

Fazendo

u = (x + 2π) ⇒ du = dx ,

dv = cos

n+1

x dx ⇒ v =



cos

n+1

x dx ,

Para calcular v utilizamos, recursivamente, a propriedade 2(ii) enunciada no início

deste apêndice. Observe que a aplicação recursiva dessa propriedade, reduz a potência

(n + 1) do cosseno e, dependendo da pa ridade de n, essa redução resulta em



cos x dx



dx.

Se n for par então

v =



cos

n+1

x dx =

cos

x senx

(n + 1)



cos

n−1

x dx

cos

x senx

(n + 1)

cos

n−2

x senx

(n − 1)

n(n − 2)

(n + 1)(n − 1)



cos

n−3

x dx

cos

x senx

(n + 1)

cos

n−2

x senx

(n − 1)

n(n − 2)

(n + 1)(n − 1)

cos

n−4

x senx

(n − 3)

n(n − 2)(n − 4)

(n + 1)(n − 1)(n − 3)



cos

n−5

x dx

cos

x senx

(n + 1)

cos

n−2

x senx

(n − 1)

n(n − 2)

(n + 1)(n − 1)

cos

n−4

x senx

(n − 3)

+ . . . +

n(n − 2)(n − 4) . . . 8.6.4

(n + 1)(n − 1)(n − 3) . . . 9.7.5

cos

x senx

n(n − 2)(n − 4) . . . 8.6.4.2

(n + 1)(n − 1)(n − 3) . . . 9.7.5.3



cos xdx .

Integrando por partes, temos que

= [uv]

−2π

−



−2π

vdu = 0 −



−2π

vdu =



cos

n+1

(n + 1)



= +

(n + 1)(n − 1)



cos

n−1

(n − 1)



−2π

+ . . . +

n(n − 2)(n − 4) . . . 8.6.4

(n + 1)(n − 1)(n − 3) . . . 9.7.5.3



cos



−2π

n(n − 2)(n − 4) . . . 8.6.4.2

(n + 1)(n − 1)(n − 3) . . . 9.7.5.3

[cos x]

−2π

= 0 .

Portanto, se n for um número par entã o I

= 0.

Se n for ímpar então o cálculo de v através da aplicação recursiva da propriedade

2(ii) resulta em

v =



cos

n+1

x dx =

cos

x senx

(n + 1)

cos

n−2

x senx

(n − 1)

= +

n(n − 2)

(n + 1)(n − 1)

cos

n−4

x senx

(n − 3)

+ . . . +

n(n − 2)(n − 4) . . . 7.5.3

(n + 1)(n − 1)(n − 3) . . . 8.6.4

cos x senx

n(n − 2)(n − 4) . . . 7.5.3.1

(n + 1)(n − 1)(n − 3) . . . 8.6.4.2



dx .

Daí, para n ímpar, temos que

= [uv]

−2π

−



−2π

vdu = 0 −



−2π

vdu

(n + 1)



cos

n+1

(n + 1)



−2π

= +

(n + 1)(n − 1)



cos

n−1

(n − 1)



−2π

+ . . . +

n(n − 2)(n − 4) . . . 7.5.3

(n + 1)(n − 1)(n − 3) . . . 8.6.4.2



cos



−2π

n(n − 2)(n − 4) . . . 7.5.3.1

(n + 1)(n − 1)(n − 3) . . . 8.6.4.2



−



−2π

n(n − 2)(n − 4) . . . 7.5.3.1

(n + 1)(n − 1)(n − 3) . . . 8.6.4.2

(2π

)

n(n − 1)(n − 2)(n − 3)(n − 4) . . . 8.7.6.5.4.3.2.1

(n + 1)[(n − 1)(n − 3) . . . 8.6.4.2]

(2π

)

(n + 1)[(n − 1)(n − 3) . . . 8.6.4.2]

(2π

Sendo n ímpar, podemos escrevê-lo na forma n = 2m + 1, assim,

(2m + 1)!

(2m + 2)[(2m)(2m − 2) . . . 8.6.4.2]

(2π

)

(2m + 1)!

2(m + 1)[2

m(m − 1) . . . 4.3.2.1]

(2π

) =

(2m + 1)!

(m + 1)2

[m!]

(2m + 1)!

(m + 1)m!m!

(2m + 1)!

(m + 1)!m!



2m + 1



Logo,







0 se n for par;



2m+1



se n for ímpar, n = 2m + 1.

Portanto,

= I

− I

= I

− 0 = I







0 se n for par;



2m+1



se n for ímpar, n = 2m + 1.

Substituindo I

, I

e I

na expressão de E(cos Θ

cos Θ

), obtemos

E(cos Θ

cos Θ

) =

(2π)

(1 − ρ

)

∞



m=0

(2m + 1)!



2(1 − ρ

)



(2m+1+2)

×Γ



2m + 1 + 2



2m+1

(1 − ρ

)

2m+1



2m + 1



2(1 − ρ

)

∞



m=0

(1 − ρ

)

2m+3



m +



(1 − ρ

)

2m+1

m!(m + 1)!

ρ (1 − ρ

)

∞



m=0



m +



Γ (m + 2)

(ρ

)

Podemos reescrever Γ(m + 2) da seguinte maneira

Γ(m + 2) = (m + 1)! = (m + 1)m(m − 1) . . . 4.3.2 = 2.3.4 . . . (m − 1)m(m + 1)

= (2 + 0)(2 + 1)(2 + 2) . . . (2 + m − 3)(2 + m − 2)(2 + m − 1)

m−1



i=0

(2 + i) = 2

[m]

Além disso, pode-se mostrar, por indução, que



m +







[m]

√

Assim,

E(cos Θ

cos Θ

) =

ρ(1 − ρ

)

∞



m=0





[m]





[m]

(ρ

)

ρ(1 − ρ

)



, 2; ρ



onde



, 2; ρ



é a função hipergeométrica deﬁnida no início deste apêndice.

• Cálculo de E(senΘ

senΘ

)

O cálculo de E(senΘ

senΘ

) é feito de maneira análoga ao anterior, de onde vem

E(senΘ

senΘ

) =

ρ(1 − ρ

)



, 2; ρ



Substituindo, cada valor esperado calculado, na expressão do coeﬁciente de correlação,

obtemos

(1 − ρ

)





, 2; ρ



como queríamos mostrar.

Referências Bibliográﬁcas

[Box e Jenkins, 1976] Box, G. E. P. e Jenkins, G. M (1976). Time Series Analysis -

forecasting and control. San Francisco: Holden-Day.

[Charles et al., 2001] Charles, T., Guéméné, J. M., Vicent, G., Dubrule, O. e TotalFi-

naElf (2001). Experience with the Quantiﬁcation of Subsurface Uncertainties.

Society of Petroleum Engineers, n

68703.

[Fisher, 1993] Fisher, N. I (1993). Statistical Analysis of Circular Data. Cambridge:

University Press.

[Fisher e Lee, 1983] Fisher, N. I. e Lee, A. J (1983). A correlation coeﬃcient for circular

data. Biometrics 70, 327-332.

[Fisher e Lee, 1992] Fisher, N. I. e Lee, A. J (1992). Regression models for an angular

response. Biometrics 48, 665-677.

[Fisher e Lee, 1994] Fisher, N. I. e Lee, A. J (1994). Time series analysis of circular

data. Journal of the Royal Statistical Society, B 56, 327-339.

[James, 2002] James, B. B (2002). Probabilidade: Um curso em Nível Intermediário.

Rio de Janeiro: IMPA.

[Johnson e Kotz, 1969] Johnson, L. N. e Kotz, S (1969). Discrete Distributions. Boston.

[Lima] Lima, H. R. P. L.Fundamentos de Perfuração. Notas de um curso do Centro de

Desenvolvimento de Recursos Humanos da Petrobras.

[Mardia e Jupp, 2000] Mardia, K. V. e Jupp, P. E (2000). Directional Statistics. New

York: John Wiley & Sons.

[Morettin e Toloi, 2004] Morettin, P. A. e Toloi, C. M. C (2004). Análise de Séries

Temporais. São Paulo: Edgard Blücher.

[Silva, 2004] Silva, A. M (2004). Um Modelo Estocástico para Previsão de Desvios da

Coluna de Perfuração em Poços Petrolíferos. Monograﬁa de Graduação - Pro-

grama de Recursos Humanos da ANP/MCT - PRH(25). Universidade Federal

de Campina Grande - UFCG. Campina Grande - PB.

[Thomas, 2001] Thomas, J. E (2001). Fundamentos de Engenharia de Petróleo. Editora

Interciência.

[Thomas, 2003] Thomas, G. B (2003). Cálculo. São Paulo: Addison Wesley.

[Wilks, 1995] Wilks, D. S (1995). Statistical Methods in the Atmosferic Sciences. Aca-

demic Press.

Livros Grátis
( http://www.livrosgratis.com.br )
 
Milhares de Livros para Download:
 
Baixar livros de Administração
Baixar livros de Agronomia
Baixar livros de Arquitetura
Baixar livros de Artes
Baixar livros de Astronomia
Baixar livros de Biologia Geral
Baixar livros de Ciência da Computação
Baixar livros de Ciência da Informação
Baixar livros de Ciência Política
Baixar livros de Ciências da Saúde
Baixar livros de Comunicação
Baixar livros do Conselho Nacional de Educação - CNE
Baixar livros de Defesa civil
Baixar livros de Direito
Baixar livros de Direitos humanos
Baixar livros de Economia
Baixar livros de Economia Doméstica
Baixar livros de Educação
Baixar livros de Educação - Trânsito
Baixar livros de Educação Física
Baixar livros de Engenharia Aeroespacial
Baixar livros de Farmácia
Baixar livros de Filosofia
Baixar livros de Física
Baixar livros de Geociências
Baixar livros de Geografia
Baixar livros de História
Baixar livros de Línguas

Baixar livros de Literatura
Baixar livros de Literatura de Cordel
Baixar livros de Literatura Infantil
Baixar livros de Matemática
Baixar livros de Medicina
Baixar livros de Medicina Veterinária
Baixar livros de Meio Ambiente
Baixar livros de Meteorologia
Baixar Monografias e TCC
Baixar livros Multidisciplinar
Baixar livros de Música
Baixar livros de Psicologia
Baixar livros de Química
Baixar livros de Saúde Coletiva
Baixar livros de Serviço Social
Baixar livros de Sociologia
Baixar livros de Teologia
Baixar livros de Trabalho
Baixar livros de Turismo