Download PDF
ads:
UNIVERSIDADE DO RIO GRANDE DO NORTEFEDERAL
Universidade Federal do Rio Grande do Norte
Centro de Tecnologia
Programa de os-Gradua¸ao em Engenharia El´etrica e de
Computa¸ao
Estima¸ao de Modelos ARIMA/ARIMAX e
Aplica¸ao em Inferˆencia de Perdas de
Propano
Wany Leydiane Souza de Andrade
Orientador: Prof. Dr. Luiz Affonso H. Guedes de Oliveira
Natal, RN, julho de 2009
ads:
Livros Grátis
http://www.livrosgratis.com.br
Milhares de livros grátis para download.
UNIVERSIDADE DO RIO GRANDE DO NORTEFEDERAL
Universidade Federal do Rio Grande do Norte
Centro de Tecnologia
Programa de os-Gradua¸ao em Engenharia El´etrica e de
Computa¸ao
Estima¸ao de Modelos ARIMA/ARIMAX e
Aplica¸ao em Inferˆencia de Perdas de
Propano
Wany Leydiane Souza de Andrade
Orientador: Prof. Dr. Luiz Affonso H. Guedes de Oliveira
Disserta¸ao de Mestrado apresentada ao
Programa de os-Gradua¸ao em Engenharia
El´etrica e de Computa¸ao da UFRN (´area de
concentra¸ao: Engenharia de Computa¸ao)
como parte dos requisitos para obten¸ao do
t´ıtulo de Mestre em Ciˆencias.
N´umero de ordem PPgEE: M237
Natal, RN, julho de 2009
ads:
Estima¸ao de Modelos ARIMA/ARIMAX e
Aplica¸ao em Inferˆencia de Perdas de
Propano
Wany Leydiane Souza de Andrade
Disserta¸ao de Mestrado aprovada em 16 de julho de 2009 pela banca examinadora com-
posta pelos seguintes membros:
Prof. Dr. Luiz Affonso H. Guedes de Oliveira (orientador) . . . . . . DCA/UFRN
Prof. Dr. abio Meneghetti U. de Ara´ujo (examinador interno) . DCA/UFRN
Prof. Dr. Jorge Dantas de Melo (examinador interno) . . . . . . . . . . . DCA/UFRN
Prof. Dr. Diego Rodrigo Cabral Silva (examinador externo) . . . . . . CEFET-RN
Dedicat´oria
`
A minha fam´ılia, respons´avel pelo
alicerce da minha educao, dedico
mais esta conquista.
Agradecimentos
A Deus.
Ao meu orientador, professor Luiz Affonso, sou enormemente grata pela orienta¸ao.
Ao professor abio Meneghetti e ao engenheiro Jos´e Medeiros A. J´unior, por disponibili-
zarem o Estudo de Caso utilizado nesta disserta¸ao.
Aos colegas de laborat´orio, pelas contribui¸oes e sugest˜oes.
Aos demais amigos e familiares, pelo incentivo e compreens˜ao durante esta jornada.
Ao CNPq, pelo apoio financeiro.
Resumo
Nesta disserta¸ao de mestrado realiza-se um estudo sobre s´eries temporais, que conem
uma descri¸ao das principais ecnicas existentes para an´alise de eries temporais lineares,
detalhando-se mais profundamente os modelos ARIMA e ARIMAX. Os modelos ARIMA
e ARIMAX destinam-se `a modelagem de s´eries temporais que podem ser representadas
por equa¸oes lineares, sejam elas estacion´arias ou ao-estacion´arias.
Dentro do processo de estima¸ao do modelo ARIMA/ARIMAX, usam-se arias t´ec-
nicas combinadas, em diferentes partes desse processo, como: Crit´erio de Informa¸ao
de Akaike para a escolha das ordens e atrasos do modelo e o algoritmo Recursive Least
Squares para estimar os coeficientes do modelo.
O problema a ser abordado nesta disserta¸ao consiste em, de posse apenas de amostras
de uma erie temporal no dom´ınio do tempo, e de uma entrada (ou arias) do sistema
gerador dessa erie temporal, estimar um modelo que represente adequadamente essa erie,
com o menor erro poss´ıvel em rela¸ao `a s´erie real e `a s´erie ajustada pelo modelo.
Os principais resultados desta disserta¸ao ao a implementa¸ao e valida¸ao de algorit-
mos para determina¸ao de ordens, coeficientes e atrasos dos modelos ARIMA/ARIMAX.
Outro resultado refere-se `a estima¸ao do modelo e `a realiza¸ao de inferˆencias para a s´erie
temporal do estudo de caso, a s´erie de Perdas de Propano no topo da coluna deetaniza-
dora de uma Unidade de Processamento de G´as Natural. As estima¸oes realizadas sobre a
sa´ıda da s´erie do estudo de caso funcionar˜ao como um sensor de software capaz de indicar
a perda de propano nessa coluna em caso de ausˆencia de um sensor de hardware para tal
finalidade.
Palavras-chave: S´eries Temporais, Tendˆencia, Sazonalidade, Modelos ARIMA, Mo-
delos ARIMAX, Previs˜ao de eries Temporais.
Abstract
In this master’s thesis, it’s made a study about time series, that has a description of
the principal techniques to linear time series analysis, it’s shown with details the ARIMA
and ARIMAX models. The ARIMA and ARIMAX models are destinated to modeling of
time series which can be represented for linear equations, independently if the time series
is stationary or non-stationary.
In the process of ARIMA/ARIMAX models estimation, many techniques are used
together, in different parts of this process, like: Akaike’s Information Criteria (AIC) to
choose the orders and delays of the model and Recursive Least Squares (RLS) algorithm
to estimate the model’s coefficients.
The problem to be approched in this master’s thesis is, having only samples of a time
serie in the time domain and one (or more) entries of the generator system of this serie,
to estimate a model that properly represents this time serie, with the minor error possible
in relation to the real serie and the serie generated by the model.
The principal results of this dissertation are the implementation and validation of the
algorithms to determination of orders, coefficients and delays of the ARIMA/ARIMAX
models. Another result refers to the model estimation and the inferences for the time
serie of the case study, the time serie of propane loss at the top of the column called
deetanizadora, in a natural gas processing unit. The inferences made on the exit of the
serie of case study will work as a software sensor able to indicate the propane loss in this
column in the absence of a hardware sensor for this purpose.
Keywords: Time Series, Tendency, Seasonality, ARIMA Models, ARIMAX Models,
Time Series Prevision.
xi
Conte´udo
Lista de Figuras xv
Lista de Tabelas xix
Lista de Siglas xxi
1 Introdu¸ao 1
2 Processos Estoasticos e eries Temporais 5
2.1 S´eries Temporais ao-estacion´arias . . . . . . . . . . . . . . . . . . . . . . 7
2.2 Outras Transforma¸oes Pr´evias para eries Temporais . . . . . . . . . . . . 8
2.3 Modelos para eries Temporais . . . . . . . . . . . . . . . . . . . . . . . . 9
2.4 Tendˆencias, Sazonalidades, Ciclos, Aleatoriedade e Outliers . . . . . . . . . 10
2.5 Modelos de Suaviza¸ao Exponencial . . . . . . . . . . . . . . . . . . . . . . 14
2.5.1 S´eries Temporais Sem Tendˆencia e Sem Sazonalidade . . . . . . . . 14
2.5.1.1 M´edias oveis Simples . . . . . . . . . . . . . . . . . . . . 15
2.5.1.2 Suaviza¸ao Exponencial Simples . . . . . . . . . . . . . . 15
2.5.2 S´eries Temporais Com Tendˆencia e Sem Sazonalidade . . . . . . . . 16
2.5.2.1 Suaviza¸ao Exponencial de Holt . . . . . . . . . . . . . . . 16
2.5.3 S´eries Temporais Com Tendˆencia e Sazonalidade . . . . . . . . . . . 17
2.5.3.1 Suaviza¸ao Exponencial Sazonal de Holt-Winters (para sa-
zonalidade aditiva) . . . . . . . . . . . . . . . . . . . . . . 17
2.5.3.2 Suaviza¸ao Exponencial Sazonal de Holt-Winters (para sa-
zonalidade multiplicativa) . . . . . . . . . . . . . . . . . . 18
3 Modelos ARIMA e ARIMAX 21
3.1 Modelo ARIMA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
3.1.1 Caracter´ısticas do Modelo ARIMA . . . . . . . . . . . . . . . . . . 24
3.1.2 Modelos AR e ARI . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
3.1.3 Modelos MA e IMA . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
3.1.4 Modelo ARMA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
3.2 Modelo ARIMAX . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
3.2.1 ARIMAX e suas Subdivis˜oes . . . . . . . . . . . . . . . . . . . . . . 26
3.3 Modelo SARIMA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
3.4 Modelo NARMAX . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
4 Etapas da Modelagem para Modelo ARIMA/ARIMAX 31
4.1 Sele¸ao do Modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
4.2 Estima¸ao das Ordens do Modelo . . . . . . . . . . . . . . . . . . . . . . . 31
4.2.1 Fun¸ao de Autocorrela¸ao (FAC) e Fun¸ao de Autocorrela¸ao Par-
cial (FACP) Estimadas . . . . . . . . . . . . . . . . . . . . . . . . . 32
4.2.2 Crit´erio de Informa¸ao de Akaike (CIA) . . . . . . . . . . . . . . . 34
4.2.2.1 CIA para Modelos ARIMA e ARIMAX . . . . . . . . . . 34
4.2.2.2 CIA para Modelos AR . . . . . . . . . . . . . . . . . . . . 36
4.2.2.3 CIA para Modelos SARIMA . . . . . . . . . . . . . . . . . 36
4.2.2.4 Outras Equa¸oes para CIA . . . . . . . . . . . . . . . . . 37
4.2.2.5 Crit´erio de Informa¸ao de Akaike Modificado . . . . . . . 37
4.2.3 Crit´erio de Informa¸ao Bayesiano (CIB) . . . . . . . . . . . . . . . 39
4.3 Estima¸ao dos Coeficientes do Modelo . . . . . . . . . . . . . . . . . . . . 39
4.3.1 M´etodo de axima Verossimilhan¸ca . . . . . . . . . . . . . . . . . 39
4.3.2 RLS - Recursive Least Squares (M´ınimos Quadrados Recursivos) . . 40
4.3.3 ELS - Extended Least Squares (M´ınimos Quadrados Estendidos) . . 43
4.4 Diagn´ostico do Modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
4.4.1 Teste de Autocorrela¸ao Residual . . . . . . . . . . . . . . . . . . . 46
4.4.2 Teste de Autocorrela¸ao Cruzada . . . . . . . . . . . . . . . . . . . 47
4.4.3 Adicionando Novos Termos ao Modelo ARIMA/ARIMAX . . . . . 47
4.5 Previs˜oes com o Modelo ARIMA e ARIMAX . . . . . . . . . . . . . . . . . 48
4.5.1 Transforma¸oes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
4.6 Etapas da Modelagem e etodos Escolhidos para o Sistema . . . . . . . . 50
5 Testes e Resultados Preliminares 55
5.1 Problemas T´ecnicos Enfrentados Durante a Fase de Implementa¸ao do Sis-
tema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
5.1.1 Estouro de Pilha . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
5.2 Ambiente Computacional Desenvolvido . . . . . . . . . . . . . . . . . . . . 71
6 Estudo de Caso 77
7 Conclus˜oes 95
7.1 Contribui¸oes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
7.2 Trabalhos Futuros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
Referˆencias 97
xv
Lista de Figuras
1.1 S´erie Temporal fict´ıcia da taxa de varia¸ao do olar em dias. . . . . . . . . 2
2.1 Exemplo de um processo estoastico (um conjunto de vari´aveis aleat´orias). 5
2.2 Uma vari´avel aleat´oria com uma fun¸ao densidade de probabilidade corres-
pondente (para um valor de t fixado). . . . . . . . . . . . . . . . . . . . . . 6
2.3 Uma s´erie temporal em fun¸ao do tempo (para um valor de ω fixado). . . . 6
2.4 Diagrama de subdivis˜oes do modelo ARIMAX. . . . . . . . . . . . . . . . . 10
3.1 O processo gerador da erie temporal juntamente com o sistema estimador
da s´erie. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
3.2 Fluxograma : constru¸ao de um modelo ARIMA/ARIMAX. . . . . . . . . 23
4.1 Componentes do RLS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
4.2 Algoritmo RLS (WIKIPEDIA, 2005). . . . . . . . . . . . . . . . . . . . . . . 42
4.3 Algoritmo ELS (FERRARI, 2006). . . . . . . . . . . . . . . . . . . . . . . . 44
4.4 Fluxograma estendido: constru¸ao de um modelo ARIMA/ARIMAX. . . . 51
5.1 Gr´afico contendo os valores originais da s´erie de teste que simula o com-
portamento de um modelo ARIMA. . . . . . . . . . . . . . . . . . . . . . . 57
5.2 Ru´ıdos correspondentes `a parte MA do modelo ARIMA estimados pelo
Algoritmo ELS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
5.3 Gr´afico da S´erie Real versus erie gerada pelo modelo ARIMA. . . . . . . . 59
5.4 Gr´afico de convergˆencia do termo Z
t1
do modelo ARIMA. . . . . . . . . . 59
5.5 Gr´afico de convergˆencia do termo a
t1
do modelo ARIMA. . . . . . . . . . 60
5.6 Autocorrela¸oes Estimadas dos Res´ıduos do modelo ARIMA. . . . . . . . . 60
5.7 Valores previstos utilizando o modelo ARIMA e valores reais da S´erie Tem-
poral Fict´ıcia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
5.8 Gr´afico contendo os valores originais da s´erie de teste que simula o com-
portamento de um modelo ARIMAX. . . . . . . . . . . . . . . . . . . . . . 62
5.9 Gr´afico contendo os valores da Entrada Ex´ogena 1 do modelo ARIMAX. . 63
5.10 Gr´afico contendo os valores da Entrada Ex´ogena 2 do modelo ARIMAX. . 63
5.11 Ru´ıdos correspondentes `a parte MA do modelo ARIMAX estimados pelo
Algoritmo ELS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
5.12 Gr´afico da S´erie Real versus erie gerada pelo modelo ARIMAX. . . . . . . 65
5.13 Gr´afico de convergˆencia do termo Z
t1
do modelo ARIMAX. . . . . . . . . 65
5.14 Gr´afico de convergˆencia do termo a
t1
do modelo ARIMAX. . . . . . . . . 66
5.15 Gr´afico de convergˆencia do termo X
1
t
do modelo ARIMAX. . . . . . . . . . 66
5.16 Gr´afico de convergˆencia do termo X
1
t1
do modelo ARIMAX. . . . . . . . . 67
5.17 Gr´afico de convergˆencia do termo X
2
t
do modelo ARIMAX. . . . . . . . . . 67
5.18 Gr´afico de convergˆencia do termo X
2
t1
do modelo ARIMAX. . . . . . . . . 68
5.19 Autocorrela¸oes Estimadas dos Res´ıduos do modelo ARIMAX. . . . . . . . 68
5.20 Valores estimados utilizando o modelo ARIMAX e valores reais da erie
Temporal Fict´ıcia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
5.21 Tela inicial do sistema de gera¸ao de modelos ARIMA/ARIMAX. . . . . . 71
5.22 Detalhe da tela do sistema de gera¸ao de modelos ARIMA/ARIMAX ap´os
os arquivos carregados contendo as entradas ex´ogenas. . . . . . . . . . . . 73
5.23 Tela do sistema de gera¸ao de modelos ap´os a gera¸ao de um modelo ARI-
MAX. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
5.24 Detalhe da tela do sistema de gera¸ao de modelos ap´os a gera¸ao de um
modelo ARIMAX, mostrando a exibi¸ao dos coeficientes do modelo gerado. 75
6.1 Colunas da planta de produ¸ao de GLP. . . . . . . . . . . . . . . . . . . . 78
6.2 S´erie Temporal de Perdas de Propano (dada em 10
6
Fra¸ao Molar) . . . . 80
6.3 Entrada Ex´ogena 1 - Vaz˜ao de Refluxo (dada em Kg.Mole/h) . . . . . . . 80
6.4 Entrada Ex´ogena 2 - Temperatura (dada em graus Celsius) . . . . . . . . . 81
6.5 Gr´afico da S´erie Real versus erie gerada pelo modelo ARIX. . . . . . . . . 81
6.6 Gr´afico da S´erie Real versus erie gerada pelo modelo ARIMAX. . . . . . . 82
6.7 S´erie Temporal de Perdas de Propano ap´os duas diferen¸cas. . . . . . . . . . 82
6.8 Gr´afico da S´erie Real diferenciada versus S´erie gerada pelo modelo ARIMAX. 83
6.9 Ru´ıdos correspondentes `a parte MA do modelo ARIMAX estimados pelo
Algoritmo ELS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
6.10 Autocorrela¸oes Estimadas dos Res´ıduos do modelo ARIMAX. . . . . . . . 85
6.11 Gr´afico de convergˆencia do termo Z
t1
do modelo ARIMAX. . . . . . . . . 86
6.12 Gr´afico de convergˆencia do termo a
t1
do modelo ARIMAX. . . . . . . . . 86
6.13 Gr´afico de convergˆencia do termo a
t2
do modelo ARIMAX. . . . . . . . . 87
6.14 Gr´afico de convergˆencia do termo a
t3
do modelo ARIMAX. . . . . . . . . 87
6.15 Gr´afico de convergˆencia do termo a
t4
do modelo ARIMAX. . . . . . . . . 88
6.16 Gr´afico de convergˆencia do termo a
t5
do modelo ARIMAX. . . . . . . . . 88
6.17 Gr´afico de convergˆencia do termo a
t6
do modelo ARIMAX. . . . . . . . . 89
6.18 Gr´afico de convergˆencia do termo X
1
t5
do modelo ARIMAX. . . . . . . . . 89
6.19 Gr´afico de convergˆencia do termo X
2
t
do modelo ARIMAX. . . . . . . . . . 90
6.20 Gr´afico de convergˆencia do termo X
2
t1
do modelo ARIMAX. . . . . . . . . 90
6.21 Gr´afico de convergˆencia do termo X
2
t2
do modelo ARIMAX. . . . . . . . . 91
6.22 Gr´afico de convergˆencia do termo X
2
t3
do modelo ARIMAX. . . . . . . . . 91
6.23 Erros Relativos de Inferˆencia (em percentuais). . . . . . . . . . . . . . . . . 92
6.24 Erros Relativos Percentuais de Inferˆencias sobre um novo conjunto de dados
da s´erie temporal. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
xix
Lista de Tabelas
4.1 Comportamento da FAC e FACP de arios modelos ARIMA. . . . . . . . . 34
5.1 Valores do CIA das combina¸oes de ordens (p,q). . . . . . . . . . . . . . . 57
xxi
Lista de Siglas
AR Auto-Regressive
ARA Alto do Rodrigues-A
ARI Auto-Regressive Integrated
ARIMA Auto-Regressive Integrated with Moving Average
ARIMAX Auto-Regressive Integrated with Moving Average and Exogenous
inputs
ARIX Auto-Regressive Integrated with Exogenous inputs
ARMA Auto-Regressive with Moving Average
ARMAX Auto-Regressive with Moving Average and Exogenous inputs
ARX Auto-Regressive with Exogenous inputs
CAM Canto do Amaro
CIA Crit´erio de Informa¸ao de Akaike
CIB Crit´erio de Informa¸ao Bayesiano
ELS Extended Least Square
EQM Erro Quadr´atico edio
FAC Fun¸ao de Autocorrela¸ao
FACE Fun¸ao de Autocorrela¸ao Estendida
FACP Fun¸ao de Autocorrela¸ao Parcial
FACV Fun¸ao de Autocovariˆancia
FV Fun¸ao de Verossimilhan¸ca
GLP as Liquefeito de Petr´oleo
IDE Integrated Development Environment
IMA Integrated with Moving Average
IMAX Integrated with Moving Average and Exogenous inputs
JDK Java Development Kit
JVM Java Virtual Machine
LGN L´ıquido de as Natural
LMS Least Mean Square
MA Moving Average
MAX Moving Average with Exogenous inputs
NARMAX Non-linear Auto-Regressive with Moving Average and Exogenous
inputs
PETROBRAS Petr´oleo Brasileiro S/A
RLS Recursive Least Square
SARIMA Seasonal Auto-Regressive Integrated with Moving Average
SQE Soma dos Quadrados dos Erros
UPGN Unidade de Processamento de as Natural
1
1 Introdu¸ao
Uma s´erie temporal ´e uma seq
¨
uˆencia de observoes de uma cole¸ao de vari´aveis
quaisquer ordenadas ao longo do tempo. Embora seja mais comum a ordena¸ao das
s´eries ao longo de unidades de tempo, como por exemplo dias, meses ou anos, tamem
´e poss´ıvel que a sua ordena¸ao seja constru´ıda ao longo de outras unidades, como por
exemplo volume, latitude, longitude, espa¸co, entre outros (MORETIN; TOLOI, 2004).
Em virtude da defini¸ao anterior, percebe-se que em uma erie temporal a ordena¸ao
´e crucial, e as observoes vizinhas ao dependentes, como ser´a verificado mais adiante.
Como exemplos de s´eries temporais de nosso cotidiano, temos: valores de temperaturas
m´edias (dadas por exemplo em graus cent´ıgrados) di´arias de uma capital brasileira; valores
de precipita¸oes atmosf´ericas mensais de uma cidade; valores anuais do Produto Interno
Bruto de um pa´ıs; valores dos pre¸cos di´arios de oes da empresa Petr´oleo Brasileiro S/A
(PETROBRAS); etc.
A Figura 1.1 ilustra uma s´erie temporal fict´ıcia de observoes da vari´avel taxa de va-
ria¸ao do valor do d´olar, exibida em forma de um gr´afico. Os valores das taxas de varia¸ao
do d´olar s˜ao representados em n´umeros reais e a s´erie ´e ordenada no dom´ınio do tempo (a
unidade de tempo utilizada ´e dia). A s´erie temporal fict´ıcia possui 78 amostras, ordenadas
do dia 18/08/2007 ao dia 03/11/2007. A exibi¸ao da erie temporal em forma de gr´aficos
permite a verifica¸ao visual, por especialistas, de caracter´ısticas importantes da s´erie, tais
como estacionariedade, tendˆencia e sazonalidade, que ser˜ao descritos posteriormente nesta
disserta¸ao.
Neste trabalho, a an´alise das eries temporais ser´a realizada no dom´ınio do tempo, e
ao ser´a abordada a an´alise no dom´ınio da freq
¨
uˆencia. Quando se faz uma an´alise de uma
s´erie temporal, pode-se estar interessado em arios objetivos diferentes, como (MORETIN;
TOLOI, 2004):
Descobrir o mecanismo que gerou a erie temporal;
Descrever o comportamento da erie (se existe tendˆencia, sazonalidade, ciclos, out-
liers, etc);
Encontrar rela¸oes da s´erie com outras eries temporais;
Fazer previs˜ao de valores futuros, e
Fazer estima¸ao dos valores de sa´ıda, apenas de posse dos valores de entrada.
Dada uma erie temporal Z, para representar um valor observado da erie temporal
em um instante de tempo, utiliza-se Z
t
, onde t conem um instante de tempo representado
2 1 Introdu¸ao
Figura 1.1: erie Temporal fict´ıcia da taxa de varia¸ao do olar em dias.
em uma unidade de tempo qualquer (podendo ser ano, es, dia, horas de um dia, entre
outros) e Z
t
conem o valor da erie temporal no instante de tempo t. O valor de Z
t
pode
ser representado em unidades de medida diferentes, dependendo da vari´avel que a erie
temporal representa, como por exemplo, graus celsius para representar temperaturas, reais
para representar valores de oes de uma empresa, etc. Tendo-se como exemplo a erie
temporal (Z) de temperatura edia di´aria de uma capital brasileira, e como instante de
tempo t o dia 01-03-2007, a temperatura m´edia observada ´e representada em
o
C (graus
celsius):
Z
01032007
= 32
o
C
Uma erie temporal pode ser classificada em discreta ou cont´ınua, e essa classifica¸ao
refere-se aos valores que a erie temporal pode assumir, uma erie discreta armazena va-
lores enumer´aveis, como n´umero de cirurgias realizadas, enquanto que uma erie cont´ınua
pode assumir qualquer valor real, como a temperatura de uma cidade (MORETIN; TOLOI,
2004).
Esta classifica¸ao refere-se tamem `as unidades de tempo nas quais as observoes s˜ao
coletadas. Se t pertence a um conjunto finito e enumer´avel, como por exemplo o conjunto
dos dias do ano, a erie ´e discreta, se pertencer ao conjunto R (n´umeros reais) a s´erie
ser´a cont´ınua. Como exemplo do segundo caso, temos o conjunto de registro de mar´e em
um porto. Este conjunto forma uma s´erie temporal cont´ınua, porque existe o registro da
mar´e em todos os instantes (representado por um n´umero real) ao longo do intervalo de
um dia, o espa¸co de tempo das observoes ´e cont´ınuo (MORETIN; TOLOI, 2004).
a as eries temporais discretas podem ser sub-classificadas em (MORETIN; TOLOI,
2004):
1 Introdu¸ao 3
Inerentemente discreta: ao s´eries temporais cujas observoes s´o existem no espa¸co
de tempo discreto, como a cada dia, a cada mˆes, etc. Como exemplo, tem-se a
s´erie de ´ındices di´arios da Bolsa de Valores de ao Paulo, onde as observoes ao
coletadas a cada per´ıodo de um dia;
erie cont´ınua discretizada: ao s´eries temporais cont´ınuas que ao transformadas
em eries discretas, atrav´es de sua amostragem a per´ıodos de tempo fixos. Por
exemplo, a erie de registro de mar´es pode ser discretizada pegando-se seu valores
a cada per´ıodo de uma hora;
erie de valores acumulados: ao s´eries temporais discretas que ao formadas acumu-
lando-se valores em intervalo de tempo iguais. Por exemplo, a s´erie temporal de
precipita¸ao atmosf´erica anual de uma cidade ´e formada somando-se as observoes
de precipita¸ao atmosf´erica desta cidade durante um ano inteiro.
Por´em uma erie Z
t
pode conter arios valores, bem como t ao necessariamente
representa o tempo, mas pode representar outra vari´avel (ou at´e mesmo um conjunto
delas). Como exemplo, tem-se:
Z
t
= [Z
1
t
, Z
2
t
, Z
3
t
],
t = (tempo, latitude, longitude)
onde Z
t
´e um vetor de dimens˜ao rx1, e as trˆes componentes representam respectivamente
a altura, a temperatura e a press˜ao, e t ´e um vetor de dimens˜ao px1 contendo os valo-
res: tempo, latitude, longitude. Segundo Moretin e Toloi (2004), diz-se que esta s´erie ´e
multivariada (r = 3) e tamb´em multidimensional (p = 3).
A seguir, tem-se algumas caracter´ısticas que ao particulares aos dados de uma s´erie
temporal (ANSUJ; ALMEIDA; SANTOS, 2005):
Observoes correlacionadas ao mais dif´ıceis de analisar e requerem t´ecnicas espe-
c´ıficas;
Fatores complicadores como presen¸ca de tendˆencias e varia¸ao sazonal ou c´ıclica
podem ser dif´ıceis de estimar ou remover;
A sele¸ao de modelos pode ser bastante complicada, e as ferramentas podem ser de
dif´ıcil interpreta¸ao;
´
E mais dif´ıcil de lidar com observoes perdidas e dados discrepantes devido `a na-
tureza seq
¨
uencial.
Assim, no contexto de eries temporais, os principais objetivos desta disserta¸ao ao:
O desenvolvimento de um ambiente computacional para a determina¸ao de s´eries
temporais monovariadas e monodimensionais, descritas por modelos do tipo Auto-
Regressive Integrated with Moving Average (ARIMA) e Auto-Regressive Integrated
with Moving Average and Exogenous inputs (ARIMAX), incorporando as etapas de:
4 1 Introdu¸ao
Escolha do tipo do modelo, que pode ser escolhido pelo usu´ario do ambiente;
Determina¸ao das ordens e atrasos do modelo, utilizando-se o Crit´erio de In-
forma¸ao de Akaike (CIA);
Determina¸ao dos coeficientes do modelo, utilizando os algoritmos Recursive
Least Squares (RLS) e Extended Least Squares (ELS);
Aplica¸ao desses algoritmos para obten¸ao de modelos ARIMA/ARIMAX adequa-
dos `a estima¸ao de valores de perdas de propano no topo da coluna deetanizadora
de uma Unidade de Processamento de as Natural. Assim, o modelo obtido funci-
onar´a como um sensor de software, que ir´a fazer a inferˆencia daquele valor apenas
de posse dos valores de vaz˜ao de refluxo e temperatura na coluna deetanizadora.
O restante desta disserta¸ao est´a organizada de acordo com os seguintes cap´ıtulos:
O Cap´ıtulo 2 detalha processos estoc´asticos e s´eries temporais, e suas principais carac-
ter´ısticas como estacionariedade, tendˆencia e sazonalidade, al´em de dar uma vis˜ao geral
dos modelos mais utilizados para modelar as eries temporais. O Cap´ıtulo 3 detalha os
modelos de interesse neste trabalho, que ao os modelos ARIMA e ARIMAX. O Cap´ıtulo
4 aborda as etapas envolvidas no processo de cria¸ao do modelo ARIMA/ARIMAX para
uma s´erie temporal. O Cap´ıtulo 5 apresenta alguns testes realizados com s´eries temporais
fict´ıcias e seus resultados pr´evios, com o prop´osito de valida¸ao dos algoritmos desenvolvi-
dos. O Cap´ıtulo 6 cont´em um estudo de caso que trata-se de uma s´erie temporal de perdas
de propano em uma unidade de processamento de as natural, sobre a qual ser´a utilizado
o ambiente computacional aqui desenvolvido para a realiza¸ao de estima¸oes de valores
de perda na referida unidade. E por fim, o Cap´ıtulo 7 cont´em as principais conclus˜oes do
trabalho.
5
2 Processos Estoasticos e S´eries
Temporais
Um processo estoastico ´e uma fam´ılia Z = {Z(t), t T }, onde T ´e um conjunto
arbitr´ario, tal que, para cada t T , Z(t) ´e uma vari´avel aleat´oria, e toda a fam´ılia de
vari´aveis aleat´orias ´e definida num mesmo espa¸co de probabilidades (MORETIN; TOLOI,
2004).
O conjunto T pode ser o conjunto dos inteiros Z, o conjunto dos reais R ou o que
geralmente ´e utilizado: o conjunto dos inteiros positivos Z+. Para um dado t, Z(t) ´e uma
vari´avel aleat´oria do tipo Real.
Como, para t T , Z(t) ´e uma vari´avel aleat´oria definida sobre Ω, ent˜ao Z(t) ´e na
verdade uma fun¸ao de dois argumentos, Z(t, ω), onde t T , ω Ω, e ´e o conjunto
dos valores poss´ıveis de probabilidade de um evento de uma vari´avel aleat´oria (MORETIN;
TOLOI, 2004).
Figura 2.1: Exemplo de um processo estoastico (um conjunto de vari´aveis aleat´orias).
A Figura 2.1 ilustra um processo estoastico, que ´e constitu´ıdo por um conjunto de
vari´aveis aleat´orias, onde f
z
(z) ´e a fun¸ao de densidade de probabilidade da vari´avel
aleat´oria Z(t, ω), e t T . A fun¸ao de densidade de probabilidade de uma vari´avel
6 2 Processos Estoasticos e eries Temporais
aleat´oria ´e a derivada da fun¸ao de distribui¸ao desta vari´avel aleat´oria, ou seja:
f
z
(z) =
dF
z
(z)
dz
(2.1)
Figura 2.2: Uma vari´avel aleat´oria com uma fun¸ao densidade de probabilidade corres-
pondente (para um valor de t fixado).
Figura 2.3: Uma erie temporal em fun¸ao do tempo (para um valor de ω fixado).
A fun¸ao de distribui¸ao F
z
(z) ´e uma fun¸ao cumulativa de uma vari´avel aleat´oria, e
esta fun¸ao ´e constru´ıda de acordo com a seguinte equa¸ao:
F
z
(z) = P {Z z} (2.2)
onde Z ´e uma vari´avel aleat´oria, {Z z} ´e um evento (expresso em n´umero real) da
vari´avel aleat´oria Z, sendo que z (min´usculo) pode variar de −∞ a +, e P {Z z} ´e a
2.1 eries Temporais ao-estacion´arias 7
probabilidade do evento {Z z} ocorrer. Para cada t T , temos uma vari´avel aleat´oria
Z(t, ω) com uma fun¸ao de densidade de probabilidade (f
z
(z)), como pode ser visto na
Figura 2.2, enquanto que para cada ω Ω, obt´em-se uma fun¸ao de t que ´e uma trajet´oria
do processo, que tamb´em ´e conhecida por erie Temporal, como pode ser visto na Figura
2.3.
Um processo estoastico pode ser estacion´ario ou ao-estacion´ario. Uma defini¸ao
intuitiva de processo estacion´ario diz respeito ao processo que se desenvolve no tempo de
modo que a escolha de uma origem dos tempos ao ´e importante, ou seja, as caracter´ısticas
de Z(t + τ), τ, ao as mesmas de Z(t) (MORETIN; TOLOI, 2004).
2.1 S´eries Temporais ao-estacion´arias
As s´eries temporais podem ser analisadas de acordo com a sua estacionariedade. Uma
s´erie temporal estacion´aria ´e uma s´erie cujos dados ao longo do tempo se mantˆem ao redor
de um valor m´edio (a m´edia ´e constante). Enquanto uma s´erie temporal ao-estacion´aria
´e aquela cujos dados ao longo do tempo ao se mantˆem ao redor de um valor edio,
mas ao inv´es disto apresentam uma tendˆencia (negativa ou positiva) e/ou apresentam
sazonalidade ou ciclo (MORETIN; TOLOI, 2004).
S´eries Temporais que apresentam a caracter´ıstica de ao-estacionariedade necessitam
de uma transforma¸ao pr´evia para torn´a-la uma erie estacion´aria. Para isso ´e reali-
zada uma opera¸ao de diferencia¸ao na s´erie original. Pode-se diferenciar uma erie uma
vez, duas vezes, ou n vezes, por´em na maioria dos casos apresentados na literatura, uma
diferencia¸ao a ´e suficiente para torn´a-la estacion´aria, e em casos mais raros duas dife-
rencia¸oes a resolvem o problema, ao sendo necess´ario mais que duas diferencia¸oes em
s´eries temporais (MORETIN; TOLOI, 2004). Quando a s´erie for discreta no tempo, utiliza-se
a opera¸ao de diferen¸ca para reobter a estacionariedade da erie.
Dada uma erie temporal Z
t
, com N valores, a erie resultante de uma diferen¸ca W
t
,
com (N 1) valores, ser´a igual a:
Z
t
= W
t
= Z
t
Z
t1
para t = 2...N , onde representa a opera¸ao de diferen¸ca.
A segunda diferen¸ca de Z
t
ser´a igual a:
∆(∆Z
t
) = ∆W
t
= V
t
= W
t
W
t1
, para t = 3, ..., N
Assim a s´erie temporal W
t
conter´a um valor a menos que Z
t
, e V
t
conter´a dois valores
a menos que Z
t
, por´em os instantes de tempo t continuam os mesmos.
8 2 Processos Estoasticos e eries Temporais
2.2 Outras Transforma¸oes Pr´evias para S´eries Tem-
porais
Al´em da diferencia¸ao/diferen¸ca, existem outras transforma¸oes que podem ser re-
alizadas na erie Temporal, de acordo com as caracter´ısticas da mesma, antes de se
encontrar um modelo adequado para ela. Em algumas casos como em eries temporais
financeiras, pode ser preciso realizar uma transforma¸ao ao-linear com a finalidade de
tornar a variˆancia da s´erie constante, al´em de posteriormente realizar a transforma¸ao de
diferencia¸ao/diferen¸ca (MORETIN; TOLOI, 2004).
O fenˆomeno de ao-constˆancia na variˆancia ´e denominado de volatilidade na literatura
de eries temporais e pode ser tratado atrav´es de transforma¸oes nos dados (como por
exemplo a aplica¸ao da fun¸ao logar´ıtmica na erie), segundo Ehlers (2005).
Supondo uma s´erie, por exemplo, que possua uma variˆancia crescente, ´e indicado pela
literatura que seja realizada uma transforma¸ao logar´ıtmica na mesma, como:
W
t
= log(Z
t
) (2.3)
para todo t.
´
E importante ter em mente que, uma vez que a s´erie temporal sofreu uma transforma-
¸ao pr´evia qualquer, o modelo encontrado para modelar a erie na verdade ´e um modelo
da s´erie transformada e ao um modelo da erie original.
Segundo Moretin e Toloi (2004), alguns autores conclu´ıram que transforma¸oes ao
melhoram a qualidade da previs˜ao. Outros verificaram que dados transformados em
pouco efeito na melhoria da previs˜ao. a outros mostram que as previs˜oes dos anti-
logaritmos dos dados transformados ao estimadores viesados e portanto, deveriam ser
ajustados.
As previs˜oes viesadas em o sentido de que as previs˜oes realizadas em uma erie tem-
poral que foi diferenciada ou sofreu outra transforma¸ao, ao correspondem a previs˜oes
reais daquela erie, pois correspondem a previs˜oes realizadas com base nos dados diferen-
ciados ou transformados (dados diferentes da erie temporal original). Para tornar essas
previs˜oes alidas (n˜ao-viesadas) para a erie temporal original ´e necess´ario submeter as
previs˜oes a transforma¸oes inversas `as que foram aplicadas na s´erie temporal original.
Portanto, se a s´erie foi diferenciada, as previs˜oes ser˜ao integradas. Por exemplo, se a s´erie
foi transformada de acordo com a fun¸ao logar´ıtmica, as previs˜oes ser˜ao transformadas de
acordo com a fun¸ao exponencial. Caso esta transforma¸ao ao seja realizada, as previ-
oes resultantes poder˜ao ser viesadas, como descrito anteriormente, e assim poder˜ao ao
corresponder `a realidade.
Apesar de ao melhorar a qualidade das previs˜oes, a transforma¸ao de diferencia-
¸ao/diferen¸ca ´e ´util quando ´e preciso eliminar a tendˆencia existente na erie temporal.
Por exemplo, em eries temporais que possuem tendˆencia e sazonalidade, ´e preciso elimi-
nar a tendˆencia antes de realizar algum tipo de teste de existˆencia de sazonalidade, sendo
esta elimina¸ao realizada atrav´es da diferencia¸ao/diferen¸ca. Caso a existˆencia de sazo-
nalidade seja confirmada, a diferencia¸ao/diferen¸ca realizada na s´erie temporal original
elimina o efeito da tendˆencia sobre ela e torna poss´ıvel analisar a sua parte sazonal de
2.3 Modelos para eries Temporais 9
forma independente, podendo assim, por exemplo, estimar um modelo SARIMA para a
s´erie temporal.
2.3 Modelos para S´eries Temporais
Existem diversos modelos que representam as s´eries temporais, e esses modelos se
dividem entre os modelos param´etricos, onde a an´alise da s´erie se a no dom´ınio do tempo
e o modelo conem um n´umero finito de parˆametros, e os modelos ao-param´etricos, que
em geral a an´alise da erie se a no dom´ınio da freq
¨
uˆencia (MORETIN; TOLOI, 2004).
Neste trabalho ser˜ao utilizados apenas os modelos param´etricos, pois a an´alise da erie
ser´a realizada no dom´ınio do tempo.
Entre os modelos param´etricos mais utilizados temos:
Modelos de Erro ou Regress~ao: Modelo da forma Z
t
= f(t) + a
t
, para t = 1, ..., N,
onde f(t) ´e chamado sinal e a
t
´e um ru´ıdo. Esta ´e uma forma geral para modelos de
regress˜ao, por´em f(t) pode assumir formas diferentes, podendo ser: uma constante;
uma fun¸ao linear; um polinˆomio em t (de baixo grau); ou um polinˆomio harmˆonico
(com combina¸oes lineares de seno e cosseno).
Modelos Estruturais: que permitem uma variabilidade nas componentes tendˆencia, sa-
zonalidade e n´ıvel do modelo.
Modelos n~ao-lineares: descreve s´eries que ao podem ser descritas por modelos li-
neares. Como exemplo de modelo ao-linear, tem-se o modelo Non-linear Auto-
Regressive with Moving Average and Exogenous inputs (NARMAX).
Modelos ARIMA: modelos gerais capazes de representar processos lineares estacion´arios,
processos lineares ao-estacion´arios homogˆeneos e processos de mem´oria longa.
´
E
utilizado para eries cujos valores atuais dependem apenas de seus valores passados
e/ou valores passados de um ru´ıdo aleat´orio, mais um ru´ıdo aleat´orio no instante
atual (com edia zero e variˆancia constante). Engloba os modelos Auto-Regressive
(AR), Auto-Regressive Integrated (ARI), Moving Average (MA), Integrated with Mo-
ving Average (IMA) e Auto-Regressive with Moving Average (ARMA).
Modelos ARIMAX: modelos similares aos modelos ARIMA, por´em, adicionalmente, pos-
suem entradas ex´ogenas. Engloba os modelos Auto-Regressive with Exogenous in-
puts (ARX), Auto-Regressive Integrated with Exogenous inputs (ARIX), Moving
Average with Exogenous inputs (MAX), Integrated with Moving Average and Exoge-
nous inputs (IMAX) e Auto-Regressive with Moving Average and Exogenous inputs
(ARMAX).
Modelos SARIMA: modelo Seasonal Auto-Regressive Integrated with Moving Average (SA-
RIMA), corresponde a um modelo ARIMA mais uma componente sazonal.
Como podemos ver, arios modelos lineares derivam do modelo geral ARIMAX. O
diagrama da Figura 2.4 mostra as subdivis˜oes do modelo ARIMAX. Assim, o modelo
ARIX ´e um modelo ARIMAX sem a parte de m´edia ovel, o modelo IMAX ´e um modelo
10 2 Processos Estoasticos e eries Temporais
ARIMAX sem a parte auto-regressiva, o modelo ARMAX ´e um modelo ARIMAX sem
diferencia¸ao/diferen¸ca na erie e o modelo ARIMA ´e um modelo ARIMAX sem a parte
ex´ogena (n˜ao possui entrada(s) ex´ogena(s)).
Figura 2.4: Diagrama de subdivis˜oes do modelo ARIMAX.
Nesta disserta¸ao, estamos interessados em modelos do tipo ARIMA e ARIMAX.
2.4 Tendˆencias, Sazonalidades, Ciclos, Aleatoriedade
e Outliers
Uma erie Z
1
, ..., Z
n
pode ser escrita como uma fun¸ao de quatro componentes indi-
viduais: sazonalidade, tendˆencia, ciclo e aleatoriedade.
Z = f(S, T, C, E)
onde, em um per´ıodo t, S corresponde `a componente sazonal; T `a tendˆencia; C ´e a
componente de ciclo e E ´e a componente aleat´oria (SILVA, 2004).
Uma erie com tendˆencia significa que ela ao possui os seus valores flutuando ao
redor de um valor fixo, mas possui um aumento ou decl´ınio gradual nestes valores (SILVA,
2004).
2.4 Tendˆencias, Sazonalidades, Ciclos, Aleatoriedade e Outliers 11
a os ciclos, bem como a sazonalidade, ao altera¸oes que acontecem nos valores da
s´erie temporal de acordo com o tempo, e essas altera¸oes se repetem a cada intervalo fixo
de tempo, que pode ser semestralmente, anualmente, etc (SILVA, 2004).
Assume-se que a componente aleat´oria ´e supostamente um ru´ıdo branco, com m´edia
zero e variˆancia constante (SILVA, 2004).
Existe uma certa chance de se confundir a defini¸ao de sazonalidade com a de ciclo.
Basicamente varia¸oes sazonais s˜ao varia¸oes de aumento ou diminui¸ao ocorridas durante
o espa¸co de tempo, de um ano por exemplo, e que seguem algum evento, como as esta¸oes
do ano, ou per´ıodos de safra e entressafra de algum produto. Enquanto que o ciclos ao
repeti¸oes de valores que acontecem em intervalos de tempo bem definidos, podendo ser
definido quando um ciclo se fecha e outro se inicia. Os ciclos podem ser di´arios, anuais,
sazonais, etc.
Outliers ao valores muito discordantes presentes em eries temporais. A presen¸ca de
outliers pode ter impactos negativos na an´alise de eries temporais, como por exemplo,
interferir na estima¸ao dos coeficientes dos parˆametros de modelos ARIMA/ARIMAX,
fazendo-se com que valores incorretos sejam estimados (PALMA, 1998). Esta interferˆencia
na estima¸ao dos coeficientes do modelo acontece porque nas eries temporais as obser-
voes vizinhas ou adjacentes ao correlacionadas, fazendo com que um valor discrepante
em um instante de tempo interfira no valor de arios valores subseq
¨
uentes no modelo
ARIMA/ARIMAX estimado. Em eries que contˆem outliers, a melhor abordagem a ser
utilizada para o problema em quest˜ao ´e tentar limitar a influˆencia desses outliers na mo-
delagem das s´eries temporais. Uma forma de limitar essa influˆencia, na fase de estima¸ao
dos coeficientes do modelo, ´e atribuindo-se pesos pequenos `as observoes discordantes.
Entretanto, os estudos sobre outliers em eries temporais, incluindo estudos sobre m´etodos
de detec¸ao e acomoda¸ao, ainda s˜ao escassos, principalmente devido `a sua complexidade
(PALMA, 1998).
Existem arios m´etodos para se estimar a tendˆencia presente nas eries temporais.
Entre eles temos (MORETIN; TOLOI, 2004):
1. Tendˆencia Polinomial: Encontra-se uma fun¸ao (polinomial, exponencial, log´ıstica,
etc) que se ajusta bem aos dados da erie temporal, e a partir dela encontra-se a
fun¸ao que representa a tendˆencia. Ex. Se a fun¸ao polinomial Z
t
= B
0
+ B
1
.t + a
t
representa uma dada s´erie temporal, e considerando-se que esta erie possui apenas
tendˆencia (´e livre de sazonalidade), enao temos que: Z
t
= T
t
+a
t
. Logo, a tendˆencia
´e encontrada por: T
t
= B
0
+ B
1
.t.
2. Suaviza¸ao: Com este etodo, a tendˆencia no instante t ´e estimada utilizando-se
2v + 1 valores da s´erie temporal, sendo v valores anteriores a t, v valores posteriores
a t, e o valor Z
t
. Esse m´etodo pode-se subdividir em:
(a) edias oveis:
T
t
=
1
(2v + 1)
v
j=v
Z
t+j
(2.4)
12 2 Processos Estoasticos e eries Temporais
(b) Medianas:
T
t
= mediana(Z
tv
, Z
tv+1
, ..., Z
t+v
) (2.5)
3. Diferen¸cas:
´
E realizada a diferen¸ca da s´erie para eliminar a tendˆencia (n˜ao para
estim´a-la). Por´em para se eliminar a tendˆencia, o n´umero de diferen¸cas deve ser
igual a m, onde m ´e o grau do polinˆomio que representa a tendˆencia. Por exemplo:
Se Z
t
= B
0
+ B
1
.t + a
t
(s´erie com tendˆencia) ap´os uma diferen¸ca temos: ∆(Z
t
) =
B
1
+ a
t
a
t1
(s´erie sem tendˆencia).
Existem tamb´em arios testes para verificar se uma erie cont´em ou ao tendˆencia.
´
E importante salientar que caso uma erie contenha tendˆencia e sazonalidade ´e preciso
eliminar a sazonalidade antes de realizar o teste de existˆencia de tendˆencia, e o contr´a-
rio tamb´em: ´e preciso eliminar a tendˆencia antes de realizar o teste de existˆencia de
sazonalidade (MORETIN; TOLOI, 2004).
Uma vez que a foi definido o que ´e sazonalidade, ´e importante ressaltar algumas de
suas caracter´ısticas. Suponha uma s´erie mensal cujos valores apresentam um comporta-
mento parecido a cada per´ıodo de um ano. Provavelmente esta erie possui sazonalidade,
com per´ıodo de um ano. Em eries como esta, os valores de meses sucessivos (dentro de
um mesmo ano) ao relacionadas; e os valores de anos sucessivos (para um mesmo mˆes)
tamem ao relacionados.
No caso em que a componente sazonal ao variar muito de ano para ano, representa-se
a erie temporal como: Z
ij
= T
ij
+ S
j
+ a
ij
, para i = 1...n´umero de anos e j = 1, ..., 12,
onde S
j
´e uma constante, existindo uma constante para cada es do ano (MORETIN;
TOLOI, 2004).
No caso em que a componente sazonal variar de ano para ano, representa-se a erie
temporal como: Z
ij
= T
ij
+ S
ij
+ a
ij
, para i = 1...n´umero de anos e j = 1, ..., 12, onde S
ij
´e a componente sazonal do ano i e es j (MORETIN; TOLOI, 2004).
Entre os m´etodos de estima¸ao de sazonalidade temos (MORETIN; TOLOI, 2004):
1. etodo de Regress˜ao: Que ´e adequado para s´eries que apresentam sazonalidade
determin´ıstica (ou seja, que pode ser prevista a partir de meses anteriores). Temos
que:
T
t
=
m
j=0
β
j
.t
j
(2.6)
S
t
=
11
j=1
α
j
.D
tj
(2.7)
Z
t
= T
t
+ S
t
+ a
t
=
m
j=0
β
j
.t
j
+ S
t
=
11
j=1
α
j
.D
tj
+ a
t
(2.8)
onde m ´e a ordem do polinˆomio que representa a tendˆencia, N ´e o n´umero de
2.4 Tendˆencias, Sazonalidades, Ciclos, Aleatoriedade e Outliers 13
amostras da s´erie temporal, D
tj
´e o valor da matriz D na linha t e coluna j, sendo
que a matriz D ´e constru´ıda com as ordens N por 11, e o valor de D na posi¸ao da
linha t e coluna j ser´a:
D
tj
=
1 se per´ıodo t corresponde ao mˆes j;
1, se per´ıodo t corresponde ao mˆes 12;
0, caso contr´ario.
D
Nx11
=
D
11
D
21
··· D
11,1
D
12
D
22
··· D
11,2
.
.
.
.
.
.
D
1N
D
2N
··· D
11,N
Em forma matricial, tem-se:
Z = Cβ + Dα + a (2.9)
onde:
Z
Nx1
=
Z
1
.
.
.
Z
N
, C
Nx(m+1)
=
1 1 ··· 1
1 2 ··· 2
m
.
.
.
.
.
.
1 N ··· N
m
,
β
(m+1)x1
=
β
0
β
1
.
.
.
β
m
, α
11x1
=
α
1
α
2
.
.
.
α
11
, a
Nx1
=
a
1
a
2
.
.
.
a
N
A Equa¸ao 2.10 pode ser escrita tamb´em na forma descrita abaixo:
Z = Xγ + a (2.10)
onde:
X = [ C : D ] , γ =
β
···
α
de modo que a matriz X ser´a formada pela matriz C concatenada com a matriz
D. Logo, X ter´a N linhas por m + 12 colunas (correspondentes ao resultado de
(m+1) colunas de C somadas a 11 colunas de D). Enquanto que ˆγ (γ estimado) ´e
encontrado por:
ˆγ = [X
X]
1
.X
Z (2.11)
2. etodo de m´edias m´oveis: Que ´e adequado para s´eries com sazonalidade estoastica
(ou seja, que varia com o tempo). Temos que:
Z
t
= T
t
+ S
j
+ a
t
(2.12)
onde j = 1, ..., 12
14 2 Processos Estoasticos e eries Temporais
S
t
= Y
.j
Y (2.13)
onde Y
.j
representa a m´edia do mˆes j, para j = 1...12 (j representa os meses de
janeiro a dezembro, respectivamente), e ´e dada por:
Y =
1
12
12
j=1
Y
.j
(2.14)
Y
.j
=
1
n
j
n
j
i=1
Y
ij
(2.15)
Y
t
= Z
t
ˆ
T
t
(2.16)
onde Y ´e a erie temporal Z menos a tendˆencia estimada
ˆ
T . Y
ij
´e o valor da s´erie
temporal (sem tendˆencia) observada no ano i, para i = 1, ..., p anos, e no mˆes j,
para j = 1, ..., 12 meses e n
j
´e a quantidade de amostras da erie no es j.
2.5 Modelos de Suaviza¸ao Exponencial
Estes modelos fazem parte da categoria de Modelos de Erro ou Regress˜ao, citada an-
teriormente. Modelos de Suaviza¸ao tratam-se de um conjunto de modelos onde valores
de pico de uma erie temporal ao considerados ru´ıdos, e esses extremos devem ser su-
avizados. Nesses modelos, essa s´erie suavizada cont´em os valores bases da erie, e esses
valores ao utilizados para predi¸ao dos valores futuros (MORETIN; TOLOI, 2004).
Por´em al´em dos ru´ıdos, existem em algumas s´eries temporais outras componentes im-
portantes: a tendˆencia e a sazonalidade. Para a predi¸ao dos valores futuros, ´e necess´ario
antes detectar se essas duas componentes est˜ao presentes a s´erie, e em caso positivo, elas
devem ser removidas.
2.5.1 eries Temporais Sem Tendˆencia e Sem Sazonalidade
Um dos modelos dessa classe ´e o modelo para s´eries localmente constantes, ou seja,
que n˜ao possuem tendˆencia nem sazonalidade. Esse modelo cont´em apenas um n´ıvel mais
um ru´ıdo aleat´orio (MORETIN; TOLOI, 2004):
Z
t
= µ
t
+ a
t
(2.17)
para t = 1, ..., N.
2.5 Modelos de Suaviza¸ao Exponencial 15
Dado este modelo, existem arias ecnicas de suaviza¸ao da s´erie temporal, como
m´edia ovel simples e suaviza¸ao exponencial simples.
2.5.1.1 M´edias oveis Simples
Nesse procedimento ´e calculada uma edia aritm´etica com os ´ultimos s valores da
s´erie, que ao de Z
ts+1
at´e Z
t
, onde t ´e o instante cujo valor suavizado est´a sendo
calculado (MORETIN; TOLOI, 2004):
Suavizado(t) =
(Z
t
+ Z
t1
+ ... + Z
ts+1
)
s
(2.18)
Este valor ´e calculado para t = 1, ..., N (tamanho da s´erie). O conjunto de todos esses
valores ´e a erie temporal suavizada.
As vantagens deste m´etodo ao a simplicidade e a flexibilidade com o ajuste do parˆa-
metro s e sua caracter´ıstica de ser aplic´avel a s´eries com poucas observoes.
Como desvantagens, tem-se: aplica¸ao limitada apenas para eries estacion´arias; ar-
mazenamento de (s 1) observoes; dificuldade de escolher o melhor s.
A previs˜ao de dados futuros ´e realizada a partir da seguinte equa¸ao:
ˆ
Z
t
(h) =
Suavizado(t), onde
ˆ
Z
t
(h) representa o valor da previs˜ao da erie temporal Z no ins-
tante de tempo t + h, sendo t o ´ultimo instante de tempo da s´erie temporal no qual
tem-se o valor conhecido da s´erie. Por isso, diz-se que foi realizada uma previs˜ao h passos
(ou unidades de tempo) no futuro, contados a partir do instante de tempo base que ´e t
(MORETIN; TOLOI, 2004).
Na ecnica de edias oveis simples, percebe-se que a predi¸ao ser´a a mesma para
todos os valores de h: o valor suavizado no instante t. Logo,
ˆ
Z
t
(h) =
ˆ
Z
t
(h + 1) =
ˆ
Z
t
(h + 2) = ... .
O comportamento deste m´etodo depende da escolha de s. Para s´eries muito aleat´o-
rias deve-se usar s igual ou pr´oximo de N, para que seja calculada a m´edia de todos os
valores da s´erie. Caso contario, usa-se um valor pr´oximo de 1 para s, para que apenas al-
guns valores mais recentes sejam utilizados para prever valores futuros (MORETIN; TOLOI,
2004).
2.5.1.2 Suaviza¸ao Exponencial Simples
Este m´etodo corresponde a uma m´edia ponderada, cujos pesos das observoes mais
novas ao maiores que os pesos das observoes mais antigas (MORETIN; TOLOI, 2004).
Neste m´etodo, temos a equa¸ao:
Z
t
= α
t1
k=0
((1 α)
k
Z
tk
) + (1 α)
t
Z
0
(2.19)
para t = 1, ..., N, onde Z
t
´e o valor suavizado exponencialmente e α ´e a constante de
suaviza¸ao que deve estar entre 0 e 1. Quanto menor for α, as observoes passadas ter˜ao
16 2 Processos Estoasticos e eries Temporais
maior peso e como conseq
¨
uˆencia, as previs˜oes ao mais est´aveis `as observoes aleat´orias.
Por outro lado, quanto maior for α, as observoes recentes ter˜ao maior peso (MORETIN;
TOLOI, 2004).
Para realizar a predi¸ao, temos que:
ˆ
Z
t
(h) = Z
t
, h > 0.
Este m´etodo tem a vantagem da simplicidade, acil implementa¸ao, flexibilidade gra¸cas
`a constante de suaviza¸ao e ao necessita armazenar muitas informa¸oes.
A desvantagem deste etodo reside na dificuldade em determinar o melhor valor da
constante de suaviza¸ao.
2.5.2 eries Temporais Com Tendˆencia e Sem Sazonalidade
Um modelo para eries temporais que apresentam tendˆencia mas ao possuem sazo-
nalidade ´e descrito por:
Z
t
= µ
t
+ a
t
+ T
t
(2.20)
para t = 1, ..., N, onde µ
t
´e o n´ıvel; T
t
´e a componente de tendˆencia e a
t
´e o ru´ıdo aleat´orio
com m´edia zero e variˆancia constante (MORETIN; TOLOI, 2004).
2.5.2.1 Suaviza¸ao Exponencial de Holt
Este m´etodo de suaviza¸ao para eries com tendˆencia, possui duas constantes de su-
aviza¸ao, uma (A) que atua no n´ıvel do modelo, e outra (C) que atua na tendˆencia do
mesmo, ambas com valores entre 0 e 1. A equa¸ao do valor suavizado ´e (MORETIN; TOLOI,
2004):
Z
t
= AZ
t
+ (1 A)(Z
t1
+
ˆ
T
t1
) (2.21)
para t = 2, ..., N, onde:
ˆ
T
t
= C(Z
t
Z
t1
) + (1 C)
ˆ
T
t1
(2.22)
para t = 2, ..., N, onde
ˆ
T ´e a componente de tendˆencia estimada. Os valores de Z
t
e
ˆ
T
t
ao calculados para t 2. Para t 3, ao utilizadas as Equa¸oes 2.21 e 2.22, enquanto
que para t = 2, ao utilizados os valores iniciais aproximados seguintes (MORETIN; TOLOI,
2004):
ˆ
T
2
= Z
2
Z
1
(2.23)
Z
2
= Z
2
(2.24)
As previs˜oes ao realizadas a partir da equa¸ao:
ˆ
Z
t
(h) = Z
t
+ h
ˆ
T
t
(2.25)
2.5 Modelos de Suaviza¸ao Exponencial 17
Para se determinar as duas constantes de suaviza¸ao, deve-se escolher os valores A
e C tais que o erro quadr´atico m´edio (EQM) de previs˜ao seja o menor poss´ıvel. O erro
quadr´atico m´edio de previs˜ao ´e definido como a esperan¸ca da diferen¸ca entre o valor real e
o valor previsto da s´erie elevada ao quadrado, como mostrado na Equa¸ao 2.26 (MORETIN;
TOLOI, 2004).
EQM(
ˆ
Z
t
(h)) = E(Z
t+h
ˆ
Z
t
(h))
2
(2.26)
As vantagens deste m´etodo ao as mesmas do m´etodo de Suaviza¸ao Exponencial
Simples, al´em de poder ser aplicado a eries com tendˆencia.
A desvantagem deste m´etodo ´e a dificuldade na escolha das constantes de suaviza¸ao.
2.5.3 eries Temporais Com Tendˆencia e Sazonalidade
Um modelo para eries temporais que apresentam tendˆencia e sazonalidade ´e descrito
por:
Z
t
= µ
t
S
t
+ a
t
+ T
t
(2.27)
para t = 1, ..., N. Ou:
Z
t
= µ
t
+ a
t
+ T
t
+ S
t
(2.28)
para t = 1, ..., N, onde µ
t
´e o n´ıvel, T
t
´e a componente de tendˆencia, S
t
´e a componente de
sazonalidade e a
t
´e o ru´ıdo aleat´orio com m´edia zero e variˆancia constante. O modelo 2.27
considera a sazonalidade multiplicativa e a tendˆencia aditiva. O modelo 2.28 considera a
sazonalidade e a tendˆencia aditivas (MORETIN; TOLOI, 2004).
2.5.3.1 Suaviza¸ao Exponencial Sazonal de Holt-Winters (para sazonalidade
aditiva)
Este etodo de suaviza¸ao para eries com tendˆencia e sazonalidade, possui trˆes
constantes de suaviza¸ao, uma (A) que atua no n´ıvel do modelo, uma (C) que atua na
tendˆencia, e outra (D) que atua na sazonalidade, todas com valores entre 0 e 1. A equa¸ao
do valor suavizado ´e dada por (MORETIN; TOLOI, 2004):
Z
t
= A(Z
t
ˆ
F
ts
) + (1 A)(Z
t1
+
ˆ
T
t1
) (2.29)
para t = (s + 1), ..., N. Onde s ´e chamado de per´ıodo e indica que o comportamento da
s´erie temporal ´e semelhante a cada s instantes de tempo. Tem-se ainda:
ˆ
T
t
= C(Z
t
Z
t1
) + (1 C)
ˆ
T
t1
(2.30)
para t = (s + 1), ..., N.
ˆ
F
t
= D(Z
t
Z
t
) + (1 D)
ˆ
F
ts
(2.31)
18 2 Processos Estoasticos e eries Temporais
para t = (s + 1), ..., N.
A previs˜ao ´e realizada a partir da seguinte equa¸ao:
ˆ
Z
t
(h) = Z
t
+ h
ˆ
T
t
+
ˆ
F
t+hs
(2.32)
para h = 1, ..., s. E:
ˆ
Z
t
(h) = Z
t
+ h
ˆ
T
t
+
ˆ
F
t+h2s
(2.33)
para h = s+1, ..., 2s e assim sucessivamente para h = 2s +1, ..., 3s, para h = 3s+1, ..., 4s,
etc.
Os valores iniciais ao:
ˆ
F
j
=
Z
j
(
1
s
s
k=1
Z
k
)
(2.34)
para j = 1, ..., s.
Z
s
=
1
s
s
k=1
Z
k
(2.35)
ˆ
T
s
= 0 (2.36)
2.5.3.2 Suaviza¸ao Exponencial Sazonal de Holt-Winters (para sazonalidade
multiplicativa)
Este m´etodo de suavizao para eries com tendˆencia e sazonalidade, tamb´em possui
trˆes constantes de suaviza¸ao, uma (A) que atua no n´ıvel do modelo, uma (C) que atua
na tendˆencia, e outra (D) que atua na sazonalidade, todas com valores entre 0 e 1. A
equa¸ao do valor suavizado ´e dado por (MORETIN; TOLOI, 2004):
Z
t
= A
Z
t
ˆ
F
ts
+ (1 A)(Z
t1
+
ˆ
T
t1
) (2.37)
para t = (s + 1), ..., N. Onde s ´e chamado de per´ıodo e indica que o comportamento da
s´erie temporal ´e semelhante a cada s instantes de tempo. Tem-se ainda:
ˆ
T
t
= C(Z
t
Z
t1
) + (1 C)
ˆ
T
t1
(2.38)
para t = (s + 1), ..., N.
ˆ
F
t
= D
Z
t
Z
t
+ (1 D)
ˆ
F
ts
(2.39)
para t = (s + 1), ..., N.
A previs˜ao ´e realizada a partir da seguinte equa¸ao:
ˆ
Z
t
(h) = (Z
t
+ h
ˆ
T
t
)
ˆ
F
t+hs
(2.40)
2.5 Modelos de Suaviza¸ao Exponencial 19
para h = 1, ..., s. E:
ˆ
Z
t
(h) = (Z
t
+ h
ˆ
T
t
)
ˆ
F
t+h2s
(2.41)
para h = (s+1), ..., 2s e assim sucessivamente para h = 2s+1, ..., 3s, para h = 3s+1, ..., 4s,
etc.
Os valores iniciais ao:
ˆ
F
j
=
Z
j
(
1
s
s
k=1
Z
k
)
(2.42)
para j = 1, ..., s.
Z
s
=
1
s
s
k=1
Z
k
(2.43)
ˆ
T
s
= 0 (2.44)
As vantagens desses dois m´etodos s˜ao as mesmas do etodo de suaviza¸ao exponencial
de Holt, adicionando-se a vantagem de ser aplicada a eries com tendˆencia e sazonalidade
(MORETIN; TOLOI, 2004).
A desvantagem ´e a dificuldade em escolher os melhores valores para as trˆes constantes
de suaviza¸ao, que podem ser escolhidas usando o EQM. Os valores que gerarem o menor
EQM ser˜ao os escolhidos (MORETIN; TOLOI, 2004).
20 2 Processos Estoasticos e eries Temporais
21
3 Modelos ARIMA e ARIMAX
Existem diversas t´ecnicas e modelos para an´alise de eries temporais, entre as mais
comumente usadas temos a an´alise de Fourier, an´alise de Wavelets, Modelos ARIMAX
e suas subdivis˜oes, Modelos Estruturais para S´eries de Tempo e Redes Neurais. A es-
colha de qual t´ecnica utilizar e o respectivo modelo vai depender do que se espera da
an´alise da erie (por exemplo, se o objetivo ´e realizar previs˜oes ou se ´e importante ter a
ocorrˆencia dos dados no dom´ınio do tempo, ent˜ao algumas dessas ecnicas ao suprir˜ao
estas necessidades), da complexidade de cada t´ecnica e das caracter´ısticas que cada erie
individualmente possui (como possuir estacionariedade ou ao). Neste trabalho foram
escolhidos os modelos ARIMA e ARIMAX porque ao menos complexos que outros como
o modelo NARMAX, por exemplo, al´em de serem modelos muito difundidos e que ao
capazes de resolver adequadamente muitos problemas, incluindo problemas com eries
temporais ao-estacion´arias.
Assim, os modelos adotados neste trabalho s˜ao utilizados para modelar a sa´ıda de um
processo linear. A sa´ıda desse processo linear corresponde a uma s´erie temporal, enquanto
que as entradas deste processo ao o ru´ıdo branco (com edia zero e variˆancia constante)
e uma ou mais entradas ex´ogenas. Esse processo pode ser visto na Figura 3.1.
Figura 3.1: O processo gerador da s´erie temporal juntamente com o sistema estimador da
s´erie.
Na Figura 3.1 tem-se uma representa¸ao do processo gerador da erie temporal, a
partir das entradas, bem como o sistema estimador de um modelo para representar tal
s´erie temporal.
22 3 Modelos ARIMA e ARIMAX
Os processos nos quais existe entrada ex´ogena ser˜ao modelados atraes do modelo
ARIMAX, e os processos nos quais ao existe entrada ex´ogena (ou ela ao ´e conhecida)
ser˜ao modelados atraes do modelo ARIMA.
´
E importante lembrar que quando a entrada
ex´ogena do sistema ao ´e conhecida, o processo de estima¸ao do modelo torna-se mais
complexo, tendo como alimentao para o sistema estimador do modelo apenas os valores
da s´erie temporal, e tendo que estimar os valores do ru´ıdo.
3.1 Modelo ARIMA
Um dos modelos lineares mais utilizados para an´alise de s´eries temporais no dom´ınio
do tempo ´e o modelo ARIMA(p,d,q). Modelos ARIMA ao modelos auto-regressivos
integrados de m´edias oveis. O nome ´e dado em virtude deste modelo conter uma parte
do modelo AR e outra parte do modelo MA (ambos ser˜ao descritos nesta se¸ao), e se
a s´erie original for transformada por uma (ou mais) diferencia¸ao, ent˜ao a s´erie original
ser´a uma integra¸ao da s´erie diferenciada. O modelo ´e representado da seguinte forma:
ARIMA(p,d,q), onde p ´e a ordem da parte AR do modelo, q ´e a ordem da parte MA do
modelo, e d ´e o n´umero de diferen¸cas que foram realizadas nos dados at´e que a erie se
tornasse estacion´aria (se a erie original a ´e estacion´aria, ent˜ao d=0) (MORETIN; TOLOI,
2004).
Os passos para a constru¸ao do modelo que melhor se ajusta aos dados da erie
temporal ao descritos no fluxograma da Figura 3.2.
Os quatro passos do fluxograma ao descritos a seguir:
Sele¸ao :
´
E realizada a sele¸ao do melhor tipo do modelo a ser usado: AR (que ´e repre-
sentado por ARIMA(p, 0, 0)), MA (que ´e representado por ARIMA(0, 0, q)), ARI
(que ´e representado por ARIMA(p, d, 0)), IMA (que ´e representado por ARIMA(0,
d, q)), ARMA (que ´e representado por ARIMA(p, 0, q)) ou ARIMA completo (que
´e representado por ARIMA(p, d, q)).
Estima¸ao da ordem : Estimar as ordens do modelo (ordem da diferen¸ca necess´aria,
ordem da parte AR e a ordem da parte MA).
Estima¸ao dos Coeficientes :
´
E realizada a estima¸ao dos coeficientes do modelo a
selecionado.
Diagn´ostico :
´
E realizado um diagn´ostico do modelo, a fim de verificar se o modelo ´e
adequado, ou seja, representa bem a erie temporal. Caso o modelo ao seja ade-
quado, voltar ao passo de Sele¸ao. Caso contr´ario, termina a execu¸ao do algoritmo
e o modelo est´a pronto para ser usado para diversas finalidades, como por exemplo,
previs˜ao.
A fase mais cr´ıtica deste processo ´e o passo de estima¸ao das ordens. Pessoas diferentes
podem achar diferentes modelos para uma mesma s´erie temporal, ent˜ao se deseja criar
um modelo para previs˜ao, deve-se escolher o modelo cujo erro de previs˜ao seja o menor
poss´ıvel, e assim por diante, sempre escolhendo o modelo que oferece o melhor desempenho
na fun¸ao para a qual este foi criado (MORETIN; TOLOI, 2004). Todas estas etapas ser˜ao
melhor detalhadas no cap´ıtulo 4.
3.1 Modelo ARIMA 23
Figura 3.2: Fluxograma : constru¸ao de um modelo ARIMA/ARIMAX.
24 3 Modelos ARIMA e ARIMAX
Embora as etapas do fluxograma da Figura 3.2 tenham sido descritas como sendo para
a cria¸ao de um modelo ARIMA, as mesmas tamb´em ao aplicadas `a cria¸ao do modelo
ARIMAX. Para a cria¸ao do modelo ARIMAX, al´em da estima¸ao das ordens e coeficien-
tes contidos no modelo ARIMA, deve-se estimar tamb´em as ordens e os coeficientes das
entradas ex´ogenas.
O modelo ARIMA ´e destinado para eries temporais ao-estacion´arias, mas que to-
mando-se d diferen¸cas da s´erie (com d finito), esta torna-se estacion´aria. Esse tipo de
s´erie ´e conhecida como s´erie ao-estacion´aria homogˆenea (MORETIN; TOLOI, 2004).
Uma vez que a erie ao-estacion´aria homogˆenea Z
t
foi diferenciada d vezes, ela se
transformou em uma s´erie estacion´aria W
t
=
d
Z
t
, e podemos represena-la como um
modelo ARMA(p,q) da forma:
W
t
= φ
1
W
t1
+ φ
2
W
t2
+ ... + φ
p
W
tp
+ a
t
θ
1
a
t1
... θ
q
a
tq
(3.1)
onde p ´e a ordem da parte auto-regressiva e q ´e a ordem da parte de m´edias oveis do
modelo (MORETIN; TOLOI, 2004).
Quando o parˆametro d > 0, sup˜oe-se que µ, a m´edia de W
t
, ´e igual a zero e portanto
ao ´e necess´ario adicionar um termo constante `a s´erie. Caso contr´ario, existem duas
possibilidades: ou retira-se a m´edia da s´erie antes de sua modelagem, e coloca-a novamente
no final, ou deve-se adicionar um termo constante θ
0
ao modelo, e este dever´a ser estimado,
juntamente com os outros coeficientes do modelo (MORETIN; TOLOI, 2004).
3.1.1 Caracter´ısticas do Modelo ARIMA
A entrada a
t
do modelo ´e supostamente um ru´ıdo branco. Uma entrada a
t
´e conside-
rada um ru´ıdo branco se (MORETIN; TOLOI, 2004):
Cont´em edia zero;
Cont´em variˆancia constante;
Cont´em covariˆancia nula E[ε
t
ts
] = E[ε
tj
tjs
] = L = 0, para todo valor de s.
3.1.2 Modelos AR e ARI
O modelo AR ´e um modelo que possui apenas a parte auto-regressiva (Auto-Regressive)
do modelo ARIMA mais geral. Um modelo auto-regressivo de ordem p ´e representado
por AR(p), ou equivalentemente ao modelo ARIMA(p,0,0), sendo p a ordem do modelo,
e assume a forma:
˜
Z = φ
1
˜
Z
t1
+ φ
2
˜
Z
t2
+ ... + φ
p
˜
Z
tp
+ a
t
(3.2)
onde
˜
Z
t
= Z
t
µ.
a o modelo ARI ´e um modelo que possui apenas a parte auto-regressiva (Auto-
Regressive) do modelo ARIMA mais geral, e a s´erie precisou de d diferen¸cas para se
tornar estacion´aria. Um modelo auto-regressivo integrado de ordem p ´e representado por
3.1 Modelo ARIMA 25
ARI(p,d), ou equivalentemente ao modelo ARIMA(p,d,0), sendo p a ordem do modelo, e
assume a forma:
W
t
= φ
1
W
t1
+ φ
2
W
t2
+ ... + φ
p
W
tp
+ a
t
(3.3)
onde W
t
= ∆
d
Z
t
(d diferen¸cas de Z
t
).
Para ambos os modelos, temos que µ ´e a edia da s´erie (se a erie for estacion´aria),
ou ao tem significado espec´ıfico (se a s´erie for ao-estacion´aria).
3.1.3 Modelos MA e IMA
O modelo MA ´e um modelo que possui apenas a parte de m´edias oveis (Moving
Average) do modelo ARIMA mais geral. Um modelo de m´edias oveis de ordem q ´e
representado por MA(q), ou equivalentemente ao modelo ARIMA(0,0,q), sendo q a ordem
do modelo, e assume a forma:
˜
Z
t
= a
t
θ
1
a
t1
... θ
q
a
tq
(3.4)
onde
˜
Z
t
= Z
t
µ.
a o modelo IMA ´e um modelo que possui apenas a parte m´edias oveis (Moving
Average) do modelo ARIMA mais geral, e a s´erie precisou de d diferen¸cas para se tornar
estacion´aria. Um modelo de m´edias oveis integrado de ordem q ´e representado por
IMA(d,q), ou equivalentemente ao modelo ARIMA(0,d,q), sendo q a ordem do modelo, e
assume a forma:
W
t
= a
t
θ
1
a
t1
... θ
q
a
tq
(3.5)
onde W
t
= ∆
d
Z
t
(d diferen¸cas de Z
t
).
Para ambos os modelos, temos que µ ´e a edia da s´erie (se a erie for estacion´aria),
ou ao tem significado espec´ıfico (se erie ´e ao-estacion´aria).
3.1.4 Modelo ARMA
O modelo ARMA ´e o modelo auto-regressivo (Auto-Regressive) e de edias oveis
(Moving Average) combinados em um o. Esse modelo ´e aplic´avel para s´eries temporais
estacion´arias, ou seja, ao necessita de diferen¸cas (d = 0). Representa-se este modelo
como ARMA(p,q), sendo p a ordem da parte auto-regressiva, e q a ordem da parte de
m´edias oveis do modelo. Equivalentemente, podemos represent´a-lo como um modelo
ARIMA(p,0,q) mais geral, esse modelo assume a forma (MORETIN; TOLOI, 2004):
˜
Z
t
= φ
1
˜
Z
t1
+ φ
2
˜
Z
t2
+ ... + φ
p
˜
Z
tp
+ a
t
θ
1
a
t1
... θ
q
a
tq
(3.6)
onde
˜
Z
t
= Z
t
µ; e µ ´e a edia da erie (para erie estacion´aria).
26 3 Modelos ARIMA e ARIMAX
3.2 Modelo ARIMAX
O modelo ARIMAX ´e similar ao modelo ARIMA descrito anteriormente. A diferen¸ca ´e
que o modelo Auto-Regressivo (Auto-Regressive) Integrado (Integrated) de M´edias M´oveis
(Moving Average) e Entradas Ex´ogenas (Exogenous inputs) possui, al´em dos parˆametros
auto-regressivos e de edias oveis, a entrada ex´ogena (FERRARI, 2006). Desta forma,
para o modelo ARIMAX, existir´a mais um termo a se estimar, r, que corresponde `a ordem
da equa¸ao que representa a entrada ex´ogena.
As etapas da constru¸ao de um modelo ARIMAX ao os mesmos descritos na Figura
3.2.
Na classe de modelos ARIMAX, tem-se um modelo mais simples denominado AR-
MAX, onde ao ao realizadas opera¸oes de diferen¸cas nos valores da s´erie temporal e
nem na(s) entrada(s) ex´ogena(s). O modelo ARMAX ´e um modelo ARIMAX simplifi-
cado, e assume a forma (FERRARI, 2006):
p
j=0
d
j
Z
tj
= b
0
X
t
+
r
j=1
b
j
X
tj
+
q
j=0
c
j
a
tj
(3.7)
para t = 0, ±1, ±2, ..., onde:
Z ´e um vetor de sa´ıdas observ´aveis (corresponde aos pontos da s´erie temporal);
X ´e um vetor de entradas observ´aveis;
a ´e um vetor de elementos que caracterizam ru´ıdos aleat´orios ao observ´aveis.
Assumindo-se que:
Z e X ao estacion´arios;
a tem m´edia zero e variˆancia σ
2
a
.
No caso da erie temporal ao ser estacion´aria, ´e necess´ario realizar a mesma quanti-
dade de diferen¸cas na sa´ıda e na entrada. Neste caso, utiliza-se o modelo ARIMAX, que
assume a forma (FERRARI, 2006):
p
j=0
d
j
d
Z
tj
= b
0
+
r
j=1
b
j
d
X
tj
+
q
j=0
c
j
a
tj
(3.8)
O modelo ARIMAX pode ser generalizado para representar mais de uma entrada.
3.2.1 ARIMAX e suas Subdivis˜oes
De conhecimento do modelo ARIMA e suas subdivis˜oes vistas na se¸ao anterior, pode-
se construir, por analogia, os modelos ARX, ARIX, MAX e IMAX, que ao derivoes do
modelo ARIMAX.
3.3 Modelo SARIMA 27
3.3 Modelo SARIMA
O Modelo SARIMA ´e composto por um modelo ARIMA mais uma componente que
representa a sazonalidade presente na s´erie temporal (MORETIN; TOLOI, 2004).
Quando ´e realizada a detec¸ao de uma componente sazonal em uma erie temporal
analisada, esta sazonalidade pode ser de dois tipos: determin´ıstica ou estoastica.
Quando a sazonalidade encontrada ´e determin´ıstica, com per´ıodo de 12 meses (su-
pondo uma s´erie temporal mensal e com sazonalidade anual), esta s´erie pode ser modelada
por (MORETIN; TOLOI, 2004):
Z
t
= µ
t
+ N
t
(3.9)
onde µ
t
´e uma fun¸ao determin´ıstica peri´odica cujos valores ao iguais para cada t
=
t + i 12 (para i = 0, 1, ...); N
t
´e um processo estacion´ario modelado por um modelo
ARMA(p,q).
Segundo Moretin e Toloi (2004), N
t
satisfaz a equa¸ao:
φ(B)N
t
= θ(B)a
t
(3.10)
onde (B) ´e um vetor de operadores de atraso B, ou seja, (B
12
)N
t
= N
t12
, a
t
´e um ru´ıdo
branco e µ
t
tem sua solu¸ao dada por:
µ
t
= µ +
6
j=1
[α
j
cos
(2πjt)
12
+ β
j
sin
(2πjt)
12
] (3.11)
onde µ, α
j
, β
j
ao constantes desconhecidas.
Aplicando-se a diferen¸ca sazonal (1 B
12
) `a Equa¸ao 3.9, tem-se:
(1 B
12
)Z
t
= (1 B
12
)µ
t
+ (1 B
12
)N
t
(3.12)
como µ
t
= µ
t12
, temos:
(1 B
12
)Z
t
= (1 B
12
)N
t
(3.13)
E finalmente, substituindo-se 3.10 em 3.13, tem-se:
φ(B)W
t
= θ(B)(1 B
12
)a
t
(3.14)
onde W
t
= (1 B
12
)Z
t
.
a a sazonalidade estoastica ´e identificada atrav´es da an´alise da fun¸ao de autocor-
rela¸ao (FAC) e da fun¸ao de autocorrela¸ao parcial (FACP) da s´erie (FAC e FACP ser˜ao
detalhadas na subse¸ao 4.2.1), que ao diferentes de zero apenas nos m´ultiplos do pe-
r´ıodo de sazonalidade. A sazonalidade estoastica pode ser modelada da seguinte forma
(MORETIN; TOLOI, 2004):
Z
t
= µ
t
+ N
t
(3.15)
28 3 Modelos ARIMA e ARIMAX
onde µ
t
agora ´e um processo estoastico. Tem-se que:
(1 B
12
)µ
t
= Y
t
(3.16)
onde Y
t
´e um processo estoastico. Novamente aplicando-se o operador (1B
12
) `a Equa¸ao
3.15, e de acordo com 3.16, tem-se:
(1 B
12
)Z
t
= Y
t
+ (1 B
12
)N
t
(3.17)
com φ
Y
(B)Y
t
= θ
Y
(B)a
t
e φ
N
(B)N
t
= θ
N
(B)ε
t
. Onde a
t
e ε
t
ao ru´ıdos brancos inde-
pendentes.
Moretin e Toloi (2004) demonstram que a Equa¸ao 3.17 ´e equivalente `a:
Φ(B
12
)∆
D
12
Z
t
= Θ(B
12
)α
t
(3.18)
onde:
Φ(B
12
) = 1 Φ
1
B
12
... Φ
P
B
12P
: operador auto-regressivo sazonal de ordem P e
estacion´ario;
Θ(B
12
) = 1 Θ
1
B
12
... Θ
Q
B
12Q
: operador de edias oveis sazonal de ordem Q e
invert´ıvel;
12
= (1 B
12
): operador diferen¸ca sazonal;
D
12
= (1 B
12
)
D
: onde D indica o n´umero de diferen¸cas sazonais realizadas;
α
t
: pode ser um ru´ıdo branco.
Como descrito anteriormente, α
t
pode ser ou n˜ao um ru´ıdo branco, em caso positivo, a
FAC de Z
t
´e zero para todas as posi¸oes ao-sazonais e o modelo 3.17 ´e chamado de modelo
sazonal puro (MORETIN; TOLOI, 2004). Por´em, se α
t
ao for um ru´ıdo branco e satisfizer
um modelo ARIMA(p,d,q) (ϕ(B)α
t
= θ(B)a
t
), sendo ϕ(B) = (1B)
d
φ(B) e a
t
um ru´ıdo
branco, Moretin e Toloi (2004) demonstram que Z
t
satisfaz o modelo denominado ARIMA
sazonal multiplicativo, ou seja, SARIMA(p, d, q)x(P, D, Q)
12
, a seguir:
φ(B)Φ(B
12
)(1 B
12
)
D
(1 B)
d
Z
t
= θ(B)Θ(B
12
)a
t
(3.19)
com θ(B) = 1 θ
1
B ... θ
q
B
q
e φ(B) = 1 φ
1
B ... φ
p
B
p
.
3.4 Modelo NARMAX
O modelo NARMAX (Non-linear Auto-Regressive with Moving Average and Exoge-
nous inputs) ´e um modelo ao-linear, ao contr´ario dos modelos vistos neste cap´ıtulo,
por´em ´e um modelo linear em seus parˆametros.
Devido `a caracter´ıstica ao-linear, o modelo NARMAX ´e capaz de representar eries
temporais que apresentam um comportamento dinˆamico mais complexo do que aque-
les modelados pelos modelos ARIMAX. Em contrapartida, a estima¸ao de um modelo
3.4 Modelo NARMAX 29
NARMAX ´e muito mais dispendiosa que os modelos lineares j´a vistos, al´em do que, alguns
passos do processo de cria¸ao do modelo NARMAX ainda ao est˜ao bem estabelecidos
(AGUIRRE; RODRIGUES; J
´
ACOME, 1998).
Na cria¸ao de um modelo NARMAX, ao seguidas as mesmas etapas da cria¸ao de um
modelo linear ARIMA/ARIMAX, descritas na Figura 3.2 (na etapa de sele¸ao, deve-se
escolher o modelo NARMAX), o que muda s˜ao as t´ecnicas utilizadas em cada uma dessas
etapas.
No modelo NARMAX, todo conhecimento pr´evio existente sobre a s´erie deve ser uti-
lizado para a escolha da estrutura do modelo adequada (AGUIRRE; RODRIGUES; J
´
ACOME,
1998).
A estrutura do modelo NARMAX mono-vari´avel assume a forma:
Z
t
= F
L
(Z
t1
, Z
t2
, . . . , Z
tn
y
, X
tb1
, . . . , X
tbn
u
+1
, a
t1
, a
t2
, . . . , a
tn
e
) + a
t
(3.20)
para t = 1, ..., N. Onde F
L
´e uma fun¸ao ao-linear; L representa o grau de ao-
linearidade; Z
t
´e a sa´ıda, com atraso aximo n
z
; X
t
´e a entrada, com atraso aximo
n
x
; e a
t
´e um ru´ıdo aditivo, com atraso aximo n
a
; b ´e o retardo do sistema (AGUIRRE;
RODRIGUES; J
´
ACOME, 1998).
A fun¸ao F
L
ao ´e conhecida, e deve ser estimada de forma a representar adequada-
mente toda a dinˆamica do sistema real. Os modelos polinomiais e racionais ao conside-
rados bons modelos para aproximar a fun¸ao F
L
. Um modelo polinomial de grau L que
pode ser usado para representar o modelo NARMAX descrito em 3.20 assume a forma
(AGUIRRE; RODRIGUES; J
´
ACOME, 1998):
Z
t
= θ
0
+
n
i
1
=1
θ
i
1
U
i
1
t
+
n
i
1
=1
n
i
2
=i
1
θ
i
1
U
i
1
t
U
i
2
t
+ . . . +
n
i
l
=1
. . .
n
i
l
=i
l1
θ
i
1
...i
l
U
i
1
t
. . . U
i
l
t
+ a
t
(3.21)
onde U
1
t
= Z
t1
, U
2
t
= Z
t2
, . . . , U
n
y
+1
t
= X
td
, . . . , U
n
y
+n
u
+1
t
= a
t1
, . . . , U
n
t
= a
tn
e
.
Temos ainda que: n = n
z
+ n
x
+ n
a
e θ
i
ao os coeficientes a serem estimados.
A quantidade axima de termos de um modelo NARMAX polinomial pode crescer
muito `a medida que o valor de L cresce e em fun¸ao dos atrasos n
z
, n
x
e n
a
tamem.
Por´em, se utiliz´assemos todos esses termos obter´ıamos um modelo muito grande. Assim,
´e aconselh´avel reduzir o n´umero de parˆametros, por´em garantindo que o modelo ainda
represente bem a dinˆamica da erie temporal. Para isso utiliza-se uma t´ecnica conhecida
como detec¸ao de estrutura, capaz de selecionar os termos que s˜ao realmente importantes
para o modelo, e que devem ser inclu´ıdos no mesmo (AGUIRRE; RODRIGUES; J
´
ACOME,
1998).
Os modelos NARMAX polinomiais ao lineares com rela¸ao aos seus coeficientes.
Desta forma, os coeficientes podem ser estimados usando qualquer ecnica de estima¸ao
30 3 Modelos ARIMA e ARIMAX
de coeficientes para modelos lineares, como os algoritmos Least Mean Square (LMS) ou
Recursive Least Square (RLS). Maiores detalhes sobre os modelos NARMAX podem ser
encontrados em (AGUIRRE; RODRIGUES; J
´
ACOME, 1998), pois estes modelos est˜ao fora do
escopo desta disserta¸ao.
31
4 Etapas da Modelagem para
Modelo ARIMA/ARIMAX
Este cap´ıtulo descreve com maiores detalhes as etapas de modelagem de uma erie
temporal representada por modelos ARIMA e ARIMAX. As variantes do modelo ARIMA:
ARMA, AR, MA, etc, bem como o modelo ARIMAX e seus variantes seguem as mesmas
etapas gerais de modelagem descritas na Figura 3.2, apresentada no cap´ıtulo anterior. A
seguir essas etapas ao analisadas em detalhes.
4.1 Sele¸ao do Modelo
Nesta fase de sele¸ao ´e realizada a escolha da melhor estrutura a ser usada para mo-
delar a s´erie temporal, por exemplo, o modelo ARIMA, ARMA, ARIMAX ou NARMAX.
Esta escolha ´e realizada com base no conhecimento pr´evio que se tem a respeito da s´e-
rie temporal em quest˜ao, escolhendo-se a categoria cujas caracter´ısticas sejam aplic´aveis
`aquela erie.
Neste trabalho, utiliza-se sempre o modelo ARIMA(p,d,q) (ou ARIMAX(p,d,r,q), se
existem entradas ex´ogenas) como estrutura, independente da s´erie ser estacion´aria ou n˜ao.
Como ao se tem conhecimento pr´evio se a s´erie temporal ´e auto-regressiva ou de m´edias
oveis ou ambas, esta informa¸ao o ser´a descoberta na fase de estima¸ao das ordens do
modelo, motivo pelo qual ´e usado o modelo ARIMA (ou ARIMAX) geral.
4.2 Estima¸ao das Ordens do Modelo
Nesta etapa, o primeiro passo a ser executado ´e verificar se a erie precisa de alguma
transforma¸ao pr´evia para estabilizar a sua variˆancia (MORETIN; TOLOI, 2004).
No segundo passo, ´e preciso verificar se a erie precisa ser diferenciada ou ao. ao
se deve diferenciar a erie mais vezes do que ela necessita para tornar-se estacion´aria.
Analisando-se a variˆancia ´e poss´ıvel escolher o parˆametro d adequadamente, pois a vari-
ˆancia da erie diminui para uma diferencia¸ao/diferen¸ca adequada e aumenta para uma
diferencia¸ao/diferen¸ca excessiva. Para isso, analisa-se a variˆancia da s´erie original e de-
pois a variˆancia da s´erie com a primeira diferen¸ca. Se a variˆancia da s´erie com primeira
diferen¸ca diminuiu de valor, enao erie deve ser diferenciada pelo menos uma vez (d = 1
por enquanto), se a variˆancia aumentou, ent˜ao a s´erie ´e estacion´aria, e d = 0. Em se-
32 4 Etapas da Modelagem para Modelo ARIMA/ARIMAX
guida, compara-se a variˆancia da erie com uma diferen¸ca e a erie com duas diferen¸cas.
Se a variˆancia da erie com duas diferen¸cas diminuiu, ent˜ao a erie ser´a diferenciada duas
vezes (d = 2), caso contr´ario, a erie a tornou-se estacion´aria com uma diferen¸ca apenas,
e d = 1. Na pr´atica, a maior parte das s´eries se tornam estacion´arias com no aximo
d = 2, por isso neste trabalho ´e utilizado esse valor como limite aximo de d (MORETIN;
TOLOI, 2004).
Uma vez que descobriu-se o melhor valor para d, a partir de agora passa-se a trabalhar
com a s´erie diferenciada, caso d = 0. O pr´oximo passo ´e utilizar uma ecnica para a escolha
das outras ordens dos modelos ARIMA/ARIMAX. A seguir s˜ao apresentadas algumas das
principais ecnicas de determina¸ao da ordem de modelos ARIMA/ARIMAX.
4.2.1 Fun¸ao de Autocorrela¸ao (FAC) e Fun¸ao de Autocorre-
la¸ao Parcial (FACP) Estimadas
Uma das formas de se encontrar as ordens do modelo ´e calculando-se e analisando-se
as autocorrela¸oes e autocorrela¸oes parciais estimadas da erie.
A fun¸ao de autocorrela¸ao estimada ´e calculada por:
r
j
=
c
j
c
0
, j = 1, ..., N (4.1)
onde c
j
´e a fun¸ao de autocovariˆancia (FACV) estimada, sendo calculada por:
c
j
=
1
N
Nj
t=1
[(Z
t
Z)(Z
t+j
Z)], j = 0, 1, ..., N 1 (4.2)
onde Z =
1
N
N
t=1
Z
t
´e a edia amostral da erie, e r
j
= r
j
(MORETIN; TOLOI, 2004).
´
E necess´ario saber se uma r
j
´e considerada nula ou ao. Para isso, utiliza-se um
intervalo de confian¸ca aproximado, no qual r
j
´e diferente de zero se (MORETIN; TOLOI,
2004):
| r
j
|> 2ˆσ(r
j
), j > q (4.3)
onde ˆσ(r
j
) ´e a variˆancia de r
j
.
Existe tamb´em a fun¸ao de autocorrela¸ao parcial estimada,
ˆ
φ
jj
, que tamb´em ´e uma
fun¸ao utilizada na etapa de identifica¸ao da ordem do modelo ARIMA. A FAC e FACP
ao utilizadas para identifica¸ao da ordem do modelo ARIMA exclusivamente, pois ao ao
capazes de identificarem as ordens das entradas ex´ogenas presentes no modelo ARIMAX.
De acordo com Moretin e Toloi (2004), denota-se por φ
kj
o j-´esimo coeficiente de um
modelo AR(k), de forma que φ
kk
seja o ´ultimo coeficiente. Vejamos:
ρ
j
= φ
k1
ρ
j1
+ φ
k2
ρ
j2
+ ... + φ
kk
ρ
jk
(4.4)
para j = 1, ..., k, onde ρ
j
´e a fun¸ao de autocorrela¸ao e como ao conhecemos seu valor,
usamos o seu valor estimado (r
j
), obtido pela Equa¸ao 4.1.
Para cada j = 1, ..., k, tem-se uma Equa¸ao 4.4 diferente e o conjunto delas ´e conhecido
4.2 Estima¸ao das Ordens do Modelo 33
como equa¸oes de Yule-Walker, cuja representa¸ao matricial ´e descrita abaixo:
1 ρ
1
ρ
2
··· ρ
k1
ρ
1
1 ρ
2
··· ρ
k2
.
.
.
ρ
k1
ρ
k2
ρ
k3
··· 1
φ
k1
φ
k2
···
φ
kk
=
ρ
1
ρ
2
···
ρ
k
(4.5)
Resolvendo as equa¸oes de Yule-Walker para k = 1, 2, ..., tem-se:
φ
11
= ρ
1
(4.6)
φ
22
=
1 ρ
1
ρ
1
ρ
2
1 ρ
1
ρ
1
1
=
ρ
2
ρ
2
1
1 ρ
2
1
(4.7)
φ
33
=
1 ρ
1
ρ
1
ρ
1
1 ρ
2
ρ
2
ρ
1
ρ
3
1 ρ
1
ρ
1
ρ
1
1 ρ
1
ρ
2
ρ
1
1
(4.8)
Logo, de forma geral,
ˆ
φ
jj
´e calculada da seguinte forma:
φ
jj
=
| P
k
|
| P
k
|
(4.9)
onde P
k
´e a matriz de autocorrela¸oes e P
k
´e a matriz P
k
com a ´ultima coluna substitu´ıda
pelo vetor de autocorrela¸oes.
A FACP estimada,
ˆ
φ
jj
, ´e considerada diferente de zero se (MORETIN; TOLOI, 2004):
|
ˆ
φ
jj
|>
2
N
, j > p (4.10)
Para descobrir se a s´erie deve ser representada por um modelo ARI(p,d,0), IMA(0,d,q)
ou ARIMA(p,d,q), calcula-se e analisa-se o comportamento da FAC e da FACP da s´erie
diferenciada, e compara-se com o comportamento dos trˆes modelos acima citados, que
est˜ao descritos na Tabela 4.1. Se a FAC e FACP da erie tiverem seus comportamentos
semelhantes aos comportamentos do modelo ARIMA(p,d,0) ou ARIMA(0,d,q), enao as
ordens p e q do modelo ser˜ao estimadas tamb´em de acordo com os comportamentos descri-
tos na Tabela 4.1. Se a FAC e FACP da s´erie tiverem seus comportamentos semelhantes
aos comportamentos do modelo ARIMA(p,d,q), ent˜ao a estima¸ao das ordens p e q ao
´e ao simples e estas ao poder˜ao ser estimadas pela mesma tabela (MORETIN; TOLOI,
2004).
Analisar a FAC e a FACP pode dar ind´ıcios de que o modelo trata-se de um ARIMA,
mas ao a ind´ıcios sobre os melhores valores para p e q. Para este modelo, ´e indicado
34 4 Etapas da Modelagem para Modelo ARIMA/ARIMAX
Tabela 4.1: Comportamento da FAC e FACP de arios modelos ARIMA.
Modelo FAC
FACP
ARIMA(p,d,0) Decai de acordo com exponencias
e/ou sen´oides amortecidas.
´
E in-
finita em extens˜ao.
Diferente de zero, para as posi¸oes
p, e igual a zero, para as posi¸oes
> p (p ser´a o ordem do modelo).
ARIMA(0,d,q) Finita em extens˜ao. O corte acon-
tece ap´os a posi¸ao q (q ser´a a or-
dem do modelo).
Decai de acordo com exponencias
e/ou sen´oides amortecidas.
´
E infi-
nita em extens˜ao.
ARIMA(p,d,q) Decai de acordo com exponencias
e/ou sen´oides amortecidas ap´os a
posi¸ao (q p).
´
E infinita em ex-
tens˜ao.
Decai de acordo com exponencias
e/ou sen´oides amortecidas.
´
E infi-
nita em extens˜ao.
utilizar a Fun¸ao de Autocorrela¸ao Estendida (FACE). Esse etodo ao ser´a abordado
aqui, maiores detalhes sobre o mesmo podem ser encontrados em (MORETIN; TOLOI, 2004).
4.2.2 Crit´erio de Informa¸ao de Akaike (CIA)
O crit´erio de informa¸ao de Akaike ´e um etodo utilizado para estimar as melhores
ordens de um modelo. Quando ´e aplicado `a estima¸ao das ordens de um modelo ARIMA,
o CIA escolhe o modelo cujas ordens p e q minimizam a equa¸ao:
CIA(p, q) = ln ˆσ
2
p,q
+ (p + q)
C(N)
N
(4.11)
O CIA ´e um etodo baseado em uma fun¸ao penalizadora, onde N ´e o n´umero de
amostras da s´erie temporal, C(N ) ´e uma fun¸ao do tamanho da s´erie e ln ´e o operador de
logaritmo natural (com base igual ao n´umero e). O termo (p + q)
C(N)
N
da Equa¸ao 4.11 ´e
o termo penalizador, e aumenta a medida que as ordens do modelo aumentam; enquanto
que ˆσ
2
p,q
´e a variˆancia do erro de modelagem (erro de predi¸ao de um passo `a frente ou
res´ıduo), tamem chamada de variˆancia residual, e diminui `a medida que as ordens do
modelo aumentam. Assim, este m´etodo tenta equilibrar essas duas medidas (MORETIN;
TOLOI, 2004).
4.2.2.1 CIA para Modelos ARIMA e ARIMAX
Ser˜ao escolhidas como ordens do modelo, o par de valores (p,q) que minimizam o valor
CIA(p,q) da Equa¸ao 4.12:
CIA(p, q) = N ln ˆσ
2
a
+
N
N d
2(p + q + 1) + N ln 2π + N (4.12)
4.2 Estima¸ao das Ordens do Modelo 35
onde ˆσ
a
´e o estimador de axima verossimilhan¸ca de σ
a
(que ´e a variˆancia do ru´ıdo equi-
valente `a parte de m´edias oveis do modelo) e d ´e o n´umero de diferencia¸oes/diferen¸cas
(MORETIN; TOLOI, 2004).
No entanto, a Equa¸ao 4.12 ao pode ser utilizada para a estima¸ao das ordens de
todos os tipos de modelo. A equa¸ao do CIA sofrer´a pequenas modifica¸oes de acordo
com o modelo para o qual o mesmo ser´a utilizado. A Equa¸ao 4.12, por exemplo, ser´a
utilizada se a s´erie temporal ´e n˜ao-estacion´aria e sofreu diferencia¸ao/diferen¸ca. Se a s´erie
´e estacion´aria, a equa¸ao do CIA ser´a (MORETIN; TOLOI, 2004):
CIA(p, q) = N ln ˆσ
2
a
+ 2(p + q + 2) + N ln 2π + N (4.13)
Por´em, quando se deseja comparar arios modelos diferentes para a mesma erie (neste
caso o valor de N ao muda), os dois ´ultimos termos das Equa¸oes 4.12 e 4.13 podem
ser retirados. As duas novas equa¸oes ser˜ao, respectivamente, iguais a (MORETIN; TOLOI,
2004):
CIA(p, q) = N ln ˆσ
2
a
+
N
N d
2(p + q + 1) (4.14)
CIA(p, q) = N ln ˆσ
2
a
+ 2(p + q + 2) (4.15)
As Equa¸oes 4.14 e 4.15 s˜ao calculadas para todas as combina¸oes de p e q, 0 p P
e 0 q Q, onde os valores de P e Q ao escolhidos de acordo com a equa¸ao a seguir
(MORETIN; TOLOI, 2004):
P = Q = ln N (4.16)
onde N ´e o n´umero de amostras da s´erie temporal.
Segundo Moretin e Toloi (2004), ´e natural a suposi¸ao de que as ordens p e q estimadas
para um modelo se tornem maiores `a medida que N aumenta e em geral, os limites
superiores P e Q ao encontrados em fun¸ao de N. Alguns autores sugerem que seja
utilizado como limite superior para as ordens do modelo, o valor de (ln N)
α
, com 0
α . Para maiores detalhes ver (MORETIN; TOLOI, 2004) e suas referˆencias. Nesta
disserta¸ao utilizou-se P = Q = (ln N)
α
com α = 1 que ´e equivalente `a Equa¸ao 4.16.
Pode-se ainda reescrever a equa¸ao de CIA para s´eries estacion´arias conforme a equa-
¸ao:
CIA(p, q) = ln ˆσ
2
p,q
+
2(p + q)
N
(4.17)
onde comparando-se com a Equao 4.15, trocou-se o termo N ln ˆσ
2
a
por ln ˆσ
2
p,q
, e realizou-
se uma simplifica¸ao no termo penalizador. Segundo Moretin e Toloi (2004), os valores
que minimizam a Equa¸ao 4.17 ao os mesmos que minimizam a Equa¸ao 4.15.
Para a combina¸ao de ordens (p,q) que se est´a analisando no momento, ´e gerado um
modelo com as ordens p e q, os seus coeficientes ao estimados e enao este modelo ´e
utilizado para prever valores para a s´erie temporal. Os valores previstos por este modelo
ao comparados com os valores reais da erie, e a diferen¸ca entre eles ´e chamada de erro
de modelagem. Ap´os calculados os erros de modelagem para todos os valores previstos ´e
calculada a variˆancia dos erros de modelagem (ˆσ
2
p,q
), cujo valor ´e substitu´ıdo na Equa¸ao
4.17 e juntamente com os valores de p, q e N vai gerar o ´ındice CIA(p,q). O ´ındice
CIA(p,q) ´e calculado para arias combina¸oes diferentes de ordens (p,q) e a combina¸ao
36 4 Etapas da Modelagem para Modelo ARIMA/ARIMAX
de ordens que ser´a escolhida para o modelo ser´a aquela que minimizar o valor do ´ındice.
Embora o CIA apresentado nesta se¸ao contenha apenas as ordens p e q, a que ´e
aplicado `a estimativa das ordens do modelo ARIMA, o CIA pode ser estendido para
ser aplicado tamb´em na estimativa das ordens do modelo ARIMAX, bastando para isso
somar as ordens das entradas ex´ogenas do modelo junto com as ordens (p + q) do termo
penalizador.
4.2.2.2 CIA para Modelos AR
Para o caso do modelo utilizado ser um modelo AR, a equa¸ao do CIA ser´a (MORETIN;
TOLOI, 2004):
CIA(p) = N ln ˆσ
2
p
+ 2p (4.18)
para p P e P = ln N.
Existem ainda outras equa¸oes para o alculo do CIA que foram criados com o intuito
de melhorar a qualidade da estima¸ao das ordens, diminuindo-se para isso, a probabilidade
de sele¸ao de ordens maiores que as verdadeiras da s´erie temporal, ou seja, superestima¸ao
das ordens.
Um equa¸ao proposta com o intuito de diminuir a probabilidade de superestimar a
ordem de um modelo AR ´e a equa¸ao abaixo (MORETIN; TOLOI, 2004):
CIA
c
(p) = CIA(p) +
2(p + 1)(p + 2)
(N p + 2)
(4.19)
para p P e P = ln N.
Por´em, o CIA
c
mostrou-se ´util apenas quando N ´e um n´umero pequeno ou quando o
valor de P ´e uma fra¸ao “moderadamente grande” de N (MORETIN; TOLOI, 2004).
Uma outra equa¸ao proposta para melhorar a qualidade da estima¸ao da ordem de
um modelo AR ´e o CIA
α
:
CIA
α
(p) = N ln ˆσ
2
p
+ αp (4.20)
para p P e P = ln N.
Segundo Moretin e Toloi (2004), a probabilidade de sele¸ao da ordem correta do
modelo utilizando-se o CIA
α
aumenta `a medida que o valor de α cresce, e um valor
consistente para ser utilizado em α, seria:
α = 2 ln (ln N) (4.21)
4.2.2.3 CIA para Modelos SARIMA
Quando se trata de modelagem utilizando modelos SARIMA, o CIA a ser utilizado
ser´a:
CIA(p, q, P, Q) = 2 log L + 2a (4.22)
4.2 Estima¸ao das Ordens do Modelo 37
onde a ´e o n´umero de coeficientes do modelo (a = p + q + P + Q), p ´e a ordem da parte
auto-regressiva, q ´e a ordem da parte de edias oveis, P ´e a ordem da parte auto-
regressiva sazonal e Q ´e a ordem da parte de edias oveis sazonal e L ´e a fun¸ao de
verossimilhan¸ca utilizando os a coeficientes estimados.
Por´em, Barbiero (2003) sugere a utiliza¸ao de uma aproxima¸ao da Equa¸ao 4.22, por
quest˜oes computacionais. A equa¸ao aproximada ´e mostrada abaixo:
CIA(p, q, P, Q)
=
N(1 + log 2π) + N log σ
2
+ 2a (4.23)
onde a ´e o n´umero de coeficientes do modelo (a = p + q + P + Q), p ´e a ordem da parte
auto-regressiva, q ´e a ordem da parte de m´edias oveis, P ´e a ordem da parte auto-
regressiva sazonal e Q ´e a ordem da parte de edias oveis sazonal e N ´e o n´umero de
observoes da erie e σ
2
´e a variˆancia residual (MEDEIROS, 2006).
4.2.2.4 Outras Equa¸oes para CIA
Outras equa¸oes para o alculo do CIA encontrados na literatura, que podem ser
aplicados a modelos ARIMA e ARIMAX ao:
CIA = log
SQE
N
+ 2
b
N
(4.24)
onde SQE ´e a Soma dos Quadrados dos Erros (SQE) de ajuste do modelo `a s´erie temporal,
b ´e o n´umero de coeficientes do modelo, e N ´e o n´umero de observoes da erie (HOFLER,
2001).
CIA =
2 log F V
N
+ 2
b
N
(4.25)
onde b ´e o n´umero de coeficientes do modelo, FV ´e a Fun¸ao de Verossimilhan¸ca (FV)
utilizando os b coeficientes estimados, e N ´e o n´umero de observoes da s´erie (HOFLER,
2001).
CIA = N ln σ
2
erro
+ 2b (4.26)
onde b ´e o n´umero de coeficientes do modelo, σ
2
erro
´e a variˆancia do erro de modelagem
utilizando os b coeficientes estimados, e N ´e o n´umero de observoes da s´erie (MEDEIROS,
2006).
4.2.2.5 Crit´erio de Informa¸ao de Akaike Modificado
O crit´erio de informa¸ao de Akaike utilizado nesta disserta¸ao para a estima¸ao das
ordens do modelo ARIMAX foi modificado de forma a estimar, al´em das ordens p, q e
r, os atrasos c de cada entrada ex´ogena presente no modelo. A diferen¸ca do CIA para o
CIA modificado ´e que o primeiro calcula o valor de Akaike com base na soma das ordens
p, q e r do modelo (considerando sempre o atraso igual a zero e todos os termos da parte
ex´ogena presentes), enquanto que o CIA modificado calcula o valor de Akaike com base na
soma das ordens p, q e a quantidade de termos da parte ex´ogena do modelo, r
, conforme
38 4 Etapas da Modelagem para Modelo ARIMA/ARIMAX
pode ser visto na equa¸ao modificada do CIA (Equa¸ao 4.27). Isto possibilita a estima¸ao
do atraso da(s) entrada(s) ex´ogena(s) do modelo ARIMAX.
CIA(p, q, r, c) = N ln ˆσ
2
p,q,r,c
+ 2(p + q + r
) (4.27)
onde c ´e o atraso da entrada ex´ogena, ˆσ
2
p,q,r,c
´e a variˆancia residual estimada para o
modelo criado com as ordens p, q, r e atraso c; r
corresponde `a quantidade de termos
ex´ogenos presentes no modelo ARIMAX.
´
E importante ter em mente que r pode ser
um ´unico n´umero (caso o modelo possua apenas uma entrada ex´ogena) ou pode ser um
vetor contendo s ordens (caso o modelo possua s entradas ex´ogenas), neste ´ultimo caso,
a quantidade de termos de todas as s entradas ex´ogenas ser˜ao somadas para formar o
n´umero r
. O atraso c tamb´em pode ser um ´unico valor ou um vetor contendo os atrasos
de todas as entradas ex´ogenas.
De maneira similar ao CIA, no CIA modificado a Equa¸ao 4.27 ´e calculada para todas
as combina¸oes de p, q e r, para 0 p P , 0 q Q e 0 r R, onde os valores de
P , Q e R ao escolhidos de acordo com a equa¸ao a seguir:
P = Q = R = ln N (4.28)
onde ln ´e o operador de logaritmo natural (com base igual ao n´umero e), e N ´e o n´umero
de amostras da erie temporal.
Por exemplo, suponha um modelo que possua uma entrada ex´ogena X com os se-
guintes termos: X
t1
, X
t2
e X
t3
, ou seja, a ordem r = 3 (r ´e a quantidade de termos
da entrada ex´ogena) e o atraso c = 1 (c ´e o atrasador do primeiro termo da entrada
ex´ogena). Utilizando-se o CIA para estimar a ordem r deste modelo, este estimaria r = 4
e o modelo conteria os termos X
t0
, X
t1
, X
t2
e X
t3
, ou seja, conteria o termo X
t0
equivocadamente. O CIA modificado testa arios atrasos c diferentes para um mesmo
valor de ordem r, e assim identifica qual desses atrasos gerou o modelo com o melhor
ajuste `a s´erie temporal. Para o mesmo exemplo anteriormente citado, utilizando-se o CIA
modificado, este estimaria a ordem r = 3 e atraso c = 1, e portanto o modelo conteria
apenas os termos X
t1
, X
t2
e X
t3
, como conseq
¨
uˆencia disto ter´ıamos tamb´em r
= 3
(quantidade de termos da parte ex´ogena do modelo).
Ao utilizar-se o CIA ´e necess´ario armazenar, durante a sua execu¸ao e ap´os o seu
t´ermino, os valores de p, q e r que apresentaram os menores valores para a equa¸ao do CIA.
Entretanto, ao utilizar-se o CIA modificado ´e necess´ario armazenar al´em dos valores de p,
q e r que minimizaram a Equa¸ao 4.27, uma matriz contendo a informa¸ao dos termos de
todas as entradas ex´ogenas que fazem parte do modelo ARIMAX. A partir dessa matriz
sabe-se os atrasos (c) de cada entrada ex´ogena. Embora o CIA modificado necessite
armazenar mais informa¸oes que o CIA, este armazenamento ao traz nenhum preju´ızo
ao m´etodo CIA modificado em termos de tempo de processamento quando comparado ao
CIA.
O CIA modificado foi o m´etodo escolhido e utilizado neste trabalho. A escolha se
justifica pelo m´etodo ser simples, eficiente e poder ser aplicado aos modelos ARIMA e
ARIMAX. As equa¸oes do CIA que foram implementadas no ambiente computacional
para esta disserta¸ao foram a Equa¸ao 4.26 e a Equa¸ao 4.27, para serem aplicados aos
modelos ARIMA e ARIMAX, respectivamente.
4.3 Estima¸ao dos Coeficientes do Modelo 39
4.2.3 Crit´erio de Informa¸ao Bayesiano (CIB)
O m´etodo CIB, assim como o CIA, tamem ´e um m´etodo baseado em uma fun¸ao
penalizadora (MORETIN; TOLOI, 2004).
Neste caso, escolhe-se o modelo cujas ordens (p, q) minimizam a equa¸ao (MORETIN;
TOLOI, 2004):
CIB(p, q) = ln ˆσ
2
p,q
+ (p + q)
ln N
N
(4.29)
para um modelo ARIMA.
Para aplic´a-lo ao modelo ARIMAX basta adicionar o vetor r contendo as ordens de
todas as entradas ex´ogena (r
1
, r
2
, etc) no alculo. Por exemplo:
CIB(p, q, r) = ln ˆσ
2
p,q,r
+ (p + q + r
1
+ r
2
+ ...)
ln N
N
(4.30)
4.3 Estima¸ao dos Coeficientes do Modelo
Nesta fase, identifica-se os coeficientes do modelo anteriormente identificado. Vale
relembrar que se o modelo for ARIMA(p,d,0) ou ARIMA(0,d,q), s´o ´e necess´ario identificar
os coeficientes da parte auto-regressiva ou da parte de edias oveis, respectivamente.
Se o modelo for ARIMAX(p,d,0,r) ou ARIMAX(0,d,q,r), o ´e necess´ario identificar os
coeficientes da parte auto-regressiva ou da parte de m´edias m´oveis, respectivamente, al´em
da parte de entradas ex´ogenas.
Assim, ser˜ao estimados (p + q + 1) coeficientes (p coeficientes para a parte AR; q
coeficientes para a parte MA; e 1 para o termo a
t
). Se a m´edia da erie µ
w
ao for igual
a zero, adiciona-se uma constante ao modelo (θ
0
), somando-se (p + q + 2) coeficientes a
serem estimados, neste ´ultimo caso.
4.3.1 etodo de axima Verossimilhan¸ca
Dados φ= (φ
1
, ..., φ
p
) e θ= (θ
1
, ..., θ
q
), o etodo de axima verossimilhan¸ca torna-se
equivalente a minimizar a fun¸ao:
S
(η) =
N
t=1
a
2
t
(η | W, W
, a
) (4.31)
onde η=(φ, θ), ou seja, ´e a combina¸ao de coeficientes que se est´a testando no momento.
W
e a
ao os valores iniciais estimados de W e a respectivamente, W ao os valores
reais da s´erie (diferenciada, se d > 0), a ao os ru´ıdos da erie e N ´e o umero de
amostras da s´erie (MORETIN; TOLOI, 2004). Detalhando-se a Equa¸ao 4.31, temos que
a
2
t
(η | W, W
, a
) significa o valor de a no instante de tempo t elevado ao quadrado,
calculado atrav´es da Equa¸ao 4.34 para o conjunto de coeficientes η, utilizando-se os
valores da erie W e os valores iniciais W
e a
.
Para calcular S
, ser˜ao necess´arios valores iniciais estimados de a
t
e W
t
, chamados de
40 4 Etapas da Modelagem para Modelo ARIMA/ARIMAX
a
e W
, valores estes que n˜ao temos conhecimento. Uma forma de resolver este problema,
´e estimar os valores iniciais (n˜ao conhecidos) de a
t
e W
t
como sendo sua edia, que ao
E(a
t
) = 0 e E(W
t
) = W , respectivamente (MORETIN; TOLOI, 2004).
Para cada combina¸ao de valores de coeficientes η diferente, calcula-se o valor de a
t
atraes da Equa¸ao 4.34, para t = 1, ..., N, usando-se os valores iniciais estimados a
e W
,
e os valores W
t
da s´erie temporal. Depois de todos os a
1
, ..., a
N
calculados, substitui-se
seus valores na Equa¸ao 4.31 e encontra-se o valor de S
(η).
Ap´os calculados os valores de S
para todas as combina¸oes dos coeficientes φ e θ, no
intervalo de (-1,1), os coeficientes escolhidos ser˜ao aqueles que minimizaram S
(MORETIN;
TOLOI, 2004).
4.3.2 RLS - Recursive Least Squares (M´ınimos Quadrados Re-
cursivos)
O RLS ´e um algoritmo que estima recursivamente os coeficientes do modelo de um
filtro, de tal forma que, no final de sua execu¸ao, tem-se um conjunto de coeficientes
estimados tais que, a soma do quadrado dos erros (diferen¸ca entre o sinal esperado e o
sinal obtido pelo filtro) seja o m´ınimo (least squared) poss´ıvel (WIKIPEDIA, 2005).
Um filtro pode ser modelado segundo a equa¸ao a seguir:
Z(n) = H
T
n
B(n) (4.32)
onde B(n) ´e o vetor contendo os sinais de entrada do filtro, Z(n) ´e o sinal de sa´ıda do
filtro, H
T
n
´e o vetor transposto de H
n
e H
n
´e o vetor contendo os pesos do filtro na
itera¸ao n (WIKIPEDIA, 2005).
A id´eia por tr´as do algoritmo RLS ´e sempre minimizar uma fun¸ao custo C (geralmente
usa-se o erro quadr´atico entre o sinal desejado e o sinal obtido), atrav´es da escolha do
melhor conjunto de pesos H
n
para a entrada atual, e sempre atualizar o filtro a medida
que uma nova entrada chega. Assim, a cada instante de tempo (n + 1, por exemplo), um
novo conjunto de pesos H
n+1
´e estimado, com base no conjunto de pesos H
n
do instante
anterior (WIKIPEDIA, 2005). O algoritmo ´e chamado recursivo, devido ao fato de que o
novo valor de H
n
, depende apenas do H
n1
(anterior) mais uma diferen¸ca (∆). Como
vemos na equa¸ao abaixo:
H
n
= H
n1
+ H
n1
(4.33)
A Figura 4.1 ilustra o funcionamento do RLS, onde a cada instante de itera¸ao n, o
erro e(n) ´e calculado (e(n) = Z(n)
ˆ
Z(n)), e a partir deste erro e outros parˆametros, um
algoritmo de atualiza¸ao gera um H
n
, que somado aos pesos atuais H
n
, dar˜ao origem
aos novos pesos H
n+1
.
O algoritmo RLS pode ser facilmente adaptado para ser utilizado com eries tempo-
rais, para encontrar os coeficientes de um modelo ARX ou AR que represente uma erie.
Quando o algoritmo RLS ´e aplicado a uma s´erie temporal, B(n) ser´a um vetor contendo
valores passados da s´erie, al´em dos valores das entradas ex´ogenas e um valor constante,
ˆ
Z(n) ser´a equivalente a
ˆ
Z
n
(o valor da erie temporal no instante n previsto pelo modelo
ARX), Z(n) ser´a equivalente a Z
n
(o valor da erie temporal no instante n) e o filtro
4.3 Estima¸ao dos Coeficientes do Modelo 41
Figura 4.1: Componentes do RLS.
representar´a o modelo ARX, onde os pesos contidos no vetor H
n
ser˜ao os coeficientes
desse modelo.
Todos os passos do algoritmo RLS ao sumarizados no Algoritmo descrito na Figura
4.2.
As primeiras linhas do algoritmo contˆem os parˆametros e vari´aveis utilizadas pelo
RLS, bem como as vari´aveis recebidas e as retornadas pelo algoritmo. Logo ap´os, temos
as inicializa¸oes de algumas dessas vari´aveis.
Os passos 1 a 8 descritos na Figura 4.2 contˆem o algoritmo RLS propriamente dito.
Em cada itera¸ao n (n = 1, ..., N), o vetor B(n) ´e montado de acordo com a seguinte
seq
¨
uˆencia:
B(n) =
B(1)
B(2)
.
.
.
B(m)
=
Z
n1
Z
n2
.
.
.
Z
np
X
1
natraso
1
X
1
n(atraso
1
+1)
.
.
.
X
1
nr
1
X
2
natraso
2
X
2
n(atraso
2
+1)
.
.
.
X
2
nr
2
.
.
.
X
s
natraso
s
X
s
n(atraso
s
+1)
.
.
.
X
s
nr
s
bias
42 4 Etapas da Modelagem para Modelo ARIMA/ARIMAX
Parˆametros :
m : quantidade de coeficientes a serem estimados;
λ : fator de esquecimento. O λ ´e um valor fixo a ser escolhido. Quanto menor, menor
´e a contribui¸ao de amostras antigas do calculo de H
n
, ou seja, menos flutua¸oes nos
valores dos pesos H
n
. Quanto maior seu valor, ocorre o oposto;
δ : Valor usado para inicializar a matriz P(0). δ deve ter um valor alto, como 10
4
,
por exemplo;
N : n´umero de amostras da erie temporal;
P(n) : matriz (m)x(m);
B(n) : matriz de entrada (m)x(1);
H
n
: matriz de pesos (m)x(1);
H
T
n
: matriz H
n
transposta;
Z(n) : matriz de sa´ıda desejada (1)x(1);
g(n) : matriz de ganhos (m)x(1);
α(n) : matriz que possui o erro entre as sa´ıdas desejada e obtida (1)x(1);
Inicializa¸oes :
λ : valor fixo entre 0 < λ 1;
H
n
=0;
P(0)=δ
1
I (onde I ´e uma matriz identidade (m)x(m));
n = 1;
In´ıcio:
1. Itera¸ao = n
2. Monte : B(n) =
B(1)
B(2)
.
.
.
B(m)
3. Calcule : α(n) = Z(n) H
T
n1
B(n)
4. Calcule : g(n) = P (n 1)B(n)λ + B
T
(n)P (n 1)B(n)
1
5. Calcule : P (n) = λ
1
P (n 1) g(n)B
T
(n)λ
1
P (n 1)
6. Atualize os pesos : H
n
= H
n1
+ g(n)α(n)
7. Se n = N e H
n
ao convergiu: incrementa n e volte ao passo 1. Sen˜ao : a ao
passo 8.
8. Termina a execu¸ao do algoritmo e retorna os pesos finais : H
N
Resultados:
H
N
(H
n
na itera¸ao N);
Figura 4.2: Algoritmo RLS (WIKIPEDIA, 2005).
4.3 Estima¸ao dos Coeficientes do Modelo 43
onde Z
n
´e o valor da s´erie temporal no instante n; X
i
n
´e o valor da entrada ex´ogena i
no instante n; s ´e a quantidade de entradas ex´ogenas existentes; m ´e a quantidade de
coeficientes a serem estimados; p ´e a ordem da parte AR do modelo; r
i
´e a ordem da
entrada ex´ogena i do modelo; atraso
i
´e o atraso da entrada ex´ogena i do modelo e bias
´e um termo constante que pode ou ao aparecer no modelo ARX (caso o bias ao fa¸ca
parte do modelo, o seu valor estimado ser´a igual a zero).
No passo 3, ´e realizado o alculo de α(n), que nada mais ´e que a diferen¸ca entre o
valor desejado (que corresponde `a pr´opria erie temporal) e o valor estimado pelo modelo
com os coeficientes H
n1
. No passo 4 ´e calculada a matriz de ganhos (g(n)), no passo 5 ´e
calculada a nova matriz P (n) (que ser´a utilizada na pr´oxima itera¸ao do algoritmo). No
passo 6, a matriz de pesos H
n
´e atualizada com base na pr´opria matriz H
n1
(pesos da
itera¸ao anterior). Os pesos da matriz H
n
representam todos os coeficientes do modelo
ARX.
A condi¸ao de parada do algoritmo ´e quando a matriz H
n
tiver convergido ou quando
n atinge o valor de N, porque depois da itera¸ao n = N ao se tem mais conhecimento
dos valores das entradas ex´ogenas e nem da s´erie temporal. Caso uma das condi¸oes
de parada tenha sido atingida, ent˜ao o algoritmo termina a sua execu¸ao e retorna como
resultado a matriz H
n
(pesos da itera¸ao n). Caso contr´ario, o valor de n ´e incrementado,
e a execu¸ao do algoritmo volta ao passo 1.
As vantagens de se usar o algoritmo RLS ao: simplicidade, pois ao precisa inverter
matrizes; independˆencia, pois o RLS depende apenas de seus sinais, ao ´e dependente
do conhecimento de suas estat´ısticas; e velocidade, pois converge para o resultado ´otimo
rapidamente.
4.3.3 ELS - Extended Least Squares (M´ınimos Quadrados Es-
tendidos)
O algoritmo RLS ao pode ser utilizado para estimar os coeficientes de um modelo que
possui a parte de m´edias oveis, como por exemplo o ARIMA ou ARIMAX, porque nestes
modelos existem ru´ıdos cuja dinˆamica ao ao conhecidas mas precisam ser estimadas,
a que ao inclu´ıdas no pr´oprio modelo. Para estes dois tipos de modelo, usa-se em
substitui¸ao ao algoritmo RLS, o algoritmo ELS, que como o pr´oprio nome sugere, ´e uma
extens˜ao do algoritmo RLS.
O algoritmo ELS tem seu funcionamento similar ao do RLS, por´em o ELS tamb´em
estima os valores dos ru´ıdos presentes na erie temporal. O funcionamento do ELS pode
ser sumarizado no algoritmo descrito na Figura 4.3. O algoritmo est´a descrito para ser uti-
lizado com o modelo ARIMAX, mas pode ser adaptado para o modelo ARIMA, bastando
para isso desprezar as entradas ex´ogenas.
As primeiras linhas do algoritmo descrito na Figura 4.3 conem os parˆametros e vari´a-
veis utilizadas pelo ELS, bem como as vari´aveis recebidas e as retornadas pelo algoritmo.
Logo ap´os, temos as inicializa¸oes de algumas dessas vari´aveis. Os passos 1 a 11 contˆem
o algoritmo ELS propriamente dito. Inicialmente no passo 1, ´e realizada a estima¸ao da
matriz Harx
n
(diferente de H
n
, que cont´em os coeficientes do modelo ARIMAX) como
se o modelo fosse um ARX (ou seja, a matriz B(n) ser´a montada sem os valores de ru´ıdos
44 4 Etapas da Modelagem para Modelo ARIMA/ARIMAX
Parˆametros :
m : quantidade de coeficientes a serem estimados;
ˆa(n) : matriz de ru´ıdos da erie que ser˜ao estimados pelo ELS;
λ : fator de esquecimento. O λ ´e um valor fixo a ser escolhido. Quanto menor, menor
´e a contribui¸ao de amostras antigas do calculo de H
n
, ou seja, menos flutua¸oes nos
valores dos pesos H
n
. Quanto maior seu valor, ocorre o oposto;
δ : Valor usado para inicializar a matriz P(0). Deve ter um valor alto, como 10
4
;
N : n´umero de amostras da erie temporal;
P(n) : matriz (m)x(m);
B(n) : matriz de entrada (m)x(1);
H
n
: matriz de pesos (m)x(1);
H
T
n
: matriz H
n
transposta;
Harx
n
: matriz de coeficientes do modelo ARX (n´umero de termos do modelo
ARX)x(1);
Harx
T
n
: matriz Harx
n
transposta;
Z(n) : matriz de sa´ıda desejada (1)x(1);
g(n) : matriz de ganhos (m)x(1);
α(n) : matriz que possui o erro entre as sa´ıdas desejada e obtida (1)x(1);
Inicializa¸oes :
λ : valor fixo entre 0 < λ 1;
H
n
=0;
P(0)=δ
1
I (onde I ´e uma matriz identidade (m)x(m));
n = 1;
In´ıcio:
1. Estime os parˆametros de um modelo ARX, ou seja, estime os valores da matriz
Harx
n
2. Calcule os ru´ıdos ˆa(n) = Z(n) Harx
T
n
B(n) para os valores passados necess´arios
3. Itera¸ao = n
4. Monte : B(n) =
B(1)
B(2)
.
.
.
B(m)
5. Calcule : α(n) = Z(n) H
T
n1
B(n)
6. Calcule : g(n) = P (n 1)B(n)λ + B
T
(n)P (n 1)B(n)
1
7. Calcule : P (n) = λ
1
P (n 1) g(n)B
T
(n)λ
1
P (n 1)
8. Atualize os pesos : H
n
= H
n1
+ g(n)α(n)
9. Calcule os ru´ıdos ˆa(n) = Z(n) H
T
n
B(n) para os valores passados necess´arios
10. Se n = N e H
n
ao convergiu: incrementa n e volte ao passo 3. Sen˜ao : a ao
passo 11.
11. Termina a execu¸ao do algoritmo e retorna os pesos finais : H
N
Resultados:
H
N
(H
n
na itera¸ao N);
Figura 4.3: Algoritmo ELS (FERRARI, 2006).
4.3 Estima¸ao dos Coeficientes do Modelo 45
a
n1
, a
t2
, etc). No passo 2, os ru´ıdos iniciais necess´arios para a execu¸ao do algoritmo
ELS s˜ao estimados. O ru´ıdo ser´a a diferen¸ca entre o valor desejado (que ´e o valor da erie
temporal) e o valor estimado pelo modelo ARX (cujos coeficientes foram estimados no
passo 1). Inicialmente os ru´ıdos ao calculados com base em um modelo ARX e ao um
modelo ARIMAX porque se utiliz´assemos este ´ultimo, precisar´ıamos de valores de ru´ıdos
mais antigos ainda, os quais ao tem-se conhecimento (FERRARI, 2006).
A partir do passo 3, o algoritmo ELS ´e similar ao RLS. Em cada itera¸ao n (n =
1, ..., N), o vetor B(n) ´e montado de acordo com a seguinte seq
¨
uˆencia:
B(n) =
B(1)
B(2)
.
.
.
B(m)
=
Z
n1
Z
n2
.
.
.
Z
np
ˆa
n0
ˆa
n1
.
.
.
ˆa
nq
X
1
natraso
1
X
1
n(atraso
1
+1)
.
.
.
X
1
nr
1
X
2
natraso
2
X
2
n(atraso
2
+1)
.
.
.
X
2
nr
2
.
.
.
X
i
natraso
i
X
i
n(atraso
i
+1)
.
.
.
X
i
nr
i
bias
Onde Z
n
´e o valor da erie temporal no instante n; X
i
n
´e o valor da entrada ex´ogena i no
instante n; ˆa
n
´e o valor do ru´ıdo no instante n que foi estimado pelo ELS; s ´e a quantidade
de entradas ex´ogenas existentes; m ´e a quantidade de coeficientes a serem estimados; p ´e
a ordem da parte AR do modelo; q ´e a ordem da parte MA do modelo; r
i
´e a ordem da
entrada ex´ogena i do modelo; atraso
i
´e o atraso da entrada ex´ogena i do modelo e bias
´e um termo constante que pode ou ao aparecer no modelo ARX (caso o bias ao fa¸ca
parte do modelo, o seu valor estimado ser´a igual a zero). No passo 3, se n = 1, enao os
ru´ıdos ˆa(n) utilizados ao os ru´ıdos iniciais calculados no passo 2 do algoritmo.
No passo 5, ´e realizado o alculo de α(n), que nada mais ´e que a diferen¸ca entre o
valor desejado (que corresponde `a pr´opria erie temporal) e o valor estimado pelo modelo
com os coeficientes H
n1
.
No passo 6 ´e calculada a matriz de ganhos (g(n)) e no passo 7 ´e calculada a nova matriz
P (n) (que ser´a utilizada na pr´oxima itera¸ao do algoritmo). No passo 8, a matriz de pesos
46 4 Etapas da Modelagem para Modelo ARIMA/ARIMAX
H
n
´e atualizada com base na pr´opria matriz H
n1
(pesos da itera¸ao anterior). Os pesos
da matriz H
n
representam todos os coeficientes do modelo ARIMAX, com exce¸ao do
coeficiente do termo a
t0
. Este coeficiente ao ´e estimado pelo algoritmo ELS porque seu
valor ´e fixo e igual a 1,0.
No passo 9, os ru´ıdos necess´arios para a pr´oxima itera¸ao do algoritmo s˜ao estimados.
O ru´ıdo, neste ponto, ser´a a diferen¸ca entre o valor desejado (que ´e o valor da s´erie
temporal) e o valor estimado pelo modelo ARIMAX (cujos coeficientes foram estimados
no passo 8) (FERRARI, 2006).
O algoritmo ara quando a matriz H
n
tiver convergido ou quando n atinge o valor
de N, porque depois da itera¸ao n = N ao se tem mais conhecimento dos valores das
entradas ex´ogenas e nem da s´erie temporal. Caso uma das condi¸oes de parada tenha sido
atingida, enao o algoritmo termina a sua execu¸ao e retorna como resultado a matriz H
n
(pesos da itera¸ao n). Caso contr´ario, o valor de n ´e incrementado, e a execu¸ao do
algoritmo volta ao passo 3.
As vantagens do algoritmo ELS ao as mesmas do algoritmo RLS.
4.4 Diagn´ostico do Modelo
Uma vez que foi constru´ıdo um modelo para representar a s´erie temporal, o pr´oximo
passo ´e fazer o diagn´ostico deste modelo, ou seja, verificar se ele modela adequadamente
os dados da erie temporal.
Na maioria dos casos, quando um modelo ao ´e adequado para representar uma erie
temporal, deve-se optar por um outro modelo com mais parˆametros que o anterior, ou seja,
com uma ordem superior. Se a variˆancia residual deste novo modelo ´e significativamente
menor que a variˆancia residual do modelo pr´evio, significa que o novo modelo se ajusta
melhor aos dados da erie temporal que o modelo pr´evio (MORETIN; TOLOI, 2004).
Nesta etapa do processo de modelagem, al´em de diagnosticar se um modelo ´e adequado
ou ao a um s´erie temporal, pode-se tamb´em dar ind´ıcios de quais parˆametros devem
ser adicionado ao modelo preliminar, no caso de este ter sido diagnosticado como ao
adequado `a s´erie temporal (MORETIN; TOLOI, 2004).
A seguir, tem-se alguns testes que s˜ao ´uteis para diagnosticar se um modelo ARIMA/
ARIMAX ´e adequado ou ao `a uma erie temporal:
4.4.1 Teste de Autocorrela¸ao Residual
Este teste baseia-se na autocorrela¸ao estimada dos res´ıduos.
De posse dos vetores φ e θ, que correspondem respectivamente aos coeficientes da
parte auto-regressiva e de m´edias oveis do modelo ARIMA, escolhidos na etapa de
estima¸ao dos coeficientes do modelo, calcula-se ˆa
t
, chamados de res´ıduos estimados.
Onde ˆa
t
pode ser calculado por (MORETIN; TOLOI, 2004):
ˆa
t
= W
t
φ
1
W
t1
... φ
p
W
tp
+ θ
1
a
t1
+ ... + θ
q
a
tq
(4.34)
4.4 Diagn´ostico do Modelo 47
onde W
t
= ∆
d
Z
t
.
Se o modelo encontrado for adequado, ˆa
t
dever´a ser aproximadamente ao correlaci-
onado, assim como a
t
o ´e. Pode-se calcular as autocorrela¸oes residuais de ˆa
t
, ˆr
k
, atrav´es
da seguinte equa¸ao (MORETIN; TOLOI, 2004):
ˆr
k
=
n
t=k+1
ˆa
t
ˆa
tk
n
t=1
ˆa
2
t
(4.35)
onde N ´e o n´umero de amostras da s´erie original (sem diferencia¸ao/diferen¸ca) e n = Nd.
Para um modelo adequado, ´e suposto que: ˆr
k
0 (para todos os ˆr
k
). Um bom
limite para considerar ˆr
k
0 ´e o valor ±2/
n (MORETIN; TOLOI, 2004). Assim, se
2/
n ˆr
k
2/
n, ˆr
k
pode ser considerado igual a zero.
Se algum valor de ˆr
k
estiver fora deste limite, o modelo ao ´e adequado, pois isso
indica uma quebra de comportamento de ru´ıdo branco em ˆa
t
, lembrando-se que para
valores pequenos de k, estes limites subestimar˜ao a significˆancia de qualquer discrepˆancia
(MORETIN; TOLOI, 2004).
O teste de autocorrela¸ao residual tamb´em pode ser aplicado a modelos ARIMAX,
bastando para isso adicionar do lado direito da Equa¸ao 4.34, os termos do modelo ARI-
MAX que correspondem `as entradas ex´ogenas com os seus sinais invertidos.
4.4.2 Teste de Autocorrela¸ao Cruzada
Este teste baseia-se na correla¸ao cruzada entre o valor atual de ˆa
t
e os valores ante-
riores da erie.
A fun¸ao de correla¸ao cruzada ´e calculada por (MORETIN; TOLOI, 2004):
ˆs
k
=
n
t=k+1
ˆa
t
(Z
tk
Z)
[
n
t=1
ˆa
2
t
n
t=1
/(Z
t
Z/)
2
]
1/2
(4.36)
para k = 1, 2, ... . Onde Z
t
´e o valor da erie temporal no instante t, Z ´e o valor edio
da s´erie e ˆa
t
´e calculado pela Equa¸ao 4.34.
Se o modelo for adequado `a erie, ent˜ao ˆa
t
e Z
tk
ao ao-correlacionados, ou seja, a
correla¸ao cruzada entre eles deve ser igual a zero, para k 1. A correla¸ao cruzada ˆs
k
´e significativamente diferente de zero se | ˆs
k
|>
2
n
(exceto para valores pequenos de k)
(MORETIN; TOLOI, 2004).
O teste de autocorrela¸ao cruzada tamb´em pode ser aplicado a modelos ARIMAX.
4.4.3 Adicionando Novos Termos ao Modelo ARIMA/ARIMAX
A an´alise da fun¸ao de correla¸ao cruzada (ˆs
k
) e da autocorrela¸ao residual (ˆr
k
) atraes
de gr´aficos nos a bons ind´ıcios de quais termos devem ser adicionados ao modelo pr´evio,
a fim de torn´a-lo adequado `a s´erie temporal.
48 4 Etapas da Modelagem para Modelo ARIMA/ARIMAX
Se o modelo mostrou-se inadequado, primeiramente deve-se incluir novos termos auto-
regressivos ao modelo. Se algum valor ˆs
k
´e significativamente diferente de zero, ent˜ao
deve-se adicionar um termo auto-regressivo com atraso k, φ
k
W
tk
, ao modelo pr´evio.
Deve-se testar, k, se algum valor ˆs
k
´e significativamente diferente de zero (MORETIN;
TOLOI, 2004).
Depois de inserir termos auto-regressivos, para as posi¸oes em que o ˆs
k
for considerada
diferente de zero, deve-se analisar ˆr
k
. Se | ˆr
k
| possui valor significativamente diferente de
zero, ent˜ao um termo de edias oveis, θ
k
a
tk
tamem dever´a ser adicionado ao modelo
(MORETIN; TOLOI, 2004).
Moretin e Toloi (2004) ressaltam que se termos de m´edias oveis ao adicionados na
fase de sele¸ao do modelo, a interpreta¸ao de valores grandes de | s
k
| ao ´e ao ´obvia.
4.5 Previs˜oes com o Modelo ARIMA e ARIMAX
De posse dos valores de uma s´erie temporal Z= Z
1
, Z
2
, ..., Z
t
, nos instantes t = 1, ..., t,
a previs˜ao ´e realizada para valores Z
t+h
, onde h 1 (chamado de horizonte de previs˜ao)
e o instante t (o instante cujo valor da erie ´e o ´ultimo de que temos conhecimento) ´e
chamado de origem de previs˜ao (MORETIN; TOLOI, 2004).
O valor previsto de Z
t+h
´e expresso por:
ˆ
Z
t
(h).
Supomos que W
t
= ∆
d
Z
t
e de agora em diante usaremos W
t
no lugar de Z
t
.
O valor W
t+h
, escrito na forma de equa¸oes de diferen¸cas ´e:
W
t+h
= φ
1
W
t+h1
+ ... + φ
p
W
t+hp
θ
1
a
t+h1
... θ
q
a
t+hq
+ a
t+h
(4.37)
A previs˜ao
ˆ
W
t
(h) ´e a esperan¸ca condicional de W
t+h
([W
t+h
]), dadas as amostras da
s´erie nos instantes anteriores. Assim, a previs˜ao
ˆ
W
t
(h), ou seja, h passos a frente, expresso
na forma de equa¸oes de diferen¸cas, e tomando a esperan¸ca condicional, ´e (MORETIN;
TOLOI, 2004):
ˆ
W
t
(h) = φ
1
[W
t+h1
] + ... + φ
p
[W
t+hp
] θ
1
[a
t+h1
] ... θ
q
[a
t+hq
] + [a
t+h
] (4.38)
onde os valores das esperan¸cas ao:
[W
t+k
] =
ˆ
W
t
(k) , para k > 0;
[W
t+k
] = W
t+k
, para k 0;
[a
t+k
] = 0 , para k > 0;
[a
t+k
] = a
t+k
, para k 0.
Vale salientar aqui algumas observoes acerca da Equa¸ao de previs˜ao 4.38 (MORE-
TIN; TOLOI, 2004):
1. Os termos de m´edias oveis desaparecem para h > q;
4.5 Previs˜oes com o Modelo ARIMA e ARIMAX 49
2. Para calcular
ˆ
W
t
(h), precisamos de
ˆ
W
t
(h 1),
ˆ
W
t
(h 2), ..., que ao calculados
recursivamente;
3. Na pr´atica o um n´umero finito de amostras passadas ´e conhecido. Logo, a previs˜ao
´e E[W
t+h
| W
t
, W
t1
, ..., W
1
], que ´e diferente da previs˜ao ´otima, que seria E[W
t+h
|
W
t
, W
t1
, ...]. Mas a previs˜ao com amostras finitas ´e uma boa aproxima¸ao da
previs˜ao ´otima, para um valor grande de t;
4. O erro da previs˜ao a um passo ´e e
t
(1) = Z
t+1
ˆ
Z
t
(1).
A Equa¸ao de previs˜ao 4.38 ´e aplic´avel ao modelo ARIMA. A previs˜ao
ˆ
W
t
(h) para o
modelo ARIMAX ´e descrito na Equa¸ao 4.39.
ˆ
W
t
(h) = φ
1
[W
t+h1
] + ... + φ
p
[W
t+hp
] θ
1
[a
t+h1
] ... θ
q
[a
t+hq
] + [a
t+h
]
+ϕ
1
1
[X
1
t+hc
1
] + ... + ϕ
1
r
1
[X
1
t+h(c
1
+r
1
1)
]
+ϕ
2
1
[X
2
t+hc
2
] + ... + ϕ
2
r
2
[X
2
t+h(c
2
+r
2
1)
]
+...
+ϕ
s
1
[X
s
t+hc
s
] + ... + ϕ
s
r
s
[X
s
t+h(c
s
+r
s
1)
].
(4.39)
onde X
i
conem os valores da entrada ex´ogena i, ϕ
i
´e o vetor de coeficientes dos termos da
entrada ex´ogena i, r
i
´e a ordem da entrada ex´ogena i no modelo,c
i
´e o atraso da entrada
ex´ogena i, s ´e a quantidade de entradas ex´ogenas e os valores das esperan¸cas ao:
[W
t+k
] =
ˆ
W
t
(k) , para k > 0;
[W
t+k
] = W
t+k
, para k 0;
[a
t+k
] = 0 , para k > 0;
[a
t+k
] = a
t+k
, para k 0;
[X
i
t+k
] = X
i
t+k
k, onde o ´ındice i identifica as entradas ex´ogenas.
Algumas observoes acerca da Equa¸ao de previs˜ao 4.39 ao:
1. Os termos de m´edias oveis desaparecem para h > q;
2. Para calcular
ˆ
W
t
(h), precisamos de
ˆ
W
t
(h 1),
ˆ
W
t
(h 2), ..., que ao calculados
recursivamente;
3. Na pr´atica o um n´umero finito de amostras passadas ´e conhecido. Logo, a previs˜ao
´e E[W
t+h
| W
t
, W
t1
, ..., W
1
], que ´e diferente da previs˜ao ´otima, que seria E[W
t+h
|
W
t
, W
t1
, ...]. Mas a previs˜ao com amostras finitas ´e uma boa aproxima¸ao da
previs˜ao ´otima, para um valor grande de t;
4. O erro da previs˜ao a um passo ´e e
t
(1) = Z
t+1
ˆ
Z
t
(1);
5. Sup˜oe-se que as entradas ex´ogenas futuras, ou seja, as entradas ex´ogenas a partir
do instante de origem de previs˜ao, ao conhecidas.
50 4 Etapas da Modelagem para Modelo ARIMA/ARIMAX
4.5.1 Transforma¸oes
Como visto no cap´ıtulo 2, algumas eries necessitam de transforma¸oes especiais para
estabilizar o valor da variˆancia, al´em das diferencia¸oes/diferen¸cas. Este tipo de transfor-
ma¸ao ´e muito comum em eries econˆomicas, onde usualmente usa-se a fun¸ao log para
transformar a s´erie original.
Para eries que sofrem algum tipo de transforma¸ao, ´e preciso ter em mente que as
previs˜oes realizadas ao correspondem `as previs˜oes para a erie original, logo ´e preciso
realizar a transforma¸ao inversa `aquela realizada na erie original, sobre as previs˜oes (se
esta for invert´ıvel). Por exemplo, e a erie original Z
t
sofreu a seguinte transforma¸ao:
Y
t
= ln Z
t
(4.40)
enao a inversa ´e:
Z
t
= e
Y
t
(4.41)
e a previs˜ao para Z
t+h
seria:
ˆ
Z
t
(h) = e
ˆ
Y
t
(h)
(4.42)
4.6 Etapas da Modelagem e etodos Escolhidos para
o Sistema
A Figura 4.4 mostra todas as etapas do processo de cria¸ao do modelo ARIMA/
ARIMAX, detalhando-se, em cada etapa deste processo, as ecnicas que foram escolhidas
e implementadas nesta disserta¸ao.
Sele¸ao:
Na etapa de sele¸ao, o usu´ario selecionar´a o modelo a ser criado: modelo ARIMA
ou ARIMAX. O passo de sele¸ao deve ser feito pelo usu´ario e ao de forma au-
tomatizada porque somente este pode saber se o processo linear que deu origem `a
s´erie temporal possui entrada(s) ex´ogena(s). Se o processo linear possuir entrada(s)
ex´ogena(s), enao o usu´ario deve selecionar o modelo ARIMAX. Caso ao existam
entradas ex´ogenas, o usu´ario deve selecionar o modelo ARIMA.
Estima¸ao da ordem:
Na etapa de estima¸ao da ordem ´e realizado um teste de estacionariedade sobre a
s´erie temporal, baseado no alculo da variˆancia da erie temporal, da primeira e
da segunda diferen¸cas da s´erie. Caso a variˆancia da erie temporal seja menor que
as variˆancias da primeira e segunda diferen¸cas da erie, enao a s´erie temporal ´e
estacion´aria e ao precisa sofrer nenhuma opera¸ao de diferen¸ca. Caso contr´ario, ´e
realizada a primeira ou a segunda opera¸ao de diferen¸ca sobre a s´erie, de acordo com
a que apresentar a menor variˆancia. Optou-se por ao realizar nenhuma transfor-
ma¸ao sobre a s´erie, como a opera¸ao de diferen¸ca ou a transforma¸ao logar´ıtmica
(com o intuito de estabilizar a variˆancia da erie), porque a qualidade das previs˜oes
realizadas ao sofre nenhuma melhoria em fun¸ao desta transforma¸ao (MORETIN;
4.6 Etapas da Modelagem e M´etodos Escolhidos para o Sistema 51
Figura 4.4: Fluxograma estendido: constru¸ao de um modelo ARIMA/ARIMAX.
52 4 Etapas da Modelagem para Modelo ARIMA/ARIMAX
TOLOI, 2004). Ap´os o passo de verifica¸ao da estacionariedade da s´erie, e sua dife-
ren¸ca, caso seja necess´ario, ´e realizada a estima¸ao das melhores ordens do modelo
ARIMA/ARIMAX. Para o modelo ARIMAX ser˜ao estimadas as ordens para a parte
auto-regressiva, a parte de edias oveis do modelo e a parte de entrada(s) ex´o-
gena(s), enquanto que se o modelo ARIMA foi selecionado, ser˜ao estimadas as ordens
para a parte auto-regressiva e a parte de m´edias oveis do modelo (neste caso a
ordem da parte ex´ogena ser´a igual a zero).
Para a estima¸ao destas ordens ´e utilizado o etodo CIA, se o modelo ´e ARIMA,
ou o CIA modificado, se o modelo ´e ARIMAX. O CIA modificado foi implementado
nesta disserta¸ao para que o m´etodo pudesse, al´em das ordens do modelo, estimar
tamem os atrasos da(s) parte(s) ex´ogena(s) do modelo ARIMAX. Suponha que
X represente uma entrada ex´ogena de um modelo ARIMAX qualquer, o primeiro
termo da parte ex´ogena do modelo ARIMAX geralmente ´e o termo com atraso igual
a zero, ou seja, X
t0
, e os termos seguintes ser˜ao X
t1
, X
t2
, etc. O atraso igual a
zero em um sistema real sugere que a entrada ex´ogena de um instante t tem reflexo
na sa´ıda do sistema no mesmo instante t, o seu reflexo ´e instantˆaneo. Por´em, na
pr´atica, isto pode ao acontecer, uma entrada ex´ogena de um instante de tempo t
tem reflexo na sa´ıda do sistema no instante t + 1, ou no instante t + 2, etc. Por
exemplo, se uma entrada ex´ogena em um instante de tempo t tem reflexo na sa´ıda
do sistema dois instantes depois (t + 2), enao tem-se que no modelo ARIMAX o
atraso da entrada ex´ogena ser´a igual a dois, o primeiro termo da parte ex´ogena deste
modelo ser´a o termo com atraso igual a dois (X
t2
) e os termos seguintes ser˜ao X
t3
,
X
t4
, etc. Portanto, o crit´erio de informa¸ao de Akaike modificado estima para o
modelo ARIMAX, al´em das ordens do modelo (p, q e r), os atrasos c de todas as
entradas ex´ogenas presentes no modelo.
Estima¸ao dos coeficientes:
Uma vez que as melhores ordens para o modelo foram estimadas, tem-se que estimar
os coeficientes de cada termo do modelo. Para realizar esta estima¸ao ´e utilizado um
dos dois algoritmos: o RLS ou o ELS. O RLS ´e utilizado para estimar os coeficientes
de modelos que ao possuem a parte de m´edias oveis, sendo eles os modelos: AR,
ARI, ARIX e ARX. Se o modelo a ser modelado possuir a parte de edias oveis,
utiliza-se o algoritmo ELS para estimar os coeficientes do modelo, uma vez que o
ELS ´e uma extens˜ao do RLS que permite a estima¸ao dos valores de ru´ıdo existentes
na s´erie temporal.
Diagn´ostico:
Na etapa de diagn´ostico ao realizados dois testes: o teste de autocorrela¸ao resi-
dual e o teste de autocorrela¸ao cruzada. O teste de autocorrela¸ao residual calcula
as autocorrela¸oes residuais do modelo e verifica se algum destes valores ´e signi-
ficativamente diferente de zero. Caso algum valor de autocorrela¸ao residual seja
significativamente diferente de zero, isto sugere que o modelo ao ´e adequado para
representar a s´erie temporal, bem como sugere que seja adicionado ao modelo um
termo de m´edias m´oveis com atraso igual `a posi¸ao na qual a autocorrela¸ao residual
se mostrou diferente de zero. Caso todas as autocorrela¸oes residuais sejam iguais
ou pr´oximas de zero, o modelo ´e adequado para a s´erie temporal at´e o momento,
por´em o teste de autocorrela¸ao cruzada ainda deve ser realizado.
4.6 Etapas da Modelagem e M´etodos Escolhidos para o Sistema 53
O teste de autocorrela¸ao cruzada calcula as correla¸oes cruzadas do modelo e veri-
fica se algum destes valores ´e significativamente diferente de zero. Caso algum valor
de correla¸ao cruzada seja significativamente diferente de zero, isto sugere que o mo-
delo ao ´e adequado para representar a erie temporal, bem como sugere que seja
adicionado ao modelo um termo auto-regressivo com atraso igual `a posi¸ao na qual
a correla¸ao cruzada foi diferente de zero. Caso todas as correla¸oes cruzadas sejam
iguais ou pr´oximas de zero, o modelo ´e adequado para a s´erie temporal, segundo o
teste de autocorrela¸ao cruzada.
Se os dois testes (autocorrela¸ao residual e autocorrela¸ao cruzada) detectem que
o modelo ´e adequado, ent˜ao conclui-se que o modelo ´e realmente adequado para
representar a erie temporal e pode ser utilizado a partir de ent˜ao para a realiza¸ao de
predi¸oes. Caso contr´ario, ao adicionados termos auto-regressivos e/ou de m´edias
oveis ao modelo e volta-se `a primeira etapa do processo de modelagem (a sele¸ao),
onde a partir da´ı todos os passos ao repetidos at´e que se encontre um modelo
adequado `a s´erie temporal.
54 4 Etapas da Modelagem para Modelo ARIMA/ARIMAX
55
5 Testes e Resultados
Preliminares
Neste cap´ıtulo ser˜ao mostradas as ecnicas que foram implementadas para esta dis-
serta¸ao e os problemas enfrentados durante suas implementa¸oes. Todas as etapas da
cria¸ao do modelo ARIMA/ARIMAX foram implementadas usando a linguagem de pro-
grama¸ao Java. Foi utilizado como ambiente de desenvolvimento o NetBeans Integrated
Development Environment (IDE) verao 6.0 e o Java Development Kit (JDK) vers˜ao
1.6. Ser˜ao apresentados em seguida os resultados preliminares de gera¸ao de modelos
ARIMA/RIMAX para s´eries temporais fict´ıcias para prop´osito de valida¸ao e por fim
ser´a mostrada a interface gr´afica do ambiente computacional desenvolvido.
A primeira etapa na modelagem de uma erie, seguindo as etapas descritas no Cap´ı-
tulo 4, ´e verificar se a s´erie necessita de alguma transforma¸ao pr´evia do tipo logar´ıtmica.
Se as eries temporais a serem trabalhadas forem eries econˆomicas, esta transforma¸ao ´e
necess´aria para estabilizar a sua variˆancia. Em seguida, ´e realizado um teste na erie, a
fim de verificar se a erie precisa ou ao precisa ser diferenciada (s´erie estacion´aria), ana-
lisando para isso a sua variˆancia. E em caso positivo, define-se a quantidade de diferen¸cas
necess´arias (parˆametro d) para torn´a-la estacion´aria. Entretanto, nesta disserta¸ao optou-
se por ao utilizar a s´erie transformada para criar o modelo, uma vez que este tipo de
transforma¸ao ao interfere na qualidade das previs˜oes e ainda geram previs˜oes viesadas,
como a foi discutido anteriormente.
O etodo utilizado na etapa de estima¸ao das ordens (p e q) do modelo, foi o CIA,
uma vez que este se mostrou mais eficiente, no acerto das ordens do modelo, do que com
o uso de FAC, FACP e FACE juntas.
Na etapa de estima¸ao dos coeficientes do modelo, utilizou-se o etodo de axima
Verossimilhan¸ca. Este m´etodo mostrou-se ineficiente, uma vez que o mesmo analisa todas
as combinoes poss´ıveis dos coeficientes do modelo e quando aplicado a modelos mais
complexos (com uma ordem grande e/ou com arias entradas ex´ogenas), a quantidade
de combina¸oes testadas pelo m´etodo cresce exponencialmente. Por exemplo, para um
modelo ARIMA(2,0,3), o m´etodo de axima verossimilhan¸ca estimar´a 5 coeficientes dife-
rentes (o coeficiente do termo a
t
ao ´e estimado porque ´e sempre igual a 1, 0), construindo
para isso arias combina¸oes de coeficientes, variando-se o valor de cada coeficiente no
intervalo [1, 1], em passos de 0, 1, totalizando 21 valores poss´ıveis. Para este modelo
ARIMA, seriam testadas 4.084.101 combina¸oes diferentes de coeficientes e conseq
¨
uen-
temente 1.801.088.541 itera¸oes na execu¸ao do m´etodo. Se o modelo proposto for um
ARIMAX(2,0,3,[2,1]), ent˜ao a quantidade de coeficientes a serem estimados ser´a igual a
10, e o n´umero de itera¸oes na execu¸ao do m´etodo sobe para 16.679.880.978.201.
56 5 Testes e Resultados Preliminares
Um dos problemas gerados com o uso deste etodo, foi o estouro do tamanho da
heap, em tempo de execu¸ao, da Java Virtual Machine (JVM). Este problema ser´a melhor
detalhado na se¸ao seguinte. Diante disto, optou-se por substituir o M´etodo de axima
Verossimilhan¸ca pelos algoritmos RLS e ELS. Estes ´ultimos se mostraram m´etodos velozes,
eficientes na estima¸ao dos coeficientes corretos, bem como ao apresentaram problemas
em tempo de execu¸ao, enfrentados com o etodo inicial.
Para o diagn´ostico do modelo, foi utilizado o Teste de Autocorrela¸ao Residual jun-
tamente com o Teste de Autocorrela¸ao Cruzada. Se o modelo se mostra adequado, est´a
pronto para ser utilizado para realizar previs˜oes da s´erie (j´a que previs˜ao ´e o principal ob-
jetivo deste trabalho). Caso contr´ario, utiliza-se os resultados desses testes tamb´em para
modificar o modelo, adicionando-se novos termos ao modelo previamente constru´ıdo. Vale
relembrar que se o modelo previamente estimado tiver termos de m´edias oveis (ou seja,
o parˆametro q > 0), a interpreta¸ao de valores grandes de | s
k
| ao ´e ao ´obvia (MORETIN;
TOLOI, 2004), e portanto termos auto-regressivos ao ser˜ao adicionados ao modelo.
Caso o modelo tenha sido modificado, atualiza-se as ordens do modelo. Ap´os isto,
estima-se novamente os coeficientes do modelo, e em seguida realiza-se novo diagn´ostico
na s´erie, e assim sucessivamente, at´e encontrar um modelo adequado.
Ser˜ao apresentados agora os resultados preliminares do sistema de gera¸ao de modelos
ARIMA e ARIMAX aplicado a eries temporais fict´ıcias que foram constru´ıdas apenas
para a realiza¸ao de testes de valida¸ao de todos os etodos utilizados no processo de
estima¸ao de um modelo ARIMA/ARIMAX. Essas eries fict´ıcias foram criadas a partir
de dados de produ¸ao de petr´oleo de duas esta¸oes de transferˆencia da PETROBRAS,
chamadas de Canto do Amaro (CAM) e Alto do Rodrigues-A (ARA), ambas no Rio
Grande do Norte.
Nos resultados que ser˜ao apresentados, tem-se uma an´alise de arios aspectos do sis-
tema de gera¸ao de modelo ARIMA/ARIMAX, quando aplicado `as eries de teste. Entre
estes aspectos temos: a exatid˜ao da escolha das ordens do modelo e de seus coeficientes,
a capacidade do modelo gerado pelo sistema de representar os dados da s´erie temporal,
bem como a qualidade das previs˜oes sobre a s´erie. Todos esses aspectos ser˜ao avaliados a
fim de validar os etodos que foram implementados no sistema.
Inicialmente, ser´a analisada a gera¸ao de um modelo ARIMA. A erie para teste
criada com as caracter´ısticas de um modelo ARIMA tem edia 3,48, ao possui entradas
ex´ogenas e possui um ru´ıdo aleat´orio de edia 0,0 e desvio padr˜ao 0,5. Esta erie cont´em
228 dados, ordenados por dias que ao de 01/08/2007 at´e 16/03/2008. O modelo gerador
da erie ´e um modelo ARIMAX(1,0,1,0), onde o ´ultimo valor refere-se `a ordem da(s)
entrada(s) ex´ogena(s) que neste caso ´e igual a zero, uma vez que a erie temporal ao
possui entradas ex´ogenas. Neste caso tem-se que o modelo gerador ARIMAX(1,0,1,0) ´e
equivalente ao modelo ARIMA(1,0,1), de ordens p = 1, q = 1, e d = 0. O modelo gerador
desta s´erie temporal ´e:
Z
t
= 0, 8Z
t1
+ a
t
+ 0, 5a
t1
(5.1)
onde Z
t
´e a erie temporal sem diferen¸cas e a
t
´e o ru´ıdo aleat´orio.
Os dados da erie temporal de teste podem ser vistos no gr´afico da Figura 5.1.
Ap´os informados ao sistema todos os dados dispon´ıveis da erie temporal de teste,
tem-se a gera¸ao do modelo que, segundo o sistema, ´e o modelo que melhor representa
5 Testes e Resultados Preliminares 57
Figura 5.1: Gr´afico contendo os valores originais da erie de teste que simula o compor-
tamento de um modelo ARIMA.
esta s´erie. A s´erie foi tratada como se fosse uma s´erie estacion´aria para que fosse poss´ıvel
verificar se as ordens e coeficientes do modelo gerado foram estimados corretamente. Para
a estima¸ao das ordens p e q do modelo ARIMA ´e utilizado o m´etodo CIA, que testa arias
ordens variando de 1 a 5 (onde 5 ´e igual ao ln(228) e 228 ´e o n´umero de amostras da
s´erie dispon´ıveis). A Tabela 5.1 mostra o valor do CIA de todas as combina¸oes de ordens
testadas. Para a estima¸ao dos coeficientes do modelo ARIMA ´e utilizado o etodo ELS
com o fator de esquecimento (λ) igual a 0,98 e a matriz de covariˆancia (δ) inicial igual a
10
4
.
Tabela 5.1: Valores do CIA das combina¸oes de ordens (p,q).
(p,q) 1 2 3 4 5
1 2.308,81 2.311,27 2.313,33 2.315,08 2.318,35
2 2.310,82 2.312,99 2.319,98 2.317,79 2.320,07
3 2.312,87 2.314,89 2.317,21 2.319,15 2.323,96
4 2.314,91 2.316,92 2.318,95 2.321,29 2.323,33
5 2.316,93 2.318,86 2.320,91 2.322,81 2.325,31
Os ru´ıdos correspondentes `a parte MA do modelo ARIMA ao ao conhecidos e ne-
cessitam ser estimados pelo algoritmo ELS. Esses valores estimados podem ser vistos na
Figura 5.2.
Comparando as estima¸oes das ordens do modelo para esta s´erie temporal fict´ıcia,
temos que as ordens estimadas se utiliz´assemos a FAC, FACP e FACE juntas seriam
ARIMA(1,3), enquanto que utilizando-se o CIA as ordens encontradas foram ARIMA(1,1),
58 5 Testes e Resultados Preliminares
Figura 5.2: Ru´ıdos correspondentes `a parte MA do modelo ARIMA estimados pelo Algo-
ritmo ELS.
onde as ordens (1,1) foram retiradas da Tabela 5.1 e correspondem `as ordens que apre-
sentaram o CIA de menor valor. O CIA apresentou resultados melhores na estima¸ao das
ordens do modelo, por isto esta t´ecnica foi escolhida para ser utilizada nesta disserta¸ao
ao inv´es da FAC, FACP e FACE.
Quando aplicado `a erie temporal fict´ıcia descrita anteriormente, o sistema gerou um
modelo ARIMA(1,0,1) descrito na Equa¸ao 5.2:
Z
t
= 0, 81Z
t1
+ a
t
+ 0, 5a
t1
(5.2)
O sistema tamb´em apresenta um gr´afico contendo duas s´eries juntas: a s´erie temporal
de teste e a erie temporal gerada pelo modelo ARIMA estimado pelo sistema. A partir
deste gr´afico ´e poss´ıvel visualizar a qualidade do ajuste do modelo matem´atico `a erie
temporal de teste. Este gr´afico pode ser visto na Figura 5.3.
As Figuras 5.4 e 5.5 mostram a convergˆencia dos coeficientes dos termos Z
t1
e a
t1
,
respectivamente, em fun¸ao do n´umero de itera¸oes do algoritmo ELS. A convergˆencia do
termo a
t
ao ´e mostrada porque este termo ´e fixo e sempre igual a 1,0.
Analisando-se os resultados obtidos pelo sistema, percebe-se que o modelo gerado
conem as mesmas ordens do modelo que gerou a nossa s´erie temporal de teste, o que
significa que todas as ordens do modelo foram estimadas corretamente. Com rela¸ao
aos coeficientes do modelo, os coeficientes estimados foram exatamente os coeficientes do
modelo que gerou a erie temporal, com exce¸ao do coeficiente do termo Z
t1
, cujo valor
do coeficiente ´e 0,8 no modelo gerador da erie, enquanto que o sistema estimou um valor
aproximado de 0,81. Portanto, conclui-se que os valores dos coeficientes estimados contˆem
5 Testes e Resultados Preliminares 59
boa exatid˜ao.
Figura 5.3: Gr´afico da erie Real versus erie gerada pelo modelo ARIMA.
Figura 5.4: Gr´afico de convergˆencia do termo Z
t1
do modelo ARIMA.
Analisando-se visualmente a Figura 5.3, verifica-se um bom ajuste entre as duas s´eries
apresentadas, de onde conclui-se que o modelo ARIMA gerado pelo sistema representa
60 5 Testes e Resultados Preliminares
Figura 5.5: Gr´afico de convergˆencia do termo a
t1
do modelo ARIMA.
Figura 5.6: Autocorrela¸oes Estimadas dos Res´ıduos do modelo ARIMA.
5 Testes e Resultados Preliminares 61
bem os dados da erie temporal de teste. Mas apenas a verifica¸ao visual ao ´e suficiente
e nem precisa para concluirmos que o modelo ´e adequado `a erie temporal, para isso
tem-se a fase de Diagn´ostico. Ap´os o modelo ter sido gerado pelo sistema, foi efetuado
o diagn´ostico do mesmo realizando o teste de autocorrela¸ao residual, que analisa as
autocorrela¸oes estimadas dos res´ıduos, que podem ser vistas na Figura 5.6. Segundo o
gr´afico da Figura 5.6, para j = 4 a autocorrela¸ao residual extrapolou o limite de ±2/
n,
dando ind´ıcios de que um termo a
t4
deveria ser adicionado ao modelo para torn´a-lo
adequado, tornando-se um modelo ARIMA(1,0,4). Por´em, analisando-se as variˆancias
residuais dos dois modelos, verificou-se que elas ao muito pr´oximas e portanto, segundo
Moretin e Toloi (2004), deve-se escolher o modelo ARIMA(1,0,1) pois este possui ordens
menores. Desta forma, conclui-se que o modelo 5.2 ´e adequado para representar a erie
temporal de teste.
Depois do modelo ARIMA ter sido diagnosticado como adequado, o modelo est´a apto
para ser utilizado, como por exemplo em aplica¸ao de previs˜ao. Foram realizadas previs˜oes
de 7 valores para esta erie temporal de teste, utilizando-se os horizontes de previs˜ao
h = 1, ..., 7 e a origem das previs˜oes em 16/03/2008. Os valores previstos, bem como
os valores reais da s´erie neste per´ıodo de tempo, podem ser vistos na Figura 5.7. O erro
absoluto m´edio das previoes em rela¸ao `a s´erie real foi de 0,412 e o maior erro absoluto foi
de 1,230. Um outro ´ındice que pode ser usado na verifica¸ao da qualidade da previs˜ao ´e a
correla¸ao cruzada. O c´alculo da correla¸ao cruzada entre a s´erie prevista e a s´erie real d´a
uma medida da rela¸ao entre as duas. Se as duas s´eries s˜ao correlacionadas positivamente
elas movem-se na mesma propor¸ao e dire¸ao, sendo que quanto mais forte for a rela¸ao
entre elas, mais pr´oximo de 1,0 ser´a a correla¸ao cruzada. O valor da correla¸ao cruzada
calculada entre os valores reais da erie e os valores previstos pelo modelo foi de 0,729.
Figura 5.7: Valores previstos utilizando o modelo ARIMA e valores reais da S´erie Temporal
Fict´ıcia.
62 5 Testes e Resultados Preliminares
Agora ser´a analisada a gera¸ao de um modelo ARIMAX. A s´erie para teste criada com
as caracter´ısticas de um modelo ARIMAX tem edia 235.978,20, possui duas entradas
ex´ogenas e possui um ru´ıdo aleat´orio de edia 0,0. Esta erie cont´em 228 dados, ordenados
por dias que ao de 01/08/2007 at´e 16/03/2008. As entradas ex´ogenas tamb´em possuem
228 valores ordenados no mesmo intervalo de dias da s´erie temporal. O modelo gerador da
s´erie ´e um modelo ARIMAX(1,0,1,[2,2]), onde o ´ultimo valor refere-se a um vetor contendo
as ordens das entradas ex´ogenas. Este modelo cont´em ordens p = 1, q = 1, e d = 0, al´em
das ordens das entradas ex´ogenas, r
1
= 2 e r
2
= 2, com seus respectivos atrasos c
1
= 0
c
2
= 0. O modelo gerador da s´erie tamb´em pode ser representado como ARIMAX(1,0,1,[2-
0,2-0]), onde ao inv´es de indicar as ordens das entradas ex´ogenas [r
1
,r
2
]=[2,2], indica as
suas ordens seguidas de seus atrasos [r
1
c
1
,r
2
c
2
]=[2-0,2-0]. O modelo gerador desta
s´erie temporal ´e:
Z
t
= 0, 8Z
t1
+ a
t
0, 7a
t1
+ 1, 0X
1
t
+ 0, 6X
1
t1
+ 0, 9X
2
t
+ 1, 0X
2
t1
(5.3)
onde Z
t
´e a erie temporal sem diferen¸cas, a
t
´e o ru´ıdo aleat´orio e X
1
t
e X
2
t
ao a entrada
ex´ogena 1 e a entrada ex´ogena 2, respectivamente.
Os dados da s´erie temporal de teste podem ser vistos no gr´afico da Figura 5.8, e os
valores das duas entradas ex´ogenas podem ser vistos nas Figuras 5.9 e 5.10.
Figura 5.8: Gr´afico contendo os valores originais da erie de teste que simula o compor-
tamento de um modelo ARIMAX.
Ap´os informados ao sistema todos os dados dispon´ıveis da erie temporal de teste,
tem-se a gera¸ao do modelo que, segundo o sistema, ´e o modelo que melhor representa
esta s´erie. A s´erie foi tratada como se fosse uma s´erie estacion´aria para que fosse poss´ıvel
verificar se as ordens e coeficientes do modelo gerado foram estimados corretamente. Para
a estima¸ao das ordens do modelo ARIMAX ´e utilizado o m´etodo CIA, que testa arias
5 Testes e Resultados Preliminares 63
Figura 5.9: Gr´afico contendo os valores da Entrada Ex´ogena 1 do modelo ARIMAX.
Figura 5.10: Gr´afico contendo os valores da Entrada Ex´ogena 2 do modelo ARIMAX.
64 5 Testes e Resultados Preliminares
ordens variando de 1 a 5 (onde 5 ´e igual ao ln(228) e 228 ´e o n´umero de amostras da s´erie
dispon´ıveis). Para a estima¸ao dos coeficientes do modelo ARIMAX ´e utilizado o etodo
ELS com o fator de esquecimento (λ) igual a 0,90 e a matriz de covariˆancia (δ) inicial
igual a 10
4
.
Figura 5.11: Ru´ıdos correspondentes `a parte MA do modelo ARIMAX estimados pelo
Algoritmo ELS.
Os ru´ıdos correspondentes `a parte MA do modelo ARIMAX tamb´em ao ao conhe-
cidos e necessitam ser estimados pelo algoritmo ELS. Esses valores estimados podem ser
vistos na Figura 5.11.
Quando aplicado `a s´erie temporal fict´ıcia descrita anteriormente, o sistema apresentou
os seguintes resultados:
Ordens e Atrasos do Modelo ARIMAX: ARIMAX(1,0,1,[2-0,2-0])
Modelo ARIMAX gerado:
Z
t
= 0, 8Z
t1
+ a
t
0, 58a
t1
+ 1, 0X
1
t
+ 0, 6X
1
t1
+ 0, 9X
2
t
+ 1, 0X
2
t1
(5.4)
O sistema apresenta um gr´afico contendo duas s´eries juntas: a s´erie temporal de teste
e a s´erie temporal gerada pelo modelo ARIMAX estimado pelo sistema, a partir do qual ´e
poss´ıvel visualizar a qualidade do ajuste do modelo matem´atico `a erie temporal de teste.
O ajuste da s´erie temporal gerada pelo modelo ARIMAX `a erie temporal de teste pode
ser visto na Figura 5.12.
As Figuras 5.13, 5.14, 5.15, 5.16, 5.17 e 5.18 mostram a convergˆencia dos coeficientes
dos termos Z
t1
, a
t1
, X
1
t
, X
1
t1
, X
2
t
e X
2
t1
, respectivamente, em fun¸ao do n´umero de
itera¸oes do algoritmo ELS. A convergˆencia do termo a
t
ao ´e mostrada porque este termo
5 Testes e Resultados Preliminares 65
´e fixo e sempre igual a 1,0.
Figura 5.12: Gr´afico da erie Real versus erie gerada pelo modelo ARIMAX.
Figura 5.13: Gr´afico de convergˆencia do termo Z
t1
do modelo ARIMAX.
Analisando-se os resultados obtidos pelo sistema, percebe-se que o modelo gerado
conem as mesmas ordens do modelo que gerou a nossa s´erie temporal de teste, o que
66 5 Testes e Resultados Preliminares
Figura 5.14: Gr´afico de convergˆencia do termo a
t1
do modelo ARIMAX.
Figura 5.15: Gr´afico de convergˆencia do termo X
1
t
do modelo ARIMAX.
5 Testes e Resultados Preliminares 67
Figura 5.16: Gr´afico de convergˆencia do termo X
1
t1
do modelo ARIMAX.
Figura 5.17: Gr´afico de convergˆencia do termo X
2
t
do modelo ARIMAX.
68 5 Testes e Resultados Preliminares
Figura 5.18: Gr´afico de convergˆencia do termo X
2
t1
do modelo ARIMAX.
Figura 5.19: Autocorrela¸oes Estimadas dos Res´ıduos do modelo ARIMAX.
5.1 Problemas ecnicos Enfrentados Durante a Fase de Implementa¸ao do Sistema 69
significa que todas as ordens do modelo foram estimadas corretamente. Com rela¸ao
aos coeficientes do modelo, todos os coeficientes estimados foram exatamente iguais aos
coeficientes do modelo que gerou a erie temporal, exceto o termo a
t1
que foi estimado
como -0,58, enquanto que o valor real ´e -0,7. Essa diferen¸ca no coeficiente do termo a
t1
pode ser justificada pelo fato de que os ru´ıdos aleat´orios ao ao conhecidos e necessitam
ser estimados pelo sistema, que acaba gerando valores de ru´ıdos aproximados aos reais
mas n˜ao exatos. Portanto, com base em todos os coeficientes estimados, conclui-se que os
seus valores estimados conem boa exatid˜ao.
Analisando-se visualmente a Figura 5.12, verifica-se um bom ajuste entre as duas
s´eries apresentadas, de onde conclui-se que o modelo ARIMAX gerado pelo sistema re-
presenta bem os dados da erie temporal de teste. Por´em apenas a verifica¸ao visual ao
´e suficiente e nem precisa para concluirmos que o modelo ´e adequado `a s´erie temporal,
para isso tem-se a fase de Diagn´ostico. Ap´os o modelo ter sido gerado pelo sistema, foi
efetuado o diagn´ostico do mesmo realizando-se o teste de autocorrela¸ao residual, que
analisa as autocorrela¸oes estimadas dos res´ıduos, que podem ser vistas na Figura 5.19.
Segundo o gr´afico da Figura 5.19, para j = 25 a autocorrela¸ao residual extrapolou o
limite de ±2/
n, dando ind´ıcios de que um termo a
t25
deveria ser adicionado ao mo-
delo para torn´a-lo adequado, tornando-se um modelo ARIMAX(1,0,25,[2-0,2-0]). Por´em,
analisando-se as variˆancias residuais dos dois modelos, verificou-se que elas s˜ao muito pr´o-
ximas e portanto, segundo Moretin e Toloi (2004), o modelo ARIMAX(1,0,1,[2-0,2-0]) ´e
preferido. Desta forma, conclui-se que o modelo 5.4 ´e adequado para representar a erie
temporal de teste.
Depois de o modelo ARIMAX ter sido diagnosticado como adequado, o modelo est´a
apto para gerar previs˜oes sobre a erie temporal. Foram realizadas previs˜oes de 7 valores
para esta erie temporal de teste, utilizando-se os horizontes de previs˜ao h = 1, ..., 7 e a
origem das previs˜oes em 16/03/2008. Os valores estimados, bem como os valores reais da
s´erie neste per´ıodo de tempo, podem ser vistos na Figura 5.20. O erro absoluto m´edio das
previs˜oes em rela¸ao `a s´erie real foi de 0,698 e o maior erro absoluto foi de 0,951. O valor
da correla¸ao cruzada calculada entre os valores reais da s´erie e os valores previstos pelo
modelo foi de 0,999, revelando-nos a qualidade da previs˜ao, uma vez que o valor aximo
para a correla¸ao cruzada ´e 1,0.
5.1 Problemas T´ecnicos Enfrentados Durante a Fase
de Implementa¸ao do Sistema
Durante a fase de implementa¸ao do sistema, incluindo a implementa¸ao dos m´etodos
de an´alise de s´eries temporais, deparou-se com alguns problemas t´ecnicos que por algumas
vezes tornaram invi´avel a utiliza¸ao, no sistema, de determinado etodo ou algoritmo
encontrados na literatura para o processamento de eries temporais. Dentre os problemas
enfrentados, tem-se por exemplo o estouro de pilha.
70 5 Testes e Resultados Preliminares
Figura 5.20: Valores estimados utilizando o modelo ARIMAX e valores reais da erie
Temporal Fict´ıcia.
5.1.1 Estouro de Pilha
Todos os m´etodos foram implementados na Linguagem Java, que conem a JVM.
Cabe aqui uma apida explana¸ao sobre a JVM. Para executar um programa escrito na
linguagem Java em um computador ou outro dispositivo, ´e necess´ario existir uma JVM
instalada no mesmo. Quando ´e realizada a compila¸ao de um odigo Java, o bytecode
(que ´e um c´odigo intermedi´ario) ´e gerado e a JVM ´e uma m´aquina virtual (ou imagin´aria)
que executa as instru¸oes do bytecode operacional. A JVM ´e uma esp´ecie de camada
intermedi´aria entre o programa Java e o Sistema, e gra¸cas a ela ´e poss´ıvel executar o-
digo Java em qualquer plataforma, independentemente da plataforma na qual o odigo
foi gerado (ALECRIM, 2004). Cada instˆancia da JVM aloca um espa¸co de mem´oria
chamado de heap, que ´e compartilhado entre todas as suas threads. Heap ´e usada em
tempo de execu¸ao para guardar temporariamente todos os objetos de classes e arrays
criados. O tamanho aximo padr˜ao da heap depende da implementa¸ao da JVM (va-
riam de 16MB a 64MB), por´em todas as implementa¸oes permitem que o valor aximo
e m´ınimo da heap sejam modificados. Sempre que o espa¸co necess´ario para executar uma
aplica¸ao ´e maior que o tamanho aximo da heap, a JVM lan¸ca uma exce¸ao chamada
java.lang.OutOfMemoryError: Java Heap Space. Este erro era apresentado durante
a execu¸ao do m´etodo de escolha dos coeficientes do modelo, chamado de m´etodo de
axima verossimilhan¸ca. Quando a exce¸ao “java.lang.OutOfMemoryError: Java Heap
Spaceocorre, n˜ao a como liberar espa¸co para continuar a aplica¸ao, porque os dados con-
tidos na heap podem ser ainda necess´arios para a execu¸ao do resto do m´etodo. Portanto
a melhor solu¸ao seria aumentar o tamanho aximo da heap para um valor satisfat´orio
para a aplica¸ao. Por´em, na nossa aplica¸ao, o valor satisfat´orio para o tamanho da heap
5.2 Ambiente Computacional Desenvolvido 71
era superior ao tamanho aximo que o Netbeans 6.0.1 permitia configurar para a heap.
Enao a solu¸ao encontrada foi utilizar outro m´etodo para encontrar os coeficientes do
modelo, e o m´etodo de M´axima Verossimilhan¸ca foi substitu´ıdo pelos m´etodos RLS e ELS
com muito sucesso, por que solucionou o problema de gera¸ao de exce¸oes anteriormente
descrito e apresentou resultados em tempo computacional inferior ao etodo de axima
verossimilhan¸ca.
5.2 Ambiente Computacional Desenvolvido
Figura 5.21: Tela inicial do sistema de gera¸ao de modelos ARIMA/ARIMAX.
Ser´a apresentado a seguir o sistema de gera¸ao dos modelos ARIMA/ARIMAX. O
sistema possui uma tela inicial onde o usu´ario do mesmo ir´a informar o arquivo que
conem os dados da erie temporal atraes do bot˜ao “Abrir Dados da erie”, como pode
ser visto na Figura 5.21. O arquivo contendo os dados da erie temporal deve ser um
arquivo .txt ou .csv. Os formatos aceitos para este arquivos ao:
O arquivo pode conter uma coluna apenas com os valores da s´erie temporal, orde-
nados no tempo, e sem cabcalho;
O arquivo pode conter duas colunas separadas por tabula¸ao ou por espa¸co, a pri-
meira contendo os timestamps e a segunda contendo os valores da erie temporal,
ordenadas por ordem crescente do timestamp, sendo a primeira linha deste arquivo
destinado ao cabcalho contendo o t´ıtulo de cada coluna;
Os valores da s´erie temporal dentro do arquivo devem ser sempre n´umeros reais,
com as casas decimais separadas por ponto (e ao por v´ırgula);
72 5 Testes e Resultados Preliminares
O timestamp da s´erie temporal conem trˆes formatos poss´ıveis:
Ano: o timestamp ´e um n´umero inteiro representando um ano. Ex.: 1998;
es/Ano: o timestamp ´e um n´umero inteiro representando um mˆes, separado
por barra (/) ou h´ıfen (-), seguido de um n´umero inteiro representando um
ano. Ex.:01/1998 e 01-1998;
Dia/Mˆes/Ano: o timestamp ´e um n´umero inteiro representando um dia, sepa-
rado por barra (/) ou h´ıfen (-), seguido de um n´umero inteiro representando
um mˆes, separado por barra (/) ou h´ıfen (-), seguido de um n´umero inteiro
representando um ano. Ex.:01/11/1998 e 01-11-1998.
Ap´os selecionado o arquivo de dados da erie temporal, deve-se selecionar um dos ti-
pos de modelo a ser criado: ARIMA ou ARIMAX, de acordo com a presen¸ca de entradas
ex´ogenas na erie. Se a erie temporal ao possui entradas ex´ogenas, deve-se selecionar
o modelo ARIMA. Se a erie possui entradas ex´ogenas, deve-se selecionar o modelo ARI-
MAX.
´
E extremamente importante que o usu´ario selecione corretamente o tipo do modelo,
para a obten¸ao de um modelo correto para a erie temporal, uma vez que a informa¸ao
de que existe ou ao entradas ex´ogenas ao pode ser deduzida pelo sistema.
Caso o modelo selecionado tenha sido o modelo ARIMA, o usu´ario pode clicar no
bot˜ao “Gerar Modelo” para que o sistema estime um modelo para a s´erie temporal que foi
anteriormente carregada.
Caso o modelo selecionado tenha sido o modelo ARIMAX, o usu´ario deve informar o
n´umero de entradas ex´ogenas, e em seguida o usu´ario deve selecionar um arquivo contendo
os dados das entradas ex´ogenas, sendo um arquivo separado para cada entrada ex´ogena.
Por exemplo, se a s´erie cont´em duas entradas ex´ogenas, o usu´ario deve digitar 2 no
n´umero de entradas ex´ogenas, em seguida deve clicar no bot˜ao “Abrir Entradas Ex´ogenas”
e selecionar o arquivo contendo os dados da primeira entrada ex´ogena e clicar em “Abrir”
(existente na janela de busca) para que o primeiro arquivo seja carregado. Em seguida, a
janela de busca ser´a aberta novamente, onde o usu´ario deve selecionar o arquivo contendo
os dados da segunda entrada ex´ogena e clicar em “Abrir” para que o segundo arquivo seja
carregado. A tela do sistema ap´os estes passos pode ser vista na Figura 5.22. Ap´os todos
os arquivos carregados, o usu´ario pode clicar no bot˜ao “Gerar Modelo” para que o sistema
estime um modelo para a s´erie temporal que foi anteriormente carregada.
Ap´os alguns minutos, o sistema retornar´a na tela `a direta, o modelo mais apropriado `a
s´erie temporal carregada, contendo informa¸oes das ordens do modelo e seus coeficientes,
como pode ser visto nas Figuras 5.23 e 5.24. Al´em disso ao exibidos arios gr´aficos que
descrevem as caracter´ısticas da erie: o gr´afico da s´erie com seu valores reais, o gr´afico
da erie ap´os sofrer uma ou duas diferen¸cas (caso a erie seja ao-estacion´aria), o gr´afico
com a autocorrela¸ao residual, o gr´afico com a autocorrela¸ao cruzada, entre outros.
Ap´os a gera¸ao do modelo pelo sistema, o usu´ario pode optar por realizar previs˜oes da
s´erie temporal, para isso o usu´ario deve clicar no bot˜ao “Gerar Previs˜oes”. Os valores da
previs˜ao ser˜ao mostrados em um novo gr´afico intitulado “Previs˜oes da erie Temporal”.
5.2 Ambiente Computacional Desenvolvido 73
Figura 5.22: Detalhe da tela do sistema de gera¸ao de modelos ARIMA/ARIMAX ap´os
os arquivos carregados contendo as entradas ex´ogenas.
74 5 Testes e Resultados Preliminares
Figura 5.23: Tela do sistema de gera¸ao de modelos ap´os a gera¸ao de um modelo ARI-
MAX.
5.2 Ambiente Computacional Desenvolvido 75
Figura 5.24: Detalhe da tela do sistema de gera¸ao de modelos ap´os a gera¸ao de um
modelo ARIMAX, mostrando a exibi¸ao dos coeficientes do modelo gerado.
76 5 Testes e Resultados Preliminares
77
6 Estudo de Caso
Para o estudo de caso os modelos ARIMAX ser˜ao utilizados para inferir valores de
perda de propano em uma planta de produ¸ao de as Liquefeito de Petr´oleo (GLP). Nesta
planta ao utilizados controladores que ajustam o etano e i-pentano presentes na compo-
si¸ao do GLP produzido por uma Unidade de Processamento de as Natural (UPGN)
(BESERRA et al., 2008).
O as natural proveniente de campos de produ¸ao passa por arias etapas diferentes
em uma planta de processamento de tal as. Na primeira etapa ´e realizada a remo¸ao de
´agua e elementos oxidantes e ap´os isto, o as ´e transportado para colunas de destila¸ao
fracionada. Na planta em estudo, existem duas colunas de destila¸ao de petr´oleo, a
deetanizadora e a debutanizadora, ambas compostas por trˆes partes: uma coluna, um
condensador e um refervedor (BESERRA et al., 2008). Essas colunas ao respons´aveis
por realizar a separa¸ao do as natural, ou as in natura, em arios compostos ou sub-
produtos, atrav´es do processo de destila¸ao. Como cada elemento que constitui o as
possui temperaturas de ebuli¸ao diferentes, atrav´es da adi¸ao ou subtra¸ao de calor ´e
poss´ıvel separar os seus componentes (BESERRA et al., 2008).
Na Figura 6.1 podem ser vistas as colunas de destila¸ao fracionada: a primeira ´e a
deetanizadora, que ´e respons´avel pela produ¸ao de as de Venda ou as Industrial (pro-
duto de topo) e L´ıquido de as Natural (LGN) (produto de fundo), a segunda coluna ´e
a debutanizadora, que ´e respons´avel pela produ¸ao do GLP (produto de topo), composto
por propanos e butanos, e de C5+, ou gasolina natural (produto de fundo). O controle
de quanto ´e produzido de cada sub-produto ´e garantido pela atua¸ao conjunta dos con-
troladores relacionados `a vaz˜ao de refluxo, `a temperatura de fundo e ao n´ıvel da coluna
(BESERRA et al., 2008).
Detalhando-se um pouco mais a planta da Figura 6.1, tem-se o fornecimento da carga
de entrada da coluna deetanizadora. Essa carga de entrada ´e constante e constitu´ıda de
as natural, que ´e um as composto por hidrocarbonetos (C1+). Na coluna deetaniza-
dora, uma parte do produto de fundo, composto por C3+ e uma pequena quantidade
de C2, conhecido por LGN, sai desta coluna e ´e transportado `a coluna debutanizadora.
Uma outra parte do LGN passa por um processo de aquecimento em um reboiler e depois
retorna `a coluna deetanizadora (BESERRA et al., 2008). Segundo Beserra et al. (2008), um
controlador de temperatura ajusta a abertura de uma alvula que regula a vaz˜ao de ´oleo
t´ermico que passa por esse reboiler, enquanto que um controlador de n´ıvel ajusta uma
outra alvula que regula o fluxo de LGN que ´e fornecido para a coluna debutanizadora.
a o produto de topo da coluna deetanizadora passa por um trocador de calor e ´e trans-
portado a um vaso de condensado. Um controlador de press˜ao regula a abertura de uma
alvula determinando desta forma a quantidade de as residual que ser´a liberado para
78 6 Estudo de Caso
Figura 6.1: Colunas da planta de produ¸ao de GLP.
comercializa¸ao. A partir do n´ıvel presente em um controlador de n´ıvel, um controlador
de fluxo ajusta a abertura da alvula que regula o fluxo de LGN que retornar´a do vaso
de condensado `a coluna deetanizadora (BESERRA et al., 2008).
Na coluna debutanizadora, uma parte do produto de fundo, a gasolina natural, ´e
comercializada, enquanto que outra parte passa pelo processo de aquecimento em um
reboiler e retorna `a mesma coluna. Um controlador ´e respons´avel por regular a vaz˜ao de
´oleo t´ermico que passa pelo reboiler. Enquanto isso, um controlador de press˜ao ajusta a
abertura da v´alvula que regula a quantidade de produto de topo que ´e transportado de um
vaso de condensado, passando por um air-cooler. Este air-cooler ´e respons´avel por passar
o g´as para o estado l´ıquido. Um outro controlador regula a abertura da v´alvula de refluxo
que controla o fluxo de uma parte do GLP contido no vaso de condensado que retornar´a
`a coluna debutanizadora, enquanto que a outra parte do GLP do vaso de condensado
´e extra´ıdo do topo da coluna debutanizadora para ser comercializado (BESERRA et al.,
2008).
Dentre os produtos produzidos pela Unidade de Processamento de G´as Natural, o que
possui mais valor econˆomico ´e o GLP, produzido pela coluna debutanizadora (BESERRA
et al., 2008). A coluna deetanizadora produz como produto de topo alguns compostos de
menor valor ecoomico que o GLP, por´em produz tamb´em res´ıduos de propano (C3), que ´e
um composto valioso e que n˜ao deveria existir na produ¸ao de topo de tal coluna, gerando
assim desperd´ıcios e perdas no sentido econˆomico, uma vez que um composto de alto
valor ser´a vendido por um pre¸co inferior ao que deveria. Diante deste problema, prop˜oe-
se neste estudo de caso a utiliza¸ao de um modelo ARIMAX para realizar inferˆencias sobre
os valores de fra¸ao molar do propano (C3) que ao produzidos indevidamente no topo
da coluna deetanizadora da planta de produ¸ao de GLP, utilizando-se como entradas
ex´ogenas os valores de vaz˜ao de refluxo e temperatura desta coluna, enquanto que a
6 Estudo de Caso 79
s´erie temporal observada ser´a a perda de propano (C3) no topo da coluna deetanizadora.
Atrav´es da inferˆencia do propano (C3) produzido no topo dessa coluna, ser´a poss´ıvel
interferir nas entradas de forma a diminuir a perda deste composto ao m´ınimo poss´ıvel, e
conseq
¨
uentemente, diminuir o desperd´ıcio.
Vale salientar que neste estudo de caso ao dispomos da medi¸ao real dos valores
de perda de propano na UPGN no topo da coluna debutanizadora. As colunas aqui
utilizadas foram simuladas computacionalmente em um software comercial de processos
qu´ımicos, chamado HYSYS (BESERRA et al., 2008), e essas simula¸oes foram utilizadas na
gera¸ao do modelo ARIMAX. Desta forma, ao ines de dizer que ao realizadas“previs˜oes”
sobre os dados, dizemos que s˜ao realizadas “inferˆencias” sobre os mesmos, pois n˜ao tem-se
conhecimento dos valores reais da perda de propano.
A seguir, ser´a apresentado o melhor modelo obtido pelo ambiente computacional para
a S´erie Temporal de Perdas de Propano no topo da coluna deetanizadora, que ser´a referen-
ciada a partir de agora como erie Temporal de Perdas de Propano apenas. Inicialmente
foram coletados do sistema HYSYS um conjunto de amostras da erie de Perdas de Pro-
pano, al´em dos dois conjuntos de dados das entradas ex´ogenas correspondentes, sendo
a primeira entrada, X
1
t
, a vaz˜ao de refluxo e a segunda entrada, X
2
t
, a temperatura. A
vaz˜ao de refluxo ´e dada em Kg.Mole/h e a temperatura ´e dada em graus Celsius. a a
S´erie Temporal de Perdas de Propano ´e dada em fra¸ao molar e possu´ıa originalmente
valores muito pequenos da ordem de 10
3
, portanto foi feito um pr´e-processamento sobre
os dados da erie, multiplicando-os por 10
6
, logo erie temporal ´e dada em 10
6
fra¸ao
molar.
Ap´os este pr´e-processamento, foi realizada uma separa¸ao no conjunto de dados da
s´erie e das entradas ex´ogenas. Originalmente estes conjuntos continham 299 amostras,
das quais 250 foram utilizadas para estimar o modelo e as outras 49 foram utilizadas para
a realiza¸ao de inferˆencias.
Pelo fato do estudo de caso em quest˜ao possuir entradas ex´ogenas, optou-se por esti-
mar um modelo do tipo ARIMAX. Optou-se por n˜ao fazer qualquer transforma¸ao pr´evia
na erie do tipo logar´ıtmica, nem utilizar a erie diferenciada para criar o modelo, uma
vez que este tipo de transforma¸ao ao melhora a qualidade das previs˜oes, pelo contr´ario,
torna necess´ario um processamento extra pois gera previs˜oes viesadas.
A S´erie Temporal de Perdas de Propano utilizada para a estimao do modelo conem
250 valores que foram amostrados a cada 30 segundos (ou 0,5 minutos), sendo a erie
ordenada por minutos que ao de 0 a 124,5, vistos no gr´afico da Figura 6.2. Os valores
das duas entradas ex´ogenas podem ser vistos nas Figuras 6.3 e 6.4. Para esta erie foram
gerados dois modelos: um contendo termos de edias oveis, ARIMAX(1,0,6,[1-5,4-0]),
e outro sem termos de edias oveis, ARIX, que pode ser entendido como um modelo
ARIMAX com a ordem q = 0, ou seja, ARIMAX(1,0,0,[1-5,4-0]). Dentre esses dois mo-
delos, o modelo ARIMAX apresentou um ajuste melhor que o modelo ARIX, uma vez
que a soma dos erros absolutos do primeiro foi de 82,67 e do segundo foi de 260,09. A
qualidade das inferˆencias do modelo ARIX tamb´em foi inferior `aquela apresentada pelo
ARIMAX, pois o modelo ARIX apresentou erro absoluto m´edio e maior erro absoluto das
inferˆencias iguais a 34,41 e 52,64 respectivamente, enquanto que o ARIMAX apresentou
erro absoluto m´edio e maior erro absoluto das inferˆencias iguais a 29,29 e 50,31 respectiva-
mente. Atrav´es da compara¸ao dos resultados dos modelo ARIX e ARIMAX em rela¸ao
80 6 Estudo de Caso
ao ajuste `a erie e `as inferˆencias, optou-se pela utiliza¸ao do modelo ARIMAX. O ajuste
do modelo ARIX pode ser visto na Figura 6.5 e o ajuste do modelo ARIMAX pode ser
visto na Figura 6.6.
Figura 6.2: erie Temporal de Perdas de Propano (dada em 10
6
Fra¸ao Molar)
Figura 6.3: Entrada Ex´ogena 1 - Vaz˜ao de Refluxo (dada em Kg.Mole/h)
6 Estudo de Caso 81
Figura 6.4: Entrada Ex´ogena 2 - Temperatura (dada em graus Celsius)
Figura 6.5: Gr´afico da erie Real versus erie gerada pelo modelo ARIX.
82 6 Estudo de Caso
Figura 6.6: Gr´afico da erie Real versus erie gerada pelo modelo ARIMAX.
Figura 6.7: erie Temporal de Perdas de Propano ap´os duas diferen¸cas.
6 Estudo de Caso 83
Figura 6.8: Gr´afico da S´erie Real diferenciada versus S´erie gerada pelo modelo ARIMAX.
Foi gerado tamb´em um modelo a partir da Serie Temporal de Perdas de Propano
com diferen¸cas. Foi realizado um teste de estacionariedade da erie e verificou-se que esta
´e ao-estacion´aria, enao foram realizadas duas diferen¸cas at´e que a mesma se tornasse
estacion´aria. A erie temporal estacion´aria resultante das duas diferen¸cas ´e mostrada na
Figura 6.7 e para esta erie o modelo estimado foi o ARIMAX(1,2,1,[1-0,2-1]). O ajuste do
modelo ARIMAX com parˆametro d = 2 pode ser visto na Figura 6.8, onde verifica-se que
a qualidade do ajuste foi inferior ao apresentado pelo modelo ARIMAX sem diferen¸cas
(d = 0) na s´erie. Desta forma optou-se por escolher como modelo para a S´erie Temporal de
Perdas de Propano o modelo ARIMAX com d = 0, uma vez este apresentou melhor ajuste
que o modelo com diferen¸cas e ao apresenta o problema de gerar inferˆencias viesadas.
Assim, ap´os os testes, o sistema indicou o modelo ARIMAX(1,0,6,[1-5,4-0]) descrito
na Equa¸ao 6.1:
Z
t
= 0, 99Z
t1
+ 1, 0a
t
+ 0, 03a
t1
+ 0, 33a
t2
+ 0, 15a
t3
+ 0, 11a
t4
+ 0, 19a
t5
+0, 13a
t6
0, 13X
1
t5
+ 2, 35X
2
t
1, 37X
2
t1
0, 42X
2
t2
0, 01X
2
t3
(6.1)
onde Z
t
´e a s´erie temporal sem diferen¸cas, a
t
´e o ru´ıdo aleat´orio estimado, X
1
t
´e a en-
trada ex´ogena 1 (vaz˜ao de refluxo) e X
2
t
´e entrada ex´ogena 2 (temperatura), ambas ao
diferenciadas.
Para a estima¸ao das ordens do modelo ARIMAX, o m´etodo CIA testou arias ordens
variando de 1 a 6 (onde 6 ´e igual ao ln(250) e 250 ´e o n´umero de amostras da s´erie
dispon´ıveis). Para a estima¸ao dos coeficientes do modelo ARIMAX foi utilizado o m´etodo
84 6 Estudo de Caso
Figura 6.9: Ru´ıdos correspondentes `a parte MA do modelo ARIMAX estimados pelo
Algoritmo ELS.
ELS com matriz de covariˆancia (δ) inicial igual a 10
4
. Para o fator de esquecimento (λ)
do algoritmo ELS foi utilizado o valor 1,0, o que significa que as amostras mais recentes e
menos recentes da s´erie temporal ser˜ao igualmente ponderadas. Os ru´ıdos correspondentes
`a parte MA do modelo ARIMAX ao ao conhecidos e foram estimados pelo algoritmo
ELS. Esses valores estimados podem ser vistos na Figura 6.9.
A Figura 6.6 mostra a erie Temporal de Perdas de Propano juntamente com a erie
temporal gerada pelo modelo ARIMAX estimado pelo sistema. A partir deste gr´afico ´e
poss´ıvel visualizar a qualidade do ajuste do modelo matem´atico `a erie temporal, mos-
trando um bom ajuste entre as duas eries, de onde conclui-se que o modelo ARIMAX
gerado pelo sistema representa bem os dados da s´erie temporal. Para fazer o diagn´ostico
do modelo, se o modelo ´e adequado `a erie temporal, a verifica¸ao visual auxilia mas ao
´e suficiente. Para isso foi efetuado o diagn´ostico do mesmo realizando o teste de auto-
correla¸ao residual, que analisa as autocorrela¸oes estimadas dos res´ıduos, que podem ser
vistas na Figura 6.10. Analisando-se o gr´afico da Figura 6.10, verifica-se que em j = 7 a
autocorrela¸ao residual extrapolou o limite de ±2/
n, dando ind´ıcios de que um termo
a
t7
deveria ser adicionado ao modelo para torn´a-lo adequado. O valor de j = 1 tamb´em
extrapolou o limite mas ao foi adicionado porque este termo a est´a presente no modelo.
O termo a
t7
foi adicionado na primeira itera¸ao do teste de diagn´ostico, a cada itera¸ao
apenas um termo ´e adicionado ao modelo e enao o gr´afico de autocorrela¸ao residual
´e recalculado para este modelo e novamente verificado. Ao final de todas as itera¸oes,
ou seja, quando ao haviam mais termos a serem adicionados, chegou-se ao modelo final:
ARIMAX(1,0,9,[1-5,4-0]). O modelo ARIMAX(1,0,6,[1-5,4-0]) apresentou a somat´oria dos
erros absolutos de ajuste igual a 82,67 enquanto que o modelo ARIMAX(1,0,9,[1-5,4-0])
obteve a somat´oria dos erros absolutos de ajuste igual a 80,92, onde conclui-se que este
6 Estudo de Caso 85
´ultimo modelo possui um melhor ajuste `a s´erie temporal. Por´em, o maior erro absoluto
e o erro absoluto edio encontrados nas inferˆencias do modelo ARIMAX(1,0,6,[1-5,4-0])
foram de 50,31 e 29,29 respectivamente, enquanto que o maior erro absoluto e o erro
absoluto m´edio encontrados nas inferˆencias do modelo ARIMAX(1,0,9,[1-5,4-0]) foram de
54,25 e 29,68 respectivamente. Desta forma, conclui-se que o modelo ARIMAX(1,0,6,[1-
5,4-0]) obteve uma qualidade de inferˆencia superior `a do modelo ARIMAX(1,0,9,[1-5,4-0])
porque seus erros absolutos foram menores. Al´em disso, analisando-se as variˆancias resi-
duais dos modelos ARIMAX(1,0,6,[1-5,4-0]) e ARIMAX(1,0,9,[1-5,4-0]), respectivamente
1,36 e 1,32, verificou-se que elas ao muito pr´oximas e portanto, segundo Moretin e Toloi
(2004), o modelo ARIMAX(1,0,6,[5,3]) ´e preferido para representar a erie temporal de
Perdas de Propano. O teste de autocorrela¸ao cruzada ao foi realizado uma vez que, se-
gundo Moretin e Toloi (2004), quando o modelo pr´evio estimado cont´em termos de m´edias
oveis a interpreta¸ao de valores grandes desta autocorrela¸ao ao ´e ao ´obvia.
Figura 6.10: Autocorrela¸oes Estimadas dos Res´ıduos do modelo ARIMAX.
As Figuras 6.11 a 6.22 mostram a convergˆencia dos coeficientes de cada termo do
modelo em fun¸ao do n´umero de itera¸oes do algoritmo ELS. A convergˆencia do termo a
t
ao ´e mostrada porque este termo ´e fixo e sempre igual a 1,0.
Depois do modelo ARIMAX ter sido diagnosticado como adequado, o modelo est´a
apto para gerar inferˆencias sobre a erie temporal. Foram realizadas inferˆencias de 49
valores para esta erie temporal, utilizando-se os horizontes h = 1, ..., 49 e a origem das
inferˆencias em t = 124, 5. Os erros relativos de inferˆencia (em percentuais) podem ser
vistos na Figura 6.23. O erro relativo m´edio de inferˆencia (em percentual) foi de 1,71% e
o maior erro relativo de inferˆencia (em percentual) foi de 2,92%.
Al´em das inferˆencias descritas no par´agrafo anterior, utilizou-se o modelo gerado para
realizar inferˆencias sobre um outro conjunto de dados da s´erie temporal de perdas de
86 6 Estudo de Caso
Figura 6.11: Gr´afico de convergˆencia do termo Z
t1
do modelo ARIMAX.
Figura 6.12: Gr´afico de convergˆencia do termo a
t1
do modelo ARIMAX.
6 Estudo de Caso 87
Figura 6.13: Gr´afico de convergˆencia do termo a
t2
do modelo ARIMAX.
Figura 6.14: Gr´afico de convergˆencia do termo a
t3
do modelo ARIMAX.
88 6 Estudo de Caso
Figura 6.15: Gr´afico de convergˆencia do termo a
t4
do modelo ARIMAX.
Figura 6.16: Gr´afico de convergˆencia do termo a
t5
do modelo ARIMAX.
6 Estudo de Caso 89
Figura 6.17: Gr´afico de convergˆencia do termo a
t6
do modelo ARIMAX.
Figura 6.18: Gr´afico de convergˆencia do termo X
1
t5
do modelo ARIMAX.
90 6 Estudo de Caso
Figura 6.19: Gr´afico de convergˆencia do termo X
2
t
do modelo ARIMAX.
Figura 6.20: Gr´afico de convergˆencia do termo X
2
t1
do modelo ARIMAX.
6 Estudo de Caso 91
Figura 6.21: Gr´afico de convergˆencia do termo X
2
t2
do modelo ARIMAX.
Figura 6.22: Gr´afico de convergˆencia do termo X
2
t3
do modelo ARIMAX.
92 6 Estudo de Caso
Figura 6.23: Erros Relativos de Inferˆencia (em percentuais).
propano, conjunto este completamente diferente daquele que foi utilizado para a estima¸ao
do modelo. Foram geradas 299 inferˆencias (utilizando-se os horizontes h = 1, ..., 299 e a
origem das inferˆencias em t = 124, 5) e o erro relativo m´edio percentual de tais inferˆencias
foi de 1,72%. Os erros relativos de inferˆencia (em percentuais) deste novo conjunto de
dados podem ser vistos na Figura 6.24.
Figura 6.24: Erros Relativos Percentuais de Inferˆencias sobre um novo conjunto de dados
da s´erie temporal.
Entre as conclus˜oes obtidas com o estudo de caso, tem-se: a verifica¸ao da ao-
estacionariedade da s´erie temporal, a estima¸ao do tipo de modelo mais adequado `a s´erie,
sendo ele o ARMAX, a estima¸ao das ordens e dos coeficientes do modelo, bem como a
6 Estudo de Caso 93
identifica¸ao dos regressores das entradas ex´ogenas com atrasos, o diagn´ostico do modelo,
cuja conclus˜ao foi de que o modelo ´e adequado `a s´erie e representa bem a sua dinˆamica,
e por fim, a gera¸ao das inferˆencias sobre a s´erie com erro relativo percentual m´edio de
1,71%, que ´e considerado um erro relativo percentual baixo.
94 6 Estudo de Caso
95
7 Conclus˜oes
Foram realizadas nesta disserta¸ao todas as etapas de Identifica¸ao de modelos ARIMA
/ARIMAX, desde o teste de estacionariedade, a sele¸ao do modelo linear a ser utilizado
para a erie, a estima¸ao das ordens e dos coeficientes do modelo, bem como a estima¸ao
dos regressores das entradas ex´ogenas com atrasos (utilizando-se o Crit´erio de Informa-
¸ao de Akaike Modificado). Foram realizados ao final, testes de diagn´ostico do modelo
estimado e inferˆencias dos dados da s´erie temporal.
Todas as etapas descritas no par´agrafo anterior foram implementadas na linguagem
de programa¸ao Java, e deram origem a um sistema que recebe como entradas uma erie
temporal e suas entradas ex´ogenas, caso existam, e gera como sa´ıda o modelo estimado
pelo sistema, al´em de diversos gr´aficos relacionados `a s´erie, como por exemplo: o gr´afico
da erie ap´os a realiza¸ao de diferen¸cas, os gr´aficos de convergˆencia dos coeficientes do
modelo estimado, o gr´afico da fun¸ao de autocorrela¸ao estimada dos res´ıduos e o gr´afico
do erro relativo percentual da predi¸ao ou inferˆencia.
Todos as etapas implementadas foram validadas com arias s´eries temporais fict´ıcias
para modelos ARIMA e ARIMAX.
Ap´os todas as etapas validadas, o sistema foi aplicado ao Estudo de Caso: a S´erie
Temporal de Perdas de Propano (C3) no topo da coluna deetanizadora de uma Unidade
de Processamento de as Natural. ao a como verificar se as ordens e os coeficientes
do modelo encontrados para a erie temporal do estudo de caso ao corretos porque ao
se tem conhecimento do modelo real de tal s´erie. Por´em esta falta de conhecimento ao
gera preju´ızos `a nossa aplica¸ao, uma vez que o objetivo principal da estima¸ao do modelo
para a erie do estudo de caso ´e a utiliza¸ao deste modelo para gerar inferˆencias da erie.
As inferˆencias geradas pelo modelo ARIMAX estimado pelo sistema apresentaram er-
ros relativos percentuais que variaram de 0,08% a 2,92%, sendo o erro relativo m´edio (em
percentual) igual a 1,71%. Esses valores demonstram que o modelo estimado ´e adequado
`a erie e gerou inferˆencias de boa qualidade, ou seja, com baixo erro relativo percentual.
Desta forma, o modelo ARIMAX estimado poder´a ser utilizado como um sensor de soft-
ware capaz de estimar os valores de Perda de Propano na coluna deetanizadora sempre
que um sensor de hardware ao estiver dispon´ıvel.
7.1 Contribui¸oes
As principais contribui¸oes desta disserta¸ao ao:
96 7 Conclus˜oes
A modifica¸ao realizada no Crit´erio de Informa¸ao de Akaike, que possibilita a esti-
ma¸ao das ordens e tamb´em dos atrasos das entradas ex´ogenas do modelo ARIMAX;
A realiza¸ao de todas as etapas da metodologia de modelagem;
O desenvolvimento de um sistema para modelagem de eries temporais implemen-
tado na linguagem de programa¸ao Java;
A aplica¸ao do sistema desenvolvido para solucionar o problema do estudo de caso.
7.2 Trabalhos Futuros
Como trabalho futuro, pretende-se continuar com o estudo de modelos para eries
temporais com o foco em modelos ao-lineares chamados NARMAX.
97
Referˆencias
AGUIRRE, L. A. Introdu¸ao `a Identificao de Sistemas - ecnicas Lineares e ao-
lineares Aplicadas a Sistemas Reais. 3. ed. Belo Horizonte, MG: Editora UFMG, 2007.
AGUIRRE, L. A.; RODRIGUES, G. G.; J
´
ACOME, C. R. F. Identifica¸ao de sistemas
ao-lineares utilizando modelos NARMAX polinomiais - uma revis˜ao e novos resultados.
SBA Controle & Automa¸ao, v. 9, n. 2, 1998.
ALECRIM, E. aquina Virtual Java (Java Virtual Machine). 2004. Acessado em:
28/01/2009. Dispon´ıvel em: <http://www.infowester.com/jvm.php>.
ANSUJ, A. P.; ALMEIDA, D. T. de; SANTOS, R. O. dos. Previs˜ao da demanda de exa-
mes de dire¸ao veicular no estado do Rio Grande do Sul. XXVIII Congresso Nacional de
Matem´atica Aplicada e Computacional - CNMAC, 2005. Acessado em: 08/01/2008. Dis-
pon´ıvel em: <http://www.sbmac.org.br/eventos/cnmac/cd xxviii cnmac/resumosdos/
raquel santos ST14.pdf>.
BARBIERO, C. C. de M. eries Temporais: Um Estudo de Previs˜ao para a Re-
ceita Operacional da ECT - Empresa Brasileira de Correios e Tel´egrafos. Disserta¸ao
(Mestrado) Universidade Federal de Santa Catarina - Programa de os-Gradua¸ao
em Engenharia de Produ¸ao - SC, 2003. Acessado em: 30/01/2009. Dispon´ıvel em:
<http://www.qualimetria.ufsc.br/dissertacoes arquivos/claudia.pdf>.
BECERRA, V. M. Advanced System Identification CY4A2 - Lecture No-
tes - Lecture 3: Recursive Least Squares. University of Reading - School
of Systens Engineering. Acessado em: 23/03/2009. 2008. Dispon´ıvel em:
<http://www.personal.reading.ac.uk/ shs99vmb/notes/asi/Lecture3.pdf>.
BERGAMASCHI, D. P. Fundamentos de bioestat´ıstica - aula 8 - notas de
aula. UFMT/Instituto de Sa´ude Coletiva/USP/Faculdade de Sa´ude ublica
- Programa PQI/CAPES. Acessado em: 08/01/2008. 2003. Dispon´ıvel em:
<http://www.fsp.usp.br/ denisepb/aula8testehip.pdf>.
BESERRA, A. F. L.; J
´
UNIOR, J. M. A.; ARA
´
UJO, F. M. U. de; MAITELLI, A. L. Con-
troladores Fuzzy aplicados na gera¸ao dinˆamica de Set Points para colunas de destila¸ao
visando o ajuste da fra¸ao molar de etanos e pentanos presentes no GLP. CBA, 2008.
BOLETIM SIQUEIRA CAMPOS. Aprendizado instananeo. Boletim Si-
queira Campos, 2002. Acessado em: 08/01/2008. Dispon´ıvel em:
<http://www.siqueiracampos.com/pdf/b10.pdf>.
CIENTEC. Consultoria e desenvolvimento de sistemas Ltda, amostragem casual simples-
manual t´ecnico. Acessado em: 08/01/2008. [entre 2001 e 2008]. Dispon´ıvel em:
<http://www.matanativa.com.br/matanativa2/ajudasimples.asp>.
98 Referˆencias
COELHO, A. A. R.; COELHO, L. dos S. Identificao de Sistemas Dinˆamicos Lineares.
1. ed. Florian´opolis, SC: Editora da UFSC, 2004.
EHLERS, R. An´alise de eries temporais - notas de aula. Departamento
de Estat´ıstica, UFPR. Acessado em: 08/01/2008. 2005. Dispon´ıvel em:
<http://leg.ufpr.br/ ehlers/notas/stemp.pdf>.
FAVERO, L. P. L.; OLIVEIRA, M. A. de. Uma breve descri¸ao de algumas t´ec-
nicas para an´alise de s´eries temporais: S´eries de Fourier, Wavelets, ARIMA,
modelos estruturais para s´eries de tempo e redes neurais. VI SEMEAD - Se-
min´arios em Administrao - FEA/USP, 2003. Acessado em: 08/06/2008. Dis-
pon´ıvel em: <http://www.ead.fea.usp.br/semead/6semead/MQI/010MQI%20-
Algumas%20Tecnicas%20para%20Anal%20de%20Series%20Temporais.doc>.
FERRARI, S. M. Identificao on-line de motores de indu¸ao atravez de modelo discreto
para sinais senoidais - Cap´ıtulo 4: Estima¸ao de Parˆametros de M´ınimos Quadrados.
Disserta¸ao (Mestrado) — Universidade do Estado de Santa Catarina - Centro de Ciˆencias
Tecnol´ogicas - Departamento de Engenharia El´etrica, 2006. Acessado em: 23/03/2009.
Dispon´ıvel em: <http://www.tede.udesc.br/tde busca/arquivo.php?codArquivo=448>.
HAYKIN, S. Redes Neurais - Princ´ıpios e Pr´atica. 2. ed. [S.l.]: Editora Bookman, 2000.
HOFLER, R. A. Akaike’s Information Criterion and the Schwarz Criterion -
Class Notes. University of Central Florida - College of Business Administration
- Department of Economics. Acessado em: 30/01/2009. 2001. Dispon´ıvel em:
<http://www.bus.ucf.edu/hofler/eco 6416/eco 6416 classnotes Spring2001/Akaike%
20Info%20Criterion.pdf>.
HOTTA, L. K.; VASCONCELLOS, K. L. Aggregation and Disaggregation of structu-
ral time series models. Jornal of Times Series Analysis - Blackwell Publishers Ltd.,
v. 20, n. 2, 1999. Acessado em: 11/04/2008. Dispon´ıvel em: <http://www.blackwell-
synergy.com/doi/pdf/10.1111/1467-9892.00131>.
LEITE, S. Q. Proje¸oes para a demanda por Energia El´etrica no Bra-
sil, 2006-2015. Disserta¸ao (Mestrado) Faculdade de Economia e Fi-
nan¸cas IBMEC - Programa de os-Gradua¸ao e Pesquisa em Administra-
¸ao e Economia - RJ, 2006. Acessado em: 12/06/2008. Dispon´ıvel em:
<http://www.ibmecrj.br/sub/RJ/files/dissert mestrado/ECO/ECO sidimarleite
dez.pdf>.
LIMA, E. C. R.; C
´
ESPEDES, B. J. V. O desempenho do mercado (focus) e do ba-
cen na previs˜ao da infla¸ao: Compara¸oes com modelos lineares univariados-nota t´ec-
nica. Ipea - boletim de conjuntura, 2003. Acessado em: 08/01/2008. Dispon´ıvel em:
<http://ipea.gov.br/pub/bccj/bc 60m.pdf>.
MACHADO, M. A. S.; J
´
UNIOR, R. G. T.; SOUZA, R. C. Previs˜ao de s´e-
ries temporais de falhas em manuten¸ao industrial usando redes neurais. ENGE-
VISTA, v. 7, n. 2, p. 4–18, 2005. Acessado em: 08/01/2008. Dispon´ıvel em:
<http://www.uff.br/engevista/2 7Engevista03.pdf>.
Referˆencias 99
MARQUES, P. A. C. Introdu¸ao `a filtragem adaptativa - notas de aula
da disciplina de processamento digital de sinal II. Instituto Superior de
Engenharia de Lisboa. Acessado em: 08/06/2008. [2007]. Dispon´ıvel em:
<http://www.deetc.isel.ipl.pt/analisedesinai/pdsII/Blibliografia/Filtragem%20
Adaptativa.pdf>.
MARTINS, R. S.; LOBO, D. S.; ARA
´
UJO, M. da P. Forma¸ao de pre¸cos e sazonalidade
no mercado de fretes rodovi´arios para produtos do agroneg´ocio no estado do Paran´a.
Revista Paraense de Desenvolvimento, n. 106, p. 113–136, 2004. Acessado em: 12/06/2008.
Dispon´ıvel em: <http://www.ipardes.gov.br/pdf/revista PR/106/ricardo.pdf>.
MEDEIROS, A. V. de. Modelagem de Sistemas Dinˆamicos ao lineares utilizando
Sistemas Fuzzy, Algoritmos Gen´eticos e Fun¸oes de Base Ortonormal. Disserta¸ao
(Mestrado) Universidade Estadual de Campinas - Faculdade de Engenharia El´e-
trica e de Computa¸ao - SP, 2006. Acessado em: 30/01/2009. Dispon´ıvel em:
<http://libdigi.unicamp.br/document/?code=vtls000380701>.
MOREIRA, D. S.; DIAS, P. L. da S.; LUCIO, P. S. Sistema de ava-
lia¸ao estat´ıstica de modelos num´ericos de previs˜ao do tempo. XIV
Congresso Brasileiro de Meteorologia - (CBMET), 2006. Acessado em:
08/01/2008. Dispon´ıvel em: <http://mtc-m15.sid.inpe.br/col/sid.inpe.br/mtc-
m15@80/2006/11.07.11.25/doc/Moreira.Sistema.pdf>.
MOREIRA, M.
ˆ
Angelo. Introdu¸ao `as redes neuronais artificiais - notas de aula. Escola
Superior de Tecnologia - Departamento de Matem´atica. Acessado em: 14/06/2008. 1997.
Dispon´ıvel em: <http://ltodi.est.ips.pt/mmoreira/PUBLICACOES P/introducao redes
neuronais 1997.pdf>.
MORETIN, P. A.; TOLOI, C. M. C. An´alise de S´eries Temporais. 1. ed. ao Paulo, SP:
Editora Edgard Blucher, 2004.
NGUYEN, H. H.; CHAN, C. W. Applications of data analysis techniques for
oil production prediction. Artigo de Engineering Applications of Artificial In-
telligence, v. 18, p. 549–558, 2005. Acessado em: 08/01/2008. Dispon´ıvel
em: <http://www.sciencedirect.com/science? ob=ArticleURL& udi=B6V2M-
4F9F84Y-3& user=687335& rdoc=1& fmt=& orig=search& sort=d&view=c& acct=
C000037878& version=1& urlVersion=0& userid=687335&md5=
db6084412f4c3f531aba2e467e8de4a6>.
PACHECO, A. G. F. Estudo da influˆencia de vari´aveis Meteorol´ogicas no apareci-
mento de casos graves de leptospirose em Salvador-BA via modelos de eries Tempo-
rais. Disserta¸ao (Mestrado) Minist´erio da Sa´ude - Funda¸ao Oswaldo Cruz - Es-
cola Nacional de Sa´ude P´ublica - RJ, 2001. Acessado em: 12/06/2008. Dispon´ıvel em:
<http://teses.cict.fiocruz.br/pdf/pachecoagfm.pdf>.
PALMA, J. A. Outliers em eries temporais - Uma Abordagem no Dom´ınio dos Modelos
ARMA. Disserta¸ao (Mestrado) FC-UL, 1998. Acessado em: 08/01/2008. Dispon´ıvel
em: <http://ltodi.est.ips.pt/dmat/documentos/papers.htm>.
PEIXOTO, M. L. B. Avalia¸ao da qualidade do infectˆometro como instrumento de identifi-
cao de surtos de Infec¸ao Hospitalar. Disserta¸ao (Mestrado) — Escola de Enfermagem
100 Referˆencias
da Universidade Federal de Minas Gerais, 2005. Acessado em: 08/01/2008. Dispon´ıvel
em: <http://www.enf.ufmg.br/mestrado/dissertacoes/MariaLuiza.pdf>.
POSKITT, D. S. A note on the Specification and Estimation of ARMA Sys-
tems. Jornal of Time Series Analysis - Blackwell Publishing Ltd., v. 26,
n. 2, 2005. Acessado em: 11/04/2008. Dispon´ıvel em: <http://www.blackwell-
synergy.com/doi/pdf/10.1111/j.1467-9892.2005.00397.x>.
SILVA, J. L. d. C. e. ProCon - Progn´ostico de Congestionamento de Tafego de Redes
usando Wavelets. Tese (Doutorado) os-gradua¸ao em Ciˆencia da Computa¸ao da
Universidade Federal de Pernambuco, 2004. Acessado em: 08/01/2008. Dispon´ıvel em:
<http://www.larces.uece.br/ jlcs/tese.pdf>.
THE APACHE SOFTWARE FOUNDATION. 8 Probability Distributions - The com-
mons Math User guide. Acessado em: 08/01/2008. [entre 2003 e 2008]. Dispon´ıvel em:
<http://commons.apache.org/math/userguide/distribution.html>.
THERON, R.; FLORES, J. A.; SIERRO, F. J.; VAQUERO, M.; BAR-
BERO, F. PaleoPlot:A Tool for the Analysis, Integration and Manipulation of
Time-series Paleorecords. Geoscience and Remote Sensing Symposium. IGARSS
’02. 2002 IEEE International, 2002. Acessado em: 08/01/2008. Dispon´ıvel em:
<http://ieeexplore.ieee.org/iel5/7969/22041/01027238.pdf>.
VALEN ¸CA, M. J. S.; FILHO, D. V.; FERREIRA, T. A. E.; LUDER-
MIR, T. B. Um modelo de previs˜ao baseado em inteligˆencia artificial na
gest˜ao de bibliotecas universit´arias. XII Semin´ario Nacional de Bibliote-
cas Universit´arias - SNBU, 2002. Acessado em: 08/01/2008. Dispon´ıvel em:
<http://www.sibi.ufrj.br/snbu/snbu2002/oralpdf/39.a.pdf>.
WIKIPEDIA. Recursive Least Square Filter. Acessado em: 28/01/2008. 2005. Dispon´ıvel
em: <http://en.wikipedia.org/wiki/Recursive least squares filter>.
ZIMERMANN, H. R. Diferentes ecnicas de condicionamento em eries Temporais Tur-
bulentas. Disserta¸ao (Mestrado) Universidade Federal de Santa Maria - Centro de
Ciˆencia Naturais e Exatas - Programa de os-Gradua¸ao em F´ısica, 2005. Acessado em:
08/01/2008. Dispon´ıvel em: <http://www.ufsm.br/pgfisica/alunos/dissertacao.pdf>.