Download PDF
ads:
ads:
Livros Grátis
http://www.livrosgratis.com.br
Milhares de livros grátis para download.
Dados Internacionais de Catalogação-na-Publicação (CIP)
Divisão Biblioteca Central do ITA/CTA
Breseghello, Fernando Neves
Estudo comparativo de métodos de previsão de demanda: uma aplicação ao caso dos aeroportos com
tráfego aéreo regular administrados pelo DAESP / Fernando Neves Breseghello.
São José dos Campos, 2005.
104f.
Tese de mestrado – Curso de Engenharia de Infra-Estrutura Aeronáutica. Área de Transporte Aéreo e
Aeroportos – Instituto Tecnológico de Aeronáutica, 2005. Orientador: Dr. Protógenes Pires Porto.
1. Análise de séries temporais. 2. Previsão econômica. 3. Tráfego aéreo. I. Centro Técnico
Aeroespacial. Instituto Tecnológico de Aeronáutica. Divisão de Engenharia de Infra-Estrutura
Aeronáutica. II. Título
REFERÊNCIA BIBLIOGRÁFICA
BRESEGHELLO, Fernando Neves. Estudo comparativo de métodos de previsão de
demanda: uma aplicação ao caso dos aeroportos com tráfego aéreo regular administrados
pelo DAESP. 2005. 104f. Tese de mestrado – Instituto Tecnológico de Aeronáutica, São José
dos Campos.
CESSÃO DE DIREITOS
NOME DO AUTOR: Fernando Neves Breseghello
TÍTULO DO TRABALHO: Estudo comparativo de métodos de previsão de demanda: uma
aplicação ao caso dos aeroportos com tráfego aéreo regular administrados pelo DAESP.
TIPO DO TRABALHO/ANO: Tese / 2005.
É concedida ao Instituto Tecnológico de Aeronáutica permissão para reproduzir cópias desta
tese e para emprestar ou vender cópias somente para propósitos acadêmicos e científicos. O
autor reserva outros direitos de publicação e nenhuma parte desta tese pode ser reproduzida
sem a autorização do autor.
___________________________
Fernando Neves Breseghello
Rua João Fonseca dos Santos, 109 – Jd Satélite.
12230-088 – São José dos Campos - SP
ads:
Estudo comparativo de métodos de previsão de demanda: uma
aplicação ao caso dos aeroportos com tráfego aéreo regular
administrados pelo DAESP
Fernando Neves Breseghello
Composição da Banca Examinadora:
Prof. Carlos Muller Presidente (ITA)
Prof. Protógenes Pires Porto Orientador (ITA)
Prof. Armando Zeferino Milioni (ITA)
Prof. Cláudio Jorge Pinto Alves (ITA)
Prof. Respício Antônio Espírito Santo Jr. (COPPE)
ITA
RESUMO
O presente trabalho tem como objetivo principal comparar o desempenho de
metodologias preditivas, baseadas na abordagem de séries temporais, diferentes das
atualmente utilizadas para prognosticar a demanda, para um horizonte de 12 meses, dos
aeroportos administrados pelo Departamento Aeroviário do Estado de São Paulo (DAESP)
operando com tráfego aéreo regular.
A determinação de previsões adequadas e, ao mesmo tempo, realistas, o que, em
outras palavras, significa utilizar o método preditivo com maior grau de precisão (ou menor
margem de erro), constitui-se em uma etapa fundamental para que o processo de
planejamento da administração aeroportuária possa ser adequadamente realizado.
Para alcançar o objetivo proposto, buscou-se, em primeiro lugar, estudar os principais
aspectos teóricos relacionados aos métodos de previsão de demanda abordados neste trabalho.
Posteriormente, segue-se o processo de calibração dos modelos propostos, aplicados às séries
históricas disponibilizadas pela referida instituição. Os modelos de séries temporais
experimentados nesta dissertação são: Trivial, Média Móvel de seis e 12 meses, Suavização
Exponencial Simples, Holt, Holt-Winters Aditivo, Holt-Winters Multiplicativo e os possíveis
modelos Box-Jenkins selecionados a partir do processo de identificação. Por fim emprega-se
uma estratégia de avaliação e seleção de modelos preditivos, de natureza quantitativa, para
subsidiar as conclusões apresentadas no final deste trabalho.
Os resultados obtidos, mediante a utilização desta estratégia, demonstraram que as
metodologias propostas são mais adequadas (superiores em acurácia) para a projeção de
valores para um horizonte de 12 meses do que a metodologia atualmente utilizada pela
instituição estudada. Neste contexto, os modelos Box-Jenkins se mostraram como os mais
acurados em 61% dos casos (cinco aeroportos). Os modelos Aditivo de Holt-Winters, S.E.S. e
Holt apresentaram-se como os modelos com menor margem de erro em 13% (um aeroportos),
13% (um aeroportos) e 13% (um aeroporto) dos casos, respectivamente.
ABSTRACT
This work aims to compare the performance of predictive methodologies, based on
time series, different of the ones used presently to forecast demand, for 12 months horizon, of
the airports managed by Departamento Aeroviário do Estado de São Paulo (DAESP)
operating with regular air traffic.
The determination of accurate forecasts, which means, in other words, to use the
predictive method with greater degree of precision (or minor edge of error) is considered the
prime stage for the planning process of airports administration.
To reach the planned objective, this research examines, in first place, the main
theoretical aspects of the demand forecasting methods studied in this work. Later, it is carried
out the process of calibration for the employed models, applied to historical series available
by the institution used as case study.
The time series models studied in this thesis are: Naïve Model, Moving Average of six
and twelve months, Simple Exponential Smoothing, Holt´s Method, Holt-Winter´s Additive
Method, Holt-Winter´s Multiplicative Method and the possible Box-Jenkins models chosen
based in an identification process performed in this research. Finally it was used one strategy
of evaluation and selection of predictive models, of quantitative nature, to subsidize the
conclusions presented at the end of this dissertation.
The results obtained by means of this strategy, demonstrated that the chosen
methodologies are more precise (have greater accuracy) to forecast values for 12 months
horizon than those presently used by the institution studied.
In this context the Box-Jenkins models showed greater accuracy in 61% of the cases
(five airports). The Holt-Winter´s Additive Model, S.E.S. Model and Holt´s Model showed to
be the models with minor edge of error in 13% (one airport), 13% (one airport) and 13% (one
airport) of the cases, respectively.
The work concludes that every winner model examined performs better than the one
employed by the institution chosen as case study for this thesis.
AGRADECIMENTOS
Em primeiro lugar a Deus por me proporcionar saúde e motivação mesmo nos
momentos mais difíceis desta árdua jornada.
Em segundo lugar a toda minha família em especial à minha mãe, Sônia Maria Neves
Breseghello, ao meu pai, Edmilson Breseghello, e aos meus filhos, Ângelo Breseghello e
Fernanda Vitória Breseghello, pelas palavras de carinho e incentivo, que sem dúvida alguma
impulsionaram a materialização deste sonho.
Em terceiro lugar, mas não menos importante ao sucesso deste trabalho, ao meu
orientador Prof. Protógenes Pires Porto pela dedicação demonstrada e pela busca incessante
de melhorias, implementadas ao longo da elaboração deste documento.
E em último lugar ao Prof. Armando Zeferino Milioni pelo conhecimento e pelo
exemplo de profissionalismo transmitido ao longo da convivência no decurso de suas
disciplinas.
SUMÁRIO
RESUMO
ABSTRACT
AGRADECIMENTOS
LISTA DE TABELAS
LISTA DE FIGURAS
1 Introdução............................................................................................................. 1
1.1 Motivação do trabalho................................................................................... 3
1.2 Objetivos do trabalho..................................................................................... 4
1.2.1 Objetivo geral...................................................................................... 4
1.2.2 Objetivos específicos........................................................................... 4
1.3 Estrutura do trabalho...................................................................................... 4
1.4 Metodologia .................................................................................................. 5
1.5 Delimitação.................................................................................................... 7
2 Revisão bibliográfica............................................................................................ 8
2.1 Modelo Trivial de previsão............................................................................ 9
2.2 Modelos de médias móveis............................................................................ 10
2.3 Modelos de suavização exponencial.............................................................. 11
2.3.1 Modelo de suavização exponencial simples........................................ 11
2.3.2 Modelo de Holt.................................................................................... 12
2.3.3 Modelos de Holt-Winters.................................................................... 14
2.3.3.1 Modelo multiplicativo de Holt-Winters.................................. 15
2.3.3.2 Modelo aditivo de Holt-Winters ............................................ 18
2.4 Modelos de Box-Jenkins................................................................................ 18
2.4.1 Conceitos básicos para a compreensão dos modelos Box-Jenkins...... 19
2.4.2 Modelos Auto-Regressivos.................................................................. 23
2.4.3 Modelos de Médias Móveis................................................................. 25
2.4.4 Modelos mistos Auto-Regressivos – Média Móvel............................. 27
2.4.5 Modelos Não-Estacionários................................................................. 28
2.4.6 Modelos Sazonais................................................................................ 33
2.4.7 Modelagem de série temporal.............................................................. 34
2.4.7.1 Identificação do modelo......................................................... 34
2.4.7.2 Estimativa dos parâmetros do modelo.................................... 35
2.4.7.3 Verificação do modelo............................................................ 36
2.4.7.4 Previsões................................................................................. 37
2.4.7.5 Exemplos de construção de modelos ARIMA........................ 37
2.4.8 Variações dos Modelos de Box-Jenkins.............................................. 46
2.4.9 Comentários sobre os Modelos Box-Jenkins....................................... 47
2.5 Estratégia de avaliação e seleção para modelos de natureza quantitativa .... 48
2.5.1 Medidas estatísticas-padrão................................................................. 48
2.5.2 Comentários......................................................................................... 49
2.5.3 Estatística U de Theil........................................................................... 49
3 Metodologia para a estruturação de um sistema de previsão................................ 51
3.1 Definição do problema.................................................................................. 52
3.2 Coleta de informações................................................................................... 54
3.2.1 Montagem do banco de dados............................................................. 54
3.3 Seleção do pacote computacional.................................................................. 55
3.4 Análise Preliminar......................................................................................... 56
3.5 Escolha e validação dos modelos.................................................................. 57
4 Estudo de caso...................................................................................................... 59
4.1 Considerações iniciais sobre os dados........................................................... 59
4.2 Análise preliminar dos dados......................................................................... 60
4.3 Modelagem e calibração dos modelos propostos.......................................... 65
4.4 Resumo dos resultados.................................................................................. 79
5 Conclusão............................................................................................................. 80
Referências bibliográficas.......................................................................................... 83
LISTA DE TABELAS
TABELA 1. Previsão de demanda de um eletrodoméstico..................................................
12
TABELA 2. Previsão de demanda pelo método de Holt.....................................................
14
TABELA 3. Previsão de demanda pelo modelo multiplicativo de Holt-Winters................
17
TABELA 4. Des. para o cálculo da auto-correlação de lag 1 da série utilizada na Tab.5...
21
TABELA 5. Série Temporal obtida em Morettin & Toloi (1987).......................................
38
TABELA 6. Série temporal obtida em Füller (1996)..........................................................
40
TABELA 7. Usuários conectados a um serv. de Internet durante um per. de 100 min.......
43
TABELA 8: Comparação entre os diferentes modelos aplicados aos dados da Fig. 18......
66
TABELA 9: Comparação entre os diferentes modelos aplicados aos dados da Fig. 19......
68
TABELA 10: Comparação entre os diferentes modelos aplicados aos dados da Fig. 20....
70
TABELA 11: Comparação entre os diferentes modelos aplicados aos dados da Fig. 21....
71
TABELA 12: Comparação entre os diferentes modelos aplicados aos dados da Fig. 22....
73
TABELA 13: Comparação entre os diferentes modelos aplicados aos dados da Fig. 23....
74
TABELA 14: Comparação entre os diferentes modelos aplicados aos dados da Fig. 24....
76
TABELA 15: Comparação entre os diferentes modelos aplicados aos dados da Fig. 25....
77
TABELA 16: Resumo dos resultados alcançados...............................................................
79
TABELA A.1. Demanda do aeroporto de Araçatuba..........................................................
A-1
TABELA A.2. Previsões para a demanda do aeroporto de Araçatuba................................
A-1
TABELA A.3. Demanda do aeroporto de Assis..................................................................
A-2
TABELA A.4. Previsões para a demanda do aeroporto de Assis.......................................
A-2
TABELA A.5. Demanda do aeroporto de Bauru.................................................................
A-3
TABELA A.6. Previsões para a demanda do aeroporto de Bauru......................................
A-3
TABELA A.7. Demanda do aeroporto de Marília...............................................................
A-4
TABELA A.8. Previsões para a demanda do aeroporto de Marília....................................
A-4
TABELA A.9. Demanda do aeroporto de Presidente Prudente...........................................
A-5
TABELA A.10. Previsões para a demanda do aeroporto de Presidente Prudente.............
A-5
TABELA A.11. Demanda do aeroporto de Ribeirão Preto.................................................
A-6
TABELA A.12 Previsões para a demanda do aeroporto de Ribeirão Preto......................
A-6
TABELA A.13. Demanda do aeroporto de São José do Rio Preto.....................................
A-7
TABELA A.14. Previsões para a demanda do aeroporto de São José do Rio Preto.........
A-7
TABELA A.15. Demanda do aeroporto de Sorocaba.......................................................... A-8
TABELA A.16. Previsões para a demanda do aeroporto de Sorocaba..............................
A-8
LISTA DE FIGURAS
FIGURA 1. Relação entre previsão e planejamento............................................................ 3
FIGURA 2. Características de uma série temporal.............................................................. 9
FIGURA 3. Séries temporais. ............................................................................................. 20
FIGURA 4. Série temporal não-estacionária na média........................................................ 29
FIGURA 5. Série temporal não estacionária na média e na declividade............................. 29
FIGURA 6. Redução do comp. não estacionário de uma série temp. após diferenciações 31
FIGURA 7. Gráfico e linha de média da série temporal apresentada na Tabela 5.............. 38
FIGURA 8. F.A.C. e F.A.C.P. da série temporal na Figura 7............................................. 39
FIGURA 9. F.A.C. dos resíduos da série representada na Figura 7.................................... 40
FIGURA 10. Gráfico e linha de média da série temporal apresentada na Tabela 6............ 41
FIGURA 11. F.A.C. e F.A.C.P. da série temporal representada na Figura 10.................... 41
FIGURA 12. Gráfico e linha de tendência da série temporal apresentada na Tabela 7....... 44
FIGURA 13. F.A.C. e F.A.C.P. da série temporal representada na Figura 12.................... 44
FIGURA 14. Graf./ linha de média da série temp. apresentada na Tab.7, após 1
a
. diferen. 45
FIGURA 15. F.A.C. e F.A.C.P. da série temporal apresentada na Figura 14...................... 45
FIGURA 16. F.A.C. dos resíduos da série representada pelos valores estimados............... 46
FIGURA 17. Relação entre acurácia e custo de previsão.................................................... 53
FIGURA 18. Demanda aeroporto de Araçatuba.................................................................. 61
FIGURA 19. Demanda aeroporto de Assis.......................................................................... 61
FIGURA 20. Demanda aeroporto de Bauru......................................................................... 62
FIGURA 21. Demanda aeroporto de Marília....................................................................... 62
FIGURA 22. Demanda aeroporto de Presidente Prudente................................................... 63
FIGURA 23. Demanda aeroporto de Ribeirão Preto........................................................... 63
FIGURA 24. Demanda aeroporto de São José do Rio Preto............................................... 64
FIGURA 25. Demanda aeroporto de Sorocaba................................................................... 64
FIGURA 26. Previsões para o aeroporto de Araçatuba....................................................... 68
FIGURA 27. Previsões para o aeroporto de Assis.............................................................. 69
FIGURA 28. Previsões para o aeroporto de Bauru.............................................................. 71
FIGURA 29. Previsões para o aeroporto de Marília............................................................ 72
FIGURA 30. Previsões para o aeroporto de Presidente Prudente........................................ 74
FIGURA 31. Previsões para o aeroporto de Ribeirão Preto................................................ 75
FIGURA 32. Previsões para o aeroporto de São José do Rio Preto.................................... 77
FIGURA 33. Previsões para o aeroporto de Sorocaba........................................................ 78
CAPÍTULO 1
1 Introdução
Previsões de demanda desempenham um papel-chave em diversas áreas na gestão de
organizações, sejam elas públicas, sejam privadas. A área financeira, por exemplo, planeja a
necessidade de recursos analisando previsões de demanda de longo prazo. As mesmas
previsões também servem às áreas de recursos humanos e marketing, no planejamento de
modificações no nível da força de trabalho e no agendamento de promoções de vendas
(Krajewski & Ritzman, 1999).
Talvez mais do que em qualquer outra área de uma organização, previsões de demanda
são essenciais na operacionalização de diversos aspectos do gerenciamento de produção.
Alguns exemplos são a gestão de estoques, o desenvolvimento de planos agregados de
produção e a viabilização de estratégias de gerenciamento de materiais como o MRP
(Material Requirements Planning – Planejamento de Necessidade de Materiais); mais
exemplos são apresentados em Elsayed & Boucher (1994). Desta forma, técnicas estatísticas
para modelagem têm merecido a atenção de engenheiros e gerentes de produção.
Previsões de demanda são elaboradas utilizando: (i) métodos quantitativos, (ii)
métodos qualitativos, ou (iii) combinações de métodos quantitativos e qualitativos.
Métodos quantitativos utilizam dados numéricos (time series ou cross section) para
prever a demanda em períodos futuros. A previsão de demanda futura requer a construção de
modelos matemáticos a partir dos dados disponíveis. As diferentes técnicas disponíveis para
construção desses modelos são denominadas técnicas de previsão. A técnica de previsão de
natureza quantitativa mais difundida nas organizações industriais e de serviços e, em grande
parte por encontrar-se disponível em planilhas eletrônicas como Microsoft Excel (1997) e
Quattro Pro (1999), é a regressão linear (Seber, 1977).
1
Métodos qualitativos, por sua vez, baseiam-se em opiniões de especialistas, os quais se
fundamentam, principalmente, no julgamento de executivos, apreciação de pessoal de vendas
e expectativas dos consumidores. Como diferentes indivíduos apresentam preferências
distintas, esses métodos são vulneráveis a tendências o que pode comprometer a
confiabilidade de seus resultados. Dentre os métodos qualitativos mais utilizados, destaca-se o
método Delphi, apresentado em Krajewski & Ritzman (1999).
Os métodos qualitativos têm sido, historicamente, os mais utilizados na previsão da
demanda (Mentzer & Cox, 1997). Tais métodos, no entanto, costumam apresentar um baixo
grau de precisão. Apesar disto, continuam sendo amplamente utilizados pelas empresas,
mesmo com a difusão de métodos quantitativos mais avançados, impulsionados pelo avanço
na capacidade de processamento e armazenamento de dados computacionais (Sanders &
Manrodt, 1994). A escassa fundamentação teórica dessas previsões pode explicar, em grande
parte, a baixa acurácia dos referidos métodos qualitativos de previsão.
O processo de previsão é, freqüentemente, confundido com o processo de
planejamento. No entanto, enquanto o objeto de estudo do planejamento é o comportamento
do negócio, sistemas de previsão buscam analisar tal comportamento no tempo futuro. Esta
relação é apresentada na Figura 1. Métodos de previsão são utilizados para prever os
resultados de cursos de ação propostos no planejamento: se os resultados não forem
potencialmente satisfatórios, o planejamento deve ser revisto. Esse processo deve ser repetido
até que os resultados previstos para o planejamento sejam satisfatórios. Planos revisados são,
então, implementados, e os resultados obtidos são monitorados para ser usados no próximo
período de planejamento. O processo da Figura 1 parece intuitivo. Porém, na prática, muitas
organizações revisam previsões, ao invés de revisarem planos.
2
Ambiente onde os dados são gerados
Banco de Dados
Planos
Processo de
Planejamento
Métodos de
previsão
NÃO
SIM
Os resultados
previstos são
satisfatórios?
Previsões
Implementação dos planos
Monitoramento dos resultados
FIGURA 1. Relação entre previsão e planejamento (Adaptado de Armstrong, 1999).
1.1 Motivação
A tomada de decisões é um fato cotidiano no meio empresarial, mas que, no entanto,
devido aos valores financeiros vultosos resultantes de suas ações (ex: construção de novas
facilidades ou manutenção de estruturas ociosas), desempenha um papel de maior relevância
em empresas que têm como seu objeto de ação a administração da infra-estrutura
aeroportuária, como é o caso da empresa aqui tomada como estudo de caso (DAESP).
Logo, para este tipo de empresa, a disponibilidade de previsões que retratem, de forma
realista e em tempo hábil, o comportamento da demanda no futuro é de suma importância e se
constitui em um fator crítico para que seus gestores formulem, de forma satisfatória e eficaz, o
planejamento de estratégias e políticas de investimento (ex: expansão ou redução da
capacidade de processamento de passageiros em um aeroporto).
Haja vista que a geração destas previsões é função da disponibilidade de dados e da
habilidade em extrair destes dados informações relevantes por intermédio do uso das técnicas
de previsão e que, atualmente, existe à disposição uma quantidade razoável de metodologias
3
para o propósito de prognosticar a demanda (ex: modelos de séries temporais, modelos
causais) é necessário, então, identificar a metodologia mais apropriada, ou seja, aquela que
seja capaz de capturar, de forma mais eficaz, as características pertinentes aos dados da
demanda estudada.
Uma vez que a técnica de previsão (metodologia) mais apropriada para determinada
situação, isto é, a que propicia previsões com menores margens de erro seja identificada será,
então, possível a realização de decisões mais acertadas o que, por sua vez, possibilitará uma
administração mais eficaz.
1.2 Objetivos
1.2.1 Objetivo Geral
Comparar o desempenho de metodologias preditivas, baseadas na abordagem de séries
temporais, diferentes das utilizadas para prognosticar a demanda, para um horizonte de 12
meses, dos aeroportos administrados pelo Departamento Aeroviário do Estado de São Paulo
(DAESP) operando com tráfego aéreo regular.
1.2.2 Objetivos Específicos
1. Identificar e caracterizar os métodos quantitativos de previsão abordados neste trabalho;
2. Aplicar estes métodos para prognosticar a demanda “hipoteticamente” desconhecida;
3. Selecionar, dentre os métodos examinados, o mais acurado para cada aeroporto analisado.
1.3 Estrutura
Esta dissertação está estruturada da seguinte maneira:
No Capítulo 1, é apresentado o tema abordado, as motivações para a escolha do
mesmo, os objetivos a serem alcançados, a estrutura e as delimitações do trabalho.
4
No Capítulo 2 é feita uma revisão bibliográfica. Por meio desta revisão, busca-se
apresentar de forma concisa, inclusive com o uso de exemplos práticos, as técnicas
quantitativas abordadas nesta tese.
No Capítulo 3 é proposta, de forma genérica, uma metodologia para a estruturação de
um sistema de previsão.
No Capítulo 4 é apresentado um estudo de caso realizado com dados reais do
Departamento Aeroviário do Estado de São Paulo (DAESP).
O Capítulo 5 é reservado às conclusões e sugestões para possíveis desdobramentos
futuros deste trabalho.
1.4 Metodologia
Nesta seção, seguem-se as explicações bem como as justificativas acerca das decisões
assumidas na confecção desta dissertação (escolha dos modelos, considerações sobre os
dados, critério de decisão), a qual pesquisou pelos modelos de séries temporais, dentre os
propostos, os mais acurados para prognosticar a demanda por transporte aéreo, para um
horizonte de previsão de 12 meses, dos aeroportos analisados.
No desempenho desta pesquisa optou-se por testar os seguintes modelos de previsão:
1. Modelo de Média móvel dos últimos seis meses;
2. Modelo de Média móvel dos últimos 12 meses;
3. Modelo trivial;
4. Modelo de suavização exponencial simples;
5. Modelo de Holt;
6. Modelo multiplicativo de Holt-Winters;
7. Modelo aditivo de Holt-Winters;
8. E os possíveis modelos Box-Jenkins identificados para cada situação.
A justificativa pela presença dos Modelos de Média Móvel (seis e 12 meses) nesta
dissertação se deve exclusivamente, ao fato de que o caso estudado utiliza estes modelos para
elaborar previsões para o horizonte fixado para análise (12 meses).
5
Quanto ao modelo trivial, sua justificativa se baseia, eminentemente, pelo fato que a
estatística escolhida para subsidiar o processo de comparação e ordenação de modelos
(Estatística U de Theil) utiliza-o como parâmetro de comparação.
Em relação às escolhas das demais metodologias propostas (Suavização Exponencial e
ARIMA), a justificativa pelas mesmas é a flexibilidade de utilização, já que ambas as
metodologias gozam da prerrogativa de não precisarem de dados externos.
É necessário admitir que a idéia inicial era, também, analisar o desempenho
proporcionado pela utilização de modelos econométricos de regressão que, tradicionalmente,
é a metodologia mais utilizada na previsão por transporte aéreo. Porém, diante das
dificuldades adiante indicadas, optou-se por estudar apenas as séries temporais.
Não foi encontrado nenhum material bibliográfico, de acesso público, que retratasse,
de forma realista e atual, as áreas geográficas que sofrem influência econômica dos
municípios paulistas com aeroportos com tráfego aéreo regular. Uma vez que um documento
desta natureza estivesse a disposição seria, então, possível a identificação dos fatores
econômicos relacionados com a pujança econômica da região para poderem ser utilizados
como variáveis explicativas.
Verificou-se, ainda, que as variáveis tradicionalmente citadas na literatura como
fatores determinantes para a demanda por transporte aéreo: Renda (Proxy: Renda per Capita)
e Consumo (Proxy: consumo de energia elétrica) estavam disponíveis somente em base anual.
Dessa forma, a base de dados que, inicialmente, somava 80 observações seria reduzida para
apenas seis, o que, além de não propiciar a calibração de regressões confiáveis (do ponto de
vista amostral), também não possibilitaria o uso das metodologias inicialmente planejadas:
Box-Jenkins (necessita de, no mínimo, 50 observações) e Suavização Exponencial (necessita
de dois ciclos sazonais completos).
Em relação ao processo de coleta de dados, a série de dados utilizada para a realização do
estudo de caso compreende o intervalo entre Janeiro/97 a Agosto/03. A escolha por esta janela
temporal é, exclusivamente, devida à disponibilidade do DAESP. Vale ressaltar que o
intervalo (série) compreendendo o período entre janeiro de 1997 e agosto de 2002, o qual se
denominou conjunto inicialização foi utilizado para o fim de calibrar os modelos. Já o
intervalo entre setembro de 2002 e agosto de 2003, o qual se denominou conjunto teste foi
utilizado apenas para o fim de avaliar e selecionar os modelos. Por intermédio desta divisão
nos dados foi possível avaliar o poder real de previsão dos diferentes modelos calibrados.
As metodologias aqui adotadas (Box-Jenkins e Suavização Exponencial) necessitam de
amostras representativas (a metodologia Box-Jenkins, por exemplo, precisa de, no mínimo, 50
6
observações) o que, forçosamente, dada a restrição do banco de dados do DAESP, obrigou o
uso de dados mensais. Isto, por sua vez, resultou em previsões mensais. É, no entanto,
necessário dizer que este tipo de previsão (mensal) não é o mais usual em se tratando de
transporte aéreo.
O processo de modelagem por meio da metodologia Box-Jenkins (identificação,
estimação dos parâmetros, checagem e previsão) foi realizado mediante o uso do pacote
estatístico STATISTICA. Já o processo de modelagem por meio da utilização da família de
modelos de Suavização exponencial (inicialização, otimização dos parâmetros e previsão) foi
realizado mediante a utilização do suplemento SOLVER do software EXCEL.
O critério utilizado para determinar o melhor modelo, isto é, aquele com maior grau de
acurácia foi o menor valor para a Estatística U de Theil (Makridakis et al., 1998).
1.5 Delimitação
Esta dissertação descreve a aplicação de duas metodologias na solução de um
problema específico e, portanto, apresenta limitações. A primeira delas diz respeito à natureza
inerentemente pouco dedutiva dos trabalhos envolvendo o tema previsão, ou seja, não é
intuito desta dissertação dizer qual dos modelos de previsão apresentados é melhor em termos
absolutos e sim indicar, para as determinadas situações pesquisadas, qual dentre eles se
mostra mais acurado (adequado) no que tange à capacidade de gerar previsões pontuais. As
demais limitações estão relacionadas à qualidade e fidedignidade dos dados utilizados no
estudo de caso.
As técnicas investigativas utilizadas neste trabalho compreendem os modelos de
Médias Móveis e as metodologias Box-Jenkins e Suavização Exponencial, não sendo
abordadas, de forma detalhada, outras técnicas de previsão de demanda citadas no mesmo.
O estudo de caso apresentado neste trabalho foi realizado tomando como base alguns
aeroportos administrados pelo DAESP. Portanto, não faz parte das ambições deste trabalho a
generalização dos resultados obtidos para outras organizações do setor aeroportuário.
7
CAPÍTULO 2
2 Revisão Bibliográfica
A previsão de demanda utilizando modelos quantitativos pode ser feita por intermédio
de vários modelos matemáticos. O emprego de cada modelo depende basicamente do
comportamento da série temporal que se deseja analisar. Uma série temporal pode exibir até
quatro características diferentes em seu comportamento: média, tendência, ciclo e
sazonalidade (Makridakis et al., 1998). Estas características estão exemplificadas na Figura 2.
A característica de média (também chamada estabilidade ou horizontalidade) existe
quando os valores da série flutuam em torno de um valor constante. A série possui
característica de sazonalidade quando padrões cíclicos de variação se repetem em intervalos
relativamente constantes de tempo. A característica de ciclo existe quando a série exibe
variações ascendentes e descendentes, porém, em intervalos não regulares de tempo.
Finalmente, a característica de tendência ocorre quando a série apresenta comportamento
ascendente ou descendente por um longo período de tempo.
Toda variação em uma série temporal que não pode ser explicada pelas características
demonstradas na Figura 2 é devida ao ruído aleatório no processo gerador dos dados; tal
ruído não é matematicamente modelável.
A seguir, são apresentados alguns modelos utilizados como métodos quantitativos para
previsão de demanda.
8
FIGURA 2. Características de uma série temporal. (Adaptado de Makridakis et al., 1998).
2.1 Modelo Trivial de previsão
O modelo Trivial supõe simplesmente que a previsão para o período ‘t’ é exatamente o
valor observado no período ‘t -1’. Tal modelo é conhecido, também, como a abordagem do
caminho aleatório (“random walk”) e é matematicamente formulado como:
ˆ
tt
z=z
-1
onde
é a previsão para o período t e é o valor real observado no período t-1.
t
ˆ
z
t-1
z
A previsão trivial é normalmente utilizada quando a série de dados possui um comportamento
altamente imprevisível.
9
2.2 Modelos de Médias Móveis
Os Modelos de Médias Móveis geram previsões médias com menor variabilidade que os
dados originais. Isso ocorre devido ao processo de combinação entre as observações com
valores altos e valores baixos. Possuem como características a simplicidade e o baixo custo
computacional. Conforme menciona Tubino (2000, p. 70), “a média móvel usa dados de um
número predeterminado de períodos, normalmente os mais recentes, para gerar sua previsão.
A cada novo período de previsão se substitui o mais antigo pelo mais recente”.
Conforme citam Makridakis et.al. (1998), o método consiste em calcular a média das
últimas n observações mais recentes. O valor encontrado é considerado a previsão para o
próximo período. A previsão por meio de médias móveis pode ser obtida mediante a
utilização da equação descrita da seguinte forma por Mentzer e Bienstock (1998, p. 49):
12
1
(...
tt t tn
t
SS S S
F
n
−− +
+
1
)
+
+++
=
Onde:
1t
F
+
: previsão para o período t +1;
1t
S
: observação referente ao período t-1;
n: número de períodos utilizados na média móvel.
Em se tratando dos pontos negativos do método em questão, Mentzer e Bienstock
(1998) salientam que o problema com o mesmo relaciona-se com a escolha do número de
períodos que serão utilizados na previsão. Tubino (2000, p. 71) ressalta que “o número de
períodos incluídos no cálculo da média móvel determina sua sensibilidade com relação aos
dados mais recentes”. Períodos pequenos proporcionam uma reação maior a possíveis
mudanças no padrão dos dados. Grandes períodos, por sua vez, produzem uma média mais
homogênea.
10
2.3 Modelos de Suavização Exponencial
Os modelos de suavização exponencial são amplamente utilizados para previsão de
demanda devido à sua simplicidade, facilidade de ajuste e boa acurácia. Estes métodos usam
uma ponderação distinta para cada valor observado na série temporal, de modo que valores
mais recentes recebam pesos maiores. Assim, os pesos formam um conjunto que decai
exponencialmente a partir de valores mais recentes.
2.3.1 Suavização Exponencial Simples
Se a série temporal mantém-se constante sobre um nível médio, uma suavização
exponencial simples pode ser usada para a previsão de valores futuros da série. Sua
representação matemática é dada por (Makridakis et al., 1998):
1
1
ˆˆ
(- )
tt
zaz a
+
=+
t
z
onde
é a previsão da demanda para o tempo +1, feita no período atual
t
;
1
ˆ
t
z
+
t
α
é a constante
de suavização, assumindo valores entre 0 e 1;
é o valor observado na série temporal para o
tempo
t
; e, é o valor da previsão feita para o tempo .
t
z
ˆ
t
z
t
Uma forma de medir a acurácia da previsão é calcular o erro gerado pela mesma,
matematicamente:
. ˆ
tt
ezz=−
t
Para ilustrar estes conceitos, suponha que se deseje saber a previsão de demanda de
um eletrodoméstico para os próximos três meses. Considere a última demanda observada
como sendo 55 unidades e
α
= 0,1. Assim,
= 53 é a estimativa inicial da demanda no tempo ; ˆ
t
z
t
é a diferença entre o valor real e o valor previsto;
111
ˆ
2ezz=−=
)
)
21 1
ˆˆ
1 0,1 55 0,9 53 53,2zz z
α
α
=+ =×+ = é a previsão para o mês 2, feita
no mês correspondente a
t
= 1. O restante dos valores está na Tabela 1.
11
TABELA 1. Previsão de demanda de um eletrodoméstico.
t
t
z
Previsão (
)
ˆ
t
z
t
e
1 55 53 2
2 52 53,2 -1,2
3 54 53,08 0,92
As previsões de demanda (
) feitas neste exemplo foram calculadas sempre com base
no período imediatamente anterior [
(
t
– 1)]. Previsões podem ser feitas para mais de um
período; desta forma, porém, não ocorre a atualização do modelo a cada período, aumentando
assim o componente de erro.
ˆ
t
z
ˆ
t
z
O valor da constante de suavização
α
pode ser definido de duas formas: arbitrária ou
iterativamente. Neste caso, utiliza-se alguma forma de comparação como, por exemplo, o
Erro Quadrado Médio (E.Q.M.). Outras formas de comparação poderiam ser empregadas:
Erro Percentual Absoluto Médio (E.P.A.M.) ou Erro Absoluto Médio (E.A.M.). Desta
maneira, seleciona-se aleatoriamente um valor inicial para a constante
α
, a partir do qual
previsões são geradas. Comparam-se, então, os valores previstos com os reais, calcula-se a
média do quadrado das diferenças entre os mesmos. O parâmetro que minimizar essa média é,
então, utilizado no modelo final. Pacotes computacionais determinam automaticamente o
melhor valor de
α
.
A magnitude da constante
α
determina a velocidade de resposta do modelo frente a
mudanças na demanda (Montgomery et al.; 1990). Valores pequenos de
α
fazem com que o
modelo demore a assumir mudanças no comportamento da série. Com valores grandes de
α
,
o modelo reage rapidamente.
Os modelos de suavização exponencial simples requerem uma estimativa inicial para
. Quando dados históricos estão disponíveis, pode-se usar uma média simples das N
observações mais recentes como
. Caso contrário pode-se utilizar a última observação, ou
fazer uma estimativa subjetiva.
ˆ
t
z
ˆ
t
z
2.3.2 Modelo de Holt
O modelo de Holt pode ser utilizado, de maneira satisfatória, em séries temporais com
tendência linear. Este modelo emprega duas constantes de suavização,
α
e
β
(com valores
12
entre 0 e 1), sendo representado por três equações (Makridakis et al., 1998):
(
)( )
11
1
tt tt
Lz LT,
α
α
−−
=+ +
(1)
(
)
(
)
1
1
ttt
TLL T
1
,
t
β
β
=−+
T
(2)
.
ˆ
tk t t
zLk
+
=+
(3)
As equações (1) e (2) fazem uma estimativa do nível (intercepto) e da inclinação da
série temporal, respectivamente. Já a equação (3) calcula a previsão da demanda para os
próximos k períodos.
Assim como na suavização exponencial simples, o método de Holt requer valores
iniciais, neste caso
0
L
e , lembrando que
0
T
0
L
e designam nível (level) e tendência (trend)
respectivamente. Uma alternativa para estes cálculos iniciais é igualar
0
T
0
L
ao último valor
observado na série temporal e calcular uma média das declividades nas últimas observações
para . Uma outra forma de cálculo é a regressão linear simples aplicada aos dados da série
temporal, onde se obtém o valor da declividade da série temporal e de
0
T
0
L
em sua origem.
Para exemplificar o modelo de Holt, suponha que se deseja saber a previsão da
demanda para os próximos três meses de um produto que possui tendência ascendente.
Considere que as vendas nos últimos 12 meses foram 4, 6, 8, 10, 14, 18, 20, 22, 24, 28, 31 e
34 unidades / mês (Winston, 1994). Assim,
0
L
= 34 representa o último valor observado na
série; e,
(
(
(
0
6 4 8 6 ... 34 31
2,73
11
T
−+−++
==
é o valor médio da declividade nos
últimos 12 meses.
Considerando
α
= 0,3 e
β
= 0,1, obtêm-se os valores apresentados na Tabela 2. A
seguir são apresentados exemplos dos cálculos para o período correspondente ao tempo t =1:
13
()
()()( )
() ( )()
()
00
111
11 00
1100
11 1
1
ˆ
34 1 2,73 36,73;
ˆ
40 36,73 3,27;
0,3 0,7 0,3 40 0,7 34 2,73 37,71;
0,1 0,9 0,1 37,71 34 0,9 2,73 2,83;
ˆ
37,71 1 2,83 40,54.
t
zLkT
ezz
Lz LT
TLLT
zLkT
+
=+ =+ =
=−= =
=+ += + + =
=−+= + =
=+ = + =
TABELA 2. Previsão de demanda pelo modelo de Holt
t
t
z
t
L
t
T
ˆ
t
z
t
e
1 40 37,71 2,83 36,73 3,27
2 47 42,48 3,02 40,54 6,46
3 50 46,85 3,16 45,5 4,5
Os valores das constantes de suavização no modelo de Holt podem ser determinados
de forma semelhante à usada na suavização exponencial simples; ou seja, uma combinação de
valores para
α
e
β
que minimize o Erro Quadrado Médio (E.Q.M.), por exemplo.
2.3.3 Modelos de Holt-Winters
Os modelos de Holt-Winters projetam apropriadamente dados de demanda onde se
observa a ocorrência de tendência linear, além de um componente de sazonalidade. Dados de
demanda sazonal caracterizam-se pela ocorrência de padrões cíclicos de variação que se
repetem em intervalos relativamente constantes de tempo. Demanda de tipo sazonal
caracteriza alguns ramos da indústria alimentícia (refrigerantes e sorvetes), de cosméticos
(bronzeadores) e de serviços (intensidade de atendimento de um banco ao longo do dia).
Os modelos de Holt-Winters dividem-se em dois grupos: aditivo e multiplicativo. No
modelo aditivo, a amplitude da variação sazonal é constante ao longo do tempo; em outras
palavras, a diferença entre o maior e o menor valor de demanda dentro das estações
permanece relativamente constante no tempo. No modelo multiplicativo, a amplitude da
variação sazonal aumenta ou diminui como função do tempo.
14
2.2.3.1 Modelo Multiplicativo de Holt-Winters
O modelo multiplicativo de Holt-Winters é utilizado na modelagem de dados sazonais
onde a amplitude do ciclo sazonal varia com o passar do tempo. Sua representação
matemática é dada por (Makridakis et al., 1998):
()(
11
1
t
t
ts
z
LL
S
αα
−−
=+ +
)
,
tt
T
1
,
t
(4)
()()
1
1
ttt
TLL T
β
β
=−+
(5)
()
1
t
t
t
z
S
L
γγ
=+ ,
ts
S
+
(6)
()
ˆ
,
tk t t tsk
zLkTS
+
=+
(7)
onde s é uma estação completa de sazonalidade (por exemplo, s é igual a 12 quando se tem
dados mensais e sazonalidade anual);
t
L
, e representam o nível, a tendência e a
sazonalidade da série, respectivamente;
t
T
t
S
ˆ
tk
z
+
é a previsão para k períodos à frente; e,
finalmente,
γ
é a constante de suavização que controla o peso relativo à sazonalidade,
variando entre 0 e 1.
A equação (4) difere da equação que trata do nível (intercepto) da série no modelo de
Holt, já que o primeiro termo é dividido por um componente sazonal, eliminando assim a
flutuação sazonal de
. A equação (5) é exatamente igual à equação da tendência no modelo
de Holt. Já a equação (6), faz um ajuste sazonal nas observações .
t
z
t
z
Como todos os métodos de suavização exponencial, os modelos de Holt-Winters
necessitam de valores iniciais de componentes (neste caso, nível, tendência e sazonalidade)
para dar início aos cálculos. Para a estimativa do componente sazonal, necessita-se, no
mínimo, de uma estação completa de observações, ou seja,
s
períodos (Makridakis et al.,
1998). As estimativas iniciais do nível e da tendência são feitas, então, no período s definido
para o componente sazonal.
O estimador inicial para o nível da série é dado pela média da primeira estação:
(
12
1
... .
s
Lzz z
)
s
s
=+++
(8)
15
O cálculo da estimativa inicial para a tendência requer duas estações completas (2s):
11 2 2
1
...
ss ss
s
zzzz zz
T
ss s s
++ +
−−
⎛⎞
=+++
⎜⎟
⎝⎠
s
. (9)
Para o componente sazonal, utilizam-se s estimativas iniciais:
12
12
, ,..., .
s
s
s
ss
z
zz
SS S
L
LL
== =
(10)
Estimadores diferentes dos apresentados nas equações (8), (9) e (10) estão disponíveis
na literatura. Alguns exemplos podem ser encontrados em Winters (1960), Jonhson &
Montgomery (1974), Hamilton (1994) e Elsayed & Boucher (1994).
A Tabela 3 apresenta um exemplo de previsão de demanda utilizando o modelo
multiplicativo de Holt-Winters com
α
= 0,822,
β
= 0,055 e
γ
= 0. Para tanto, é utilizada
uma série temporal sazonal com dados dispostos trimestralmente (Makridakis et al., 1998). Os
cálculos iniciais da tabela são apresentados a seguir:
16
()
()
12 4
51 62 84
1
1
2
2
3
3
4
4
11
... 362 385 432 341 380;
44
1
...
44 4 4
1 382 362 409 385 498 432 387 341
9,75;
44 4 4 4
362
0,953;
380
385
1,013;
380
432
1,137;
380
341
3
s
s
s
s
s
s
Lzz z
zzzz zz
T
z
S
L
z
S
L
z
S
L
z
S
L
=+++= +++=
−−
⎛⎞
=+++
⎜⎟
⎝⎠
−−−−
⎛⎞
=+++=
⎜⎟
⎝⎠
== =
== =
== =
==
()( )
()( )
()( )
()() ( )( )
()
()
1
41 4 4
5
5
1
55
5
51
5
0,897;
80
ˆ
380 1 9,75 0,953 371,29;
382
1 0,822 1 0,822 380 9,75 398,99;
0,953
1 0,055 398,99 380 1 0,055 9,75 10,26;
382
1 0 1 0 0,953 0,953.
398,99
ss
ss
zLkTS
z
LLT
S
TLL T
z
SS
L
αα
ββ
γγ
+
=
=+ = +× =
=+ += + + =
= +− = +− =
=+ = + =
TABELA 3. Previsão de demanda pelo modelo multiplicativo de Holt-Winters.
(Adaptado de Makridakis et al., 1998).
t
t
z
t
L
t
T
t
S
ˆ
t
z
1 362 - - 0,953 -
2 385 - - 1,013 -
3 432 - - 1,137 -
4 341 380 9,75 0,897 -
5 382 398,99 10,26 0,953
371,29 (
=1)
k
6 409 404,68 10,01 1,013
414,64 ( =1)
k
7 498 433,90 11,07 1,137
471,43 (
=1)
k
8 387 433,70 10,45 0,897
399,30 (
=1)
k
9 - - - -
423,11 ( =1)
k
10 - - - -
460,57 (
=1)
k
17
Os valores das constantes de suavização seguem a mesma lógica de determinação
sugerida para os outros métodos de suavização exponencial.
2.2.3.2 Modelo Aditivo de Holt-Winters
O modelo aditivo de Holt-Winters é utilizado na modelagem de dados sazonais onde a
amplitude do ciclo sazonal permanece constante com o passar do tempo. Sua representação
matemática é dada por (Makridakis et al., 1998):
()()
(
)
11
1
ttts tt
LzS LT,
α
α
−−
=−+ +
1
,
t
(11)
()()
1
1
ttt
TLL T
β
β
=−+
,
ts
(12)
()()
1
ttt
SzL S
γ
γ
=−+
(13)
ˆ
.
tk t t tsk
zLkTS
+
=+ +
+
(14)
A equação da tendência permanece a mesma utilizada para o modelo multiplicativo
[ver equação (5)]. Nas demais equações, a única diferença é que o componente sazonal está
efetuando operações de soma e subtração, ao invés de multiplicar e dividir.
Os valores iniciais de
s
L
e
s
T
são calculados de forma idêntica ao modelo
multiplicativo. Já os componentes sazonais são calculados da seguinte forma:
11 22
, ,..., .
s
sss
SzLSzL SzL=− = =
s
2.4 Modelos de Box-Jenkins
Os modelos de Box-Jenkins, também conhecidos como Modelos Auto-regressivos
Integrados a Média Móvel, ou simplesmente ARIMA (Autoregressive Integrated Moving
Average), foram propostos por George Box e Gwilym Jenkins no inicio dos anos 70 (Box et
al., 1994).
Os modelos de Box-Jenkins partem da idéia de que os valores de uma série temporal são
altamente dependentes, ou seja, cada valor pode ser explicado por valores prévios da série. Os
modelos ARIMA representam a classe mais geral de modelos para a análise de séries
18
temporais. Alguns conceitos devem ser analisados para o entendimento dos modelos Box-
Jenkins; tais conceitos são apresentados na seqüência.
2.4.1 Conceitos Básicos para a Compreensão dos Modelos Box-Jenkins
Modelos Estocásticos e Determínisticos
A representação de fenômenos físicos mostrada numa série temporal pode ser feita por
meio de uma modelagem matemática. Nos modelos, valores podem ser agrupados e descritos
por intermédio de equações matemáticas. Pode-se utilizar modelagem matemática, por
exemplo, para prever o valor de variáveis de interesse em qualquer momento no tempo, caso
as variáveis sejam dependentes do tempo. Sempre que uma previsão exata for possível, os
modelos são ditos determínisticos. No entanto, muitos fenômenos não são de natureza
determinística, devido à incidência aleatória de fatores desconhecidos. Nestes casos, a
previsão do valor futuro está sujeita a um cálculo de probabilidade. Modelos matemáticos
desenvolvidos para analisar tais fenômenos são ditos estocásticos.
Um processo estocástico é caracterizado por uma família de variáveis aleatórias que
descrevem a evolução de algum fenômeno de interesse. Processos estocásticos que
caracterizam os estudos de séries temporais descrevem a evolução temporal de um fenômeno
de interesse.
Modelos Estocásticos Estacionários e Não-Estacionários
Uma importante classe de modelos estocásticos utilizados na representação de séries
temporais são os modelos estacionários. Tais modelos pressupõem um processo em
equilíbrio, onde a família de variáveis se mantém em um nível médio constante (Box et al.,
1994). Porém, muitas séries temporais são mais bem representadas por modelos não
estacionários. Séries estacionárias e não-estacionárias vêm representadas graficamente na
Figura 3.
19
FIGURA 3. Séries temporais. (Fonte: Box & Luceño, 1997).
Os gráficos (a) e (b) na Figura 3 mostram séries temporais exibindo variação
estacionária. Tais séries variam de maneira estável no tempo, em torno de um valor de média
fixo. O gráfico (c) mostra uma série temporal não estacionária, a qual se desloca no tempo
sobre uma média não fixa.
A série da Figura 3(a) é uma série de ruído aleatório. Em tais séries, as diferenças
entre as observações e a média são estatisticamente independentes, seguindo alguma
distribuição de probabilidade (geralmente normal, com média zero e desvio padrão
a
σ
). A
propriedade-chave em uma série de ruído aleatório é que a ordem na qual as observações
ocorrem não informa nada a respeito da série. Assim, valores passados da série não podem ser
utilizados na previsão de valores futuros (Box &
Luceño, 1997).
A série da Figura 3(b) também é estacionária, mas apresenta ruídos auto-
correlacionados. Neste caso, diferenças entre observações e a média não são estatisticamente
independentes entre si. Dependência estatística implica na probabilidade de uma diferença
qualquer ser influenciada pela magnitude das demais diferenças na série. Na série da Figura
3(b), diferenças positivas tendem a seguir diferenças positivas e vice-versa.
A auto-correlação difere da correlação pela seguinte razão: a correlação mede o grau
de associação entre duas séries temporais distintas. Já a auto-correlação mede a associação
entre valores da mesma série, em diferentes períodos defasados de tempo (veja Tabela 4).
20
TABELA 4. Desenvolvimento para o cálculo da auto-correlação de lag 1 da série utilizada na Tabela 5.
t
t
z
1t
z
()
t
zz
(
)
1t
zz
(
)
2
t
zz
(
)
(
)
1tt
zzz z
−−
1 0,656 - 0,198 - 0,039 -
2 1,057 0,656 0,599 0,198 0,359 0,119
3 -1,750 1,057 -2,208 0,599 4,874 -1,323
4 -0,489 -1,750 -0,947 -2,208 0,896 2,090
5 -2,861 -0,489 -3,319 -0,947 11,015 3,142
# # # # # # #
49 -1,799 -0,937 -2,257 -1,395 5,093 3,148
50 -1,698 -1,799 -2,156 -2,257 4,648 4,865
z =
0,458
Σ
300,493 254,969
Finalmente, a Figura 3(c) ilustra uma variação não estacionária. Esta série é
encontrada com freqüência em aplicações na indústria, bem como em estudos de economia e
negócios.
Auto-correlação
Uma estatística importante na análise de séries temporais é o coeficiente de auto-
correlação
ρ
. A auto-correlação é usada para descrever a correlação entre dois valores da
mesma série temporal, em diferentes períodos de tempo. Assim, um coeficiente de auto-
correlação
1
ρ
mede a correlação entre dois valores adjacentes na série. A auto-correlação,
neste caso, é dita auto-correlação de lag 1 (ou defasagem de 1 unidade de tempo). De
maneira genérica, o coeficiente de auto-correlação
k
ρ
mede a correlação entre observações
distantes
k
períodos de tempo (ou seja, uma auto-correlação de lag ).
k
A auto-correlação de lag
é medida pelo coeficiente
k
k
ρ
, definido por (Box et al.,
1994):
()( )
()( )
22
,
ttk
k
ttk
Ez z
Ez Ez
µµ
ρ
µµ
−−
⎡⎤
⎣⎦
=
⎤⎡
−−
⎦⎣
(15)
ou
21
()( )
2
,
ttk
k
z
Ez z
µµ
ρ
σ
−−⎡⎤
=
(16)
onde
2
z
σ
é a variância da série temporal.
Uma estimativa do coeficiente de auto-correlação populacional
k
ρ
nas equações (16)
e (17) é dado pelo coeficiente de auto-correlação amostral:
()()
()
1
2
1
ttk
k
t
n
tk
n
t
zzz z
r
zz
=+
=
−−
=
, com k = 0, 1, 2, ...... , n, (17)
onde
1
1
.
t
n
t
zz
n
=
=
Na prática, para se obter uma boa estimativa do coeficiente de auto-correlação, deve-
se dispor de pelo menos 50 observações da variável z (Montgomery et al., 1990). O número
de auto-correlações de lags diferentes que se calcula para a análise da série temporal deve ser
de n/4, onde n é o número total de observações na série.
A seguir é apresentado o cálculo da auto-correlação de lag 1 da série temporal
utilizada na Tabela 5 (veja página 37). Para tanto, usa-se o desenvolvimento demonstrado na
Tabela 4 (veja página 20).
Utilizando a equação (17), e os somatórios da Tabela 4, chega-se a:
254,969
0,849
300,493
k
r ==
,
o que implica em uma forte associação entre os valores da série em questão, para uma
defasagem igual a 1.
Similarmente à auto-correlação, a auto-correlação parcial também permite analisar o
relacionamento entre valores de uma série temporal. Porém, a auto-correlação parcial mede o
grau de associação entre
e , quando o efeito de outros lags – 1, 2, 3, ... , (k-1) – é
removido (Box et al., 1994). A auto-correlação parcial é representada por
t
z
tk
z
kk
φ
.
22
O coeficiente de auto-correlação parcial
kk
φ
é o k
ésimo
coeficiente em um processo auto-
regressivo de ordem k (Box et al., 1994).
Uma vez apresentados os conceitos básicos, passa-se ao detalhamento dos modelos de
Box-Jenkins.
2.4.2 Modelos Auto-regressivos
Um modelo estocástico útil na representação de um grande número de séries temporais
é o modelo auto-regressivo. Neste modelo, o valor corrente do processo é expresso como uma
combinação linear finita de valores prévios do processo e um ruído aleatório
.
t
a
Definem-se os valores observados de um processo em espaços de tempo igualmente
divididos t, t-1, t-2, ... por
12
,,,.
tt t
zz z
−−
..
..
Definem-se também
como sendo desvios da média
12
,,,.
tt t
zz z
−−

µ
:
11 2 2
,,
tt t t t t
zz z z z z ,...
µ
µµ
−−
=− = =

Então, a equação:
,
11 2 2
...
tt t ptp
zz z z
t
a
φ
φφ
−−
=+ ++ +

(18)
representa um processo auto-regressivo de ordem p, ou simplesmente AR(p). A razão para o
nome auto-regressivo é decorrente do fato de ser um modelo linear:
11 2 2
...
pp
zx x xa
φ
φφ
=+ ++ +

(19)
relacionando uma variável dependente z a um grupo de variáveis independentes x1, x2, ..., xp,
e um termo de erro
a, ser geralmente referido como um modelo de regressão. Assim z é dito
regredido em x1, x2, ..., xp. Na equação (18), a variável z é regredida em valores prévios da
própria variável; por essa razão, o modelo é denominado auto-regressivo (Box et al., 1994).
Os coeficientes auto-regressivos
,
12
, ,...,
p
φ
φφ
são parâmetros que descrevem como
um valor corrente
relaciona-se com valores passados
t
z
12
, ,...,
tt t
zz z
p
−−
B
. O coeficiente
auto-regressivo de ordem p pode ser expresso usando a definição do operador B:
,
12
2
() 1 ...
p
p
BBB
φφφ φ
=−
simplificando a representação matemática do modelo auto-regressivo para
()
tt
B
za
φ
=
.
23
O modelo AR(p) contém p+2 parâmetros desconhecidos
12
2
( , , ,..., , )
µφφ φ
σ
p
aa
, os
quais podem ser estimados a partir de valores observados na série temporal.
2
a
σ
é a variância
do processo de ruído aleatório .
t
a
Processos auto-regressivos podem ser estacionários ou não estacionários (Box et al.,
1994). A premissa necessária para que a condição estacionária seja satisfeita é que o operador
auto-regressivo
, considerando como sendo um
polinômio em B de grau p, tenha todas as suas raízes
12
2
( ) 1 ...
p
p
BBB
φφφ φ
=− B
() 0B
φ
=
maiores que 1, em valores
absolutos (todas as raízes devem estar fora do círculo unitário).
O processo auto-regressivo possui dois importantes casos especiais: os processos de
primeira e segunda ordem.
Se p = 1 tem-se um processo auto-regressivo de primeira ordem, designado por AR(1)
e descrito por:
11tt
zz
t
a
φ
=+

(20)
Este processo também é conhecido como processo de Markov [num processo de Markov, para
se saber o valor assumido pela variável de interesse num instante t qualquer, necessita-se
somente a informação sobre o valor assumido pela mesma em t-1 (Ross, 1993)]. Para o
processo AR(1) ser estacionário, a raiz de
1
() 1 0B
φ
φ
=
−=
deve estar fora do círculo
unitário. Isto equivale dizer que
1
1
φ
<
, para que a condição estacionária se verifique.
A função de auto-correlação do processo é dada por
1k 1k
ρ
φρ
=
, com k>0, ou
1
k
k
ρ
φ
= , com k 0, já que
0
1
ρ
=
. Assim, a função de auto-correlação extingue-se
exponencialmente quando
1
φ
é positivo. Analogamente, quando
1
φ
é negativo, a função de
auto-correlação extingue-se exponencialmente com alternância de sinal.
Quando p = 2, tem-se um processo auto-regressivo de segunda ordem, designado por
AR(2) e descrito por:
122
1
tt
t
zz z
t
a
φ
φ
=++

. (21)
Novamente, para o processo ser estacionário, as raízes da equação
devem estar fora do círculo unitário. Isto implica em
parâmetros
12
2
() 1 0BBB
φφφ
=− =
1
φ
e
2
φ
que satisfaçam as seguintes condições:
24
(i)
12
1,
φ
φ
+<
(ii)
21
1
φ
φ
−<
e
(iii)
2
11.
φ
−< <
A função de auto-correlação do processo AR(2) é dada por
11 2kk 2k
ρ
φρ φρ
=+
, com k 0. >
Para k = 1 e 2 tem-se, respectivamente:
1
1
2
1
φ
ρ
φ
=
e (22)
22
2
2
.
1
φ
ρφ
φ
=+
(23)
As equações (22) e (23) são denominadas equações de Yule – Walker (Box et al.,
1994).
A função de auto-correlação de ordem 2 é complexa. Se
, a função de
auto-correlação é uma mistura de distribuições exponenciais decrescentes. Quando
, a função de auto-correlação extingue-se de maneira senoidal. De uma
maneira geral, a função de auto-correlação para um processo estacionário auto-regressivo
consiste de uma mistura de distribuições exponenciais com ondas senoidais decrescentes (Box
et al., 1994).
2
2
1
4
φφ
+≥0
0
2
2
1
4
φφ
+<
Um caso de modelo auto-regressivo é apresentado no exemplo 1 da seção 2.2.7.5.
2.4.3 Modelos de Média Móvel
Nos modelos de média móvel,
, que representa a observação subtraída da média
t
z
t
z
µ
, depende linearmente de um número finito q de valores prévios do ruído aleatório .
Assim,
t
a
11 2 2
...
tt t t qt
za a a a
q
θ
θθ
−−
=−
(24)
é chamado um processo de média móvel (MA) de ordem q. O nome média móvel pode levar a
equívocos de interpretação, já que os pesos 1,
12
, ,...,
q
θ
θθ
−−
não somam,
25
necessariamente, a unidade nem precisam ser, necessariamente, positivos (Montgomery et al.,
1990).
O coeficiente de média móvel
θ
de ordem q pode ser expresso usando a definição do
operador B
,
12
2
() 1 ...
q
q
BBB
θθθ θ
=− B
a
simplificando a representação matemática para
()
tt
zB
θ
=
,
o qual contém q+2 parâmetros desconhecidos
12
2
( , , ,..., , )
q
a
µ
θθ θσ
, estimáveis a partir dos
valores observados na série temporal.
Uma vez que a série
12
2
() () 1 ...
q
q
BB BB B
ψ
θθθ
==
θ
é finita, nenhuma restrição é necessária sobre os parâmetros do processo de média móvel para
assegurar estacionariedade.
A função de auto-correlação de um processo MA(q) é
11
22
1
...
1...
kk qk
k
q
q
θ
θθ θ θ
ρ
θθ
+
−+ ++
=
+++
, com k = 1, 2, ..., q, e (25)
0
k
ρ
=
quando k q. >
Para o caso particular de um processo MA(1)
1tt t
za a
1
θ
=−
, (26)
ou
1
(1 )
t
z
t
Ba
θ
=−
, (27)
com o processo sendo estacionário para qualquer valor de
1
θ
.
A função de auto-correlação do processo MA(1) é dada por
1
2
1
1
k
θ
ρ
θ
=
+
, quando k = 1, e
0
k
ρ
=
, quando k
2.
Outro caso particular de interesse é o processo de média móvel MA(2), representado
por:
11 2tt t t
za a a
2
θ
θ
=−
, (28)
o qual é estacionário para qualquer valor de
1
θ
e
2
θ
.
26
A função de auto-correlação do processo MA(2) é dada por:
12
1
22
12
(1 )
1
θ
θ
ρ
θ
θ
−−
=
++
,
2
2
22
12
1
θ
ρ
θ
θ
=
++
,
0
k
ρ
=
, para k
3.
Um modelo de média móvel é apresentado no exemplo 2 da seção 2.2.7.5.
2.4.4 Modelos Mistos Auto-regressivo – Média Móvel
Algumas vezes, séries temporais são mais bem modeladas com a inclusão de termos
auto-regressivos e de média móvel. O resultado é um modelo misto auto-regressivo – média
móvel de ordem (p,q):
11 11
... ...
tt ptptt q
zz zaa a
tq
φ
φθ
−−
=++ +

θ
, (29)
ou, utilizando a notação do operador de defasagem B e rearranjando os termos na equação
(29).
() ()
tt
B
zBa
φ
θ
=
,
o qual pode ser abreviado para ARMA (p,q).
O modelo possui p+q+2 parâmetros desconhecidos
11
2
( , ,..., ; ,..., , )
pq
a
µφ φ
θθσ
,
que podem ser estimados a partir dos valores observados na série temporal. Na prática, os
valores de p e q são geralmente menores que dois para séries temporais estacionárias (Box et
al., 1994).
As condições de estacionariedade estabelecidas para os processos AR (p) e MA (q) se
mantém nos modelos ARMA (p,q). Ou seja, um modelo ARMA (p,q) é estacionário se as
raízes do polinômio
() 0B
φ
=
estiverem fora do círculo unitário.
Um caso especial de interesse prático dos modelos mistos auto-regressivo - média
móvel, é o processo ARMA (1,1), dado por:
11tt t
zzaa
1t
φ
θ
−−
−=

,
ou
11
(1 ) (1 )
tt
B
zBa
φ
θ
−=
.
27
Este processo é estacionário se
1
1
φ
<
.
A função de auto-correlação de um processo ARMA (1,1) é
11 1 1
1
11
2
1
(1 )( )
12
φ
θ
φ
θ
ρ
θφ
θ
−−
=
+−
, e
1k 1k
ρ
φρ
=
quando .
2k
Como se pode ver, o componente de média móvel faz parte apenas da determinação de
1
ρ
.
Conseqüentemente, a função de auto-correlação apresenta um pequeno decréscimo entre
0
ρ
e
1
ρ
, decrescendo exponencialmente a partir de
1
ρ
, em contraste com o modelo AR (1), que
decresce exponencialmente a partir de
0
ρ
.
1
ρ
é positivo sempre que
1
φ
for maior que
1
θ
, e
negativo em caso contrário.
2.4.5 Modelos Não Estacionários
Muitas séries temporais não possuem uma média constante. Isto significa que, em
nenhum dado intervalo de tempo, as observações da série se comportam como as observações
de um intervalo de tempo distinto. Tais séries são chamadas de não estacionárias na média.
Da mesma forma, é possível uma série temporal exibir comportamento não estacionário na
média e na declividade. Um exemplo de série não estacionária na média vem apresentado na
Figura 4; um exemplo de série não estacionária na média e na declividade é mostrado na
Figura 5.
28
FIGURA 4. Série temporal não estacionária na média. (Fonte: Montgomery et al., 1990).
FIGURA 5. Série temporal não estacionária na média e na declividade (Fonte: Montgomery et al., 1990).
Séries temporais não estacionárias podem exibir, independente da média local (ou
média e declividade locais), um comportamento geral homogêneo com a ocorrência de
tendências que se repetem.
Séries não estacionárias podem geralmente ser representadas por um operador auto-
regressivo generalizado
()B
ϕ
, no qual uma ou mais raízes do polinômio
()B
ϕ
são iguais a
1 em módulo. Em particular, se existirem d raízes unitárias, o operador
()B
ϕ
assumirá a
forma abaixo (Box et al., 1994):
29
() ()(1 )
d
BBB
ϕφ
=−
, (30)
onde
()B
φ
é um operador estacionário. Em contrapartida, um modelo que apresenta
comportamento homogêneo não-estacionário apresenta a seguinte forma:
,
() ()(1 ) ()
tt
d
Bz B B z Ba
ϕφ θ
=−=
t
t
ou
() ()
t
B
wBa
φ
θ
=
, (31)
onde
. (32)
t
ttt
d
wzzz
=∇ =
d
Assim, um comportamento homogêneo não-estacionário pode ser representado por um
processo estacionário, com d níveis de diferenciação. Na prática, d pode ser 0 ou 1, ou, no
máximo, 2.
Uma boa representação do efeito da diferenciação sobre uma série temporal não
estacionária vem dada pela Figura 6.
30
Figura 6. Redução do comportamento não estacionário de uma série temporal após sucessivas diferenciações.
(Adaptado de Montgomery et al., 1990).
A série temporal da Figura 6(a) exibe comportamento não estacionário na média e na
declividade. Após a primeira diferenciação
1
(
tt
zz
)
, mostrada na Figura 6(b), a série passa
a apresentar um comportamento não estacionário apenas na média. Após a segunda
diferenciação
112 1
[( ) ( ) 2 ]
tt t t t t t
zz z z z z z
−− 2
−−= +
, com o resultado apresentado
na Figura 6(c), a série torna-se estacionária.
A série representada na Figura 6(a) é um exemplo de série homogeneamente não
estacionária: após aplicarem-se diferenciações, esta se torna estacionária.
O processo definido pelas equações (31) e (32) produz um eficiente modelo para
descrever séries temporais estacionárias e não-estacionárias. Esse modelo é chamado de
processo auto-regressivo integrado a média móvel (ARIMA) de ordem (p, d, q), onde p
31
corresponde ao componente auto-regressivo, d ao número de diferenciações e q ao
componente de média móvel. O processo é representado pela equação (Box et al., 1994):
11 11
... ...
tt ptptt q
ww waa a
tq
φ
φθ
−−−
=++ +
θ
z
(33)
com
. Quando d = 0, substituindo-se por t
t
d
w=∇
t
w
t
z
µ
no modelo da equação (33),
obtém-se o modelo misto estacionário [equação (29)].
A palavra “integrado” no modelo ARIMA tem o sentido de “somado”, já que a
equação (32) pode ser escrita por:
tt
d
zSw=
,
onde
é o operador de soma, definido por:
1
(1 )S
=∇ =
1
B
+
t
12
0
...
ttjttt
j
Sw w w w w
−−
=
==++
Assim, o processo geral auto-regressivo integrado a média móvel ARIMA pode ser
gerado somando-se ou “integrando-se” o processo estacionário ARMA
vezes.
,
t
wd
A seguir, são apresentados alguns casos especiais do modelo ARIMA (Box et al.,
1994):
Modelo ARIMA (0, 1, 1):
11 1
(1 )
tt t
za a Ba
θ
θ
∇= =
,
onde p = 0, d = 1, q = 1,
() 1B
φ
=
,
1
() 1
B
B
θ
θ
=
. Este modelo pode ser descrito
abreviadamente por IMA (1,1) (Montgomery et al., 1990), uma vez que não possui
componente auto-regressivo.
Modelo ARIMA (0, 2, 2):
,
11 2 2 1 2
22
(1 )
tt t t
za a a B Ba
θθ θθ
−−
∇= =
t
onde p = 0, d = 2, q = 2,
φ
(B) = 1,
()B
θ
=
12
2
1 BB
θ
θ
−−
. Uma outra forma de descrever
este modelo é IMA (2,2).
Modelo ARIMA (1, 1, 1):
11 1ttt
zzaa
1t
φ
θ
−−
∇− =
, ou
11
(1 ) (1 )
tt
B
zBa
φ
θ
−∇=
,
32
onde p = 1, d = 1, q = 1,
11
()1,()1.
B
BB B
φ
φθ θ
=− =−
2.4.6 Modelos Sazonais
Grande parte das séries temporais, encontradas principalmente na indústria, apresenta
variações sazonais (Montgomery et al., 1990). Isto ocorre quando a série exibe uma
característica periódica que se repete a cada s intervalos de tempo. Por exemplo, em séries
compostas por observações mensais e sazonalidade anual, s é igual a 12.
Define-se
(1 )
s
s
B∇= como sendo o operador de diferença sazonal. Assim,
(1 )
s
ttt
s
zBzz
ts
z
∇= =
é a primeira diferenciação sazonal. Em geral, D diferenciações sazonais podem ser requeridas
para produzir uma série estacionária. Neste caso, o operador de diferenciação sazonal de
ordem D é
(1 )
D
sD
s
B∇= . Assim, a forma geral do modelo sazonal auto-regressivo
integrado a média móvel de ordem (P,D,Q) é (Box et al., 1994):
, (34)
() ()t
sD s
s
Bz BΦ∇=Θ ta
onde
()
s
BΦ
e
()
s
BΘ
são polinômios em
s
B de graus P e Q, respectivamente, que
satisfazem as condições de série não-estacionária. A representação da ordem (P, D, Q) é feita
em letras maiúsculas, para diferenciá-las da representação feita nos modelos sazonais.
No modelo da equação (34), os componentes de erro
α
estão geralmente
correlacionados. Assim
α
t
estaria relacionado com
1
,
tt2
α
α
, etc. Para tratar tal
relacionamento, introduz-se um segundo modelo,
, (35)
() ()
t
d
B
φαθ
∇=
t
Ba
onde
é um processo de ruído aleatório. ta
()B
φ
e
()B
θ
são polinômios em B de graus p e
q, respectivamente, que satisfazem as condições de série não-estacionária.
Subtraindo-se a equação (34) na equação (35), obtém-se um modelo multiplicativo
geral,
, () ( ) () ( )
pp t Q
sdD s
s
BB z BB
φθ
Φ∇=Θ
t
a
chamado de processo multiplicativo de ordem (p,d,q) x (P,D,Q)
s
.
33
2.4.7 Modelagem de Série Temporal
Um procedimento iterativo em três etapas pode ser utilizado na construção de modelos
ARIMA (Montgomery et al., 1990). Primeiro, o modelo ARIMA é identificado por
intermédio da análise dos dados históricos. A seguir, os parâmetros desconhecidos do modelo
são estimados. Finalmente, verifica-se o modelo quanto à sua adequação aos dados. Alguns
exemplos de modelagem são apresentados na seção 2.2.7.5.
2.4.7.1 Identificação do Modelo
A identificação de um modelo ARIMA é feita por meio da análise dos dados que
compõem a série temporal. Geralmente, necessita-se um mínimo de 50 observações para
identificar-se satisfatoriamente o modelo que melhor descreve a série temporal (Box et al.,
1994). . As principais ferramentas usadas no processo de identificação do modelo são a
função de auto-correlação (F.A.C.) e a função de auto-correlação parcial (F.A.C.P.).
A escolha do modelo mais apropriado para descrever uma série temporal não é uma
tarefa trivial, dado que existe uma grande variedade de modelos ARIMA a serem
considerados como candidatos. Na prática, a identificação do melhor modelo pode ser
auxiliada pela seqüência de passos abaixo (Makridakis et al., 1998):
1. Por meio do gráfico da série temporal, analisa-se o seu comportamento no tempo.
Em algumas situações, é necessário fazer transformações nos dados (por exemplo, uma
transformação logarítmica), com a finalidade de estabilizar a variância da série em estudo.
2. Uma vez estabilizada a variância, caso tal procedimento seja necessário, verifica-se
a condição estacionária da série. Este procedimento é feito em duas etapas: análise da série
temporal e dos gráficos das F.A.C. e F.A.C.P.. Quando a série exibe dados em torno de uma
média constante e os gráficos das F.A.C. e das F.A.C.P. apresentam auto-correlações que
tendem a zero rapidamente, tem-se a indicação de que a série é estacionária. Se algum destes
requisitos não for observado, a série é, possivelmente, do tipo não-estacionária.
3. Séries não-estacionárias devem ser estabilizadas por meio de diferenciação. Para
séries não sazonais, faz-se a diferenciação das observações
1
)
ttt
zzz
=
; para séries
sazonais, faz-se a diferenciação sazonal das observações
)
tt ts
zzz
=
, que leva em
consideração o intervalo sazonal s. Persistindo o comportamento não estacionário, nova
34
diferenciação é necessária. Geralmente, a série torna-se estacionária após, no máximo, duas
diferenciações.
4. Uma vez a série estando estacionária, os valores de D e d são conhecidos. Resta
determinar os componentes normais, p e q, e os componentes sazonais, P e Q.
Se a F.A.C. extingue-se rapidamente e a F.A.C.P. trunca abruptamente após o l
iésimo
lag, então p = 1. Da mesma maneira, para séries sazonais, o valor de P será igual ao número
de lags significativos múltiplos de s na F.A.C.P. Entendem-se como lags significativos
àqueles que ultrapassem os limites de
±
2()
k
Sr
para a F.A.C., e
ˆ
2( )
kk
S
φ
±
para a F.A.C.P.
onde:
1/2
1/2 2 2 2
12
() [12( ... )]
k
q
Sr n r r r
≈++++
(36)
1/2
ˆ
()
kk
Sn
φ
, (37)
e n é o número de observações da série.
Se a F.A.C.P. extingue-se rapidamente, e a F.A.C. trunca abruptamente após o l
iésimo
lag, então q = 1. Para modelos sazonais, o valor de Q será igual ao número de lags
significativos múltiplos de s na F.A.C..
Quando ambas as F.A.C. e F.A.C.P. extinguem-se rapidamente, um modelo misto
pode ser necessário. Tais modelos são de difícil identificação, devendo-se usar um processo
por tentativas que inicie testando valores baixos de P, Q, p e q.
2.4.7.2 Estimativa dos Parâmetros do Modelo
Uma vez identificado o modelo, seus parâmetros devem ser estimados. O método dos
mínimos quadrados pode ser usado na identificação dos parâmetros de modelos ARIMA
(Makridakis et al., 1998). Todavia, para os componentes MA, não existe uma fórmula simples
para determinação das estimativas dos parâmetros.
Um outro método freqüentemente utilizado na estimação de parâmetros é o da máxima
verossimilhança. Como o próprio nome indica, o estimador será o valor de parâmetro que
maximiza a função de verossimilhança, definida a seguir. Seja Z uma variável aleatória com
distribuição de probabilidade
(,)
f
z
θ
, onde
θ
é um parâmetro desconhecido a ser
estimado. Sejam valores observados numa amostra aleatória de tamanho n.
Então, a função de verossimilhança da amostra é (Montgomery, 1994):
12
, ,...,
n
zz z
35
12
() (,) (,)... ( ,)
n
Lfzfz fz
θ
θθ
=×××
θ
,
onde o estimador de máxima verossimilhança de
θ
é o valor de
θ
que maximiza a função de
verossimilhança
()L
θ
. Tal estimador é determinado diferenciando-se
()L
θ
, igualando o
resultado a zero e resolvendo a expressão resultante para
θ
.
2.4.7.3 Verificação do Modelo
Uma vez obtido um modelo ajustado para a série temporal, deve-se determinar sua
adequação e necessidade de melhoria. Um método lógico para a verificação do modelo utiliza
o cálculo dos resíduos
. Deve-se estimar e examinar a função de auto-
correlação dos resíduos (Montgomery et al., 1990). Se o modelo obtido for apropriado, a
F.A.C. da amostra dos resíduos
não deve apresentar lags significativos para nenhum
valor de k, neste caso definidos como sendo os maiores que . Quando este for o caso, os
resíduos resultantes da série temporal z
ˆ
(
ttt
ezz=−
)
)
()
e
rk
1/2
n
t
terão sido transformados em um processo de ruído
aleatório.
Uma outra forma de verificação da significância são os testes de Portmanteau. Estes
testes não consideram os valores de
individualmente, mas o conjunto dos k primeiros
´s. Os testes de Portmanteau seguem aproximadamente uma distribuição Qui-quadrado
()
e
rk
()
e
rk
2
(
χ
, e testam a hipótese de um conjunto de resíduos ser significativo. Sua representação
matemática é dada por:
2
1
()
e
h
k
Qnrk
=
=
,
onde n é o número de observações na série temporal e
20h
(Makridakis et al., 1998).
Os testes de Portmanteau, no geral, devem ser utilizados apenas como auxílio, uma
vez que não apresentam muita precisão.
36
2.4.7.4 Previsões
Uma vez determinado o melhor modelo para a série temporal em estudo, pode-se usá-
lo para gerar previsões de observações futuras. Partindo-se do período presente t, e supondo
que se deseja prever a série em um período futuro,
ˆ
tk
z
+
representa a previsão para um período
t+k feita em t.
A previsão para o período t+k é normalmente construída a partir de sucessivas
previsões para os períodos t+1, t+2, ... , t+k-1 (Montgomery et al., 1990). Neste
procedimento, o valor de
, o qual não se conhece no tempo t, é substituído pela sua
previsão . O valor de , o qual também não se conhece no tempo t, é substituído por
zero, e
. No início do processo de previsão, deve-se assumir que
tj
z
+
ˆ
tj
z
+ tj
a
+
ˆ
tj tj tj
azz
−−
=−
0
tj
a
=
para
.
0tj−≤
2.4.7.5 Exemplos de Construção de Modelos ARIMA
A seguir, são apresentados três exemplos para ilustrar as etapas de construção dos
modelos ARIMA.
37
Exemplo 1
Considere a série temporal com dados apresentados na Tabela 5 e representada
graficamente na Figura 7. A série foi originalmente apresentada em Morettin & Toloi (1987).
TABELA 5. Série Temporal obtida em Morettin & Toloi (1987)
t
t
z
t
t
z
t
t
z
t
t
z
t
t
z
1 0,656 11 -0,731 21 -2,092 31 3,892 41 1,958
2 1,057 12 -0,549 22 -1,993 32 4,29 42 1,883
3 -1,75 13 -1,801 23 -1,187 33 3,746 43 0,344
4 -0,489 14 -0,538 24 1,394 34 3,723 44 -0,708
5 -2,861 15 -0,292 25 3,098 35 1,111 45 -1,852
6 -2,227 16 -0,444 26 4,853 36 3,48 46 -2,318
7 -2,014 17 1,648 27 4,649 37 2,144 47 -2,3
8 -3,773 18 2,183 28 4,821 38 1,252 48 -0,937
9 -3,333 19 -0,253 29 4,441 39 -0,006 49 -1,799
10 -0,626 20 -1,069 30 5,496 40 0,412 50 -1,698
-6
-4
-2
0
2
4
6
FIGURA 7. Gráfico e linha de média da série temporal apresentada na Tabela 5.
O gráfico da Figura 7 mostra que a série temporal varia em torno da sua média,
podendo ser caracterizada como estacionária. Porém, a condição estacionária deve ser
38
comprovada por intermédio da análise das auto-correlações, conforme definido na equação
(18). Os gráficos da F.A.C. e F.A.C.P. são mostrados na Figura 8.
FIGURA 8. F.A.C. e F.A.C.P da série temporal na Figura 7.
Os gráficos das F.A.C. e F.A.C.P. confirmam a condição estacionária da série, uma
vez que seus valores tendem a zero rapidamente. As linhas horizontais traçadas nos gráficos
determinam os limites de significância para as auto-correlações, conforme definido nas
equações (36) e (37).
Com a F.A.C. extinguindo-se rapidamente de maneira exponencial, e a F.A.C.P.
contendo apenas um lag significativo, tem-se a sugestão de um modelo AR (1). Assim
usando-se a equação (20), temos:
1tt
zz
t
a
φ
=+

,
O parâmetro
1
φ
é obtido por meio de regressão, sendo dado por
1
0,8686
φ
=
; o
modelo resultante é então:
,
1
0,8686
tt
zz
=+

t
a
o qual resulta na F.A.C. para os resíduos mostrada na Figura 9.
Uma vez que a F.A.C. dos resíduos não possui lags significativos, o modelo estimado
é considerado adequado. Desta forma, o modelo obtido pode ser utilizado para gerar previsões
futuras confiáveis.
39
FIGURA 9. F.A.C. dos resíduos da série representada na Figura 7.
Exemplo 2
Considere a série temporal com dados apresentados na Tabela 6 e representada
graficamente na Figura 10. A série foi originalmente apresentada em Füller (1996).
TABELA 6. Série temporal obtida em Füller (1996).
t
t
z
t
t
z
t
t
z
t
t
z
t
t
z
1 1,432 21 -1,008 41 -1,845 61 -1,412 81 -2,569
2 -0,343 22 -1,589 42 0,281 62 -1,525 82 -0,524
3 -1,759 23 0,289 43 -0,136 63 -0,017 83 0,044
4 -2,537 24 -0,58 44 -0,992 64 -0,525 84 -0,088
5 -0,295 25 1,213 45 0,321 65 -2,689 85 -1,333
6 0,689 26 1,176 46 2,621 66 -0,211 86 -1,977
7 -0,633 27 0,846 47 2,804 67 2,145 87 0,12
8 -0,662 28 0,079 48 2,174 68 0,787 88 1,558
9 -0,229 29 0,815 49 1,897 69 -0,452 89 0,904
10 -0,851 30 2,566 50 -0,781 70 1,267 90 -1,437
11 -3,361 31 1,675 51 -1,311 71 2,316 91 0,427
12 -0,912 32 0,933 52 -0,105 72 0,258 92 0,061
13 1,594 33 0,284 53 0,313 73 -1,645 93 0,12
40
14 1,618 34 0,568 54 -0,89 74 -1,552 94 1,46
15 -1,26 35 0,515 55 -1,778 75 -0,213 95 -0,493
16 0,288 36 -0,436 56 -0,202 76 2,607 96 -0,888
17 0,858 37 0,567 57 0,45 77 1,572 97 -0,53
18 -1,752 38 1,04 58 -0,127 78 -0,261 98 -2,757
19 -0,96 39 0,064 59 -0,463 79 -0,686 99 -1,452
20 1,738 40 -1,051 60 0,344 80 -2,079 100 0,158
-4
-3
-2
-1
0
1
2
3
4
FIGURA 10. Gráfico e linha de média da série temporal apresentada na Tabela 6.
O gráfico da Figura 10, da mesma forma que o exemplo 1, mostra que a série temporal
varia em torno da sua média, o que permite caracterizá-la como sendo estacionária.
Novamente, a condição não estacionária deve ser comprovada por meio da análise das auto-
correlações. Os gráficos da F.A.C. e F.A.C.P. são mostrados na Figura 11.
FIGURA 11. F.A.C. e F.A.C.P. da série temporal representada na Figura 10.
41
A condição estacionária é confirmada pelos gráficos das F.A.C. e F.A.C.P., já que seus
valores tendem a zero rapidamente. Com a F.A.C.P. extinguindo-se rapidamente e a F.A.C.
contendo apenas um lag significativo, tem-se a sugestão de um modelo MA (1). Assim,
usando-se a equação (26), temos:
11tt t
za a
θ
=−
,
A partir do método de máxima verossimilhança, obtém-se uma estimativa para o
parâmetro do modelo
1
0,7318
θ
=−
, o que conduz à seguinte expressão:
,
1
0,7318
tt t
za a
=+
resultando na F.A.C. dos resíduos sem lags significativos. Assim, o modelo estimado é
considerado adequado.
Exemplo 3
Considere a série temporal com dados apresentados na Tabela 7 e representada
graficamente na Figura 13. A série foi originalmente apresentada em Makridakis et al. (1998)
e representa o número de usuários conectados a um servidor da Internet durante o período de
100 minutos.
42
TABELA 7. Usuários conectados a um servidor da Internet durante um período de 100 minutos
(Makridakis et al., 1998).
t
t
z
t
t
z
t
t
z
t
t
z
t
t
z
1 88 21 147 41 142 61 112 81 121
2 84 22 149 42 150 62 104 82 135
3 85 23 143 43 159 63 102 83 145
4 85 24 132 44 167 64 99 84 149
5 84 25 131 45 170 65 99 85 156
6 85 26 139 46 171 66 95 86 165
7 83 27 147 47 172 67 88 87 171
8 85 28 150 48 172 68 84 88 175
9 88 29 148 49 174 69 84 89 177
10 89 30 145 50 175 70 87 90 182
11 91 31 140 51 172 71 89 91 193
12 99 32 134 52 172 72 88 92 204
13 104 33 131 53 174 73 85 93 208
14 112 34 131 54 174 74 86 94 210
15 126 35 129 55 169 75 89 95 215
16 138 36 126 56 165 76 91 96 222
17 146 37 126 57 156 77 91 97 228
18 151 38 132 58 142 78 94 98 226
19 150 39 137 59 131 79 101 99 222
20 148 40 140 60 121 80 110 100 220
43
0
50
100
150
200
250
0 20 40 60 80 100 120
Minutos
Usuários
FIGURA 12. Gráfico e linha de tendência da série temporal apresentada na Tabela 7.
Uma análise no gráfico da série temporal mostra que a mesma não é estacionária,
possuindo uma tendência ascendente. Porém, a condição de não-estacionária deve ser
comprovada por meio da análise das auto-correlações (Figura 13).
FIGURA 13. F.A.C. e F.A.C.P. da série temporal representada na Figura 12.
O gráfico da F.A.C. confirma a condição não-estacionária da série, uma vez que seus
valores não tendem a zero rapidamente. Assim, é necessário fazer a diferenciação da série
temporal, a fim de torná-la estacionária. O gráfico da primeira diferenciação
está
representado na Figura 14.
1
()
tt
zz
44
FIGURA 14. Gráfico e linha de média da série temporal apresentada na Tabela 7, após primeira diferenciação.
A série parece tornar-se estacionária após a primeira diferenciação, variando
aleatoriamente em torno de sua média. Esta análise preliminar deve ser validada por
meio do estudo dos gráficos das F.A.C. e F.A.C.P, apresentados na Figura 15.
FIGURA 15. F.A.C. e F.A.C.P. da série temporal apresentada na Figura 15.
O gráfico da F.A.C. extingue-se rapidamente, combinando padrões exponenciais e
senoidais; já o gráfico da F.A.C.P. exibe três lags significativos. Isto sugere um modelo
ARIMA (3,1,0), o qual possui 3 parâmetros auto-regressivos e uma diferenciação. Assim,
usando-se a equação (33), temos:
11 2 2 33tt t t
ww w w
t
a
φ
φφ
−−
=+ ++
.
Observe que os componentes de média móvel da equação (33) não estão presentes no modelo
acima.
Como
e d = 1, o modelo pode ser expresso por:
ttt
wzz
=−
d
t
111 2 22 3 33 4
()()()
tt t t t t t t
zz z z z z z z a
φφ φ
−−
= −+ + −+.
45
A partir de regressão, estimam-se os parâmetros do modelo:
1
1,1563
φ
=
,
2
0,6665
φ
=−
e
3
0,3346
φ
=
; o modelo resultante é dado por:
112 23 34
1,1563( ) 0,6665( ) 0,3346( )
tt t t t t t t
zz z z z z z z a
−−
−= + +
t
4t
a+
Rearranjando os termos, chega-se ao modelo final:
,
123
2,1563 1,8228 1,0011 0,3346
tt t t t
zz z z z
−−
=−+
o qual resulta na F.A.C. dos resíduos, mostrada na Figura 16.
FIGURA 16. F.A.C. dos resíduos da série representada pelos valores estimados
Observe que a F.A.C. dos resíduos na Figura 16 não possui lags significativos. O
modelo obtido para a série temporal da Tabela 7 pode ser, assim, considerado adequado.
2.4.8 Variações dos Modelos de Box-Jenkins
X-11 ARIMA e X-12 ARIMA
As variantes X-11 ARIMA e X-12 ARIMA são os refinamentos mais difundidos do
método Census II, criado pelo Departamento de Censo do Governo Americano em 1955. Este
método utiliza a decomposição da série temporal, criando séries para sazonalidade, tendência,
ciclo e aleatoriedade. Uma vez feita à decomposição, dados atípicos são refinados, tornando
as séries livres de fatores externos que por ventura venham a influir em seu comportamento.
46
A decomposição pelo método Census II envolve a aplicação de média móvel
ponderada aos dados, causando a perda de alguns valores no início e no final da série
temporal. A função das variantes X-11 ARIMA e X-12 ARIMA é fazer a previsão destes
valores perdidos com o cálculo das médias, utilizando para isto, modelos de Box-Jenkins.
Esta metodologia é tratada com maior profundidade em Findley et al. (1998).
Regressão com Erros dos Modelos ARIMA
Nos modelos usuais de regressão, uma variável dependente é estimada por intermédio
de uma ou mais variáveis independentes, acrescidos de um termo de resíduo. Supõe-se, via de
regra, que esses resíduos sejam normalmente distribuídos, com média zero, variância
2
a
σ
e
componentes não-correlacionados.
Os modelos de Box-Jenkins em determinadas situações não modelam de maneira
adequada uma série temporal. Muitas vezes, resíduos da modelagem Box-Jenkins possuem
componentes correlacionados. Assim, estes resíduos podem ser utilizados como variáveis
independentes em modelos de regressão (ver Makridakis et al., 1998). Desta forma, utilizam-
se as características dos modelos de Box-Jenkins para descrever, em conjunto com outras
variáveis independentes, o comportamento da variável dependente.
2.4.9 Comentários sobre os Modelos Box-Jenkins
Os modelos de Box-Jenkins constituem-se em importante ferramenta para solução de
problemas de previsão. A metodologia Box-Jenkins, de um modo geral, gera previsões
acuradas das séries temporais, oferecendo uma abordagem bem estruturada para a construção
e análise do modelo. Porém, estes modelos possuem algumas limitações (Montgomery et al.,
1990):
De maneira geral, são necessárias pelo menos 50 observações para o
desenvolvimento de um modelo aceitável de Box-Jenkins. Este fato pode
impossibilitar a obtenção dos modelos em situações onde não existem muitas
observações disponíveis.
Não existe uma maneira fácil de modificar (ou melhorar) as estimativas dos
parâmetros do modelo quando novas observações são acrescidas à série de dados;
47
O tempo despendido na construção de um modelo satisfatório costuma ser
grande. Existem situações em que centenas, ou talvez milhares de séries temporais
estão em estudo, o que pode inviabilizar economicamente a realização de melhorias
na acurácia das previsões.
2.5 Estratégia de Avaliação e Seleção para Modelos de previsão de natureza
quantitativa
Agora, voltar-se-á as atenções para tratar de um tópico relevante no campo de estudo
das previsões quantitativas: como mensurar o grau de adequabilidade e utilidade de um
método de previsão particular a um conjunto de dados históricos.
Haja vista a importância deste tópico, no contexto da qualidade e veracidade desejadas
neste trabalho, foi necessário, então, que se definisse uma estratégia de avaliação de modo a
conseguir um diagnóstico confiável e realista dos resultados. Primeiramente, há a necessidade
de se declarar que na confecção deste trabalho não se priorizou verificar o grau de aderência
dos modelos aos dados utilizados no processo de calibração (quantificação dos erros de ajuste
aos dados do conjunto inicialização) e sim com o poder real de previsão de cada modelo aos
dados hipoteticamente desconhecidos (grau de aderência aos dados do conjunto teste). Sendo
assim, toda a análise realizada em relação aos erros está focalizada nos erros de previsão
gerados.
Adiante se apresentam as medidas e estatísticas utilizadas durante o processo de
avaliação e seleção dos modelos apresentados no capítulo 4.
2.5.1 Medidas Estatísticas-Padrão
Dependendo do comportamento da série temporal que se deseja analisar, vários
modelos podem ser empregados na previsão de seus valores futuros (Makridakis et al., 1998).
A escolha do modelo mais apropriado, no entanto, é baseada a partir da análise dos erros
gerados por cada modelo
. Uma vez que o cálculo dos erros pode resultar em
valores positivos ou negativos, o que pode, em algumas situações, zerar o seu somatório,
diferentes manipulações da estatística de erro (
) devem ser empregadas. Estas diferentes
manipulações constituem-se em critérios para escolha de modelos mais apropriados às séries
temporais. Os critérios mais utilizados são:
ˆ
(
ttt
eYF=−
)
t
e
48
Erro Quadrado Médio (E.Q.M.) =
2
1
1
n
t
t
e
n
=
,
Erro Absoluto Médio (E.A.M.) =
1
1
n
t
t
e
n
=
,
Erro Percentual Absoluto Médio (E.P.A.M.) =
1
1
100.
n
t
t
t
e
nY
=
×
,
2.5.2 Comentários
Dentre as medidas mencionadas para se medir a acurácia de previsão, a mais eficiente
e utilizada é a E.P.A.M. (Kahn, 1998). Tal constatação deve-se ao fato de que as medidas
E.Q.M. e E.A.M. são influenciadas pela escala dos números a serem trabalhados. Portanto,
não permitem que se proceda a análises comparativas acerca de diferentes séries temporais em
diferentes intervalos de tempo. Dentro deste contexto a medida E.P.A.M. é tida como a mais
eficiente. Porém, carrega consigo a desvantagem de que, quando a série temporal contém
valores iguais a zero, torna-se impossível o uso de sua fórmula.
2.5.3 Estatística U de Theil
Nenhuma das medidas citadas anteriormente dá uma boa base de comparação ordinal
quanto aos ganhos de acuracidade auferidas pelo uso de determinado método de previsão em
detrimento de outro. Por exemplo, será que pelo fato de se observar um valor de cinco
unidades para a estatística E.Q.M., ou um percentual de 3,2% para a estatística E.P.A.M. já
permite dizer que um determinado método é um bom previsor para um processo qualquer?
Dentro deste contexto a estatística U de Theil é adequada, pois permite uma comparação
relativa entre métodos de previsão formais com o Método Trivial de Previsão.
Matematicamente, a estatística U de Theil é definida como:
1
11
1
1
1
1
2
2
++
=
+
=
⎛⎞
⎜⎟
⎝⎠
=
⎛⎞
⎜⎟
⎝⎠
n
tt
t
t
n
tt
t
t
FY
Y
U
YY
Y
49
A característica positiva da utilização da estatística U de Theil, como medida de
acurácia, é sua interpretação intuitiva:
se
U
< 1 a técnica de previsão testada é mais acurada que o método trivial, portanto, é
vantajosa a utilização do método testado.
se
U
= 1 a técnica de previsão testada é tão acurada quanto as método trivial de
previsão. Logo, não existe diferença, no que tange à qualidade de previsão, se
for empregado tanto o modelo testado quanto o modelo trivial para a tarefa de
previsão.
se
U
> 1 a técnica de previsão testada é inferior (menos acurada), em relação ao
método trivial. Sendo assim, é vantajoso utilizar o método trivial para prever
o processo em estudo.
No entanto há que se fazer uma ressalva sobre esta estatística: a interpretação, da
forma como foi descrita acima, na qual o valor de U para o Modelo Trivial, por definição, é
igual a um só é válida quando o critério de decisão baseia-se, eminentemente, sobre os erros
de ajuste (erros gerados para o conjunto inicialização). Entretanto, quando o critério de
decisão baseia-se sobre os erros de previsão (erros gerados para o conjunto teste), como é o
caso deste trabalho, a interpretação acima não é mais válida (continua-se desejando o menor
valor de U, pois quanto menor for o valor de U maior será a indicação que o modelo tem uma
boa capacidade preditiva), porém o valor de U para o Modelo Trivial não é igual a um, por
definição. Para estes casos é necessário, então, calcular normalmente o valor de U para o
Modelo Trivial para, a partir daí, proceder à análise comparativa.
É oportuno repetir que, neste trabalho, se convencionou que a escolha do método de
previsão mais acurado para cada aeroporto está vinculada à análise e comparação das
estatísticas U dos diferentes modelos calculados a partir dos erros do conjunto teste (conjunto
de valores “hipoteticamente” desconhecidos).
50
CAPÍTULO 3
3 Metodologia para a Estruturação de um Sistema de Previsão
A elaboração de um sistema de previsão requer: organização, conhecimento e habilidade
em quatro áreas básicas:
(i) Identificação e definição dos problemas a serem tratados (ou previstos);
(ii) Aplicação dos métodos de previsão;
(iii) Procedimentos para seleção do método apropriado a situações específicas;
(iv) Suporte organizacional para adaptar e usar os métodos de previsão
requeridos.
A aplicabilidade de um sistema de previsão quantitativo depende de três condições
(Makridakis et al., 1998):
Disponibilidade de informações históricas;
Possibilidade da transformação das informações históricas em dados numéricos; e
Suposição da repetição, no futuro, dos padrões observados no passado.
Esta última consideração é conhecida como suposição de continuidade. Tal condição é
uma premissa básica em métodos quantitativos de previsão, bem como em diversos métodos
qualitativos.
As técnicas de previsão quantitativas variam consideravelmente, tendo sido
desenvolvidas com vários propósitos diferentes. Cada técnica possui características próprias,
com diferentes graus de acurácia e custos computacionais incorridos, os quais devem ser
consideradas na escolha de um método específico.
51
De forma geral, os critérios para a escolha de um sistema de previsão compreendem as
etapas descritas a seguir.
3.1 Definição do problema
Em algumas aplicações relacionadas à previsão, a definição do problema pode ser a
etapa mais complexa. Diversos fatores devem ser analisados: como a previsão será usada,
onde será usada e como ela se encaixa dentro da organização. O nível de detalhe requerido é
uma consideração de extrema importância, sendo influenciado por diversos fatores, tais como
disponibilidade de dados, acurácia, custo da análise e preferências gerenciais.
O custo da previsão está diretamente ligado a acurácia requerida. Uma vez que o
aumento da acurácia diminui as perdas resultantes dos processos decisórios, a relação entre o
custo da previsão e as perdas causadas pela incerteza forma um trade-off, exemplificado na
Figura 17, adiante apresentada.
52
Custo previsão
Custo
Acurácia na
previsão
Ótimo
Perdas causadas
pela incerteza
Custo total
FIGURA 17. Relação entre acurácia e custo de previsão. (Adaptado de Montgomery et., 1990).
Fica claro, a partir da análise do gráfico na Figura 17, que após um determinado ponto
o aumento dos recursos investidos não implica em aumento expressivo na acurácia. Sendo
assim, procura-se trabalhar dentro de uma faixa que possibilite a melhor previsão a um menor
custo.
Uma segunda classe de decisões envolve elementos temporais; mais
especificadamente, o período, o horizonte e o intervalo da previsão requerida.
O período é a unidade básica de tempo em que a previsão é requerida. Geralmente, ele
é expresso em meses ou semanas, dependendo do espaço de tempo em que os dados de
demanda estão armazenados. Dentre os elementos temporais, a magnitude do período é o fator
que mais influencia na escolha do modelo a ser utilizado.
O horizonte é o número de períodos futuros cobertos pela previsão, sendo expresso na
mesma unidade temporal do período. Está relacionado com a capacidade de resposta da
organização em relação à geração de novas informações. Sendo assim, quanto menos flexível
for a organização, isto é, quanto menor for sua capacidade de atualizar e gerar novas
informações, maior será o horizonte de previsão; por outro lado, quanto mais agilidade a
organização possuir em atualizar e disponibilizar novas informações, menor o horizonte de
tempo para a geração de novas previsões.
O intervalo é a freqüência com a qual novas previsões são preparadas. Na definição
desta freqüência, existe um trade-off entre o risco de não se identificar uma mudança na série
53
temporal e os custos incorridos na revisão da previsão. Assim, o intervalo depende da
estabilidade do processo, das conseqüências de se estar usando uma previsão obsoleta, e dos
custos da previsão e do replanejamento. Geralmente o intervalo é igual ao período. Desta
maneira, os modelos são revistos a cada período, usando a demanda do período mais recente
(Montgomery et al., 1990).
Durante a etapa de definição do problema, o técnico responsável pela elaboração do
sistema de previsão deve consultar todos aqueles envolvidos na coleta de dados, na
manutenção do banco de dados e no uso das previsões para o planejamento futuro.
3.2 Coleta de Informações
Pelo menos dois tipos de informações devem estar disponíveis na elaboração de um
sistema de previsão (Makridakis et al., 1998): (i) dados estatísticos (numéricos) e (ii) dados
subjetivos oriundos de julgamento e perícia de especialistas (empregado, principalmente, na
avaliação da qualidade dos dados a serem utilizados no sistema). Esses dois tipos de
informação são essenciais na elaboração dos modelos de previsão. Os dados estatísticos serão
utilizados na modelagem matemática do fenômeno a ser previsto; a opinião de especialistas é
essencial para a validação prática das previsões geradas pelo sistema.
3.2.1 Montagem do Banco de Dados
Os dados estatísticos a serem utilizados na previsão da demanda são usualmente
armazenados dentro de um banco de dados. Um banco de dados é um conjunto de
informações relacionadas a um assunto específico (Microsoft Access, 1997). Assim, uma
simples lista de compras, uma agenda pessoal e um conjunto complexo de informações sobre
um cliente são exemplos de banco de dados. No entanto, o termo é geralmente aplicado para
registros computadorizados de informações, facilitando assim, a manipulação das informações
nele contidas.
O banco de dados deve conter, além da série temporal (representada por produtos e a
demanda dos mesmos a cada período), informações que possibilitem a utilização de filtros. O
filtro, em um banco de dados, é a designação utilizada para quaisquer critérios empregados no
agrupamento de dados. Considere, por exemplo, a estratificação da previsão da demanda para
54
um cliente específico, uma região geográfica ou um vendedor. Os filtros, no exemplo, são os
clientes, a região geográfica e os vendedores.
A atualização do banco de dados deve ser feita a cada período, incorporando-se assim
as informações mais recentes aos modelos de previsão.
3.3 Seleção do Pacote Computacional
Dada a complexidade de alguns dos modelos de previsão, faz-se necessário o uso de
pacotes computacionais no cálculo de previsão de demanda. A escolha correta do pacote
adequado pode ser difícil, devido a grande variedade de produtos disponíveis no mercado. A
seguir, são apresentadas algumas questões que podem ser úteis na determinação do pacote
computacional mais apropriado para apoio a um sistema de previsão de demanda (Makridakis
et al., 1998):
O pacote deve possuir vantagens identificadas como essenciais pelo modelador do
processo. Verifique os modelos de previsão contemplados no produto, a forma de
gerenciamento das informações, a apresentação gráfica e relatórios dos resultados
obtidos na análise.
Identifique o sistema operacional do pacote. O sistema deve ser compatível com
aquele utilizado pelos computadores na empresa, ou permitir a transferência de dados
entre sistemas operacionais distintos.
O pacote deve ser de fácil utilização e aprendizado. Solicite uma demonstração de
funcionamento do programa e verifique aspectos relacionados à sua facilidade de
operacionalização.
Verifique a possibilidade de implementação de novos modelos de previsão no pacote
computacional. Usuários avançados, geralmente, procuram fazer modificações em
modelos existentes ou mesmo programam novos modelos nos pacotes. Para tanto, a
linguagem de programação do pacote selecionado deve ser dominada pelos
modeladores.
Muitas vezes, centenas, ou às vezes milhares de séries temporais podem estar em
estudo. Alguns pacotes possuem uma ferramenta que pode gerar rapidamente a
previsão individual de um conjunto de dados envolvendo milhares de séries temporais.
55
Esta característica é de suma importância, quando se necessita de agilidade na análise
de muitas séries.
Verifique a capacidade de processamento de dados do pacote. Alguns sistemas de
previsão utilizam séries temporais bastante extensas, que podem facilmente ultrapassar
o limite de capacidade de processamento de alguns pacotes computacionais.
Verifique a acurácia das previsões calculadas pelo pacote. Apesar de possuírem
diferentes algoritmos, pacotes distintos devem apresentar resultados, no mínimo, bem
próximos. Assim, é interessante fazer uma comparação entre eles, uma vez que alguns
podem conter erros.
3.4 Análise Preliminar
Nesta etapa, dados históricos são agrupados e representados graficamente. Desta
maneira, possíveis valores espúrios (ou outliers) podem ser identificados na série temporal, o
que dificultaria a sua modelagem.
Valores espúrios podem ser causados por erros de digitação, como tamm por uma
infinidade de fatores. Para o tratamento destes valores, sugerem-se os seguintes
procedimentos:
Procedimento A. Quando o valor espúrio encontra-se no final da série temporal e
existem valores suficientes para gerar um modelo de previsão, substitui-se o valor
espúrio pela previsão relativa ao período correspondente ao dado excluído.
Procedimento B. Quando o valor espúrio encontra-se no início da série temporal, o
procedimento descrito anteriormente torna-se impossível. Uma sugestão para tal
situação é fazer a substituição do valor espúrio pela média das observações
imediatamente adjacentes a ele e gerar um modelo de previsão. Uma vez feita a
previsão, o valor espúrio é substituído pela previsão relativa ao período
correspondente.
Uma vez retirados os valores espúrios, analisam-se fatores como padrões, tendências e
sazonalidades que podem estar presentes na série temporal em estudo. A análise gráfica
preliminar fornece subsídios auxiliares na escolha dos modelos quantitativos a serem
utilizados na modelagem matemática das diversas séries de dados. Outra ferramenta bastante
56
útil, nesta fase do estudo, é a análise da função auto-correlação das observações da série
temporal.
3.5 Escolha e Validação dos Modelos
A escolha do modelo de previsão apropriado a uma série de dados temporais deve estar
baseada, além da acurácia do modelo, nos seguintes fatores (Makridakis et al., 1998):
Aspectos que influenciam o fenômeno a ser analisado.
O conhecimento de aspectos que podem influenciar a demanda, como, por exemplo,
promoções ou campanhas promocionais, é de vital importância para o processo de
previsão. Por meio deste tipo de informação, pode-se fazer com que a previsão, com o
uso da análise subjetiva, se ajuste a casos particulares. Além disto, a previsão
geralmente é feita para um intervalo de confiança, o qual pode ter uma magnitude
elevada. Assim, mais uma vez, a análise subjetiva pode ser utilizada para aumentar a
acurácia da previsão.
Características da série temporal.
Na seção 2.2, mostrou-se que a previsão futura de uma série temporal pode ser feita
por meio de previsões de seus componentes (sazonalidade, tendência, etc). A previsão
da sazonalidade, em virtude da sua regularidade, pode ser feita de maneira adequada
por um grande número de modelos. Muitas séries, inclusive, podem ser modeladas de
forma mais acurada se removido o componente sazonal (Makridakis & Hibon, 1997).
Assim, sem o componente sazonal, o domínio de um dos componentes sobre os
demais na série temporal pode definir o modelo a ser utilizado.
Quando a aleatoriedade domina a tendência-ciclo (muitos métodos de decomposição
consideram a tendência e o ciclo como sendo um componente único), a suavização
exponencial simples geralmente modela a série temporal de forma satisfatória.
Em casos nos quais a tendência-ciclo domina a aleatoriedade, modelos mais
complexos, tais como Box-Jenkins, são os mais indicados (Makridakis et al., 1982).
Em séries temporais onde existe pouca aleatoriedade e o componente de tendência
domina as flutuações cíclicas, o modelo de Holt (ver seção 2.1.2) geralmente produz
57
bons resultados. Porém, quando o componente cíclico domina a tendência, o modelo
de Holt pode gerar uma previsão pouco acurada, uma vez que a tendência linear não se
mantém constante.
Agregação temporal dos dados.
O grau de agregação temporal influencia na seleção do modelo, pois, de maneira geral,
a aleatoriedade diminui com o agrupamento dos dados. Assim, dados dispostos
anualmente possuem pouca aleatoriedade e um forte componente de tendência,
sugerindo o uso do modelo de Holt. Por outro lado, dados diários possuem grande
aleatoriedade, sendo preferível o modelo de suavização exponencial simples.
Modelos mais complexos, como Box-Jenkins, produzem melhores resultados em
agregações intermediárias (mensais ou quadrimestrais), uma vez que podem exibir
fortes componentes cíclicos e de tendência.
Intervalo das previsões.
O intervalo, o qual relata a freqüência com que novas previsões são preparadas,
também pode ajudar a determinar o melhor modelo a ser utilizado. Dados com pouca
agregação temporal (por exemplo, diários) requerem previsões em intervalos curtos de
tempo. Assim, para dados dispostos diariamente são evitados modelos complexos, por
serem muito trabalhosos e por poderem, potencialmente, tornar o sistema dispendioso.
58
CAPÍTULO 4
4. Estudo de Caso
Neste capítulo realiza-se o processo de calibração dos modelos de previsão propostos
aplicados a uma amostra de dados de alguns aeroportos administrados pelo Departamento
Aeroviário do Estado de São Paulo (DAESP), que são os seguintes: Araçatuba, Assis, Bauru,
Marília, Presidente Prudente, Ribeirão Preto, São José do Rio Preto e Sorocaba. A
justificativa para a escolha dos mesmos se dá pelo fato de que apenas estes realizam
transporte regular de passageiros.
Em seguida, realiza-se, a partir de uma estratégia de avaliação e seleção na qual os
erros de previsão gerados são analisados, o processo de determinação do modelo preditivo
com maior grau de acurácia.
Com o intuito de alcançar as proposições supracitadas, fez-se necessário dividir o
capítulo nas seguintes seções:
1) Considerações iniciais sobre os dados utilizados;
2) Análise da série de dados;
3) Calibração e análise dos modelos;
4) Resumo dos resultados.
4.1 Considerações iniciais sobre os dados utilizados
A coleta da série de dados da amostra teve como intervalo de tempo o período de
janeiro de 1997 a agosto de 2003. De forma que os objetivos idealizados pudessem ser
atingidos, dividiu-se, então, esta amostra em dois conjuntos distintos de dados:
conjunto
inicialização e conjunto teste. O conjunto inicialização - compreendido entre Janeiro/1997 e
Agosto/2002 - foi utilizado para fins de calibração dos coeficientes e geração das previsões. Já
59
o conjunto teste, compreendido entre Setembro/2002 e Agosto/2003, foi utilizado apenas
como um meio para que a estratégia de avaliação escolhida pudesse ser implementada. Esta
estratégia, por sua vez, serviu de subsídio para a escolha do modelo mais acurado para cada
um dos diferentes aeroportos. A maneira como foi dividida a série de dados (proporção)
seguiu o seguinte procedimento: 81% dos dados disponibilizados foram alocados para o
conjunto inicialização enquanto que os 19% complementares foram alocados para o conjunto
teste.
As séries históricas referentes às demandas totais (conjunto inicialização + conjunto
teste) bem como os resultados de todos os modelos, para cada um dos aeroportos
mencionados, encontram-se no Anexo.
4.2 Análise Preliminar dos Dados
Nesta etapa, proceder-se-á, uma análise gráfica das séries históricas disponibilizadas
para a modelagem. O objetivo desta análise é verificar se alguma das características possíveis
a uma série temporal (ex: tendência, sazonalidade, horizontalidade, aleatoriedade ou conjunto
de ambas) é direta e fortemente observada, facilitando assim, o processo de entendimento pelo
qual determinado modelo se mostra como o mais adequado para uma determinada situação.
No entanto, é necessário dizer que, neste trabalho, a idéia perseguida na confecção do
mesmo foi a de experimentar todas as metodologias propostas para as diferentes séries de
dados e escolher dentre elas aquela com menor margem de erro para previsão real. Ou seja,
mesmo que, na situação em que uma característica presente à série já indique o modelo mais
adequado, outras modelagens foram normalmente realizadas e avaliadas.
Para que tal análise possa ser realizada, os gráficos referentes ao conjunto inicialização
das séries históricas, presentes no Anexo, são plotados a seguir:
60
FIGURA 18 - Demanda aeroporto de Araçatuba
Demanda Aeroporto de Araçatuba
Período
Volume de Passageiros
4000
5000
6000
7000
8000
9000
10000
11000
12000
4000
5000
6000
7000
8000
9000
10000
11000
12000
Jan-1997 Jan-1998 Jan-1999 Jan-2000 Jan-2001 Jan-2002
Demanda Aeroporto de Assis
Período
Volume de Passageiros
0
1000
2000
3000
4000
5000
6000
7000
0
1000
2000
3000
4000
5000
6000
7000
Jan-1997 Jan-1998 Jan-1999 Jan-2000 Jan-2001 Jan-2002
FIGURA 19 - Demanda aeroporto de Assis
61
FIGURA 20 - Demanda aeroporto de Bauru
FIGURA 21 - Demanda aeroporto de Marília
Demanda Aeroporto de Bauru
Período
Volume de Passageiros
0
2000
4000
6000
8000
10000
12000
14000
16000
18000
0
2000
4000
6000
8000
10000
12000
14000
16000
18000
Jan-1997 Jan-1998 Jan-1999 Jan-2000 Jan-2001 Jan-2002
Demanda Aeroporto de Marília
Período
Volume de Passageiros
1000
2000
3000
4000
5000
6000
7000
8000
9000
10000
1000
2000
3000
4000
5000
6000
7000
8000
9000
10000
Jan-1997 Jan-1998 Jan-1999 Jan-2000 Jan-2001 Jan-2002
62
FIGURA 22 – Demanda aeroporto de Presidente Prudente
Demanda Aeroporto de Presidente Prudente
Período
Volume de Passageiros
3000
4000
5000
6000
7000
8000
9000
10000
11000
3000
4000
5000
6000
7000
8000
9000
10000
11000
Jan-1997 Jan-1998 Jan-1999 Jan-2000 Jan-2001 Jan-2002
Demanda Aeroporto de Ribeirão Preto
Período
Volume de Passageiros
20000
25000
30000
35000
40000
45000
50000
55000
60000
65000
70000
75000
20000
25000
30000
35000
40000
45000
50000
55000
60000
65000
70000
75000
Jan-1997 Jan-1998 Jan-1999 Jan-2000 Jan-2001 Jan-2002
FIGURA 23 - Demanda aeroporto de Ribeirão Preto
63
FIGURA 24 – Demanda aeroporto de São José do Rio Preto
Demanda Aeroporto de São José do Rio Preto
Período
Volume de Passageiros
5000
10000
15000
20000
25000
30000
35000
40000
45000
5000
10000
15000
20000
25000
30000
35000
40000
45000
Jan-1997 Jan-1998 Jan-1999 Jan-2000 Jan-2001 Jan-2002
Demanda Aeroporto de Sorocaba
Período
Volume de Passageiros
2000
3000
4000
5000
6000
7000
8000
9000
10000
11000
2000
3000
4000
5000
6000
7000
8000
9000
10000
11000
Jan-1997 Jan-1998 Jan-1999 Jan-2000 Jan-2001 Jan-2002
FIGURA 25 - Demanda aeroporto de Sorocaba
64
Analisando individualmente o formato de cada um dos gráficos plotados, a partir das
séries mostradas no Anexo, é aparente a impressão de que os mesmos, a grosso modo, não
apresentam um comportamento bem definido (exceção feita ao gráfico do aeroporto de
Sorocaba, onde, claramente, se observa um comportamento bem definido das componentes
tendência e sazonalidade), quanto às características possíveis a uma série temporal como
mostrada na Figura 2 (página 11).
Por exemplo, ao analisar mais atentamente os gráficos dos aeroportos de Marília,
Presidente Prudente e Assis observa-se a predominância da componente aleatoriedade em
relação às outras possíveis características (tendência, média, sazonalidade).
Enquanto que, analisando os gráficos produzidos pelos dados dos aeroportos de
Araçatuba, Bauru, Presidente Prudente, Ribeirão Preto e São José do Rio Preto, também é
perceptível a predominância da componente aleatoriedade, entretanto, agora, acompanhada da
incidência da componente tendência.
4.3 Calibração e análise dos modelos
Esta seção tem como objetivos: apresentar os valores dos coeficientes dos diferentes
modelos testados, bem como avaliar as medidas de acurácia, calculadas a partir das previsões
estimadas para os dados do conjunto teste. A partir desta análise, já será possível, então,
indicar qual dentre os modelos propostos mais se ajusta ao padrão dos dados observado para
cada um dos aeroportos estudados. Para tanto, experimentar-se-á os modelos de suavização
exponencial (suavização constante, Holt, Holt-Winters aditivo e Holt-Winters multiplicativo),
os modelos de média móvel (seis e 12 meses) e os modelos de Box-Jenkins que venham a ser
identificados.
A título de informação, é necessário mencionar que a instituição em estudo utiliza
como modelo para geração de previsões (para fins de planejamento) o modelo média móvel
de 12 meses. Neste sentido, considerações e comparações acerca do grau de acurácia
apresentados em relação a este, também serão apresentadas no decorrer das subseções.
Aeroporto de Araçatuba
A fim de que se pudesse indicar qual dentre os modelos testados é mais adequado ao
padrão de dados exibido pela série disponibilizada para estudo, referente ao respectivo
65
aeroporto, eis que na Tabela 8 são descritas as informações que, efetivamente, basearam a
conclusão do modelo mais acurado, que são elas: os valores dos coeficientes calibrados; as
medidas de acurácia E.A.M., E.Q.M. e E.P.A.M. e a Estatística U de Theil.
Lembrando que a estimação dos coeficientes, bem como das previsões foram
realizadas mediante a utilização do conjunto inicialização. Já o cálculo das medidas de
acurácia e da Estatística U de Theil, fator este preponderante para a escolha do modelo mais
apropriado, foi realizado mediante a utilização do conjunto teste. As previsões estimadas, por
cada um dos modelos testados, são apresentadas no Anexo.
TABELA 8: Comparação entre os diferentes modelos propostos aplicados aos dados da Figura 18
Critérios
MODELOS
E.A.M. E.Q.M. E.P.A.M. U de Theil
ARIMA
()()
120,1,1 0,1,1
2.001 4.312.624 72,46 5,17
Trivial
2.571 6.728.910 92,92 6,64
Média Móvel 6 meses
3.348 12.052.782 120,07 8,25
Holt
(
0,37; 0,08
αβ
==
)
3.478 12.286.894 124,90 8,76
Holt-Winters aditivo
(
0,57; 0,03; 0,79
αβγ
===
)
3.507 12.860.780 125,94 8,80
Holt-Winters multiplicativo
(
0,52; 0,02; 0,74
αβγ
===
)
3.821 15.065.992 137,31 9,59
Suavização Exponencial Simples
()
0,38
α
=
4.192 17.689.162 150,46 10,66
Média Móvel 12 meses *
4.451 20.295.013 159,66 11,26
* Modelo utilizado pela Instituição estudada.
Onde:
E.Q.M. (Erro Quadrado Médio) =
(
)
2
80
69
1
12
ˆ
tt
t
YF
=
,
E.A.M (Erro Absoluto Médio) =
80
69
1
12
tt
t
YF
=
,
66
E.P.A.M. (Erro Percentual Absoluto Médio) =
80
69
1
12
ˆ
100
t
tt
t
YF
Y
=
⎛⎞
⎜⎟
⎜⎟
⎝⎠
×
.
U =
79
11
69
79
1
69
2
2
++
=
+
=
⎛⎞
⎜⎟
⎝⎠
⎛⎞
⎜⎟
⎝⎠
tt
t
t
tt
t
t
FY
Y
YY
Y
Em relação ao processo de comparação e seleção dos modelos preditivos apresentados,
torna-se imperativo ressaltar que a Estatística U de Theil é a estatística utilizada para a
classificação e, posterior, seleção do modelo mais adequado. Em síntese, o método de
previsão que obtiver o menor valor para a referida estatística será admitido como o mais
adequado para a situação, ou seja, com maior grau de acurácia.
Neste sentido, tendo como base o conteúdo do parágrafo anterior, e analisando os
resultados da tabela 8 constata-se que, dentre os métodos testados, o modelo ARIMA
é o mais acurado (já que apresenta U = 5,17).
()()
120,1,1 0,1,1
O resultado torna-se particularmente interessante por 2 aspectos:
1) O modelo utilizado pela empresa é o último colocado no ranking de acurácia;
2) A dimensão numérica da diferença entre os valores das respectivas Estatísticas U de
Theil é bastante significativa, o que indica, por sua vez, que as previsões geradas pelos
diferentes modelos são bastante diferentes.
No gráfico, plotado na página seguinte, poder-se-á visualizar as diferenças entre os
dados reais e as previsões proporcionadas pelo modelo vencedor – ARIMA
– e pelo modelo atualmente utilizado – Média Móvel de 12 meses.
()()
120,1,1 0,1,1
67
Comparão: Dados reais X Previsões
0
2000
4000
6000
8000
10000
12000
dez-96 abr-98 ago-99 jan-01 mai-02 out-03 fev-05
Período
Passageiros
Dados reais
ARIMA
MM 12 meses
FIGURA 26 – Previsões para o aeroporto de Araçatuba
Por meio da análise do gráfico se pode concluir que, dada a suposição de continuidade
nos dados, existe um potencial
considerável de ganho em acurácia em substituir o modelo
atual - Média Móvel 12 meses - pelo modelo vencedor –
ARIMA
(
)( )
120,1,1 0,1,1
para se
gerar previsões de demanda por passageiros para um horizonte de 12 meses.
Aeroporto de Assis
Analogamente ao que foi feito para o aeroporto de Araçatuba segue abaixo a tabela
contendo as informações relevantes para que o processo de escolha de modelo para o
aeroporto de Assis seja realizado.
TABELA 9: Comparação entre os diferentes modelos propostos aplicados aos dados da Figura 19
Critérios
MODELOS
E.A.M. E.Q.M. E.P.A.M. U de Theil
Suavização Exponencial Simples
(
)
0,62
α
=
100 17.309 15,61 0,73
Média Móvel 6 meses
93 13.185 15,02 0,74
Trivial
100 17.565 15,71 0,75
Média Móvel 12 meses *
156 32.208 24,81 1,26
ARIMA
(
)
2,1,2
201 48.110 28,76 1,55
Holt
()
0,62; 0,04
αβ
==
393 176.059 60,02 3,23
Holt-Winters multiplicativo
(
0,45; 0,01; 1,00
αβγ
===
)
369 187.147 60,37 3,29
68
Holt-Winters aditivo
(
0,45; 0,06; 0,87
αβγ
===
)
817 971.590 150,35 7,61
* Modelo utilizado pela Instituição estudada.
Tendo como base o critério anteriormente citado utilizado para a escolha, isto é, o
valor da Estatística U de Theil, verifica-se que o modelo com maior grau de acurácia dentre os
modelos propostos é o modelo S.E.S. - Estatística U de Theil = 0,73. Paralelamente, o método
preditivo utilizado pelo DAESP (Média Móvel 12 meses) classificou-se apenas em 4° lugar
(Estatística U de Theil = 0,75).
No gráfico, plotado abaixo, poder-se-á visualizar as diferenças entre os dados reais e
as previsões proporcionadas pelo modelo vencedor – S.E.S. – e pelo modelo atualmente
utilizado – Média Móvel de 12 meses.
Comparão: Dados reais X Previsões
0
1000
2000
3000
4000
5000
6000
dez-96 abr-98 ago-99 jan-01 mai-02 out-03 fev-05
Período
Passageiros
Dados reais
SES
MM 12 meses
FIGURA 27 – Previsões para o aeroporto de Assis
Por meio da análise do gráfico se pode concluir que, dada a suposição de continuidade
nos dados, existe um potencial de ganho em acurácia em substituir o modelo atual - Média
Móvel 12 meses - pelo modelo vencedor – S.E.S.
para se gerar previsões de demanda por
passageiros para um horizonte de 12 meses.
69
Aeroporto de Bauru
Analogamente ao que foi feito para os aeroportos de Araçatuba e Assis, segue abaixo a
tabela contendo as informações relevantes ao processo de escolha do modelo de previsão mais
acurado para o aeroporto de Bauru.
TABELA 10: Comparação entre os diferentes modelos propostos aplicados aos dados da Figura 20
Critérios
MODELOS
E.A.M. E.Q.M. E.P.A.M. U de Theil
ARIMA
()()
122,1,0 1,1,0
1.616 3.200.786 22,02 2,13
Média Móvel 12 meses *
3.847 18.533.554 55,46 5,21
Holt-Winters multiplicativo
(
0,32; 0,00; 0,47
αβγ
===
)
3.750 18.683.773 53,69 5,37
Suavização Exponencial Simples
(
)
0,72
α
=
4.171 20.668.572 59,40 5,42
Holt-Winters aditivo
(
0,51; 0,00; 0,22
αβγ
===
)
3.901 19.520.911 56,05 5,44
Média Móvel 6 meses
4.193 21.048.164 59,82 5,49
Trivial
4.260 21.415.459 60,56 5,51
Holt
(
0,78; 0,09
αβ
==
)
4.441 23.417.229 63,24 5,78
* Modelo utilizado pela Instituição estudada.
Ao analisar os valores apresentados pelos diferentes modelos propostos em relação à
Estatística U de Theil, percebe-se que o modelo ARIMA
(
)
(
)
122,1,0 1,1,0
é o mais acurado
– Estatística U de Theil = 2,13. Enquanto que, o modelo utilizado pela Instituição estudada
(Média Móvel de 12 meses) se classificou em 2º lugar no ranking de acurácia (Estatística U
de Theil = 5,21).
No gráfico, plotado na página seguinte, poder-se-á visualizar as diferenças entre os
dados reais e as previsões proporcionadas pelo modelo vencedor – ARIMA
– e pelo modelo atualmente utilizado – Média Móvel de 12 meses.
()()
122,1,0 1,1,0
70
Comparão: Dados reais X Previsões
0
5000
10000
15000
20000
dez-96 abr-98 ago-99 jan-01 mai-02 out-03 fev-05
Período
Passageiros
Dados reais
ARIMA
MM 12 meses
27 – Pra o aeroporto de FIGURA 28 – Previsões para o aeroporto de Bauru
Por meio da análise do gráfico se pode concluir que, dada a suposição de continuidade
nos dados, existe um potencial
considerável de ganho em acurácia em substituir o modelo
atual - Média Móvel 12 meses - pelo modelo vencedor – ARIMA
(
)( )
122,1,0 1,1,0
– para se
gerar previsões de demanda por passageiros para um horizonte de 12 meses.
Aeroporto de Marília
Seguindo o procedimento realizado para os outros aeroportos, segue abaixo a tabela na
qual são apresentadas as informações relevantes ao processo de escolha do modelo mais
acurado para o aeroporto de Marília.
TABELA 11: Comparação entre os diferentes modelos propostos aplicados aos dados da Figura 21
Critérios
MODELOS
E.A.M. E.Q.M. E.P.A.M. U de Theil
ARIMA
(
)
0,1,1
1.205 1.921.339 27,82 2,00
Holt-Winters aditivo
(
0,35; 0,03; 0,79
αβγ
===
)
2.167 5.449.510 47,78 3,37
Holt-Winters multiplicativo
(
0,24; 0,02; 0,78
αβγ
===
)
2.459 6.713.081 53,66 3,68
71
Média Móvel 12 meses *
2.424 6.865.362 54,66 3,77
Trivial
2.508 7.207.986 56,34 3,82
Suavização Exponencial Simples
(
)
0,47
α
=
2.513 7.233.056 56,44 3,82
Média Móvel 6 meses
2.533 7.270.756 56,75 3,82
Holt
(
0,48; 0,02
αβ
==
)
3.273 12.228.900 73,32 4,99
* Modelo utilizado pela Instituição estudada.
Ao analisar os valores apresentados pelos diferentes modelos propostos em relação à
Estatística U de Theil, percebe-se que o modelo ARIMA
(
)
0,1,1
é o mais acurado –
Estatística U de Theil = 2,00. Enquanto que, o modelo utilizado pela Instituição estudada
(Média Móvel de 12 meses) se classificou em 4° lugar no ranking de acurácia (Estatística U
de Theil = 3,77).
No gráfico, plotado abaixo, poder-se-á visualizar as diferenças entre os dados reais e
as previsões proporcionadas pelo modelo vencedor – ARIMA
(
)
0,1,1
– e pelo modelo
atualmente utilizado – Média Móvel de 12 meses.
Comparão: Dados reais X Previsões
0
2000
4000
6000
8000
10000
dez-96 abr-98 ago-99 jan-01 mai-02 out-03 fev-05
Período
Passageiros
Dados reais
ARIMA
MM 12 meses
FIGURA 29 – Previsões para o aeroporto de Marília
Por meio da análise do gráfico se pode concluir que, dada a suposição de continuidade
nos dados, existe um potencial
considerável de ganho em acurácia em substituir o modelo
72
atual, Média Móvel 12 meses, pelo modelo vencedor, ARIMA
(
)
0,1,1
, para se gerar
previsões de demanda por passageiros para um horizonte de 12 meses.
Aeroporto de Presidente Prudente
Seguindo o procedimento realizado para os outros aeroportos segue abaixo a tabela em
que são apresentadas as informações relevantes ao processo de escolha do modelo de previsão
mais acurado para o aeroporto de Presidente Prudente.
TABELA 12: Comparação entre os diferentes modelos propostos aplicados aos dados da Figura 22
Critérios
MODELOS
E.A.M. E.Q.M. E.P.A.M. U de Theil
Holt
(
0,67; 0,06
αβ
==
)
1.787 3.717.253 50,65 3,74
Holt-Winters aditivo
(
0,44; 0,01; 0,58
αβγ
===
)
1.548 3.603.143 45,55 3,88
Média Móvel 12 meses *
1.999 4.631.118 56,99 4,21
ARIMA
(
)
0,1,1
2.049 4.915.988 58,37 4,35
Suavização Exponencial Simples
(
)
0,60
α
=
2.049 4.915.988 58,37 4,35
Holt-Winters multiplicativo
(
0,48; 0,00; 0,71
αβγ
===
)
1.790 4.652.051 52,74 4,41
Média Móvel 6 meses
2.122 5.456.706 60,80 4,61
Trivial
2.199 5.608.523 62,63 4,65
* Modelo utilizado pela Instituição estudada.
Ao analisar os valores apresentados pelos diferentes modelos propostos em
relação à Estatística U de Theil, percebe-se que o modelo Holt é o mais acurado – Estatística
U de Theil = 3,74. Enquanto que, o modelo utilizado pela Instituição estudada (Média Móvel
de 12 meses) se classificou em 3° lugar no ranking de acurácia (Estatística U de Theil = 4,21).
No gráfico, plotado na página seguinte, poder-se-á visualizar as diferenças entre os
dados reais e as previsões proporcionadas pelo modelo vencedor – Holt – e pelo modelo
atualmente utilizado – Média Móvel de 12 meses.
73
Comparão: Dados reais X Previsões
0
2000
4000
6000
8000
10000
12000
dez-96 abr-98 ago-99 jan-01 mai-02 out-03 fev-05
Períodos
Passageiros
Dados reais
HOLT
MM 12 meses
FIGURA 30 – Previsões para o aeroporto de Presidente Prudente
olt, para se gerar previsões de
anda por passageiros para um horizonte de 12 meses.
Preto
antes ao processo de escolha do modelo mais
TABELA 13: Comparação entre os diferentes modelos propostos a dos da Figura 23
éri
Por meio da análise do gráfico se pode concluir que, dada a suposição de
continuidade nos dados, existe um potencial de ganho em acurácia em substituir o modelo
atual, Média Móvel 12 meses, pelo modelo vencedor, H
dem
Aeroporto de Ribeirão
Seguindo o procedimento realizado para os outros aeroportos, segue abaixo a tabela
em que são apresentadas as informações relev
acurado para o aeroporto de Ribeirão Preto.
plicados aos da
Crit os
MODELOS
E.A.M. E.Q.M. E.P.A.M. U de Theil
ARIMA
1,1,0
6.364 51.287.103 23,28 1,52
()()
120,1,1
Holt
16.781 307.495.782 61,35 3,94
()
0,66; 0,22
αβ
==
Trivial
17.886 350.228.277 65,42 4,23
74
Média Móvel 12 meses *
18.178 354.999.313 66,12 4,23
Média Móvel 6 meses
17.899 351.167.511 65,49 4,23
Suavização Exponencial Simples
()
0,50
α
=
17.971 353.292.010 65,72 4,24
Holt-Winters multiplicativo
(
0,68; 0,00; 1,00
αβγ
===
)
19.155 400.426.795 69,20 4,45
Holt-Winters aditivo
(
0,64; 0,00; 1,00
αβγ
===
)
18.792 392.894.975 68,39 4,48
* Modelo utilizado pela Instituição estudada
Ao analisar os valores apresentados pelos diferentes modelos propostos em relação à
Estatística U de Theil, percebe-se que o modelo ARIMA
(
)
(
)
120,1,1 1,1,0
é o mais acurado
– Estatística U de Theil = 1,52. Enquanto que, o modelo utilizado pela Instituição estudada
(Média Móvel de 12 meses) se classificou em lugar no ranking de acurácia (Estatística U
de Theil = 4,23).
No gráfico, plotado abaixo, poder-se-á visualizar as diferenças entre os dados reais e
as previsões proporcionadas pelo modelo vencedor – ARIMA
(
)( )
120,1,1 1,1,0
– e pelo
modelo atualmente utilizado – Média Móvel de 12 meses.
Comparão: Dados reais X Previsões
0
10000
20000
30000
40000
50000
60000
70000
80000
dez-96 abr-98 ago-99 jan-01 mai-02 out-03 fev-05
Período
Passageiros
Dados reais
ARIMA
MM 12 meses
FIGURA 31 – Previsões para o aeroporto de Ribeirão Preto
Por meio da análise do gráfico se pode concluir que, dada a suposição de continuidade
nos dados, existe um potencial
considerável de ganho em acurácia em substituir o modelo
75
atual, Média Móvel 12 meses, pelo modelo vencedor, ARIMA
(
)( )
120,1,1 1,1,0
, para se
gerar previsões de demanda por passageiros para um horizonte de 12 meses.
Aeroporto de São José do Rio Preto
Seguindo o procedimento realizado para os outros aeroportos, segue abaixo a tabela na
qual são apresentadas as informações relevantes ao processo de escolha do modelo mais
acurado para o aeroporto de São José do Rio Preto.
TABELA 14: Comparação entre os diferentes modelos propostos aplicados aos dados da Figura 24
Critérios
MODELOS
E.A.M. E.Q.M. E.P.A.M. U de Theil
ARIMA
()()
120,1,1 1,1,0
3.713 16.940.377 19,00 2,24
Holt-Winters multiplicativo
(
0,67; 0,00; 1,00
αβγ
===
)
6.458 44.759.395 32,49 3,53
Trivial
6.639 48.102.146 34,08 3,65
Média Móvel 6 meses
7.664 62.008.695 38,92 4,01
Holt-Winters aditivo
(
0,62; 0,00; 1,00
αβγ
===
)
7.841 67.296.246 39,80 4,40
Média Móvel 12 meses *
8.147 72.284.216 41,74 4,51
Suavização Exponencial Simples
(
)
0,42
α
=
8.560 77.309.879 43,67 4,58
Holt
()
0,48; 0,15
αβ
==
9.488 94.969.206 48,38 5,09
* Modelo utilizado pela Instituição estudada
Ao analisar os valores apresentados pelos diferentes modelos propostos em relação à
Estatística U de Theil, percebe-se que o modelo ARIMA
(
)
(
)
120,1,1 1,1,0
é o mais acurado
– Estatística U de Theil = 2,24. Enquanto que, o modelo utilizado pela Instituição estudada
(Média Móvel de 12 meses) se classificou em 6° lugar no ranking de acurácia (Estatística U
de Theil = 4,51).
76
No gráfico, plotado abaixo, poder-se-á visualizar as diferenças entre os dados reais e
as previsões proporcionadas pelo modelo vencedor – ARIMA
(
)( )
120,1,1 1,1,0
– e pelo
modelo atualmente utilizado – Média Móvel de 12 meses.
Comparão: Dados reais X Previsões
0
5000
10000
15000
20000
25000
30000
35000
40000
dez-96 abr-98 ago-99 jan-01 mai-02 out-03 fev-05
Período
Passageiros
Dados reais
ARIMA
MM 12 meses
FIGURA 32 – Previsões para o aeroporto de São José do Rio Preto
Por meio da análise do gráfico se pode concluir que, dada a suposição de continuidade
nos dados, existe um potencial
considerável de ganho em acurácia em substituir o modelo
atual, Média Móvel 12 meses, pelo modelo vencedor, ARIMA
(
)( )
120,1,1 1,1,0
, para se
gerar previsões de demanda por passageiros para um horizonte de 12 meses.
Aeroporto de Sorocaba
Seguindo o procedimento realizado para os outros aeroportos, segue abaixo a tabela
em que são apresentadas as informações relevantes para o processo de escolha do modelo
mais acurado para o aeroporto de Sorocaba.
TABELA 15: Comparação entre os diferentes modelos propostos aplicados aos dados da Figura 25
Critérios
MODELOS
E.A.M. E.Q.M. E.P.A.M. U de Theil
Holt-Winters aditivo
(
0,13; 0,03; 0,80
αβγ
===
)
1.043 1.857.149 32,22 1,98
77
Holt
(
0,54; 0,02
αβ
==
)
1.224 1.730.750 38,65 2,06
Trivial
1.358 2.158.855 43,19 2,33
Holt-Winters multiplicativo
(
0,05; 0,12; 0,67
αβγ
===
)
1.264 2.688.221 40,14 2,43
Média Móvel 6 meses
1.660 3.070.555 51,60 2,64
ARIMA
()()
121, 0,1 1,1, 0
1.734 3.537.379 54,59 2,90
Suavização Exponencial Simples
(
)
0,47
α
=
1.829 3.658.725 57,26 3,00
Média Móvel 12 meses *
1.835 3.802.057 57,40 3,06
* Modelo utilizado pela Instituição estudada
Ao analisar os valores apresentados pelos diferentes modelos propostos em relação à
Estatística U de Theil, percebe-se que o modelo de Holt-Winters Aditivo é o mais acurado –
Estatística U de Theil = 1,98. Enquanto que, o modelo utilizado pela Instituição estudada
(Média Móvel de 12 meses) se classificou em último lugar no ranking de acurácia (Estatística
U de Theil = 3,06).
No gráfico, plotado abaixo, poder-se-á visualizar as diferenças entre os dados reais e
as previsões proporcionadas pelo modelo vencedor – Holt-Winters Aditivo – e pelo modelo
atualmente utilizado – Média Móvel de 12 meses.
Comparão: Dados reais X Previsões
0
2000
4000
6000
8000
10000
12000
dez-96 abr-98 ago-99 jan-01 mai-02 out-03 fev-05
Período
Passageiros
Dados reais
HW-Aditivo
MM 12 meses
FIGURA 33 – Previsões para o aeroporto de Sorocaba
78
Por meio da análise do gráfico se pode concluir que, dada a suposição de continuidade
nos dados, existe um potencial considerável de ganho em acurácia em substituir o modelo
atual, Média Móvel 12 meses, pelo modelo vencedor, Holt-Winters Aditivo, para se gerar
previsões de demanda por passageiros para um horizonte de 12 meses.
4.4 Resumo dos Resultados
A tabela abaixo resume, para cada um dos oito aeroportos estudados, os modelos
atualmente utilizados e os modelos dentre os propostos, que apresentaram maior grau de
acurácia de acordo com a estratégia utilizada para avaliação e seleção dos modelos (Estatística
U de Theil para os dados do conjunto teste).
TABELA 16: Resumo dos resultados alcançados
Aeroporto Modelo utilizado
Modelo mais acurado para
horizonte de 12 meses
Araçatuba Média Móvel 12 meses
ARIMA
(
)( )
120,1,1 0,1,1
Assis Média Móvel 12 meses Suavização Simples
Bauru Média Móvel 12 meses
ARIMA
(
)( )
122,1,0 1,1,0
Marília Média Móvel 12 meses
ARIMA
(
)
0,1,1
Presidente Prudente Média Móvel 12 meses Holt
Ribeirão Preto Média Móvel 12 meses
ARIMA
(
)( )
120,1,1 1,1,0
São José do Rio Preto Média Móvel 12 meses
ARIMA
(
)( )
120,1,1 1,1,0
Sorocaba Média Móvel 12 meses Holt-Winters aditivo
O que pode claramente ser percebido ao se analisar a tabela mostrada é o desempenho
superior das metodologias propostas em relação à metodologia atualmente utilizada pela
Instituição estudada para prognosticar a demanda num horizonte de 12 meses à frente.
Isto é uma indicação para o DAESP que por meio da utilização de modelos de séries
temporais, como os aqui propostos, os quais apresentam como vantagem a flexibilidade na
sua utilização, é possível a obtenção de melhorias na qualidade das previsões elaboradas que,
posteriormente, serão utilizadas no processo de planejamento.
79
CAPÍTULO 5
5.1 Conclusões
O objetivo principal deste trabalho foi aplicar as metodologias de Box-Jenkins e
Suavização Exponencial na previsão de séries temporais, mais precisamente, das séries de
demanda dos aeroportos com tráfego aéreo regular administrados pelo Departamento
Aeroviário do Estado de São Paulo (DAESP).
A principal motivação para o uso de tais modelos na previsão destas séries foi buscar,
de uma forma que independesse da obtenção de dados externos, melhores resultados que os
apresentados pela metodologia atualmente utilizada pela Instituição estudada (Média Móvel
de 12 meses), que pela sua própria estrutura de cálculo não captura padrões como
sazonalidade e tendência, padrões estes, por sua vez, bastante comuns a este tipo de série.
A não-inclusão dos modelos econométricos de regressão nesta dissertação, que,
tradicionalmente, é a metodologia mais utilizada para estudos desta natureza, se deu com base
em duas razões.
A primeira delas é decorrente do fato de não ter sido encontrado nenhum material
bibliográfico, de acesso público, que retratasse, de forma realista e atual, as áreas geográficas
que sofrem influência econômica dos municípios paulistas com aeroportos com tráfego
regular de passageiros. Uma vez que um documento desta natureza estivesse a disposição
seria, então, possível a identificação dos fatores econômicos relacionados com o desempenho
econômico da região os quais, posteriormente, poderiam ser utilizados como variáveis
explicativas em um possível modelo.
O IBGE publica um estudo desta natureza (Regiões de influência das cidades), o qual
poderia ser utilizado neste sentido, porém, durante um encontro realizado em 28/11/2004 com
o Superintendente do DAESP Dr. José Mauro Garcia declarou não achar válido a utilização
deste estudo para o processo de identificação de possíveis variáveis explicativas para os
aeroportos do interior paulista. Segundo o Dr. Mauro, considerando o ambiente econômico
80
peculiar no qual o interior paulista está inserido e isto, automaticamente, inclui os aeroportos
estudados acaba por derivar demandas com um comportamento bastante particular. Sendo
assim, na visão desta autoridade, uma estratégia válida na tentativa de identificar os fatores,
realmente, determinantes à demanda por transporte aéreo nestes aeroportos, os quais poderiam
se transformar em variáveis explicativas, seria por meio de pesquisas individualizadas onde ao
passageiro usuário do aeroporto seria solicitado: as cidades origem-destino da viagem, a
freqüência com que viaja e o setor econômico no qual desenvolve suas atividades.
Consequentemente, só a partir da realização de uma pesquisa desta natureza, seria possível,
então, a identificação das variáveis explicativas e a correta utilização de modelos
econométricos de regressão para prognosticar a demanda dos aeroportos administrados pelo
DAESP.
A segunda razão resulta da hipótese que a demanda por transporte aéreo dos
respectivos aeroportos seria determinada por variáveis sócio-econômicas de âmbito local. No
entanto, em uma pesquisa realizada junto à Fundação SEADE (
www.seade.com.br) verificou-
se que as variáveis tradicionalmente citadas na literatura como fatores determinantes para a
demanda por transporte aéreo: Renda (proxy: Renda per Capita) e Consumo (proxy: consumo
de energia elétrica) estavam disponíveis somente em base anual. Dessa forma, a base de dados
que inicialmente somava 80 observações seria reduzida para apenas seis. O que além de não
propiciar a calibração de regressões confiáveis (do ponto de vista amostral) também não
possibilitaria o uso de metodologias inicialmente planejadas: Box-Jenkins (necessita de, no
mínimo, 50 observações) e Suavização Exponencial (necessita de ciclos sazonais completos).
Todas estas considerações foram ponderadas e analisadas em relação à proposta inicial
de estudo e decidiu-se, então, pela não-inclusão da referida metodologia no âmbito deste
trabalho, mesmo sabendo de sua utilidade em estudos desta natureza.
Os resultados obtidos, mediante o critério de decisão assumido (Estatística U de
Theil), demonstraram a superioridade dos métodos escolhidos em relação ao método
atualmente utilizado, gerando previsões mais acuradas para 8 (oito) dos 8 (oito) aeroportos
analisados. Este fato indica que qualquer um dos modelos estudados, uma vez utilizados,
poderia melhorar a qualidade das previsões utilizadas.
Obviamente, não há um método único para se prognosticar a demanda por transporte
aéreo. Assim sendo, os diferentes métodos pesquisados tendem a trabalhar melhor
dependendo das características (natureza) da demanda que se pretende prever.
Este breve estudo sobre a aplicação de modelos de séries temporais na previsão de
demanda por transporte aéreo demonstra o fato de que a previsão é um campo amplo e
81
inóspito da economia. As idiossincrasias e particularidades econômicas e operacionais de
cada aeroporto não podem ser representadas, de forma completa, em um simples estudo. Para
aqueles que lidam com transporte aéreo, o tópico é de uma importância crescente,
especialmente se contextualizado no âmbito estratégico das empresas que dele fazem parte.
5.2 Extensões
Conforme já mencionado anteriormente, este trabalho não pretende esgotar o tema
relativo à previsão de demanda para os aeroportos estudados, nem mesmo inferir que os
métodos aqui abordados sejam definitivamente a melhor alternativa para o DAESP em termos
de metodologia de previsão. O intuito principal desta dissertação foi demonstrar que, por meio
da utilização de modelos temporais, os quais apresentam como principal vantagem a
flexibilidade de utilização, é possível melhorar a qualidade das previsões que atualmente são
elaboradas e que, posteriormente, serão utilizadas para fins de planejamento.
Dentro deste contexto, abaixo, é sugerida uma possível extensão deste trabalho:
Mensuração e comparação do nível de acurácia proporcionada pela utilização de outros
modelos como, por exemplo, Redes Neurais Artificiais, para o mesmo conjunto de dados.
82
REFERÊNCIAS BIBLIOGRÁFICAS
ALTABET, R. The forecaster as a key member of the strategic planning team. The Journal of
Business Forecasting Methods & Systems, v. 17, n. 3, p. 3-6, Fall 1998.
ARMSTRONG, J. S. (1999). Principles of forecasting: a handbook for researchers and
practitioners, Kluwer, Philadelphia.
BOX, G. & LUCEÑO, A. (1997). Statistical control by monitoring and feedback adjustment,
John Wiley, New York.
BOX, G. E. P., JENKINS, G. M. & REINSEL, G. C. (1994). Time series analysis –
forecasting and control, 3ª ed., Prentice Hall, New Jersey.
BROWN, R. G. “ Exponential smoothing for predicting demand,” presented at the tenth
national meeting of the Operations Research Society of America, San Francisco, 16
November 1956.
ELSAYED, E. A. & BOUCHER, T. O. (1994). Analysis and control of production systems, 2ª
ed., Prentice Hall, New Jersey.
FINDLEY, D. F., MONSELL, B. C., BELL, W. R., et al. New capabilities and methods of
the X-12 ARIMA seasonal adjustment program. Journal of Business & Economic
Statistics. Alexandria, v. 16, n. 2, p. 127-177, apr. 1998.
FULLER, W. A. (1996). Introduction to statistical time series, 2ª ed., John Wiley, New
York.
GARDNER, E. S. Exponential smoothing: the state of the art, Journal of Forecasting, 4, 1
– 28, 1985.
HILL, T. (1994). Manufacturing strategy: text and cases, 2ª ed., Irwin Boston, MA.
HOLT, C. C. Forecasting seasonal and trends by exponentially weighted moving averages,
Office of Naval Research, Research Memorandum No. 52, 1957.
LEDOLTER, J. and B. ABRAHAM. Some comments on the initialization of exponential
smoothing, Journal of Forecasting, 3, 79 – 84, 1984.
KAHN, K. B. Benchmarking sales forecasting performance measures. The Journal of
Business Forecasting Methods & Systems, v. 17, n. 4, p. 19-23, Winter 1998/1999.
83
KRAJEWSKI, L. J. & RITZMAN, L. P. (1999). Operations management, strategy and
analysis, 5ª Ed., Addison-Wesley, Reading, MA.
MAGEE, J. F. Production planning and inventory control, New York: McGraw-Hill, 1958.
MAKRIDAKIS, S., ANDERSEN, A., CARBONE, R., et al. The accuracy of extrapolation
(time-series) methods – results of a forecasting competition. Journal of Forecasting, v. 1,
n. 2, p. 111-153, mar. 1982.
MAKRIDAKIS, S. & HIBON, M. ARMA models and Box-Jenkins methodology. Journal of
Forecasting, v. 16, n. 3, p. 147 – 163, may 1997.
MAKRIDAKIS, S., WHEELWRIGHT, S. C. & HYNDMAN, R. J. (1998). Forecasting –
Methods and applications, 3ª ed., John Wiley, New York.
MENTZER, J. T. & BIENSTOCK, C. C. (1998). Sales Forecasting Management, Sage,
California.
MENTZER, J. T. & COX Jr., J. E. Familiarity, application, and performance of sales
forecasting techniques. Journal of Forecasting, v. 3, n. 1, p. 27-37, jan. 1997.
MONTGOMERY, D. C., JONHSON, L. A. & GARDINER, J. S. (1990). Forecasting and
time series analysis, 2ª ed., McGraw-Hill, Inc., New York.
MORETTIN, P. A. & TOLOI, C. M. C. (1987). Previsões de séries temporais, 2ª ed., Atual,
São Paulo.
ROSS, S. M. (1993). Introduction to probability models, 5ª ed., Academic Press, San Diego.
SANDERS, N. R. & MANRODT, K. B. Forecasting practices in US corporations: survey
results. Interfaces, v. 24, n. 2, p. 92 – 101, mar. 1994.
SEBER, G. A. F. (1977). Linear Regression Analysis, John Wiley, New York.
SHUMWAY, R. H. (1988). Applied statistical time series analysis, Prentice Hall, New
Jersey.
TOMPKINS, J. A., BOZER, Y. A., FRAZELLE, E., et al. (1996). Facilities planning, 2ª ed.,
John Wiley, New York.
TUBINO, Dálvio F. (2000). Manual de Planejamento e Controle da Produção, 2ª ed., Ed.
Atlas, São Paulo.
WINSTON, W. L. (1994). Operations Research – applications and algorithms, 3ª ed.,
Duxbury Press, Belmont, CA.
WINTERS, P. R. Forecasting sales by exponentially weighted moving averages, Management
Science, 6, 324 – 342, 1960.
84
ZHOU, W. Integration of different forecasting models. The Journal of Business Forecasting
Methods & Systems, v. 18, n. 3, p. 26 – 29, Fall 1999.
85
ANEXO
Este anexo contém as séries completas (conjunto inicialização + conjunto teste)
referente às demandas mensais dos aeroportos que fazem parte do estudo de caso, bem como
as previsões (para o conjunto teste) geradas por intermédio da utilização dos modelos
propostos. Estas demandas representam a métrica passageiros regulares transportados
(embarcados + desembarcados), em unidades.
A-1
TABELA A.1. Demanda doy aeroporto de Araçatuba
Período (t) z
t
Período (t) z
t
Período (t) z
t
Período (t) z
t
Jan/97 4587 Set/98 8753 Mai/00 8341 Jan/02
8356
Fev/97 4856 Out/98 7812 Jun/00 8270 Fev/02
6571
Mar/97 5898 Nov/98 8498 Jul/00 10354 Mar/02
7419
Abr/97 5666 Dez/98 8141 Ago/00 8108 Abr/02
7445
Mai/97 5040 Jan/99 8010 Set/00 7936 Mai/02
8194
Jun/97 5627 Fev/99 6247 Out/00 7956 Jun/02
7706
Jul/97 6702 Mar/99 7480 Nov/00 9251 Jul/02
8462
Ago/97 6453 Abr/99 6724 Dez/00 9447 Ago/02
5433
Set/97 6037 Mai/99 7207 Jan/01
8860
Set/02
3431
Out/97 6736 Jun/99 6438 Fev/01
6472
Out/02
3268
Nov/97 6421 Jul/99 8339 Mar/01
8321
Nov/02
3086
Dez/97 6004 Ago/99 7025 Abr/01
8399
Dez/02
2643
Jan/98 6670 Set/99 6698 Mai/01
8194
Jan/03
2063
Fev/98 5711 Out/99 7222 Jun/01
7996
Fev/03
2748
Mar/98 7088 Nov/99 7523 Jul/01
10980
Mar/03
2593
Abr/98 6382 Dez/99 7430 Ago/01
9289
Abr/03
2989
Mai/98 6382 Jan/00 7681 Set/01
9591
Mai/03
2733
Jun/98 5886 Fev/00 7406 Out/01
9545
Jun/03
2752
Jul/98 7876 Mar/00 7815 Nov/01
7541
Jul/03
3052
Ago/98 7303 Abr/00 7864 Dez/01
9282
Ago/03
2982
TABELA A.2. Previsões para a demanda do aeroporto de Araçatuba
Período z
t
MM 6 MM 12 Trivial SES Holt HWM HWA BJ
Set-02
3431
7443 7962 5433 7054 6910 6791 6563 5513
Out-02
3268
7448 7814 5433 7054 6807 7015 6762 5608
Nov-02
3086
7449 7641 5433 7054 6703 6856 6598 4407
Dez-02
2643
7200 7652 5433 7054 6599 7720 7498 5179
Jan-03
2063
6948 7448 5433 7054 6495 6941 6566 4932
Fev-03
2748
5433 7319 5433 7054 6391 5490 4903 4662
Mar-03
2593
5433 7443 5433 7054 6287 6482 6144 4675
Abr-03
2989
5433 7448 5433 7054 6184 6468 6131 4711
Mai-03
2733
5433 7449 5433 7054 6080 6646 6330 5146
Jun-03
2752
5433 7200 5433 7054 5976 6235 5823 4988
Jul-03
3052
5433 6948 5433 7054 5872 7599 7495 4864
Ago-03
2982
5433 5433 5433 7054 5768 5951 5607 3666
A-2
TABELA A.3. Demanda do aeroporto de Assis
Período (t) z
t
Período (t) z
t
Período (t) z
t
Período (t) z
t
Jan/97 687 Set/98 4564 Mai/00 2457 Jan/02
1012
Fev/97 815 Out/98 4949 Jun/00 2653 Fev/02
1139
Mar/97 931 Nov/98 5472 Jul/00 3466 Mar/02
1222
Abr/97 1057 Dez/98 4764 Ago/00 2822 Abr/02
907
Mai/97 1107 Jan/99 5614 Set/00 2565 Mai/02
727
Jun/97 4686 Fev/99 4286 Out/00 2648 Jun/02
635
Jul/97 1569 Mar/99 4124 Nov/00 2669 Jul/02
690
Ago/97 1457 Abr/99 4466 Dez/00 3146 Ago/02
710
Set/97 1481 Mai/99 4403 Jan/01
2231
Set/02
996
Out/97 1553 Jun/99 5164 Fev/01
2461
Out/02
791
Nov/97 1596 Jul/99 4188 Mar/01
2344
Nov/02
729
Dez/97 1366 Ago/99 4081 Abr/01
2334
Dez/02
722
Jan/98 857 Set/99 3010 Mai/01
2253
Jan/03
552
Fev/98 1585 Out/99 4048 Jun/01
1467
Fev/03
640
Mar/98 2413 Nov/99 4188 Jul/01
2736
Mar/03
635
Abr/98 2040 Dez/99 3109 Ago/01
2192
Abr/03
716
Mai/98 2040 Jan/00 2738 Set/01
2114
Mai/03
636
Jun/98 3507 Fev/00 2457 Out/01
1319
Jun/03
502
Jul/98 5499 Mar/00 2371 Nov/01
1169
Jul/03
730
Ago/98 5376 Abr/00 2776 Dez/01
1220
Ago/03
517
TABELA A.4. Previsões para a demanda do aeroporto de Assis
Período z
t
MM 6 MM 12 Trivial SES Holt HWM HWA BJ
Set-02
996
815 1072 710 705 608 927 605 728
Out-02
791
734 977 710 705 550 769 247 610
Nov-02
729
691 943 710 705 491 890 347 465
Dez-02
722
678 918 710 705 433 1116 339 373
Jan-03
552
700 880 710 705 375 997 -221 358
Fev-03
640
710 861 710 705 317 1130 -411 396
Mar-03
635
710 815 710 705 258 1158 -662 449
Abr-03
716
710 734 710 705 200 979 -954 485
Mai-03
636
710 691 710 705 142 921 -1144 494
Jun-03
502
710 678 710 705 83 879 -1144 482
Jul-03
730
710 700 710 705 25 1229 -402 463
Ago-03
517
710 710 710 705 -33 1416 -322 449
A-3
TABELA A.5. Demanda do aeroporto de Bauru
Período (t) z
t
Período (t) z
t
Período (t) z
t
Período (t) z
t
Jan/97 2514 Set/98 6118 Mai/00 12071 Jan/02
10017
Fev/97 3531 Out/98 6298 Jun/00 11825 Fev/02
8269
Mar/97 4612 Nov/98 6379 Jul/00 12762 Mar/02
11935
Abr/97 4784 Dez/98 5694 Ago/00 11028 Abr/02
12223
Mai/97 5468 Jan/99 5580 Set/00 11700 Mai/02
11927
Jun/97 4522 Fev/99 5807 Out/00 12307 Jun/02
12379
Jul/97 5117 Mar/99 8542 Nov/00 11372 Jul/02
11831
Ago/97 5696 Abr/99 8180 Dez/00 11896 Ago/02
12267
Set/97 5007 Mai/99 9623 Jan/01
10897
Set/02
10816
Out/97 5675 Jun/99 8374 Fev/01
9804
Out/02
10991
Nov/97 4736 Jul/99 10014 Mar/01
12179
Nov/02
10644
Dez/97 4556 Ago/99 9748 Abr/01
13063
Dez/02
8671
Jan/98 3871 Set/99 8841 Mai/01
13485
Jan/03
6844
Fev/98 3706 Out/99 9028 Jun/01
10566
Fev/03
6625
Mar/98 5331 Nov/99 9426 Jul/01
16274
Mar/03
7204
Abr/98 5259 Dez/99 9528 Ago/01
15920
Abr/03
8479
Mai/98 5259 Jan/00 8277 Set/01
14261
Mai/03
7416
Jun/98 5528 Fev/00 8969 Out/01
14566
Jun/03
6102
Jul/98 5720 Mar/00 10679 Nov/01
13123
Jul/03
6179
Ago/98 6867 Abr/00 10901 Dez/01
10957
Ago/03
6114
TABELA A.6. Previsões para a demanda do aeroporto de Bauru
Período z
t
MM 6 MM 12 Trivial SES Holt HWM HWA BJ
Set-02
10816
12094 11980 12267 12178 12237 12033 11737 11243
Out-02
10991
12125 11772 12267 12178 12276 12655 12357 9845
Nov-02
10644
12101 11493 12267 12178 12314 11816 11679 9239
Dez-02
8671
12159 11312 12267 12178 12352 11094 11394 7492
Jan-03
6844
12049 11356 12267 12178 12391 9454 10013 6190
Fev-03
6625
12267 11547 12267 12178 12429 8743 10240 5049
Mar-03
7204
12267 12094 12267 12178 12467 11791 12190 6122
Abr-03
8479
12267 12125 12267 12178 12506 12084 12274 5640
Mai-03
7416
12267 12101 12267 12178 12544 12653 12816 5015
Jun-03
6102
12267 12159 12267 12178 12582 11829 11991 4579
Jul-03
6179
12267 12049 12267 12178 12621 13395 13058 3741
Ago-03
6114
12267 12267 12267 12178 12659 13535 13152 3397
A-4
TABELA A.7. Demanda do aeroporto de Marília
Período (t) z
t
Período (t) z
t
Período (t) z
t
Período (t) z
t
Jan/97 2562 Set/98 3786 Mai/00 7200 Jan/02
6373
Fev/97 2737 Out/98 3882 Jun/00 3516 Fev/02
5308
Mar/97 3381 Nov/98 3501 Jul/00 7456 Mar/02
7122
Abr/97 4090 Dez/98 3616 Ago/00 7220 Abr/02
8320
Mai/97 3686 Jan/99 4034 Set/00 6782 Mai/02
7500
Jun/97 4078 Fev/99 4155 Out/00 6674 Jun/02
7381
Jul/97 6997 Mar/99 5380 Nov/00 7227 Jul/02
7464
Ago/97 3597 Abr/99 5275 Dez/00 7062 Ago/02
7434
Set/97 4378 Mai/99 5477 Jan/01
6306
Set/02
6646
Out/97 3811 Jun/99 5305 Fev/01
5268
Out/02
6207
Nov/97 3397 Jul/99 5817 Mar/01
6727
Nov/02
6152
Dez/97 2914 Ago/99 6292 Abr/01
7477
Dez/02
5264
Jan/98 2611 Set/99 6234 Mai/01
7282
Jan/03
4253
Fev/98 2374 Out/99 5646 Jun/01
6514
Fev/03
3846
Mar/98 2996 Nov/99 5116 Jul/01
7874
Mar/03
3971
Abr/98 2859 Dez/99 5012 Ago/01
8888
Abr/03
5632
Mai/98 2859 Jan/00 4672 Set/01
7717
Mai/03
4580
Jun/98 3125 Fev/00 5777 Out/01
8216
Jun/03
4105
Jul/98 3268 Mar/00 6138 Nov/01
7634
Jul/03
4170
Ago/98 3710 Abr/00 6463 Dez/01
7430
Ago/03
4287
TABELA A.8. Previsões para a demanda do aeroporto de Marília
Período z
t
MM 6 MM 12 Trivial SES Holt HWM HWA BJ
Set-02
6646
7537 7325 7434 7439 7652 7730 7418 5928
Out-02
6207
7620 7289 7434 7439 7752 7999 7621 5928
Nov-02
6152
7445 7197 7434 7439 7851 7619 7220 5928
Dez-02
5264
7426 7148 7434 7439 7951 7365 6962 5928
Jan-03
4253
7449 7113 7434 7439 8050 6415 6084 5928
Fev-03
3846
7434 7218 7434 7439 8150 5602 5456 5928
Mar-03
3971
7434 7537 7434 7439 8249 7383 7156 5928
Abr-03
5632
7434 7620 7434 7439 8348 8334 7968 5928
Mai-03
4580
7434 7445 7434 7439 8448 7711 7346 5928
Jun-03
4105
7434 7426 7434 7439 8547 6910 6630 5928
Jul-03
4170
7434 7449 7434 7439 8647 7596 7402 5928
Ago-03
4287
7434 7434 7434 7439 8746 7960 7859 5928
A-5
TABELA A.9. Demanda do aeroporto de Presidente Prudente
Período (t) z
t
Período (t) z
t
Período (t) z
t
Período (t) z
t
Jan/97 4936 Set/98 9228 Mai/00 6576 Jan/02
7444
Fev/97 5334 Out/98 9307 Jun/00 6332 Fev/02
5898
Mar/97 6591 Nov/98 7751 Jul/00 7319 Mar/02
5659
Abr/97 6304 Dez/98 7901 Ago/00 7423 Abr/02
5727
Mai/97 6320 Jan/99 7210 Set/00 8245 Mai/02
5932
Jun/97 6206 Fev/99 6498 Out/00 6554 Jun/02
5180
Jul/97 6404 Mar/99 6665 Nov/00 6244 Jul/02
5840
Ago/97 7080 Abr/99 6609 Dez/00 10280 Ago/02
6143
Set/97 7267 Mai/99 6865 Jan/01
6049
Set/02
7214
Out/97 6256 Jun/99 6402 Fev/01
5622
Out/02
5072
Nov/97 6366 Jul/99 7494 Mar/01
6464
Nov/02
5567
Dez/97 4707 Ago/99 6417 Abr/01
7156
Dez/02
4625
Jan/98 4487 Set/99 7342 Mai/01
7458
Jan/03
3534
Fev/98 4116 Out/99 6568 Jun/01
6860
Fev/03
3905
Mar/98 6142 Nov/99 6183 Jul/01
8974
Mar/03
3962
Abr/98 6411 Dez/99 6265 Ago/01
8671
Abr/03
3040
Mai/98 6411 Jan/00 6554 Set/01
8831
Mai/03
2978
Jun/98 6531 Fev/00 5977 Out/01
7956
Jun/03
3057
Jul/98 7288 Mar/00 6976 Nov/01
6945
Jul/03
3320
Ago/98 8153 Abr/00 7089 Dez/01
7407
Ago/03
3200
TABELA A.10. Previsões para a demanda do aeroporto de Presidente Prudente
Período z
t
MM 6 MM 12 Trivial SES Holt HWM HWA BJ
Set-02
7214
5747 6580 6143 5964 5920 6723 6777 5964
Out-02
5072
5764 6376 6143 5964 5879 6011 5850 5964
Nov-02
5567
5774 6218 6143 5964 5838 5593 5309 5964
Dez-02
4625
5721 6137 6143 5964 5797 6249 6196 5964
Jan-03
3534
5992 5978 6143 5964 5755 5159 4828 5964
Fev-03
3905
6143 5768 6143 5964 5714 4407 3913 5964
Mar-03
3962
6143 5747 6143 5964 5673 4948 4678 5964
Abr-03
3040
6143 5764 6143 5964 5632 5508 5253 5964
Mai-03
2978
6143 5774 6143 5964 5591 5899 5575 5964
Jun-03
3057
6143 5721 6143 5964 5550 5596 5234 5964
Jul-03
3320
6143 5992 6143 5964 5509 6825 6463 5964
Ago-03
3200
6143 6143 6143 5964 5468 7053 6585 5964
A-6
TABELA A.11. Demanda do aeroporto de Ribeirão Preto
Período (t) z
t
Período (t) z
t
Período (t) z
t
Período (t) z
t
Jan/97 34328 Set/98 40451 Mai/00 52173 Jan/02
52055
Fev/97 28050 Out/98 42475 Jun/00 46459 Fev/02
42257
Mar/97 33124 Nov/98 42250 Jul/00 54752 Mar/02
47520
Abr/97 30223 Dez/98 43249 Ago/00 48486 Abr/02
47974
Mai/97 27818 Jan/99 42643 Set/00 47308 Mai/02
48152
Jun/97 33833 Fev/99 32654 Out/00 54050 Jun/02
45364
Jul/97 31811 Mar/99 39161 Nov/00 49634 Jul/02
49070
Ago/97 33369 Abr/99 36894 Dez/00 55128 Ago/02
47690
Set/97 32782 Mai/99 35427 Jan/01
51672
Set/02
41142
Out/97 36797 Jun/99 31687 Fev/01
44147
Out/02
36630
Nov/97 36359 Jul/99 44093 Mar/01
49100
Nov/02
36303
Dez/97 34742 Ago/99 41462 Abr/01
51151
Dez/02
31493
Jan/98 35880 Set/99 41136 Mai/01
53360
Jan/03
29329
Fev/98 29231 Out/99 47969 Jun/01
49400
Fev/03
26497
Mar/98 30868 Nov/99 45639 Jul/01
67608
Mar/03
26974
Abr/98 28401 Dez/99 45562 Ago/01
58925
Abr/03
20438
Mai/98 28401 Jan/00 49712 Set/01
52979
Mai/03
29074
Jun/98 27205 Fev/00 42657 Out/01
56065
Jun/03
24878
Jul/98 38793 Mar/00 47247 Nov/01
50125
Jul/03
26822
Ago/98 43299 Abr/00 47893 Dez/01
53795
Ago/03
28068
TABELA A.12. Previsões para a demanda do aeroporto de Ribeirão Preto
Período z
t
MM 6 MM 12 Trivial SES Holt HWM HWA BJ
Set-02
41142
47628 49421 47690 47775 47481 46211 45021 42937
Out-02
36630
47650 49097 47690 47775 47318 52342 51139 44188
Nov-02
36303
47569 48400 47690 47775 47156 49955 48127 39439
Dez-02
31493
47375 48209 47690 47775 46993 53791 52116 41078
Jan-03
29329
48380 47510 47690 47775 46830 52289 50617 39121
Fev-03
26497
47690 46861 47690 47775 46667 42992 42379 31808
Mar-03
26974
47690 47628 47690 47775 46504 48136 47947 34505
Abr-03
20438
47690 47650 47690 47775 46341 47818 48227 34007
Mai-03
29074
47690 47569 47690 47775 46178 47044 48329 33324
Jun-03
24878
47690 47375 47690 47775 46015 43498 44652 30671
Jul-03
26822
47690 48380 47690 47775 45852 52624 53808 32333
Ago-03
28068
47690 47690 47690 47775 45689 50803 50796 30615
A-7
TABELA A.13. Demanda do aeroporto de São José do Rio Preto
Período (t) z
t
Período (t) z
t
Período (t) z
t
Período (t) z
t
Jan/97 12288 Set/98 15469 Mai/00 25341 Jan/02
19925
Fev/97 10646 Out/98 16743 Jun/00 23896 Fev/02
25582
Mar/97 13891 Nov/98 14827 Jul/00 29715 Mar/02
29391
Abr/97 13517 Dez/98 16211 Ago/00 26148 Abr/02
27652
Mai/97 13689 Jan/99 17118 Set/00 23940 Mai/02
29355
Jun/97 13810 Fev/99 14207 Out/00 27400 Jun/02
28036
Jul/97 15294 Mar/99 17136 Nov/00 24789 Jul/02
33054
Ago/97 15427 Abr/99 15957 Dez/00 29544 Ago/02
26874
Set/97 13640 Mai/99 17268 Jan/01
28721
Set/02
23468
Out/97 14664 Jun/99 17079 Fev/01
23905
Out/02
23949
Nov/97 14081 Jul/99 20566 Mar/01
29565
Nov/02
20453
Dez/97 12878 Ago/99 19010 Abr/01
27980
Dez/02
21062
Jan/98 12685 Set/99 18528 Mai/01
27492
Jan/03
18985
Fev/98 10980 Out/99 21282 Jun/01
28061
Fev/03
17543
Mar/98 15310 Nov/99 19854 Jul/01
37797
Mar/03
18494
Abr/98 12122 Dez/99 20899 Ago/01
31309
Abr/03
20325
Mai/98 12122 Jan/00 21405 Set/01
29273
Mai/03
18224
Jun/98 12303 Fev/00 19806 Out/01
30143
Jun/03
18070
Jul/98 15379 Mar/00 23891 Nov/01
26541
Jul/03
21898
Ago/98 15669 Abr/00 24556 Dez/01
29324
Ago/03
20351
TABELA A.14. Previsões para a demanda do aeroporto de São José do Rio Preto
Período z
t
MM 6 MM 12 Trivial SES Holt HWM HWA BJ
Set-02
23468
29060 27929 26874 28796 29090 26684 26454 25106
Out-02
23949
28994 27807 26874 28796 29205 29068 28896 25768
Nov-02
20453
29330 27573 26874 28796 29320 26413 26632 22691
Dez-02
21062
29321 27688 26874 28796 29435 28480 29505 24952
Jan-03
18985
29964 27484 26874 28796 29551 23473 24979 17028
Fev-03
17543
26874 28563 26874 28796 29666 23799 26744 21693
Mar-03
18494
26874 29060 26874 28796 29781 26731 29582 24812
Abr-03
20325
26874 28994 26874 28796 29896 25194 27630 23293
Mai-03
18224
26874 29330 26874 28796 30012 25983 28233 24651
Jun-03
18070
26874 29321 26874 28796 30127 25507 27304 23483
Jul-03
21898
26874 29964 26874 28796 30242 31601 33172 27613
Ago-03
20351
26874 26874 26874 28796 30357 27389 27785 22380
A-8
TABELA A.15. Demanda do aeroporto de Sorocaba
Período (t) z
t
Período (t) z
t
Período (t) z
t
Período (t) z
t
Jan/97 6337 Set/98 7651 Mai/00 6005 Jan/02
4296
Fev/97 6133 Out/98 5554 Jun/00 7726 Fev/02
3929
Mar/97 7650 Nov/98 7407 Jul/00 5865 Mar/02
5557
Abr/97 7051 Dez/98 5734 Ago/00 5287 Abr/02
5981
Mai/97 7313 Jan/99 4790 Set/00 4834 Mai/02
5238
Jun/97 5967 Fev/99 5198 Out/00 4165 Jun/02
7538
Jul/97 10220 Mar/99 6713 Nov/00 4453 Jul/02
4902
Ago/97 8035 Abr/99 6744 Dez/00 3847 Ago/02
4787
Set/97 6302 Mai/99 7325 Jan/01
4213
Set/02
4501
Out/97 8823 Jun/99 8404 Fev/01
4907
Out/02
4230
Nov/97 9963 Jul/99 6251 Mar/01
7118
Nov/02
3433
Dez/97 5939 Ago/99 5643 Abr/01
5722
Dez/02
2822
Jan/98 4823 Set/99 6375 Mai/01
5627
Jan/03
2704
Fev/98 5435 Out/99 4800 Jun/01
8278
Fev/03
4018
Mar/98 6168 Nov/99 4406 Jul/01
5738
Mar/03
3298
Abr/98 4823 Dez/99 4804 Ago/01
6254
Abr/03
3151
Mai/98 4823 Jan/00 4952 Set/01
4896
Mai/03
3836
Jun/98 6599 Fev/00 4533 Out/01
5014
Jun/03
3115
Jul/98 6873 Mar/00 5058 Nov/01
4845
Jul/03
3186
Ago/98 7867 Abr/00 7784 Dez/01
3229
Ago/03
2855
TABELA A.16. Previsões para a demanda do aeroporto de Sorocaba
Período z
t
MM 6 MM 12 Trivial SES Holt HWM HWA BJ
Set-02
4501
5667 5018 4787 5258 5057 4554 3975 4862
Out-02
4230
5689 5029 4787 5258 4984 4360 3802 5098
Nov-02
3433
5616 5030 4787 5258 4910 4315 3689 5104
Dez-02
2822
5742 5051 4787 5258 4837 3187 2392 4548
Jan-03
2704
4845 5279 4787 5258 4763 3903 3287 4938
Fev-03
4018
4787 5419 4787 5258 4690 3807 3145 4810
Mar-03
3298
4787 5667 4787 5258 4617 5306 4851 5394
Abr-03
3151
4787 5689 4787 5258 4543 5435 5015 5546
Mai-03
3836
4787 5616 4787 5258 4470 4860 4339 5280
Jun-03
3115
4787 5742 4787 5258 4396 6894 6620 6105
Jul-03
3186
4787 4845 4787 5258 4323 4643 4033 5160
Ago-03
2855
4787 4787 4787 5258 4249 4629 4010 5119
A-9
FOLHA DE REGISTRO DO DOCUMENTO
1.
CLASSIFICAÇÃO/TIPO
TM
2.
DATA
24 de maio de 2005
3.
DOCUMENTO N°
CTA/ITA-IEI/TM-004/2005
4.
N° DE PÁGINAS
104
5.
TÍTULO E SUBTÍTULO:
Estudo comparativo de métodos de previsão de demanda: uma aplicação ao caso dos aeroportos co
m
tráfego aéreo regular administrados pelo DAESP.
6.
AUTOR(ES):
Fernando Neves Breseghello
7. INSTITUIÇÃO(ÕES)/ÓRGÃO(S) INTERNO(S)/DIVISÃO(ÕES):
Instituto Tecnológico de Aeronáutica. Divisão de Engenharia de Infra-Estrutura Aeronáutica – ITA/IEI
8.
PALAVRAS-CHAVE SUGERIDAS PELO AUTOR:
Séries temporais; Previsão de demanda; Transporte aéreo regional
9.PALAVRAS-CHAVE RESULTANTES DE INDEXAÇÃO:
Análise de séries temporais; Previsão econômica; Transporte aéreo; Demanda (Economia); Estudo de
casos; Análise estatística; Modelos matemáticos; Matemática; Engenharia aeronáutica
10.
APRESENTAÇÃO: X Nacional Internacional
ITA, São José dos Campos, 2005, 104 páginas
11.
RESUMO:
O presente trabalho tem como objetivo principal comparar o desempenho de metodologias
preditivas,
b
aseadas na abordagem de séries temporais, diferentes das atualmente utilizadas para
p
rognosticar a demanda, para um horizonte de 12 meses, dos aeroportos administrados pelo
Departamento Aeroviário do Estado de São Paulo (DAESP) operando com tráfego aéreo regular.
A determinação de previsões adequadas e, ao mesmo tempo, realistas, o que, em outras palavras,
significa utilizar o método preditivo com maior grau de precisão (ou menor margem de erro), constitui-se
em uma etapa fundamental para que o processo de planejamento da administração aeroportuária possa ser
adequadamente realizado.
Para alcançar o objetivo proposto, buscou-se, em primeiro lugar, estudar os principais aspectos
teóricos relacionados aos métodos de previsão de demanda abordados neste trabalho. Posteriormente,
segue-se o processo de calibração dos modelos propostos, aplicados às séries históricas disponibilizadas
p
ela referida instituição. Os modelos de séries temporais experimentados nesta dissertação são: Trivial,
Média Móvel de seis e 12 meses, Suavização Exponencial Simples, Holt, Holt-Winters Aditivo, Holt-
Winters Multiplicativo e os possíveis modelos Box-Jenkins selecionados a partir do processo de
identificação. Por fim emprega-se uma estratégia de avaliação e seleção de modelos preditivos, de
natureza quantitativa, para subsidiar as conclusões apresentadas no final deste trabalho.
Os resultados obtidos, mediante a utilização desta estratégia, demonstraram que as metodologias
propostas são mais adequadas (superiores em acurácia) para a projeção de valores para um horizonte de
12 meses do que a metodologia atualmente utilizada pela instituição estudada. Neste contexto, os
modelos Box-Jenkins se mostraram como os mais acurados em 61% dos casos (cinco aeroportos). Os
modelos Aditivo de Holt-Winters, S.E.S. e Holt apresentaram-se como os modelos com menor marge
m
de erro em 13% (um aeroportos), 13% (um aeroportos) e 13% (um aeroporto) dos casos,
respectivamente.
12.
GRAU DE SIGILO:
(X ) OSTENSIVO ( ) RESERVADO ( ) CONFIDENCIAL ( ) SECRETO
Livros Grátis
( http://www.livrosgratis.com.br )
Milhares de Livros para Download:
Baixar livros de Administração
Baixar livros de Agronomia
Baixar livros de Arquitetura
Baixar livros de Artes
Baixar livros de Astronomia
Baixar livros de Biologia Geral
Baixar livros de Ciência da Computação
Baixar livros de Ciência da Informação
Baixar livros de Ciência Política
Baixar livros de Ciências da Saúde
Baixar livros de Comunicação
Baixar livros do Conselho Nacional de Educação - CNE
Baixar livros de Defesa civil
Baixar livros de Direito
Baixar livros de Direitos humanos
Baixar livros de Economia
Baixar livros de Economia Doméstica
Baixar livros de Educação
Baixar livros de Educação - Trânsito
Baixar livros de Educação Física
Baixar livros de Engenharia Aeroespacial
Baixar livros de Farmácia
Baixar livros de Filosofia
Baixar livros de Física
Baixar livros de Geociências
Baixar livros de Geografia
Baixar livros de História
Baixar livros de Línguas
Baixar livros de Literatura
Baixar livros de Literatura de Cordel
Baixar livros de Literatura Infantil
Baixar livros de Matemática
Baixar livros de Medicina
Baixar livros de Medicina Veterinária
Baixar livros de Meio Ambiente
Baixar livros de Meteorologia
Baixar Monografias e TCC
Baixar livros Multidisciplinar
Baixar livros de Música
Baixar livros de Psicologia
Baixar livros de Química
Baixar livros de Saúde Coletiva
Baixar livros de Serviço Social
Baixar livros de Sociologia
Baixar livros de Teologia
Baixar livros de Trabalho
Baixar livros de Turismo