Download PDF
ads:
ALBINO MILESKI JUNIOR
ANÁLISE DE MÉTODOS DE PREVISÃO DE
DEMANDA BASEADOS EM SÉRIES
TEMPORAIS EM UMA EMPRESA DO SETOR
DE PERFUMES E COSMÉTICOS
CURITIBA
2007
Dissertação apresentada ao Programa de Pós-
Graduação em Engenharia de Produção e Sistemas
da Pontifícia Universidade Católica do Paraná como
requisito parcial para obtenção do título de Mestre
em Engenharia de Produção e Sistemas.
ads:
Livros Grátis
http://www.livrosgratis.com.br
Milhares de livros grátis para download.
ALBINO MILESKI JUNIOR
ANÁLISE DE MÉTODOS DE PREVISÃO DE
DEMANDA BASEADOS EM SÉRIES
TEMPORAIS EM UMA EMPRESA DO SETOR
DE PERFUMES E COSMÉTICOS
CURITIBA
2007
Dissertação apresentada ao Programa de Pós-
Graduação em Engenharia de Produção e Sistemas
da Universidade Católica do Paraná como requisito
parcial para obtenção do título de Mestre em
Engenharia de Produção e Sistemas.
Área de Concentração: Gerência de Produção e
Logística
Orientador: Prof. Dr.Guilherme Ernani Vieira
ads:
Mileski Junior, Albino
M637a Análise de métodos de previsão de demanda baseados em séries temporais
2007 em uma empresa do setor de perfumes e cosméticos / Albino Mileski Junior;
[orientador], Guilherme Ernani Vieira. -- 2007.
100 f.: il.; 30 cm
Dissertação (mestrado) – Pontifícia Universidade Católica do Paraná,
Curitiba, 2007
Bibliografia: f. 87-96
1. Administração de materiais. 2. Controle de estoque. 3. Análise de séries
temporais. 4. Variações sazonais (Economia). 5. Administração de empresas.
6. Perfumes – Indústria. 7. Cosméticos – Indústria. I.
Vieira, Guilherme Ernani.
II. Pontifícia Universidade Católica do Paraná. Programa de Pós-Graduação
em Engenharia de Produção e Sistemas. III. Título.
CDD 20. ed. – 658.7
TERMO DE APROVAÇÃO
ALBINO MILESKI JUNIOR
ANÁLISE DE MÉTODOS DE PREVISÃO DE
DEMANDA BASEADOS EM SÉRIES
TEMPORAIS EM UMA EMPRESA DO SETOR
DE PERFUMES E COSMÉTICOS
Dissertação aprovada como requisito parcial para obtenção do grau de Mestre no Curso de
Mestrado em Engenharia de Produção e Sistemas, Programa de Pós-Graduação em
Engenharia de Produção e Sistemas, do Centro de Ciências Exatas e de Tecnologia da
Pontifícia Universidade Católica do Paraná, pela seguinte banca examinadora:
Prof. Dr. Guilherme Ernani Vieira (PUCPR)
Orientador
Prof. Dr. Fábio Favaretto (PUCPR)
Membro Interno
Prof. Dr. Roberto Max Protil (PUCPR)
Membro Externo
Prof. Dr. Joel Maurício Corrêa da Rosa (UFPR)
Membro Externo
Curitiba, 26 de Setembro de 2007.
A minha esposa Rosane.
Aos nossos filhos Lucas, Rebeca, Raquel e Filipe.
Pelo amor e compreensão durante a realização deste empreendimento.
i
Agradecimentos
Ao Prof. Dr. Guilherme Ernani Vieira, pela orientação, apoio, paciência e
ensinamentos úteis no desenvolvimento deste trabalho.
A PUC-PR e a CAPES, pelo auxílio financeiro através da bolsa de estudos, sem o qual
este projeto não poderia ser desenvolvido.
Aos professores, funcionários e colegas do PPGEPS, pela amizade, apoio,
companheirismo e orientações durante o desenvolvimento da pesquisa.
Aos professores Dr. Joel Maurício Corrêa da Rosa, Dr. Darli Rodrigues Vieira, Dr.
Leandro dos Santos Coelho, pelos conselhos, idéias e ajuda.
Aos amigos Miguel Letenski e Donald Neumann que apoiaram este projeto, tornando
possível a sua realização.
A meus pais, que me ensinaram os princípios de trabalho e perseverança, que foram
fundamentais para concluir este projeto.
E finalmente, a minha esposa e filhos, que me apoiaram incondicionalmente,
demonstrando paciência e confiança na minha busca pela conclusão deste projeto.
ii
Sumário
Agradecimentos
i
Sumário
ii
Lista de Figuras
iv
Lista de Tabelas
vi
Lista de Símbolos
viii
Lista de Abreviaturas
x
Resumo
xi
Abstract
xii
Capítulo 1
Introdução
1
1.1. Definição do Problema da Pesquisa 3
1.2. Objetivos da Pesquisa
3
1.3. Estrutura do Trabalho
4
Capítulo 2
Procedimentos Metodológicos
5
2.1. Metodologia de Pesquisa Adotada 5
2.2. Delineamento do Estudo 6
2.3. Metodologia Adotada 11
2.3.1. Análise Exploratória dos Dados 12
2.3.2. Métodos de Previsão Considerados 14
2.3.3. Critério de Validação 18
iii
Capítulo 3
Referencial Teórico
21
3.1. Previsão 21
3.2. Séries Temporais 24
3.3. Métodos de Previsão 27
3.3.1. Método de Suavização Exponencial 34
3.3.2. Modelos de Box-Jenkins 38
3.3.3. Redes Neurais 41
3.4. Medidas de Performance Preditiva 50
3.4.1. Soma do Quadrado dos Erros 51
3.4.2. Erro Quadrático Médio 51
3.4.3. Desvio Absoluto Médio 51
3.4.4. Erro Absoluto Médio Percentual 52
3.4.5. Erro Médio Percentual 53
3.4.6. Viés 53
3.4.7. Razão de Viés 53
Capítulo 4
Implementação e Análise dos Modelos
55
4.1. Análise Descritiva dos Dados 55
4.1.1. Análise Descritiva Geral 55
4.1.2. Análise Descritiva Particular 59
4.2. Parametrização e Validação dos Modelos Implementados 64
4.3. Análise Comparativa dos Desempenhos dos Modelos 70
Capítulo 5
Comentários Finais
83
Referências Bibliográficas 87
ANEXO A 97
iv
Lista de Figuras
Figura 2.1 Representação de um sistema de previsão da demanda [FOG03] 7
Figura 2.2 Modelo da tabela dinâmica para separação das categorias 10
Figura 2.3 Esquema do trabalho 11
Figura 2.4 Cenário de previsão da demanda [BAR03] 19
Figura 3.1 Sistema dinâmico [MOR04] 26
Figura 3.2 Métodos quantitativos [SIL02] 28
Figura 3.3 Métodos qualitativos [SIL02] 29
Figura 3.4 Métodos para previsão da demanda [SIL03] e [SIL02] 31
Figura 3.5 Processo previsor de Box-Jenkins [BOX94] 38
Figura 3.6 Modelo de um neurônio artificial [HAY01a] 42
Figura 3.7 Rede feedforward [EST03] 43
Figura 3.8 Representação gráfica de uma RNA [FER95] 47
Figura 3.9 Ajuste de mínimos quadrados não-lineares [FER95] 48
Figura 4.1 Histórico de demanda da categoria de produtos 1 56
Figura 4.2 Histórico de demanda da categoria de produtos 2 57
Figura 4.3 Histórico de demanda do produto P13 da Categoria 1 60
Figura 4.4 Histórico de demanda do produto P8 da Categoria 2 61
Figura 4.5 Decomposição da série temporal do produto P13 da Categoria 1 61
Figura 4.6 Decomposição da série temporal do produto P8 da Categoria 2 62
Figura 4.7 Autocorrelação da série temporal do produto P13 da Categoria 1 63
Figura 4.8 Autocorrelação da série temporal do produto P8 da Categoria 2 63
Figura 4.9
Gráfico dos resíduos do produto P13 da Categoria 1
65
Figura 4.10
Gráfico dos resíduos do produto P8 da Categoria 2
66
Figura 4.11
Autocorrelação dos resíduos do produto P13 da Categoria 1
67
Figura 4.12
Autocorrelação dos resíduos do produto P8 da Categoria 2
67
v
Figura 4.13
Interseção dos intervalos de confiança para os produtos da Categoria 1
77
Figura 4.14
Interseção dos intervalos de confiança para os produtos da Categoria 2
78
Figura 4.15
Box plot da Categoria 1
80
Figura 4.16
Box plot da Categoria 2
81
vi
Lista de Tabelas
Tabela 3.1 Descrição dos métodos quantitativos [SIL02] 30
Tabela 3.2 Esquema de classificação [PEG69] 35
Tabela 3.3 Dicionário de redes neurais-econometria [FER95] 43
Tabela 4.1 Histórico de demanda por categorias
56
Tabela 4.2 Estatísticas descritivas para a Categoria 1 57
Tabela 4.3 Estatísticas descritivas para a Categoria 2 58
Tabela 4.4
Histórico de demanda dos produtos da Categoria 1 58
Tabela 4.5
Histórico de demanda dos produtos da Categoria 2 59
Tabela 4.6 Estatísticas descritivas para o produto P13 da Categoria 1
59
Tabela 4.7 Estatísticas descritivas para o produto P8 da Categoria 2
60
Tabela 4.8 Parâmetros Holt-Winters para os produtos P13 e P8
64
Tabela 4.9 Parâmetros Box-Jenkins para os produtos P13 e P8
68
Tabela 4.10 Parâmetros Redes Neurais Artificiais para os produtos P13 e P8
69
Tabela 4.11 Previsões pelo Método Atual e Holt-Winters para a Categoria 1
70
Tabela 4.12 Previsões por Box-Jenkins e Rede Neural Artificial para a Categoria 1
71
Tabela 4.13 Previsões pelo Método Atual e Holt-Winters para a Categoria 2
71
Tabela 4.14 Previsões por Box-Jenkins e Rede Neural Artificial para a Categoria 2
72
Tabela 4.15 EAMP entre os métodos de previsão para a Categoria 1
73
Tabela 4.16 EAMP entre os métodos de previsão para a Categoria 2
73
Tabela 4.17 Análise comparativa entre os métodos de previsão
74
Tabela 4.18 Análise comparativa entre os métodos de previsão
75
Tabela 4.19 Análise comparativa dos métodos de previsão por produto
76
Tabela 4.20 Análise comparativa dos métodos de previsão por produto
76
Tabela 4.21 Análise de variância (ANOVA)
79
Tabela 4.22 Análise de variância por categoria
80
vii
Tabela 4.23 Comparação múltipla entre médias por categoria
82
viii
Lista de Símbolos
E
(t)
Erro entre o valor real e o valor previsto
ε
t
Termo aleatório
Ŷ
(t)
Valor previsto por um modelo
∆w Variação do peso sináptico a cada iteração durante o treinamento
n Número de períodos observados de determinados fenômeno
R
2
Coeficiente de determinação
Z(t) Representação de uma série temporal com t elementos
θp Bias (viés) de um neurônio p
v(t) Função de transferência
T
t
Tendência
S
t
Sazonalidade
b
k
Coeficiente de regressão parcial
S
k
Desvio padrão
α
,
β
,
γ
Constantes de suavização
ψ
K
Filtro linear
ϕ
(B)
Operador auto-regressivo não sazonal
θ
(B)
Operador de médias móveis não sazonal
r
k
Autocorrelação
σ
d
Desvio padrão da demanda
t
a
Ruído branco
K
Ψ
Função de transferência ou filtro linear definido como
)()( BB
pq
ϕθ
B
Operador de retardo que representa um atraso de um período de tempo
)(B
ϕ
Operador auto-regressivo não sazonal
dd
B)1( =
Operador de diferença não sazonal de ordem d
ix
)(
S
BΦ
Operador auto-regressivo sazonal
DSD
S
B )1( =
Operador de diferença sazonal de ordem D
)(B
Operador de médias móveis não sazonal
)(
S
BΘ
Operador de médias móveis sazonal
x
Lista de Abreviaturas
ACF Função de Autocorrelação
AIC Akaike Information Criterion
AR Autoregressive
ARCH Autoregressive Conditional Heteroscedasticity
ARMA Autoregressive Moving Average
ARIMA Autoregressive Integrated Moving Average
DAM Desvio padrão absoluto médio
EAMP Erro absoluto médio percentual
EQM Erro quadrático médio
GARCH Generalized Autoregressive Conditional Heteroscedasticity
MA Moving Average
PACF Função de Autocorrelação Parcial
RN(s) Rede Neural/Redes Neurais
RNA(s) Rede Neural Artificial/Redes Neurais Artificiais
SARIMA Seasonal Autoregressive Integrated Moving Average
SQE Soma do quadrado dos erros
TS Tracking Signal
xi
Resumo
A previsão da demanda é um dos principais fatores que contribui para a eficiência na cadeia
produtiva das empresas que operam com ênfase no conceito de produção para estoque e é
fundamental para o planejamento da produção, e por extensão, para o início do processo de
suprimento. Neste contexto, quanto maior a acuracidade da previsão da demanda melhor será
o desempenho da empresa. Em sentido contrário, o nível das variações pode levar ao não
atendimento da demanda, atraso neste atendimento e/ou excesso de estoques. Certamente,
estas condições aumentam os custos do produto e afetam a lucratividade do negócio. O
objetivo desta pesquisa é identificar o melhor método de previsão para produtos de uma
empresa do setor de perfumes e cosméticos. Esta pesquisa analisou métodos de previsão,
baseados em séries temporais para produtos com comportamento sazonal. Três métodos
foram considerados: suavização exponencial, Box-Jenkins (SARIMA) e as redes neurais
artificiais. Estes métodos foram implementados no pacote estatístico R e em Excel, e um
estudo comparativo foi feito a partir das previsões realizadas (pelo método atual), a demanda
real verificada e as previsões feitas com os métodos considerados. A eficiência de cada
método analisado foi definida pelo erro absoluto médio percentual (EAMP) e o sinal de
rastreabilidade (TS). Os principais resultados obtidos indicam que o método atualmente
utilizado pela empresa é adequado. Entretanto, os outros métodos de previsão analisados
seriam igualmente aplicáveis. Alguns deles apresentaram melhores resultados (previsões mais
exatas, erros menores), como é o caso dos métodos de previsão de rede neural artificial (o
melhor entre os três métodos analisados).
Palavras-Chave: Cadeia de Suprimento, Previsão de Demanda, Séries Temporais,
Sazonalidade.
xii
Abstract
The demand forecast is one of the main factors that contribute for the efficiency in the
productive chain of companies who operate with emphasis in the concept of “make to stock
and is essential for the production planning, and consequently, for the beginning of the supply
process. In this context, the more accurate the demand forecast is the better the performance
of the company will be. In opposite direction, forecasting inaccuracies can lead to inventory
shortages, backlogs and/or over stocks. Certainly, these conditions increase production costs
and jeopardize business profitability. The objective of this research is to identify the best
forecasting method for products of a company in the perfumes and cosmetics sector. This
research evaluates forecast methods based on time series for products with seasonal behavior.
Three methods were considered: exponential smoothing, Box-Jenkins (SARIMA) and the
artificial neural networks. These methods have been implemented in the statistical package R
and Excel, and a comparative study was made from the realized forecasts (under the current
method), the real demand occurred and the forecasts made with the considered methods. The
efficiency of each analyzed method was defined by the mean absolute percentual error
(EAMP) and the tracking signal (TS). The main results obtained indicated that the method
currently used by the company is adequate. However, the other forecasting methods analyzed
would also be applicable. Some of them would even present better results (more accurate
forecasts, less errors) as is the case for artificial neural networks forecasting methods (the best
among the three methods analyzed).
Key words: Supply Chain, Forecasting, Time Series, Seasonality.
1
Capítulo 1
Introdução
A competição entre as empresas cresceu significativamente nas últimas duas décadas
como conseqüência do processo de globalização. Neste contexto, muitas empresas, em várias
partes do mundo, inclusive aquelas localizadas em países em processo de industrialização,
têm enfrentado mercados altamente desafiadores, com novos e crescentes critérios para
concorrer e garantir a própria sobrevivência.
Este ambiente dinâmico e de mudanças rápidas exige das empresas a obtenção de
melhor desempenho em relação a indicadores de qualidade, rapidez, confiabilidade,
flexibilidade e custo. Desta forma, a cadeia de suprimento recebeu maior atenção das
empresas como uma alternativa estratégica para enfrentar as mudanças e desafios de suas
operações neste novo cenário.
A eficiência do gerenciamento da cadeia de suprimento, que visa à satisfação dos
clientes, é uma das formas que contribui fortemente para o sucesso das empresas. É
influenciada por diversos fatores como: gerenciamento dos níveis de estoque, planejamento
da capacidade produtiva, custos de produção, concepção de métodos eficientes de
programação, estratégias de distribuição do produto e demanda do consumidor.
A previsão da demanda é, portanto, um dos principais fatores que contribui para a
eficiência na cadeia produtiva das empresas. Ela é fundamental para o planejamento da
demanda, e por extensão, para o início do processo de suprimento. Neste sentido, quanto
maior a acuracidade da previsão da demanda menor serão os impactos no nível de
atendimento e custos na cadeia de suprimento. O não atendimento destas condições aumenta
os custos do produto e afeta a lucratividade do negócio.
Em cadeias de suprimento que possuem uma grande quantidade de produtos, com
2
ciclos de vida curtos, produção para estoques, com grandes lead times de entrega, lotes
padrões de compra e de produção elevados, demanda sazonal de produtos e insumos
importados, exige-se uma organização responsiva da cadeia. Esta responsividade da cadeia de
suprimento, segundo [CHO03], é a habilidade da cadeia de suprimento de responder a amplos
escopos de quantidades exigidas, atender com lead times curtos, manejar uma grande
variedade de produtos, produzir produtos altamente inovadores e atender a um nível de
serviço muito alto.
O negócio que possui uma cadeia de suprimento com estas características, ou seja,
com todas essas variáveis, necessita de um elevado nível de precisão na previsão da demanda
para se evitar o desbalanceamento dos estoques ao longo da cadeia e, conseqüentemente, dos
gastos desnecessários. Este é o caso da área de perfumaria e cosméticos, onde a previsão da
demanda é um desafio. Os dados históricos disponíveis para a previsão da demanda nesta
área, na maioria das vezes, apresentam sazonalidade e comportamento variante no tempo, isto
é, a presença de fatores relacionados à ruptura de modelo de previsão.
Neste contexto, um dos problemas principais abordados por métodos numéricos é a
previsão baseada em dados históricos. Uma vez que as pesquisas sobre séries temporais
1
visam providenciar uma previsão quando o modelo matemático de um fenômeno é complexo,
desconhecido ou incompleto. A utilização, então, de modelos estocásticos de previsão de
séries temporais para produtos com demanda sazonal, na área de perfumaria e cosméticos,
pode ser uma alternativa viável para o gerenciamento eficiente da produção e distribuição de
cada produto no mercado.
Neste sentido, esta pesquisa, portanto, analisa os seguintes métodos de previsão, para
séries temporais, de produtos com comportamento sazonal: o método de suavização
exponencial, o método de Box-Jenkins e as redes neurais artificiais. Os métodos de
suavização exponencial e de Box-Jenkins estão dentro dos métodos tradicionais de estatística,
sendo amplamente difundidos, inclusive em áreas de economia e administração, facilitando
assim, uma possível implantação dos mesmos por parte da empresa [BAR03]. As redes
neurais artificiais estão dentro da área de inteligência artificial, a qual disponibilizou outras
ferramentas de previsão além dos métodos tradicionais de estatística.
Estes métodos foram implementados, com o uso do software R (pacote estatístico)
1
Uma série temporal consiste de medidas ou observações previamente obtidas de um fenômeno que são
realizadas seqüencialmente sob um intervalo de tempo. Se estas observações consecutivas são dependentes uma
da outra, então é possível conseguir-se uma previsão do comportamento dinâmico do sistema analisado.
3
para gerar, analisar e selecionar modelos de previsão baseados em dados históricos de uma
empresa de perfumaria e cosméticos, para duas categorias de produtos que têm impacto
significativo nos seus custos e investimentos. Um estudo comparativo foi realizado com a
previsão realizada pelo método atual e a demanda real para verificação da sua eficiência e a
identificação do método de previsão mais adequado aos dados fornecidos.
1.1 Definição do Problema da Pesquisa
A previsão da demanda futura, segundo [CHO03], é a base para todas as decisões
estratégicas e de planejamento em uma cadeia de suprimento. Neste processo, os dados
passados são combinados e analisados de uma forma pré-determinada até se obter uma
estimativa de um evento futuro. Desta maneira, a previsão visa reduzir o excesso de estoque,
reduções desnecessárias de preços ou perda de vendas devido à falta de produtos.
Neste sentido, a intenção desta pesquisa é realizar uma análise comparativa e
identificar entre o método de suavização exponencial, o método de Box-Jenkins, as redes
neurais artificiais e o todo utilizado pela empresa, qual deles e com quais parâmetros é o
mais adequado para as categorias de produtos, isto é, qual método gera o menor erro de
previsão da demanda possível para cada produto. A questão a ser respondida, portanto, por
esta pesquisa é: “Qual é o método de previsão e seus parâmetros são mais adequados para
cada produto e categoria de produtos, conseguindo o menor erro possível?”.
Desta forma, a pesquisa visa auxiliar a tomada de decisão e, neste contexto, é possível
realizar o planejamento de produção de produtos com um maior grau de acurácia, o que
proporcionará para a empresa a diminuição de problemas no nível de atendimento e custos na
cadeia de suprimento, principalmente com estoques elevados desnecessários.
1.2 Objetivos da Pesquisa
Esta pesquisa visa identificar o método de previsão
2
mais adequado para duas
categorias de produtos que apresentam comportamento sazonal, em uma empresa de
perfumaria e cosméticos, com o objetivo de minimizar os efeitos que os erros de previsões
têm gerado nesta empresa.
Os objetivos específicos deste trabalho são:
2
Esta pesquisa trata apenas de métodos quantitativos de previsão da demanda.
4
Identificação das categorias de produtos e caracterização de nível, tendência e
sazonalidade dos históricos de demanda dos produtos usando métodos estatísticos;
Identificação do método de previsão utilizado pela empresa e os parâmetros
para análise de cada grupo de produtos;
Análise e seleção de todos de previsão baseados em séries temporais mais
adequados em lidar com os produtos em análise;
Estudo comparativo e verificação da eficiência dos métodos de previsão em
relação ao utilizado pela empresa.
1.3 Estrutura do Trabalho
Este trabalho está dividido em 5 capítulos. No Capítulo 1 é realizada a introdução do
trabalho, discutindo a sua origem, o problema da pesquisa, os objetivos gerais e específicos, e
a metodologia. O Capítulo 2 demonstra a aplicação do ferramental adotado dentro dos
objetivos da pesquisa, detalhando os passos básicos na realização da análise comparativa para
identificar dentre certos métodos de previsão da demanda, qual deles e com quais parâmetros,
é o mais adequado aos dados históricos fornecidos para os produtos (e suas categorias)
considerados. O Capítulo 3 apresenta o referencial teórico, que aborda o atual estado da arte
dos assuntos diretamente relacionados à dissertação, que são: conceitos de previsão com base
em séries temporais e métodos de previsão. O Capítulo 4 apresenta e discute os resultados
obtidos dentro da pesquisa realizada com a utilização das ferramentas selecionadas e a
aplicação dessas ferramentas na identificação do método de previsão mais adequado. No
Capítulo 5 são tratadas as conclusões e recomendações deste trabalho para trabalhos futuros.
5
Capítulo 2
Procedimentos Metodológicos
Este capítulo demonstra a aplicação do ferramental adotado dentro dos objetivos da
pesquisa, detalhando os passos básicos na realização da análise comparativa para identificar
dentre certos métodos de previsão da demanda, qual deles e com quais parâmetros, é o mais
adequado aos dados históricos fornecidos para os produtos (e suas categorias) considerados.
2.1 Metodologia de Pesquisa Adotada
A abordagem metodológica define e classifica a pesquisa dentro de padrões
determinados. Esta classificação varia em detalhes e complexidade. A abordagem
metodológica, os métodos de pesquisa e os instrumentos utilizados para a coleta de dados,
portanto, devem ser escolhidos e organizados de acordo com o propósito de cada investigação
[BER98] e [SIL01]. Neste sentido, no desenvolvimento do presente estudo, descreve-se na
seqüência as possíveis classificações.
De acordo com [GIL02], uma pesquisa pode ser classificada com base em seus
objetivos e procedimentos técnicos utilizados (delineamento). Em relação aos seus objetivos,
por procurar descobrir, com a precisão possível, a freqüência com que um fenômeno ocorre,
sua relação e conexão com outros, sua natureza e características, sem manipulá-los, a pesquisa
pode ser definida como uma pesquisa descritiva [CER02], [GIL02] e [EAS03].
A pesquisa pode ser classificada como uma pesquisa bibliográfica e quantitativa, em
relação aos seus procedimentos técnicos, com propósito de previsão baseado em dados
históricos [NAK96]. Quantitativa por ser baseada na coleta, análise e interpretação
matemática de dados numéricos coletados ao longo do tempo em um sistema existente.
Os métodos de previsão serão avaliados de acordo com critérios de desempenho
6
baseados em medidas de erro, isto é desvios entre valores previstos e observados.
Neste contexto das definições citadas, a pesquisa está estruturada em nove etapas,
como indicado abaixo:
Entendimento do negócio: etapa de contextualização do problema e do cenário
ou negócio da empresa em questão;
Conceituação do problema: etapa de explicação do problema e justificação do
problema no contexto da empresa;
Definição de objetivos da pesquisa;
Organização ou estruturação dos dados relevantes à pesquisa e da forma de
tratamento destes;
Definição dos métodos de previsão a serem analisados;
Definição dos experimentos de análise a serem realizados;
Implementação dos métodos em computador;
Experimentação e análise dos resultados obtidos pelos métodos de previsão
escolhidos;
Conclusões: etapa de apresentação dos resultados finais.
2.2. Delineamento do Estudo
Uma representação simplificada de um sistema de previsão da demanda, segundo
[FOG03], está apresentada na Figura 2.1. O sistema é alimentado por dados históricos,
normalmente provenientes de arquivos de vendas da empresa. A partir dos dados e
assumindo-se que se tem o método “ideal” para os dados históricos que se deseja analisar,
define-se um método de previsão que pode ser quantitativo ou qualitativo que será usado para
a elaboração da previsão propriamente dita.
A intenção de um sistema de previsão da demanda é aumentar a eficiência da previsão,
reduzindo a incerteza desta previsão, para que as decisões que afetam o futuro da organização
sejam tomadas. Segundo [HAN01], as suposições ponderadas sobre o futuro são mais valiosas
aos gerentes da organização do que as suposições não ponderadas. Desta forma, quanto maior
for o grau de precisão associado às previsões, melhor será o desempenho da organização, ou
seja, menores serão os impactos no nível de atendimento e custos na cadeia de suprimento.
Com base neste sistema de previsão da demanda, o passo inicial, segundo [FOG03],
na elaboração de uma previsão da demanda é a definição do problema de decisão que será
7
auxiliado pelo sistema. Este problema definirá o objetivo da previsão, qual o método de
previsão a ser adotado, os elementos envolvidos e o nível de precisão desejado.
Com este passo, pretende-se minimizar as causas de erros comuns de previsão que
muitas vezes fazem com que as técnicas de previsão sejam consideradas incorretas e
inadequadas, e que em muitos casos, na realidade são causados por erros nos dados ou falhas
na análise dos resultados, gerando os erros de previsão [GIL06].
Fonte: Adaptado de [FOG03]
Figura 2.1: Representação de um sistema de previsão da demanda.
Nesta pesquisa, conforme descrito na seção 1.2, a questão de interesse é a previsão da
demanda de um grupo de produtos com comportamento sazonal. O delineamento deste estudo
está baseado em dados históricos de uma empresa de perfumaria e cosméticos, para duas
categorias de produtos que têm impacto significativo nos seus custos e investimentos. A
realização de um estudo comparativo visa identificar o método de previsão mais adequado, e
seus parâmetros, para cada categoria de produtos, conseguindo o menor erro possível.
Como esta previsão baseia-se exclusivamente no comportamento histórico da
demanda, sendo tal enfoque chamado de estatístico ou de séries temporais, o modelo é obtido
diretamente dos dados disponíveis, sem recorrer a uma possível teoria subjacente, sendo,
portanto um método quantitativo.
Dados H
istóricos
Definição do
Método de
Previsão
Avaliação e
Experiência
Gerencial
Previsão Revista
Controle da
Previsão
Critérios de
Desempenho do
Sistema
Elaboração da
Previsão
(inicial)
8
Os dados históricos utilizados compreendem um período de 2004 a 2007, observados
num intervalo mensal, resultando em 39 observações. Estes dados referem-se a número de
produtos, ou seja, a quantidade de produtos vendidos (demanda real) e não a valores
monetários. As duas categorias de produtos serão identificadas como Categoria 01 e Categoria
02, e são compostas por 28 e 16 produtos respectivamente. Estes dados encontram-se no
ANEXO A e compreendem as ries temporais a serem estudadas. Os mesmos foram
coletados do sistema ERP (Enterprise Resource Planning) da empresa em um formato
Microsoft Office Excel Comma Separated Values File, sendo necessário à criação de uma
tabela dinâmica utilizando o Excel 2003 para isolar as duas categorias a serem estudadas. A
disposição dos dados na tabela dinâmica seguiu uma estrutura para facilitar a utilização do
pacote estatístico R
3
.
O R é uma linguagem e ambiente para computação estatística e gráficos. É um projeto
GNU (General Public License da Free Software Foundation) que é similar à linguagem e
ambiente S, que foi desenvolvida nos Laboratórios Bell (antiga AT & T, agora Lucent
Technologies) por Rick Becker, John Chambers e Allan Wilks, e também forma a base dos
sistemas S-Plus. O R pode ser considerado como uma aplicação diferente do S. algumas
diferenças importantes, mas muitos códigos escritos para o S são executados de maneira
inalterada pelo R.
O R fornece uma ampla variedade de estatística (modelagem linear e não-linear, testes
estatísticos clássicos, análise de séries temporais, testes paramétricos e não-paramétricos,
suavização, etc.) e técnicas gráficas, e é altamente extensível. A linguagem S é
freqüentemente o veículo de escolha para a pesquisa na metodologia estatística, e o R oferece
o código aberto como uma rota para a participação nessa atividade.
Um dos pontos fortes do R é a facilidade com que pode ser produzida a edição, com
qualidade, de gráficos, incluindo símbolos e fórmulas matemáticas, quando necessário.
Grandes cuidados foram tomados na elaboração dos padrões durante a escolha do projeto
gráfico, mas o usuário mantém o controle total.
O R está disponível como software livre, nos termos da GNU na forma de código
aberto. Pode ser compilado e “roda” em um grande número de plataformas UNIX e sistemas
semelhantes (incluindo FreeBSD e Linux), Windows e MacOS.
O R é um conjunto integrado de facilidades em software para manipulação de dados,
3
R Development Core Team (2007). R: A language and environment for statistical computing. R Foundation for
Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0, URL http://www.R-project.org.
9
cálculo e visualização gráfica. Inclui:
Um eficaz tratamento de dados e facilidade de armazenagem;
Um conjunto de operadores de cálculos sobre arrays, em especial matrizes;
Uma ampla, coerente e integrada de coleção de ferramentas intermediárias para
análise dos dados;
Facilidades gráficas para análise e visualização de dados, quer na tela ou
impresso;
Uma bem desenvolvida, simples e eficaz linguagem de programação que inclui
condicionantes, loops, funções recursivas definidas pelo usuário e facilidades de entrada e de
saída.
O termo "ambiente" destina-se a caracterizá-la como um sistema coerente e totalmente
planejado, em vez de um incremento de ferramentas muito específicas e inflexíveis, como é
frequentemente o caso com outros softwares de análise de dados. O R, como o S, foi
concebido em torno de uma verdadeira linguagem computacional, e ela permite aos usuários
acrescentar funcionalidades adicionais através da definição de novas funções. Grande parte do
sistema é em si escrita no R por linguagem do S, o que facilita aos usuários identificarem a
escolha algorítmica realizada. Para tarefas computacionais intensivas, o C, o C + + e o Fortran
podem ser conectados e acessados durante a execução. Os usuários avançados podem escrever
códigos C para manipular objetos do R diretamente.
Muitos usuários pensam no R como um sistema estatístico. Contudo, é preferível
pensar nele como em um ambiente dentro do qual muitas técnicas clássicas e modernas de
estatística são implementadas. Algumas destas estão incorporadas na base do ambiente R, mas
muitas são oferecidas como “pacotes”, o que permite ao R ser estendido facilmente. Há cerca
de 25 pacotes oferecidos com o R (chamados pacotes "padrão" e "recomendado") e muitos
outros estão disponíveis através do CRAN
4
e noutros locais abrangendo um vasto leque de
estatísticas modernas.
A decisão de utilização deste software se deu por ser um software livre, de linguagem
simples ou uma linguagem de expressão com uma sintaxe simples, muitas técnicas clássicas e
4
Comprehensive R Archive Network. É o repositório central de pacotes de software do projeto R. É a partir dele
que são feitos os downloads automáticos para a instalação de novos pacotes em seu ambiente R. Conta com
diversos mirrors que "espelham" uma cópia atualizada de seu conteúdo, garantindo disponibilidade ininterrupta.
A página oficial do CRAN é http://cran.r-project.org e o mirror brasileiro, hospedado na Universidade Federal
do Paraná – UFPR, podem ser acessado em http://cran.br.r-project.org.
10
modernas de estatística estão implementadas em seu ambiente e por suas facilidades gráficas.
A Figura 2.2 demonstra o modelo da tabela dinâmica elaborada para a separação das
categorias.
Figura 2.2: Modelo da tabela dinâmica para separação das categorias.
Nesta pesquisa, optou-se pelos métodos tradicionais e de inteligência artificial dentro
dos métodos quantitativos de previsão baseados em séries temporais. Dentro dos métodos
tradicionais, a pesquisa concentrou-se nos métodos de suavização exponencial e de Box-
Jenkins, pois os mesmos são amplamente difundidos, inclusive em áreas de economia e
administração, facilitando assim, uma possível implantação dos mesmos por parte da empresa
[SIL03] e [BAR03]. Estes métodos têm sido aplicados na engenharia de produção e são
referência obrigatória na bibliografia que trabalha com planejamento da produção [HAN01] e
[CHO03].
Dentro da inteligência artificial, optou-se pelo método de previsão baseado em redes
neurais artificiais, pois este método tem apresentado um crescimento em suas aplicações e
mostrado vantagens sobre métodos tradicionais como, por exemplo, regressão linear e
regressão múltipla [TRA04] e [BAU04].
11
2.3 Metodologia Adotada
Com o escopo da pesquisa abordado no delineamento do estudo e baseado nas nove
etapas da estrutura da pesquisa, tratadas na seção 2.1, a metodologia adotada contempla as
fases de:
Organização ou estruturação dos dados e tratamento destes;
Definição dos métodos de previsão a serem analisados;
Definição dos experimentos de análise a serem realizados;
Implementação dos métodos em computador;
Experimentação e análise dos resultados obtidos pelos métodos de previsão
escolhidos.
Para isto foi elaborada a estrutura apresentada na Figura 2.3 e esta seção foi dividida
em três subseções: Análise Exploratória dos Dados, Análise de Séries Temporais e Critério de
Validação.
Figura 2.3: Esquema do trabalho.
DADOS HISTÓRICOS DA DEMANDA
(
SÉRIE TEMPORAL
)
PREVISÕES
ANÁLISE EXPLORATÓRIA DOS DADOS
Estacionariedade:
o Média
o Variância
Estruturas comportamentais
o Tendência
o Sazonalidade
o Periodicidades
Exame dos dados
o Autocorrelação
ANÁLISE DE SÉRIES TEMPORAIS
Testes estatísticos
Critérios de seleção do método
o AIC
o Função erro
o Parametrização
Significância dos parâmetros
estimados
Resíduos ruído branco
o Gráficos dos resíduos
o Testes de normalidade dos
resíduos
o Autocorrelação dos resíduos
12
É importante salientar que na seção 2.3.2 são tratados os critérios relacionados ao
processo de escolha dos parâmetros dos métodos utilizados nesta pesquisa visando minimizar
a medida de erro destes métodos (desempenho em ajuste), enquanto na seção 2.3.3 são
considerados os critérios de validação, ou seja, os critérios para a realização da avaliação
entre cada um dos métodos de previsão estudados. Esta avaliação será feita através da
comparação entre alguns indicadores de erro, ou medidas de erro, dos resultados da previsão
de cada modelo considerando erro como a diferença entre o valor obtido da previsão e o valor
real [TRA04], como descrito na seção 3.4 (desempenho em previsão).
Para o tratamento dos dados, conforme explicado nesta seção, serão utilizados os
programas computacionais Excel 2003 (planilha eletrônica) e o R (pacote estatístico). O
processo de escolha dos parâmetros dos modelos será realizado de forma automática, ou seja,
o pacote estatístico R realiza uma otimização das variáveis de maneira a indicar quais são os
melhores parâmetros para aquele conjunto de dados em análise, conforme programação. Os
resultados serão apresentados, discutidos e considerados no próximo capítulo, bem como, as
previsões realizadas para os melhores modelos obtidos.
2.3.1
Análise Exploratória dos Dados
Os dados coletados possuem muitas informações importantes que precisam ser
examinadas, para isto, conforme sugere [BOX94], deve-se deixar que os dados falem por si.
Este objetivo é alcançado através da análise exploratória dos dados, que permite investigar
relações e estruturas comportamentais do conjunto de observações coletadas, ou seja, das duas
categorias de produtos em análise, possibilitando a pesquisa de um modelo que projete
possíveis valores futuros, previsões, com determinado nível de confiança.
A partir dos dados do ANEXO A serão efetuadas as estatísticas descritivas para a
verificação de médias, medianas, desvio padrão e outras estatísticas das séries. O primeiro
passo no exame da série temporal é a observação se a mesma é estacionária, isto é, não
tendência presente ou se ela já foi removida anteriormente. A verificação da estacionariedade,
nesta pesquisa, se dará através da média e variância (estacionariedade de segunda ordem ou
fraca).
Na seqüência, a análise será realizada para o reconhecimento das estruturas
comportamentais da série. Um primeiro passo, neste momento da análise da série temporal, é
a construção de seu gráfico, que revelará características importantes, como tendência,
13
sazonalidade, variabilidade, observações aberrantes (outliers), etc. [MOR87a]. O outro passo
é a utilização do processo de decomposição em componentes não-observáveis.
No caso das ries temporais um tratamento clássico, a decomposição clássica, de
suas informações, com vistas à geração de parâmetros para subseqüente emprego na previsão
da variável sob estudo. Ameados da cada de 1970, esse método foi um dos principais
instrumentos utilizados pela econometria
5
de séries temporais. Para ser feita a decomposição,
determina-se a série histórica de dados e faz-se a sua decomposição em quatro componentes,
quais sejam: tendência (T), ciclo (C), sazonalidade (S) e termo aleatório (
ε
)
6
.
Conforme [HAN01], [ROC03] e [MOR04], a tendência pode ser entendida como o
movimento persistente dos dados em uma dada direção. O ciclo, por sua vez, indica o
movimento oscilatório em torno da tendência, podendo este ser verificado por períodos
prolongados. A sazonalidade indica o comportamento regular assumido pela série em algum
subperíodo. o termo aleatório leva em consideração movimentos esporádicos e irregulares
presentes na série. A combinação destes componentes pode ser feita mediante a forma aditiva
ou multiplicativa.
A decomposição pelo pacote estatístico R se dá utilizando médias móveis. O modelo
utilizado pelo R considera a componente sazonal, podendo ser aditivo (que é adequado
quando S não depende das outras componentes como T) ou multiplicativo (se as amplitudes
sazonais variam com a tendência), bem como, a decomposição sazonal de séries temporais
por Loess
7
.
Como última análise desta fase, é verificada a função de autocorrelação (fac). O
estudo dos processos estacionários pode ser feito no domínio da freqüência ou no domínio do
tempo. O estudo no domínio da freqüência papel de relevo aos conceitos de periodograma
e de densidade espectral; o domínio no tempo atribui papel predominante às funções
autocovariância e autocorrelação [BEL91].
A autocorrelação é uma medida de dependência entre observações da mesma série
separadas por um determinado intervalo chamado retardo. A função de autocorrelação (fac)
5
Área da economia voltada à descrição de relações econômicas por meio de modelos matemáticos e à estimação
dos parâmetros desses modelos, com uso de dados estatísticos.
6
Segundo [MOR87a], era comum incluir no modelo uma componente cíclica, para representar movimentos com
períodos longos, geralmente maiores que um ano, mas não há evidencia que séries modernas contenham
componentes periódicas além da sazonal.
7
Para maiores informações ver: CLEVELAND, W. S.; GROSSE, E.; SHYU, W. M. Local Regression Models.
In J. M. Chambers and T. Hastie, editors, Statistical Models in S, pages 309–376. Chapman and Hall, New York,
1992.
14
nada mais é do que a representação gráfica do coeficiente de autocorrelação em função dos
diversos retardos que podem ser atribuídos aos dados [BOX94].
A função de autocorrelação (fac) permite que se entenda melhor o comportamento da
dependência estatística entre os dados e, posteriormente, será útil quando da determinação de
qual série temporal utilizar para o ajuste do processo. A função de autocorrelação é definida
por:
(
)
( )
t
jtt
o
j
j
ZVar
ZZCov
+
==
,
γ
γ
ρ
,
(2.1)
que é utilizada para a verificação da condição de estacionariedade. O seu gráfico, chamado de
correlograma, será apresentado. O correlograma, conforme [MOR87a], pode ser utilizado
para se verificar se uma série apresenta periodicidade. Pode-se demonstrar que se Z
t
é da
forma:
(
)
φω
+= tAZ
t
cos
(2.1)
ou seja, tem uma periodicidade com freqüência ω e período 2π/ω,
ωγ
k
A
k
cos
2
2
= ,
(2.3)
ou seja, o correlograma apresentará uma periodicidade de mesma freqüência.
2.3.2
Métodos de Previsão Considerados
Com a realização da análise exploratória dos dados, verificou-se a estrutura
comportamental das séries em estudo. Baseado nesta análise e na busca de atender ao objetivo
desta pesquisa será utilizado a análise de séries temporais, tendo como base os Métodos de
Holt-Winters, Box-Jenkins (SARIMA) e Rede Neural Artificial (RNA) do tipo Feedforward,
detalhados Capítulo 3.
Para o processo de escolha dos parâmetros dos modelos será utilizado o programa
computacional R (pacote estatístico), pois este pacote possibilita implementar a escolha
automática do modelo de previsão mais apropriado, de acordo com critérios pré-definidos.
15
Método de Holt-Winters
O modelo de suavização exponencial de Holt-Winters representa apropriadamente
dados de demanda onde se verifica a ocorrência de tendência linear, além de um componente
de sazonalidade [SOU03] e [EST03]. O modelo utiliza a idéia de suavização da série visando
estimar o nível da série; estimar a taxa de crescimento e/ou decrescimento da série e estimar
os fatores sazonais. Em cada um dos componentes estima-se um parâmetro de suavização
diferente (α, β e γ). Conforme explicado na seção 3.3.1, [MAK98] e [HAN01] sugerem que se
utilizem valores de α, β e γ, que minimizem a medida de erro adotado no estudo.
Uma função-perda que é utilizada frequentemente é o erro quadrático dio. Para a
verificação do método que se ajusta melhor à série, utiliza-se uma comparação entre os erros
encontrados nestes candidatos. Em geral, procura-se minimizar o erro médio quadrático,
escolhendo-se aquele que apresentar menor erro. No caso do método de Holt-Winters os
parâmetros são determinados pelo R através da minimização da soma dos erros quadráticos.
Método de Box-Jenkins
Nas ries que tem suas observações anotadas em intervalos de tempos iguais
(modelos univariados), encontram-se os processos AR (auto-regressivo), MA (médias
móveis), ARMA (auto-regressivo médias móveis), ARIMA (auto-regressivo médias móveis
integrado), SARIMA (auto-regressivo médias móveis integrado sazonal) e outras derivações.
Estes processos são também conhecidos por metodologia de Box-Jenkins devido às pesquisas
e aprimoramentos realizados, e conseqüente popularização dos métodos por estes
pesquisadores [BAR03].
Uma condição para os processos AR, MA e ARMA é que a série temporal discreta a
ser trabalhada seja estacionária de segunda ordem (estacionariedade fraca) [BAR03]. Uma
série estritamente estacionária (estacionariedade forte) é, segundo [KEN76], a que satisfaz os
seguintes requisitos:
i)
(
)
µ
=
t
YE ;
ii)
(
)
2
2
σµ
=
t
YE , sendo
2
σ
= variância de
Y
;
iii)
(
)
(
)
kktt
YYE
γµµ
=
+
, sendo a k-ésima autocovariância com a autocorrelação
correspondente
2
σγρρ
kkk
==
;
ou seja, que a série apresente todos seus momentos constantes. Para uma estacionariedade de
16
segunda ordem deve-se satisfazer os requisitos i e ii onde a média e a variância apresentam-se
constantes [BOX94] e [MAK98].
Entretanto os processos ARIMA e SARIMA aceitam séries temporais discretas não
estacionárias, porém homogêneas e em equilíbrio estatístico, entende-se por isso, séries que
não contenham grandes saltos, “degraus” ou “explosões” nos valores observados. Para séries
com estas características é indicada uma análise de intervenção identificando o efeito da
ocorrência de algum evento especial [BOX94]. Os processos ARIMA e SARIMA são os mais
utilizados já que na prática, em geral, as séries são não-estacionárias.
[MAK98] acrescenta uma preparação dos dados, como o uso de transformações para
estabilização da variância e o uso de diferenças para obtenção de estacionariedade, utilizando
para reconhecimento destes comportamentos o correlograma, que é a representação gráfica da
função de autocorrelação cujos detalhes podem ser vistos em [MOR87b]. Portanto, têm-se as
funções de autocorrelação (fac) e de autocorrelação parcial (facp) como ferramentas auxiliares
para verificação de comportamentos da série e observação dos valores de p, P, d, D, q, Q e s.
A parametrização do modelo será feita de acordo com o critério de Akaike (AIC)
8
o
qual é baseado na teoria da decisão, tradicionalmente utilizado em seleção de modelos,
considerando o pressuposto de estacionariedade. O critério de AIC utilizado para comparação
de modelos leva em conta a variância do erro, o tamanho da amostra T e os valores de p, q, P
e Q.
O AIC é uma medida de qualidade de ajuste. Foi desenvolvido para estimar a
discrepância entre o modelo gerador de dados e um modelo candidato ajustado através de:
(
)
plAIC 22 +=
θ
(2.4)
onde, l é o ln da função de verossimilhança do modelo em questão,
θ
é o vetor de parâmetros
e p é a quantidade de parâmetros independentes do modelo. Este critério penaliza o modelo
pela quantidade de parâmetros. Segundo [MAK98], por questões computacionais, utiliza-se a
aproximação deste critério definido por:
(
)
(
)
mnnAIC 2log2log1
2
+++
σπ
(2.5)
8
AIC – Akaike Information Criteria.
17
onde, m é o número de parâmetros do modelo (m=p+q+P+Q), n é o número de observações
da série e
σ
2
é a variância dos resíduos.
O AIC pode ser empregado para comparar modelos com os mesmos efeitos fixos, mas
diferentes estruturas de variância, sendo considerado melhor o modelo com o menor AIC.
Para tanto um compromisso satisfatório entre o bom ajuste e o princípio de parcimônia
9
pode
ser alcançado aplicando-se este critério.
Para um bom ajuste do modelo de Box-Jenkins, é necessário utilizar técnicas em que a
estrutura residual seja um ruído branco, isto é, que o resíduo seja uma variável aleatória
independente e identicamente distribuída, ou seja, o modelo foi tão bem ajustado que somente
restou a aleatoriedade dos dados que não pode ser explicada matematicamente. Neste sentido,
são utilizados para análise testes estatísticos conhecidos por testes Portmanteau [BAR03].
Redes Neurais Artificiais
A rede neural artificial utilizada nesta pesquisa é do tipo feedforward, a qual é bastante
conhecida e experimentada, e a mais largamente utilizada atualmente [CAL02]. Em redes do
tipo feedforward os neurônios são dispostos em camadas, usualmente duas camadas ativas. Os
neurônios de uma camada se conectam com os da camada subseqüente. Este modelo de
rede esta disponível no programa computacional R (pacote estatístico), tendo o algoritmo de
retropropagação (algoritmo backpropagation) utilizado para o ajuste dos pesos.
Os neurônios da camada escondida ou intermediária necessitam ser definidos. Para
muitos autores, segundo [FER95], o número de unidades das camadas escondidas se
apresentam como incógnita e o tamanho da camada escondida é escolhido usando o bom
senso: se a camada for muito grande, a rede estará memorizando os padrões e com isso
perdendo a capacidade de generalização, por outro lado, se a camada for muito pequena, a
rede levará muito mais iterações para atingir a precisão desejada.
A memorização no contexto de um modelo de RNAs, é equivalente ao problema
econométrico da super-parametrização do modelo. Quando a RNA memoriza um certo
conjunto de dados ela vai apresentar pequenos erros de previsão para o período amostral, mas
grandes erros para previsões fora da amostra [FER95].
Neste sentido, [CAL02] diz que, em qualquer problema a ser resolvido através do uso
de redes neurais, é necessário o uso de pares de entrada-saída conhecidos. Muitas vezes a
9
Representação dos modelos matemáticos, com a menor quantidade de parâmetros possível.
18
quantidade de pares disponíveis não é muito grande, mesmo assim deve-se separar esses
dados em dois conjuntos bem definidos, o conjunto de treinamento e o conjunto de teste. O
treinamento da rede é feito utilizando o conjunto de treinamento. É, entretanto, necessário
medir a performance da rede, considerando como ela responde a pares entrada-saída não
apresentados durante o treinamento, ou seja, o conjunto de teste.
Conforme [CAL02], isto é importante, pois um treinamento prolongado demais gera
um problema conhecido como overtraining, que pode levar a uma super-especialização da
rede (principalmente quando se dispõe de muito poucos dados) e a uma perda da capacidade
da rede de responder bem a dados nunca apresentados (perda da capacidade de
generalização). A partir de um certo número de passos, a performance do conjunto de teste
pára de decair e começa a piorar, mesmo que a do conjunto de treinamento continue decaindo.
Inicia-se a super-especialização. É virtualmente aceito que a melhor rede é aquela que fornece
o menor erro no conjunto de validação
10
e aquela que fornece o mínimo erro para o conjunto
de teste [CAL02]. A busca, portanto, da melhor configuração para a camada escondida da
rede é feita de forma a minimizar o número de neurônios nesta camada sem que haja perda de
capacidade preditiva [FER95].
2.3.3
Critério de Validação
Depois de identificar os parâmetros dos métodos de previsão mais adequados a cada
produto determinado ou sua categoria, conforme detalhado na seção 2.3.2, será necessário
realizar uma análise entre os métodos levando em consideração o seu desempenho em relação
às previsões. No caso, desta pesquisa, optou-se pela utilização do erro absoluto médio
percentual (EAMP) como critério para validar o modelo definido (ajustado), com vistas à
realização das previsões, o qual, segundo [HAN01], é útil quando o tamanho ou magnitude da
variável de previsão é importante na avaliação da acurácia da previsão.
Para a realização da comparação dos métodos de previsão, será utilizado um
subconjunto de teste com 36 observações, obtido da série integral que compreende 39
observações, permanecendo assim três observações para comparação das previsões obtidas
com os valores das observações realizadas.
Em relação ao número de observações ou número de períodos de tempo necessários
10
O conjunto de validação ou treinamento corresponde a pares entrada-saída que não são apresentados à rede
durante o treinamento e não são parâmetros para encerrar o treinamento, ou seja, representam um conjunto
totalmente novo a ser apresentado à rede para avaliação de desempenho [CAL02].
19
para um estudo em séries temporais, [KEN76] descreve que o número de observações em uma
série temporal não é por si uma medida completa de informação. O que pode ser observado é
que o acréscimo ou decréscimo do número de observações auxilia no reconhecimento de
algum comportamento nos dados.
Baseado no histórico disponível e conforme [MAK98], o cenário para previsão da
demanda apresenta-se como demonstrado na Figura 2.4. Onde, Y é a variável de interesse e n
o número de observações conhecidas da série, considera-se que numa linha cronológica, a
partir de um ponto de referência (Y
t
), as observações ocorridas no passado localizam-se à
esquerda deste ponto e são denominadas por Y
t-1
, Y
t-2
,..., Y
t-n+1
. Os valores futuros localizam-
se à direita e são denominados por F
t+1
,..., F
t+m
, onde m é o número de valores estimados para
a variável, a partir do ponto de referência.
Fonte: Adaptado de [BAR03]
Figura 2.4: Cenário de previsão da demanda.
No ANEXO A, encontram-se as 39 observações relativas à demanda real, conforme
descrito na seção 2.2, bem como, as previsões para os meses de maio, junho e julho de 2007
realizadas pelo método de previsão utilizado pela empresa. O método de previsão utilizado
pela empresa não foi divulgado, apenas que o mesmo é quantitativo e está integrado ao
sistema ERP. A previsão para os meses citado acima se deu para os 3 períodos de uma vez
e não período a período.
Com base nas previsões realizadas pelos métodos em análise será observado se a
previsão está enviesada, podendo estar subestimada ou superestimada, o que é proporcionado
pelo TS, conforme descrito na seção 3.4.7 e serão analisados os erros das previsões,
proporcionado pelo EAMP.
Subconjunto de Teste
n = 36 observações
Y = valores observados
F = valores futuros
t = abril/2007
n = 39 observações
Y = valores observados
F = valores futuros
t = julho/2007
Y
t-n+1
Y
t-2
Y
t-1
Y
t
F
t+1
F
t+2
F
t+m
Série Integral
20
Para verificar qual método apresenta o menor erro, ou seja, maior precisão será
analisado o intervalo de confiança dos erros de cada categoria, o qual é um método usual de
especificação da precisão, de forma a estabelecer um intervalo de valores plausíveis para a
realização da comparação do erro entre os métodos.
Neste sentido, para a obtenção do intervalo de confiança, será utilizada a distribuição t
(Student) com n-1 graus de liberdade, para coeficiente de confiança (1 α) desejado de 95%.
Uma vez que o comprimento do intervalo de confiança mede a precisão da estimação, a
intenção será da obtenção de um intervalo relativamente curto e com alta confiança,
considerando-se a média e o desvio-padrão da amostra.
Como análise estatística para a comparação dos erros entre os métodos será realizado
um teste de hipóteses de médias, a análise da variância ou ANOVA, o qual é um
procedimento muito útil para avaliar se as diferenças observadas entre as médias das amostras
são estatisticamente significantes.
Também será aplicado o teste de Tukey, o qual se baseia na diferença mínima
significativa, para determinar quais grupos diferem entre si, realizando a comparação múltipla
entre médias. Como o teste de Tukey controla o erro tipo I, este é um teste muito utilizado
pelos estatísticos. Estes dois testes serão realizados no pacote estatístico R.
21
Capítulo 3
Referencial Teórico
Este capítulo apresenta o referencial teórico, que aborda o atual estado da arte dos
assuntos diretamente relacionados à dissertação, que são: conceitos de previsão com base em
séries temporais e métodos de previsão.
3.1. Previsão
Quando se analisa uma série temporal )(),....,(
1
N
tZtZ , observada nos instantes
N
tt ,....,
1
, os objetivos são os mais variados possíveis. Segundo [MOR87a], os objetivos
básicos são os seguintes:
Modelagem do fenômeno sob consideração;
Obtenção de conclusões em termos estatísticos;
Avaliação da adequação do modelo em termos de previsão.
Dentre os objetivos da análise de série temporais mencionados, um deles é a avaliação
do modelo em termos de previsibilidade
11
de valores futuros da série sob consideração. A
previsão de séries temporais é somente o estabelecimento de valores futuros para a série, e é
feita com base tanto na informação atual quanto na passada. O horizonte de previsão é o
comprimento do tempo, contado a partir de uma origem predeterminada (origem da previsão).
Para [MAK98] ao analisar a ciência da previsão observa que a eficiência da previsão
varia de acordo com o horizonte de previsão necessário. Na medida em que o horizonte
11
Prever é o processo de estimar um evento futuro baseado em dados passados (histórico). Estes dados são
combinados sistematicamente de uma forma predeterminada até se obter uma estimativa futura [SIL02].
22
aumenta, os resultados da previsão se tornam mais suscetíveis a erros aumentando a incerteza
da previsão. Segundo [GIL06] as causas de erros comuns de previsão que muitas vezes fazem
com que as técnicas de previsão sejam consideradas incorretas e inadequadas, em muitos
casos, na realidade são causados por erros nos dados ou falhas na análise dos resultados,
gerando os erros de previsão.
Em face da inerente falta de acurácia no processo, por que é necessária a previsão? A
resposta é que todas as organizações operam em uma atmosfera de incerteza e que, apesar
deste fato, as decisões que afetam o futuro da organização devem ser tomadas. As suposições
ponderadas sobre o futuro são mais valiosas aos gerentes da organização do que as suposições
não ponderadas [HAN01].
Quando os gerentes da organização são confrontados com a necessidade de tomar
decisões em uma atmosfera da incerteza, que tipos de previsões estão disponíveis para eles?
Os procedimentos de previsão podem primeiramente ser classificados com relação ao prazo,
longo ou curto. As previsões de longo prazo são necessárias para ajustar o curso geral de uma
organização para o funcionamento de longo alcance, assim, transformam-se no foco particular
da alta gerência. As previsões de curto prazo são usadas para estabelecer estratégias imediatas
e são usadas pela gerência média e operacional para encontrar as necessidades do futuro
imediato [HAN01].
Ainda segundo [HAN01], as previsões podem também ser classificadas nos termos de
sua posição em um continuum micro-macro, isto é, na extensão em que envolvem detalhes
pequenos contra grandes valores concisos. Por exemplo, um gerente de planta pôde estar
interessado em prever o número dos trabalhadores necessários para diversos meses seguintes
(uma micro previsão), enquanto que o governo federal está prevendo o número total das
pessoas empregadas no país inteiro (uma macro previsão). Outra vez, os níveis diferentes da
gerência em uma organização tendem a focalizar em níveis diferentes do continuum micro-
macro. A alta gerência estaria interessada em prever as vendas da companhia inteira, por
exemplo, enquanto que os vendedores individualmente estariam muito mais interessados em
prever seus próprios volumes de vendas.
Desta forma, percebe-se que dois enfoques a considerar quando se deseja fazer
previsões em alguma área. No primeiro, o analista se baseia na teoria (econômica, física, etc.)
para construir um modelo, enquanto no segundo o modelo é obtido diretamente dos dados
disponíveis, sem recorrer a uma possível teoria subjacente. Este segundo procedimento é
23
chamado de estatístico ou de séries temporais, o qual é o enfoque desta pesquisa (previsão
baseada em séries temporais).
Existem diversas classificações para formalização de algoritmos de previsão de séries
temporais. Uma possibilidade é dividir os métodos matemáticos de previsão em dois grupos:
Métodos no domínio do tempo:
o
Métodos paramétricos;
o
Métodos não-paramétricos;
Métodos no domínio da freqüência.
Os métodos paramétricos utilizam estruturas matemáticas parametrizadas para
descrever o comportamento dinâmico, no domínio do tempo. Os parâmetros destas estruturas
matemáticas são determinados através de algoritmos de estimação, a partir dos dados
medidos. Os métodos não-paramétricos também obtêm modelos no domínio do tempo e o
comportamento dinâmico é determinado através de funções de correlação dos dados
disponíveis. Os métodos no domínio da freqüência configuram modelos utilizando
ferramentas matemáticas, tais como: wavelets e transformada de Fourier, para o cálculo da
resposta em freqüência do sistema sob análise.
Normalmente as séries temporais são analisadas a partir de seus principais
movimentos descritos como: tendência, ciclo, sazonalidade e variações aleatórias [MOR04].
As séries temporais podem também apresentar comportamentos cíclicos, variações periódicas.
Ou seja, alguma dependência cíclica. É conveniente que se faça a medição da mesma a partir
dos dados disponíveis e inclua esse comportamento (por exemplo, a sazonalidade, um caso
particular do ciclo) dentro do modelo de previsão. Existem vários procedimentos para estimar
a componente sazonal, sendo que os mais usuais são [MOR87a]:
Método de Regressão (método paramétrico);
Método de Médias Móveis (método não-paramétrico);
Método de Diferença Sazonal (sazonalidade determinística).
Uma série sazonal é definida como uma série temporal com um padrão de mudança
que se repete ano após ano (sazonalidade trimestral, semestral, etc.). Desenvolver uma técnica
de previsão sazonal envolve geralmente selecionar um método de decomposição
multiplicativo ou aditivo, e então estimar os índices sazonais do histórico da série. Estes
índices são usados então para incluir a sazonalidade nas previsões ou remover tais efeitos dos
24
valores observados. O último processo é referenciado como ajustamento sazonal dos dados ou
desazonalização [HAN01].
As técnicas de previsão da demanda para dados com sazonalidade são usadas sempre
que:
O tempo influencia a variável de interesse. São exemplos o consumo de
energia elétrica, as atividades do verão e do inverno (como por exemplo, esportes), e as
estações de colheita ou plantio na agricultura.
O calendário anual influencia a variável de interesse. Os exemplos são vendas
de varejo influenciadas por feriados, por fins de semana prolongados, e pelo calendário
escolar.
As técnicas que devem ser consideradas ao prever a demanda de uma série sazonal
incluem a decomposição clássica, Census X-12, suavização exponencial de Winters, a
regressão múltipla de séries temporais e os modelos SARIMA (métodos de Box-Jenkins)
[HAN01].
É importante observar que um modelo não conduz necessariamente a uma estimativa
de previsão. Será necessário especificar, além do modelo, uma função-perda ou erro, para se
chegar a uma estimativa de qual será a previsão da demanda. Uma função-perda, que é
utilizada frequentemente é o erro quadrático médio (EQM), embora em algumas ocasiões
outros critérios ou funções-perdas sejam mais apropriados [MOR87a] e [MOR04].
3.2. Séries Temporais
Em muitas áreas do conhecimento as observações de interesse são obtidas em
instantes sucessivos de tempo (séries temporais discretas) ou registradas por algum
equipamento de forma contínua (séries temporais contínuas). Chama-se de série temporal um
conjunto de observações ordenadas no tempo. Pode-se, então, definir uma série temporal
como sendo um grupo de dados observados (um conjunto de observações de uma variável)
durante um determinado intervalo de tempo, sendo esse espaço de tempo entre os dados
disponíveis equiespaçados (horários, diário, semanal, mensal, trimestral, anual, e etc.)
[MOR87a].
Há, basicamente, dois enfoques usados na análise de séries temporais. Em ambos o
objetivo é construir modelos para as séries, com propósitos determinados. No primeiro
25
enfoque, a análise é feita no domínio do tempo. No segundo, a análise é conduzida no
domínio de freqüências. Essas duas formas de análise não são alternativas, mas sim
complementares. No entanto, sabe-se que a primeira se adequa mais a análise de processos
não determinísticos, enquanto a segunda, a processos determinísticos [MOR87b] e [EST03].
Na análise no domínio do tempo considera-se a evolução da série temporal do
processo que está sendo estudado, tendo como objetivo a determinação da magnitude de cada
evento nos diversos instantes da série. As ferramentas utilizadas para essa análise são duas
funções: a função de autocorrelação e a função de autocorrelação parcial. A função de
autocorrelação mede a relação entre os eventos em diferentes instantes e as suas magnitudes.
A análise é baseada, em geral, por modelos paramétricos [EST03].
Os desenvolvimentos contemporâneos no domínio do tempo foram influenciados pelo
importante livro de Box e Jenkins, de 1970, Time series analysis: forecasting and control
[BOX94]. Estes autores desenvolveram a metodologia do domínio do tempo ordenando
alguns de seus temas principais e aplicando-os a funções importantes como a previsão da
demanda e o controle. Demonstraram quão amplos torna-se o escopo da análise das séries
temporais pela aplicação a problemas tão diversos tais como a previsão da demanda de
números de passageiros de uma linha aérea e da análise do processo de combustão em uma
fornalha a gás [POL99].
Na análise no domínio da freqüência, o interesse está em verificar a freqüência que
alguns eventos ocorrem em determinado período de tempo. A ferramenta utilizada para essa
análise é a análise espectral, nela são estabelecidas às características de um processo
estocástico em termos de freqüências, podendo, no caso das séries temporais determinarem as
periodicidades existentes na mesma. Como o espectro de um processo não é conhecido, ele
precisa ser estimado. Em geral, é estimado através do periodograma de janelas espectrais, por
possuir boas propriedades estatísticas [EST03].
Nestes dois distintos, contudo equivalentes, modos de análise de séries temporais
existem alguns pontos a considerar. Os métodos do domínio do tempo têm sua origem na
teoria clássica da correlação. Tais métodos tratam preponderantemente das funções de
autocovariância e de covariância cruzada da série, e conduzem inevitavelmente para a
construção de modelos estruturais ou paramétricos do tipo média móvel auto-regressivo
(ARMA) para uma única série e do tipo função de transferência para duas ou mais séries
causalmente relacionadas. Muitos dos métodos que são usados para estimar os parâmetros
26
destes modelos podem ser vistos como variantes sofisticadas do método da regressão linear
[MOR04].
Do outro lado estão os métodos do domínio da freqüência, onde se tem a análise
espectral, que consiste em decompor a série dada em componentes de freqüência. Estes são
baseados em uma extensão dos métodos da análise de Fourier que se originaram na idéia de
que, sobre um intervalo finito, toda a função analítica pode ser aproximada, ao grau de
acurácia desejado, a uma soma de funções seno e co-seno do aumento harmônico das
freqüências [MOR04].
A série temporal pode ser classificada como determinística ou estocástica (o conjunto
de todas as possíveis trajetórias que se poderia observar; trajetória aleatória). Quando os
valores da série podem ser escritos através de uma função matemática )(tempofy
=
, diz-se
que a série é determinística. Quando a série envolve além de uma função matemática do
tempo também um termo aleatório ),(
ε
tempofy
=
chama-se a série de estocástica
[MOR04].
Muitas situações em ciências físicas, engenharia, ciências biológicas e humanas
envolvem o conceito de sistema dinâmico, caracterizado por uma série de entrada )(tX , uma
série de saída )(tZ e uma função de transferência )(tv , como demonstrado na Figura 3.1.
Fonte: [MOR04]
Figura 3.1: Sistema dinâmico.
De particular importância são os sistemas lineares, onde a saída é relacionada com a
entrada através de uma função linear envolvendo v(t). Um exemplo típico é:
=
=
0
)()()(
τ
ττ
tXvtZ
(3.1)
Z(t)
v(t)
X(t)
27
Para que uma determinada série seja tratada com métodos particulares para uma série
temporal, é necessário que preencha outro pré-requisito: os dados também devem apresentar
uma dependência serial entre eles. Por exemplo: os dados de uma variável aleatória Z no
instante t, com t variando de 1 até N, possa, de certa maneira, conter informações necessárias
para que seja determinado o valor dessa variável no instante t+1. Cabe mencionar, que N
representa o número de observações da série temporal em questão. As séries temporais podem
ser classificadas, como mencionado, como discretas, contínuas, determinísticas, estocásticas,
bem como, multivariadas e multidimensionais [BAR03] e [MOR04].
Um modelo clássico para séries temporais supõe que a série
N
ZZ ,....,
1
possa ser
escrita como a soma de três componentes: tendência, componente sazonal e um termo
aleatório:
.,...,1,)( NtaSTtZ
ttt
=++=
(3.2)
3.3 Métodos de Previsão
12
Os métodos de previsão podem ser agrupados em métodos quantitativos e métodos
qualitativos [MAK98] e [HAN01]. Em um extremo, uma técnica puramente qualitativa é uma
que não requer nenhuma manipulação de dados. Somente o "julgamento" da previsão é usado.
Mesmo aqui, naturalmente, o "julgamento" da previsão é realmente um resultado da
manipulação mental de dados históricos passados. No outro extremo, as técnicas puramente
quantitativas não necessitam da entrada de julgamento; eles são procedimentos mecânicos que
produzem resultados quantitativos. Alguns procedimentos quantitativos requerem uma
manipulação muito mais sofisticada dos dados do que outros, naturalmente [HAN01].
Os métodos qualitativos são métodos analíticos, considerados métodos de predição,
baseados no julgamento, intuição, experiência dos envolvidos, entrevista com especialistas,
pesquisa de mercado, entre outros, e usados para criar cenários futuros. Os métodos
quantitativos são métodos analíticos baseados em um modelo matemático e são considerados
métodos de previsão.
12
Segundo [MOR04], não há algo chamado método de previsão ou algo chamado método de previsão ARMA.
Há algo chamado método de previsão de mínimos quadrados, e este, de fato fornece a base para virtualmente
todos os estudos teóricos. Além disso, todos os métodos de previsão são simplesmente diferentes procedimentos
computacionais para calcular a mesma quantidade, a saber, a previsão de mínimos quadrados de um valor futuro
a partir de combinações lineares de valores passados.
28
Os métodos quantitativos de previsão utilizam o padrão histórico dos dados para
extrapolar o seu comportamento futuro. Existem dois grandes grupos de procedimentos
quantitativos: a análise de séries temporais e os modelos causais (ou estruturais).
Os modelos causais descrevem a demanda como função de variáveis independentes,
ou seja, buscam relacionar as demandas (variável dependente) com outros fatores tais como
PIB, inflação, clima, perfil de população, denominados variáveis independentes. Para isso são
utilizadas técnicas de regressão linear e não-linear. Dentre os modelos causais mais
conhecidos, destacam-se os modelos de regressão simples e múltipla. Os modelos causais
aumentam o erro de predição por demandarem predições das variáveis independentes em
tempos futuros. Ou seja, para obter previsões de modelos causais acerca de uma variável de
interesse, serão necessárias previsões acerca das variáveis independentes utilizadas na
construção do modelo [FOG03] e [PAC03].
Na análise de séries temporais são considerados os modelos de suavização
exponencial simples, de suavização exponencial dupla (para dados com tendência) e o modelo
de Winters, para dados com variação sazonal [FOG03].
Fonte: Adaptado de [SIL02]
Figura 3.2: Métodos quantitativos.
Os métodos qualitativos são usados quando dados históricos são inexistentes ou
escassos. Estes métodos vêm encontrando crescente aplicação prática devido à alta
customização dos produtos, o que resulta em séries históricas com poucos dados devido ao
rápido ciclo de vida dos produtos, e ao crescente lançamento de novos produtos no mercado.
Métodos
Quantitativos
Séries Temporais Métodos Causais
- Extrapolação
- Suavização exponencial
- Médias
- Box-Jenkins (ARIMA)
- Correlação
- Regressões
- Modelos econométricos
29
Os métodos qualitativos são baseados em opiniões de especialistas. Estes analisam
situações similares, em conjunto com os dados existentes, para predizer valores futuros de
demanda. Os métodos difundidos de previsão qualitativa estão associados à pesquisa de
mercado, e incluem a utilização de grupos focados e técnicas de consenso. Das técnicas de
consenso, a mais difundida é o método Delphi [FOG03].
Fonte: Adaptado de [SIL02]
Figura 3.3: Métodos qualitativos.
A previsão combina dados via um modelo matemático para estimar eventos futuros,
a predição estima eventos futuros com base em considerações subjetivas, sem combinações
predeterminadas [SIL03].
Os métodos quantitativos são os mais usados em ferramentas de apoio à decisão. Os
modelos são baseados em dados históricos e no comportamento passado de determinado
fenômeno. Na Tabela 3.1 é apresentado uma breve descrição dos métodos quantitativos.
As previsões baseadas em informações provenientes de dados históricos, segundo
[MOR87b], possuem três componentes básicas que contemplam padrões de comportamento
do fenômeno, como:
Tendências;
Sazonalidade;
Métodos
Qua
l
itativos
Avaliação Subjetiva
Exploratórios
- Júri de executivos
- Pesquisa de opinião
junto à força de vendas
- Pesquisa de mercado
com consumidores finais
- Métodos de construção
de cenários
- Método Delphi (painel
de especialistas é
interrogado utilizando-se
uma seqüência de
questionários, sendo que,
a partir do segundo, eles
são construídos a partir
das respostas do anterior
e assim por diante).
- Métodos de analogia
30
Variações aleatórias.
Tabela 3.1: Descrição dos métodos quantitativos.
Método Quantitativo Descrição
Extrapolação A partir de dados passados de vendas, da análise das sazonalidades e dos
ciclos de vendas projeta-se a previsão de vendas.
Suavização Exponencial Aplicação particular da média ponderada e da média móvel – premissa de
que os dados disponíveis para o cálculo da previsão tornam-se cada vez
menos relevantes conforme o aumento de sua idade. a associação de
pesos mais altos aos dados mais recentes.
Média Simples Previsão é feita a partir da média aritmética das demandas passadas.
Considera o mesmo peso para todos os dados históricos.
Média Móvel Muito útil na suavização de curvas que representam tendências e
atenuação de distorções (como sazonalidades). Média dos N dados mais
recentes. Atribui o mesmo peso para todos os dados no cálculo da
previsão, além de necessitar de uma grande quantidade de dados para a
produção de bons resultados.
Box-Jenkins (ARIMA) Considera-se série histórica de vendas, em ordem cronológica, em que se
realizam análises de autocorrelações e autocorrelações parciais, para se
identificar o modelo, estimar os parâmetros, minimizando o erro
quadrático. O modelo requer o diagnóstico dos resíduos. Ferramenta
acurada e custosa, que requer maior tempo para a análise.
Correlação e Regressão A análise de regressão é muito utilizada para o desenvolvimento da
função de demanda (pode envolver fator simples ou múltiplos fatores). A
relação de correlação entre os diversos fatores pode ser linear ou não
(logarítmica, exponencial, etc.).
Modelos Econométricos São consideradas variáveis endógenas, como exógenas. São modelos
complexos que requerem a utilização de especialistas em estatística e
economia.
Fonte: Adaptado de [SIL02]
Segundo [SIL03], deve-se ainda considerar três condições básicas para a utilização de
dados históricos em modelos de previsão, que são os seguintes:
A existência de informações históricas;
As informações históricas podem ser transformadas em dados numéricos;
Padrões passados podem ser repetidos no futuro.
31
O objetivo de qualquer modelo de previsão é prever o componente sistemático da
demanda e estimar a variabilidade do componente aleatório.
A discussão anterior sugere diversos fatores a serem considerados ao escolher um
método de previsão. O nível do detalhe deve ser considerado. São necessários detalhes
específicos de previsão (uma micro previsão)? Ou é necessário o status futuro de algum fator
total ou de um fator conciso (uma macro previsão)? É a previsão necessária para algum ponto
no futuro próximo (uma previsão de curto prazo) ou para um ponto no futuro distante (uma
previsão de longo prazo)? E em relação aos métodos apropriados são qualitativos
(julgamento) e quantitativos (dados manipulados)?
Fonte: Adaptado de [SIL03] e [SIL02]
Figura 3.4: Métodos para previsão da demanda.
A consideração dominante ao escolher um método de previsão é que os resultados
devem facilitar o processo de tomada de decisão dos gerentes da organização. A exigência
essencial, então, não é que o método de previsão envolva um processo matemático
complicado ou que seja o método mais recente em termos de sofisticação. Preferivelmente, o
método escolhido deve produzir uma previsão que seja exata, oportuna, e compreendida pela
gerência de modo que a previsão possa ajudar a produzir decisões melhores. Também, o uso
Previsão
Métodos
Quantitativos
Métodos
Qualitativos
Séries
Temporais
Modelos
Causais
Inteligência
Artificial
Exploratórios
Avaliação
Subjetiva
Média
Móvel
Ajuste
Exponencial
Box-Jenkins
Regressão
Linear
Regressão
Múltipla
Redes
Neurais
Lógica
Fuzzy
Algoritmos
Genéticos
Delphi
Pesquisa de
Mercado
Projeção de
Demanda
Júri de
Executivos
Pesquisa de
Opinião
Métodos de
Analogia
32
do procedimento de previsão deve produzir um benefício que esteja adequado ao custo
associado com seu uso (relação custo/beneficio) [HAN01].
Todos os procedimentos formais de previsão envolvem estender as experiências do
passado para o futuro incerto. Assim, eles envolvem a suposição que as circunstâncias que
geraram dados passados são indistinguíveis das condições do futuro à exceção daquelas
variáveis reconhecidas explicitamente pelo modelo de previsão. Se alguma previsão for
realizada avaliando o desempenho do trabalho dos empregados usando somente o exame da
contagem da entrada na empresa como uma predição, por exemplo, está supondo-se que cada
avaliação de desempenho do trabalho pessoal está relacionada somente ao exame da
contagem de entrada. Até ao ponto em que esta suposição de indistinguível do passado e do
futuro não é encontrada totalmente, resultam nas previsões inexatas a menos que elas sejam
modificadas pelo julgamento de quem está realizando a previsão.
O reconhecimento que as técnicas de previsão operam sobre a geração de dados por
eventos históricos conduz à identificação das seguintes cinco etapas no processo de previsão
[HAN01]:
a.
Coleta de dados;
b.
Redução de dados ou condensação (tratamento dos dados);
c.
Construção do modelo e avaliação;
d.
Extrapolação do modelo (a previsão atual, real);
e.
Avaliação da previsão.
Os procedimentos de previsão de séries temporais, de acordo com [MOR87a], podem
ser divididos em duas categorias:
Automáticos, que são aplicados diretamente, com a utilização de programas
simples de computador;
Não-automáticos, que exigem a intervenção de pessoal especializado, para
serem aplicados.
É evidente que mesmo aqueles procedimentos incluídos entre os automáticos
requerem do usuário um mínimo de conhecimento e prática para serem utilizados. Dentre os
procedimentos automáticos podem ser mencionados:
Modelos de alisamento ou suavização (alisamento exponencial simples, linear
33
de Brown, biparamétrico de Holt, sazonal de Holt-Winters, etc.);
Auto-regressão stepwise;
Filtragem adaptativa.
Os métodos de previsão não-automáticos incluem:
Método Box-Jenkins; método Bayesiano.
Para que sejam estabelecidos valores futuros para a série em estudo, é necessário que,
de alguma forma, se possa captar e formular um modelo matemático capaz de representar o
comportamento e as características da série temporal que se deseja prever. Essas informações
são extraídas dos dados disponíveis. Existe uma grande quantidade de modelos de previsão,
na literatura estatística adequados para exercer tal tarefa, e eles são classificados da seguinte
forma:
Modelos univariados: os valores futuros de uma série são explicados somente
pelos valores passados dessa mesma série. Os métodos de decomposição, métodos de
suavização (amortecimento) exponencial e os modelos Box&Jenkins (ARIMA) estão
enquadrados dentro dessa classificação.
Modelos causais ou modelos de função de transferência: os valores futuros de
uma série são explicados não somente pelos valores passados da mesma, mas também por
séries que de alguma forma possuam relação com ela.
Modelos multivariados: são modelos capazes de realizar várias previsões ao
mesmo tempo, um modelo único capaz de prever o futuro de diversas séries.
Conforme o objetivo desta pesquisa, descrito na seção 1.2, com base nos conceitos
apresentados na seção 3.3 e levando em consideração o comportamento sazonal dos dados
fornecidos, na seqüência é apresentado o referencial teórico dos métodos utilizados neste
estudo para análise dos dados. A seção 3.3.1 apresenta o método de suavização exponencial e
a seção 3.3.2 os modelos de Box-Jenkins relacionados aos métodos tradicionais de estatística
e a seção 3.3.3 apresenta as redes neurais artificiais relacionado à inteligência artificial.
34
3.3.1 Método de Suavização Exponencial
Os métodos de suavização exponencial para séries temporais formam uma grande
classe de métodos que procuram captar as informações contidas nos próprios valores da série;
ou seja, buscam traduzir as influências ocorridas nas observações ao longo do tempo através
delas mesmas. Se um fato externo acarreta mudanças de valores da variável em estudo, então
a conseqüência deste fato já está embutida nos valores observados passados que resultarão em
respostas futuras [BAR03].
Dentro desta idéia, verifica-se que se as observações de uma determinada série
encontram-se em torno de uma média constante, com variância constante, a melhor previsão a
longo prazo para esta série seria a própria média. Caso a média altere ao longo do tempo
apresentando uma tendência crescente ou decrescente, isto deverá ser considerado e, neste
caso, a melhor previsão será a média acrescida de uma constante que traduza a tendência
encontrada. O mesmo ocorrerá se uma estrutura sazonal for percebida na série onde será
necessário buscar uma maneira de refletir esta sazonalidade [BAR03].
Para tanto, os métodos de suavização exponencial dispõem de equações que
consideram o nível, a tendência e a sazonalidade, e que são aplicadas conforme as
características encontradas na série, formando conjuntos específicos destas equações. Por
exemplo, se a série é somente caracterizada como tendenciosa, o conjunto de equações
resultantes a ser utilizado para a previsão desta série secomposto de três equações, sendo
que uma considerará o nível da série, outra considerará a tendência e por último a equação
que efetivamente fornecerá o próximo valor da série; ou seja, uma previsão pontual para o
futuro [EST03] e [BAR03].
Para facilitar a escolha do método a ser utilizado devido à estrutura existente nos
dados, [PEG69] propôs um resumo apresentado na Tabela 3.2, onde relaciona os métodos e
suas equações às características de comportamento dos dados. A série é representada por Y, os
componentes estruturais são representados por L para nível, b para tendência e S para
sazonalidade, os índices t indicam o instante da observação no tempo, m o número de
períodos a frente da última observação realizada, e s para a periodicidade da estrutura sazonal,
α ,β ,γ são constantes de suavização e variam entre 0 e 1, e finalmente, F representa o valor da
observação prevista [HYN02], [BIL06] e [BAR03].
35
Tabela 3.2: Esquema de classificação.
Componente Sazonal
Nenhum
1
Aditivo
2
Multiplicativo
3
Nenhum
A
(
)
tmt
ttt
LF
LYL
=
+=
+
1
1
αα
(
)
(
)
( ) ( )
smttmt
stttt
tsttt
SLF
SLYS
LSYL
++
+=
+=
+=
γγ
αα
1
1
1
( )
( )
smttmt
st
t
t
t
t
st
t
t
SLF
S
L
Y
S
L
S
Y
L
++
=
+=
+=
γγ
αα
1
1
1
Aditivo
B
(
)
(
)
( ) ( )
ttmt
tttt
tttt
mbLF
bLLb
bLYL
+=
+=
++=
+
11
11
1
1
ββ
αα
(
)
(
)
(
)
( ) ( )
( ) ( )
smtttmt
stttt
tttt
ttsttt
SmbLF
SLYS
bLLb
bLSYL
++
++=
+=
+=
++=
γγ
ββ
αα
1
1
1
11
11
( )( )
( ) ( )
( )
( )
smtttmt
st
t
t
t
tttt
tt
st
t
t
SmbLF
S
L
Y
S
bLLb
bL
S
Y
L
++
+=
+=
+=
++=
γγ
ββ
αα
1
1
1
11
11
Componente Tendência
Multiplicativo
C
(
)
(
)
( )
m
ttmt
t
t
t
t
tttt
bLF
b
L
L
b
bLYL
=
+=
+=
+
1
1
11
1
1
ββ
αα
(
)
(
)
(
)
( )
( ) ( )
smt
m
ttmt
stttt
t
t
t
t
ttsttt
SbLF
SLYS
b
L
L
b
bLSYL
++
+=
+=
+=
+
=
γγ
ββ
α
α
1
1
1
1
1
11
( )( )
( )
( )
smt
m
ttmt
st
t
t
t
t
t
t
t
tt
st
t
t
SbLF
S
L
Y
S
b
L
L
b
bL
S
Y
L
++
=
+=
+=
+=
γγ
ββ
αα
1
1
1
1
1
11
Fonte: [PEG69]
Tem-se que as células da Tabela 3.2: A-1, B-1, B-2 e B-3 são conhecidas como
método de alisamento exponencial simples, método de Holt, método de Winters aditivo e
método de Winters multiplicativo, respectivamente [HYN02] e [BAR03].
A robustez e a acuracidade dos métodos de suavização exponencial, tem levado a um
grande aumento das formas de aplicação e utilização do método. Principalmente, nos casos
onde um grande número de séries temporais precisam ser atualizadas através de um
procedimento automático, tal como ocorre, por exemplo, no caso do controle de estoques
[SOU05]. Entretanto, existe uma variedade de séries temporais que não se ajustam facilmente
a modelagem via suavização exponencial tradicional. As séries com variação cíclica ou
sazonal se enquadram dentro desse perfil de série.
Para essas séries temporais que apresentam um padrão de comportamento mais
complexo, existem outras formas de suavização tais como:
Método de Holt-Winters;
Método de suavização exponencial geral (Método de Brown).
O modelo de suavização exponencial de Holt-Winters é um procedimento bastante
popular para a previsão de séries temporais que possuem ciclos sazonais. Um fator importante
36
para a sua popularidade é a sua simplicidade e facilidade de implementação computacional.
Além de ser um procedimento heurístico, sendo as suas equações de atualização obtidas de
forma intuitiva [SOU05] e [EST03].
Segundo [MAK98], no ano de 1957 Holt expandiu o modelo de suavização
exponencial simples para lidar com dados que apresentavam tendência linear e, assim realizar
previsões que fossem mais precisas que as realizadas com suavização exponencial simples,
por ajustá-las a esta condição. Em 1960, Winters estendeu o modelo de Holt, incluindo uma
nova equação que possibilitasse ser acrescentada nas previsões o comportamento da
componente sazonal dos dados que se estivessem trabalhando, gerando assim o Método de
Holt-Winters [MAK98] e [HAN01].
O método possui, portanto, três equações básicas, uma para ajuste do nível (3.3) e
(3.7), outra para ajuste da tendência (3.4) e (3.8) e uma outra para o ajuste da sazonalidade
(3.5) e (3.9), as quais podem ser tanto multiplicativas como aditivas. As aditivas (3.10) são
empregadas em situações em que não há interação entre tendência e sazonalidade, e as
multiplicativas (3.6), em caso contrário, como coloca [MAK98], em situações em que as
flutuações sazonais aumentem e diminuam proporcionalmente ao aumento ou decréscimo do
nível da série.
No caso de sazonalidade multiplicativa, presente em séries que sofrem a influência das
condições econômico-conjunturais, as expressões de cada uma das componentes, assim como
a utilizada para se realizar as previsões (3.6), são descritas da seguinte forma:
))(1(
11
++=
tt
st
t
t
TL
S
Y
L
αα
(3.3)
11
)1()(
++=
tttt
TLLT
ββ
(3.4)
st
t
t
t
S
L
Y
S
+= )1(
γγ
(3.5)
mstttmt
SmTLY
++
+= )(
ˆ
(3.6)
Conforme [MOR04], o método multiplicativo considera o fator sazonal como sendo
multiplicativo e a tendência como aditiva. De acordo com [MAK98], a equação para o ajuste
da sazonalidade (3.5) pondera o mais recente fator sazonal. A equação do ajuste da tendência
(3.4), ao seu tempo, é igual à equação de tendência do método linear de Holt. Por fim, a
equação para o ajuste de nível (3.3) difere-se da equação do método linear de Holt pelo fato
37
do primeiro termo ser dividido pelo número sazonal. Esse procedimento acontece para
eliminar flutuações sazonais de Y
t
.
Segundo [MAK98] e [MOR04], as equações referentes ao método de suavização
exponencial com sazonalidade e tendência linear, ou seja, a componente sazonal sendo tratada
de forma aditiva são as seguintes:
(
)
(
)
(
)
11
1
++=
ttsttt
TLSYL
αα
(3.7)
(
)
(
)
11
1
+=
tttt
TLLT
ββ
(3.8)
(
)
(
)
stttt
SLYS
+=
γγ
1
(3.9)
mstttmt
SmTLY
++
++=
ˆ
(3.10)
As equações para o ajuste da tendência (3.8) e (3.4) são idênticas. De acordo com
[MAK98], a única diferença entre as demais expressões dizem respeito aos índices sazonais.
Enquanto no método aditivo, os mesmos são somados e subtraídos, no multiplicativo, são
multiplicados e divididos.
Nestas expressões, s representa o intervalo sazonal
13
e m o número de passos à frente
em que se quer prever. Como se observa nas expressões anteriores é necessário que se estime
o valor de três constantes de suavização (α, β e γ) que variam entre 0 e 1 e os valores iniciais
de L
t
, T
t
e S
t
. É sugerido por [MAK98] e [HAN01] que se utilizem valores de α, β e γ, que
minimizem a medida de erro adotado no estudo.
Uma outra questão que merece destaque é o fato de também não existir uma
metodologia pré-definida por Winters, para que se estimem os valores iniciais de L
t
, T
t
e S
t
.
Pacotes estatísticos realizam este cálculo, assim como os valores de α, β e γ, de forma
automática sem, porém, revelar o algoritmo utilizado em seus manuais. Antevendo esta
dificuldade, [MAK98] apresentou uma alternativa para que se encontrem tais valores de Ls,
Ts e Ss, através da aplicação de equações como as 3.11, 3.12 e 3.13, porém os índices
sazonais calculados a partir da decomposição clássica também podem ser utilizados.
)...(
1
21 ss
YYY
s
L +++=
(3.11)
13
Utilizando 1 se os dados forem anuais, 12 se forem mensais, 365 se forem diários, etc.
38
++
+
=
+++
s
YY
s
YY
s
YY
s
T
sssss
s
...
1
2211
(3.12)
s
s
s
ss
L
Y
S
L
Y
S
L
Y
S === ,...,,
2
2
1
1
(3.13)
A aplicação do método de Holt-Winters não exige que os dados originais respeitem
uma distribuição normal e/ou estejam estacionados, tratando-se, portanto, de um método
determinístico. Esta questão o torna bastante popular no âmbito empresarial tanto público
quanto privado. Apesar deste fato ser considerado uma vantagem, entretanto, isto também
contribui para que, em algumas situações, torne limitada sua aplicabilidade. A
impossibilidade de aplicação surge em situações em que é impossível aumentar o tamanho da
amostra considerada. Porque se o modelo apresentar discrepâncias consideradas inaceitáveis,
não é possível estudar seus resíduos e com isso melhorar suas previsões de forma que o torne
mais aderente aos dados, o que acaba por desqualificá-lo a servir de suporte à tomada de
decisões [SOU05].
3.3.2 Modelos de Box-Jenkins
Os modelos de Box-Jenkins interpretam a série temporal como uma realização de um
vetor aleatório multivariado, sendo sua dimensão o tamanho da rie disponível, seguindo o
princípio da parcimônia (representação dos modelos matemáticos, com a menor quantidade de
parâmetros possível) e da construção de modelos através de um ciclo interativo. Estes
modelos determinam o processo estocástico adequado para representar uma dada série
temporal através da passagem de um ruído branco por um filtro linear [EST03]. A
representação do processo utilizado por Box-Jenkins pode ser observado na Figura 3.5.
Fonte: [BOX94]
Figura 3.5: Processo previsor de Box-Jenkins.
Z(t)
Função da
Transferência
X(t)
Série de Entrada
Série de Saída
39
Como nem todos os processos são estacionários busca-se um operador de retardo, para
que seja permitida a construção de modelos para séries com comportamentos seriais, através
da descrição delas por processos estacionários ou processos estacionários homogêneos. O
processo não estacionário é transformado em estacionário homogêneo, através de
diferenciações sucessivas, feitas, pelo uso do operador de retardo mencionado anteriormente.
Ψ
=
+=
0
k
kt
K
t
aX
µ
(3.14)
fazendo
µ
=
t
XX
~
, tem-se que:
Ψ
=
=
0
~
k
kt
K
t
aX
(3.15)
onde:
µ
- nível de série.
t
a - ruído branco.
K
Ψ
- função de transferência ou filtro linear definido como )()( BB
pq
ϕθ
.
B
- operador de retardo que representa um atraso de um período de tempo.
A equação 3.14 é a formulação geral do modelo Box-Jenkins. Primeiramente foram
desenvolvidos os modelos ARMA, com o objetivo de se modelar somente séries
estacionárias, como pode ser observado na equação abaixo.
tt
aBXB )()(
θϕ
=
(3.16)
No entanto, sabe-se que no mundo real, a maioria das séries são não estacionárias
[MOR04]. Então, os modelos ARIMA foram à forma encontrada para solucionar esse
problema, podendo assim modelar também séries não estacionárias homogêneas. Entende-se
por séries não estacionárias homogêneas, aquelas que não são estacionárias na média ou no
nível, sendo as mesmas transformadas em séries estacionárias através de sucessivas
40
diferenças. Se mesmo depois de terem sido feitas as sucessivas diferenças, a série não se
tornar estacionária, convém fazer a transformação logarítmica da série em questão. Mas é
preciso estar atento, pois a introdução de transformações na previsão pode causar
tendenciosidade (no caso da transformação logarítmica geram estimadores tendenciosos do
anti-log), sendo necessário à aplicação de correções para eliminá-la. Com a inclusão do
operador de diferença, a formula geral, é a que segue.
tt
d
aBXB )()(
θϕ
=
(3.17)
E finalmente, os modelos SARIMA que são uma extensão dos modelos ARIMA para
que seja incluída a sazonalidade dentro da modelagem. Ou seja, inclui-se na modelagem a
correlação serial dentro e entre períodos sazonais. Os modelos ARIMA exploram a
autocorrelação entre os valores da série em instantes sucessivos, mas quando os dados são
observados em períodos inferiores a um ano, a série também pode apresentar autocorrelação
para uma estação de sazonalidade s. Os modelos SARIMA é que modelam as séries que
apresentam autocorrelação sazonal. Os modelos SARIMA contêm uma parte não sazonal,
com parâmetros (p,d,q), e uma sazonal, com parâmetros (P,D,Q)
S
, onde [HAN01]:
p - é o número de parâmetros auto-regressivos não-sazonal.
d - é o número de diferenças não-sazonal necessário para tornar a série estacionária.
q - é o número de parâmetros médias móveis não-sazonal.
P - é o número de parâmetros auto-regressivos sazonal.
D - é o número de diferenças sazonal necessário para tornar a série estacionária.
Q - é o número de parâmetros médias móveis sazonal.
s - é o tamanho do período sazonal.
dado por:
t
S
t
dD
S
S
aBBXBB )()()()( Θ=Φ
θϕ
(3.18)
onde:
)(B
ϕ
- operador auto-regressivo não sazonal.
41
dd
B)1( = - operador de diferença não sazonal de ordem d.
)(
S
BΦ - operador auto-regressivo sazonal.
DSD
S
B )1( = - operador de diferença sazonal de ordem D.
)(B
- operador de médias móveis não sazonal.
)(
S
BΘ - operador de médias móveis sazonal.
A modelagem geral de Box-Jenkins segue na equação acima, que pode ser usada tanto
para modelos sazonais (SARIMA(p,d,q)x(P,D,Q)s) quanto para os modelos não sazonais
(ARIMA(p,d,q))
14
.
A estimação dos parâmetros do modelo é feita por máxima verossimilhança. No
entanto, existem dois problemas na estimação da máxima verossimilhança: o primeiro
problema seria o estabelecimento dos valores iniciais do modelo, e o segundo a minimização
da soma dos quadrados dos resíduos, que seria o equivalente a maximizar a verossimilhança,
pode talvez não conduzir a uma função linear dos parâmetros.
3.3.3 Redes Neurais
As Redes Neurais e/ou Redes Neurais Artificiais (RNAs) são sistemas inspirados na
estrutura de funcionamento do cérebro e dos neurônios biológicos. As RNAs funcionam
conceitualmente de forma similar ao cérebro humano, tentando reconhecer regularidades e
padrões de dados. Esse interesse foi principalmente motivado pela observação da facilidade e
eficácia com o que o cérebro realiza tarefas difíceis e complexas. As redes neurais resolvem
problemas onde é difícil criar modelos adequados à realidade ou, então, situações que mudam
muito (problemas não lineares), sem a necessidade de se definir regras ou modelos explícitos.
As RNAs são capazes de aprender com a experiência e fazer generalizações baseadas no seu
conhecimento previamente acumulado. Embora biologicamente inspiradas, as RNAs
encontraram aplicações em diferentes áreas científicas [EST03].
Devido à similaridade de uma rede neural com a estrutura de um cérebro, elas,
14
De acordo com [BAR03], é importante salientar que, na aplicação destes processos (ARIMA e SARIMA) à
série, a parte “autoregressiva” (AR) do modelo final é o resultado da análise da função de autocorrelação parcial
(facp) que identifica o valor de p e P; a parte “médias móveis” (MA) é o resultado da análise da função de
autocorrelação (fac) que identifica o valor de q e Q. O número de diferenças necessárias à estacionariedade da
série resulta d e/ou D, no caso de diferenças sazonais, e o número de observações do ciclo sazonal resulta em s.
Assim, p, P, q e Q determinam o número de parâmetros necessários ao modelo e d, D e s identificam as
observações passadas influentes nos valores a serem previstos.
42
também, acabam por exibir características semelhantes, tais como:
Aprendizado: aprende-se por experiência;
Associação: faz associações entre padrões diferentes;
Generalização: são capazes de generalizar o conhecimento adquirido a partir
de experiências passadas.
Abstração: extrai a essência de um conjunto de informações, retirando os
ruídos.
Segundo [HAY01a], as unidades básicas da rede são os neurônios artificiais. Os
neurônios se agrupam em camadas. Existem três categorias de camadas: a camada de entrada,
a intermediária que pode também conter mais de uma camada e a camada de saída. Os
neurônios entre as camadas são conectados por sinapses ou pesos (pesos sinápticos), os quais
refletem a importância relativa de cada entrada com o neurônio. A camada de entrada é
responsável pelas variáveis de entrada do modelo; a camada de saída contém um ou mais nós,
representando os resultados finais do processamento e as camadas intermediárias, ou camadas
ocultas (escondidas), que podem existir uma ou mais que irão tornar o processamento mais
refinado e não-linear.
A Figura 3.6, apresenta o modelo de um neurônio, que forma a base para o projeto de
redes neurais artificiais.
Fonte: [HAY01a]
Figura 3.6: Modelo de um neurônio artificial.
Saída
w
=b
k
Pesos Sinápticos
v
k
Entrada
Fixa
x
1
x
2
x
x
0
=
Sinais de
Entrada
w
w
w
w
k
Junção
Aditiva
Potencial
de
Ativação
Função
de
Ativação
y
k
φ(.)
43
Conforme [FER95], as RNAs têm vários pontos de contato com os modelos
estatísticos e econométricos tradicionais. Como estas ligações acabam embotadas pelo uso de
jargões técnicos distintos, [FER95] apresenta um dicionário reduzido, com o objetivo de
facilitar a comunicação entre economistas e conexionistas
15
, apresentado na Tabela 3.3.
Tabela 3.3: Dicionário de redes neurais-econometria.
Redes Neurais Estatística
Pesos Parâmetros
Conjunto de treinamento Amostra
Entradas Variáveis exógenas
Saídas Variáveis endógenas
Retropropagação Aproximação estocástica
Treinamento ou aprendizado Estimação
Sinal de entrada Valor das variáveis exógenas
Sinal de saída Valor estimado
Alvo Valor das variáveis endógenas
Fonte: [FER95]
Um bom exemplo da topologia de rede neural encontra-se na Figura 3.7, que, por
convenção, é um formato de rede bastante usado, a rede feedforward [HAY99]. Nela, podem
existir uma ou mais camadas de processamento.
Fonte: [EST03]
Figura 3.7: Rede feedforward.
15
O conexionismo é uma das duas principais linhas de pesquisa da IA e tem por objetivo investigar a
possibilidade de simulação de comportamentos inteligentes através de modelos baseados na estrutura e
funcionamento do cérebro humano, isto é, de seus neurônios e de suas interligações [BIT08].
Y
1
W
d,c
X
1k
X
2k
Camada
Escondida
Camada de
Saída
Camada
de
Entrada
44
Na Figura 3.7, a rede possui 3 camadas: a camada de entrada, a camada escondida, e a
camada de saída. A rede neural possui também unidades de processamento da informação.
Essas unidades são denominadas neurônios, e são conectadas por pesos sinápticos
16
. Vale a
pena mencionar que as redes feedforward não possuem realimentação.
Existe também um outro tipo de rede, conhecida como rede recorrente. Nesse tipo de
topologia existe uma conexão entre os processadores não de uma mesma camada como
também de camadas diferentes, existindo realimentação na rede.
O ajuste pelas redes neurais tem duas fases até que se obtenha o resultado final: (1) a
fase de treinamento, onde é retirado o conhecimento do ambiente; (2) a fase de generalização,
onde o conhecimento adquirido na fase anterior é testado, para verificar se o que foi
aprendido pode ser utilizado para o fim desejado. No entanto, existem, diversas formas
importantes de uma rede aprender. O aprendizado pode acontecer de forma supervisionada ou
de forma não supervisionada. No primeiro, trabalha-se com conjuntos de pares de entrada e
saída, ambos previamente conhecidos e representantes da realidade. Já no aprendizado não
supervisionado, não se trabalha com conjuntos previamente conhecidos. Estabelece-se uma
medida que represente a qualidade da representação da rede, e os parâmetros são modificados
de forma a otimizá-la [CAL02] e [EST03].
No entanto, é preciso ser enfatizado que em se tratando do uso de rede neurais para o
tratamento de problemas lineares é fácil ser verificado que a maioria dos métodos estatísticos
tradicionais obtém resultados mais eficientes. As redes neurais, tal como a gica nebulosa,
somente oferece resultados mais adequados, em casos onde o investigador lida com a busca
de solução para problemas não lineares e quando se tem como objetivo a modelagem de
relações complicadas [CAL02] e [EST03].
Conforme [FER95], uma RNA pode ser definida como uma forma de mapear um
número de entradas (x
1
, x
2
, x
3
,..., x
r
) em um grupo de saídas (o
1
, o
2
, o
3
,..., o
p
). Imagine-se que
existe apenas um neurônio na camada de saída, isto é, p = 1, desta forma, em cada neurônio j
da camada oculta, a entrada corresponde a uma soma ponderada representada por:
rjrj
r
i
jjiji
xxxx
γγγγγ
++++=
=
...
22
0
110
(3.19)
16
Pesos sinápticos são forças de conexões entre neurônios que são utilizados para armazenar o conhecimento
adquirido [HAY01a].
45
Desta forma, o primeiro elemento da soma é visto como o viés, o qual aparece em
função da existência de um neurônio ligado a todos os demais neurônios da rede cujo sinal de
saída é sempre igual à unidade (x
0
= 1). Assim, segundo [FER95], após a aplicação da função
de ativação G tem-se a saída de cada neurônio j da camada oculta dada por:
=
=
r
i
ijij
xGh
1
γ
(3.20)
Assumindo-se a existência de q neurônios na camada oculta e fazendo h
0
= 1, tem-se
então a entrada do neurônio da camada de saída representada por [FER95]:
qq
q
j
jj
hhhh
βββββ
++++=
=
...
0
22110
(3.21)
Neste sentido, o sinal de saída da RNA pode ser obtido como:
=
=
q
j
jj
hGO
0
β
(3.22)
ou, simplesmente
),(.
00
θγβ
xfxGGO
r
j
iji
q
j
j
=
=
==
(3.23)
Na equação (3.23) tem-se a saída da rede como uma função das entradas da rede e dos
diversos pesos. Pode-se escrever resumidamente ),(
xf
=
, onde x representa o vetor de
entradas e
θ
é o vetor que representa os pesos
γ
e
β
. A função f pode ser chamada de
função de saída da rede, e sua forma precisa vai depender da arquitetura usada na rede. Neste
sentido, pode-se dizer que a procura por uma arquitetura ótima para uma RNA resume-se a
procura da forma funcional f apropriada. Existem então duas questões a serem resolvidas: a
escolha da forma funcional f, que está associada à arquitetura da rede, isto é, ao número de
camadas da rede e ao número de neurônios em cada camada, e a estimação do vetor de
parâmetros
θ
, que é feita pela utilização do método de retropropagação [CAL02] e [FER95].
46
Este método de retropropagação de erro (algoritmo) é responsável pelo treinamento
realizado na arquitetura feedforward. Este algoritmo requer a propagação direta do sinal de
entrada através da rede, e a retropropagação do sinal de erro [SAN01]. Segundo [NEV08], ele
é um modelo de treinamento mais robusto e com álgebra mais elaborada, atualmente o mais
utilizado em redes neurais de múltiplas camadas, uma vez que se demonstrou muito eficiente
na maioria das aplicações convencionais.
Este algoritmo utiliza o conceito de minimização do gradiente descendente e o limiar
da função sigmóide, considerado uma generalização da Regra Delta
17
para redes de
alimentação para frente com mais de duas camadas. A Regra Delta Generalizada, mais
conhecida como Algoritmo de Correção de Erros de Retropropagação procura minimizar o
erro obtido pela rede por meio do método do gradiente descendente. O objetivo deste
gradiente é buscar um mínimo global. Sendo que, o mínimo global é considerado como uma
solução teórica ótima, pois apresenta o menor erro possível [SAN01].
Como o algoritmo de retropropagação requer o cálculo do gradiente do vetor de erro, é
interessante que a função de ativação seja derivável em todos os pontos. A função f, utilizada
para obter a saída do neurônio, é chamada de função de ativação. As funções de ativação mais
utilizadas são funções do tipo sigmoidal (com forma de S). A maior vantagem desta função é
sua derivada, facilmente encontrada. A derivada da função de ativação é necessária no
processo de treinamento da rede neural. Isto explica o sucesso da função sigmóide ou função
logística como função de ativação, pois ela apresenta esta propriedade [BIT08] e [SAN01].
A Regra Delta utiliza um conjunto de treinamento com o qual se pretende uma
aproximação linear, de tal forma que se obtenha a melhor aproximação possível no sentido do
erro quadrático. A retropropagação é um algoritmo de treinamento supervisionado (necessita
de um conjunto de dados para treinamento, ou seja, uma série de pares de entradas e saídas
desejadas). Seu funcionamento pode ser descrito da seguinte forma, segundo [BIT08]: (1)
apresenta-se um exemplo à rede e obtém-se a saída correspondente, (2) calcula-se o vetor de
erro que consiste na diferença entre a saída obtida e a esperada, (3) calcula-se o gradiente do
vetor de erro e atualizam-se, utilizando a Regra Delta, os pesos da camada de saída e,
finalmente, (4) propaga-se para trás os valores desejados de modo a atualizar os pesos das
17
A Regra Delta de aprendizado que é baseada no método do gradiente para minimizar o erro na saída de um
neurônio com resposta linear foi proposta por Widrow e Hoff em 1960. Para maiores informações ver:
WIDROW, B.; HOFF, M. E. Adaptive switching circuits. In: WESCON, 1960, New York. Proceedings... New
York: WESCON, 1960.
47
demais camadas.
De acordo com [SAN01], durante o treinamento com este algoritmo, a rede opera em
uma seqüência de dois passos. No primeiro passo, um padrão é apresentado à camada de
entrada da rede. A atividade resultante flui através da rede, camada por camada, até que a
resposta seja produzida pela camada de saída. No segundo passo, a saída obtida é comparada
à saída desejada para esse padrão particular e o erro será calculado. O erro é propagado a
partir da camada de saída até a camada de entrada, e os pesos das conexões das unidades das
camadas internas vão sendo modificados conforme o erro é retropropagado.
Nesse tipo de aprendizado, os cálculos necessários para minimizar o erro são
importantes e estão atrelados ao algoritmo utilizado. Onde são considerados parâmetros como
o tempo por iteração, o número de iterações por padrão de entrada para o erro alcançar um
valor mínimo no treinamento, a ocorrência de um mínimo local ou global e a capacidade da
rede escapar desses mínimos locais.
Na Figura 3.8 tem-se a representação gráfica de uma rede neural feedforward com
quatro neurônios na camada de entrada, sendo o viés representado pelo triângulo, três
neurônios na camada escondida ou intermediária e um neurônio na camada de saída. O vetor
de pesos
γ
estabelece as ligações entre as camadas de entrada e oculta, enquanto o vetor
β
estabelece as ligações entre as camadas oculta e de saída [CAL02] e [FER95].
Fonte: Adaptado de [HAY99]
Figura 3.8: Representação gráfica de uma RNA.
γ
β
x
1
x
2
O
x
3
x
0
Camada de
Entrada
Camada
Escondida
Camada de
Saída
48
Considerando [FER95], no problema usual de estimar-se uma regressão não-linear,
tem-se, para esta regressão a expressão ),(
xf
=
, onde x é o vetor de variáveis exógenas e
θ
o vetor de parâmetros, que representa uma família de curvas cuja forma funcional é definida a
priori, e o problema consiste em obter-se o estimador
θ
ˆ
ótimo, isto é, aquele que minimiza a
soma do quadrado dos resíduos. Em outras palavras, o problema consiste em obter um
membro específico desta família de curvas, )
ˆ
,(
θ
xf = que apresenta o melhor ajuste aos
dados.
Fonte: [FER95]
Figura 3.9: Ajuste de mínimos quadrados não-lineares.
Em White apud [FER95] é mostrado que o estimador de mínimos quadrados não-
lineares (
θ
ˆ
) tende assintoticamente para os pesos ótimos aprendidos pela RNA (
*
θ
). É neste
sentido que pode se afirmar que a grande novidade introduzida pelas RNAs consiste em
focalizar a atenção na forma funcional f.
Segundo a literatura consultada, as redes neurais artificiais têm sido utilizadas com
grande sucesso na resolução de problemas envolvendo reconhecimento de padrões,
classificação, previsão, etc., pois elas possuem a propriedade de serem aproximadores
universais. É interessante observar que um único neurônio não é capaz de resolver nenhum
problema prático. Porém, muitos neurônios adequadamente conectados e com os pesos das
conexões devidamente ajustados são capazes de resolver complexos problemas não-
determinísticos. Quanto maior a complexidade do problema a ser resolvido, maior será o
f(x,θ
2
)
Entrada
Alvo
f(x,θ
)
f(x,θ
1
)
49
número de neurônios utilizados.
Segundo [FER95], uma RNA, com um número suficiente de neurônios na camada
oculta e uma função de ativação tipo logística consegue aproximar, com o grau de precisão
desejado, qualquer mapa de um espaço dimensional finito em um outro espaço dimensional
finito qualquer. Já os procedimentos de aprendizagem utilizados para obter os pesos
consistem em um processo de estimação usual em estatística. O algoritmo de retropropagação
é utilizado simplesmente para determinar o mínimo local da superfície de erros.
Robbins e Monro apud [FER95] propuseram um procedimento para estimar o vetor
θ
ˆ
que resolve a equação
(
)
(
)
0, =
θ
t
ZmE , onde E representa a esperança matemática,
θ
é um
vetor de parâmetros e
(
)
θ
,
t
Zm é uma quantidade aleatória, cuja aleatoriedade advém da
presença da variável aleatória Z
t
. A única informação conhecida para estimar-se
θ
ˆ
é uma
única realização da variável aleatória Z
t
, para t=1, 2, ..., n. A proposta para estimar
θ
de
forma recursiva pela equação (3.24) para t=1,2,...,n:
(
)
11
,.
+=
ttttt
Zm
θηθθ
(3.24)
onde
0
θ
é escolhido aleatoriamente. Fazendo-se:
ηη
=
t
(3.25)
(
)
(
)
(
)
(
)
111
,.,,
=
ttttttt
xfyxfZm
θθθ
(3.26)
(
)
ttt
yxZ ,=
(3.27)
obtém-se:
(
)
(
)
(
)
111
,.,.
+=
ttttttt
xfyxf
θθηθθ
(3.28)
que é, na verdade, uma forma genérica de escrever o algoritmo de retropropagação [FER95].
50
3.4 Medidas de Performance Preditiva
Toda demanda possui um componente aleatório. Segundo [CHO03] um bom modelo
de previsão deve captar o componente sistemático da demanda, mas não o componente
aleatório. Este componente aleatório se manifesta na forma de um erro de previsão, o qual
possui informações importantes que devem ser analisadas com critério.
Diversos métodos foram desenvolvidos para resumir os erros gerados por uma técnica
de previsão particular. A maioria destas medidas envolve o cálculo da média de alguma
função da diferença entre um valor real e o valor predito. Estas diferenças entre valores
observados e valores previstos são freqüentemente referenciadas como resíduos. Um resíduo
é, portanto, a diferença entre um valor real e seu valor previsto [HAN01].
Na tomada de decisão, conforme indica [CHO03], deve se fazer uma análise completa
dos erros em uma previsão por dois motivos:
Utilizar as análises de erros para determinar se o modelo de previsão adotado
está prevendo detalhadamente o componente sistemático da demanda.
Estimar o erro da previsão porque qualquer plano de contingência deve ser
responsável por tal erro.
Parte da decisão para usar uma técnica de previsão em particular envolve a
determinação se a técnica produzirá os erros da previsão que são julgados ser suficientemente
pequenos. É certamente realístico esperar que uma técnica produza erros relativamente
pequenos de previsão em uma base consistente [HAN01].
Se os erros observados estiverem dentro das estimativas históricas de erros, as
empresas geralmente podem continuar adotando seu modelo atual de previsão. Contudo, se
for observado que um erro está muito além das estimativas históricas, isto pode indicar que o
modelo de previsão adotado deixou de ser adequado. Também é possível que todas as
previsões costumem superestimar ou subestimar a demanda, o que será um sinal para alterar o
modelo de previsão [CHO03] e [HAN01].
O erro de previsão para o período t é dado por E
t
, e representado pela expressão
abaixo, onde F
t
é a previsão de demanda e D
t
é a demanda real observada [CHO03].
ttt
DFE =
(3.29)
51
A avaliação e a comparação entre os modelos de previsão são realizadas através de
estatísticas que medem o “grau de ajustamento” do modelo aos dados. Dentre estas
estatísticas, freqüentemente utilizadas estão as descritas abaixo [CHO03] e [HAN01].
Soma do quadrado dos erros (Sum Squared Error – SSE);
Erro quadrático médio (Mean Square Error – MSE);
Desvio padrão absoluto médio (Mean Absolute Deviation – MAD);
Erro absoluto médio percentual (Mean Absolute Percentual Error – MAPE);
Erro médio percentual (Mean Percentual Error – MPE);
Viés, desvio ou bias;
Razão de viés ou verificação da variação de sinal do erro (Tracking Signal
TS).
3.4.1
Soma do Quadrado dos Erros (SQE)
O SQE é a simples soma dos erros ao quadrado, para o qual se aplica a expressão
[CHO03]:
=
=
n
t
t
ESQE
1
2
(3.30)
3.4.2
Erro Quadrático Médio (EQM)
O EQM estima a variação do erro de previsão. O EQM é utilizado quando a simples
soma dos erros ao quadrado apresenta valores muito grandes que podem dificultar a
interpretação. Para o qual se aplica a expressão [CHO03]:
=
=
n
t
tn
E
n
EQM
1
2
1
(3.31)
3.4.3
Desvio Absoluto Médio (DAM)
Um método para avaliar técnicas de previsão usa a soma dos erros absolutos. O desvio
padrão absoluto (DAM) mede a acurácia da previsão pela média das magnitudes dos erros das
previsões (valores absolutos de cada erro). O DAM é mais utilizado quando o analista quer
medir o erro da previsão na mesma unidade que a série original [HAN01].
52
A definição do desvio absoluto no período t, A
t
, como sendo o valor absoluto do erro
no período t, ou seja:
tt
EA =
(3.32)
O desvio absoluto médio (DAM) é definido como sendo a média do desvio absoluto
em todos os períodos, expresso da seguinte maneira:
=
=
n
t
tn
A
n
DAM
1
1
(3.33)
O DAM pode ser usado para estimar o desvio-padrão do componente aleatório,
supondo que o componente aleatório seja distribuído normalmente [CHO03]. Nesse caso o
desvio-padrão do componente aleatório é:
DAM25,1
=
σ
(3.34)
Estima-se a partir daí que a média do componente aleatório é 0 e que o desvio-padrão
do componente aleatório da demanda é
σ
.
3.4.4 Erro Absoluto Médio Percentual (EAMP)
Algumas vezes é mais útil calcular os erros de previsão em termos dos valores
percentuais do que dos valores absolutos. O erro absoluto médio percentual (EAMP) é
calculado encontrando o erro absoluto em cada período, dividindo este pelo valor atual
observado para esse período, e então calculando a média desses erros absolutos percentuais. O
EAMP fornece uma indicação de quão grandes os erros de previsão estão na comparação com
os valores atuais das séries. A técnica é especialmente útil quando os valores F
t
são grandes.
O EAMP pode também ser usado para comparar a acurácia da mesma técnica ou diferentes
técnicas em duas séries inteiramente diferentes [HAN01].
É o erro absoluto médio como porcentagem de demanda e se expressa assim:
53
n
D
E
EAMP
n
t
t
t
n
100
1
=
=
(3.35)
3.4.5 Erro Médio Percentual (EMP)
Às vezes é necessário determinar se um método de previsão fornece uma previsão
consistentemente alta ou baixa. O erro médio da porcentagem (EMP) é usado nestes casos. É
calculado encontrando o erro em cada período, dividindo este pelo valor atual para esse
período, e então calculando a média destes erros porcentuais. Se a aproximação não for
consistentemente alta ou baixa, a Equação 3.32 produzirá uma porcentagem que chegará perto
de zero. Se o resultado for uma porcentagem negativa grande, o método de previsão é
consistentemente superestimado. Se o resultado for uma porcentagem positiva grande, o
método de previsão é consistentemente subestimado [HAN01].
=
=
n
t
t
t
n
D
E
n
EMP
1
1
(3.36)
3.4.6
Viés
Para se determinar se o modelo de previsão consistentemente superestima ou
subestima a demanda, pode-se utilizar a soma dos erros de previsão para avaliar o viés da
previsão, que é expresso como segue [CHO03]:
=
=
n
t
tn
Eviés
1
(3.37)
O viés da previsão (VP) oscilará em torno de 0 se o erro for verdadeiramente aleatório
e não enviesado de uma forma ou de outra. O ideal é, ao se plotar todos os erros num gráfico
de erro pelo tempo, que a inclinação da reta estimada seja 0.
3.4.7
Razão de Viés (TS)
A razão de viés ou sinal de rastreabilidade (TS – tracking signal) é a razão entre o viés
da previsão e o DAM e é formulada pela seguinte expressão:
54
t
t
t
DAM
viés
TS =
(3.38)
Se o TS em qualquer período estiver fora da faixa de ±6, isso significa que a previsão
está enviesada e que pode estar subestimada (razão de viés abaixo de -6) ou superestimada
(razão de viés acima de +6). Nesse caso, a empresa deve optar pela escolha de um novo
modelo de previsão [CHO03] e [HAN01].
55
Capítulo 4
Implementação e Análise dos Modelos
Este capítulo apresenta e discute os resultados obtidos dentro da pesquisa realizada
com a utilização das ferramentas selecionadas e a aplicação dessas ferramentas na
identificação do método de previsão mais adequado.
4.1. Análise Descritiva dos Dados
Nesta seção serão apresentados os resultados obtidos da análise exploratória dos
dados, conforme indicados na seção 3.2.1. Os resultados foram obtidos através da utilização
dos programas computacionais Excel 2003 (planilha eletrônica) e o R (pacote estatístico). O
processo de análise foi iniciado com a elaboração de um script para a programação no R. Os
passos seguidos na elaboração do script estão baseados na estrutura da pesquisa e na
metodologia adotada contemplando as fases de:
Organização ou estruturação dos dados e tratamento destes;
Definição dos métodos de previsão a serem analisados;
Definição dos experimentos de análise a serem realizados.
4.1.1
Análise Descritiva Geral
Os dados históricos completos, que formam as séries temporais a serem utilizadas,
estão apresentados no ANEXO A. Na Tabela 4.1 são demonstrados os resumos das Categorias
1 e 2, considerando o subconjunto de teste com 36 observações, tratado na seção 3.2.3, sendo
que a Categoria 1 é composta de 28 produtos e a Categoria 2 de 16 produtos, conforme
descrito na seção 3.1.
56
Tabela 4.1: Histórico de demanda por categorias.
2004 2005 2006 2007 Total Geral
Categoria 1
6.482.418,00 8.210.655,00 7.439.343,00 2.145.434,00
24.277.850,00
Categoria 2
4.672.684,00 5.626.559,00 4.780.695,00 1.170.377,00
16.250.315,00
Total Geral
11.155.102,00 13.837.214,00 12.220.038,00 3.315.811,00 40.528.165,00
Ao analisar a Tabela 4.1, é necessário atentar para o fato de que o subconjunto de teste
do histórico fornecido tem o seu início no mês de maio de 2004, bem como, o seu término no
mês de abril de 2007. Percebe-se, entretanto, que o volume de produtos de ambas as
categorias são bem elevados. Nota-se, contudo, um decréscimo nos valores históricos
fornecido entre o ano de 2005 e 2006 em ambas as categorias.
As Figuras 4.1 e 4.2 apresentam os gráficos dos dados históricos de demanda para a
Categoria 1 e Categoria 2. Estes gráficos demonstram a relação das quantidades totais de
produtos em função do período de observação, que é mensal. Percebe-se um padrão cíclico
nos dados para as duas categorias, que atingem altas quantidades de produtos nos meses de
novembro caindo imediatamente nos meses de dezembro atingindo as quantidades mais
baixas em fevereiro, ano após ano, caracterizando um comportamento sazonal, bem como,
uma tendência negativa (indicada em vermelho) ao se verificar que os valores dos meses
decrescem ao longo do tempo.
0
200.000
400.000
600.000
800.000
1.000.000
1.200.000
1.400.000
1.600.000
1.800.000
2.000.000
05/2004 08/2004 11/2004 02/2005 05/2005 08/2005 11/2005 02/2006 05/2006 08/2006 11/2006 02/2007
Figura 4.1: Histórico de demanda da categoria de produtos 1.
57
0
200.000
400.000
600.000
800.000
1.000.000
1.200.000
1.400.000
05/2004 08/2004 11/2004 02/2005 05/2005 08/2005 11/2005 02/2006 05/2006 08/2006 11/2006 02/2007
Figura 4.2: Histórico de demanda da categoria de produtos 2.
A tendência negativa é confirmada para as duas séries temporais, ao se observar a
média anual da quantidade de produtos que decresce ao longo do período em estudo, como
pode ser visto na Tabela 4.2 e 4.3. Este fato pode estar associado com o ciclo de vida dos
produtos
18
. Indicando algum evento especial em relação às fases deste ciclo, que ocasionou
este comportamento na série em análise.
Tabela 4.2: Estatísticas descritivas para a Categoria 1.
2004
2005
2006
2007
Total
Média
810.302,25
684.221,25
619.945,25
536.358,50
674.384,72
Mediana
597.060,50
551.686,50
504.056,00
444.386,50
532.019,50
Desvio padrão
480.151,73
398.439,40
384.124,06
285.826,58
396.015,39
Curtose
2,00
5,09
4,78
1,78
2,64
Assimetria
1,51
2,14
2,00
1,45
1,73
Mínimo
425.944,00
354.473,00
272.853,00
314.109,00
272.853,00
Máximo
1.811.284,00
1.775.095,00
1.661.166,00
942.552,00
1.811.284,00
Soma
6.482.418,00
8.210.655,00
7.439.343,00
2.145.434,00
24.277.850,00
Contagem
8
12
12
4
36
18
O ciclo de vida do produto representa estágios distintos na história das vendas do produto. Estes diferentes
estágios incluem, mas não se resumem, as fases referentes ao desenvolvimento do produto. Correspondentes a
estes estágios estão diferentes oportunidades e problemas com respeito a várias estratégias mercadológicas,
operacionais e financeiras. Estas fases são quatro: introdução no mercado, crescimento de volume, maturidade e
declínio. Nas quais deve ser verificada uma correlação entre características encontradas nos produtos e mercados
servidos ao longo do ciclo de vida do produto e características do processo a cargo de fazer os produtos ao longo
das fases do ciclo [COR04].
58
Tabela 4.3: Estatísticas descritivas para a Categoria 2.
2004
2005
2006
2007
Total
Média
584.085,50
468.879,92
398.391,25
292.594,25
451.397,64
Mediana
528.830,00
423.668,50
356.640,00
266.873,00
420.640,50
Desvio padrão
271.326,27
240.886,43
221.796,97
119.052,08
240.022,26
Curtose
4,40
7,19
5,53
-0,95
3,83
Assimetria
1,92
2,40
2,03
0,86
1,85
Mínimo
322.645,00
214.166,00
147.340,00
187.857,00
147.340,00
Máximo
1.196.625,00
1.163.929,00
1.010.410,00
448.774,00
1.196.625,00
Soma
4.672.684,00
5.626.559,00
4.780.695,00
1.170.377,00
16.250.315,00
Contagem
8
12
12
4
36
Ao se analisar, agora, a quantidade anual por produtos das Categorias 1 e 2, observa-se
a redução entre 2005 e 2006, como ocorreu na Tabela 4.1. A exceção apresenta-se para os
produtos P8, P14, P22 e P27 da Categoria 1, como pode ser visto na Tabela 4.4 e 4.5.
Tabela 4.4: Histórico de demanda dos produtos da Categoria 1.
Período
Produto
2004 2005 2006 2007 Total
P1
172.037,00 224.294,00 214.537,00 64.435,00
675.303,00
P2
221.859,00 248.312,00 209.967,00 63.583,00
743.721,00
P3
501.724,00 692.212,00 676.704,00 215.373,00
2.086.013,00
P4
340.245,00 508.351,00 487.149,00 128.910,00
1.464.655,00
P5
121.228,00 152.751,00 133.870,00 40.990,00
448.839,00
P6
272.435,00 366.474,00 352.463,00 107.546,00
1.098.918,00
P7
184.290,00 243.048,00 228.014,00 65.004,00
720.356,00
P8
541.577,00 591.600,00 595.902,00 191.611,00
1.920.690,00
P9
149.454,00 168.093,00 152.850,00 50.261,00
520.658,00
P10
163.766,00 176.381,00 136.257,00 41.582,00
517.986,00
P11
231.324,00 345.124,00 337.899,00 117.898,00
1.032.245,00
P12
216.039,00 233.993,00 229.994,00 67.642,00
747.668,00
P13
48.027,00 67.511,00 61.762,00 14.552,00
191.852,00
P14
173.038,00 177.224,00 181.055,00 62.422,00
593.739,00
P15
186.003,00 261.831,00 228.222,00 56.017,00
732.073,00
P16
527.065,00 710.942,00 605.229,00 161.550,00
2.004.786,00
P17
233.093,00 323.005,00 306.622,00 72.710,00
935.430,00
P18
191.906,00 230.074,00 178.440,00 40.441,00
640.861,00
P19
207.136,00 232.696,00 207.249,00 59.976,00
707.057,00
P20
363.887,00 471.487,00 375.119,00 91.555,00
1.302.048,00
P21
219.762,00 305.310,00 274.511,00 76.493,00
876.076,00
P22
155.964,00 222.759,00 223.393,00 71.346,00
673.462,00
P23
305.282,00 432.638,00 355.271,00 90.508,00
1.183.699,00
P24
129.772,00 138.437,00 92.557,00 27.292,00
388.058,00
P25
65.900,00 85.268,00 81.716,00 19.148,00
252.032,00
P26
247.794,00 208.282,00 121.028,00 36.518,00
613.622,00
P27
243.058,00 302.672,00 315.207,00 93.081,00
954.018,00
P28
68.753,00 89.886,00 76.356,00 16.990,00
251.985,00
59
Tabela 4.5: Histórico de demanda dos produtos da Categoria 2.
Período
Produto
2004 2005 2006 2007 Total
P1
344.228,00 384.742,00 305.678,00 81.083,00
1.115.731,00
P2
407.559,00 505.383,00 418.677,00 104.177,00
1.435.796,00
P3
231.751,00 278.239,00 217.261,00 60.481,00
787.732,00
P4
464.456,00 624.407,00 477.115,00 117.197,00
1.683.175,00
P5
293.288,00 315.853,00 280.950,00 60.792,00
950.883,00
P6
454.249,00 546.853,00 461.269,00 118.103,00
1.580.474,00
P7
214.191,00 252.422,00 245.801,00 66.116,00
778.530,00
P8
60.139,00 68.801,00 44.862,00 10.243,00
184.045,00
P9
335.012,00 373.838,00 269.089,00 54.740,00
1.032.679,00
P10
227.027,00 240.567,00 222.376,00 55.482,00
745.452,00
P11
165.732,00 185.094,00 146.263,00 29.401,00
526.490,00
P12
263.689,00 367.043,00 345.430,00 99.919,00
1.076.081,00
P13
295.712,00 328.652,00 295.492,00 78.877,00
998.733,00
P14
75.965,00 77.050,00 69.050,00 16.079,00
238.144,00
P15
475.410,00 617.743,00 587.420,00 129.188,00
1.809.761,00
P16
364.276,00 459.872,00 393.962,00 88.499,00
1.306.609,00
Na seqüência será apresentada a análise descritiva específica, a qual, devido a grande
quantidade de informações obtidas para cada produto de cada categoria, em termos de tabelas
e gráficos, optou-se por demonstrar os procedimentos metodológicos realizado para toda a
série apenas para um produto de cada categoria. O critério de escolha baseou-se apenas na
quantidade total de produtos, sendo o produto com a menor quantidade a opção escolhida.
4.1.2
Análise Descritiva Específica
Observando-se a seqüência da análise exploratória dos dados, conforme indicados na
seção 3.2.1, foram realizadas as estatísticas descritivas do produto P13 da Categoria 1 e P8 da
Categoria 2 que estão apresentados nas Tabelas 4.6 e 4.7.
Tabela 4.6: Estatísticas descritivas para o produto P13 da Categoria 1.
2004
2005
2006
2007
Total
Média
6.003,38
5.625,92
5.146,83
3.638,00
5.329,22
Mediana
5.183,00
5.038,50
4.576,50
3.395,50
4.686,50
Desvio padrão
3.356,11
3.126,92
2.971,01
1.499,76
2.960,57
Curtose
4,42
3,73
6,55
1,84
3,37
Assimetria
1,97
1,76
2,30
0,93
1,86
Mínimo
3.097,00
2.692,00
2.418,00
2.081,00
2.081,00
Máximo
13.598,00
13.770,00
13.600,00
5.680,00
13.770,00
Soma
48.027,00
67.511,00
61.762,00
14.552,00
191.852,00
Contagem
8
12
12
4
36
60
Tabela 4.7: Estatísticas descritivas para o produto P8 da Categoria 2.
2004
2005
2006
2007
Total
Média
7.517,38
5.733,42
3.738,50
2.560,75
5.112,36
Mediana
6.554,50
4.485,00
3.643,50
2.300,00
4.179,50
Desvio padrão
3.629,16
3.374,83
2.280,52
1.076,79
3.285,30
Curtose
2,73
3,22
3,79
-0,58
2,61
Assimetria
1,57
1,74
1,70
0,96
1,58
Mínimo
4.281,00
2.626,00
1.244,00
1.649,00
1.244,00
Máximo
15.281,00
14.392,00
9.692,00
3.994,00
15.281,00
Soma
60.139,00
68.801,00
44.862,00
10.243,00
184.045,00
Contagem
8
12
12
4
36
Percebe-se que o padrão cíclico dos dados observados para as duas categorias,
conforme realizado na análise descritiva geral, se repete nos produtos destas categorias. O que
caracteriza um comportamento sazonal. Novamente é identificada uma tendência negativa ao
verificar-se que os valores dos meses decrescem ao longo do tempo.
Nas Figuras 4.3 e 4.4, estendência negativa percebida é demonstrado nos gráficos.
A construção destes gráficos, neste estudo, permitiu observar as características importantes
das séries, como um apoio aos demais procedimentos utilizados.
Com a utilização do R analisou-se a condição de estacionariedade das séries do
produto P13 da Categoria 1 e P8 da categoria 8, conforme determinados na seção anterior, por
meio da média e da variância. Em ambos os casos, a condição foi de “estacionário na média”
e “estacionário na variância”. O processo desta análise se deu com a elaboração de um script
para a programação no R.
0
4.000
8.000
12.000
16.000
05/2004 08/2004 11/2004 02/2005 05/2005 08/2005 11/2005 02/2006 05/2006 08/2006 11/2006 02/2007
Figura 4.3: Histórico de demanda do produto P13 da Categoria 1.
61
0
4.000
8.000
12.000
16.000
05/2004 08/2004 11/2004 02/2005 05/2005 08/2005 11/2005 02/2006 05/2006 08/2006 11/2006 02/2007
Figura 4.4: Histórico de demanda do produto P8 da Categoria 2.
Na seqüência da análise, para que um reconhecimento das estruturas comportamentais
das séries fosse comprovado, empregou-se o processo de decomposição em componentes não-
observáveis. A decomposição pelo pacote estatístico R se utilizando médias móveis. As
Figuras 4.5 e 4.6 apresentam a decomposição realizada.
Figura 4.5: Decomposição da série temporal do produto P13 da Categoria 1.
Tempo
06/200
4
01/200
06/200
01/200
06/200
01/200
-
2000
0
2000
-
2000
2000
6000
4800
5200
5600
6000
4000
6000
10000
Ale
atório Sazonal Tendência Observado
62
Figura 4.6: Decomposição da série temporal do produto P8 da Categoria 2.
Na análise dos gráficos de decomposição
19
apresentados para as séries temporais
observa-se a componente sazonal bem definida. Entretanto, devido ao número de observações
obtidas, verifica-se um comportamento diferente para a componente tendência. Percebe-se
que existe uma tendência negativa durante um período de tempo, mas em um determinado
momento o mesmo tende a crescer. Não se sabe se o comportamento reflete alguma ação da
empresa que levou a um crescimento da demanda, pois não foram fornecidas outras
informações além do histórico. Este ponto merece uma análise mais criteriosa, a qual poderia
ser objeto de um futuro trabalho para estas categorias de produtos.
Como última análise desta fase verificou-se a estrutura de dependência das séries
temporais pelo gráfico da função de autocorrelação apresentados nas Figuras 4.7 e 4.8. O que
se percebe a respeito da análise destes gráficos é que uma estrutura de dependência,
caracterizado pelo alto valor da autocorrelação no retardo de 12 períodos (intervalos de
tempo), isto indica a presença da componente sazonal para a série temporal.
19
A decomposição adotada para verificar a estrutura da série foi a aditiva devido ao histórico disponível ser
pequeno para uma decomposição multiplicativa.
Tempo
06/200
4
01/200
06/200
01/200
06/200
01/200
-
1000
1000
3000
-
2000
4000
8000
4000
5000
6000
2000
8000
14000
Aleatório Sazonal Tendência Observado
63
Figura 4.7: Autocorrelação do histórico de demanda do produto P13 da Categoria 1.
Figura 4.8: Autocorrelação do histórico de demanda do produto P8 da Categoria 2.
FAC
FAC
64
4.2. Parametrização e Validação dos Modelos Implementados
Nesta seção são apresentados os resultados discutidos na seção 3.2.2, relacionadas à
análise dos dados históricos, onde se indicam os parâmetros obtidos, para os modelos dos
métodos de previsão utilizados nesta pesquisa, mais adequados a cada produto determinado
ou sua categoria. Como ocorreu na seção anterior, o processo de análise foi realizado com a
utilização do R, sendo necessário à elaboração de um script para a sua programação.
Como verificado na análise das estruturas comportamentais, através da decomposição
e da autocorrelação, as séries temporais em análise apresentam sazonalidade anual. Desta
forma, confirmando que as séries temporais são homogêneas em certo equilíbrio estatístico,
com tendência negativa, porém não significativa do ponto de vista estatístico direcionando a
aplicação dos modelos sazonais.
Método de Holt-Winters
Em geral, procura-se minimizar o erro médio quadrático, escolhendo-se aquele
modelo que apresentar menor erro. No caso do método Holt-Winters os parâmetros são
determinados pelo R através da minimização da soma dos erros quadráticos. No caso das
séries temporais para os produtos P13 da Categoria 1 e P8 da Categoria 2, foram obtidos os
parâmetros indicados na Tabela 4.8.
Tabela 4.8: Parâmetros Holt-Winters para os produtos P13 e P8.
P13
P8
Parâmetros:
alfa
0,90
0,17
beta
0,00
0,38
gama
0,03
1,00
Coeficientes:
a
4.430,18
3.938,31
b
-42,59
83,73
s1
127,13
2.270,43
s2
-2.106,55
-932,17
s3
-2.436,27
334,61
s4
-2.183,54
410,92
s5
-1.430,23
-1.644,59
s6
1.554,18
522,16
s7
9.419,64
6.354,14
s8
1.469,61
575,42
s9
-1.532,25
-1.979,16
s10
-2.204,64
-1.890,52
s11
-2.032,53
-1.077,88
s12
1.353,77
55,69
65
Os coeficientes a, b e s (s
1
,...,s
n
) são valores estimados para os componentes: nível (a),
tendência (b) e sazonalidade (s). No R, para modelos sazonais, os valores iniciais para a, b e s
são identificados pela realização de uma decomposição simples nas componentes tendência e
sazonalidade usando a média vel sobre os primeiros períodos (uma regressão linear
simples sobre a componente tendência é usada para iniciar o nível e a tendência).
Método de Box-Jenkins
No processo de definição dos parâmetros para o SARIMA, o passo inicial se deu pela
criação de um script, para a escolha dos valores ótimos dos parâmetros (p,d,q) (P,D,Q),
conforme o valor do critério de Akaike (AIC). Como explicado no capítulo anterior, este
critério é uma medida de qualidade de ajuste, o qual penaliza o modelo pela quantidade de
parâmetros. Desta forma, o modelo mais apropriado será o com menor AIC.
As Figuras 4.9 e 4.10 apresentam os gráficos dos resíduos
20
. Realizou-se um teste de
normalidade (o pacote R utiliza o teste de normalidade Shapiro-Wilk
21
) e uma autocorrelação
dos resíduos visando verificar se o modelo escolhido se ajustava bem aos dados disponíveis.
Figura 4.9: Gráfico dos resíduos do produto P13 da Categoria 1.
20
Resíduo ou erro de previsão. Um resíduo é a diferença entre um valor atual e seu valor previsto [HAN01].
21
Para maiores informações ver: ROYSTON, Patrick. Remark AS R94: A remark on Algorithm AS 181: The W
test for normality. Applied Statistics, v. 44, n. 4, p. 547-551, out./dez. 1995.
Resíduos do Arima
Tempo
06/2004
01/2005
06/2005
01/2006
06/2006
01/2007
66
Figura 4.10: Gráfico dos resíduos do produto P8 da Categoria 2.
Os testes paramétricos exigem que a variável dependente possua distribuição normal e
que as variâncias populacionais sejam homogêneas, caso se esteja a comparar duas ou mais
populações. Para testar a normalidade os testes mais utilizados são o de Kolmogorov-Smirnov
e Shapiro-Wilk. O teste de normalidade, utilizado nesta pesquisa, é o Shapiro-Wilk, o qual é o
mais apropriado para séries temporais com menos de 50 observações [EST03] e [KEN76].
Dentro do processo de definição dos parâmetros, o diagnóstico focaliza as análises
sobre os resíduos resultantes do modelo, para a verificação se estes resultam em “ruído
branco”, ou seja, o modelo foi tão bem ajustado que somente restou a aleatoriedade dos dados
que não pode ser explicada matematicamente. Neste sentido, testes estatísticos são utilizados
pelo R para esta análise, conforme descritos na seção 3.2.2.
As Figuras 4.11 e 4.12 apresentam a autocorrelação das medidas de dependência entre
observações dos resíduos para as séries em análise, mostrando que não restou nenhuma
estrutura temporal fora aquelas contempladas pelo modelo (a autocorrelação pode surgir por
especificação incorreta do modelo da regressão, por causa de erros na forma do modelo ou
por exclusão de variáveis independentes importantes para a análise).
Resíduos do Arima
Tempo
06/2004
01/2005
06/2005
01/2006
06/2006
01/2007
67
Figura 4.11: Autocorrelação dos resíduos do produto P13 da Categoria 1.
Figura 4.12: Autocorrelação dos resíduos do produto P8 da Categoria 2.
FAC
FAC
68
Os parâmetros obtidos para os produtos P13 da Categoria 1 e P8 da Categoria 2, são:
Tabela 4.9: Parâmetros Box-Jenkins para os produtos P13 e P8.
P13
P8
Coeficientes:
ma1
0,85
-0,83
ma2
0,55
ma3
0,36
sar1
0,44
0,86
sar2
0,54
intercept
5.265,87
sigma estimado
554.167,00
2.527.350,00
log likelihood
-308,84
-316,26
AIC
631,68
638,52
AICc
634,57
638,89
BIC
641,18
641,69
Os parâmetros
22
apresentados acima indicam que o modelo SARIMA (0,0,3) (2,0,0)
12
para o P13 da Categoria 1 e SARIMA (0,1,1) (1,0,0)
12
para o P8 da Categoria 2 apresentam
menores valores de AIC e maior probabilidade em rejeitar a hipótese de autocorrelação dos
resíduos, portanto, são os mais adequados aos produtos analisados.
Redes Neurais Artificiais
Conforme descrito na seção 3.2.2, a rede neural artificial utilizada nesta pesquisa é do
tipo feedforward, com o algoritmo backpropagation utilizado para o ajuste dos pesos. O passo
inicial se deu pela definição do conjunto de treinamento, do conjunto de teste e do conjunto de
validação no processo de definição dos parâmetros para a rede neural.
Uma vez que, na seção 3.2.3, estabeleceu-se o subconjunto de teste para a comparação
dos métodos de previsão, com 36 observações, obtido da série integral composta de 39
observações, definiu-se este subconjunto como o conjunto de treinamento e teste, e que as três
observações restantes que serão utilizadas para comparação das previsões, como o conjunto
de validação.
Nesta pesquisa, em cada ano do período de treinamento e teste, foram selecionados
randomicamente pelo R os pontos de teste e de treinamento, sem meses pré-determinados
22
Os parâmetros do modelo são representados pelos coeficientes ar (p), ma (q), sar (P) e sma (Q), como os dados
são mensais o tamanho do período sazonal (s) é 12. O p-value ou probabilidade significante com valores baixos
(menor que 0,05) evidenciam falta de normalidade, ou seja, a rejeição da hipótese H
0
.
69
para teste ou treinamento. Isto visa que os conjuntos de teste e treinamento sejam ambos
assemelhados ao padrão da série, homogêneos tanto com relação aos meses do ano quanto
com os anos utilizados [CAL02]. O R foi utilizado também na determinação dos demais
parâmetros para definição da arquitetura da rede a ser utilizada, sendo que apenas os
neurônios da camada escondida ou intermediária necessitam ser estabelecidos pelo usuário.
Na determinação do número de neurônios na camada intermediária realizaram-se
algumas experimentações. Em cada experiência procurou-se a melhor configuração, ou seja,
testar diversos números de neurônios na camada intermediária, descartando os piores
resultados com base na comparação das previsões realizadas, o que se deu pela utilização do
EAMP, como critério de desempenho em ajuste.
Como observado na seção 3.2.2, a melhor configuração para a camada escondida da
rede é feita de forma a minimizar o número de neurônios nesta camada sem que haja perda de
capacidade preditiva. A utilização de poucos neurônios proporciona uma capacidade de
generalização maior, mas pode simplificar muito o modelo, no sentido contrário, pode
introduzir uma complexidade que o problema não possui, e fazer com que a rede fique muito
restrita, e propensa a overtraining [CAL02]. A configuração que proporcionará a melhor rede
é aquela que fornecer o menor erro no conjunto de validação e o mínimo erro para o conjunto
de teste.
Neste sentido, as configurações 3-9-1 para o produto P13 e 3-8-1 para o produto P8
proporcionaram a melhor rede. Os parâmetros obtidos para estes produtos, são:
Tabela 4.10: Parâmetros Redes Neurais Artificiais para os produtos P13 e P8.
P13
P8
Camada de Entrada
3,00
3,00
Camada Escondida
9,00
8,00
Camada de Saída
1,00
1,00
Pesos
46,00
41,00
Valor Inicial
1.224.267.734,81
1.121.632.638,20
Iteração 10 (valor)
171.919.969,20
287.141.323,41
Iteração 20 (valor)
159.363.941,80
217.213.249,25
Iteração 30 (valor)
135.268.316,25
189.438.670,04
Iteração 40 (valor)
102.475.326,11
180.421.843,54
Iteração 50 (valor)
72.472.101,99
128.113.243,06
Iteração 60 (valor)
45.153.979,66
125.876.554,52
Iteração 70 (valor)
43.082.704,65
125.875.086,75
Iteração 80 (valor)
42.751.529,29
Iteração 90 (valor)
33.776.532,31
Iteração 100 (valor)
32.813.793,84
Valor Final
32.813.793,84
125.875.073,86
70
4.3 Análise Comparativa dos Desempenhos dos Modelos
Nesta seção será tratada a análise comparativa entre os métodos levando em
consideração o seu desempenho em relação às previsões, conforme descrito na seção 3.2.3.
Depois da parametrização dos modelos de previsão de demanda, descrito na seção anterior,
realizou-se a previsão para os meses de maio, junho e julho de 2007, pelos referidos métodos.
Esta previsão foi comparada entre o método utilizado pela empresa e os métodos identificados
nesta pesquisa, com base na demanda real do período, tendo o erro absoluto médio percentual
(EAMP) como critério de validação.
É importante salientar que a empresa forneceu a demanda real (D
t
) e a previsão
realizada (F
t
) pelo método atual para os meses de maio, junho e julho de 2007, conforme se
encontra no ANEXO A, para todos os produtos das duas categorias em análise. As Tabelas
4.11, 4.12, 4.13 e 4.14 apresentam a demanda real e as previsões realizadas pelo método atual,
Holt-Winters, Box-Jenkins e Rede Neural Artificial (RNA) para as duas categorias.
Tabela 4.11: Previsões pelo Método Atual e Holt-Winters para a Categoria 1.
Demanda Real (D
t
) Método Atual (F
t
) Holt-Winters
Produtos
05/2007
06/2007
07/2007
05/2007
06/2007
07/2007
TS
t
05/2007
06/2007
07/2007
TS
t
P1
23.081
13.140
14
21.967
13.548
0
-1,41
23.827
18.877
17.050
3,00
P2
23.291
12.781
16.788
20.242
12.187
19.578
-0,40
21.953
18.397
19.188
2,14
P3
73.341
47.266
39.135
65.511
40.587
50.959
-0,31
73.553
52.133
40.935
3,00
P4
49.856
31.134
23.470
51.246
30.410
33.200
2,63
44.537
34.846
27.784
0,61
P5
16.149
7.981
7.920
16.278
7.526
0
-2,91
20.309
10.267
11.637
3,00
P6
38.122
21.973
19.028
39.651
20.318
29.166
2,25
40.763
30.894
26.680
3,00
P7
23.842
13.804
13.699
23.882
13.562
15.834
2,40
21.982
17.922
15.356
1,54
P8
59.938
36.240
15.902
60.738
40.385
0
-1,58
77.582
29.644
39.627
2,17
P9
16
1718
0
0
0
0
-3,00
19438
12728
8493,9
3,00
P10
14.456
9.757
1.456
16.077
7.377
0
-1,22
9.198
4.534
2.862
-2,29
P11
38.229
27.720
21.607
39.323
22.051
29.683
0,71
44.301
37.211
32.060
3,00
P12
23.144
13.313
13.428
29.403
14.970
0
-0,77
21.664
14.827
14.266
0,68
P13
4.693
2.037
2.720
5.600
3.081
3.245
3,00
4.515
2.238
1.866
-2,02
P14
23.847
12.440
9.368
27.662
13.389
0
-0,98
23.376
16.006
15.253
2,72
P15
22.665
11.824
11.124
23.812
11.373
0
-2,46
19.291
9.797
6.556
-3,00
P16
46.000
28.819
32.062
50.841
25.806
0
-2,27
51.324
32.379
28.614
1,32
P17
26.140
13.578
11.389
31.084
14.181
0
-1,03
25.153
11.624
17.589
1,07
P18
14.929
9.426
11.967
14.374
12.309
14.546
2,45
12.133
6.964
6.140
-3,00
P19
20.771
12.372
14.289
23.942
13.455
15.132
3,00
17.788
9.638
11.478
-3,00
P20
36.842
24.826
22.243
35.330
16.324
19.788
-3,00
31.288
17.924
13.488
-3,00
P21
24.629
15.549
3.140
26.029
13.818
0
-1,66
22.484
16.645
14.204
2,10
P22
25.269
17.079
13.674
24.053
20.012
15.337
1,74
25.526
24.464
16.940
3,00
P23
32.807
16.936
14.671
32.027
21.548
19.231
2,53
28.302
13.449
12.936
-3,00
P24
9.307
5.474
3.485
15.443
6.558
3.950
3,00
5.167
840
968
-3,00
P25
6.812
2.932
4.203
6.790
4.217
5.359
2,95
6.216
4.104
3.958
0,49
P26
15.001
9.712
7.177
11.027
5.968
6.363
-3,00
12.735
3.837
1.853
-3,00
P27
31.547
23.000
21.770
34.458
19.757
26.126
1,15
35.604
26.760
22.815
3,00
P28
5.743
2.262
2.738
6.667
4.043
4.693
3,00
6.023
3.000
3.385
3,00
71
Tabela 4.12: Previsões por Box-Jenkins e Rede Neural Artificial para a Categoria 1.
Demanda Real (D
t
) Box-Jenkins Rede Neural Artificial
Produtos
05/2007
06/2007
07/2007
05/2007
06/2007
07/2007
TS
t
05/2007
06/2007
07/2007
TS
t
P1
23.081
13.140
14
20.068
14.277
14.189
2,01
25.519
12.348
16.800
2,76
P2
23.291
12.781
16.788
19.740
11.348
15.821
-3,00
24.782
9.969
15.284
-1,46
P3
73.341
47.266
39.135
68.977
45.338
39.276
-2,87
78.339
48.974
43.052
3,00
P4
49.856
31.134
23.470
42.042
22.800
29.642
-1,34
51.177
31.132
20.001
-1,35
P5
16.149
7.981
7.920
17.349
8.975
7.497
2,03
17.166
7.715
7.818
1,40
P6
38.122
21.973
19.028
37.699
24.574
23.056
2,64
36.891
21.880
20.259
-0,11
P7
23.842
13.804
13.699
20.804
11.579
14.193
-2,49
22.851
12.926
11.426
-3,00
P8
59.938
36.240
15.902
69.849
24.365
34.403
1,23
59.136
35.081
16.591
-1,44
P9
16
1718
0
19.362
7.647
9.862
3,00
15.220
6.673
4.626
3,00
P10
14.456
9.757
1.456
17.475
7.096
8.283
1,72
14.967
9.434
3.881
2,41
P11
38.229
27.720
21.607
38.545
23.632
21.056
-2,62
39.246
36.623
22.988
3,00
P12
23.144
13.313
13.428
23.435
12.461
15.512
1,42
23.488
14.116
14.093
3,00
P13
4.693
2.037
2.720
4.166
2.738
3.032
0,95
4.777
2.109
2.599
0,38
P14
23.847
12.440
9.368
17.826
9.160
7.947
-3,00
22.143
12.885
9.291
-1,80
P15
22.665
11.824
11.124
21.918
8.382
9.496
-3,00
22.968
12.249
11.351
3,00
P16
46.000
28.819
32.062
60.512
29.118
33.382
3,00
51.656
27.333
33.278
1,93
P17
26.140
13.578
11.389
26.178
13.011
18.824
2,58
26.314
15.197
11.619
3,00
P18
14.929
9.426
11.967
12.655
5.327
7.223
-3,00
14.605
9.815
12.691
1,65
P19
20.771
12.372
14.289
19.824
11.925
13.488
-3,00
20.079
12.405
14.004
-2,80
P20
36.842
24.826
22.243
35.506
15.868
15.816
-3,00
36.169
23.811
23.608
-0,32
P21
24.629
15.549
3.140
26.225
12.698
15.383
1,98
24.837
17.208
15.104
3,00
P22
25.269
17.079
13.674
22.294
16.516
12.748
-3,00
26.479
16.340
13.711
0,77
P23
32.807
16.936
14.671
30.977
17.346
18.629
1,23
31.374
17.366
13.711
-2,09
P24
9.307
5.474
3.485
9.482
5.323
5.783
2,65
9.399
6.859
4.070
3,00
P25
6.812
2.932
4.203
6.506
4.487
4.943
2,29
7.231
3.445
5.379
3,00
P26
15.001
9.712
7.177
18.919
15.490
20.811
3,00
16.944
9.136
7.161
1,60
P27
31.547
23.000
21.770
31.120
19.062
20.434
-3,00
29.472
24.234
22.496
-0,09
P28
5.743
2.262
2.738
5.504
3.375
4.471
2,54
5.234
1.882
1.945
-3,00
Tabela 4.13: Previsões pelo Método Atual e Holt-Winters para a Categoria 2.
Demanda Real (D
t
) Método Atual (F
t
) Holt-Winters
Produtos
05/2007
06/2007
07/2007
05/2007
06/2007
07/2007
TS
t
05/2007
06/2007
07/2007
TS
t
P1
30.327
22.301
7.226
36.730
22.101
0
-0,22
23.827
18.877
17.050
3,00
P2
35.659
20.683
41.617
44.091
31.009
48.195
3,00
21.953
18.397
19.188
3,00
P3
29.108
19.773
24.962
30.115
22.813
28.981
3,00
73.553
52.133
40.935
3,00
P4
45.495
41.001
57.665
49.497
31.798
54.658
-1,52
44.537
34.846
27.784
3,00
P5
19.841
15.852
13.015
24.231
7.509
0
-1,98
20.309
10.267
11.637
0,25
P6
51.959
41.239
50.003
51.362
32.225
52.268
-1,86
40.763
30.894
26.680
3,00
P7
23.148
22.733
27.754
27.104
17.695
22.545
-1,33
21.982
17.922
15.356
1,51
P8
2.105
3.790
4.239
6.084
2.309
3.528
0,87
77.582
29.644
39.627
2,27
P9
19.021
17.314
11.785
22.724
11.717
0
-1,95
19438
12728
8493,9
2,14
P10
23
0
0
0
0
0
-3,00
9.198
4.534
2.862
3,00
P11
12.611
10.282
2.047
10.108
4.453
0
-3,00
44.301
37.211
32.060
-0,19
P12
32.254
25.567
35.181
34.004
26.759
38.932
3,00
21.664
14.827
14.266
3,00
P13
29.442
23.112
33.175
31.341
23.288
30.545
-0,35
4.515
2.238
1.866
-1,15
P14
5.045
5.371
7.565
4.982
4.280
8.912
0,23
23.376
16.006
15.253
-2,78
P15
57.357
42.324
51.652
56.171
43.066
52.958
0,80
19.291
9.797
6.556
-0,78
P16
33.300
25.128
2.709
33.733
20.887
0
-2,65
51.324
32.379
28.614
3,00
72
Tabela 4.14: Previsões por Box-Jenkins e Rede Neural Artificial para a Categoria 2.
Demanda Real (D
t
) Box-Jenkins Rede Neural Artificial
Produtos
05/2007
06/2007
07/2007
05/2007
06/2007
07/2007
TS
t
05/2007
06/2007
07/2007
TS
t
P1
30.327
22.301
7.226
30.520
29.813
27.368
3,00
30.500
19.294
6.805
-2,71
P2
35.659
20.683
41.617
48.237
33.090
41.685
3,00
33.611
23.750
39.990
-0,27
P3
29.108
19.773
24.962
26.857
17.438
19.710
-3,00
26.181
20.372
24.433
-2,11
P4
45.495
41.001
57.665
53.348
35.521
46.089
-1,11
47.463
38.828
62.679
1,58
P5
19.841
15.852
13.015
21.981
14.102
24.211
2,30
20.636
15.840
11.862
-0,57
P6
51.959
41.239
50.003
53.162
31.509
42.256
-2,61
53.429
43.501
48.526
1,30
P7
23.148
22.733
27.754
23.877
16.231
20.552
-2,70
24.114
22.809
28.228
3,00
P8
2.105
3.790
4.239
4.904
1.955
3.159
-0,06
1.750
3.008
4.357
-2,44
P9
19.021
17.314
11.785
24.873
16.277
25.408
2,70
25.814
22.356
20.849
3,00
P10
23
0
0
23.454
18.465
21.095
3,00
21.800
17.860
144.235
3,00
P11
12.611
10.282
2.047
18.772
10.669
13.141
3,00
14.403
10.483
7.157
3,00
P12
32.254
25.567
35.181
34.527
25.358
27.761
-1,62
32.905
27.266
37.829
3,00
P13
29.442
23.112
33.175
31.542
24.992
29.138
-0,02
28.421
23.355
33.174
-1,85
P14
5.045
5.371
7.565
6.272
4.427
5.550
-1,24
5.085
2.629
6.943
-2,93
P15
57.357
42.324
51.652
55.027
39.901
46.402
-3,00
54.724
26.025
47.956
-3,00
P16
33.300
25.128
2.709
39.870
26.030
35.031
3,00
36.947
23.287
30.001
2,66
Pode-se verificar nas tabelas acima que as previsões realizadas com o método
atualmente utilizado pela empresa, bem como, os métodos contemplados nesta pesquisa não
apresentam nenhum viés significativo, ou seja, conforme descrito na seção 2.4.7, observa-se
que o TS, em todos os períodos está dentro da faixa de ±6, significando que as previsões não
estão enviesadas (subestimada razão de viés abaixo de -6; superestimada razão de viés
acima de +6). O que indica que os métodos de previsão utilizados nesta análise estão
adequados aos seus propósitos [CHO03] e [HAN01].
Segundo [CHO03], se o TS estiver fora da faixa descrita acima, há a necessidade de se
optar pela escolha de um novo modelo de previsão. Por exemplo, numa situação em que o
resultado é uma grande razão de viés negativa, o que ocorre quando a demanda tem uma
tendência de crescimento e a opção de utilização de um modelo de previsão se pela média
móvel. Uma vez que a tendência não está incluída, a média da demanda histórica será sempre
menor que a demanda futura. A razão de viés negativa detectará que o modelo de previsão
está consistentemente subestimando a demanda, servindo como um alerta [CHO03].
Na seqüência do processo da análise comparativa do desempenho, com base nas
previsões realizadas, conforme apresentadas acima, são agrupados os dados relativos ao erro
absoluto médio percentual (EAMP) dos métodos de previsão utilizados, os quais são
demonstrados nas Tabelas 4.15 e 4.16.
73
Tabela 4.15: EAMP entre os métodos de previsão para a Categoria 1.
Demanda Real (D
t
) Método Atual
Holt-Winters Box-Jenkins RNA
Produtos
05/2007
06/2007
07/2007
EAMP
t
EAMP
t
EAMP
t
EAMP
t
P1
23.081
13.140
14
36
40.578
33.757
39.972
P2
23.291
12.781
16.788
11
21
11
12
P3
73.341
47.266
39.135
18
5
3
7
P4
49.856
31.134
23.470
16
14
23
6
P5
16.149
7.981
7.920
35
34
8
4
P6
38.122
21.973
19.028
22
29
11
3
P7
23.842
13.804
13.699
6
17
11
9
P8
59.938
36.240
15.902
38
66
55
3
P9
16
1718
0
67
40.676
40.419
31.771
P10
14.456
9.757
1.456
45
62
172
58
P11
38.229
27.720
21.607
20
33
6
14
P12
23.144
13.313
13.428
46
8
8
4
P13
4.693
2.037
2.720
30
15
19
3
P14
23.847
12.440
9.368
41
31
22
4
P15
22.665
11.824
11.124
36
24
16
2
P16
46.000
28.819
32.062
40
12
12
7
P17
26.140
13.578
11.389
41
24
23
5
P18
14.929
9.426
11.967
19
31
33
4
P19
20.771
12.372
14.289
10
19
5
2
P20
36.842
24.826
22.243
16
27
23
4
P21
24.629
15.549
3.140
39
123
138
131
P22
25.269
17.079
13.674
11
23
7
3
P23
32.807
16.936
14.671
20
15
12
4
P24
9.307
5.474
3.485
33
67
24
14
P25
6.812
2.932
4.203
24
18
25
17
P26
15.001
9.712
7.177
25
50
92
6
P27
31.547
23.000
21.770
14
11
8
5
P28
5.743
2.262
2.738
55
20
39
18
Tabela 4.16: EAMP entre os métodos de previsão para a Categoria 2.
Demanda Real (D
t
) Método Atual
Holt-Winters Box-Jenkins RNA
Produtos
05/2007
06/2007
07/2007
EAMP
t
EAMP
t
EAMP
t
EAMP
t
P1
23.081
13.140
14
41
117
104
7
P2
23.291
12.781
16.788
30
80
32
8
P3
73.341
47.266
39.135
12
30
14
5
P4
49.856
31.134
23.470
12
20
17
6
P5
16.149
7.981
7.920
58
25
36
4
P6
38.122
21.973
19.028
9
31
14
4
P7
23.842
13.804
13.699
19
10
19
2
P8
59.938
36.240
15.902
82
74
69
13
P9
16
1718
0
17
13
12
22
P10
14.456
9.757
1.456
33
38.062
33.958
31.561
P11
38.229
27.720
21.607
59
133
198
89
P12
23.144
13.313
13.428
7
25
10
5
P13
4.693
2.037
2.720
5
13
9
2
P14
23.847
12.440
9.368
13
15
23
20
P15
22.665
11.824
11.124
2
13
7
17
P16
46.000
28.819
32.062
39
436
405
342
74
Com base nos erros descritos nas tabelas acima se realizou a comparação entre os
métodos de previsão por categoria, para verificar qual método apresentou o menor erro, ou
seja, maior precisão. Para esta análise procurou-se encontrar um intervalo de confiança, o qual
é um método usual de especificar a precisão, que proporcionasse um intervalo de valores
plausíveis para a comparação do erro entre os métodos.
Neste sentido, para a obtenção do intervalo de confiança, onde
1
e
2
são,
respectivamente, os limites inferior e superior do intervalo de confiança, calculou-se a média
(X) e o desvio-padrão da amostra (s). Determinou-se como tamanho da amostra (n) todo o
conjunto de erros obtidos, ou seja, para a Categoria 1 com 28 produtos, n igual a 28, para a
Categoria 2 com 16 produtos, n igual a 16. Nesse caso, utilizou-se a distribuição t (Student)
com n-1 graus de liberdade, para coeficiente de confiança (1 – α) desejado de 95% (1 – α para
95%, portanto, α = 0,05).
Os resultados obtidos desta análise encontram-se na Tabela 4.17. Uma vez que o
comprimento do intervalo de confiança mede a precisão da estimação, pode-se observar que a
precisão é inversamente relacionada com o nível de confiança. A intenção, portanto, é a
obtenção de um intervalo relativamente curto e com alta confiança. Neste caso, percebe-se
que os produtos P1 e P9 da Categoria 1 e P10 e P16 da Categoria 2, não proporcionam um
intervalo curto para os métodos utilizados nesta pesquisa, devido aos valores dos erros serem
elevados para os mesmos.
Tabela 4.17: Análise comparativa dos métodos de previsão por categoria.
Categoria 1 Categoria 2
Dados
Método
Atual
Holt-
Winters
Box-
Jenkins
RNA
Método
Atual
Holt-
Winters
Box-
Jenkins
RNA
X
29,07
2.930,46
2.677,93
2.574,80
27,38
2.443,56
2.182,94
2.006,64
s
14,88
10.647,03
9.761,04
9.470,39
23,15
9.498,83
8.473,98
7.881,60
1-α
0,05
0,05
0,05
0,05
0,05
0,05
0,05
0,05
1
23,30
-1.199,54
-1.108,39
-1.098,79
15,04
-2.616,94
-2.331,58
-2.192,28
2
34,84
7.060,46
6.464,25
6.248,38
39,71
7.504,07
6.697,45
6.205,56
Não seria possível afirmar qual método é o mais adequado para as Categorias 1 e 2,
pois o comprimento do intervalo de confiança do método de Holt-Winters abrange os
intervalos dos demais métodos comprometendo a precisão e a confiança numa tomada de
decisão.
Devido ao problema do comprimento do intervalo de confiança dificultar a
75
identificação do método adequado, ocasionado pelos valores elevados dos produtos
identificados acima, uma alternativa elaborada foi a de excluir os produtos que distorcem os
resultados dos métodos analisados e refazer os cálculos, os quais são, então, apresentados na
Tabela 4.18.
Tabela 4.18: Análise comparativa dos métodos de previsão por categoria.
Categoria 1 Categoria 2
Dados
Método
Atual
Holt-
Winters
Box-
Jenkins
RNA
Método
Atual
Holt-
Winters
Box-
Jenkins
RNA
X
29,07
30,73
31,00
13,49
27,38
42,79
40,29
14,53
s
14,88
25,30
41,28
26,35
23,15
41,11
52,86
22,30
1-α
0,05
0,05
0,05
0,05
0,05
0,05
0,05
0,05
1
23,30
20,51
14,33
2,85
15,04
19,04
9,76
1,65
2
34,84
40,95
47,67
24,14
39,71
66,53
70,81
27,41
Com os novos dados, observou-se que há, ainda, uma sobreposição dos intervalos de
confiança entre os métodos, sendo que nesta análise, o comprimento do intervalo de confiança
do método de Box-Jenkins abrange o intervalo do método atual, do método Holt-Winters e do
limite superior da Rede Neural.
Ao considerar-se a média, o desvio-padrão da amostra e os limites do intervalo de
confiança, a Rede Neural apresenta os melhores resultados, indicando ser o método mais
adequado para as Categorias 1 e 2, devido ao critério do menor erro. Diz-se que 95% de
confiança de que a média do erro do método adequado para a Categoria 1 está entre um
intervalo de 2,85 µ 24,14 e para a Categoria 2 está entre um intervalo de 1,65 µ 27,41.
A Rede Neural proporciona um intervalo relativamente curto com alta confiança.
Entretanto, percebe-se que a nível de produtos existe um desempenho melhor por parte
de outros métodos, ou seja, alguns métodos apresentam um erro menor para determinado
produto em relação aos demais. Isto indica a necessidade de uma outra avaliação para
comparar os resultados a nível de produto também, pois como exposto acima, considerou-se
na análise a média da categoria, sendo que alguns resultados que estavam elevados
comprometeram a avaliação dos métodos. Desta forma, para se ter uma análise mais criteriosa
ou uma análise complementar, optou-se pela comparação entre os produtos.
As Tabelas 4.19 e 4.20 apresentam os dados desta comparação, os quais seguem o
mesmo processo de avaliação utilizado para as categorias, ou seja, o intervalo de confiança.
76
Tabela 4.19: Análise comparativa dos métodos de previsão por produto.
Método Atual (F
t
) Holt-Winters Box-Jenkins Rede Neural Artificial
Produtos
X
1
2
X
1
2
X
1
2
X
1
2
P1
15
-6
36
13.535
-12.999
40.069
11.260
-10.813
33.333
13.330
-29.107
55.768
P2
11
9
14
17
6
29
13
11
16
11
3
19
P3
14
9
18
4
0
7
5
3
6
6
5
8
P4
7
-1
15
12
10
14
20
16
24
3
-1
8
P5
13
-9
35
29
24
34
9
7
10
5
2
7
P6
10
-1
21
20
7
33
6
1
12
3
1
4
P7
2
-1
6
14
8
21
13
11
15
6
1
11
P8
15
-7
37
40
14
65
32
9
55
2
1
4
P9
89
67
111
74.359
26.800
121.917
73.987
26.543
121.430
58.151
-2.375
118.677
P10
25
4
45
48
33
63
72
-26
170
22
-36
79
P11
12
2
21
25
15
34
5
1
9
11
-3
25
P12
31
15
47
8
6
9
4
1
8
3
0
6
P13
28
19
37
9
2
15
18
11
24
3
1
4
P14
23
5
41
16
0
33
24
22
27
5
2
8
P15
15
-5
36
18
13
24
12
3
20
2
1
3
P16
20
1
40
12
11
12
20
8
32
9
4
14
P17
24
7
41
12
0
24
9
-6
23
4
-1
9
P18
13
4
22
24
17
31
26
15
36
3
1
5
P19
12
9
15
17
14
20
4
4
5
2
1
4
P20
13
4
22
21
14
28
15
4
27
3
1
5
P21
18
-3
39
46
-28
121
52
-32
137
46
-90
181
P22
9
5
13
15
1
29
9
6
12
4
3
6
P23
12
2
23
15
13
17
7
2
12
4
3
5
P24
47
28
66
59
45
73
9
-5
23
10
-4
23
P25
15
1
30
17
8
26
19
5
34
12
2
22
P26
28
24
32
34
14
54
54
15
92
10
4
16
P27
12
9
15
13
11
15
6
1
11
6
5
7
P28
40
16
63
15
5
24
23
3
43
13
5
22
Tabela 4.20: Análise comparativa dos métodos de previsão por produto.
Método Atual (F
t
) Holt-Winters Box-Jenkins Rede Neural Artificial
Produtos
X
1
2
X
1
2
X
1
2
X
1
2
P1
24
7
41
46
-25
116
41
-22
104
5
-2
11
P2
30
23
38
74
49
100
38
29
48
8
4
12
P3
8
3
13
19
3
35
10
7
14
7
3
12
P4
12
8
16
21
20
21
16
15
18
5
3
7
P5
39
19
60
20
13
26
19
3
36
3
1
6
P6
7
1
13
26
22
31
10
2
17
4
2
5
P7
19
17
20
15
8
22
13
3
22
3
1
5
P8
128
66
191
127
54
200
98
61
134
16
11
21
P9
21
16
26
18
12
24
20
10
31
30
16
43
P10
61
22
100
69.781
24.897
11.4665
62.256
22.213
102.300
57.862
-2.559
11.8282
P11
39
17
61
65
-2
131
91
-15
197
37
-45
119
P12
6
5
7
28
24
32
7
4
10
4
1
7
P13
5
3
7
9
6
13
8
7
9
2
1
4
P14
8
1
16
8
0
15
23
21
25
16
-9
40
P15
2
2
2
10
7
14
5
4
7
14
-2
30
P16
17
-6
39
153
-124
431
146
-109
401
121
-232
473
77
A média e o desvio-padrão da amostra foram obtidos da previsão realizada para os
meses de maio, junho e julho de 2007 de cada produto, portanto, o n (tamanho da amostra) é
igual a 3.
Percebe-se na Tabela 4.19 que o método atual obteve um melhor desempenho para os
produtos P1, P2, P7, P9, P10 e P21, enquanto, o método de Box-Jenkins se destacou para os
produtos P3 e P11, e os demais foram atendidos pela Rede Neural. Na Tabela 4.20, o método
atual apresentou um desempenho melhor para os produtos P12, P14, P15 e P16, sendo que
nos demais produtos a Rede Neural obteve melhor desempenho.
Novamente observaram-se sobreposições ou interseções entre os intervalos de
confiança, indicando alguns valores em comum. Construíram-se gráficos com esses
intervalos, para os dois conjuntos de produtos, contra um eixo comum para verificar esta
interseção, como apresentados nas Figuras 4.13 e 4.14. Se não houvesse sobreposição dos
intervalos, então seria possível afirmar ter-se, pelo menos, 95% de confiança de que as
verdadeiras médias não são iguais.
-200 -160 -120 -80 -40 0 40 80 120 160 200 240 280 320 360 400
P1
P4
P7
P10
P13
P16
P19
P22
P25
P28
Método Atual Holt-Winters Box-Je nkins
Rede Neural
Figura 4.13: Interseção dos intervalos de confiança para os produtos da Categoria 1.
78
-300 -200 -100 0 100 200 300 400 500 600 700 800 900 1000 1100 1200
P1
P2
P3
P4
P5
P6
P7
P8
P9
P10
P11
P12
P13
P14
P15
P16
Método Atual Holt-Winters Box-Jenkins Rede Neural
Figura 4.14: Interseção dos intervalos de confiança para os produtos da Categoria 2.
As sobreposições nas medidas obtidas do intervalo de confiança indicam que não
diferença significativa entre as medidas de alguns produtos. O que indica que os métodos de
previsão atendem de forma adequada o processo de previsão para os produtos, contudo ao
considerar-se a média, o desvio-padrão da amostra e os limites do intervalo de confiança, a
Rede Neural apresenta os melhores resultados para a maioria dos produtos das duas
categorias, devido ao critério do menor erro, conforme indicando nas Tabelas 4.19 e 4.20.
Como análise estatística para a comparação dos erros entre os métodos, com base nas
Tabelas 4.15 e 4.16, mantendo a exclusão dos produtos que distorcem os resultados dos
métodos analisados, foi realizado um teste de hipóteses de médias através da análise de
variância (ANOVA) e da comparação múltipla entre médias (Tukey).
A ANOVA é um procedimento utilizado para comparar três ou mais tratamentos, a
qual se baseia na decomposição da variação total da variável resposta em partes que podem
ser atribuídas aos tratamentos (variância entre) e ao erro experimental ou resíduo (variância
dentro). Essa variação pode ser medida por meio das somas de quadrados definidas para cada
um dos componentes, as quais podem ser organizadas em uma tabela, como apresentado na
Tabela 4.21.
A utilização da ANOVA pode ser sintetizada por três procedimentos:
Formulação das hipóteses;
Estabelecimento do nível de significância;
Validação da hipótese.
79
Tabela 4.21: Análise de variância (ANOVA).
Fonte de Variação
Soma dos
Quadrados
Graus de
Liberdade
Média dos
Quadrados Teste F Pr (> F); valor-p
Entre Grupos SQG k-1 MQG MQG/MQR
Dentro dos Grupos
SQR n-k MQR
Total SQT n-1
As hipóteses formuladas para esta análise foram baseadas no EAMP entre os métodos
de previsão, onde:
H
0
: E
M1
=E
M2
=E
M3
=E
M4
H
1
: há alguma diferença
No teste de hipótese pode-se deparar com dois tipos de erros:
Erro tipo I – consiste em rejeitar H
0
, sendo que H
0
é verdadeira;
Erro tipo II – consiste em aceitar H
0
, sendo que H
0
é falso.
A probabilidade da ocorrência do erro tipo I é denominada, no teste de hipótese, como
nível de significância (α). O nível de significância determinado para esta análise é de 5%, o
que consiste em dizer que existe uma probabilidade de 5% dos dados possuírem H
0
e serem
considerados como H
1
.
A decisão de rejeitar a hipótese H
0
consiste numa comparação do valor F calculado
com o F crítico correspondente ao nível de significância (α) adotado. Também podem ser
comparados o p-value do F calculado e o nível de significância (α). Convém lembrar que esse
teste é válido se os pressupostos assumidos para os erros do modelo estiverem satisfeitos.
Nas Tabelas 4.22 e 4.23 são apresentados os resultados da análise de variância,
obtidos por meio da utilização do pacote estatístico R, para as duas categorias em estudo.
Como o F calculado é maior que o F crítico, para as duas categorias, o teste é significativo, ou
seja, a hipótese H
0
é rejeitada a favor da hipótese alternativa ao risco de 5%.
80
Tabela 4.22: Análise de variância por categoria.
Categoria 1
Fonte de Variação
Soma dos
Quadrados
Graus de
Liberdade
Média dos
Quadrados Teste F Pr (> F); valor-p
Entre Grupos 28,565 3 9,522 13,789 1,35E-07
Dentro dos Grupos
69,052 100 0.691
Total 97,617 103
Categoria 2
Fonte de Variação
Soma dos
Quadrados
Graus de
Liberdade
Média dos
Quadrados Teste F Pr (> F); valor-p
Entre Grupos 13,448 3 4,483 3,1998 3,01E-02
Dentro dos Grupos
78,454 56 1,401
Total 91,902 59
Como diferenças significativas entre os grupos, ou seja, observa-se que a MQG é
maior do que a MQR, o que indica uma forte variância entre os grupos, da mesma forma,
rejeita-se a hipótese nula. Para verificar e entender a diferença entre as médias foi elaborado o
gráfico box plot, no qual a comparação entre os traços centrais das “caixas”, que representam
o valor mediano do método, possibilitam visualizar onde estão localizadas as diferenças.
Figura 4.15: Box plot da Categoria 1.
M1 M2 M3 M4
1 2 3 4 5
81
Figura 4.15: Box plot da Categoria 2.
Como pode ser observado na Tabela 4.22 e nas Figuras 4.14 e 4.15
23
, houve diferença
significativa dos erros em relação aos métodos, o que exige a aplicação de um teste
complementar para verificar quais grupos são diferentes, neste caso o teste de Tukey. O
procedimento é o de comparar as médias dos grupos para identificar qual ou quais grupos é ou
são diferente(s).
O teste de Tukey permite testar qualquer contraste, sempre, entre duas médias de
tratamentos, ou seja, não permite comparar grupos entre si. O teste baseia-se na Diferença
Mínima Significativa (DMS). O nível de significância (α) para o teste será de 5%.
Como o teste de Tukey é de certa forma, independente do teste F, é possível que,
mesmo sendo significativo o valor de F calculado, não se encontre diferenças significativas
entre contrastes de médias. Se o contraste for maior do que a Diferença Mínima Significativa
(DMS), então as médias diferem ao nível de significância (α).
As Tabelas 4.24 e 4.25 apresentam os resultados do teste de Tukey, implementados no
pacote estatístico R.
23
Devido à sobreposição dos dados ocorrida durante a análise do intervalo de confiança, utilizou-se para as
Figuras 4.14 e 4.15 uma escala logarítmica, visando proporcionar uma melhor visualização dos dados.
M1 M2 M3 M4
1 2 3 4 5 6
82
Tabela 4.23: Comparação múltipla entre médias por categoria.
Categoria 1
Métodos Diferença Limite Superior Limite Inferior p Ajustado
M2-M1 0,005438 -0,596728 0,607603 0,999995
M3-M1 -0,279309 -0,881474 0,322857 0,620789
M4-M1 -1,272031 -1,874196 -0,669865 0,000002
M3-M2 -0,284747 -0,886912 0,317419 0,605900
M4-M2 -1,277469 -1,879634 -0,675303 0,000001
M4-M3 -0,992722 -1,594887 -0,390557 0,000224
Categoria 2
Métodos Diferença Limite Superior Limite Inferior p Ajustado
M2-M1 0,687283 -0,457132 1,831698 0,392414
M3-M1 0,484042 -0,660373 1,628457 0,678873
M4-M1 -0,538527 -1,682943 0,605888 0,600635
M3-M2 -0,203241 -1,347656 0,941174 0,965285
M4-M2 -1,22581 -2,370226 -0,081395 0,031306
M4-M3 -1,022569 -2,166985 0,121846 0,095655
As colunas métodos, das tabelas acima, representam modelos de previsão analisados
nesta pesquisa, ou seja, método atual da empresa (M1), Holt-Winters (M2), Box-Jenkins (M3)
e Rede Neural Artificial (M4). O teste de Tukey indicou que para a Categoria 1 e 2 a Rede
Neural Artificial apresentou diferença significativa, ou seja, rejeita a hipótese H
0
em
comparação com todos os outros métodos utilizados.
Após a realização deste teste e analisando, novamente as Figuras 4.14 e 4.15, que
fornecem uma visualização clara e rápida da variabilidade dos erros dos métodos e da
distribuição de seus dados, comparando-os entre si, percebe-se que o método M4 (Rede
Neural Artificial) possui um desempenho melhor, o que foi verificado quando da análise
realizada com base na média, no desvio-padrão da amostra e nos limites do intervalo de
confiança.
Desta forma, os principais resultados obtidos indicam que o método atualmente
utilizado pela empresa é adequado. Entretanto, os outros métodos de previsão analisados
seriam igualmente aplicáveis. Alguns deles apresentaram melhores resultados (previsões mais
exatas, erros menores), como é o caso dos métodos de previsão de rede neural artificial (o
melhor entre os três métodos analisados).
83
Capítulo 5
Comentários Finais
Esta pesquisa analisou três métodos de previsão para identificar os modelos mais
adequados para produtos de uma empresa do setor de perfumes e cosméticos. O método de
suavização exponencial, o método de Box-Jenkins e as redes neurais artificiais foram
implementados para definir, analisar e selecionar modelos de previsão. Através de um estudo
comparativo, a partir das previsões realizadas pelo método atual, da demanda real da empresa
e das previsões realizadas com os métodos considerados foi verificada a eficiência de cada
método definida pelo erro absoluto médio percentual (EAMP) e o sinal de rastreabilidade
(TS).
As duas categorias de produtos utilizadas têm um impacto significativo nos custos e
investimentos da empresa em questão. O comportamento sazonal apresentado por estas
categorias, dificulta a previsão da demanda, afetando a eficiência da cadeia produtiva da
empresa, uma vez que a previsão é fundamental para o planejamento da produção e para o
início do processo de suprimento. Os efeitos que os erros ocasionam na previsão podem levar
ao não atendimento da demanda, atraso neste atendimento e/ou excesso de estoques. Estas
condições aumentam os custos do produto e afetam a lucratividade do negócio.
A busca pelo método mais adequado, teve o objetivo de minimizar tais efeitos que os
erros de previsões têm gerado na empresa. Desta forma, quanto maior a acuracidade da
previsão da demanda menor serão os impactos no nível de atendimento e custos na cadeia de
suprimento. Como tratado no desenvolvimento desta pesquisa, o não atendimento destas
condições aumentam os custos do produto e afetam a lucratividade do negócio.
Os resultados obtidos indicam que o procedimento metodológico utilizado mostrou-se
adequado a proposta deste estudo. O processo de identificação dos métodos mais adequados,
84
de maneira geral, possibilitou a obtenção de modelos que não apresentavam nenhum viés
significativo, ou seja, as previsões não foram subestimada ou superestimada e os erros de
previsão ficaram muito próximos do método utilizado pela empresa e da demanda real.
Os métodos utilizados, tanto os tradicionais como o de inteligência artificial, tiveram
um bom desempenho em termos de previsão, pois os resultados, na sua maioria, ficaram
muito próximos e a avaliação do desempenho, devido às sobreposições das medidas, levam a
afirmar que não diferença significativa entre estas medidas. O que indica que os métodos
de previsão, considerados nesta pesquisa, atendem de forma adequada o processo de previsão
para os produtos.
Contudo, a sobreposição das medidas tornou-se um problema que levou a realização
de um critério de desempate que foi baseado no intervalo de confiança, considerando a média
e desvio-padrão da amostra, para a análise da categoria onde a Rede Neural teve um
desempenho melhor, ou seja, o menor erro proporcionado. E a análise por produto
possibilitou verificar que a utilização de métodos de previsão estocásticos, tal como o método
Box-Jenkins e os métodos de previsão determinísticos, como o Holt-Winters, informaram
estimativas aproximadas da realidade, podendo ser utilizados para determinados produtos.
Como a previsão de demanda é uma atividade importante no apoio à determinação dos
recursos necessários para o gerenciamento logístico da empresa em estudo. Esta análise
permitiu avaliar o método de previsão atual e os possíveis pontos, ou melhor, produtos em que
os modelos estimados podem auxiliar na melhoria do processo de previsão. A sobreposição
verificada pode ser à base de trabalhos futuros, onde uma metodologia de pesquisa diferente
possa trabalhar com este “fenômeno”.
Como este trabalho baseou-se exclusivamente no comportamento histórico da
demanda, muitos eventos especiais que podiam incidir futuramente sobre o processo gerador
dos dados foram desconsiderados. Uma pesquisa explicativa, com método experimental, pode
ser a continuação deste estudo, devido à possibilidade de manipulação das variáveis que este
tipo de pesquisa oferece, proporcionando o entendimento entre as causas e efeitos destes
eventos.
Seria oportuno, também, incorporar métodos que contemplem a avaliação e
experiência dos participantes do sistema, de forma a corrigir a previsão para atender a eventos
que não venham ocorrendo. Neste sentido, percebe-se que a existência de um setor de análises
estatísticas que poderia estar relacionado diretamente ao sistema integrado de gestão
85
empresarial é um fator importante no tratamento destes dados.
É importante salientar que este trabalho não tem a pretensão de estabelecer que as
redes neurais artificiais, apresentam-se como o melhor método de realização de previsão de
valores futuros de série temporais. Entretanto, pelos resultados apresentados, pode-se dizer
com certa confiança que elas são uma ferramenta poderosa para a realização de previsão de
séries temporais, capazes de realizar previsões com o mesmo nível de precisão ou, em alguns
casos, até maior que os modelos de ries temporais clássicos considerados nesta pesquisa.
Este fato é evidenciado nos casos em que métodos clássicos de previsão não conseguem
resultados bons devido a não linearidades, então, as redes neurais artificiais podem obter um
desempenho mais significativo em termos de previsão.
O que se percebe é que a principal dificuldade na utilização de redes neurais artificiais
para a previsão de séries temporais, ainda é a determinação da arquitetura ótima da rede. Nos
vários trabalhos consultados durante a pesquisa bibliográfica, observa-se que ainda não se
dispõe de uma metodologia consistente que apresente a melhor configuração da rede para
cada série proposta, em especial, em relação à determinação do número de neurônios da
camada intermediária.
Como os sistemas de previsão da demanda são utilizados para reduzir o risco inerente
a processos decisórios. O risco será tanto menor quanto maior for o grau de precisão
associado às previsões. Este aumento na acurácia da previsão acarreta na diminuição das
perdas financeiras resultantes da incerteza no processo decisório. Desta maneira, como
sugestão para trabalhos futuros, pode-se destacar:
Utilização de outras metodologias de séries temporais, tais como: à
metodologia estrutural de Harvey ou a metodologia Bayesiana de West e Harrison.
A abordagem de modelos dinâmicos, pois se verificou que os dados necessitam
incorporar outras informações como o conhecimento qualitativo de outros agentes envolvidos
no processo de previsão, fornecendo um conhecimento a priori mais apurado e com um
horizonte de tempo menor.
A utilização de métodos híbridos para o processo de previsão.
A combinação de redes neurais com outros métodos de previsão, visando uma
cooperação com o objetivo de proporcionar uma previsão mais acurada;
Uma análise de como o ciclo de vida do produto afeta no processo de previsão
de empresas com produtos sazonais. Associado com a manutenção de estoque e o custo de
86
produção, onde poderiam ser analisadas as questões de tempo do ciclo de vida do produto,
tamanho do lote de compra e produção e o seu custo de produção. Realizando uma avaliação
se seria viável a continuidade da produção a partir de um determinado ponto do ciclo de vida
do produto, antes de criar um estoque de insumos que eventualmente não seriam totalmente
utilizados, acarretando um custo adicional ao processo produtivo da empresa em estudo.
Torna-se necessário salientar que o cálculo e acompanhamento dos erros de previsão
são necessários para o processo de manutenção e monitoramento das previsões geradas. Desta
forma, existe a necessidade de acompanhamento do desempenho do modelo de previsão para
que se possa confirmar sua validade e mantê-lo atualizado. Desta maneira, torna-se evidente
que se deve priorizar a utilização de modelos de previsão que gerem o menor erro no tempo.
Esse procedimento assegura maior segurança na seleção de modelos com fins preditivos que
possuam maior grau de acurácia.
Como observação final, é importante salientar que o R como um conjunto integrado de
facilidades em software para manipulação de dados e análises estatísticas, apresentou-se
adequado, pois a utilização do mesmo se deu em todo o processo de análise e comparação dos
métodos de previsão. As técnicas clássicas de análise estatística estão incorporadas na base do
ambiente R, e novas técnicas são oferecidas como “pacotes”, o que permite a este software ser
estendido facilmente, abrangendo um vasto leque de estatísticas modernas, bem como, ter-se
acesso às atualizações mais recentes.
87
Referências Bibliográficas
[AGU04] AGUIRRE, L. A. Introdução à identificação de sistemas: cnicas lineares e não-
lineares aplicadas a sistemas reais. 2. ed. Belo Horizonte: Editora UFMG, 2004.
[ASH02] ASHBY, M. How to write a paper. Cambridge: Engineering Department,
University of Cambridge, 2002, v. 5, 38 f.
[AZE99] AZEVEDO, F. M. Redes neurais e suas aplicações. In: ESCOLA DE REDES
NEURAIS. CONSELHO NACIONAL DE REDES NEURAIS, 5, São José dos
Campos, 1999. Anais. São José dos Campos: ITA, 1999.
[BAL01] BALLOU, Ronald H. Gerenciamento da cadeia de suprimentos: planejamento,
organização e logística empresarial. 4. ed. Porto Alegre: Bookman, 2001.
[BAR03] BARBIERO, Claudia C. M. Séries Temporais: um estudo de previsão para a
receita operacional da ECT Empresa Brasileira de Correios e Telégrafos.
Dissertação de Mestrado em Engenharia de Produção Faculdade de Engenharia de
Produção, Universidade Federal de Santa Catarina, Florianópolis, 2003.
[BAU04] BAUCHSPIESS, Adolfo. Introdução aos sistemas inteligentes: aplicações em
engenharia de redes neurais artificiais, lógica fuzzy e sistemas neuro-fuzzy. Disponível
em: < http://www.ene.unb.br/adolfo/ISI >. Acesso em: 20 julho 2006.
[BIT08] BITTENCOURT, Guilherme. Inteligência computacional. Disponível em: <
http://www.das.ufsc.br/gia/softcomp/softcomp.html >. Acesso em: 10 abril 2008.
[BEA99] BEAMON, B. Measuring supply chain performance. University of Washington:
International Journal of Operations and Production Management. v. 19, n. 3, p. 275-
292, 1999.
88
[BEL91] BELTRÃO, K. I. Séries temporais no domínio da freqüência: uma introdução.
Escola de Séries Temporais e Econometria, UFRJ. 1991.
[BER98] BERTO, R.; NAKANO, D. Metodologia da pesquisa e a engenharia de produção.
In: ENCONTRO NACIONAL DE ENGENHARIA DE PRODUÇÃO, 18., Niterói,
1998. Anais... Niterói: UFF/ABEPRO, 1998.
[BER02] BERTRAND, J.; FRANSOO, J. Operations management research methodologies
using quantitative modeling. International Journal of Operations and Production
Management. v. 22, n. 2, p. 241-264, 2002.
[BIL06] BILLAH, B.; KING, M.; SNYDER, R.; KOEHLER, A. Exponential smoothing
model selection for forecasting. Amsterdam: International Journal of Forecasting. v.
22, n. 2, p. 239-247, abr./jun. 2006.
[BOU95] BOUMA, G.; ATKINSON, G. A handbook of social science research: a
comprehensive and practical guide for students. New York: Oxford, 1995.
[BOW01] BOWERSOX, Donald J.; CLOSS, David J. Logística empresarial: o processo de
integração da cadeia de suprimento. São Paulo: Atlas, 2001.
[BOX94] BOX, George E.;JENKINS, Gwilym M.; REINSEL, Gregory C. Time series
analysis: forecasting and control. 3. ed. Englewood Cliffs: Prentice Hall, 1994.
[BRI01] BRILLINGER, David R. Time series: data analysis and theory. Philadelphia: Siam,
2001.
[BRY89] BRYMAN, A. Research methods and organization studies. London: Unwin
Hyman, 1989.
[CAL01] CALEGARE, Álvaro José de Almeida. Introdução ao delineamento de
experimentos. São Paulo: Edgard Blücher, 2001.
89
[CAL02] CALÔBA, Guilherme M.; CALÔBA, Luiz P.; SALIBY, Eduardo. Cooperação
entre redes neurais artificiais e técnicas “clássicas” para previsão de demanda de
uma série de vendas de cerveja na Austrália. Pesquisa Operacional, Rio de Janeiro, v.
22, n. 3, p. 345-358, abr./dez. 2002.
[CER02] CERVO, L. A.; BERVIAN, P. A. Metodologia científica. 5. ed. São Paulo: Pearson
Prentice Hall, 2002.
[CHA03] CHAN, T. S.; QI, H. J.; LAU, C. W.; IP, W. L. A conceptual model of performance
measurement for supply chains. Management Decision. v. 41, n. 7, p. 635-642, 2003.
[CHO03] CHOPRA, Sunil; MEINDL, Peter. Gerenciamento da cadeia de suprimentos:
estratégia, planejamento e operações. São Paulo: Prentice Hall, 2003.
[COE03a] COELHO, L. S.; TRAUTWEIN JR., B.; VIEIRA, G. E. Avaliação de redes
neurais e ajustamento exponencial aplicados à previsão de consumo de água a
curtíssimo prazo. In: CONGRESSO BRASILEIRO DE REDES NEURAIS, 7, São
Paulo, 2003. Anais... São Paulo: Congresso Brasileiro de Redes Neurais, 2003.
[COR04] CORRÊA, Henrique L. Administração de produção e operações: manufatura e
serviços: uma abordagem estratégica. São Paulo: Atlas, 2004.
[COR05] CORRÊA, Henrique L. Supply chain management in Latin America: the Brazilian
pharmaceutical industry case. Disponível em: < http://www.celog.fgvsp.br/artigos.asp
>. Acesso em: 1 dezembro 2005.
[COS05] COSTA, Sérgio E. G. Definições metodológicas e métodos de pesquisa. Disponível
em: < http://www.pucpr.br/eureka >. Acesso em: 1 julho 2005.
[DAV01] DAVIS, Mark M.; AQUILANO, Nicholas J.; CHASE, Richard B. Fundamentos da
administração da produção. 3. ed. Porto Alegre: Bookman, 2001.
90
[DOR00] DORNIER, Philippe-Pierre, et al. Logística e operações globais: textos e casos.
São Paulo: Atlas, 2000.
[DOW99] DOWNING, Douglas; CLARK, Jeffrey. Estatística aplicada. São Paulo: Saraiva,
1999.
[EAS91] EASTERBY-SMITH, M.; THORPE, R.; LOWE, M. Management research: an
introduction. London: Sage, 1991.
[EHL05] EHLERS, Ricardo S. Análise de séries temporais. Disponível em: <
http://www.est.ufpr.br/~ehlers/notas >. Acesso em: 20 julho 2006.
[EST03] ESTEVES, Gheisa R. T. Modelos de previsão de carga de curto prazo. Dissertação
de Mestrado em Engenharia de Elétrica Faculdade de Engenharia de Elétrica,
Pontifícia Universidade Católica do Rio de Janeiro, Rio de Janeiro, 2003.
[FAC03] FACHIN, Odília. Fundamentos de metodologia. 4. ed. São Paulo: Saraiva, 2003.
[FER95] FERNADES, L. G.; PORTUGAL, M. S.; NAVAUX, P. O. Previsão de séries de
tempo: redes neurais artificiais e modelos estruturais. Pesquisa e Planejamento
Econômico, Rio de Janeiro, v. 26, n. 2, p. 253-276, ago. 1996.
[FOG03] FOGLIATTO, Flávio Sanson. Previsão da demanda. DEPROT, UFRGS, p. 01-62,
2003. Disponível em: < http://www.producao.ufrgs.br >. Acesso em: 14 julho 2006.
[GIL02] GIL, Antônio C. Como elaborar projetos de pesquisa. 4. ed. São Paulo: Atlas, 2002.
[GIL06] GILLILAND, M. Is forecasting a waste of time. Disponível em: <
http://www.manufacturing.net/scm >. Acesso em: 14 julho 2006.
[GOM00] GOMES, Frederico Pimentel. Curso de estatística experimental. 14. ed. Piracicaba:
ESALQ, 2000.
91
[HAN01] HANKE, John E.; WICHERN, Dean W.; REITSCH, Arthur G. Business
forecasting. 7. ed. New York: Prentice Hall, 2001.
[HAR05] HARVILL, J.; RAY, B. A note on multi-step forecasting with functional coefficient
autoregressive models. Amsterdam: International Journal of Forecasting. v. 21, n. 4, p.
717-727, out./dez. 2005.
[HAY99] HAYKIN, Simon. Neural networks: a comprehensive foundation. 2. ed. Englewood
Cliffs, New Jersey: Prentice Hall, 1999.
[HAY01a] HAYKIN, Simon. Redes neurais: princípios e prática. 2. ed. Porto Alegre:
Bookman, 2001.
[HAY01b] HAYKIN, Simon; VEEN, Barry Van. Sinais e sistemas. Porto Alegre: Bookman,
2001.
[HYN02] HYNDMAN, R. J.; KOEHLER, A. B.; SNYDER, R. D.; GROSE, S. A state space
framework for automatic forecasting using exponential smoothing methods.
International Journal of Forecasting. v. 18, n. 3, p. 439-454, jul./set. 2002.
[JUN06] JUNG, R.; TREMAYNE, A. Coherent forecasting in integer time series models.
Amsterdam: International Journal of Forecasting. v. 22, n. 2, p. 223-238, abr./jun.
2006.
[KAZ04] KAZMIER, Leonard J. Estatística aplicada á economia e administração. São
Paulo: Pearson Makron Books, 2004.
[KEN76] KENDALL, M. Time series. 2. ed. London: Charles Griffin e Co. Ltd., 1976.
[KUH70] KUHN, T. The structure of scientific revolutions. 2. ed. Chicago: University of
Chicago, 1970.
92
[LAK91] LAKATOS, E.; MARCONI, M. Metodologia científica. 2. ed. São Paulo: Atlas,
1991.
[LEV00] LEVINE, M. D.; BERENSON, M. L.; STEPHAN, D. Estatística: teoria e
aplicações – usando Microsoft Excel. Rio de Janeiro: Editora LTC,2000.
[LIM04] LIMA, Fabiano Guasti. Um método de análise e previsão de sucessões cronológicas
unidimensionais lineares e não-lineares. Tese de Doutorado em Administração –
Faculdade de Economia, Administração e Contabilidade, Universidade de São Paulo,
São Paulo, 2004.
[LOP04] LOPES, Luiz A. Previsão da demanda com planilha eletrônica. Revista
Tecnologística, São Paulo, v. 9, n. 101, p. 79-81, abr. 2004.
[LOP03] LOPES, Ricardo D. Modelos de previsão para uma série temporal de produção de
veículos automotores. Revista de Administração Nobel, Maringá, n. 1, p. 27-36,
jan./jun. 2003.
[MAK89] MAKRIDAKIS, S. G.; WHEELWRIGHT, S. C. Forecasting methods for
management. New York: John Wiley & Sons, 1989.
[MAK90] MAKRIDAKIS, S. G. Forecasting planning and strategy for the 21st century. New
York: The Free Press, 1990.
[MAK98] MAKRIDAKIS, S. G.; WHEELWRIGHT, S. C.; HYNDMAN, R. J. Forecasting
methods and applications. 3. ed. New York: John Wiley & Sons, 1998.
[MAR04] MARCONI, Marina de Andrade; LAKATOS, Eva Maria. Metodologia científica.
4. ed. São Paulo: Atlas, 2004.
[MON03] MONTGOMERY, Douglas C.; RUNGER, George C. Estatística aplicada e
probabilidade para engenheiros. 2. ed. Rio de Janeiro: LTC, 2003.
93
[MOR81] MORETTIN, Pedro A.; TOLOI, Clélia M. Modelos para previsão de séries
temporais. Rio de Janeiro: Impa, 1981.
[MOR87a] MORETTIN, Pedro A.; TOLOI, Clélia M. Séries temporais. 2. ed. São Paulo:
Atual, 1987.
[MOR87b] MORETTIN, Pedro A.; TOLOI, Clélia M. Previsão de séries temporais. 2. ed.
São Paulo: Atual, 1987.
[MOR04] MORETTIN, Pedro A.; TOLOI, Clélia M. Análise de séries temporais. São Paulo:
Edgard Blücher, 2004.
[NAK96] NAKANO, D.; FLEURY, A. Métodos de pesquisa em engenharia de produção. In:
ENCONTRO NACIONAL DE ENGENHARIA DE PRODUÇÃO, 16., Piracicaba,
1996. Anais... Piracicaba: UNIMEP, 1996.
[NEV08] NEVES, Rogério Perino de Oliveira. Introdução aos princípios conexionistas.
Disponível em: < http://cognitio.incubadora.fapesp.br/portal/producao/ >. Acesso em:
1 julho 2005.
[OLI02] OLIVEIRA, Gilson A. Sistema de Controle de Estoques Utilizando a Metodologia
Box & Jenkins de Series Temporais. Dissertação de Mestrado em Métodos Numéricos
em Engenharia – Universidade Federal do Paraná, Curitiba, 2002.
[OLI03] OLIVEIRA, Mauri A.; FAVERO, Luiz P. Uma breve descrição de algumas técnicas
para análise de séries temporais: séries de Fourier, wavelets, Arima, modelos
estruturais para séries de tempo e redes neurais. São Paulo: USP, 2003. 13 p. Ensaio.
[PAC03] PACHECO, Ricardo F.; SILVA, Alisson F. Aplicação de modelos quantitativos de
previsão em uma empresa de transporte ferroviário. In: ENCONTRO NACIONAL
DE ENGENHARIA DE PRODUÇÃO, 23., Ouro Preto, 2003. Anais... Ouro Preto:
XXIII Encontro Nacional de Engenharia de Produção, 2003.
94
[PEG69] PEGELS, C. C. Exponential forecasting: some new varations. Management Science,
New York, v. 12, n. 5, p. 311-315, jan. 1969.
[PEL00] PELLEGRINI, Fernando R.; FOGLIATTO, Flávio S. Estudo comparativo entre os
modelos de Winters e de Box-Jenkins para previsão de demanda sazonal. Produto &
Produção, Porto Alegre, v. 4, n. especial, p. 72-85, abr. 2000.
[POL99] POLLOCK, D. S. G. A handbook of time-series analysis, signal processing and
dynamics. London: Academic Press, 1999.
[POP01] POPPER, Karl Raimund. A lógica da pesquisa cientifica. 9. ed. São Paulo: Cultrix,
2001.
[POR91] PORTER, Michael E. Estratégia competitiva: técnicas para analise de indústrias e
da concorrência. 5. ed. Rio de Janeiro: Campus, 1991.
[ROC03] ROCHA, Fábio Guimarães. Contribuição de Modelos de Séries Temporais para a
Previsão da Arrecadação de ISS. Dissertação de Mestrado em Economia Instituto de
Economia, Universidade Estadual de Campinas, Campinas, 2003.
[SAN01] SANTOS, Cláudia Cristina dos. Modelagem de bacias urbanas com redes neurais
artificiais. Dissertação de Mestrado em Engenharia Escola Politécnica, Universidade
de São Paulo, São Paulo, 2001.
[SCH05] SCHWARTZ, Jay D.; RIVERA, Daniel E.; KEMFT, Karl G. Towards control-
relevant forecasting in supply chain management. In: AMERICAN CONTROL
CONFERENCE, 2005, Portland. Proceedings... Portland: American Control
Conference, 2005, p.202-207.
[SIL01] SILVA, Edna Lúcia da. Metodologia da pesquisa e elaboração de dissertação. 3. ed.
rev. atual. Florianópolis: Laboratório de Ensino a Distância da UFSC, 2001.
95
[SIL03] SILVA, C. S. Previsão multivariada da demanda horária de água em sistemas
urbanos de abastecimento. Tese de Doutorado em Administração – Faculdade de
Economia, Administração e Contabilidade, Universidade de São Paulo, São Paulo,
2003.
[SIL02] SILVEIRA, Daniela M.; NICOLAU, André M. O impacto da previsão de demanda
nas operações de campo dos vendedores em empresas de venda direta. ABEVD,
Edição 2002, p. 01-23, 2002. Disponível em: < http://www.abevd.org.br/htdoc >.
Acesso em: 14 julho 2006.
[SIL00] SILVERMAN, D. Doing qualitative research: a practical handbook. London: Sage,
2000.
[SIM00] SIMCHI-LEVI, D.; KAMINSKY, P.; SIMCHI-LEVI, E. Designinig and managing
the supply chain: concepts, strategies and case studies. Boston: McGraw-Hill, 2000.
[SIM02] SIMCHI-LEVI, D.; SIMCHI-LEVI, L.; WATSON, M. Tactical planning for
reinventing the supply chain. University of Cambridge; Massachusetts Institute of
Technology, USA, 2002.
[SIM03] SIMCHI-LEVI, David; KAMINSKY, Philip; SIMCHI-LEVI, Edith. Cadeia de
suprimentos: projeto e gestão. Porto Alegre: Bookman, 2003.
[SLA02] SLACK, Nigel; CHAMBERS, Stuart; JOHNSTON, Robert. Administração da
produção. 2. ed. São Paulo: Atlas, 2002.
[SOU05] SOUZA, Gueibi P. Previsão do consumo industrial de energia elétrica no estado de
Santa Catarina: uma aplicação da combinação de previsões entre modelos
univariados e de regressão dinâmica. Dissertação de Mestrado em Engenharia de
Produção – Faculdade de Engenharia de Produção, Universidade Federal de Santa
Catarina, Florianópolis, 2005.
96
[TAY06] TAYLOR, J.; MENEZES, L.; MCSHARRY, P. A comparison of univariate
methods for forecasting electricity demand up to a day ahead. Amsterdam:
International Journal of Forecasting. v. 22, n. 2, p. 01-16, jan./mar. 2006.
[THI98] THIOLLENT, M. Metodologia da pesquisa-ação. 8. ed. São Paulo: Cortez, 1998.
[THI03] THIOLLENT, Michel. Metodologia da pesquisa-ação. 12. ed. São Paulo: Cortez,
2003.
[TRA04] TRAUTWEIN JR., Breno. Avaliação de métodos para previsão de consumo de
água para curtíssimo prazo: um estudo de caso em empresa de saneamento.
Dissertação de Mestrado em Engenharia de Produção e Sistemas – Faculdade de
Engenharia de Produção e Sistemas, Pontifícia Universidade Católica do Paraná,
Curitiba, 2004.
[TRA05] TRAUTWEIN JR., Breno; VIEIRA, Guilherme E. Análise de modelos de ajuste
exponencial para a previsão de consumo de curtíssimo prazo como apoio no
planejamento da operação de um sistema de distribuição de água. In: CONGRESSO
BRASILEIRO DE ENGENHARIA SANITÁRIA E AMBIENTAL, 23., Campo
Grande, 2005. Anais... Campo Grande: ABES, 2005.
[UNI96] UNIVERSIDADE FEDERAL DO PARANÁ. Biblioteca Central. Normas para
apresentação de trabalhos: referências bibliográficas. 6. ed. Curitiba, 1996, v.6.
[WER03] WERNER, Liane; RIBEIRO, Jo L. Previsão de demanda: uma aplicação dos
modelos Box-Jenkins na área de assistência técnica de computadores pessoais. Gestão
& Produção, São Paulo, v. 10, n. 1, p. 47-67, abr. 2003.
[YIN01] YIN, Robert K. Estudo de caso: planejamento e métodos. 2. ed. Porto Alegre:
Bookman, 2001.
97
ANEXO A
Dados Históricos
98
Categoria 1 (Realizado)
Produtos
Período
P1 P2 P3 P4 P5 P6 P7 P8 P9 P10 P11 P12 P13 P14
05/2004
30.278
39.341
80.326 60.282 23.261
47.681
33.354
82.256 23.200
33.789
40.735
39.136
5.783 33.091
06/2004
11.754
13.748
30.258 19.423 6.039 17.985
10.781
33.922 11.491
14.067
14.221
12.810
3.097 7.628
07/2004
11.107
16.734
32.151 18.751 5.508 18.419
11.312
42.010 13.837
11.047
14.108
12.151
3.585 6.682
08/2004
15.350
16.127
40.567 27.561 7.013 24.843
14.192
34.953 11.456
12.299
19.410
14.782
4.147 8.414
09/2004
17.225
22.822
56.299 34.405 9.475 29.269
19.131
46.581 13.841
11.751
24.988
19.608
4.583 10.567
10/2004
26.288
35.404
82.658 54.357 17.811
41.242
29.757
87.574 22.503
21.503
39.455
32.322
7.167 26.655
11/2004
45.833
59.492
133.127
91.358 40.349
66.925
50.111
173.751
42.183
45.886
57.446
66.696
13.598
62.324
12/2004
14.202
18.191
46.338 34.108 11.772
26.071
15.652
40.530 10.943
13.424
20.961
18.534
6.067 17.677
01/2005
9.562 10.364
31.656 26.159 6.527 17.529
10.415
15.843 6.369 8.581 15.113
9.980 4.733 6.126
02/2005
9.097 11.021
29.777 20.002 5.528 15.963
9.755 16.531 6.235 7.750 15.271
9.038 4.640 6.153
03/2005
16.181
18.575
51.934 36.357 7.876 26.651
17.805
28.671 9.329 10.865
25.561
13.926
6.538 8.808
04/2005
28.325
29.486
92.774 61.868 17.723
47.271
32.217
67.917 20.094
27.438
43.561
27.327
8.764 22.214
05/2005
21.111
20.608
71.381 46.231 17.422
37.382
20.944
67.104 19.358
13.262
35.019
20.512
5.344 14.775
06/2005
15.486
15.833
49.253 37.004 11.993
27.238
16.500
38.146 14.844
8.904 26.813
13.356
3.109 9.716
07/2005
12.884
15.324
36.827 29.604 8.252 22.420
13.405
31.121 7.582 7.042 20.016
12.170
2.692 6.635
08/2005
14.162
15.315
41.680 31.547 7.623 24.044
14.482
27.336 8.893 10.214
19.899
12.603
2.780 8.664
09/2005
18.447
16.176
49.943 37.257 8.471 26.434
17.801
34.847 9.860 10.508
23.672
16.033
3.288 8.946
10/2005
21.748
24.860
74.772 47.211 14.730
35.132
25.150
74.249 18.375
18.143
36.846
25.836
6.000 16.165
11/2005
45.136
56.959
132.027
101.959
37.600
66.247
50.922
156.827
38.501
44.262
65.036
61.029
13.770
57.536
12/2005
12.155
13.791
30.188 33.152 9.006 20.163
13.652
33.008 8.653 9.412 18.317
12.183
5.853 11.486
01/2006
6.522 5.990 18.676 18.006 4.339 8.946 7.902 19.146 4.626 5.576 10.192
5.545 2.933 3.972
02/2006
8.478 9.323 26.995 20.310 3.825 12.953
9.525 18.542 5.101 5.842 14.335
6.773 2.418 3.542
03/2006
12.525
11.081
39.996 25.445 6.726 18.314
13.687
28.394 7.757 7.186 20.220
10.899
2.697 5.960
04/2006
23.406
20.620
86.924 57.314 15.030
41.123
27.098
68.526 17.418
16.613
43.066
24.920
6.126 20.742
05/2006
19.250
16.949
69.371 45.527 16.936
35.906
20.829
72.634 19.324
17.380
33.384
21.829
5.736 19.235
06/2006
12.946
9.187 29.573 22.350 5.952 17.640
11.095
22.815 6.515 5.209 16.335
11.593
3.545 7.957
07/2006
15.022
14.759
39.544 28.821 6.458 24.007
13.853
33.358 9.072 6.765 22.610
14.917
4.314 8.403
08/2006
17.926
17.110
48.791 37.994 8.587 28.390
17.152
45.193 13.317
10.696
22.736
19.916
4.839 12.023
09/2006
15.288
13.679
43.782 31.377 8.299 24.993
15.219
41.084 15.050
8.481 24.193
18.829
3.931 10.045
10/2006
25.011
25.247
84.076 58.033 14.879
41.794
26.497
65.801 15.810
12.671
41.114
25.784
6.178 18.554
11/2006
45.189
50.420
141.307
109.773
32.099
72.025
50.048
139.504
28.180
30.147
65.745
51.678
13.600
53.432
12/2006
12.974
15.602
47.669 32.199 10.740
26.372
15.109
40.905 10.680
9.691 23.969
17.311
5.445 17.190
01/2007
10.029
10.767
41.425 17.952 8.426 16.505
9.162 36.711 8.958 8.512 18.313
12.680
3.261 14.101
02/2007
9.774 10.457
37.880 17.129 6.207 17.402
9.536 27.064 8.711 6.299 17.898
10.118
2.081 9.471
03/2007
14.832
15.566
45.998 32.842 8.712 26.170
16.206
56.073 12.339
8.969 28.919
15.070
3.530 13.566
04/2007
29.800
26.793
90.070 60.987 17.645
47.469
30.100
71.763 20.253
17.802
52.768
29.774
5.680 25.284
05/2007
23.081
23.291
73.341 49.856 16.149
38.122
23.842
59.938 16 14.456
38.229
23.144
4.693 23.847
06/2007
13.140
12.781
47.266 31.134 7.981 21.973
13.804
36.240 1718 9.757 27.720
13.313
2.037 12.440
07/2007
14 16.788
39.135 23.470 7.920 19.028
13.699
15.902 0 1.456 21.607
13.428
2.720 9.368
Categoria 1 (Previsão)
Produtos
Período
P1 P2 P3 P4 P5 P6 P7 P8 P9 P10 P11 P12 P13 P14
05/2007
21.967
20.242
65.511 51.246 16.278
39.651
23.882
60.738 0 16.077
39.323
29.403
5.600 27.662
06/2007
13.548
12.187
40.587 30.410 7.526 20.318
13.562
40.385 0 7.377 22.051
14.970
3.081 13.389
07/2007
0 19.578
50.959 33.200 0 29.166
15.834
0 0 0 29.683
0 3.245 0
99
Categoria 1 (Realizado)
Produtos
Período
P15 P16 P17 P18 P19 P20 P21 P22 P23 P24 P25 P26 P27 P28
05/2004
35.678
88.389 41.363
34.257
47.336
61.679 37.321
29.840
50.457
29.216
9.152 37.385
40.283
7.768
06/2004
10.704
42.572 12.341
10.993
14.944
22.718 15.382
8.720 21.209
6.653 5.371 23.676
18.671
4.766
07/2004
10.925
46.807 14.133
10.819
11.614
23.029 13.622
7.493 18.593
5.246 5.093 21.909
32.011
5.122
08/2004
12.809
47.526 12.743
13.770
11.139
30.005 17.879
9.946 23.411
6.419 5.468 20.626
17.283
6.338
09/2004
16.905
51.709 19.312
19.917
16.428
38.441 23.154
15.519
31.072
11.008
5.787 25.226
18.500
7.730
10/2004
27.863
70.745 37.378
31.375
31.548
58.085 32.907
25.887
48.579
19.807
8.896 36.883
32.990
10.499
11/2004
53.554
138.591
75.389
53.888
59.659
98.639 58.866
43.120
81.406
39.237
18.848
61.058
60.617
19.333
12/2004
17.565
40.726 20.434
16.887
14.468
31.291 20.631
15.439
30.555
12.186
7.285 21.031
22.703
7.197
01/2005
11.470
32.583 14.944
12.493
6.740 24.302 16.947
10.037
32.601
6.608 6.491 14.791
13.912
7.118
02/2005
10.852
32.653 12.368
10.420
7.225 21.990 13.172
10.199
24.459
5.837 4.139 16.126
13.097
5.175
03/2005
18.437
54.989 20.648
17.293
13.222
32.608 22.313
14.817
35.685
9.375 6.002 14.490
20.116
7.669
04/2005
35.158
76.861 38.589
31.160
29.607
60.179 35.855
29.169
50.072
19.816
10.365
33.602
36.084
10.667
05/2005
24.415
63.519 35.827
18.899
20.004
42.555 25.975
21.109
38.368
10.387
6.578 18.470
32.049
7.755
06/2005
15.271
45.291 19.880
14.083
14.060
29.952 20.249
19.456
22.466
6.091 4.436 9.143 23.358
4.701
07/2005
12.240
41.658 13.047
12.526
12.163
24.947 17.667
11.110
19.542
4.586 4.237 6.774 18.367
4.937
08/2005
14.086
44.525 14.426
12.404
12.892
26.063 19.260
11.614
21.330
8.554 4.481 9.333 16.956
5.282
09/2005
18.859
62.007 21.679
14.031
16.913
34.830 25.695
15.012
30.647
7.420 5.521 8.611 21.290
5.357
10/2005
27.635
75.814 36.675
23.286
28.040
49.842 30.468
22.760
43.093
12.553
8.340 19.601
30.007
6.827
11/2005
57.526
141.662
75.187
51.531
57.188
100.220
60.817
45.229
80.880
34.437
16.670
47.431
60.937
17.569
12/2005
15.882
39.380 19.735
11.948
14.642
23.999 16.892
12.247
33.495
12.773
8.008 9.910 16.499
6.829
01/2006
12.214
28.244 15.649
4.967 7.877 12.782 13.931
6.890 22.640
4.594 3.743 2.820 11.835
2.296
02/2006
11.850
26.232 10.869
6.726 9.083 16.034 13.625
8.143 17.009
4.272 3.221 3.815 13.677
2.437
03/2006
14.196
50.308 14.253
9.324 12.545
21.482 15.986
12.145
19.473
5.130 4.434 4.131 18.007
2.660
04/2006
29.256
71.659 34.900
24.188
24.245
45.265 30.494
25.583
38.348
11.788
7.727 15.585
31.084
8.316
05/2006
21.494
60.298 26.184
14.656
19.225
41.903 26.341
20.449
30.196
7.901 7.781 12.363
30.893
6.440
06/2006
7.757 27.575 12.643
6.879 11.071
14.278 11.968
11.065
16.041
3.628 4.852 4.810 15.035
4.203
07/2006
8.930 32.170 18.621
8.851 12.917
18.754 14.821
14.791
17.555
4.219 5.926 7.251 21.348
5.886
08/2006
14.648
44.849 21.700
14.047
17.598
28.636 20.422
18.448
25.588
6.947 6.257 11.070
27.771
6.686
09/2006
11.571
34.403 19.490
10.811
15.021
20.826 16.174
16.369
18.175
5.779 5.703 8.643 26.097
6.389
10/2006
24.499
67.558 33.156
20.315
17.836
37.921 31.984
27.591
42.090
9.941 8.986 15.172
34.827
8.396
11/2006
56.893
131.782
78.476
45.993
45.023
88.787 60.764
45.447
83.355
20.407
16.992
26.232
61.296
16.572
12/2006
14.914
30.151 20.681
11.683
14.808
28.451 18.001
16.472
24.801
7.951 6.094 9.136 23.337
6.075
01/2007
7.270 21.014 13.342
4.694 11.021
14.193 11.852
11.078
16.591
4.289 3.827 5.479 16.137
3.777
02/2007
6.456 14.912 9.266 5.515 10.604
12.659 10.606
10.757
12.366
3.944 2.783 5.592 16.437
2.185
03/2007
12.225
53.267 14.948
10.149
13.456
21.022 18.196
16.724
22.039
5.608 4.999 7.955 24.147
3.880
04/2007
30.066
72.357 35.154
20.083
24.895
43.681 35.839
32.787
39.512
13.451
7.539 17.492
36.360
7.148
05/2007
22.665
46.000 26.140
14.929
20.771
36.842 24.629
25.269
32.807
9.307 6.812 15.001
31.547
5.743
06/2007
11.824
28.819 13.578
9.426 12.372
24.826 15.549
17.079
16.936
5.474 2.932 9.712 23.000
2.262
07/2007
11.124
32.062 11.389
11.967
14.289
22.243 3.140 13.674
14.671
3.485 4.203 7.177 21.770
2.738
Categoria 1 (Previsão)
Produtos
Período
P15 P16 P17 P18 P19 P20 P21 P22 P23 P24 P25 P26 P27 P28
05/2007
23.812
50.841
31.084
14.374
23.942
35.330
26.029
24.053
32.027
15.443
6.790
11.027
34.458
6.667
06/2007
11.373
25.806
14.181
12.309
13.455
16.324
13.818
20.012
21.548
6.558
4.217
5.968
19.757
4.043
07/2007
0
0
0
14.546
15.132
19.788
0
15.337
19.231
3.950
5.359
6.363
26.126
4.693
100
Categoria 2 (Realizado)
Produtos
Período
P1 P2 P3 P4 P5 P6 P7 P8 P9 P10 P11 P12 P13 P14 P15 P16
05/2004
42.897
55.706 23.304
55.151 34.336
68.277 30.272
9.124 39.799
29.230
22.027
33.818
37.001
9.903 61.264 45.680
06/2004
30.926
36.245 19.864
50.485 21.496
43.171 21.018
4.870 23.817
23.289
13.241
25.386
33.961
5.530 43.084 29.134
07/2004
42.473
54.625 36.216
54.569 36.961
60.006 28.099
7.927 44.590
38.481
22.630
32.252
39.936
11.400
60.176 47.847
08/2004
34.794
35.287 21.231
39.237 26.251
35.546 18.446
4.281 29.352
19.590
13.424
25.029
28.908
7.655 46.629 32.885
09/2004
36.247
41.651 22.591
45.067 28.289
42.977 19.799
5.153 30.742
19.824
16.181
27.292
30.333
7.174 49.133 37.418
10/2004
48.362
55.675 31.441
61.202 40.797
63.269 28.369
8.321 45.555
28.931
23.151
36.454
37.748
9.941 65.385 48.903
11/2004
85.491
102.163
60.009
122.732
86.654
111.170
53.761
15.281
96.716
53.748
44.834
63.534
67.272
19.389
115.347
98.524
12/2004
23.038
26.207 17.095
36.013 18.504
29.833 14.427
5.182 24.441
13.934
10.244
19.924
20.553
4.973 34.392 23.885
01/2005
19.244
15.735 11.002
22.918 10.197
18.201 8.862 2.626 11.866
9.846 6.028 17.221
15.729
1.689 28.368 14.634
02/2005
28.679
22.409 12.788
26.642 22.675
19.881 10.956
3.549 22.030
10.556
13.422
21.276
18.127
3.499 32.956 30.775
03/2005
28.154
29.391 16.290
38.579 27.098
35.019 15.381
4.335 27.035
15.562
16.775
23.943
24.309
2.066 38.446 39.560
04/2005
28.167
46.356 23.896
61.023 17.469
49.394 22.862
8.696 24.729
20.514
13.155
31.657
28.384
5.023 55.067 33.820
05/2005
33.209
47.714 25.797
53.074 19.831
53.947 23.693
8.537 29.692
28.022
13.511
33.854
31.947
5.755 57.390 39.661
06/2005
24.431
40.408 23.628
45.465 19.242
43.911 20.939
5.509 21.187
25.060
10.737
27.320
24.755
5.699 53.377 31.068
07/2005
31.387
51.314 27.704
60.714 23.473
51.854 21.759
4.635 29.538
18.326
13.675
33.806
26.431
5.683 48.064 39.919
08/2005
27.595
39.982 19.945
57.132 22.603
39.718 18.285
3.976 32.334
13.737
12.556
29.055
27.221
6.205 42.764 31.493
09/2005
26.614
36.795 18.245
47.526 22.440
38.649 18.148
2.985 26.583
14.867
13.229
29.077
22.952
5.650 46.390 33.350
10/2005
39.644
51.663 27.865
63.646 33.338
55.761 25.522
6.118 40.136
23.266
19.016
35.908
30.078
8.671 62.354 44.957
11/2005
79.283
101.735
58.439
120.495
79.211
111.896
52.548
14.392
90.138
49.505
42.249
65.126
61.118
21.464
120.221
96.109
12/2005
18.335
21.881 12.640
27.193 18.276
28.622 13.467
3.443 18.570
11.306
10.741
18.800
17.601
5.646 32.346 24.526
01/2006
6.728 12.080 5.493 14.531 11.548
15.278 8.008 1.244 6.875 5.860 5.339 9.919 7.274 2.065 20.479 14.619
02/2006
10.704
17.024 7.752 16.619 10.631
19.260 10.435
1.711 9.147 7.474 6.699 13.671
11.797
2.847 26.909 17.221
03/2006
15.741
21.634 10.318
22.862 15.488
25.949 14.211
2.155 12.654
11.594
7.821 21.239
16.761
4.203 35.632 23.537
04/2006
21.535
32.578 15.557
33.264 18.732
35.269 21.881
3.627 17.549
15.296
10.708
28.551
22.113
5.946 45.896 27.505
05/2006
25.822
43.791 23.994
46.575 22.316
48.943 23.952
5.686 24.164
22.235
15.057
32.293
27.514
6.214 55.306 37.117
06/2006
22.315
28.409 15.591
30.751 13.402
29.040 15.994
2.262 15.116
17.452
9.744 24.636
21.051
4.043 39.202 24.551
07/2006
24.992
39.057 18.884
43.780 24.055
41.635 20.491
3.660 25.022
20.845
11.364
28.848
25.571
5.365 46.124 34.581
08/2006
32.145
33.464 18.718
48.885 26.339
39.342 18.924
4.078 26.722
21.037
13.619
34.254
30.470
6.761 51.015 34.526
09/2006
20.378
24.094 11.977
25.912 19.438
29.378 15.522
2.247 15.199
20.063
7.148 23.781
20.406
4.422 38.881 25.377
10/2006
34.104
47.366 23.296
50.857 30.420
51.184 28.128
4.436 27.395
22.471
13.311
38.011
32.370
7.250 73.017 41.015
11/2006
68.246
86.928 47.520
106.790
68.404
91.620 49.832
9.692 67.554
42.695
34.175
67.562
60.736
14.483
106.972
87.201
12/2006
22.968
32.252 18.161
36.289 20.177
34.371 18.423
4.064 21.692
15.354
11.278
22.665
19.429
5.451 47.987 26.712
01/2007
14.128
14.646 9.809 18.102 13.841
14.116 9.469 1.649 10.416
9.642 4.295 17.768
13.277
2.316 21.412 12.971
02/2007
14.975
18.293 10.721
21.040 12.938
19.830 11.128
1.822 10.096
9.820 5.489 20.421
15.837
2.681 22.721 15.047
03/2007
21.862
28.937 16.568
31.847 16.888
33.071 18.828
2.778 15.137
15.856
7.258 27.696
22.803
4.353 32.113 24.892
04/2007
30.118
42.301 23.383
46.208 17.125
51.086 26.691
3.994 19.091
20.164
12.359
34.034
26.960
6.729 52.942 35.589
05/2007
30.327
35.659 29.108
45.495 19.841
51.959 23.148
2.105 19021 23 12.611
32.254
29.442
5.045 57.357 33.300
06/2007
22.301
20.683 19.773
41.001 15.852
41.239 22.733
3.790 17314 0 10.282
25.567
23.112
5.371 42.324 25.128
07/2007
7226 41.617 24.962
57.665 13.015
50.003 27.754
4.239 11785 0 2.047 35.181
33.175
7.565 51.652 2.709
Categoria 2 (Previsão)
Produtos
Período
P1 P2 P3 P4 P5 P6 P7 P8 P9 P10 P11 P12 P13 P14 P15 P16
05/2007
36.730
44.091
30.115
49.497
24.231
51.362
27.104
6.084
22.724
0
10.108
34.004
31.341
4.982
56.171
0
06/2007
22.101
31.009
22.813
31.798
7.509
32.225
17.695
2.309
11.717
0
4.453
26.759
23.288
4.280
43.066
33.733
07/2007
0
48.195
28.981
54.658
0
52.268
22.545
3.528
0
0
0
38.932
30.545
8.912
52.958
20.887
Livros Grátis
( http://www.livrosgratis.com.br )
Milhares de Livros para Download:
Baixar livros de Administração
Baixar livros de Agronomia
Baixar livros de Arquitetura
Baixar livros de Artes
Baixar livros de Astronomia
Baixar livros de Biologia Geral
Baixar livros de Ciência da Computação
Baixar livros de Ciência da Informação
Baixar livros de Ciência Política
Baixar livros de Ciências da Saúde
Baixar livros de Comunicação
Baixar livros do Conselho Nacional de Educação - CNE
Baixar livros de Defesa civil
Baixar livros de Direito
Baixar livros de Direitos humanos
Baixar livros de Economia
Baixar livros de Economia Doméstica
Baixar livros de Educação
Baixar livros de Educação - Trânsito
Baixar livros de Educação Física
Baixar livros de Engenharia Aeroespacial
Baixar livros de Farmácia
Baixar livros de Filosofia
Baixar livros de Física
Baixar livros de Geociências
Baixar livros de Geografia
Baixar livros de História
Baixar livros de Línguas
Baixar livros de Literatura
Baixar livros de Literatura de Cordel
Baixar livros de Literatura Infantil
Baixar livros de Matemática
Baixar livros de Medicina
Baixar livros de Medicina Veterinária
Baixar livros de Meio Ambiente
Baixar livros de Meteorologia
Baixar Monografias e TCC
Baixar livros Multidisciplinar
Baixar livros de Música
Baixar livros de Psicologia
Baixar livros de Química
Baixar livros de Saúde Coletiva
Baixar livros de Serviço Social
Baixar livros de Sociologia
Baixar livros de Teologia
Baixar livros de Trabalho
Baixar livros de Turismo