Download PDF
ads:
CARLOS ALBERTO ARAGÓN DE PLANAS
A IMPORTÂNCIA DA VOLATILIDADE
NO MERCADO FINANCEIRO BRASILEIRO
UERJ / FCE
2006
ads:
Livros Grátis
http://www.livrosgratis.com.br
Milhares de livros grátis para download.
ii
A IMPORTÂNCIA DA VOLATILIDADE
NO MERCADO FINANCEIRO BRASILEIRO
CARLOS ALBERTO ARAGÓN DE PLANAS
Dissertação apresentada à Faculdade de Ciências
Econômicas da Universidade do Estado do Rio de
Janeiro para obtenção do título de Mestre em
Ciências Econômicas. Área de Concentração:
Economia Internacional.
RIO DE JANEIRO
Estado do Rio de Janeiro – Brasil
Junho – 2006
ads:
iii
A IMPORTÂNCIA DA VOLATILIDADE
NO MERCADO FINANCEIRO BRASILEIRO
CARLOS ALBERTO ARAGÓN DE PLANAS
Orientador: Prof. LÉO DA ROCHA FERREIRA
Co-orientador: Prof. GERSON LACHTERMACHER
Dissertação apresentada à Faculdade de Ciências
Econômicas da Universidade do Estado do Rio de
Janeiro para obtenção do título de Mestre em
Ciências Econômicas. Área de Concentração:
Economia Internacional.
RIO DE JANEIRO
Estado do Rio de Janeiro – Brasil
Junho – 2006
iv
Dedico esta dissertação em memória ao meu pai,
José Planas, pela compreensão e carinho nos
momentos que deixei de estar ao seu lado para que
este sonho fosse realizado, sem perceber que aquelas
seriam nossas últimas oportunidades de estarmos
juntos.
v
AGRADECIMENTOS
À Deus pela saúde, força e proteção ao longo desta trajetória;
À minha mãe pela compreensão, carinho e apoio constantes, e principalmente,
pela sua presença nos momentos mais difíceis;
À minha esposa por estar sempre ao meu lado me incentivando e acreditando no
alcance deste objetivo, jamais permitindo que as dificuldades criadas pela vida
impedissem mais esta conquista;
À minha irmã e familiares por compreenderem o motivo de minha ausência em
alguns momentos de suas vidas;
Ao querido amigo Manuel Sanchez De La Cal, pela orientação, motivação e
otimismo ao longo do curso;
Ao amigo Hélcio Fajardo Henriques por permitir a realização de mais este
sonho, contribuindo para meu desenvolvimento profissional e pelo apoio, sem o qual
nada disso seria possível;
Ao amigo Ricardo Pinto Nogueira pela compreensão e colaboração, ao longo
desta trajetória, tornando possível a conclusão deste curso;
Ao professor e orientador Léo da Rocha Ferreira pela paciência, estímulo e
atenção durante a elaboração deste estudo, revisando os textos e enriquecendo-os com
robustas sugestões, sem o qual não seria possível realizá-lo;
Ao professor Gerson Lachtermacher pela atenção e apoio, dedicando diversos
momentos a fim de me transmitir conhecimentos, e por ter delineado, juntamente
comigo, os rumos desta dissertação, cruciais para o seu desenvolvimento e conclusão;
vi
Aos demais professores do Programa de Pós-Graduação em Ciências
Econômicas, pelos conhecimentos adquiridos;
Aos meus colegas de mestrado por dividirmos momentos de incertezas e
alegrias;
Aos demais amigos da BOVESPA, pelo carinho com que me receberam e
agradável convivência dentro e fora do trabalho.
vii
"A mente que se abre a uma nova idéia
jamais voltará ao seu tamanho original."
Albert Einstein
viii
SUMÁRIO
LISTA DE ABREVIATURAS OU SIGLAS................................................................. xii
LISTA DE FIGURAS ................................................................................................... xiii
LISTA DE
TABELAS .................................................................................................xiiii
LISTA DE ANEXOS .................................................................................................. xivv
RESUMO ....................................................................................................................... xv
ABSTRACT ................................................................................................................. xvii
1. INTRODUÇÃO....................................................................................................... xviii
1.1. O problema e sua relevância................................................................................ 19
1.2. Objetivos.............................................................................................................. 20
1.3. Estrutura do Trabalho.......................................................................................... 22
2. REVISÃO DA LITERATURA.................................................................................. 25
3. VOLATILIDADE ...................................................................................................... 29
3.1. Definições Básicas............................................................................................... 30
3.2. Tipos e Características......................................................................................... 32
3.3. Estimando a Volatilidade .................................................................................... 33
3.3.1. Estimador não viesado de mínima variância uniforme ................................ 35
3.3.2. Estimador de máxima verossimilhança ........................................................ 36
3.3.3. Estimador de média móvel exponencialmente ponderada ........................... 37
3.3.4. ARCH........................................................................................................... 39
3.3.5. GARCH ........................................................................................................ 41
3.4. Previsão de Volatilidade...................................................................................... 42
3.4.1. Previsão de Volatilidade Histórica ............................................................... 43
3.4.2. Volatilidade Implícita................................................................................... 45
3.4.3. Volatilidade Implícita versus Volatilidade Histórica ................................... 46
4. TAXA DE CÂMBIO.................................................................................................. 48
4.1. A importância da taxa de câmbio ........................................................................ 48
4.2. Regime cambial................................................................................................... 50
4.3. Evolução da política cambial brasileira............................................................... 51
4.4. Impacto da volatilidade da taxa de câmbio sobre o mercado.............................. 68
5. OPÇÕES..................................................................................................................... 71
ix
5.1. Conceito e tipos de opções .................................................................................. 72
5.2. Classificação das opções e suas características................................................... 73
5.3. Contrato de Opção versus Contrato Futuro......................................................... 76
5.4. Valores que influenciam no preço de uma opção................................................ 77
5.4.1. Preço do ativo-objeto.................................................................................... 77
5.4.2. Preço de exercício da opção ......................................................................... 78
5.4.3. Prazo de vencimento da opção ..................................................................... 78
5.4.4. Taxa de juro livre de risco............................................................................ 79
5.4.5. Volatilidade do preço do ativo-objeto .......................................................... 79
5.4.6. Smile de volatilidade .................................................................................... 81
5.5. Modelo de Black & Scholes................................................................................ 82
5.6. Redes Neurais Artificiais..................................................................................... 89
5.6.1. Introdução..................................................................................................... 91
5.6.2. Histórico ....................................................................................................... 92
5.6.3. O Neurônio Artificial ................................................................................... 97
5.6.4. Função de Ativação .................................................................................... 100
5.6.5. Topologia das Redes Neurais Artificiais.................................................... 103
5.6.6. Arquitetura.................................................................................................. 107
5.6.7. Processo de Aprendizagem......................................................................... 109
5.6.8. Redes Multilayer Perceptron ..................................................................... 112
5.6.9. Algoritmo Backpropagation ....................................................................... 113
5.6.10. Conclusão ................................................................................................. 119
6. METODOLOGIA E ANÁLISE DOS RESULTADOS EMPÍRICOS..................... 121
6.1. Introdução.......................................................................................................... 121
6.2. Dados................................................................................................................. 122
6.2.1. Ajustes no preço de exercício..................................................................... 123
6.2.2. Tempo até o vencimento da opção ............................................................. 124
6.2.3. Volatilidade do preço da ação .................................................................... 124
6.2.4. Taxa de juro livre de risco.......................................................................... 125
6.2.5. Taxa de câmbio........................................................................................... 125
6.3. Definição do modelo de Redes Neurais ............................................................ 126
6.3.1. Fases para o desenvolvimento de uma Rede Neural Artificial................... 126
x
6.3.2. Análise de modelos de Redes Neurais........................................................ 128
6.4. Arquitetura da Rede Neural............................................................................... 131
6.5. Comparação entre os modelos........................................................................... 132
6.5.1. Grupo de previsão....................................................................................... 132
6.5.2. Grupo de treinamento................................................................................. 134
6.6. Análise dos Resultados Empíricos .................................................................... 135
6.6.1. Modelo Black & Scholes versus Redes Neurais Artificiais ....................... 136
7. CONCLUSÕES E RECOMENDAÇÕES................................................................ 145
8. REFERÊNCIAS BIBLIOGRÁFICAS ..................................................................... 149
xi
LISTA DE ABREVIATURAS OU SIGLAS
ARCH
Autoregressive Conditional Heteroskedasticity
BACEN Banco Central do Brasil
BIRD Banco Internacional de Reconstrução e Desenvolvimento
BM&F Bolsa de Mercadorias & Futuros
BMS Black-Merton-Scholes
BOVESPA Bolsa de Valores de São Paulo
CETIP Central de Custódia e de Liquidação Financeira de Títulos
DI Depósito Interfinanceiro
FMI Fundo Monetário Internacional
GARCH
General Autoregressive Conditional Heteroskedasticity
IOF Imposto sobre Operações Financeiras
ITM
In the money
LTF Letra do Tesouro Federal
MERCOSUL Mercado Comum do Sul
MLP Redes Multilayer Perceptron
MSE
Mean Squared Error
OTM
Out of the money
PN Ações Preferenciais Nominativas
RNA Redes Neurais Artificiais
URV Unidade de Referência de Valor
xii
LISTA DE FIGURAS
Figura 1 – Modelo de McCullock e Pitts (1943)............................................................ 98
Figura 2 – Modelo de um Neurônio Artificial................................................................ 99
Figura 3 – Rede Neural Artificial Não-Recorrente ...................................................... 104
Figura 4 – Rede Neural Artificial Recorrente .............................................................. 105
Figura 5 – Modelo de uma Rede Neural de camada única........................................... 107
Figura 6 – Modelo de uma Rede Neural de múltiplas camadas ................................... 108
Figura 7 – Rede Neural Artificial Multilayer Perceptron............................................ 112
Figura 8 – Fases do desenvolvimento de uma Rede Neural Artificial. ........................ 127
xiii
LISTA DE TABELAS
Tabela 1 – Estimativas para a volatilidade da Cia Vale do Rio Doce (Vale PN)........... 44
Tabela 2 – Grupos de moneyness das opções e suas características............................... 75
Tabela 3 – Efeitos no valor da opção ............................................................................. 82
Tabela 4 – Parâmetros considerados no processo de construção e avaliação das Redes
Neurais........................................................................................................ 131
Tabela 5 – Séries de opções escolhidas para apreçamento pelas RNA’s e Black &
Scholes........................................................................................................ 133
Tabela 6 – Resultados dos EAM, EQM, REQM nos apreçamentos das séries de opções
fora do preço calculadas pelos modelos de Black & Scholes e Redes Neurais
Artificiais.................................................................................................... 136
Tabela 7 – Resultados dos EAM, EQM, REQM nos apreçamentos das séries de opções
no preço calculadas pelos modelos de Black & Scholes e Redes Neurais
Artificiais.................................................................................................... 138
Tabela 8 – Resultados dos EAM, EQM, REQM nos apreçamentos das séries de opções
dentro do preço calculadas pelos modelos de Black & Scholes e Redes
Neurais Artificiais ...................................................................................... 139
Tabela 9 – Resultados dos EAM, EQM, REQM nos apreçamentos das séries de opções
fora do preço calculadas pelas RNA’s e RNA’s_US$ ............................... 140
Tabela 10 – Resultados dos EAM, EQM, REQM nos apreçamentos das séries de opções
no preço calculadas pelas RNA’s e RNA’s_US$....................................... 141
Tabela 11 – Resultados dos EAM, EQM, REQM nos apreçamentos das séries de opções
dentro do preço calculadas pelas RNA’s e RNA’s_US$............................ 142
Tabela 12 – Número de acertos entre B&S/RNA e RNA/RNA_US$.......................... 143
xiv
LISTA DE ANEXOS
ANEXO 1 - Gráfico gerado pelo software Neural Net Analizer da série de opçoes de
abril out the money com modelo de RNA_US$ na qual se aplicou o corte do early
stopping quando a linha de treinamento cortou a linha de validação........................... 154
ANEXO 2 – Gráfico gerado pelo software Neural Net Analizer da série de opçoes de
fevereiro in the money com modelo de Rede Neural Artificial na qual foi aplicado o
corte do early stopping uma vez que as duas linhas de validação e treinamento tendiam
ao infinito paralelamente. ............................................................................................. 155
ANEXO 3 – Gráfico gerado pelo software Neural Net Analizer da série de opções de
janeiro out the money com modelo de RNA_US$ onde ocorre a convergência das linhas
de validação e treinamento. .......................................................................................... 156
ANEXO 4 - Tela Training Track Board do software Neural Net Analizer na qual foram
definidos para cada grupo de cada vencimento os parâmetros de treinamento da Rede
Neural Artificial e a topologia utilizada, demonstrando o resultado através do erro
quadrado mínimo na saída (MSE on out put), após o treinamento de 50.000 épocas, para
uma série de janeiro, fora do preço, sem a variável Dólar. .......................................... 157
ANEXO 5 – Tela Training Track Board do software Neural Net Analizer na qual foram
definidos para cada grupo de cada vencimento os parâmetros de treinamento da Rede
Neural Artificial e a topologia utilizada, demonstrando o resultado através do erro
quadrado mínimo na saída (MSE on out put), após o treinamento de 100.000 épocas,
para uma série de fevereiro, no preço, com a variável Dólar....................................... 158
xv
A IMPORTÂNCIA DA VOLATILIDADE
NO MERCADO FINANCEIRO BRASILEIRO
Autor: CARLOS ALBERTO ARAGÓN DE PLANAS
Orientador: Prof. LÉO DA ROCHA FERREIRA
Co-orientador: Prof. GERSON LACHTERMACHER
RESUMO
A presente dissertação tem por objetivo verificar a influência da volatilidade da
taxa de câmbio no cálculo do apreçamento de opções através da técnica das Redes
Neurais, posto não ser possível a aplicação desta variável no Modelo de Black &
Scholes em razão das limitações por este apresentadas. Para tanto, utilizou-se séries
históricas das ações preferenciais da empresa Telemar Participações S.A.,
correspondentes ao período de 02 de janeiro de 2004 a 30 de maio de 2006, obtidos
diretamente da Bolsa de Valores de São Paulo. Dentre as variáveis utilizadas somente a
volatilidade precisou ser estimada, utilizando-se para isso o tipo da volatilidade histórica
sendo a forma de estimação o estimador não viesado de mínima variância uniforme.
Propôs-se o desenvolvimento de uma Rede Neural feedforward, multicamada, com
algoritmo de treinamento backpropagation para realizar a previsão de preços das opções
da empresa analisada. O modelo desenvolvido apresentou, em seus resultados,
estimativas de retornos aproximadas dos valores reais, principalmente quando
acrescentada a taxa de câmbio, confirmando a assertiva de que as Redes Neurais são
superiores ao Modelo Black & Scholes no apreçamento de opções. Em suma, a inclusão
da variável cambial na técnica das Redes Neurais acarreta melhora no apreçamento de
opções ativo, devendo ser levada em consideração.
xvi
A IMPORTÂNCIA DA VOLATILIDADE
NO MERCADO FINANCEIRO BRASILEIRO
Autor: CARLOS ALBERTO ARAGÓN DE PLANAS
Orientador: Prof. LÉO DA ROCHA FERREIRA
Co-orientador: Prof. GERSON LACHTERMACHER
ABSTRACT
xvii
1. INTRODUÇÃO
A volatilidade, tema muito bem difundido nos mercados dos países mais
desenvolvidos e de recente aplicabilidade no mercado financeiro brasileiro, permite
analisar o risco de determinados mercados e auxiliar a determinação de preços de
derivativos, principalmente de opções.
Estudos em finanças afirmam que em países onde a volatilidade é baixa, o risco
e o retorno também tendem a ser baixos.
1
Esta afirmativa não é necessariamente
verdadeira quando se trata do mercado financeiro brasileiro, em que as taxas de juros
são altíssimas.
Neste contexto, cumpre destacar, por oportuno, que o conceito de risco se difere
do conceito de volatilidade. Entendida por alguns como desvio padrão dos retornos de
determinados ativos, a correta estimativa da volatilidade auxilia o investidor no
gerenciamento de risco, na negociação de opções, no desenvolvimento de novos
produtos e na determinação de preços de derivativos de forma geral. A volatilidade é,
portanto, o parâmetro matemático que calcula a incerteza dos mercados. Sem
volatilidade não há retorno e, claro, sem oscilação dos mercados a oportunidade de
ganhos é extremamente limitada.
Alexandre Bourgeois (2005) afirma que, “no Brasil, o mercado tende a
considerar eventos prováveis como certos e eventos extremamente improváveis como
impossíveis.” Para ele, “temos várias provas, no mínimo uma vez por ano, que o
improvável torna-se bastante possível”. E esclarece que,
1
Sobre o assunto, ver Pinheiro (1996).
18
“risco é definir qual é o valor fixo em reais que você
pretende perder numa posição – antes de sair dela, espera-
se. Devolver parte do lucro para salvar o restante não é
risco, é volatilidade. Volatilidade existe, faz parte de
nossas vidas e permite oportunidade de ganhos maiores
que a média.” (BOURGEOIS, 2005)
Dados disponíveis sobre determinado ativo auxiliam o investidor na análise da
melhor opção de investimento, permitindo que escolha aquele com maior retorno dentre
os que possuem a mesma volatilidade, ou os que têm menor volatilidade dado o mesmo
retorno.
Assim, dependendo dos objetivos, dívidas e prazos dos seus investimentos,
mercados voláteis não representam necessariamente um grande risco. Mas, frisa-se que
ao escolher um determinado investimento, o que importa é analisar não apenas a
dimensão dos retornos potencialmente esperados, mas também os riscos potencialmente
envolvidos.
Atualmente o Brasil possui uma das mais altas taxas de volatilidades no mercado
financeiro mundial, apesar de sua constante queda devido à sua maior estabilidade
econômica. Sua importância é indiscutível para o desenvolvimento do mercado de
capitais do Brasil e do mundo e tem sido cada vez mais analisada e estudada por
pesquisadores.
Sabe-se que alterações políticas afetam a volatilidade em um país, o que poderá
gerar maior instabilidade no mercado e a conseqüente redução de investimentos. Nos
últimos anos, o Governo Brasileiro vem dispensando contínuos esforços para diminuir a
sensibilidade das variáveis macroeconômicas em relação a choques externos e cumprir
as metas de inflação, a fim de transmitir segurança ao mercado e contribuir para o
estímulo ao investimento e crescimento econômico do país.
19
1.1. O problema e sua relevância
A regra geral é que quanto maior o risco de um investimento, maior será o
retorno demandado pelo investidor, ou seja, quanto maior a volatilidade, maior o risco.
Neste sentido, a preocupação com as oscilações no mercado financeiro e a recente
importância dispensada ao estudo da volatilidade se tornam claras e justificáveis.
Neste contexto, uma das formas de demonstrar a importância da volatilidade é
através da análise do apreçamento de opções, razão pela qual passou a ser objeto de
estudo de várias pesquisas.
2
Ressalta-se, por oportuno, que o apreçamento de opções é tarefa importante para
a definição do comportamento do mercado de opções, exercendo influência sobre as
operações de hedge
3
, especulação e arbitragem.
Assim, no intuito de resolver o problema do apreçamento de opções e
demonstrar a importância atual da volatilidade no mercado financeiro, foi desenvolvido
por Fischer Black e Myron Scholes (1973) o modelo de determinação de preços de
opções chamado Black & Scholes, um dos mais utilizados em Finanças.
Neste modelo, caracterizado pela facilidade de utilização, o preço de uma opção
não depende do valor esperado da ação, mas exclusivamente da volatilidade da ação a
que ela se refere.
No entanto, alguns de seus pressupostos não foram confirmados na prática, o
que levou a diferenças significativas entre o valor da opção, calculado pelo modelo, e o
valor realmente verificado no mercado.
2
Opções são valores mobiliários derivativos que conferem ao seu titular o direito de comprar ou vender
um ativo a um preço futuro predeterminado, conforme será visto no capítulo 5 do presente estudo.
3
Operação que protege o investidor contra variação brusca das cotações.
20
Houve, assim, a necessidade de um modelo alternativo que demonstrasse reais
resultados no cálculo do apreçamento de opções. Neste sentido, a utilização de Redes
Neurais surge como importante alternativa aos modelos já propostos, principalmente se
considerarmos a dificuldade em especificar um modelo de apreçamento de opções que
estabeleça, satisfatoriamente, as relações entre as diferentes variáveis envolvidas.
As Redes Neurais desenvolvem modelos matemáticos intrínsecos a partir de
dados empíricos do problema, por meio de um processo de aprendizagem. Logo são
capazes de extrair as relações entre as diferentes variáveis do problema de forma
empírica, facilitando a descoberta dessas relações.
Sendo assim, a aplicação das Redes Neurais no apreçamento de opções, a ser
apresentada neste estudo, despertou o interesse de pesquisadores de diferentes áreas.
Trabalhos analisados sobre o tema são convergentes ao concluir que a técnica das Redes
Neurais é uma importante ferramenta para a compreensão do mercado de opções. No
entanto não foram encontrados estudos sobre a inclusão da taxa de câmbio nesta técnica
e sua influência no apreçamento de opções, despertando o interesse para o presente
estudo.
Dessa forma, considerando que a volatilidade é importante não só para apreçar
opções, mas também como medida de risco, torna-se necessária uma maior
compreensão do tema a fim de buscar maior retorno no mercado nacional.
1.2. Objetivos
Um dos objetivos deste estudo é verificar se a utilização de um modelo do
apreçamento de opções, baseado nas técnicas de Redes Neurais, é capaz de superar os
21
resultados do Modelo de Black & Scholes na determinação de preços de opções mais
condizentes com os preços realmente verificados no mercado brasileiro e se a
volatilidade da taxa de câmbio tem alguma influência nesse cálculo.
Seus objetivos específicos são:
Avaliar os estudos realizados por pesquisadores e seus respectivos
resultados (revisão da literatura recente);
Comparar os estudos apresentados e a visão de cada um deles;
Especificar o conceito de volatilidade, bem como seus diferentes tipos, e
sua importância no mercado financeiro brasileiro.
Utilizar a técnica das Redes Neurais no apreçamento de opções, como
melhor modelo para a tomada de decisões;
Validar o modelo proposto, comparando-o ao Modelo de Black &
Scholes;
Analisar a volatilidade da taxa de câmbio no modelo proposto, no
período determinado.
Os resultados da fórmula final para o apreçamento de opções, deverão mostrar se
o preço da opção depende ou não da volatilidade do câmbio.
Enfim, este estudo deverá explicar a importância da volatilidade, avaliando seus
efeitos no mercado financeiro como um todo e enfatizando que com eventuais
modificações na política nacional ou internacional haverá alterações econômicas
diversas como conseqüência de variações do risco-país.
Procura-se, assim, contribuir para o desenvolvimento da teoria das opções e na
ampliação do conhecimento sobre o mercado financeiro brasileiro, na medida em que
22
será apresentado testes empíricos à partir de dados recentes, não analisados
anteriormente e que se tornam objeto do presente trabalho.
Dessa forma, demonstraremos que devido à capacidade de desenvolver modelos
matemáticos intrínsecos a partir de dados empíricos, as Redes Neurais são utilizadas em
situações reais para as quais a dedução de modelo representativo é tarefa complexa.
1.3. Estrutura do Trabalho
Esta dissertação está organizada em oito capítulos, ordenados de forma
cronológica por assunto.
O primeiro capítulo compreende uma introdução do tema escolhido, ou seja,
uma abordagem geral do assunto, demonstrando sua importância e utilidade no atual
mercado financeiro nacional e internacional. Os objetivos também são apresentados e
descritos neste capítulo.
O segundo capítulo apresenta uma revisão dos estudos anteriores sobre o
assunto, que são de extrema importância na defesa da utilização das Redes Neurais
como melhor modelo para o apreçamento de opções.
O terceiro capítulo aborda, especificamente, a volatilidade: conceituando,
definindo, estimando e previsionando-a, e esclarecendo sua importância e finalidade.
O quarto capítulo relata breve estudo sobre a taxa de câmbio, apresentando a
evolução histórica da política cambial brasileira e seu impacto sobre a variabilidade da
taxa de câmbio.
Já o quinto capítulo trata do mercado de opções, explicando seu funcionamento,
a que e a quem se destinam e suas características. Apresenta ambos os modelos já
23
utilizados no apreçamento de opções, o Modelo Black & Scholes e o das Redes Neurais,
definindo-os e demonstrando suas premissas básicas. Neste capítulo cada modelo será
analisado separadamente, facilitando a compreensão e a percepção da diferença entre
eles.
Importante destacar que, para construir o modelo de apreçamento de opções
utilizando as Redes Neurais e compará-lo com o Modelo tradicional Black & Scholes
foram utilizadas séries históricas das ações preferenciais da empresa Telemar
Participações S.A., com registro de negociação de seus valores mobiliários na Bolsa de
Valores de São Paulo (BOVESPA).
Os dados relacionados às opções utilizados são: o preço do ativo-objeto, o preço
de exercício, o tempo até o vencimento, a volatilidade do preço do ativo-objeto e a taxa
de juro livre de risco. Para tanto foi aplicada a volatilidade histórica do preço da ação
utilizando o estimador não viesado de mínima variância uniforme já que o foco deste
estudo é analisar a influência da taxa de câmbio no apreçamento de opções.
Salienta-se que esses dados correspondem ao período de 02 de janeiro de 2004 a
30 de maio de 2006 e foram obtidos diretamente da BOVESPA. Já os dados relativos às
séries históricas das taxas de câmbio utilizados no estudo da volatilidade e os relativos à
taxa de juro livre de risco, foram obtidos através do Banco Central do Brasil e do
CETIP, respectivamente.
Os resultados desta pesquisa visam demonstrar a superioridade do modelo
baseado em Redes Neurais, em comparação com o Modelo Black & Scholes, no
apreçamento de opções fora do preço (out-of-the-money), no preço (at-the-money) e
dentro do preço (in-the-money), conforme comentado anteriormente, bem como
verificar se o câmbio afeta no cálculo do preço teórico da opção.
24
Assim, no sexto capítulo, é feita uma análise comparativa dos modelos
anteriormente estudados, comentando suas diferenças e demonstrando o porquê da
escolha do modelo das Redes Neurais para o apreçamento de opções e qual o impacto
da variabilidade do câmbio adicionado ao modelo proposto.
No penúltimo capítulo são apresentadas as considerações finais do presente
trabalho, tecendo comentários conclusivos do estudo realizado, como fruto da
aprendizagem adquirida no presente curso, bem como recomendações para futuras
pesquisas.
Por fim, no oitavo capítulo, como não poderia deixar de ser, é apresentada a
bibliografia utilizada, cruciais na formulação do tema e desenvolvimento do estudo.
25
2. REVISÃO DA LITERATURA
Desenvolvido em conjunto por Fischer Black e Myron Scholes (1973), o
Modelo então denominado Black & Scholes foi o precursor das teorias de valorização
para determinar o preço ou prêmio de opções de compra e venda européias sobre ações
sem dividendos, sendo considerado um dos modelos mais utilizados e de maior sucesso
em finanças.
No entanto, apesar do sucesso inicial, que se justifica pela facilidade de sua
aplicação, na prática algumas de suas premissas não foram constatadas, ocorrendo, em
determinadas situações, diferenças significativas entre os valores calculados mediante o
modelo e os realmente verificados no mercado.
Dessa forma, várias foram as tentativas em construir um modelo que
conseguisse alcançar um resultado condizente com a realidade. Hull e White (1987),
Scott (1987), e Wiggins (1987) desenvolveram um modelo de volatilidade estocástica,
em que a volatilidade do preço da ação é considerada incerta. Geske (apud Hull, 1998),
desenvolveu em 1979 um modelo baseando-se na idéia de que a ação de uma empresa
alavancada pode ser considerada uma opção de compra sobre o valor da empresa,
contrariando a hipótese de mudança contínua dos preços da ação.
Segundo Hull (1998), em 1973 Merton propôs um modelo que substituía a taxa
de juro do Modelo Black & Scholes por uma taxa de juro, R(t,T), de um título sem risco,
que vence no mesmo instante T do vencimento da opção; além de realizar mudanças no
cálculo da volatilidade.
26
De acordo com Freitas (2002), em 1976, Merton, e posteriormente, Cox, Ross e
Rubinstein (1979), desenvolveram modelos baseados em comportamento dos preços das
ações, caracterizados por saltos ou descontinuidades.
Outra alternativa ao Modelo de Black & Scholes foi apresentada em 1994, por
Rubinstein, Derman e Kani, e Dupire, que consiste na construção de árvores binomiais
ou trinomiais ajustadas aos preços observados na data da análise, o que permite prever o
comportamento da volatilidade futura, conforme comenta Adler (1999).
Neste contexto, Freitas (2002) relata os modelos citados por Bakshi, Chao e
Chen, em 1997, como o modelo de taxa de juro estocástica de Amim e Jarrow (1992),
os modelos de difusão por saltos/saltos puros de Bates (1996) e de Madan e Chang
(1996), o modelo de elasticidade constante da volatilidade de Cox e Ross (1976), os
modelos Markovianos de Ait-Shalaia e Lo (1996), os modelos de volatilidade
estocástica de Heston (1993), Melino e Turnbull (1990, 1995), Stein and Stein (1991),
os modelos de volatilidade estocástica e taxa de juro estocástica de Amin e NG (1993),
Bailey e Stulz (1989), Bakshi e Ghen (1997a,b) e Scott (1997) e os modelos de difusão
por salto da volatilidade estocástica de Bates (1996a,b) e Scott (1997). Segundo ele,
Bakshi, Chao e Chen desenvolveram um modelo de avaliação de opções européias que
inclui outros modelos de apreçamento como casos especiais às equações propostas.
De acordo com Hull (1998), além dos procedimentos numéricos que envolvem o
uso de árvores, como o proposto por Cox, Ross e Rubinstein, em 1979, também são
utilizados na avaliação de opções o método de diferenças finitas e a simulação de Monte
Carlo. Segundo ele, na avaliação de derivativos utilizando o método de diferenças
finitas, a equação diferencial satisfeita pelo derivativo é convertida em equações de
diferença, que são resolvidas iterativamente. No caso da simulação de Monte Carlo, são
27
geradas amostras das diferentes trajetórias que podem ser seguidas pelas variáveis que
influenciam o preço do derivativo. Conforme comenta Freitas (2002), a estimativa do
preço da opção será a média aritmética dos retornos calculados para cada trajetória e
descontada a taxa de juro livre de risco.
Importante destacar que alguns modelos citados foram aplicados no mercado de
opções brasileiro, como o método de árvores binomiais implícitas, proposto por
Rubinstein (1994) e analisado por Adler (1999), utilizando os preços de opções dos
recibos de Telebrás no período de 2 de março a 16 de abril de 1999. Comparado ao
Modelo de Black & Scholes, não se pôde chegar a nenhuma conclusão quanto à
superioridade de um método sobre o outro, devido às pequenas diferenças obtidas; o
modelo genérico proposto por Bronstein (1999) para avaliação de preços de opções
contemplando processos de difusão e salto, fazendo-se uma analogia com dividendos
concluiu-se, através dos resultados obtidos para o período posterior à crise cambial de
janeiro de 1999, que “para as opções fora do preço, o modelo não apresenta diferença
significativa em relação aos preços de mercado e supera o Modelo de Black &
Scholes”.
4
Outro estudo comparativo foi realizado por Vitiello Júnior (1998) com os
modelos de Black & Scholes e o de Cox e Ross em 1996. Neste, foram avaliadas todas
as opções lançadas na BOVESPA durante o período de outubro de 1994 a junho de
1997 e concluiu que o segundo se ajustou melhor às opções dentro do preço e o
primeiro às opções fora do preço e no preço.
Vargas e Pisciotto (1999) realizaram um estudo baseado em uma opção sobre
recibo da Telebrás com vencimento em 08 de fevereiro de 1999 utilizando os métodos
4
Ver Adler (1999).
28
de árvores trinomiais e o Modelo de Black & Scholes. A partir dos resultados obtidos,
concluíram que o método de árvores trinomiais mostrou ser eficiente e compatível com
o Modelo de Black & Scholes.
Nota-se, assim, que já foram apresentadas várias alternativas para o apreçamento
de opções visando substituir o Modelo Black & Scholes e obter resultados condizentes
com a realidade do mercado. Atualmente as Redes Neurais vem sendo o método
utilizado para apreçar opções em razão dos resultados obtidos, conforme será visto
adiante.
29
3. VOLATILIDADE
Conforme comentado anteriormente, a volatilidade pode ser entendida como a
dispersão de dados em torno de seu valor esperado. Logo, pode-se dizer que a
volatilidade representa uma medida de risco. Neste sentido, torna-se imprescindível
estimá-la a fim de se decidir a alocação de recursos.
Entretanto, tal fato não é tão fácil quanto parece em razão da ausência de estudos
pacíficos quanto ao modelo que deve ser utilizado para estimar a volatilidade e que seja
capaz de obter resultados condizentes com os verificados no mercado. Até porque, sabe-
se que existe uma gama de métodos elaborados por pesquisadores e que diferentes
modelos de volatilidade podem resultar em estimativas consideravelmente diferentes.
Importante esclarecer que, até meados dos anos 80, pesquisadores e analistas
financeiros usavam modelos nos quais a volatilidade era assumida constante no longo
prazo. Posteriormente, verificou-se que a volatilidade pode variar consideravelmente ao
longo do tempo, afinal possui como causa diversos fatores, tais como o fluxo de
informações, antecipadas ou não-antecipadas, e o processo de negociação dos ativos,
dentre outros. Assim, quanto mais incerto estiver o mercado frente a crises ou fato
exógenos, mais os preços dos ativos tendem a variar, implicando em maiores
possibilidades de ganhos ou perdas, diante do alto risco assumido.
30
3.1. Definições Básicas
Inicialmente, é necessário esclarecer determinados conceitos a fim de facilitar a
compreensão e análise de se estimar a volatilidade como desvio padrão dos retornos de
determinados ativos.
O primeiro conceito elencado por Pinheiro (1996) é o de distribuição normal.
Uma variável qualquer, denominada X, segue uma distribuição normal caso sua função
densidade de probabilidade seja:
,,
2
1
)(
2
2
)(
2
1
<<−∞=
xeXf
x
σ
µ
πσ
onde
µ
é a média e é a variância da distribuição. Ambos são parâmetros de
distribuição capazes de representar completamente a distribuição normal.
2
σ
Importante esclarecer que, a função densidade de probabilidade tem seu pico na
média, formato semelhante ao de um sino, e é simétrica com relação a sua média, ou
seja,
.
1
),( + xxf
µ
O segundo conceito importante para o estudo da volatilidade, e elencado por
Pinheiro, é o de desvio padrão. Trata-se da raiz quadrada da variância (
),
representada apenas por
2
σ
σ
e nos informa qual a probabilidade de um resultado estar a
uma determinada distância da média. O desvio padrão de uma distribuição lognormal de
preços é definido como sua volatilidade e indicado em percentual.
Costa (1998) explica que “um ativo que exiba volatilidade para x dias igual a 2%
é um ativo que, em termos práticos, possui 68% de chance de ser encontrado, findos x
dias, entre 2% abaixo ou acima de seu valor mais provável”. Nas palavras de Pinheiro
31
(1996), “há 68% de probabilidade de um resultado distar um desvio padrão da média”.
E afirma que, “dada a simetria da distribuição normal, um valor tem 68% de
probabilidade de estar no seguinte intervalo:
σ
µ
±
”.
Esta volatilidade mede o nível de oscilação de um mercado, ou seja, “é a medida
de risco de um mercado”
5
. Conforme Costa (1998) esclarece, um mercado calmo
possui volatilidade baixa, já um mercado agitado, incerto, possui volatilidade alta, e
conseqüentemente, retornos maiores em razão do risco assumido pelo investidor.
Assim, quando pensamos em descrições da evolução de variáveis aleatórias no
tempo, ou seja, em processos estocásticos, surge a idéia de volatilidade. E, neste
sentido, torna-se importante esclarecer, ainda que seja de fácil percepção, que o
interesse do presente estudo está direcionado ao processo estocástico, em especial o
movimento Browniano.
Conforme bem define Pinheiro (1996), o movimento Browniano é um processo
que incorpora a idéia de movimentos puramente aleatórios, capturados por uma
distribuição normal. No entanto, ainda que interessante por suas características
6
, o
movimento Browniano não é adequado para preços, mas somente para retornos. Para
obter melhor resultado na análise do comportamento de preços sugere-se o processo de
difusão, no qual as variações nos preços são aleatórias, apesar de possuírem uma
tendência definida.
O processo de difusão pode ser definido da seguinte forma
7
:
5
Ver Costa (1998).
6
Pinheiro (1996) afirma que o movimento Browniano satisfaz duas suposições básicas: os retornos de um
determinado ativo seguem uma distribuição normal e de que mudanças nos preços são independentes
umas das outras. Para ele, mercado eficiente é aquele onde o preço de um ativo incorpora toda informação
disponível, o que faz com que as mudanças nos preços sejam imprevisíveis.
7
representa o movimento Browniano; dz
α
representa a tendência; e
β
é o chamado termo de volatilidade, que neste caso depende de t e
.
32
dzTXdttXdX ).(),(
β
α
+
=
Pinheiro (1996) destaca o seguinte modelo como o mais comum para preços de
ativos:
,dzdt
S
dS
tt
t
t
σµ
+=
onde
tt
SdS é o retorno instantâneo,
t
µ
a tendência e
t
σ
é a volatilidade.
Do exposto, chega-se à volatilidade, que nada mais é do que a parte da variação
dos preços que não é determinalística, pois, frisa-se, é o desvio padrão dos retornos de
determinados ativos
8
.
3.2. Tipos e Características
Conforme comentado anteriormente, existem dois tipos de volatilidade: a
volatilidade histórica (
historical volatility) e a volatilidade implícita (implied volatilty).
A volatilidade histórica de um ativo é determinada à partir de uma estimativa
baseada em dados históricos sobre variações do preço do referido ativo, ou seja,
depende da escolha de um modelo estatístico a ser aplicado aos dados históricos dos
retornos do ativo, que geralmente é um modelo de série de tempo. A volatilidade
histórica supõe que cenários passados tenderão a se repetir no futuro. Tal fato é
interpretado por analistas como uma desvantagem em relação aos outros tipos de
volatilidade.
8
Silva (1996) define volatilidade como “a variabilidade no preço do ativo subjacente de um contrato de
opção, e é definida como o desvio-padrão do logaritmo do preço do ativo-objeto expressado numa taxa
anual”. E afirma que “a expectativa de volatilidade é uma variável usada para a avaliação de preço ou
precificação de opções”.
33
Já a volatilidade implícita é obtida à partir da utilização de um modelo de
apreçamento de opções, ou seja, “é aquela que, mantendo os outros dados constantes,
devemos substituir no nosso modelo para obter como resultado um preço idêntico ao do
mercado de opções”
9
. Possui como principais características o fato do preço de uma
opção depender da volatilidade futura esperada ao longo do horizonte de sua
maturidade, bem como do modelo teórico de apreçamento de opções a ser utilizado.
Logo, esta pode variar dependendo das características da opção que estiver sendo
analisada. No entanto, ainda que aparentemente satisfatória, suas características são
interpretadas por muitos como certa desvantagem, ao depender da precisão do modelo
em uso, afinal se este apresentar defeitos interferirá no cálculo da volatilidade implícita.
Nota-se, assim, que a volatilidade não é diretamente observável no mercado,
podendo obter diferentes estimativas em ambos os casos. Logo, a volatilidade somente
poderá ser estimada e prevista no contexto de um modelo.
3.3. Estimando a Volatilidade
É de suma importância esclarecer, em princípio, que a volatilidade refere-se a
um lapso temporal que pode ser expresso em qualquer unidade de tempo, seja ele em
dia (volatilidade-dia), mês (volatilidade-mês), ano (volatilidade-ano) e período
(volatilidade-período). Sendo assim, para estimar a volatilidade deve-se inicialmente
definir o intervalo de tempo a ser analisado, ou seja, se fechamento diário, semanal,
mensal, etc.
9
Ver Pinheiro (1996).
34
Ressalta-se, por oportuno, que após o cálculo da volatilidade para a
periodicidade da série escolhida (diária, por exemplo) pode-se converter o número
calculado para uma outra unidade de medida conveniente (volatilidade-ano, por
exemplo) utilizando-se a seguinte expressão
10
:
..)%(252)( aadiaanual
σσ
×=
Nas palavras de Silva (1996), “para calcular a volatilidade, o desvio-padrão é
multiplicado pela raiz quadrada do período escolhido”. Segundo ele, tal procedimento
“é importante, pois na avaliação dos riscos, a incerteza sobre o preço do ativo aumenta
com a raiz quadrada do tempo no futuro que estamos considerando, e esse aumento não
é linear”.
Conforme visto no tópico anterior, a volatilidade implícita depende do modelo
de apreçamento de opções que estiver sendo utilizado e das características da opção.
Trata-se, na verdade, de um indicador da estimativa do mercado com respeito a
volatilidade futura média do dia em que foi colhido o preço da opção até o vencimento
da mesma. Logo, pode ser considerada como uma previsão de volatilidade.
Já a volatilidade histórica, como o próprio nome diz, se baseia em um histórico
de variação de preços, sendo este utilizado para sua estimativa. Ou seja, quando se
utiliza o critério da volatilidade histórica na estimação da volatilidade, está sendo aceita
a hipótese de que os dados passados têm relevância no que deve ocorrer com o
comportamento do ativo objeto no futuro.
10
Para calcular o desvio padrão equivalente, considera-se que existem 252 dias úteis no ano. Tratando-se
de retornos semanais é necessário multiplicar o
σ
(semanal) obtido por 52 e no caso de
σ
(mensal) o
resultado deve ser multiplicado por
12 , tendo em vista que o ano possui 52 semanas ou 12 meses.
35
Dessa forma, ao estimar a volatilidade está-se referindo a volatilidade histórica
posto inexistir sentido na utilização desta terminologia para a volatilidade implícita.
Existem várias formas de se alcançar o objetivo aqui desejado. Em decorrência,
o presente estudo vai se ater a 5 (cinco) delas, quais sejam: estimador não viesado de
mínima variância uniforme, estimador de máxima verossimilhança, estimador de média
móvel exponencialmente ponderada, ARCH (Autoregressive Conditional
Heteroskedasticity) e, por último, GARCH (General Autoregressive Conditional
Heteroskedasticity).
Aqui, vale citar as palavras de Lemgruber (1992):
“a procura por melhores estimadores para a volatilidade
tem sido objeto de estudo de muitos pesquisadores, que
argumentam que a perda de simplicidade é compensada
pelo ganho de eficiência.”
3.3.1. Estimador não viesado de mínima variância uniforme
Conforme comentado anteriormente, inicialmente faz-se necessário definir a
freqüência de nossa série. Sendo assim, em razão deste trabalho ter como foco o
mercado financeiro, optou-se por trabalhar com dados diários de fechamento.
Seguindo as orientações feitas por Pinheiro (1996), definido o intervalo de
tempo a ser analisado, escolheu-se a quantidade de observações que serão usadas
11
.
11
Em seu estudo, Lemgruber (1992) comenta que alguns analistas contestam o uso de pesos iguais para
as observações (retornos) incluídas no cálculo da volatilidade, argumentando que deve-se ser dada maior
importância às informações mais recentes. E ensina: “uma maneira usual de distribuir esses pesos é
assumir um crescimento exponencial contínuo partindo-se da observação mais antiga até a mais recente”.
Para Costa (1998), a quantidade de observações que se utiliza para calcular o desvio-padrão depende do
estilo de cada operador e de seus objetivos.
36
Dessa forma, a estimativa do desvio padrão dos retornos é representada pela
seguinte equação:
()
1
1
2
=
=
n
rr
n
i
i
σ
Sendo esta a raiz quadrada do estimador não viesado de mínima variância
uniforme, donde, “n” será o número de observações de retornos; como conseqüência,
tem-se “n - 1” como observações de preços; “r
i
” como o iésimo retorno e “r” como a
média dos retornos.
3.3.2. Estimador de máxima verossimilhança
Partindo da equação apresentada acima e utilizando as mesmas variáveis, pode-
se chegar ao estimador de máxima verossimilhança do desvio-padrão dos retornos, na
forma a seguir:
()
n
rr
n
i
i
=
=
1
2
σ
Pinheiro (1996) realizou uma análise prática com este estimador utilizando
dados diários de fechamento de mercado de preços da Petrobras PN e verificou que é
extremamente importante que a escolha de n seja apropriada, ainda que tal escolha não
seja fácil, tendo em vista que esta influencia de forma sobremaneira na estimativa
37
obtida
12
. Outro ponto notado e que requer atenção é o fato de que ao aumentar o número
de observações a estimativa fica mais suave, mas em contrapartida, falha em responder
rapidamente o movimento nos preços.
Sendo assim, Pinheiro (1996) conclui que “a diminuição do número de
observações pode acarretar perda de precisão”. E finaliza afirmando que “não existe
nada como um n ótimo que possibilite respostas rápidas a movimentos bruscos nos
preços e que ao mesmo tempo, encampe um número razoável de observações, dando
precisão à estimativa”. No entanto, a escolha é feita pelo próprio usuário e de acordo
com seu interesse.
Assim, visando resolver o problema acima, apresentado pelo estimador de
máxima verossimilhança, surgiu o estimador de média móvel exponencialmente
ponderada.
3.3.3. Estimador de média móvel exponencialmente ponderada
Considerado um avanço quando comparado aos outros esquemas de ponderação,
o estimador de média móvel exponencialmente ponderada “consiste basicamente em
designar maior peso para as observações mais recentes”
13
. Possui como objetivo fazer a
estimativa reagir de forma mais rápida a movimentos bruscos de preço.
Assim, diferentemente dos demais estimadores, neste o peso das observações
diminui com o decorrer do tempo fazendo com que a volatilidade estimada tenha um
decaimento gradual.
12
No exemplo da utilização do estimador de máxima verossimilhança apresentado por Pinheiro foram
usados dois n diferentes, 20 e 60 dias úteis. Pinheiro notou que, “como a amostra é igualmente ponderada,
uma observação nova, recém-coletada, terá o mesmo peso que a mais antiga de todas”. No entanto,
conclui ser importante a realização de observações tendo em vista ser prejudicial sua redução.
13
Ver Pinheiro (1996).
38
A fórmula utilizada para calcular a volatilidade e que representa este estimador
é:
(
)(
)
,
2
,1
1
0
2
tNt
N
n
nt
nt
xXw
=
=
σ
onde:
)
(
,1
λλ
=
n
n
w .10
<
<
λ
Percebe-se, assim, que o peso alocado para cada observação, representado na
equação por
, depende do fator de decaimento
""
n
w ""
λ
. Seguindo este raciocínio,
quando
temos: ,N
,))(1(
2
1
2
1
2
+=
tttt
xX
λλλσσ
=
=
oi
it
i
t
Xx
11
λ
Dessa expressão extrai-se que a cada nova observação as estimativas são
refeitas, ou seja, esta fórmula é recursiva. Para chegarmos a , faz-se necessário
definir , que pode ser feito da seguinte forma:
14
2
1
σ
2
0
σ
=
=
1
0
2
)1,0(
2
0
,)(
1
k
t
kt
xX
k
σ
No entanto, em razão do estimador de média móvel exponencialmente
ponderada depender da escolha do fator ótimo de decaimento, tal escolha, que deve ser
14
)1,0( k
x é a média aritmética do tempo t a k-1.
39
baseada numa comparação de estimativas ex-ante e ex-post de volatilidade, conforme
define Pinheiro (1996), não está inserida nos objetivos deste trabalho.
Sendo assim, o próximo passo é o estudo dos processos auto-regressivos
mencionados anteriormente.
3.3.4. ARCH
Autoregressive Conditional Heteroskedasticity é um processo auto-regressivo
heterocedástico derivado da suposição de que a volatilidade segue um processo AR (de
ordem
). Este, na definição de Pinheiro (1996), consiste num processo onde a
variável independente é explicada por ela própria, porém defasada de p períodos e
representado da seguinte forma:
[
)( pARp
]
,2211
...
tptpttt
uyyycy
+
+
+
+
+=
φ
φ
φ
onde
é a variável; p é ordem do processo e é chamado de ruído branco, isto é:
t
y
t
u
0)(
=
t
uE
para
2
)(
σ
τ
=uuE
t
τ
=
t
0)(
=
τ
uuE
t
em outros casos.
Na verdade, os modelos ARCH são uma tentativa de aplicar as características de
reversão para a média e de autocorrelação da volatilidade para ajudar na sua estimativa.
40
Assim, para se chegar ao processo ARCH(m), basta supor que segue um processo
AR(m), na forma a seguir
15
:
2
t
u
,...
22
22
2
11
2
tmtmttt
wuuuku +++++=
ααα
onde
é o novo ruído branco, com as mesmas características de já definidas
anteriormente.
t
w
t
u
Importante destacar que, apesar da variância incondicional ser constante, ou
seja,
, a variância condicional pode variar com o tempo. Dessa forma, o
processo não apresentará necessariamente a mesma variância sempre, o que de certa
forma pode ser interpretado como um ponto positivo frente ao mercado financeiro,
afinal ativos mais voláteis, com altas variâncias, são capazes de proporcionar maiores
retornos aos investidores, compensando assim o risco por estes assumido. Até porque,
agentes avessos ao risco exigem uma compensação em termos de retorno, de acordo
com o grau de risco do ativo.
22
)(
λ
=
t
wE
Por fim, se considerar:
,
2
ttt
vu ×=
σ
onde
é uma variável aleatória independente identicamente distribuída com média
zero e variância um, tem-se:
{}
t
v
15
Trata-se de um processo autoregressivo de heterocedasticidade condicional de ordem m.
41
+=
n
i
itit
uk
1
22
ασ
s de Pinheiro
(1996), “os modelos ARCH parecem responder mais rapidamente a “observações de
variações nos preços com reflexo sobre a volatilidade)”.
3.3.5.
mória mais longa e uma estrutura de defasagens para a variância
mais fl
esmo ambos
terem a
como um processo ARCH.
Segundo analistas, os modelos ARCH são superiores em precisão quando
comparados ao estimador de máxima verossimilhança, em decorrência da falta de
precisão e da ausência de respostas suficientemente rápidas. Nas palavra
choque” (bruscas
GARCH
Os modelos GARCH (General Autoregressive Conditional Heteroskedasticity)
são uma generalização dos modelos ARCH. Diferenciam-se destes últimos por
permitirem uma me
exível. São também utilizados para entender a relação entre a volatilidade e os
retornos esperados.
De acordo com Souza Sobrinho (2004), os modelos GARCH apresentaram
ligeira superioridade em relação aos modelos de volatilidade estocástica, m
lcançado seus objetivos com “razoável robustez”, quando aplicados na extração
de volatilidade a uma série do Ibovespa durante a vigência do Plano Real.
42
Estudos demonstram que uma vez satisfeitas as restrições paramétricas, o
modelo GARCH não apresenta problemas como distribuição incondicional degenerada
dos retornos, persistência unitária da volatilidade e não-reversão à média.
16
Uma versão simplificada de um processo GARCH pode ser expressa da seguinte
forma:
∑∑
==
++= uk
222
.
σβασ
odelos GARCH são o
de má
essa forma, vale dizer que em razão do seu bom desempenho e parcimônia, o
modelo-padrão da família ARCH tanto em aplicações
acadêm as quanto em aplicações práticas mais sofisticadas.
o estudo da estimativa da volatilidade e dos tipos de volatilidade
existen
q
i
p
i
itiitit
11
Importante destacar que, de acordo com o estudo realizado por Souza Sobrinho
(2004), os métodos geralmente empregados na estimação dos m
xima verossimilhança, sob a hipótese de a taxa de retorno ser distribuída
conforme uma normal e o da quase-máxima verossimilhança, que prescinde da exata
especificação da função densidade da taxa de retorno.
D
modelo GARCH tornou-se o
ic
3.4. Previsão de Volatilidade
Após
tes, fica fácil compreender que o termo “previsão” somente é utilizado para a
volatilidade histórica, afinal, como visto, a volatilidade implícita já é por si só um tipo
de previsão.
16
Por exemplo, ver o artigo de Souza Sobrinho (2004).
43
Assim, como o cálculo da volatilidade é um processo que tenta avaliar
estatisticamente o potencial de variação do ativo, entende-se por bem apresentar o passo
a passo para o cálculo da volatilidade de um ativo antes de se adentrar em como prever
a volatilidade futura.
A primeira decisão a ser tomada é escolher a série de preços do ativo para o
período escolhido. Em seguida, calcula-se a variação diária dos preços, através da
divisão do preço de fechamento do dia pelo preço de fechamento do dia anterior. A
terceira providência é calcular a média das variações através da soma de todas as
variações e a posterior divisão deste resultado pelo número de observações em que se
realizou o cálculo. A seguir, deve-se calcular a diferença entre cada variação e a
variação média. Para cada resultado anterior d
everá ser elevado ao quadrado, somados e
depois divididos pelo número de observações que compuseram o cálculo menos um. Por
btido, dando assim o desvio-padrão das
ariações de preço, ou seja, o quanto a variação de preço pode sair do valor esperado,
represe
Para o alcance da previsão da volatilidade futura é imprescindível a existência e
o
média aritmética dos valores apresentados, conforme dados apresentados na Tabela 1.
fim, extrai-se a raiz quadrada do valor o
v
ntando um risco para o investidor.
17
3.4.1. Previsão de Volatilidade Histórica
conhecimento de alguns dados de volatilidade, posto aquela ser obtida através da
17
Ver Silva (1996).
44
Tabela 1 – Estimativas para a v ilidade da Comp ale do Rio Doce (Vale PN)
n (dias úteis) Volatilidade (%)
olat anhia V
20 35,19
40 31,01
60 31,30
120 28,01
250 28,89
Tecendo a média aritmética dos valores apresentados tem-se::
(35,19% + 31,01% + 31,30% + 28,01% + 28,89%) 5 = 30,88%
De acordo com o cálculo apresentado, a volatilidade futura seria de 30,88%.
No exemplo apresentado, as estimativas foram obtidas utilizando o estimador
não viesado de mínima variância uniforme. No entanto, este exemplo também é válido
para o caso onde as estimativas tenham sido obtidas pelos estimadores de máxima
verossimilhança ou de média móvel exponencialmente ponderada, bem como pelos
modelos ARCH.
18
Nota-se ainda que o valor obtido é a volatilidade anualizada através da previsão
mais simples de ser realizada. Qualquer combinação linear dos valores acima
apresentados que atenda a interesses específicos pode ser considerada como uma
previsão coerente de volatilidade da Vale PNA. Em poucas palavras, pode-se prever que
a volatilidade no período de 40 dias é de 31,01% e assim por diante.
Fonte dos dados: BOVESPA
Nota: Estimativas obtidas em 01/06/2006
18
Vide item 3.3 do presente estudo.
45
3.4.2.
implícita é obtida através da volatilidade histórica e depende de
vários
de mercado para o ativo subjacente, a data de
exercíc
antes do mercado sobre qual será a volatilidade de
determ a como parâmetro
para a negociação da opção.
Costa (1998) adotou u
latilidade implícita dessa opção, que nada
ais é do que o valor de σ que, colocado na fórmula de
valor de V igual ao que está sendo negociado no
Volatilidade Implícita
A volatilidade
fatores, tais como: o modelo de apreçamento de opções, as características da
opção, dentre outros.
Silva (1996) esclarece que, a partir do cálculo da volatilidade histórica assume-
se que o prêmio é “conhecido” (através da utilização do prêmio da mais líquida),
verifica-se a taxa de juro e o preço
io, e executa-se a fórmula para determinar o nível de volatilidade implícita que
carrega o preço de mercado da opção.
Na definição de Pinheiro (1996), “volatilidade implícita é algo como um
consenso entre os particip
inado ativo durante a vida restante da opção”. Logo, é utilizad
ma definição mais técnica ao dizer que
“o nível de risco embutido no prêmio de uma opção é
medido pela vo
m
precificação de Black e Scholes produz como output um
mercado”.
19
20
19
Para o autor, ao detalhar em diferentes tipos a volatilidade estamos ofuscando a simplicidade do
fundamento, o que pode nos induzir a erro. Segundo ele, o que importa é conhecer o grau de oscilação
atual verificado no mercado do ativo e o grau de oscilação do preço do ativo que vigorará desde a data
atual até o vencimento das opções (esta é estimada).
20
Sobre o Modelo Black & Scholes vide capítulo 5, item 5.5 do presente estudo.
46
Conforme ainda afirma Costa (1998), como a volatilidade implícita é
relacionada ao sobrepreço de uma opção, variações da volatilidade implícita de uma
opção são variações em reais no preço dessa opção.
Nota-se, assim, qu
e a volatilidade implícita pode ser considerada como uma
previsã volatilidade, na medida em que é um indicador da estimativa do mercado
ido o preço da opção até
vencimento da mesma.
na previsão da volatilidade futura,
mesmo erros de medida e problemas estatísticos, afinal a
volatilidade implícita é, com
respeito da previsão futura do
Costa (1998) explica q
o principal sobre utilizar a volatilidade histórica
como parâmetro para operações de volatilidade reside em
que as opções são sensíveis à volatilidade futura e não à
é uma expectativa do mercado para a volatilidade que S
(preço) exibirá entre a data atual e a data de exercício da
opção”.
o de
com respeito à volatilidade futura média do dia em que foi colh
o
3.4.3. Volatilidade Implícita versus Volatilidade Histórica
Estudos comparativos entre as volatilidades implícita e histórica concluíram que
a primeira tem melhor performance do que a segunda
contando com possíveis
o visto, formada a partir de expectativas de mercado a
s preços/volatilidades.
ue
“a questã
histórica. A volatilidade implícita nos prêmios das opções
Dessa forma, para um operador o número calculado como volatilidade histórica
pode ser de pouca utilidade.
47
Logo, em um mercado eficiente, onde as informações relevantes encontram-se
incorporadas instantaneamente nos preços, a volatilidade implíc
ita é o melhor previsor
não-vie
ante às tendências de
preços
endo assim, em razão da sua facilidade de aplicação, neste trabalho será
utilizada a volatilidade histórica estimada através do estimador não viesado de mínima
variância uniforme. Afinal o que se pretende é a validação do modelo proposto e a
análise dos impactos da variável cambial no apreçamento de opções, bastando para
tanto aplicar o mesmo tipo de volatilidade em ambos os modelos analisados.
sado da volatilidade futura.
Conclui-se, assim, que ambos os tipos de volatilidade são formas de estimativas
possíveis de volatilidade futura, no entanto a volatilidade implícita apresenta padrões de
tendência que podem ser tratadas de alguma maneira semelh
de ativos e perseguidas mais ou menos pelo operador.
Ressalta-se, por oportuno, que a volatilidade implícita em uma opção pode
depender de vários fatores observados empiricamente, posto não figurarem nas fórmulas
de apreçamento, nem nos modelos, mas terem seus conceitos conhecidos por todo o
mercado, como por exemplo os smiles e a volatilidade intraday.
S
48
4. TAXA DE CÂMBIO
Dado a importância da taxa de câmbio no comércio internacional é essencial
verificar sua influência no apreçamento de opções. A escolha desta variável se deve à
sua influência na economia brasileira
21
e às suas características próprias, em principal, a
volatilidade. Utilizou-se a taxa de câmbio apenas no modelo das Redes Neurais, visto
não ser possível seu emprego no Modelo Black & Scholes em razão das limitações
apresentadas, que serão abordadas futuramente, em outra parte deste trabalho.
Inicialmente, considerou-se demonstrar a importância da taxa de câmbio e os efeitos de
sua volatilidade sobre o mercado, bem como a escolha de um regime cambial mais
adequado ao país, para em um momento posterior analisar o impacto da volatilidade da
taxa de câmbio no apreçamento de opções.
4.1. A importância da taxa de câmbio
A taxa de câmbio é uma variável importante na política econômica e no
comércio internacional, visto representar uma relação de preço entre duas moedas
nacionais.
Existem dois regimes cambiais básicos: a taxa de câmbio fixa que estabelece
uma relação fixa entre duas moedas nacionais; e a taxa de câmbio flutuante que é
determinada livremente no mercado pela livre interação da oferta e da procura. Desde o
advento do regime flutuante no Brasil, as taxas de câmbio têm sido excessivamente
voláteis e os desvios de seus valores de equilíbrio persistem ao longo do tempo. A
flexibilidade da taxa de câmbio facilita ajustes no balanço de pagamentos, reduzindo a
21
Sobre o assunto, ver item 4.3 do presente trabalho.
49
necessidade de se aumentar o controle de capitais para que se atinja o equilíbrio
econômico
22
. Por outro lado, o regime de câmbio fixo proporciona maior segurança,
agilidade e certeza, tendo em vista a existência de uma relação fixa entre duas moedas.
Segundo Ferreira (2004), “a liberação cambial faz parte da ampliação do
movimento internacional de capitais. Neste contexto, a política de câmbio flexível
passou a ser instrumento essencial à ampliação do movimento de capitais entre países e
regiões”.
Vários são os benefícios decorrentes do regime cambial flexível, dentre eles
pode-se citar a proteção da economia a choques externos e a potencial independência de
ações de política econômica. No entanto, vale destacar que nenhum país adota um
regime puro de câmbio flutuante. Na prática, prevalece o regime de câmbio flutuante
“sujo”
23
no qual há a interferência do Banco Central para evitar uma excessiva
desvalorização ou valorização da moeda.
24
A intervenção do Banco Central no mercado cambial pode ser feita de várias
formas e seguindo diferentes estratégias. A escolha da melhor delas é de extrema
importância e depende de vários fatores, tais como os objetivos da política cambial, a
credibilidade do Banco Central e suas restrições institucionais e do volume de reservas
cambiais, dentre outros. Neste sentido, Crusius (2003) esclarece que, “os objetivos
destas intervenções são defendidos, de maneira geral, como importantes para assegurar
uma flutuação ordenada da taxa de câmbio, tendo como base seus fundamentos, e não
para defender uma paridade fixa para esta variável”. E continua dizendo que “a rigor,
22
Sobre o assunto, Ferreira (2004) esclarece que “qualquer evento que possa trazer dúvidas sobre o
balanço de pagamentos do país, acaba interferindo no mercado de câmbio”. De fato, no regime cambial
flutuante, um desequilíbrio no balanço de pagamentos pode incidir na desvalorização da moeda local.
23
Neste sistema, também chamado de regime de flutuação administrada, as cotações podem variar
somente até o limite que o Banco Central considerar adequado.
24
Ver Lacerda (2003).
50
portanto, não há qualquer restrição formal à magnitude de um realinhamento do câmbio
nominal, desde que este seja percebido como compatível com os fundamentos
econômicos subjacentes”.
4.2. Regime cambial
A escolha do regime cambial a ser adotado é um dos temas mais controversos na
definição da política econômica. A elaboração de critérios para a fixação do valor da
moeda local não é tarefa fácil, principalmente quando se trata de países que não são
possuidores de moedas transacionáveis internacionalmente.
25
Assim, a decisão de qual
o regime cambial condizente com o país em questão deve fundamentar-se em fatores
econômicos, monetários e fiscais sólidos, afinal sua economia e desenvolvimento estão
diretamente ligados a correta escolha do regime de câmbio adotado.
Neste sentido, Ferreira (2004) esclarece que
“o regime cambial de um país tem a necessidade de
combinar dosagens de flexibilidade e rigidez a fim de
combinar múltiplos objetivos econômicos, nem sempre
fáceis de conciliar, como estabilidade e equilíbrio externo
num contexto de mobilidade de capitais”.
Crusius (2003) afirma que, “do ponto de vista teórico, os regimes de câmbio
flexível ou fixo não são melhores ou piores entre si, mas são adequados ou não do ponto
de vista da consistência com as políticas monetária e fiscal”.
25
Ver Lacerda (2003).
51
Assim, com a globalização financeira, permitindo livre fluxo de capitais e
trazendo maior facilidade na comercialização entre países, houve crescente tendência na
adoção de regimes cambiais flexíveis por inúmeras economias emergentes. De fato,
países como Israel, Hungria, México, Colômbia, Chile, Uruguai, Argentina e Brasil
evoluíram de regimes cambiais fixos para regimes cambiais flutuantes. Inicialmente,
Israel adotou o regime de bandas de câmbio fixas e a partir de dezembro de 1991 passou
para o regime de bandas de câmbio flutuantes, objetivando introduzir maior
flexibilidade ao sistema. Em 1989, a Hungria adotou o regime de bandas fixas e em 16
de março de 1995 passou a utilizar o regime de bandas flutuantes. Entre 1992 e
dezembro de 1994, o México utilizou o regime de bandas de câmbio flutuante, na qual a
taxa de desvalorização da margem superior da banda era preestabelecida. A Colômbia e
o Chile passaram a utilizar o regime de câmbio flutuante em setembro de 1999. E o
Uruguai e a Argentina mais recentemente. Já o Brasil iniciou o regime de bandas de
câmbio fixas em outubro de 1994 com uma política de intervenções intramarginais e
paridade central da taxa de câmbio fixada em 0,845 Real/Dólar (em termos nominais) e,
em janeiro de 1999 passou para o regime flutuante, como veremos a seguir.
4.3. Evolução da política cambial brasileira
A reordenação do sistema monetário internacional, ocorrido no período pós-
guerra, foi marcada pela criação do Fundo Monetário Internacional (FMI) e do Banco
Mundial (BIRD) no fórum internacional de Bretton Woods, em 1944. Naquele
momento, duas regras básicas foram estabelecidas, conforme lembra Ferreira (2004):
52
“(1) o dólar norte-americano seria a moeda central do
sistema monetário internacional, tendo em vista o
compromisso americano de garantir aos bancos centrais
dos países membros do FMI – do qual o Brasil faz parte –
a livre conversibilidade do dólar em ouro, à razão de US$
35,00 por onça-troy do metal; e (2) os demais países
membros fixariam as paridades de suas moedas em
relação ao dólar, podendo apenas reajustá-las em casos de
desequilíbrios fundamentais dos seus balanços de
pagamentos, mediante prévia concordância do FMI”.
A partir daí, os países membros do FMI passaram a fixar a paridade de suas
moedas em relação ao Dólar, sendo o Brasil um dos primeiros a adotar este sistema
fixando Cr$ 18,82 por Dólar. No entanto, com o passar do tempo, verificou-se que em
razão das diferentes taxas de inflação entre os países o sistema de paridades fixas não
era o mais adequado.
Assim, no período pós-guerra as taxas de inflação evoluíram de tal forma que,
em 1948, o Brasil passou a viver com o problema da escassez de divisas. Naquele
momento, o problema foi contornado pelas filas de câmbio e, mais adiante, pela criação
do regime de licenças de importação através da Carteira de Exportações e Importações
do Banco do Brasil (CEXIM).
26
Em fevereiro de 1951, o então presidente Getúlio Vargas denunciou a
regulamentação do retorno de capitais estrangeiros como lesiva aos interesses nacionais.
Assim, em fevereiro de 1953 tornou-se livre o fluxo de capitais estrangeiros no país
pelo sistema de taxa de câmbio livre. Finalmente, em setembro de 1953, com a
Instrução nº 70 da Superintendência da Moeda e do Crédito (SUMOC)
27
, que
26
Ver Ferreira (2004). Vale dizer que devido as freqüentes denúncias de corrupção na época, o governo
extinguiu a Carteira de Exportação e Importação em dezembro de 1953, criando a Carteira de Comércio
Exterior em sua substituição.
27
Criada em 1945, com a finalidade de exercer o controle monetário e preparar a organização de um
banco central, a SUMOC tinha a responsabilidade de fixar os percentuais de reservas obrigatórias dos
bancos comerciais, as taxas do redesconto e da assistência financeira de liquidez, bem como os juros
53
disciplinava o mercado de câmbio, o governo passou a distribuir as divisas disponíveis
em lotes (alocados inicialmente em bens de acordo com sua essencialidade), sendo a
taxa de câmbio para cada categoria determinada por meio de leilões. Neste sistema que
durou, com algumas alterações, até 1957, o governo fixava a quantidade de divisas
distribuídas, mas não o valor da moeda estrangeira.
A partir de 1960, tornava-se cada vez mais inevitável uma nova reorganização
do sistema financeiro, uma vez que os desafios da economia já exigiam uma maior
sofisticação dos instrumentos de captação e de aplicação dos recursos financeiros.
Assim, em 1961, houve uma reformulação no mercado cambial brasileiro, retornando-se
ao sistema de taxa de câmbio fixa, ajustada esporadicamente.
O período compreendido entre 1961 e 1964 foi marcado por uma política
cambial instável, posto a taxa de câmbio não ter acompanhado a aceleração do processo
inflacionário, o que despertou a desconfiança do investidor estrangeiro agravando ainda
mais os desequilíbrios no balanço de pagamentos.
Assim, objetivando instituir um mercado de capitais forte e utilizá-lo na política
global de desenvolvimento e de controle da inflação, em 1965 foi promulgada a Lei de
Mercado de Capitais
28
, que fora bem recepcionada pelo mercado financeiro da época, e
criado o Banco Central do Brasil, como gestor da política monetária, cujas diretrizes
eram determinadas pelo Conselho Monetário Nacional. Com isso, funções antes
executadas pelo Banco do Brasil e pela SUMOC, como emissão de moeda, controle do
redesconto e dos depósitos de reservas obrigatórias, regulação das atividades bancárias,
financeiras e dos capitais estrangeiros, foram atribuídas ao BACEN. Neste período,
sobre depósitos bancários. Além disso, supervisionava a atuação dos bancos comerciais, orientava a
política cambial e representava o País junto a organismos internacionais.
28
Lei nº. 4.728, de 14 de julho de 1965.
54
houve forte oscilação nas reservas cambiais e na oferta monetária do país em razão da
inflação brasileira ter sido consideravelmente superior à norte-americana.
Em 1967, surge a nova moeda, o “Cruzeiro Novo” em razão da desvalorização
do "Cruzeiro" e com valor mil vezes maior que este. Posteriormente, em 1968, o
sistema baseado em maxidesvalorizações, em que as revisões da taxa de câmbio tinham
periodicidade de oito a quatro meses, foi substituído pelo sistema de
minidesvalorizações cambiais, com o intuito de incentivar a exportação.
Segundo Ferreira (2004), “esse sistema consistia, basicamente, em ajustar a taxa
de câmbio em intervalos menores de tempo, pela diferença entre as taxas de inflação
doméstica e externa, com desvios maiores ou menores em função do desempenho do
saldo total do balanço de pagamentos”.
O sistema de minidesvalorizações, que perdurou até 1989, baseava-se na
variação da paridade do poder de compra (purchasing power parity), seguindo o
enfoque das metas reais, no qual mudanças na taxa de câmbio alteram a relação entre os
preços domésticos e os externos, o que afeta a competitividade da economia com o resto
do mundo. Este sistema tinha o objetivo de manter constante a taxa de câmbio efetiva
real e evitar ataques especulativos.
Ferreira (2004) destaca que o “aspecto altamente positivo desse sistema cambial
foi o fato de ser um instrumento de rápido ajustamento”. E elenca as seguintes
vantagens do sistema de minidesvalorização:
“(1) estabilização da renda real dos exportadores
brasileiros; (2) manter o grau de proteção efetiva da
indústria nacional em relação às exportações; e (3) evitar
os ciclos de liquidez e de reservas cambiais provocados
pelo antigo sistema de revisão cambial em degraus
longos”.
55
No entanto, a política de minidesvalorizações sofreu algumas interrupções. A
primeira delas ocorreu em 1979 (nove anos após a volta do “Cruzeiro”) quando o
Governo foi obrigado a realizar uma maxidesvalorização de 30% da moeda nacional em
relação ao Dólar devido a problemas de inflação e com balanços de pagamentos.
Assim, para combater a inflação, em 1980 os reajustes do câmbio passaram a ser
prefixados
29
. No entanto, como a economia permanecia sob um amplo sistema de
indexação, a inflação chegou a alcançar os três dígitos ao ano e os reajustes do câmbio,
que no início eram de um mês, chegaram a ser diários, ainda que fixados pelo governo e
não pelo mercado.
A crise externa obrigou o Brasil à assinatura de um acordo com o Fundo
Monetário Internacional (FMI) em fevereiro de 1983, objetivando melhorar a posição
do balanço de pagamentos, reduzir o déficit do setor público e promover a liberalização
da economia, suspendendo a política de minidesvalorização pela segunda vez. Até esse
período, os intervalos entre as minidesvalorizações eram de três a três dias.
No entanto, devido à aceleração da inflação ocorrida no final de 1985, que
elevou a taxa ao patamar de 15% ao mês, o governo instituiu, em janeiro de 1986, um
novo plano de estabilização. Este novo plano baseava-se no congelamento dos preços,
dos salários e do câmbio, na desindexação da economia, na criação de um novo padrão
monetário, o “Cruzado”, e no aumento de taxas de juros para conter a demanda. No
início, obteve grande sucesso em termos de controle da inflação e de níveis de
crescimento econômico. Mas não durou muito. E com o aumento da inflação, no final
daquele ano, foi reintroduzida a política de minidesvalorizações diárias.
29
A taxa de desvalorização para aquele ano foi prefixada em 40%.
56
Em junho de 1987, com o objetivo de controlar a inflação, que em maio daquele
ano atingia 23,26%, foi instituído o “Plano Bresser” que decretava o congelamento de
preços, dos alugueis e salários por 60 dias, dentre outras medidas adotadas. Porém, o
Plano não teve êxito fazendo com que a inflação alcançasse o patamar de 366% em
dezembro. Assim, em janeiro de 1988, Maílson da Nóbrega assume o Ministério da
Fazenda propondo uma política econômica sem medidas drásticas, denominada “Feijão
com Arroz”, para tentar conviver com a inflação e evitar a hiperinflação.
Mas em janeiro de 1989, em razão da inflação ter alcançado 933%, o governo
cria uma nova moeda, o “Cruzado Novo”, com valor 1.000 vezes maior que o extinto
“Cruzado” e lança o “Plano Verão”, que dentre outros objetivos, visava o congelamento
dos preços, a extinção da correção monetária e a privatização de algumas estatais. Como
conseqüência, em um ano de sua implementação a inflação atingiu 2.751%.
Assim, em março de 1990, no início do governo Collor, foi adotado o regime de
câmbio flutuante, a retomada do Cruzeiro como moeda nacional e o confisco de 80% da
poupança financeira, reduzindo a liquidez geral da economia.
Na área cambial, foi transferida para o mercado a responsabilidade pela
determinação das taxas e a conciliação entre oferta e demanda de divisas no segmento
comercial
30
, ou seja, caberia aos bancos e corretoras determinar diariamente o preço do
Dólar no mercado, efetuando operações de compra e venda da moeda americana. E
mais, as instituições credenciadas a operar no mercado de câmbio poderiam adquirir
qualquer volume de divisas, sendo obrigadas a depositar no Banco Central somente o
que excedesse determinado limite.
30
Sobre o assunto, Crusius (2003) esclarece que “se a procura por divisas for maior do que a oferta, o
preço sobe (há desvalorização), assim como, se houver mais agentes querendo vender divisas, o câmbio
se valoriza”.
57
Com essas novas regras, o BACEN modificou seu critério de atuação no
mercado de taxas livres. Ao invés de ter a obrigação de comprar e vender dólares a uma
taxa anunciada pela política das minidesvalorizações, o BACEN somente interviria para
garantir o cumprimento das metas monetárias.
A partir daí, o mercado de câmbio tornou-se mais sensível às taxas de juros, à
instabilidade da política doméstica, sobretudo ao balanço de pagamentos, e às
expectativas de desvalorização do câmbio.
No entanto, apesar do regime adotado pretender uma alta conversibilidade e
flutuação cambial, na prática somente a crescente conversibilidade da moeda nacional
se verificou. E em setembro de 1990, o Banco Central passou a efetuar compras no
mercado de câmbio a fim de acumular reservas internacionais e evitar a volatilidade da
taxa no curto prazo, desvalorizando o Cruzeiro em relação ao Dólar. Surge aí a
expressão “flutuação suja”, conceituada anteriormente
31
.
A abertura da economia prosseguiu até agosto de 1991, registrando uma
valorização real de 11,34% do Cruzeiro em relação ao Dólar dentro do sistema de
flutuação suja, o que prejudicou as exportações brasileiras e levou à retração do ingresso
de divisas no país. Assim, em setembro, o Banco Central promoveu uma desvalorização
de 14% no Cruzeiro em relação ao Dólar, retornando ao regime de câmbio fixo em
outubro daquele ano.
Ao final de 1991, “quando a taxa de câmbio do Cruzeiro em relação ao Dólar se
tornou compatível com o processo inflacionário interno e o governo adotou uma política
de juros elevados, houve substancial ingresso de capital no País, fruto não apenas de
31
Vide item 4.1 (A importância da taxa de câmbio), desta dissertação.
58
investimentos estrangeiros, mas também de captação de recursos externos por empresas
estrangeiras”, conforme esclarece Munch (2003).
A partir de 1992, o governo manteve a orientação de ampliar a abertura
econômica, com o estímulo à entrada de recursos externos, sendo implementadas várias
medidas para regular o fluxo de capitais estrangeiros, dentre as quais “estava a
revogação da proibição de remessas (royalties e assistência técnica) de uma subsidiária
para sua matriz no exterior e a isenção da obrigatoriedade de se depositar, no Banco
Central, a remessa destinada ao exterior para pagamento do principal e dos juros de
natureza financeira”.
32
Neste ano, o BACEN passa a controlar o distanciamento das
cotações entre paralelo e comercial comprando e vendendo moeda estrangeira
diretamente no mercado flutuante a fim de alcançar a unificação cambial e,
conseqüentemente, a estabilização.
E em abril de 1992, a crise monetária e o excesso de divisas começam a
desestabilizar a economia, provocando alta do ágio do Dólar paralelo em relação ao
oficial e o início das intervenções quase diárias do Banco Central no câmbio.
Assim, em 1993, com a desvalorização do Cruzeiro, cria-se o Cruzeiro-real, com
valor 1.000 vezes maior. Neste ano a inflação foi de 2.477,12%, a mais alta desde 1990.
No primeiro semestre de 1994, o Governo tentou novamente restringir a entrada
de recursos externos no País através da regulamentação da atuação do investidor
estrangeiro. De acordo com Munch (2003), “mesmo assim, as operações do setor
externo foram as principais responsáveis pelo crescimento da base monetária nos
primeiros seis meses do ano”.
32
Ver Munch (2003).
59
Em março de 1994 foi criada a Unidade de Referência de Valor (URV)
33
como
unidade de conta alternativa, cuja cotação em 30 de junho de 1994, no valor de C$
2.750,00, passaria a equivaler a uma nova moeda brasileira, o Real (R$).
Assim, diante do grande fluxo de divisas e buscando a estabilidade da moeda, o
então Governo de Fernando Henrique Cardoso implanta o Plano Real em 1º de julho de
1994, baseando-se em um regime explícito e flexível de bandas cambiais. Neste
momento, o Banco Central adotou a paridade fixa de 1,00 R$/US$ na cotação de venda,
sem mencionar a taxa de compra, permitindo sua livre flutuação de acordo com o
mercado, mas comprometendo-se a vender dólares sempre que a taxa de câmbio
atingisse o limite máximo fixado.
O ingresso líquido de divisas e a combinação de taxa flutuante com juros
elevados, utilizada para fixar as bandas cambiais, conduziram a uma apreciação do
câmbio, atingindo sua cotação mais baixa no valor de R$ 0,889 por Dólar em agosto
daquele ano, deteriorando a balança comercial. Dessa forma, em setembro de 1994 o
BACEN teve que intervir no mercado de câmbio a fim de sinalizar um limite mínimo
para as cotações, fato que não acontecia desde a implantação do Plano Real.
No mês seguinte, com o intuito de auxiliar no processo de estabilização
econômica do país, o BACEN estabeleceu uma banda informal com paridade central da
taxa de câmbio fixada em 0,845 R$/US$ (em termos nominais), iniciando o regime de
bandas de câmbio no Brasil.
A partir de novembro de 1994, já eram sinalizados problemas com o câmbio. O
Dólar estava sofrendo uma apreciação e as medidas de estímulo às importações levaram
ao primeiro déficit comercial brasileiro desde 1986.
33
A URV refletia uma cesta de índices de preços e variava tendo o Dólar como parâmetro.
60
Em dezembro, estourou a crise do México. Tal fato criou um ambiente de
incertezas, afastando investidores internacionais do Brasil e fazendo com que as
reservas brasileiras caíssem de US$43,4 bilhões em setembro, para US$ 38 bilhões em
dezembro. Como conseqüência da elevação significativa da demanda por Dólar, o
BACEN interferiu no mercado vendendo dólares, na tentativa de impedir uma oscilação
mais brusca da taxa de câmbio.
No início de 1995, com a fuga de capitais especulativos, a equipe econômica
passou a estimular as exportações. A deteriorização da balança comercial agravava o
déficit do balanço de pagamentos em conta corrente.
Em março daquele ano, objetivando a eliminação das especulações quanto à
possível desvalorização da moeda brasileira, o BACEN alterou a política de câmbio,
fixando uma banda de câmbio com flutuação de 0,86 R$/US$ a 0,90 R$/US$. A falta de
transparência e informações contraditórias passadas pelo governo, ocasionados pela
inexperiência com o sistema, provocou confusão no mercado e criou um amplo
movimento especulativo contra o Real. Os principais bancos não acreditavam na
estabilidade das bandas. E os demais interpretaram que os limites máximos e mínimos
destas poderiam ser alternados constantemente.
Para se ter uma idéia, no dia 08 de março de 1995, o governo interveio cinco
vezes no mercado de câmbio e no dia seguinte o Banco Central foi obrigado a realizar o
recorde de 32 leilões de venda de Dólar, posto o movimento especulativo ter atingido
seu auge. Assim, no dia 10 de março o BACEN alterou os limites da faixa cambial
permitindo ao Dólar flutuar entre 0,88 R$/US$ a 0,93 R$/US$ e adotou uma série de
medidas para estimular o ingresso de recursos no país e desestimular a saída de capitais,
dentre as quais estava a redução do volume de dólares que os bancos poderiam manter
61
em seu poder (de US$50 milhões para US$5 milhões), devendo o restante ser
depositado no Banco Central a juros baixos; a elevação considerável da taxa de juros e a
eliminação do imposto sobre Operações Financeiras (IOF) para empréstimos; e
aplicações de capital estrangeiro nas Bolsas de Valores.
Em 12 de junho de 1995, o governo conseguiu vender todo o lote de papéis
atrelados ao Dólar (as NTN´s cambiais), sinalizando que não pretendia alterar a banda
cambial no curto prazo e acalmando o mercado da moeda estrangeira. Adotou, ainda,
outras medidas visando trazer maior estabilidade ao mercado de Dólar, quais sejam: a
instituição dos leilões de spread
34
e a atuação do BACEN em intrabandas (pequena
faixa dentro da banda oficial). Dez dias depois, houve a modificação das bandas de
câmbio, passando para 0,91 R$/US$ e 0,99 R$/US$, conferindo maior flexibilidade na
condução da política cambial.
Neste contexto, vale lembrar que com o advento das minibandas, implementadas
através dos leilões spread, o mercado de câmbio passou a ser menos volátil, posto a
variação média do Dólar no período de 7 de março a 22 de junho ter sido de 0,40%
contra 0,10%, entre 23 de junho a 25 de julho.
Em janeiro de 1996, houve nova alteração das margens superiores e inferiores
das bandas de câmbio, passando para 0,99 R$/US$ e 1,06 R$/US$, respectivamente. O
Conselho Monetário Nacional (CMN) determinou que os limites da banda cambial
fossem definidos periodicamente pelo BACEN e que este deveria intervir no mercado
de câmbio todas as vezes que os limites das faixas de flutuação fossem atingidos.
Assim, em 1997 os limites da banda cambial foram novamente modificados,
passando para 1,05 R$/US$ e 1,14 R$/US$, e posteriormente, em 20 de janeiro de 1998,
34
No leilão de spread, o banco que quiser negociar com o Banco Central deverá mostrar os dois preços, o
de compra e o de venda.
62
foram elevados para R$ 1,12 e R$ 1,22 por Dólar. Este último ano foi marcado pela
intensiva preocupação com a perda de reservas internacionais totalizadas em US$ 36,1
bilhões, apesar das medidas adotadas com o objetivo de incentivar o ingresso de
recursos externos.
Pelo exposto até então, nota-se que nos primeiros anos do Plano Real, a
preocupação e o esforço do governo em manter a cotação do Real mais próxima
possível da paridade com o Dólar norte-americano, trouxeram resultados satisfatórios
para a época. No entanto, devido a política de juros elevados que desencadeou no
aumento da dívida interna e a insegurança de investidores estrangeiros agravada com as
crises asiática e russa no final de 1997 e 1998, respectivamente, o Brasil teve grande
perda de reservas internacionais demonstrando a vulnerabilidade da economia brasileira
a uma crise externa e a necessidade de modificar a política cambial vigente na época.
Neste contexto, cumpre destacar as palavras de Ferreira (2004): “O real
sobrevalorizado prejudicou sensivelmente as exportações, gerando déficits comerciais.
A conseqüência foi não só a perda de competitividade no mercado externo, como
também perda de reservas cambiais.
Dessa forma, a fim de tentar conter a perda de reservas e em razão da taxa
cambial aproximar-se do limite superior da intrabanda, em 13 de janeiro de 1999, o
Banco Central ampliou a banda cambial para 1,20 R$/US$ a 1,32 R$/US$ e aumentou
suas intervenções nos mercados presente e futuro. Além destas medidas, o BACEN
decidiu unificar as posições de câmbio existentes nos dois segmentos, o livre, também
chamado de "comercial", e o flutuante, conhecido como "turismo", inexistindo, assim,
diferença entre eles na formação da taxa de câmbio.
63
Contudo, o ajuste inicial (aumento da banda) mostrou-se pequeno e as novas
elevações nas taxas de juros foram ineficientes. Como a fuga de capital continuou em
ritmo acelerado, em 15 de janeiro, o Banco Central decidiu não intervir, deixando que o
Real passasse a flutuar livremente de acordo com o estabelecido pelo mercado
interbancário. A partir daí, o BACEN somente atuaria com vistas a conter as oscilações
bruscas da taxa de câmbio. Neste ano, houve uma forte desvalorização do Real, que de
1,21 R$/US$ alcançou uma média de 1,52 R$/US$ em janeiro, 1,91 R$/US$ em
fevereiro e 1,90 R$/US$ em março.
Diante da inexistência de pressões do setor externo e da retomada da confiança
no país pelos agentes econômicos, nos primeiros três meses do ano 2000 houve uma
diminuição da cotação da moeda norte-americana e os investimentos externos líquidos
voltaram a crescer. Porém, no segundo semestre, rumores do mercado externo causaram
pressões sobre a taxa de câmbio, terminando o ano a 1,95 R$/US$.
Em 2001, devido a fatos internos e externos, tais como a crise do setor elétrico, a
recessão norte-americana agravada com os atentados terroristas de 11 de setembro, a
estagnação econômica do Japão e as crises da Turquia e Argentina, a economia
brasileira cresceu somente 1,5% e a taxa de inflação atingiu 10,4%. A cotação chegou a
2,80 R$/US$ em setembro e no final do ano, com interferência do Banco Central,
fechou em 2,32 R$/US$.
Segundo Ferreira (2004),
”em situações de crise, como ocorreu em setembro, o que
o Banco Central fez foi acionar os instrumentos clássicos
de política monetária que tem a seu alcance: elevação dos
depósitos compulsórios sobre os depósitos à vista e a
prazo dos bancos comerciais; ampliação dos leilões de
títulos governamentais com correção cambial; e aumento
de suas intervenções no mercado de câmbio”.
64
Em resposta à maior confiabilidade do mercado na economia brasileira, a taxa
de câmbio manteve-se relativamente estável no período entre novembro de 2001 a abril
de 2002. No entanto, as expectativas econômicas para 2002, principalmente por ser um
ano eleitoral, não se confirmaram. Na prática, houve novo clima de incerteza e
instabilidade causado por uma série de fatores, tais como, a incerteza quanto ao
processo eleitoral e o agravamento da crise da Argentina, dentre outros.
Segundo analistas, a crise política instaurada no governo de FHC, como a saída
de lideranças do PFL de cargos executivos, provocou a desvalorização cambial em
março daquele ano e causou efeitos negativos no mercado.
Assim, em 06 de maio de 2002, o Banco Central cria o hedge, nova modalidade
de proteção cambial, com o objetivo de controlar as oscilações da moeda norte-
americana, e permite ao investidor contratar a proteção cambial do BACEN apenas pelo
“swap”, sem a necessidade de comprar títulos do Tesouro Nacional.
35
Em setembro de 2002, o clima de incertezas e a desvalorização do Real frente ao
Dólar elevaram as expectativas de inflação. Após esse período de turbulências
internacionais e com o fim do processo eleitoral, a economia brasileira adquiriu
novamente estabilidade e, diante do compromisso assumido pelo novo governo em
continuar com a política fiscal e monetária, a taxa de câmbio desvalorizou-se
acentuadamente fechando o ano em 3,53 R$/US$ e a inflação atingiu 12,53%.
Segundo Bacha (2005), “o compromisso com o equilíbrio fiscal contribui para
reduzir as expectativas futuras de inflação e permitir que a política monetária cumpra
seu papel de estabilizar os preços no curto prazo com custos mais baixos”.
35
Vigente até então, o “swap casado” consistia em uma forma de investidores protegerem suas dívidas
em Dólar com a contratação de operação no Banco Central de troca de rentabilidade comprando
obrigatoriamente títulos pós-fixados (LTF’s corrigidos a juros de mercado). Esta modalidade amarrava o
Tesouro Nacional ao investidor e o fazia vender títulos depreciados no mercado (a um valor mais baixo
do que havia pago anteriormente).
65
Assim, em outubro de 2003, houve uma valorização cambial em razão da
expectativa de que o Banco Central suspendesse os leilões para rolagem da dívida
cambial até dezembro, fazendo com que o Dólar encerrasse em baixa de 2,87 R$/US$
no dia 20 daquele mês, fechando o ano em 2,89 R$/US$ e inflação de 9,30%.
No segundo mês de 2004, o Grupo dos Sete países mais industrializados do
mundo (G7) alertou contra a volatilidade excessiva nos mercados. No entanto, o Japão
se recusou a mudar sua política de intervir no câmbio
36
, conforme afirmou o vice-
ministro das Finanças do Japão na época, Masakazu Hayashi (2004): “é desejável que o
câmbio reflita fundamentos econômicos. Nossa política de agir contra movimentos
excessivos está inalterada”.
37
Após uma reunião econômica, em dezembro, líderes chineses prometeram
manter estáveis as políticas fiscal e monetária no ano de 2005 e o controle sobre
investimento em capital fixo.
No Brasil, em junho de 2004, o Banco Central decide rolar até 40% dos
vencimentos cambiais em razão de uma demanda competitiva no mercado, o que não
fazia desde novembro de 2003. No entanto, em novembro deste mesmo ano, com a
tendência de baixa do Dólar em razão da incerteza quanto ao resultado da eleição
presidencial americana, inexistia no mercado demanda por hedge, não fazendo sentido a
realização de leilão de rolagem dos títulos. Na verdade, o BACEN objetivava reduzir a
exposição da dívida pública às oscilações do câmbio, que fechou o ano em 2,65R$/US$.
O ano de 2005 inicia com o Banco Central anunciando que passará a promover
leilões de “swaps” cambiais com periodicidade inicial semanal, a fim de reduzir o
passivo cambial do setor público. Essa medida implementada desde 2003, mas com
36
Para conter a alta do Iene, o Japão vendeu um recorde de 20 trilhões de Ienes em 2003.
37
Publicado em 09 de fevereiro de 2004, no Universo On Line – UOL:
http://www1.uol.com.br/economia/reuters/ult29u32809.shl
66
algumas modificações contratuais, seria baseada em condições adequadas de mercado a
cada momento e teria como objetivo não adicionar volatilidade ao mercado cambial
nem interferir na tendência de flutuação da taxa de câmbio.
No final, mesmo com a crise política no governo Lula, o câmbio encerra o
período em baixa, cotado a 2,34 R$/US$ e a inflação reduz para 5,69% contra 7,60% do
ano anterior.
Por fim, o ano de 2006 inicia com valorização da moeda brasileira de 9,82% em
20 de fevereiro, sendo 40% de alta apenas neste dia.
Conforme Fonseca (2006), “por mais restritivas que fossem as regras cambiais
vigentes nos últimos 70 anos, elas não nos livraram de recorrentes crises cambais e de
gigantescas fugas de capitais”.
38
O autor do texto lembra a evasão de divisas na
economia brasileira ocorridas nos anos 1980 e 1998. Para ele, é ingênua a idéia de
quanto mais controlado o cambio, menor a vulnerabilidade cambial, afirmando que “na
era da globalização, são inúteis os controles cambiais e cada vez mais se impõem o livre
fluxo de capitais, a livre cotação e a conversibilidade das moedas”.
Conclui-se, assim, que o regime de câmbio flutuante introduzido em janeiro de
1999 após experiências insatisfatórias de indexação cambial, das bandas cambiais, de
câmbio fixo e de maxidesvalorizações periódicas, é o que melhor se adequa à política
econômica brasileira.
Após as desvalorizações cambiais ocorridas nos anos anteriores, em especial em
2002
39
, a cotação do Dólar chega a 2,11 R$/US$, em 03 de março de 2006, menor valor
em 5 anos. Essa queda de 0,14% se deve, dentre outros fatores à balança comercial e ao
38
“O cambio em debate”, publicado no Jornal Folha de São Paulo, em 20 de fevereiro de 2006. Roberto
Giannetti da Fonseca é economista e diretor titular do Departamento de Relações Internacionais e
Comércio Exterior da Fiesp (Federação das Indústrias do Estado de São Paulo) e presidente da Funcex
(Fundação Centro de Estudos do Comércio Exterior).
39
Desde 2002 a moeda norte-americana caiu quase 40% em relação ao Real.
67
maior fluxo de divisas desde 1998, refletindo assim a melhora do cenário externo.
Coincidentemente, o Banco Central está atuando de forma mais discreta no câmbio,
indicando que possivelmente as reservas em moeda estrangeira já estão em níveis
confortáveis.
40
Em 07 de março deste ano, o BACEN avisou que não realizaria leilão de “swap
cambial reverso”, contrariando o afirmado anteriormente. No dia 10, o BACEN somente
realizou leilão para comprar dólares diretamente dos bancos. A divulgação de dados de
inflação dentro do esperado pelo mercado (em 0,41% em fevereiro) ocasionou queda na
taxa de juros na BM&F (Bolsa de Mercadorias & Futuros).
Em 14 de março, a notícia de que o Governador de São Paulo, Geraldo Alckmin,
será o candidato à Presidência pelo PSDB reforçou o otimismo no mercado, e o ingresso
de recursos no país fizeram com que o Dólar atingisse o menor nível do dia, a 2,12
R$/US$. Até então, o Banco Central não realiza leilão de contratos de swap cambial
reverso há cinco sessões, efetuando somente o leilão de compra de dólares. Segundo
analistas, sua atuação mais fraca torna mais difícil enxugar a liquidez do mercado.
De acordo com o boletim do Banco Central
41
, a taxa de câmbio será de 2,22
R$/US$ no primeiro semestre de 2006 e de 2,13 R$/US$ no segundo semestre. A nós,
só nos resta esperar e torcer para que fatores como a política não reverta a apreciação do
Real.
40
Vide “Fluxo cambial é o maior desde 98, e dólar atinge novo mínimo em 5 anos”. Jornal Folha de São
Paulo, de 03 de maço de 2006. p. B1.
41
BCB Boletim/BP, atualizado em 02 de março de 2006.
68
4.4. Impacto da volatilidade da taxa de câmbio sobre o mercado
A globalização financeira permitiu o livre fluxo de capitais e trouxe maior
facilidade na comercialização entre países, provocando maior adoção de regimes
cambiais flexíveis por inúmeras economias emergentes. Neste regime mudanças bruscas
nas expectativas provocam variações bruscas na taxa de câmbio o que pode ser um fator
altamente instabilizador.
42
Nas palavras de Crusius (2003), “movimentos bruscos da taxa de câmbio
nominal, ainda que justificados, podem causar desequilíbrios de curto prazo envolvendo
os setores exportadores, importador e bancário, afetando o lado real da economia”. E
acrescenta que, “além disso, pode haver problemas de liquidez, aumentando a
volatilidade cambial”. Sendo assim, o efeito da volatilidade da taxa de câmbio, ou seja,
a incerteza gerada por variações no câmbio, sobre os movimentos do comércio
internacional tornou-se uma questão importante em economia internacional.
Vários estudos teóricos analisaram a reação do comércio frente ao
comportamento da taxa de câmbio. A maioria concluiu que um aumento da incerteza em
relação à taxa de câmbio leva a um menor nível de comércio, em razão do risco ali
existente.
No estudo sobre considerações e perspectivas do MERCOSUL, Ferreira (2004)
conclui que “um ambiente marcado por um processo de instabilidade cambial, que
42
Ferreira (2004) menciona que um levantamento feito por Hausmann & outros (1999) mostra “que a
habilidade da taxa de câmbio flutuar livremente está intimamente relacionada ao nível de
desenvolvimento de um país”. De acordo com o estudo, “quanto mais desenvolvido o país, mais volátil
será a taxa de câmbio, tanto em relação ao nível das reservas internacionais quanto da taxa de juros”
Dessa forma, de acordo com o autor, “nos países em desenvolvimento, o regime de câmbio flutuante é
menos volátil em razão da interferência direta do Banco Central”, como é o caso do Brasil.
69
acarrete alterações freqüentes nos preços relativos, gera incertezas nas decisões de
investimentos e distorções na produção de bens e serviços”.
Nesse contexto, a volatilidade funciona como fator extremamente importante
para a tomada de decisão do investidor, posto auxiliá-lo na análise dos riscos e dos
possíveis retornos advindos do negócio.
Lacerda (2003) elenca três medidas de proteção capazes de minimizar a
volatilidade de países em desenvolvimento, quais sejam, “diminuir a dependência de
recursos externos, gerando expressivos superávits comerciais; ampliar o volume de
reservas cambiais líquidas; e selecionar o ingresso de capitais externos, privilegiando os
investimentos diretos e recursos de longo prazo”.
Examinando a relação existente entre volatilidade e comércio internacional,
alguns estudiosos argumentam que a volatilidade da taxa de câmbio impõe custos sobre
os participantes de mercado avessos ao risco, que geralmente irão responder a isso na
margem, favorecendo o comércio interno em detrimento do comércio externo. Este
argumento vê os agentes como se não pudessem diversificar os riscos de câmbio. Já
outros defendem que há benefícios para o comércio internacional advindos da
volatilidade da taxa de câmbio ou risco cambial. De acordo com eles, o comércio pode
ser visto como uma opção comprada pelas firmas. Como qualquer outro tipo de opção, o
valor do comércio pode subir com a alta da volatilidade.
No entanto, na análise do efeito da volatilidade da taxa de câmbio sobre os
preços tem-se que o exportador que fatura em moeda estrangeira enfrenta risco de
preços afinal a quantidade demandada é conhecida (já que os preços não mudam
durante o período do contrato) mas o fluxo de receita e dos lucros é incerto. No entanto,
o exportador que recebe em moeda doméstica enfrenta o risco quantidade, ou seja, a
70
quantidade demandada é incerta já que o preço enfrentado pelo comprador e os custos
da produção são incertos.
Dessa forma, a incerteza sobre a taxa de câmbio faz com que participantes do
mercado avessos ao risco reduzam suas atividades, mudem preços, ou modifiquem sua
oferta ou demanda de forma a minimizar a sua exposição aos efeitos da volatilidade da
taxa de câmbio.
71
5. OPÇÕES
As opções são um tipo de derivativo que vem sendo muito utilizado no mercado
financeiro, e por isso merece grande atenção por parte de analistas. Derivativos são
instrumentos financeiros cujo valor depende de outro ativo, que pode ser financeiro ou
não.
Segundo Damodaran (1997), “embora a negociação de opções tenha origem
comparativamente recente, valores com características de opções existem há muito mais
tempo”. Para ele, “a tecnologia disponível para a avaliação de opções expandiu-se
fortemente nos últimos 25 anos, especialmente após o desenvolvimento do modelo
básico de precificação de opções de Black e Scholes”.
43
No entanto, este modelo já não apresenta resultados condizentes com a realidade
no cálculo de apreçamentos de opções, surgindo as Redes Neurais como importante
alternativa aos modelos propostos. Sendo assim, neste capítulo será visto que, em razão
das funções que representa, a volatilidade é uma variável muito importante no mercado
de opções
44
, bem como será analisado ambos os modelos para o apreçamento de opções
de forma a encontrar aquele que apresente resultados condizentes com a realidade e que
estabeleça de forma satisfatória as relações entre as diferentes variáveis envolvidas. Para
tanto, torna-se imprescindível analisar o mercado de opções, apresentando suas
características e os fatores determinantes do valor das opções.
43
O Modelo de Black e Scholes foi criado em 1973, conforme será visto mais adiante.
44
Vale dizer que a volatilidade auxilia na determinação de preços de derivativos de forma geral,
principalmente de opções.
72
5.1. Conceito e tipos de opções
As opções conferem a seus proprietários o direito de comprar ou vender uma
quantidade específica de um bem ou um ativo a um preço predeterminado (denominado
preço de exercício) numa data prefixada ou num prazo determinado até a data de
vencimento ou expiração.
As opções podem ser de compra (chamado de call) ou de venda (put). Uma
opção de compra permite ao comprador adquirir um determinado ativo
45
a um preço
predeterminado a qualquer momento antecedente à data de vencimento da opção. Já
uma opção de venda dá o direito ao comprador de vender à outra parte uma quantidade
prefixada de um ativo-objeto
46
, por determinado preço de exercício, até a data de
maturidade do contrato. Em ambos os casos, o comprador paga um prêmio para adquirir
esse direito.
Vale esclarecer que o prêmio de uma opção responderá à variação dada no preço
do ativo-objeto da opção. Sendo assim, se o preço do ativo-objeto da opção baixa, o
prêmio da opção de compra tende a baixar também. Já o prêmio da opção de venda é
inversamente relacionado com o preço do ativo-objeto da opção.
Sobre o assunto, Freitas (2002) reconhece que “em virtude da diferença entre os
riscos assumidos por cada investidor, é de se esperar que a opção tenha um preço que
reflita a possibilidade de ganhos ou perdas futuras do lançador devido à variação do
preço do ativo-objeto”.
45
De acordo com Lemgruber (1992), “o ativo em questão, denominado ativo-objeto, pode ser o ouro ou o
Dólar negociados na BM&F, ou qualquer outro, não necessariamente negociado em bolsa, bastando que
haja concordância entre as partes envolvidas sobre suas características”.
46
Na definição de Silva (1996), ativo-objeto ou subjacente é “o instrumento ou ativo designado que pode
ser entregue para um contrato de opções”.
73
5.2. Classificação das opções e suas características
De acordo com a data de exercício
47
, as opções podem ser classificadas em
opções americanas e opções européias. As primeiras podem ser exercidas a qualquer
momento até seu vencimento. Já nas segundas o direito somente poderá ser exercido na
data de exercício
48
. Assim, por exigir apenas o conhecimento do preço final do ativo, o
apreçamento de opções européias apresenta-se como tarefa bastante simples se
comparada com opções mais complexas do estilo americano. Neste sentido, o que
tornam as opções americanas mais interessantes e difíceis de avaliar é a necessidade de
determinar seu momento ótimo de exercício antecipado.
Conforme Costa (1998), o resultado das opções de compra americanas sobre
ativos que não proporcionam rendas adicionais superiores às taxas de juro demonstra
que o exercício antecipado nunca é mais vantajoso do que a venda e reduz o problema
ao das opções européias. No entanto, para opções de venda americanas sobre o mesmo
tipo de ativo, certas situações (notadamente a alta de taxas de juro) favorecem o
exercício antecipado. Para o autor, “avaliar uma put (opção de venda) americana nessas
circunstâncias não pode ser feito por Black e Scholes, e necessita de um outro modelo.
O mesmo vale para calls (opções de compra) americanas sobre ativos que proporcionem
rendas maiores que as taxas de juro vigentes.”
49
Nota-se, assim que as opções conferem ao seu titular o direito de compra e
venda do ativo-objeto, permitindo que ele exerça sua opção somente quando lhe for
47
Entende-se por data de exercício o prazo que o comprador possui para exercer a opção; e data de
vencimento o último dia no qual a opção pode ser exercida.
48
As opções brasileiras são do tipo americano e possuem cláusula de proteção a variações de preço da
ação-objeto, causadas por distribuições de dividendos, bonificações, subscrições e desdobramentos.
49
Ver Costa (1998).
74
vantajosa. O fato de ser um direito implica que a parte titular possui uma escolha
possível de exercer ou não exercer o direito e permitir que a opção expire
50
.
O comprador de uma opção está exposto a muito menos risco de preço do que o
vendedor ou lançador da opção. O risco do comprador da opção está limitado ao prêmio
pago no ato da compra, ao passo que o risco do vendedor é proporcional ao potencial
movimento de preço.
Aqui, vale esclarecer que o preço de exercício é o preço predeterminado pelo
qual a opção pode ser exercida, ou seja, é o preço pelo qual pode-se comprar (vender) o
ativo caso deseje exercê-la.
Sendo assim, as opções podem estar dentro do preço (in-the-money), no preço
(at-the-money) ou fora do preço (out-of-the-money). Uma opção está in the money se
existe algum lucro que o comprador pode obter imediatamente ao exercer a opção, do
tipo americana
51
, resultando num fluxo de caixa positivo. Já em uma opção at the money
o preço de exercício é igual ao preço de mercado, que faz com que o valor intrínseco
52
seja “zero”. E finalmente, quando a opção está out of the money significa que não
oferece condições de exercício para o momento, pois seu preço de exercício é maior
(menor) que o preço de mercado no caso de uma opção de compra (de venda).
50
Sobre essa escolha, segundo Costa (1998) “não há praticamente nenhum tipo de opção em que, dada
uma situação e assumida a racionalidade do titular, o resultado da escolha não seja conhecido. Isto é,
assumindo-se que o titular é um agente racional que prefere mais dinheiro a menos dinheiro, na verdade
não há escolha alguma sobre o exercício, e a opção deixa de representar uma escolha para representar um
perfil de fluxo de caixa a ser atribuído ao titular em alguma data futura”.
51
O lucro é derivado da diferença entre o preço de mercado do ativo-objeto da opção e o preço de
exercício da opção.
52
Conforme Silva (1996), “do ponto de vista teórico, no preço de uma opção ou prêmio estão embutidos
dois elementos: o valor intrínseco e o valor temporal”. Valor intrínseco, na definição de Silva, é o valor
em espécie que seria alcançado se a opção fosse exercida imediatamente pelo comprador, especificamente
no caso de opções in the money (dentro do preço). Já valor temporal representa o valor que os
compradores estão dispostos a pagar por uma opção, com expectativa de que o preço do ativo-objeto da
opção varie, pelo menos, a uma quantia suficiente para motivar um aumento no prêmio da opção.
75
A Tabela 2 apresenta um resumo dos grupos de moneyness das opções e suas
principais características.
Tabela 2 – Grupos de moneyness das opções e suas características
Grupos de moneyness Opção de Compra Opção de Venda
In the money(“dentro do preço”)
At the money (“no preço”)
Out of the money (“fora do
preço”)
Preço do Ativo > Preço de
Exerc.
Preço do Ativo = Preço de
Exerc.
Preço do Ativo < Preço de
Exerc.
Preço do Ativo < Preço de
Exerc.
Preço do Ativo = Preço de
Exerc.
Preço do Ativo > Preço de
Exerc.
Referidos conceitos podem ser facilmente compreendidos através do gráfico
abaixo (Gráfico 1).
Gráfico 1 – Grau de moneyness das opções
76
Silva (1996) esclarece que “o preço de venda, ou valor total, de uma opção
geralmente excede ao seu valor intrínseco. Isto é verdadeiro para operações do tipo
americano porque o valor temporal é sempre mantido positivo para cima até a data de
expiração”. E continua dizendo que
“o caso é mais duvidoso para opções do tipo
europeu, visto que aproximando-se o tempo de
expiração pode não aumentar seu valor, dado que ele
somente pode ser exercido na data de exercício. Isto
é, uma opção do tipo europeu pode estar in the
money antes da expiração, contudo próximo da data
de expiração ela poderá estar out of the money”.
(SILVA, 1996)
5.3. Contrato de Opção versus Contrato Futuro
Objetivando evitar confusões e propiciar uma melhor compreensão à respeito do
mercado de opções, entende-se por bem tecer breve comentário acerca das diferenças
entre o contrato de opção e o contrato futuro.
Apesar de ambos tratarem de uma opção futura, criando ligeira semelhança entre
eles, suas diferenças são facilmente perceptíveis. Em um contrato de opções, inexiste a
obrigatoriedade do seu cumprimento. Como o próprio nome diz, no contrato de opções
o comprador tem a faculdade de exercer a opção, o que ocorrerá apenas se for de seu
máximo interesse fazê-lo, ou seja, se o preço do ativo exceder o preço de exercício da
opção em uma de opção de compra e vice-versa em uma opção de venda. Nota-se,
assim, que no mercado de opções as partes negociam o direito (e não a obrigação) de
comprar ou vender uma quantidade específica de um ativo a um preço predeterminado
77
para exercê-lo numa data prefixada até a data de exercício ou expiração. Vale dizer que
o comprador da opção paga antecipadamente por esse privilégio.
Já em um contrato futuro, tanto o comprador quanto o vendedor são obrigados a
cumprir suas partes no acordo. Neste, as partes assumem o compromisso
53
de realizar
no futuro a compra e venda do ativo a um preço acordado entre as partes. Dessa forma,
o comprador não tem uma vantagem sobre o vendedor e não tem que pagar um preço
antecipado para o contrato de futuros. A Bolsa de Futuros além de atuar como
intermediário e garantidor no contrato futuro, ela padroniza e regulamenta a forma
como este é criado e negociado no mercado.
5.4. Valores que influenciam no preço de uma opção
O preço de uma opção, usualmente denominado prêmio, depende basicamente
de cinco variáveis: preço do ativo-objeto, preço de exercício da opção, prazo de
vencimento da opção, taxa de juro livre de risco e volatilidade do preço do ativo-
objeto.
54
Nesta seção, comentar-se-á como essas variáveis limitam e afetam os prêmios
das opções de compra e de venda.
5.4.1. Preço do ativo-objeto
O prêmio da opção está diretamente relacionado ao preço do ativo-objeto, de tal
forma que mudanças no valor deste ativo afetam o valor da opção sobre o mesmo.
Assim, como as opções de compra conferem o direito de comprar o ativo-objeto a um
53
O contrato de futuros é um acordo entre duas partes.
54
Freitas (2002) acrescenta os dividendos esperados durante a vida da opção como mais uma variável que
afeta o preço de uma opção de ação. Ver Freitas apud Hull (1998).
78
preço fixo, um aumento no valor do ativo-objeto valorizará as opções. Em
contrapartida, as opções de venda se desvalorizam à medida que o valor do ativo-objeto
aumenta.
5.4.2. Preço de exercício da opção
Conforme comentado anteriormente, o preço de exercício é o preço pelo qual o
comprador da opção pode exercê-la. Esta variável é, na verdade, uma característica-
chave que descreve a opção.
55
O valor da opção é função direta do preço de exercício.
Quanto menor for o preço de exercício, maior será o valor da opção de compra e menor
valor terá a opção de venda.
5.4.3. Prazo de vencimento da opção
Tanto as opções de compra quanto as de venda valorizam à medida que seus
prazos de vencimento aumentam, ou seja, quanto mais distante estiver a data de
vencimento da opção, maior será o direito concedido e, conseqüentemente, maior será o
prêmio, afinal sendo maior o prazo de uma opção há maiores possibilidades de que ela
ofereça condições para o exercício.
Logo, “quanto maior o prazo de vencimento, maior o valor das opções de
compra. Para opções de venda do tipo europeu, os efeitos atuam em sentidos opostos, e
o resultado final não é determinado de maneira geral.”
56
Segundo Lemgruber (1992),
“para as opções de venda do tipo americano, o efeito da possibilidade de exercício
55
Ver Damodaran (1997).
56
Ver Lemgruber (1992).
79
antecipado elimina a desvantagem oriunda da redução do valor presente do preço de
exercício e, como conseqüência, o efeito do prazo de vencimento será idêntico aos das
opções de compra.” Ou seja, “quanto maior o prazo do vencimento maior será o valor
da opção de venda do tipo americano”, conforme afirma o autor.
5.4.4. Taxa de juro livre de risco
A taxa de juro livre de risco afeta o preço das opções na medida em que
influencia a determinação do valor atual do preço de exercício. Como este é um valor
preestabelecido, quanto maior for a taxa de juro, menor será seu valor atual e,
conseqüentemente, maior será o valor (prêmio) das opções de compra (call) e menor o
valor das opções de venda (put).
5.4.5. Volatilidade do preço do ativo-objeto
A incerteza em relação aos retornos proporcionados por determinado ativo-
objeto advém da variação de movimentos de seus preços, afinal estes não são
determinados arbitrariamente ou por qualquer outro mercado nem seguem um padrão.
Logo, quanto maior a volatilidade do ativo-objeto, maior o valor das opções, tanto de
compra como de venda, e portanto, mais valorizada estará a opção.
Dessa forma, faz-se importante observar o reflexo das alterações da volatilidade
sobre o preço das opções a fim de minimizar o risco ou maximizar os ganhos para o
investidor. Afinal, conforme Damodaran (1997) esclarece:
80
“Embora possa parecer contra-intuitivo que o
aumento numa medida de risco (variância) aumente
valor, opções são diferentes de outros títulos, uma
vez que os compradores de opções jamais poderão
perder mais do que o prêmio pago por elas e podem
potencialmente realizar ganhos significativos
decorrentes de grandes movimentos de preços.”
Segundo Costa (1998), “uma pressão compradora persistente nas opções pode
levantar seus níveis de volatilidade constantemente, criando uma tendência de alta que
pode durar dias”. E continua dizendo que, “da mesma maneira, em um mercado calmo,
o desinteresse geral por opções acaba provocando uma oferta, que causa uma downtrend
na volatilidade”.
Analisando o comportamento da volatilidade implícita no mercado brasileiro
percebe-se que esta mostra padrões de tendência que podem ser mais ou menos
perseguidos pelo operador. No entanto, existem outros fatores que devem ser
observados ainda que não estejam na fórmula de apreçamento nem nos modelos, posto
existirem dependências da volatilidade implícita em relação a cada uma delas. Dentre as
mais conhecidas, segundo Costa (1998), estão: a volatilidade no intraday (volatilidade
maior na abertura do pregão e declinante durante o pregão em razão do emagrecimento
da opção ocorrer durante o pregão e do momento de maior inquietação no mercado
ocorrer na sua abertura); volatilidade e direção de mercado (a tendência da volatilidade
implícita nas opções de ações é subir quando o mercado cai e cair quando o mercado
sobe, afinal um mercado acionário em baixa é naturalmente mais volátil que um
mercado em alta)
57
; volatilidade e at the moneyness (onde as opções at the money
57
Costa (1998) menciona que “alguns modelos (como o EGARCH) podem quantificar a dependência
entre a volatilidade do mercado e a sua direção, fornecendo valores de volatilidade histórica diferentes
dos que são calculados assumindo o passeio aleatório dos preços”.
81
apresentam volatilidade implícita menor que as não at the money, resultando no
chamado smile de volatilidade).
5.4.6. Smile de volatilidade
O termo smile (sorriso) surgiu da observação da forma resultante dos gráficos
volatilidade implícita de uma opção versus seu preço de exercício. De acordo com esses
gráficos as opções at the moneyness apresentam volatilidade implícita menor, ao passo
que nas opções out of the money e in the money a volatilidade torna-se maior.
Segundo Costa (1998), “pode-se argumentar que o smile não é um fenômeno da
volatilidade, e sim do preço”, tendo em vista que diferenças constantes nos preços das
opções produzem padrões de smile na volatilidade.
Vale destacar que, no mercado acionário brasileiro ainda não houve
demonstração deste efeito sorriso bem estabelecido em razão das poucas séries de
opções com liquidez simultâneas, ao contrário do mercado de opções de câmbio onde
ocorreram vários casos de smiles. No entanto, apesar das opções out of the money
ocorrerem com maior freqüência e terem liquidez (em razão da existência de
interessados em hedgear uma desvalorização potencial do real), o mercado de opções de
câmbio carecia de opções in the money o que fez com que a outra metade superior do
smile jamais chegou a ser observada com exatidão, coincidindo assim com as
volatilidades escalonadas, tipo mais comum de smile das opções de bolsa brasileiras.
58
A Tabela 3 abaixo, resume os efeitos no valor da opção de acordo com o
comportamento de suas variáveis.
58
Ver Costa (1998). Outra forma de smile que geralmente está relacionada à taxa de juro que é utilizada
no modelo.
82
Tabela 3 – Efeitos no valor da opção
Efeito sobre
Fator
Valor da opção
de Compra
Valor da opção
de Venda
Aumento no preço do ativo-objeto Aumenta Diminui
Aumento no preço de exercício da opção Diminui Aumenta
Aumento no prazo de vencimento da opção Aumenta Aumenta
Aumento nas taxas de juros Aumenta Diminui
Aumento na variância do ativo subjacente Aumenta Aumenta
Fonte: Adaptado de Damodaran (1997).
5.5. Modelo de Black & Scholes
Criado em 1973, por Fischer Black e Myron Scholes, o modelo então
denominado Black & Scholes foi desenvolvido para a avaliação de opções européias,
que são protegidas de dividendos. Representou um enorme avanço na teoria do
apreçamento de opções, sendo considerado um dos modelos mais utilizados e de maior
sucesso em finanças.
A facilidade de sua aplicação, onde o preço da opção pode ser calculado a partir
de uma fórmula, cujas variáveis de entrada, excetuando uma, são diretamente
observáveis, conquistou analistas do mercado. Assim, após sua publicação surgiram
diversos estudos a respeito e os mercados de opções começaram a se desenvolver,
crescendo o volume então negociado.
83
A fórmula de Black & Scholes pode ser utilizada para o apreçamento de
qualquer derivativo dependente de uma ação sem dividendos.
59
Logo, nem a
possibilidade de exercício antecipado nem o pagamento de dividendos afetam o preço
das opções.
Na verdade, este modelo é uma sofisticação do modelo binomial. Enquanto este
requer grande quantidade de dados de entrada, em termos de preços futuros esperados
em cada nó, o Modelo de Black & Scholes reduz substancialmente as necessidades de
informações.
De acordo com Damodaran (1997), “o Modelo Black & Scholes se aplica
quando a distribuição limitadora for a distribuição normal e supõe, explicitamente, que
o processo de preços é contínuo e que não há salto nos preços dos ativos”.
60
Frisa-se, por oportuno, que as determinantes de valor no Modelo Black &
Scholes são aquelas já apresentadas acima, ou seja, o preço atual do ativo-objeto, o
preço de exercício, o tempo a decorrer até o vencimento da opção, a taxa de juro livre
de risco e a variabilidade nos preços dos ativos-objeto.
A fim de produzir resultados úteis, este modelo possui certas premissas básicas
que procuram ser as mais realistas possíveis, quais sejam
61
:
- os mercados têm negociação contínua, isto é, a qualquer tempo há a
possibilidade de realização de um negócio;
- o comportamento do preço da ação segue o modelo lognormal, com taxa de
retorno
()
µ
esperada da ação e volatilidade
(
)
σ
do preço da ação constantes;
59
Segundo Silva (1996), “a fórmula Black-Scholes pode ser muito útil para investidores do mercado de
opções, já que pode ser usada tanto para medir o valor como o risco de uma opção em relação a ação
subjacente”.
60
Conforme esclarece o autor, a distribuição limitadora é a distribuição normal se, à medida que t se
aproxima de zero, as variações de preços se tornarem menores.
61
Sobre o assunto, ver Freitas (2002) e Pinheiro (1996).
84
- não há custos operacionais, nem impostos e todos os títulos são perfeitamente
divisíveis;
- as ações não pagam dividendos até o vencimento das opções, o que permite
que o modelo possa ser utilizado para opções Européias e opções de compra
Americanas;
- não existem oportunidades de arbitragem sem risco
62
;
- há a possibilidade de venda a descoberto, sem qualquer custo adicional;
- a taxa de juro livre de risco é conhecida e constante.
Nota-se assim que, de acordo com este modelo os preços do ativo-objeto de uma
opção possui comportamento estocástico contínuo, na forma de Movimento Geométrico
Browniano, o que significa dizer, nas palavras de Lemgruber (1992), que “a distribuição
probabilística dos preços do ativo-objeto em uma data futura é log-normal e, por
conseqüência, a distribuição probabilística das taxas de retorno calculadas de forma
contínua e composta entre duas datas é normal”.
Outra particularidade do Modelo Black & Scholes é de que nele o preço de uma
opção dependerá exclusivamente da volatilidade da ação a que ela se refere, e não do
valor esperado da mesma.
A fórmula de avaliação para opções definida por Black & Scholes pode ser
derivada em função das seguintes variáveis:
S que é o preço corrente do ativo sobre o qual a opção foi lançada ou ativo-
objeto;
62
Segundo Freitas (2002), “para derivar a equação diferencial que descreve o modelo, Black & Scholes
utilizaram a hipótese de não existência de oportunidades de arbitragem. Dessa forma, construíram uma
carteira sem risco, composta por uma posição na ação-objeto e uma posição na opção, e igualaram seu
retorno à taxa de juro livre de risco”.
85
X é o preço sobre o qual será comprado ou vendido o ativo-objeto na data de
exercício, ou preço de exercício da opção;
r é a taxa de juro livre de risco entre hoje e o vencimento da opção
63
;
T é o tempo, medido em anos, até o exercício;
σ
é a volatilidade anual do ativo subjacente entre hoje e o vencimento da opção;
tendo, assim, um modelo matemático da forma
),,,,(
σ
TrXSfC
BS
=
Dessa forma, utilizando estas variáveis, Black & Scholes definiram fórmulas
para apreçar opções de compra e venda européias de ações sem dividendos, quais
sejam
64
:
)()(
21
dNXedSNc
rT
BS
=
)()(
12
dSNdNXep
rT
BS
=
Onde:
T
TrXS
d
σ
σ
)2/()/ln(
2
1
++
=
Td
T
TrXS
d
σ
σ
σ
=
+
=
1
2
2
)2/()/ln(
63
A taxa de juro livre de risco usada neste modelo deve ser capitalizada continuamente. Para tanto, pode-
se utilizar a seguinte transformação: e
a
– 1 = b, donde a é a taxa capitalizada continuamente e b é a taxa
efetiva.
64
Silva (1996) lembra que algum tempo atrás, a montagem da fórmula do Modelo Black-Scholes era uma
tarefa bastante complexa. Porém, a disseminação da microinformática e o uso intensivo de ferramentas ou
utilitários, como as planilhas eletrônicas, pôs fim ao obstáculo para a montagem do modelo.
86
Aqui, cumpre esclarecer que N(x) é a função de distribuição cumulativa de uma
normal, ou seja, é a probabilidade de uma variável que segue uma distribuição normal
padrão (média igual a 0 e desvio padrão igual a 1) ser menor que determinado valor x;
Xe
-rT
é o valor presente do preço de exercício; c e p são os preços das opções de compra
(call) e venda (put), respectivamente; e ln é o logaritmo neperiano.
Analisando a expressão acima, percebe-se que o modelo requer o conhecimento
de todos os parâmetros nele contidos, os quais são facilmente verificados no momento
da negociação, exceto um, a volatilidade, que não pode ser diretamente observada,
devendo ser estimada.
Como visto no capítulo 3 do presente estudo, há diversas formas de estimar a
volatilidade: a partir de dados históricos do preço da ação-objeto ou através do cálculo
da volatilidade implícita, na qual consiste em determinar a volatilidade a partir do
próprio modelo de apreçamento Black & Scholes, igualando-se a fórmula ao preço de
mercado da opção
65
. No entanto, neste trabalho utilizar-se-á a volatilidade histórica para
o cálculo do apreçamento de opções, em razão dos motivos já expostos anteriormente.
Até porque, conforme afirma Freitas (2002), “ainda não existe consenso quanto
ao método de estimativa da volatilidade mais adequado ao mercado de opções”. Para
Lanari (2000), que analisou vários trabalhos sobre a volatilidade implícita e sua
capacidade de prever o futuro, “não há (...) conclusão definitiva sobre a melhor maneira
de se estimar a volatilidade”.
66
Nestes 30 anos de existência do Modelo de Black & Scholes, diversas críticas
foram a ele direcionadas. Seja em razão da inovação que trouxe ao sistema, resultando
no seu imenso sucesso, ou à facilidade de sua utilização, a verdade é que à partir daí
65
Neste contexto, a volatilidade implícita pode ser definida como a volatilidade que, aplicada ao Modelo
de Black & Scholes, resulta em um preço igual àquele negociado no mercado.
66
Apud Freitas (2002).
87
surgiram muitos estudos à respeito do assunto: uns procurando criar novos modelos
capazes de apreçar opções, outros analisando a precisão do Modelo Black & Scholes no
alcance dos objetivos por ele almejados.
O resultado encontrado pelos estudiosos foi de que algumas de suas premissas
não são confirmadas na prática, levando a diferenças significativas entre o valor da
opção, calculado pelo modelo, e o valor realmente verificado no mercado.
Dentre as premissas apontadas pelo modelo estão as que se referem ao
comportamento estocástico dos preços dos ativos-objeto e da taxa de juro. Black &
Scholes consideraram que as mudanças nos preços do ativo-objeto são constantes e que
a taxa de juro também é constante durante o tempo de vida da opção. Entretanto,
observando o mercado, é possível notar drásticas variações nos preços dos ativos com
freqüência e alterações na taxa de juro, principalmente no Brasil, onde a estabilidade da
taxa de juro é premissa mais fraca.
Costa (1998), ao criticar a premissa de juro constante apontada pelo Modelo
Black & Scholes, enfatiza
“Acontece que toda opção sobre S é, indiretamente,
uma opção sobre juros: se os juros caírem, o valor
futuro de S também cai, podendo até transformar um
call em out-of-the-money ou uma put em in-the-
money. Se os juros sobem, o valor futuro de S
também sobe, podendo transformar uma call em in-
the-money, ou uma put em out-of-the-money. Em
ambos os casos, o deslocamento das opções deveu-
se apenas à variação dos juros. Isso quer dizer que
uma opção pode entrar e sair do dinheiro movida a
juros.”
Outra premissa básica do Modelo de Black & Scholes é de que a volatilidade do
preço das ações é constante. Porém, na prática, essa assertiva não se confirma, afinal a
88
volatilidade futura do preço de uma ação é incerta, posto depender do preço de exercício
e da maturidade da opção em questão.
Sobre o assunto, Freitas (2002) completa ao dizer que “se o Modelo Black e
Scholes fosse um modelo perfeito, as opções sobre a mesma ação e de mesmo
vencimento deveriam estar relacionadas à mesma volatilidade implícita”.
67
Nesta mesma linha de raciocínio encontra-se Oliveira (2003) ao afirmar que
“empiricamente, observa-se que os preços estimados pelo BMS, usando-se previsores
estatísticos para
σ
, não se ajustam perfeitamente àqueles praticados pelo mercado”. De
acordo com o autor,
“mesmo em mercados com alta liquidez e com
significativa similaridade às hipóteses subjacentes
ao modelo de BMS, principalmente para opções
muito fora do dinheiro (OTM) ou muito dentro do
dinheiro (ITM), os preços de mercado apresentam
discrepância com relação ao que se esperaria caso o
BMS fosse o “verdadeiro” modelo de formação dos
preços”.
68
Como se isso não bastasse, o Modelo de Black & Scholes apresenta outras
limitações, quais sejam, não levar em consideração a possibilidade de exercício
antecipado nem o pagamento de dividendos. Conforme Damodaram (1997), ambos
impactam o valor de opções, e há ajustes que, embora não sejam perfeitos, oferecem
correções parciais de valor. Segundo Freitas (2002), na prática, nem sempre essa
premissa de não-pagamento de dividendos antes do vencimento da opção se confirma.
Por outro lado, Silva Neto (1996) faz críticas às premissas de ausência de custos
operacionais e igualdade das taxas de captação e aplicação. Segundo ele, há muitos
67
Daigler (1997) apud Freitas (2002).
68
As abreviações contidas no texto são utilizadas pelo próprio autor para definir Black-Merton-Scholes
(BMS), neste trabalho definido como Black & Scholes, out-of-the-money (OTM) e in-the-money (ITM).
89
custos operacionais envolvidos na negociação de opções, incluindo os impostos e as
taxas cobradas pelas Bolsas.
Pelo exposto, nota-se que as premissas nas quais o Modelo Black & Scholes se
baseia estão longe de refletir a realidade. No entanto, ainda é largamente utilizado no
mercado de ações em razão da sua popularidade e da maneira rápida, prática e barata de
calcular opções.
Tal situação demonstra a fragilidade do mercado e incerteza nos resultados,
afinal ao preferir aplicar um modelo que não proporciona confiança estar-se-ão
admitindo a ingerência do operador de mercado e o aumento do risco para o investidor.
É preciso muito mais que um simples cálculo matemático onde encaixa-se os
valores numa fórmula e obtêm-se um resultado. É preciso encontrar uma forma de
apreçar opções que consiga incorporar não só o comportamento estocástico da
volatilidade como evitar demais erros capazes de ocasionar grandes transtornos aos
investidores em razão do enorme risco por eles assumidos.
5.6. Redes Neurais Artificiais
Nos anos de 1980 e 1990, especialmente os últimos, houve mudança
extraordinária na ordem internacional econômica. A área financeira passou por uma
evolução tecnológica que resultou no relacionamento dos mercados globais e
intensificou a necessidade de uma perspectiva global de negociação. A tendência em
torno da globalização interconectando os mercados resultou da convergência de fatores
como o avanço das telecomunicações e das tecnologias computacionais.
90
Assim, no decorrer dos anos, houve um aumento considerável na utilização de
técnicas matemáticas, estatísticas e computacionais para a previsão de movimentos
futuros no mercado financeiro, dentre elas destacam-se as Redes Neurais Artificiais
69
,
uma das técnicas mais difundidas da Inteligência Artificial.
A Rede Neural Artificial é um sistema de processamento de informação que
possui certas características de performance em comum com as redes neurais biológicas,
tendo em vista que procura simular o funcionamento do cérebro humano, de forma a
adquirir conhecimento para a solução de um determinado problema através de um
processo de aprendizagem.
Em razão de sua habilidade em lidar com dados ruidosos, incompletos ou
imprecisos, e de prever sistemas não lineares, a aplicabilidade das redes neurais
artificiais no mercado financeiro torna-se bastante eficiente, pelo fato deste mercado ser
um sistema não-linear visto que sofre a influência de diversos fatores políticos,
econômicos, entre outros
70
.
Vale destacar, por oportuno, que o avanço da tecnologia computacional
possibilitou o desenvolvimento das Redes Neurais que conseguiram superar as
dificuldades encontradas por outros métodos já utilizados na tentativa de realizar
previsões no mercado financeiro.
69
Cumpre esclarecer que a técnica das Redes Neurais Artificiais também são utilizadas em outras áreas,
tais como recursos humanos, marketing, médica, engenharia, etc, não sendo apenas aplicável ao mercado
financeiro. No entanto, o presente estudo analisará a sua utilização neste último setor em razão do tema
abordado.
70
As Redes Neurais não estabelecem hipóteses ou suposições sobre a distribuição ou propriedades dos
dados, o que faz com que sejam mais úteis em situações práticas.
91
5.6.1. Introdução
A Rede Neural Artificial
71
é uma técnica de Inteligência Artificial que tenta
simular em máquinas (computadores) o funcionamento do cérebro humano, de uma
maneira simplificada, a fim de solucionar problemas. Pode ser implementada por meio
de componentes eletrônicos ou através de software.
Nas palavras de Freiman (2005), “as redes neurais artificiais são ferramentas de
Inteligência Artificial que possuem a capacidade de se adaptar e de aprender a realizar
uma certa tarefa, ou comportamento, a partir de um conjunto de exemplos dados”. Ou
seja, são técnicas computacionais que apresentam um modelo inspirado na estrutura
neural de organismos inteligentes e que adquirem conhecimento através da experiência.
Como o cérebro humano, as Redes Neurais são constituídas de um conjunto de
unidades de processamento conectadas entre si, chamadas de neurônios artificiais, ou
simplesmente, neurônios. Essas unidades geralmente são conectadas por canais de
comunicação que estão associados a um determinado peso, chamado de peso
sináptico
72
. As unidades fazem operações apenas sobre seus dados locais, que são
entradas recebidas pelas suas conexões. O comportamento inteligente de uma Rede
Neural Artificial provém das interações entre as unidades de processamento da rede.
Para Haykin (2001), uma Rede Neural assemelha-se ao cérebro humano em dois
aspectos:
“(1) o conhecimento é adquirido pela rede a partir de seu
ambiente através de um processo de aprendizagem; (2)
forças de conexão entre neurônios (os pesos sinápticos)
são utilizadas para armazenar o conhecimento adquirido”.
71
Conforme esclarece Smith & Gupta (2000), existem vários tipos de redes, cada uma com diferentes
objetivos, arquitetura e algoritmo de aprendizagem.
72
De acordo com Freitas (2002), “pode-se dizer que os pesos sinápticos constituem o meio utilizado por
uma rede neural para armazenar o conhecimento adquirido durante o processo de aprendizagem.”
92
Assim, as Redes Neurais Artificiais utilizam o processamento distribuído, onde
os neurônios comunicam-se através de arestas exibindo um peso sináptico associado a
cada uma destas. Cada neurônio possui uma função de ativação, permitindo que, a partir
de um valor recebido como entrada e do valor já armazenado internamente, seja gerado
um valor de saída, que será propagado ao neurônio seguinte. Ou seja, de forma
sintetizada, estas operações consistem na multiplicação do valor de cada entrada pelo
respectivo peso associado e na posterior soma para resultar em um valor.
5.6.2. Histórico
O primeiro modelo artificial de um neurônio biológico foi desenvolvido por
Warren McCulloch e Walter Pitts, em 1943. McCulloch e Pitts criaram uma máquina
inspirada e baseada no cérebro humano, denominada Psychon, a partir de um modelo
matemático do neurônio biológico. No entanto, os diversos tipos de Redes Neurais
Artificiais por eles criados, executavam tarefas lógicas elementares e reconheciam
padrões visuais e auditivos simples, não apresentando técnicas de aprendizado, em
razão de seus idealizadores se concentrarem mais em descrever um modelo artificial de
neurônio e apresentar suas capacidades computacionais.
A partir daí, surgiram muitos estudos sobre o assunto, fruto da rápida
disseminação do entendimento de possíveis modelos neurais.
Em 1949, Donald O. Hebb mostrou que a plasticidade da aprendizagem de redes
neurais é conseguida através da variação dos pesos de entrada dos nodos. Ele propôs
uma teoria, conhecida como Regra de Hebb, para explicar o aprendizado em nodos
biológicos baseada no reforço das ligações sinápticas entre os nodos excitados, sendo o
93
pioneiro a propor uma lei de aprendizagem específica para as sinapses dos neurônios.
Este primeiro passo inspirou muitos outros pesquisadores. Hoje, a Regra de Hebb é
utilizada em vários algoritmos de aprendizado.
Em 1958, Frank Rosenblatt cria os Perceptrons
73
, modelos de neurônios
baseados nos conceitos de McCulloch e Pitts
74
e o primeiro neurocomputador a obter
sucesso. Com este novo modelo, Rosenblatt demonstrou que se as Redes Neurais
Artificiais, com nodos desenvolvidos por McCulloch e Pitts, fossem acrescidas de
sinapses poderiam ser treinadas para classificar certos tipos de padrões.
Segundo Smith (1993), “Rosenblatt demonstrated that the perceptron can
generalize. That is, if a perceptron gives a certain response to an input, it gives the
same response when it receives a novel but similar input”.
Posteriormente, em 1962, Bernard Widrow, fundador da primeira companhia de
hardware de neurocomputadores e componentes, e Marcian Hoff desenvolveram um
modelo similar ao Perceptron chamado Adaline (Adaptive Linear Element), equipado
com uma poderosa lei de aprendizado, que ainda permanece em uso.
Esses modelos do tipo Perceptron, incluindo o Adaline, são baseados no
aprendizado supervisionado por correção de erros, uma classe muito importante de
Redes Neurais Artificiais que possui uma larga aplicação na atualidade.
75
Para Smith
(1993),”the Adaline’s method of learning illustrates two key concepts: supervised
learning and gradient descent”.
73
“For Rosenblatt, the fundamental question was how the brain, despite the imprecision oh its initial
wiring, comes to respond insimilar ways to similar stimuli. How do we group together experiences that
are similar, and how do we differentiate them from dissimilar experiences? Rosenblatt’s answer was a
theory of statistical separability: a mathematical analysis oh the behavior of a class of network models
called perceptrons.” (SMITH, 1993)
74
Sobre o assunto, ver Loesch & Sari (1996).
75
Sobre o assunto ver Freiman (2004).
94
Minsky e Papert fizeram um estudo cuidadoso desses algoritmos e, em 1969
criticaram severamente os modelos baseados no Perceptron, dizendo que estes eram
limitados a resolver problemas linearmente separáveis. Estes resultados e observações
formalmente apresentados foram devastadores, e a abordagem conexionista ficou
relegada a um plano secundário durante toda a década de 70 e início da década de 80.
Ultrapassado o impacto e após um período de pesquisas silenciosas, surgiram
novos modelos, que deram um novo impulso às Redes Neurais. Assim, em 1982, John
Hopfield, renomado físico de reputação mundial, criou um modelo baseado em um tipo
de rede diferente dos modelos que tinham como base o Perceptron. Conforme esclarece
Freiman (2004), tal modelo tratava-se de uma rede com conexões recorrentes e com um
comportamento baseado na competição entre os neurônios, em que o aprendizado era
não supervisionado.
Alguns anos mais tarde, com o desenvolvimento dos computadores e de
modelos matemáticos foi possível analisar o problema apontado por Minsky e Papert.
Em 1986, surge, então, o modelo que permitiu o ressurgimento das redes baseadas em
Perceptrons, o das redes multinível, que possuía como algoritmo de aprendizado o
Backpropagation ou Retropropagação, desenvolvido por Rumelhart, Hinton e Williams.
Este algoritmo permitia realizar o aprendizado por correção de erros em uma rede de
múltiplas camadas.
Conforme afirma Smith (1993):
“They called the method “backward propagation of
errors”. Backpropagation is based on a generalization of
the Adaline’s gradient descent learning method, and it
provides the solution to the problem that had stymied
Connectionism for two decades”.
95
Os problemas de aprendizado existentes até então, foram resolvidos em grande
parte. E com o desenvolvimento da informática, a partir dos anos 80, os estudos sobre
Redes Neurais sofreram grande revolução, tornando-se destaque, seja em razão das
promissoras características apresentadas pelos modelos propostos, seja pelas condições
tecnológicas atuais de implementação, que permitem desenvolver arrojadas arquiteturas
neurais paralelas em hardwares dedicados e obter ótimas performances destes sistemas.
Surgiram assim, diversos estudos aplicando as Redes Neurais no mercado de
opções. Freitas (2002) analisou esses trabalhos, que utilizaram os modelos de Redes
Neurais no apreçamento de opções e na previsão de volatilidade implícita, e verificou
que todos são convergentes ao concluírem que a técnica de Redes Neurais é uma
importante ferramenta para a análise e compreensão do mercado de opções.
Tecendo breve resumo dos trabalhos analisados por Freitas (2002) que aplicaram
Redes Neurais ao mercado de opções, tem-se que:
- Hutchinson et al. (1994) utilizaram Redes Neurais no apreçamento e hedge de
opções sobre fundos do índice S&P 500, entre 1987 e 1991 e verificaram que o
resultado obtido pela fórmula de Black & Scholes foi superado pelas Redes Neurais
quando se utilizou, como conjunto de treinamento, dados sobre os preços diários das
opções vistos durante dois anos.
- Lajbcygier et al. (1996) compararam o modelo de Hutchinson et al. (1994)
com um modelo de quatro parâmetros de entrada: e rTXS ,,/
σ
, onde T é o tempo até
o vencimento, r é a taxa de juro livre de risco e
σ
é a volatilidade histórica estimada a
partir de dados diários de um período de 60 dias, aplicado ao mercado australiano de
derivativos. Segundo Freitas (2002), estes pesquisadores verificaram que o modelo de
96
quatro entradas mostrou-se superior ao modelo de duas entradas de Hutchinson et al.
(1994) e ao Modelo de Black & Scholes.
- Garcia e Gençay (2000) propuseram variação do modelo de Hutchinson et al.
(1994), dividindo a função do apreçamento em duas partes: uma controlada pela razão
e outra, por uma função do tempo até o vencimento. De acordo com Freitas
(2002), os resultados indicaram que a utilização dessa técnica reduz o erro de predição,
embora não se tenha verificado diferença significativa para o hedge com opções.
XS /
- Malliaris e Salchenberger (1996) desenvolveram um modelo de Redes Neurais
backpropagation para estimar a volatilidade futura, aplicando-o ao mercado de opções
sobre o índice S&P 100 e utilizando opções que estavam mais no preço (at-the-money).
Os resultados obtidos demonstraram que, em comparação aos métodos tradicionais de
volatilidade histórica e volatilidade implícita, a volatilidade estimada por meio das
Redes Neurais descreve melhor o movimento da volatilidade implícita calculada pelo
Modelo de Black & Scholes, conforme comenta Freitas (2002).
- Yao et al. (2000) construíram modelos de Redes Neurais backpropagation para
apreçar opções sobre futuros do índice Nikkei 225, em negociação no Singapore
International Monetary Exchange (SIMEX). O estudo realizado mostrou, em
comparação com o Modelo Black & Scholes, a superioridade do modelo de Redes
Neurais no apreçamento de opções dentro do preço e fora do preço. No entanto, no
apreçamento de opções no preço, o Modelo de Black & Scholes obteve um desempenho
superior.
- QI et al. (1996), por meio de rede MLP, apreçaram opções de compra sobre o
índice S&P 500, negociadas entre dezembro de 1994 e janeiro de 1995, e concluíram
97
que as Redes Neurais podem ser uma boa alternativa quando os pressupostos básicos do
Modelo de Black & Scholes são desrespeitados.
- Ormoneit (1999) propôs um algoritmo de treinamento para situações em que as
relações não-lineares de interesse mudam gradualmente com o tempo. Ormoneit utilizou
modelo de Rede Neural MLP no apreçamento e hedge de opções de compra sobre o
DAX, índice alemão de ações. E, em comparação ao Modelo de Black & Scholes,
obteve resultados melhores em relação aos erros de apreçamento.
- Burgess e Refenes (1999) empregaram redes neurais para estimar a
volatilidade implícita de opções sobre o índice Ibex35, que contém as 35 ações mais
líquidas negociadas na bolsa de valores espanhola por meio do sistema CATS. Segundo
Freitas (2002), os resultados empíricos mostraram que, por meio das Redes Neurais,
pode-se obter boas estimativas da volatilidade implícita.
5.6.3. O Neurônio Artificial
Conforme comentado anteriormente, uma Rede Neural busca inspiração na
estrutura do cérebro humano, sendo formada por diversos neurônios organizados em
camadas. Estas, por sua vez, são classificadas em três grupos divididos em camadas de
entrada (na qual os padrões são apresentados à rede), camadas intermediárias ou ocultas
(nas quais é feita a maior parte do processamento, através de conexões ponderadas) e
camada de saída (na qual o resultado final é apresentado).
Cada neurônio de uma camada é conectado com todos os neurônios das camadas
anteriores e posteriores e a cada uma dessas ligações é arbitrado um peso sináptico
76
,
76
Os pesos sinápticos são responsáveis pelo armazenamento das informações e definem o efeito que a
saída de um neurônio exerce sobre a entrada do neurônio seguinte.
98
além de haver um valor pré-arbitrado para cada neurônio. O resultado do somatório dos
pesos multiplicados pelos valores de entrada e do valor pré-arbitrado é submetido a uma
função de ativação, que, por sua vez gera a saída.
Assim, como as Redes Neurais se baseiam no funcionamento do neurônio
biológico, possuem uma estrutura idêntica a este. McCullock e Pitts interpretaram o
funcionamento do neurônio biológico como sendo um circuito de entradas binárias onde
cada sinal positivo ou negativo que entra pelo sistema é multiplicado por um número,
ou peso, que indica a sua influência na saída. Caso a soma ponderada dos sinais exceda
certo limite, é gerada uma resposta de saída.
Figura 1 – Modelo de McCullock e Pitts (1943)
A partir deste modelo é possível identificar três elementos básicos para o projeto
de Redes Neurais: um conjunto de sinapses, cada uma caracterizada por um peso ou
força própria (representadas por W
1
, W
2
.... Wp); um somador para somar os sinais de
entrada, ponderado pelas respectivas sinapses do neurônio, constituindo um combinado
linear; e uma função de ativação para restringir o intervalo permissível de amplitude do
sinal de saída do neurônio a um valor finito.
99
Haykin (2001) apresentou o modelo de um neurônio artificial k (Figura 2), em
que após a multiplicação dos valores de entrada pelos respectivos pesos
,
os produtos obtidos são somados entre si e às bias (parâmetro que permite a calibragem
do sinal de saída
77
), resultando no potencial de ativação representado por .
Posteriormente, o valor de
é submetido a uma função de ativação
(
kmkk
www ...,
21
k
v
v
)
ϕ
, cujo resultado
é o valor de saída do neurônio.
k
y
Figura 2 – Modelo de um Neurônio Artificial
Fonte: Haykin (2001)
Sendo assim, o neurônio pode ser representado matematicamente pelas seguintes
expressões:
=
+
=
m
lj
bjkjk
k
xwv .
)(
kk
vy
ϕ
=
77
Nas palavras de Welstead (1994), bias (ou threshold) caracteriza um peso adotado que possui um valor
unitário, e é utilizado de forma a proporcionar que um neurônio artificial possa gerar um resultado
diferente de zero correspondente a um valor (sinal) líquido nulo gerado pela função soma.
100
5.6.4. Função de Ativação
A função de ativação, denotada por (.)
ϕ
, é uma função matemática que,
aplicada à combinação linear entre as variáveis de entrada e pesos que chegam a
determinado neurônio, define seu valor de saída. Em outras palavras, a função de
ativação é aplicada ao potencial de ativação
para a produção do valor de saída do
neurônio artificial.
78
k
v
k
y
Esta função limita a amplitude do intervalo do sinal de saída do neurônio para
algum valor finito, geralmente no intervalo normalizado [0,1] ou [-1,1].
Dentre as principais funções de ativação utilizadas, os tipos básicos são:
a)
Função Degrau ou Limiar – É o tipo mais simples de função de ativação,
onde tem-se que:
1 se
v 0
=
)(v
ϕ
0 se v < 0
Correspondentemente, a saída do neurônio
que utiliza a função limiar é
expressa como:
k
1 se 0
=
k
y
k
v
0 se
< 0
k
v
78
Ver Freitas (2002).
101
Nota-se, assim, que neste modelo a saída do neurônio recebe o valor de 1 se o
nível total de atividade interna desse neurônio é não negativo, e 0 se é o contrário.
Graficamente, é definido da seguinte forma:
Gráfico 2 – Função Degrau ou Limiar
v
b) Função Linear – Esta função, representada pelo gráfico 3 abaixo, utiliza um
valor unitário para apresentar o fator de graduação do sinal de saída em uma região de
comportamento linear. Excluindo esta região, a função assume características similares
a Função Degrau.
79
Pode ser descrita como:
1, se
v
2
1
=
)(v
ϕ
v, se
2
1
>
v >
2
1
0 se
v
2
1
onde
(
2
1
e
)
2
1
é o intervalo que define a saída linear e 0 e 1 são os limites mínimo
e máximo da função.
79
Ver Bocanegra (2002).
102
Gráfico 3 – Função Linear
v
c) Função Sigmóide – Segundo Haykin (1999)
80
é a função mais utilizada na
construção de Redes Neurais Artificiais. Esta função assume valores em um intervalo
contínuo entre 0 e 1. De acordo com Bocanegra (2002), “é definida como uma função
de caráter estritamente crescente, que mostra propriedades homogêneas e assintóticas”.
A função sigmoidal pode assumir as seguintes formas:
- função logística:
av
e
v
+
=
1
1
)(
ϕ
onde
a é o parâmetro de inclinação da função sigmóide. Variando o parâmetro a,
são obtidas funções sigmóides de diferentes inclinações.
- função tangente hiperbólica
81
:
=
)(v
ϕ
tanh
)(v
Representada pelo gráfico 4, a função sigmóide quando está no seu limite, se
aproxima tanto do infinito que se torna uma função limiar. Enquanto esta assume o
valor entre 0 e 1, uma função sigmóide assume valores em uma faixa contínua entre 0 e
1.
80
Apud Freitas (2002).
81
Bocanegra (2002) explica que a diferença entre esta função e a função logística está no fato de que a
função hiperbólica se trata de uma função logística modificada.
103
Gráfico 4 – Função Sigmoidal
v
5.6.5. Topologia das Redes Neurais Artificiais
A topologia nada mais é do que o modo de conexão entre os diferentes
neurônios que formam a Rede Neural Artificial. As várias topologias de Redes Neurais
podem ser agrupadas, basicamente, em duas classes:
- Não- Recorrentes (
feedforward ou acíclicas)
- Recorrentes (ou cíclicas).
As Redes Neurais Artificiais Não-Recorrentes são aquelas que não possuem
realimentação de suas saídas para suas entradas, razão pela qual são também ditas “sem
memória”. Freiman (2004) esclarece que sua estrutura é em camadas, podendo ser
formada por uma ou mais camadas. Redes multicamadas contêm um conjunto de
neurônio de entrada, uma camada de saída e uma ou mais camadas escondidas. A
entrada não é considerada uma camada de rede pelo fato de apenas distribuir os padrões.
A camada com os neurônios que fornecem a saída da rede é chamada de camada
de saída, onde o resultado final é concluído e apresentado. Já as camadas que não
possuem ligações diretas nem com a entrada, nem com a saída são chamadas de
104
camadas intermediárias ou escondidas, onde é feita a maior parte do processamento,
através de conexões ponderadas.
82
A figura 3 mostra um exemplo de uma Rede Neural Artificial Não-Recorrente.
Percebe-se que não existem conexões ligando um neurônio de uma camada a outro de
uma camada prévia, nem a um neurônio da mesma camada.
Figura 3 – Rede Neural Artificial Não-Recorrente
Uma Rede Neural deste tipo, depois de treinada, é capaz de associar uma série
de valores que são colocados em suas entradas a uma determinada saída. Não se trata,
porém, simplesmente de uma memória, pois tem a capacidade de generalização
83
; ela
82
Ver Freiman (2004).
83
Há três fatores capazes de avaliar o desempenho da Rede Neural Artificial: convergência, generalização
e escalabilidade. A primeira diz respeito à capacidade das redes em aprender um determinado conjunto de
dados definido no procedimento de treinamento, sendo muito importante para o bom desempenho das
Redes Neurais. Se não consegue aprender (não converge) dificilmente apresentará bons resultados. A
generalização diz respeito à habilidade das redes de reconhecer padrões fora do conjunto de treinamento e
é a principal propriedade que deve ser exigida de um sistema neural. Ela determina a quantidade de dados
necessários para treinar o sistema a fim de que este responda corretamente para padrões fora do conjunto
de treinamento. De uma forma geral, a diminuição do número de conexões da rede aumenta a
probabilidade de uma boa generalização. Contudo, isto deve ser feito sem reduzir demais o tamanho da
rede, já que esta redução pode implicar na incapacidade da rede em computar a função desejada. Já a
escalabilidade diz respeito a ambos e é relativa ao procedimento de ajustar parâmetros das Redes Neurais
para que elas consigam convergir e generalizar bem. Afinal, para que uma Rede Neural tenha um bom
desempenho, ela deve ser grande o suficiente para aprender o problema (convergir), e pequena o bastante
para generalizar bem.
105
pode encontrar respostas corretas mesmo quando os dados disponíveis para as entradas
estão incompletos ou danificados ou mesmo quando a relação entre entrada e saída não
é correta.
84
As Redes Neurais Recorrentes são redes mais gerais que contêm realimentação
das saídas para as entradas, sendo suas saídas determinadas pelas entradas atuais e pelas
saídas anteriores. As estruturas da classe de redes recorrentes não são obrigatoriamente
organizadas em camadas. No entanto, quando isso acontece, estas redes podem possuir
interligações entre neurônios da mesma camada e entre camadas não consecutivas,
gerando interconexões bem mais complexas que as Redes Neurais Artificiais Não-
Recorrentes, conforme demonstra a figura 4 abaixo.
Figura 4 – Rede Neural Artificial Recorrente
Fonte: Freiman (2004)
Essas Redes Neurais Artificiais, também chamadas de Redes Neurais Artificiais
com memória, por possuírem realimentação (
feedback), respondem a estímulos
84
Ver Haykin (2001).
106
dinamicamente, ou seja, após aplicar uma nova entrada, a saída é calculada e então
realimentada para modificar a entrada. Para as redes estáveis, este processo é repetido
várias vezes, produzindo pequenas mudanças nas saídas, até estas ficarem constantes.
Todavia, as Redes Neurais Artificiais Recorrentes nem sempre são estáveis, mesmo
com entradas constantes.
No início da década de 80, pesquisadores estavam preocupados com o fato de
não se conseguir prever quais redes seriam estáveis. Cohen e Grossberg, então,
provaram um teorema capaz de tal definição. Este teorema determina que para que as
Redes Neurais Artificiais Recorrentes alcancem um estado estável é necessário que
possuam conexões simétricas.
De acordo com Bocanegra (2002), contribuições importantes também foram
dadas por John Hopfield (1984), tanto para a teoria como para a prática, sendo algumas
configurações chamadas de redes de Hopfield em sua homenagem
85
. Segundo ele,
“Hinton e Sejnowski (1986) também tiveram seus
méritos neste campo, introduzindo regras gerais de
treinamento para redes, denominadas por eles de
máquina de Boltzmann, devido ao cálculo das saídas
dos neurônios artificiais ser efetuado através de
probabilidade segundo a distribuição de
Boltzmann”. (BOCANEGRA, 2002)
Atualmente a topologia mais utilizada em problemas práticos é a
feedforward,
que pode ser implementada em processadores comuns e não exige muita memória, se
comparada a outras topologias.
85
Freiman (2004) explica que “a rede neural de Hopfield apresenta comportamento dinâmico e fluxo de
dados multidirecional devido à integração total dos neurônios, desaparecendo a idéia de camadas bem
distintas. Com isso, seu funcionamento é mais complexo, havendo certas complicações, seja na fase de
aprendizado ou na fase de testes”. E finaliza dizendo que, “seu uso é direcionado a problemas de
minimização e otimização”.
107
5.6.6. Arquitetura
A arquitetura da Rede Neural é muito importante para suas capacidades de
convergência e generalização. Para definir a arquitetura de uma Rede Neural basta
determinar a estrutura sobre a qual os neurônios da rede estarão organizados. A escolha
de uma arquitetura adequada, nem tão grande, nem tão pequena, é a principal
responsável pelo sucesso de uma aplicação.
86
A arquitetura da Rede Neural é definida pelas características do número de
camadas da rede, do número de neurônios de cada camada, tipo de conexão entre os
neurônios e a topologia da rede.
87
Há redes de camada única e de múltiplas camadas
88
. Em redes de camada única
existe apenas um neurônio entre cada entrada e cada saída da rede (Figura 5). A
designação “camada única” se refere à camada de saída. A camada de nós de entrada
não é considerada por não realizar qualquer computação.
Figura 5 – Modelo de uma Rede Neural de camada única
x1
w1
w2
v )(v
ϕ
x2 Saída
y
w3
x3
Fonte: Haykin (2001)
86
Ver Freiman (2004).
87
Braga et al. (2000), apud Freitas (2002).
88
Neste estudo não serão abordadas as Redes Neurais Artificiais de uma camada, também chamadas de
Perceptrons, por possuírem um espectro de representações limitado. Em contrapartida, utilizar-se-á as
redes multicamadas, em razão de estas suprirem as deficiências das redes de uma única camada.
108
As redes de múltiplas camadas se distinguem da primeira classe pela presença de
uma ou mais camadas ocultas, ou seja, por conterem mais de um neurônio entre
qualquer entrada e qualquer saída da rede, conforme figura 6 abaixo.
Figura 6 – Modelo de uma Rede Neural de múltiplas camadas
Freiman (2004) explica que existem várias técnicas que tentam encontrar a
arquitetura ideal através da diminuição de neurônios redundantes e do
compartilhamento de pesos, porém nenhuma conseguiu resultados convincentes para
todas as aplicações. E conclui que, “a verdade é que a arquitetura ideal das RNA’s ainda
continua sendo determinada principalmente pela experimentação manual e pela
experiência e sensibilidade do projetista”.
Conclui-se assim, que o desenvolvimento de uma Rede Neural ainda é um
processo de tentativa e erro. A seleção da rede envolve a escolha da topologia da rede,
da função de transferência e do algoritmo de aprendizagem.
109
5.6.7. Processo de Aprendizagem
De todas as propriedades interessantes das Redes Neurais Artificiais, nenhuma
captura tão bem uma característica humana como a habilidade de aprender.
89
O
processo de aprendizagem, além de auxiliar na melhora de seu desempenho, faz com
que as Redes Neurais sejam capazes de fornecer soluções a determinado problema.
90
Conforme afirma Tafner (1995), a Rede Neural é capaz de modificar-se em função da
necessidade de aprender a informação que lhe foi apresentada.
O processo de aprendizagem nas Redes Neurais acontece internamente por meio
do ajuste dos pesos sinápticos das conexões durante a exposição dos exemplos, em
resposta à quantidade de erros gerados pela rede. Dessa forma, o principal parâmetro
utilizado para representar o conhecimento adquirido pelas Redes Neurais é o peso
associado a cada ligação entre dois neurônios.
Para a compreensão do processo de aprendizagem, dois conceitos são
importantes: o número de ciclos e taxa de aprendizagem. O número de ciclos refere-se
ao número de vezes que os padrões de treinamento serão apresentados às Redes
Neurais, a fim de que se faça a atualização dos pesos. A taxa de aprendizagem controla
a intensidade das alterações dos pesos. De acordo com Freitas (2002), uma alta taxa de
aprendizado acelera o processo de aprendizado, mas pode reduzir a capacidade de
generalização da Rede Neural.
Denomina-se algoritmo de aprendizado a um conjunto de regras bem definidas
para a solução de um problema de aprendizado. Existem muitos tipos de algoritmos de
89
Ver Bocanegra (2002).
90
O aprendizado ocorre quando a rede atinge uma solução generalizada para uma classe de problemas.
110
aprendizado específicos para determinados modelos de Redes Neurais, diferindo entre
si, principalmente pelo modo como os pesos são modificados.
Na definição de Freitas (2002), “é dado o nome de
algoritmo de treinamento, ou
algoritmo de aprendizado, ao conjunto de procedimentos utilizados para ajustar os
parâmetros das redes neurais de forma que ela possa realizar uma determinada função”.
As Redes Neurais são treinadas para aprender a partir dos dados de entrada.
Assim como o cérebro humano, elas aprendem a partir de experiências (dados
históricos) e não através de programação
91
.
Segundo Freiman (2004), ao invés de especificar todos os detalhes de uma
computação, tem-se a possibilidade de treinar uma rede para fazer esta computação.
Sendo assim, o objetivo do treinamento de uma Rede Neural Artificial é fazer
com que a aplicação de um conjunto de entradas produza um conjunto de saídas
desejado ou, no mínimo, um conjunto de saídas consistentes. Cada conjunto de entrada
ou saída é chamado de
vetor. O treinamento é realizado pela aplicação seqüencial dos
vetores de entrada (e em alguns casos também os de saída), enquanto os pesos da rede
são ajustados de acordo com um procedimento de treinamento pré-determinado.
Durante o treinamento, os pesos da rede gradualmente convergem para determinados
valores, tal que a aplicação dos vetores de entrada produza as saídas necessárias.
92
Os dois principais
93
paradigmas de aprendizado são:
aprendizado supervisionado;
aprendizado não-supervisionado.
91
Uma Rede Neural é capaz de generalização, não de deduções ou adivinhações.
92
Ver Freiman (2004).
93
Freitas (2002) acrescenta outro principal paradigma de aprendizado: o aprendizado por reforço, no qual,
ao contrário do que ocorre no aprendizado supervisionado, não são fornecidas à rede respostas corretas,
mas somente um sinal de reforço, informando se a resposta fornecida pela rede está certa ou errada.
111
O aprendizado supervisionado é aquele que utiliza um conjunto de pares
(entrada-saída), em que para cada padrão de entrada é especificado um padrão de saída
desejado. O aprendizado ocorre no momento em que, a partir dos cálculos efetuados
com o padrão de entrada e pesos correntes, a saída gerada pela rede for diferente da
saída desejada. O algoritmo de treinamento, segundo alguns critérios, ajusta os pesos da
rede de forma a reduzir o erro. Essa dinâmica é repetida inúmeras vezes para todo o
conjunto de dados de entradas e saídas, até que a taxa atinja uma faixa considerada
satisfatória. Nesse paradigma de aprendizado, o objetivo é realizar os ajustes dos
parâmetros de tal forma que a saída calculada pelas Redes Neurais seja igual à saída
desejada.
O aprendizado não-supervisionado, também conhecido como auto-
supervisionado, classifica os padrões similares sem utilizar os pares entrada e saída, isto
é, no treinamento da rede são usados apenas valores de entrada, não fazendo
comparações para determinar a resposta ideal. Nesse paradigma de aprendizado, os
ajustes dos parâmetros são feitos com base nas regularidades estatísticas dos dados de
entrada. Ao captar essas regularidades, as Redes Neurais são capazes de identificar
padrões e estabelecer novas classes de dados. Em outras palavras, a rede trabalha essas
entradas e se organiza de modo a classificá-las mediante algum critério de semelhança.
Esse tipo de rede utiliza os neurônios como classificadores, e os dados de entrada como
elementos de classificação.
112
5.6.8. Redes Multilayer Perceptron
As Redes
Multilayer Perceptron são redes acíclicas (feedforward) com uma ou
mais camadas intermediárias e constituem os modelos neurais artificiais mais utilizados
e conhecidos atualmente.
Tipicamente, a arquitetura do tipo
perceptron de múltiplas camadas consiste de
um conjunto de unidades sensoriais que formam uma camada de entrada, uma ou mais
camadas intermediárias ou escondidas de unidades computacionais e uma camada de
saída. Os sinais de entrada são propagados camada a camada pela rede em uma direção
positiva, ou seja, da entrada para a saída
94
.
A figura 7 abaixo ilustra um
perceptron de múltiplas camadas.
Figura 7 – Rede Neural Artificial
Multilayer Perceptron
94
O fluxo de sinais através da rede é feito positivamente, da esquerda para a direita, camada a camada.
113
Segundo Freitas (2002), devido a presença das camadas intermediárias, os
modelos de Redes
Multilayer Perceptron permitem a solução de problemas mais
complexos. Para Cybenko (1988)
95
, uma rede com uma camada intermediária pode
implementar qualquer função contínua, já a utilização de duas camadas intermediárias
permite a aproximação de qualquer função matemática.
Bocanegra (2002) afirma que as redes do tipo
Multilayer Perceptron têm sido
utilizadas com sucesso para a solução de vários problemas envolvendo altos graus de
não-linearidade.
O método de aprendizagem mais popular aplicado às Redes
Multilayer
Perceptron
é o algoritmo backpropagation. Este algoritmo é baseado numa regra de
aprendizagem, denominada Regra Delta Generalizada, que ajusta o erro durante o
treinamento, conforme será visto a seguir.
5.6.9. Algoritmo Backpropagation
Descoberto em meados da década de 70, o algoritmo de retropropagação
consiste, basicamente, em fornecer variações para alterar os pesos da Rede Neural
Artificial, com o objetivo de minimizar o erro obtido na saída através do aprendizado do
vetor de treinamento (entrada-saída). Em outras palavras, o erro gerado pelos neurônios
na camada de saída é distribuído para os demais neurônios da rede realizando o ajuste
de pesos.
Sua popularidade estende-se desde 1986, e hoje é um dos algoritmos mais
populares em razão de apresentar pouca dificuldade para o seu desenvolvimento, sendo
95
Apud Freitas (2002).
114
em parte responsável pelo ressurgimento do interesse na área de Redes Neurais
Artificiais.
Através deste algoritmo, o processo de aprendizagem é realizado em duas
etapas, onde cada etapa percorre a rede em um sentido. A primeira é a etapa
forward,
em que os valores de saída da rede são calculados a partir dos valores de entrada
fornecidos. Na segunda etapa, a
backward, os pesos associados a cada conexão são
atualizados conforme as diferenças entre os valores de saída obtidos e os valores
desejados, da última camada até a camada de entrada.
96
Os pesos conectados às
unidades de saída são então ajustados para reduzir este erro.
Para isso, este algoritmo utiliza o método do gradiente descendente
97
, no qual
dada uma medida de erro
, procura-se melhorar o conjunto de pesos ,
deslizando para baixo na superfície definida no espaço
W .
98
Dessa forma, tem-se que:
)(wE
ij
w
(
)
ijij
wEw
=
η
onde
η
é conhecido como a taxa de aprendizado, i refere-se ao neurônio i da camada
posterior e
j
da camada anterior.
Ressalta-se que mesmo conhecendo o erro global da rede, não é possível
determinar os pesos exatos para poder corrigi-lo. No entanto, com base nesta
informação, pode-se estabelecer a direção na qual os pesos devem ser ajustados para
96
Ver Freitas (2002).
97
Conforme esclarece Smith (1993), “The gradient descent method of changing these coefficients is
designed to produce the set of coefficients that minimizes the error of the model.”
98
Wasserman (1989) apud Freiman (2004).
115
minimizar o erro quadrado total da saída da rede. Conhecida esta direção, é possível
ajustar os pesos até que o menor erro global seja atingido
99
.
O ajuste de um peso
que define seu valor para a próxima iteração é definido
por:
ij
w
(
)
(
)
(
)
nwnwnw
ijijij
+
=
+
1
A variação
ij
w
que é aplicada ao peso deve ser proporcional ao sinal de
entrada
, definido pelos sinais de saída da camada anterior ponderados pelos pesos, e
ao erro gerado na saída, sendo representada na forma a seguir:
ij
w
j
x
(
)
(
)
(
)
nxnnw
jjij
ηδ
=
onde
j
δ
é o gradiente local do erro para o neurônio
j
.
O gradiente local do erro é determinado através do método gradiente
decrescente, responsável pela distribuição do erro da camada de saída para as camadas
anteriores. O ajuste dos pesos
deve ser realizado na direção contrária ao gradiente,
conforme gráfico 5 abaixo.
(
w
)
99
Nas palavras de Smith (1993), “Backpropagation provides a way of using examples of a target function
to find the coefficients that make a certain mapping function approximate the target function as closely as
possible.”
116
Gráfico 5 – Função erro para um único peso
Percebe-se, assim, que se o peso
(
)
nw (valor do peso na iteração n) está à
esquerda do erro mínimo, o ajuste
w
deve ser positivo para que (valor do
peso da próxima iteração) esteja mais próximo do valor de
que minimiza o erro. No
entanto, se o peso
(
1+nw
)
w
(
)
nw está à direita do erro mínimo, o ajuste w
deve ser negativo.
Como já citado, o objetivo do treinamento da rede é ajustar os pesos, de modo
que a aplicação de um conjunto de entradas produza um conjunto de saídas desejadas.
Assim, antes de se iniciar o processo de treinamento, todos os pesos devem ser
inicializados randomicamente com valores pequenos, garantindo dessa forma que a rede
não ficará saturada com grandes valores de pesos e prevenindo-se contra certas
patologias de treinamento, conforme afirma Freiman (2004).
117
Dessa forma, o algoritmo pode ser dividido nos seguintes passos:
1.
iniciar os pesos sinápticos com valores randômicos;
2.
aplicar padrão de entrada, com seu respectivo valor desejado de saída , e
verificar a saída da rede
;
)(xj
)(
sj
3.
calcular o erro na saída sj
x
jej
=
;
4.
se , ou seja, o valor esperado foi igual ao valor apresentado pela rede
como resposta, volta ao 2
o
passo; já se
0=ej
0
ej , ou seja, o valor esperado é
diferente do valor apresentado pela rede como resposta, deve-se ajustar os pesos
da rede de maneira a minimizar o erro;
5.
repetir do 2
o
passo em diante para cada vetor do conjunto de treinamento, até
o erro se tornar aceitavelmente baixo para o conjunto inteiro.
Freitas (2001) destaca que para a realização do processo de aprendizagem das
redes MLP, é necessário definir alguns parâmetros de treinamento do algoritmo
backpropagation relacionados ao momento de parar o treinamento e à freqüência de
ajuste dos pesos, quais sejam:
parar após ciclos; n
parar após o erro médio atingir um nível mínimo predeterminado;
parar após a taxa de acertos atingir um nível predeterminado;
uma combinação dos critérios acima.
Nas palavras de Freiman (2004), “o treinamento deve ser interrompido quando a
rede apresentar uma boa capacidade de generalização e quando a taxa de erro for
suficientemente pequena, ou seja, menor que um erro admissível”. E finaliza dizendo
118
que, “deve-se encontrar um ponto ótimo de parada com erro mínimo e capacidade de
generalização máxima”.
No entanto, apesar do grande sucesso das aplicações do algoritmo de
retropropagação e da sua enorme popularidade, alguns problemas ainda o acompanham,
como:
¾ longo período de treinamento, principalmente para problemas complexos, em
que não há garantias de que, depois deste tempo, o treinamento tenha sido feito
com sucesso;
¾ mínimos locais, já que a superfície do erro geralmente é cheia de vales e
desníveis e o algoritmo emprega um tipo de gradiente descendente, existindo
sempre a possibilidade de ficar preso em um mínimo local;
¾ a rede poder se especializar nos padrões de treinamento e perder sua
capacidade de generalização (
overfitting);
¾ paralisação da rede, pois durante o treinamento os pesos podem ser ajustados
para valores muito grandes, os quais vão levar a derivada da função de ativação
a zero, impedindo a rede de aprender o conjunto de treinamento.
Em comentários às deficiências apresentadas pelo algoritmo
backpropagation,
Freitas (2002) reconhece que este “pode ser extremamente lento na solução de
problemas mais complexos, embora seja capaz de solucioná-los”. Segundo o autor, para
contornar e evitar o
overfitting pode ser utilizada a técnica de early stopping que
consiste em treinar a Rede Neural com uma determinada amostra de dados (
grupo de
treinamento
) e validar o desempenho da rede, periodicamente, utilizando outra amostra
119
de dados (o grupo de validação). Quando os resultados obtidos com a validação
atingirem um nível satisfatório, o treinamento é interrompido.
Em virtude disso, algumas alterações têm sido propostas nos últimos anos no
intuito de melhorar seu desempenho, mas, de acordo com Freiman (2004), até agora
nenhuma solucionou de forma definitiva e confiável os problemas do
backpropagation.
5.6.10. Conclusão
Já foi dito que as Redes Neurais possuem certas características exclusivas de
sistemas biológicos, como a capacidade de aprendizado e generalização. Sobre o
assunto, Freiman (2004) comenta que apesar do modelo simples de neurônio artificial
ignorar diversas características do neurônio natural, como a não consideração dos
atrasos de tempo que afetam a dinâmica do sistema e a não inclusão dos efeitos de
sincronismo ou de modulação de freqüência, as Redes Neurais Artificiais possuem
atributos semelhantes aos do sistema biológico, podendo-se dizer que a essência do
funcionamento do neurônio natural foi absorvida.
No entanto, estas não são as únicas vantagens atribuídas as Redes Neurais
Artificiais. Há inúmeras outras que podem ser citadas, dentre as quais destacam-se: a
capacidade de encontrar soluções eficientes para problemas do mundo real; sua
habilidade em lidar com dados ruidosos, incompletos ou imprecisos; sua capacidade de
análise e reconhecimento de padrões; a capacidade de resolver problemas práticos sem a
necessidade da definição de regras ou de modelos precisos; e a capacidade de buscar a
solução através de um método próprio de treinamento e auto-aprendizado.
120
Tais atributos incentivam analistas e estudiosos na escolha da técnica das Redes
Neurais como a apropriada para a obtenção de resultados reais, apesar das deficiências
anteriormente apresentadas. Até porque, o fato de sua estrutura possuir como principal
força a habilidade de adaptação e aprendizagem, permite que as Redes Neurais possam
lidar com dados imprecisos e situações não totalmente definidas.
Uma rede treinada de maneira razoável tem a habilidade de generalizar quando é
apresentada a entradas que não estão presentes em dados já conhecidos por ela.
Como se sabe, as Redes Neurais podem ter várias entradas e várias saídas, sendo
facilmente aplicáveis à sistemas com muitas variáveis. As conexões entre os neurônios
formam uma rede de elementos de processamento, fazendo com que as informações
armazenadas por uma Rede Neural sejam compartilhadas por todas as suas unidades
permitindo, que mesmo que parte da rede seja destruída, a informação ali contida ainda
esteja presente, e possa ser recuperada. Essa redundância na representação de
informações transforma-se em outra vantagem das Redes Neurais, tendo em vista que
torna o sistema tolerante a falhas, diferentemente de outros modelos como o Black &
Scholes.
Mas o grande diferencial das Redes Neurais Artificiais, quando comparada a
outros métodos, é a sua capacidade de modelar e prever sistemas não-lineares,
principalmente quando aplicada no mercado financeiro.
Nota-se, assim, que mesmo com algumas restrições, as Redes Neurais têm
demonstrado sua potencialidade em diversas aplicações, superando expectativas e
gerando resultados até então não alcançados com qualquer outra técnica, seja
computacional ou convencional.
121
6. METODOLOGIA E ANÁLISE DOS RESULTADOS EMPÍRICOS
Cumpre agora aplicar todo o conhecimento obtido utilizando ambos os modelos
apresentados no apreçamento de opções pertencentes aos grupos de opções dentro do
preço (
in the money), no preço (at the money) e fora do preço (out the money) a fim de
descobrir, através do comportamento de cada modelo, qual aquele que apresenta
resultados condizentes com os realmente verificados no mercado e que estabeleça de
forma satisfatória as relações entre as diferentes variáveis envolvidas. Sendo assim,
neste capítulo será feita uma análise comparativa entre o Modelo de Black & Scholes e
as Redes Neurais, apresentando os cálculos realizados e verificando se, no período
estudado, a taxa de câmbio proporciona alguma influência no apreçamento de opções e
em que dimensões.
6.1. Introdução
No intuito de facilitar a compreensão e alcançar o objetivo final desta
dissertação, serão apresentados os dados a serem utilizados nesta pesquisa, a forma
utilizada no ajuste das variáveis de entrada, cada fase percorrida no desenvolvimento da
Rede Neural, definindo seu modelo e comparando-o ao Modelo de Black & Scholes. A
definição do modelo a ser utilizado visa fornecer uma ferramenta de auxílio ao
investidor, proporcionando-lhe maior segurança na tomada de decisão.
122
6.2. Dados
Para construir o modelo de apreçamento de opções baseado em Redes Neurais e
compará-lo ao Modelo de Black & Scholes, foram utilizados os dados referentes às
opções de compra sobre as ações da Telemar Participações PN, negociadas na Bolsa de
Valores de São Paulo (BOVESPA), que corresponde à Bolsa de maior movimentação
financeira do mercado de capitais do Brasil.
100
A escolha dessas opções se justifica pelo
fato da ação da Telemar Participações PN ser o título de maior liquidez no mercado
brasileiro e de maior negociação na BOVESPA, não apenas no período analisado
101
.
Os valores considerados correspondem ao período de 02
de janeiro de 2004 a 30
de maio de 2006, obtidos diretamente da BOVESPA, CETIP e BACEN. Posteriormente
foram organizados no Microsoft Excel, para o cálculo do Modelo Black & Scholes e
uso na Rede Neural através do programa
Neural Net Analizer. No entanto, para se aferir
o poder preditivo do Modelo de Black & Scholes sobre o prêmio justo de opções de
compra lançadas sobre a ação acima mencionada, considerou-se as opções com
vencimento no período compreendido entre janeiro/2006 a junho/2006.
Os dados organizados contêm as principais variáveis que influenciam o preço
das opções sobre ações: o preço corrente da ação, o preço de exercício da opção, o
tempo até o vencimento da opção, a volatilidade do preço da ação e a taxa de juro livre
de risco, sendo acrescentada, num segundo momento, a taxa de câmbio na Rede Neural,
exclusivamente. Dentre essas variáveis, somente a volatilidade precisou ser estimada.
100
Vale destacar que “atualmente, a BOVESPA é o maior centro de negociações com ações da América
Latina, destaque que culminou com um acordo histórico para a integração de todas as bolsas brasileiras
em torno de um único mercado de valores - o da BOVESPA”. (BOVESPA, 2006)
101
Cabe ressaltar que as séries de opções com liquidez no ambiente de negociação na Bolsa de Valores de
São Paulo são do tipo americanas, mas comportam-se como opções européias, ou seja, acabam sendo
exercidas apenas no seu vencimento, permitindo que sejam precificadas utilizando o Modelo de Black &
Scholes, conforme comentado no capítulo 5, item 5.2, do presente estudo.
123
Para tanto, adotou-se a volatilidade histórica e utilizou-se para o seu cálculo o estimador
não viesado de mínima variância uniforme.
Ressalta-se que antes de serem apresentados à Rede, os dados foram submetidos
a um pré-processamento a fim de normalizá-los em uma escala entre [0, 1], seguindo a
fórmula de Normalização Relativa (NR) apresentada abaixo:
(
)
()()
LIxMenorLSxMaior
LIxMenorx
NR
××
×
=
)()(
)(
onde, FI é o limite inferior e FS é o limite superior, com valores de 0,7 e 1,3,
respectivamente.
O objetivo da normalização é diminuir a influência causada por valores que se
destacam excessivamente em relação aos demais, ou seja, diminuir a distância entre os
valores de variáveis muito espaçadas.
6.2.1. Ajustes no preço de exercício
Como se sabe, uma das premissas básicas do Modelo Black & Scholes é de que
a ação não paga dividendos até o vencimento da opção.
102
Sendo assim, havendo
distribuição de proventos, os ajustes no preço de exercício tornam-se necessários para a
avaliação de opções.
103
Após tornar pública a distribuição de dividendo e/ou subscrição, o ativo-
subjacente da opção passa a ser negociado
ex direito e as séries são ajustadas. Já em
102
Sobre o assunto, ver capítulo 5, item 5.5 (Modelo Black & Scholes).
103
Ver capítulos 2 e 5, item 5.2 do presente estudo.
124
relação a eventos societários como bonificações e desdobramentos, o ajuste ocorre
somente no momento do exercício.
6.2.2. Tempo até o vencimento da opção
Na determinação do tempo até o vencimento da opção, considerou-se apenas os
dias úteis em que houve negociação na BOVESPA.
6.2.3. Volatilidade do preço da ação
No cálculo da volatilidade histórica, considerou-se inicialmente o retorno das
ações da Telemar Participações PN como o retorno continuamente composto, isto é, o
retorno logarítmico dos preços das ações:
)/ln(
1
=
iii
SSr
onde
é o preço da ação na data i.
i
S
Posteriormente, foi calculada a volatilidade histórica (
σ
), através do estimador
não viesado de mínima variância uniforme, como o desvio-padrão dos retornos diários
continuamente capitalizados das ações da referida empresa apurados durante os 20 dias
de negociação anteriores ao dia de cálculo da volatilidade histórica.
Assim, a volatilidade histórica foi estimada de acordo com a fórmula:
()
1
1
2
=
=
n
rr
n
i
i
σ
125
onde,
é o número de observações de retornos (neste caso, n 20
=
n ) e
r
é a média dos
valores de
, que corresponde ao retorno continuamente capitalizado.
i
r
6.2.4. Taxa de juro livre de risco
A taxa de juro livre de risco utilizada foi a taxa de depósito interfinanceiro (DI)
de 1 dia, apurada pela CETIP e divulgada na forma de taxa média diária ao ano de 252
dias úteis.
Para a sua utilização a taxa DI foi transformada para o regime de capitalização
contínua, da seguinte forma:
)1ln(
compostacontínua
rr
+
=
onde,
corresponde a taxa do DI em regime de capitalização contínua e
a taxa do DI em regime de capitalização composta.
contínua
r
composta
r
6.2.5. Taxa de câmbio
Na tentativa de verificar o impacto da taxa de câmbio no apreçamento de opções
através da técnica das Redes Neurais, utilizou-se as cotações de fechamento de venda
R$/US$ no período de 02 de janeiro de 2004 a 30 de maio de 2006, divulgadas e
disponibilizadas pelo BACEN.
126
A cotação de fechamento Ptax, acima mencionada, corresponde à taxa média
ponderada dos negócios realizados no mercado interbancário de câmbio com liquidação
em dois dias úteis, conforme Comunicado n
o
. 6.815/99 do BACEN.
6.3. Definição do modelo de Redes Neurais
A definição do modelo de Rede Neural requer análise, experiência e
conhecimento técnico do projetista, afinal inexiste procedimento sistemático e
determinado para a configuração e especificação dos parâmetros relacionados a uma
Rede Neural.
Neste trabalho foram analisados e testados diversos modelos de Redes Neurais,
optando-se por uma Rede Neural
feedfoward, com algoritmo de treinamento
backpropagation para realizar a previsão de preços das opções de ações da Telemar
Participações PN, com registro de negociação de seus valores mobiliários na Bolsa de
Valores de São Paulo (BOVESPA).
6.3.1. Fases para o desenvolvimento de uma Rede Neural Artificial
Em regra, as Redes Neurais são criadas e desenvolvidas através de um
software
exclusivamente voltado para esse fim. No entanto, há casos em que o próprio projetista
desenvolve um código para a solução de determinado problema.
O desenvolvimento de um modelo baseado em Redes Neurais compõe-se de
diversas fases, organizadas da seguinte forma, conforme figura 8: definição do
127
problema, coleta dos dados de treinamento e de previsão, pré e pós-processamento dos
dados, projeto da estrutura da rede, treinamento, previsão e validação.
Figura 8 – Fases do desenvolvimento de uma Rede Neural Artificial.
Fonte: Thomé (2003)
104
Inicialmente define-se o problema a ser solucionado, tecendo uma análise
cuidadosa a seu respeito, a fim de minimizar ambigüidades e erros. Posteriormente, faz-
se a coleta dos dados de entrada de forma que estes sejam capazes de caracterizar
exatamente o problema, tendo em vista que a sua capacidade de resolução, o
desempenho do treinamento e a confiabilidade nos resultados dependem da qualidade
da representação dos dados adotados.
Os valores coletados podem ser divididos em duas maneiras: (1) separando os
dados em dados de treinamento, utilizados para o treinamento da rede, e dados de
previsão, utilizados para verificar seu desempenho sob condições reais de utilização; (2)
criando uma subdivisão no conjunto de dados de treinamento, denominada de validação.
104
Apud Freiman (2004).
128
O conjunto de validação é utilizado para testar a eficncia da rede quanto à sua
capacidade de generalização durante o treinamento.
Como comentado anteriormente, uma das características das Redes Neurais é de
que ela é capaz de generalização e não de deduções ou adivinhações. Sendo assim, esses
conjuntos são dispostos aleatoriamente para evitar tendências relacionadas à ordem de
apresentação de dados.
Pode ser necessário, ainda ajustá-los a fim de torná-los mais apropriados à sua
utilização na rede. Referido ajuste é feito na fase de pré-processamento, que inclui o
tratamento dos dados incompletos, e através de normalizações, escalonamentos e
conversões.
6.3.2. Análise de modelos de Redes Neurais
Para a realização deste trabalho, foi escolhido o software Neural Net Analizer.
Utilizando as funções deste
software foram desenvolvidos e comparados diferentes
modelos de Redes
Multilayer Perceptron e algoritmo de treinamento backpropagation,
que se diferenciavam, pelo número de neurônios e camadas, algoritmos de treinamento,
funções de ativação e variáveis de entrada e saída.
Para a escolha da quantidade de variáveis de entrada e saída foi analisado o
comportamento da rede após a inclusão ou exclusão de uma ou mais variáveis. A
decisão do número de camadas de entrada e camadas intermediárias levou em
consideração o fato de que quanto maior número de camadas, maior a complexidade e o
tempo de processamento da rede.
129
Logo, para alcançar o objetivo desejado deve-se resolver o problema com a
menor topologia possível para que o desempenho da rede não seja comprometido pela
dimensionalidade, alcançando a generalização.
Partindo-se da premissa de que as Redes Neurais devem proporcionar resultados
satisfatórios e condizentes com a realidade, também foram feitas análises de correlação
entre as variáveis de entrada e as de saída da rede, no intuito de selecionar as relações
mais importantes para a compreensão do problema em estudo.
A função de ativação deve ser contínua, diferenciável e, de preferência, não
decrescente para que o algoritmo
backpropagation possa ser utilizado. Sendo assim, na
camada intermediária foi empregada a função sigmoidal logística.
Para a avaliação do desempenho da Rede Neural, utilizou-se o erro quadrático
médio (
MSE – mean squared error), que é a média do somatório dos quadrados dos
erros de cada caso, tanto do conjunto de treinamento, quanto do conjunto de previsão e
representado pela da seguinte forma:
2
1
2
=
=
N
li
i
ii
Cm
CtCm
N
i
MSE
onde
é o preço de fechamento observado, Ct é o preço teórico obtido pelo modelo
e
é o número total de observações.
Cm
N
É normal se adotar a raiz quadrada do erro quadrático médio (
RMSE) no cálculo
do erro da rede. O cálculo do
RMSE pode ser determinado pela seguinte expressão:
130
=
n
yy
RMSE
2
)
~
(
onde,
y representa as saídas reais normalizadas; y
~
, as saídas normalizadas previstas
pela rede; e
n, o número de casos.
Para alguns modelos de Redes Neurais foi utilizada a técnica de
early stopping,
conforme Anexos 1, 2 e 3. Sendo assim, cada amostra de dados foi dividida em três
grupos: um grupo de treinamento, ao qual destinou-se 60% dos dados; um grupo de
validação, com 25%; e um grupo de previsão, para o qual foram destinados 15% na sua
formação. Independentemente de o modelo utilizar ou não o grupo de validação, a
periodicidade dos dados de cada grupo foi a mesma para cada modelo.
A tabela abaixo (Tabela 4) apresenta os parâmetros de rede submetidos a
variações e os valores atribuídos aos mesmos, bem como a descrição dos algoritmos de
treinamento avaliados. Objetivando analisar o desempenho de cada modelo de Rede
Neural no apreçamento de opções fora do preço, no preço e dentro do preço
105
, utilizou-
se, nesta primeira etapa, o conjunto de dados correspondente ao período de 02/01/2004
a 30/05/2004, dividido em três amostras, quais sejam: opções fora do preço (
P
0,95 x
PE), no preço (0,95 x PE <
P
1,05 x PE) e dentro do preço (P > 1,05 x PE), sendo P
o preço do ativo-objeto e
PE preço de exercício.
105
Estes conceitos são também chamados pelo mercado financeiro como moneyness.
131
Tabela 4 – Parâmetros considerados no processo de construção e avaliação das Redes Neurais
Parâmetro Valores atribuídos
Número de Camadas
Intermediárias
1 a 5
Número de neurônios na camada
intermediária
3 a 5
Variáveis de entrada Preço de fechamento corrente da ação, preço
médio corrente da ação, preço de exercício da
opção, tempo até o vencimento da opção,
volatilidade do preço da ação, taxa de juro livre de
risco, taxa de câmbio
Variáveis de saída Premio da opção de compra
Funções de ativação na camada
intermediária
Sigmoidal logística, linear e tangente hiperbólica
Funções de ativação na camada de
saída
Sigmoidal logística, linear e tangente hiperbólica
Normalização dos dados Relativa no intervalo [0,1], com limite inferior 0,7
e limite superior 1,3.
Número de épocas 20.000 a 100.000
Taxa de aprendizado
Taxa de momento
Tolerância dos erros
0,0001 a 0,01
0,001 a 0,05
Erro total máximo por interação = 0,001
Erro total máximo, por exemplo (padrão) = 0,001
6.4. Arquitetura da Rede Neural
O modelo escolhido é um modelo de Rede Multilayer Perceptron, com uma
camada de entrada formada por cinco parâmetros, uma camada intermediária com três
neurônios e uma camada de saída com apenas um neurônio. Ao acrescentar mais um
132
parâmetro na camada de entrada, qual seja, o câmbio, a camada intermediária passou a
conter quatro neurônios.
Nos neurônios estão presentes pesos e
bias com valores gerados aleatoriamente
pelo
software, com parâmetros de valor central 0 (zero) e intervalo 0,25. As conexões
entre os neurônios são do tipo
feedforward ou acíclica e a rede é completamente
conectada. (Anexos 3 e 4)
6.5. Comparação entre os modelos
Para comparar o desempenho do modelo baseado em Redes Neurais com o
Modelo de Black & Scholes foram utilizados os dados pertencentes ao período de 02
de
janeiro de 2004 a 30 de maio de 2006, ordenados seqüencialmente pelo tempo. Dessa
amostra, foram extraídos os dados do grupo de treinamento da Rede Neural e os dados
correspondentes ao grupo de previsão, aplicado aos modelos para a realização do estudo
comparativo.
6.5.1. Grupo de previsão
Para compor o grupo de previsão, foram escolhidas séries de opções com
vencimento no primeiro semestre de 2006, e cada vencimento foi dividido em três
grupos distintos:
-
Grupo A - opções fora do preço (
P
0,95 x PE);
-
Grupo B – opções no preço (0,95 x PE <
P
1,05 x PE); e
-
Grupo C – opções dentro do preço (P > 1,05 x PE).
133
Para tanto, analisou-se cada série de opções e calculou-se o grau de moneyness
de cada uma de suas cotações no período.
106
Dessa forma, para cada vencimento
escolheu-se a série que possuísse mais do que 20 cotações e que mais tempo houvesse
permanecido em um dos grupos acima, desconsiderando os últimos 13 dias de
negociação anteriores ao preço de exercício, em função da alta volatilidade dos preços.
A Tabela 5 relaciona as séries escolhidas, informando o vencimento, o preço de
exercício, série e o seu grau de representatividade para o grupo de
moneyness às quais
foram relacionadas. As séries das opções apresentadas abaixo foram apreçadas pelo
Modelo de Black & Scholes e pela Rede Neural desenvolvida, sendo posteriormente
acrescida, nesta última, a taxa de câmbio. A partir dos resultados obtidos, realizaram-se
comparações entre os referidos modelos, analisando o impacto da volatilidade do Dólar
no apreçamento de opções através de indicadores estatísticos.
Tabela 5 – Séries de opções escolhidas para apreçamento pelas RNA’s e Black & Scholes
106
O grau de moneyness refere-se à relação entre o preço de exercício da opção e o preço à vista da ação,
ou seja:
, onde S é o preço da ação, X é o preço de exercício, r é a taxa de juro livre
de risco e T é o tempo até o vencimento da opção em anos.
)(
./
Tr
eXSMoneyness
=
134
6.5.2. Grupo de treinamento
As amostras de dados para treinamento da Rede Neural consistiram de valores
dos doze meses anteriores ao mês da primeira cotação presente no grupo de dados da
série a ser analisada.
Procurando aprimorar o processo de aprendizagem, bem como o de previsão,
cada grupo de dados para treinamento foi subdividido em subgrupos, de acordo com o
grau de
moneyness, adotando o mesmo critério da previsão. Assim, para o
desenvolvimento do estudo foram construídos trinta e duas redes de treinamento, das
quais dezoito referem-se à Rede Neural Artificial com os cinco parâmetros contidos no
Modelo Black & Scholes e as demais, à Rede Neural Artificial adicionada o parâmetro
taxa de câmbio, aqui diferenciada pela sigla RNA_US$.
Por exemplo, para apreçar a série de opções com vencimento em 19 de junho de
2006 e preço de exercício de R$ 36,49, correspondente ao Grupo B (opções no preço), a
Rede Neural foi treinada com dados das cotações diárias das opções e ações da Telemar
Participações PN do período de abril de 2005 a março de 2006 também do Grupo B,
pois essa série foi avaliada a parir de 03 de abril de 2006. Para série de opções com
vencimento em 15 de maio de 2006 e preço de exercício de R$ 34,00, contidos no
Grupo A (opções fora do preço), os dados para treinamento da rede pertenciam ao
período de março de 2005 a fevereiro de 2006 do Grupo A, já que a cotação mais
antiga, pertencente ao grupo de dados dessa série, é de 14 de março de 2006. Para as
demais séries, segue-se o mesmo procedimento.
135
Portanto, pode-se dizer que para cada série de opções, foram construídas três
Redes Neurais com a mesma arquitetura (número de camadas, neurônios etc.) para
ambos os grupos RNA e RNA_US$.
6.6. Análise dos Resultados Empíricos
Em razão da quantidade dos dados a serem apresentados e com o intuito de
facilitar a compreensão dos resultados obtidos, optou-se por separar a presente análise
em duas etapas: Black & Scholes
versus Redes Neurais Artificiais e Redes Neurais
Artificiais
versus Redes Neurais Artificiais com variável Dólar.
Para cada série de opções agrupadas, são comparados os resultados de
desempenho estatístico do erro de generalização relativos aos preços teóricos gerados
pelos modelos acima e os preços reais observados no mercado. Para mensurar as
diferenças entre os valores dos preços utilizou-se o erro absoluto médio (EAM), o erro
quadrático médio (EQM) e a raiz quadrada do erro quadrático médio (REQM).
As tabelas apresentadas nos itens seguintes comparam os EAM, EQM e REQM
resultantes do apreçamento de séries pertencentes, respectivamente, aos grupos de
opções fora do preço, no preço e dentro do preço. Com base nesses valores é possível
analisar o comportamento de cada modelo durante a vida da opção, proporcionando ao
investidor maior confiabilidade na tomada de decisões financeiras na medida em que os
resultados obtidos pelo modelo capturam a variabilidade do preço da ação no decorrer
de sua vida.
136
6.6.1. Modelo Black & Scholes versus Redes Neurais Artificiais
a) Grupo A – Fora do preço
Na Tabela 6 abaixo, são apresentados os valores referentes aos EAM, EQM e
REQM estimados para série de opções com maior liquidez e tempo fora do preço. Para
esse grupo obteve-se um resultado satisfatório em relação a assertiva comentada
anteriormente de que a técnica de Rede Neural superaria o Modelo de Black & Scholes
no apreçamento de opções. Em quatro das seis séries analisadas, todos os tipos de
indicadores de erros analisados apresentaram valores inferiores se comparados ao
Modelo
benchmark Black & Scholes. Estatisticamente, as Redes Neurais foram 67%
melhores que o modelo criado em 1973.
Tabela 6 – Resultados dos EAM, EQM, REQM nos apreçamentos das séries de opções
fora do preço calculadas pelos modelos de Black & Scholes e Redes Neurais Artificiais
Pode-se observar que o menor EQM obtido foi de 0,0941 na série de opção de
janeiro com preço de exercício de R$38,00, resultante da aplicação das Redes Neurais.
No gráfico abaixo (Gráfico 6) mostra o comportamento dos preços na série de
opções fora do preço com vencimento em fevereiro de 2006 para ambos os modelos.
Entre o 1
o
e 14
o
dia a Rede Neural obteve melhor resultado que o apresentado pelo
137
modelo de Black & Scholes, no entanto na janela entre o 15
o
ao 22
o
dia ambos os
modelos apreçam opções com valores próximos ao preço de mercado. Após esta data o
Modelo Black & Scholes mostrou um alisamento satisfatório em relação aos preços de
mercado, ainda que na média as Redes Neurais tenham demonstrado melhores
resultados.
Gráfico 6 – Preços reais e teóricos de uma série de opções fora do preço
com vencimento em fevereiro de 2006
-
0,50
1,00
1,50
2,00
2,50
3,00
3,50
4,00
4,50
5,00
5,50
6,00
6,50
7,00
7,50
12345678910111213141516171819202122232425262728
Tempo em dias
Preço da Opção em reais
REAL B&S RNA
b) Grupo B – No preço
Neste grupo de séries, nota-se um resultado ainda superior ao Grupo A, pois
demonstra que em 83% os erros apresentados pelas Redes Neurais foram menores que
os referentes ao Modelo de Black & Scholes. Ou seja, cinco das seis séries analisadas,
as Redes Neurais obtiveram melhores respostas, conforme Tabela 7 a seguir.
138
Tabela 7 – Resultados dos EAM, EQM, REQM nos apreçamentos das séries de opções
no preço calculadas pelos modelos de Black & Scholes e Redes Neurais Artificiais
A superioridade no apreçamento de opções neste grupo utilizando a técnica das
Redes Neurais pode ser facilmente observada no gráfico abaixo (Gráfico 7), no qual são
comparados os preços reais de mercado com os preços projetados pelos modelos
analisados de uma série de opção com vencimento em abril e preço de exercício de
R$38,00. Observa-se que na janela intermediaria, ou seja, entre os dias 12 e 26, a
diferença dos valores obtidos pelos modelos são maiores que R$0,80.
Gráfico 7 – Preços reais e teóricos de uma série de opções no preço
com vencimento em abril de 2006
-
0,25
0,50
0,75
1,00
1,25
1,50
1,75
2,00
2,25
2,50
2,75
3,00
3,25
3,50
3,75
4,00
4,25
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32
Tempo em dias
Preço da Opção em reais
REAL B&S RNA
139
c) Grupo C – Dentro do preço
O grupo de opções dentro do preço alcançou resultado semelhante ao grupo
anterior em relação ao percentual de superioridade da Rede Neural, diferenciando-se
apenas nos meses de vencimento, conforme mostra a Tabela 8 seguinte.
Tabela 8 – Resultados dos EAM, EQM, REQM nos apreçamentos das séries de opções dentro
do preço calculadas pelos modelos de Black & Scholes e Redes Neurais Artificiais
Tecendo breve comentário comparativo entre ambos os modelos, percebe-se que
EAM apresentado nas séries de opções com vencimento em abril e junho e preço de
exercício de R$44,00 e R$42,49, respectivamente, distanciam-se demasiadamente entre
si, de tal forma que nos permite afirmar novamente a superioridade do modelo de Redes
Neurais, também explicitada nos grupos anteriores.
6.6.2. Redes Neurais Artificiais versus Redes Neurais Artificiais com Dólar
a) Grupo A – Fora do preço
Analisando a influência da taxa de câmbio no apreçamento de opções fora do
preço, percebe-se expressiva melhora quando acrescentada esta variável no modelo
desenvolvido para as Redes Neurais, principalmente no resultado obtido através da
verificação do resultado do EQM. Tal fato corrobora com as afirmativas feitas
anteriormente, pelo menos em um ponto de vista, o das opções fora do preço. Logo,
140
deve-se levar em consideração a volatilidade da taxa de câmbio no cálculo do
apreçamento dessas opções.
Como exemplo, extrai-se a opção com vencimento em abril e preço de exercício
R$ 34,00, onde o índice de EQM no apreçamento de opções acrescida da variável Dólar
é menor que o obtido na Rede Neural calculada com os mesmos parâmetros do Modelo
Black & Scholes, como mostra a Tabela 9.
Tabela 9 – Resultados dos EAM, EQM, REQM nos apreçamentos das séries de opções
fora do preço calculadas pelas RNA’s e RNA’s_US$
Nota-se assim que, estatisticamente, o resultado foi 83% positivo em relação aos
EQM calculados.
b) Grupo B – No preço
Observando a tabela abaixo (Tabela 10), percebe-se considerável melhora nos
resultados obtidos nesta série de opções quando acrescentada a variável câmbio no
apreçamento destes derivativos. Na estimativa dos erros expostos encontrou-se um
resultado favorável à técnica das RNA_US$ de 83% para o EMA e de 67% para os
EQM e REQM testados. No entanto, nos meses de maio e junho, responsáveis pela
perda de eficiência do modelo RNA_US$, as diferenças entre os erros resultantes foram
pequenos, quase insignificativos, o que nos permite afirmar que na série das opções no
preço a taxa de câmbio deve ser considerada, assim como nas opções fora do preço.
141
Tabela 10 – Resultados dos EAM, EQM, REQM nos apreçamentos das séries de opções
no preço calculadas pelas RNA’s e RNA’s_US$
O Gráfico 8 abaixo apresenta os preços reais do mercado comparando-os com os
preços projetados pelos três modelos estudados. Analisando a janela de 3 a 11 dias,
verifica
com vencimento em março de 2006
-se que a técnica da RNA_US$ demonstra melhor aderência aos preços de
mercado.
Gráfico 8 – Preços reais e teóricos de uma série de opções no preço
-
0,25
0,50
0,75
1,00
1,25
1,50
1,75
2,00
2,25
2,50
2,75
3,00
3,25
3,50
3,75
4,00
4,25
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36
Tempo em dias
Preço da Opção em reais
REAL B&S RNA RNA_US$
c) Grupo C – Dentro do preço
142
Neste grupo de opções, os erros calculados também comprovaram a assertiva de
que a
preço de opções em uma série com vencimento no mês de
março,
Tabela 11 – Resultados dos EAM, EQM, REQM nos apreçamentos das séries de opções
taxa de câmbio influencia no apreçamento de opções, ao demonstrar valores
inferiores aos obtidos pelas RNA’s e de forma semelhante em todos estes indicadores,
ou seja, o percentual dos erros entre os EMA, EQM, REQM foram os mesmos (67%)
nas opções dentro do preço.
Simulando valores de
verifica-se através do EAM que considerando-se R$ 1,00 como preço de
mercado, o modelo RNA apreça na média a R$ 1,17 enquanto o modelo RNA_US$ a
R$ 1,11. Apesar de pequena a diferença entre ambos (R$ 0,06), em termos percentuais
representa 5,41%. Este percentual pode resultar em um prejuízo maior que 50 mil reais
numa operação que envolva a negociação de um lote de um milhão de opções,
desconsiderando os custos de corretagem, emolumentos entre outros.
dentro do preço calculadas pelas RNA’s e RNA’s_US$
Pelo gráfico abaixo, é possível verificar a superioridade no apreçamento
realizad
da RNA_US$.
o pelos modelos de Redes Neurais Artificiais no período do 10
o
ao 24
o
dia,
principalmente naquelas que utilizaram a variável câmbio. Como exemplo, destaca-se
no 17
o
dia a diferença de R$0,65 entre os EAM dos modelos de apreçamento do B&S e
143
Gráfico 9 - Preços reais e teóricos de uma série de opções dentro do preço
com vencimento em abril de 2006
-
0,25
0,50
0,75
1,00
1,25
1,50
1,75
2,00
2,25
1 3 5 7 9 11131517192123252729313335373941
Tempo em dias
Preço da Opção em reais
REAL B&S RNA RNA_US$
Pode-se afirmar, assim, a relevância da taxa de câmbio no apreçamento de
opções fora do preço, no preço e dentro do preço, tendo em vista que apresentou 72% de
EAM, E
acertos entre B&S/RNA e RNA/RNA_US$
nas séries de opções fora do preço, no preço e dentro do preço
QM e REQM menores do que os calculados pela RNA. Destaca-se ainda, que o
grupo fora do preço foi o que melhor se adequou a esta variável.
Por fim, os comentários realizados acima e percentuais destacados podem ser
observados pela tabela abaixo
107
.
Tabela 12 – Número de
107
Na Tabela 12, RNA/B&S representa o percentual de acertos em que a RNA superou o Modelo Black
& Scholes; e RNA_US$/RNA representa o percentual de acertos em que a RNA_US$ superou a RNA.
144
145
7. CONCLUSÕES E RECOMENDAÇÕES
Entendida como a dispersão de dados em torno de seu valor esperado, a
volatilidade representa um medida de risco para o investidor. Analisar as oscilações do
mercado frente aos acontecimentos atuais é extremamente importante na alocação de
recursos.
A volatilidade é uma variável presente em diversos ativos financeiros e
resultante do comportamento político, econômico e social do país. Em razão da sua
importância no cenário mundial, surgiu o interesse de seu estudo, não apenas a fim de
estimá-la, mas também na determinação de preços de derivativos, principalmente de
opções.
O Modelo de Black & Scholes foi o precursor no cálculo do apreçamento de
opções e considerado de maior sucesso em finanças. No entanto, constataram-se
diferenças significativas nos resultados obtidos entre o valor da opção calculado pelo
modelo e o realmente verificado no mercado. Dessa forma surgiram diversas técnicas na
tentativa de obter uma resposta satisfatória e encontrar um modelo capaz de substituir o
Black & Scholes em sua finalidade, dentre elas destacam-se as Redes Neurais
Artificiais.
A premissa deste trabalho foi verificar se a técnica de Redes Neurais supera o
Modelo criado em 1973 na determinação de preço de opções, alcançando preços mais
condizentes com a realidade.
Para tanto, foi desenvolvida uma análise comparativa entre os resultados
apresentados por ambos os modelos utilizando-se séries de opções fora do preço, no
preço e dentro do preço.
146
Posteriormente, decidiu-se verificar o impacto da volatilidade da taxa de câmbio
no apreçamento de opções devido a sua influência na economia brasileira, adotando-se
para isso o mesmo critério de avaliação entre os modelos. Referida análise somente foi
possível através da técnica das Redes Neurais, em decorrência das limitações
apresentadas pelo Modelo de Black & Scholes.
A determinação em alocar os dados em três diferentes tipos de séries, conforme
o grau de
moneyness, realizando o treinamento da rede de forma separada por grupo,
melhorou substancialmente o desempenho da Rede Neural Artificial. Notou-se assim,
que o comportamento dos preços das opções se distinguem de acordo com o grupo a
que pertencem.
A partir dos resultados encontrados, foi constatado que o modelo baseado em
Redes Neurais sobrepuja o Modelo Black & Scholes no apreçamento de opções fora do
preço, no preço e dentro do preço. Dentre esses grupos, o modelo desenvolvido obteve
melhor desempenho quando aplicado à séries de opções no preço e dentro do preço, se
comparado ao Modelo precursor. No entanto, os valores que mais se aproximaram da
realidade, alcançando o menor erro médio, foram das opções dentro do preço, pelo
cálculo do EQM, para ambos os modelos estudados.
Esse equilíbrio entre as séries de opções no preço e dentro do preço pode
também ser observado nos resultados obtidos no cálculo dos respectivos Erros
Absolutos Médios, Erros Quadráticos Médios e das Raízes Quadradas dos Erros
Quadráticos Médios.
Da análise comparativa entre os valores encontrados pela RNA e pela
RNA_U$$ extrai-se que a taxa de câmbio, quando inserida na técnica de Redes Neurais,
influencia positivamente no apreçamento de opções fora do preço, no preço e dentro do
147
preço, sendo de forma mais expressiva no primeiro grupo, em que mais vezes alcançou
o mínimo nos erros verificados e mais se aproximou da realidade. No entanto, nos
meses em que a taxa de câmbio não demonstrou melhora quando comparada à RNA
percebe-se uma diferença ínfima entre os resultados obtidos pelos diversos indicadores
de erro analisados, o que permite afirmar que a taxa de cambio é uma variável
dependente do cálculo do apreçamento de opções que mais se ajusta aos preços reais
ocorridos no mercado.
Conclui-se assim que a técnica da Rede Neural supera o Modelo de Black &
Scholes no apreçamento de todos os grupos de opções estudados, posto apresentar
resultados mais condizentes com a realidade, transmitindo assim maior segurança ao
investidor na tomada de decisão. E mais, ao adicionar a variável câmbio no modelo de
Rede Neural desenvolvido obtem-se resposta ainda mais favorável nos preços teóricos
das séries de opções fora do preço, no preço e dentro do preço.
Contudo, o presente estudo não teve a pretensão de esgotar o tema e abordar
todos os seus conceitos e aplicabilidade. Até porque, trata-se de um assunto complexo e
extenso de uma forma geral, posto lidar com técnicas que imitam artificialmente o
cérebro humano, inexistindo, portanto, limites a serem alcançados. A cada momento
surgem novas técnicas para o apreçamento de opções com o intuito de encontrar aquela
que realize a melhor previsão de preços possíveis.
Neste trabalho foi desenvolvida uma Rede Neural
feedfoward, com algoritmo de
treinamento
backpropagation. Para trabalhos futuros, sugere-se o estudo de uma Rede
Neural utilizando o algoritmo de aprendizagem
weight elimination. Este algoritmo
consiste em eliminar os pesos sinápticos entre os neurônios. Pode-se ainda, elaborar
uma Rede Neural Artificial utilizando outras variáveis de entrada, com diferentes
148
topologias e variando a periodicidade dos dados de treinamento para verificar a
estabilidade do mercado de capitais brasileiro em séries de treinamentos, como por
exemplo, de três meses.
149
8. REFERÊNCIAS BIBLIOGRÁFICAS
ADLER, A. S. et al. Árvores Binomiais Implícitas: Aplicação para as Opções de
Telebrás no Exercício de Abril de 1999. XXIII ENANPAD,
Anais. Foz do Iguaçu,
1999.
APÓS G7, Japão mantém política de intervenção cambial.
UOL Economia: Universo
On Line
, 09 fev. 2004. Disponível em: <http://www1.uol.com.br/economia/reuters/
ult29u32809.shl
>. Acesso em: 13 mar. 2006.
ATUALMENTE: BOVESPA é o maior centro da América Latina.
BOVESPA. Quem
somos – Histórico. Disponível em: < http://www.bovespa.com.br/Principal.asp>.
Acesso em: 04 mai 2006.
BACHA, Edmar Lisboa e outro.
Mercado de Capitais e crescimento econômico:
lições internacionais e desafios brasileiros.
Rio de Janeiro: Contra Capa Livraria,
2005.
BANCO CENTRAL DO BRASIL.
Economia e Finanças. Disponível em:
<http://www.bcb.gov.br/?ECONOMIA>. Acesso em: 12 mar. 2006.
BANCO CENTRAL DO BRASIL.
Taxas de Câmbio. Disponível em:
<http://www5.bcb.gov.br/pec/taxas/port/ptaxnpesq.asp?id=txcotacao>. Acesso em: 01
jun. 2006.
BISHOP, Christopher.
Neural Networks for Pattern Recognition. Oxford University
Press, 2000.
BOCANEGRA, C. W. R.
Procedimentos para tornar mais efetivo o uso das redes
neurais artificiais em planejamento de transportes.
2002. 108p. Dissertação
(Mestrado) – Faculdade de Engenharia Civil, Universidade de São Paulo, São Carlos.
150
BRONSTEIN, G. et al. Modelo de Avaliação de Opções para Processos de Difusão e
Salto. XXIII ENANPAD,
Anais. Foz do Iguaçu, 1999.
CAVALCANTE, F.; RUDGE, L. F.; MISUMI, J. Y.
Mercado de capitais; o que é,
como funciona.
Campus, 2005.
COSTA, César Lauro da.
Opções: operando a volatilidade. São Paulo: Bolsa de
Mercadorias & Futuros, 1998.
CRUSIUS, Yeda. Flutuação da taxa de câmbio, intervenções do Banco Central e
influência nas exportações.
Revista de Conjuntura, abr./jun. 2003. Disponível em:
<http:// www.yedacrusius.com.br/artigos/imagens/YedaCrusius.pdf >. Acesso em: 13
mar. 2006.
DAMODARAN, Aswath.
Avaliação de investimentos: ferramentas e técnicas para a
determinação do valor de qualquer ativo.
Rio de Janeiro: Qualitymark Ed., 1997.
FERREIRA, Léo da Rocha.
Taxa de câmbio social no Brasil: Mercosul e a abertura
comercial.
Rio de Janeiro: Letra Capital, 2004.
FLUXO cambial é o maior desde 98, e dólar atinge novo mínimo em 5 anos.
Folha de
São Paulo
, São Paulo, Folha Dinheiro, p. B1, 03 mar. 2006.
FONSECA, Roberto Gianetti. O cambio em debate.
Jornal Folha de São Paulo, São
Paulo, 20 fev. 2006. Disponível em: <http://www1.folha.uol.com.br/fsp/opiniao/fz2002
200609.htm>. Acesso em: 14 mar. 2006.
FREIMAN, José Paulo.
Utilização das redes neurais artificiais na previsão de
indicadores financeiros para avaliação econômica de negócios em situação de risco.
2004. 96p. Dissertação (Mestrado) – Faculdade de Engenharia, Universidade Federal de
Itajubá, Itajubá.
151
FREIMAN, José Paulo; P., Edson de O. Redes Neurais Artificiais na Previsão do
Valor de Commodity do Agronegócio. V Encuentro Internacional de Finanzas.
Santiago, Chile, 19-21 jan. 2005.
FREITAS, S. O.
Utilização de modelo baseado em redes neurais para a precificação
de opções.
São Paulo: Bolsa de Mercadorias & Futuros, 2002.
GERSHENFELD, N. A.
The Nature of Mathematical Modeling. Cambridge
University Press, 1998.
HAYKIN, S.
Redes Neurais, Princípios e Prática. 2
a
ed. Porto Alegre: Bookman,
2001.
HULL, J. C.; WHITE, A. The Pricing of Options on Assets with Stochastic Volatilities.
Journal of Finance, v. 42, p. 281-300, june 1987.
HULL, J.
Opções, Futuros e Outros Derivativos. São Paulo: Bolsa de Mercadorias &
Futuros, 1998.
KNIGHT, J.; SATCHELL, S.
Forecasting Volatility in the Financial Markets.
Butterworth-Heinemann, 2002.
LACERDA, Antônio Corrêa de. Política Cambial. Comentário Econômico.
Wirtschaftskommentar, set., 2003. Disponível em: <http://
www.ahk.org.br/extranet/revista/upload_comentario/comen_econ_setembro03_port.pdf
>. Acesso em: 13 mar. 2006.
LEMGRUBER, Eduardo Facó.
Avaliação de Contratos de Opções. São Paulo: Bolsa
de Mercadorias & Futuros, 1992.
LIPTON, Alexander. Mathematical Methods for Foreign Exchange.
A Financial
Engineer's Approach.
World Scientific Publishing Company, 2001.
152
LOESCH, C.; SARI, S. T.
Redes neurais artificiais: fundamentos e modelos.
Blumenau: FURB, 1996.
MUNCH, Isabela Perle.
Bandas de câmbio, expectativas de desvalorização,
volatilidade e crescimento econômico: uma análise comparativa entre o Brasil e
outros países emergentes.
São Paulo: Bolsa de Mercadorias & Futuros, 2003.
NABNEY, Ian. Netlab.
Algorithms for Pattern Recognition. Springer-Verlag Telos,
2001.
NATEMBERG, Sheldon.
Option volatility & pricing. Probus Publishing Company,
Chicago: 1994.
OLIVEIRA, Gustavo Aleixo de.
Informação implícita em prêmios de opções. São
Paulo: Bolsa de Mercadorias & Futuros, 2003.
SCOTT, L. O. Option Pricing when the Variance Changes Randomly: Theory,
Estimation, and an Application.
Journal of Financial and Quantitative Analysis, v.
22, p. 419-438, dec. 1987.
SHEPHARD, Neil.
Stochastic Volatility. Oxford University Press, 2005.
SILVA NETO, L. A.
Opções: do Tradicional ao Exótico. São Paulo: Atlas, 1996.
SILVA, C. R. L.
Instabilidade no mercado brasileiro de câmbio. v. 31. São Paulo.
2001.
SILVA, Luiz Maurício da.
Mercado de Opções: conceitos e estratégias. Rio de
Janeiro: Ed. HALIP, 1996.
153
SMITH, K. A.; Gupta, J. N. D. Neural networks in business: techniques and
applications for the operations researcher.
Computers & Operations Research, 2000.
p. 1023-1044.
SMITH, Murray.
Neural Networks for Statistical Modeling. New York: Van
Nostrand Reinhold, 1993.
SOUZA SOBRINHO, Nelson Ferreira de. Extração da volatilidade do Ibovespa.
Resenha Bolsa de Mercadorias & Futuros, n
144, 2004.
TAFNER, M. A.; XEREZ, M; FILHO, I. R.
Redes Neurais Artificiais: Introdução e
Princípios de Neurocomputaçao.
Blumenau: EKO, 1995.
TELES, J. L.; PINHEIRO, M. A.; TEIXEIRA, V. L. VII Prêmio de Monografia.
Volatilidade: importância e utilidade no mercado financeiro. Rio de Janeiro:
Corecon, 1996. p.69-114.
VARGAS, J. V.; PISCIOTTO, M. M. Utilização de Árvores Trinomiais no cálculo de
opções.
Resenha Bolsa de Mercadorias & Futuros, n. 134, p. 39-73, 1999.
VITIELLO JÚNOR, L. R. S. Opções de Compra: O ajustamento de dois modelos de
precificação ao Mercado Brasileiro. XXII ENANPAD,
Anais. Foz do Iguaçu, 1998.
WELSTEAD, S. T.
Neural Network and Fuzzy Logic Applications in C/C++. New
York: John Wiley & Sons, 1994.
WHITE, A. Jay. Pricing Options with Futures-Style Margining.
A Genetic Adaptive
Neural Network Approach.
Garland Publishing, 1999.
WIGGINS, J. B. Option Values under Stochastic Volatility: Theory and Empirical
Estimates.
Journal of Financial Economics, v. 19, p. 351-372, 1987.
154
ANEXO 1
Gráfico gerado pelo
software Neural Net Analizer da série de opções de abril out the
money
com modelo de RNA_US$ na qual se aplicou o corte do early stopping quando a
linha de treinamento cortou a linha de validação.
155
ANEXO 2
Gráfico gerado pelo
software Neural Net Analizer da série de opções de fevereiro in the
money
com modelo de Rede Neural Artificial na qual foi aplicado o corte do early
stopping
uma vez que as duas linhas de validação e treinamento tendiam ao infinito
paralelamente.
156
ANEXO 3
Gráfico gerado pelo
software Neural Net Analizer da série de opções de janeiro out the
money
com modelo de RNA_US$ onde ocorre a convergência das linhas de validação e
treinamento.
157
ANEXO 4
Tela Training Track Board do software Neural Net Analizer na qual foram definidos
para cada grupo de cada vencimento os parâmetros de treinamento da Rede Neural
Artificial e a topologia utilizada, demonstrando o resultado através do erro quadrado
mínimo na saída (MSE
on out put), após o treinamento de 50.000 épocas, para uma
série de janeiro, fora do preço, sem a variável Dólar.
158
ANEXO 5
Tela Training Track Board do software Neural Net Analizer na qual foram definidos
para cada grupo de cada vencimento os parâmetros de treinamento da Rede Neural
Artificial e a topologia utilizada, demonstrando o resultado através do erro quadrado
mínimo na saída (MSE on out put), após o treinamento de 100.000 épocas, para uma
série de fevereiro, no preço, com a variável Dólar
Livros Grátis
( http://www.livrosgratis.com.br )
Milhares de Livros para Download:
Baixar livros de Administração
Baixar livros de Agronomia
Baixar livros de Arquitetura
Baixar livros de Artes
Baixar livros de Astronomia
Baixar livros de Biologia Geral
Baixar livros de Ciência da Computação
Baixar livros de Ciência da Informação
Baixar livros de Ciência Política
Baixar livros de Ciências da Saúde
Baixar livros de Comunicação
Baixar livros do Conselho Nacional de Educação - CNE
Baixar livros de Defesa civil
Baixar livros de Direito
Baixar livros de Direitos humanos
Baixar livros de Economia
Baixar livros de Economia Doméstica
Baixar livros de Educação
Baixar livros de Educação - Trânsito
Baixar livros de Educação Física
Baixar livros de Engenharia Aeroespacial
Baixar livros de Farmácia
Baixar livros de Filosofia
Baixar livros de Física
Baixar livros de Geociências
Baixar livros de Geografia
Baixar livros de História
Baixar livros de Línguas
Baixar livros de Literatura
Baixar livros de Literatura de Cordel
Baixar livros de Literatura Infantil
Baixar livros de Matemática
Baixar livros de Medicina
Baixar livros de Medicina Veterinária
Baixar livros de Meio Ambiente
Baixar livros de Meteorologia
Baixar Monografias e TCC
Baixar livros Multidisciplinar
Baixar livros de Música
Baixar livros de Psicologia
Baixar livros de Química
Baixar livros de Saúde Coletiva
Baixar livros de Serviço Social
Baixar livros de Sociologia
Baixar livros de Teologia
Baixar livros de Trabalho
Baixar livros de Turismo