Download PDF
ads:
UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL
PROGRAMA DE PÓS-GRADUAÇÃO EM ECONOMIA
CONDIÇÃO DE MARSHALL-LERNER E QUEBRA ESTRUTURAL NA
ECONOMIA BRASILEIRA
Autor: Guilherme Valle Moura
Porto Alegre
2005
ads:
Livros Grátis
http://www.livrosgratis.com.br
Milhares de livros grátis para download.
UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL
PROGRAMA DE PÓS-GRADUAÇÃO EM ECONOMIA
CONDIÇÃO DE MARSHALL-LERNER E QUEBRA ESTRUTURAL NA
ECONOMIA BRASILEIRA
Autor: Guilherme Valle Moura
Orientador: Prof. Sergio da Silva
Dissertação submetida ao
Programa de Pós-Graduação em
Economia da Faculdade de
Ciências Econômicas da UFRGS
como requisito para a obtenção
do Grau de Mestre em Economia.
Porto Alegre
2005
ads:
Sumário
Introdução...........................................................................................................7
Capítulo 1 Taxa de Câmbio e Balança Comercial. ......................................11
1.1 Abordagem das Elasticidades.....................................................................11
1.2 Abordagem da Absorção.............................................................................17
1.3 Curva J........................................................................................................20
Capítulo 2 Metodologia..................................................................................25
2.1 Raízes Unitárias..........................................................................................25
2.2 Cointegração...............................................................................................38
2.2.1 Testes de Cointegração...........................................................................42
A Metodologia de Engle e Granger.............................................................42
 A Metodologia de Johansen........................................................................43
2.3 Processos VAR Cointegrados com Mudanças de Regime Markoviano.....44
2.3.1 Mudança de Regime no Drift e na Média de Equilíbrio do VECM............46
2.3.2 Representação Estável de Espaço-Estado..............................................48
2.3.3 Processos MS-VAR Mais Gerais. ............................................................49
2.3.4 Representação VARMA de Processos MS-VAR Cointegrados. ..............50
2.3.5 Estimação ................................................................................................52
Capítulo 3 Resultados....................................................................................56
3.1 Dados..........................................................................................................56
3.2 Modelo Linear .............................................................................................58
3.3 Modelo com Mudança de Regime Markoviano...........................................60
Conclusão.........................................................................................................69
Referências Bibliográficas..............................................................................71
Apêndice...........................................................................................................84
Lista de Ilustrações
Figura 1.1 Um modelo de dois bens e dois países...................................................14
Figura 3.2.1 Resposta de lnxm à inovação de um desvio padrão em lnreal. ...........60
Tabela 3.3.2 Estimativas do MSMH(2)-VECM(4).....................................................62
Tabela 3.3.3 Data dos regimes ................................................................................63
Figura 3.3.1 Probabilidades suavizadas do regime 1...............................................63
Figura 3.3.2 Probabilidades suavizadas do regime 2...............................................63
Figura 3.4 Funções impulso-resposta do modelo MSMH(2)-VECM(4) ....................68
Tabela 3.1.1 Estatísticas descritivas ........................................................................84
Tabela 3.1.2 Teste ADF ...........................................................................................84
Tabela 3.1.3 Teste de raiz unitária baseado em Perron (1997) ...............................84
Tabela 3.1.4 Datas das quebras estruturais dadas pelo teste Perron (1997) ..........84
Tabela 3.2.1 Critérios AIC e BIC para seleção do número de defasagens ..............85
Tabela 3.2.2 Testes de cointegração.......................................................................85
Tabela 3.3.1 Critérios de informação para a seleção do modelo .............................85
RESUMO
O presente trabalho tem como objetivo analisar empiricamente a desempenho
da balança comercial brasileira em resposta a depreciações cambiais no período
entre janeiro de 1990 e dezembro de 2003. A condição de Bickerdike-Robinson-
Metzler, bem como a de Marshall-Lerner afirmam que existe uma relação positiva
entre estas variáveis. Porém, os trabalhos empíricos sobre o assunto têm obtido
resultados divergentes, principalmente no que se refere à resposta de curto prazo.
Vários autores estimam uma relação negativa entre a balança comercial e o câmbio
no curto prazo, confirmando a hipótese da curva J. Utilizamos a metodologia MS-
VECM (Markov-switching vector error correction model) para capturar os vários
choques e mudanças ocorridos na economia brasileira. Concluímos que nos
períodos de maior volatilidade, a resposta da balança comercial é menor. Porém, as
condições de Bickerdike-Robinson-Metzler e de Marshall-Lerner são válidas para a
economia brasileira no período analisado, independentemente do regime em vigor.
Palavras-Chave: Balança comercial, condição de Marshall-Lerner, curva J,
cointegração, mudança markoviana
ABSTRACT
This work examines empirically the trade balance response to exchange rate
depreciations. Both Bickerdike-Robinson-Metzler and Marshall-Lerner conditions
state the existence of a positive relation between theses variables. Yet empirical
evidence has been mixed, especially that of the short run response. Several authors
find a negative relationship, which confirms a J curve hypothesis. We employ a
Markov switching vector error correction model to track shocks and structural
changes hitting the Brazilian economy. We find that periods of greater volatility are
accompanied by smaller response of the trade balance. However the results of both
regimes are consistent with Bickerdike-Robinson-Metzler and Marshall-Lerner
conditions.
Keywords: Trade balance, Marshall-Lerner condition, J curve, cointegration, Markov
switching
7
Introdução
A taxa de câmbio é um preço importante em uma economia aberta, pois afeta
diretamente vários negócios, investimentos e decisões de política. Dessa forma,
não é surpreendente que o estudo das taxas de câmbio tenha se tornado uma área
de pesquisa tão prolífica nas últimas décadas. Essa linha de pesquisa cresceu
tremendamente depois de Bretton Woods, quando as taxas de câmbio se tornaram
altamente voláteis devido à adoção do regime de taxa de câmbio flutuante.
Uma das áreas de pesquisa da taxa de câmbio que recebeu muita atenção de
vários pesquisadores é a relação entre taxa de câmbio e balança comercial. O
modelo da balança comercial baseado nas elasticidades, desenvolvido por
Bickerdike (1920), Robinson (1947) e Metzler (1948), mostra a existência teórica
dessa relação. Vários estudos empíricos foram feitos para descobrir os efeitos de
variações cambiais sobre a balança comercial, com intuito de fornecer informações
importantes para os formuladores de política. Principalmente sobre a eficácia de
políticas cambiais, como desvalorizações nominais, para ajustar a balança comercial
(Krugman e Baldwin 1987, Greenwood 1984, Hilmarios 1989, Rose e Yellen 1989,
Bahmani-Oskooee 1991, 2001, Mahdavi e Sohrabian 1993, Arize 1994, Wei 1999,
Baharumshah 2001, Singh 2002, Onafowora 2003).
Espera-se que a depreciação (apreciação) nominal altere a taxa de câmbio
real (Hilmarios 1989, Bahmani-Oskooee 2001), gerando um efeito direto sobre a
balança comercial. Especificamente, Bahmani-Oskooee (2001) diz que, com o
objetivo de aumentar a competitividade internacional e melhorar a balança
comercial, um país pode realizar uma desvalorização ou permitir que seu câmbio se
deprecie.
Porém, existem evidências empíricas que mostram a persistência no ajuste
tanto de preços quanto de quantidades, na balança comercial, após variações
cambiais (Junz e Rhomberg 1973, Krugman e Baldwin 1987, Meade 1988). Além
disso, muitos acreditam na existência de rigidez no ajuste de preços e quantidades
devido à existência de contratos de câmbio, defasagens no processo de tomada de
decisão dos agentes, preços viscosos, persistência nos hábitos de consumo e
histerese (Magee 1973, Junz e Rhomberg 1973, Gerlach 1989, Mansoorian 1998,
Dixit 1994). Este fenômeno é conhecido na literatura como curva J, devido ao efeito
8
perverso no curto prazo e a subseqüente melhora da balança comercial no longo
prazo, o que faz com que o gráfico de sua evolução ao longo do tempo se
assemelhe à letra J.
A circunstância sob a qual uma desvalorização cambial melhora a balança
comercial é conhecida como condição de Marshall-Lerner. O fenômeno da curva J
pode ocorrer em um modelo de dois países mesmo se a condição de Marshall-
Lerner for válida, pois o aumento da balança comercial postulado por ela só irá se
manifestar no novo equilíbrio de longo prazo, uma vez que ela é derivada de uma
análise de estática comparativa. Em um modelo de dois países, onde o país
estrangeiro é o resto do mundo, a balança comercial é dada por
(
)
()
RYQEPRYPXBC ,,
**
= (1.1)
onde P é o nível de preço do país local, X(
) é a demanda por exportações, Q(
) é a
demanda por importações, Y
*
é a renda do resto do mundo, R é a taxa de câmbio
real PEPR
*
, E é a taxa de câmbio nominal, P
*
é o nível de preço do resto do
mundo e Y é a renda local.
Os efeitos de uma depreciação sobre a balança comercial são, portanto,
incertos, uma vez que esta desencadeia três processos:
1. A depreciação torna os bens domésticos mais baratos para o
estrangeiro, aumentando assim o volume das exportações. Com o nível de preços
constante, a receita em moeda local das exportações também aumenta, elevando
então a balança comercial.
2. Uma depreciação aumenta o preço doméstico das importações,
diminuindo assim o volume demandado. Tudo o mais constante, isto também
aumenta o saldo da balança comercial.
3. A depreciação faz com que o país local tenha que pagar mais por cada
unidade importada remanescente. Isto piora a balança comercial.
Os processos 1 e 2 são conhecidos como efeito volume, já o processo três é
o efeito preço. Combinando os efeitos, a depreciação cambial não melhora a
balança comercial em todas as situações. A melhora só ocorre se 1 e 2 superarem
3. Para que uma depreciação cambial melhore a balança comercial, precisamos
que a derivada de (1.1) em relação a E seja positiva:
0
**
>
QP
E
Q
EP
E
X
P
. (1.2)
9
Segundo a condição de Marshall-Lerner, uma depreciação cambial só
melhora a balança comercial se, e somente se, a soma das elasticidades da taxa de
câmbio das demandas por exportações e importações for, em termos absolutos,
maior do que um, de forma a compensar o aumento no preço das importações
causado pela depreciação. Porém, nada impede que ao longo do processo de
ajustamento a balança comercial deteriore graças, por exemplo, ao efeito volume ou
preço.
Krugman e Baldwin (1987), Foray e McMillan (1999) e Bahmani-Oskooee e
Kantipong (2001) encontram evidências de curva J, com uma fase inicial de redução
na balança comercial após a depreciação cambial e subsequente aumento. Porém,
Moffet (1989), Rose e Yellin (1989) e Leonard e Stockman (2001) não encontram
evidências robustas de curva J. Já Backus, Kehoe e Kydland (1994), adotam uma
abordagem de ciclos reais internacionais e encontram grande dependência do tipo
de choque nos resultados da balança comercial. De acordo com esse estudo, a
balança comercial é contra-cíclica e, geralmente, negativamente correlacionada com
movimentos presentes e futuros dos termos de troca, porém é positivamente
correlacionada com movimentos passados nos termos de troca, o que gera o que
eles chamaram de curva S.
Portanto, apesar de vários estudos já realizados sobre a dinâmica da balança
comercial após uma depreciação cambial, não existe um consenso na literatura do
tema. As diversas alterações cambiais ocorridas no Brasil, bem como a abertura
comercial iniciada nos anos 90, oferecem uma grande oportunidade para a análise
dos impactos de variações cambiais sobre a balança comercial brasileira.
Este trabalho tem como objetivo investigar os efeitos que variações na taxa
de câmbio real exercem sobre a balança comercial brasileira. Pretende-se utilizar a
metodologia de cointegração com o intuito de captar os efeitos de curto e longo
prazo da taxa de câmbio sobre a balança comercial como tem sido feito na literatura
(Antonucci 2003, Arize 1994, Baharumshah 2001, Bahmani-Oskooee 1991, 1994,
2001, Brada 1997, Mahdavi e Sohrabian 1993, Onafowora 2003, Singh 2002, Wei
1999).
Optamos pela adoção de modelos com mudança de regime markoviano para
capturar as várias alterações no regime de câmbio, o grande número de planos
econômicos adotados por diferentes governos e os choques externos que afetaram
a economia brasileira.
10
O trabalho está dividido da seguinte maneira. No primeiro capítulo faremos
uma descrição da evolução teórica do estudo da relação entre balança comercial e
câmbio. Mais especificamente, apresentaremos as abordagens das elasticidades
para a balança comercial, bem como a da absorção e o caso da curva J. No
segundo capítulo discutiremos a metodologia econométrica usada. Começaremos
pela análise de raiz unitária em séries macroeconômicas, apresentando os testes
existentes para dados com e sem quebra estrutural. Em seguida exporemos a
metodologia de cointegração, que possibilita a análise dos efeitos de curto e longo
prazo como desejado. Finalmente, desenvolveremos a metodologia para análise e
estimação de vetores auto-regressivos cointegrados com mudança de regime
markoviano. No terceiro capítulo apresentaremos e interpretaremos os resultados
obtidos para dados brasileiros usando tanto o modelo linear quanto o não linear.
11
Capítulo 1 Taxa de Câmbio e Balança Comercial
Os economistas sempre enfatizaram a interdependência entre a taxa de
câmbio e a balança comercial e seus efeitos sobre as economias. Uma percepção
rudimentar do ajuste das taxas de câmbio em resposta aos desequilíbrios nos
pagamentos do comércio internacional pode ser encontrada pelo menos a partir do
século XIV. Nesta época, as instituições bancárias européias começaram a emitir
títulos de troca com o intuito de facilitar as transações nas feiras de comércio
internacional. Estas feiras duravam muitas semanas, fazendo com que os
mercadores pudessem fazer várias transações de compra e venda. Para facilitar as
transações, as compras e vendas não eram efetuadas com meios de pagamento e
os oficiais da feira supervisionavam um processo de compensação. Ao final do
evento, validavam-se os pagamentos devidos e recebidos de cada mercador,
reduzindo-se assim o número de transações. Os saldos restantes eram pagos
através de títulos de troca, conversíveis em ouro ou prata, emitidos por bancos
localizados nos grandes centros comerciais da Europa.
No início do século XVII, a influência das taxas de câmbio e da balança comercial
nas condições domésticas foi reconhecida nos círculos políticos da Inglaterra e da
Itália, onde dificuldades com a economia doméstica devido à saída de divisas
geraram preocupações (para uma abordagem histórica das taxas de câmbio ver
Enzig (1970)).
Desde meados do século XX, o desenvolvimento tanto na análise econômica
quanto na evolução da economia mundial, alteraram a percepção das relações entre
a taxa de câmbio e a balança comercial. Ao mesmo tempo, a análise do processo de
ajustamento das taxas de câmbio tornou-se muito importante para as políticas
públicas que visavam o equilíbrio interno e externo da economia doméstica.
1.1 Abordagem das Elasticidades
Considerando que até o final da década de 60 os fluxos internacionais de
capitais eram pequenos em relação ao valor do comércio internacional, a maioria
dos modelos de taxa de câmbio e balanço de pagamentos tratava a conta corrente –
muitas vezes simplesmente a balança comercial – como o único componente
12
endógeno do balanço de pagamentos. As taxas de câmbio, por sua vez, eram tidas
como exógenas, pois o câmbio era fixo, e as expectativas ainda não exerciam papel
na modelagem econômica. Apesar destas limitações, algumas características dos
primeiros modelos da conta corrente continuam presentes nos atuais modelos
expectacionais de câmbio flexível.
O primeiro modelo relacionando a balança comercial e a taxa de câmbio
seguia a abordagem das elasticidades, na tradição marshalliana de se considerar a
taxa de câmbio como um preço que equilibra um mercado bem definido com curvas
de demanda e oferta. Entre as contribuições mais citadas para o desenvolvimento
da abordagem das elasticidades estão Bickeerdike (1920), Marshall (1923), Lerner
(1914), Robinson (1947) e Metzler (1948). Este modelo se baseia na idéia de um
efeito substituição explícito no consumo e implícito na produção, introduzido por uma
alteração no preço relativo dos bens domésticos em comparação com os bens
estrangeiros após uma desvalorização cambial.
O modelo padrão analisa o efeito de uma alteração na taxa de câmbio sobre a
balança comercial em termos de mercados separados para bens produzidos
domésticamente e bens produzidos no estrangeiro, abstraindo a existência de bens
não transacionáveis.
Seguindo a clássica exposição deste modelo feita por Dornbusch (1975), a
oferta de exportações e a demanda por importações dependem somente dos preços
nominais medidos em moeda local das exportações e das importações. As funções
demanda são Marshallianas com elasticidade preço negativa. Apesar do modelo não
ser construído com microfundamentação, pode-se assumir que estas funções de
demanda são derivadas de um problema de maximização de utilidade, ou seja, que
elas satisfazem as propriedades de homogeneidade de grau zero, de restrição
orçamentária ativa e que a matriz de Slutsky é negativa semi-definida. O efeito preço
cruzado entre os mercados é desprezado. A equação para a demanda doméstica
por importações (exportações do país estrangeiro) é dada por:
()
m
dd
PMM = (1.1.1)
Observe que
*
mm
EPP = , onde E é a taxa de câmbio nominal em unidades de
moeda local por uma unidade de moeda estrangeira e
*
m
P é o nível de preço das
importações domésticas no estrangeiro, ou seja, assume-se que a paridade do
13
poder de compra é válida. A equação para a demanda estrangeira por importações
(exportações domésticas) é definida de forma similar:
(
)
***
x
dd
PMM = , (1.1.2)
onde
*d
M
é a quantidade de importações estrangeiras e
*
x
P é o nível de preço das
exportações domésticas em moeda externa. Como na definição acima, temos que
E
P
P
x
x
=
*
, onde
x
P é o nível de preço das exportações domésticas em moeda local.
Da mesma forma que se definiu as funções demanda, também as funções de
oferta de exportação são definidas de forma a depender somente dos preços
nominais:
()
x
ss
PXX = (1.1.3)
(
)
***
m
ss
PXX = , (1.1.4)
onde X
s
e X
s*
são as quantidades de exportações ofertadas pelo país local e pelo
estrangeiro, respectivamente. Portanto, as condições de equilíbrio para as
exportações e importações são:
*sd
X
M
= (1.1.5)
sd
X
M
=
*
(1.1.6)
Dadas as equações (1.1.1), (1.1.2), (1.1.3) e (1.1.4), a balança comercial em
moeda local é dada por:
d
m
s
x
MPXPB = (1.1.7)
Devem-se notar dois pontos sobre as taxas de câmbio neste modelo.
Primeiramente, como não existem bens não transacionáveis, a taxa de câmbio real é
medida pelos termos de troca. Além disso, qualquer desvalorização nominal se torna
uma desvalorização real. A explicação para isso é a hipótese implícita de que os
níveis de preço locais e estrangeiros sejam determinados exogenamente. Kenen
(1985) chama atenção para o fato de que isto torna este modelo keynesiano, uma
vez que o mercado de bens é equilibrado por mudanças no produto e não por
alterações nos preços.
Pode-se usar a estática comparativa para ilustrar as equações deste modelo.
Existem dois mercados separados para demanda doméstica por importações e
oferta de exportações. Supondo que exista equilíbrio, ou seja, B=0, o que acontece
14
com a balança comercial definida em (1.1.7) após uma desvalorização cambial
doméstica? O efeito de uma desvalorização cambial neste modelo é mostrado na
Figura 1.1.
Figura 1.1: Um modelo de dois bens e dois países.
Em equilíbrio, as exportações domésticas são X
0
e as importações são M
0
, os
preços são P
x
0
e P
m
0
, respectivamente. A desvalorização não desloca a oferta
doméstica de exportações e nem a demanda por importações, pois estas são
afetadas somente pelos preços locais, que estão no eixo vertical dos gráficos da
Figura 1.1. O que ocorre é apenas um movimento ao longo das curvas M
d
e X
s
, de
forma que a oferta de exportações domésticas aumenta e a demanda por
importações diminui. Porém a desvalorização cambial altera o nível de preço das
exportações locais em moeda externa, bem como o nível de preço das importações
domésticas em moeda externa, que não estão explícitos na Figura 1.1. Por isso, as
curvas de demanda externa por importações domésticas e de oferta externa de
exportações são deslocadas para cima de M
0
d*
para M
1
d*
e de X
0
s*
para X
1
s*
,
respectivamente. De forma a manter o preço em moeda externa dos bens, como
definido acima, os preço em moeda local têm que aumentar na mesma proporção da
desvalorização. O novo equilíbrio se estabelece quando ambos os mercados se
M
Pm
X
0
S*
X
1
S*
M
P
m
1
P
m
0
M
1
M
0
P
x
X
X
0
X
1
P
x
1
P
x
0
M
0
d*
Mercado de Importações
X
S
Mercado de Exportações
M
1
d*
15
equilibram com as novas quantidades X
1
e M
1
e os novos preços P
m
1
e P
x
1
. Então, a
desvalorização aumenta os preços de equilíbrio em moeda local nos dois mercados,
aumentando o volume de exportações domésticas e reduzindo o volume de
importações do país local. O que acontece é uma substituição no consumo entre
bens domésticos e estrangeiros induzida pela alteração na taxa de câmbio. Dessa
forma, o valor das exportações domésticas, P
x
X
S
, aumenta, enquanto o valor das
importações, P
m
M
d
, pode aumentar ou diminuir dependendo da elasticidade preço
doméstico da demanda. Isto implica que o efeito de uma desvalorização na balança
comercial, neste modelo, é ambíguo.
Uma condição suficiente para que a balança comercial melhore após uma
desvalorização cambial, na abordagem das elasticidades, foi desenvolvida por
Bickerdike (1920) e exposta por Robinson (1947) e Metzler (1949). Por isso ficou
conhecida como a condição de Bickerdike-Robinson-Metzler, ou simplesmente
condição BRM. Derivando (1.1.7) e colocando os resultados em forma de
elasticidade, pode-se conseguir esta condição algébrica. Ela relaciona a resposta
da balança comercial às alterações na taxa de câmbio e as elasticidades preço
doméstico e externo das importações e exportações:
()
()
(
)
()
+
+
+
=
ηε
εη
ηε
ηε
*
*
*
*
11
d
m
s
x
MPXP
dE
dB
, (1.1.8)
onde
η
e
ε
denotam as elasticidades (em valor absoluto) da demanda doméstica
por importações e oferta doméstica de exportações. Existem duas hipóteses
implícitas na derivação das elasticidades demanda. A primeira é que as rendas
nominais do país local e do estrangeiro são mantidas constantes. A segunda
hipótese é que o nível geral de preços do país local é constante. A interpretação de
Dornbusch (1975) da primeira hipótese é de que estas elasticidades são, então,
elasticidades compensadas. Kemp (1970) entre outros, enfatizou que, além dessas
duas hipóteses, o modelo também assume implicitamente que todas as
elasticidades preço cruzadas (entre exportações e importações) são zero. Logo, a
matriz de Slutsky é uma matriz diagonal.
Pode-se mostrar que, se B=0, então 0>
dE
dB
se e somente se:
()()
()()
0
11
**
***1*
>
++
++
ηεηε
ηηεεεεηη
. (1.1.9)
16
Note que quando ==
**
εη
, o país em questão não afeta os preços
internacionais, pois a demanda por importações e a oferta externa de exportações
são perfeitamente elásticas. Este é o caso do “país pequeno”, no qual o Brasil
parece se enquadrar. Nesta situação, o país é tomador de preço tanto no mercado
de exportação quanto no mercado de importação. Dessa forma, uma desvalorização
local não afeta os preços internacionais em moeda externa dos bens exportados e
importados. Isto implica que apenas mudanças de volume afetam a balança
comercial em moeda externa. Logo, o efeito de uma desvalorização cambial sobre a
balança comercial seria o seguinte. Com a desvalorização, os exportadores irão
receber mais unidades de moeda local por suas exportações. Com isso, é de se
esperar que a resposta destes agentes seja o aumento da quantidade ofertada a um
dado preço em moeda externa. Por outro lado, os importadores irão se defrontar
com preços mais altos em moeda local para suas importações. Consequentemente,
eles irão reduzir suas importações. Logo, com volume de exportação aumentando e
volume de importações diminuindo a preços em moeda externa fixos, a
desvalorização irá melhorar a balança comercial (Lindert e Kindleberger, 1982).
Portanto, no caso do país pequeno, uma desvalorização cambial deve melhorar a
balança comercial em moeda externa.
Todavia, se a balança comercial é medida em moeda local, a estória pode ser
bem diferente. A razão para isto é que o aumento no valor das exportações
domésticas pode ser menor que a redução no valor das importações domésticas, ou
seja, o efeito final sobre a balança comercial depende das elasticidades preço
domésticas. A desvalorização doméstica deve melhorar a balança comercial, em
moeda local, se
ηε
> (por hipótese não existem barreiras comerciais qualitativas
nem quantitativas).
Outro resultado que pode ser derivado da condição (1.1.9) é a chamada
condição de Marshall-Lerner (Marshall, 1923; Lerner, 1944). Esta condição é obtida
fazendo
*
,
εε
. Tal hipótese de elasticidade infinita para a oferta de exportações
domésticas e externas faz com que o lado esquerdo de (1.1.9) fique 1
*
+
ηη
. Logo,
para uma melhora da balança comercial após uma desvalorização cambial,
1
*
>+
ηη
deve valer ou, como na apresentação tradicional, 1
*
>+
ηη
. A condição
de Marshall-Lerner estabelece que quando as elasticidades de oferta de exportação
17
doméstica e externa são estritamente elásticas e a renda dos países permanece
constante, uma desvalorização cambial gera uma melhora do saldo da balança
comercial apenas se a soma das elasticidades demanda por importação local e
estrangeira, em valor absoluto, é maior que um. Esta condição tem sido considerada
na literatura como suficiente para assegurar a estabilidade do mercado de câmbio.
Logo, se a condição de Marshall-Lerner é válida, existe um excesso de demanda por
moeda estrangeira se esta está abaixo do valor de equilíbrio e um excesso de oferta
quando a taxa de câmbio está acima do preço de equilíbrio. Nessas circunstâncias,
a taxa de câmbio irá se mover para o valor de equilíbrio e o mercado irá “zerar”.
Muitos trabalhos usaram argumentos de equilíbrio parcial para argumentar que a
condição de Marshal-Lerner pode não ser satisfeita, entre eles se destacam
Dornbusch, 1987; Krugman,1987 e Krugman e Baldwin, 1987. Os argumentos se
baseiam em falhas de mercados tais como histerese, comportamento de pricing to
market ou incerteza. Desta maneira, uma questão relevante para o presente trabalho
é saber se a condição de Marshal-Lerner é válida para o Brasil.
Como descrito pelo conjunto de equações (1.1.1) – (1.1.8), a abordagem das
elasticidades tem várias limitações. Primeiro, as funções demanda por importações e
oferta de exportações dependem somente dos preços nominais dos bens em
questão, ao invés dos preços relativos e de variáveis tais como renda ou capacidade
produtiva. Segundo, mudanças na balança comercial correspondem a alterações
idênticas nas contas nacionais na diferença entre produção e absorção interna,
porém nenhuma destas variáveis foi incluída na análise explicitamente. Terceiro, o
conceito de desequilíbrio comercial implica que os bens são pagos com algum ativo
que não foi explicitamente incluído na análise.
1.2 Abordagem da Absorção.
Os teóricos da abordagem das elasticidades reconheceram as limitações de
sua modelagem. No começo dos anos 50, os efeitos de desvalorizações cambiais
sobre a renda nacional e o emprego foram modelados por Robinson (1947),
Harberger (1950), Meade (1951), Alexander (1952, 1959), entre outros. Este novo
corpo de análise, conhecido como abordagem da absorção, não é uma rejeição da
abordagem das elasticidades, mas uma tentativa de integrar esta última com as
idéias keynesianas e seu foco nas contas nacionais.
18
O núcleo desta abordagem é a proposição de que qualquer melhora na
balança comercial requer um aumento da renda nacional sobre as despesas
domésticas totais. Tal teoria da balança comercial pode ser definida através de
identidades macroeconômicas básicas, que expressam as diferentes ligações entre
a balança comercial e os agregados macroeconômicos. Duas semelhanças entre as
abordagens das elasticidades e da absorção são as hipóteses de países “grandes” e
de que a conta corrente se reduz à balança comercial. Duas diferenças são a
introdução da renda e da moeda, apesar da última ser muito pouco discutida.
Assumindo ausência de transferências e serviços, de forma que a renda
nacional é o PIB e a conta corrente é a balança comercial, pode-se escrever:
MDCXDCTBDCAY
== (1.2.1)
onde Y é o PIB, TBDC é a balança comercial em moeda local e XDC e MDC são os
valores em moeda local das exportações e importações respectivamente. Esta
identidade mostra que a balança comercial é apenas um lado da moeda e que a
abordagem das elasticidades esqueceu de analisar o outro lado. Ou seja, o que a
abordagem da absorção faz é analisar a economia do ponto de vista das despesas
agregadas e, especialmente, analisar os efeitos diretos da taxa de câmbio nos
preços relativos, renda, absorção e balança comercial. Esta abordagem assume
implicitamente a hipótese keynesiana de que o volume de exportações é
independente da renda nacional e que as importações dependem positivamente
desta. Esta dependência positiva, segundo Alexander (1952), acontece porque a
produção de um país depende de insumos que são importados e também porque a
importação responde à absorção total.
Esta abordagem integrada enfatiza que a desvalorização da moeda local leva
à redução do preço relativo do bem doméstico. Tal redução produz dois efeitos
diretos. Primeiro, gera um efeito substituição que altera a composição da demanda,
transferindo a demanda por bens estrangeiros para os bens domésticos. Até agora
esta análise produz os mesmos resultados da abordagem das elasticidades. Porém,
nesta abordagem, existe um efeito renda que aumenta a absorção interna,
reduzindo assim a balança comercial. Assumindo a existência de desemprego, como
é tradicional na análise keynesiana, este efeito substituição leva a um aumento do
produto local e uma redução do produto estrangeiro. O efeito renda está relacionado
tanto com o aumento na renda doméstica, que age através da propensão marginal a
consumir e a investir, quanto com a redução nos termos de troca. A abordagem da
19
absorção argumenta que, em geral, uma desvalorização cambial gera uma piora nos
termos de troca. A hipótese é de que uma desvalorização irá levar a uma redução no
preço das exportações em moeda estrangeira. Como os países são “grandes”, com
ofertas elásticas, então, sob a hipótese de preços domésticos constantes (oferta de
exportação estritamente elástica), uma desvalorização irá reduzir o preço doméstico
das exportações em moeda estrangeira. O preço doméstico das importações em
moeda externa fica constante, ou pode diminuir se a oferta externa de exportações
não é estritamente elástica. A condição para uma piora nos termos de troca é que o
decréscimo no preço das exportações seja maior que o decréscimo no preço das
importações.
Porém, o fato de que os termos de troca irão decrescer não implica que a
balança comercial irá piorar. Pode haver a piora na balança comercial se o redução
nos termos de troca for grande o suficiente para compensar a melhora na balança
comercial gerada pelo aumento no volume de exportações e a redução do volume
de importações (Lindert e Kindleberger, 1982). Apesar de que a desvalorização
aumenta o produto real medido em termos do bem doméstico, ela pode não
melhorar o bem estar. Usando os termos de Bhagwati (1958), uma desvalorização
pode ser empobrecedora se causa uma queda muito grande nos termos de troca.
Pode-se construir modelos onde a desvalorização reduz a renda doméstica, ver
Salop (1974). No final, o efeito líquido da desvalorização cambial sobre a balança
comercial irá depender da combinação dos efeitos substituição e renda.
A abordagem da absorção leva a quatro conclusões:
1. Uma desvalorização cambial aumenta o produto local quando não há pleno
emprego e reduz o produto externo.
2. Por causa dos efeitos sobre as rendas local e estrangeira, e nos fluxos de
comércio, a desvalorização melhora a balança comercial em uma quantidade
menor do que a prevista pela abordagem das elasticidades.
3. Mudança na taxa de câmbio é uma política ótima em resposta às alterações
espontâneas na despesa local ou às alterações na despesa externa.
4. Se os países estão em pleno emprego, entretanto, mudanças na taxa de
câmbio por si só não são suficientes para melhorar a balança comercial.
A primeira conclusão é resultado do efeito substituição na despesa
doméstica. O aumento na demanda por bens locais faz com que o produto
doméstico cresça para eliminar o excesso de demanda, enquanto a redução na
20
demanda por bens externos faz com que a renda estrangeira decresça para
equilibrar este mercado. Isto implica que a desvalorização configura-se como uma
política de empobrecer o vizinho (beggar my neighbour) para resolver o problema do
desemprego local.
A segunda conclusão decorre da primeira, pois o aumento da renda local gera
aumento das importações domésticas, enquanto a redução na renda externa causa
redução nas importações do exterior e, portanto, nas exportações locais. Logo, o
efeito na balança comercial é menor do que a alteração inicial nas despesas com
bens domésticos e estrangeiros. Neste caso, o aumento é permanente, porque o
processo de equilíbrio é incompleto neste modelo, pois as reservas foram
esterilizadas. Em modelos monetários do balanço de pagamentos, por sua vez, a
desvalorização leva a melhora apenas temporária na balança comercial, pois as
alterações no fluxo de reservas levam à alterações na oferta de moeda, o que
desloca as despesas (Dornbusch, 1973).
Os efeitos de uma alteração na taxa de câmbio sempre levam a mudanças na
despesa. Portanto, mudança no câmbio é uma resposta ótima à alterações
espontâneas na despesa, pois ela pode manter tanto equilíbrio interno nos países
quanto o equilíbrio externo. Além disso, é a política ótima para um país que enfrenta
uma alteração na despesa estrangeira.
Se a economia doméstica está em pleno emprego, uma desvalorização
cambial não melhora a balança comercial, a não ser que esta seja acompanhada por
uma redução na demanda pelo bem doméstico. Isto se dá porque a acomodação do
excesso de demanda gerado pelo efeito substituição na despesa não pode ser
acomodado por aumento na renda. Ao invés, este excesso de demanda é
acomodado por aumento nos preços de forma a manter constante a taxa de câmbio
real, impedindo qualquer alteração na estrutura das despesas.
1.3 Curva J.
As mudanças nas taxa de câmbio que se seguiram após o colapso do sistema
de Bretton Woods, em particular a depreciação do dólar americano, renovaram o
interesse no perfil temporal das respostas dos preços e quantidades de bens
transacionados às variações cambiais. Passou a ser freqüente o uso do conceito de
curva J entre os economistas. A idéia da curva J surge da constatação empírica de
21
que a balança comercial medida em moeda local pode, inicialmente, deteriorar-se
após uma desvalorização cambial, sendo seguida por uma melhora. A idéia é que no
curto prazo, o preço em moeda local das importações aumenta mais rápido que o
preço das exportações, sendo que os volumes só se ajustam após alguma
defasagem. Porém, a idéia de um padrão para a resposta da balança comercial à
desvalorização do câmbio começou a ficar mais obscura depois que os economistas
começaram a analisar com mais cuidado o processo. A moeda na qual os contratos
são fechados, as defasagens no processo de pass-trough dos preços e quantidades,
as incertezas associadas à desvalorização cambial, entre outros fatores, são
importantes na determinação do perfil temporal do ajustamento da balança
comercial após uma desvalorização.
As explicações teóricas para tal fenômeno têm variado bastante. A primeira
explicação teórica para este perfil temporal do ajustamento da balança comercial em
resposta a variações cambiais foi feita por Magee (1973). Em uma estrutura que usa
a abordagem das elasticidades, abstraindo os efeitos renda, e adotando a hipótese
de que tanto a demanda quanto a oferta de importações e exportações dependem
somente dos preços relativos, ele identificou três períodos distintos após uma
desvalorização cambial. Estes períodos são definidos de acordo com os diferentes
fatores afetando a balança comercial: o período de contrato de moedas, o período
de pass through e o período de ajuste nas quantidades.
O período de contrato de moedas é definido como o período logo após a
depreciação, quando contratos fechados antes da alteração no câmbio ainda estão
sendo realizados. Como neste horizonte de tempo tanto os preços quanto as
quantidades estão fixos, uma depreciação cambial com o intuito de reduzir o déficit
da balança comercial irá aumentar ou diminuir o saldo da última, dependendo da
proporção dos contratos estipulados em moeda local e moeda estrangeira. Como na
maioria das vezes, os contratos de exportação bem como os de importação são
fixados em moeda estrangeira, de forma a evitar uma perda cambial, a depreciação
irá aumentar ainda mais o déficit neste período.
O período do “pass-through” é definido como o período após a depreciação
no qual os preços começam a variar devido à alteração cambial, mas as
quantidades permanecem fixas devido a várias restrições atingindo o lado da oferta
e o da demanda de importações e exportações. Dessa forma, o valor das
importações irá aumentar devido a depreciação cambial, entretanto, a quantidade
22
importada ficará constante, aumentando o valor das importações totais. Por outro
lado, o preço das exportações em moeda estrangeira diminui na mesma proporção
da desvalorização - assumindo que os exportadores ajustam o preço em moeda
estrangeira de acordo com a desvalorização - mas a demanda não irá se alterar, de
forma que a receita em moeda estrangeira irá diminuir e a receita em moeda local
permanecerá constante. Dessa forma, a balança comercial medida em moeda local
irá deteriorar seguindo o padrão de uma curva J.
O período de ajuste nas quantidades é definido como o período no qual tanto
preços quanto quantidades ajustam-se livremente e, dado que a CML é válida, a
balança comercial irá certamente melhorar. Entretanto, isto é verdade somente para
uma análise de estática comparativa. A mesma análise feita em contexto dinâmico
mostra que na transição do equilíbrio antigo para o novo, uma menor velocidade de
ajustamento para volume em relação aos preços é suficiente para causar o efeito
curva J na balança comercial.
Entre os possíveis fatores causadores de tal rigidez, Junz e Rhomberg (1973)
identificam uma defasagem de reconhecimento, onde os agentes demoram a
perceber a mudança no ambiente de competição. Após a percepção da nova
situação, existe uma defasagem de decisão, que dura do momento no qual a nova
situação foi reconhecida até o momento da ação, onde os produtores precisam ser
convencidos de que a nova situação será duradoura e rentável o suficiente para
compensar os esforços e custos de aumentar a capacidade produtiva ou
transferência de recursos. Finalmente, existe uma defasagem na produção e entrega
de mercadorias cujos preços relativos foram alterados, de forma que mesmo ordens
de compra emitidas logo antes da desvalorização só irão afetar o volume de
comércio após seu pagamento. Mas o pagamento, normalmente, só ocorre após a
produção e o embarque da mercadoria no porto, o que demanda tempo, devido a
dificuldades técnicas e logísticas.
Estas explicações tradicionais para a curva J têm sido criticadas. O
argumento usado é de que maior velocidade no ajustamento de preços em relação
às quantidades não é o único motivo para que, após uma depreciação cambial,
tenha-se a deterioração da balança comercial no curto prazo. Tais efeitos também
ocorrem na presença de preços viscosos e quantidades livres para se ajustar. Dessa
maneira, o fenômeno da curva J não necessariamente implica um rápido pass
through. Se os preços dos bens importados são viscosos, os consumidores irão
23
antecipar o aumento futuro destes, revisando suas compras futuras, o que pode
levar a uma dinâmica em J para a balança comercial. É nesse contexto que Gerlach
(1989) distingue entre o efeito preço relativo e o efeito de realocação intertemporal.
Ele enfatiza que preços mais altos em moeda local de bens importados tendem a
melhorar a balança comercial, porém, se os preços são viscosos, os consumidores
terão incentivos para antecipar suas compras futuras de bens importados, o que
tende a piorar a balança comercial.
Mansoorian (1998) mostra que a deterioração inicial da balança comercial em
conseqüência de uma depreciação do câmbio pode ser atribuída à persistência nos
hábitos de consumo. Também neste caso, os efeitos de substituição intertemporal,
além de outros fenômenos de sobreposição, podem afetar os preços e os fluxos de
comércio.
Outra explicação para os efeitos de curto prazo na balança comercial é a
teoria da histerese, como mostrado por Dixit (1994) e Teles (2003). Como operações
de importação e exportação geram custos irrecuperáveis, os agentes econômicos
valorizam a oportunidade de esperar e ver se a variação cambial é apenas
passageira. Se este for o caso, os agentes evitam os custos irrecuperáveis. De fato,
o incentivo para que se iniciem ou encerrem negócios internacionais ocorre somente
se a variação cambial excede um certo limite. Neste caso, as defasagens de
ajustamento não são definidas com relação ao tempo, mas sim em termos de um
estado econômico representado pela distância entre a taxa de câmbio corrente e a
que faz os agentes reagirem.
Sem recorrer a argumentos de rigidez de preços, Backus et. al. (1994) usa um
modelo de ciclos reais de negócios com dois países para explicar os movimentos no
saldo da balança comercial em resposta a variações cambiais. Neste modelo, um
choque positivo de produtividade, inicialmente, gera um aumento da importação de
bens de investimento, causando um déficit na balança comercial. Porém, quando o
estoque de capital torna-se condizente com o novo nível de produtividade, o “boom”
das importações é dissipado e a balança comercial passa a ser superavitária. O
padrão da função impulso resposta para a economia teórica mostra um efeito
contemporâneo negativo para a correlação entre os termos de troca e a balança
comercial. Esta correlação tende a aumentar com o tempo, gerando uma função de
correlação cruzada similar a um S deitado, sendo chamada pelos autores de curva
24
S. Este padrão é justificado com base na influência da formação de capital na
balança comercial.
A teoria da curva J tem sido alvo de vários estudos empíricos, alguns dos quais
confirmaram a presença de defasagens de ajustamento na balança comercial após
uma depreciação cambial, como por exemplo, Bahmani-Oskooee (1985), Moffet
(1989) e Onafowora (2003), enquanto outros, como por exemplo Rose e Yellen
(1989) e Hsing e Savvides (1996), rejeitaram a hipótese de curva J. Estes estudos
podem ser classificados em dois grupos. No primeiro grupo o fenômeno da curva J é
analisado em um modelo de dois países, sendo um o país local e o outro o resto do
mundo, como em Felmingham (1988). No segundo grupo o fluxo de comércio
bilateral entre grandes parceiros comerciais é levado em conta para a análise, como
em Bahmani-Oskooee e Brooks (1999).
Como uma moeda pode, simultaneamente, apreciar em relação à outra
moeda e depreciar com respeito à uma terceira, a abordagem de comércio bilateral
é usada para evitar erros de interpretação devido a este fato. Porém, a curva J é um
fenômeno agregado e não apenas bilateral, de forma que o uso de dados agregados
em um modelo de dois países também parece justificado.
Bahmani-Oskooee e Alse (1994) fazem uma análise de cointegração para a
taxa de câmbio, renda local, renda externa e balança comercial bilateral para 41
países, entre eles o Brasil. Eles encontram evidência de cointegração para estas
variáveis usando a metodologia de Engle e Granger, estimam um modelo de
correção de erros linear e, além disso, não utilizam funções impulso resposta.
Teles (2003) faz uma análise do equilíbrio externo da economia brasileira
usando a abordagem de histerese introduzida por Dixit (1994). Neste contexto, ele
conclui que uma política de juros altos afeta negativamente a decisão da firma
doméstica de entrar no mercado externo, pois aumenta o nível da taxa de câmbio a
partir do qual a firma passa a agir. Outra conclusão é que a mudança do regime de
câmbio fixo para câmbio flutuante também alterou o limite da taxa de câmbio a partir
do qual a firma entra no mercado externo. A mudança de regime alterou os
parâmetros do processo estocástico ao qual a taxa de câmbio está sujeita, como a
tendência e a variância. Dessa forma, não só a taxa de câmbio esperada mudou,
mas também sua variância esperada. Portanto, a política monetária, bem como a
política cambial, afetam a defasagem descrita pela curva J.
25
Capítulo 2 Metodologia
2.1 Raízes Unitárias
Os resultados assintóticos usuais não são aplicáveis se algumas variáveis do
modelo de regressão são não estacionárias. No caso do modelo de regressão linear
UXY +=
β
, os resultados usuais dependem da hipótese de que XXn ´
1
tenda para
uma matriz positiva definida finita, quando n tende para infinito. Quando esta
hipótese é violada pode-se ter regressões espúrias, ou seja, obter estimativas
significativas de relações entre variáveis totalmente não relacionadas. Este é um
problema prático sério, pois grande parte das séries de tempo macroeconômicas
aumentam ao longo do tempo e, portanto, violam esta hipótese (ver Nelson e
Plosser (1982)).
Duas formas de evitar que esta hipótese seja violada são retirar a tendência
da série ou diferenciá-la. Mas estas são duas operações distintas. Se a primeira é
apropriada, a segunda não será e vice-versa. Retirar a tendência da série de tempo
t
y será apropriado quando o processo gerador dos dados puder ser descrito como
tt
ty ++=
10
γ
γ
. Onde t é a tendência de tempo e
t
z segue um processo ARMA
estacionário. Por outro lado, diferenciar a série é apropriado quando o processo
gerador dos dados puder ser descrito por
ttt
zyy
+
+
=
11
γ
. Onde, novamente,
t
z
segue um processo ARMA estacionário.
A escolha entre diferenciar e retirar a tendência de uma série é a escolha
entre estes dois modelos. As principais formas para esta escolha são os testes de
raiz unitária.
Representação de uma série de tempo com e sem raiz unitária
Pode ser útil pensar uma série de tempo macroeconômica
t
y como a soma
de vários componentes com propriedades diferentes.
ttt
zTDy += (2.1.1)
26
Aqui
t
TD é uma função que descreve a tendência determinística de
t
y e
t
z é
uma função ruído ou componente estocástico de
t
y . A hipótese de raiz unitária diz
respeito ao comportamento da função ruído, mas a especificação da tendência
determinística é crucial para os testes de raiz unitária. Em princípio, uma grande
variedade de especificações são possíveis, mas normalmente postula-se que
t
TD é
linear no tempo, isto é:
tkTD
t
δ
+= (2.1.2)
De forma a simplificar a exposição, assume-se que a função ruído pode ser
descrita por um processo autoregressivo com médias móveis.
()
(
)
tt
eLBzLA = (2.1.3)
Onde
()
LA e
()
LB são polinômios no operador de defasagem L, de ordem p e
q respectivamente, e
t
e é uma seqüência de inovações i.i.d.. A função ruído tem
média zero, uma vez que a tendência determinística inclui a média da série no termo
k. Outra hipótese é de que as raízes do polinômio de médias móveis estão
estritamente fora do círculo unitário. A equação (2.1.3) resume a dinâmica
univariada do processo
t
z . Aqui o sistema (2.1.1)-(2.1.3) será chamado de processo
gerador dos dados (PGD), mesmo que ele só resuma as implicações univariadas de
um sistema multivariado mais completo.
Pode-se agora distinguir dois modelos alternativos para
t
y . No modelo
tendência-estacionário, as raízes do polinômio autoregressivo estão estritamente
fora do círculo unitário, de forma que
t
z é um processo estacionário e
t
y é
estacionário em torno de uma tendência. No modelo diferença-estacionário,
t
z tem
uma raiz unitária autoregressiva e todas as outras raízes estão estritamente fora do
círculo unitário. Neste caso,
(
)
tt
zLz
1 é um processo estacionário e
t
y
é
estacionária em torno de uma média fixa. A hipótese de raiz unitária é que
t
y seja
um processo diferença-estacionário. Os modelos tendência-estacionário e diferença-
estacionário são comumente chamados de modelos integrados de ordem zero e de
ordem um, respectivamente.
Para entender o significado da hipótese de raiz unitária, é útil decompor a
função ruído
t
z em um componente cíclico
t
c e uma tendência estocástica
t
TS . O
27
componente cíclico é, por hipótese, um processo estacionário de média zero, de
forma que choques em
t
c não têm efeito de longo prazo no nível de
t
y . A tendência
estocástica incorpora todos os choques que têm efeitos permanentes sobre o nível
de
t
y . A soma da tendência determinística
t
TD com a tendência estocástica
t
TS é a
tendência total da série. É comum em macroeconomia empírica tentar isolar o
componente cíclico
t
c , subtraindo de
t
y as tendências
t
TD e
t
TS .
Nos modelos tendência-estacionário, a decomposição de
t
z em tendência
estocástica e ciclo é trivial, uma vez que
t
z é estacionário por hipótese, de forma
que ele já satisfaz as condições para o ciclo
t
c . Neste caso, a tendência estocástica
t
TS é zero e o ciclo é igual ao ruído
t
z . No modelo diferença-estacionário, a
decomposição é um pouco mais complicada. Quando o polinômio
()
LA em (3)
possui uma raiz unitária, pode-se escrever
(
)
(
)
(
)
LALLA
*
1= , onde
()
LA
*
tem raízes
fora do círculo unitário. A primeira diferença
t
z
segue um processo ARMA
estacionário
() ()
tt
eLBzLA =
*
. Seguindo Beveridge e Nelson (1981), pode-se
construir a seguinte decomposição. Seja
(
)
(
)
(
)
LBLAL
1
*
=
ψ
a representação de
médias móveis da primeira diferença de
t
z . A notação
(
)
1
ψ
denota a soma dos
coeficientes de média móvel. Define-se
() ( ) () ()
1
*
11LLL
ψψψ
=−
, de forma que
t
z satisfaz
() ( )
(
)
*
11
tt
zLLe
ψψ
⎡⎤
∆= +
⎣⎦
. Então, multiplicando os dois lados por
()
1
1 L
, pode-se escrever:
()
()
()
*
1
1
t
tt
e
zLe
L
ψψ
=+
Mas
()
1
t
e
L
é uma progressão geométrica. Supondo que o processo se
iniciou em
1
e , obtém-se:
()
1
1
t
t
jt
j
e
es
L
=
==
Então:
() ( )
*
1
tt t
zsLe
ψψ
=+ (2.1.4)
28
Onde
t
s é um passeio aleatório de média zero. Aqui a função de tendência
para a variável
t
y contém não somente a tendência determinística
t
TD , mas
também o componente estocástico de
t
z ,
(
)
tt
sTS 1
ψ
=
que afeta o intercepto da
tendência em cada período. Esta tendência estocástica é obtida através da soma
dos coeficientes de médias móveis de
t
z
, que é equivalente ao efeito de longo
prazo de um choque unitário em
t
e sobre o nível de
t
z . O ruído ou componente
cíclico é
()
tt
eLc
*
ψ
= , construído de forma a não ter efeito de longo prazo em
t
z .
A decomposição (2.1.4) pode ser usada para desenvolver uma medida da
importância da tendência estocástica
t
TS para o comportamento da série
t
y .
Campbell e Mankiw (1987) propuseram que o coeficiente
()
1
ψ
é uma medida
natural da persistência da série, porque ele é a razão entre o efeito de longo prazo e
o efeito imediato de uma inovação
t
e . Quando
(
)
11 >
ψ
, o efeito de longo prazo de
um choque univariado em
t
y é maior que o efeito imediato; quando
()
11
<
ψ
, por
outro lado, o choque tende a diminuir. O modelo de passeio aleatório tem
(
)
11
=
ψ
,
enquanto o modelo tendência-estacionário é o caso limite onde
()
01 =
ψ
.
Os processos tendência-estacionário e diferença-estacionário descritos acima
podem ser considerados modelos na forma reduzida. É possível derivar estes
processos como formas reduzidas de modelos estruturais com componentes não
observáveis, como em Harvey (1985). Considere, por exemplo, um modelo de
componentes não observáveis que representa
t
y como a soma de um passeio
aleatório com drift e um processo estocástico independente. Quando a inovação do
passeio aleatório é zero,
t
y é tendência-estacionário. Generalizando, a forma
reduzida deste modelo é um processo diferença-estacionário com restrições, como
em Clark (1987) e Watson (1986). De especial relevância é a restrição de
(
)
1
ψ
em
(2.1.4) ser menor que um, isto é, que o efeito de longo prazo das inovações não seja
maior que o efeito imediato.
Ultimamente, vários modelos estruturais não lineares foram propostos. Estes
levam a formas reduzidas não lineares ao invés de formas reduzidas lineares
tendência-estacionária e diferença-estacionária. Estes modelos tentam capturar a
idéia de que dois tipos fundamentais de choques estão presentes. Os grandes
29
choques ocorrem com menor freqüência e afetam a função tendência da série de
forma permanente. Já os choques regulares ocorrem todos os períodos e podem ou
não afetar o nível da série permanentemente. Neste caso, o problema da raiz
unitária é saber se os choques regulares têm efeitos permanentes sobre a série.
Uma classe destes modelos foi proposta por Hamilton (1989). O seu modelo
estrutural faz com que
t
y seja a soma de uma função tendência não linear e um
processo ARIMA linear com raiz no círculo unitário. A função tendência é um
passeio aleatório com drift, que muda de valores altos para baixos de acordo com
um processo de Markov de primeira ordem.
Perron (1989) sugeriu que uma estrutura de série de tempo com mudanças
infrequentes na inclinação pode ser uma boa aproximação em aplicações empíricas.
Na verdade, uma única alteração na inclinação pode ser suficiente para caracterizar
muitas séries de interesse. Restringir o número de mudanças na inclinação a priori,
é uma solução para as dificuldades técnicas dos testes de raiz unitária na estrutura
proposta por Hamilton. Desta forma, pode-se obter testes válidos assintóticamente
da hipótese nula de que a parte linear do processo contém uma raiz unitária. Nesta
estrutura restritiva, mas útil empiricamente, a forma reduzida das séries é descrita
por (2.1.1) com componente determinístico dado por:
()
(
)
01
.1
tBB
TD k t t T t T
δδ
=+ + > ,
onde
()
1. é a função indicador e
B
T é o momento da alteração na inclinação. Se
t
z
contém uma raiz unitária, a função tendência também contém um componente
estocástico, de forma análoga aos processos diferença-estacionários usuais.
Um modelo similar pode ser derivado para uma série com mudanças
infrequentes no intercepto. Neste caso, é possível testar a hipótese nula de raiz
unitária através da especificação do componente determinístico da função tendência
como:
()
01
.1
tB
TD k k t T=+ > (2.1.5)
Logo, os modelos reduzidos descritos por Perron (1989) podem ser vistos
como aproximações dos modelos estruturais onde mudanças infrequentes no
intercepto ou na inclinação são modelados estocasticamente como em Hamilton
(1989). A hipótese implícita é de que, dado o conjunto de dados de interesse, existe
30
apenas um grande choque. Porém, se os dados forem relativos a um período muito
longo, pode ser necessário mais de uma mudança.
Porém, a teoria da distribuição assintótica por trás dos valores críticos obtidos
por Perron (1989) depende da hipótese de que a data da mudança no intercepto ou
na inclinação da série é conhecida a priori. Christiano (1992) argumenta que a
escolha das datas das quebras estruturais é quase sempre correlacionada com os
dados. Este é um problema importante, pois tanto a distribuição de amostra finita
das estatísticas de teste, quanto a assintótica, dependem do grau de correlação
entre a data da quebra e os dados.
Para solucionar este problema, Perron (1997) propõe um teste que escolhe o
ponto de quebra estrutural de forma que a estatística t para testar a hipótese nula de
raiz unitária seja a menor possível. Dessa forma, a escolha do ponto de quebra é
perfeitamente correlacionada com os dados. Perron (1997) argumenta que se for
possível rejeitar a hipótese nula neste contexto, será possível rejeita-la também
quando a correlação for menor que um. Através de experimentos de Monte Carlo e
comparações com os resultados obtidos em Perron (1989), ele conclui que os
resultados de seu trabalho anterior são robustos. Perron (1997) mostra que os
valores críticos baseados na hipótese na hipótese de nenhuma correlação entre a
data da quebra e os dados, pode ser uma boa aproximação para os valores críticos
reais. Porém, cada pesquisador pode diferir em relação à quantidade de informação
a priori que deseja usar. Parece existir um trade-off entre poder do teste e
quantidade de informação a priori a respeito da escolha do ponto de quebra que se
deseja utilizar. Um procedimento que não impõe informações a priori tem poder
relativamente baixo.
Testando a presença de uma raiz unitária.
Considerando primeiramente o caso mais simples, onde o componente de
ruído
t
z (que é a série
t
y menos a tendência determinística) é um processo AR(1),
isto é,
ttt
ezz +=
1
φ
. Este processo pode ser descrito como:
ttt
ezz +=
1
π
(2.1.6)
Onde
1=
φ
π
. Aqui a hipótese de raiz unitária é dada por 0=
π
, enquanto
tendência-estacionariedade implica 0
<
π
.
31
Ao testar a hipótese de raiz unitária, é importante distinguir entre o processo
gerador dos dados e a equação de regressão usada no teste.
Seja
t
DV o conjunto de variáveis que aparecem na tendência determinística
do PGD. Na maioria das aplicações
{
}
1
=
t
DV , uma constante, ou
{
}
tDV
t
,1
=
,
permitindo um polinômio de 1
a
ordem em t. Entretanto,
t
DV pode ser mais
complicado; por exemplo, o modelo estrutural não linear com mudança
determinística no intercepto na data
B
T tem
(
)
{
}
Bt
TttDV
=
1,,1 . Como o interesse é a
função ruído, uma estratégia natural é primeiro retirar a tendência da série e analisar
o componente dos resíduos estimados. Usa-se a notação
~
y para os resíduos da
projeção de
t
y em um conjunto de regressores determinísticos
t
DR . A hipótese de
raiz unitária pode ser testada através da estimação do par de regressões:
~
´ yDRy
tt
+=
τ
ttt
uyy +=
~
1
~
π
(2.1.7)
Usa-se então a estatística t para testar 0
=
π
, denotada
^
π
t . A escolha natural
para o conjunto de regressores
t
DR é o conjunto de variáveis
t
DV que aparecem na
tendência determinística do PGD.
Quando a tendência determinística é linear no tempo (
{}
tDV
t
,1= ou
{
}
1
=
t
DV )
este procedimento de dois estágios é assintoticamente equivalente ao procedimento
de um estágio, onde os regressores determinísticos
*
t
DR são incluídos na seguinte
autoregressão:
tttt
uyDRy ++=
1
*
'
πτ
(2.1.8)
Onde
tt
DRDR =
*
. O conjunto de regressores
*
t
DR deve incluir todos os
elementos
t
DR para que a equivalência assintótica valha. Em particular, se
{}
tDRDV
tt
,1== , o procedimento dois estágios será equivalente ao procedimento
um estágio somente se
*
t
DR incluir a tendência t. O coeficiente desta variável é
δ
π
, que será igual a zero sob H0, mas diferente de zero sob H1 de que
t
y é
tendência-estacionária. Logo, a tendência t deve ser incluída de forma a permitir que
a equação (2.1.8) englobe tanto a hipótese nula quanto a alternativa.
32
Quando a função tendência determinística
t
TD é não linear, a relação entre o
procedimento dois estágios de (2.1.7) e o procedimento um estágio de (2.1.8) é mais
complicada. No caso de tendência com uma única mudança no intercepto, como
descrito em (2.1.5), onde
(
)
{
}
Bt
TttDV
=
1,,1 , o procedimento em dois estágios com
tt
DVDR = será equivalente ao procedimento um estágio somente se
()
(){}
t
BBt
TDTttDR ,1,,1
*
= , onde
(
)
t
B
TD é um para 1
+
=
B
Tt e zero nos outros casos.
O regressor extra
()
t
B
TD deve ser incluído para que o procedimento em um estágio
englobe adequadamente as hipóteses nula e alternativa do teste, porém não é
necessário no procedimento dois estágios. No caso de tendência com uma alteração
na inclinação, o procedimento dois estágios e um estágio podem não ser
equivalentes nem assintoticamente.
Uma vez determinados os regressores determinísticos, pode-se testar as
implicações da hipótese de raiz unitária para as regressões (2.1.7) e (2.1.8).
Um ponto importante a se notar é que a distribuição assintótica de
^
π
t ,sob a
hipótese nula de raiz unitária, é não normal e depende dos elementos incluídos no
conjunto de regressores determinísticos.
A razão básica para a dependência da distribuição assintótica sob a hipótese
nula nos regressores determinísticos incluídos é o fato de que a função tendência
especificada precisa ser estimada. Se os verdadeiros coeficientes da tendência do
PGD fossem conhecidos, somente um conjunto de valores críticos seria necessários,
o conjunto para
φ
=
t
DR . Os valores críticos tabelados também revelam importantes
implicações para o poder dos testes de raiz unitária, ou seja, para a probabilidade do
teste rejeitar a hipótese de raiz unitária quando a hipoótese alternativa de tendência-
estacionariedade é verdadeira. Pois, sob H0 de raiz unitária, os valores críticos da
cauda esquerda da distribuição assintótica de
^
π
t aumenta, em valor absoluto, com o
número de regressores determinísticos incluídos.
A situação é outra quando o conjunto de regressores determinísticos incluídos
não contém todos os componentes da tendência determinística do PGD. Suponha
que
t
DR omita uma variável de
t
DV que esteja crescendo a uma taxa pelo menos
tão rápida quanto qualquer outro elemento de
t
DR . Então, sob H0 de raiz unitária, a
33
estatística
^
π
t em (2.1.7) pode ser normalizada de tal forma que sua distribuição
assintótica seja normal.
Este é o caso onde uma tendência linear diferente de zero está presente no
PGD, mas não está contida no conjunto de regressores determinísticos
t
DR . É
também o caso onde o PGD contém um polinômio de tendência de ordem maior que
os contidos em
t
DR .
Porém, é preciso cuidado ao interpretar esta afirmação. Ela parece sugerir
que pode-se aumentar o poder do teste de raiz unitária omitindo-se certos
regressores determinísticos que estão presentes no PGD. Se a estatística t for
usada para testar 0=
π
em uma regressão sem tendência no caso onde o PGD é
um passeio aleatório com “drift”, a distribuição assintótica da estatística de teste é
normal e os valores críticos são menores ,em valor absoluto, que os valores críticos
obtidos quando a tendência é incluída como regressor. Entretanto, a distribuição
para amostras finitas de
^
π
t não é invariante aos valores do parâmetro de tendência
e, para valores pequenos deste parâmetro, a aproximação pela normal pode não ser
válida. Além disso, este procedimento leva a testes onde o poder vai para zero
quando a amostra cresce para infinito. Esta é uma forma extrema de inconsistência,
sendo teste inconsistente definido como aquele cujo poder em relação a uma
hipótese alternativa fixa, não vai para um quando a amostra vai para infinito.
No caso onde o PGD é tendência estacionário ao longo da função tendência
determinística
tkTD
tt
δ
+= ; e somente uma constante é incluída como regressor. Ao
aplicar a regressão
ttt
uycy
+
+=
1
π
, a única maneira de considerar a tendência é
fazendo
0=
π
. De forma similar, se o PGD especifica uma função tendência com
mudança no coeficiente de inclinação, o teste de raiz unitário usando somente uma
constante e uma tendência determinística como regressores irá gerar um teste
inconsistente. Já se o PGD especifica uma alteração no intercepto da função
tendência em alguma data e não for incluído um regressor para captar esta quebra,
o poder do teste irá decrescer à medida que a magnitude da mudança aumenta.
Portanto, percebe-se a importância da inclusão de tantos regressores
determinísticos quanto forem os componentes da função tendência do PGD. Porém,
é desejável que não se inclua regressores determinísticos em excesso.
34
Suponha que
^
π
t é construída usando um conjunto de regressores
determinísticos
t
DR , que inclua pelo menos todos os componentes determinísticos
do PGD. O poder do teste de raiz unitária contra a hipótese alternativa de
estacionariedade decresce à medida que novos regressores determinísticos são
incluídos.
A afirmação acima é parcialmente justificada pela afirmação já feita de que os
valores críticos aumentam, em valor absoluto, com o número de regressores
determinísticos incluídos. Entretanto, em amostras finitas, existe um viés para baixo
na estimativa de
π
e o viés cresce à medida que o número de regressores
determinísticos não contidos no PGD aumenta.
A discussão acima sugere que deve-se ficar atento para a escolha dos
regressores determinísticos a incluir, de forma a obter-se propriedades de poder
razoáveis. Quando não é claro qual é o conjunto de regressores determinísticos
adequado, uma seqüência de testes pode ser útil. Em Perron (1988), é discutida
uma estratégia de teste seqüencial para os casos onde a função tendência do PGD
contém nenhum componente, uma constante ou uma constante e tendência.
Argumenta-se que a estratégia de teste deve iniciar na especificação mais geral da
tendência e continuar na direção de especificações mais restritivas.
A má especificação dos componentes determinísticos incluídos como
regressores no teste de raiz unitária, pode levar a não rejeição da hipótese nula
quando esta é falsa.
Tamanho e período da amostra.
Muitas vezes, se obtém vários conjuntos de dados para a mesma série de
tempo. Isto ocorre, principalmente, quando os dados são disponíveis em freqüências
amostrais diferentes. Normalmente, uma série anual terá menos observações que
uma série trimestral, que por sua vez, terá menos observações que uma série
mensal. Porém, as séries anuais costumam cobrir um período maior que as séries
trimestrais e estas últimas cobrem um período maior que as séries mensais. É
35
natural perguntar qual conjunto de dados permite maior poder. Um número maior de
observações é melhor em termos de poder?
Os testes de raiz unitária contra a alternativa estacionária dependem muito
pouco do número de observações em si, mas sim do período coberto pelos dados.
Para um dado número de observações, o poder é maior quanto maior for o período.
Para um dado período, observações adicionais usando dados mais freqüentes leva
a um acréscimo apenas marginal no poder. Na maioria das aplicações de interesse,
um conjunto de dados contendo dados anuais de um longo período levará a testes
com maior poder do que usando mais observações por um período mais curto.
Porém, dados históricos muito longos podem ter qualidade questionada
devido às antigas metodologias de construção das estatísticas. Além disso, uma
amostra grande aumenta a chance de que a série de interesse tenha quebras
estruturais de grande porte. A presença de uma quebra desse tipo irá viesar o teste
em favor da hipótese de raiz unitária.
Extensão para processos com correlação serial.
No caso onde a função ruído
t
z obedece um processo ARMA(p,q) como em
(2.1.3), ao invés de um AR(1) como em (2.1.6), os pontos levantados anteriormente
continuam válidos, porém novos tópicos aparecem. A distribuição assintótica da
estatística
^
π
t nas autoregressões de primeira ordem como em (2.1.7) e (2.1.8)
depende da estrutura de correlação dos dados. Portanto, modificações são
necessárias para livrar-se desta dependência incômoda.
Dickey e Fuller (1979) e Said e Dickey (1984) fazem uma correção
paramétrica motivada no caso de um processo AR(p). Neste caso, pode-se escrever
1
1
1
p
tt jtj
j
zz z
πγ
−−
=
∆= +
, onde
1
1
p
i
i
a
π
=
=
é a diferença entre a soma dos coeficientes
autoregressivos e um, enquanto
1
p
ji
ij
a
γ
=+
=−
. Como antes, o componente de ruído
t
z
tem raiz unitária se 0=
π
. A regressão (estimada por mínimos quadrados) é então:
~
'
ttt
yDRy
τ
=+ ;
~~ ~
1
1
k
tt jtj
j
yy y
πγ
=
∆= +
(2.1.9)
ou
36
*
1
1
'
k
tttjtjt
j
yDRy yu
τπ γ
−−
=
∆= + + +
(2.1.10)
Onde k=p-1. Aqui
t
DR e
*
t
DR também são vetores de regressores
determinísticos. No caso de um AR(p) puro, a distribuição assintótica de
^
π
t obtida de
(2.1.9) e (2.1.10) é a mesma obtida para o caso do AR(1). No caso mais geral, onde
o componente de ruído é um ARMA(p,q), Said e Dickey (1984) sugerem que o
processo pode ser aproximado por um processo autoregressivo de maior ordem.
Neste caso, as regressões (2.1.9) e (2.1.10) continuam apropriadas. A condição
técnica para que tal procedimento continue assintóticamente válido é que a ordem
da autoregressão estimada, k, cresça a uma taxa razoável quando a amostra vai
para infinito.
Na prática, a escolha do parâmetro de defasagem para a truncagem é
importante. Primeiro, mesmo no caso do AR(p) puro, a ordem p é normalmente
desconhecida. No caso mais geral do ARMA(p,q), as condições assintóticas teóricas
para a validade do procedimento não são informativas o suficiente para guiar a
escolha em amostras finitas. Este problema é importante porque o resultado do teste
depende da escolha do parâmetro de truncagem das defasagens. Vários fatores
podem explicar essa sensibilidade. Primeiro, poucas defasagens podem afetar
negativamente o tamanho do teste. Segundo, a introdução de muitas defasagens
reduz o poder, pois mais parâmetros devem ser estimados com o mesmo número de
observações. Finalmente, quando k se altera, as condições iniciais também se
alteram. Este último fator é de grande importância, dada a não invariância da função
de poder da estatística do teste às condições iniciais, como discutido em DeJong,
Nankervis, Savin, e Whiteman (1990). Estes fatores mostram a importância de se
escolher o parâmetro de truncagem das defasagens com bom senso.
A escolha de um k fixo, escolhido independentemente dos dados,
provavelmente, será inadequada. Existem evidências de que um método para a
seleção do parâmetro de defasagens do teste que seja dependente dos dados leva
a estatísticas com melhores propriedades de tamanho e poder (ver Ng e Perron
(1995), Perron e Vogelsang (1992) e Hall (1994))
Existem alguns procedimentos para a escolha de k que são dependentes dos
dados. Qualquer procedimento que escolha a ordem autoregressiva
assintóticamente, por exemplo, usando o critério de informação de Akaike ou um
37
teste F sobre a significância conjunta das defasagens adicionais será adequado. É
importante, porém, notar que o método de seleção deve partir do modelo geral para
o específico.
Uma outra alternativa para lidar com o problema da correlação serial no
processo de ruído
t
z foi proposta por Phillips (1987) e Phillips e Perron (1988). Esta
abordagem consiste em adicionar à estatística do teste de raiz unitária original, um
fator de correção que elimina a dependência de sua distribuição assintótica na
correlação serial de
t
z . A correção utiliza uma estimativa não paramétrica da
densidade espectral de
t
z à freqüência zero, medida em relação à variância
amostral de
t
z . Esta estimativa não paramétrica é uma soma ponderada da
autocovariância de
t
z , onde os pesos são escolhidos de tal forma que a densidade
espectral é positiva por construção.
Esta estatística de teste é facilmente implementada e assintóticamente válida
sob condições muito gerais. Porém, estudos e simulações como Schwert (1989) e
Phillips e Perron (1988) mostraram que ela tem sérios problemas de distorção e
tamanho em amostras finitas quando o PGD tem uma predominância de
autocorrelação negativa na primeira diferença. Isto sugere que o teste de Phillips e
Perron pode ser menos confiável que a metodologia de Dickey e Fuller, onde uma
correção paramétrica é usada. Um ponto importante, que dá alguma esperança para
esta classe de estatísticas é que resultados de simulação também sugerem que o
tamanho, ajustado ao poder, delas é bem maior que o da estatística de Dickey e
Fuller.
Abordagens alternativas
Grande parte da literatura existente se preocupa com as propriedades dos
coeficientes e da estatística t em autoregressões para a variável
t
y . Alguns autores,
entretanto, exploram as implicações de modelos de raiz unitária em comparação
com modelos tendência-estacionários através da observação do comportamento
assintótico das séries de tempo em questão.
Suponha que o PGD não contenha componente determinístico, de forma que
tt
yz= seja um modelo ARMA(p,q) com média zero. Se
t
y contém raiz unitária, sob
38
condições gerais, tem-se que
1/2
T
Ty
converge para um movimento browniano. Sob
a hipótese de que
t
y não contém raiz unitária,
1/2
t
Ty
converge para zero. Stock
(1990) usou esta idéia para desenvolver uma classe de testes estatísticos da
hipótese nula de raiz unitária. Simulações sugerem que o problema de tamanho é
aliviado, enquanto o poder deste teste é maior que o da maioria das estatísticas
disponíveis.
2.2 Cointegração
Um vetor de séries de tempo y
t
é dito cointegrado se todas as série individuais
são I(1), ou seja, não estacionárias com uma raiz unitária, enquanto uma
combinação linear das séries
t
Ya' é estacionária, ou I(0), para algum vetor não nulo
a.
Cointegração significa que apesar de muitos acontecimentos causarem
alterações permanentes em y
t
, existe uma relação de equilíbrio de longo prazo
unindo seus componentes individuais, representada pela combinação
t
Ya' . Um
exemplo de tal sistema é o modelo de gastos com consumo proposto por Davidson,
Hendry, Srba e Yeo (1978). O resultado deste estudo sugere que apesar do
consumo e da renda serem processos não estacionários, no longo prazo, o consumo
tende a ser uma porção constante da renda, de forma que a diferença entre o
logaritmo do consumo e da renda é constante ao longo do tempo.
A análise de cointegração formal introduzida por Engle e Granger (1987)
começa por considerar um conjunto de variáveis econômicas em equilíbrio de longo
prazo, quando:
0...
2211
=+++
ntntt
yyy
β
β
β
(2.2.1)
Em notação vetorial, o sistema está em equilíbrio de longo prazo quando
0=
t
y
β
. O desvio do equilíbrio de longo prazo, chamado de erro de equilíbrio e
denotado por e
t
é tal que:
tt
ye
β
= (2.2.2)
Se a relação de equilíbrio faz sentido, os desvios do equilíbrio devem ser
estacionários. Engle e Granger (1987) dão a seguinte definição de cointegração.
39
Os componentes do vetor
(
)
',...,,
21 ntttt
yyyy
=
são ditos cointegrados de ordem
d, b, denotado por
()
bdCIy
t
,~ se:
1. Todos os componentes de y
t
são integrados de ordem d.
2. Existe um vetor
(
)
n
β
β
β
β
,...,,
21
=
tal que a combinação linear
ntnttt
yyyy
β
β
β
β
++
+
= ...
2211
é integrada de ordem (d-b), onde b>0.
O vetor
β
é dito vetor de cointegração.
Se o vetor y
t
é cointegrado, então não é correto ajustar um VAR com os
dados diferenciados. Suponha o seguinte exemplo de um vetor cointegrado:
ttt
ttt
uyy
uyy
2122
121
+=
+=
γ
(2.2.3)
(2.2.4)
onde u
1t
e u
2t
são ruídos brancos não correlacionados. A representação univariada
de y
2t
é um passeio aleatório:
tt
uy
22
= (2.2.5)
enquanto diferenciando (2.2.3), temos:
1112121
+=
+
=
tttttt
uuuuyy
γ
γ
(2.2.6)
Reescrevendo (2.2.6), temos:
() ( )
(
)
tttttttt
LLuuu
21121111112
1
ε
γ
ε
γε
ε
ε
γ
+
=
=+
onde
tt
u
22
=
ε
é o erro de previsão de y
2t
com base em valores passados de y
1t
e y
2t
,
e
ttt
uu
121
+=
γ
ε
é o erro de previsão de y
1t
.
Substituindo este resultado em (2.2.6) e formando um vetor com (2.2.5),
obtém-se a representação VARMA de
(
)
',
21 tt
yy
:
()
Ψ=
t
t
t
t
L
y
y
2
1
2
1
ε
ε
(2.2.7)
onde
()
=Ψ
10
1 LL
L
γ
(2.2.8)
O VAR para os dados diferenciados, se existisse, seria:
()
tt
YL
ε
=Φ (2.2.9)
onde
() ()
[]
1
Ψ=Φ LL . Mas a matriz polinomial associada com a representação VMA
para este processo,
()
LΨ , tem uma raiz unitária:
40
()
0
10
1
=
=Ψ
LL
L
γ
(2.2.10)
Isto faz com que a matriz do operador de média móvel seja não invertível, de
forma que nenhum VAR de ordem finita pode descrever
t
Y
.
A razão pela a qual o VAR em diferenças não é uma boa aproximação para o
sistema cointegrado contido em (2.2.3) e (2.2.4) é que y
2t
em nível contém
informações relevantes para a previsão de y
1t,
e que são descartadas ao se
diferenciar y
2t
.
Ao se modificar o VAR de forma a incluir defasagens das variáveis em nível, é
fácil de encontrar uma representação estacionária similar a um VAR para
t
Y
.
Lembrando que
2,21,111
=
ttt
yyu
γ
, note que podemos reescrever (2.2.5) e (2.2.6) de
forma a obtermos:
+
+
=
t
tt
t
t
t
t
u
uu
y
y
y
y
2
11,2
1,2
1,1
2
1
00
1
γ
γ
(2.2.11)
O sistema em (2.2.11) ilustra o fato de que em um sistema cointegrado,
devemos incluir valores defasados das variáveis em nível no VAR explicando
t
Y
.
As defasagens em nível devem aparecer na forma das combinações lineares de Y
t
que são estacionárias.
Uma característica de variáveis cointegradas é que suas trajetórias ao longo
do tempo são influenciadas pelos desvios do equilíbrio de longo prazo. Logo, a
dinâmica de curto prazo deve ser influenciada pelos desvios da relação de equilíbrio
de longo prazo.
Formalmente, o vetor
(
)
',...,,
21 ntttt
yyyY
=
tem uma representação de correção
de erros se pode ser expresso na forma:
tptptttt
yyyyy
ε
π
π
π
π
π
+
+
+
+
+=
...
221110
(2.2.12)
onde
0
π
é um vetor de interceptos,
i
π
são matrizes de coeficientes,
π
é uma matriz
com um ou mais elementos diferentes de zero e
t
ε
é um vetor de distúrbios com
elementos
it
ε
, onde
it
ε
e
jt
ε
podem ser correlacionados.
Sejam todas as variáveis contidas em Y
t
I(1). Se existe uma representação de
correção de erros como em (2.2.12), existe necessariamente uma combinação linear
das variáveis em Y
t
que é estacionária. Resolvendo para
1t
y
π
, temos:
41
t
p
p
i
ititt
yyy
επππ
=
=
1
01
(2.2.13)
Como todas as expressões do lado direito são estacionárias,
1t
y
π
é
necessariamente estacionária. Como
π
contém apenas constantes, cada linha de
π
é um vetor de cointegração de Y
t
, pois cada série y
i,t-1
é I(1). Logo, um modelo de
correção de erros para variáveis I(1) implica, necessariamente, cointegração. Pode-
se mostrar que o contrário também é verdadeiro. Este resultado é conhecido como
Teorema da Representação de Granger, estabelecendo que para um conjunto de
variáveis I(1), correção de erros e cointegração são representações equivalentes.
Existem três pontos a serem destacados sobre a matriz
π
:
1. Se todos os elementos de
π
são zero, (2.2.12) é um VAR tradicional em
primeira diferença, de forma que não há representação de correção de erros
bem como cointegração.
2. Se um ou mais elementos de
π
for diferente de zero,
t
Y responde a desvios
do período passado em relação ao equilíbrio de longo prazo. Logo, estimar
um VAR em primeira diferença é inapropriado. A omissão do termo
1t
y
π
leva
a um erro de especificação, como foi visto anteriormente.
3. Este resultado ilustra as idéias de Johansen (1988) e Stock e Watson (1988)
de que pode-se usar o posto da matriz
π
para determinar se as variáveis são
ou não cointegradas.
Considere o caso de um VAR de primeira ordem:
ttt
yAy
ε
+
=
11
(2.2.14)
onde A
1
é uma matriz de parâmetros.
Subtraindo y
t-1
dos dois lados de (2.2.14), obtém-se:
()
ttt
ttt
yy
yAIy
επ
ε
+=
+=
1
11
(2.2.15)
É fácil perceber que (2.2.15) é um caso especial de (2.2.12). Novamente o
ponto crucial em relação a cointegração está ligado ao posto de
π
. Se o posto de
π
é zero, cada elemento de
π
deve ser zero. Neste caso, (2.2.15) é equivalente a um
VAR em primeira diferença.
No outro extremo está o caso onde
π
tem posto completo. A solução de
longo prazo para (2.2.15) é dada por n equações independentes. Neste caso, todas
as variáveis de y
t
são estacionárias.
42
Em casos intermediários, onde o posto de
π
é igual a r, para r<n, existem r
vetores de cointegração.
2.2.1 Testes de Cointegração
A metodologia de Engle e Granger.
Engle e Granger (1987) propõe uma maneira simples de testar se duas
variáveis I(1) são CI(1,1). Sejam y
t
e z
t
duas variáveis I(1), deve-se estimar a relação
de longo prazo entre elas na forma:
ttt
ezy ++=
10
β
β
(2.2.16)
Se as variáveis são cointegradas, uma regressão por mínimos quadrados
ordinários leva a estimadores super consistentes, como demonstrado por Stock
(1988). Para determinar se as variáveis são mesmo cointegradas, deve-se testar se
a série de resíduos estimados ê
t
contém uma raiz unitária. Se os resíduos estimados
forem estacionários, conclue-se que y
t
e z
t
são cointegradas de ordem (1,1). Para
isto, utiliza-se teste de raiz unitária sem intercepto, pois os resíduos devem ter
médias iguais a zero:
ttt
êaê
ε
+
=
11
(2.2.17)
Não se pode utilizar a tabela de Dickey-Fuller, pois a seqüência {ê
t
} vem de
uma regressão, ou seja, são estimativas e o pesquisador não sabe o verdadeiro
valor de e
t
, apenas sua estimativa. A tabela apropriada foi desenvolvida por Engle e
Yoo (1987). Se os resíduos não parecerem ser ruídos brancos, pode-se realizar o
teste de Dickey-Fuller aumentado ao invés de (2.2.17):
t
p
i
ititt
êaêaê
ε
++=
=
+
0
111
(2.2.18)
Se as variáveis são cointegradas, os resíduos da equação de equilíbrio de
longo prazo podem ser usados para estimar o modelo de correção de erros:
(
)
(
)
() ()
∑∑
==
==
++++=
++++=
p
i
zt
p
i
tttzt
p
i
yt
p
i
tttyt
ziyiêz
ziyiêy
11
12212112
11
11211111
εαααα
εαααα
(2.2.19)
(2.2.20)
As equações (2.2.19) e (2.2.20) podem ser estimadas usando a metodologia
VAR, uma vez que o sistema é um VAR com um termo de correção de erro.
43
A metodologia de Johansen.
Apesar de ser facilmente implementado, o procedimento de Engle e
Granger tem algumas limitações. A estimação do equilíbrio de longo prazo requer
que o pesquisador selecione uma variável como dependente e outra como
explicativa. Em alguns casos, acontece de uma regressão indicar que as variáveis
são cointegradas e quando se inverte a ordem, as variáveis não são mais
cointegradas. Além disso, se tivermos mais de duas variáveis, podemos ter mais
de um vetor de cointegração e o método não apresenta forma de separar estes
vetores. Outra limitação é o fato de que o procedimento de Engle e Granger é
feito através de estimação em dois estágios. Isto faz com que o erro de estimação
do primeiro passo seja transferido para o segundo passo.
O método de estimação por máxima verossimilhança, introduzido por
Johansen (1988), não necessita de dois estágios e, além do mais, possibilita testes
para múltiplos vetores de cointegração. Outra vantagem deste procedimento é a
possibilidade de restringir parâmetros no vetor de cointegração.
Considere a equação (2.2.15). O posto de
π
é igual ao número de vetores de
cointegração.
O número de vetores de cointegração independentes pode ser obtido
checando o nível de significância dos auto valores de
π
. É um resultado de álgebra
matricial que o posto de uma matriz é igual ao número de seus auto-valores que são
diferentes de zero. Suponha que obtenha-se a matriz
π
e ordene-se seus n auto-
valores de forma que
n
λ
λ
λ
>>> ...
21
. Se as variáveis em y
t
não são cointegradas, o
posto de
π
será zero e todos os auto-valores serão iguais a um. Se as variáveis não
são cointegradas, como ln(1)=0, cada expressão
(
)
i
λ
1ln será igual a zero. Se o
posto de
π
for um, a primeira expressão
(
)
1
1ln
λ
será diferente de zero e as outras
expressões
()()
(
)
01ln...1ln1ln
32
=
=
=
=
n
λ
λ
λ
.
Na prática, obtém-se apenas estimativas dos auto-valores de
π
. O teste para
o número de auto-valores significativamente diferente de um pode ser conduzido
usando as seguintes estatísticas testes:
()
()
()
()
1max
1
1ln1,
1ln
+
+=
=+
=
r
n
ri
itraço
Trr
Tr
λλ
λλ
)
)
44
A primeira estatística testa a hipótese nula de que o número de vetores de
cointegração é menor ou igual a r, contra uma alternativa geral. Dessa forma, quanto
mais longe os auto-valores estão de zero, maior é
traço
λ
.
A segunda estatística testa a hipótese nula de r vetores de cointegração,
contra a hipótese alternativa de r+1 vetores de cointegração. Se as estimativas dos
auto-valores forem próximas de zero,
max
λ
será pequena. Os valores críticos para
estas estatísticas são apresentados por Osterwald-Lenum (1992) e depedem do
número de componentes não estacionários sob a hipótese nula e da inclusão ou não
de constantes no vetor de cointegração.
2.3 Processos VAR Cointegrados com Mudanças de Regime Markoviano.
A idéia por trás da análise de sistemas lineares multivariados de séries de
tempo é que os parâmetros do processo estocástico são variantes no tempo, porém
condicionais à variável de regime,
t
s . Essa variável indica a possibilidade de
existência de diferentes estados de mundo. Seja M o número de regimes possíveis
de forma que
1,...,
t
sM . Então a densidade de probabilidade condicional do vetor
de série de tempo observado,
t
y , é dada por:
()
()
()
11
1
1
,
,
,
tt
tt t
tt M
fyY
pyY s
fyY
θ
θ
=
M
se
se
1
t
t
s
sM
=
=
M
()
2.3.1
onde
1t
Y
são as observações
1
tj
j
y
=
. O vetor de parâmetros do VAR,
θ
, depende
do regime que prevalece em t, de forma que
m
θ
é o vetor de parâmetros do VAR no
regime m=1,...,M.
Logo, para um dado regime
t
s , o vetor de série de tempo K dimensional
()
1, ,
,..., `
ttKt
yy y= , t=1,...,T, é gerado por um vetor autoregressivo de ordem p
(VAR(p)), tal que:
() ()
1
1
,
p
tt t t j t tj
j
EyY s vs Asy
=
⎡⎤=+
⎣⎦
As inovações em
t
y são dadas por:
45
1
,
tt ttt
uyEyYs
=
−⎡
O processo das inovações
t
u é um ruído branco gaussiano com média zero e
matriz de variância covariância
(
)
t
sΣ .
(
)
(
)
0,
tt
uNID sΣ
Os modelos de vetores autoregressivos com mudanças de regime
markoviano (MS-VAR) são uma generalização dos modelos VAR de ordem finita:
() ()
(
)
11
...
tt tt pttpt
yvs Asy Asy u
−−
=+ ++ +
()
2.3.2
onde os valores amostrais
01
,...,
p
yy
são fixos. As funções de mudança nos
paraâmetros
(
)()
(
)
(
)
1
, ,..., e
ttpt t
vs A s A s sΣ descrevem a dependência dos
parâmetros do processo em relação ao regime em questão.
()
1
se 1
se
t
t
Mt
vs
vs
vsM
=
=
=
M
(
)
2.3.3
Como os parâmetros do processo condicional (2.3.2) dependem do regime
vigente, que é, por hipótese, estocástico e não observável, uma descrição completa
do processo gerador dos dados requer uma formulação do processo gerador dos
regimes. Uma vez formulada uma lei para a geração dos estados, a evolução dos
regimes pode ser inferida dos dados. Em modelos de mudança de regime
markovianos, o processo gerador dos regimes é uma cadeia de Markov ergódica
com número finito de estados 1,...,
t
sM
=
que são definidos pelas probabilidades de
transição.
()
{}
M
1
j=1
Pr , 1 i,j 1,...,M
ij t t ij
psjsip
+
=== =
(2.3.4)
Mais precisamente, assume-se que
t
s segue uma cadeia de Markov ergódica
com M estados e matriz de transição P, tal que:
11 12 1
21 22 2
3
12
M
M
M
MM MM
pp p
pp p
P
p
pp p
⎡⎤
⎢⎥
⎢⎥
=
⎢⎥
⎢⎥
⎢⎥
⎣⎦
L
L
MMO
L
(2.3.5)
onde
11
1 ... para 1,...,
iM i iM
p
pp iM
=− = .
46
Um VAR(p) com M regimes com mudança markoviana é chamado MS(M)-
VAR(p). Uma grande vantagem dos modelos MS-VAR é sua grande flexibilidade (ver
Krolzig(1997)). Na sua especificação mais geral, todos os parâmetros do MS-VAR
são condicionais ao estado
t
s da cadeia de Markov. No caso onde se têm apenas
mudanças no intercepto do processo VAR(p), obtêm-se:
()
1
1
P
tittt
i
yAyuvs
=
=++
(2.3.6)
onde
[
]
()
(
)
(
)
11
,..., ', ,..., ', os 's
ttkt t t kt i
yy yvs vs vs A==
⎣⎦
são matrizes (kxk) de
coeficientes e
[
]
1
,..., '
ttkt
uu u= .
Subtraindo
1t
y
dos dois lados de (2.3.2), se obtém o modelo de correção de
erros vetorial com mudança markoviana de regime (MS-VECM).
() () ()
1
1
1
'
p
tt itt ttpt
i
yvs sy s y u
αβ
−−
=
∆= + Γ + +
(2.3.7)
Onde
() ()
1 1
, 1,..., 1 e '
p
i
ik jt t k j
j j
I
As i p s I A
αβ
= =
⎛⎞
Γ= = =Π=
⎜⎟
⎝⎠
∑∑
. A matriz '
β
é a matriz de cointegração.
2.3.1 Mudança de regime no Drift e na média de equilíbrio do VECM
Em modelos VAR(p) cointegrados, o intercepto v reflete, em geral, duas
quantidades diferentes. Aplicando o operador de expectativa ao VECM em (2.3.7),
obtém-se:
(
)
[
]
[
]
1'
tt
Ey v E y
αβ
Γ∆=+
onde
()
11
1 ...
kp
I
Γ=ΓΓ. Logo, o intercepto é igual a
()
[
]
[
]
1 , onde e
tt
vEyEcy
αδ µ µ δ
=− +Γ = = é uma constante determinando o
equilíbrio de longo prazo e incluída na relação de cointegração. A cointegração
implica na seguinte restrição à esperança do sistema em primeira diferença
[
]
''0
t
Ey
ββµ
∆= = (2.3.8)
mostrando que m contém apenas k-r parâmetros livres, refletindo as tendências
lineares comuns no sistema. Logo,
µ
pode ser parametrizado como
*
'
µ
βµ
= ,
47
onde '
β
é uma matriz com posto completo (k x [k-r]), ortogonal a ', ' ' 0
β
ββ
=
, e
*
µ
é um vetor ([k-r] x 1).
Se o intercepto pode ser absorvido pela relação de cointegração, as variáveis
não têm tendências lineares determinísticas. Por outro lado, na ausência de
qualquer restrição em v, existem k-r tendências temporais produzindo um drift em
t
y , tal que:
()
*
1'v
α
δβµ
=− +Γ (2.3.9)
Em sistemas cointegrados é, portanto, útil discriminar modelos com restrição
absorvente, v
α
δ
=− , e modelos irretritos com 0v
α
.
Analogamente, uma mudança de regime no intercepto pode mudar a taxa de
crescimento média e média de equilíbrio. Em modelos MS-VAR cada regime
m=1,...,M é associado com um atrator
(
)
*
,
mm
µ
δ
.
(
)
*
1'
mm m
v
α
δβµ
=− +Γ
Portanto, diferentes especificações de modelos MS-VECM podem ser de
interesse:
Mudança irrestrita no intercepto
(
)
t
vs
() ( )
1'
tt tpt
yvs y u
αβ
Γ∆= + + (2.3.10)
Mudança no drift
(
)
t
s
µ
() ( )
()
()
1'
tt tp t
ys y u
µαβδ
Γ∆ = + (2.3.11)
onde
δ
é um vetor (rx1) de interceptos de cointegração e
*
'
µ
βµ
= é um vetor
(kx1) com k-r parâmetros livres
*
m
µ
para cada regime m.
Mudança no equilíbrio de longo prazo
(
)
t
s
δ
()( )
(
)
()
1'
ttptt
yysu
µαβ δ
Γ∆= + (2.3.12)
onde
()
t
s
δ
é um vetor (rx1) de interceptos de cointegração e
'*
µ
βµ
=
*
'
µ
βµ
= é
um vetor (kx1) com k-r parâmetros livres
*
m
µ
.
Mudança contemporânea no drift e no equilíbrio de longo prazo.
() ( )
()
(
)
()
1'
tt tptt
ys y su
µαβδ
Γ∆ = + (2.3.13)
48
onde
()
t
s
δ
e
()
t
s
µ
são definidos como em (2.3.11) e (2.3.12). A diferença para o
modelo (2.3.10) é que em (2.3.13), após uma mudança de regime, tem-se uma
alteração tanto no drift quanto na média do processo.
2.3.2 Representação Estável de Espaço-Estado.
Para introduzir a representação de estado-espaço dos MS-VECM, faz-se uso
da representação VAR(1) de uma cadeia de Markov (Hamilton, 1994). Introduz-se
então as variáveis indicadores:
()
t
t
1se s
0se s
t
m
Is m
m
=
==
para m=1,...,M. A informação sobre o acontecimento de
t
s pode ser coletada no vetor
de regimes
t
ξ
:
(
)
()
1
t
t
t
Is
Is M
ξ
=
=
=
M
O vetor de regime
t
ξ
denota o estado não observável do sistema. Em
Hamilton (1994), a representação VAR(1) é de uma cadeia de Markov ergódica, de
forma que
'
11
M
t
ξ
=
r
. Esta restrição de soma assegura a estabilidade. Para propósitos
analíticos, elimina-se esta restrição de forma a obter-se uma formulação um pouco
diferente da equação de transição. Este procedimento altera a representação de
estado-espaço considerada por Hamilton (1994), pois o novo vetor
t
ς
tem dimensão
M-1.
1, 1
1,
1
t
t
Mt
M
ξ
ξ
ς
ξ
ξ
⎡⎤
⎡⎤
⎢⎥
⎢⎥
=−
⎢⎥
⎢⎥
⎢⎥
⎢⎥
⎣⎦
⎣⎦
MM
(2.3.14)
onde
ξ
é o vetor de probabilidades ergódicas da cadeia de Markov. O processo
estocástico do vetor de regimes
t
ς
é uma cadeia de Markov escondida, que pode
ser representada por um processo VAR(1).
1ttt
Fe
ς
ς
=+ (2.3.15)
49
onde a matriz ([M-1] x [M-1]) F, corresponde à matriz transposta de probabilidades
de transição.
1,1 ,1 1,1 ,1
1, 1 , 1 1, 1 , 1
MMM
MMM MMMM
pp p p
F
pp p p
−− −−
⎡⎤
−−
⎢⎥
=
⎢⎥
⎢⎥
−−
⎣⎦
L
MOM
L
e
t
v é um processo ruído branco não normal de média zero.
Conseqüentemente o termo de intercepto
(
)
t
vs em (2.3.7) é gerado por um
processo estocástico do tipo:
()
tt
vs v M
ς
=+ (2.3.16)
onde
v é a média não condicionada de
(
)
t
vs e
[
]
11MMM
M
vv v v
=− L é uma
matriz (K x [M-1]).
Reparametrizando o mecanismo do VECM em (2.3.7) e combinando com
(2.3.14) e (2.3.16), obtém-se a seguinte representação de estado-espaço para
MS(M)-VECM(p):
1
11
1 2
1
'
1
'
0
0000
0
000
´
00'0
00
0
t tt
p
t t
K
tp tp
K
tp tp
r
t tt
yyu
M
v
yy
I
yy
I
yy
I
e
F
αβ α
ββ
β
ςζ
−+
⎡⎤
∆∆
ΓΓ
⎡⎤
⎡⎤
⎢⎥
⎢⎥
⎢⎥
∆∆
⎢⎥
⎢⎥
⎢⎥
⎢⎥
⎢⎥
⎢⎥
=++
⎢⎥
⎢⎥
⎢⎥
∆∆
⎢⎥
⎢⎥
⎢⎥
⎢⎥
⎢⎥
⎢⎥
⎢⎥
⎢⎥
⎢⎥
⎢⎥
⎢⎥
⎢⎥
⎣⎦
⎣⎦
⎣⎦
L
L
MMM
MOMMMM
M
M
LM
M
M
L
M
LLL
⎢⎥
⎢⎥
⎢⎥
(2.3.17)
2.3.3 Processos MS-VAR mais gerais.
Os modelos MS-VAR cointegrados podem ser generalizados de forma a
representar diferentes tipos de mudanças de regimes no sistema. Além de mudança
no intercepto, as matrizas de coeficientes, bem como a matriz de covariância
também podem ser dependentes do regime.
()
it
sΓ mudança nos coeficientes autoregressivos.
()
it
sΣ heterocedasticidade dependente do regime.
()
´
t
s
β
mudanças na relação de cointegração, ou seja, no equilíbrio de longo
prazo.
50
Enquanto mudanças nos coeficientes autoregressivos
i
Γ são apenas uma
extensão dos modelos MS-VECM tratados até aqui, mudanças na relação de
cointegração ainda necessitam de mais investigação. Se a matriz de covariância é
dependente dos regimes, então o termo de erro w
t
do modelo VAR resultante se
torna bilinear nas inovações e
t
e u
t
, de forma que:
1
2
00
ii
tt ti tit
ii
weMFeSFee
∞∞
−−
==
⎛⎞
+ +
⎜⎟
⎝⎠
∑∑
(2.3.18)
onde
()
1
2
m
0, ,
tK
eNIDI Σ é uma decomposição de Choleski triangular inferior de
m
Σ
,
[
]
()
1
M
K
I
ξ
Σ= Σ Σ L é a média incondicional de
(
)
tt
sΣ=Σ e S é definida como:
11
22
11M
S
=
Σ−Σ Σ Σ
L
A bilinearidade de w
t
pode afetar o uso da metodologia de Johansen na
estimação do modelo, apesar de que Johansen (1991) mostra que a hipótese de
distribuição normal não compromete seriamente os resultados da análise assintótica.
2.3.4 Representação VARMA de processos MS-VAR cointegrados.
Em contraste com modelos gaussianos considerados por Johansen (1995), o
intercepto aqui não é um simples parâmetro que adiciona inovações não-normais ao
modelo gaussiano. O intercepto v é determinado pela função de mudança
()( )
1
,,
tMt
vs v v
ξ
= K ,
()
1
p
titptt
i
yAyuvs
=
=++
. (2.3.19)
Por isso o termo de intercepto não é um simples parâmetro, mas é gerado por
um processo estocástico dado por (2.3.16). A representação VAR(1) da cadeia de
Markov geradora dos regimes é dada em (2.3.15), daí pode-se chegar à
representação MA
()
,
0
j
ttj
j
Fe
ς
=
=
. (2.3.20)
Substituindo (2.3.20) e (2.3.16) em (2.3.19), tem-se
51
10
p
j
titpt tj
ij
yAyuvMFe
−−
==
=+++
∑∑
. (2.3.21)
Portanto a mudança de regime no intercepto implica um processo VAR
cointegrado onde o termo de equilíbrio w
t
é a soma de dois processos
indepenmdetes, o ruído branco gaussiano u
t
e o processo auto-correlacionado não
normal
0
j
tj
j
M
Fe
=
,
1
0
p
titpt
i
j
tt tj
j
yv Ay w
wu M Fe
=
=
=+ +
=++
(
)
()
2.3.22
2.3.23
Denotando
()
1M
FL I FL
=−, o processo w
t
pode ser escrito como:
(
)
1
tt t
wuMFLe
=+ .
Usando a definição de matriz adjubta,
*1
() () ()FL FL FL
= , obtém-se:
*
() () ()
tt t
FLw FLu MFL e=+ .
Krolzig (1995) mostra que um processo estacionário w
t
possui uma
representação VARMA (M-1, M-1) com um ruído branco de média zero não normal
t
ε
,
() ()
tt
Lw L
γ
αε
= (2.3.24)
onde
()
1
()
M
LFLI FL
γ
== e
(
)
1
11
M
KM
LI L L
ααα
=− K . Logo a equação
(2.3.24) é a equação na forma final, que é identificável. Considere agora as
implicações de (2.3.24) para as propriedades do processo gerador da variável
observável y
t
:
() ()
()
tt
tt
ALy v w
Lw L
γ
αε
=+
=
.
A estrutura das inovações w
t
resulta em um processo VARMA cointegrado de
y
t
da forma:
() ()
(
)
() 1
tt
LALy v L
γ
γαε
=+ (2.3.25)
ou escrito como o polinômio reduzido (KxK) () ()()LLAL
γ
Λ
= e com o vetor (Kx1) de
constantes
(
)
0
1av
γ
= ,
52
1
1
0
11
pM
M
tjtjtiti
ji
ya y
ε
αε
+−
==
=+ Λ ++
∑∑
. (2.3.26)
Como na representação VARMA dos teoremas de representação de
processos MS-VAR estacionários em Krolzig (1995), a ordem dada dos processos
são apenas limites superiores, ou seja, não é assegurado que a matriz de transição
irrestrita F é não singular, tendo posto M-1.
Pode-se perceber de (2.3.25) que um processo MS(M) VAR(p) cointegrado
pode ser escrito na forma de um vetor autoregressivo de ordem infinita. Para
perceber isto, multiplica-se os dois lados de (2.3.25) pelo polinômio
()
1
L
α
, de forma
a obter
( ) ( ) () ()
11
() 1 1
tt
LLALy v
γ
αγαε
−−
=+. (2.3.27)
Definindo
1
1
() ()() ()
i
Ki
i
LI L LLAL
γα
=
Ψ=Ψ=
como um polinômio AR infinito,
obtém-se um sistema cointegrado de ordem infinita com inovaçãoes não normais,
0
titit
i
yy
ψ
ε
=
=+ Ψ +
, (2.3.28)
onde o termo de intercepto
(
)
(
)
1
11v
ψ
γα
= reflete a média incondicional de v(s
t
) e
()LΨ exibe somente as raízes unitárias introduzidas por A(L).
A idéia principal da equação (2.3.28) é que ela representa o sistema
cointegrado com mudança markoviana de regime apresentado em (2.3.7) como um
vetor autoregressivo não normal de ordem infinita. Tal processo gerador de dados
permite que a analise de cointegração seja baseada nos procedimentos existentes
para modelos VAR de ordem infinita.
2.3.5 Estimação
A técnica proposta para a estimação de máxima verossimilhança de
processos MS-VECM é um procedimento em dois estágios. Primeiramente usa-se a
metodologia máxima verossimilhança proposta por Johansen para determinar o
número de vetores de cointegração, bem como par estimar a matriz de cointegração
´
β
. Então se estima o restante dos parâmetros do MS VECM com o algoritmo EM
para uma estimação de máxima verossimilhança.
53
A análise de sistemas cointegrados usando máxima verossimilhança com
informação total desenvolvida por Johansen (1988, 1991) para vetores
autoregressivos de ordem finita e gaussianos foi estendida para classes mais gerais
de modelos. Saikkonen (1992) e Saikkonen e Luukkonen (1995) mostram que o uso
de versões análogas do teste de razão de verossimilhança desenvolvido para
vetores autoregressivos de ordem finita e gaussianos é justificado mesmo quando os
dados são gerados por um processo de ordem infinita e não gaussiano. Saikkonem
(1992) apresenta alguns resultados assintóticos gerais para processos VAR de
ordem infinita que mostram que a maioria dos resultados assintóticos de Johansen
(1988, 1991) para as relações de cointegração estimadas e para a matriz de pesos
estimada continuam válidos. As propriedades assintóticas dos parâmetros de curto
prazo estimados, bem como das funções impulso resposta para essa classe de mais
geral de modelos é derivada em Saikkonen e Lütkepohl (1994) e Lütkepohl e
Saikkonen (1996). O trabalho de Lütkepohl e Saikkonen (1996) é de especial
importância para os resultados que serão apresentados aqui, uma vez que
demonstra que a interpretação usual de VECM através de funções impulso resposta
pode ser justificada mesmo quando os dados são gerados por um processo VAR de
ordem infinita, mas o modelo ajustado é um VAR de ordem finita.
Portanto, como a não normalidade de
t
ε
não é essencial para a análise.
Como enfatizado por Johansen (1991) e demonstrado em Saikkonen e Lütkepohl
(1994), a hipótese de distribuição gaussiana não é muito importante no que
concerne aos resultados da análise assintótica. Como os modelos MS VECM
implicam que um processo VARMA gerou os dados, o procedimento de máxima
verossimilhança de Johansen parece ser adequado. Em outras palavras, sob a
hipótese de que o P.G.D. é um processo MS(M) VAR(p), não existe obstáculo em
estudar as propriedades de longo prazo do sistema através da metodologia de
Johansen para sistemas lineares.
A análise de cointegração é baseada na aproximação a um sistema linear. A
partir dos resultados de longo prazo obtidos nesta estimação, constrói-se o modelo
de correção de erros do processo MS(M) VAR(p) gerador dos dados:
()
1
1
1
p
tit ttptt
i
yyszMu
αξ
−−
=
∆= Γ + + +
(2.3.29)
54
onde
[
]
11MMM
M
vv v v
=− L e ´
tt
zy
β
=
. Pode-se perceber que (2.3.29)
corresponde a um modelo MS(M) VAR(p) com um regressor exógeno, z
t
. A
estimação de máxima verossimilhança de (2.3.29), portanto, pode ser feita através
de um algoritmo EM como uma extensão do modelo sugerido por Hamilton (1990). A
estimação do modelo é condicionada à matriz de cointegração estimada no primeiro
período
´
β
.
Seja
t
η
o vetor das densidades de y
t
, condicional a
t-1
e Y
t
ξ
()
()
()
()
11 1 1
11
1
11 1
;, , , ,,
;;
;;
;,,, ,,
tt p
tt t
t
tt M t
tt M p
pyY v
py Y
py Y
pyY v
α
ξ
ιθ
η
ξ
ιθ
α
−−
−−
⎡⎤
ΓΓ Σ
=
⎢⎥
⎢⎥
==
⎢⎥
=
ΓΓ Σ
⎢⎥
⎣⎦
K
MM
K
,
onde
()
11
,,, ,,
p
vec M
θα
ΓΣK é o vetor de parâmetros do VECM, de forma que a
densidade de y
t
condicional a Y
t-1
é dada por
()
$ $
(
)
11
1
´1´
tt tt
tt t M t
pyY
ηξ η ξ
−−
==
onde
$
1tt
ξ
é a inferência estatística
tt
EY
ξ
sobre o vetor de estado não observável
ξ
dado o conjunto de informações Y
t
. Então, condicional à matriz de cointegração
´
β
, a função de verossimilhança do vetor de parâmetros
λ
,que contém o vetor de
parâmetros do VECM,
θ
, os parâmetros da cadeia de Markov ,
()
vec P
ρ
= , e o
estado inicial
0
ξ
, é dada por:
()() ()
(
)
(
)
0
,,Pr,
TT T T
L Y pY pY d pY d
λ
λξλξξθξρξξ
== =
∫∫
. (2.3.30)
Devido à não linearidade resultante das condições de primeira ordem de
λ
, a
maximização da função de verossimilhança é um problema de otimização não linear.
Sua solução requer o uso de técnicas de solução numérica que maximizam a função
log-verosimilhança de forma iterativa. Um algoritmo que resolve este problema é o
algoritmo Expectation-Maximization (EM) introduzido por Dempster, Laird e Rubin
(1977). Este algoritmo foi desenvolvido para uma classe geral de modelos onde a
série de tempo observada depende de alguma variável estocástica não observável.
Cada iteração deste algoritmo consiste de dois passos, o passo da expectativa e o
passo da maximização. O primeiro passo é o passo da expectativa, onde o estado
não observável
t
ξ
é estimado por suas probabilidades suavizadas
$
tT t T
EY
ξξ
=
;
55
onde todas as probabilidades condicionais
(
)
(1)
Pr ,
j
Y
ξλ
são calculadas usando o
vetor de parâmetros
(1)j
λ
calculado no último passo de maximização. No passo de
maximização, uma estimativa do vetor de parâmetros
λ
é derivada como solução
das condições de primeira ordem associadas a (2.3.30), onde as probabilidades
condicionais dos regimes
(
)
Pr ,
t
Y
ξ
λ
são substituídas pelas probabilidades
suavizadas
()
()
Pr ,
ji
t
Y
ξλ
derivadas no último passo de expectativa. A cada passo
obtém-se um novo vetor de parâmetros
λ
com o qual se atualizam as
probabilidades filtradas e suavizadas. Então, cada iteração do algoritmo EM envolve
uma passagem pelas iterações de filtragem e suavização, seguidas por uma
atualização nas condições de primeira ordem e nos parâmetros estimados,
garantindo um aumento na função de verossimilhança.
56
Capítulo 3 Resultados
Aqui serão apresentados os resultados dos modelos lineares e não lineares
bem como a análise destes, com o intuito de entender o processo dinâmico de
resposta da balança comercial brasileira a variações cambiais.
3.1 Dados
Os dados utilizados são mensais com início em janeiro de 1990 e término em
dezembro de 2003, perfazendo um total de 168 observações. As variáveis utilizadas
são a razão exportações/importações, a taxa de câmbio real, o Produto Interno Bruto
brasileiro, o Índice Nacional de Preços ao Consumidor (INPC), as importações
mundiais e o índice de preço das exportações mundiais.
Os dados para exportações totais e importações totais, usados para calcular a
razão exportações/importações, usada como índice para o salda da balança
comercial, foram cedidos pela Secretaria de Comércio Exterior do Ministério do
Desenvolvimento, Industria e Comércio Exterior (MDIC/Secex). A taxa de câmbio
real utilizada é calculada pelo Instituto de Pesquisa Econômica Aplicada (IPEA)
através do expurgo do INPC e dos Índices de Preços por Atacado (IPAs) dos 16
mais importantes parceiros comerciais do Brasil da série nominal de taxa de câmbio
(R$ / US$), ponderada pela participação de cada parceiro na pauta do total das
exportações brasileiras em 2001. O PIB mensal utilizado foi estimado pelo Banco
Central do Brasil (BC), deflacionado pelo INPC calculado pelo Instituto Brasileiro de
Geografia e estatística (IBGE). As importações mundiais foram obtidas no
International Financial Statistics do Fundo Monetário Internacional (IFS/FMI) e
deflacionadas pelo índice de preços das importações mundiais, também do IFS/FMI.
Algumas estatísticas descritivas das séries utilizadas estão descritas na Tabela 3.1.1
do Anexo.
A definição de balança comercial usada segue Haynes e Stone (1982),
Bahmani-Oskoee (1991), Bahmani-Oskoee e Alse (1994), Brada, Kutan e Zhou
(1997), Rincón(1998), Bahmani-Oskoee e Kantipong (2001), Antonuci (2003), entre
outros. É utilizada a razão exportações/importações por vários motivos.
Primeiramente, este índice permite expressar a balança comercial em logarítimo
(Brada, Kutan e Zhou, 1997), de forma que a primeira diferença das variáveis reflete
57
a taxa de variação destas. Outra vantagem deste índice é sua invariância a
alterações nas unidades de medida. Além disso, quando a balança comercial é
definida como a diferença entre exportações e importações, utiliza-se um deflator
para obter a balança comercial real. Logo, essa medida fica sensível ao deflator
utilizado. O índice usado aqui resolve este problema, pois independe do deflator
utilizado. Por isso, seguindo Banmani-Oskoee (1991) pode-se interpretar este índice
como a balança comercial nominal ou real. As importações mundiais são usadas
como proxi para a renda do resto do mundo.
A análise gráfica das séries sugere que elas são não estacionárias. Para
confirmar esta suspeita, foram realizados testes de raiz unitária do tipo ADF nas
séries em nível e em primeira diferença, os resultados se encontram na Tabela 3.1.2
do Anexo. Os resultados dos testes confirmam a análise gráfica, sendo que todas as
séries contêm uma raiz unitária em nível e são estacionárias em primeira diferença.
-.6
-.4
-.2
.0
.2
.4
.6
.8
1990 1992 1994 1996 1998 2000 2002
4.0
4.2
4.4
4.6
4.8
5.0
5.2
1990 1992 1994 1996 1998 2000 2002
5.8
5.9
6.0
6.1
6.2
6.3
6.4
6.5
6.6
1990 1992 1994 1996 1998 2000 2002
0.8
1.0
1.2
1.4
1.6
1.8
2.0
1990 1992 1994 1996 1998 2000 2002
Figura 3.1.1 - Gráfico da série lnxm. Figura 3.1.2 - Gráfico da série lnreal.
Figura 3.1.3 - Gráfico da série lnpibr. Figura 3.1.4 - Gráfico da série lnimpr.
58
A análise gráfica, bem como as mudanças na economia brasileira ocorridas
no período de análise, sugerem que algumas séries possuem quebras estruturais,
principalmente as séries do câmbio e da balança comercial. Como visto
anteriormente, estas quebras estruturais podem distorcer os testes de raiz unitária.
Neste caso, o teste mais indicado é o proposto por Perron(1997), que escolhe uma
data para a quebra estrutural de forma endógena. Os resultados deste teste, bem
como as datas de quebra estrutural indicadas por este se encontram nas Tabelas
3.1.3 e 3.1.4 do anexo. Os resultados reforçam a hipótese de não estacionariedade
das séries.
3.2 Modelo Linear
Dado que as séries são não estacionárias, é necessário testar se estas
cointegram, o que possibilitaria a estimação de um modelo de correção de erros.
Antes disso é necessário saber quantas defasagens deve-se usar no teste. Para
isso, estima-se um VAR com as variáveis em nível e escolhe-se o melhor modelo
segundo os critérios de informação Akaike (AIC) e de Schwarz (BIC) (Ver Tabela
3.2.1 no Anexo). Seleciona-se quatro defasagens, pois este modelo apresenta
valores satisfatórios para os dois critérios de seleção, além de possibilitar uma
dinâmica para o modelo sem exagerar no número de parâmetros a ser estimados.
Na seqüência, utiliza-se o teste de cointegração de Johansen (1998) com quatro
defasagens, onde se constata a existência de um vetor de cointegração, os
resultados estão na tabela 3.2.2 do Anexo. O vetor de cointegração encontrado,
normalizado para lnxm, é dado por:
()
1,-1.811856, 1.158394, 1.383791,-2.176329
β
= .
Ou seja, a equação que representa a relação de longo prazo entre as
variáveis em questão é:
ln 2.176329+1.811856lnreal- 1.158394lnimpr- 1.383791lnpibrxm = . ()
Esta equação revela que a elasticidade de longo prazo taxa de câmbio da
balança comercial estimada é positiva. Dessa maneira, uma desvalorização (real)
melhora a balança comercial (real). O coeficiente estimado mostra que para uma
desvalorização cambial de 1%, ceteris paribus, a balança comercial aumenta
1.811856%, na média. Portanto, essa evidência empírica mostra que a condição de
59
Marshal-Lerner é válida para o Brasil. O sinal negativo do coeficiente da renda local
é consistente com a abordagem da absorção, pois mostra que a renda tem uma
relação negativa com a balança comercial. Nota-se, porém, que o coeficiente para a
variável de renda externa é inconsistente com a abordagem da absorção, que prevê
uma relação positiva entre balança comercial e renda externa.
Partindo da evidência de que existe apenas uma relação de longo prazo entre
as variáveis estudadas, estima-se o modelo vetorial de correção de erros com quatro
defasagens. Os resultados da estimação do modelo da balança comercial são:
O coeficiente do termo de correção de erros é significativo a 1%. Isto significa
que a velocidade na qual a variação da balança comercial, ln
x
m , ajusta em
direção ao único equilíbrio de longo prazo existente difere de zero. Ou seja, a
equação para a ln
x
m
contém informação sobre a relação de longo prazo entre as
variáveis, uma vez que o termo de correção de erro entra nesta equação. De acordo
com as estimativas, os desequilíbrios de curto prazo na balança comercial são
corrigidos a uma velocidade de 20% por mês.
Uma forma de interpretar os coeficientes estimados em um vetor
autoregressivo é usar funções de impulso resposta, que resumem o significado
Variável Coeficiente Desvio Padrão Estatística t
Constante -0.0075 -0.01039 [-0.72165]
D(LNXM(-1)) -0.345346 -0.08286 [-4.16791]
D(LNXM(-2)) -0.005552 -0.08486 [-0.06543]
D(LNXM(-3)) 0.078976 -0.08396 [ 0.94066]
D(LNXM(-4)) 0.059713 -0.07797 [ 0.76580]
D(LNREAL(-1)) 0.105307 -0.24902 [ 0.42288]
D(LNREAL(-2)) 0.158494 -0.27091 [ 0.58505]
D(LNREAL(-3)) 0.296454 -0.25768 [ 1.15046]
D(LNREAL(-4)) -0.377392 -0.24223 [-1.55799]
D(LNIMPR(-1)) -0.071862 -0.21965 [-0.32717]
D(LNIMPR(-2)) 0.244983 -0.25481 [ 0.96142]
D(LNIMPR(-3)) 0.34979 -0.23943 [ 1.46093]
D(LNIMPR(-4)) 0.258443 -0.19742 [ 1.30909]
D(LNPIBR(-1)) 0.303673 -0.25922 [ 1.17150]
D(LNPIBR(-2)) 0.022641 -0.20727 [ 0.10923]
D(LNPIBR(-3)) -0.210954 -0.20083 [-1.05040]
D(LNPIBR(-4)) -0.029536 -0.20425 [-0.14461]
CointEq1 -0.207923 -0.04995 [-4.16258]
Tabela 3.2.3 – Estimativas do VECM.
60
destes coeficientes em gráficos. O maior interesse deste trabalho é analisar a
dinâmica da resposta da balança comercial a variações no câmbio, o que pode ser
analisado através de funções impulso resposta.
Figura 3.2.1 - Resposta de lnxm a inovação de um desvio padrão em lnreal.
.00
.01
.02
.03
.04
.05
.06
1 2 3 4 5 6 7 8 9 10
A função impulso resposta da balança comercial em resposta a um choque no
câmbio mostra um aumento da balança comercial nos períodos subseqüentes ao
choque no câmbio, sendo que este aumento atinge o máximo depois de
aproximadamente quatro meses. Parece haver uma espécie de overshooting da
balança comercial, pois após atingir o máximo quatro meses depois do choque no
câmbio, há uma pequena retração na balança comercial, sendo que esta se
estabiliza em um novo nível após aproximadamente dez meses. A função impulso
resposta para este modelo linear de correção de erros rejeita a hipótese da curva J,
uma vez que a balança comercial não apresenta deterioração no curto prazo.
3.3 Modelo com Mudança de Regime Markoviano.
O fato de que a economia brasileira passou por várias mudanças no período
abordado, que afetaram as variáveis utilizadas neste trabalho, além da constatação
visual (Figura 3.1) de que as séries parecem possuir quebras estruturais, sugerem a
61
utilização de modelos não lineares que contabilizem estas mudanças. Desta
maneira, propõe-se a utilização de modelos MS-VEC.
Um problema que surge nos modelos MS-VEC é a determinação do número
de regimes. Os testes de razão de verossimilhança para a determinação do número
de regimes não têm distribuição assintótica padrão devido à existência de
parâmetros incômodos. Hansen (1992) e Garcia (1993) desenvolveram um
procedimento para a derivação da distribuição assintótica, porém esta não pode ser
padronizada para todos os modelos. A distribuição que pode ser derivada é
dependente dos dados e dos parâmetros do modelo, de forma que tem-se que
calcular uma distribuição assintótica para cada teste. Além, o cálculo destas
distribuições exige uma demorada simulação que se repete para cada especificação
desejada, o que limita muito seu uso em trabalhos empíricos com modelos muito
parametrizados (Krolzig,1997). Para a determinação do número de regimes foram
utilizados critérios de informação, já que é demonstrado que os critérios de
informação de Akaike e Schwartz nunca subestimam o número mínimo de regimes
(Rydén,1995). Os resultados se encontram na Tabela 3.3.1 do Anexo.
O modelo mais apropriado parece ser o MSMH(2)-VECM(4), onde a média e
a variância são dependentes do regime vigente. Neste caso, após uma mudança de
regime há um salto imediato na média do processo:
() ( )
4
1
1
tt ititi tt
i
ysv y s zu
µµα
−−
=
⎡⎤
∆− =+ Γ∆ + +
⎣⎦
,
onde s
t
=1,2, `
tt
zy
β
= e
(
)
(
)
0,
tt
uNID sΣ . Após a normalização do modelo não
linear de forma a colocar lnxm como variável dependente, obtém-se as seguintes
estimativas para as elasticidades:
62
Tabela 3.3.2 – Estimativas do MSMH(2)-VECM(4).
dxm Desvio Padrão t-valor
Média (Reg.1)
0.795951 0.2065 3.8544
Média (Reg.2)
0.788046 0.2044 3.8554
dxm_1
-0.3183 0.094 -3.3852
dxm_2
0.009631 0.0768 0.1253
dxm_3
0.119602 0.077 1.5541
dxm_4
0.121797 0.0738 1.6494
dreal_1
0.012341 0.2768 -0.0446
dreal_2
0.29702 0.2955 1.0053
dreal_3
0.350168 0.2881 1.2154
dreal_4
-0.32299 0.2394 -1.3492
dimpr_1
-0.12236 0.1965 -0.6227
dimpr_2
0.136474 0.2329 0.5860
dimpr_3
0.147492 0.237 0.6223
dimpr_4
0.180132 0.18 1.0010
dpibr_1
0.224533 0.2437 0.9214
dpibr_2
0.002029 0.2105 0.0096
dpibr_3
-0.19808 0.1994 -0.9932
dpibr_4
-0.16155 0.1981 -0.8154
z_1
-0.21396 0.0502 -4.2631
Desvio (Reg.1)
0.100029
Desvio (Reg.2)
0.137412
O coeficiente para a série exógena contendo as informações sobre a relação
de longo prazo entre as variáveis é significativo ao nível de significância de 1%.
Percebe-se que desvio padrão do segundo regime é 37% maior do que a do
primeiro regime. Percebe-se também que a média do primeiro regime é maior que a
do segundo regime. A maioria dos coeficientes apresenta sinal compatível com a
abordagem da absorção para a balança comercial, porém apenas o coeficiente da
primeira defasagem da balança comercial é significativo a 5%.
A Tabela 3.3.3 apresenta as datas estimadas de início e término de cada
regime, enquanto os gráficos na Figura 3.3.1 e 3.3.2 abaixo apresentam as
probabilidades suavizadas dos dois regimes:
63
Tabela 3.3.3 – Data dos Regimes.
Regime 1 Regime 2
Baixa Volatilidade Alta Volatilidade
1991:01 - 1991:2 1990:06 - 1990:12
1991:07 - 1991:09 1991:03 - 1991:06
1992:01 - 1994:06 1991:10 - 1991:12
1994:08 - 1995:02 1994:07 - 1994:07
1995:07 - 1998:12 1995:03 - 1995:06
1999:11 - 2001:02 1999:01 - 1999:10
2003:05 - 2003:12 2001:03 - 2003:04
Figura 3.3.1 – Probabilidades suavizadas do regime 1.
Figura 3.3.2 – Probabilidades suavizadas do regime 2.
O período analisado começa em janeiro de 1990 e termina em dezembro de
2003, porém, devido às quatro defasagens do modelo e à diferenciação dos dados,
64
se perde as cinco observações iniciais. Para uma recuperação da política cambial
brasileira dessa época, utiliza-se Bonomo e Terra (1999), que fazem uma síntese
dos acontecimentos que influenciaram a taxa de câmbio no período de 1964 a 1997,
Garcia (2004), bem como várias edições dos relatórios trimestrais de análise do
mercado de câmbio do Banco Central do Brasil.
Durante o período que vai de junho de 1990 a dezembro de 1991 esteve em
vigor o Planos Collor 1, houve de confiscou grande parte dos ativos líquidos da
economia brasileira e suspensão dos pagamentos da dívida do governo. Neste
período a taxa de câmbio real se manteve apreciada por grande parte do tempo,
devido à alta taxa de inflação, o que diminui os superávits comerciais.
Em janeiro de 1991 a inflação ultrapassava 20% ao mês e o governo lançou o
Plano Collor 2, baseado em congelamento de preços.
Em maio de 1991 a ministra da fazenda foi substituída e o controle de preços
foi suspenso. Após a entrada da nova equipe econômica, a taxa de câmbio foi
levemente desvalorizada e mantida constante até o final de setembro, quando houve
uma desvalorização de 14% devido à queda nas reservas durante os meses
anteriores.
A partir de setembro de 1991 o governo continuou desvalorizando lentamente
a moeda até fevereiro de 1992, quando se interromperam as desvalorizações e o
câmbio foi mantido nos mesmos níveis até meados de 1993.
De fevereiro de 1992 a meados de 1993 não houve desvalorizações. Em
maio de 1993 Fernando Henrique Cardoso assumiu o ministério da fazenda e sua
equipe econômica começou a formular o Plano Real. Em março de 1994 foi criada a
unidade de medida URV, que rapidamente foi aceita como indexador de preços.
Em 1 de julho o Cruzeiro Real, foi extinto e substituído pelo Real, que era
baseado na URV.
Na introdução da nova moeda, a paridade com o dólar era unitária. O governo
decidiu não intervir no câmbio, o que gerou uma apreciação do Real que chegou a
ser cotado US$1,20 no final de outubro, devido ao influxo de capitais. Este nível da
taxa de câmbio gerou uma queda nas exportações brasileiras, bem como um
aumento das importações. O superávit comercial de US$1 bilhão se transformou em
um déficit de US$700 milhões.
65
A partir de outubro de 1994 o governo começou a intervir no mercado de
câmbio de forma a manter a taxa de câmbio dentro de uma mini-banda informal.
Esta política se estendeu até fevereiro de 1995.
Em março de 1995 o câmbio foi desvalorizado em 6% e um regime de bandas
cambiais foi anunciado. A taxa de câmbio poderia varia 5% dentro desta banda e o
governo interviria no mercado se a taxa ultrapassasse este limite.
Após o estabelecimento de leilões de spread periódicos em julho de 1995, o
câmbio se tornou muito estável e o Banco Central foi capaz de conduzir a taxa de
câmbio dentro de limites muito menores que os estabelecidos pelo regime de
bandas. Porém, devido ao grande déficit em conta corrente gerado pela política
cambial, iniciou-se um debate sobre a sustentabilidade do regime de câmbio
adotado.
A taxa de câmbio fixa e o grande déficit comercial gerado por esta, tornaram a
economia brasileira extremamente dependente da entrada de capitais. As crises do
México, da Ásia e da Rússia afetaram o influxo de capital para o Brasil, reduzindo as
possibilidades de financiamento do déficit externo e gerando uma rápida queda nas
reservas nacionais. O mercado de câmbio foi pressionado pela queda no ingresso
de recursos financeiros via conta de capital e pelo fato de que serviços e
vencimentos de obrigações externas aumentavam a demanda por moeda
estrangeira. Nos últimos meses de 1998 o volume de emissão de bônus sofreu
violenta contração, com estreitamento dos prazos e elevação dos spreads. É nesse
contexto que se dá a desvalorização cambial de 15 de janeiro de 1999.
A desvalorização cambial foi seguida por especulações sobre a revisão do
acordo com o FMI e sobre mudanças no ministério da fazenda e no Banco Central,
declaração de moratória pelo governador de Minas Gerais, Itamar Franco e quedas
históricas no índice BOVESPA. Devido a este quadro negativo passou a haver forte
demanda por dólares, o que obrigou o Banco Central a vender grandes quantidades
de moeda estrangeira. Mesmo com a intervenção do BACEN, no final de fevereiro a
taxa de câmbio Real/Dólar já ultrapassava R$2,00. O mercado de câmbio continuou
volátil durante a maior parte do ano. Nos meses de março e abril a taxa recuou para
R$1,70, mas em agosto já estava em R$1,95 devido a especulações sobre
mudanças no regime cambial argentino, sendo que no final de setembro o dólar era
negociado a R$1,9223.
66
A partir de outubro de 1999 o câmbio deu sinais de recuperação, sendo que
em 31 de dezembro o dólar era cotado a R$1,7890. Até o início do primeiro trimestre
de 2001 o mercado cambial operou relativamente estável, sendo que a cotação
mensal média deste período foi R$1,8279, com variância de apenas R$0,0041.
No mês de março, as duas trocas de ministro da economia na argentina em
menos de um mês, como também as incertezas quanto aos efeitos da
desaceleração da economia americana trouxeram uma maior instabilidade para o
mercado de câmbio. No final de março a moeda americana era negociada
novamente acima de R$2,00. O dólar continuou a trajetória ascendente nos meses
seguintes, sendo que em 19 de julho de 2001, o dólar chegou à cotação de
R$2,4675. No mês de setembro, os atentados terroristas nos E.U.A. trouxeram ainda
mais instabilidade para o mercado cambial brasileiro, sendo que de janeiro a
setembro de 2001 o Banco Central já tinha gasto US$5,3 bilhões com intervenções
cambiais, enquanto em todo o ano de 2002 as intervenções somaram US$4,6
bilhões. Em fevereiro de 2002 o fim do regime de câmbio fixo na Argentina gerou
muita incerteza quanto à reação do peso ao regime de câmbio flutuante. Neste
contexto, os bancos no Brasil mantinham posições compradas em dólar como forma
de proteção, o que continuou a pressionar o câmbio. No mês de julho o dólar fechou
cotado a R$2,84, refletindo as incertezas do mercado em relação ao crescimento da
candidatura da oposição para as eleições de outubro. Os analistas financeiros
temiam que, com a eventual vitória do candidato petista, poderia haver uma
descontinuidade da ortodoxia fiscal e monetária utilizada pelo governo vigente. Com
o aumento das incertezas no cenário político e a subseqüente recomendação por
parte de alguns bancos de investimento estrangeiros para que seus clientes
diminuíssem a exposição a títulos da dívida externa brasileira, aumentou a demanda
por dólar tanto pelo lado das empresas quanto pelo das tesourarias dos bancos. A
vitória do partido oposicionista nas eleições de outubro de 2002 aumentou ainda
mais a volatilidade do mercado de câmbio, sendo que o dólar chegou a ser cotado a
R$3,75. Esta incerteza só se dissipou a partir do segundo trimestre de 2003.
No final de março o comportamento da taxa de câmbio se tornou mais
estável, devido à confiança dos agentes externos na determinação do novo governo
em manter a austeridade econômica, inclusive com a realização de reformas
estruturais importantes como a da previdência. O processo de reversão das
expectativas culminou com uma acentuada desvalorização do dólar, impulsionada
67
pela entrada de capitais estrangeiros motivados pelo alto diferencial entre os juros
brasileiros e internacionais, sendo que em abril o dólar era negociado a R$2,889. A
confiança no novo governo e a estabilidade do cenário externo contribuíram para um
período de tranqüilidade no mercado cambial até o final de 2003.
O regime 2 parece coincidir com momentos de maior volatilidade no mercado
de câmbio e instabilidade econômica. As datas estimadas para este regime são
relativas a períodos de alterações no regime cambial, que acabam por gerar
instabilidade no mercado de câmbio. Fazem parte deste regime os períodos de mini-
desvalorizações do Plano Collor 1 e 2, o início do Plano Real e a primeira
desvalorização da nova moeda que levou ao estabelecimento do regime de bandas
cambiais, a liberalização do câmbio de 1999, bem como o período da crise Argentina
que foi seguido pelo atentado de 11 de setembro e pela instabilidade do período
eleitoral. Já o regime 1 se encaixa nos momentos de maior estabilidade, como o
primeiro mandato do presidente Fernando Henrique Cardoso e o segundo semestre
de 2003.
O fato do regime de alta volatilidade apresentar média mais baixa mostra que
períodos de grande volatilidade cambial são caracterizados por um saldo menor na
balança comercial. Teles (2003), usando um modelo teórico baseado na hipótese de
histerese e abordando apenas o período entre julho de 1994 e maio de 2003,
concluiu que a mudança de um regime de câmbio fixo para o regime de flutuação
cambial alterou a taxa de câmbio limite sob a qual as firmas domésticas decidem
aumentar sua produção para exportação. Esta parece ser uma explicação para a
menor média durante o período de alta volatilidade.
Para analisar os resultados das estimativas do modelo MSMH(2) VECM(4),
novamente se utiliza as funções impulso resposta. Como não há mudança nos
parâmetros auto-regressivos do modelo, as funções impulso resposta apresentam a
mesma dinâmica. Entretanto, a variância do primeiro regime é menor, o que faz com
que o choque de um desvio padrão do segundo regime seja maior.
68
Figura 3.4 – Funções Impulso-Resposta do modelo MSMH(2)-VECM(4).
Como no modelo linear, não há evidência de curva J na dinâmica de
ajustamento da balança comercial após uma desvalorização cambial. De acordo
com a função impulso resposta, a condição de Marshall-Lerner é válida mesmo no
curto prazo, apesar do impacto total do choque na taxa de câmbio sobre a balança
comercial não se realizar no mesmo período da desvalorização, mas somente após
mais de um ano.
Portanto, percebe-se que a modelagem não linear da relação entre a balança
comercial e o câmbio é a mais adequada para o caso do Brasil. Isto ficou evidente
através dos critérios de informação, bem como pelo ajustamento dos regimes aos
períodos de alterações ou turbulências no mercado cambial brasileiro.
69
Conclusão
O objetivo deste trabalho é a analise empírica da relação de curto e longo
prazo entre balança comercial e taxa de câmbio para a economia brasileira, no
período compreendido entre janeiro de 1990 e dezembro de 2003, com o intuito de
verificar a validade da hipótese da curva J.
Para atingir o primeiro objetivo foram usados modelos VECM, que
possibilitam a análise de curto e longo prazo da relação entre as variáveis em
questão. Como o coeficiente para o termo de correção de erro foi significante ao
nível de 1% de significância, existe forte evidência de uma relação de longo prazo
entre balança comercial e taxa de câmbio. A relação de longo prazo estimada é
positiva, o que confirma a condição de Marshall-Lerner. Para a análise da hipótese
da curva J, se utiliza funções de impulso resposta, de forma a verificar se estas
possuem um padrão temporal semelhante à letra J. Porém, não foi possível verificar
uma piora na balança comercial após a desvalorização cambial, o que contradiz a
hipótese da curva J.
Analisando-se os resultados dos coeficientes estimados para renda local, foi
observado que somente no longo prazo eles estão em conformidade com a
abordagem da absorção, que prevê coeficientes negativos para a renda local. No
curto prazo o coeficiente estimado é positivo, o que contraria a teoria. O coeficiente
de longo prazo estimado, bem como o de curto prazo, para a renda externa não
estão de acordo com abordagem da absorção, uma vez que apresenta sinal
negativo, contrariando a teoria.
Para contabilizar pelas várias alterações no regime cambial brasileiro no
período, bem com pelos planos econômicos e choques externos ocorridos, utilizou-
se a metodologia de modelos MS VECM. A vantagem deste método é poder estimar
variações dos parâmetros ao longo do tempo, o que pode captar mudanças na
relação entre as variáveis no período analisado. Além disso, esta é uma metodologia
mais geral, sendo que o modelo linear VECM é apenas um caso dentre todas as
especificações possíveis.
Os critérios de informação mostraram que o melhor modelo para os dados
analisados é o MSMH(2) VECM(4). Este é um modelo vetorial de correção de erros
com dois regimes na média e na matriz de variância. O primeiro regime é
caracterizado por uma média maior e uma menor variância, captando os períodos de
70
maior estabilidade na economia brasileira e mundial. O segundo regime é
caracterizado por menor média e maior variância, e se encaixa nos períodos de
maior turbulência da economia brasileira.
Portanto, parece que quanto maior a volatilidade nas variáveis, menor é o
saldo da balança comercial. Logo, uma menor volatilidade do câmbio parece ser
mais favorável ao comércio internacional. Este resultado pode ser ligado a Teles
(2003), que usando uma abordagem de histerese, chegou à conclusão de que o
aumento na volatilidade do câmbio faz com que os exportadores reajam mais
cautelosamente a uma desvalorização cambial.
Os resultados do modelo não linear confirmaram os resultados do modelo
linear e mostra que a condição de Marshall-Lerner é válida mesmo no curto prazo.
Além disso, as funções de impulso resposta não confirmam a hipótese da curva J.
71
Referências Bibliográficas.
Alexander, S. S. (1952) “Effects of a Devaluation on the Trade Balance”, IMF
Staff Papers, 2, 263-78.
Alexander, S. S. (1959) “Effects of a Devaluation: a simplified synthesis of the
elasticities and absortion approaches”, American Economic Review, 49, 21-
42.
Antonucci, D. (2003). Effects of exchange rate changes on the Italian trade
balance: the J-Curve. CSC working paper, n. 39.
Arize, A.C. (1994) Cointegration test of a long-run relation between the real
effective exchange rate and the trade balance. International Economic
Journal, 8, 1-9.
Backus D. K., Kehoe P. J., Kydland F. E. (1994), Dynamics of the Trade
Balance and the Terms of Trade: the J-Curve? American Economic Review
84, 84-103.
Bacchetta, P., Gerlach, S., 1994. Sticky import prices and J-curves.
Economics Letters 44 (3), 281–285.
Baharumshah, A.Z. (2001) The effect of exchange rate on bilateral trade
balance: new evidence from Malaysia and Thailand. Asian Economic Journal,
15, 291-312.
Bahmani-Oskooee M. (1985), Devaluation and the J-Curve: some Evidence
from LDCs, Review of Economics and Statistics 67, 500-504.
Bahmani-Oskooee, M. (1991) Is there a long-run relation between the trade
balance and the real effective exchange rate of LDCs? Economics Letters, 36,
403-407.
72
Bahmani-Oskooee M., Alse J. (1994), Short-Run Versus Long-Run Effects of
Devaluation: Error-Correction Modeling and Cointegration, Eastern
Economic Journal 20, 453-464.
Bahmani-Oskooee, M., Kantipong, T. (2001) Bilateral J-Curve between
Thailand and her trading partners. Journal of Economic Development, 6, 107-
117.
Baldwin, A. (1988) "Hysteresis in Import Prices: The Beachhead Effect"
American Economic Review, 78, p.773-785.
Banerjee, A., Dolado, J.J., Galbraith, W., Hendry, D.F., 1993. Cointegration,
error-correction, and the econometric analysis of non-stationary data. Oxford
University Press, Oxford.
Beveridge, S., Nelson, C. R. (1981). A new approach to decomposition of
economic time series into permanent and transitory component with particular
attention to measurement of the `business cycle`. Journal of Monetary
Economics. 7, 151-174.
Bhagwati, J. (1958). Immeserizing Growth: A Geometrical Note. Review of
Economic Studies, vol. 25.
Bickerdike, C. F. (1920).The Instability of Foreign Exchanges. The Economic
Journal. Março.
Bonomo, M. , Terra, C. (1999). The Political Economy of Exchange Rate
Policy in Brazil: 1964-1997. FGV-Rio, texto para discussão.
Box, G.E.P. and G.M. Jenkins (1976) Time Series Analysis: Forecasting and
Control. Revised Edition. San Francisco: Holden-Day.
73
Brada J. C., Kutan A. M., Zhou S. (1993), China's Exchange Rate and the
Balance of Trade, Economics of Planning 26, 229-242.
Brada, J.C., Kutan A.M., S. Zhou (1997), “The Exchange Rate and the
Balance of Trade: The Turkish Experience,” Journal of Development Studies,
33, 675-692.
Buluswar, M.D., Thompson, H. and Upadhyaya, K.P. (1996) Devaluation and
the trade balance in India: stationarity and cointegration. Applied Economics,
28, 429-432.
Campbell, J.Y., P. Perron (1991) “Pitfalls and Opportunities: What
Macroeconomists Should Know about Unit Roots”, NBER Macroeconomics
Annual, 141-200.
Campbell, J.Y. , Mankiw, N. G. (1987). Are output fluctuations transitory?
Quaterly Journal of Economics. 102, 857-880.
Clark, P. K. (1987). The cyclical component of U.S. economic activity. Quaterly
Journal of Economics. 102, 798-814.
Christiano, L. J. (1992). Searching for breaks in the GNP. Journal of business
and Economic Statistics. 10, 237-250.
Davidson, J.E.H., D.F. Hendry, F. Srba and S. Yeo (1978) Econometric
Modelling of the Aggregate Time-Series Relationship Between Consumer’s
Expenditure and Income in the United Kingdom,Economic Journal,
86,661&692.
DeJong, D. N., Nankervis, J. C., Savin, N. E., Whiteman, C. H. (1990).
Integration versus trend-stationarity in time series. Mimeo, University of Iowa.
74
Diebold, F.X. (1990) On ‘Unit Root Econometrics’: Discussion of Geweke,
Sims, and DeJong and Whiteman, in: Proceedings of the American Statistical
Association Business and Economics Statistics Session. Washington, D.C.:
American Statistical Association.
Dickey, D.A., W.A. Fuller, 1979. Distributioir of the estimators for
autoregressive time series with unit root. Journal of the American Statistical
Association. 74,427-431.
Diebold, F.X. and M. Nerlove (1990) Unit Roots in Economic Time Series: A
Selective Survey, in: T.B. Fomby and G.F. Rhodes, eds., Advances in
Econometrics: Co-Integration, Spurious Regressions, and Unit Roots.
Greenwich, CT: JAI Press.
Dixit A (1994), Hysteresis and the Duration of the J-curve, Japan and the
World Economy 6, 105-115.
Demirden, T., I. Pastine (1995), “Flexible Exchange Rates and the J-Curve: An
Alternative Approach,” Economics Letters, 48, 373-377.
Dornbusch, R. (1973). Devaluation, Money and Nontraded Goods. American
Economic Review. 5, 871-880.
Dornbusch, R. (1975). Exchange rates and fiscal policy in a popular model of
international trade. American Economic Review 65, 859-871.
Dornbusch, R. (1987). Purchasing power Parity. The New Palgrave Dictionary,
Stockton Press.
Dombusch. R., P. Krugman (1976). Flexible exchange rates in the short run.
Brookings Papers on Economic Activity, 537-575.
75
Engle. R.F. (1984) Wald. Likelihood Ratio. and Lagrange Multiplier Tests in
Econometrics, in: 2. Griliches and M. Intriligator, eds., Handbook of
Econometrics. North-Holland: New York, Vol. 2, 775-826.
Engle. R.F. and C.W.J. Granger, 1987, Co-integration and error correction:
Representation, estimation and testing, Econometrica 55, 1251-1276.
Engle, R.F. e Yoo, B.S.(1987). Forecasting and testing in cointegrated
systems. Journal of Econometrics, 35.
Evans, G.B.A. and N.E. Savin (1981), Testing for Unit Roots: I, Econometrica,
49, 753-779.
Evans, G.B.A. and N.E. Savin (1984), Testing for Unit Roots: II, Econometrica,
52, 1241-1260.
Felmingham B. S. (1988), Where is the Australian J-Curve?, Bulletin of
Economic Research 40, 43-56.
Felmingham, B.S., and S. Divisekera (1986), “The Response of Australia’s
Trade Balance Under Different Exchange Rate Regimes,” Australian
Economic Papers, 25, June, 33-46.
Fialho, M. (2004). Interação entre as Políticas Monetária e Fiscal no Brasil sob
a Ótica da Teoria Fiscal do Nível de Preços. UFRGS, Dissertação de
mestrado.
Fuller, W.A. (1976) Introduction to Statistical Time Series. New York:Wiley.
Garcia, M. (2004) Vulnerabilidade externa e as crises do Plano Real sob
câmbio flutuante: como escaper da armadilha dos juros reais muito elevados?
Disponível em http://www.econ.puc-rio.br/Mgarcia/.
76
Garcia, R. (1993). Asynptotic Null Distribution of Likelihood Ratio Test in
Markov Switching Models. Université de Montréal, working paper.
Granger, C.W.J. (1983) Co-Integrated Variables and Error-Correcting Models,
UCSD Discussion Paper83-13.
Granger, C.W.J. and T.-H. Lee (1990) Multicointegration, Advances in
Econometrics, 8, 71-84.Reprinted in: R.F. Engle and C.W.J. Granger, eds.,
Long-Run Economic Relations: Readings in Cointegration. Oxford University
Press: New York, 1991.
Granger, C.W.J. and P. Newbold (1974) Spurious Regressions in
Econometrics, Journal of Econometrics, 2, 11 l-20.
Granger, C.W.J. and P. Newbold (1976) Forecasting Economic Time Series.
Academic Press: New York.
Granger, C.W.J. and A.A. Weiss (1983) Time Series Analysis of Error-
Correcting Models, in: Studies in Econometrics, Time Series and Multivariate
Statistics. Academic Press: New York, 255-78.
Gerlach S. (1989), Intertemporal Speculation, Devaluation, and the J-curve,
Journal of International Economics 27, 335-345.
Greenwood, J. (1984) Non-traded goods, the trade balance, and the balance
of payments. Canadian Journal of Economics, 17, 806-823.
Gupta-Kapoor, A. e Ramakrishnan, U. (1999) Is there a J-Curve? A new
estimation for Japan. International Economic Journal, 4.
Hamilton, J.D. (1989).A new approach to the economic analysis of non
stationary time series and business cycle. Econometrica. 57, 357-384.
77
Hamilton, J.D. (1994) Time Series Analysis. Princeton University Press:
Princeton, NJ.
Hansen, B. E. (1992). The likelihood ratio test under non-standard conditions:
testing the markov swithing model of GNP. Journal of Applied Econometrics,
7, S61-S82.
Harberger, A. C. (1950). Currency Depreciation, Income, and the Balance of
Trade. Journal of Political Economy. 58, 47-60.
Harvey, A. C. (1985). Trends and cycles in macroeconomic time series.
Journal of Business and Economics Statistics. 3(3), 216-227.
Hendry, D.F. (1986), Econometric modelling with cointegrated variables: An
overview. Oxford Bulletin of Economics and Statistics 48, 201–212.
Haynes, S. E., Stone, J. A. (1982). Impacts of the terms of trade on the U.S.
trade balance: a reexamination. The Review of Economics and Statistics. 702-
706.
Himarios, D. (1989), Do Devaluations Improve the Trade Balance? The
Evidence Revisited, Economic Inquiry, 27, January, 143-168.
Hsing H., Savvides A. (1996), Does J-Curve Exist for Korea and Taiwan?
Open Economies Review 7, 127-145.
Johansen, S. (1988). Statistical Analysis of Cointegration Vectors. Journal of
Economic Dynamics and Control, 12.
Johansen, S., Juselius, K., 1990. Maximum likelihood estimation and
inference on cointegration — with application to the demand for money.
Oxford Bulletin of Economics and Statistics 52, 169–210.
78
Johansen, S. (1991). Estimation and hypothesis testing of cointegrating
vectors in gaussian vector autoregressive models. Econometrica. 59, 1551-
1580.
Johansen, S. (1995). Likelihood-Based Inference in Cointegrating Vector
AutoregressiveModels. Oxford University Press.
Juselius, K., 1995. Do purchasing power parity and uncovered interest rate
parity hold in the long run? An example of likelihood inference in a multivariate
time-series model. Journal of Econometrics 69, 211–240.
Junz H. B., Rhomberg R. R. (1973), Price Competitiveness in Export Trade
Among Industrial Countries, American Economic Review 63, 412-418.
Kemp, M. C. (1970). The Balance of Payments and the Terms of Trade in
Relation to Financial Control. Review of Economic Studies. 37, 25-31.
Koray, F. and McMillin, W. Douglas (1999). Monetary Shocks, the Exchange
Rate, and the Trade Balance, Journal of International Money and Finance 18,
no. 6, pp. 925-40.
Kremers, J.J., N.R. Ericson, and J.J. Dolado (1992). The Power of
Cointegration Tests, Oxford Bulletin of Economics and Statistics, 54, 325-347.
Krolzig, H. M. (1995). Specification of Autoregressive Process with Markov
Switching Regime Based ARMA Representation. Humboldt Universität zu
Berlin, texto para discussão.
Krolzig, H. M. (1997). Markov-Switching Vector Autoregressions. Sprienger-
Verlang, Berlin.
79
Krolzig, H. M. (1998). Econometric Modelling of Markov-Switching Vector
Autoregression using MSVAR for Ox. Institute of Economics and Statistics,
and Nuffield College, texto didático.
Krolzig, H. M., Toro, J. (2000). A New Approach to the Analysis of Business
Cycle Transitions in a Model of Output and Employment. Institute of
Economics and Statistics, Oxford, texto para discussão.
Krueger, A.D. (1983). Exchange Rate Determination, Cambridge University
Press.
Krugman, P. (1987). Pricing to Market When the Exchange Rate Changes. Em
Real Financial Linkages Among Open Economies, MIT Press.
Krugman P. R., Baldwin R. E. (1987). The Persistence of U.S. Trade Deficit,
Brookings Papers on Economic Activity 1, 1-43.
Krugman, P.; Obstfeld, M. (1991). International Economics, 2nd ed., Harper
Collins, NY.
Lal, A.K. and Lowinger, T.C. (2002) Nominal effective exchange rate and trade
balance adjustment in South Asia countries. Journal of Asian Economics, 13,
371-383.
Lerner, A. P. (1944). The Economics of Control: Principles of Welfare
Economics. The Macmillan Company, N.Y..
Lindert, P. H., Kindleberger, C.P. (1982). International Economics. Irwin Series
in Economics, Homewood, IL..
Lütkepohl, H., Saikkonen, P.(1996). Infinite order cointegrated vector
autoregressive processes: Estimation and inference. Econometric Theory
12, 814-844.
Lütkepohl, H., P. Saikkonen (1997). Impulse response analysis in infinite
80
order cointegrated vector autoregressive processes. Journal of Econometrics
81, 127-157.
Luukkonen, R. , P. Saikkonen (1995). Power of the Lagrange multiplier
test for testing an autoregressive unit root. Economics Letters 51, 27-35.
Magee S. P. (1973), Currency Contracts, Pass-through, and Devaluation,
Brookings Papers on Economic Activity 1, 303-323.
Mahdavi, S. and Sohrabian, A. (1993) The exchange value of the dollar and
the US trade balance: an empirical investigation based on cointegration and
Granger causality tests. Quarterly Review of Economics and Finance, 33, 343-
358.
Mansoorian A. (1998), Habits and Durability in Consumption, and the
Dynamics of the Current Account, Journal of International Economics 44, 69-
81.
Marshall, A. (1923). Money, Credit and Commerce. Macmillan, London.
Marwah, K., and L.R. Klein (1996), Estimation of J-Curve: United States and
Canada, Canadian Journal of Economics, 29, August, 523-539.
Meade, J. (1951). The Balance of Payments. Oxford University Press.
Metzler, L. (1948). A Survey of Contemporary Economics, vol. I. Richard Irwin,
Homewood, IL..
Miles, M.A. (1979), “The Effects of Devaluation on the Trade Balance and the
Balance of Payments: Some New Results,” Journal of Political Economy, 87,
June, 600-620.
Moffett M. H. (1989), The J-Curve Revisited: an Empirical Examination for the
United States, Journal of International Money and Finance 8, 425-444.
81
Moraes, I., Portugal, M. (2003). Structural Change in the Brazilian Demand for
imports: A Regime Switching Approach. UFRGS, texto para discussão,
2003/13.
Nelson, C. R., Plosser, C. I. (1982), Trends and random walks in
macroeconomic time series. Journal of Monetary Economics. 10, 139-162.
Ng, S., P. Perron, (1995). Unit root tests in ARMA models with data dependent
methods for the selection of the truncation lag. Journal of the American
Statistical Association . 90, 268-281.
Onafowora, O. (2003), Exchange Rate and Trade Balance in East Asia: Is
There a J-Curve?, EconomicsBulletin.
Osterwald-Lenum, M. (1992).”A note with fractiles of the asymptotic
distribution of the maximum likelihood cointegration rank test statistics: Four
cases”. Oxford Bulletin of Economics and Statistics, 54.
Peron, P. (1988). Trends and random walks in macroeconomic time series:
Further evidence from a nem approach. Journal of Economic Dynamics and
Control. 12, 297-332.
Peron, P. (1989). The great crash, the oil price shock and the unit root
hypothesis. Econometrica. 57, 1361-1401.
Peron, P. (1997). Further evidence on breaking trends functions in
macroeconomic variables. Journal of Econometrics. 80, 355-385.
Perron, P., T-J. Vogelsang (1992). Nonstationarity and level shifts with an
application to purchasing power parity. Journal of Business and Economic
Statistics. 10, 301-320.
Pesaran, M.H., Shin, Y. (1996), Cointegration and speed of convergence to
equilibrium. Journal of Econometrics 71, 117–143.
82
Phillips, P.C.B., Perron, P. (1988), Testing for a unit root in time series
regression. Biometrika 75, 335–346.
Rahman, M. and Mustafa, M. (1996) The dancing of the real exchange rate of
US dollar and the US real trade balance. Applied Economics Letters, 3, 807-
808.
Rahman, M., Mustafa, M. and Burckel, D.V. (1997) Dynamics of the yen-dollar
real exchange rate and the US-Japan real trade balance. Applied Economics,
29, 661-664.
Relatório Trimestral de Análise do Mercado de Câmbio. Banco Central do
Brasil. Várias edições.
Rincón, H. (1998) Testing the short and long run exchange rate effects on the
trade balance: The case of Colombia. working paper University of Illinois.
Robinson, J. (1947). Essays in the Theory of Employment. Basil Blackwell,
London.
Rose A. K., Yellen J. L. (1989), Is There a J-Curve?, Journal of Monetary
Economics 24, 53-68.
Rosensweig, J.A., and P.D. Koch (1988), The U.S. Dollar and the Delayed J-
Curve, Economic Review, 73, Federal Reserve Bank of Atlanta, July/August,
2-15.
Rydén, T. (1995). Estimating the order of hidden markov models. Statistics,
26, 345-354.
Said, S.E., D.A. Dickey (1984). Testing for unit roots in autoregressive -
moving average models of unknown order. Biometrika 71, 599-608.
83
Saikkonen, P. (1992). Estimation and testing of cointegrated systems by na
autoregressive approximation. Econometric Theory. 8, 1-27.
Saikkonen, P., Luukkonen, R. (1997). Testing cointegration in infinite
order cointegrated vector autoregressive processes. Journal of Econometrics
81, 93-126.
Salop, J.K. (1974). Devaluation and Balance of Trade Under Flexible Wages.
F.E.D. Intenational Finance Discussion Paper, n. 27.
Senhadji, A.S. (1998), Dynamics of the Trade Balance and the Terms of Trade
in LDCs:The S-Curve, Journal of International Economics, 46, 105-131.
Stock, J. e Watson, M. (1988).Testing for comon trends. Journal of the
American Statistical Association, 83.
Teles, Vladimir Kühl (2003), Choques Cambiais: Política Monetária e
Equilíbrio Externo da Economia Brasileira em um Ambiente de Hysteresis,
Anais do XXV Encontro Brasileiro de Econometria.
Watson, M. W. (1986). Univariate detrending methods with stochastic trends.
Journal of Monetary Economics. 18, 1-27.
Wei, W.X. (1999) An empirical study of the foreign trade balance in China.
Applied Economics Letters, 6, 485-490.
84
Apêndice
Tabela 3.1.1 – Estatísticas Descritivas.
Série Obs Mean Std Error Minimum Maximum
lnxm 168 0.169773 0.276411 -0.396838 0.745195
lnreal 168 4.486688 0.222783 4.062519 5.081669
lnpibr 168 6.162157 0.098654 5.86521 6.583862
lnimpr 168 1.405084 0.275638 0.90829 1.916716
Tabela 3.1.2 – Teste ADF.
Nível Primeira diferença
Série
lnxm -2.118219 -2.261872 -1.888342
-18.7365 -18.74535 -18.80222
lnreal -2.12053 -1.665742 1.171722
-9.561508 -9.597206 -9.502779
lnpibr -3.413373 -3.212559 -0.305698
-7.547178 -10.62408 -10.65189
lnimpr -2.533028 -0.359855 1.322549
-6.868682 -3.921123 -16.24827
Nota: Os valores em negrito denotam rejeição da hipótese nula de raiz unitária ao nível de
significância de 5%.
Tabela 3.1.3 Teste de raiz unitária baseado em Perron (1997).
Modelo lnxm lnreal lnpibr lnimpr
1 -4.26519 -3.89801
-6.86492
-3.75716
2 -4.52955
-5.33981 -8.78159
-3.39941
3 -2.96843 -4.32458 -4.23698 -2.69416
Nota: Os valores em negrito denotam rejeição da hipótese nula de raiz unitária ao nível de
significância de 5%.
Tabela 3.1.4 – Datas das quebras estruturais dadas pelo teste Perron (1997).
Modelo lnxm lnreal lnpibr lnimpr
1 1994-08 1994-06 1993-10 2001-09
2 1996-12 1998-11 1993-10 1999-11
3 1998-03 1997-05 1995-01 1999-10
τ
τ
τ
τ
µ
τ
µ
τ
τ
τ
85
Tabela 3.2.1 – Critérios AIC e BIC para seleção do número de defasagens.
Nº de Lags AIC BIC
8 -10.8387 -8.301666
7 -10.9106 -8.690424
6 -11.1417 -9.235736
5 -11.0883 -9.493935
4 -10.8902 -9.604841
3 -10.7539 -9.775046
2 -10.5183 -9.843404
1 -10.1921 -9.818636
Tabela 3.2.2 – Testes de Cointegração.
H0
Autovalor 0.190723 0.134642 0.02508
Traço 62.23588 27.7427 4.170876
Valor ctico a 5% 47.21 29.68 15.41
0r =
1r
2r
Tabela 3.3.1 – Critérios de informação para a seleção do modelo.
Critério de Informação
Modelo AIC HQ BIC
MSIAH(3)
-12,558
-10,616 -7,775
MSMAH(3)
-7,293 -5,351 -2,510
MSIA(3)
-12,020 -10,233 -7,617
MSMA(3)
-7,539 -5,751 -3,135
MSIH(3) .............. .............. ...............
MSMH(3)
-11,863 -10,969 -9,661
MSI(3)
-11,761 -11,021 -9,939
MSM(3) .............. ............... ...............
MSIAH(2)
-11,754 -10,475 -8,604
MSMAH(2)
-8,023 -6,744 -4,872
MSIA(2)
-11,710 -10,508 -8,749
MSMA(2)
-8,146 -6,944 -5,185
MSIH(2)
-12,090 -11,335 -10,230
MSMH(2)
-12,115
-11,360 -10,255
MSI(2)
-11,571 -10,892 -9,900
MSM(2)
-11,479 -10,801 -9,809
Linear
-11,494 -10,862 -9,937
86
Tabela 3.3.4 - Matriz de probabilidades de transição e duração dos regimes.
Regime 1 Regime 2 n. obs Prob. Duração
Regime 1 0.9381 0.0619 106.8 0.6797 16.14
Regime 2 0.1315 0.8685 56.2 0.3203 7.61
Livros Grátis
( http://www.livrosgratis.com.br )
Milhares de Livros para Download:
Baixar livros de Administração
Baixar livros de Agronomia
Baixar livros de Arquitetura
Baixar livros de Artes
Baixar livros de Astronomia
Baixar livros de Biologia Geral
Baixar livros de Ciência da Computação
Baixar livros de Ciência da Informação
Baixar livros de Ciência Política
Baixar livros de Ciências da Saúde
Baixar livros de Comunicação
Baixar livros do Conselho Nacional de Educação - CNE
Baixar livros de Defesa civil
Baixar livros de Direito
Baixar livros de Direitos humanos
Baixar livros de Economia
Baixar livros de Economia Doméstica
Baixar livros de Educação
Baixar livros de Educação - Trânsito
Baixar livros de Educação Física
Baixar livros de Engenharia Aeroespacial
Baixar livros de Farmácia
Baixar livros de Filosofia
Baixar livros de Física
Baixar livros de Geociências
Baixar livros de Geografia
Baixar livros de História
Baixar livros de Línguas
Baixar livros de Literatura
Baixar livros de Literatura de Cordel
Baixar livros de Literatura Infantil
Baixar livros de Matemática
Baixar livros de Medicina
Baixar livros de Medicina Veterinária
Baixar livros de Meio Ambiente
Baixar livros de Meteorologia
Baixar Monografias e TCC
Baixar livros Multidisciplinar
Baixar livros de Música
Baixar livros de Psicologia
Baixar livros de Química
Baixar livros de Saúde Coletiva
Baixar livros de Serviço Social
Baixar livros de Sociologia
Baixar livros de Teologia
Baixar livros de Trabalho
Baixar livros de Turismo