Download PDF
ads:
Rodrigo Simões Atherino
Estimação de Reservas IBNR por Modelos
em Espaço de Estado: Empilhamento por
Linhas do Triângulo Runoff
Tese de Doutorado
Tese apresentada ao Programa de Pós-graduação
em Engenharia Elétrica do Departamento de
Engenharia Elétrica da PUC-Rio como parte dos
requisitos parciais para obtenção do título de Doutor
em Engenharia Elétrica.
Orientador: Prof. Cristiano Augusto Coelho Fernandes
Co-orientador: Prof. Adrian Heringer Pizzinga
Rio de Janeiro
Dezembro de 2008
ads:
Livros Grátis
http://www.livrosgratis.com.br
Milhares de livros grátis para download.
Rodrigo Simões Atherino
Estimação de Reservas IBNR por Modelos
em Espaço de Estado: Empilhamento por
Linhas do Triângulo Runoff
Tese apresentada como requisito parcial para obtenção
do grau de Doutor pelo Programa de Pós-Graduação
em Engenharia Elétrica do Departamento de
Engenharia Elétrica do Centro Técnico Científico da
PUC-Rio. Aprovada pela Comissão Examinadora
abaixo assinada.
Dr. Cristiano Augusto Coelho Fernandes
Orientador
Departamento de Engenharia Elétrica – PUC-Rio
Dr. Adrian Heringer Pizzinga
Co-orientador
PUC-Rio
Dr. Álvaro de Lima Veiga Filho
Departamento de Engenharia Elétrica – PUC-Rio
Dr. Marcelo Cunha Medeiros
Economia – PUC-Rio
Dr. Kaizô Iwakami Beltrão
ENCE/IBGE
Dr. Nei Carlos dos Santos Rocha
UFRJ
Prof. José Eugenio Leal
Coordenador Setorial do Centro
Técnico Científico
Rio de Janeiro, 17 de dezembro de 2008
ads:
Todos os direitos reservados. É proibida a reprodução total ou
parcial do trabalho sem autorização da universidade, do autor e do
orientador.
Rodrigo Simões Atherino
Graduou-se em Engenharia Elétrica com ênfase em
Telecomunicações pela PUC-Rio, tendo realizado trabalhos de
pesquisa na área de Processamento de Imagens, assim como em
Mobilidade de Sistemas Celulares. Especializou-se em Redes de
Computadores e obteve o título de Mestre em Engenharia Elétrica
com ênfase em Métodos de Apoio à Decisão pela mesma
instituição. Trabalhou nas empresas Globalstar do Brasil na área de
Sistemas de Comunicações Celulares via Satélite; na empresa
Embratel, na área de Planejamento de Rede de Dados e Internet; na
empresa Telemar, área de Outsourcing e Projetos Complexos de
Telecomunicações; e na gestora de recursos JGP, na área de
Pesquisas Quantitativas.
Ficha Catalográfica
CDD: 621.3
Atherino, Rodrigo Simões
Estimação de reservas IBNR por modelos em espaço de
estado: empilhamento por linhas do triângulo Runoff / Rodrigo
Simões Atherino ; orientador: Cristiano Augusto Coelho
Fernandes ; co-orientador: Adrian Heringer Pizzinga. – 2008.
57 f. ; 30 cm
Tese (Doutorado em Engenharia Elétrica) Pontifícia
Universidade Católica do Rio de Janeiro, Rio de Janeiro, 2008.
Inclui bibliografia
1. Engenharia elétrica Teses. 2. Espaço de estado. 2.
Filtro de Kalman.
3. IBNR. 4. Valores faltantes. I. Fernandes,
Cristiano Augusto Coelho. II. Pizzinga, Adrian Heringer. III.
Pontifícia Universidade Católica do Rio de Janeiro.
Departamento de Engenharia Elétrica. IV. Título.
Agradecimentos
Gostaria de fazer os seguintes agradecimentos:
- Ao meu amigo e co-orientador prof. Adrian ``Master'' Pizzinga, não só pela sua
orientação e pelo auxílio técnico, mas também pelos agradáveis momentos de
convivência;
- Ao meu orientador, prof. Cristiano Fernandes, pelo apoio e pela confiança
depositada em mim durante todo este longo trajeto;
- Ao Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq) e
à Escola Nacional de Seguros (FUNENSEG) pelo apoio financeiro. Sem eles, este
trabalho não seria concretizado;
- Aos membros da banca, pelas críticas e sugestões que em muito enriqueceram a
versão final desse texto;
- Ao meu amigo Giuliano Lorenzoni, pelo apoio e pelos grandes eventos de
apreciação dos ``clássicos'';
- Ao Marcio Lyra, por ter me proporcionado um ambiente de trabalho propício
para a conclusão deste trabalho;
- Às funcionárias do Departamento de Engenharia Elétrica da PUC-Rio, Alcina e
Márcia, por toda a atenção e paciência.
- À Maria do Carmo Rosas e Silva, pelo carinho e pela revisão do texto desta tese,
e ao prof. Raul Rosas e Silva, por todas as conversas e momentos de
descontração;
- Aos meus pais, Yolanda e Cristóvão, que com muito carinho, dedicação e amor,
sempre possibilitaram-me realizar sonhos e conquistas;
- Ao meu amor Mariana, simplesmente por existir em minha vida.
Resumo
Atherino, Rodrigo Simões; Fernandes, Cristiano Augusto Coelho
(Orientador); Pizzinga, Adrian Heringer (Co-orientador). Estimação de
Reservas IBNR por Modelos em Espaço de Estado: Empilhamento
por Linhas do Triângulo Runoff. Rio de Janeiro, 2008. 57p. Tese de
Doutorado – Departamento de Engenharia Elétrica, Pontifícia
Universidade Católica do rio de Janeiro.
Este trabalho versa sobre previsão de reservas do tipo IBNR levando-se
em conta uma ordenação diferente do triângulo de runoff incremental. Esta se dá
por linhas empilhadas, originando, assim, uma série temporal univariada repleta
de valores faltantes, cuja soma desses valores constitui o IBNR a ser estimado.
Duas abordagens de estimação, inteiramente baseadas na teoria dos modelos em
Espaço de Estado e do filtro de Kalman, são desenvolvidas, implementadas com
dados reais de empresas seguradoras, e comparadas entre si e a outros métodos de
estimação já consagrados na literatura atuarial. A primeira abordagem pauta-se no
cálculo da matriz de covariâncias condicionais das componentes do IBNR, e a
segunda é um processo de obtenção do IBNR por acumulação. Os resultados
obtidos revelam, para as abordagens propostas, os seguintes pontos sumários: (i)
plena eficiência e viabilidade computacional; (ii) sistemático ganho em termos de
acurácia do IBNR estimado; e (iii) abrangência no que diz respeito às
possibilidades de modelagem estatística dos dados de IBNR.
Palavras-chave
Espaço de Estado, filtro de Kalman, IBNR, valores faltantes.
Abstract
Atherino, Rodrigo Simões; Fernandes, Cristiano Augusto Coelho
(Advisor). Pizzinga, Adrian Heringer (Co-advisor). State Space Models
for IBNR Reserves Estimation: Row-Wise Stacking the Runoff
Triangle. Rio de Janeiro, 2008. 57p. Doctorate Thesis – Departamento de
Engenharia Elétrica, Pontifícia Universidade Católica do Rio de Janeiro.
This work deals with prediction of IBNR reserves under a different
ordering of the non-cumulative runoff triangle. This is accomplished by stacking
the rows, which results in a univariate time series with several missing values,
whose corresponding sum is in fact the IBNR. Two estimation approaches,
entirely based on state space methods and Kalman filtering, are developed,
implemented with real data, and compared with some well established estimation
methods for IBNR. The first approach consists in obtaining the conditional
covariance matrix of the IBNR components, and the second tackles the IBNR
estimation under an accumulation process. Three remarks emerge from the
empirical results: (i)computational feasibility and efficiency; (ii)precision
improvement for IBNR estimation; and (iii)flexibility in which concerns the
IBNR modelling framework.
Keywords
IBNR, Kalman filter, missing values, State Space.
Sum´ario
1 Introdu¸ao 10
2 Reordena¸ao do triˆangulo runoff 12
2.1 O m´etodo Chain-Ladder 14
2.2 Modelo em Espa¸co de Estado proposto 15
3 Metodologia 18
3.1 Modelos em Espa¸co de Estado Lineares Gaussianos 18
3.2 Primeira Abordagem: o m´etodo dos blocos 21
3.3 Segunda Abordagem: o m´etodo do acumulador 25
4 Aplica¸oes 29
4.1 S´erie AFG: resultados 34
4.2 S´erie MC1: resultados 44
4.3 S´erie DJZ: resultados 47
5 Conclus˜oes e Extens˜oes 51
A Provas 55
A.1 Prova do Lema 2 55
A.2 Prova do Lema 3 55
A.3 Prova do Lema 4 56
A.4 Prova do Teorema 1 56
A.5 Prova da Proposi¸ao 1 56
Lista de figuras
2.1 Triˆangulo de runoff. 12
2.2 Reparametriza¸ao “por linhas” do triˆangulo. 16
2.3 Reparametriza¸ao “por linhas” do triˆangulo com valores ausentes. 16
3.1 Triˆangulo trimestral. 21
4.1 S´eries empilhadas na escala real. 32
4.2 S´eries empilhadas na escala logar´ıtmica. 33
4.3 Resultados do modelo estrutural nos dados sem transforma¸ao
(dados AFG). 35
4.4 Resultados do modelo estrutural nos dados com transforma¸ao
(dados AFG). 35
4.5 Diagn´osticos modelo estrutural nos dados AFG sem transforma¸ao. 37
4.6 Diagn´osticos modelo estrutural nos dados AFG com transforma¸ao. 37
4.7 Resultados dados AFG – Modelo I-c (8 interven¸oes). 42
4.8 Resultados dados AFG – Modelo II-c (10 interven¸oes). 42
4.9 Diagn´osticos dados AFG – Modelo I-c (8 interven¸oes). 43
4.10 Diagn´osticos dados AFG – Modelo II-c (10 interven¸oes). 43
4.11 Resultados do modelo estrutural nos dados MC1 com trans-
forma¸ao (10 interven¸oes). 46
4.12 Diagn´osticos modelo estrutural nos dados MC1 com trans-
forma¸ao (10 interven¸oes). 46
4.13 Resultados do modelo estrutural nos dados sem transforma¸c˜ao
(dados DJZ). 48
4.14 Resultados modelo estrutural nos dados com transforma¸ao (dados
DJZ). 48
Lista de tabelas
3.1 Nova dimens˜ao dos vetores e matrizes para o m´etodo do acumuldador. 28
4.1 D´ıvidas gerais facultativas (excluindo ambiental) do estudo da
evolu¸ao hist´orica de perdas (1991 - unidade milhar de d´olar)–AFG. 29
4.2 Triˆangulo de runoff extra´ıdo de Mack (1993). 30
4.3 Triˆangulo de runoff para uma seguradora inglesa (unidade milhar
de libra)–DJZ. 30
4.4 Parˆametros estimados e rela¸oes sinal/ru´ıdo para a base de dados
AFG. 34
4.5 Compara¸ao entre os modelos (dados AFG). 34
4.6 Compara¸ao entre os modelos (dados AFG) – Out of Sample. 36
4.7 Reservas AFG calculadas e CV em %. 36
4.8 Interven¸oes em cada modelo para os dados AFG. 38
4.9 Parˆametros estimados e rela¸oes sinal/ru´ıdo para a base de dados
AFG - modelos com interven¸oes. 38
4.10 Compara¸ao entre os modelos com interven¸oes (dados AFG). 39
4.11 Compara¸ao entre os modelos com interven¸oes (dados AFG)
Fora da Amostra. 40
4.12 Testes & Diagn´osticos para os dados AFG. 40
4.13 Reservas Estimadas para os modelos com interven¸oes e seus
respectivos CV (%) – AFG. 44
4.14 Interven¸oes em cada modelo para os dados MC1. 44
4.15 Paametros estimados e rela¸oes sinal/ru´ıdo para a base de dados
MC1. 45
4.16 Compara¸ao entre os modelos (dados MC1). 45
4.17 Compara¸ao entre os modelos (dados MC1) – Fora da Amostra. 45
4.18 Testes & Diagn´osticos para os dados MC1. 47
4.19 Reservas Estimadas para os modelos com interven¸oes e seus
respectivos CV (%) – MC1. 47
4.20 Paametros estimados e rela¸oes sinal/ru´ıdo para a base de dados
DJZ. 49
4.21 Compara¸ao entre os modelos (dados DJZ). 50
4.22 Compara¸ao entre os modelos (dados DJZ) – Fora da Amostra. 50
4.23 Reservas estimadas e seus respectivos CV (%) – DJZ. 50
1
Introdu¸ao
O problema da previs˜ao de Reservas IBNR foi um dos mais explorados na
literatura atuarial durante as ´ultimas d´ecadas. Ao longo desse tempo, diversas
t´ecnicas matem´aticas foram criadas objetivando-se uma maior acur´acia para
previs˜ao da reserva, pois sua subestima¸ao ou superestima¸ao podem implicar
decis˜oes gerenciais equivocadas (cf. Bornhuetter & Ferguson, 1972).
IBNR ´e uma abrevia¸ao em inglˆes para sinistros “ocorridos por´em ao
reportados” (Incurred But Not Reported). Um sinistro ´e dito IBNR quando
ocorre antes da data de an´alise da seguradora, e que ainda ao foi notificado
`a mesma. O tempo entre a ocorrˆencia e a notifica¸ao `a seguradora, chamado
tempo de aviso, varia de acordo com o tipo de neg´ocio. Por exemplo, sinistros
de propriedade tendem a ter um atraso menor, pois a ocorrˆencia do sinistro ´e
de acil constata¸ao. Por´em, no ramo de seguros de danos a terceiros, em alguns
casos, pode-se levar um tempo consider´avel para que se perceba a ocorrˆencia
do sinistro, e mais ainda at´e que se desembolse o pagamento. O tempo ´e ainda
maior se o sinistro for discut´ıvel (cf. Hart et al., 2001).
Existem ainda os sinistros ditos IBNER (Incurred But not Enough
Reported ), que ao sinistros ocorridos e notificados `a seguradora, por´em ainda ´e
desconhecido o quanto dever´a ser desembolsado para liquid´a-lo completamente.
Alguns autores desenvolveram modelos estat´ısticos que separam IBNER do
IBNR, como o de Schnieper (1991), por´em aqui ao haver´a esta distin¸ao:
tudo ser´a tratado como IBNR.
As referˆencias bibliogr´aficas que realizam uma excelente revis˜ao atrav´es
de an´alises comparativas de uma grande variedade de modelos para previs˜ao
de IBNR ao Taylor (2000), England & Verrall (2002) e Taylor (2003). O
primeiro ´e um livro em que a maioria dos m´etodos ao descritos em detalhes
e suas express˜oes deduzidas; o segundo, assim como o primeiro, realiza uma
revis˜ao de v´arios m´etodos apresentando suas express˜oes matem´aticas (por´em,
sem deduzi-las) e, aplicando a dados reais, compara seus resultados. Por fim, a
terceira referˆencia ´e um artigo que apresenta uma nova
1
forma de se classificar
os etodos de previs˜ao de reservas IBNR que aparecem na literatura, com o
1
Para uma classifica¸ao anterior, vide Taylor (1986).
Cap´ıtulo 1. Introdu¸ao 11
objetivo de facilitar o estudo na ´area. Essa classifica¸ao estabelece uma linha
evolutiva, que tem origem nos modelos est´aticos e determin´ısticos at´e atingir
os dinˆamicos e estoasticos.
´
E na categoria dos modelos dinˆamicos e estoasticos que se inserem as
metodologias propostas no presente trabalho. Estas envolvem uma ordena¸ao
alternativa por linhas dos valores que comp˜oem o triˆangulo de runoff.
Este “empilhamento” d´a origem a uma erie temporal univariada com valores
faltantes, cuja soma destes ´ultimos ´e, justamente, a reserva IBNR procurada.
Ser˜ao propostas duas abordagens distintas baseadas na forma em Espa¸co de
Estado – que envolvem o tratamento destes valores faltantes, de maneira que
se possibilite, tamb´em, o alculo do erro m´edio quadr´atico da estima¸ao desta
soma.
A primeira abordagem, o m´etodo dos blocos, consiste em calcular cada
bloco da matriz de covariˆancias dos valores faltantes. A estima¸ao desta matriz
permite obter os erros m´edios quadr´aticos de quaisquer combina¸oes lineares
dos valores em quest˜ao; em particular, a que gera a reserva IBNR. a a
segunda abordagem, chamada de etodo do acumulador, acrescenta uma nova
componente ao vetor de estado, a qual ´e respons´avel pela acumula¸ao das
estima¸oes dos valores faltantes. Como a componente acumuladora integra
o vetor de estado, seu erro m´edio quadr´atico ´e naturalmente obtido pelas
recurs˜oes do filtro de Kalman.
A seguir, descreve-se a organiza¸ao do trabalho. No cap´ıtulo 2,
apresentam-se o triˆangulo de runoff, os detalhes sobre a nova ordena¸ao pro-
posta e a correspondente justificativa. O cap´ıtulo 3 mostra a metodologia con-
solidada para a estima¸ao de reservas IBNR. Nesse cap´ıtulo apresenta-se ini-
cialmente a forma geral de espa¸co de estado, revisando-se a literatura sobre
suas aplica¸oes `a estima¸ao de reserva IBNR e desenvolvendo-se resultados
que constituir˜ao a base para obten¸ao do erro edio quadr´atico da reserva
estimada. Em seguida, as duas abordagens ao descritas, com suas respec-
tivas especificidades de estima¸ao, tanto para dados do triˆangulo em escala
original (distribui¸ao normal) quanto para dados em escala logar´ıtmica (dis-
tribui¸ao log-normal). O cap´ıtulo 4 trata dos resultados emp´ıricos obtidos de
cada modelo, comparando desempenho com outros modelos a consagrados na
literatura, utilizando-se trˆes bases de dados distintas. Conclus˜oes e extens˜oes
futuras do trabalho encontram-se no cap´ıtulo 5. No apˆendice A, exp˜oem-se as
provas de lemas, teoremas e proposi¸oes do cap´ıtulo 3.
2
Reordena¸ao do triˆangulo runoff
Para se prever o IBNR total, os dados de sinistros do tipo IBNR ao
dispostos em um formato particular, chamado triˆangulo runoff, representado
graficamente pela Figura 2.1 (vide Hart et al., 2001 e suas diversas referˆencias).
Cada linha do triˆangulo representa um “ano de acidente”
1
ou “ano de origem”,
isto ´e, o ano em que o sinistro ocorreu. a as colunas referem-se aos “anos
de desenvolvimento”, que expressam o atraso entre o pagamento e o ano de
origem. Os “anos de calend´ario” (ou “anos de pagamento”) ao as diagonais
do triˆangulo.
Ano de
Origem Desenvolvimento d
w 0 1 2 . . . J 1
1 C
10
C
11
C
12
. . . C
1J1
2 C
20
C
21
. . . C
2J2
3 C
30
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
. C
J1 1
J C
J0
Figura 2.1: Triˆangulo de runoff.
O triˆangulo possui duas representa¸oes asicas: incremental e acumulada.
Na forma incremental, cada c´elula do triˆangulo ´e representada por C
wd
, onde
0 < w J e 0 d < J. O valor C
wd
´e o montante agregado pago pela
seguradora referente a sinistros ocorridos no ano de origem w, e atrasados d
anos (ou seja, pagos no ano de calend´ario w + d).
Na forma acumulada do triˆangulo, as c´elulas s˜ao calculadas da forma
D
wd
=
d
k=0
C
wk
,
1
Conforme Hart et al. (2001), qualquer unidade de tempo pode ser utilizada. Para
algumas classes de neg´ocios pode ser mais adequado utilizar meses, trimestres ou semestres.
Cap´ıtulo 2. Reordena¸ao do triˆangulo runoff 13
isto ´e, a uma acumula¸ao dos incrementos C
wd
ao longo das linhas. Em geral,
a forma acumulada ´e utilizada em m´etodos baseados nas raz˜oes ou taxas entre
anos de desenvolvimento consecutivos, como os modelos em Hertig (1985) e
em de Jong (2004), e o pr´oprio m´etodo Chain Ladder (cf. Booth et al., 2004;
England & Verrall, 2002; Taylor, 2000 entre outros) s´o para citar alguns.
O ponto comum a todos os etodos de previs˜ao de reservas – sobretudo
aos aplicados em triˆangulos runoff ´e a expectativa de que determinados
“padr˜oes” de comportamento dos sinistros ocorridos no passado se repitam
no futuro. O padr˜ao em quest˜ao ´e o de atraso entre o per´ıodo de origem e
o de pagamento do sinistro, ou seja, ´e o padr˜ao apresentado ao longo das
colunas. Os m´etodos estat´ısticos aplicados ao triˆangulo tentam modelar esta
dependˆencia entre colunas de diversas formas, dentre as quais est´a a curva de
Hoerl (cf. Wright, 1990). Em de Jong & Zehnwirth (1983) e Renshaw (1989) a
curva ´e utilizada no contexto de eries temporais, enquanto England & Verrall
(2002) o faz no contexto de Modelos Lineares Generalizados, atrav´es de uma
regress˜ao de vari´aveis dependentes Poisson com sobredispers˜ao. O trabalho de
de Jong (2006), que ´e uma extens˜ao do trabalho de Hertig (1985), verifica a
existˆencia de correla¸oes entre as colunas do triˆangulo sobretudo entre as
primeiras (atrasos menores) – e as tratam explicitamente, levando a melhoras
significativas no ajuste do modelo e, conseq¨uentemente, no seu poder preditivo.
Ainda existem outros trabalhos que incorporam como informa¸ao adicional
o n´umero de sinistros ocorridos em cada “c´elula” do triˆangulo. Vide, por
exemplo, Ntzoufras & Dellaportas (2002), no qual ´e realizada uma compara¸ao
entre estima¸oes de reserva levando-se em conta ou n˜ao o n´umero de sinistros.
Os autores mostram que a inclus˜ao dessa informa¸ao reduz o intervalo de
confian¸ca da previs˜ao.
Na representa¸ao de ´ındice duplo” tanto no contexto de eries tem-
porais quanto no de regress˜ao – ´e comum se parametrizar o triˆangulo atrav´es
de fatores comuns `as colunas e outros comuns `as linhas. Por exemplo, na
parametriza¸ao mais tradicional, onde C
wd
= α
w
β
d
, todas as observoes da
linha w compartilham do mesmo parˆametro α
w
. A grande desvantagem desta
abordagem ´e o grande n´umero de parˆametros a serem estimados com poucas
observoes. Alguns trabalhos utilizam-se de reparametriza¸oes no intuito de
se reduzir o n´umero de parˆametros a ser estimado. Um exemplo disso ´e a curva
de Hoerl, empregada em de Jong & Zehnwirth (1983), que reduz o n´umero de
parˆametros que influenciam as colunas para apenas um.
Cap´ıtulo 2. Reordena¸ao do triˆangulo runoff 14
2.1
O m´etodo Chain-Ladder
O m´etodo determin´ıstico Chain-Ladder para previs˜ao de reservas IBNR
´e, ainda hoje, um dos mais utilizados pelas empresas seguradoras. A principal
raz˜ao disto, segundo Mack (1993), ´e sua simplicidade e por ser livre de dis-
tribui¸ao
2
. Muitos dos trabalhos citados anteriormente tentaram construir um
arcabou¸co estoastico para este etodo atrav´es da incorpora¸ao de premis-
sas asicas, como, por exemplo, assumir uma determinada distribui¸ao para
as observoes do triˆangulo. Assim, seria poss´ıvel obter uma medida de dis-
pers˜ao para a reserva estimada. Por´em, a maioria dos trabalhos, na realidade,
estava apenas desenvolvendo um novo m´etodo – diferente do Chain-Ladder
pois os valores estimados das reservas ao coincidiam. Coube ao trabalho de
Mack (1993) desenvolver o arcabou¸co estoc´astico do m´etodo Chain-Ladder
mantendo idˆentico o valor estimado da reserva –, e dessa forma obter a me-
dida de dispers˜ao para tal reserva sem assumir qualquer distribui¸ao para as
observoes do triˆangulo, ou seja, preservou-se a caracter´ıstica principal do
m´etodo Chain-Ladder : ser “livre de distribui¸ao”.
2.1.1
Express˜oes b´asicas
O m´etodo Chain-Ladder asico assume a existˆencia de J 1 fatores
(“Development Factors”) f
1
, . . . , f
J1
> 0 tais que
E(D
w,k
|D
w1
, . . . , D
w,k1
) = D
w,k1
f
wk
, 1 w J, 1 k J 1. (2-1)
Os estimadores dos fatores f
k
ao dados pela seguinte express˜ao
ˆ
f
k
=
Jk
j=1
D
j,k
Jk
j=1
D
j,k1
, 1 k J 1. (2-2)
Assim, a esperan¸ca do valor acumulado na ´ultima coluna da linha w ´e dada
por
ˆ
D
w,J1
= D
w,Jw
·
ˆ
f
Jw
· . . . ·
ˆ
f
J1
(2-3)
As parcelas da reserva referentes a cada linha w (ano de acidente w) ao dadas
pelo valor obtido na coluna J 1, subtra´ıdo do valor da diagonal da linha
correspondente.
2
Segundo a classifica¸ao criado por Taylor (2003), o m´etodo Chain-Ladder ´e heur´ıstico e
determin´ıstico.
Cap´ıtulo 2. Reordena¸ao do triˆangulo runoff 15
ˆ
R
w
=
ˆ
D
w,J1
D
w,Ji
= D
w,Jw
ˆ
f
Jw
· . . . ·
ˆ
f
J1
A reserva total ´e dada pela soma de cada uma destas parcelas
ˆ
R =
J
i=2
R
i
. (2-4)
2.1.2
Express˜oes do erro m´edio quadr´atico obtidas por Mack
A grande contribui¸ao do trabalho de Mack foi a obten¸ao de uma ex-
press˜ao para o erro edio quadr´atico da reserva, sem assumir qualquer dis-
tribui¸ao subjacente. Para tal, alguns pressupostos tiveram que ser assumidos,
como, por exemplo, a independˆencia entre linhas do triˆangulo. Desta maneira,
a express˜ao para o erro m´edio quadr´atico da parcela da reserva correspondente
`a linha w ´e dada por
EQM(
ˆ
R
w
) =
ˆ
D
2
w,J1
J2
k=Jw
ˆσ
2
k
ˆ
f
2
k
1
ˆ
D
w,k
+
1
Jk
j=1
D
j,k
com ˆσ
2
k
definido como o seguinte estimador n˜ao-viesado:
ˆσ
2
k
=
1
J k 1
Jk
i=1
D
ik
D
ik
D
i,k1
ˆ
f
k
2
, 1 k J 2.
A express˜ao para o erro edio quadr´atico da reserva total encontra-se
a seguir. Ela ser´a utilizada no cap´ıtulo 4 para efeito de compara¸ao com o
modelo proposto no cap´ıtulo 3.
EQM(
ˆ
R) =
J
i=2
(e.p.(
ˆ
R
i
))
2
+
ˆ
D
i,J1
J
j=i+1
ˆ
D
j,J1
J2
k=Ji
2ˆσ
2
k
/
ˆ
f
2
k
Jk
n=1
D
nk
(2-5)
2.2
Modelo em Espa¸co de Estado proposto
Este trabalho far´a uso da forma incremental do triˆangulo, por´em, como
a citado, adotando-se uma nova ordena¸ao: os ´ındices w e d cedem lugar
para um ´unico ´ındice t, o qual define uma s´erie temporal univariada, cuja
Cap´ıtulo 2. Reordena¸ao do triˆangulo runoff 16
ordena¸ao est´a exemplificada na Figura 2.2. Com esta ordena¸ao, e utilizando-
se a formula¸ao em Espa¸co de Estado (a ser discutida na se¸ao 3.1), as
estruturas de dependˆencia entre os valores do triˆangulo podem ser modeladas
de forma natural. Cabe, aqui, ressaltar que este ´ındice t ao representa a
ordem cronol´ogica dos pagamentos, mas sim uma nova maneira de possibilitar a
an´alise do triˆangulo atrav´es de modelos que admitam componentes peri´odicas,
como ser´a visto no pr´oximo cap´ıtulo.
Ano de
Origem Desenvolvimento d
w 0 1 2 . . . J 1
1 y
1
y
2
y
3
. . . y
J
2 y
J+1
y
J+2
. . . y
2J1
y
2J
3 y
2J+1
y
2J+2
. . . y
3J1
y
3J
.
.
.
.
.
.
.
.
.
J y
(J1)J+1
y
(J1)J+2
. . . y
J
2
1
y
J
2
Figura 2.2: Reparametriza¸ao “por linhas” do triˆangulo.
Ano de
Origem Desenvolvimento d
w 0 1 2 . . . J 1
1 y
1
y
2
y
3
. . . y
J
2 y
J+1
y
J+2
. . . y
2J1
.
.
.
.
.
.
J y
(J1)J+1
Figura 2.3: Reparametriza¸ao “por linhas” do triˆangulo com valores ausentes.
Perseguindo a mesma ogica apresentada na Figura 2.1, alguns elementos
da Figura 2.2, na pr´atica, ao faltantes, pois correspondem `as parcelas do
IBNR (vide defini¸ao mais adiante). Logo, a figura 2.3 ser´a o verdadeiro
objeto de estudo. Prever a Reserva IBNR significa, em termos pr´aticos,
completar os valores faltantes do triˆangulo inferior da figura 2.3. Na abordagem
univariada em discuss˜ao, a Reserva IBNR propriamente dita consiste na soma
ao observada desses valores faltantes, ou seja,
IBNR R =
t: y
t
´e ausente
y
t
. (2-6)
´
E no tratamento destes valores ausentes que a formula¸ao em Espa¸co de Estado
apresenta um de seus diferenciais: a estima¸ao se torna natural mediante a
utiliza¸ao do filtro de Kalman. ao o se obt´em a previs˜ao pontual de tais
Cap´ıtulo 2. Reordena¸ao do triˆangulo runoff 17
valores, mas tamb´em sua medida de dispers˜ao (cf. Harvey, 1989; Durbin &
Koopman, 2001; e Brockwell & Davis, 2002).
No entanto, enuncia-se um problema:
Supondo que os valores faltantes ao vari´aveis aleat´orias de 2
a
ordem e adotando-se como estimador pontual de R a sua esperan¸ca
condicional dados todos os outros valores conhecidos do triˆangulo,
calcular seu erro m´edio quadr´atico associado, o qual, sabe-se, ´e
m´ınimo dentre todos os outros estimadores que ao fun¸oes dos
valores conhecidos.
Neste trabalho, o problema delimitado acima ´e atacado mediante duas aborda-
gens diferentes, mas que possuem como base a teoria dos modelos em Espa¸co de
Estado e a mesma ordena¸ao por linhas a proposta. Tais temas ao explorados
plenamente no pr´oximo cap´ıtulo.
3
Metodologia
3.1
Modelos em Espa¸co de Estado Lineares Gaussianos
3.1.1
Estrutura B´asica
A forma em Espco de Estado Linear Gaussiana (forma em EE daqui
por diante) consiste em duas equa¸oes. A primeira delas ´e chamada equa¸ao
das observa¸oes, que descreve a evolu¸ao de um processo estoastico p-
variado e observ´avel y
t
, t = 1, 2, . . . e a outra ´e chamada equa¸ao do estado.
Especificamente:
y
t
= Z
t
α
t
+ d
t
+ ε
t
, ε
t
N(0, H
t
)
α
t+1
= T
t
α
t
+ R
t
η
t
, η
t
N(0, Q
t
) (3-1)
α
1
N(a
1
, P
1
).
O processo m-variado α
t
´e chamado de estado e ´e considerado ao-observ´avel.
Os erros ε
t
e η
t
ao independentes no tempo, entre si e de α
1
. As matrizes do
sistema Z
t
, d
t
, T
t
, R
t
, H
t
e Q
t
ao determin´ısticas. Dada uma erie temporal
de tamanho n do processo y
t
, definam-se Y
j
y
1
, . . . , y
j
, a
t|j
E(α
t
|Y
j
) e
P
t|j
Var(α
t
|Y
j
). As equa¸oes de predi¸ao e de suaviza¸ao do filtro de Kalman
fornecem f´ormulas recursivas para o alculo dos momentos condicionais acima
quando j = t 1 e para j = n, respectivamente. Suas express˜oes anal´ıticas
encontram-se em (3-2) e (3-3). Suas derivoes, sob os pressupostos da forma
em EE aqui adotada, podem ser obtidas em Durbin & Koopman (2001) e em
Harvey (1989).
υ
t
= y
t
Z
t
a
t|t1
d
t
, F
t
= Z
t
P
t|t1
Z
t
+ H
t
,
K
t
= T
t
P
t|t1
Z
t
F
1
t
, L
t
= T
t
K
t
Z
t
, t = 1, . . . , n,
(3-2)
a
t+1|t
= T
t
a
t|t1
+ K
t
υ
t
, P
t+1|t
= T
t
P
t|t1
L
t
+ R
t
Q
t
R
t
,
Cap´ıtulo 3. Metodologia 19
r
t1
= Z
t
F
1
t
υ
t
+ L
t
r
t
, N
t1
= Z
t
F
1
t
Z
t
+ L
t
N
t
L
t
,
a
t|n
= a
t|t1
+ P
t|t1
r
t1
, P
t|n
= P
t|t1
P
t|t1
N
t1
P
t|t1
, (3-3)
r
n
= 0, N
n
= 0, t = 1, . . . , n.
a diversos artigos publicados na ´area de estima¸ao de IBNR mediante
o arcabou¸co da forma em EE. O primeiro deles, que pode ser destacado, ´e o
trabalho de de Jong & Zehnwirth (1983), um precursor do uso do filtro de
Kalman na literatura atuarial. Nele, o triˆangulo ´e organizado de tal forma que
as diagonais formam os vetores das observoes. Uma variante deste m´etodo
tamem ´e apresentada em Atherino & Fernandes (2007). Em de Jong (2006)
ainda se prop˜oe a forma em EE para se estimar correla¸oes entre valores do
triˆangulo. Tamem cumpre citar o artigo Verrall (1989), que oferece uma
metodologia de estima¸ao dentro do enfoque Bayesiano. Outro trabalho de
importˆancia ´e devido a Wright (1990). Greg Taylor tamem se utiliza da
forma em EE para estimar seu modelo em Taylor (2003), ao qual se emprega o
filtro EDF (Exponential Distribution Filter ). Al´em de artigos, cita-se tamem
o livro de autoria do pr´oprio Taylor (cf. Taylor, 2000), no qual, em adi¸ao a
um apanhado de t´ecnicas previamente desenvolvidas na literatura, ´e oferecida
uma abordagem em que cada linha do triˆangulo runoff ´e vista como um vetor
aleat´orio.
3.1.2
Modelos Estruturais
Um modelo estrutural para eries temporais ´e aquele no qual as compo-
nentes ao observ´aveis de n´ıvel, inclina¸ao, sazonalidade e ru´ıdo ao modeladas
explicitamente, cf. Harvey (1989). O modelo em (3-4) ´e o modelo estrutural
com as componentes peri´odica e de n´ıvel estoasticas que ser´a considerado nas
aplica¸oes do presente trabalho.
y
t
= µ
t
+ γ
t
+ x
t
β
t
+ ε
t
, ε
t
N(0, σ
2
ε
),
µ
t+1
= µ
t
+ ζ
t
, ζ
t
N(0, σ
2
ζ
), (3-4)
γ
t+1
=
J1
j=1
γ
t+1j
+ ω
t
, ω
t
N(0, σ
2
ω
).
O termo de regress˜ao x
t
β
t
´e principalmente motivado pela necessidade de
interven¸oes de outliers e de quebras (vide se¸ao 3.1.3). A id´eia de se estimar tal
modelo estrutural em particular ´e a de que suas componentes ao observ´aveis
Cap´ıtulo 3. Metodologia 20
terem capacidade de explicar o comportamento dos sinistros IBNR de forma
intuitiva. A componente de n´ıvel µ
t
explica as informa¸oes referentes ao volume
de sinistros ocorridos em cada ano de acidente. Cabe `a componente peri´odica
γ
t
captar o padr˜ao da s´erie em cada linha do triˆangulo, isto ´e, ser´a respons´avel
por explicar o comportamento do atraso na liquida¸ao dos sinistros.
O modelo estrutural tem a seguinte forma em Espa¸co de Estado:
y
t
=
1 1 0 ··· 0
µ
t
γ
t
γ
t1
.
.
.
γ
tJ+1
+ x
t
β
t
+ ε
t
, t = 1, 2, . . . , n
µ
t+1
γ
t+1
γ
t
.
.
.
γ
tJ
=
1 0 0 ··· 0 0
0 1 1 1 1
0 1 0 0 0
.
.
.
0 0 0 1 0
µ
t
γ
t
γ
t1
.
.
.
γ
tJ+1
+
1 0
0 1
0 0
.
.
.
.
.
.
0 0
ξ
t
ω
t
Nas subse¸oes seguintes, ser˜ao apresentadas duas propostas que visam
resolver o problema da estima¸ao de IBNR sob a ordena¸ao “por linhas” do
triˆangulo de runoff proposta na se¸ao 2, e do alculo do erro m´edio quadr´atico
associado. Muito essencialmente e, em palavras, o primeiro deles parte para
a dedu¸ao, bloco a bloco, de uma express˜ao anal´ıtica fechada da matriz de
covariˆancia condicional das parcelas do IBNR (cf. express˜ao (2-6)) empilhados;
o segundo, por sua vez, ´e baseado no aumento do vetor de estado com um
acumulador das parcelas do IBNR. Ou seja, um m´etodo tenta solucionar
o problema “construindo blocos de covariˆancias”; e o outro, “acumulando a
reserva”.
3.1.3
Incorpora¸ao de sazonalidade entre o per´ıodo de origem dos sinistros
(linhas do triˆangulo)
A metodologia descrita neste trabalho independe da unidade de tempo
utilizada no triˆangulo, seja ela mensal, trimestral, semestral etc. Abarca, ainda,
naturalmente, a poss´ıvel existˆencia de comportamentos peri´odicos entre as
colunas do triˆangulo, ap´os a introdu¸ao do modelo (3-4) como previamente
comprovado. Entretanto, em determinadas unidades de tempo, pode haver, ao
menos teoricamente, certa periodicidade entre as linhas, refletindo, assim, a
Cap´ıtulo 3. Metodologia 21
possibilidade de existˆencia de um padr˜ao sazonal nas ocorrˆencias de sinistros
IBNR.
Na Figura 3.1 est´a representado um triˆangulo trimestral. Caso existam
ind´ıcios emp´ıricos de que sinistros originados em um determinado trimestre
de um ano em particular tenham aspectos em comum com os originados no
mesmo trimestre de outros anos, esta sazonalidade pode estar incorporada
diretamente no modelo. Uma forma de se acrescentar essa componente sazonal
seria atraes de vari´aveis dummies, como no modelo abaixo:
y
t
= µ
t
+ γ
t
+
J
i=2
β
(i)
t
d
(i)
t
+ ε
t
, (3-5)
no qual
d
(i)
t
=
1 y
t
{iesimo “per´ıodo”, . . . , S-´esimo “per´ıodo”}, i = 2, 3, . . . , J
0 caso contr´ario.
Origem Desenvolvimento d
w 0 1 2 . . . 11
2006Q1 C
1,0
C
1,1
C
1,2
C
1,11
2006Q2 C
2,0
C
2,1
C
2,2
. . .
2006Q3 C
3,0
C
3,1
C
3,2
. . .
2006Q4 C
4,0
C
4,1
C
4,2
. . .
2007Q1 C
5,0
C
5,1
C
5,2
2007Q2 C
6,0
C
6,1
C
6,2
2007Q3 C
7,0
C
7,1
C
7,2
2007Q4 C
8,0
C
8,1
C
8,2
2008Q1 C
9,0
C
9,1
C
9,2
2008Q2 C
10,0
C
10,1
C
10,2
2008Q3 C
11,0
C
11,1
2008Q4 C
12,0
Figura 3.1: Triˆangulo trimestral.
A inclus˜ao dos referidos parˆametros adicionais pode agravar ainda mais
a quest˜ao da maximiza¸ao da verossimilhan¸ca, j´a que a quantidade de valores
faltantes sempre ser´a cerca de 50% do n´umero de observoes do triˆangulo.
3.2
Primeira Abordagem: o m´etodo dos blocos
Considere a forma em EE e toda a nota¸ao correspondente a
esta e ao filtro de Kalman da subse¸ao 3.1.1. Adicionalmente, defina
Cap´ıtulo 3. Metodologia 22
I {t : y
t
´e n˜ao-ausente},
˜
Y {y
i
j
: i
j
I, j}
1
, Y {y
t
: t = 1, . . . , n} e
L
t
L
t
, se t I
T
t
, caso contr´ario
N
t
n
k=t+1
L
∗
t+1
. . . L
∗
k1
Z
∗
k
F
1
k
Z
k
L
k1
. . . L
t+1
.
Observe que
˜
Y, no contexto de alculo de IBNR, consiste na informa¸ao
proveniente do triˆangulo (cf. Figura 2.3).
O ponto de partida para tudo o que se desenvolver´a nesta subse¸ao ao
express˜oes recursivas, deduzidas em Durbin & Koopman (2001, se¸ao 4.5), para
algumas matrizes de covariˆancias condicionais provenientes de manipula¸oes
com as equa¸oes de suaviza¸ao do filtro de Kalman. Estas s˜ao sumarizadas no
seguinte Lema:
Lema 1 Sejam t, j = 1, . . . , n quaisquer. Ent˜ao,
1. Cov(α
t
, α
j
|Y) = P
t|t1
L
t
L
t+1
. . . L
j1
(I
m
N
j1
P
j|j1
), j t
sendo que L
t
L
t+1
. . . L
j1
= I
m
quando j = t.
2. Cov(ε
t
, ε
j
|Y) = H
t
K
t
L
t+1
. . . L
j1
W
j
, j > t
sendo que W
j
= H
j
(F
1
j
Z
j
K
j
N
j
L
j
).
3. Cov(ε
t
, α
j
|Y) = H
t
K
t
L
t+1
. . . L
j1
(I
m
N
j1
P
j|j1
), j > t.
4. Cov(α
t
, ε
j
|Y) = P
t|t1
L
t
L
t+1
. . . L
j1
W
j
, j t
sendo que W
j
= H
j
(F
1
j
Z
j
K
j
N
j
L
j
) e L
t
L
t+1
. . . L
j1
= I
m
quando
j = t.
Outro resultado importante ´e o Lema 2 dado na sequˆencia, o qual se
relaciona com distribui¸oes Gaussianas condicionais e, diferentemente de todos
os resultados desta se¸ao, ao se restringe necessariamente ao contexto de
modelos em Espa¸co de Estado. A prova deste Lema encontra-se no apˆendice
A.1.
Lema 2 Sejam x, y e z vetores aleat´orios com distribui¸ao conjunta Gaus-
siana. Se Cov(y, z) = 0 e se Cov(x, z) = 0, ent˜ao
E(x|y, z) = E(x|y) (3-6)
Var(x|y, z) = Var(x|y). (3-7)
1
Observe que
˜
Y est´a sendo definido como um conjunto de vetores aleat´orios e n˜ao como
um vetor aleat´orio empilhado. Mas, para o que segue, o mesmo pode ser visto como tal.
Cap´ıtulo 3. Metodologia 23
O pr´oximo resultado, de prova bem direta e apresentada no apˆendice A.2,
revela uma esp´ecie de ortogonalidade entre a parte observada do triˆangulo e
as parcelas n˜ao observadas do IBNR.
Lema 3 Para todo t / I, ε
t
´e n˜ao-correlacionado com
˜
Y.
A linha condutora do desenvolvimento do etodo dos blocos ´e a obten¸ao
de uma matriz de covariˆancia condicional de todos os y
t
, tais que t / I,
empilhados dado
˜
Y. O caminho para isso ´e estudar, para os mesmos ´ındices
t, as covariˆancias condicionais dos vetores aleat´orios ao-observ´aveis α
t
, ε
t
e
η
t
e explorar convenientemente a linearidade da rela¸ao entre estes e os y
t
. O
pr´oximo resultado materializa esta ideia e tem como base de constru¸ao os
Lemas 1, 2 e 3. Sua prova encontra-se no apˆendice A.3.
Lema 4 Para t, j / I arbitr´arios, tem-se que:
1. Cov(ε
t
, ε
j
|
˜
Y) =
H
t
, para t = j
0, caso contr´ario.
2. Cov(ε
t
, α
j
|
˜
Y) = 0
3. Cov(α
t
, α
j
|
˜
Y) =
P
t|t1
L
∗
t
L
∗
t+1
. . . L
∗
j1
I N
j1
P
j|j1
, se t < j
P
t|t1
P
t|t1
N
t1
P
t|t1
, se t = j.
Estabelecidos os resultados de suporte, agora a existem plenas condi¸oes
para que se deduzam as express˜oes computacionais do etodo dos blocos. Essas
se encontram no pr´oximo Teorema, cuja prova est´a no apˆendice A.4.
Teorema 1 Para t, j arbitr´arios, tem-se que
Cov(y
t
, y
j
|
˜
Y) =
0 se t I ou j I
Z
t
(P
t|t1
P
t|t1
N
t1
P
t|t1
)Z
t
+ H
t
se t = j e t, j / I
Z
t
P
t|t1
L
∗
t
L
∗
t+1
. . . L
∗
j1
I N
j1
P
j|j1
Z
j
se t < j e t, j / I.
Ap´os ter-se chegado ao objetivo desejado, cabem aqui alguns comenarios
de ordem pr´atica. A implementa¸ao computacional da express˜ao matricial,
enunciada no Teorema 1, envolve o armazenamento de algumas matrizes
advindas das recurs˜oes do filtro de Kalman: P
t|t1
e N
t1
para todo t / I,
Cap´ıtulo 3. Metodologia 24
e ainda as matrizes L
τ
, L
τ+1
, . . . , L
τ
1
, 1 τ < τ
n nas quais τ e τ
ao o primeiro e o ´ultimo instantes, respectivamente, em que existem valores
faltantes. Tamem, ´e a mesma ormula que, quando calculada para todas as
combina¸oes poss´ıveis de ´ındices i e j, conduz ao insumo asico - que ´e a matriz
de covariˆancias condicionais completa de Y
n
dado
˜
Y - para que se calcule uma
medida de precis˜ao associada `a estima¸ao de qualquer combina¸ao linear dos
valores faltantes.
3.2.1
Erro m´edio quadr´atico da Reserva IBNR estimada: casos total e por ano
Para um vetor a = (a
1
, a
2
, . . . , a
n
)
qualquer, tem-se que E(a
Y|
˜
Y) =
a
E(Y|
˜
Y) e Cov(a
Y|
˜
Y) = a
Cov(Y|
˜
Y)a. A reserva IBNR ´e calculada
escolhendo-se um vetor a, aqui definido por a
(T )
, de forma que a
(T )
i
= 1 se
i / I e a
(T )
i
= 0 caso contr´ario. Para as parcelas do IBNR relativas a um
espec´ıfico ano de acidente (linhas), utilize o mesmo vetor a com coordenadas
nulas nos lugares apropriados - os que ao correspondem ao ano. Esta an´alise
por ano de acidente ´e interessante porque permite a identifica¸ao de fontes de
incertezas nas parcelas do IBNR.
Assim, as express˜oes do m´etodo dos blocos para a Reserva IBNR e seu
correspondente erro padr˜ao s˜ao:
IBNR
ˆ
R = a
E(Y|
˜
Y) (3-8)
ep(IBNR)
ep(R) =
a
Cov(Y|
˜
Y)a (3-9)
3.2.2
Uso da distribui¸ao log-normal para y
t
Uma alternativa `a hip´otese de normalidade para y
t
do triˆangulo ´e a
distribui¸ao log-normal, que induz, por primeiros princ´ıpios, `a modelagem
de z
t
log y
t
. Essa distribui¸ao foi extensamente explorada na literatura
atuarial (cf. Taylor, 2000, cap´ıtulo 9), tanto na ´area de Modelos Lineares
Generalizados (MLG) quanto na ´area de S´eries Temporais. Em MLG, podem-
se citar os trabalhos de Kremer (1982), Renshaw (1989), Christofides (1990),
Verrall (1991) e Doray (1996); na ´area de S´eries Temporais, tˆem-se de Jong &
Zehnwirth (1983), Verrall (1989), de Jong (2004) e de Jong (2006). Apesar de
desenvolver seu modelo sem precisar admitir qualquer distribui¸ao (cf. Mack,
1994a), Mack faz um exemplo utilizando log-normalidade para a constru¸ao
gr´afica da reserva (cf. Mack, 1994b).
Cap´ıtulo 3. Metodologia 25
Sob a ado¸ao do m´etodo dos blocos, este pressuposto distribucional
alternativo a origem ao seguinte algoritmo para o alculo da reserva IBNR
estimada e seu correspondente erro m´edio quadr´atico:
1. Aplique o filtro de Kalman ao triˆangulo formado pelos z
t
, armazenando
todas as matrizes devidas (vide comenarios finais da se¸ao 3.2).
2. Utilize o m´etodo dos blocos para obter ˆz
t
E(z
t
|
˜
Z) = E(log y
t
|
˜
Y),
σ
2
ˆz
t
Var(z
t
|
˜
Z) e σ
ˆz
t
,ˆz
j
Cov(z
t
, z
j
|
˜
Z).
3. Calcule
2
:
ˆy
t
= exp
ˆz
t
+
σ
2
ˆz
t
2
(3-10)
σ
2
ˆy
t
= exp
2ˆz
t
+ σ
2
ˆz
t
e
σ
2
ˆz
t
1
(3-11)
σ
ˆy
t
,ˆy
j
= exp
ˆz
t
+ ˆz
j
+
σ
2
ˆz
t
2
+
σ
2
ˆz
j
2
(e
σ
ˆz
t
,ˆz
j
1) (3-12)
4. Proceda com os c´alculos da subse¸ao anterior.
Essa ´e uma clara vantagem deste m´etodo sobre o do acumulador, que ao
permite, por constru¸ao, a modelagem do logaritmo dos valores do triˆangulo,
como ser´a visto na sequˆencia.
3.3
Segunda Abordagem: o m´etodo do acumulador
Este m´etodo consiste em adicionar uma componente ao vetor de estado,
denotada por δ
t
, a qual ser´a respons´avel pela acumula¸ao das previs˜oes dos
valores faltantes:
y
t
=
Z
t
0
α
t
δ
t
+ d
t
+ ε
t
α
t+1
δ
t+1
=
T
t
0
X
t
I
α
t
δ
t
+
R
t
0
η
t
, (3-13)
na qual X
t
= 0 quando t I e X
t
= Z
t
quando t / I (observao faltante).
Denote por ψ e ψ
os vetores de parˆametros dos modelos (3-1) e (3-13)
respectivamente e denote por L e L
as correspondentes verossimilhan¸cas.
Apesar de ψ = ψ
– com efeito, o modelo em (3-13) ´e um simples aumento na
2
Estas express˜oes decorrem de direta aplica¸ao de fun¸ao geradora de momentos e/ou
fun¸ao caracter´ıstica.
Cap´ıtulo 3. Metodologia 26
equa¸ao do estado do modelo em (3-1) cujas matrizes do sistema adicionais ao
compreendem novos parˆametros –, ao ´e muito direto afirmar o mesmo, ou algo
diferente, para os estimadores de axima verossimilhan¸ca provenientes de L e
de L
. O pr´oximo resultado, cuja prova encontra-se no apˆendice A.5, esclarece
essa d´uvida e, mais `a frente, mostrar-se-´a fundamental para a implementa¸ao
computacional do m´etodo do acumulador.
Proposi¸ao 1
ˆ
ψ arg max L(ψ) = arg max L
(ψ
)
ˆ
ψ
.
Interpreta¸ao: Apesar de o modelo aumentado possuir uma componente a mais
de “acumula¸ao”, ao a acr´escimo de informa¸ao `a fun¸ao de verossimilhan¸ca,
pois, mesmo que a componente adicional seja, recursivamente, fun¸ao de α
t
,
este ´ultimo depende, recursivamente, apenas de si mesmo.
A importˆancia pr´atica da Proposi¸ao 1 adv´em de as implementa¸oes se
simplificarem muito – sobretudo com a extens˜ao adicional do vetor de estado
a ser mostrado na pr´oxima subse¸ao –, pois o vetor de parˆametros poder´a
ser estimado atraes do modelo original (com matrizes menores) e, assim, as
estimativas obtidas ser˜ao utilizadas no filtro de Kalman do modelo aumentado.
3.3.1
Extens˜ao adicional do acumulador: acumuladores parciais por ano de
origem
Como a visto na se¸ao 3.3, o m´etodo do acumulador consiste no
acr´escimo do acumulador δ
t
ao vetor de estado, e no redimensionamento das
matrizes do sistema. Entretanto, ´e conveniente incorporar ao o o acumulador
da reserva IBNR total, mas tamem acumuladores parciais para cada ano
de origem w = 2, . . . , J, pela mesma motivao apresentada no etodo
dos blocos. Para tanto, seja δ
t
um vetor de dimens˜ao J × 1 tal que δ
t
=
(δ
(2)
t
, δ
(3)
t
, . . . , δ
(J)
t
, δ
(T )
t
)
, cujo sobrescrito (i) representa a parcela referente a
linha i, com 2 i J, e o total i = T . O modelo em (3-13), ent˜ao, ´e
expandido no modelo em (3-14)
Cap´ıtulo 3. Metodologia 27
y
t
=
Z
t
0 . . . 0
α
t
δ
(2)
t
.
.
.
δ
(J)
t
δ
(T )
t
+ ε
t
,
α
t+1
δ
(2)
t+1
.
.
.
δ
(J)
t+1
δ
(T )
t+1
=
T
t
0
(m×pJ)
˜
X
t
I
(pJ×pJ)
α
t
δ
(2)
t
.
.
.
δ
(J)
t
δ
(T )
t
+
R
t
0
.
.
.
0
η
t
, (3-14)
com
˜
X
t
= (X
(1)
t
, X
(2)
t
, . . . , X
(J)
t
, X
(T )
t
)
.
As novas dimens˜oes dos vetores e matrizes deste modelo est˜ao expostas na
tabela 3.1. Como visto na se¸ao 3.3, a matriz de transi¸ao em (3-14) ´e formada
por trˆes blocos constantes e um variante no tempo,
˜
X
t
, cujos elementos seguem
a regra a seguir.
Para i = 1, . . . , J
X
(i)
t
=
Z
t
0 . . . 0
t / I e t linha i,
0 caso contr´ario.
E tamem
X
(T )
t
=
Z
t
0 . . . 0
t / I,
0 caso contr´ario.
Por fim, existe uma extens˜ao direta da Proposi¸ao 1 aplic´avel ao modelo
(3-14), a qual, como anteriormente discutido na se¸ao 3.3, facilita a estima¸ao
dos parˆametros do modelo em situa¸oes pr´aticas.
3.3.2
Erro m´edio quadr´atico da Reserva IBNR estimada: casos total e por ano
Como a mencionado na se¸ao anterior, uma das vantagens do m´etodo
do acumulador ´e obter-se o valor estimado da reserva IBNR e seu erro edio
quadr´atico diretamente do vetor de estado suavizado e sua matriz de variˆancia-
covariˆancia, respectivamente.
Cap´ıtulo 3. Metodologia 28
Vetor ou
Matriz Dimens˜ao
α
t
(m + pJ) × 1
Z
t
p × (m + pJ)
T
t
(m + pJ) × (m + pJ)
R
t
(m + pJ) × r
Tabela 3.1: Nova dimens˜ao dos vetores e matrizes para o etodo do acumul-
dador.
A reserva estimada ser´a dada por
ˆ
R = E(δ
(T )
n+1
|
˜
Y) +
t/∈I
d
t
, exatamente
como na equa¸ao (
2-6). Seu erro m´edio quadr´atico ser´a dado pelo ´ultimo
elemento da diagonal principal da matriz Var(α
n+1
|
˜
Y) = P
n+1|n
. Assim, a
reserva e seu respectivo erro padr˜ao s˜ao dados por:
IBNR
ˆ
R = E(δ
(T )
n+1
|
˜
Y) +
t/∈I
d
t
, (3-15)
ep(IBNR)
ep(R) =
Var(δ
(T )
n+1
|
˜
Y) +
t/∈I
H
t
. (3-16)
4
Aplica¸oes
A fim de se comparar o desempenho e a aderˆencia dos modelos apre-
sentados no cap´ıtulo 3, trˆes bases de dados ser˜ao utilizadas. A primeira base,
apresentada na tabela 4.1, foi amplamente estudada na literatura de Reservas
IBNR (cf. Mack, 1993; England & Verrall, 2002; de Jong, 2006; entre outros),
e, aqui, ser´a denotada pela forma abreviada AFG. A segunda, mostrada na
tabela 4.2, tamb´em foi estudada em Taylor & Ashe (1983), Verrall (1991) e
Mack (1993), e que ser´a chamada de MC1. Por fim, a terceira base, apresen-
tada na tabela 4.3, foi utilizada no trabalho de de Jong & Zehwirth (1983).
Esta base, aqui chamada por DJZ, refere-se aos montantes pagos, em milhar
de libra, por um seguradora inglesa n˜ao identificada.
Tabela 4.1: D´ıvidas gerais facultativas (excluindo ambiental) do estudo da
evolu¸ao hist´orica de perdas (1991 - unidade milhar de d´olar)–AFG.
Ano de
Origem Desenvolvimento d
w 0 1 2 3 4 5 6 7 8 9
1 5012 3257 2638 898 1734 2642 1828 599 54 172
2 106 4179 1111 5270 3116 1817 -103 673 535
3 3410 5582 4881 2268 2594 3479 649 603
4 5655 5900 4211 5500 2159 2658 984
5 1092 8473 6271 6333 3786 225
6 1513 4932 5257 1233 2917
7 557 3463 6926 1368
8 1351 5596 6165
9 3133 2262
10 2063
As eries univariadas criadas a partir do “empilhamento” dos anos de
acidente das bases AFG, MC1 e DJZ est˜ao representadas nas figuras 4.1(a),
4.1(b) e 4.1(c), respectivamente, em suas escalas originais, e nas figuras 4.2(a),
4.2(b) e 4.2(c) em escala logar´ıtmica. Em uma primeira an´alise gr´afica da erie
DJZ, notam-se claros ind´ıcios de periodicidade: o padr˜ao de decaimento dos
valores da s´erie parece repetir-se a cada ano de acidente. a nas s´eries AFG e
Cap´ıtulo 4. Aplica¸oes 30
Tabela 4.2: Triˆangulo de runoff extra´ıdo de Mack (1993).
Ano de
Origem Desenvolvimento d
w 0 1 2 3 4 5 6 7 8 9
1 357848 766940 610542 482940 527326 574398 146342 139950 227229 67948
2 352118 884021 933894 1183289 445745 320996 527804 266172 425046
3 290507 1001799 926219 1016654 750816 146922 495992 280405
4 310608 1108250 776189 1562400 272482 352053 206286
5 443160 693190 991983 769488 504851 470639
6 396132 937085 847498 805037 705960
7 440832 847631 1131398 1063269
8 359480 1061648 1443370
9 376686 986608
10 344014
Tabela 4.3: Triˆangulo de runoff para uma seguradora inglesa (unidade milhar
de libra)–DJZ.
Ano de Desenvolvimento d
Origem w 0 1 2 3 4
1 753.5 648.9 311.7 173.5 71.3
2 642.3 648.4 249.7 206.5
3 715.8 661.1 309.4
4 841.6 862.6
5 968.8
MC1 esse comportamento ao fica ao evidente: cada ano de acidente aparenta
ter padr˜oes distintos um dos outros.
O n´umero significativo de valores faltantes do triˆangulo pode dificultar a
estima¸ao da fun¸ao de verossimilhan¸ca, pois a informa¸ao de Fisher correspon-
dente, que ´e diretamente ligada `a curvatura (cf. Migon & Gamerman, 2001,
cap.2), perde contribui¸oes. Com o intuito de contornar parcialmente este pro-
blema, decidiu-se pela combina¸ao entre o algoritmo Expectation-Maximization
(EM ) adaptado ao modelo em EE (cf. Durbin & Koopman, 2001; e Shumway
& Stoffer, 2006) com o otimizador do tipo quasi-Newton BFGS para a maxi-
miza¸ao da verossimilhan¸ca.
O algoritmo EM ´e um procedimento iterativo composto por dois passos: o
primeiro passo envolve a avalia¸ao da esperan¸ca da densidade p(Y, α|Ψ) condi-
cionada a p(α|Y,
˜
Ψ), com Ψ = (σ
2
ε
, σ
2
µ
, σ
2
γ
)
e
˜
Ψ sendo os hiperparˆametros da
itera¸ao corrente; e a segunda etapa consiste na maximiza¸ao desta esperan¸ca
com rela¸ao aos elementos de Ψ. As express˜oes dos valores de Ψ para cada
itera¸ao, no caso particular de um modelo estrutural de n´ıvel local com peri-
Cap´ıtulo 4. Aplica¸oes 31
odicidade (sazonalidade), s˜ao dadas por:
¯σ
2
ε
=
1
n
n
t=1
ˆε
2
t
Var(ε
t
|Y)
¯σ
2
µ
=
1
n 1
n
t=2
ˆµ
2
t1
Var(µ
t1
|Y)
¯σ
2
γ
=
1
n 1
n
t=2
ˆγ
2
t1
Var(γ
t1
|Y)
Na sequˆencia, ser˜ao apresentados os resultados das implementa¸oes dos
m´etodos aplicados nas trˆes bases de dados. A estima¸ao dos modelos foi
realizada utilizando-se a linguagem Ox com o pacote de Espa¸co de Estado
SsfPack (cf. Doornik, 2001 e Koopman et al., 1999).
Cap´ıtulo 4. Aplica¸oes 32
0 10 20 30 40 50 60 70 80 90 100
0
1000
2000
3000
4000
5000
6000
7000
8000
AFG
4.1(a): Dados AFG
0 10 20 30 40 50 60 70 80 90 100
250000
500000
750000
1e6
1.25e6
1.5e6
MC1
4.1(b): Dados MC1
0 5 10 15 20 25
100
200
300
400
500
600
700
800
900
DJZ
4.1(c): Dados DJZ
Figura 4.1: S´eries empilhadas na escala real.
Cap´ıtulo 4. Aplica¸oes 33
0 10 20 30 40 50 60 70 80 90 100
4
5
6
7
8
9
Data
4.2(a): Dados AFG
0 10 20 30 40 50 60 70 80 90 100
11.5
12.0
12.5
13.0
13.5
14.0
MC1
4.2(b): Dados MC1
0 5 10 15 20 25
4.5
5.0
5.5
6.0
6.5
Data
4.2(c): Dados DJZ
Figura 4.2: S´eries empilhadas na escala logar´ıtmica.
Cap´ıtulo 4. Aplica¸oes 34
4.1
erie AFG: resultados
A estima¸ao dos parˆametros do modelo para os dados AFG, na escala
original, revelou n´ıvel e periodicidade estoasticos, enquanto que para a
escala logar´ıtmica estas mesmas componentes mostraram-se determin´ısticas,
de acordo com as desprez´ıveis rela¸oes sinal/ru´ıdo mostradas na Tabela 4.4. Tal
mudan¸ca de comportamento, no que diz respeito `as componentes de n´ıvel das
escalas analisadas, pode ser justificado por causa de a raz˜ao sinal/ru´ıdo do dado
AFG em escala original ter se mostrado ao muito “alta”, facilitando assim
a elimina¸ao de variabilidade pela tranforma¸ao logar´ıtimica, compressora
natural de escala. Vale ainda dizer que este fenˆomeno ao compromete e
tampouco torna conflitantes as an´alises particulares para cada escala, pois
o comportamento estoastico do n´ıvel da s´erie em escala original, no aximo,
indicou um fraqu´ıssimo movimento ao-constante entre os 1
o
e 5
o
anos de
acidente (cf. Figura 4.3). Quanto `a periodicidade, apenas confirma-se o mesmo
padr˜ao de decaimento j´a esperado, assim, como antes, obtido em Atherino &
Fernandes (2007), para cada ano de origem.
Tabela 4.4: Parˆametros estimados e rela¸oes sinal/ru´ıdo para a base de dados
AFG.
Escala
Parˆametro (original) (log)
Log-ver. 407.41 -62.96
σ
2
ε
2.15 ×10
6
6.59 ×10
1
σ
2
ξ
1.64 ×10
4
1.82 ×10
13
σ
2
ω
2.05 ×10
5
2.39 ×10
10
σ
2
ξ
2
ε
7.62 ×10
3
2.77 ×10
13
σ
2
ω
2
ε
9.55 ×10
2
3.63 ×10
10
As reservas IBNR estimadas est˜ao expostas na Tabela 4.7.
Tabela 4.5: Compara¸ao entre os modelos (dados AFG).
Escala
(original) (log) Chain Ladder
MAPE (%) 87.13 127.47 127.82
EQM 3.51 ×10
6
4.87 ×10
6
9.65 ×10
6
Pseudo R2 (%) 31.92 23.61 12.05
AIC 15.29 2.76
BIC 15.76 3.24
Quanto aos diagn´osticos, constata-se bom comportamento das inovoes
para o modelo na escala original, sem ind´ıcios de correla¸ao serial, como est´a
Cap´ıtulo 4. Aplica¸oes 35
0 10 20 30 40 50 60 70 80 90 100
0
2500
5000
7500
Série AFG Nível suavizado
0 10 20 30 40 50 60 70 80 90 100
0
2500
5000
7500
Série AFG Série suavizada
0 10 20 30 40 50 60 70 80 90 100
0
2500
Periodicidade suavizada
Figura 4.3: Resultados do modelo estrutural nos dados sem transforma¸ao
(dados AFG).
0 20 40 60 80 100
4
5
6
7
8
9
10
Série AFG (log) Nível suavizado
0 20 40 60 80 100
−1
0
1
Periodicidade suavizada
0 20 40 60 80 100
4
5
6
7
8
9
10
Série AFG (log) Série suavizada (log)
0 20 40 60 80 100
0
2500
5000
7500
10000
Série AFG Série suavizada
Figura 4.4: Resultados do modelo estrutural nos dados com transforma¸ao
(dados AFG).
Cap´ıtulo 4. Aplica¸oes 36
Tabela 4.6: Compara¸ao entre os modelos (dados AFG) – Out of Sample.
Escala
(original) (log) Chain Ladder
MAPE (%) 206.26 177.94 246.85
EQM 2.44 ×10
6
2.53 ×10
6
8.45 ×10
6
Pseudo R2 (%) 57.62 36.23 49.01
Tabela 4.7: Reservas AFG calculadas e CV em %.
Ano de
Origem Chain Ladder Mod. Est. (original) Mod. Est. (log)
2 154 (134.0%) 733 (290.6%) 1966 (102.4%)
3 617 (101.0%) 2011 (171.6%) 611 (101.6%)
4 1636 (45.7%) 3584 (125.3%) 1579 (80.3%)
5 2747 (53.5%) 4378 (125.0%) 3213 (68.1%)
6 3649 (54.9%) 5201 (124.2%) 5565 (58.5%)
7 5435 (40.6%) 7867 (95.3%) 9433 (54.3%)
8 10907 (49.1%) 9961 (86.7%) 13093 (47.7%)
9 10650 (59.5%) 15472 (64.2%) 19076 (45.4%)
10 16339 (150.4%) 19447 (58.5%) 25624 (42.1%)
Total 52135 (51.6%) 68654 (48.9%) 80159 (24.2%)
retratado em suas FAC e FACP (cf. Figura 4.5). O modelo em log tamb´em
apresentou o mesmo comportamento (cf. Figura 4.6). Segundo a pr´opria Tabela
4.5, ambos os modelos superaram o etodo Chain-Ladder tanto em erro
m´edio quadr´atico quanto em pseudo-R2. Entretanto, o comportamento dos
res´ıduos auxiliares
1
um instrumento para detec¸ao de observoes aberrantes
apontou a presen¸ca de observoes outliers, tornando-se necess´aria uma nova
an´alise introduzindo interven¸oes ao modelo. Essa an´alise ser´a discutida em
detalhes na pr´oxima subse¸ao.
4.1.1
An´alise de interven¸oes nos dados AFG
Para cada uma das escalas, original e em log, foram estimados dois
modelos com interven¸oes (totalizando assim, com os modelos previamente
estimados, seis modelos): um com “menos interven¸oes”; e o outro com “mais
interven¸oes”. Com o intuito de facilitar a an´alise, deste ponto em diante, cada
modelo ser´a referenciado seguindo a nomenclatura abaixo:
Modelo I-a — modelo em escala original sem interven¸oes;
Modelo I-b — modelo em escala original com 5 interven¸oes;
1
Foram considerados outliers todas as observoes cujos res´ıduos auxiliares superaram
trˆes unidades em valor absoluto.
Cap´ıtulo 4. Aplica¸oes 37
0 20 40 60 80 100
−2
0
2
Inovação padronizada
0 20 40 60 80 100
−2.5
0.0
2.5
5.0
Resíduo auxiliar
0 5 10 15 20
0
1
FAC−Inovação padronizada
0 5 10 15 20
0
1
FACP−Inovação padronizada
−4 −3 −2 −1 0 1 2 3
0.2
0.4
N(s=0.999)
−1 0 1 2
−2
0
2
Inovação padronizada × normal
Figura 4.5: Diagn´osticos modelo estrutural nos dados AFG sem trans-
forma¸ao.
0 20 40 60 80 100
−2
0
2
Inovação padronizada
0 20 40 60 80 100
−10
−5
0
5
Resíduo auxiliar
0 5 10 15 20
0
1
FAC−Inovação padronizada
0 5 10 15 20
0
1
FACP−Inovação padronizada
−4 −2 0 2
0.25
0.50
N(s=0.995)
−1 0 1 2
−2.5
0.0
2.5
Inovação padronizada × normal
Figura 4.6: Diagn´osticos modelo estrutural nos dados AFG com trans-
forma¸ao.
Cap´ıtulo 4. Aplica¸oes 38
Modelo I-c — modelo em escala original com 8 interven¸oes;
Modelo II-a — modelo em escala log sem interven¸oes;
Modelo II-b — modelo em escala log com 7 interven¸oes;
Modelo II-c — modelo em escala log com 10 interven¸oes.
A Tabela 4.8 mostra os instantes que sofreram interven¸oes em cada um
dos modelos.
Tabela 4.8: Interven¸oes em cada modelo para os dados AFG.
Modelo # Interv. Instantes
I-a 0 NA
I-b 5 11,13,31,42 e 44
I-c
8 4,11,13,14,31,34,42 e 44
II-a
0 NA
II-b
7 11,13,21,31,44,46 e 60
II-c
10 4,9,11,13,21,31,34,44,46 e 61
Primeiramente, ser˜ao analisados os parˆametros estimados de cada mo-
delo. Segundo a Tabela 4.9, a ind´ıcios de que a componente de n´ıvel ´e de-
term´ınistica para todos os modelos, a que foram estimados valores pr´oximos de
zero para a variˆancia da componente de n´ıvel (σ
2
ξ
) (excetuando-se o modelo I-
a). Entretanto, apesar de o n´ıvel ter mostrado comportamento determin´ıstico,
a componente peri´odica manteve-se com um padr˜ao estoastico, de acordo
com as rela¸oes sinal/ru´ıdo expressivamente ao-nulas (0.24 para o modelo I-b
e 1.23 para o I-c).
Tabela 4.9: Parˆametros estimados e rela¸oes sinal/ru´ıdo para a base de dados
AFG - modelos com interven¸oes.
Escala
(normal) (log)
Parˆametro I-b I-c II-b II-c
Log-ver. 392.66 -380.27 -39.89 -17.39
σ
2
ε
9.89 ×10
5
3.00 ×10
5
1.99 ×10
1
9.06 ×10
187
σ
2
ξ
1.03 ×10
4
0 9.89 ×10
13
1.64 ×10
4
σ
2
ω
2.37 ×10
5
3.68 ×10
5
1.34 ×10
2
7.48 ×10
2
σ
2
ξ
2
ε
1.04 ×10
10
0 4.95 ×10
12
σ
2
ω
2
ε
2.39 ×10
1
1.23 6.71 ×10
2
As estat´ısticas de compara¸ao dentro da amostra entre os modelos
encontram-se na Tabela 4.10, na qual se explicitam MAPE, EQM, Pseudo-R2,
AIC, BIC e resultados dos testes de raz˜ao de verossimilhan¸ca para a relevˆancia
Cap´ıtulo 4. Aplica¸oes 39
das interven¸oes. Para o alculo do MAPE, do EQM e do Pseudo-R2, foram
exclu´ıdas as observoes da primeira linha do triˆangulo – referente ao per´ıodo
difuso do filtro de Kalman e tamem as da primeira coluna `a qual o
m´etodo Chain-Ladder ao se aplica por constru¸ao. Comparando-se, com essas
medidas, os modelos em EE e o etodo Chain-Ladder, os primeiros mostraram-
se mais aderentes aos dados do que o ´ultimo. At´e mesmo os modelos I-a e
II-a, que ao possuem interven¸oes, foram considerados mais adequados em
rela¸ao ao Chain-Ladder. Finalmente, cita-se que as interven¸oes se mostraram
estatisticamente significantes atrav´es de testes de raz˜ao de verossimilhan¸ca
(RV) aplicados aos modelos I-a & I-b, I-a & I-c e I-b & I-c, com todos os testes
tendo suas respectivas hip´oteses nulas
2
sendo fortemente rejeitadas (todos os
p-valores inferiores a 10
4
).
Tabela 4.10: Compara¸ao entre os modelos com interven¸oes (dados AFG).
I-b I-c II-b II-c CL
MAPE (%) 63.68 55.23 42.26 31.03 127.82
EQM 2.16 ×10
6
1.06 ×10
6
2.66 ×10
6
2.04 ×10
6
9.65 ×10
6
Pseudo R2 (%) 50.45 55.96 43.19 54.46 12.05
AIC 14.93 14.59 2.18 1.47
BIC 15.59 15.36 2.91 2.31
Teste RV (1) 29.5 54.28 46.14 91.14
(0.000) (0.000) (0.000) (0.000)
Teste RV (2) 24.78 45.00
(0.000) (0.000)
Tamb´em foi realizada uma valida¸ao fora da amostra, em que cada
modelo ´e estimado novamente sem levar em conta as observoes pertencentes
`a diagonal; tais observoes ser˜ao utilizadas para a valida¸ao do modelo. Assim
como no procedimento dentro da amostra, para efeito de compara¸ao entre os
modelos e o etodo Chain-Ladder, n˜ao ser˜ao levadas em conta as observoes
da primeira linha e a da primeira coluna. As estat´ısticas MAPE, EQM e
Pseudo-R2 para o procedimento fora da amostra encontram-se na Tabela 4.11.
Os resultados confirmam a inferioridade do m´etodo Chain-Ladder a todos os
modelos em EE analisados, quanto ao poder preditivo. Os modelos em EE com
melhor poder preditivo foram os que possu´ıam o maior umero de interven¸oes:
o modelo I-c obteve o menor EQM e o maior Pseudo-R2, enquanto que o
modelo II-c obteve o menor MAPE; ressalte-se, por´em, que essas diferen¸cas
ao s˜ao expressivas ao ponto de se determinar qual modelo ´e superior.
2
Para o teste RV(1), a hip´otese nula H
0
´e “Os coeficientes associados `as interven¸oes
ao todos zero”, e os modelos reduzido e completo ao, respectivamente, dados por I-a e
I-b (ou I-c) para o caso da escala original, e por II-a e II-b (ou II-c) para a escala em log.
Para o RV(2), os modelos comparados ao os com “menos interven¸oes” com os de “mais
Cap´ıtulo 4. Aplica¸oes 40
Tabela 4.11: Compara¸ao entre os modelos com interven¸oes (dados AFG)
Fora da Amostra.
I-b I-c II-b II-c CL
MAPE (%) 161.64 149.12 161.56 142.76 246.85
EQM 1.44 ×10
6
1.27 ×10
6
1.47 ×10
6
1.33 ×10
6
2.75 ×10
6
Pseudo R2 (%) 70.49 73.55 69.00 72.98 27.23
Os diagn´osticos dos modelos em EE est˜ao representados na Tabela
4.12. Todos eles foram implementados sobre as inova¸oes padronizadas, que
ao definidas, para cada t, por υ
S
t
=
υ
t
F
t
(vide 3.1.1) e, sob as hip´oteses
asicas do modelo linear Gaussiano univariado, devem se comportar como
vari´aveis aleat´orias i.i.d. N(0, 1). Todos os modelos apresentaram inovoes
padronizadas n˜ao-correlacionadas segundo o teste de Ljung-Box. Os testes de
heterocedasticidade tamem ao evidenciaram viola¸oes nesse quesito, com
exce¸ao do modelo II-b que apresentou certos problemas de inconstˆancia na
variˆancia. As estat´ısticas de Durbin-Watson tamb´em foram pr´oximas de 2
(com exce¸ao do modelo II-a), bem como o teste do sinal de Cox-Stuart,
que tamb´em ao acusou presen¸ca de quaisquer tendˆencias nas inovoes. a
o teste Jarque-Bera rejeitou a hip´otese de normalidade apenas no modelo
II-a (o resultado desse crit´erio relativo ao modelo II-b, por causa de seu
comportamento possivelmente heteroced´astico, deve ser visto com cautela).
Tabela 4.12: Testes & Diagn´osticos para os dados AFG.
I-a I-b I-c II-a II-b II-c
Heterocedasticidade (20) 1.225 0.952 1.535 0.589 0.343 1.079
(0.655) (0.913) (0.346) (0.245) (0.021) (0.867)
Ljung-Box (15 lags) 11.898 8.962 11.660 7.287 12.526 24.530
(inov. padr.) (0.999) (1.000) (0.999) (1.000) (0.998) (0.748)
Ljung-Box (15 lags) 8.042 7.442 10.411 4.199 9.587 16.690
(quadrado inov. padr.) (1.000) (1.000) (1.000) (1.000) (1.000) (0.976)
Jarque-Bera 0.733 1.700 0.486 23.070 13.981 1.569
(0.693) (0.427) (0.784) (0.000) (0.001) (0.456)
Durbin-Watson 1.778 1.935 2.058 1.639 2.121 2.247
Cox-Stuart 7 6 8 8 7 14
(0.134) (0.052) (0.286) (0.286) (0.134) (0.134)
Na escala original, o melhor modelo, segundo qualquer um dos crit´erios
da Tabela 4.10 (log-verossimilhan¸ca, AIC, BIC etc.), foi o I-c; enquanto que
para a escala logar´ıtmica foi o modelo II-c. Graficamente, as componentes
interven¸oes”, seja qual for a escala.
Cap´ıtulo 4. Aplica¸oes 41
estimadas e os diagn´osticos dos referidos modelos podem ser observados nas
Figuras 4.7 e 4.9 (modelo I-c), e 4.8 e 4.10 (modelo II-c). A fim de se escolher
qual o modelo mais adequado dentre estes dois, alguns cuidados precisam ser
tomados: suas log-verossimilhan¸cas e seus crit´erios de informa¸ao AIC e BIC
ao ao compar´aveis devido `as observoes estarem em escalas diferentes. A
medida MAPE tamb´em ´e fortemente influenciada pela escala dos dados: mesmo
com as previs˜oes transformadas de volta para a escala original dos modelos em
escala logar´ıtmica, o MAPE, por ser uma medida percentual, cria distor¸oes
nos erros absolutos.
Na literatura atuarial, existe a pr´atica de se utilizar o coeficiente de
varia¸ao (CV) te´orico para a reserva total como uma medida de compara¸ao
entre modelos, cf. Mack (1993), England & Verrall (2002), Taylor (2000),
de Jong (2006), entre outros autores. O CV ´e uma medida percentual que
´e fun¸ao do erro quadr´atico edio te´orico (cujo alculo torna-se vi´avel pelo
m´etodo dos blocos ou, para modelos em escalas originais, pelo m´etodo de
acumulador) e tamb´em do valor esperado da reserva. Logo, se dois modelos
possu´ırem o mesmo erro m´edio quadr´atico previsto, por´em com um deles tendo
estimado uma reserva mais alta, este ser´a considerado “melhor”, pois ter´a
um CV menor. Al´em disso, cumpre observar que, se pressupostos asicos
de um dado modelo ao violados o que se atestaria mediante pr´atica de
diagn´osticos e/ou o mesmo demonstrar pouca habilidade em reproduzir
os dados o que se refletiria em baixa performance sob crit´erios de poder
preditivo –, poucos argumentos restariam a favor do uso de medidas te´oricas,
como o CV, para compara¸ao de modelos. A fim de se evitar tais distor¸oes e
poss´ıveis ambiguidades, sugere-se o uso de medidas como o CV, ou o erro m´edio
quadr´atico te´orico (oriundo dos m´etodos discutidos nas se¸oes metodol´ogicas
dessa Tese se¸oes
3.2 e 3.3) apenas como medidas de precis˜ao nominal da
estima¸ao da reserva dos modelos, considerados como os “mais adequados’ de
acordo com an´alises dentro da amostra, como as que se praticaram at´e enao.
Para tais modelos, com os dados AFG, essas informa¸oes, junto com as reservas
estimadas (parciais e total) encontram-se na Tabela 4.13.
Cap´ıtulo 4. Aplica¸oes 42
0 10 20 30 40 50 60 70 80 90 100
0
2500
5000
7500
Série AFG Nível suavizado
0 10 20 30 40 50 60 70 80 90 100
0
2500
5000
7500
Série AFG Série suavizada
0 10 20 30 40 50 60 70 80 90 100
0
2500
5000
Periodicidade suavizada
Figura 4.7: Resultados dados AFG – Modelo I-c (8 interven¸oes).
0 20 40 60 80 100
4
5
6
7
8
9
10
Série AFG (log) Nível suavizado
0 20 40 60 80 100
−2
−1
0
1
2
Periodicidade suavizada
0 20 40 60 80 100
4
5
6
7
8
9
10
Série AFG (log) Série suavizada (log)
0 20 40 60 80 100
0
2500
5000
7500
10000
Série AFG Série suavizada
Figura 4.8: Resultados dados AFG – Modelo II-c (10 interven¸oes).
Cap´ıtulo 4. Aplica¸oes 43
0 20 40 60 80 100
−2
−1
0
1
2
Inovação padronizada
0 20 40 60 80 100
−1
0
1
2
Resíduo auxiliar
0 5 10 15 20
0
1
FAC−Inovação padronizada
0 5 10 15 20
0
1
FACP−Inovação padronizada
−3 −2 −1 0 1 2 3
0.2
0.4
N(s=0.999)
−2 −1 0 1 2
−2
0
2
Inovação padronizada × normal
Figura 4.9: Diagn´osticos dados AFG – Modelo I-c (8 interven¸oes).
0 20 40 60 80 100
0
2
Inovação padronizada
0 20 40 60 80 100
−0.000025
0.000000
0.000025
Resíduo auxiliar
0 5 10 15 20
0
1
FAC−Inovação padronizada
0 5 10 15 20
0
1
FACP−Inovação padronizada
−2 −1 0 1 2 3
0.2
0.4
0.6
N(s=0.983)
−2 −1 0 1
−2
0
2
Inovação padronizada × normal
Figura 4.10: Diagn´osticos dados AFG – Modelo II-c (10 interven¸oes).
Cap´ıtulo 4. Aplica¸oes 44
Tabela 4.13: Reservas Estimadas para os modelos com interven¸oes e seus
respectivos CV (%) – AFG.
Linha I-c II-c Chain Ladder
2 226 (461.5%) 200 (24.0%) 154 (134.0%)
3
1185 (112.4%) 937 (22.1%) 617 (101.0%)
4
2264 (67.3%) 1597 (20.9%) 1636 (45.7%)
5
4119 (40.5%) 2733 (19.4%) 2747 (53.5%)
6
5544 (32.2%) 5837 (18.4%) 3649 (54.9%)
7
8270 (22.7%) 9046 (18.7%) 5435 (40.7%)
8
9286 (21.1%) 11051 (22.2%) 10907 (49.1%)
9
16436 (12.4%) 20882 (20.8%) 10650 (59.5%)
10
19526 (10.9%) 25394 (25.2%) 16339 (150.4%)
Total 66856 (14.9%) 77677 (17.1%) 52135 (51.6%)
4.2
erie MC1: resultados
Seguindo com os exerc´ıcios emp´ıricos desta Tese, ser˜ao apresentados os
resultados com o MC1 para os dados em escala logar´ıtmica
3
.
Tabela 4.14: Interven¸oes em cada modelo para os dados MC1.
Modelo # Interv. Instantes
II-a 0
II-b
7 4,6,17,26,34,35 e 73
II-c
10 4,6,7,14,17,26,27,34,35 e 73
Perseguindo o mesmo roteiro adotado na subse¸ao anterior, inicialmente,
apresentam-se as estimativas das variˆancias na Tabela 4.15. Pelas mesmas e
correspondentes “raz˜oes sinal-ru´ıdo”, a periodicidade mostra-se determin´ıstica
para qualquer um dos modelos sob quest˜ao. a as componentes de n´ıvel,
noutra dire¸ao, mostraram-se com comportamento razoavelmente estoastico,
ao contr´ario do ocorrido nos dados AFG.
No tocante `a compara¸ao dos modelos sob a ´otica de poder preditivo,
o modelo II-c ´e o que se mostra sistematicamente superior na compara¸ao
que envolve tamb´em, mais uma vez, o Chain-Ladder, como ´e comprovado
na Tabela 4.16. A valida¸ao fora da amostra, cujos resultados encontram-
se na Tabela 4.17, tamem sugere que o modelo II-c seja o mais adequado,
embora o m´etodo Chain-Ladder tenha o erro m´edio quadr´atico inferior aos dos
modelos em EE. Quanto aos crit´erios de informa¸ao e aos testes de RV, todas
3
Dada a enorme quantidade de outliers sugeridos pelos res´ıduos auxiliares para a escala
original, al´em de alguns problemas encontrados no processo de estima¸ao de parˆametros, a
an´alise s´o se efetivou para os dados em escala logar´ıtmica.
Cap´ıtulo 4. Aplica¸oes 45
Tabela 4.15: Parˆametros estimados e rela¸oes sinal/ru´ıdo para a base de dados
MC1.
II-a II-b II-c
Log-Ver -24.67 -4.69 5.90
σ
2
ε
1.10 ×10
1
3.72 ×10
2
2.48 ×10
2
σ
2
ξ
2.47 ×10
4
1.67 ×10
3
6.44 ×10
4
σ
2
ω
3.43 ×10
12
3.23 ×10
12
1.18 ×10
11
σ
2
ξ
2
ε
2.24 ×10
3
4.50 ×10
2
2.60 ×10
2
σ
2
ω
2
ε
3.11 ×10
11
8.68 ×10
11
4.78 ×10
10
as interven¸oes consideradas mostraram-se, mais uma vez, estatisticamente
significantes (ao n´ıvel de 5% ou menos). Em rela¸ao aos diagn´osticos, a
Tabela 4.18 e, graficamente, a Figura 4.12, revelam que o modelo II-c ´e
o que mais se adequa aos pressupostos asicos da forma em EE linear
Gaussiana, apesar de ind´ıcio de que ainda persista estrutura de correla¸ao
nas inovoes padronizadas segundo o teste de Ljung-Box – apesar de o teste
de independˆencia de Cox-Stuart apontar adequado comportamento.
Tabela 4.16: Compara¸ao entre os modelos (dados MC1).
II-a II-b II-c CL.
MAPE (%) 35.51% 19.43% 14.92% 50.47%
EQM 6.17 ×10
10
2.75 ×10
10
1.72 ×10
10
1.17 ×10
11
Pseudo R2 52.11% 66.33% 64.51% 29.04%
AIC 1.37 0.82 0.44
BIC 1.84 1.48 1.10
Teste RV (1) 39.96 61.14
(0.000) (0.000)
Teste RV (2) 21.18
(0.000)
Tabela 4.17: Compara¸ao entre os modelos (dados MC1) – Fora da Amostra.
II-a II-b II-c CL.
MAPE (%) 33.73% 24.10% 21.81% 26.97%
EQM 6.21 ×10
10
4.25 ×10
10
4.64 ×10
10
3.44 ×10
10
Pseudo R2 82.96% 86.67% 89.40% 80.93%
As evidˆencias reunidas, no par´agrafo anterior, levam `a conclus˜ao de que
os dados ao melhores descritos pelo modelo com “mais interven¸oes”. Na
Tabela 4.19, encontram-se as reservas estimadas do mesmo, juntamente com o
CV te´orico oriundo do m´etodo dos blocos.
Cap´ıtulo 4. Aplica¸oes 46
0 20 40 60 80 100
12
13
14
Série MC1 (log) Nível suavizado
0 20 40 60 80 100
−1
0
1
Periodicidade suavizada
0 20 40 60 80 100
12
13
14
Série MC1 (log) Série suavizada (log)
0 20 40 60 80 100
500000
1e6
1.5e6
Série MC1 Série suavizada
Figura 4.11: Resultados do modelo estrutural nos dados MC1 com trans-
forma¸ao (10 interven¸oes).
0 20 40 60 80 100
−2
0
2
Inovação padronizada
0 20 40 60 80 100
−2.5
0.0
2.5
Resíduo auxiliar
0 5 10 15 20
0
1
FAC−Inovação padronizada
0 5 10 15 20
0
1
FACP−Inovação padronizada
−3 −2 −1 0 1 2 3 4
0.2
0.4
N(s=0.973)
−1 0 1 2
−2
0
2
Inovação padronizada × normal
Figura 4.12: Diagn´osticos modelo estrutural nos dados MC1 com trans-
forma¸ao (10 interven¸oes).
Cap´ıtulo 4. Aplica¸oes 47
Tabela 4.18: Testes & Diagn´osticos para os dados MC1.
II-a II-b II-c
Heterocedasticidade (20) 0.235 0.369 0.556
(0.002) (0.031) (0.198)
Ljung-Box (15 lags) 22.679 14.020 32.980
(inov. padr.) (0.091) (0.524) (0.005)
Ljung-Box (15 lags) 16.028 12.258 14.303
(quadrado inov. padr.) (0.380) (0.659) (0.503)
Jarque-Bera 4.893 1.268 0.395
(0.087) (0.530) (0.821)
Durbin-Watson 2.355 1.916 2.053
Cox-Stuart 9.000 8.000 12.000
(0.523) (0.286) (0.523)
Tabela 4.19: Reservas Estimadas para os modelos com interven¸oes e seus
respectivos CV (%) – MC1.
Linha II-c Chain Ladder
2 78,904 (23.3%) 94,634 (79.8%)
3
433,790 (17.3%) 469,510 (25.9%)
4
663,310 (13.7%) 709,640 (18.8%)
5
891,770 (12.0%) 984,890 (26.5%)
6
1,336,400 (10.8%) 1,419,500 (29.0%)
7
2,009,900 (10.3%) 2,177,600 (25.6%)
8
2,919,600 (10.4%) 3,920,300 (22.3%)
9
3,810,800 (10.8%) 4,279,000 (22.7%)
10
4,726,900 (12.1%) 4,625,800 (29.5%)
Total 16,871,000 (7.1%) 18,681,000 (13.1%)
4.3
erie DJZ: resultados
Os parˆametros estimados do modelo estrutural, para a base de dados
DJZ, encontram-se na tabela 4.20. As estima¸oes, em ambas as escalas (original
e em log), confirmaram a intui¸ao gr´afica citada anteriormente, apontando
uma periodicidade determin´ıstica do padr˜ao de pagamentos de sinistros IBNR
(vide as desprez´ıveis raz˜oes sinal/ru´ıdo na Tabela 4.20). Mas, ressalte-se que o
padr˜ao exibido de decaimento, ao longo de um dado ano de origem, ´e similar aos
provenientes de outras modelagens, com este mesmo triˆangulo, na literatura
(cf. de Jong & Zehnwirth, 1983; e Atherino & Fernandes, 2007).
Os primeiros pain´eis das Figuras 4.13 e 4.14 mostram um crescimento do
n´ıvel ao longo do tempo, o que pode ser interpretado, dada a ordena¸ao usada,
como um aumento do n´umero de sinistros IBNR com o avan¸co dos anos de
acidente.
Cap´ıtulo 4. Aplica¸oes 48
0 5 10 15 20 25
250
500
750
1000
Série DJZ Nível suavizado
0 5 10 15 20 25
250
500
750
1000
Série DJZ Série suavizada
0 5 10 15 20 25
−250
0
250
500
Periodicidade suavizada
Figura 4.13: Resultados do modelo estrutural nos dados sem transforma¸ao
(dados DJZ).
0 5 10 15 20 25
5
6
7
Série DJZ (log) Nível suavizado
0 5 10 15 20 25
−1.0
−0.5
0.0
0.5
1.0
1.5
Periodicidade suavizada
0 5 10 15 20 25
5
6
7
Série DJZ (log) Série suavizada (log)
0 5 10 15 20 25
250
500
750
1000
Série DJZ Série suavizada
Figura 4.14: Resultados modelo estrutural nos dados com transforma¸ao
(dados DJZ).
Cap´ıtulo 4. Aplica¸oes 49
Tabela 4.20: Parˆametros estimados e rela¸oes sinal/ru´ıdo para a base de dados
DJZ.
Escala
Parˆametro (normal) (log)
Log-ver. 58.44 3.84
σ
2
ε
3.31 × 10
2
5.65 × 10
3
σ
2
ξ
1.84 × 10
3
3.05 × 10
3
σ
2
ω
1.81 × 10
5
1.52 × 10
8
σ
2
ξ
2
ε
5.55 0.54
σ
2
ω
2
ε
5.47 × 10
8
2.69 × 10
6
No processo de compara¸ao dos modelos entre si e com o Chain-Ladder,
apenas foram consideradas, face `a escassez de dados, medidas de poder
preditivo e crit´erios de informa¸ao. Pela Tabela 4.21, ao a ind´ıcios claros
de um m´etodo “vencedor”. A valida¸ao, fora da amostra, tamb´em n˜ao sugere
um m´etodo com melhores propriedades preditivas (vide Tabela 4.22), por´em
as medidas foram calculadas levando-se em conta apenas trˆes observoes da
diagonal principal. As reservas estimadas, junto com os correspondentes CVs,
est˜ao na Tabela 4.23.
Cap´ıtulo 4. Aplica¸oes 50
Tabela 4.21: Compara¸ao entre os modelos (dados DJZ).
Mod. Est. (normal) Mod. Est. (log) Chain Ladder
MAPE (%) 14.08% 12.12% 13.00%
EQM 3.76 ×10
3
3.57 ×10
3
2.19 ×10
3
Pseudo R2 95.64% 96.13% 96.87%
Tabela 4.22: Compara¸ao entre os modelos (dados DJZ) – Fora da Amostra.
Mod. Est. (normal) Mod. Est. (log) Chain Ladder
MAPE (%) 12.95% 16.54% 14.87%
EQM 4.53 ×10
3
1.20 ×10
4
2.55 ×10
3
Pseudo R2 99.20% 99.94% 99.97%
Tabela 4.23: Reservas estimadas e seus respectivos CV (%) – DJZ.
Ano de
Origem Mod. Est. (normal) Mod. Est. (log) Chain Ladder
2 115 (46.0%) 76 (13.1%) 66 (55.5%)
3 478 (19.4%) 304 (7.4%) 268 (23.3%)
4 1283 (10.4%) 712 (7.7%) 693 (11.6%)
5 2302 (11.7%) 1628 (10.4%) 1696 (8.1%)
Total 4179 (8.9%) 2720 (7.7%) 2723 (8.2%)
5
Conclus˜oes e Extens˜oes
A metodologia proposta no presente trabalho atingiu os objetivos pre-
tendidos; evidˆencias emp´ıricas apontaram que a ordena¸ao “por linhas” do
triˆangulo runoff juntamente com as t´ecnicas propostas surgem como novas
alternativas para estima¸ao de reservas IBNR. Suas estima¸oes foram siste-
maticamente superiores em compara¸ao ao m´etodo Chain-Ladder para os trˆes
triˆangulos runoff aqui investigados. Outro ponto extremamente relevante ´e
a possibilidade de se utilizar duas abordagens distintas (M´etodo dos Blocos e
M´etodo do Acumulador) com caracter´ısticas pr´oprias, por´em gerando o mesmo
resultado final, al´em da viabilidade computacional e eficiˆencia das estima¸oes.
Por fim, cabe aqui ressaltar a flexibilidade e abrangˆencia em rela¸ao `as possi-
bilidades de se incorporar novos modelos estat´ısticos para estima¸ao de IBNR,
gra¸cas `a flexibilidade da forma em Espa¸co de Estado.
Como poss´ıveis extens˜oes do presente trabalho, citam-se:
1. Implementar modelos SAR (AR sazonal), na forma de Espa¸co de Estado,
com tabelas AIC/BIC comparando cada modelo.
2. Realizar um estudo de simula¸ao de Monte Carlo para que se determinem
as propriedades dos testes de RV para significˆancia usados nos modelos
em Espa¸co de Estado.
3. Medir a influˆencia de diferentes inicializa¸oes difusas aproximadas nas
estima¸oes, tanto dos parˆametros do modelo, quanto na reserva IBNR.
Referˆencias Bibliogr´aficas
[1] ATHERINO, R.; FERNANDES, C.. Um modelo em espa¸co de estado
para estima¸ao de reservas IBNR. Revista Brasileira de Risco e
Seguro, 3(5):93–110, 2007.
[2] BOOTH, P.; CHADBURN, R.; HABERMAN, S.; JAMES, D.; KHO-
RASANEE, Z.; PLUMB, R. H. ; RICKAYZEN, B.. Modern Actuarial
Theory and Practice. CRC Press, 2004.
[3] BORNHUETTER, R.; FERGUSON, R.. The actuary and IBNR.
In: PROCEEDINGS OF THE CASUALTY ACTUARIAL SOCIETY,
n´umero 59, p. 181–195, 1972.
[4] BROCKWELL, P. J.; DAVIS, R. A.. Introduction to Time Series
and Forecasting. Springer, 2002.
[5] CHRISTOFIDES, S.. Regression models based on log-incremental
payments. In: CLAIMS RESERVING MANUAL, VOL 2. Institute of
Actuaries, 1990.
[6] DE JONG, P.; ZEHNWIRTH, B.. Claims reserving, state-space
models and the Kalman filter. Journal of the Institute of Actuaries,
110:157–181, 1983.
[7] DE JONG, P.. Forecasting general insurance liabilities. Technical
report, Macquarie University, feb 2004. Department of Actuarial Studies
Research Paper Series.
[8] DE JONG, P.. Forecasting runoff triangles. North American Actuarial
Journal, 10(2):28–38, 2006.
[9] NTZOUFRAS, I.; DELLAPORTAS, P.. Bayesian modelling of out-
standing liabilities incorporating claim count uncertainty. North
American Actuarial Journal, 6(1):113–136, 2002.
[10] DOORNIK, J. A.. Ox 3.0: An object-oriented matrix programming
language, 2001. Timberlake Consultants LTD.
Referˆencias Bibliogr´aficas 53
[11] DORAY, L. G.. UMVUE of the IBNR reserve in a lognormal linear
regression model. Insurance: Mathematics and Economics, 18:43–57,
1996.
[12] DURBIN, J.; KOOPMAN, S.. Time Series Analysis by Space State
Methods. Oxford University Press, 2001.
[13] ENGLAND, P. D.; VERRALL, R. J.. Stochastic claims reserving
in general insurance. Journal of the Institute of Actuaries, 129:1–76,
2002.
[14] HERTIG, J.. A statistical approach to the IBNR-reserves in
marine insurance. ASTIN Bulletin, 15:171–183, 1985.
[15] KOOPMAN, S. J.; SHEPHARD, N. ; DOORNIK, J. A.. Statistical al-
gorithms for models in state space using ssfpack 2.2. Econometrics
Journal, 2:113–166, 1999.
[16] KREMER, E.. IBNR claims and the two-way model of ANOVA.
Scandinavian Actuarial Journal, 1982.
[17] MACK, T.. Distribution-free calculation of the standard error
of chain ladder reserve estimates. ASTIN Bulletin, 23(2):213–225,
1993.
[18] MACK, T.. Measuring the variability of chain ladder reserve
estimates. In: CASUALTY ACTUARIAL SOCIETY SPRING FORUM,
p. 101–182, 1994.
[19] MACK, T.. Which stochastic model is underlying the chain ladder
method? Insurance: Mathematics and Economics, 15:133–138, 1994.
[20] MIGON, H.; GAMERMAN, D.. Statistical Inference: an Integrated
Approach. A Hodder Arnold Publication, 1999.
[21] RENSHAW, A. E.. Chain ladder and interactive modelling (claims
reserving and GLIM). Journal of the Institute of Actuaries, 116:559–
587, 1989.
[22] SCHNIEPER, R.. Separating true ibnr and ibner claims. ASTIN
Bulletin, 21(1), 1991.
[23] SHUMWAY, R. H.; STOFFER, D. S.. Time Series Analysis and Its
Applications. Springer, 2006.
Referˆencias Bibliogr´aficas 54
[24] JOHNSON, R.; WICHERN, D.. Applied Multivariate Statistical
Analysis. Prentice Hall, 2002.
[25] WRIGHT, T.. A stochastic method for claims reserving in general
insurance. Journal of the Institute of Actuaries, 117:677–731, 1990.
[26] HARVEY, A. C.. Forecasting, structural time series models and
the Kalman filter. Cambridge University Press, 1989.
[27] HART, D.; BUCHANAN, R. ; HOWE, B.. The Actuarial Practice of
General Insurance. Institute of Actuaries of Australia, Level 7, Challis
House, Martin Place, Sydney, NSW, Australia, 1996.
[28] TAYLOR, G.; ASHE, F.. Second moment of estimates of outstand-
ing claims. Journal of Econometrics, 23:37–61, 1983.
[29] TAYLOR, G.. Claims Reserving in Non-Life Insurance. North-
Holland, 1986.
[30] TAYLOR, G.. Loss Reserving: an Actuarial Perspective. Springer,
2000.
[31] TAYLOR, G.. Loss reserving: Past, present and future. Technical
report, The University of Melbourne, 2003. Research Paper no. 109.
[32] VERRALL, R.. A state space representation of the chain ladder
linear model. Journal of the Institute of Actuaries, 116:589–610, 1989.
[33] VERRALL, R.. On the estimation of reserves from loglinear
models. Insurance: Mathematics and Economics, 10:75–80, 1991.
A
Provas
A.1
Prova do Lema 2
Para p, q = x, y, z, defina µ
p
= E(p) e Σ
pq
= Cov(p, q). Supondo sem perda
de generalidade que Σ
pp
´e invert´ıvel para p = y e p = z, a express˜ao (3-6) ´e
obtida da forma
E(x|y, z) = µ
x
+
Σ
xy
Σ
xz
Σ
1
yy
Σ
yz
Σ
zy
Σ
1
zz
y µ
y
z µ
z
= µ
x
+
Σ
xy
0
Σ
1
yy
0
0 Σ
1
zz
y µ
y
z µ
z
= µ
x
+ Σ
xy
Σ
1
yy
(y µ
y
)
= E(x|y),
sendo que as 1
a
e 3
a
igualdades decorrem da tradicional express˜ao para
esperan¸cas condicionais envolvendo distribui¸oes Gaussianas (cf. Johnson &
Wichern, 2002). A dedu¸ao da express˜ao (3-7) ´e inteiramente an´aloga.
A.2
Prova do Lema 3
Seja t / I arbitr´ario.
´
E suficiente ver que Cov(ε
t
, y
s
) = 0, para todo s I.
Mas isto ´e decorrente de
y
s
= Z
s

s1
j=1
T
j
α
1
+
s2
j=1
s1
k=j+1
T
k
R
j
η
j
+ R
s1
η
s1
+ d
s
+ ε
s
e de os vetores aleat´orios ε
t
, ε
s
, η
j
para j = 1, . . . , s1 e α
1
serem mutuamente
ao-correlacionados (vide pressupostos da forma em EE na subse¸ao 3.1.1).
Apˆendice A. Provas 56
A.3
Prova do Lema 4
Seja uma forma auxiliar em EE que possui a mesma equa¸ao de estado que
(3-1) e cuja equa¸ao das medidas ´e dada por
y
t
= Z
t
α
t
+ d
t
+ ε
t
, ε
t
NID(0, H
t
),
na qual y
t
= y
t
, Z
t
= Z
t
, d
t
= d
t
, H
t
= H
t
se t I, e Z
t
= 0, d
t
= 0, e
H
t
= I caso contr´ario. Ent˜ao, como y
s
´e ao correlacionado com (
˜
Y
, α
t
, ε
j
)
para s, t, j / I, a express˜ao 1 decorre do Lema 2 e do Lema 3 (correla¸ao
nula implica em independˆencia sob normalidade), e as express˜oes 2 e 3 ao
conseq¨uˆencias do Lema 2 e do Lema 1, novamente observando que K
t
= 0
sempre que t / I.
A.4
Prova do Teorema 1
Se t I, enao E(y
t
|
˜
Y) = y
t
, o que ´e suficiente para o primeiro caso. Suponha
agora que t, j / I e veja que, pela equa¸ao das observoes da forma em EE
dada em (3-1),
Cov(y
t
, y
j
|
˜
Y) = Z
t
Cov(α
t
, α
j
|
˜
Y)Z
j
+ Cov(ε
t
, ε
j
|
˜
Y)
+ Z
t
Cov(α
t
, ε
j
|
˜
Y) + Cov(ε
t
, α
j
|
˜
Y)Z
j
. (A-1)
Pelo item 2 do Lema 4, a 3
a
e a 4
a
parcelas de (A-1) se anulam. Al´em disso, se
t = j, segue-se, pelos itens 1 e 3 do Lema 4, que a 1
a
e a 2
a
parcela de (A-1)
resultam em Z
t
(P
t|t1
P
t|t1
N
t1
P
t|t1
)Z
t
e H
t
, respectivamente; isso prova o
segundo caso. Tamem, se t < j, enao, novamente pelos itens 1 e 3 do Lema
4, a 1
a
parcela ´e dada por Z
t
P
t|t1
L
∗
t
L
∗
t+1
. . . L
∗
j1
Z
t
e a 2
a
parcela se anula,
provando, assim, o terceiro caso.
A.5
Prova da Proposi¸ao 1
´
E suficiente mostrar que L = L
em todo espa¸co param´etrico, o que decorre,
atraes da decomposi¸ao pelo erro de predi¸ao (cf. Harvey, 1989), de se mostrar
que υ
t
= υ
t
para todo t = 1, . . . , n. Implementando: fixe t arbitr´ario. De acordo
com (3-2), segue-se, para os modelos (3-1) e (3-13) respectivamente, que
υ
t
= y
t
Z
t
a
t|t1
d
t
e υ
t
= y
t
Z
t
a
t|t1
d
t
, (A-2)
Apˆendice A. Provas 57
sendo a nota¸ao
um indicador de que o modelo adotado ´e o aumentado
e a
t|t1
E(α
t
|Y
t1
). Por outro lado, sob o modelo aumentado, a solu¸ao
recursiva da equa¸ao das observoes, para s = 1, . . . , t 1, ´e
y
s
=
Z
s
0

s1
j=1
T
j
0
X
j
I

α
1
δ
1
+
+
s2
j=1
s1
k=j+1
T
k
0
X
k
I

R
j
0
η
j
+
R
s1
0
η
s1
+ d
t
+ ε
s
. (A-3)
Como
s1
j=1
T
j
0
X
j
I
=
s1
j=1
T
j
0
A
s
I
(A-4)
e
s2
j=1
s1
k=j+1
T
k
0
X
k
I

R
j
0
η
j
=
s2
j=1
s1
k=j+1
T
k
R
j
η
j
B
j
, (A-5)
sendo que A
s
´e dependente das Z
j
e das T
j
, j = 1, . . . , s 2, e as B
j
ao
dependentes de Z
k
e das T
k
, k = j + 1, . . . , s 2, enao, substituindo (A-4) e
(A-5) apropriadamente em (A-3), obt´em-se
y
s
= Z
s

s1
j=1
T
j
α
1
+
s2
j=1
s1
k=j+1
T
k
R
j
η
j
+ R
s1
η
s1
+ d
t
+ ε
s
, (A-6)
a qual coincide com a solu¸ao recursiva da equa¸ao das oservoes do modelo
original. Por fim, combine (A-6) a (A-2).
Livros Grátis
( http://www.livrosgratis.com.br )
Milhares de Livros para Download:
Baixar livros de Administração
Baixar livros de Agronomia
Baixar livros de Arquitetura
Baixar livros de Artes
Baixar livros de Astronomia
Baixar livros de Biologia Geral
Baixar livros de Ciência da Computação
Baixar livros de Ciência da Informação
Baixar livros de Ciência Política
Baixar livros de Ciências da Saúde
Baixar livros de Comunicação
Baixar livros do Conselho Nacional de Educação - CNE
Baixar livros de Defesa civil
Baixar livros de Direito
Baixar livros de Direitos humanos
Baixar livros de Economia
Baixar livros de Economia Doméstica
Baixar livros de Educação
Baixar livros de Educação - Trânsito
Baixar livros de Educação Física
Baixar livros de Engenharia Aeroespacial
Baixar livros de Farmácia
Baixar livros de Filosofia
Baixar livros de Física
Baixar livros de Geociências
Baixar livros de Geografia
Baixar livros de História
Baixar livros de Línguas
Baixar livros de Literatura
Baixar livros de Literatura de Cordel
Baixar livros de Literatura Infantil
Baixar livros de Matemática
Baixar livros de Medicina
Baixar livros de Medicina Veterinária
Baixar livros de Meio Ambiente
Baixar livros de Meteorologia
Baixar Monografias e TCC
Baixar livros Multidisciplinar
Baixar livros de Música
Baixar livros de Psicologia
Baixar livros de Química
Baixar livros de Saúde Coletiva
Baixar livros de Serviço Social
Baixar livros de Sociologia
Baixar livros de Teologia
Baixar livros de Trabalho
Baixar livros de Turismo