Download PDF
ads:
FELIPE RICARDO SANTOS DE GUSMÃO
UMA ABORDAGEM BAYESIANA PARA DISTRIBUIÇÃO
WEIBULL INVERSA GENERALIZADA
RECIFE-PE - DEZ/2008
ads:
Livros Grátis
http://www.livrosgratis.com.br
Milhares de livros grátis para download.
UNIVERSIDADE FEDERAL RURAL DE PERNAMBUCO
PRÓ-REITORIA DE PESQUISA E PÓS-GRADUAÇÃO
PROGRAMA DE PÓS-GRADUAÇÃO EM BIOMETRIA E ESTATÍSTICA APLICADA
UMA ABORDAGEM BAYESIANA PARA DISTRIBUIÇÃO
WEIBULL INVERSA GENERALIZADA
Dissertação apresentada ao Program a de
Pós-Graduação em Biometria e Estatística
Aplicada como exigên cia parcial à obtenção
do título de Mestre.
Área de Concentração: Modelagem Estatística e Computacional
Orientador: Prof. Dr. Eufrázio de Souza Santos
Co-orien ta dor: Pr of. Dr. Gauss M. Cordeiro
RECIFE-PE - DEZ/2008.
ads:
FICHA CATALOGRÁFICA
CDD 574. 018 2
1. Weibull
2. Verossimilhnça
3. Bayesiana
4. Inferência
5. Estimação
6. Sobrevivência
I. Santos, Eufrázio de Souza
II. Título
G982a Gusmão, Felipe Ricardo Santos de
Uma abordagem Bayesiana para distribuição Weibull
inversa generalizada / Felipe Ricardo Santos de Gusmão.
-- 2008.
56 f. : il.
Orientador : Eufrázio de Souza Santos
Dissertação (Mestrado em Biometria e Estatística Aplica -
da) - Universidade Federal Rural de Pernambuco. Departa –
mento de Estatística e Informática.
Inclui apêndice e bibliografia.
UNIVERSIDADE FEDERAL RURAL DE PERNAMBUCO
PRÓ-REITORIA DE PESQUISA E PÓS-GRADUAÇÃO
PROGRAMA DE PÓS-GRADUAÇÃO EM BIOMETRIA E ESTATÍSTICA APLICADA
UMA ABORDAGEM BAYESIANA PARA DISTRIBUIÇÃO WEIBULL INVERSA
GENERALIZADA
Felipe Ricardo Santos de Gusmão
Dissertação julgada adequada para obtenção
do título de mestre em Biometria e Estatística
Aplicada, defendida e aprovada por unanimi-
dade em 19/12/2008 pela Comissão Exami-
nadora.
Orientador:
Prof. Dr. Eufrázio de Souza San tos
Universidade Federal Rural de Pernambuco
Banca Exam inadora:
Prof. Dr. Borko D. Stosic
Universidade Federal Rural de Pernambuco
Prof. Dr. Marinho Gomes de Andrade Filho
Universidade de São Paulo
Prof
a
. Dr
a
. Roseli Aparecida Leandro
Universidade de São Paulo
iii
Dedico, a todos que de alguma forma
tornaram a realização deste trabalho p ossí-
vel.
Agradecimentos
Agradeço a todos que de forma direta ou indireta, por ter me concedido a graça de
nascer do amor dos meus pais e ao longo de minha vida ter permitido chegar até aqui.
À minha mãe Sôn ia Gu smão, minha esposa Cristina e ao meu filho Vítor que são a
razão da m inha vida e luta.
Ao meu Or ientador Eufrázio de Souza Santos p ela sua paciência e ajuda no decorrer
do meu período como mestrando e como aluno de iniciação científica.
Ao Prof. Gauss Moutinho Cordeiro pela sugestão dada a mim sobre este tra balho.
Ao Prof. Edwin M. M. Ortega pelo seu apoio, ajuda, pe la orientação e dedicação dados
a mim .
A Prof
a
Roseli Aparecida Leand ro por ter nos guiado no camin ho do mundo bayesiano.
Ao Prof. Borko Stosíc por sua con stante transmissão de conhecimentos.
Ao Secretário Marco Antônio dos Santos pela sua amizade e ajuda durante todo o
decorrer deste per ío do.
Ao meu amigo Erinaldo Leite de Siqueira Júnior por seu apoio durante todo o decorrer
da nossa vida como mestrandos.
Ao meu amigo Kleber por seu ap oio durante os últimos momentos de elaboração deste
trabalho.
Ao meu amigo Ricardo por seu apoio e amizade durante todos e stes anos.
A minha amiga Edleide Brito que enfrentou comig o a jornada em São Paulo .
A doutora Julia na Cespedes por seu apoio quando tive dificuldades em m inha estadia
em São Paulo.
A todos meus amigos do mestrados pela interação p rodutiva e harmoniosa durante
nosso convívio.
Aos professores e funcionários do Departamento de Estatística e Informática pela con -
vivência agradável durante esse per ío do.
vi
"O mundo é um lugar per igoso de se viver,
não por causa daqueles que fazem o mal,
mas sim por causa daqueles que observam
e deixa m o mal acontecer."
Alber t Eisntein
Resumo
A distribuição Weibull inversa tem a habilidade de m odelar funções de r isco com forma
unimodal qu e são bastante comuns em e stud os biológicos e de confiabilidade. Uma nova
distribuição Weibull inversa generalizada tri-paramétrica com taxa de falha decrescente
e unimodal é proposta. Um compreensivo tratamento das propriedades matemáticas de
Weibull inversa gene ralizada é provid o e foi encontrado expressões para suas funções
geradoras de momentos e o r-ésimo momento generalizado foi determinado. Também
discutimos a estimação de xima verossimilhança e a s fórmu las para os elementos da
matriz de informa ção observada. Uma abordagem bayesiana para esta nova distribuição
foi proposta e exemplificada, modela ndo um conjunto de dad os agrários pelos métodos
clássico e bayesiano.
Palavras-ch ave: Weibull, verossimilhança, Bayesiana, Inferência, Estimação,
Sobrevivência.
Abstract
The distribution inverse Weibull is suitable for modeling failure rates which are quite
common in reliability and biological studies. In th is work a new three-parameter distribu-
tion generalized inverse Weibull with decreasing and unimodal failure rate is introduced.
We p rovide a comprehensive treatment of the mathematical properties of the generalized
inverse Weibull an d derive expressions for its moment g enerating function and the rth gen-
eralized moment. We a lso discuss maximum likelihood estimation and we provide formu lae
for the elements of the Observed information matrix, we also made an bayesian appr oach
for this new distribution and an applied was mad e for a real da ta set for the methods classic
and bayes.
Lista de Figuras
1 (a) Função densidade da DWI. (b) Fun ção de risco da DWI. (c) Função de
Sobrevivência da DWI. . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 20
2 Função densidade da DWIG. . . . . . . . . . . . . . . . . . . . . . . . . . p. 23
3 Função de Sobrevivência da DWIG. . . . . . . . . . . . . . . . . . . . . . p. 24
4 Função Taxa de Falha da DWIG. . . . . . . . . . . . . . . . . . . . . . . . p. 25
5 mistura de duas distribuições weibull inversa exponencializada com α
1
=
1, β
1
= 2, γ
1
= 4, α
2
= 2, β
2
= 3, γ
2
= 10, 5 e p
1
= p
2
= 0, 5 . . . . . . . . p. 36
6 mistura de duas funções de sobrevivência da weibull inversa exponenciali-
zada com α
1
= 1, β
1
= 2, γ
1
= 4, α
2
= 2, β
2
= 3, γ
2
= 10, 5 e p
1
= p
2
= 0, 5 p. 37
7 mistura de duas funções taxa de falha da weibull inversa exponencializada
com α
1
= 1, β
1
= 2, γ
1
= 4, α
2
= 2, β
2
= 3, γ
2
= 10, 5 e p
1
= p
2
= 0, 5 . . p. 38
8 Histograma, funções densidade da Weibull inversa e da Weibull inversa
generalizada e de nsidade empírica. . . . . . . . . . . . . . . . . . . . . . p. 45
9 Comparação entre sobrevivências geradas pelo método clássico, bayesiano
e Kaplan-Meier esboçadas no esque m a S(t) versus tempo. As curvas
tracejadas são os intervalos de confiança 95% par a o Kaplan-Meier . . . . p. 47
10 Comparação entre sobrevivências geradas pelo método clássico, bayesiano
e Kaplan-Meier esboçadas n o e sq uema de linearização. . . . . . . . . . . p. 47
11 Gráfico de autocorrelação para os parâmetros alfa, beta e gama. . . . . . p. 48
12 Gráfico da s densidades a posteriori e do tra ço pa ra o vetor de p arâmetros. p. 49
Lista de Tabelas
1 Algumas funções de distribuição geradas a partir da distribuição Weibull
inversa generalizada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 26
2 Valores estimados dos parâ metros α, β e γ p elo método de xima vero-
ssimilhança para os dados do gado da raça Nelore . . . . . . . . . . . . p. 46
3 Resulta dos da abordagem bayesian a para distribuição Weibull inversa ge-
neralizada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 46
Sumário
1 INTRODUÇÃO p. 1
2 REVISÃO DE LITERATURA p. 2
3 METODOLOGIA p. 4
3.1 Inferência Estatística . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 4
3.1.1 Função de Verossimilhança . . . . . . . . . . . . . . . . . . . . . . p. 4
3.1.2 Função Escore . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 5
3.1.3 Estimativa de Máxima Verossimilhan ça . . . . . . . . . . . . . . . p. 6
3.1.4 todos Iterativos . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 6
3.1.5 Momentos e Cumula ntes . . . . . . . . . . . . . . . . . . . . . . . p. 6
3.1.6 Identificabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 7
3.2 Análise de Sobrevivência . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 8
3.2.1 Censura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 8
3.2.2 Funções do Tempo de Sobrevivência . . . . . . . . . . . . . . . . p. 9
3.2.3 Função de Sobrevivência . . . . . . . . . . . . . . . . . . . . . . . p. 9
3.2.4 Função Taxa de Falha . . . . . . . . . . . . . . . . . . . . . . . . . p. 10
3.2.5 Algumas Relações entre as Funções . . . . . . . . . . . . . . . . . p. 10
3.2.6 Técnicas Não-Paramétricas . . . . . . . . . . . . . . . . . . . . . . p. 11
3.2.7 Estimador de Kaplan-Meier . . . . . . . . . . . . . . . . . . . . . . p. 11
3.2.8 Função de Verossimilhança em Análise de sobrevivência . . . . . p. 12
3.3 Inferência Bayesiana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 12
3.3.1 Teorema de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . p. 13
3.3.2 Informação a Priori . . . . . . . . . . . . . . . . . . . . . . . . . . p. 14
3.3.2.1 Densidades a Pr iori Su bjetivas . . . . . . . . . . . . . . . p. 14
3.3.2.2 Densidades a Pr iori Conjugadas . . . . . . . . . . . . . . p. 15
3.3.2.3 Priori de Laplace . . . . . . . . . . . . . . . . . . . . . . p. 15
3.3.2.4 Priori de Jef freys . . . . . . . . . . . . . . . . . . . . . . p. 16
3.3.2.5 Estimação Pontual . . . . . . . . . . . . . . . . . . . . . p. 17
3.3.2.6 Avaliação da Conver gência do Métod o de Amostrag em
Gibbs . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 17
3.3.2.7 Diagnóstico de Gewe ke . . . . . . . . . . . . . . . . . . . p. 18
3.4 A Distribuição Weibull Inversa . . . . . . . . . . . . . . . . . . . . . . . . p. 18
4 Distribuição Weibull Inversa Generalizada p. 21
4.1 Função Densidade da Distribuição Weibull Inve rsa Generalizada . . . . . p . 22
4.2 Função de Sobrevivência da Distribuição Weibull Inversa Generalizada . . p. 23
4.3 Função Taxa de Falha da Distribuição Weibull Inversa Generalizada . . . p. 24
4.4 Relação com ou tr as distribuições . . . . . . . . . . . . . . . . . . . . . . p. 25
4.5 Momentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 26
4.6 Função Geradora de Mome ntos e Cumulantes . . . . . . . . . . . . . . . p . 27
4.7 Estimação de Verossimilhança para DWIG . . . . . . . . . . . . . . . . . p. 28
4.8 Estimação de xima Verossimilhança com Dados Censurados . . . . . p. 30
4.9 Mistura de duas Distribuições Weib ull Inversa Generalizada . . . . . . . . p. 35
4.9.1 Propr iedades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 35
4.9.2 Identificabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 37
5 ABORDAGEM BAYESIANA p. 40
5.1 Distribuições a priori para DWIG . . . . . . . . . . . . . . . . . . . . . . . p. 40
5.2 Função de verossimilhança para DWIG . . . . . . . . . . . . . . . . . . . p. 41
5.3 Densidadea a posteriori para DWIG . . . . . . . . . . . . . . . . . . . . . p. 41
5.4 Média a posteriori e veto r das medianas a p osteriori para DWIG . . . . . . p. 42
6 APLICAÇÃO p. 44
6.1 Função Taxa de Falha . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 44
6.2 Estimação de Parâmetros . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 44
6.2.1 Estimação Através do Método de xima Verossimilhan ça . . . . p. 44
6.2.2 Estimação Através do Método Bayesiano . . . . . . . . . . . . . . p. 46
7 CONCLUSÃO p. 50
Referências p. 51
APÊNDICE p. 53
1
1 INTRODUÇÃO
Nos estudos em análise de sobrevivência, as distribu içõ es usadas para estimar os tem-
pos d e sobrevivência de indivíduos, como a distribuição exponencial, a Weibull, a log-gama
generalizada, acomodam a lgumas formas de risco, como a forma constante (distribuição
expon encial) e a forma crescente e decrescente (distribuição Weib ull), este gráficos de-
scritos anteriormente sã o facéis de encontrar em livros sobre análise de sobrevivência,
como o livro do Colosimo e Giolo (2006) por exemplo. Porém, na prática é comum en -
contrarmos dados de sobrevivência com função de risco de diferentes formas, como por
exemplo, em forma de U ou banheira e unimodal como no artigo do Jiang et. al. (2001). Os
modelos conhecidos para essas situações, em geral, têm como origem o modelo Weibu ll,
que tradicionalmente pode modelar funções de risco com formas constantes, crescentes e
decrescentes.
A distribuição Weib ull é bastante utilizada em estudos associados ao tempo de falha,
devido a grande aplicabilida de na área médica como na área de confiabilidade , bem como
na análise de sobrevivência. Dentro do contexto da taxa de risco ter forma unimodal, a
distribuição Weibull inversa atende a este requisito ver Jiang et. al. (2001).
No sentido (un im odalidade na fu nção de risco), foi proposto uma nova distribuição
nomeada de Weibull inversa generalizada. Esta nova d istribuição, devido a flexibilidade
em acomodar algumas formas de riscos, apresenta-se como uma importante distribuição
pois pode ser utilizada no s mais variados prob lemas de m odelagem de dados na análise
de sobrevivência oferecendo a vantagem de modelar funções de risco crescentes, decres-
centes e unimodal. Outra característica desta nova distribuição é a de possuir como caso
particular a s distribuições We ibull inversa, exponencial inversa e Rayleigh inversa.
2
2 REVISÃO DE LITER ATURA
De acordo com Cordeiro (1999) a inferência busca adquirir procedimentos adequados
de forma científica com base em dado conjunto d e d ados, tais como: obter uma estima-
tiva de um parâmetro θ desconhecido, construir um conjunto de valores po ssíveis d e θ que
tenha uma confiabilidade especificada. Logo, as ativida des da inferência são: a estimação,
a construção de regiões de confiança e o desenvolvimento de testes de hipóteses.
A análise de sobrevivência pode ser definida como um conjunto de técnicas e modelos
estatísticos que analisa dados tal como o tempo de ocorrência de determinado evento de
interesse, este m étodo se faz peculiar devido às características especiais, devido aos tipos
de dados que são geralmente utilizados pa ra esta análise como dados contendo censura,
por exemplo. Este método exige a introdução de uma variável extr a na análise, q ue in-
dica se o valor do tempo de sobrevivência de um d ado indivíduo foi observado ou não.
Louzada-Neto et. al.(2001).
De acordo com Colo simo e Giolo (2006) um d os m étodos que dispomos para testarmos
se nosso m odelo está bem ajustados aos dados consiste na comparação da função de so-
brevivência do modelo para métrico proposto com o estimador de Kaplan-Meier. Tend o em
mãos as estimativas dos parâmetros do mo delo, estima-se a função de sobrevivência. E
para o mesmo conjunto de dados, obtém-se a estimativa de Kaplan-Meier para a função de
sobrevivência. Daí, co m param-se graficamente as funções de sobrevivências estimadas
para o modelo paramétrico proposto com o de Kaplan-Meier. Se o modelo for adequado
ele deverá ter uma curva de sobrevivência que se aproxime da curva de sobrevivência
do estimador de Kaplan-Meier. Outro método consiste e m esboçarmos a função de so-
brevivência do modelo paramétrico versus a estimativa de Kaplan-Meier para a função de
sobrevivência, se esta curva estiver próxima da reta y = x teremos um bom ajuste.
Jiang et. al. (2001) mostraram que a funçã o densidade de prob abilidade d a distribuição
3
Weibull inversa tem a propriedade de un im odalidade e també m propuseram modelos de
misturas entre duas distribuições Weibu ll inversa.
Gupta e Kundu (1999) fizeram uso da generalização d a distribuição exp onencial calcu -
lando a máxima verossimilhança para dados completos e censurados.
Mudholkar et. al. ( 1996) pro põem uma generalização da distribuição Weibull para e s-
tudos de dados de análise de sobrevivência.
Xie e Lai (1995) estudar am um modelo ba seado da soma de duas distribuições We ibull.
Choudhury (2005) estudou sobre os momentos da distribuição Weibull exponenciada.
Lai et. al. (2003) fizeram uma modificação na distribuição Weibull e compararam com
outras modificações existentes.
Rajarshi e Rajarshi (1988) fizera m um a revisão sobre taxas de falha q ue apresentam a
forma de b anheira.
Xie et. al. (2002) propõem uma extensão da distrib uição Weibull modificada, discutem
a forma da taxa de falha do mesmo e estudam métodos de estimação de parâm etros.
De acordo com Pollard (1986) a abordagem bayesiana é um método para pôr no
mesmo co ntexto a informação a priori e da amostra. Ele advoga com o esta informação
a priori deve ser corrigida pelos novos dados.
De acordo com Box e Tiao (1973) o existe um estado de ignorância total a respeito
de uma dada situação ou do parâmetro, sempre se sabe algo , mesmo que este conheci-
mento seja mínimo.
De acordo com Paulino (2003) uma probabilidade subjetiva é uma medida de um certo
grau de crença pessoal de um dado indivíduo .
O sub jetivismo é o fundamento filosófico predominante da inferência bayesiana, em-
bora na prá tica densidades a priori nã o informativas (construidas sobre alguma regra for-
mal) são bastan te usadas. Kass e Wa sserman (1996)
4
3 METODOLOGIA
3.1 Inferência Estatística
De acordo com Gauss(1992) a inferência é a parte fundamental da Estatística e é tão
antiga quanto a teoria dos métodos qu e formam a Estatística atual. As primeir as técnicas
de inferência surgiram a ma is de 200 anos com os trabalhos de Bayes, DeMoivre, Gauss
e Laplace. Sir Ronald Fisher em 1912 prôpos uma inferência estatística basea da direta-
mente na função de verossimilhança, porém a intensificação da p roposta de Fisher foi
feita no período de 1930 à 1940, devido as aplicações em problemas agrícola s. A inferên-
cia tem por objetivo prover regras apropriadas de natureza científica baseando-se em um
certo conjunto de da dos para executar algumas tarefas como:
1) estimação;
2) construção de intervalos de confiança;
3) dese nvolvimento de testes de hipóteses.
3.1.1 Função de Verossimilhança
Sendo Y = (Y
1
, ..., Y
n
)
T
uma variável aleatória caracterizada por uma função de prob-
abilidade ou densidade de pr obabilidad e com forma analítica f(y; θ) conhecida e um vetor
de parâmetros desconhecidos θ = (θ
1
, ..., θ
k
)
T
e θ Θ em q ue Θ é o espaço paramétrico
e Θ
k
, em que
k
é o conjunto dos reais.
5
A função de verossimilhaça L(θ) é igual a f(y; θ), daí
L(θ) = f(y; θ). (3.1)
Assim, a função de verossimilhaça quando inferida obtém-se informação sobre o vetor de
parâmetros θ. Daí L(θ) depende de y e não de θ. Se Y tem componentes mutuamente
independentes para f(y
i
; θ), 1 i n, tem-se
L(θ) =
n
i=1
f(y
i
; θ) (3.2)
O logaritmo da verossimilhaça é conhe cid a como função suporte e no caso de variá-
veis alea tórias independentes é dada por
(θ) = logL(θ) = log
n
i=1
f (y
i
; θ)
=
n
i=1
log [f (y
i
; θ)] (3.3)
dentre vários vetores θ’s aquele que sobre o mesmo conjunto de dados tiver a maior
verossimilhaça será o vetor θ mais plausivel ou o mais próximo de θ
0
(o vetor de parâ-
metros verdadeiros).
3.1.2 Função Escore
Por definição a primeira derivada da função suporte é denominada função escore tam-
bém conh ecida por vetor escore e é dada por:
U (θ) =
(θ; y) =
(θ; y)
θ
=
(θ)
θ
. (3.4)
A função escore é um vetor com dimensão k.
A pr im eiras derivadas da função escore com sinal negativo é chamada de matriz de infor-
mação ob se rvada e é dada por:
J (θ) =
U
T
θ
=
′′
(θ) =
2
(θ)
θθ
T
. (3.5)
6
3.1.3 Estimativa de Máxima Verossimilhança
Para estimar os parâmetros usamos u m a técnica de cálculo para encontrar ximos
e mínimos, que consiste em derivar uma função e igualar o resultado à zero, então para
nosso caso de rivamos a fu nção suporte e igualamos à zero.
U
ˆ
θ
= 0. (3.6)
3.1.4 Métodos It erativos
Os métodos iterativos são usados quando a as equações de máxima verossimilhança
gera equações que nã o tem soluções analíticas ou quando a dimensão k do parâmetro é
muito grande, ao expandir U
ˆ
θ
em série multivariada de Taylor até a prime ira ordem ao
redor de um ponto qualquer θ pertencente a uma vizinhaça de
ˆ
θ, tem-se, aproximadamente
U
ˆ
θ
=
U (θ) +
U (θ )
T
θ
θ
ˆ
θ
(3.7)
como U
ˆ
θ
= 0, então
ˆ
θ θ
=
[J (θ)]
1
U (θ) (3.8)
O método de Newton-Raph so n consiste em usar a equação obtida a nteriormente de
forma iterativa , assim
ˆ
θ
(m+1)
=
θ
(m)
+
J
θ
(m)

1
U
θ
(m)
(3.9)
em que as quantidades com superescrito (m) sã o avaliadas na m- ésima iteração. Repete-
se o procedimento até a diferença entre
ˆ
θ
(m+1)
e θ
(m)
se tornar desprezível ou m enor que
uma certa quantidade definida.
3.1.5 Momentos e Cumulantes
A função geratriz de momentos (fgm) é definida por:
M(t) = E( e
tY
), (3.10)
7
a função geratriz de momentos M(t) pode ser representada também pela expansão dada
por:
M(t) = 1 +
k
µ
k
t
k
k!
(3.11)
suposta convergente para todo |t| suficientemente pe queno. A função geratriz de cumu-
lantes (fgc) é definida por:
K(t) = log M(t) (3.12)
e ainda a função geratriz de cumulantes p ode ser expandida como
K(t) =
k
κ
k
t
k
k!
. (3.13)
Os quatros primeiros cumulantes são dados por:
κ
1
= µ
1
, (3.14)
κ
2
= µ
2
µ
2
1
(3.15)
κ
3
= µ
3
3µ
2
µ
1
+ 2µ
3
1
(3.16)
κ
4
= µ
4
4µ
3
µ
1
3µ
2
2
+ 12µ
2
µ
2
1
6µ
4
1
(3.17)
3.1.6 Identificabilidade
Definição: Seja φ uma transformação associada com cada F
i
Φ tendo o domínio
definido por D
Φ
i
com mapa linear M : F
i
φ
i
. Se existe uma ordem total () de Φ tal
que:
i) F
1
F
2
, (F
1
, F
2
Φ) D
Φ
i
D
Φ
i
;
ii) para cada F
1
Φ, existe algum s
1
D
Φ
1
, φ
1
(s) = 0 tal que lim
ss
1
φ
2
φ
1
= 0 for F
1
< F
2
,
(F
1
, F
2
Φ).
Então a classe Λ de todas as misturas finitas de distribuições é identificável relativa a
Φ. Ver Sultan et. al. (2006))
8
3.2 Análise de Sobrevivência
A análise de sobrevivência é uma das áreas da estatística que vem apresentando o
maior crescimento nas duas últimas d écadas do século passado de acordo com Colosimo
e Giolo ( 2006), isto devido ao avanço tecnológico nos computadores e com o aprimora-
mento e desenvolvimento da s técnicas estatísticas. A an álise de sobrevivência é uma
técnica estatística usada em casos em que, geralmente, a variável resposta é o período
de tempo a o acontecimento de um eve nto de interesse e a este tempo é dado o n ome
de tempo de falha. O tempo de falha pode ser p or exemp lo a duração do funcionamento
de um equ ipamento elétrico até sua queima, pode ser o tempo de vida de um paciente do
momento que foi diagnosticado a doença a a morte do mesmo ou até cura, também pode
ser o tempo de desmame de um bezerro. A ca racterística principal dos dados em análise
de sobrevivência é a censura, que consiste em uma observação parcial d a respo sta. Sem
a presença de censura técnicas estatísticas como a nálise de regressão e planejamentos
de experimentos se riam aplicadas sem nenhum problema nestes dados. Os dados de
sobrevivência são basicamente car acterizados pelos tempos de falhas e pelas censuras.
3.2.1 Censura
As observações incompletas ou parciais são comuns em estudos clinicos, mesmo
tendo estes longos períod os de duração , a estas observações dar-se o nome de cen-
suras e pode m ocorrer devido a diversas causas, por exemplo se estivermos analisando
um grupo de pacientes com câncer alguns destes podem aban donar o estudo antes do
término por uma razão qualquer que não seja o evento de in teresse. Embora alguns da-
dos dentro do estudo d e análise de sobrevivência sejam cen su rados eles não devem ser
descartados, pois mesmo sendo parciais fornecem informações sobre o tempo de vida dos
individuos em estud o e o nã o uso dos dados parciais pode ocasionar conclusões viciadas.
tipos de mecanismos de censuras diferenciados como as censuras tipo I, II e a aleatória.
A censura do tipo I consiste em dar um final ao estudo num período de tempo pré-esta-
belecido, a censura tipo II consiste em termina r o estudo quando um mero determinad o
de eventos de interesse tiverem acontecido e censura aleatória pode acontecer quando a
9
retirada da observação no estud o e m questão for antes do evento de interesse ocorrer.
Para fazer uma representação simples do mecanismo de ce nsura aleatória duas va-
riáveis aleatórias serão usadas. Seja T e C va riáveis aleatórias independ entes a prim eira
representando o tempo de falha e a segunda a censura, respectivamente. Daí o tempo de
uma ob serva ção é dado por t = min(T, C) e o indicador de censura é dado por
δ =
1, para o tempo de falha
0, para a censura
(3.18)
3.2.2 Funções do Tempo de Sobrevivência
Seja T uma variável aleatória não-negativa, geralmente continua, que representa o
tempo de falha, é comume nte especificada em análise de sobrevivência pelas suas funções
de sobrevivência e de taxa de falha.
3.2.3 Função de Sobrevivência
A função de sobrevivência é um a das principais funções proba bilísticas usadas em
estudos de análise de sobrevivên cia . Definida como a probabilidade de uma observação
não falhar até um tempo t e dada por
S(t) = P (T > t) = 1 P (T t) (3.19)
em que P(T t)=F(t), d a função de sobrevivência po de ser definida como
S(t) = 1 F (t), (3.20)
que tem as seg uintes propriedades:
1) t = 0 S(t) = 1;
10
2) t S(t) 0;
3)
d[S(t)]
dt
= f(t).
3.2.4 Função Taxa de Falha
É definida como sendo a probababilida de de que a falha ocorra em u m intervalo de
tempo [t, t + t) dado que não ocorreu antes do tempo t, dividida pelo comprimento do
intervalo de tempo. Se assumirmos que t é muito pequeno h(t) representa a função taxa
de falha instantânea e é dad a por
h(t) = lim
t0
P (t T < t + t | T t)
t
(3.21)
Funções de sobrevivência distintas podem ter formas semelhantes, porém podem diferir
bastante na s fu nções taxa de falha. Daí a importância da função taxa de falha em a nálise
de sobrevivência.
3.2.5 Algumas Relações entre as Funções
Seja T uma variável aleatória contínua e não-negativa, algumas relações podem ser
obtidas em termos da s funções definidas anteriormente e são elas
h(t) =
f(t)
S(t)
(3.22)
em que f(t) é a função densidade de probabilidade da distribuição a qual T esteja associ-
ada,
S(t) = exp
Λ(u)
(3.23)
em que Λ(u) é a função de taxa de falha acu m ulada que é definida como:
Λ(u) =
t
0
h(u)du. (3.24)
11
3.2.6 Técnicas Não-Paramétricas
A análise estatística envolvendo dados de sobrevivên cia geralmente estão relacionadas
as respostas às perguntas de interesse obtid as a partir de um conjunto de dados de sobre-
vivência , o passo inicial de uma análise estatística consiste em um a d escrição dos dados.
Para as técnicas convencionais de análise descritiva, dados contendo censuras geralmente
são um problema para obtenção de médias, desvio-padrão e técnicas gráficas como his-
tograma, entre outras.
O principal compo nente da análise descritiva e nvolvendo dados de tem po de vida é a
função de sobrevivência. Neste caso, o procedimento inicial é encontrar uma estimativa
para esta função de sobrevivência e então, a partir dela , estimar as estatísticas de inter-
esse que usualmente são o tempo mé dio ou mediano, alguns percentis ou certas frações
de falhas em tempos fixos d e acompa nhamento.
3.2.7 Estimador de Kaplan-Meier
Em geral conjuntos de dados amostrais de tempos de falha contém censuras, e daí
se faz necessário utilizar técnicas estatísticas especializadas para acomodar a informação
contida nestas observações. A observação censurada informa que o tempo a a falha
é maior do que aquele que foi registrado. De acordo com Colosimo e Giolo (2006) para
fazer a estimação da função de sob revivência, este estimador não-paramétrico de Kaplan-
Meier é também co nhecido por estimador limite-produto. O estimador consiste em uma
adaptação da função de sobrevivência empírica que é d efinida por:
ˆ
S(t) =
n
N
(3.25)
em que n=núme ro de o bservações que não falharam até o tempo t e N=número total de
observações no estudo. O estimador de Kaplan-Meier consider a o número de intervalos
iguais ao número de falhas distintas e os limites dos intervalos são os próp rios tempos de
falhas da amostra. Considerando os itens abaixo:
t
1
< t
2
...< t
k
, os k tempos distintos e ordenados de falha,
12
d
j
o número de falhas em t
j
, j = 1, ..., k, e
n
j
o número de indivíduo s sob risco em t
j
, ou seja, os indivíduos que não falharam
e não foram censurados até o instante imediatamente anterior a t
j
.
Podemos agora definir a expressão geral do estimador de Kaplan-Meier, q ue é dada por:
ˆ
S(t) =
j:t
j
<t
n
j
d
j
n
j
=
j:t
j
<t
1
d
j
n
j
. (3.26)
A consistência e normalidade assintótica de
ˆ
S(t) foram provada s, sob certas condições
de regularidade.
3.2.8 Função de Verossimilhança em Análise de sobrevivência
De forma ger al a verossimilhança é dada por
L(θ) =
n
i=1
[f(y
i
; θ)]
δ
i
[S (y
i
; θ)]
1δ
i
(3.27)
em que δ
i
é o indicador de censura, se δ
i
= 1 ocorre tempo de falha e se δ
i
= 0 ocorre
tempo de censu ra.
3.3 Inferência Bayesiana
Em estatística é fu ndamental a informação sobre a quantidade desconhecida θ ou
seja o vetor de parâmetros θ = (θ
1
, θ
2
, ..., θ
n
)
T
. Como foi dito θ é um valo r desco-
nhecido e a estatística busca investiga-lo para tentar diminuir a incerteza sobre ele. Este
desconhecimento sobre θ pode ter graus distintos de incerteza. Para os bayesianos este
grau de d esconhecimento assume uma distribu ição d e probabilidade para θ, então a lguns
pesquisadores podem diferir quanto o modelo pr obabilístico a ser usado, pois o modelo
adotado tem haver com o conhecimento pessoal do pesquisador, daí para o mesmo pro-
blema p esquisadores podem assumir modelos probabilísticos distintos para θ.
13
3.3.1 Teorema de Bayes
Se considerarmos dois eve ntos A e B em um espaço de pr obabilidad e. Sendo P(B) >
0, a probabilid ade con dicional do evento A ocorrer dado que o evento B ocorreu é dada
por:
P (A | B) =
P (A B)
P (B)
, (3.28)
consideran do agora os eventos X
1
, X
2
, ..., X
n
em um espaço de probabilidade que formam
uma pa rtição do espaço amostral e P (X
i
) > 0 para todo i = 1, 2, ..., n. Daí, para qualquer
evento A, temos:
P (A) =
n
i=1
P (X
i
)P (A | X
i
) (3.29)
em que a descrição acima é chamada de Lei d a Probabilidade Total e agora utilizando o
que foi apresentado chegaremos no Teorema de Bayes.
Suponha que X
i
s
em que i = 1, 2..., n estão em um espaço de probabilidade, formam
uma partição do espaço amostral e P (X
i
) > 0 p ara todo i = 1, 2, ..., n. Seja A um evento
qualquer com P(A) > 0. Para todo j = 1, 2, ..., n, o Teorema de Bayes é dado por:
P (X
j
| A) =
P (A | X
j
)P (X
j
)
n
i=1
P (A | X
i
)P (X
i
)
. (3.30)
Supondo que se o bserva Y = y. Seja f(y | θ) a verossimilhança e a distribuição a
priori do investigad or h(θ), O teorema de Bayes para densidades leva a expressão:
h(θ | y) =
f(y | θ)h(θ)
Θ
f(y | θ)h(θ)dθ
(3.31)
em que h(θ | y) é densidade a posteriori d e θ dado que conhecemos x.
Tendo um espaço-p aramétrico finito, Θ = θ
1
, ..., θ
m
, temos
h(θ
1
| y) =
f(y | θ
1
)h(θ
1
)
i
f(y | θ
1
)h(θ
1
)
(3.32)
em que i = 1, ..., m. Sendo o denominador da expressão 3.32 igualado a uma constante
c, pode-se escrever a expressão 3.30 como:
P (θ | y) = c
1
P (y | θ)P (θ) (3.33)
ou
P (θ | y) P (y | θ)P (θ) (3.34)
14
e como c
1
não altera o conhecimento relativo a respeito de θ fica assim justificado a pro-
porcionalidade. P(θ | y) é uma função densidade de probabilidade e por isto tem que
integrar 1, mesmo que a priori, caso particular da uniforme, não integre 1. P(θ), chamada
de priori, representa o que se sabe sobre θ antes da observação dos da dos e P(y | θ) re-
presenta o conhecimento sobre θ depois de observados os dados ou seja a tu alizado pelos
dados. Com P(y | θ) e P(θ) tendo sido especificado o Teorema de Bayes fornece solução
para um dad o problema através do aprendizado com os dados.
A verossimilhança L(θ | y) representada no Teorema de Bayes por P(y | θ) tem vital im-
portância, po is é ela que atualiza o conhecimento sobre θ.
3.3.2 Informação a Priori
A distribu içã o a priori representa o conhecimento prévio do pesquisador antes de se
observar os dados, devido a este acréscimo de informação o método bayesiano geral-
mente fornece conclusõe s mais fortes que o método freqüentista para um mesmo conjunto
de dados. De acordo com Leandro (2001) devido, em geral, a subjetividade da escolha
das densidades a priori, estatísticos freqüentistas se opõem ao uso desta informação adi-
cional e se sustentam no fato de que a função densida de de probabilida de a posterior i
ser bastante sensível a escolha de prior is distintas. Porém o s estatísticos bayesianos tem
apoio em alguns argumentos, por exemplo este feito por Gelman et. al. (1997):
′′
Todos os
métodos estatísticos que usam probabilidades são subjetivos no sentido que se baseia m
em idea lizaçõ es matemáticas do mundo.
′′
3.3.2.1 Densidades a Priori Subjetivas
Uma priori subjetiva representa única, direta e simplesmente a esperança subjetiva
do pesquisador sobre o parâmetro, assim o sentimento do pesquisador é colocado na
distribuição a priori. Algumas vezes a posterior i não se apresenta correspondente as ex-
pectativas do pesquisad or e ne stes casos a escolha da distribuição a priori terá que ser
revista. Na e scolh a desta distribuição a priori poderemos ter distribuições próprias (que
integradas no espaço parâmetrico resulta 1) e distribuição impróprias (que integradas no
espaço parâmetrico o necessariamente resulta 1), porém a distribuição a poste riori tem
15
que integrar 1 não importando se a priori escolhida é p rópria ou imprópria. Ainda temos
temos que verificar o domínio da distribuição a priori escolh ida e ver se compatibilidade
com o espaço paramétrico do parâmetro em questão.
3.3.2.2 Densidades a Priori Conjugadas
A defin ição de priori conjugada de acordo com Lee (2004) é:
Seja L(θ) uma função de verossimilhança. Uma classe Φ de distribuições a priori é
chamada geradora de uma fam ília conjugada se a densidade posteriori está na classe
Φ para todo t sempre q ue a densidade a priori está em Φ,
ϕ(θ | t) ϕ(θ)L(θ | t). (3.35)
3.3.2.3 Priori de Laplace
Na ausência de razão suficiente para priorizar umas possibilidades em detrimento de
outras, devido a pouca informação decorrente a priori, deve-se adotar a eq uiprobabilidade,
gerando assim densidades a Priori não informativas. A este processo deu-se o nome de
Princípio da Razão Insuficiente.
Para o caso em que o espaço paramétrico é finito, Θ = (θ
1
, ..., θ
k
), a distribuição a
priori é uma distribuição Uniforme discreta, que é expressa por:
ϕ(θ) =
1
k
, θ Θ. (3.36)
Para o caso em que o espaço paramétrico é infinito numerável, não distribuição de
probabilidade que seja compatível com a equipro babilidade de todos os valores possíveis
de θ, pr oduzindo uma distribuição imp rópria.
Agora, qua ndo o espaço pa ramétrico é infinito não numerável, conduz a uma dis-
tribuição Uniforme contínua, que é uma distribuição imprópria se θ não pertencer a um
intervalo.
16
3.3.2.4 Priori de Jeffreys
O conceito de escolher uma priori por convenção , ou seja adotar uma referência padrão
é devido ao físico Jeffreys. Ele tinha a crença na existência de um estado de ignorância e
que o pr incípio da razão insuficiente era uma man eira formal de expressar tal ignor ância.
De acordo com a idéia de Jeffreys para um dado co njunto de dados dizemos que uma
certa proposição está relacionada a este conjun to de dados com uma e somente uma
probabilidade. Se cada pesquisador atribuir uma probabilid ade distinta para distrib uição a
priori, ela simple smente está equivocada.
Das diversas situações consideradas por Jeffreys para fo rmular regras objetivas para
escolha de uma priori, a mais simples é o caso d e u m espaço paramétrico finito na qual
ele u tilizou o princípio da razão insuficiente a atribuição de pro babilidade s iguais para cada
valor do parâmetro. Daí foi considerado os casos em que o espaço pa ramétrico tivesse um
intervalo limitado, consider ando um intervalo (- , ) ou o intervalo (0, ).
Tentando assegurar a invariância sobre transformações injetivas Je ffreys advoga sobre
um procedimento que se baseia no uso da medida de informação de Fisher sobre θ Θ,
I (θ) = E
2
(θ)
θ
2
| θ
. (3.37)
Para qualquer transformação real injetiva de θ Θ, tem-se:
I (ρ) = I (θ (ρ))
d
2
θ
2
. (3.38)
Isto mostra que Jeffreys propõe uma distribuição a priori (n o caso uniparamétrico) que
é dada por:
ϕ ( theta)
I (θ)
1
2
(3.39)
e tem a pr opriedade de invariância.
Agora no caso mu ltip aramétrico, temos:
I
i,j
(θ) = E
2
(θ)
θ
i
θ
j
| θ
, (3.40)
daí a distribuição a priori é proporcional a raiz quadrada do determinante da matriz de
informação de Fisher,
ϕ (θ) |I ( θ) |
1
2
. (3.41)
17
3.3.2.5 Estimação Pontual
As estimativas p ara o vetor de parâmetros θ = (θ
1
, ..., θ
k
) depende da forma da pos-
teriori h(θ | t), como dos ob jetivos de seu uso. As estimativa s mais usadas são a média
a posteriori, moda a posteriori e a mediana a posteriori. Neste trabalho foi dado enfâse a
média a posteriori e ao vetor das media nas a posteriori, em que a média é dada por:
ˆ
θ
i
= E[θ
i
| t] =
Θ
θ
i
h(θ | t), (3.42)
em que i = 1, ..., k e Θ é o espaço paramétrico.
O vetor d as medianas a posteriori é dado po r:
P
θ
i
ˆ
θ
i
| t
1
2
(3.43)
e
P
θ
i
ˆ
θ
i
| t
1
2
(3.44)
em que i = 1, ..., k e
ˆ
θ =
ˆ
θ
1
...,
ˆ
θ
k
.
3.3.2.6 Avaliação da Convergência do Método de Amostr agem Gibbs
Seja g(θ) a função do parâmetro a ser estimado. Fazendo a simulação dos vetores
de θ
t
pelo método de Gibbs em uma determinada cadeia d e Markov. O valor esperado a
posteriori de g(θ) estimado é dado pela média ergódica dos g(θ
j
). Então a função real g(θ)
e sua trajetória g
1
, g
2
,...construída a partir de g
t
= g(θ
t
), define uma série temporal.
18
3.3.2.7 Diagnóstico de Geweke
O método de Geweke consiste em observar um número N bastante longo em iterações
e calcula-se a média g
a
=
g(θ
t
)
n
a
à custa de n
a
das primeiras iteradas, també m calcula-se
a dia g
b
=
g(θ
t
)
n
b
à custa de n
b
das últimas iteradas.
Se a cadeia é estacionária, então a média g
a
deve ser semelhante à g
b
.
n
a
+ n
b
< N (3.45)
Com esta comparação pode averiguar- se se ou não convergência. Uma boa des-
crição do algoritmo Gibbs pode ser visto no livro do Paulino et. a l.( 2003).
3.4 A Distribuição Weibull Inversa
Através da função de risco ou taxa de falha, podemos caracterizar algumas classes in-
teressantes de distribuição de tempo de sobrevivência, conforme seu comportamento em
função do tempo. A funçã o de risco pode asssumir comportamento constante, crescente,
decrescente, etc...
A distribuição Weibull é bastante conhecida da literatura estatística, seu uso em questões
de confiabilidade (como é conhecida nas engenharias) ou análise d e sob revivência (como
é conhecida na literatura m édica) é amplamente difundido. Na pr ática, os dados podem
ser esboçados das mais variadas fo rmas gráficas e novas distribuições são propostas na
tentativa de modelá-los. Ultimamente vem sendo observado um grand e interesse em es-
tudar modificações e generalizações da distribuição Weibull em diversos artigos científicos
e uma de suas modificações é distribuição chamada de Weibull inversa que tem a cara-
cterística de unimodalidade na função de risco.
Utilizando uma distrib uição Weibull padrão bi-paramétrica que tem como função de
probabilidade acumulada:
Q(t) = 1 exp
t
α
β
(3.46)
em que α, β são positivos e t 0 , sendo o primeiro o p arâmetro de escala e o se gundo o
parâmetro de forma, respectivamente, no artigo de Jiang, Ji e Murthy(2001) podemos ver
a seguinte modificação:
19
Seja X uma variável aleatória contínua não-negativa com distribuiçãoo Weibull, defini-
se Y como sendo:
Y =
α
2
X
(3.47)
e cuja função acumula da para Y é dada por:
G(t) = exp
α
t
β
(3.48)
em que α, β > 0 e t> 0 e sua função densidade é dada por:
g(t) = βα
β
t
(β+1)
exp
α
t
β
(3.49)
e as funções de risco e sobrevivência são dadas, respectivamente, por:
h(t) = βα
β
t
(β+1)
exp
α
t
β
1 exp
α
t
β
1
(3.50)
S(t) = 1 exp
α
t
β
, t > 0; (3.51)
e a expressão geral para os M omentos é dada por:
E
T
k
= α
k
Γ
1
k
β
. (3.52)
Os gráficos produzidos p ela distribuição Weibull inve rsa para as funções densidade,
sobrevivência e risco; são exibidos na s figuras 1a, 1b e 1c; respectivamente:
20
(a) (b)
0 2 4 6 8 10
0.0 0.2 0.4 0.6 0.8 1.0
Tempo
Comparação entre fdp’s
alfa=1 e beta=2
alfa=2 e beta=3
alfa=3 e beta=4
0 2 4 6 8 10
0.0 0.2 0.4 0.6 0.8 1.0 1.2
Tempo
Comparação entre funções de risco
alfa=1 e beta=2
alfa=2 e beta=3
alfa=3 e beta=4
(c)
0 2 4 6 8 10
0.0 0.2 0.4 0.6 0.8 1.0
Tempo
Comparação entre S(t)’s
alfa=1 e beta=2
alfa=2 e beta=3
alfa=3 e beta=4
Figura 1: (a) Função densidade da DWI. (b) Função de risco da DWI. (c) Função de Sobre-
vivência da DWI.
21
4 Distribuição Weibull Inversa
Generalizada
Neste trabalho foi proposto uma modificaçao para distribuição Weibull inversa; qu e
consiste em elevar a funçã o a cu m ulada da distribuição Weibull inversa a uma constante γ
positiva ao qual a esta nova fun çã o acumulada exp ressamos por F(t) que é dada por:
F (t) =
G(t)
γ
=
exp
α
t
β
γ
= exp
γ
α
t
β
(4.1)
em que γ > 0 e para suposta função densidade de p robabilidade, temos:
f(t) = γβα
β
t
(β+1)
exp
γ
α
t
β
, t > 0. (4.2)
A introdução deste novo parâmetro γ, como foi mostrado acima, tem por finalidad e
aumentar a flexibilidade desta nova distribuição.
Agora precisamos mostrar que f(t) é realmente uma função densidade de probabili-
dade, para isto du as propr iedades devem ser satisfeitas:
1)f(t) 0 , x ;
2)
0
f(t)dt=1.
Para 1
a
propr iedade, temos:
f(t) = γβα
β
t
(β+1)
exp
γ
α
t
β
I
(0,)
(t) (4.3)
como todos os parâmetros são positivos e a variável indep endente também é positiva,
então f(t) é positiva e se a variável ind ependen te tender a o infinito f (t) tende à zero. Daí 1
a
propr iedade é satisfeita.
22
Para 2
a
propr iedade, temos:
f(t) =
0
γβα
β
t
(β+1)
exp
γ
α
t
β
dt = 1 (4.4)
Utilizando a técnica de integraçã o por substituição, fazendo u = γα
β
t
β
teremos t
(β+1)
dt = d u
γα
β
β
1
f(t) =
0
γβα
β
e
u
du
γβα
β
= e
u
=
exp
γα
β
βt
β

0
= 1 (4.5)
Logo, a 2
a
propr iedade também é satisfeita.
4.1 Função Densidade da Distribuição Weibull Inversa
Generalizada
A função densidade de probabilidade da DWIG é da da por:
f(t) = γβα
β
t
(β+1)
exp
γ
α
t
β
(4.6)
Através da análise da monotonicidade de uma função podem os dete rminar se ela é
unimodal, bimodal, etc. Para esta finalidade utilizamos a técnica para encontr ar extremos
relativos, esta técnica consiste em estuda r o crescimento d a função, o qual será realizado
analisando-se o sinal de sua d erivada de primeira ordem.
f
(t) = f (t)t
(β+1)
γβα
β
(β + 1) t
β
= 0 (4.7)
agora resolvendo a equação acima e isolando t, temos
t = α (γ)
1
β
1 +
1
β
1
β
(4.8)
Se t < t
m
f
(t) > 0 e se t> t
m
f
(t) < 0, logo f(t) é unimodal.
23
0 2 4 6 8 10
0.0 0.2 0.4 0.6 0.8
time
f(t)
a=1,b=2,g=1
a=4,b=1,g=1
a=4,b=2,g=4
a=3,b=5,g=3
a=4,b=4,g=8
a=7,b=13,g=7
Figura 2: Função densidade da DWIG.
4.2 Função de Sobrevivência da Distribuição Weibull
Inversa Generalizada
Usando a relação S(t)=1-F(t) é fácil encontrar
S(t) = 1 exp
γ
α
t
β
(4.9)
24
0 2 4 6 8 10
0.0 0.2 0.4 0.6 0.8 1.0
time
S(t)
a=1,b=2,g=1
a=4,b=1,g=1
a=4,b=2,g=4
a=3,b=5,g=3
a=4,b=4,g=8
a=7,b=13,g=7
Figura 3: Fu nção de Sobrevivência da DWIG.
4.3 Função Taxa de Falha da Distribuição Weibull Inversa
Generalizada
A função taxa de falha é dada por:
h(t) = γβα
β
t
(β+1)
exp
γ
α
t
β
1 exp
γ
α
t
β
1
. (4.10)
Diferenciando h(t), temos:
h
(t) = h(t)t
(β+1)
γβα
β
1 exp
γ
α
t
β
(β + 1) t
β
. (4.11)
25
0 2 4 6 8 10
0.0 0.2 0.4 0.6 0.8 1.0 1.2
time
h(t)
a=1,b=2,g=1
a=4,b=1,g=1
a=4,b=2,g=4
a=3,b=5,g=3
a=4,b=4,g=8
a=7,b=13,g=7
Figura 4: Fu nção Taxa de Falha da DWIG.
Vemos que h(t) é un imodal e tem pico em t = t
M
em que t
M
é solução da equação abaixo
γ
α
t
M
β
1 e
γ
α
t
M
β
= 1 +
1
β
(4.12)
e que
lim
t0
h(t) = lim
t
h(t) = 0 (4.13)
4.4 Relação com outras distribuições
A distribuição Weibull inversa g eneralizada apresenta a distribuição Weibull inversa como
caso particular. Quando o parâmetro γ é igual a 1(um), a distribuição Weibull inve rsa
26
generalizada assume a forma da distribuição Weibull inversa, quando β e γ são iguais a 1
(um) temos a distribuição exponencial inversa e se γ é igual a 1 (um) e β igual a 2 (d ois)
temos a distrib uição Rayleigh inversa. O Tabela 1 resume estas relações
Tabela 1: Alg umas funções de distribuição geradas a partir da distribuição Weibull inversa
generalizada
Distribuição Parâmetros
Weibull inversa γ = 1
expon encial inversa β = 1, γ = 1
Rayleigh inversa β = 2, γ = 1
4.5 Momentos
É necessário enfatizar a importância e a necessidade dos momentos em qualquer
análise estatística especialmente em tra balhos aplicados. Algumas das mais importantes
características de uma dada distribuição pode ser estudada através dos momentos como:
média, variância, assimétria e curtose. Seja T uma variável aleatória com função den-
sidade de probabilidade dada p ela distribuição Weibull inversa gen eralizada(DWIG) o k-
ésimo mome nto de T é dado por
M
k
=
−∞
t
k
g(t)dt =
0
γβα
β
t
kβ1
e
γ
(
α
t
)
β
dt (4.14)
Fazendo u = γα
β
t
β
e du = γβα
β
t
β1
dt quando t 0 u e quando t
u 0, d
M
k
=
0
t
k
e
u
du (4.15)
usando a seguinte relação t
k
=
t
β
k
β
=
u
γα
β
k
β
, então
M
k
=
0
u
γα
β
k
β
e
u
du =
γα
β
k
β
0
u
[(
1
k
β
1
)]
e
u
du = γ
k
β
α
k
Γ
1
k
β
(4.16)
27
4.6 Função Geradora de Momentos e Cumulantes
Sendo o k-ésimo momen to de T dado po r:
E
T
k
= γ
k
β
α
k
Γ
1
k
β
(4.17)
A função geradora de m omentos é
M
t
(z) =
n
k=0
z
k
k!
E
T
k
(4.18)
A função geradora de cum ulantes é
K (z) = log
M
t
(z) =
n
k=0
z
k
k!
E
T
k
(4.19)
então o primeiro cumulante é a d erivada da função geradora de cumulantes e em seguida
iguala-se z à zer o(z em nosso caso)
K
(z) =
n
k=0
1
k!
γ
k
β
α
k
Γ
1
k
β
kz
k1
n
k=0
1
k!
γ
k
β
α
k
Γ
1
k
β
z
k
(4.20)
expan dindo os somatórios e em seguida igualando z à zero, temos:
K
(z) = k
1
= γ
1
β
αΓ
1
1
β
(4.21)
que satisfaz a rela çã o
k
1
= E (T ) = γ
1
β
αΓ
1
1
β
, (4.22)
os próximos 3 cumulantes são dados pelas seguintes relações
k
2
= E
T
2
E
T
1

2
(4.23)
k
3
= E
T
3
3E
T
2
E
T
1
+ 2E
T
3
(4.24)
k
4
= E
T
4
4E
T
3
E
T
1
3
E
T
2

2
+ 12E
T
2
E
T
1
6
E
T
1

4
. (4.25)
28
Daí para DWIG, temos:
k
2
= γ
2
β
α
2
Γ
1
2
β
Γ
1
1
β

2
(4.26)
k
3
= γ
3
β
α
3
Γ
1
3
β
1
2
β
Γ
1
1
β
+ 2
Γ
1
1
β

3
(4.27)
k
4
= γ
4
β
α
4
Γ
1
4
β
4γ
4
β
α
4
Γ
1
3
β
Γ
1
1
β
3γ
4
β
α
4
Γ
1
1
β

2
+ 12γ
4
β
α
4
Γ
1
2
β

2
Γ
1
1
β

2
. (4.28)
4.7 Estimação de Verossimilhança para DWIG
Sejam T
1
, T
2
, ..., T
n
variáveis aleatórias, independentes e identicamente distribuida s
seguindo uma DWIG em que o vetor de parâmetros é θ = (α, β, γ)
T
e a função de verossi-
milhança p ara DWIG é dada por
L(θ) =
n
i=1
γβα
β
t
(β+1)
i
exp
γ
α
t
i
β
=
γβα
β
n
n
i=1
t
(β+1)
i
exp
γ
α
t
i
β
(4.29)
O logaritmo da função de verossimilhaça conhecida como função suporte como é descrita
acima é dada por:
(θ) = logL(θ) = nlogγ + nlogβ + logα (β + 1)
n
i=1
log (t
i
) γα
β
n
i=1
t
β
i
. (4.30)
Então para estimar os par âmetros utilizamos a e quação escore, que é definida como:
U
ˆ
θ
=
(θ)
θ
= 0 (4.31)
para DWIG, temos
(θ)
α
=
1
α
γβα
β1
n
i=1
t
β
i
= 0, (4.32)
(θ)
β
= n
1
β
nlogα
n
i=1
log (t
i
) γ
n
i=1
log
α
t
i
t
β
i
α
β
= 0 (4.33)
29
e
(θ)
γ
= n
1
γ
α
β
n
i=1
t
β
i
= 0 (4.34)
As equações 4.32, 4 .3 3 e 4.3 4 o têm forma fechada, então par a solucioná-las pode-
mos utilizar o método iterativo d e Newton-Raph so n
ˆ
θ θ = [ J (θ)]
1
.U (θ) (4.35)
Mas para isto precisamos encontrar a m atriz de informação observada J (θ)
J (θ) =
L
αα
(θ) L
αβ
(θ) L
αγ
(θ)
L
βα
(θ) L
ββ
(θ) L
βγ
(θ)
L
γα
(θ) L
γβ
(θ) L
γγ
(θ)
para a DWIG tem como ele mentos
ρ
(θ)
σ
= L
ρσ
(θ) em qu e ρ e σ são parâmetros da
distribuição em questão e θ o vetor de parâmetros, então
L
αα
(θ) = α
2
+ (β 1)γβα
β2
n
i=1
t
β
i
L
αβ
(θ) =
1
+ γ
n
i=1
t
β
i
α
β1
(1 + βlogα) βα
β1
t
β
i
logt
i
L
γβ
(θ) =
n
i=1
α
β
t
β
i
log
α
t
i
L
αγ
(θ) = βα
β1
n
i=1
t
β
i
30
L
γγ
(θ) =
2
L
ββ
(θ) =
2
+ γ
n
i=1
log
α
t
i
β
α
β
t
β
i
em que
α
β
t
β
i
= α
β
t
β
i
log
α
t
i
4.8 Estimação de Máxima Verossimilhança com Dados
Censurados
Seja T
i
uma variável aleatória seguindo uma DWIG com o vetor de parâmetros θ =
(α, β, γ)
T
. Os dados encontrados em estudos de análise de sobrevivência e confiabilidade
são censurados e então a fun çã o suporte é dada por
l(θ) = r
log(γ) + log(β) + β log(α)
(β + 1)
iF
log(t
i
) γα
β
iF
t
β
i
+
iC
log
1 exp
γ
α
t
i
β
,
A função escore para os parâmetros α, β e γ é dado por
U
α
(θ) = rβα
1
γβα
β1
iF
t
β
i
+ γβα
β1
iC
t
β
i
exp
γ
α
t
i
β
1 exp
γ
α
t
i
β
1
31
U
β
(θ) = rβ
1
iF
logt
β
i
γ
iF
α
β
t
β
i
log(αt
1
i
) +
+
iC
t
β
i
α
β
t
β
i
log(αt
1
i
) exp
γ
α
t
i
β
1 exp
γ
α
t
i
β
1
U
γ
(θ) = rγ
1
α
β
iF
t
β
i
+ α
β
iC
t
β
i
exp
γ
α
t
i
β
1 exp
γ
α
t
i
β
1
matriz J(θ) é
J(θ) =
L
αα
L
αβ
L
αγ
. L
ββ
L
βγ
. . L
γγ
,
L
αα
(θ) = rβα
2
+ (β 1)γβα
β2
iF
t
β
i
γβ
iC
t
β
i
(β 1)α
β2
exp
γ
α
t
i
β
γβα
2β2
t
β
i
exp
γ
α
t
i
β
1 exp
γ
α
t
i
β
1
α
2β2
γβt
β
i
exp
2γ
α
t
i
β
1 exp
γ
α
t
i
β
2
L
αβ
(θ) = rα
1
+ γ
iF
t
β
i
α
β1
(1 + βlogα) βα
β1
t
β
i
logt
i
γ
iC

βα
β1
t
β
i
exp
γ
α
t
i
β

1 exp
γ
α
t
i
β
1
βγlogαα
2β1
t
2β
i
exp
2γ
α
t
i
β
1 exp
γ
α
t
i
β
2
32
em que
βα
β1
t
β
i
exp
γ
α
t
i
β

= (t
β
i
βt
β
i
logt
i
)(α
β1
exp
2γ
α
t
i
β
) +
βt
β
i
α
β1
logα exp
γ
α
t
i
β
γα
β1
exp
γ
α
t
i
β

(α
β
)
t
i
α
β
(t
β
i
)

e
(α
β
)
t
i
α
β
(t
β
i
)
= α
β
t
β
i
log
α
t
i
L
γβ
(θ) =
iF
α
β
t
β
i
log
α
t
i
iC
α
β
t
β
i
exp
γ
α
t
i
β

1 exp
γ
α
t
i
β
1
+
α
β
t
β
i
exp
γ
α
t
i
β

1 exp
γ
α
t
i
β
1
em que
α
β
t
β
i
exp
γ
α
t
i
β

= exp
γ
α
t
i
β
log
α
t
i
α
β
t
β
i
1 γα
β
t
β
i
e
1 exp
γ
α
t
i
β
1
= exp
γ
α
t
i
β
γα
β
t
β
i
log
α
t
i
1 exp
γ
α
t
i
β
2
L
αγ
(θ) = βα
β1
iF
t
β
i
βα
β1
iC
t
β
i
α
β
t
β
i
exp
γ
α
t
i
β
1 exp
γ
α
t
i
β
1
1 + exp
γ
α
t
i
β
1 exp
γ
α
t
i
β
1

33
L
γγ
(θ) = rγ
2
α
β
iC
t
β
i
α
β
t
β
i
exp
γ
α
t
i
β
1 exp
γ
α
t
i
β
1
1 + exp
γ
α
t
i
β
1 exp
γ
α
t
i
β
1
L
ββ
(θ) = rβ
2
+ γ
iF
log
α
t
i
α
β
t
β
i
β
γ
iC
log
α
t
i
β
α
β
t
β
i
exp
γ
α
t
i
β
1 exp
γ
α
t
i
β
em que
α
β
t
β
i
exp
γ
α
t
i
β
1 exp
γ
α
t
i
β
1
= α
β
t
β
i
exp
γ
α
t
i
β

1 exp
γ
α
t
i
β
1
+
α
β
t
β
i
exp
γ
α
t
i
β
1 exp
γ
α
t
i
β
1
,
α
β
t
β
i
exp
γ
α
t
i
β
= exp
γ
α
t
i
β
log
α
t
i
α
β
t
β
i
1 γα
β
t
β
i
,

1 exp
γ
α
t
i
β
1
= γ exp
γ
α
t
i
β

α
β
t
β
i
1 exp
γ
α
t
i
β

2
e
α
β
t
β
i
= α
β
t
β
i
log
α
t
i
Sob condições que são cumpr idas pelos par âmetros no interior do espaço paramétrico,
34
mas não no limite, a distribuição a ssintótica de
n (
ˆ
θ θ) é N
3
(0, I(θ)
1
), em que I(θ) é
a matriz de informação esperada. Este comportamento assintótico é válido se I(θ) é sub-
stituído por J(
θ), i.e., a matr iz de informação observada evoluiu a
ˆ
θ. A normal multivariada
assintótica N
3
(0, J(θ)
1
) distribuição pode ser usad a pa ra construir intervalos de confiança
aproximados e regiões de confiança para os parâm etros individu ais e para as funções de
sobrevivência e risco.
35
4.9 Mistura de duas Distribuições Weibull Inversa
Generalizada
Mistura de distribuições tem sido consideradas extensivamente por muitos autores; por
uma excelente técnica de estimação em sobrevivência, discussão e aplicações, ver Sultan,
Ismail e Al-Moisheer(2006) e Bucar, Nagode e Fajdiga (2003). Recentemente, tem sido
revistas propriedades e técnicas de estimação de mistura s finitas de alg uns modelos de
tempo de vida.
Neste trabalho, s definimos a mistura de duas distribuições weibull inversa generali-
zada (MDDWIG) que tem como fdp
f(t; θ) =
2
i=1
p
i
f
i
(t; θ
i
) (4.36)
em que
2
i=1
p
i
= 1, θ = (θ
T
1
, θ
T
2
)
T
, θ
1
= (p
1
, γ
1
, α
1
, β
1
)
T
, θ
2
= (p
2
, γ
2
, α
2
, β
2
)
T
, e f
i
(t; θ
i
), a
função densidade do i-ésimo componente, é dado por:
f
i
(t; θ
i
) = γ
i
β
i
α
β
i
i
t
(β
i
+1)
exp
γ
i
α
i
t
β
i
, t, γ
i
, α
i
, β
i
> 0, i = 1, 2. (4.37)
A função acum ulada da MDDWIG é dada por:
F (t; θ) =
2
i=1
p
i
F
i
(t; θ
i
), (4.38)
em que F
i
(t; θ
i
), a função acumulada do i-ésimo componente, é dad o por:
F
i
(t; θ
i
) = exp
γ
i
α
i
t
β
i
, t, γ
i
, α
i
, β
i
> 0, i = 1, 2. (4.39)
Alguns gráficos da MDDWIG são apresentados n as figuras 5, 6 e7.
4.9.1 Propriedades
Nesta subseção, nós analisamos algumas propriedades para a DWIG por extensão
dos resultados correspondentes da DWIG.
36
0 200 400 600 800 1000
0.00 0.02 0.04 0.06 0.08 0.10
tempo
fdp
Figura 5: mistura de duas distribuições weibull inversa exponencializada com α
1
= 1,
β
1
= 2, γ
1
= 4, α
2
= 2, β
2
= 3, γ
2
= 10, 5 e p
1
= p
2
= 0, 5
O ksimo momento de T para DWIG é
E(T
k
) =
2
i
p
i
γ
k
β
i
i
α
k
i
Γ(1 kβ
1
i
). (4.40)
As correspondentes funções de sobrevivência e taxa d e falha são, respectivamente,
S(t) =
2
i
p
i
1 exp
γ
i
α
i
t
β
i

(4.41)
e
h(t) =
2
i=1
p
i
γ
i
β
i
α
β
i
i
t
(β
i
+1)
exp
γ
i
α
i
t
β
i
2
i
p
i
1 exp
γ
i
α
i
t
β
i

(4.42)
Se γ
i
= 1 e α
i
=
1
δ
i
nós temos os resultados discutidos por Sultan,Ismail e AL-Moisheer(2006)
37
0 200 400 600 800 1000
0.5 1.0 1.5 2.0
tempo
Mistura de funções de sobrevivência
Figura 6: mistura de duas fu nções de sobrevivência da weibull inver sa exponencializada
com α
1
= 1, β
1
= 2, γ
1
= 4, α
2
= 2, β
2
= 3, γ
2
= 10, 5 e p
1
= p
2
= 0, 5
4.9.2 Identificabilidade
Se a função densidade do i-ésimo comp onente, é dado por:
f
i
(t; θ
i
) = γ
i
β
i
α
β
i
i
t
(β
i
+1)
exp
γ
i
α
i
t
β
i
; (4.43)
t 0 ; α
i
, β
i
, γ
i
> 0 e i = 1, 2, ..., n
A função de probabilidade acumulada é d ada por:
F
i
(t; θ
i
) = exp
γ
i
α
i
t
β
i
; (4.44)
t 0 ; α
i
, β
i
, γ
i
> 0 e i = 1, 2, ..., n
Seja φ uma transformação associada com cada F
i
Φ tendo o domínio de definido
por D
Φ
i
com mapa linear M : F
i
φ
i
. Se existe uma ordem total () de Φ cada que
38
0 200 400 600 800 1000
0.00 0.02 0.04 0.06
tempo
Mistura de funções taxa de falha
Figura 7: mistura de duas funções taxa de falha da weibull inversa exponencializada com
α
1
= 1, β
1
= 2, γ
1
= 4, α
2
= 2, β
2
= 3, γ
2
= 10, 5 e p
1
= p
2
= 0, 5
i) F
1
F
2
, (F
1
, F
2
Φ) D
Φ
i
D
Φ
i
;
ii) para cada F
1
Φ, existe algum s
1
D
Φ
1
, φ
1
(s) = 0 cada qu e lim
ss
1
φ
2
φ
1
= 0 for F
1
< F
2
,
(F
1
, F
2
Φ).
Então a classe Λ de todas as misturas finitas de distribuições é identificável relativa a
Φ.
Usando o mostrad o acima, nós prova mos a se guinte propo sição .
Proposição: A classe de todas as misturas finitas de distribuições relativas a DWIG são
identificáveis.
Prova: Seja T uma variável aleatória tendo o fdp e função de probabilidade acumulada
da DWIG dadas por (4.43) e (4.44), respectivamente. O s-ésimo momento d a i-ésimo
39
componen te da DWIG são dados por:
φ
i
(s) = E(T
s
) = γ
s
β
i
i
α
s
i
Γ(1
1
i
), i = 1, 2, ..., n 1 (4.45)
de (24), nós temos
1) F
i
< F
j
quando β
i
= β
j
, γ
i
= γ
j
and α
i
< α
j
em que j = i + 1; i = 1 , 2, ..., n 1;
j = 1, 2, ..., n
e
2) F
i
< F
j
quando α
i
= α
j
>
1
t
, γ
i
= γ
j
e β
i
< β
j
em que j = i + 1; i = 1, 2, ..., n 1;
j = 1, 2, ..., n
Agora seja D
φ
i
(s) = (−∞, β
i
), D
φ
i
(s) = (−∞, β
j
) e s
i
= s
j
,
então de 1) e 2) n ós temos q ue
lim
sβ
i
φ
i
(s) = γ
β
i
β
i
i
α
β
i
i
Γ(1 β
i
β
1
i
) Γ(0+) = (4.46)
Agora, quan do α
i
= α
j
>
1
t
, γ
i
= γ
j
e β
i
< β
j
, nós temos
lim
sβ
i
φ
j
(s) = γ
β
i
β
j
i
α
β
i
i
Γ(1 β
i
β
1
j
) > 0 (4.47)
Por último, de (4.46) e (4.47), nós temos
lim
sβ
i
φ
j
(s)
φ
i
(s)
= 0 (4.48)
a assim a identificabilidade é provada.
40
5 ABORDAGE M BAYESIANA
5.1 Distribuições a priori para DWIG
Na escolha da d istribuição a priori tentamos utilizar alguns dos métodos objetivos co mo
Jeffreys, Laplace e alg uns outros métodos também objetivos que geralmente são deriva-
dos do método de Jeffreys, porém para utilizar uma priori de Jeffreys é necessário ter a
matriz de informação esperada de Fisher e este resultado o foi obtido para distribuição
proposta neste trabalho e para os outros métodos que derivam do métodos de Jeffreys
também não foram utilizados pelo mesmo motivo que não utilizamos a priori de Jeffreys.
Acabamos por adotar o método subjetivo para escolh a destas densidades a priori. Então
atribuimos as seguin tes distribu içõ es a priori:
1) h(α ) α
b1
e
; α>0,
2) h(β) β
d1
e
; β>0,
3) h(γ) γ
g1
e
fγ
; γ>0.
A escolha destas densidades a p riori com distribuição gama deve-se ao fato de que
todos os pa râmetros da DWIG serem positivos e também devido a maior flexibilidade
que a distribuição gama bi-paramétrica proporciona para a escolha dos hiperparâmet-
ros. Aqui todos os hiperparâmetros são assumidos conhecidos e positivos, os valores
dos hiperparâmetros foram escolhido de forma tal que as densidades a priori sejam não-
41
informativa s.
A função densidade de probabilidade da ditribuição gama é expressa da seguite maneira:
λ(η, ν; t) =
ν
η
Γ(η)
t
η1
exp
ν.t
(5.1)
em que η, ν são maiores q ue zero e t 0 .
5.2 Função de verossimilhança para DWIG
A expressão para verossimilhança da distrubição Weibull inve rsa generalizada é dada
por:
f(y | θ) =
γβα
β
n
n
i=1
t
(β+1)
i
exp
γ
α
t
i
β
. (5.2)
Considerando indep endência entre as prioris, o produto da verossimilhança por elas é
expresso por:
h(θ | t) h(α)h(β)h(γ)f(y | θ) (5.3)
a constante normalizadora c que é a in tegração da expressão 5.3 e é dada por:
c
1
=
0
0
0
h(α)h(β)h(γ)f(y | θ)dαd β (5.4)
5.3 Densidadea a posteriori para DWIG
Utilizando as expressões 5.3 e 5.4 a posteriori pode ser escrita como:
42
h(θ | t) =
h(α)h(β)h(γ)f(y | θ)
0
0
0
h(α)h(β)h(γ)f(y | θ)
. (5.5)
5.4 Média a posteriori e vetor das medianas a posteriori
para DWIG
Utilizando a expressão da mé dia a posteriori, encontra-se as seguintes expressões
para as médias a posteriori de α, β e γ:
ˆα = E[α | t] =
0
0
0
αh(θ | t); (5.6)
ˆ
β = E[β | t] =
0
0
0
βh(θ | t)e (5.7)
ˆγ = E[γ | t] =
0
0
0
γh(θ | t)dαdβ; (5.8)
Então poderemos ter
ˆ
θ = (ˆα,
ˆ
β, ˆγ)
T
apartir da média.
Para o vetor d as medianas a posteriori da DWIG, temos:
P {α
i
ˆα
i
| t} =
α
h(θ | t)dαdβ
1
2
(5.9)
P
β
i
ˆ
β
i
| t
=
β
h(θ | t)dαdβ
1
2
(5.10)
43
P {γ
i
ˆγ
i
| t} =
γ
h(θ | t)dαdβ
1
2
(5.11)
em que h(θ | t) é a de nsidade a posteriori e
ˆ
θ = (ˆα,
ˆ
β, ˆγ)
T
apartir do vetor das medi-
anas a posteriori da DWIG.
44
6 APLICAÇÃO
6.1 Função Taxa de Falha
A produção comercial da carne do gado no Brasil ,que geralm ente provém do gado da
raça Nelore, busca otimizar o processo tentando ob ter um tempo curto para o gado atingir
o peso específico no período do nascimento até o desmame ou do desmame até o abate.
Para os dados com 1 55 touros da raça Nelore estudamos o tempo (em dias) até os
animais atingirem o peso d e 1 60kg relativo ao período do nascimento a o desmame, uti-
lizamos apenas 69 animais destes 155 , pois trabalhamos com os touros qu e chegaram a
o evento d e interesse (falha). Produzimos a curva da função de ta xa de falha mostrando
que a fu nção de risco, associada o conjunto de dados tem a característica de unimo dali-
dade. Sen do a ssim a distribuição Weibull inversa Generalizada, será utilizada para mode-
lar esse conjunto de dados.
6.2 Estimação de Parâmetros
Nesta subseção,apresentamos os resultados da estimação de parâmetros do modelo da
distribuição Weibull inversa exponencializada, sendo considera dos os m étodos de máxima
verossimilhança vistos na subseção (3.1.1) e os métodos bayesianos estudados na seção
(3.3).
6.2.1 Estimação Através do Método de Máxima Verossimilhança
45
Tempo
Densidade
140 150 160 170 180 190 200
0.00 0.01 0.02 0.03 0.04
DWIG
DWI
D. Empírica
Figura 8: Histograma, funçõe s densidade da Weibull inversa e da Weibull inversa genera-
lizada e den sidade empírica.
Utilizando a expressão de (θ) da subse ção (3.1.1) que foi escrita uma r otina para obter es-
timativas dos estimadores de má xima verossimilhança que não possuem formas fechadas
com esta finalidade utilizamo s o comando MaxBFGS da linguagem de programação Ox da
versão 4.0 para estimar os valores do vetor de parâ m etros θ = (α, β, γ)
T
da distrib uição
Weibull inversa generalizada para os dados do gado da raça Nelore, este rotina também
disponibiliza comandos para diferenciações numéricas (ver apêndice). A rotina MaxBFGS
maximiza funções utilizan do o método quase-Newton d esenvolvido por Broyden, Fletcher,
Goldfarrb e Shanno (BFGS) com a possibilid ade de escolha de condições e parâmetros
da maximização, como a utilização de derivadas analíticas ou numéricas da função a ser
maximizada, os critérios de convergência , o núme ro máximo de iterações, etc.. Atráves do
método de Kaplan-Meier descrito na subseção (3.2.7) obtivemos o s valores d a função de
sobrevivência estimada para os dados em questão, os procedimentos para obtenção das
estimativas de f(t), S(t), h(t) e do gr áfico foram produzidos no software R ver Venableset.
al. (2008).
46
Tabela 2: Valores estimados dos parâmetros α, β e γ pelo método de máxima verossimi-
lhança para os dados do gado da raça Nelore
Parâmetro Estimativa Clássica
α 137,135047
β 14,979992
γ 7,960508
6.2.2 Estimação Através do Método Bayesiano
Utilizando a expressão de (θ) da subseçã o (3.1.1) que foi descrita uma rotina no soft-
ware Winbugs, que é um software que utiliza três famílias de algoritmo MCMC: Gibbs,
Metropolis Hasting e slice sampling (ver apêndice), para estimar os valores do vetor de pa-
râmetros θ = (α, β, γ)
T
da distribuição Weibu ll inversa generalizada para os dados do gado
da raça Nelore. Na Tabela 6 são apresentado s os resultados obtidos pelo software Win-
bugs como média , desvio padrão, mediana e intervalo de credibilidade para os parâmetros
α, β e γ de pois de executado um burn-in de 50.000 iteraçõe s com thin de 20 (burn-in) em
seguida mais 300.000 iterações com thin de 20 para os dados do gado da raça Nelore.
Tabela 3: Resultados da abordagem bayesiana p ara distribuiçã o Weibull inversa generali-
zada
Parâmetro Média Desvio Padrão 2,5% Mediana 97,5%
α 136,3 11,26 118,8 134,6 163,3
β 14,27 1,323 11,75 14,24 16,95
γ 10,67 10,08 0,4774 7,596 38,04
A figuras 9 e 10 foram obtidas utilizando a estimação clássica e a estimação bayesiana
do vetor das medianas a posteriori.
O diagnóstico de convergência de Geweke para o vetor de parâmetros utilizando a
fração de 0, 1 da primeira série de iterações e utilizan do a fração de 0, 5 da segunda série
de iterações,foi obtido através do sof tware R utilizando o pacote CODA que forneceu os
seguintes valores:
a=-0,1488 6;
b=-0,1102 6
e
g=0,2012.
47
140 150 160 170 180 190 200
0.0 0.2 0.4 0.6 0.8 1.0
time (weeks)
S(t)
Kaplan−Meier
Frequentist
Bayesian
Figura 9: Comparação entre so brevivências geradas pelo método clássico, bayesiano e
Kaplan-Meier esboçadas no e sq uema S(t) ver su s tempo. As curvas traceja das são os
intervalos de confiança 95% para o Kaplan-Meier
0.0 0.2 0.4 0.6 0.8 1.0
0.0 0.2 0.4 0.6 0.8 1.0
S(t) Kaplan−Meier
S(t)
Linear
Freqüêntista
Bayesiana
Figura 10: Com paração entre sobrevivências geradas pelo método clássico, bayesiano e
Kaplan-Meier esboçadas no esquema de linearização.
Os valores devem ser menores que 1 (um ) para convergirem, logo a convergência foi
obtida.
48
0 200 400 600
-1.0
0.0
0.5
1.0
0 200 400 600
-1.0
0.0
0.5
1.0
Lag
beta
0 200 400 600
-1.0
0.0
0.5
1.0
Autocorrelações
Autocorrelações
Autocorrelações
Figura 11: Gráfico de autocorrelação para os parâmetros alfa, beta e gama.
49
50000 150000 250000
100 140
Iterations
Trace of alfa
100 120 140 160 180
0.00 0.02 0.04
N = 12500 Bandwidth = 1.523
Density of alfa
50000 150000 250000
10 14 18
Iterations
Trace of beta
10 12 14 16 18 20
0.00 0.15 0.30
N = 12500 Bandwidth = 0.2122
Density of beta
50000 150000 250000
0 400 800
Iterations
Trace of gama
0 200 400 600 800
0.000 0.006
N = 12500 Bandwidth = 11.29
Density of gama
Figura 12: Gráfico das d ensidades a posteriori e do traço para o vetor de parâmetros.
50
7 CONCLUSÃO
Introduzimos uma nova distribuição para tempo de vida com três parâmetros chama da
de distribuição Weibull inversa generalizada (DWIG) que gen eraliza algumas distribuições,
que tem muitas aplicações e são bastante utilizados na literatur a de análise de sobrevivên-
cia. O modelo mostro u um melhor ajuste que a distribuição Weibull inversa do qu al a
mesma foi derivada para os dados do gado Nelore através da comparação com o h is-
tograma e co m a de nsidade empír ica . A nova d istribuição pode ter a função taxa de
falha com formas decrescentes, crescentes e unimodal. Providenciamos u m tratamento
matemático desta distribuição calculando algumas estatísticas. Encontramos a explícita
fórmula algébrica para r-ésimo momento para alguns valores fixos dos pa râmetros. Foi
obtido a estimação dos parâmetros pelo méto do de máxima verossimilhança e pelo método
bayesiano. Para o conjunto de dados utilizados na aplicação, a fun ção d e sob revivência
paramétrica com os parâmetros estimados pelo método baye sia na se ajustou melhor a
sobrevivência empírica que a função de sobrevivência paramétrica com os parâmetros es-
timados pelo método clássico.
51
Referências
Abramowitz, M., Stegun I. P. (1972). Handbook of mathematical functions. edited by Miltom
Abramowitz and Irene A. Stegun , Dover publications, Inc.,New York.
Box, G. E. P., Tiao, G.C. (1973). Bayesian inference in statistical a nalysis. Addison- Wesley,
588p.
Bucar, T., Nagode, M., Fajdiga, M. (2004 ). Re liability approximation using finite Weibull
mixture distributions. Reliability Engineering and System Safety, 84 , 241 –251.
Choudhury, A. (2005). A Simple Derivation of Moments of the Exponentiated Weibull Dis-
tribution. Metrika, 6 2, 17-22.
Colosimo, E.A., Giolo, S.R. (2006). Análise de sobrevivência aplicada. Edgar blucher, 392p,
São Paulo.
Cordeiro , G.M. (1992). Introdução a teoria assintótica. 22
o
Colóquio Brasileiro de
Matemática.
Cordeiro , G.M. (1999). Intro dução a teoria da verossimilhança. 10
o
Simpósio Nacional de
Probabilidade e Estatística.
Doornik, J. (2007). Ox: An object-oriented matrix programming language. International
Thomson Bussiness Press.
Gelman, A., Carlin, J. B., Stern, H. S.; Rubin, D. B.(1997) Bayesian Data Analysis. Lond on:
Chapman Hall, pag. 526.
Gupta, R.D., Kundu, D. (1999). Generalized exponential distribution. Australian and New
Zeland Journal of Statistics. 41,2, 173–188.
Jiang, R., Murthy, D.N.P, Ji, P. (2001). Models involving two inverse Weib ull distributions.
Reliability Engineering and System Safety, 73, 73–81.
Kass, R.E., Wasse rman, L. (1 996). The Selection of Priori Distributions by Formal Rules .
Journal of teh American Statistics Association, 91, 1343-13 70.
Lai, C. D., Xie, M., Murthy, D. N. P. (2003). A modified Weibull distribution. Transactions on
Reliability, 52, 33-37.
Leandro, R. A. (2001). Introdução à Estatística Bayesiana. Departamento de Matemática e
Estatística, ESALQ/USP Piracicaba. São Paulo.
Lee, P. M. (2004). Bayesian Statistics An Introd uction. Oxford Univer sity Press Inc. 351p.
Louzada-Neto, F., Mazucheli, J. e Achcar, J. A. (2001). Uma Introdução à An álise de So-
brevivência e Confiabilida de. XXVIII Jornadas Nacion ales de Estadística. Chile .
52
Mudholkar, G. S., Srivastava, D. K. e Kollia, G. D. (1996 ). A generalization of the Weibull
distribution with application to the an alysis of survival data. J. Americ. Statist. Assoc.,
91, 1575-15 83.
Paulino, C. D.; Turkman, M. A. A.; Mu rteira, B. (2003). Estatística Bayesiana. Fundação
Calouste Gulb enkian / Lisboa. 446p.
Pollard, W. E. (1986). Bayesian statistics for evaluation research An Introduction. Sage
Publications New Delhi. 241p.
Rajarshi, S., Rajarshi, M. B. (1988). Bathtub d istributions: a review. Commun. Statatist.
Theory. Meth., 17, 2597-2521.
Sultan, K. S., Ismail, M. A., Al-Moisheer, A. S. (2007). Mixture of two Weibull distribu-
tions: Properties and estimation. Comp utacional Statistics and Data Analisys, 51,
5377-5387.
Venables,W. N., Smith, D. M. and the R Development Core Team (2008). An Introduction
to R. R Development Core Team.
Xie, M., Lai, C. D. (1995). Reliability analysis using an additive Weibull model with bathtub-
shaped failure rate function. Reliab. Eng. Syst. Sa fety, 52, 87-93.
Xie, M., Tang, Y., Goh, T. N. (2002). A modified Weibull extension with bathtub fa ilure rate
function. Reliab. Eng. Syst. Safety, 76, 279 -285.
53
APÊNDICE
/*************************** **********************************
PROGRAMA 01: estimação-parametros-EMV.ox
USO:
Estima os parâmetros de máxima verossimilhança do modelo da
distribuição Weibull inversa generalizada, mediante a rotina MaxBFGS.
AUTOR:
Edwin Moises Marcos Ortega (edwin@esalq.usp.br)
VERSÃO: 1.0
**************************************************************/
#include<oxstd.h>
#include<oxdraw.h>
#include<oxfloat.h>
#include<maximize.h>
#include<simula.h>
#pragma link("maximize.oxo")
static decl g mY ;
log vero(const vP,const a dFunc, const avScore,const amHessian)
{
decl t,cont;
decl n=rows( g mY );
54
decl uns=ones(n,1);
decl vero=zeros(1,n);
decl a1=vP[0][0]; //alpha
decl a2=vP[1][0]; //beta
decl a3=vP[2][0]; //gamma
for(cont=0;cont<n;++cont)
{ t=g mY [cont][0];
if(g mY [cont][1]==1)
vero[0][cont]=
log(a3)+log(a2) +a 2*log(a1)-(a2+1)*log(t) -a3*((a1)
(
a2)) ((t)
(
a2));
if(g mY [cont][1]==0)
vero[0][cont]=
log(1- exp(-a3*((a1/(t+0.0001))
(
a2))));
}
adF unc[0]=double(vero uns);
return 1 ;
}
main() {
g mY = loadmat(”tabela1 5lozada.txt”);
print("Dados",g mY );
decl nc=rows(g mY );
decl dfunc;
decl vP=<140.1;3 3.3;10.5>; //chute inicial
log vero(vP,dfunc,0,0);
println(" vero=",dfunc);
MaxControl(- 1,20);
decl mhess; decl ir, var, var1, var2;
ir=MaxBFGS(log vero ,vP,dfunc,mhess,1);
Num2Derivative(log ver o ,vP,mhess);
var=-1/mhess;
55
//var1=invertsym((-1)*mhess);
var2=((1) mhess)
(
1);
print("o s valores da mhess ,mhess);
print("o s valores das variâncias ,var);
//print("os valores das variâncias 1 ,var1);
print("o s valores das variâncias 2 ,var2);
print("o s valores dos param etros , vP);
decl ep= sqrt(diagonal(-1/mhess));
print("Estimativa,Erro padrão, p valor: " ,vPep’(2*(1-pro bn(fabs(vP’./ep)))’)); }
/*************************** **********************************
PROGRAMA 02: estimação-parametros-WINBUGS
USO:
Estima os parâmetros de máxima verossimilhança do modelo da
distribuição Weibull inversa generalizada, mediante o método Bayesiano.
AUTOR:
TUTORIAL WINBUGS
VERSÃO: 1.4
**************************************************************/
model
{
C <- 10000
const<- gama*beta*pow(alpha,beta)
cont2<- -beta-1
for( i in 1 : N ) {
zeros[i] <- 0
56
cont1[i]<-alpha/t[i]
cont3[i]<-exp(-gama*pow(cont1[i],beta))
L[i]<-const*pow(t[i],cont2)*cont3[i]
phi[i] <- -log(L[i]) + C
zeros[i] dpois(phi[i])
}
alpha dgamma( 0.1, 0.1)
beta dgamma(0.1, 0.1)
gama dgamma(0.1, 0.1)
}
list(t=c(138,140,141,143,145,146 ,1 46,148,
148,149,149,150,151,151,151,151,152,152,
153,153,153,155,156,156,157,158,158,159,
159,159,159,159,159,160,161,161,161,162,
163,163,163,163,164,164,164,164,165,166,
166,166,166,167,167,170,170,172,172,173,
174,176,179,179,180,183,184,185,187,189,
197),
N=69)
list(alfa=137.2, beta=15, gama=8 )
}
Livros Grátis
( http://www.livrosgratis.com.br )
Milhares de Livros para Download:
Baixar livros de Administração
Baixar livros de Agronomia
Baixar livros de Arquitetura
Baixar livros de Artes
Baixar livros de Astronomia
Baixar livros de Biologia Geral
Baixar livros de Ciência da Computação
Baixar livros de Ciência da Informação
Baixar livros de Ciência Política
Baixar livros de Ciências da Saúde
Baixar livros de Comunicação
Baixar livros do Conselho Nacional de Educação - CNE
Baixar livros de Defesa civil
Baixar livros de Direito
Baixar livros de Direitos humanos
Baixar livros de Economia
Baixar livros de Economia Doméstica
Baixar livros de Educação
Baixar livros de Educação - Trânsito
Baixar livros de Educação Física
Baixar livros de Engenharia Aeroespacial
Baixar livros de Farmácia
Baixar livros de Filosofia
Baixar livros de Física
Baixar livros de Geociências
Baixar livros de Geografia
Baixar livros de História
Baixar livros de Línguas
Baixar livros de Literatura
Baixar livros de Literatura de Cordel
Baixar livros de Literatura Infantil
Baixar livros de Matemática
Baixar livros de Medicina
Baixar livros de Medicina Veterinária
Baixar livros de Meio Ambiente
Baixar livros de Meteorologia
Baixar Monografias e TCC
Baixar livros Multidisciplinar
Baixar livros de Música
Baixar livros de Psicologia
Baixar livros de Química
Baixar livros de Saúde Coletiva
Baixar livros de Serviço Social
Baixar livros de Sociologia
Baixar livros de Teologia
Baixar livros de Trabalho
Baixar livros de Turismo