Download PDF
ads:
Universidade de ao Paulo
Escola Superior de Agricultura “Luiz de Queiroz”
An´alise Bayesiana de ensaios fatoriais 2
k
usando os princ´ıpios dos
efeitos esparsos, da hierarquia e da hereditariedade
Guilherme Biz
Disserta¸ao apresentada para obten¸ao do t´ıtulo de Mestre
em Ciˆencias.
´
Area de concentra¸ao: Estat´ıstica e Experi-
menta¸ao Agronˆomica
Piracicaba
2009
ads:
Livros Grátis
http://www.livrosgratis.com.br
Milhares de livros grátis para download.
Guilherme Biz
Bacharel em Matem´atica
An´alise Bayesiana de ensaios fatoriais 2
k
usando os princ´ıpios dos efeitos
esparsos, da hierarquia e da hereditariedade
Orientador:
Prof. Dr. SILVIO SANDOVAL ZOCCHI
Disserta¸ao apresentada para obten¸ao do t´ıtulo de
Mestre em Ciˆencias.
´
Area de concentra¸ao: Es-
tat´ıstica e Experimenta¸ao Agronˆomica
Piracicaba
2009
ads:
Dados Internacionais de Catalogação na Publicação
DIVISÃO DE BIBLIOTECA E DOCUMENTAÇÃO - ESALQ/USP
Biz, Guilherme
Análise Bayesiana de ensaios fatoriais 2
k
usando os princípios dos efeitos esparços, da
hierarquia e da hereditariedade / Guilherme Biz. - - Piracicaba, 2009.
71 p. : il.
Dissertação (Mestrado) - - Escola Superior de Agricultura “Luiz de Queiroz”, 2009.
Bibliografia.
1. Análise de regressão e de correlação 2. Estatística aplicada 3. Inferência Bayesiana
Título
CDD 519.542
B625a
“Permitida a cópia total ou parcial deste documento, desde que citada a fonte – O autor”
3
Dedicat´oria
Aos meus pais, Valdir e Sandra,
`a minha irm˜a, Milena,
`a minha namorada, Claudia,
e ao meu ao, Pascoal (in memoriam).
4
5
AGRADECIMENTOS
Primeiramente a Deus, que me de for¸ca para concluir esta disserta¸ao.
Agrade¸co o meu orientador Silvio Sandoval Zocchi por ter me ajudado muito,
mesmo em momentos dif´ıceis, mas finalizamos o trabalho. Aos professores do departamento,
em especial a professora Roseli Aparecida Leandro, pela grande ajuda, realizando o meu desejo
de concretizar este trabalho.
Agrade¸co a todos os meus amigos desta os gradua¸ao pela ajuda e os bons
momentos juntos : Bruno, assio, Eduardo, Elisabete, Elton, Epaminondas, Evandro, Fer-
nanda, Juliana, J´ulio, Lucimary, Luiz Alberto, Luiz Trench, Marcelino, Mariana, Michele,
Paula Fonte, Raphael, Renata, Renato, Rodrigo, Simone, Vanderly e Wilson
Agrade¸co as secret´arias Solange, Luciane e Eduardo que sempre me ajudaram
tirando d´uvidas e resolvendo as pendˆencias burocr´aticas.
Agrade¸co muito a minha fam´ılia, que me ajudou muito em momentos dif´ıceis e
importantes para eu realizar este trabalho: Meus pais, Valdir e Sandra; minha irma Milena.
Agrade¸co em especial a minha namorada Claudia, por me aguentar longe e as
vezes nervoso.
E a todos aqueles que acreditaram em mim.
OBRIGADO!!!
6
7
SUM
´
ARIO
RESUMO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
ABSTRACT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
LISTA DE FIGURAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
LISTA DE TABELAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1 INTRODUC¸
˜
AO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2 REVIS
˜
AO DE LITERATURA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
3 MATERIAIS E M
´
ETODOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
3.1 Materiais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
3.2 M´etodos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
4 RESULTADOS E DISCUSS
˜
AO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
4.1 Dados Simulados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
4.2 Dados de biofilme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
5 CONCLUS
˜
OES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
REFER
ˆ
ENCIAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
ANEXOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
8
9
RESUMO
An´alise Bayesiana de ensaios fatoriais 2
k
usando os princ´ıpios dos efeitos
esparsos, da hierarquia e da hereditariedade
No planejamento de experimentos para o ajuste de modelos polinomiais envol-
vendo k fatores principais e respectivas intera¸oes, ´e bastante comum a utiliza¸ao dos fatoriais
2
k
, 3
k
ou fra¸oes dos mesmos. Para as an´alises dos resultados desses experimentos, frequente-
mente se considera o princ´ıpio da hereditariedade, ou seja, uma vez constatada uma intera¸ao
significativa entre fatores, os fatores que aparecem nesta intera¸ao e respectivas intera¸oes
devem tamb´em estar presentes no modelo. Neste trabalho, esse princ´ıpio ´e incorporado direta-
mente `a priori, para um m´etodo de sele¸ao de vari´aveis Bayesiana, seguindo as id´eias propostas
por Chipman, Hamada e Wu (1997), por´em com uma altera¸ao dos valores sugeridos pelos au-
tores para os hiperparˆametros. Essa altera¸ao, proposta neste trabalho, promove uma melhoria
consider´avel na metodologia original. A metodologia ´e enao ilustrada por meio da an´alise dos
resultados de um experimento fatorial para a elabora¸ao de biofilmes de amido originado da
ervilha.
Palavras-chave: An´alise Bayesiana; Princ´ıpio da hereditariedade; Princ´ıpio dos efeitos es-
parsos; princ´ıpio da hierarquia; Ensaio fatorial
10
11
ABSTRACT
Bayesian analysis of 2
k
factorial designs using the sparse effects, hierarchy and
heredity principles
In experimental planning for adjustment of polynomials models involving k main
factors and their interactions, it is frequent to adopt the 2
k
, 3
k
designs or its fractions. Fur-
thermore, it is not unusual, when analysing the results of such experiments, to consider the
heredity principle. In other words, once detected a significant interaction between factors, the
factors that appear in this interaction and respective interactions should also be present in the
model. In this work, this principle is incorporated directly in the prior, following the ideas
proposed by Chipman, Hamada and Wu (1997), but changing some of the hyperparameters.
What improves considerably the original methodology. Finally the methodology is illustrated
by the analysis of the results of an experiment for the elaboration of pea starch biofilms.
Keywords:Bayesian analysis; Heredity principle; Sparse effects principle; Hierarchy principle;
Factorial design
12
13
LISTA DE FIGURAS
Figura 1 - Esquema de dependˆencia do termo de quarta ordem A
2
B
2
segundo o princ´ıpio
da hereditariedade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
Figura 2 - Esquema de dependˆencia dos termos de modelos polinomiais contendo trˆes
fatores principais e intera¸oes de ordem at´e trˆes, segundo o princ´ıpio da he-
reditariedade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
Figura 3 - Probabilidades a priori dos 14 modelos mais prov´aveis de acordo com a in-
tensidade da hereditaridedade . . . . . . . . . . . . . . . . . . . . . . . . . . 37
Figura 4 -
´
Indice H de diversidade dos modelos a posteriori segundo o valor do hiper-
parˆametro τ e da intensidade da hereditariedade: fraca, fraca rigorosa, forte
proposta por Chipman, Hamada e Wu (1997) e forte proposta neste trabalho
(forte*) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
Figura 5 - Probabilidades a posteriori de alguns modelos mais proaveis considerando-
se diferentes valores de τ, hereditariedades fraca, fraca rigorosa (fr. rig.) e
forte proposta por Chipman, Hamada e Wu (1997) e forte proposta neste
trabalho (forte*) , em que os n´umeros de 1 a 9 correspondem aos modelos
descritos na tabela 7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
Figura 6 - Probabilidades a posteriori dos termos considerados no modelo serem ativos,
considerando-se diferentes valores de τ e hereditariedade fraca, fraca rigorosa
(fr.rig.) e forte proposta por Chipman, Hamada e Wu (1997) e forte proposta
neste trabalho (forte*) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
Figura 7 - Densidades a posteriori dos parˆametros, para an´alise do dados simulados,
considerando-se as hereditariedades fraca, fraca rigorosa e forte proposta por
Chipman, Hamada e Wu (1997) e forte proposta neste trabalho e o intervalo
de 90% de credibilidade (HPD) . . . . . . . . . . . . . . . . . . . . . . . . . 47
Figura 8 - Cadeias de parˆametros, para a analise dos dados simulados, considerando-
se as hereditariedades fraca, fraca rigorosa e forte proposta por Chipman,
Hamada e Wu(1997) e forte proposta neste trabalho . . . . . . . . . . . . . 49
14
Figura 9 -
´
Indice H de diversidade dos modelos a posteriori, para os dados de biofilme,
segundo o valor do hiperparˆametro τ e a intensidade da hereditariedade:
fraca, fraca rigorosa ou forte proposta neste trabalho (forte*) . . . . . . . . 51
Figura 10 -Probabilidades a posteriori de alguns modelos mais prov´aveis, para os dados
de biofilme, considerando-se diferentes valores de τ, hereditariedades fraca,
fraca rigorosa (fr. rig.) e forte proposta neste trabalho (forte*), em que os
n´umeros de 1 a 7 representam os modelos descritos na tabela 12 . . . . . . 53
Figura 11 -Probabilidades a posteriori dos termos considerados no modelo serem ativos,
para os dados de biofilme, considerando-se diferentes valores de τ e hered-
itariedades fraca, fraca rigorosa (fr.rig.) e forte proposta neste trabalho
(forte*), descritos na tabela 13 . . . . . . . . . . . . . . . . . . . . . . . . . 56
Figura 12 -Cadeias de parˆametros para a an´alise dos dados de biofilme, considerando-se
as hereditariedades fraca, fraca rigorosa e forte proposta neste trabalho . . . 57
Figura 13 -Densidades a posteriori dos parˆametros, para a an´alise dos dados de Biofilme,
para as hereditariedades fraca, fraca rigorosa e forte proposta neste trabalho
e o intervalo de 90% de credibilidade (HPD) . . . . . . . . . . . . . . . . . . 59
15
LISTA DE TABELAS
Tabela 1 - N´ıveis dos fatores A, B e C de um delineamento fatorial completo 2
3
e coe-
ficientes dos contrastes ( = 1 e + = +1) para a estima¸ao dos efeitos de
intera¸ao dupla e tripla . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
Tabela 2 - N´ıveis dos fatores A e B de um delineamento fatorial completo 3
2
, e coe-
ficientes dos contrastes para a estima¸ao dos efeitos de primeira e segunda
ordem em modelos polinomiais de segunda ordem completo . . . . . . . . . 20
Tabela 3 - N´ıveis dos fatores do delineamento 2
3
completo, e observoes da vari´avel
resposta y, obtidas por meio de simula¸ao . . . . . . . . . . . . . . . . . . . 25
Tabela 4 - Formula¸oes de diferentes biofilmes de ervilha, coeficientes para estima¸ao
das intera¸oes e alongamentos sob for¸ca axima (y) dos biofilmes formados 26
Tabela 5 - Sugest˜oes de valores para os hiperparˆametros p
00
, p
01
, p
10
e p
11
da distribui¸ao
a priori de δ propostos por Chipman, Hamada e Wu (1997) e novos valores
propostos neste trabalho (
) para uma hereditariedade forte . . . . . . . . . 35
Tabela 6 - Probabilidades a priori de cada coeficiente do modelo 30 ser importante de
acordo com a intensidade da hereditariedade, cujos hiperparˆametros ao apre-
sentados na Tabela 5; N´umeros k de poss´ıveis modelos e ´ındice de diversidade
H dos poss´ıveis modelos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
Tabela 7 - Probabilidades a posteriori de alguns modelos mais prov´aveis considerando-
se diferentes valores de τ, hereditariedades fraca, fraca rigorosa (fr. rig.)e
forte propostas por Chipman, Hamada e Wu (1997) e forte proposta neste
trabalho (forte*), n´umeros de diferentes modelos (k) e ´ındices de diversidade
de Shannon (H). Em negrito ao ressaltads os modelos mais prov´aveis para
cada valor de τ e cada intensidade de hereditariedade . . . . . . . . . . . . 42
Tabela 8 - Probabilidades a posteriori dos termos considerados no modelo serem ativos,
considerando-se diferentes valores de τ e hereditariedades fraca, fraca rigorosa
(fr.rig.) e forte propostas por Chipman, Hamada e Wu (1997) e forte proposta
neste trabalho (forte*) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
16
Tabela 9 - Estimativas dos parˆametros do modelo considerando-se τ = τ
e heredi-
tariedades fraca, fraca rigorosa (fr. rig.) e forte propostas por Chipman,
Hamada e Wu (1997) e forte proposta neste trabalho (forte*) . . . . . . . . 46
Tabela 10 -Estat´ıstica (Z) para o teste de convergˆencia de Geweke (1992) considerando-
se τ = τ e a hereditariedade fraca, fraca rigorosa (fr. rig.) e forte proposta
por Chipman, Hamada e Wu (1997) e forte proposta neste trabalho (forte*), 48
Tabela 11 -Estat´ısticas (FD) para o teste de convergˆencia de Raftery e Lewis (1992)
considerando-se τ = τ e hereditariedades fraca, fraca rigorosa (fr. rig.) e
forte proposta por Chipman, Hamada e Wu (1997) e forte proposta neste
trabalho (forte*) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
Tabela 12 -Probabilidades a posteriori de alguns modelos mais prov´aveis, para o ex-
perimento do Biofilme, considerando-se diferentes valores de τ, hereditarie-
dade fraca, fraca rigorosa (fr. rig.) e forte proposta neste trabalho (forte*),
n´umeros de diferentes modelos (k) e ´ındices de diversidade de Shannon (H),
ressaltando-se, em negrito, o modelo mais prov´avel em cada uma das situa¸oes 52
Tabela 13 -Probabilidades a posteriori dos termos considerados no modelo serem ativos,
para os dados de biofilme, considerando-se diferentes valores de τ e heredi-
tariedades fraca, fraca rigorosa (fr.rig.) e forte proposta neste trabalho (forte*) 55
Tabela 14 -Estat´ıstica (Z) para o teste de convergˆencia de Geweke (1992), para o expe-
rimento do biofilme, considerando-se τ = τ e a hereditariedades fraca, fraca
rigorosa (fr. rig.) e forte proposta neste trabalho (forte*) . . . . . . . . . . 58
Tabela 15 -Estat´ıstica (FD) para o teste de convergˆencia de Raftery e Lewis (1992), para
os dados de biofilme, considerando-se τ = τ e as hereditariedades fraca, fraca
rigorosa (fr. rig.) e forte proposta neste trabalho (forte*) . . . . . . . . . . 58
Tabela 16 -Estimativas dos parˆametros do modelo, para os dados de biofilme,
considerando-se τ = τ e as hereditariedades fraca, fraca rigorosa (fr. rig.) e
forte proposta neste trabalho (forte*) . . . . . . . . . . . . . . . . . . . . . 60
17
1 INTRODUC¸
˜
AO
Em diversas ´areas de pesquisa, frequentemente o pesquisador deseja obter uma
fun¸ao matem´atica que relaciona uma vari´avel com uma ou mais vari´aveis ou fatores de in-
teresse. Especificamente, ele busca determinar um subconjunto de vari´aveis explicativas para
melhor explicar a vari´avel resposta. Quando existem muitas vari´aveis explicativas e conse-
quentemente muitos parˆametros no modelo, geralmente ao usados etodos autom´aticos para
a sele¸ao de vari´aveis. Esses m´etodos, entretanto, n˜ao contemplam princ´ıpios comumente ado-
tados nesses casos, como o dos efeitos esparsos, o da hierarquia e o da hereditariedade. Este
´ultimo, considera que, uma vez constatada uma intera¸ao entre fatores significativa, considera-
se que os fatores que aparecem nessa intera¸ao e suas intera¸oes devem tamem estar presentes
no modelo. Este trabalho utiliza a aproxima¸ao Bayesiana considerando o princ´ıpio de here-
ditariedade, incorporado diretamente na escolha da distribui¸ao a priori seguindo as id´eias
propostas por Chipman, Hamada e Wu (1997).
A metodologia ´e, ent˜ao, ilustrada por meio da an´alise dos resultados de um
experimento para a elabora¸ao de biofilme de amido originado da ervilha e de um conjunto de
dados obtidos por meio de simula¸ao.
18
19
2 REVIS
˜
AO DE LITERATURA
Em pesquisas cient´ıficas frequentemente a o interesse no estudo da influˆencia
de dois ou mais fatores simultaneamente sobre uma ou mais vari´aveis resposta de interesse.
Para isso, geralmente s˜ao utilizados os delineamentos fatoriais, que consideram todos os n´ıveis
de cada fator e todas suas poss´ıveis combina¸oes como tratamentos. Se forem considerados k
fatores, cada um com N n´ıveis, tem-se o esquema fatorial completo denotado por N
k
, com N
k
tratamentos.
Dois casos especiais ao particularmente importantes e frequentes, os que ocor-
rem quando os k fatores tem apenas dois (N = 2) ou trˆes (N = 3) n´ıveis, denotados por 2
k
e
3
k
, respectivamente.
Os fatoriais 2
k
ao especialmente usados para a sele¸ao de fatores importantes
sobre a vari´avel, dentre os k fatores candidatos. Apresentam a grande vantagem de possu´ırem
um n´umero menor de observoes do que outros delineamentos com k fatores. Devido ao fato
de os fatores possu´ırem apenas dois n´ıveis, ao usados para estudar o efeito linear dos n´ıveis
dos fatores sobre a resposta, e segundo Myers e Montgomery (1995), ao utilizados, ainda,
como parte de outros delineamentos, como o delineamento composto central. A segunda, ter-
ceira e quarta colunas da tabela 1 apresentam, como ilustra¸ao, os n´ıveis dos fatores de um
fatorial completo 2
3
, em que representa um n´ıvel e +, o outro n´ıvel. Esses sinais ao usados
tamem, na estima¸ao dos efeitos dos fatores e respectivas intera¸oes sobre a vari´avel res-
posta, considerando-os como os sinais dos coeficientes dos contrastes envolvendo as respostas.
Os sinais para o alculo dos efeitos da intera¸oes, por sua vez, ao calculados por meio da
multiplica¸ao dos sinais de seus efeitos formadores.
Em situa¸oes em que h´a o interesse de se ajustar modelos polinomiais de segunda
ordem, por outro lado, geralmente s˜ao utilizados delineamentos considerando fatores com mais
de dois n´ıveis, por exemplo, trˆes n´ıveis. Com isso, ao apresentados os fatoriais da s´erie 3
k
,
em que cada fator possui 3 n´ıveis. Um exemplo dos fatoriais 3
k
´e o delineamento 3
3
que ´e
muito usado em pesquisas em ensaios de aduba¸ao N-P-K, que possui 3 fatores: nitrogˆenio
(N), osforo (P) e pot´assio (K), cada um com 3 n´ıveis (1, 0, 1). Neste caso 1 representa
a dose mais baixa do nutriente, 0, a intermedi´aria e +1, a mais alta, totalizando 3
3
= 27
tratamentos. No caso de k = 2 nutrientes com trˆes n´ıveis cada, tem-se o delineamento 3
2
com
20
Tabela 1 - N´ıveis dos fatores A, B e C de um delineamento fatorial completo 2
3
e coeficientes
dos contrastes ( = 1 e + = +1) para a estima¸ao dos efeitos de intera¸ao dupla
e tripla
Tratamentos A B C AB AC BC ABC
1 − − − + + +
2 − − + + +
3 + + +
4 + + +
5 + − − + +
6 + + +
7 + + +
8 + + + + + + +
9 tratamentos, apresentado na tabela 2.
Tabela 2 - N´ıveis dos fatores A e B de um delineamento fatorial completo 3
2
, e coeficientes dos
contrastes para a estima¸ao dos efeitos de primeira e segunda ordem em modelos
polinomiais de segunda ordem completo
Tratamentos A B AB A
2
B
2
1 -1 -1 1 1 1
2 -1 0 0 1 0
3 -1 1 -1 1 1
4 0 -1 0 0 1
5 0 0 0 0 0
6 0 1 0 0 1
7 1 -1 -1 1 1
8 1 0 0 1 0
9 1 1 1 1 1
A codifica¸ao apresentada nas tabelas 1 e 2 ao feitas para facilitar, tanto a
21
constru¸ao do delineamento experimental, quanto a an´alise posterior dos resultados do expe-
rimento. Considere um fator quantitativo cujos n´ıveis pertencem a um certo intervalo. Uma
codifica¸ao usual para um determinado n´ıvel do fator, segundo Khuri e Cornell (1996) ´e dado
pela diferen¸ca entre o mesmo e o ponto m´edio do intervalo, dividida pela semi-amplitude do
intervalo. Nesse caso, a amplitude dos n´ıveis dos fatores codificados pertencem ao intervalo
[1, 1].
Pode-se facilmente notar que conforme o pesquisador aumenta o n´umero de fa-
tores em experimentos fatoriais, o n´umero de tratamentos aumenta rapidamente, podendo
inviabiliz´a-lo. Como exemplo, um delineamento fatorial completo 2
6
tem 2
6
= 64 tratamentos,
sendo que para estimar os parˆametros do modelo com todas as poss´ıveis intera¸oes envol-
vendo os 6 fatores, ao necess´arias, no m´ınimo, 64 observoes. Segundo Barbin (2003) e Wu
e Hamada (2000), k 7 a torna o delineamento praticamente invi´avel. Para fatores com
N = 3 n´ıveis, o valor de k a ´e considerado grande se k 4. Se, por outro lado, o pesquisador
assumir que as intera¸oes de maior ordem podem ser desprez´ıveis, ent˜ao as informa¸oes sobre
os efeitos principais e intera¸oes de ordem menor podem ser obtidas utilizando apenas uma
fra¸ao do experimento fatorial completo, chamada fatorial fracionado. Este tamb´em ´e bastante
usado quando se considera um grande umero de fatores e o pesquisador quer identificar um
subconjunto de fatores que tˆem mais efeito sobre a vari´avel resposta. Considere um delinea-
mento fatorial 2
4
completo, com os fatores A, B, C e D, contendo 2
4
= 16 tratamentos. Se
for necess´ario usar um n´umero menor de tratamentos, ´e comum usar metade deste fatorial
(
1
2
2
4
= 2
41
) que pode ser obtida a partir de um delineamento fatorial completo 2
3
, como o
da tabela 1, adicionando o fator D cujo coeficientes dos contrastes ao iguais aos da intera¸ao
tripla, ou seja, D = ABC. Neste delineamento, no entanto, os efeitos principais est˜ao confun-
didos com as intera¸oes triplas e as intera¸oes de segunda ordem ficam confundidas entre elas,
sendo imposs´ıvel diferenciar os efeitos confundidos. Assim, no caso das intera¸oes duplas, ao
´e poss´ıvel diferenciar AB de CD, AC de BD e AD de BC. Como consequˆencia, quando se
estimam os efeitos de algumas das intera¸oes duplas, na realidade ao estimados a soma dos
efeitos confundidos. No caso, quando se estima o efeito da intera¸ao dupla AB, na realidade
estima-se AB + CD.
Outras fra¸oes alternativas, denominadas fra¸oes ´otimas por Wu e Hamada
22
(2000), podem ser obtidas por uma metodologia apresentada pelos autores, baseada no conceito
de resolu¸ao de um delineamento e no crit´erio do m´ınimo desvio.
Em situa¸oes em que as unidades experimentais tˆem custos muitos elevados, no
entanto, ao ´e raro o desejo de se ajustarem modelos com mais parˆametros que observoes,
ficando invi´avel realizar a regress˜ao por meio de m´etodos cl´assicos. Entretanto, pode-se utilizar
uma aproxima¸ao Bayesiana seguindo a estrat´egia de Chipman, Hamada e Wu (1997), que
´e uma combina¸ao de sele¸ao de vari´aveis do algoritmo de George e McCulloch (1993), com
prioris para relacionar preditores dadas por Chipman (1996). Neste caso, o n´umero de modelos
poss´ıveis ´e grande e podem existir diferentes modelos que explicam os dados observados.
A estrat´egia de Chipman, Hamada e Wu (1997) utiliza, como priori, alguns
princ´ıpios cl´assicos da metodologia de superf´ıcie de resposta para ajustar um modelo e esta-
belece a sele¸ao de modelos por meio das probabilidades a posteriori dos mesmos.
Os trˆes princ´ıpios utilizados ao o dos efeitos esparsos, o de ordem hier´arquica
e efeito da hereditariedade. Segundo o efeitos esparsos, o n´umero de importantes efeitos ´e
pequeno em rela¸ao ao n´umero total de efeitos. Segundo o princ´ıpio da ordem hier´arquica,
descrito por Wu e Hamada (2000): os efeitos de baixa ordem ao mais proaveis de serem
importantes do que efeitos de alta ordem e os efeitos de mesma ordem ao igualmente proaveis
de serem importantes. Segundo os autores, este ´e um princ´ıpio emp´ırico cujo validamento tem
sido comprovado por meio de muitos experimentos reais segundo os autores.
O princ´ıpio do efeito de hereditariedade, por sua vez, tamem apresentado pelo
autores, estabelece que, caso uma intera¸ao entre certos fatores seja significativa, pelo menos
um dos fatores formadores dessa intera¸ao seja significativo.
Em resumo, estes princ´ıpios podem ser considerados na formula¸ao de uma priori
para os parˆametros do modelo adotado, de tal forma que os mesmos possam ser estimados,
at´e mesmo no caso de modelos supersaturados, por meio da inferˆencia Bayesiana.
Seja θ o parˆametro ou vetor de parˆametros do modelo de interesse e y uma
observao aleat´oria da vari´avel resposta de interesse.
O teorema de Bayes, base da inferˆencia Bayesiana, estabelece, enao, a rela¸ao
entre a distribui¸ao a posteriori de θ dado y, p(θ|y), e a distribui¸ao a priori de θ, p(θ), dada
por:
23
p(θ|y) =
p(θ, y)
p(y)
=
p(y|θ)p(θ)
p(y)
, (1)
em que
p(y) =
θ
p(θ, y) =
θ
p(y|θ)p(θ) (2)
e p(θ, y) ´e a distribui¸ao conjunta de (θ, y). Para um valor fixo de y, a fun¸ao f (y|θ) = p(y|θ)
estabelece, por sua vez, a verossimilhan¸ca para cada um dos poss´ıveis valores de θ.
Deve-se salientar ainda, que, neste caso, p(y) dado pela equa¸ao (2) ´e uma cons-
tante chamada constante normalizadora. Com isso, o teorema de Bayes, dado pela equa¸ao
(1), tem sua forma usual dada por
p(θ|y) f(y|θ)p(θ). (3)
A distribui¸ao a priori tem um importante papel na an´alise Bayesiana, sendo
usada para descrever uma informa¸ao sobre os parˆametros desconhecidos antes da obten¸ao
dos resultados do experimento (BOX; TIAO, 1992), ou seja, reflete o conhecimento pr´evio que
o pesquisador tem a respeito de seu problema.
Ap´os definida a distribui¸ao a priori, obt´em-se a distribui¸ao a posteriori dos
parˆametros, por meio da equa¸ao (3).
´
E poss´ıvel, enao, resumir as informa¸oes sobre os
parˆametros por meio de t´ecnicas inferenciais, utilizando probabilidades e esperan¸cas, que, de-
pendendo da complexidade do problema, ao ao resolvidas analiticamente.
´
E nesta etapa que
se faz necess´aria a utiliza¸ao de m´etodos computacionais intensivos para obter os parˆametros
da distribui¸ao a posteriori, como o m´etodo de Monte Carlo via Cadeias de Markov, deno-
minado de MCMC. No contexto de t´ecnica Bayesiana, o amostrador de Gibbs e o algoritmo
Metropolis-Hastings, descritos por Gelman et al. (1995), ao os etodos mais utilizados. Re-
sumidamente, a id´eia destes m´etodos ´e que a distribui¸ao dos parˆametros obtida por meio dos
mesmos converge para a distribui¸ao original (PAULINO; TURKMAN; MURTEIRA, 2003).
Estes m´etodos intensivos est˜ao implementados no pacote computacional R (2007) cuja uti-
liza¸ao ´e descrita detalhadamente por Albert (2007).
Para monitorar a convergˆencia das cadeias geradas pelo m´etodos citados, podem
ser utilizados, enao, os etodos diagn´osticos propostos por Raftery e Lewis (1992) e Geweke
24
(1992). O etodo de Geweke (1992) se baseia no teste de igualdade de m´edias da primeira e
´ultima parte da cadeia, geralmente dos primeiros 10% e dos ´ultimos 50% elementos da mesma,
respectivamente. Neste teste, a cadeia converge quando o valor Z calculado esta entre os limites
de uma distribui¸ao normal padronizada, ou atrav´es da estimativa do valor p calculado, em
que, caso esse valor for menor que um n´ıvel de significˆancia adotado elo pesquisador, conclui-se
que a cadeia ao convergiu.
O m´etodo de Raftery e Lewis (1992), por sua vez, baseia-se na acur´acia de
estima¸ao do quantil das cadeias geradas. Para isso, considere a distˆancia m´ınima de uma it-
era¸ao a outra (thin) para se obter uma subamostra aproximadamente independente e tamb´em
o n´umero de itera¸oes iniciais que devem ser descartadas (burn-in). A convergˆencia ´e avali-
ada, ent˜ao, por meio do chamado fator de dependˆencia, dado pelo acr´escimo multiplicativo ao
n´umero de itera¸oes necess´arias para se alcan¸car a convergˆencia. Assim, segundo os autores,
a cadeia ao converge enquanto esse fator for maior que cinco. Esses testes de convergˆencia
foram implementados, usando-se o pacote computacional R, no pacote de fun¸oes boa Smith
(2009).
Uma vez obtida a convergˆencia das cadeias, obtˆem-se as probabilidades a poste-
riori de diversos modelos alternativos pertencentes a uma mesma fam´ılia de modelos.
Finalmente, para analisar a diversidade de modelos a posteriori pode-se, enao,
utilizar o ´ındice de Shannon (1948), dado por:
H = ln
k
l=1
γ
γ
l
l
=
k
l=1
ln(γ
γ
l
l
) =
k
l=1
γ
l
ln(γ
l
), (4)
sendo k o n´umero de modelos a posteriori e γ
l
a probabilidade do l-´esimo modelo a posteriori. O
valor de H ´e igual a 0 se e somente se houver um modelo a posteriori que tenha probabilidade
γ
l
igual a 1, ou seja, se houver apenas um modelo a posteriori. Por outro lado, o valor
aximo para H, para um determinado k, ´e ln(k), ocorrendo quando γ
l
=
1
k
(l = 1, ..., k.),
ou seja, quando todos os modelos tem iguais probabilidades a posteriori de serem escolhidos.
Resumidamente, quanto maior a diversidade dos modelos, maior ´e o ´ındice H.
25
3 MATERIAIS E M
´
ETODOS
3.1 Materiais
Como materiais, s˜ao utilizados neste trabalho dois conjuntos de dados, o primeiro
obtido por meio de simula¸ao e o segundo, por meio de um experimento.
O primeiro considera trˆes fatores A, B e C ou vari´aveis explicativas x
1
, x
2
e x
3
,
cada uma com dois n´ıveis 1 ou 1 no esquema fatorial 2
3
, conforme apresentado na tabela 3,
cujos resultados, foram obtidos por meio de simula¸ao considerando-se o modelo:
y
i
= 10 + 5x
1i
+ 7x
2i
+ 5x
1i
x
2i
+ 2x
2i
x
3i
+
i
, (5)
em que
i
N(0, 4), i = 1, ..., 8, e Cov(
i
,
i
) = 0, para todo i = i
.
Tabela 3 - N´ıveis dos fatores do delineamento 2
3
completo, e observoes da vari´avel resposta
y, obtidas por meio de simula¸ao
A B C
Tratamento x
1
x
2
x
3
y
1 5,04
2 + 0,63
3 + 2,25
4 + + 7,80
5 + 5,59
6 + + 1,78
7 + + 22,58
8 + + + 28,27
Como segundo conjunto de dados, considerou-se os resultantes de um experi-
mento para a formula¸ao de biofilmes de amido de ervilha (Pisum sativum) conduzido por
Manoel Divino da Matta Junior, no Departamento de Ciˆencia e Tecnologia de Alimentos da
ESALQ-USP, em Piracicaba, ao Paulo, em 2009. Neste, as diferentes formula¸oes utilizadas
constavam de: 3, 4 ou 5% de amido; 0, 0, 05 ou 0, 1% de goma e 0, 10 ou 20% de glicerol em
26
combina¸oes dadas seguindo o esquema fatorial 2
3
com 5 repeti¸oes do ponto central em um
delineamento interamente ao acaso. Para o presente trabalho, selecionou-se dentre arias, a
vari´avel resposta alongamento sob for¸ca axima em mil´ımetros. As vari´aveis explanat´orias
X
1
= porcentagem de amido, X
2
= porcentagem de goma e X
3
= porcentagem de glicerol
foram, enao, codificadas por meio de x
1
=
2X
1
8
2
, x
2
=
2X
2
0,1
0,1
e x
3
=
2X
3
20
20
e apresentadas
na tabela 4. Note, nesta tabela, que ao houve forma¸ao de biofilme com a formula¸ao 5, que
considera (x
1
, x
2
, x
3
) = (1, 1, 1), ou seja, X
1
= 5% de amido, X
2
= 0% de goma e X
3
= 0%
de glicerol. Note, ainda, que a formula¸ao 9, que considera as porcentagens intermedi´arias de
amido, goma e glicerol, foi repetida cinco vezes.
Tabela 4 - Formula¸oes de diferentes biofilmes de ervilha, coeficientes para estima¸ao das
intera¸oes e alongamentos sob for¸ca axima (y) dos biofilmes formados
Formula¸ao Amido Goma Glicerol Alongamento
i (Tratamento) x
1
x
2
x
3
x
1
x
2
x
1
x
3
x
2
x
3
y
1 1 1 1 1 1 1 1 4,7458
2 2 1 1 1 1 1 1 11,1002
3 3 1 1 1 1 1 1 5,6792
4 4 1 1 1 1 1 1 10,7002
5 5 1 1 1 1 1 1
6 6 1 1 1 1 1 1 12,7502
7 7 1 1 1 1 1 1 7,1750
8 8 1 1 1 1 1 1 25,8150
9 9 0 0 0 0 0 0 4,6190
10 9 0 0 0 0 0 0 3,8922
11 9 0 0 0 0 0 0 5,9042
12 9 0 0 0 0 0 0 4,9750
n = 13 9 0 0 0 0 0 0 5,5378
27
3.2 M´etodos
Considere o modelo linear geral, dado por:
y = Xβ + (6)
em que y ´e o vetor de observoes com dimens˜ao n; X ´e a matriz do delineamento, de dimens˜oes
n × (p + 1); β ´e o vetor com dimens˜ao p + 1, incluindo o intercepto e demais p parˆametros
correspondentes aos efeitos fatoriais e ´e o vetor de erros aleat´orios com distribui¸ao normal
multivariada MN(0, σ
2
I
n
), em que 0 ´e o vetor de zeros, com dimens˜ao n e I
n
= diag{1, 1, ..., 1}
´e a matriz identidade.
O princ´ıpio de hereditariedade pode ser, enao, incorporado diretamente `a priori
considerando-se, para isso, um vetor δ de dimens˜ao p + 1, formado por 0
s e 1
s, cujo j-
´esimo elemento, δ
j
, ´e 0, se β
j
, (j = 1, 2, ..., p + 1) ao ´e importante, ou 1 se β
j
´e importante.
Considera-se, ainda, que θ = (β
T
, δ
T
, σ
2
)
T
´e o vetor de parˆametros a serem estimados, com
dimens˜ao 2p + 3. Para completar a formula¸ao Bayesiana, ao apresentadas, na sequˆencia, as
distribui¸oes a priori para θ. Considere, inicialmente que a distribui¸ao a priori para o j-´esimo
elemento de β seja a mistura de normais dada por
π(β
j
|δ
j
) =
N(0, σ
2
τ
2
j
) se δ
j
= 0
N(0, σ
2
(c
j
τ
j
)
2
) se δ
j
= 1
. (7)
Neste caso, os hiperparˆametros c
j
e τ
j
devem ser especificados de maneira tal que, quando
δ
j
= 0, β
j
tenha um valor pr´oximo a zero e quando δ
j
= 1, exista uma probabilidade elevada
de |β
j
| ter um valor alto.
A distribui¸ao a priori para σ
2
considerada ´e a gama invertida,
σ
2
IG(ν/2, νλ/2) (8)
sendo ν e λ seus hiperparˆametros, cuja escolha ser´a abordada posteriormente.
Finalmente, como δ especifica um determinado modelo, a priori para δ especifica
a priori para cada modelo poss´ıvel e ´e dada por:
π(δ) =
p+1
j=1
p
δ
j
j
(1 p
j
)
1δ
j
, (9)
28
em que p
j
= P rob(δ
j
= 1), considerando independˆencias entre as prioris para δ
j
e δ
j
, j = j
.
Esta considera¸ao, no entanto, ao ´e apropriada para modelos com intera¸oes. Neste caso,
deve-se usar uma priori hier´arquica para δ, na qual ´e incorporado o princ´ıpio da hereditarie-
dade.
Considere, para fins de ilustra¸ao, que a trˆes fatores, A, B e C, com dois n´ıveis
cada e que apenas os efeitos principais e as suas intera¸oes duplas devem fazer parte do
modelo. Neste caso, tem-se que δ = (δ
Int
, δ
A
, δ
B
, δ
C
, δ
AB
, δ
AC
, δ
BC
) e baseando-se no princ´ıpio
de hereditariedade, a significˆancia de AB depende da significˆancia de A e de B, ou seja,
se nenhum dos efeitos principais ´e significativo no modelo, ent˜ao a intera¸ao parece menos
plaus´ıvel. Esse princ´ıpio pode ser incorporado `a priori para δ, assumindo que os termos de
mesma ordem ao independentes. Com isso, os valores de δ associados aos termos de primeira
ordem, δ
A
, δ
B
e δ
C
, s˜ao independentes e os associados aos termos de segunda ordem, δ
AB
, δ
AC
e
δ
BC
, tamem a ao. Assim, o princ´ıpio da hereditariedade assume que o termo com intera¸ao
depende apenas dos termos que o formam e no caso, P rob(δ
AB
|δ
A
, δ
B
, δ
C
) = P rob(δ
AB
|δ
A
, δ
B
).
Logo, tem-se que:
P rob(δ) = P rob(δ
Int
)P rob(δ
A
)P rob(δ
B
)P rob(δ
C
)
× P rob(δ
AB
|δ
A
, δ
B
)P rob(δ
AC
|δ
A
, δ
C
)P rob(δ
BC
|δ
B
, δ
C
). (10)
Este princ´ıpio vai ser definido, ent˜ao, por meio da forma como as intera¸oes
dependem dos termos que as formam. No caso em quest˜ao, a probabilidade da intera¸ao AB
ser ativa ou importante, ou seja, de δ
AB
= 1, dados δ
A
e δ
B
, pode ser escrita como:
P rob(δ
AB
= 1|δ
A
, δ
B
) =
p
00
se (δ
A
, δ
B
) = (0, 0)
p
01
se (δ
A
, δ
B
) = (0, 1)
p
10
se (δ
A
, δ
B
) = (1, 0)
p
11
se (δ
A
, δ
B
) = (1, 1)
, (11)
em que p
00
, p
01
, p
10
e p
11
ao constantes entre 0 e 1 que refletem a intensidade da hereditarie-
dade.
No caso de se ter fatores quantitativos e modelos de segunda ordem ou superior,
esta forma de se especificar a distribui¸ao a priori tamb´em pode ser utilizada. Considere, por
exemplo, um modelo polinomial de quarta ordem em que A
2
B
2
´e um termo de quarta ordem.
29
Este fator, segundo o princ´ıpio da hereditariedade, depende dos termos de terceira ordem
A
2
B e AB
2
conforme ilustra a figura 1. Os termos de terceira ordem, por sua vez, dependem
dos termos de segunda ordem A
2
, B
2
e AB que o formam. Finalmente, os termos A
2
e B
2
dependem apenas de um termo, ou seja, de A e B, respectivamente e AB depende de A e B.
Assim,
P rob(δ
A
2
= 1|δ
A
) =
p
00
se δ
A
= 0
p
11
se δ
A
= 1
,
chamado de princ´ıpio da hereditariedade imediato.
A B
A
2
AB
B
2
A
2
B AB
2
A
2
B
2
Figura 1 - Esquema de dependˆencia do termo de quarta ordem A
2
B
2
segundo o princ´ıpio da
hereditariedade
Caso haja trˆes fatores principais e o modelo desejado inclua termos de ordem
at´e trˆes, o esquema de dependˆencia destas intera¸oes, segundo o princ´ıpio da hereditariedade
´e apresentado na figura 2 e a probabilidade de δ ´e dada por
P rob(δ) = P rob(δ
Int
)P rob(δ
A
)P rob(δ
B
)P rob(δ
C
) (12)
× P rob(δ
A
2
|δ
A
)P rob(δ
B
2
|δ
B
)P rob(δ
C
2
|δ
C
)
× P rob(δ
AB
|δ
A
, δ
B
)P rob(δ
AC
|δ
A
, δ
C
)P rob(δ
BC
|δ
B
, δ
C
)
× P rob(δ
A
2
B
|δ
A
2
, δ
AB
)P rob(δ
A
2
C
|δ
A
2
, δ
AC
)P rob(δ
B
2
C
|δ
B
2
, δ
BC
)
× P rob(δ
AB
2
|δ
B
2
, δ
AB
)P rob(δ
AC
2
|δ
C
2
, δ
AC
)P rob(δ
BC
2
|δ
C
2
, δ
BC
)
× P rob(δ
ABC
|δ
A
, δ
B
, δ
C
).
Uma vez definidas as distribui¸oes a priori, a estima¸ao Bayesiana das covari´aveis
selecionadas ´e realizada por meio das distribui¸oes condicionais. No caso em quest˜ao, a dis-
30
A
B C
AB
BC
AC
A
2
B
2
C
2
ABC
A
2
B
AB
2
B
2
C BC
2
AC
2
A
2
C
Figura 2 - Esquema de dependˆencia dos termos de modelos polinomiais contendo trˆes fatores
principais e intera¸oes de ordem at´e trˆes, segundo o princ´ıpio da hereditariedade
tribui¸ao conjunta ´e dada por
f(θ, y) = f(y|β, σ
2
, δ)π(β, σ
2
, δ)
= f(y|β , σ
2
, δ)π(β|σ
2
, δ)π(σ
2
|δ)π(δ)
= f(y|β , σ
2
)π(β|σ
2
, δ)π(σ
2
)π(δ). (13)
A fun¸ao de verossimilhan¸ca, por sua vez, considera que (y|β, σ
2
)
MN(Xβ, σ
2
I
n
), ou seja, uma distribui¸ao normal multivariada com esperan¸ca Xβ e matriz
de variˆancia e covariˆancias σ
2
I
n
, que tem a forma
f(y|β, σ
2
) σ
n
exp
(y Xβ)
T
(y Xβ)
2σ
2
, (14)
em que n ´e o n´umero de observoes.
A distribui¸ao a priori para β, dada em (7), pode ser escrita, alternativamente,
como a normal multivariada (β|σ
2
, δ) MN(0, σ
2
D
δ
), que tem a forma
π(β|σ
2
, δ) σ
(p+1)
exp
β
T
D
1
δ
β
2σ
2
, (15)
31
em que D
δ
´e uma matriz diagonal dada por
D
δ
= diag{(c
δ
1
1
τ
1
)
2
, ..., (c
δ
p+1
p+1
τ
p+1
)
2
}.
A distribui¸ao a priori para σ
2
, que ´e uma gama invertida dada em (8), tem a
forma
π(σ
2
) (σ
2
)
(
ν
2
+1)
exp
νλ
2σ
2
. (16)
e a distribui¸ao a priori para δ ´e uma multinomial com 2
p+1
valores, dada em (9).
A seguir ser´a visto como obter as distribui¸oes condicionais completas para β,
σ
2
e δ
j
(j = 1, ..., p + 1), por meio da equa¸ao (13).
A distribui¸ao condicional completa para β ´e calculada por meio do termos de
(13) que envolvem β, ou seja,
f(β|σ
2
, δ, y) f(y|β, σ
2
)π(β|σ
2
, δ). (17)
Como, a distribui¸ao a priori para β dada por (15) e a fun¸ao de verossimilhan¸ca
(14) seguem distribui¸oes normais multivariadas, ent˜ao a distribui¸ao condicional completa
para β tamem segue uma distribui¸ao normal multivariada dada por:
(β|σ
2
, δ, y) MN(σ
2
A
δ
X
T
y, A
δ
), (18)
sendo A
δ
= σ
2
(X
T
X + D
1
δ
)
1
e tem a forma
f(β|σ
2
, δ, y) exp
1
2σ
2
β
T
(D
1
δ
+ X
T
X)β β
T
X
T
y y
T
Xβ
. (19)
Analogamente, obt´em-se a distribui¸ao condicional completa para σ
2
deixando-se
de fora o termo π(δ) da equa¸ao (13), ou seja,
f(σ
2
|β, δ, y) f(y|β, σ
2
)π(β|σ
2
, δ)π(σ
2
). (20)
Simplificando a equa¸ao (20) tem-se que a distribui¸ao condicional completa para
σ
2
´e dada por
f(σ
2
|β, δ, y) (σ
2
)
(
n+p+1+ν
2
+1)
exp
νλ + (y Xβ)
T
(y Xβ) + β
T
D
1
δ
β
2σ
2
.
32
Logo, a distribui¸ao condicional completa para σ
2
´e uma gama invertida dada
por
(σ
2
|β, δ, y) IG
1
2
(n + p + 1 + ν),
1
2
νλ + (y Xβ)
T
(y Xβ) + β
T
D
1
δ
β
. (21)
Para a distribui¸ao condicional completa para δ, basta tirar de (13) os termos
que ao dependem de δ, ou seja, f(y|β, σ
2
) e π(σ
2
). Assim, tem-se que
f(δ|β, σ
2
, y) π(β|σ
2
, δ)π(δ). (22)
A distribui¸ao condicional completa para cada δ
j
´e uma Bernoulli com o
parˆametro a posteriori P r(δ
j
= 1|δ
j
, β, σ
2
, y). No entanto, ´e necess´ario determinar a proba-
bilidade de δ
j
= 1 e a distribui¸ao condicional completa para δ
j
= 1 tem a forma
f(δ
j
|δ
j
β, σ
2
, y) π(β|σ
2
, δ
j
, δ
j
)π(δ
j
, δ
j
), (23)
em que δ
j
= (δ
1
, δ
2
, ..., δ
j1
, δ
j+1
, ..., δ
p+1
). Ent˜ao,
P r(δ
j
= 1|δ
j
, β, σ
2
, y) =
=
π(β|δ
j
= 1, δ
j
, σ
2
)π(δ
j
= 1, δ
j
)
π(β|δ
j
= 1, δ
j
, σ
2
)π(δ
j
= 1, δ
j
) + π(β|δ
j
= 0, δ
j
, σ
2
)π(δ
j
= 0, δ
j
)
=
π(δ
j
= 1, δ
j
)
π(δ
j
= 1, δ
j
) + π(δ
j
= 0, δ
j
)π(β|δ
j
= 0, δ
j
, σ
2
)(β|δ
j
= 1, δ
j
, σ
2
)
.
(24)
Conclu´ıdas as distribui¸oes condicionais completas ´e preciso fazer a estima¸ao
do vetor de parˆametros θ.
Nota-se que a distribui¸ao a posteriori dada em (13) ao ´e conhecida.
Logo, ao utilizadas as distribui¸oes condicionais completas para realizar uma amostragem
para cada parˆametro e assim estim´a-los. Para isso, utiliza-se a t´ecnica MCMC
(Markov Chain Monte Carlo), mas como as distribui¸oes condicionais completas ao conhe-
cidas pode-se utilizar uma t´ecnica mais simples de MCMC chamada amostrador de Gibbs,
descrita por Gelman et al. (1995).
Neste trabalho, θ = (β
0
, β
1
, ..., β
p
, σ
2
, δ
1
, δ
2
, ..., δ
p+1
)
T
e a implementa¸ao do
amostrador de Gibbs resulta em uma amostra para cada parˆametro.
33
O procedimento ´e iniciado por meio de uma escolha arbitr´aria θ
0
para o vetor
de parˆametros θ, que ´e renovado obtendo-se θ
1
. Para essa renovao, o vetor β ´e renovado
automaticamente, mas, no caso do vetor δ, ´e necess´ario renovar cada um de seus elementos
(δ
j
, j = 1, ..., p + 1), um de cada vez, conforme ilustrado em (25).
β
1
f(β
1
|β
0
, (σ
2
)
0
, δ
0
, y)
(σ
2
)
1
f((σ
2
)
1
|β
1
, (σ
2
)
0
, δ
0
, y)
δ
1
1
f(δ
1
1
|β
1
, (σ
2
)
1
, δ
0
, y)
δ
1
2
f(δ
1
2
|β
1
, (σ
2
)
1
, δ
1
1
, δ
0
(1)
, y) (25)
δ
1
3
f(δ
1
3
|β
1
, (σ
2
)
1
, δ
1
1
, δ
1
2
, δ
0
(1,2)
, y)
.
.
.
δ
1
p+1
f(δ
1
p+1
|β
1
, (σ
2
)
1
, δ
1
(p1)
, δ
0
p+1
, y).
Esta renovao, na pr´atica, ´e feita longa o suficiente (θ
m
), at´e que os parˆametros
convirjam.
Para implementar este procedimento, no entanto, deve-se especificar os hiper-
parˆametros τ e c da priori de mistura de normais (7) e (19) para β, e ν e λ da priori para σ
2
que
tem distribui¸ao gama invertida dada em (20). Deve-se, ainda especificar os hiperparˆametros
p
00
, p
01
, p
10
e p
11
adotados em (11) para especifica¸ao da priori para δ.
Box e Meyer (1986) aconselham usar c
j
= 10, pois indica um grande efeito para
os β
j
dado δ
j
= 1.
Para a escolha de τ
j
, por sua vez, George e McCulloch (1993), sugerem utilizar
τ
j
= τ
j
, em que τ
j
´e dado por
τ
j
=
y
3∆x
j
, (26)
(j = 1, ..., p + 1) em que y representa uma pequena mudan¸ca na vari´avel resposta y e x
j
uma grande mudan¸ca em x
j
. Isto ´e feito porque se δ
j
= 0, ent˜ao uma grande mudan¸ca em x
j
´e improv´avel de acarretar mais do que uma pequena mudan¸ca em y. Os autores definem x
j
e y como
x
j
= m´ax(x
j1
, x
j2
, x
j3
, ..., x
jn
) m´ın(x
j1
, x
j2
, x
j3
, ..., x
jn
) (27)
34
e
y =
V ar(y
1
, y
2
, y
3
, ..., y
n
)
5
. (28)
Deve-se salientar que a escolha de τ pode influenciar diretamente nos resultados,
e consequentemente, na escolha de um bom modelo. Uma maneira de verificar se a essa
influˆencia, ´e atribuir a τ, trˆes valores diferentes dados por
τ
2
, τ
e 2τ
(GEORGE; MCCUL-
LOCH, 1993).
Considere, agora, a escolhas dos hiperparˆametros ν e λ. Quando o n´umero
de covari´aveis ´e pr´oximo ao umero de observoes, a priori para σ resulta em um valor
muito pequeno para σ resultando em muitos termos considerados ativos no modelo. Uma
maneira de corrigir esta deficiˆencia ´e escolhendo uma priori informativa para σ. A escolha de
ν ´e frequentemente pr´oxima de 2, indicando uma priori ao informativa. Para λ, a escolha
depende de experimento para experimento uma vez que depende da escala da vari´avel resposta.
Assim uma boa afina¸ao para λ resulta em modelos que ao em muitos e nem poucos termos.
Conem salientar que estes hiperparˆametros tˆem que ser escolhidos e afinados de maneira
correta, pois podem influenciar nas conclus˜oes das an´alises.
Quanto `a escolha das constantes que refletem a intensidade da hereditariedade,
Chipman, Hamada e Wu (1997), consideram empiricamente que, para uma hereditariedade
fraca, p
00
´e bastante pequena, isto ´e, menor do que p
10
= p
01
= 0, 1 e p
11
= 0, 25. Para
uma hereditariedade fraca rigorosa, sugerem p
00
= 0 e para a hereditariedade forte a intera¸ao
somente ser´a significativa se ambos os termos que os formam forem significativos, sugerindo
p
00
= p
10
= p
01
= 0 e p
11
= 0, 25. Resumidamente, tais constantes ao apresentadas na
tabela 5. A escolhas dessas probabilidades pelos autores foram feitas de modo a considerar
que na priori para δ sejam inclu´ıdos os princ´ıpios apresentados anteriormente, ou seja, de
modo que: (i) o n´umero de termos importantes em um experimento fatorial seja pequeno;
(ii) os efeitos de ordem menor em maior chance de serem importantes e (iii) caso um efeito
principal seja significativo, as probabilidades de as intera¸oes que incluem este efeito principal
sejam significativas aumenta.
Assim as distribui¸oes condicionais completas e seus hiperparˆametros est˜ao con-
clu´ıdos.
Conem ressaltar que ao optar pela hereditariedade forte, p
10
= p
01
= 0, e a
35
priori π(δ
j
= 0, δ
j
) ser´a, consequentemente, igual a 0 para os efeitos principais. Com isso o
denominador da equa¸ao (24) fica igual ao numerador, fazendo com que a probabilidade dos
efeitos principais sejam iguais a 1. Assim, quando se utiliza hereditariedade forte a distribui¸ao
condicional completa para δ
j
apresentada na equa¸ao (24) tem, para todos os fatores principais,
probabilidades iguais a 1, e os fatores principais sempre ser˜ao considerados no modelo. No
entanto, segundo o princ´ıpio da hereditariedade, caso uma intera¸ao seja significativa, ao menos
um dos efeitos principais deve ser significativo e ao que todos os efeitos principais sejam
necessariamente significativos ou que todos os efeitos principais devam estar no modelo. De
modo a corrigir esse problema na especifica¸ao da priori, prop˜oem-se para a hereditariedade
forte, denominada nova hereditariedade forte, utilizar, p
01
= p
10
= 0, 05, ou seja,
P rob(δ
AB
|δ
A
, δ
B
) =
0 se δ
A
= δ
B
= 0
0, 05 se δ
A
= δ
B
0, 25 se δ
A
= δ
B
= 1
. (29)
Tabela 5 - Sugest˜oes de valores para os hiperparˆametros p
00
, p
01
, p
10
e p
11
da distribui¸ao a
priori de δ propostos por Chipman, Hamada e Wu (1997) e novos valores propostos
neste trabalho (
) para uma hereditariedade forte
Hereditariedade p
1
= · · · = p
p+1
p
00
p
01
= p
10
p
11
Fraca 0,25 0 < p
00
< 0, 1 0,1 0,25
Fraca-rigorosa 0,25 0 0,1 0,25
Forte(
) 0,25 0 0,05 0,25
Forte 0,25 0 0 0,25
Afim de evidenciar a importˆancia da escolha dos hiperparˆametros da priori para
δ, considere o modelo polinomial com k = 3 fatores e intera¸oes duplas, dado por
y = β
0
+ β
1
x
1
+ β
2
x
2
+ β
3
x
3
+ β
12
x
1
x
2
+ β
13
x
1
x
3
+ β
23
x
2
x
3
+ e. (30)
A tabela 6 apresenta a probabilidade que cada termo do modelo vai ter para as
diferentes hereditariedade usadas, o n´umero de modelos poss´ıveis e o ´ındice de diversidade H
36
Tabela 6 - Probabilidades a priori de cada coeficiente do modelo 30 ser importante de acordo
com a intensidade da hereditariedade, cujos hiperparˆametros ao apresentados na
Tabela 5; N´umeros k de poss´ıveis modelos e ´ındice de diversidade H dos poss´ıveis
modelos
Hereditariedade
Coeficiente Fraca Fra. Rigorosa Forte* Forte
β
0
0,250 0,250 0,250 0,250
β
1
0,250 0,250 0,250 0,250
β
2
0,250 0,250 0,250 0,250
β
3
0,250 0,250 0,250 0,250
β
12
0,059 0,053 0,034 0,016
β
13
0,059 0,053 0,034 0,016
β
23
0,059 0,053 0,034 0,016
k 128 90 90 36
H 2,815 2,720 2,587 2,355
37
Figura 3 - Probabilidades a priori dos 14 modelos mais proaveis de acordo com a intensidade
da hereditaridedade
38
e na figura 3 ao apresentados os 14 modelos mais proaveis para as diferentes probabilidades
usadas.
Na tabela 6 pode-se notar que as escolhas dos valores para os hiperparˆametros
da priori δ apresentadas na tabela 5 fazem com que as probabilidade de os parˆametros (ou
efeitos) serem importantes ou ativos seja sempre menor ou igual a 0, 25 expressando deste
modo, o princ´ıpio dos efeitos esparsos. Nota-se, ainda que os efeitos principais em sempre
probabilidades superiores aos dos efeitos de intera¸oes duplas, expressando, por sua vez, o
princ´ıpio da hierarquia. Finalmente, por meio da compara¸ao dos gr´aficos da figura 3, nota-se
que, com o aumento da intensidade da hereditariedade, a presen¸ca de efeitos de intera¸ao dupla
traz, como consequˆencia a presen¸ca de seus efeitos principais formadores, que ´e a essˆencia do
princ´ıpio da hereditariedade.
Uma vez especificada as prioris e obtidas as amostras para cada parˆametro ´e
necess´ario obter os valores centrais das distribui¸oes de cada um deles. Para os parˆametros de
β utilizou-se a m´edia e para σ, utilizou-se a mediana, uma vez que sua distribui¸ao condicional
completa ´e uma gama invertida. No entanto, com rela¸ao `a δ
j
, ser´a usado o vetor δ que indica
cada modelo, assim, a moda dos vetores ´e que indica qual dos modelos deve-se usar.
39
4 RESULTADOS E DISCUSS
˜
AO
Tanto para a an´alise dos dados da tabela 3 como para os dados de biofilme
de amido de ervilha apresentados na tabela 4, foram utilizados os hiperparˆametros c = 10,
ν = 2, 2, λ = 0, 015 e os demais apresentados na tabela 5, tomando-se, para a hereditariedade
fraca, p
00
= 0, 01.
Para o primeiro conjunto de dados, x
j
= 2 e y =
107,4115
5
= 2, 0728. Assim,
utilizando-se a equa¸ao (26), chega-se a τ
j
= τ
= 0, 3454 (j = 1, 2, 3).
Para o segundo conjunto de dados, x
j
= 2 e y =
37,9498
5
= 1, 2321 e,
analogamente, chega-se a τ
j
= τ
= 0, 2053 (j = 1, 2, 3).
Para avaliar a influˆencia de τ sobre a inferˆencia de δ, escolheu-se segundo a
orienta¸ao de Chipman, Hamada e Wu (1997), τ =
τ
2
, τ = τ
e τ = 2τ
.
O algoritmo de Gibbs, por sua vez, ´e iniciado com todos o termos ativos, ou seja,
o vetor δ com todos os elementos iguais a 1, sendo geradas 50000 amostras de θ, descartando
as 1000 primeiras amostras (“burn in = 1000) e armazenam-se somente uma a cada dez
amostras sequencialmente (“thin” = 10).
4.1 Dados Simulados
A figura 4 apresenta os gr´aficos dos ´ındices de diversidade (H) dos modelos a
posteriori em fun¸ao do valor do hiperparˆametro τ , segundo a intensidade da hereditariedade.
Nesta figura, nota-se claramente que o aumento do valor de τ, assim como o aumento da
intensidade da hereditariedade, acarretaram, neste caso, uma diminui¸ao na diversidade dos
modelos. Essa diminui¸ao fica mais evidente quando se altera o valor de τ de
τ
2
para τ
ou
quando se passa da hereditariedade forte proposta neste trabalho para a forte proposta por
Chipman, Hamada e Wu (1997). A diminui¸ao acarretada pelo aumento da intensidade da
hereditariedade a era esperada uma vez que esse aumento implica na elimina¸ao de diversos
modelos.
A tabela 7 exibe os modelos mais proaveis a partir da amostragem da posteriori
de δ e suas respectivas probabilidades, os n´umeros de modelos a posteriori e os ´ındices H de
diversidade de Shannon. Nesta, pode-se notar que o n´umero de diferentes modelos a posteriori
permanece igual a 16, mesmo com a altera¸ao do hiperparˆametro τ , considerando-se a here-
40
Figura 4 -
´
Indice H de diversidade dos modelos a posteriori segundo o valor do hiperparˆametro
τ e da intensidade da hereditariedade: fraca, fraca rigorosa, forte proposta por
Chipman, Hamada e Wu (1997) e forte proposta neste trabalho (forte*)
41
ditariedade forte. No entanto, o aumento de τ acarreta uma maior concentra¸ao em certos
modelos que fica evidenciada pelo menor valor do ´ındice de diversidade de Shannon.
Observando-se os modelos mais proaveis, cujas probabilidades a posteriori ao
apresentadas em negrito na tabela 7 e representado na figura 5, nota-se que para τ =
τ
2
,
independente da intensidade da hereditariedade, o modelo mais proavel ´e
y = β
0
+ β
1
x
1
+ β
2
x
2
+ β
3
x
3
+ β
12
x
1
x
2
. (31)
Para τ = τ
ou τ = 2τ
e hereditariedades fraca ou fraca rigorosa houve a
exclus˜ao de β
3
(ou termo C) e a inclus˜ao de β
23
(ou termo BC) gerando o modelo:
y = β
0
+ β
1
x
1
+ β
2
x
2
+ β
12
x
1
x
2
+ β
23
x
2
x
3
, (32)
que ´e o modelo de equa¸ao (5) a partir da qual foram gerados os dados originais da tabela 3.
Note que, no entanto, pelo princ´ıpio da hereditariedade, com a inclus˜ao do termo BC (ou do
parˆametro β
23
), al´em do termo B (ou parˆametro β
2
) a presente no modelo, tamb´em deveria
estar presente o termo C (ou parˆametro β
3
). Este fato acaba por acontecer quando se aumenta
a intensidade da hereditariedade para forte, gerando o modelo:
y = β
0
+ β
1
x
1
+ β
2
x
2
+ β
3
x
3
+ β
12
x
1
x
2
+ β
23
x
2
x
3
. (33)
A tabela 7 revela, ainda, que para a hereditariedade forte proposta por Chipman,
Hamada e Wu (1997), todos os modelos que ao apresentam todos os efeitos principais A,B
e C, em probabilidade nula, comprovando o problema ressaltado na metodologia. Por outro
lado, quando se utiliza a hereditariedade forte proposta aqui, tal problema ao ocorre.
A tabela 8 e figura 6 apresentam, por sua vez, as probabilidades a posteriori
de cada um dos termos do modelo completo ser ativo segundo o valor de τ e a intensidade
da hereditariedade. Nesta, as probabilidades a posteriori iguais a 1 para os efeitos principais
A, B e C considerando-se a hereditariedade forte de Chipman, Hamada e Wu (1997) revelam
que, neste caso, todos os modelos apresentam todos os efeitos principais, problema tamb´em
evidenciado pela metodologia e solucionada por meio da hereditariedade forte proposta neste
trabalho.
Do exposto at´e aqui, ressalta-se que a ado¸ao de τ = τ
, conforme sugerido por
George e McCulloch (1993), fez com que as diferentes intensidades de hereditariedade tivessem
42
Tabela 7 - Probabilidades a posteriori de alguns modelos mais proaveis considerando-se di-
ferentes valores de τ, hereditariedades fraca, fraca rigorosa (fr. rig.)e forte pro-
postas por Chipman, Hamada e Wu (1997) e forte proposta neste trabalho (forte*),
n´umeros de diferentes modelos (k) e ´ındices de diversidade de Shannon (H). Em
negrito ao ressaltads os modelos mais proaveis para cada valor de τ e cada in-
tensidade de hereditariedade
τ =
τ
2
τ = τ
τ = 2τ
Modelo fraca fr.rig. forte* forte fraca fr.rig. forte* forte fraca fr.rig. forte* forte
1 - A,B 0,045 0,049 0,020 0 0,058 0,058 0,027 0 0,063 0,076 0,029 0
2 - A,B,C 0,060 0,059 0,105 0,142 0,052 0,057 0,094 0,144 0,048 0,051 0,097 0,126
3 - Int,A,B,C 0,061 0,064 0,106 0,142 0,042 0,041 0,084 0,106 0,031 0,033 0,069 0,094
4 - Int,A,B,AB 0,080 0,078 0,032 0 0,102 0,109 0,051 0 0,100 0,101 0,049 0
5 - A,B,C,AB 0,021 0,024 0,042 0,048 0,013 0,014 0,021 0,032 0,007 0,012 0,015 0,026
6 - Int,A,B,C,AB 0,109 0,128 0,189 0,248 0,104 0,105 0,185 0,244 0,075 0,078 0,147 0,212
7 - Int,A,B,AB,BC 0,043 0,055 0,022 0 0,112 0,124 0,049 0 0,161 0,177 0,084 0
8 - Int,A,B,C,AB,BC 0,079 0,083 0,129 0,150 0,107 0,120 0,225 0,294 0,133 0,145 0,269 0,401
9 - Int,A,B,C,AB,AC,BC 0,018 0,016 0,027 0,035 0,015 0,021 0,029 0,048 0,016 0,016 0,032 0,047
k 100 64 59 16 96 62 58 16 89 56 56 16
H 0,579 0,559 0,520 0,450 0,548 0,531 0,498 0,422 0,537 0,512 0,490 0,401
43
Figura 5 - Probabilidades a posteriori de alguns modelos mais proaveis considerando-se dife-
rentes valores de τ, hereditariedades fraca, fraca rigorosa (fr. rig.) e forte proposta
por Chipman, Hamada e Wu (1997) e forte proposta neste trabalho (forte*) , em
que os n´umeros de 1 a 9 correspondem aos modelos descritos na tabela 7
44
Tabela 8 - Probabilidades a posteriori dos termos considerados no modelo serem ativos,
considerando-se diferentes valores de τ e hereditariedades fraca, fraca rigorosa
(fr.rig.) e forte propostas por Chipman, Hamada e Wu (1997) e forte proposta
neste trabalho (forte*)
τ =
τ
2
τ = τ
τ = 2τ
Termo Parˆametro fraca fr.rig. forte* forte fraca fr.rig. forte* forte fraca fr.rig. forte* forte
Intercepto β
0
0,649 0,643 0,696 0,696 0,663 0,679 0,717 0,780 0,672 0,690 0,764 0,802
A β
1
0,880 0,904 0,958 1 0,884 0,914 0,957 1 0,879 0,912 0,962 1
B β
2
0,905 0,917 0,970 1 0,900 0,929 0,969 1 0,897 0,930 0,965 1
C β
3
0,634 0,674 0,860 1 0,549 0,556 0,805 1 0,498 0,518 0,769 1
AB β
12
0,517 0,510 0,555 0,563 0,565 0,579 0,618 0,780 0,582 0,610 0,669 0,714
AC β
13
0,184 0,185 0,181 0,184 0,125 0,124 0,116 0,127 0,100 0,101 0,096 0,099
BC β
23
0,284 0,285 0,298 0,303 0,343 0,341 0,361 0,396 0,384 0,415 0,452 0,492
45
Figura 6 - Probabilidades a posteriori dos termos considerados no modelo serem ativos,
considerando-se diferentes valores de τ e hereditariedade fraca, fraca rigorosa
(fr.rig.) e forte proposta por Chipman, Hamada e Wu (1997) e forte proposta
neste trabalho (forte*)
46
efeito sobre a escolha do modelos sem haver uma diminui¸ao consider´avel da diversidade dos
poss´ıveis modelos, como desejado.
Uma vez adotado o valor de τ = τ
, ´e apresentada, a seguir, a estima¸ao dos
parˆametros considerando-se as diferentes intensidades da hereditariedade.
A figura 7 mostra as densidades ao param´etricas dos valores simulados a pos-
teriori de β e σ, em que foram descartadas as mil primeiras itera¸oes (burn-in = 1000)
armazenando-se em seguida, os valores correspondentes `as itera¸oes de dez em dez (thin = 10).
Nota-se nesta figura que as densidades dos parˆametros quase ao se alteram em fun¸ao das
diferentes intensidades da hereditariedade. Al´em disso, os intervalos de 90% de credibilidade
incluem o valor zero para os parˆametros β
3
, β
13
e β
23
e ao incluem o zero para os parˆametros
β
0
, β
1
, β
2
e β
12
, o que poderia sugerir o modelo y = β
0
+β
1
x
1
+β
2
x
2
+β
12
x
1
x
2
. A inclus˜ao even-
tual de alguns dos demais parˆametros no modelos final se faz no entanto, devido `a utiliza¸ao
do princ´ıpio da hereditariedade.
Na tabela 9 ao apresentados as estimativas Bayesianas dadas pela m´edia dos
valores a posteriori para β
j
e pela mediana dos valores de σ.
Tabela 9 - Estimativas dos parˆametros do modelo considerando-se τ = τ
e hereditariedades
fraca, fraca rigorosa (fr. rig.) e forte propostas por Chipman, Hamada e Wu (1997)
e forte proposta neste trabalho (forte*)
Hereditariedade
Termo Parˆametro fraca fr. rig. forte* forte
Intercepto β
0
7,586 7,689 7,849 8,100
A β
1
4,922 5,063 5,173 5,261
B β
2
5,685 5,713 5,822 5,885
C β
3
0,316 0,249 0,369 0,368
AB β
12
3,787 3,812 3,854 3,989
AC β
13
-0,001 0,056 0,061 0,082
BC β
23
1,636 1,596 1,623 1,665
σ 4,853 4,779 4,178 3,682
47
Figura 7 - Densidades a posteriori dos parˆametros, para an´alise do dados simulados,
considerando-se as hereditariedades fraca, fraca rigorosa e forte proposta por Chip-
man, Hamada e Wu (1997) e forte proposta neste trabalho e o intervalo de 90% de
credibilidade (HPD)
48
Na figura 8 ao apresentadas as cadeias de valores simulados a posteriori a com
o burn-in e thin aplicados, que revelam as aparentes convergˆencias das eries comprovadas
por meio dos procedimentos de Geweke (1992) e Raftery e Lewis (1992), cujas estat´ısticas
ao apresentadas nas tabelas 10 e 11. Tais conclus˜oes foram obtidas pois, segundo o crit´erio
de Geweke, todos os valoresda estat´ıstica Z pertencem ao intervalo [1, 96; 1, 96]. Segundo o
crit´erio de Raftery e Lewis (1992), por sua vez, todos os fatores de dependˆencia (FD) est˜ao
menores que cinco.
Tabela 10 - Estat´ıstica (Z) para o teste de convergˆencia de Geweke (1992) considerando-se
τ = τ e a hereditariedade fraca, fraca rigorosa (fr. rig.) e forte proposta por
Chipman, Hamada e Wu (1997) e forte proposta neste trabalho (forte*),
Hereditariedade
Termo Parˆametro fraca fr. rig. forte* forte
Intercepto β
0
-0,89 0,35 -0,43 -0,73
A β
1
-0,70 -0,67 -0,50 0,82
B β
2
0,28 -0,46 -0,95 0,98
C β
3
0,49 1,06 0,33 0,04
AB β
12
-0,61 0,11 1,12 -0,35
AC β
13
-0.90 -1,89 -1,11 1,12
BC β
23
-0,94 -0,93 0,71 -0,36
σ 0,84 0,59 0,71 1,47
4.2 Dados de biofilme
Na figura 9 ´e apresentado o gr´afico dos ´ındices de diversidade (H) dos modelos a
posteriori em fun¸ao do valor do hiperparˆametro τ , segundo a intensidade da hereditariedade.
Nesta figura ve-se que, independente da intensidade da hereditariedade, a utiliza¸ao de τ = τ
leva a uma menos diversidade dos modelos a posteriori. Al´em disso, o aumento da intensidade
da hereditariedade leva a uma menor diversidade de modelos a posteriori como era o esperado
pois esse aumento acarreta a elimina¸ao de certos modelos como fica tamb´em evidenciado da
49
Figura 8 - Cadeias de parˆametros, para a analise dos dados simulados, considerando-se as
hereditariedades fraca, fraca rigorosa e forte proposta por Chipman, Hamada e
Wu(1997) e forte proposta neste trabalho
50
Tabela 11 - Estat´ısticas (FD) para o teste de convergˆencia de Raftery e Lewis (1992)
considerando-se τ = τ e hereditariedades fraca, fraca rigorosa (fr. rig.) e forte
proposta por Chipman, Hamada e Wu (1997) e forte proposta neste trabalho
(forte*)
Hereditariedade
Termos Parˆametros fraca fr. rig. forte* forte
Intercepto β
0
1,00 1,09 2,21 2,34
A β
1
1,00 2,05 1,02 1,04
B β
2
1,07 1,02 1,07 1,11
C β
3
1,09 1,15 1,13 1,07
AB β
12
1,02 1,15 1,09 1,06
AC β
13
1,09 1,13 1,05 1,04
BC β
23
1,05 1,07 1,03 1,09
σ 1,07 1,13 1,06 1,07
diminui¸ao dos valores de k, apresentados na tabela 12.
A tabela 12 e figura 10 mostra, dentre outras informa¸oes, as probabilidades
dos modelos a posteriori mais prov´aveis quando ao usados diferentes valores de τ , e dife-
rentes intensidades da hereditariedade. Nesta fica evidente a influˆencia da hereditariedade
especialmente quando se considera τ = 2τ
, pois, neste caso, para as hereditariedades fraca e
fraca rigorosa o parˆametro β
1
(ou termo Am) ao est´a inclu´ıdo nos modelos com maior pro-
babilidade, o que acontece quando se adota a hereditariedade forte proposta neste trabalho.
No entanto, quando se usa τ = τ
, o modelo 6 apresentou, para todas as hereditariedades,
maior probabilidade, embora, ainda assim, possa se observar a diminui¸ao da probabilidade
do modelo 5 e o aumento da probabilidade do modelo 6 com o aumento da intensidade da
hereditariedade, o que evidencia a influˆencia de tal princ´ıpio.
Concluindo, quando se usa τ = τ
, valor recomendado por George e McCulloch
(1993), independente da intensidade da hereditariedade, chega-se ao modelo de equa¸ao
y = β
0
+ β
1
x
1
+ β
2
x
2
+ β
3
x
3
+ β
12
x
1
x
2
+ β
13
x
1
x
3
, (34)
51
Figura 9 -
´
Indice H de diversidade dos modelos a posteriori, para os dados de biofilme, se-
gundo o valor do hiperparˆametro τ e a intensidade da hereditariedade: fraca, fraca
rigorosa ou forte proposta neste trabalho (forte*)
52
Tabela 12 - Probabilidades a posteriori de alguns modelos mais proaveis, para o experimento
do Biofilme, considerando-se diferentes valores de τ, hereditariedade fraca, fraca
rigorosa (fr. rig.) e forte proposta neste trabalho (forte*), n´umeros de diferentes
modelos (k) e ´ındices de diversidade de Shannon (H), ressaltando-se, em negrito,
o modelo mais prov´avel em cada uma das situa¸oes
τ =
τ
2
τ = τ
τ = 2τ
Modelo fraca fr.rig. forte(*) fraca fr.rig. forte(*) fraca fr.rig. forte(*)
1 - Int,Am,Go,Gli 0,118 0,129 0,122 0,104 0,109 0,150 0,088 0,096 0,171
2 - Int,Am,Go,Gli,Am×Gli 0,088 0,092 0,097 0,062 0,061 0,195 0,039 0,048 0,084
3 - Int,Am,Go,Gli,Am×Go 0,087 0,088 0,086 0,055 0,053 0,097 0,042 0,044 0,082
4 - Int,Am,Go,Gli,Go×Gli 0,050 0,053 0,049 0,023 0,026 0,039 0,013 0,012 0,026
5 - Int,Go,Gli,Am×Go,Am×Gli 0,046 0,048 0,052 0,131 0,128 0,049 0,108 0,118 0,055
6 - Int,Am,Go,Gli,Am×Go,Am×Gli 0,131 0,122 0,129 0,186 0,185 0,274 0,104 0,103 0,196
7 - Int,Am,Go,Gli,Am×Go,Am×Gli,Go×Gli 0,048 0,052 0,054 0,057 0,051 0,089 0,026 0,021 0,041
k 82 62 59 81 62 54 97 61 55
H 0,543 0,534 0,531 0,521 0,516 0,472 0,561 0,541 0,506
53
Figura 10 - Probabilidades a posteriori de alguns modelos mais prov´aveis, para os dados de
biofilme, considerando-se diferentes valores de τ, hereditariedades fraca, fraca
rigorosa (fr. rig.) e forte proposta neste trabalho (forte*), em que os n´umeros de
1 a 7 representam os modelos descritos na tabela 12
54
que inclui todos os efeitos principais formadores dos efeitos de intera¸ao dupla.
A tabela 13 e figura 11 apresentam as probabilidades a posteriori de cada termo
ser ativo no modelo, para as diferentes hereditariedade e valores de τ. Nestas pode-se ver que
o termo Gli (Glicose) apresenta a maior probabilidade de ser ativo independente da heredita-
riedade ou valor de τ adotados. Como era de se esperar, com o aumento da intensidade da
hereditariedade, os termos principais em suas probabilidades de serem ativos aumentadas, o
que ´e mais facilmente notado para o termo Am (Amido).
Conforme sugerido por George e McCulloch (1993), a estima¸ao dos parˆametros
mostrada a seguir, considera as diferentes hereditariedades e apenas para o valor de τ = τ
.
Na figura 12 ao apresentadas as cadeias dos valores de β e σ simulados para a
an´alise dos dados de biofilme do amido de ervilha. Considerando-se o descarte das primeiras
mil amostras (burn-in) e valores das itera¸oes tomados de dez em dez (thin). Nesta tˆem-se que
todas as s´eries dos parˆametros, aparentemente, convergiram, o que ´e comprovado por meio dos
teste de Geweke (1992) e Raftery e Lewis (1992) cujos resultados ao apresentados na tabelas
14 e 15. Esta conclus˜ao foi obtida pois todos os valores da estat´ıstica do teste de Geweke
(1992) pertencem ao intervalo [1, 96; 1, 96] e os relativos `a do teste de Raftery e Lewis (1992)
ao menores do que cinco.
Na figura 13 ao apresentados as densidades ao param´etricas a posteriori dos
parˆametros β e σ e respectivos intervalos de 90% de credibilidade. Como nas densidades a
posteriori dos parˆametros para os dados simulados, as densidades pouco se alteraram com
a altera¸ao da intensidade da hereditariedade o que se reflete nas pequenas altera¸oes das
estimativas Bayesianas dos parˆametros apresentadas na tabela 16
Observa-se, ainda, a pequena magnitude em valor absoluto, das estimativas dos
parˆametros β
1
e β
23
pertencentes aos intervalos de 90% de credibilidade apresetados na figura
13
Mais uma vez, a inclus˜ao ou ao de um termo no modelo leva em considera¸ao
a intensidade da hereditariedade, como seria desejado.
Como considera¸oes adicionais, tem-se que, mesmo para situa¸oes em que a
mais parˆametros do que observoes, a metodologia poderia ser naturalmente utilizada sem
quaisquer altera¸oes.
55
Tabela 13 - Probabilidades a posteriori dos termos considerados no modelo serem ativos, para
os dados de biofilme, considerando-se diferentes valores de τ e hereditariedades
fraca, fraca rigorosa (fr.rig.) e forte proposta neste trabalho (forte*)
τ =
τ
2
τ = τ
τ = 2τ
Termo Parˆametro fraca fr.rig. forte(*) fraca fr.rig. forte(*) fraca fr.rig. forte(*)
Intercepto β
0
0,956 0,951 0,957 0,954 0,965 0,963 0,808 0,820 0,831
Am β
1
0,779 0,793 0,926 0,657 0,657 0,875 0,565 0,580 0,812
Go β
2
0,859 0,867 0,954 0,875 0,901 0,959 0,823 0,857 0,932
Gli β
3
0,970 0,971 0,987 0,973 0,981 0,992 0,951 0,965 0,986
Am×Go β
12
0,485 0,492 0,503 0,553 0,570 0,596 0,425 0,438 0,459
Am×Gli β
13
0,493 0,477 0,501 0,572 0,569 0,607 0,437 0,448 0,470
Go×Gli β
23
0,286 0,289 0,285 0,213 0,220 0,214 0,137 0,142 0,137
56
Figura 11 - Probabilidades a posteriori dos termos considerados no modelo serem ativos, para
os dados de biofilme, considerando-se diferentes valores de τ e hereditariedades
fraca, fraca rigorosa (fr.rig.) e forte proposta neste trabalho (forte*), descritos na
tabela 13
57
Figura 12 - Cadeias de parˆametros para a an´alise dos dados de biofilme, considerando-se as
hereditariedades fraca, fraca rigorosa e forte proposta neste trabalho
58
Tabela 14 - Estat´ıstica (Z) para o teste de convergˆencia de Geweke (1992), para o experimento
do biofilme, considerando-se τ = τ e a hereditariedades fraca, fraca rigorosa (fr.
rig.) e forte proposta neste trabalho (forte*)
Hereditariedade
Termos Parˆametros fraca fr. rig. forte*
Intercepto β
0
-1,36 0,51 1,69
A β
1
-0,08 -1,06 0,14
B β
2
-0,27 0,37 0,36
C β
3
0,92 -0,32 -1,19
AB β
12
0,56 0,47 -0,13
AC β
13
0,88 0,06 -0,82
BC β
23
-1,31 -0,77 -1,37
σ 0,66 -1,67 -1,80
Tabela 15 - Estat´ıstica (FD) para o teste de convergˆencia de Raftery e Lewis (1992), para
os dados de biofilme, considerando-se τ = τ e as hereditariedades fraca, fraca
rigorosa (fr. rig.) e forte proposta neste trabalho (forte*)
Hereditariedade
Termos Parˆametros fraca fr. rig. forte*
Intercepto β
0
1,93 2,31 2,27
A β
1
1,00 1,02 1,09
B β
2
1,05 1,00 0,99
C β
3
1,00 1,09 1,00
AB β
12
1,02 0,98 1,02
AC β
13
1,02 0,97 1,15
BC β
23
1,00 1,03 1,02
σ 1,02 1,00 0,98
59
Figura 13 - Densidades a posteriori dos parˆametros, para a an´alise dos dados de Biofilme,
para as hereditariedades fraca, fraca rigorosa e forte proposta neste trabalho e o
intervalo de 90% de credibilidade (HPD)
60
Tabela 16 - Estimativas dos parˆametros do modelo, para os dados de biofilme, considerando-
se τ = τ e as hereditariedades fraca, fraca rigorosa (fr. rig.) e forte proposta
neste trabalho (forte*)
Hereditariedade
Termos Parˆametros fraca fr. rig. forte*
Intercepto β
0
7,1651 7,2262 7,1824
A β
1
0,8147 0,8264 0,8863
B β
2
2,9436 2,9847 3,1816
C β
3
5,7348 5,7274 5,8995
AB β
12
2,2229 2,2574 2,3762
AC β
13
2,2609 2,2533 2,4494
BC β
23
-0,0519 -0,0394 -0,0932
σ 4,0968 4,0262 3,8879
61
5 CONCLUS
˜
OES
O etodo utilizado apresentou ser muito pr´atico, pois estima os parˆametros ao
mesmo tempo que ´e selecionado o modelos utilizando os princ´ıpios da hereditariedade, hierar-
quia e efeito esparso. Por´em a especifica¸ao dos hiperparˆametros da priori para δ, sugerida por
Chipman, Hamada e Wu (1997), apresentou problemas quando se considera a hereditariedade
forte, e a altera¸ao, para estes hiperparˆametros, proposta neste trabalho corrige os problemas
apresentados.
62
63
REFER
ˆ
ENCIAS
ALBERT, J.; Bayesian Computation with R. New York: Springer, 2007. 267 p.
BARBIN, D. Planejamento e An´alise Estat´ıstica de Experimento Agronˆomicos. Arapongas:
Midas , 2003. 208 p.
SMITH, B. J. BOA: Bayesian Output Analysis Program for MCMC. URL. Dispon´ıvel em:
<http://www.public-health.uiowa.edu/boa>. Acesso em: 16 maio 2009.
BOX, G. E. P.; MEYER, R. D. An Analysis for Unreplicated Fractional Factorials. Technometrics,
New York, v. 28, n. 1, p. 11-18, 1986.
BOX, G. E. P.; TIAO, R. D. Bayesian inference in statistical analysis. New York: John Wiley,
1992. 588 p.
CHIPMAN, H. Bayesian Variable Selection with Related Predictors. Canadian Journal of Statis-
tics, Vancouver, v. 24, p. 17-36, 1996.
CHIPMAN, H.; HAMADA, M.; WU, C. F. J. A Bayesian Variable-Selection Aproach for Analyzing
Designed Experiments with Complex Aliasing. Technometrics, New York, v. 39, n. 4, p. 372-381,
1997.
GELMAN, A.; CARLIN, J. B.; STERN, H. S.; RUBIN, D. B. Bayesian Data Analysis. London:
Chapman & Hall, 1995. 526 p.
GEORGE, E. I.; MCCULLOCH, R. E. Variable Selection Via Gibbs Sampling. Journal of the
American Statistical Association, Boston, v. 88, n. 423, p. 881-889, 1993.
GEWEKE, J. Evaluanting the Accuracy of Sampling-Based Approaches to the Calculation
of Posterior Moments. Oxford: Oxford University Press, p. 625-631, 1992.
KHURI, A. I.; CORNELL, J. A. Response Surfaces: designs and analyses. New York: Marcel
Dekker, 1996. 510 p.
MYERS, R. H.; MONTGOMERY, D. C. Response Surface Methodology: process and product
optimization using designed experiments. New York: John Wiley & Sons, 1995. 700 p.
PAULINO, C. D. ; TURKMAN, A. A. ; MURTEIRA, B. Estat´ıstica Bayesiana. Lisboa: Funda¸ao
Calouste Gulbenkian, 2003. 446 p.
R. Development Core Team. R Foundation for Statistical Computing. R: A language and en-
vironment for statistical computing, Vienna, Austria. ISBN 3-900051-07-0, URL. Dispon´ıvel em:
<http://R-project.org>. Acesso em: 27 jun 2007.
RAFTERY, A. L. ; LEWIS, S.; How many iterations in the Gibbs sampler?. In BERNARDO, J.
M.; bERGERER, J.O.; DAWID, A.P.; SMITH, A.F.(Ed). Bayesian statistics. Oxford: Oxford
University, 1992. p. 763-774.
64
SHANNON, C. E. A mathematical theory of communication. The Bell System Technical Jour-
nal, New York, v. 27, pp. 379-423, 623-656, 1948.
WU, C. F. J.; HAMADA, M. Experiments Planning, Analysis, and Parameter Design Op-
timization. New York: John Wiley, 2000. 630 p.
65
ANEXOS
66
67
ANEXO - Programa feito no pacote estat´ıstico R
######## Limpando qualquer termo existente no R, chamando alguns pacotes
necess´arios para o programa e chamando os dados#####
rm(list=ls())
require(MASS)
require(mvtnorm)
require(LearnBayes)
require(boa)
source("dados.r")
######## Fazendo as Fun¸c~oes do programa #########
## Gerando a posteriori condicional completa para betas
B.draw.f=function(X,B,D,y,sigma2){
D=diag(1/(((c^delta)*tau)^2))
media=solve((t(X)%*%X)+D)%*%t(X)%*%y
sigma22=sigma2*(solve((t(X)%*%X)+D))
B= mvrnorm(1,media,sigma22)
return(B)
}
####gerando a posteriori condicional completa para sigma2
sigma2.draw.f=function(n,v,para,lambda,y,X,B,D){
a=(1/2)*(n+v+1+para)
D=diag(1/(((c^delta)*tau)^2))
b=(1/2)*(v*lambda+(t(y-X%*%B))%*%(y-X%*%B)+t(B)%*%D%*%B)
sigma2=1/rgamma(1,shape=a,rate=b)
return(sigma2)
}
### gerando as probabilidades dos deltas####3
delta.draw.f1=function(delta,sigma2){
for(j in 1:para){
delta[j]=1
D=diag(((c^delta)*tau)^2)
Di=diag(1/(((c^delta)*tau)^2))
#prioriB1=dmvnorm(B,zero,sigma2*D)+1e-300
prioriB1=(1/((2*pi)^(para/2)*sqrt(det(sigma2*D))))*exp(-(1/2)*(B-zero)%*%
((1/sigma2)*Di)%*%(B-zero))
68
ay=0
for(i in 2:pa)
ay[i]=ay[i-1]+delta[i]*(pa-2-sum(delta[-c(1,i,(pa+1):para)]))
ay[pa]
by=0
for(i in 2:(pa-1))
by[i]=by[i-1]+delta[i]*sum(delta[-c(1:i,(pa+1):para)])
ci=0
for(i in 2:(pa-1))
ci[i]=ci[i-1]+(1-delta[i])*(pa-i-sum(delta[-c(1:i,(pa+1):para)]))
prioriD1=prod(((p[1]^delta[1])*((1-p[1])^(1-delta[1]))):((p[1]^delta[pa])*
((1-p[1])^(1-delta[pa]))))*(p[2]^(by[pa-1]))*(p[3]^(ay[pa]))*(p[4]^ci[pa-1])
delta[j]=0
D=diag(((c^delta)*tau)^2)
Di=diag(1/(((c^delta)*tau)^2))
#prioriB0=dmvnorm(B,zero,sigma2*D)+1e-300
prioriB0=(1/((2*pi)^(para/2)*sqrt(det(sigma2*D))))*exp(-(1/2)*(B-zero)%*%(
(1/sigma2)*Di)%*%(B-zero))
ay=0
for(i in 2:pa)
ay[i]=ay[i-1]+delta[i]*(pa-2-sum(delta[-c(1,i,(pa+1):para)]))
ay[pa]
by=0
for(i in 2:(pa-1))
by[i]=by[i-1]+delta[i]*sum(delta[-c(1:i,(pa+1):para)])
ci=0
for(i in 2:(pa-1))
ci[i]=ci[i-1]+(1-delta[i])*(pa-i-sum(delta[-c(1:i,(pa+1):para)]))
prioriD0=prod(((p[1]^delta[1])*((1-p[1])^(1-delta[1]))):((p[1]^delta[pa])*(
(1-p[1])^(1-delta[pa]))))*(p[2]^(by[pa-1]))*(p[3]^(ay[pa]))*(p[4]^ci[pa-1])
pr=prioriD1/(prioriD1+prioriD0*prioriB0/prioriB1)
delta[j]=rbinom(1,1,pr)
}
delta }
######## Definindo os hiperpar^ametros a serem usados ########
n=8
c=10
#tau=(sd(y)/5)/3
ou
tau=(sd(y)/5)/6
ou
#tau=((sd(y)/5)/6)/2
v=2.2
69
lambda=0.015
p=c(0.25,0.25,0.1,0.01)
pa=4
para=7
zero=rep(0,para)
delta=rep(1,para)
B=rep(7,para)
sigma2=1
D=diag((c^delta)*tau)^2
############# Programa Gibbs #############
B.draw=B
sigma2.draw=sigma2
delta.draw=delta
m=50000
for(i in 1:m){
B=B.draw.f(X,B,D,y,sigma2)
B.draw=c(B.draw,B)
sigma2=sigma2.draw.f(n,v,p,lambda,y,X,B,D)
sigma2.draw=c(sigma2.draw,sigma2)
delta=delta.draw.f1(delta,sigma2)
delta.draw=c(delta.draw,delta)
}
############# indicando o descarte inicial das itera¸c~oes e dist^ancia m´ınima
de uma itera¸c~ao para outra #######
burnin=1000
thin=10
########### Obtendo as subamostras com thin e burni-in ##########
B.draw=matrix(B.draw,nrow=m+1,ncol=para,T)
delta.draw=matrix(delta.draw,nrow=m+1,ncol=para,T)
delta.dr=matrix(nrow=((m-burnin)/(thin)),ncol=para)
for(i in 1:((m-burnin)/(thin))){
delta.dr[i,]=delta.draw[thin*i+burnin,]}
b.draw=matrix(nrow=((m-burnin)/(thin)),ncol=7)
for(o in 1:((m-burnin)/(thin))){
b.draw[o,]=B.draw[(thin*o)+burnin,]}
sig2.draw=sigma2.draw[thin+burnin]
for(i in 1:((m-burnin)/(thin))){
sig2.draw[i]=sigma2.draw[thin*i+burnin]
}
70
########### Obtendo as frequ^encias a posteriori, o n´umero e o indice de
diversidade de Shannon para os modelos ##########
colar<-function(aaa){
paste(aaa,collapse="")}
contag<-as.factor(apply(delta.dr,1,colar))
sort(summary(contag),FALSE)/((m-burnin)/thin)
k=length(summary(contag))
k
H=-sum((summary(contag)/m)*log(summary(contag)/m))
H
####### Plotando alguns graficos usados no trabalho ########
a=sum(delta.dr[,1])
b=sum(delta.dr[,2])
c=sum(delta.dr[,3])
d=sum(delta.dr[,4])
e=sum(delta.dr[,5])
f=sum(delta.dr[,6])
g=sum(delta.dr[,7])
#par(mfrow=c(2,4),pty="s")
plot(c(a,b,c,d,e,f,g)/((m-burnin)/thin),type="h",lwd=5,ylim=c(0,0.99))
)
par(mfrow=c(2,4),pty="s")
plot(density(b.draw[,1]))
abline(v=0,col="red")
plot(density(b.draw[,2]))
abline(v=0,col="red")
plot(density(b.draw[,3]))
abline(v=0,col="red")
plot(density(b.draw[,4]))
abline(v=0,col="red")
plot(density(b.draw[,5]))
abline(v=0,col="red")
plot(density(b.draw[,6]))
abline(v=0,col="red")
plot(density(b.draw[,7]))
abline(v=0,col="red")
plot(density( sqrt(sig2.draw)),xlim=c(0,80))
par(mfrow=c(2,4),pty="s")
71
plot(b.draw[,1],type="l")
abline(h=0,col="red")
plot(b.draw[,2],type="l")
abline(h=0,col="red")
plot(b.draw[,3],type="l")
abline(h=0,col="red")
plot(b.draw[,4],type="l")
abline(h=0,col="red")
plot(b.draw[,5],type="l")
abline(h=0,col="red")
plot(b.draw[,6],type="l")
abline(h=0,col="red")
plot(b.draw[,7],type="l")
abline(h=0,col="red")
plot(sqrt(sig2.draw),type="l")
abline(h=0,col="red")
Livros Grátis
( http://www.livrosgratis.com.br )
Milhares de Livros para Download:
Baixar livros de Administração
Baixar livros de Agronomia
Baixar livros de Arquitetura
Baixar livros de Artes
Baixar livros de Astronomia
Baixar livros de Biologia Geral
Baixar livros de Ciência da Computação
Baixar livros de Ciência da Informação
Baixar livros de Ciência Política
Baixar livros de Ciências da Saúde
Baixar livros de Comunicação
Baixar livros do Conselho Nacional de Educação - CNE
Baixar livros de Defesa civil
Baixar livros de Direito
Baixar livros de Direitos humanos
Baixar livros de Economia
Baixar livros de Economia Doméstica
Baixar livros de Educação
Baixar livros de Educação - Trânsito
Baixar livros de Educação Física
Baixar livros de Engenharia Aeroespacial
Baixar livros de Farmácia
Baixar livros de Filosofia
Baixar livros de Física
Baixar livros de Geociências
Baixar livros de Geografia
Baixar livros de História
Baixar livros de Línguas
Baixar livros de Literatura
Baixar livros de Literatura de Cordel
Baixar livros de Literatura Infantil
Baixar livros de Matemática
Baixar livros de Medicina
Baixar livros de Medicina Veterinária
Baixar livros de Meio Ambiente
Baixar livros de Meteorologia
Baixar Monografias e TCC
Baixar livros Multidisciplinar
Baixar livros de Música
Baixar livros de Psicologia
Baixar livros de Química
Baixar livros de Saúde Coletiva
Baixar livros de Serviço Social
Baixar livros de Sociologia
Baixar livros de Teologia
Baixar livros de Trabalho
Baixar livros de Turismo