Download PDF
ads:
Laborat´orio Nacional de Computa¸ao Cient´ıfica
Programa de os Gradua¸ao em Modelagem Computacional
An´alise comparativa de redes metab´olicas de bact´erias
no contexto da simbiose
Por
Cecilia Coimbra Klein
PETR
´
OPOLIS, RJ - BRASIL
AGOSTO DE 2010
ads:
Livros Grátis
http://www.livrosgratis.com.br
Milhares de livros grátis para download.
AN
´
ALISE COMPARATIVA DE REDES METAB
´
OLICAS DE
BACT
´
ERIAS NO CONTEXTO DA SIMBIOSE
Cecilia Coimbra Klein
DISSERTA¸C
˜
AO SUBMETIDA AO CORPO DOCENTE DO LABORAT
´
ORIO
NACIONAL DE COMPUTA¸C
˜
AO CIENT
´
IFICA COMO PARTE DOS REQUI-
SITOS NECESS
´
ARIOS PARA A OBTEN¸C
˜
AO DO GRAU DE MESTRE EM
CI
ˆ
ENCIAS EM MODELAGEM COMPUTACIONAL
Aprovada por:
Prof. Ana Tereza Ribeiro de Vasconcelos, D.Sc
(Presidente)
Prof. Jo˜ao Carlos Pereira da Silva, D.Sc.
Prof. Arnaldo Zaha, D.Sc.
PETR
´
OPOLIS, RJ - BRASIL
AGOSTO DE 2010
ads:
Klein, Cecilia Coimbra
K64a An´alise comparativa de redes metab´olicas de bact´erias no contexto da
simbiose / Cecilia Coimbra Klein. Petrop´olis, RJ. : Laborat´orio Nacional de
Computa¸ao Cient´ıfica, 2010.
XVII, 101 p. : il.; 29 cm
Orientadore(s): Ana Tereza Ribeiro de Vasconcelos e Marie-France Sagot
Disserta¸ao (M.Sc.) Laborat´orio Nacional de Computa¸ao Cient´ıfica,
2010.
1. Metabolismo - Modelagem Computacional. 2. Simbiose. 3. Gra-
fos. 4. An´alise comparativa. I. Vasconcelos, Ana Tereza Ribeiro de. I I.
LNCC/MCT. III. T´ıtulo.
CDD 572.4
Assim firmes, duras,
entre as coisas fluidas,
fiquem as palavras,
as vossas palavras.
Cec´ılia Meireles
iv
A todo(a)s que
apoiaram-me quando foi preciso e
incentivaram-me quando foi oportuno.
v
Agradecimentos
`
A Dra. Ana Tereza Ribeiro de Vasconcelos e `a Dra. Marie-France Sagot,
pela orienta¸ao, pelos ensinamentos, pelo incentivo e pela oportunidade.
Ao Dr. Ludovic Cottret, pelos ensinamentos, pelas discuss˜oes e pelo ap oio.
Ao Dr. Hubert Charles e ao Dr. Vincent Lacroix, pelas discuss˜oes e contri-
bui¸oes para o trabalho.
`
As equipes do LABINFO e BAOBAB/BAMBOO.
Aos membros da banca examinadora, Dr. Jo˜ao Carlos Pereira da Silva e
Dr. Arnaldo Zaha.
`
As institui¸oes que apoiaram este trabalho: LABINFO/LNCC/MCT, CA-
PES, INRIA, LBBE UMR CNRS 5558, Universit´e Claude Bernard Lyon 1.
Aos colegas do LNCC e do LBBE, pela ajuda, apoio e amizade.
`
A fam´ılia e aos amigos, pelo apoio, pelo incentivo e pela compreens˜ao.
vi
Resumo da Disserta¸ao apresentada ao LNCC/MCT como parte dos requisitos
necess´arios para a obten¸ao do grau de Mestre em Ciˆencias (M.Sc.)
AN
´
ALISE COMPARATIVA DE REDES METAB
´
OLICAS DE
BACT
´
ERIAS NO CONTEXTO DA SIMBIOSE
Cecilia Coimbra Klein
Agosto, 2010
Orientador: Ana Tereza Ribeiro de Vasconcelos, D.Sc
Co-orientador: Marie-France Sagot, D.Sc.
Simbiose ´e a asso cia¸ao permanente entre dois ou mais organismos de esp´ecies
distintas, pelo menos durante uma parte do ciclo de vida. Existe uma grande di-
versidade de casos de simbiose, os quais ao frequentemente classificados de acordo
com os benef´ıcios ou deficits no valor adaptativo do hospedeiro, i.e., mutualismo,
comensalismo ou parasitismo. Outr as caracter´ısticas importantes ao a localiza¸ao,
a dependˆencia e o modo de transmiss˜ao dos simbiontes. O conjunto de organismos
selecionado para este trabalho consiste de 58 bact´erias que foram agrupadas se-
gundo caracter´ısticas das associa¸oes simbi´oticas que elas estabelecem. A an´alise
comparativa das redes metab´olicas foi realizada de forma sistˆemic a, examinando
toda a rede sem fazer a parti¸ao em vias metab´olicas selecionadas a priori. Duas
maneiras de compara¸ao foram utilizadas: (i) an´alise dos conjuntos de compostos e
de rea¸oes, e (ii) an´alise da topologia das redes metab´olicas modeladas como grafos
de compostos. Como fruto dessas an´alises foi poss´ıvel observar o contraste entre a
conservao de um ucle o metab´olico nas bact´erias extracelulares, de vida livre e
associadas `a c´elula, e a ausˆencia de partes comuns da rede metab´olica nas intrace-
lulares estritas. Nota-se que o grupo das mutualistas (MIV) foi o que especialmente
contribuiu para os valores baixos de interse¸ao para os conjuntos de compostos e de
rea¸oes. Esses endocitobiontes apresentam uma propor¸ao maior dos seus genomas
vii
dedicada ao metabolismo. Al´em disso, partes distintas do metabolis mo foram con-
servadas em diferentes subconjuntos dessas bact´erias intracelulares mutualistas.
viii
Abstract of Dissertation presented to LNCC/MCT as a partial fulfillment of the
requirements for the degree of Master of Sciences (M.Sc.)
METABOLIC NETWORK COMPARISON OF BACTERIA IN THE
CONTEXT OF SYMBIOSIS
Cecilia Coimbra Klein
August, 2010
Advisor: Ana Tereza Ribeiro de Vasconcelos, D.Sc
Co-advisor: Marie-France Sagot, D.Sc.
Symbiosis is the permanent association between two or more organisms that
are distinct, at least during a part of the life cycle. Cases of symbiosis are widely
diverse a nd are often classified based on the benefits or the deficits on the host
fitness, e.g., mutualism, commensalism or parasitism. Location, type of depen-
dency and transmission of the symbionts are also important features. The data
set is composed of 58 bacteria which were grouped according to the features of
the symbiotic associations established by them. The metabolic network compari-
son was carried out in a systematic way, taking into account the whole network
without previously selecting metabolic pathways. The comparison was performed
by analysing: (i) the sets of compounds and reactions, and (ii) the topology of the
metabolic networks modelled as c ompound graphs. A conserved metab olic core
inside the groups of extracellular, free-living and cell-associated bacteria was ob-
served, contrasting with the absence of common parts in the me tabolic networks of
the obligate intracellular bacteria. The group of mutualists (MIV) specially con-
tributed to the low values of the intersections of sets of compounds and reactions.
The portion of the genome dedicated to metabolism is higher in these endocyto-
bionts and distinct parts of the metabolism were conserved in dierent subsets of
the intracellular mutualist bacteria.
ix
Sum´ario
1 Introdu¸ao 1
1.1 Estilos de vida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1.1 Associa¸oes simbi´oticas . . . . . . . . . . . . . . . . . . . . . 1
1.1.2 Categorias dos organismos . . . . . . . . . . . . . . . . . . . 3
1.2 Reconstru¸ao e modelagem das redes metab´olicas . . . . . . . . . . 4
1.3 Compara¸ao das redes metab´olicas . . . . . . . . . . . . . . . . . . 7
1.3.1 Compara¸ao dos elementos que comp˜oem as redes metab´olicas 7
1.3.2 Compara¸ao dos ´ındices medidos em grafos metab´olicos . . . 9
1.4 Motivao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2 Objetivos 14
2.1 Obj etivo geral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.2 Obj etivos espec´ıficos . . . . . . . . . . . . . . . . . . . . . . . . . . 14
3 Metodologia 16
3.1 Conjunto de organismos . . . . . . . . . . . . . . . . . . . . . . . . 16
3.2 Compara¸ao das redes metab´olicas . . . . . . . . . . . . . . . . . . 19
3.2.1 Compara¸ao dos conjuntos de compostos e de rea¸oes . . . . 19
3.2.2 Compara¸ao da topologia das redes metab´olicas . . . . . . . 20
3.3 An´alises estat´ısticas . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
4 Resultados 24
4.1 Compara¸ao dos elementos que constituem as redes metab´olicas . . 24
x
4.1.1 Compara¸ao do conjunto de genes . . . . . . . . . . . . . . . 24
4.1.2 Compara¸ao dos conjuntos de compostos e de rea¸oes . . . . 28
4.1.3 Redu¸ao diferencial do metabolismo nos endocitobiontes . . 37
4.2 Compara¸ao da topologia das redes metab´olicas . . . . . . . . . . . 64
4.2.1 Diˆametro e distˆancia m´edia nos grafos de comp ostos . . . . 64
4.2.2 Conectividade nos grafos de compostos . . . . . . . . . . . . 68
4.2.3 Centralidade de intermedia¸ao nos grafos de compostos . . . 75
5 Discuss˜ao 78
6 Conclus˜oes e Perspectivas 85
Referˆencias Bibliogr´aficas 87
Apˆendice
A 97
A.1 Informa¸oes do conjunto de organismos . . . . . . . . . . . . . . . . 97
xi
Lista de Figuras
Figura
1.1 Grafo de compostos. Figura retirada de Cottret e Jourdan (2010). . 6
1.2 A via da glic´olise como par te da rede metab´olica. a. A apresenta-
¸ao convencional em bioqu´ımica; b. a estrutura conectada em uma
representa¸ao gr´afica mantendo metab´olitos altamente frequentes
conectados. Figura retirada de Ma e Zeng (2003). . . . . . . . . . . 7
3.1 Conjunto de organismos agrupados segundo estilos de vida. . . . . . 18
4.1 N´umero total de genes e de genes metab´olicos (barras menores) se-
gundo estilo de vida (a) e segundo classe taxonˆomica (b). . . . . . . 25
4.2 Propor¸ao do n´umero de genes metab´olicos pelo n´umero de genes. . 26
4.3 a. N´umero total de compostos. b. N´umero total de rea¸o es. . . . . 29
4.4 Interse¸oes de conjuntos de compostos (a) e de rea¸oes (b) remo-
vendo sucessivamente os organismos com os menores n´umeros de
compostos e rea¸oes. . . . . . . . . . . . . . . . . . . . . . . . . . . 34
4.5 ACM da presen¸ca/ausˆencia de rea¸oes em todo o conjunto de orga-
nimos. Proje¸ao dos dois primeiros eixos. . . . . . . . . . . . . . . . 36
4.6 Tabela de presen¸ca/ausˆencia de rea¸oes com taxas de correla¸a o
superiores a 60% no primeiro eixo da ACM do conjunto total de
organismos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
4.7 ACM da presen¸ca/ausˆencia de rea¸oes nos organismos do grupo
MIV. Proje¸ao dos dois primeiros eixos. . . . . . . . . . . . . . . . . 39
xii
4.8 Tabela de presen¸ca/ausˆencia das rea¸oes com taxas de correla¸ao
superiores a 85% no segundo eixo da ACM do grupo MIV. . . . . . 41
4.9 Grafo induzido pelas rea¸oes com taxa de correla¸ao superior a 85%
no primeiro eixo da ACM para o grupo MIV. . . . . . . . . . . . . . 42
4.10 ACM da presen¸ca/ausˆencia de rea¸oes nos organismos do grupo MIV
I (a) e II (b). Proje¸ao dos eixos 2 e 3. . . . . . . . . . . . . . . . . 44
4.11 Tabela de presen¸ca/ausˆencia de rea¸oes com taxas de correla¸ao
superiores a 50% no segundo eixo da ACM do grupo MIV I (a) e II
(b). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
4.12 Grafo induzido pelas rea¸oes do grupo A com taxa de correla¸ao
superior a 53% no segundo eixo da ACM para o grupo MIV. . . . . 47
4.13 Grafo induzido pelas rea¸oes do grupo D com taxa de correla¸ao
superior a 53% no segundo eixo da ACM para o grupo MIV. . . . . 52
4.14 Tabela de presen¸ca/ausˆencia das rea¸oes com taxas de correla¸ao
mais altas na terceira componente da ACM do grupo MIV I (a) e II
(b). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
4.15 Grafo induzido pelas rea¸oes com taxa de correla¸ao mais elevada
na terceira componente da ACM para o grupo MIV I (a) e II (b). . 57
4.16 Diˆametro (a) e tamanho edio dos caminhos (b) dos grafos de com-
postos dos 58 organismos. Os organismos est˜ao ordenados de acordo
com o tamanho do seu genoma. . . . . . . . . . . . . . . . . . . . . 65
4.17 Diˆametro em rela¸ao ao n´umero de os dos grafos de compostos dos
58 organismos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
4.18 Distˆancia m´edia dos caminhos em rela¸ao ao n´umero de os dos
grafos de compostos dos 58 organismos. . . . . . . . . . . . . . . . . 68
4.19 Grau de entrada de 55 metab´olitos correspondentes aos 10 metab´o-
litos com os mais altos graus de entrada em cada grafo de compostos
filtrado. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
xiii
4.20 Grau de sa´ıda de 46 metab´olitos correspondentes aos 10 metab´olitos
com os mais altos graus de sa´ıda em cada grafo de compostos filtrado. 71
4.21 An´alise de componentes principais (ACP) realizada para os 55 e 46
metab´olitos selecionados com os graus de entrada (a) e de sa´ıda (b),
respectivamente, mais elevados. . . . . . . . . . . . . . . . . . . . . 74
4.22 Centralidade de intermedia¸ao axima e m´edia dos os nos grafos
de compostos dos 58 organismos. . . . . . . . . . . . . . . . . . . . 76
4.23 Centralidade de intermedia¸ao dos 61 metab´olitos correspondentes
`a uni˜a o dos 5 metab´olitos mais centrais nessa medida nos grafos de
compostos filtrados. . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
xiv
Lista de Tabelas
Tab ela
3.1 N´umero de organismos por classe taxonˆomica. . . . . . . . . . . . . 17
4.1 Valor m´edio, tamanho da uni˜ao e da interse¸ao dos conjuntos de compostos e
de rea¸oes nos diferentes grupos de estilos de vida. .............. 31
4.2 Compostos comuns a todos os organismos do conjunto de dados. . . 33
4.3 Interse¸ao do conjunto de rea¸oes entre pares de organismos do
grupo MIV. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
4.4 Presen¸ca/ausˆencia de rea¸oes participantes do ciclo TCA no grupo
MIV. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
4.5 Presen¸ca/ausˆencia de rea¸oes participantes da via de s´ıntese de pan-
totenato (I a III) e de coenzima A (IV a VIII) no grupo MIV. . . . 60
A.1 Informa¸oes do conjunto de organismos. . . . . . . . . . . . . . . . 98
xv
Lista de Siglas e Abreviaturas
ACM: An´alise de correspondˆencia m´ultipla
ACP: An´alise de componentes principais
ADP: Adenosina difosfato
AICAR: Aminoimidazole carboxamida ribonucleot´ıdeo
AMP: Adenosina monofosfato
ATP: Adenosina trifosfato
CA: Associado `a elula
CEH: Comensal extracelular com transmiss˜ao horizontal
CO
2
: Di´oxido de carbono
DNA:
´
Acido desoxirribonucl´eico
FAD: F lavina adenina dinucleot´ıdeo
FL: Vida livre
IMP: Inosina monofosfato
MCAV: M utualista asso ciado `a elula com transmiss˜ao vertical
MEH: Mutualista extracelular com transmiss˜ao horizontal
MIV: Mutualista intracelular com transmiss˜ao vertical
NAD: Nicotinamida-adenina dinucleot´ıdeo
NADH: Nicotinamida-adenina dinucleot´ıdeo reduzido
NADP: Nicotinamida adenina dinucle´otido fosfato
PCAH: Mutualista associado `a elula com transmiss˜ao horizontal
PEH: Parasita extracelular com transmiss˜ao horizontal
Pi: Fosfato inorgˆanico
xvi
PIH: Parasita intracelular com transmiss˜ao horizontal
PIV: Parasita intracelular com transmiss˜ao vertical
PRPP: 5-fosforibosil-1-pirofosfato
TCA:
´
Acido tricarbox´ılico
xvii
Cap´ıtulo 1
Introdu¸ao
1.1 Estilos de vida
1.1.1 Associa¸oes simbi´oticas
Associa¸oes entre microrganismos e animais ou plantas ao frequentes na
natureza. Simbiose foi definida por De Bary em 1879 como a associa¸ao permanente
entre dois ou mais organismos de esp´ecies distintas, pelo menos durante uma parte
do ciclo de vida. Essa defini¸ao mais ampla foi adotada no presente trabalho. O
termo simbiose, de origem grega, significa viver juntos, coexistir. Em geral, um
dos participantes da associa¸ao ´e maior que os outros e ´e chamado de hospedeiro;
enquanto os participantes menores ao chamados de simbiontes.
Existe uma grande diversidade de casos de simbiose, os quais ao frequen-
temente classificados de acordo com os benef´ıcios ou deficits no valor adaptativo
(fitness) do hospedeiro (Wernegreen, 2005; Gil et al., 2004). O valor adaptativo do
indiv´ıduo depende da sua longevidade e fertilidade. Dessa forma, os arios tipos
de simbiose ao descritos pelos termos: mutualismo, comensalismo e parasitismo.
Entretanto, os limites dessas trˆes cat egorias ao ao claros e existem transi¸oes fre-
quentes entre elas (Paracer e Ahmadjian, 2000). Mutualismo ´e uma asso cia ¸ao na
qual os simbiontes tem um efeito positivo no valor adaptativo do hospedeiro; sendo
frequentemente definida como ben´efica para todos os participantes. Comensalismo
´e uma associa¸ao na qual os simbiontes ao apresentam efeito no valor adapta-
tivo do hospedeiro. O termo com mensal do latim significa convidado `a mesa.
1
A associa¸ao ´e ben´efica apenas para o simbionte (Nair, 2004). Parasitismo ´e uma
associa¸ao na qual os simbiontes apresentam efeito negativo no valor a daptativo do
hospedeiro, sendo considerada ben´efica para o simbionte `as custas do hospedeiro.
Al´em dos trˆes grandes tipos de simbiose, outras caracter´ısticas p odem ser
consideradas para classificar os casos de simbiose, como a localiza¸ao, a dependˆen-
cia e o modo de transmiss˜ao dos simbiontes.
A descri¸ao da localiza¸ao da simbiose ser´a conforme Nardon e Charles
(2004), considerando as varia¸oes na nomenclatura dependendo do autor. Na ecto
ou exossimbiose, os participantes permanecem externos uns dos outros, mesmo
em associa¸oes bastante intrincadas como as dos l´ıquens. Nessa, os participantes
menores ao chamados ectossimbiontes. Na endossimbiose, os associados meno-
res, endossimbiontes, est˜ao dentro do hospedeiro, mas permanecem extracelulares.
Na maioria das vezes, eles est˜ao no trato digestivo ou dentro de ´org˜aos especiais.
Na endocitobiose,osendocitobiontes ao intracelulares, podendo estar temporaria-
mente extracelulares em caso de migra¸ao para os ov´arios, por exemplo.
Os endocitobiontes est˜ao frequentemente localizados em c´elulas especializa-
das chamadas bacteri´ocitos, quando os endocitobiontes ao bact´erias. Pode-se con-
siderar diferentes n´ıveis de integra¸ao da bact´eria na endocitobiose. Nardon e Gre-
nier (1993) descreveram endocitobiontes integrados como aqueles que est˜ao sempre
presentes em todas as popula¸oes do hospedeiro e ao completamente dependentes
do hospedeiro para o seu crescimento. Eles ao ao cultiv´aveis in vitro e ao obri-
gat´orios para o seu hospedeiro. Al´em disso, as filogenias do hospedeiro e desses
simbiontes apresentam uma congruˆencia marcante, ocasionada pela transmiss˜ao
vertical dos simbiontes e pela transferˆencia para outros hospedeiros estar pratica-
mente ausente (Taylor et al., 2005). Por outro lado, os endocitobiontes associados
ao apresentam uma localiza¸ao precisa, ao induzem a forma¸ao de elulas espe-
cializadas e ao est˜ao presentes em todas as popula¸oes. Mesmo em popula¸oes
infectadas, eles ao est˜ao necessariamente presentes em todos os indiv´ıduos, o que
indica que eles ao ao obrigat´orios para o hospedeiro (Nardon e Grenier, 1993).
2
A dependˆencia da simbiose distingue simbiontes obrigat´orios e facultativos
(Paracer e Ahmadjian, 2000). Os primeiros e st˜ao ao adaptados `a existˆencia sim-
bi´otica que eles ao podem viver fora dela. Os ´ultimos podem igualmente viver
em condi¸ao de vida livr e. Considerando a dependˆencia da simbiose para o hospe-
deiro, pode-se dis tinguir simbionte prim´ario e secund´ario (Oliver et al., 2010). O
primeiro consiste em uma linhagem simbi´otica essencial para a sobrevivˆencia e re-
produ¸ao do hospedeiro, geralmente fornecendo nutrientes ao hospedeiro, enquanto
que o simbionte secund´ario ´e uma linhagem ao essencial para a sobrevivˆencia e
reprodu¸ao do hospedeiro.
O modo de transmiss˜ao dos simbiontes pode ser vertical ou horizontal (Oliver
et al., 2010). No primeiro caso, o material gen´etico ´e transferido diretamente da
gera¸ao parental para a prole. No segundo caso, o material gen´etico ´e transferido
para hospedeiros intra e interespec´ıficos, ao ocorrendo via heran¸ca da gera¸ao
parental para a prole.
1.1.2 Categorias dos organismos
Evidˆencias emergentes demonstram que muitas das categorias tradicional-
mente utilizadas para classificar organismos ao possuem limites claros. Casadevall
(2008) questionou se o estilo de vida intracelular representa uma categoria distinta
ou se a capacidade de sobrevivˆencia intracelular pode estar amplamente difundida
entre os micr´obios. Esse mesmo autor sugeriu que a distin¸c ˜ao entre pat´ogenos
obrigat´orios e facultativos pode ser a extens˜ao da perda de genes, que geralmente
acompanha a associa¸ao e a dependˆencia ao hospedeiro. No caso dos simbiontes de
insetos transmitidos verticalmente, Moran et al. (2008) indicou que a literatura dos
estudos moleculares desses simbiontes est´a fragmentada, refletindo o fato de que
os tipos de simbiontes (i.e., parasitas, comensais, mutualistas) foram inicialmente
descobertos por vias diferentes. Entretanto, como mencionado anteriormente, os
limites dessas categorias ao ao bem definidos.
Por outro lado, an´alises comparativas com numerosos organismos frequente-
3
mente requerem classifica¸oes para agrup´a-los.
Mamirova et al. (2007) analisaram a influˆencia de alguns fatores na sele¸ao
purificadora em genes ort´ologos em organismos que apresentam diferentes estilos
de vida. Nesse estudo, as esp´ecies de bact´erias foram divididas em dois grandes
grupos: esp´ecies intracelulares obrigat´orias (parasitas ou mutualistas) e esp´ecies
de vida livre, que possuem a capacidade de existir fora da elula do hospedeiro.
Merhej et al. (2009) realizaram uma an´alise comparativa de genomas de
bact´erias com diferentes estilos de vida. As bact´erias foram classificadas, nesse
estudo, como dependentes do hospedeiro ou possuindo vida livre. O primeiro grupo
ainda foi subdividido em associa¸ao facultativa com o hospedeiro (extracelular
ou intracelular), mutualistas intracelulares obrigat´orios ou parasitas intracelulares
obrigat´orios.
Moran et al. (2008) classificaram os simbiontes de insetos transmitidos ver-
ticalmente em simbiontes obrigat´orios” e facultativos”. A primeira categoria ´e
formada por mutualistas obrigat´orios necess´arios para a o desenvolvimento normal
do hospedeiro, i.e., simbiontes prim´arios. A segunda por outro lado, ´e formada por
simbiontes secund´arios subdivididos em mutualistas, manipuladores reprodutivos
e com efeito desconhecido.
Desta forma, bact´erias podem ser classificadas em uma diversidade de cate-
gorias para a realiza¸ao de an´alises comparativas. Entretanto, esse processo requer
extrema aten¸ao em rela¸ao `a nomenclatura adotada pelos diferentes autores, a
forma em que as associa¸oes foram descobertas e descritas, entre outras.
1.2 Reconstru¸ao e modelagem das redes metab´olicas
A reconstru¸ao de uma rede metab´olica consiste em inferir as rela¸oes entre
genes, prote´ınas (enzimas) e rea¸oes que existem em um dado sistema metab´olico
(Lacroix et al., 2008). O sequenciamento completo de numerosos genomas permite
ter uma ideia geral, embora imprecisa, das capacidades metab´olicas de um orga-
nismo. Dessa forma, a genˆomica comparativa ´e geralmente utilizada para inferir
4
a lista de rea¸oes metab´olicas do organismo, mas ao se obt´em a rede metab´olica
como um todo. Dados de metabolˆomica igualmente p odem ser utilizados para a
reconstru¸ao do metabolismo (Lacroix et al., 2008). A reconstru¸ao metab´olica,
a partir das informa¸oes provenientes do sequenciamento do genoma, consiste em:
(i) a anota¸ao funcional dos genes metab´olicos, i.e., determinar a atividade cata-
l´ıtica das enzimas para a quais eles codificam; e (ii) inferir a lista de rea¸oes a
partir das atividades metab´olicas deduzidas atrav´es da anota¸ao funcional do ge-
noma (Lacroix et al., 2008). O refinamento da lista de rea¸oes inferidas pode ser
realizado para buscar rea¸oes faltantes, no caso em que a enzima correspondente
ao foi assinalada no processo de anota¸ao. Isso pode ser feito a partir das vias
metab´olicas preditas para o organismo (Cottret e Jourdan, 2010). Uma lista de
genes candidatos para a atividade enzim´atica faltante pode ser obtida utilizando-se
o Pathway Hole Filler (Green e Karp, 2004).
A qualidade da reconstru¸ao depende principalmente da qualidade da anota-
¸ao do genoma para o organismo em quest˜ao. A proximidade filogen´etica do mesmo
com um organismo modelo, como Escherichia coli K12 (ECOLI), pode influenciar
na qualidade da reconstru¸ao (Lacroix et al., 2008). E. coli ´e um dos poucos or-
ganismos cujas fun¸oes associadas aos genes ao mais conhecidas, tendo em vista
numerosas evidˆencias experimentais. EcoCyc (Ke seler et al., 2009) ´e a parte da
base de dados BioCyc (Karp et al., 2005) que integra diversas informa¸oes sobre a
biologia de E. coli incluindo as referˆencias experimentais ligadas aos dados. Desta
forma, a qualidade da reconstru¸ao metab´olica para bact´erias filogeneticamente
pr´oximas de E. coli ´e provavelmente superior.
Cada um dos passos da reconstru¸ao metab´olica pode gerar erros que podem
ser propagados para as etapas seguintes (Lacroix et al., 2008). Esses erros podem
levar a inconsistˆencias nos resultados das an´alises das redes metab´olicas. A mode-
lagem do metabolismo pode, igualmente, criar inconsistˆencias nos resultados tendo
em vista artefatos provenientes da natureza dos dados.
Para uma an´alise estrutural do metabolismo, a rede metab´olica pode ser
5
modelada sob a forma de um grafo. Um grafo G ´e definido como um par (V,E),
onde V ´e um conjunto finito de os e E ´e um conjunto finito de arestas, o qual
´e um subconjunto de V
2
. Essa mode lagem da rede metab´olica sob a forma de
um grafo implica em definir os elementos (compostos, rea¸oes, enzimas) e o tipo
de intera¸oes que objetiva-se modelar (Lacroix et al., 2008). Para uma descri¸ao
e aplica¸oes dos diferentes tipos de grafos metab´olicos, consultar Lacroix et al.
(2008) e Cottret e Jourdan (2010).
Em um grafo de compostos, os os correspondem aos compostos e existe uma
aresta entre dois metab´olitos se a uma rea¸ao em que um ´e substrato e o outro ´e
produto. Na Figura 1.1, A e C est˜ao ligados por uma aresta, pois existe uma rea¸ao
R1 que produz C a partir de A. Nesse modelo, todos os compostos ao equivalentes,
sem uma separa¸ao, por exemplo, em compostos prim´arios e auxiliares.
format than the graphic one which makes the use
of other bioinformatics tools dicult. Table 2 pres-
ents a non-exhaustive list of databases containing
information about the metabolism of eukaryotic
parasites.
Data exchange
One aim of metabolic reconstruction is to allow the
application of several computational methods on a
metabolic network. But these methods are often im-
plemented in various softwares. To facilitate the use
of these softwares on the same metabolic network,
standard exchange formats have been developed. It is
thus relevant for databases to export networks in at
least one of these formats. For metabolic networks
mainly two formats are available : Biopax and SBML,
both are based on the XML format (Extensible
Markup Language). Both formats and their specifi-
city have been described by Stro
¨
mba
¨
ck and Lambrix
(2005). BioPax format is more complete since it is
able to handle hierarchical links between objec ts and
all the information, from genes to metabolites, can be
stored in a sing le file. Nevertheless, it seems that its
complexity makes it rarely used in metabolic network
tools. The SBML format (Systems Biolog y Markup
Language) is much simpler. It is essentially made of a
list of reactions with a list of all the substrates and
products (Finney and Hucka, 2003). Information on
metabolite concentrations and kinetic properties can
be added to allow the numerical simulation of the
network. SBML is now used by a large number of
systems biology software.
The previously mentioned databases do not pro-
vide a description of the whole network in these
formats. The BIGG web server (http://bigg.ucsd.
edu/) gives access to around 40 highly curated meta-
bolic reconstructions directly available in SBML
format. But BIGG contains only a metabolic recon-
struction for one eukaryotic parasite (Leishmania
major). Recently, our group developed the web ser-
ver MetExplore (http://metexplore.toulouse.inra.fr)
that contains about 50 metabolic networks built
from genomic annotations and available in SBML
format. Of them, about 10 come from eukaryotic
parasites (Table 2). SBML format also allows graph
Fig. 2. Metabolic graph models. Given a textual description of the five reactions of the network, five metabolic graph
models can be built. In this figure and all the following ones, the round nodes correspond to the metabolites and the
square nodes to the reactions. In the compound graph (a), nodes are compounds and two compounds are connected if
they are input and output of a reaction. In the reaction graph (b) nodes are reactions and two reactions are connected if
the product of one is the substrate of the other. In the enzyme graph (c), nodes are enzymes and they are connected if at
least one reaction catalysed by the first enzyme has a product which is the substrate of at least one reaction catalysed by
the other enzyme. In the bipartite graph (d) there are two kinds of nodes, reactions and metabolites ; a compound is
connected to a reaction if it is a substrate or a product of this reaction. In the hypergraph model (e) substrates of a
reaction are connected to products of a reaction through a hyperedge.
Ludovic Cottret and Fabien Jourdan 6
Figura 1.1: Grafo de compostos. Figura retirada de Cottret e Jourdan (2010).
A manuten¸ao de cofatores e de metab´olitos extremamente frequentes (p. ex.
´agua) como os no grafo de compostos pode resultar em uma defini¸ao ao rea-
lista dos caminhos entre dois compostos, e portanto da distˆancia (comprimento do
caminho mais curto) entre esses dois compo stos (Ma e Zeng, 2003). Um exemplo,
apresentado por Ma e Zeng (2003), pode ser observado no trecho da via da glic´olise
(Figura 1.2). O comprimento do caminho (n´umero de passos de rea¸oes na via)
partindo da glicose para formar o piruvato deve ser nove. Todavia, o comprimento
do caminho poderia ser igual a dois, tendo ATP e ADP como os da rede e levando
6
em considera¸ao a sua funcionalidade como cofatores em diferentes rea¸oes. Esse
comprimento do caminho para converter glicose em piruvato ao tem sentido bio-
qu´ımico. Al´em desses, problemas semelhantes podem ocorrer com a manuten¸ao
de outros metab´olitos extremamente frequentes.
Figura 1.2: A via da glic´olise como parte da rede metab´olica. a. A apresenta-
¸ao convencional em bioqu´ımica; b. a estrutura conectada em uma representa¸ao
gr´afica mantendo metab´olitos altamente frequentes conectados. Figura retirada de
Ma e Zeng (2003).
Grandes esfor¸cos na bioinform´atica em sido feitos para melhorar a qualidade
em cada n´ıvel. Isso ´e de extrema importˆancia, tendo em vista a necessidade de uma
boa reconstru¸ao e modelagem da rede para a obten¸ao de resultados consistentes
em an´alises de redes metab´olicas.
1.3 Compara¸ao das redes metab´olicas
1.3.1 Compara¸ao dos elementos que comp˜oem as redes metab´olicas
Uma maneira de comparar as rede s metab´olicas de numerosos organismos ´e
atrav´es da an´alise dos conjuntos de elementos que as comp˜oem. Essas compara¸oes
ao, geralmente, efetuadas nos conjuntos de enzimas (ou genes metab´olicos) e de
7
rea¸oes.
Zientz et al. (2004) analisaram os diferentes efeitos da vida simbi´otica intra-
celular no metabolismo de trˆes endocitobiontes mutualistas: Buchnera, Candidatus
Blochmannia e Wigglesworthia. Tamas et al. (2001) mostraram as diferen¸cas genˆo-
micas e metab´olicas entre uma bact´eria intracelular mutualista, Buchnera, e uma
bact´eria intracelular parasita, Rickettsia. Esses dois estudos, embora ricos em
informa¸oes, comparam apenas dois ou trˆes organismos e vias metab´olicas selecio-
nadas a priori. An´alises baseadas em vias metab´olicas de referˆencia ao permitem
encontrar vias alternativas poss´ıveis ou uma vis˜ao de todo o conjunto da rede
metab´olica.
Por outro lado, estudos em maior escala foram realizados para evidenciar
tendˆencias gerais em grandes conjuntos de organismos. van Nimwegen (2003) exa-
minou a propor¸ao de genes dedicados `as diferentes categorias funcionais da c´elula
entre os mais de 100 genomas de organismos sequenciados na ´epoca. O autor in-
dica uma pr opor¸ao de genes dedicados ao metabolismo bastante conservada entre
os genomas analisados. Cases et al. (2003) igualmente analisaram a propor¸ao de
genes dedicados ao metabolismo de pequenas mol´eculas em 60 organismos classifi-
cados de a cordo com os estilos de vida. Os autores indicam uma propor¸ao maior
do genoma das bact´erias, com menos de 3000 genes, dedicada ao metabolismo.
Diferentes grupos de estilos de vida comp˜oem esse resultado, incluindo as intrace-
lulares parasitas. Entretanto, esse resultado ´e pouco preciso, tendo em vista que o
grupo das bact´erias intracelulares parasitas ´e formado por parasitas e mutualistas,
como Buchnera aphidicola. Al´em disso, faltam detalhes sobre a influˆencia de cada
organismo nas tendˆencias globais observadas.
Freilich et al. (2005) realizaram uma an´alise comparativa de conjuntos de
enzimas em 85 organismos permeando os trˆes dom´ınios dos seres vivos, com o
objetivo de determinar se a fra¸ao de enzimas no proteoma ´e constante intra e in-
terdom´ınio. A tendˆencia encontrada para as esp´ecies de Archaea e de Bacteria foi
uma fra¸ao de enzimas e prote´ınas relacionadas a enzimas aproximadamente cons-
8
tante variando entre 30 e 40%. Esse resultado concorda com a tendˆencia indicada
por van Nimwegen (2003). Apenas seis bact´erias apresentaram uma propor¸ao
de enzimas significativamente ma is elevada: B uchnera aphidicola, Mycoplasma ge-
nitalium, Mycoplasma pulmonis, Rickettsia prowazekii, Haemophilus influenzae e
Pasteurella multocida. Os autores ressaltam o car´ater intracelular obrigat´orio e
os pequenos genomas das quatro primeiras para explicar o resultado. Entretanto,
dentre as 63 esp´ecies de bact´erias estudadas, outras apresentam esse mesmo car´a-
ter, mas ao resultaram em propor¸oes mais elevadas do que a m´edia de enzimas
no proteoma. Des sa forma, o argumento utilizado pelos autores ao parece ser
determinante para as propor¸oes mais elevadas.
Merhej et al. (2009) realizaram uma an´alise comparativa de genomas de 317
bact´erias com diferentes estilos de vida. As categorias de estilos de vida utiliza-
das pelos autores foram anteriormente apresentadas. Os autores indicaram uma
evolu¸ao convergente das bact´erias intracelulares obrigat´orias baseado nas catego-
rias funcionais estabelecidas para os Clusters of Orthologous Groups (COGs). Por
outro lado, os autores apontam divergˆencia entre parasitas e mutualistas (intrace-
lulares obrigat´orios). Em rela¸ao ao metabolismo, as varia¸oes nesses dois grupos
foram significativas
1
para as categorias transporte e metabolismo de amino´acidos,
e transporte e metabolismo de lip´ıdios. Na primeira categoria, o grupo das mutua-
listas apresentou maior propor¸ao; e na segunda, o grupo dos parasitas apresentou
maior propor¸ao. Esses resultados foram obtidos com base no n´umero m´edio de
genes no determinado COG dividido pelo n´umero total de genes para os dois gru-
pos. Dessa forma, a influˆencia de cada organismo nas tendˆencias observadas para
cada grupo ao ´e mostrada.
1.3.2 Compara¸ao dos ´ındices medidos em grafos metab´olicos
Uma vez que a rede metab´olica est´a modelada como um grafo, medidas
cl´assicas, provenientes da teoria de grafos, pode m ser utilizadas para analisar se elas
1
p<0,001.
9
fornecem um conhecimento mais aprofundado sobre a estrutura ou caracter´ısticas
gerais da rede. Essas medidas em sido utilizadas para redes metab´olicas e para
outras redes biol´ogicas.
Importantes trabalhos aplicaram algumas medidas estruturais, como diˆa-
metro e distribui¸ao de graus
2
, em redes metab´olicas com o objetivo de inferir
significado biol´ogico (Fell e Wagner, 2000; Wagner e Fell, 2001; Arita, 2004; Jeong
et al., 2000; Aloy e Russell, 2002; Keller, 2005). Esses basearam-se nas no¸oes:
Small-World Networks (Watts e Strogatz, 1998) e Scale-Free Networks (Barabasi
e Albert, 1999). Al´em disso, esses trabalhos ilustraram o entusiasmo inicial na
´area para resultados gerais sobre a estrutura das redes biol´ogicas (Lacroix et al.,
2008). Por outro lado, foi mostrado que ambos apresentam impacto limitado no
entendimento do metabolismo (Lacroix et al., 2008).
Al´em desses dois conceitos, outros estudos utilizaram medidas em grafos para
descrever e comparar redes metab´olicas.
Ma e Zeng (2003) mediram a distribui¸ao de graus, o comprimento dos ca-
minhos e o diˆametro de 80 grafos metab´olicos. Os autores indicaram que existem
diferen¸cas na estrutura das redes entre trˆes dom´ınios dos organismos, sendo o diˆa-
metro mais elevado e tamanho edio dos caminhos mais longo em eucariotos e
arqueobact´erias que em bact´erias. Acrescido a isso, eles propuseram algumas re-
gras heur´ısticas para determinar o sentido das rea¸o es e eliminar os compostos
ub´ıquos nas rea¸oes nas quais eles ao considerados como secund´arios.
Com o objetivo de identificar alvos potenciais para drogas, Rahman e Schom-
burg (2006) utilizaram uma medida, semelhante a centralidade de intermedia¸ao
(Betweenness centrality), para identificar enzimas ou rea¸oes que podem ser con-
sideradas como choke points da rede. Esses pontos ao, por exemplo, enzimas que
consomem e/ou produzem unicamente um dado metab´olito. Dessa forma, eles ao
considerados pontos bioquimicamente essenciais na rede, tendo em vista que remo-
ver uma ´unica enzima choke point da rede afetaria o consumo ou a produ¸ao do(s)
2
Medidas descritas na se¸ao metodologia.
10
metab´olito(s) ligado a ela. A partir da compara¸ao dessa medida entre duas es-
p´ecies filogeneticamente pr´oximas, sendo apenas uma patogˆenica, enzimas cruciais
para a sobrevivˆencia do pat´ogeno foram prop ostas.
Liu et al. (2007) analisaram a rela¸ao entre o perfil filogen´etico de uma en-
zima, ou o n´umero de esp´ecies de bact´erias que o cont´em, e a sua importˆancia
topol´ogica em grafos de enzimas. Os autores indicaram que o perfil filogen´etico de
uma enzima correlaciona melhor com o grau e com a centralidade de intermedia¸ao,
e menos com a centralidade de proximidade (closeness centrality). A centralidade
de intermedia¸ao mede a propor¸ao dos menores caminhos que passam pelo o i
em rela¸ao ao n´umero total de menores caminhos entre todos os pares de os do
grafo. A centralidade de proximidade mede a proximidade de um o em rela¸ao a
todos os outros, sendo a edia dos menores caminhos entre o o i e todos os os
alcan¸aveis a partir de i. Entretanto, a dire¸ao das rea¸oes e os compostos ub´ıquos
ao foram considerados na reconstru¸ao do grafo, o que enfraquece um pouco os
resultados.
Takemoto et al. (2007) investigaram o efeito da temp e ratura na estrutura das
redes metab´olicas de procariotos classificados de acordo com a varia¸ao na tem-
peratura de crescimento: hiperterm´ofilos, term´ofilos, mes´ofilos e psicr´ofilos. Essas
an´alises revelaram correla¸oes estatisticamente significativas entre esses dois fato-
res; entretanto, essa correla¸ao ao ´e forte. Dessa forma, os autores sugerem que
fatores ambientais desempenham um papel importante nos princ´ıpios que modelam
as redes, mas que outra for¸ca ex´ogena, al´em da temperatura, p ode ser igualmente
respons´avel por essa modelagem. Nesse estudo, a influˆencia dos compostos ub´ıquos
foi avaliada, co mparando os resultados em redes completas e em redes em que estes
foram removidos. A correla¸ao entre estrutura e temperatura tornou-se mais signi-
ficativa com a remo¸ao dos mesmos, indicando que essa correla¸ao ´e independente
dos metab´olitos ub´ıquos.
Nerima et al. (2010) compararam grafos preditos do n´ucleo metab´olico de
endoparasitas obrigat´orios e ao parasitas (vida livre e parasitas facultativos) com
11
o objetivo de ana lisar a redu¸ao das redes metab´olicas dos parasitas ao longo
do processo evolutivo. Os n´ucleos metab´olicos analisados compreendem apenas
algumas vias metab´olicas selecionadas, como glic´olise e pentose fosfato, pois estas
deveriam estar presentes em um ancestral comum de to do s os organismos presentes
no estudo. As an´alises foram realizadas em grafos de compostos. As redes dos
parasitas foram menores que as dos ao parasitas em n´umero de os e arestas;
entretanto, outros parˆametros, como diˆametro da rede e umero de arestas isoladas,
foram similares nos dois grupos.
Al´em disso, os autores avaliaram se os parasitas preferencialmente perderam
enzimas que catalisam rea¸oes que necessitam de AT P, por raz˜oes econˆomicas.
Ao contr´ario do esperado, os autores encontraram porcentagens significativamente
mais altas de enzimas que necessitam de ATP nos n´ucleos metab´olicos dos parasi-
tas, em compara¸ao aos ao parasitas.
1.4 Motivao
O estilo de vida pode ser considerado como a soma dos efeitos do ambiente de
um dado organismo e as asso cia¸oes que ele estabelece com outras esp´ecies (Cases
et al., 2003). No caso das bact´erias intracelulares obrigat´orias, o ambiente ´e restrito
`a elula do hospedeiro. A vida intracelular apresenta press˜oes seletivas espec´ıficas,
como a redu¸ao do genoma e, a consequente perda de vias metab´olicas inteiras.
Alguns desses tra¸cos evolutivos ao comuns a todas as bact´erias intracelulares e
outros ao espec´ıficos ao tipo de associa¸ao estabelecida com o hospedeiro. A inati-
vao de vias cujos produtos finais estejam dispon´ıveis no meio pode ser favorecida
pela sele¸ao natural (Moran, 2007). Em parasitas obrigat´orios, parece ser favore-
cida a perda de genes para utilizar substratos ao encontrados no seu ambiente
restrito e para sintetizar produtos metab´olicos fornecidos pelo hospedeiro (Moran,
2007). Em esp´ecies mutualistas cuja associa¸ao com o hospedeiro ´e nutricional,
a conservao de vias necess´arias `a asso c ia¸ao parece ser selecionada (Baumann
et al., 1995; Shigenobu et al., 2000; erez-Brocal et al., 2006; McCutcheon e Moran,
12
2007; opez-S´anchez et al., 2009).
O n´umero crescente de genomas de organismos sequenciados possibilita a rea-
liza¸ao de an´alises comparativas de cole¸oes de indiv´ıduos a presentando diferentes
estilos de vida. As reconstru¸oes metab´olicas, a partir desses dados, permitem a
obten¸ao de listas de rea¸oes e de vias metab´olicas preditas. A maneira cl´assica de
identificar e comparar as capacidades metab´olicas de um grupo de organismos ´e
verificar sucessivamente a presen¸ca de vias metab´olicas de referˆencia em cada uma
das redes metab´olic as reconstru´ıdas. Al´em de ser um processo demorado e restri-
tivo em n´umero de organismos analisados, ele ´e igualmente limitante em rela¸ao
`a explora¸ao da rede. Esta fica restrita apenas `as vias metab´olicas selecionadas
a priori, possivelmente ao permitindo a explora¸ao de toda a rede metab´olica.
Desta forma, a an´alise global das redes metab´olicas permite explorar as capacida-
des metab´olicas de um n´umero maior de organismos sem uma sele¸ao a priori.
Diversos estudos comparativos de conjuntos de indiv´ıduos com diferentes
estilos de vida tˆem sido feitos. Dentre as an´alises sistˆemicas das capacidades me-
tab´olicas de cole¸oes de organismos, muitas vezes falta detalhamento na influˆencia
de cada indiv´ıduo nos resultados; os g rupos analisados ao pouco espec´ıficos em re-
la¸ao `as caracter´ısticas das associa¸oes estabelecidas; a modelagem das redes nem
sempre leva em conta os compostos ub´ıquos e a dire¸ao das rea¸oes; entre outros.
13
Cap´ıtulo 2
Objetivos
2.1 Objetivo geral
O objetivo geral do presente trabalho ´e analisar a rela¸ao entre estilos de vida
de bact´erias, e composi¸ao e topologia das redes metab´olicas das mesmas; buscando
determinar tra¸cos comuns e divergentes entre e dentre os grupos de estilos de vida.
2.2 Objetivos espec´ıficos
I- Comparar os conjuntos de genes, compostos e rea¸oes para analisar: (i) a
rela¸ao entre a propor¸ao de genes metab´olicos nos genomas das bact´erias e
seus estilos de vida; (ii) a existˆencia e a composi¸ao dos n´ucleos metab´olicos
nos diferentes grupos; e (iii) as partes da rede metab´olica que distinguem
os endocitobiontes mutualistas.
II - Comparar os grafos metab´olicos atrav´es de medidas locais e globais da
teoria de grafos para examinar: (i) as tendˆencias dessas medidas em rela¸ao
ao tamanho das redes metab´olicas (n´umero de os) e os estilos de vida
das bact´erias; (ii) os elementos das redes metab´olicas que se destaquem
nessas medidas para alguns organismos; e (iii) a possibilidade de propor
uma interpreta¸ao biol´ogica pertinente para tais medidas ao espec´ıficas
`as redes metab´olicas.
14
A disserta¸ao est´a organizada em mais trˆes cap´ıtulos. O cap´ıtulo 3 apre-
senta os crit´erios da sele¸ao do conjunto de organismos, algumas caracter´ısticas
dos mesmos e os grupos de estilos de vida utilizados nas an´alises. Al´em disso,
consta a origem dos dados, os sistemas e bancos de dados utilizados, a modelagem
das redes metab´olicas, a descri¸ao das medidas realizadas nos grafos metab´olicos
e as an´alises estat´ısticas.
O cap´ıtulo 4 apresenta os resultados dividido em duas partes. A primeira
consiste na compara¸ao dos conjuntos de genes, compostos e rea¸oes das redes
metab´olicas das 58 bact´erias, e uma an´alise mais detalhada do grupo de endo-
citobiontes mutualistas. A segunda parte apresenta os resultados das medidas
realizadas nos grafos de compostos para todo o conjunto de organismos.
A discuss˜ao dos resultados obtidos consta no cap´ıtulo 5, e as conclus˜oes e as
perspectivas do presente estudo encontram-se no cap´ıtulo 6.
15
Cap´ıtulo 3
Metodologia
3.1 Conjunto de organismos
O conjunto de organismos utilizado neste trabalho ´e formado por 58 bac-
t´erias que apresentam estilos de vida variados em rela¸ao ao estabelecimento de
associa¸oes simbi´oticas obrigat´orias ou facultativas.
O primeiro ponto da sele¸ao consistiu em utilizar uma ´unica plataforma de
anota¸ao de genomas para a obten¸ao dos dados necess´arios de cada organismo. A
plataforma selecionada foi MicroScope, Microbial Genome Annotation Platform,
(Vallenet et al., 2009) localizada no Genoscope, o centro nacional de sequencia-
mento francˆes. Essa plataforma possui projetos de (re)anota¸ao de genomas de
microrganismos organizados em um banco de dados relacional, Prokaryotic Ge-
nome Database (PkGDB), conectada com bancos de da dos de vias metab´olicas
(MicroCyc). Dessa forma obteve-se um conjunto de dados mais uniforme, o que ´e
importante para a realiza¸ao de uma an´alise comparativa de diversos organismos.
Considerando a disponibilidade de bact´erias nesse banco de dados
1
, passou-
se `as outras etapas da sele¸ao. Constavam 449 bact´erias, sendo os trˆes filos mais
bem representados: Proteobacteria com 295, Firmicutes com 55 e Actinobacteria
com 46. Em rela¸ao `as classes mais frequentes, encontram-se as γ-proteobact´erias
com 138 organismos, α-proteobact´erias com 80 e β-proteobact´erias com 56.
A segunda etapa consistiu em selecionar um conjunto de organismos que
1
Acesso em mar¸co de 2010.
16
apresenta uma significativa diversidade de associa¸oes simbi´oticas. Al´em disso,
foram utilizados dados da literatura sobre este opico acrescido das informa¸oes
dispon´ıveis sobre intera¸oes no banco de dados HAMAP (Lima et al., 2009). Fo-
ram selecionadas 52 bact´erias as quais apresentam associa¸oes simbi´oticas mutua-
listas, comensais e/ou paras´ıticas com organismos de quatro filos: Chordata (27),
Arthropoda (21), Streptophyta (9) e Nematoda (2)
2
. Al´em disso, selecionou-se seis
bact´erias que ao apresentavam descri¸oes de intera¸oes, sendo que rela¸oes sapro-
f´ıticas ao foram consideradas.
As classes taxonˆomicas dos 58 organismos do conjunto de dados constam na
Tabela 3.1.
Tabela 3.1: umero de organismos por classe taxonˆomica.
ACT ALP BAC BET CHL DEL EPS FLA GAM MOL
N° organismos 3 10 8 4 1 2 3 2 23 2
ACT: Actinobacteria, ALP: α -proteobacteria, BAC: Bacilli, BET: β-proteobacteria,
CHL: Chlamydiae, DEL: δ-proteobacteria, EPS: -proteobacteria, FLA: Flavobacteria,
GAM: γ-proteobacteria, MOL: Mollicutes.
Com o objetivo de formar grupos de organismos a serem comparados, as
seguintes informa¸oes foram pesquisadas na literatura: tipo de associa¸ao estabe-
lecida com o(s) seu(s) hospedeiro(s), se a intera¸ao ´e obrigat´oria ou facultativa para
a bact´eria e para o seu hospedeiro, a localiza¸ao da bact´eria quando em associa¸ao
(intracelular ou extracelular) e a forma de transmiss˜ao da bact´eria (Tabela A.1 em
anexo). As associa¸oes foram classificadas em mutual´ısticas (16), comensais (7) e
paras´ıticas (29). O car´ater da associa¸ao para a bact´eria foi chamado de O (Obri-
gat´orio) e F (Facultativo), diferenciando do car´ater da associa¸ao para o hospedeiro
em P (Prim´ario) e S (Secund´ario), considerando que apresentar um simbionte pri-
ario indica o car´ater obrigat´orio da associa¸ao. A localiza¸a o foi considerada
intracelular apenas quando a bact´eria ´e intracelular obrigat´oria (16). Bact´erias
intracelulares facultativas, localizadas na superf´ıcie da elula do hospedeiro ou ex-
tracelulares com etapas intracelulares foram agrupadas na categoria associada `a
2
Alguns organismos apresentam associa¸oes com hospedeiros de diferentes filos.
17
c´elula (17). As bact´erias restantes, que apresentam alguma associa¸ao descrita,
formam o grupo extracelular (19). As bact´erias sem asso cia¸ao descrita formam o
grupo vida livre (6). O modo de transmiss˜ao foi classificado como vertical (16) e
horizontal (3 6). Algumas bact´erias classificadas com transmiss˜ao vertical tamb´em
apresentam transmiss˜ao horizontal descrita, mas elas foram mantidas apenas no
primeiro grupo.
Os grupos utilizados para as an´alises apresentadas neste trabalho considera-
ram o tipo de associa¸ao, a localiza¸ao e a transmiss˜ao (Figura 3.1).
Figura 3.1: Conjunto de organismos agrupados segundo estilos de vida. Os odigos
dos organismos correspondem aos utilizados no HAMAP.
18
3.2 Compara¸ao das redes metab´olicas
3.2.1 Compara¸ao dos conjuntos de compostos e de rea¸oes
As informa¸oes sobre genes, metab´olitos e rea¸oes foram extra´ıdas do Mi-
croCyc/MicroScope. MicroCyc ´e uma cole¸ao de bancos de dados de genomas e
de vias metab´olicas de microrganismos que ao criados no contexto dos projetos
MicroScope, utilizando o sistema Pathway tools (Karp et al., 2002).
As redes metab´olicas das 58 bact´erias foram modeladas e filtradas no Met-
Explore (Cottret et al., 2010a). Esse ´e um banco de dados de redes metab´olicas
cujas informa¸oes ao provenientes de bancos de dados BioCyc-like, incluindo o
MicroCyc. Al´em disso, filtros e fun¸oes podem ser aplica das nas redes metab´olicas
e estas podem ser exportadas em diferentes modelos de grafos.
O foco da compara¸ao do conjunto de redes metab´olicas ´e o metabolismo
de pequenas mol´eculas. As rea¸oes em que participam macromol´eculas ao foram
consideradas, como as rea¸oes de s´ıntese e de modifica¸oes de prote´ınas, de mo-
difica¸oes no DNA, etc. Para restring ir as an´alises ao metabolismo de pequenas
mol´eculas foi utilizado o filtro disponibilizado pelo MetExplore. Esse filtro con-
sidera a ontologia do BioCyc (Karp et al., 2 005) para separar as rea¸oes entre
duas classes disjuntas: rea¸oes de pequenas mol´eculas e rea¸oes de macromol´ecu-
las. A ´ultima classe ´e formada por rea¸oes em que um ou mais participantes ao
macromol´eculas.
As compara¸oes dos conjuntos de compostos e de rea¸oes baseiam-se nos
identificadores BioCyc. Cada rea¸ao ´e considerada no seu todo, ao sendo dividida
em subrea¸oes que a comp˜oem. Assim, a decomposi¸ao de ATP em ADP e fosfato,
presente em diversas rea¸oes, ao ´e considerada como uma rea¸ao a parte.
No decorrer das an´alises, as informa¸oes gerais sobre vias metab´olicas, rea-
¸oes e compostos ao provenientes do MetaCyc (Caspi et al., 2008). As interse¸oes,
uni˜oes e edias dos conjuntos de comp ostos e de rea¸oes foram calculadas em R (R
Development Core Team, 2009). As representa¸oes gr´aficas dos dados igualmente
foram realizadas em R. Nessas, os organismos frequentemente foram ordenados
19
conforme o n´umero de genes.
3.2.2 Compara¸ao da topologia das redes metab´olicas
3.2.2.1 Modelagem das redes metab´olicas
As redes metab´olicas foram modeladas em grafos de compostos utilizando o
MetExplore. A modelagem das redes metab´olicas sob a forma de grafos permite
utilizar m´etodos pr´oprios da teoria de grafos para analisar as caracter´ısticas globais
do grafo, como a topologia.
Al´em disso, a modelagem das redes metab´olicas para realizar medidas em
grafos frequentemente requer a utiliza¸ao de filtros, com o objetivo de evitar certos
artefatos provenientes da natureza dos dados. Levando isso em conta, os cofatores
e metab´olitos extremamente frequentes foram filtrados dos grafos de comp ostos
utilizando os filtros disponibilizados pelo MetExplore. O filtro, que remove pa-
res de cofatores, consiste em uma lista de 62 transforma¸oes de cofatores. Por
exemplo, a transforma¸ao: ATP -> ADP + Pi (ou reversa), esses trˆes metab´olitos
ao removidos das rea¸oes nas quais essa transforma¸ao consta. A remo¸ao dos
metab´olitos extremamente f requentes consiste em retirar compostos inorgˆanicos
altamente conectados.
A dire¸ao das rea¸oes foi atribu´ıda igualmente pelo MetExplore, conforme
regra a seguir: se uma rea¸ao ocorre sempre na mesma dire¸ao em qualquer via
metab´olica que ela participe, dentre as presentes no MetaCyc, ela ser´a considerada
irrevers´ıvel; caso contr´ario, ser´a revers´ıvel.
3.2.2.2 Medidas em grafos
Uma vez que a rede metab´olica esteja mode lada na forma de um grafo, as
medidas cl´assicas da teoria de grafos podem ser utilizadas. Alguns exemplos das
mesmas ao diˆametro, distˆancia, grau e centralidade.
A distˆancia entre dois os i e j ´e o comprimento do caminho mais curto entre
esses dois os. Dito de outra forma, ´e o n ´umero m´ınimo de arestas que deve ser
20
utilizado para passar de um o i ao o j. No grafo de compostos, a distˆancia entre
dois os representa o n´umero m´ınimo de rea¸oes para produzir um metab´olito a
partir de outro. A distˆancia edia, ou seja, o tamanho edio dos caminhos, no
grafo de compostos indica o n´umero de rea¸oes utilizadas em m´edia para produzir
um meta b´olito a partir de outro, considerando que a produ¸ao de um metab´olito
com o m´ınimo de etapas ´e selecionada.
O diˆametro de um grafo ´e o mais longo entre todos os mais curtos caminhos
entre dois os quaisquer de um grafo. Em um grafo de compostos, o diˆametro
mede o n´umero aximo de passos (rea¸oes) para produzir um metab´olito a partir
de outro. Essa medida permite ter uma ideia da compacidade do grafo.
O grau do o i ´e o n´umero de arestas que o ligam a outros os. Sendo
o grafo direcionado, separamos em grau de entrada e grau de sa´ıda. Assim, em
grafos de compostos, o grau de sa´ıda de um o i corresponde ao n´umero de produtos
distintos de rea¸oes que utilizam i como substrato. O grau de entrada de um o
i corresponde ao n´umero de compostos distintos que participam de rea¸oes que
produzem i. O valor do grau dos os do grafo de compostos de cada organismo
foi normalizado pelo n´umero total de arestas do grafo multiplicado por dois, o que
equivale `a soma dos graus observados no grafo.
Uma maneira de medir a centralidade de um o i ´e a centralidade de inter-
media¸ao (betweenness centrality). Essa mede a propor¸ao dos menores caminhos
que passam por i em rela¸ao ao n´ume ro total de menores caminhos de um o u a
um o v para todo u e v. A normaliza¸ao utilizada foi o n´umero de pares de os
ao incluindo i, i.e.,
(n1)(n2)
2
sendo n o n´umero de os do grafo. Em um grafo de
compostos, a centralidade de intermedia¸ao de um o pode significar o n´umero de
caminhos metab´olicos nos quais este o participa.
As medidas nos grafos foram realizadas em R atrav´es das fun¸oes dispon´ıveis
na biblioteca igraph (Csardi e Nepusz, 2006). Essas medidas foram utilizadas para
descrever e comparar as redes metab´olicas. Entretanto, a interpreta¸ao dessas
medidas requer precau¸ao pela natureza da rede e de seus objetos (Lacroix et al.,
21
2008).
3.3 An´alises estat´ısticas
As An´alises de Correspondˆencia M´ultipla (ACM) e as An´alises de Compo-
nentes Principais (ACP) foram realizadas em R utilizando a biblioteca ade4 (Dray
e Dufour, 2007).
A ACM foi utilizada para analisar a presen¸ca de comp ostos e de rea¸oes
no conjunto de organismos, visto que tanto o conjunto de organismos quanto os
conjuntos de compostos e de rea¸oes ao numerosos. A ACM permite estudar uma
popula¸ao de I indiv´ıduos descritos por J vari´aveis qualitativas. Cada uma dessas
vari´aveis (conjuntos de compostos ou de rea¸oes) ´e uma aplica¸ao do conjunto
I de indiv´ıduos em um conjunto finito de modalidades, nesse caso, presen¸ca ou
ausˆencia de cada composto ou rea¸ao. Esses dados est˜ao organizados em uma
tabela de Indiv´ıduos x Vari´aveis qualitativas. As linhas representam os indiv´ıduos e
as colunas representam as vari´aveis: na interse¸ao da linha i e da co luna j encontra-
se o valor x
ij
do indiv´ıduo i pela vari´avel j, sendo x
ij
= 0 quando o composto ou
rea¸ao est´a ausente e x
ij
= 1 quando presente.
A An´alise de Componentes Principais (ACP) se aplica `as tabelas Indiv´ıduos
x Vari´aveis quantitativas. A ACP foi utilizada para analisar os graus dos os nos
grafos de compostos dos 58 organismos. Dessa forma, a organiza¸ao das tabelas de
dados ao semelhantes `as mencionadas acima, estando os organismos representados
nas linhas e as vari´aveis (n´os do grafo de compostos) nas colunas. Na interse¸ao
da linha i e da coluna k encontra-se o valor x
ik
, que representa o grau do o
normalizado (vari´avel k) no indiv´ıduo i. Considerando dois indiv´ıduos, a ACP
avalia a sua semelhan¸ca de acordo com a quantidade de valores pr´oximos que
eles possuem para o conjunto de vari´aveis a partir do alculo de distˆancia entre
os indiv´ıduos i e j. A rela¸ao entre duas vari´aveis ´e medida pelo coeficiente de
correla¸ao linear.
As rea¸oes que a presentaram as mais altas taxas de correla¸ao na ACM
22
foram analisadas em tabelas de presen¸ca/ausˆencia de rea¸oes para o conjunto de
organismos em quest˜ao. Foram selecionadas as 20 rea ¸oes apresentando as taxas
de correla¸ao mais elevadas, acrescidas do conjunto de rea¸o es com a mesma taxa
de correla¸ao que a vig´esima selecionada. O limite inferior estabelecido para a
sele¸ao das mesmas foi uma taxa de correla¸ao de 50%. Nas an´alises da segunda
componente da ACM para o grupo MIV, foram selecionadas todas as rea¸oes que
apresentaram taxa de correla¸ao superior `a 50%, tendo em vista os grupos de
padr˜oes op osto s encontrados. Nessas tabelas de presen¸ca/ausˆencia de rea¸oes, os
organismos est˜ao ordenados de acordo com a sua clusteriza¸ao pelo etodo de
clusteriza¸ao hier´arquica a partir de uma matriz de distˆancia euclidiana em R.
O grafo induzido das rea¸oes selecionados foi realizado no Cytoscape (Shan-
non et al., 2003). O modelo de grafo utilizado foi o grafo bipartido.
23
Cap´ıtulo 4
Resultados
4.1 Compara¸ao dos elementos que constituem as redes metab´olicas
4.1.1 Compara¸ao do conjunto de genes
O n´umero de genes das 58 bact´erias a nalisadas ´e consideravelmente vari´avel,
de 203 genes para Candidatus Hodgkinia cicadicola (HODCD) a 7279 genes para
Ralstonia eutropha (RALEH) (Figura 4.1a). Observa-se que o n´umero de genes
´e maior nas bact´erias extracelulares em compara¸ao `as intracelulares, o que vai
de acordo com a redu¸ao do genoma relacionada `a vida intracelular das bact´erias.
Nas bact´erias intracelulares, o n´umero de genes varia de 203 genes para H. ci-
cadicola (HODCD) a 1580 genes para Orientia tsutsugamushi (ORITB). a nas
bact´erias extracelulares, o n´umero de genes varia de 1836 genes para Streptococcus
thermophilus (STR) a 7223 genes para Mycobacterium smegmatis (MYCS2), sendo
o intervalo do n´umero de genes disjunto nesses dois grupos. No entanto, o n´umero
de genes no grupo CA varia de 553 genes para Mycoplasma genitalium (MYCGE)
a 5886 genes para Bacillus anthracis (BACAN), passando pelo intervalo do n´u-
mero de genes dos outros dois grupos. No grupo FL, o n´umero de genes varia
2353 de genes para Thiomicrospira crunogena (THICR) a 7279 genes para R. eu-
tropha (RALEH), este tamb´em sendo um intervalo disjunto do grupo de bact´erias
intracelulares.
As trˆes classes taxonˆomicas mais frequentes no conjunto de organismos ana-
lisados ao γ-proteobacteria, α-proteobacteria e Bacilli (Tabela 3.1). Essas est˜ao
24
Figura 4.1: N´umero total de genes e de genes metab´olicos (barras menores) segundo
estilo de vida (a) e segundo classe taxonˆomica (b). Abrevia¸oes das esp´ecies e
de estilos de vida constam na Figura 3.1. Abrevia¸oes das classes taxonˆomicas
constam na Tabela 3.1.
bem distribu´ıdas em rela¸ao ao n´umero de genes (Figura 4.1b), sem demonstrar
uma liga¸ao entre filogenia e n´umero de genes.
O n´umero de genes metab´olicos varia de 49 para H. cicadicola (HODCD) a
1970 para M. smegmatis (MYCS2). Assim como o n´umero total de genes, o n´u-
mero de genes metab´olicos ´e maior nas bact´erias extracelulares em compara¸ao `as
intracelulares, variando de 421 genes para S. thermophilus (STRTD) a 1970 genes
para M. smegmatis (MYCS2) no primeiro grupo e de 49 genes para H. cicadicola
(HODCD) a 37 3 genes para Lawsonnia intracellularis (LAWIP) no segundo grupo.
Entretanto, a propor¸ao entre o n´umero de genes metab´olicos e o n´umero total de
genes apresenta impo rtantes diferen¸cas dependendo do organismo analisado (Fi-
gura 4.2). Os organismos dos grupos diferentes do MIV apresentam uma propor¸ao
m´edia de 21% (variˆancia de 0,001), contrastando com uma propor¸ao edia de 38%
25
Figura 4.2: Propor¸ao do n´umero de genes metab´olicos pelo n´umero de genes. Os
organismos est˜ao ordenados de acordo com o tamanho do seu genoma.
(variˆancia de 0,008) para as bact´erias do grupo MIV. Essa propor¸ao atinge 48%
para Baumannia cicadellinicola (BAUCH). Esse resultado diferencia significativa-
mente o grupo MIV dos outros grupos (teste de Wilcoxon, valor p = 5,984e-7,
α = 5%). O grupo MIV ´e formado por 11 bact´erias. As dez que apresentam as
propor¸oes mais elevadas correspondem `as bact´erias mais integradas (Nardon e
Grenier, 1993) e cuja associa¸ao com o hospedeiro ´e essencialmente nutricional.
Essas bact´erias perderam numerosos genes codantes para fun¸oes ao meta-
olicas, como virulˆencia, adapta¸ao a condi¸oes extremas, excre¸ao, entre outros
(Moran, 2007; Moran et al., 2008; Moya et al., 2008). Por outro lado, algumas fun-
¸oes metab´olicas foram perdidas enquanto outras relacionadas `a simbiose fo ram
conservadas, o que pode explicar a grande propor¸ao de genes metab´olicos nessas
bact´erias.
O endocitobionte mutualista do nemat´odeo Brugia malayi, Wolbachia pipi-
26
entis wBm (WOLTR), apresenta a propor¸ao mais baixa do grupo M IV (21,3%),
semelhante aos organismos dos outros grupos. Esta ´e ligeiramente mais elevada
que a da Wolbachia pipientis wMel (WOLPM) (19,7%), entretanto, elas apresen-
tam capacidades metab´olicas semelhantes (Foster et al., 2005). Este ´e o ´unico
integrante do grupo MIV cujo hospedeiro ao ´e um inseto. Al´em disso, W. pipien-
tis wBm (WOLTR) ´e a bact´eria que apresenta o maior n´umeros de genes (1188)
no grupo MIV, com uma diferen¸ca consider´avel e m compara¸ao a Candidatus Blo-
chmannia floridanus (BLOFL) (718), que ´e a segunda em n´umero de genes. A
sua associa¸ao com o nemat´odeo ´e considerada mutual´ıstica obrigat´oria visto que
a bact´eria ´e essencial para o desenvolvimento normal e para a fertilidade do hos-
pedeiro (Taylor et al., 2005). No entanto, pode-se imaginar, por exemplo, que essa
rela¸ao simbi´otica tenha se tornado indispens´avel ao hospedeiro mais recentemente
que para B. aphidicola e os af´ıdeos, uma vez que W. pipientis wBm (WOLTR) foi
perdida em alguns nemat´odeos (Casiraghi et al., 2004; Taylor et al., 2005).
H. cicadicola (HODCD) apresenta uma propor¸ao relativamente baixa em
compara¸ao ao grupo. A rede metab´olica deste organismo est´a bastante fragmen-
tada. Salvo a via de s´ıntese de histidina, as outras apresentam muitos passos
faltantes (McCutcheon et al., 2009).
Analisando os outros grupos, observa-se os valores mais baixos da propor¸ao
de genes metab´olicos em rela¸ao ao n´umero de genes para Listeria monocytoge-
nes (LISMO) (13,5%), Sodalis glossinidius (SODGM) (13,7%) e O. tsutsugamushi
(ORITB) (14%). S. glossinidius (SODGM) ´e um endocitobionte secund´ario de
moscas tsetse (Dale e Maudlin, 1999). O tamanho do seu cromossomo ´e seme-
lhante ao de micr´obios de vida livre, entretanto esta bact´eria apresenta um perfil
bioqu´ımico bastante inativo se comparada a E nterobacteriacea de vida livre relacio-
nadas (Dale e Maudlin, 1999). A an´alise do seu genoma indicou genes faltantes ou
erodidos para metabolismo de carboidratos, de grada¸ao de amino´acidos, produ¸ao
e convers˜ao de energia via respira¸ao anaer´obica; al´em disso, esta ao seria capaz
de fermentar anaerobicamente lactato e butirato, e ao teria a passagem secund´a-
27
ria do glioxalato funcional (Toh et al., 2006). Em geral, S. glossinidius (SODGM)
parece ter ma ntido vias do anabolismo ao inv´es do catabolismo (Toh et al., 2006).
Os outros dois organismos com as menores propor¸oes de genes metab´olicos
em rela¸ao a o n´umero total de genes ao paras itas. L. monocytogenes (LISMO)
´e um pat´ogeno humano de origem alimentar. A reconstru¸ao do metabolismo de
L. monocytogenes (LISMO), realizada quando seu genoma foi sequenciado, indicou
que as vias de s´ıntese de quatro vitaminas (riboflavina, biotina, tiamina, e lipoato)
estavam faltando ou incompletas (Glaser et al., 2001). O. tsutsugamushi (ORITB)
´e um parasita intracelular obrigat´orio de ´acaros com transmiss˜ao vertical e ´e um
pat´ogeno em pequenos roedores e humanos.
´
E marcante a diferen¸ca na propor¸ao
encontrada para Rickettsia typhi (RICTY) (24%), visto a proximidade filogen´etica
de ambas e as semelhan¸cas em rela¸ao ao estilo de vida. A an´alise comparativa
do genoma dessas duas esp´ecies da fam´ılia Rickettsiaceae indicou uma perda mais
extensiva de enzimas metab´olicas em Orientia que em Rickettsia, incluindo meta-
bolismo de carboidratos e lip´ıdios e s´ıntese de membrana e parede celular (Fuxelius
et al., 2007). Os autores concluem que o genoma de O. tsutsugamushi (ORITB) ´e
mais dependente metabolicamente dessa fam´ılia at´e aquele momento.
Assim como a dependˆencia metab´olica de O. tsutsugamushi (ORITB), era
esperado que parasitas de uma maneira geral resultassem em uma propor¸ao menor
do genoma dedicada ao metabolismo considerando a obten¸ao de nutrientes do
hospedeiro. No entanto, esses organismos ao se apresentaram significativamente
distintos das bact´erias do grupo FL em rela¸ao a propor¸ao de genes metab´olicos
(teste de Wilcoxon, valor p = 0,6233, α = 5%).
4.1.2 Compara¸ao dos conjuntos de compostos e de rea¸oes
4.1.2.1 Interse¸ao dos conjuntos de compostos e de rea¸oes
Os compostos resultantes da reconstru¸ao do metabolismo ao substratos
ou produtos das rea¸oes bioqu´ımicas inferidas. Os metab´olitos provenientes do
exterior da c´elula da bact´eria, que ao est˜ao envolvidos em alguma rea¸ao como
28
substratos, ao foram inclu´ıdos. Al´em disso, as an´alises foram restritas a o metabo-
lismo de pequenas mol´eculas, consequentemente, macromol´eculas como prote´ınas
ou ´acidos nucl´eicos ao foram inclu´ıdas.
O n´umero de compostos e de rea¸oes nas 58 bact´erias analisadas segue o
mesmo padr˜ao que o n´umero de genes metab´olicos, variando de 98 compostos e
42 rea¸oes para H. cicadicola (HODCD) a 1381 compostos e 11 66 rea¸oes para
M. smegmatis (MYCS2) (Figure 4.3).
A Tabela 4.1 apresenta, respectivamente, o valor edio, o tamanho da uni˜ao
e o tamanho da interse¸ao dos conjuntos de compostos e de rea¸oes nos diferentes
grupos de estilos de vida. O tamanho da uni˜ao do conjunto de compostos nos or-
ganismos intracelulares (798) ´e consideravelmente importante quando comparado
ao n´umero m´edio de compostos (302), indicando uma certa diversidade de meta-
Figura 4.3: a. N´umero total de compostos. b. N´umero total de rea¸oes. Os
organismos est˜ao ordenados de acordo com o tamanho do seu genoma.
29
boloma nesses organismos. O valor edio representa 38% do conjunto total de
compostos nesse grupo que ´e bastante pr´oximo aos 41% encontrado nos extrace-
lulares. Do mesmo modo, o valor m´edio do n´umero de rea¸oes representa 30% da
uni˜ao das rea¸oes nos intracelulares e 36% nos extracelulares. No entanto, quando
comparamos o tamanho da interse¸ao dos conjuntos de compostos e de rea¸o es nos
dois grupos, os valores se distanciam consideravelmente. Encontramos 23 e 206
compostos, respectivamente, representando 8% e 23% em rela¸ao ao valor m´edio
de cada grupo. O mesmo ocorre analisando os conjuntos de rea¸oes, os valores
das interse¸oes representam 0,5% e 12% em rela¸ao ao valor m´edio de cada grupo.
Isso mostra que o universo de compostos e rea¸oes no grupo dos organismos in-
tracelulares ´e consideravelmente diverso, entretanto os elementos comuns ao mais
restritos.
Apenas 18 comp ostos ao comuns aos 58 organismos (Tabela 4.2). Entre
eles est˜ao cofatores como ATP, amino´acidos e metab´olitos envolvidos na s´ıntese
de ´acidos nucl´eicos. Surpreendentemente, nenhuma rea¸ao do metabolismo de
pequenas mol´eculas est´a presente em todos os organismos do conjunto de dados
analisado. Portanto, os 18 compostos encontrados nos 58 organismos ao est˜ao
envolvidos nas mesmas rea¸oes.
30
Tabela 4.1: Valor edio, tamanho da uni˜ao e da interse¸ao dos conjuntos de compostos e de rea¸oes nos diferentes grupos de estilos de vida.
Compostos Rea¸oes
N° Organismos edia (m) Uni˜ao (u) Intersao (i) edia (m) Uni˜ao (u) Intersao (i)
MIV 11 289 665 24 203 566 1
PIV 3 297 450 182 188 327 91
PIH 2 383 529 237 267 408 126
Intra 16 302 798 23 209 705 1
% Intra 16 m/u = 38% i/m = 8% i/u = 3% m/u = 30% i/m = 0,5% i/u = 0,1%
MCAV 2 601 792 411 493 682 304
PCAH 15 717 1798 81 598 1716 17
CA 17 703 1805 81 585 1725 17
%CA 17 m/u = 39% i/m = 12% i/u = 4% m/u = 34% i/m = 3% i/u = 1%
Intra+CA 33 509 1833 18 403 1754 0
% Intra+CA 33 m/u = 28% i/m = 4% i/u = 1% m/u = 23% i/m = 0% i/u = 0%
MEH 3 1040 1466 668 877 1336 479
CEH 7 848 1859 243 706 1750 128
PEH 9 913 1829 308 773 1736 163
Extra 19 909 2206 206 765 2143 94
%Extra 19 m/u = 41% i/m = 23% i/u = 9% m/u = 36% i/m = 12% i/u = 4%
FL 6 847 1626 349 711 1548 202
%FL 6 m/u = 52% i/m = 41% i/u = 21% m/u = 46% i/m = 28% i/u = 13%
Extra+FL 25 894 2270 194 752 2232 84
%Extra+FL 25 m/u = 39% i/m = 22% i/u = 9% m/u = 34% i/m = 11% i/u = 4%
Total 58 675 2330 18 553 2285 0
%Total 58 m/u = 29% i/m = 3% i/u = 0,8% m/u = 24% i/m = 0% i/u = 0%
31
O valor nulo para a interse¸ao do conjunto de rea ¸oes tamb´em foi encon-
trado considerando apenas os grupos intracelular e CA (Intra+CA). Mais espe-
cificamente, apenas uma rea¸ao qu´ımica est´a presente em todos os organismos
do grupo MIV: rea¸ao 3.5.1.88 (3.5.1.88-RXN, MetaCyc). Essa rea¸ao consiste
na convers˜ao de formil-L-metionil pept´ıdeo e ´agua em metionil pept´ıdeo e ´acido
ormico e a mesma ao est´a assinalada em vias metab´o licas. A enzima que a ca-
talisa ´e uma hidrolase, pet´ıdeo deformilase (Def), a qual libera o grupo formil de
um res´ıduo de metionina amino terminal da maioria dos polipept´ıdeos nascentes
(Adams, 1968), um passo obrigat´orio na matura¸ao de prote´ınas em eubact´erias
(Rajagopalan et al., 1997). Essa enzima requer pelo menos um dipept´ıdeo como
substrato (Rajagopalan et al., 1997). De fato, essa rea¸ao est´a presente em todos os
organismos do conjunto analisado exceto em Mycoplasma hyopneumoniae J (MY-
CHJ). A ausˆencia de Def nessa bact´eria, juntamente com a falta de metionil-tRNA
formiltransferase (Fmt), aparentemente acarreta a incapacidade de formila¸ao de
Met-tRNAi (Vasconcelos et al., 2005). Ambas igualmente foram descritas ausen-
tes em Phytoplasma sp. e ao essenciais em Mycoplasma arthritidis (Vasconcelos
et al., 2005; Dybvig et al., 2008).
As 94 rea¸oes presentes em todas as bact´erias extracelulares correspondem
`as vias metab´olicas classicamente consideradas como envolvidas no metabolismo
central, como glic´olise, pentose fosfato e ciclo do ´acido tricarbox´ılico (TCA), al´em
de vias de s´ıntese e de degrada¸ao de amino´acidos e s´ıntese de nucleot´ıdeos e de
peptideoglicano. Entre os 206 compostos resultantes da interse¸ao das bact´erias
extracelulares, encontram-se amino´acidos, carboidratos, nucleos´ıdeos, cofatores,
´ıons e lip´ıdios. Os compostos e as rea¸oes resultantes nas interse¸oes de bact´erias
extracelulares e de vida-livre (Extra+FL) ao essencialmente o s mesmos acima
mencionados. Para o grupo CA, os compostos resultantes da interse¸ao ao nova-
mente os mesmos, enquanto que as rea¸oes ao essencialmente participantes das
vias da glic´olise, pentose fosfato e s´ıntese e degrada¸ao de nucleot´ıdeos. A inter-
se¸ao das rea¸oes para o grup o CA sem as duas bact´erias do gˆenero Mycoplama
32
Tabela 4.2: Compostos comuns a todos os organismos do conjunto de dados.
Compostos Classifica¸ao
pyruvate Acids
L-alanine Amino Acids
L-cysteine Amino Acids
L-glutamate Amino Acids
L-glutamine Amino Acids
L-serine Amino Acids
D-ribose-5-phosphate Carbohydrates
coenzyme A Cofactors
an acceptor Generic Class
a reduced acceptor Generic Class
diphosphate Ions
phosphate Ions
H+ (PROTON) Ions
AMP Nucleosides
ADP Nucleosides
ATP Nucleosides
formate Unclassified-Compounds
H2O (WATER) Unclassified-Compounds
resulta nas mesmas vias metab´olicas encontradas para as extracelulares.
Assim como a interse¸ao nula para rea¸oes, a interse¸ao de compostos para
os 58 organismos (18 compostos) foi obtida no conjunto Intra+CA. Da mesma
forma, os cinco compostos que diferenciam a interse¸ao dos grupos Intracelular e
CA ao foram encontrados em M. hyopneumoniae (MYCHJ) (os cinco compostos)
e M. genitalium (MYCGE) (um composto). Esse par de bact´erias ´e o q ue mais
influencia a pequena interse¸ao do grupo CA, visto que ´e o par que remove mais
compostos ou rea¸oes no grupo. Na ausˆencia das duas, as interse¸oes no grupo CA
seriam 198 compostos e 88 rea¸oes, valores consideravelmente maiores que 81 e 17,
respectivamente. Os valores das m´edias se elevam a 773 compostos e 650 rea¸oes
em compara¸ao a 703 e 585, respectivamente. Cabe salientar que os valores de
uni˜ao do grupo CA ao se alteram com a retirada dessas duas bact´erias.
Para avaliar se os valores pequenos das interse¸oes devem-se `as bact´erias com
as menores quantidades de compostos e rea¸oes, elas foram removidas sucessiva-
mente do conjunto de organismos e as interse¸oes foram recalculadas (Figura 4.4).
33
Os valores obtidos para os trˆes primeiros organismos removidos foram 24, 31 e
37 comp ostos e 0, 0 e 2 rea¸oes, respectivamente, mostrando que esses mant´em-
se consideravelmente baixos mesmo com a retirada dos organismos com as redes
metab´olicas bastante degradadas.
Figura 4.4: Interse¸oes de conjuntos de comp ostos (a) e de rea¸oes (b) removendo
sucessivamente os organismos com os menores n´umeros de compostos e rea¸oes.
34
4.1.2.2 An´alise de Correspondˆencia M´ultipla (ACM) dos conjuntos
de compostos e de rea¸oes
A presen¸ca/ausˆencia de metab´olitos e de rea¸oes em todo o conjunto de
organismos foi avaliada utilizando An´alise de Correspondˆencia M´ultipla (ACM). A
an´alise de ambos elementos nas redes metab´olicas resultou em uma dispers˜ao muito
semelhante dos organismos. Desta forma, apenas os resultados para o conjunto de
rea¸oes ser˜ao apresentados.
A proje¸ao das duas primeiras componentes da ACM do conjunto de rea¸oes
consta na Figura 4.5. Nesta, observa-se que as bact´erias intracelulares e as duas do
gˆenero Mycoplasma est˜ao agrupadas (Figura 4.5a). Isso possivelmente deve-se `a
distribui¸ao dos organismos na primeira componente essencialmente em fun¸ao do
tamanho da rede metab´olica. Por outro lado, analisando esse mesmo resultado com
base nas classes taxonˆomicas das bact´erias (Figura 4.5b), observa-se, no quadrante
superior direito, principalmente γ-proteobact´erias da Fam´ılia Enterobacteriaceae.
Nos outros quadrantes, ao parece haver agrupamentos relacionado `a filogenia das
bact´erias.
No presente conjunto de organismos, constam 15 representantes da Fam´ı-
lia Enterobacteriaceae permeando diferentes grup o s de estilos de vida: cinco no
grupo MIV, as duas do grupo MCAV, cinco no grupo PCAH e 3 extracelulares
(duas no grupo PEH e uma no grupo CEH). Nove deles est˜ao nesse mesmo qua-
drante, os quais possuem as maiores redes metab´olicas (a partir de 735 compostos
e 623 rea¸oes r elativas `a S. glossinidius (SODGM)) considerando essa fam´ılia. As
seis ba ct´erias restantes ao componentes dos grupos MIV (cinco) e MCAV (uma).
Dessa forma, a segunda componente da ACM parece estar distanciando os organis-
mos, que apresentam redes maiores que a de S. glossinidius (SODGM), com base
na filogenia. Cabe salientar que esse efeito ao ´e observado nas redes metab´olicas
menores.
A primeira componente explica mais de 16% da variabilidade dos dados. As
rea¸oes com taxa de correla¸ao superiores a 60% nesse eixo est˜ao ausentes nos
35
Figura 4.5: ACM da presen¸ca/ausˆencia de r ea¸oes em todo o conjunto de organis-
mos. Proje¸ao dos dois primeiros eixos. a. Cores segundo estilos de vida. C´ırculo:
bact´erias intracelulares e as duas do enero Mycoplasma. b. Cores segundo classes
taxonˆomicas.
36
organismos que apresentam as redes metab´olicas mais reduzidas e presentes nos
outros. Grande parte dessas rea¸oes participa da via de β oxida¸ao ´acidos graxos
e outras duas est˜ao envolvidas no ciclo do glioxalato (Figura 4.6).
O ciclo do glioxalato ´e uma variante do ciclo TCA que passa por duas rea¸oes
alternativas (ausentes no ciclo TCA), permitindo que o organismo use substratos
que entram no metabolismo central do carbono ao n´ıvel de acetil-CoA como ´unica
fonte de carbono. Tais substratos incluem os ´acidos graxos, ´alcoois e ´esteres. Essas
duas rea¸oes alternativas do ciclo do glioxalato correspondem `as enzimas malato
sintase (EC 2.3.3.9) e isocitrato liase (EC 4.1.3.1), as quais foram encontradas
na an´alise do primeiro eixo da ACM acima mencionada. Observa-se na Figura
4.6 que essas duas rea¸oes est˜ao ausentes at´e S. glossinidius (SODGM), ou seja,
em todos os organismos com n´umero de genes metab´olicos inferior a 639. Como
mencionado anteriormente, S. glossinidius (SODGM), apesar de aparentemente
ter mantido arias capacidades metab´olicas de bact´erias de vida livre, como o ciclo
TCA, ao apresenta a passagem secund´aria do glioxalato funcional (Toh et al.,
2006). Da mesma forma, as bact´erias com n´umeros de genes metab´olicos inferiores
a S. glossinidius (SODGM), ac rescendo-se a essas Bacillus subtilis (BACSU), ao
apresentaram as rea¸oes chave dessa varia¸ao do ciclo TCA.
A segunda e a terceira componentes da ACM realizada para todo o conjunto
de organismos representam apenas 8% e 6% da variabilidade dos dados, respectiva-
mente. As rea¸oes com taxa de corr ela¸ao mais elevada nessas duas componentes
apresentaram taxas inferiores a 50%, i.e., abaixo do limite estabelecido para as
an´alises.
4.1.3 Redu¸ao diferencial do metabolismo nos endocitobiontes
4.1.3.1 Vias de s´ıntese de flavina e de peptideoglicano
Considerando o tamanho reduzido da interse¸ao no grupo MIV, uma an´alise
mais detalhada desse grupo de bact´erias mutualistas intracelulares obrigat´orias foi
realizada. Esse grupo ´e formado p or 11 organismos, duas flavobact´erias: Can-
37
Figura 4.6: Tabela de presen¸ca/ausˆencia de rea¸oes com taxas de correla¸ao
superiores a 60% no primeiro eixo da ACM do conjunto total de organismos. O qua-
drado indica a presen¸ca da rea¸ao no organismo da coluna correspondente. Nas
colunas, os organismos est˜ao ordenados em fun¸ao do n´umero de genes metab´olicos,
crescendo da esquerda para a direita. Nas linhas, encontra-se a taxa de correla¸ao,
o nome e o n´umero EC de cada rea¸ao.
38
didatus Sulcia muelleri GWSS (SULMW) e Blattabacterium sp. Bge (BLASB);
duas α-proteobat´erias: H. cicadicola (HODCD) e W. pipientis wBm (WOLTR); e
as sete restantes ao γ-proteobact´erias. O umero total de rea¸oes deste grupo ´e
566 e a distribui¸ao das mesmas nas 11 bact´erias foi analisada utilizando ACM da
tabela de presen¸ca/ausˆencia de rea¸oes para reduzir a complexidade dos dados. A
proje¸ao dos dois primeiros eixos da ACM est´a representada na Figura 4.7.
A proje¸ao dos organismos na primeira comp o nente agrupa as quatro bac-
t´erias com o metabolismo mais reduzido no lado esquerdo desse eixo em rela¸ao
`a origem. Essa componente explica mais de 27% da variabilidade dos dados. De
fato, essa comp onente apresenta a presen¸ca das rea¸oes com taxa de correla¸ao
mais alta no lado direito do eixo em rela¸ao `a o rigem, e a ausˆencia das mesmas no
Figura 4.7: ACM da presen¸ca/ausˆencia de rea¸oes nos organismos do grupo MIV.
Proje¸ao dos dois primeiros eixos. C´ırculo: grupo de bact´erias que possuem as
menores redes meta b´olicas. Retˆangulo: um dos grupos que se distinguem na
segunda componente.
39
lado esquerdo.
As rea¸oes com taxa de correla¸ao superior a 85% seguem o padr˜ao acima
mencionado, estando presentes em todas as bact´erias do grupo MIV salvo nas qua-
tro com as redes metab´olicas mais reduzidas, as quais ao H. cicadicola (HODCD),
Candidatus Carsonella ruddii (CARRP), S. muelleri (SULMW) e Buchnera aphi-
dicola Cc (BUCCC) (Figura 4.8). Nesse grupo encontram-se essencialmente rea-
¸oes envolvidas nas vias de s´ıntese de flavina, de s´ıntese de peptideoglicano e de
s´ıntese de purinas.
O grafo induzido por esse grupo de rea¸oes e seus substratos e produtos na
rede metab´olica de referˆencia do MetaCyc ´e composto por quatro componentes co-
nexos e 11 rea¸oes isoladas. Dois desses componentes conexos e uma rea¸ao isolada
participam da via de s´ıntese de flavina, a partir de guanosina-trifosfato (GTP) e
D-ribulose-5-fosfato formando flavina adenina dinucleot´ıdeo (FAD) (Figura 4.9).
Um componente conexo consiste na s´ıntese de peptideoglicano. E o componente
conexo restante permeia a via de s´ıntese de inosina-5-fosfato (uma rea¸ao) e a via
de s´ıntese de novo de nucleot´ıdeos de adenosina (duas rea¸oes).
A via de s´ıntese de flavina permite a forma¸ao de riboflavina, tamb´em cha-
mada de vitamina B2, e dos cofatores essenciais riboflavina-5’-fosfato (FMN) e
FAD. Essa via foi recuperada praticamente completa, faltando apenas trˆes das
nove rea¸oes (MetaCyc). Dentre as trˆes faltantes, uma ´e respons´avel pelo quarto
passo dessa via, entretanto ao existe evidˆencia para uma fosfatase espec´ıfica para
essa rea¸ao em Escherichia coli. Sugere-se que ela seja catalisada por uma fosfa-
tase com especificidade de substrato ampla (MetaCyc). As duas restantes est˜ao
presentes em H. cicadicola (HODCD), em raz˜ao disso, elas ao estariam nesse
conjunto de rea¸oes que distinguem esses dois grupos de organismos.
Para as bact´erias Buchnera aphidicola APS (BUCAI), B. floridanus (BLOFL),
Candidatus Blochmannia pennsylvanicus (BLOPB), B. cicadellinicola (BAUCH),
Wigglesworthia glossinidia (WIGBR), Blattabacterium sp. Bge (BLASB), a via
de s´ıntese de flavina ´e considerada completa (Zientz et al., 2004; Degnan et al.,
40
Figura 4.8: Tabela de presen¸ca/ausˆencia das rea¸oes com taxas de correla¸ao supe-
riores a 85% no segundo eixo da ACM do grupo MIV. O quadrado indica a presen¸ca
da rea¸ao no organismo da coluna correspondente. Nas linhas, encontra-se a taxa
de correla¸ao, o nome e o n´umero EC de cada rea¸ao.
41
Figura 4.9: Grafo induzido pelas rea¸oes com taxa de correla¸ao sup erior a 85%
no primeiro eixo da ACM para o grupo MIV. C´ırculos: correspondem `as rea¸oes.
Quadrados: correspondem aos compostos. Setas tracejadas: indicam passos
faltantes.
2005; opez-S´anchez et al., 2009; McCutcheon et al., 2009). B. aphidicola Cc
(BUCCC), assim como C. ruddii (CARRP) e S. muelleri (SULMW), ao apresen-
tam nenhuma rea¸ao da s´ıntese de flavina. Essa cepa B. aphidicola perdeu arias
fun¸oes metab´olicas em compara¸ao aos genomas de outras previamente sequen-
ciadas, incluindo a capacidade de pro duzir o amino´acido tript ofano e riboflavina
(P´erez-Brocal et al., 2006).
A f un¸ao simbi´otica de S. muelleri (SULMW), como endocitobionte prim´ario
da cigarrinha Homalodisca vitripennis, ´e fornecer oito dos dez amino´acidos essen-
ciais; enquanto o cosimbionte prim´ario B. cicadellinicola (BAUCH) fornece os dois
amino´acidos essenciais restantes (histidina e metionina) e vitaminas, incluindo ri-
boflavina (McCutcheon e Moran, 2007). A complementaridade metab´o lica desses
dois endocitobiontes prim´arios cor esidentes e o intercˆambio de metab´olitos entre os
trˆes organismos envolvidos nesse sistema simbi´otico a foram bastante explorados
(Wu et al., 2006; McCutcheon e Moran, 2007; Cottret et al., 2010b), concordando
com o aparecimento das duas bact´erias em grupos distintos em rela¸ao `a pres en¸ca
de vias metab´olicas.
A cigarra Diceroprocta semicincta tamb´em foi descrita com um par de endoci-
42
tobiontes prim´arios coresidentes, Candidatus Sulcia muelleri SMDSEM (SULMS)
e H. cicadicola (HODCD). As duas cepas de S. muelleri (SULMW) apresentam
conte´udo enico praticamente idˆentico mesmo apresentando pelo menos 200 mi-
lh˜oes de anos de divergˆencia (McCutcheon e Moran, 2007). Os autores constataram
que B. cicadellinicola (BAUCH) e H. cicadicola (HODCD) convergiram em con-
juntos gˆenicos apresentando capacidades similares para bioss´ıntese de amino´acidos.
Entretanto, a capacidade de s´ıntese de vitaminas ´e divergente, sendo a s´ıntese da
riboflavina a ´unica com uma certa sobreposi¸ao de genes.
A s´ıntese de p e pt´ıdeoglicano descreve a bios´ıntese de um monˆomero de pep-
t´ıdeoglicano a partir de UDP-N-acetil-D-glicosamina e fosfoenolpiruvato (PEP)
(MetaCyc) a qual foi encontrada completa para B. aphidicola APS (BUCAI),
B. floridanus (BLOFL), B. pennsylvanicus (BLOPB), W. glossinidia (WIGBR),
Blattabacterium sp. Bge (BLASB), B. cicadellinicola (BAUCH). Peptideoglicano
´e o ´unico pol´ımero de parede celular comum a bact´erias gram-negativas e gram-
positivas (MetaCyc). Esse precursor de parede celular aparentemente foi perdido
nas quatro bact´erias cujas redes metab´olicas ao mais reduzidas. B. aphidicola Cc
(BUCCC) est´a descrita como pr´oxima de uma elula de livre difus˜ao, na qual a
maioria dos metab´olitos podem ser trocados passivamente atrav´es desse envelope
celular altamente simplificado (P´erez-Brocal et al., 2006).
A pequena parte da s´ıntese de purinas encontrada ser´a discutida juntamente
com a segunda componente da ACM.
4.1.3.2 S´ıntese de amino´acidos essenciais nos endocitobiontes
Analisando a proje¸ao do s eixos 2 e 3 da ACM para o grupo MIV (Figura
4.10a), observa-se um distanciamento consider´avel de Blattabacterium sp. Bge
(BLASB). Considerando esse distanciamento, os eixos 2 e 3 foram analisados com
(I) e sem (II) essa bact´eria no conjunto de dados em paralelo. Na Figura 4.10b,
apresenta-se a proje¸ao dos eixos 2 e 3 da ACM para o grupo MIV sem Blattabac-
terium sp. Bge (BLASB).
43
Figura 4.10: ACM da presen¸ca/ausˆencia de rea¸oes nos organismos do grupo MIV
I (a) e II (b). Proje¸ao dos eixos 2 e 3.
A segunda componente da ACM para o grupo MIV I e II explica 17% e 19%
da variabilidade dos dados, respectivamente. O n´umero de rea¸oes com taxa de
correla¸ao superior a 50% nessa componente foram 39 (I) e 41 (II), respectivamente.
Os organismos foram divididos em dois grupos com padr˜oes opostos em rela¸ao `a
presen¸ca e `a ausˆencia de grupos de rea¸oes, sendo A e B em I e C e D em II (Figura
44
4.11).
O grupo A ´e formado por B . floridanus (BLOFL), B. pennsylvanicus (BLOPB),
S. muelleri (SULMW), Blattabacterium sp. Bge (BLASB) e o grupo de rea¸oes ´e
Figura 4.11: Tabela de presen¸ca/ausˆencia de rea¸oes com taxas de correla¸ao su-
periores a 50% no segundo eixo da ACM do grupo MIV I (a) e II (b). O quadrado
indica a presen¸ca da rea¸ao no organismo da coluna correspondente.
45
essencialmente constitu´ıdo pela via de s´ıntese de corismato e por vias de s´ıntese
de amino´acidos essenciais: leucina, valina, isoleucina, lisina, t reonina, fenilalanina
e triptofano. O grupo C ´e o grupo correspo ndente do grupo A em II. O grupo
C ´e formado B. floridanus (BLOFL), B. pennsylvanicus (BLOPB), S. muelleri
(SULMW), B. aphidicola APS (BUCAI), ou seja, retira-se Blattabacterium sp. Bge
(BLASB) e acrescenta-se B. aphidicola APS (BUCAI). As rea¸oes do grupo C ao
um subconjunto daquelas do grupo A, faltando (i) as sete rea¸oes correspondentes
`a via de s´ıntese de triptofano; (ii) a rea¸ao treonina desidratase (THREDEHYD-
RXN, n´umero EC 4.3.1.19) que resulta em um passo faltante na via de s´ıntese de
isoleucina a partir de treonina; (iii) uma rea¸ao que participa da via de s´ıntese de
menaquinona-8 e (iv) uma rea¸ao que participa da via de s´ıntese de uquinona-8.
Cabe ressaltar que B. aphidicola APS (BUCAI) ao participou do grupo A pela
falta de trˆes rea¸oes (ii, iii e iv); as sete rea¸oes que participam da via de s´ıntese
de triptofano est˜ao presentes nessa bact´eria. A s´ıntese de isoleucina nessa bact´eria
est´a descrita como sendo a partir de α-ceto-butirato e piruvato, considerando a
ausˆencia da rea¸ao treonina desidratase (Zientz et al., 2004).
O grupo B ´e formado por W. glossinidia (WIGBR) e W. pipientis wBm
(WOLTR), e o conjunto de rea¸oes ´e essencialmente constitu´ıdo pela via de s´ıntese
de heme e apenas uma rea¸ao que participa da via de s´ıntese de purinas. O grupo
D ´e o grupo correspondente ao B em II. O grupo D ´e formado exatamente pelos
mesmo dois organismos: W. glossinidia (WIGBR) e W. pipientis wBm (WOLTR).
As rea¸oes do grupo D ao um superconjunto daquelas do grupo B, acrescentando
rea¸oes de vias de s´ıntese de purinas.
O grafo induzido pelas rea¸oes do grupo A (superconjunto de C) e seus subs-
tratos e produtos na rede metab´olica de referˆencia do MetaCyc ´e composto por
(i) um grande componente conexo, o qual permeia as vias de s´ıntese de corismato,
fenilalanina, triptofano, valina, leucina, isoleucina e treonina, (ii) um segundo com-
ponente conexo formado por duas rea¸oes que participam da via de s´ıntese de co-
rismato, e (iii) cinco rea¸oes isoladas. Os dois componentes conexos e a rea¸ao
46
isolada que participa da s´ıntese de lisina est˜ao apresentados na Figura 4.12.
Corismato ´e um importante intermedi´ario para a s´ıntese de metab´olitos es-
senciais, como amino´acidos arom´aticos (L-fenilalanina, L-tirosina e L-triptofano),
vitaminas E e K, ubiquinona e sider´oforos (MetaCyc). A s´ıntese de corismato no
conjunto de rea¸oes do grupo A tem como objetivo a produ¸ao dos dois amino´acidos
arom´aticos essenciais L-fenilalanina e L-triptofano a partir de D-eritrose-4-fosfato.
A s´ıntese de L-tirosina, um amino´acido arom´atico ao essencial, ao consta no con-
junto de rea¸oes do grupo A. As trˆes rea¸oes envolvidas na s´ıntese desse amino´acido
est˜ao presentes em Blattabacterium sp. Bge (BLASB), B. floridanus (BLOFL) e
B. pennsylvanicus (BLOPB). De fato, rea¸oes de s´ıntese de amino´acidos a o es-
senciais ao foram encontradas no grupo A. A bact´eria Blattabacterium sp. Bge
(BLASB), por exemplo, apresenta genes codificando para enzimas biossineticas
necess´arias para a s´ıntese dos dez amino´acidos essenciais (histidina, triptofano,
fenilalanina, leucina, isoleucina, valina, lisina, treonina, arginina, e metionina) e
de sete ao essenciais (glicina, tirosina, ciste´ına, serina, glutamato, aspartato, e
alanina) (L´opez-S´anchez et al., 2009).
Figura 4.12: Grafo induzido pelas rea¸oes do grupo A com taxa de co rrela¸ao
superior a 53% no segundo eixo da ACM para o grupo MIV. C´ırculos: correspon-
dem `as rea¸oes. Quadrados: correspondem aos compostos. Setas tracejadas:
indicam passos faltantes.
47
Dentre os dez amino´acidos essenciais, as vias de s´ıntese de sete deles constam
no grupo A, faltando arginina, metionina e histidina. B. floridanus (BLOFL) per-
deu a maior parte da via de s´ıntese de arginina (Gil et al., 2 003), o que demonstra
que rea¸oes que participam da s´ıntese desse amino´acido ao constariam no grupo
A. Ainda assim, a arginina foi proposta como tendo um papel essencial na rela¸ao
simbi´otica entre B. floridanus (BLOFL) e seu hosp edeiro, a formiga Campono-
tus floridanus, visto que a bact´eria reteve as enzimas que catalisam a s´ıntese de
citrulina a partir de ornitina, fornecendo citrulina para o hospedeiro (Gil et al.,
2003). Dentre os organismos do grupo MIV, S. muelleri (SULMW) e B. aphidi-
cola APS (BUCAI) ao as ´unicas que apresentam todas as rea¸oes que participam
da via de s´ıntese de arginina. Para Blattabacterium sp. Bge (BLASB) falta uma
das nove rea¸oes envolvidas na s´ıntese desse amino´acido. Apesar de estar descrita
como tendo mantido a capacidade de s´ıntese de todos os amino´acidos essenciais
necess´arios para o seu hospedeiro, os af´ıdeos, exceto triptofano (P´erez-Brocal et al.,
2006), B. aphidicola Cc (BUCCC) apresenta apenas cinco das nove rea¸oes da via
de s´ıntese de arginina que constam na tabela de prese n¸ca e ausˆencia de rea¸oes.
As quatro rea¸oes para a via de s´ıntese de metionina est˜ao presentes em
B. cicadellinicola (BAUCH), B. floridanus (BLOFL), B. pennsylvanicus (BLOPB)
e faltando apenas uma para Blattabacterium sp. Bge (BLASB). A via de s´ıntese
de histidina est´a completa para B. aphidicola Cc (BUCCC), B. aphidicola APS
(BUCAI), Blattabacterium sp. Bge (BLASB), B. cicadellinicola (BAUCH), B. flo-
ridanus (BLOFL) e B. pennsylvanicus (BLOPB). H. cicadicola (HODCD) apre-
senta sete das dez rea¸oes. Como rea¸oes para a s´ıntese de ambos est˜ao ausentes
em S. muelleri (SULMW), essas a o poderiam constar no grupo A. Esses ´ult imos
dois amino´ac idos essenciais (metionina e histidina), ao os ´unicos dois amino´acidos
que cabem a B. cicadellinicola (BAUCH) e H. cicadicola (HODCD) fornecerem
ao hospedeiro, visto que os cosimbiontes S. muelleri (SULMW) e Candidatus Sul-
cia muelleri SMDSEM (SULMS) respectivamente, ao possuem rea¸oes dessas
vias, como mencionado na an´alise do primeiro eixo da ACM. Concordando com
48
a co mplementaridade metab´olica dos pares de simbiontes coresidentes, estes apre-
sentam padr˜oes opostos em rela¸ao `a presen¸ca e `a ausˆencia de rea¸oes, salvo para
as quatro rea¸oes da via de s´ıntese de corisma to encontradas concomitantemente
em B. cicadellinicola (BAUCH) e em S. muelleri (SULMW), visto que o composto
em quest˜ao ´e utilizado por S. muelleri (SULMW) para a s´ıntese de amino´acidos
arom´aticos e em B. cicadellinicola (BAUCH) para a s´ıntese de tetrahidrofolato
(vitamina B9) (Cottret et al., 2010b). Computando a interse¸ao das rea¸oes de
todos os pares de bact´erias do grupo MIV, observa-se que os valores mais baixos
para B. cicadellinicola (BAUCH) e H. cicadicola (HODCD) ao as respectivas in-
terse¸oes com S. muelleri (SULMW): 22 e cinco rea¸oes respectivamente. Esses
tamb´em ao os dois valores de interse¸ao mais baixos para S. muelleri (SULMW)
contra qualquer outro organismo do grupo MIV (Tabela 4.3).
Tabela 4.3: Interse¸ao do conjunto de rea¸oes entre pares de organismos do grupo
MIV.
CARRP SULMW BUCCC BUCAI BLASB BAUCH BLOFL WIGBR BLOPB WOLTR
HODCD 8 5 15 20 20 25 23 10 25 8
CARRP - 43 46 48 50 32 55 35 56 32
SULMW - - 43 61 71 22 58 28 59 25
BUCCC - - - 100 81 77 93 56 93 46
BUCAI - - - - 154 173 165 139 175 102
BLASB - - - - - 167 186 136 197 124
BAUCH - - - - - - 195 203 217 141
BLOFL - - - - - - - 172 285 118
WIGBR - - - - - - - - 189 156
BLOPB - - - - - - - - - 138
Fornecer a seus respectivos hospedeiros os sete amino´acidos essenciais en-
contrados no grupo A ´e a fun¸ao simbi´otica predita para S. muelleri (SULMW) e
B. aphidicola APS (BUCAI) (McCutcheon e Moran, 2007; Baumann et al., 1995;
Shigenobu et al., 2000). B. floridanus (BLOFL), B. pennsylvanicus (BLOPB) e
Blattabacterium sp. Bge (BLASB) tem como fun¸ao simbi´otica predita o metabo-
lismo de nitrogˆenio. Por outro lado, a conservao da maioria das vias de s´ıntese de
amino´acidos essenciais, nessas bact´erias, indica que essas vias tamb´em devem ter
um papel importante na simbiose (Zientz et al., 2004; opez-S´anchez et al., 2009).
As rea¸oes faltantes para as vias de s´ıntese encontradas no grupo A apresentam
padr˜oes de ocorrˆencia diferentes, geralmente estando presentes na grande maio-
49
ria dos organismos. Assim, essas ao est˜ao inclu´ıdas nas rea¸oes com as maiores
taxas de correla¸ao, ao sendo essas as que melhor distinguem os organismos do
conjunto de dados em quest˜ao. As rea¸oes para a s´ıntese de lisina ao um bom
exemplo, das quais pelo menos sete das nove existentes est˜ao presentes em C. ruddii
(CARRP), S. muelleri (SULMW), B. aphidicola Cc (BUCCC), B. aphidicola APS
(BUCAI), Blattabacterium sp. Bge (BLASB), B. floridanus (BLOFL), W. glossi-
nidia (WIGBR), B. pennsylvanicus (BLOPB), W. pipientis wBm (WOLTR), ou
seja, ausentes apenas em H. cicadicola (HODCD) e B. cicadellinicola (BAUCH).
A ´unica rea¸ao da s´ıntese de lisina encontrada no grupo A corresponde ao ´ultimo
passo da s´ıntese de L-lisina a partir de meso-diaminopimelato. Em W. glossinidia
(WIGBR) e W. pipientis wBm (WOLTR), essa rea¸ao est´a ausente e a via de
s´ıntese de lisina termina em meso-diaminopimelato, sendo esse o ´unico amino´acido
produzido por W. pipientis wBm (WOLTR) (Foster et al., 2005; Zientz et al.,
2004).
Os organismos, que realmente ao apresentaram a s´ıntese dos sete amino´aci-
dos encontrados no grupo A, ao as duas bact´erias do grupo B (W. glossinidia
(WIGBR) e W. pipientis wBm (WOLTR)), H. cicadicola (HODCD) e B. cica-
dellinicola (BAUCH). H. cicadicola (HODCD) resultou na ausˆencia de todas as
rea¸oes com taxa de correla¸ao superior a 50%. B . cicadellinicola (BAUCH) apre-
sentou as rea¸oes de s´ıntese de corismato comentadas anteriormente e as rea¸oes
de s´ıntese de purinas, estando mais pr´oxima dos grupos B e D.
B. aphidicola Cc (BUCCC) e C. ruddii (CARRP) apresentaram padr˜ao de
presen¸ca de rea¸oes semelhante ao grupo C (subconjunto de A). Ambas ao apre-
sentam as rea¸oes do grupo A ausentes em C, i.e., (i) as sete rea¸oes corresponden-
tes `a via de s´ıntese de triptofano; (ii) a rea¸ao treonina desidratase (THREDEHYD-
RXN, n´umero EC 4.3.1.19) que resulta em um passo faltante na via de s´ıntese de
isoleucina a partir de treonina; (iii) uma rea¸ao que participa da via de s´ıntese de
menaquinona-8 e (iv) uma rea¸ao que participa da via de s´ıntese de uquinona-8.
Acrescidas as rea¸oes acima mencionadas, C. ruddii (CARRP) ao apresenta
50
as duas ´unicas rea¸oes correspondentes `a via de s´ıntese fenilalanina presentes em A
e C (corismato mutase e prefenato desidratase); e a rea¸ao homoserina quinase que
participa da forma¸ao de treonina a partir de homoserina. Sendo a ssim, C. ruddii
(CARRP) apresenta os passos das vias de s´ıntese de corismato, valina, leucina,
isoleucina e lisina encontrados no grupo C de rea¸oes. C. ruddii (CARRP) ´e um
endocitobionte prim´ario do psil´ıdeo Pachypsylla venusta cuja nutri¸ao ´e baseada
no floema, assim como os af´ıdeos, hospedeiros de B. aphidicola (Nakabachi et al.,
2006; Clark et al., 2001). Como o floema da maioria das plantas ´e deficiente em
amino´acidos essenciais, sugere-se que C. ruddii (CARRP) e B. aphidicola tenham
as mesmas fun¸oes relacionadas `a nutri¸ao do hospedeiro (Clark et al., 200 1).
Entretanto, C. ruddii (CARRP) foi proposta como estando rumando para a dege-
nera¸ao e transformando-se em uma nova entidade subcelular entre elulas vivas e
organelas (Tamames et al., 2007). Os autores ainda sugerem que, como a maioria
dos genes relacionados `a s´ıntese de amino´acidos essenciais foram perdidos, possi-
velmente o hospedeiro dependa de outro simbionte para complementar a sua dieta
deficit´aria (Tamames et al., 2007).
Como mencionado anteriormente, a ´unica via de s´ıntese de amino´acidos es-
senciais ao conservada em B. aphidicola Cc (BUCCC), endocitobionte prim´ario
do af´ıdeo Cinara cedri, ´e a do triptofano (P´erez-Brocal et al., 2006). Foi proposto
um cons´orcio simbi´otico para fornecer triptofano ao hospedeiro, considerando a
presen¸ca do endo citobionte secund´ario Candidatus Serratia symbiotica (Gosalbes
et al., 2008). A sua classifica¸ao como endocitobionte secund´ario foi posta em ques-
ao visto os resultados em rela¸ao `a provis˜ao de triptofano ao hospedeiro (Gosalbes
et al., 2008). Outras cinco rea¸oes ausentes em B. aphidicola Cc (BUCCC) nos
resultados apresentados est˜ao envolvidas na s´ıntese de leucina. Os genes para a
s´ıntese desse amino´acido nessa bact´eria est˜ao localizados em um plasm´ıdeo (P´erez-
Brocal et al., 2006). Confirmando na base de dados MicroCyc/Genoscope a pre-
sen¸ca de sse pla sm´ıdeo (pLeu) para B. aphidicola Cc (BUCCC), observa-se a ausˆen-
cia do mesmo, enquanto que para B. aphidicola APS (BUCAI) ambos plasm´ıdeos
51
(pLeu, pTrp) ao encontrados nessa bact´eria. Logo, B. aphidicola Cc (BUCCC)
estaria inclu´ıda no grupo C, ao apresentando as rea¸oes acrescidas no grupo A.
O grafo induzido pelas rea¸oes do grupo D (superconjunto de B) e seus
substratos e produtos na rede metab´olica de referˆencia do MetaCyc ´e composto
por (i) um grande componente conexo, o qual participa das vias de s´ıntese de 5-
aminoimidazole ribonucleot´ıdeo e de s´ıntese de inosina-5-fosfato, (ii) um segundo
componente conexo formado por duas rea¸oes que participam da via de s´ıntese
de heme, e (iii) dez rea¸oes isoladas. Os dois componentes conexos, uma rea¸ao
isolada que participa da s´ıntese de heme, e outra rea¸ao isolada que participa da
via de s´ıntese de tetrapirrole est˜ao apresentados na Figura 4.13.
Heme (protoheme, heme b) ´e um grupo prost´etico contendo ferro importante
para o metab olismo oxidativo, al´em de atuar como mol´ecula regulat´oria em n´ıvel de
transcri¸ao, tradu¸ao, estabilidade de prote´ınas e diferencia¸ao celular (MetaCyc).
Todos os genes envolvidos na s´ıntese de protoheme a partir de uroporfirinogen-
III foram encontrados em W. glossinidia (WIGBR) (Akman et al., 2002). A con-
servao dessa via e de outras vias de s´ıntese de cofatores, grupos prost´eticos e
Figura 4.13: Grafo induzido pelas rea¸oes do grupo D com taxa de correla¸ao
superior a 53% no segundo eixo da ACM para o grupo MIV. C´ırculos: correspon-
dem `as rea¸oes. Quadrados: correspondem aos compostos. Setas tracejadas:
indicam passos faltantes.
52
vitaminas concordam com as necessidades nutricionais das moscas ts´e-ts´e visto
que o sangue de mam´ıferos ´e consideravelmente pobre em certos cofatores e vita-
minas (Zientz et al., 2004).
O heme est´a entre os metab´olitos preditos para serem fornecidos pela W. pi-
pientis wBm (WOLTR) para Brugia malayi (Foster et al., 2005). Apenas o gene
que codifica para protoporfirinogen oxidase (rea¸ao PROTOPORGENOXI-RXN)
dessa via de s´ıntese est´a ausente em W. pipientis wBm (WOLTR) e esse gene ao
foi encontrado em muitas α-proteobact´erias, sendo proposto que a bact´eria possua
uma forma funcional de protoporfirinogen oxidase (Foster et al., 2005). A rea¸ao
PROTOPORGENOXI-RXN ´e o passo faltante na via de s´ıntese do heme a partir
de uroporfirinogen-III apresentada na Figura 4.13.
As vias de s´ıntese de purinas foram encontradas nas duas primeiras compo-
nentes da ACM para o grupo MIV. Na segunda componente, encontra-se a s´ıntese
de 5-aminoimidazole ribonucleot´ıdeo (AIR) a partir de 5-fosforibosil-1-pirofosfato
(PRPP). O ´ultimo pode ter origem a partir da via pentose fosfato. Ainda na
segunda comp onente, encontram-se as duas primeiras rea¸oes da s´ıntese de ino-
sina monofosfato (IMP) (Figura 4.13). Essas rea¸oes envolvidas na s´ıntese de
purinas correspondem aos organismos B. cicadellinicola (BAUCH), W. glossini-
dia (WIGBR) e W. pipientis wBm (WOLTR). A grande maioria dessas rea¸oes
tamb´em est˜ao presentes em Blattabacterium sp. Bge (BLASB). Considera-se que
W. glossinidia (WIGBR) possui a via de s´ıntese de purina completa, virtualmente
idˆentica `a via correspondente de Escherichia coli K12 (ECOLI) (Zientz et al.,
2004). No entanto, B. aphidicola APS (BUCAI) e B. floridanus (BLOFL) per-
deram a via de transforma¸ao de PRPP via glicinamida ribonucleot´ıdeo (GAR)
ao intermedi´ario da s´ıntese de purinas, aminoimidazole carboxamida ribonucleot´ı-
deo (AICAR). Nenhuma rea¸ao ´e encontrada para essa parte de via de s´ıntese de
purinas nesses organismos, nem em B. pennsylvanicus (BLOPB), nem nas quatro
que apresentam as menores redes metab´olicas (H. cicadicola (HODCD), C. ruddii
(CARRP), S. muelleri (SULMW) e B. aphidicola Cc (BUCCC)). Por outro lado,
53
B. aphidicola APS (BUCAI) e B. floridanus (BLOFL) conservaram a via de s´ıntese
de histidina, assim esses organismos podem sintetizar AICAR a partir de PRPP via
5-fosforibulosil-formimino-AICAR (Zientz et al., 2004). Outras bact´erias que tam-
b´em conservaram a via de s´ıntese de histidina, como B. aphidicola Cc (BUCCC),
B. pennsylvanicus (BLOPB) e H. cicadicola (HODCD), podem sintetizar AICAR
da mesma forma, restando C. ruddii (CARRP) e S. muelleri (SULMW) sem essas
duas possibilidades de s´ıntese de AICAR.
Adicionando a parte da via de s´ıntese de purinas resultante da an´alise da pri-
meira componente da ACM para o grupo MIV, encontramos a ´ultima rea¸ao da via
de s´ıntese de IMP, assim como a transforma¸ao de IMP em adenosina mo nofosfato
(AMP) e fumarato. Essas foram encontradas para B. cicadellinicola (BAUCH),
W. glossinidia (WIGBR) e W. pipientis wBm (WOLTR), as mesmas trˆes que
apresentaram a transforma¸ao de PRPP a 5’-P-Ribosil-4-(N-succinocarboxamida)-
5-aminoimidazole (SAICAR, um passo anterior a AICAR) na an´alise da segunda
componente da ACM. Al´em desses organismos, as trˆes rea¸oes acima menciona-
das foram encontradas para B. floridanus (BLOFL), B. pennsylvanicus (BLOPB),
B. aphidicola APS (BUCAI) e Blattabacterium sp. Bge (BLASB).
Mesmo com a alternativa de utiliza¸ao da s´ıntese de histidina para produ-
zir AICAR em B. aphidicola Cc (BUCCC) e H. cicadicola (HODCD), ambas ao
apresentam as rea¸oes para a s´ıntese de AMP. C. ruddii (CARRP) e S. muelleri
(SULMW) tamb´em ao apresentam essas rea¸oes. Possivelmente todas elas depen-
dem do hospedeiro para a provis˜ao de purinas, como foi descrito para B. aphidicola
Cc (BUCCC) (P´erez-Brocal et al., 2006).
4.1.3.3 Rea¸oes ausentes na maioria dos endocitobiontes
A terceira componente da ACM para o grupo MIV I e II explica 14% e 13%
da variabilidade dos dados, respectivamente. As rea¸oes que apresentaram as taxas
de correla¸ao mais elevadas em I (superiores a 62%) e em II (superiores a 56%)
est˜ao indicadas na tabela de presen¸ca/ausˆencia de rea¸oes na Figura 4.14.
54
Diferentemente da segunda componente em que resultava em grupos de or-
ganismos com padr˜oes opostos da presen¸ca/ausˆencia de rea¸oes, na terceira com-
ponente observa-se um organismo que realmente se dis tanciou do resto com todas
as rea¸oes com taxa de correla¸ao mais alta presentes e a ausˆencia das mesmas na
grande maioria dos organismos do conjunto de dados.
Como mencionado anteriormente, a bact´eria que mais distinguiu-se do con-
junto de organismos nas componentes 2 e 3 da ACM do grupo MIV I foi Blattabac-
terium sp. Bge (BLASB). As rea¸oes com taxas de correla¸ao mais elevadas est˜ao
todas presentes em Blattabacterium sp. Bge (BLASB) e algumas delas est˜ao pre-
sentes em W. pipientis wBm (WOLTR) e W. glossinidia (WIGBR) (Figura 4.14a).
As vias metab´olicas correspondentes a essas rea¸oes mais frequentes foram: (i) o
ciclo TCA, (ii) a degrada¸ao de purinas, ( iii) a via do mevalonato, e (iv) a degra-
da¸ao de arginina. As rea¸oes envolvidas na degrada¸ao de purinas est˜ao presentes
nas trˆes bact´erias. A maio r parte das rea¸oes correspondentes ao ciclo TCA est´a
presente em Blattabacterium sp. Bge (BLASB) e W. pipientis wBm (WOLTR).
As restantes est˜ao presentes apenas em Blattabacterium sp. Bge (BLASB).
Uma por¸ao do grafo induzido p elo conjunto de rea¸oes do grupo MIV I na
rede metab´olica de referˆencia do MetaCyc est´a apresentada na Figura 4.15a. Nesta
constam, essencialmente, as rea¸oes do ciclo TCA compreendidas entre malato e α-
ceto-glutarato (via citrato) e parte da via do mevalonato. Quatro das cinco rea¸oes
apresentadas do ciclo TCA est˜ao presentes em Blattabacterium sp. Bge (BLASB)
e W. pipientis w Bm (WOLTR). As outras rea¸oes apresentadas no grafo, entre
elas as da via do mevalonato, est˜ao presentes apenas em Blattabacterium sp. Bge
(BLASB).
55
Figura 4.14: Tabela de presen¸ca/ausˆencia das rea¸oes com taxas de correla¸ao mais
altas na terceira componente da ACM do grupo MIV I (a) e II (b). O quadrado
indica a presen¸ca da rea¸ao no organismo da coluna correspondente.
56
Figura 4.15: Grafo induzido pelas rea¸oes com taxa de correla¸ao mais elevada
na terceira componente da ACM para o grupo MIV I (a) e II (b). C´ırculos:
correspondem `as rea¸oes. Quadrados: correspondem aos compostos.
57
Em estudo realizado com W. glossinidia (WIGBR), B. floridanus (BLOFL)
e B. aphidicola APS (BUCAI), foi indicada a inexistˆencia de um ciclo TCA reg ular
entre esses trˆe s endocitobiontes (Zientz et al., 2004), tendo as duas primeiras man-
tido as rea¸oes entre α-ceto-glutarato e oxaloacetato via s uccinato; e a terceira apre-
sentando ap enas a rea¸ao α-ceto-glutarato desidrogenase. A presen¸ca/ausˆencia das
dez rea¸oes do ciclo TCA, considerando duas rea¸oes entre malato e oxaloacetato,
para os organismos do grupo MIV est˜ao apresentadas na Tabela 4.4. Observa-se
que Blattabacterium sp. Bge (BLASB) e W. pipientis wBm (WOLTR) apresentam
consideravelmente mais rea¸oes relativas ao ciclo TCA.
Tabela 4.4: Presen¸ca/ausˆencia de rea¸oes participantes do ciclo TCA no grupo
MIV.
I II I II IV V VI VII VIII IX X
HODCD 0000000000
CARRP 0000010010
SULMW 0000110000
BUCCC 0000100000
BUCAI 0000100000
BLASB 1111110101
BAUCH 0000010110
BLOFL 0000111110
WIGBR 0000111110
BLOPB 0000111110
WOLTR 1110011101
O valor (1) indica presen¸ca da rea¸ao no organismo da li nha correspondente e o valor (0)
indica a ausˆencia. (I) Citrate (si)-synthase: 2.3.3.1; (II) Aconitate hydratase: 4.2.1.3;
(I II) ACONITATEHYDR-RXN: 4.2.1.3; (IV) Isocitrate dehydrogenase (NADP+): 1.1.1.42;
(V) 2OXOGLUTARAT EDEH-RXN: NA; (VI) Succinate–CoA ligase (ADP-forming): 6.2.1.5;
(VI I) Succinate dehydrogenase: 1.3.99.1; (VIII) Fumarate hydratase: 4.2.1.2; (IX) Malate
dehydrogenase (acceptor): 1.1.99.16; (X) Malate dehydrogenase: 1.1.1.37.
A via do mevalonato ´e uma das rotas poss´ıveis para a s´ıntese de isopentenil di-
fosfato (IPP). Este pode ser utilizado para a s´ıntese de lip´ıdios da classe polisoprenil
difosfato, os quais ao formados por repetidas unidades de isopreno. Analisando
o grafo filtrado de rea¸oes e compostos de Blattabacterium sp. Bge (BLASB),
observa-se a via do mevalolato relacionada a polisoprenil difosfato com diferentes
quantidades de unidades e especificamente o composto all-trans-octaprenil difos-
fato necess´ario para a s´ıntese de menaquinona-8.
Na terceira componente do grupo MIV II, o organismo que ma is distinguiu-
58
se do resto foi B. aphidicola APS (BUCAI), o qual apresenta todas as rea¸oes
com taxa de correla¸ao mais elevada nessa componente da ACM. Outros trˆes or-
ganismos, B. cicadellinicola (BAUCH), W. glossinidia (WIGBR) e B. aphidicola
Cc (BUCCC), apresentam algumas dessas rea¸o es. A presen¸ca e ausˆencia dessas
rea¸oes para cada organismo est´a apresentada na Figura 4.14b. Entre elas, observa-
mos rea¸oes participantes das vias de bioss´ıntese de biotina, nicotinamida-adenina
dinucleot´ıdeo (NAD), pantotenato e espermidina, e de degrada¸ao de purinas.
O grafo induzido dessas rea¸oes com taxas de correla¸ao mais elevadas, par-
ticipantes das vias de bioss´ıntese supramencionadas, est´a apresentado na Figura
4.15b.
As duas rea¸oes relacionadas `a via de s´ıntese de pantotenato est˜ao presen-
tes em B. aphidicola APS (BUCAI), B. cicadellinicola (BAUCH) e W. glossinidia
(WIGBR). A via de s´ıntese de pantotenato ´e formada por trˆes rea¸oes que conver-
tem α-cetovalina e β-alanina em pantotenato (MetaCyc). Pantotenato, vitamina
B
5
, ´e o precursor universal para a s´ıntese de coenzima A (parte fosfospantote´ına)
(MetaCyc).
Analisando a presen¸ca/ausˆencia das rea¸oes participantes das vias de s´ıntese
de pantotenato e de coenzima A, apresentada na Tabela 4.5, observa-se a ausˆencia
completa das mesmas em cinco organismos: H. cicadicola (HODCD), C. ruddii
(CARRP), S. muelleri (SULMW), B. aphidicola Cc (BUCCC) e B. floridanus
(BLOFL). Al´em disso, a ausˆencia de pelo menos metade delas ocorre em B. aphi-
dicola APS (BUCAI), Blattabacterium sp. Bge (BLASB) e W. pipientis wBm
(WOLTR). Isso possivelmente indica que esses oito endocitobiontes dependem do
seu hospedeiro para a obten¸a o dessa coenzima essencial, como foi proposto para
B. aphidicola APS (BUCAI) e B. floridanus (BLOFL) (Zientz et al., 2004).
B. cicadellinicola (BAUCH) apresenta todas as rea¸oes relacionadas `as duas
vias e W. glossinidia (WIGBR) apresenta sete das oito rea¸c ˜oes. A ´ultima foi pro-
posta como tendo a capacidade de sintetizar acetil coenzima A (acetil-CoA) sem
a assistˆencia do hospedeiro visto a presen¸ca do complexo piruvato desidrogenase
59
Tabela 4.5: Presen¸ca/ausˆencia de rea¸oes participantes da via de s´ıntese de pan-
totenato (I a III) e de coenzima A (IV a VIII) no grupo MIV.
I I I III IV V VI VII VIII
HODCD 00000000
CARRP 00000000
SULMW 00000000
BUCCC 00000000
BUCAI 10100011
BLASB 00010011
BAUCH 11111111
BLOFL 00000000
WIGBR 10111111
BLOPB 00011111
WOLTR 00000011
O valor (1) indica presen¸ca da rea¸ao no organismo da li nha correspondente e o valor (0)
indica a ausˆencia. (I) 3-methyl-2-oxobutanoate hydroxymethyltransferase: 2.1.2.11; (II) 2-
dehydropantoate 2-reductase: 1.1.1.169; (II I) Pantoate-β-alanine ligase: 6.3.2.1; (IV) Pan-
tothenate kinase: 2.7.1.33; (V) Phosphopantothenate–cysteine ligase: 6.3.2.5; (VI) Phospho-
pantothenoylcysteine decarboxylase: 4.1.1.36; (VII) Pantetheine-phosphate adenylyltransfe-
rase: 2.7.7.3; (VIII) Dephospho-CoA kinase: 2.7.1.24.
para oxidar piruvato em CO
2
e acetil-CoA (Zientz et al., 2004). B. cicadellinicola
(BAUCH) tamb´em cont´em esse complexo, possivelmente apresentando essa mesma
independˆencia do hospedeiro para a s´ıntese de acetil-CoA. Neste caso, B. cicadel-
linicola (BAUCH) teria que importar α-cetovalina para a s´ıntese de pantotenato
e coenzima A, considerando a ausˆencia de grande parte das vias de s´ıntese de
amino´acidos (Wu et al., 2006). Esse composto ´e possivelmente proveniente do
endocitobionte coresidente S. muelleri (SULMW) (McCutcheon e Moran, 2007).
Ainda sobre a via de s´ıntese de pantotenato e co enzima A, ´e surpreendente
a diferen¸ca na presen¸ca das rea¸oes entre B. floridanus (BLOFL) e B. pennsyl-
vanicus (BLOPB). Em B. floridanus (BLOFL), todas as rea¸oes est˜ao ausentes.
Entretanto, em B. pennsylvanicus (BLOPB) todas as rea¸oes participantes da v ia
de s´ıntese de coenzima A est˜ao presentes, e todas as participantes da s´ıntese de
pantotenato est˜ao ausentes. Essa diferen¸ca a havia sido constatada em rela¸ao `a
presen¸ca e `a ausˆencia dos genes coaADE e dtp quando realizada a an´alise com-
parativa dos genomas das duas esp´ecies de Blochmannia (Degnan et al., 2005).
Considerando a dele¸ao desses genes em B. floridanus (BLOFL), os autores su-
geriram que (i) esse endocitobionte ao necessita de coenzima A, o u (ii) utiliza
60
outras enzimas para a sua s´ıntese, ou (iii) importa esse cofator do seu hospedeiro.
O fato de coenzima A estar presente na lista de compostos comuns aos 58 ana-
lisados no presente estudo corrobora a ideia dessa ser uma coenzima essencial.
Levando em conta as intensas trocas metab´olicas a indicadas entre simbiontes e
hospedeiros, importar essa coenzima, seja esta proveniente do hospedeiro ou de
outros organismos integrantes do sistema simbi´otico, parece plaus´ıvel. No caso de
B. pennsylvanicus (BLOPB), o composto possivelmente importado ´e pantotenato,
diferentemente de B. floridanus (BLOFL) e outras em que o composto impor tado
seria diretamente coenzima A, visto a ausˆencia completa ou parcial da via de s´ıntese
desta coenzima. Entretanto, B. cicadellinicola (BAUCH), por apresentar as vias
de s´ıntese de pantotenato e de coenzima A completas, possivelmente importariam
α-cetovalina para a s´ıntese de coenzima A.
Biotina ´e cofator de uma pequena quantidade de enzimas que facilita a trans-
ferˆencia de CO
2
em rea¸oes de carboxila¸ao, decarboxila¸ao e transcarboxila¸ao
no metabo lismo de carboidratos e de ´acidos graxos (MetaCyc). As rea¸oes re-
lacionadas `a via de s´ıntese de biotina encontradas constituem basicamente toda
a via, faltando apenas a primeira rea¸ao que consiste na convers˜ao de alanina e
pimeloil-CoA em 7-ceto-8-aminopelargonato. Essas rea¸oes foram encontradas em
B. aphidicola APS (BUCAI) e B. cicadellinicola (BAUCH), e a maior parte delas
em W. glossinidia (WIGBR).
As rea¸oes enc ontradas para a s´ıntese de NAD correspondem `a parte final
dessa via transformando nicotinato mononucleot´ıdeo em NAD, faltando trˆes rea-
¸oes se considerar a s´ıntese de NAD a partir de aspartato. As rea¸oes apresentadas
foram encontradas para B. aphidicola APS (BUCAI), B. cicadellinicola (BAUCH)
e W. glossinidia (WIGBR).
Estudos pr´evios indicam que a s´ıntese de NAD em B. aphidicola APS (BU-
CAI) ocorre a partir de nicotinato, ou seja, apenas as rea¸oes resultantes na pre-
sente an´alise (Zientz et al., 2004). Entretanto, em W. glossinidia (WIGBR), essa
via de s´ıntese come¸caria um passo antes, isto ´e, a partir de quinolinato (Zientz
61
et al., 2004).
Analisando a presen¸ca e a ausˆencia das seis rea¸oes que constituem a via de
s´ıntese de NAD, apenas as trˆes apresentadas no grafo induzido est˜ao presentes em
B. aphidicola AP S (BUCAI). Isso ocorre igualmente para Blattabacterium sp. Bge
(BLASB). Para W. glossinidia (WIGBR), faltaria apenas a primeira rea¸ao, sendo
assim a via de s´ıntese de NAD ao partiria de quinolinato, como supramencionado,
mas de α- iminosuccinato que corresponde a uma rea¸ao a mais. B. cicadellinicola
(BAUCH) ´e a ´unica que apresenta todas as rea¸oes de convers˜ao de aspartato
em NAD. H. cicadicola (HODCD), C. ruddii (CARRP), S. muelleri (SULMW),
B. aphidicola Cc (BUCCC), B. floridanus (BLOFL), B. pennsylvanicus (BLOPB)
e W. pipientis wBm (WOLTR) ao apresentam rea¸oes envolvidas na s´ıntese de
NAD a partir de aspartato.
NAD e o seu derivado fosforilado NADP ao duas das mais importantes
coenzimas em rea¸oes redox na c´elula. Geralmente, NAD est´a envolvido em rea-
¸oes catab´olicas, enquanto NADP em anab´olic as. Como regra geral, procariotos
utilizam a via de s´ıntese de NAD a partir da aspartato, como as rea¸oes acima
analisadas; enquanto eucariotos iniciam a via a partir de triptofano (MetaCyc).
Analisando a presen¸ca de rea¸oes para a s´ıntese a partir de triptofano no grupo
MIV, observa-se apenas as rea¸oes que ao comuns `as vias iniciadas em triptofano
e em aspartato.
As poliaminas, c omo a espermidina, ao um grupo de polic´ations orgˆanicos
carregados positivamente que est˜ao envolvidos em diversos processos biol´ogicos,
incluindo liga¸ao a ´acidos nucl´eicos, estabiliza¸ao de membranas e est´ımulo de
arias enzimas (MetaCyc). As rea¸oes encontradas correspondem a toda a via e
est˜ao presentes apenas em B. aphidicola APS (BUCAI).
As rea¸oes envolvidas na degrada¸ao de purinas foram encontradas apenas em
B. aphidicola APS (BUCAI) e formam um grande componente conexo envolvendo
a via de degrada¸ao de ribonucleos´ıdeos e de deoxiribonucleos´ıdeos de purina.
A primeira via ´e formada por cinco rea¸oes, dentre elas, quatro est˜ao pr esen-
62
tes em B. aphidicola APS (BUCAI). Essas permitem a transforma¸ao de adenosina,
inosina e guanosina em D-ribose-5-fosfato. O composto produzido entra no meta-
bolismo central atrav´es do ramo ao oxidativo da via pentose fosfato (MetaCyc).
A rea¸ao faltante para B. aphidicola APS (BUCAI) corresponde `a convers˜ao de
xantosina em α-D-ribose-1-fosfato.
Com base nas rea¸oes presentes em B. aphidicola APS (BUCAI), essa bact´e-
ria teria capacidade de degradar trˆes dos quatro nucleos´ıdeos p´uricos e utiliz´a -los
como fonte de carbono e energia atrav´es do ramo ao oxidativo da via pentose
fosfato. Essa via metab´olica est´a presente e completa em B. aphidicola APS (BU-
CAI).
Os primeiros trˆes ribonucleos´ıdeos p´uricos acima mencionados (adenosina,
inosina e guanosina) ao clivados pela mesma fosforilase codificada pelo gene deoD.
Essa mesma fosforilase cliva os desoxiribonucleos´ıdeos, assim como a mutase, res-
pons´avel pela convers˜ao α-D-ribose-1-fosfato em D-ribose-5-fosfato, pode utilizar
D-desoxiribose-1-fosfato como substrato. Entretanto, a via de degrada¸ao de de-
soxiribonucleos´ıdeos p´uricos ´e c omposta por mais passos aparentemente ausentes
em B. aphidicola APS (BUCAI).
A ausˆencia completa das rea¸oes ´e encontrada para todos os outros organis-
mos do grupo MIV II. Entretanto, Blattabacterium sp. Bge (BLASB), integrante
do grupo MIV I, apresenta quatro das rea¸oes que permitem a convers˜ao de xan-
tosina, adenosina, inosina e guanosina em α - D-ribose-1-fosfato, faltando o passo
final de convers˜ao em D-ribose-5-fosfato.
63
4.2 Compara¸ao da topologia das redes metab´olicas
4.2.1 Diˆametro e distˆancia m´edia nos grafos de compostos
O diˆametro ´e o mais longo entre todos os mais curtos caminhos computados
entre dois os quaisquer de um grafo. Em um grafo de compostos, o diˆametro
mede o n´umero aximo de passos (rea¸oes) para produzir um metab´olito a partir
de outro.
O diˆametro computado nas 58 bact´erias resultou em uma edia de 27 e uma
mediana de 28, variando de 8 em H. cicadicola (HODCD) a 44 em B. pennsylvani-
cus (BLOPB) (Figura 4.16a). Observa-se uma maior concentra¸ao de organismos
entre os valores 22 e 34, correspondendo a 76% do conjunto de dados.
O diˆametro ao parece estar correlacionado com o n´umero de os no grafo
de compostos das 58 bact´erias (Figura 4.17, coeficiente de correla¸ao = 0,45). Ma
e Zeng (2003) observaram um aumento do diˆametro com o aumento do n´umero de
os em redes metab´olicas de tamanho pequeno, cujo n´umero de o s era inferior a
300. No presente conjunto de dados, o grafo de compostos de oito organismos con-
t´em n´umero de os inferior a 300 (H. cicadicola (HODCD), C. ruddii (CARRP),
S. muelleri (SULMW), B. aphidicola Cc (BUCCC), M. genitalium (MYCGE),
M. hyopneumoniae (MYCHJ), Chlamydia trachomatis (CHLTR) e O. tsutsuga-
mushi (ORITB)). O coeficiente de correla¸ao entre diˆametro e n´umero de os
nesses grafos ´e 0,48. Esse valor ´e consideravelmente pr´oximo ao encontrado para
todo o conjunto de organismos. Um aumento marcante ocorre para os grafos com
n´umero de os inferiores a 400. Nesse caso, acrescentam-se nove grafos de compos-
tos correspondentes aos organismos: B. aphidicola APS (BUCAI), Blattabacterium
sp. Bge (BLASB), B. cicadellinicola (BAUCH), B. floridanus (BLOFL), W. glos-
sinidia (WIGBR), B. pennsylvanicus (BLOPB), R. typhi (RICTY), W. pipientis
wBm (WOLTR) e W. pipientis wMel (WOLPM). O coeficiente de correla¸ao entre
o diˆametro e o n´umero de os nos 17 grafos aumenta para 0,81.
As bact´erias intracelulares apresentam uma maior varia¸ao do diˆametro nos
grafos de compostos. Al´em disso, a maioria delas est´a contida nesse grupo que
64
apresentou uma maior correla¸ao entre diˆametro e n´umero de os do grafo de
compostos. De fato, essa correla¸ao para os grafos das bact´erias intracelulares ao
difere muito do valor encontrado para os 17 menores grafos de compostos (coefi-
ciente de correla¸ao = 0,84). Para os outros grupos de bact´erias, esses coeficientes
ficam consideravelmente mais baixos: para os grafos de compostos dos grupos CA,
Figura 4.16: Diˆametro (a) e tamanho m´edio dos caminhos (b) dos grafos de com-
postos dos 58 organismos. Os organismos est˜ao ordenados de acordo com o tama-
nho do seu genoma.
65
E e FL, os coeficientes de correla¸ao ao 0,17; 0,35 e -0,3, respectivamente.
Pode-se imaginar que a redu¸ao da rede metab´olica estaria acompanhada da
redu¸ao do diˆametro do grafo de compostos, mas essa rela¸ao ao parece se manter
para todo o conjunto de dados. O diˆametro parece aumentar juntamente com o
n´umero de os do grafo at´e um certo tamanho de rede com n´umero de os pr´oximo
de 400 e as redes maiores apresentariam uma certa estabilidade mantendo valores
de diˆametro pr´oximos `a m´edia encontrada. Entretanto, ´e importante considerar
que o diˆametro do grafo ´e uma me dida bastante sens´ıvel. Isso pode ser perce-
bido com a diferen¸ca do diˆametro do grafo para organismos que apresentam r edes
metab´olicas bastante similares, como B. floridanus (BLOFL) e B. pennsylvanicus
(BLOPB). O acr´escimo de uma ´unica rea¸ao pode aumentar o diˆametro do grafo,
200 400 600 800 1000 1200 1400
10 15 20 25 30 35 40 45
Number of Nodes
Diameter
FL
PEH
CEH
MEH
PCAH
MCAV
PIH
PIV
MIV
Figura 4.17: Diˆametro em rela¸c ˜ao ao n´umero de os dos grafos de compostos dos
58 organismos.
66
se aq uela rea¸ao produz um metab´olito que po de ser sintetizado apenas a partir de
um ´unico substrato.
´
E possivel que redes menores sejam mais afetadas por rea¸oes
faltantes no grafo.
A importˆancia do filtro aplicado para cofatores e da atribui¸ao de dire¸ao `as
rea¸oes fica clara considerando-se que o diˆametro medido nos grafos ao filtrados
varia de 7 a 11. Isso permite que o tamanho dos caminhos entre metab´olitos sejam
fisiologicamente mais significativos.
A distˆancia entre dois os ´e o comprimento do caminho mais curto entre esses
dois os. Em um grafo de compostos, a distˆancia edia entre dois os indica o
n´umero de rea¸oes que devem ser utilizadas em m´edia para produzir um metab´olito
a partir de outro. A hip´otese considerada ´e que: a produ¸ao de um metab´olito
com o m´ınimo de etapas ´e selecionada.
A distˆancia edia m´ınima ´e 2,5 para H. cicadicola (HODCD) e a axima ´e
13,5 para B. pennsylvanicus (BLOPB), a edia ´e 8,9 e a mediana ´e 9,2. O tamanho
m´edio dos caminhos apresenta uma tendˆencia similar ao diˆametro dos grafos, apre-
sentando uma correla¸ao alta entre eles (coeficiente de correla¸ao = 0,94) (Figura
4.16b). Como observado para o diˆametro, a distˆancia m´edia ´e bastante vari´avel
nas bact´erias intracelulares e relativamente constante nos outros grupos.
Ma e Zeng (2003) notaram um efeito do n´umero de os em rela¸ao `as distˆan-
cias m´edias, especialmente nas redes de tamanhos pequenos, a quelas cujo umero
de os ´e inferior a 300. Considerando o conjunto de 58 grafos de compostos, a
correla¸ao entre o n´umero de os e o tamanho edio dos caminhos ´e similar a
encontrada para a rela¸ao entre o n´umero de os e o diˆametro do grafo (Figura
4.18, coeficiente de correla¸a o = 0,41). Nesse caso, a correla¸ao a se mostra mais
elevada para as redes com n´umero de os inferior a 300 (coeficiente de correla¸ao =
0,68). E essa correla¸ao se eleva ainda ma is para redes com n´umero de os inferior
a 400 (coeficiente de correla¸ao = 0,86). Esses resultados encontrados aproximam-
se dos apresentados por Ma e Zeng (2003), com a varia¸ao no tamanho das redes
pequenas que apresentariam a maior correla¸ao entre n´umero de os e distˆancias
67
m´edias no grafo de compostos. A distˆancia m´edia observada para Escherichia coli
K12 (ECOLI) pelos mesmos autores foi 8,2; similar ao valor 9,2 encontrado no
presente estudo.
200 400 600 800 1000 1200 1400
4 6 8 10 12
Number of Nodes
Average distance
FL
PEH
CEH
MEH
PCAH
MCAV
PIH
PIV
MIV
Figura 4.18: Distˆancia m´edia dos caminhos em rela¸ao ao n´umero de os dos grafos
de compostos dos 58 organismos.
4.2.2 Conectividade nos grafos de compostos
A conectividade em um grafo ´e medida pelo valor do grau dos os. O grau
de um o representa o umero de arestas ligadas a esse o. No caso de um grafo
direcionado, pode-se distinguir o grau de entrada e de sa´ıda do o, que contam o
n´umero de arestas dirigidas para o o e que partem do o, respectivamente. Em
68
um grafo de compostos, o grau de entrada de um metab´olito representa o n´umero
de metab´olitos que ao substratos de rea¸oes que o produzem. O g rau de sa´ıda de
um metab´olito representa o n´umero de metab´olitos produzidos por rea¸oes em que
ele ´e um dos substratos.
Os filtros a plicados nos grafos de compostos, evidentemente, alteram as dis-
tribui¸oes dos graus dos os, uma vez que cofatores como ATP e NADH est˜ao entre
os os mais conectados nos grafos ao filtrados. Nos grafos filtrados, eles aparecem
apenas nas rea¸oes em que ao apresentam o papel de cofatores. A ´agua, frequen-
temente o metab´olito mais conectado (ela aparece em aproximadamente um quarto
das rea¸oes), est´a completamente suprimida nos grafos filtrados. A atribui¸ao de
dire¸ao `as rea¸oes permite distinguir os graus de entrada e sa´ıda dos os.
Em um grafo de compostos, os metab´olitos mais conectados podem indicar a
sua importˆancia nas r edes metab´olicas. Para analis´a-los, os dez metab´olitos mais
conectados em cada grafo de compostos foram selecionados e os graus de entrada
e sa´ıda dos os foram considerados. O umero de metab´olitos, correspondentes `a
uni˜ao desses dez metab´olitos selecionados com os graus de entrada mais elevados
para cada grafo de compostos, aumenta para 55 (Figura 4.19). Considerando a
uni˜ao dos dez metab´olitos selecionados com os graus de sa´ıda mais elevados para
cada grafo de compostos, o n´umero de metab´olitos se eleva para 46 (Figura 4.20).
Alguns metab´olitos que chamam mais aten¸ao em rela¸ao ao grau de entrada
e/ou de sa´ıda, elevado em alguns organismos e baixo ou nulo em outros, ser˜ao
analisados a seguir.
D-gliceralde´ıdo-3-fosfato ´e um importante intermedi´ario da glic´olise e da gli-
coneogˆenese. Ele tamb´em est´a envolvido como subproduto da s´ıntese de triptofano
e como s ubstrato na bioss´ıntese de tiamina. Enquanto o seu grau (entrada ou
sa´ıda) ´e alto em qualquer organismo do conjunto analisado, este ´e nulo em H. ci-
cadicola (HODCD) e R. typhi (RICTY). Frutose-6-fosfato, tamb´em intermedi´ario
da glic´olise e gliconeogˆenese, est´a ausente nas duas bact´erias acima mencionadas,
em O. tsutsugamushi (ORITB) que ´e da fam´ılia Rickettsiaceae e em S. muelleri
69
pyruvate
D-glyceraldehyde-3-phosphate
AMP
coenzyme A
fructose-6-phosphate
acetate
L-glutamate
L-methionine
CMP
dihydroxy-acetone phosphate
UMP
NAD+
L-alanine
D-ribose-5-phosphate
fumarate
D-xylulose-5-phosphate
formate
succinate
a deoxynucleotide
UDP
D-sedoheptulose-7-phosphate
glycine
5'-deoxyadenosine
oxaloacetate
an alcohol
L-cysteine
ADP
C1
DELTA3-ISOPENTENYL-PP
GMP
S-adenosyl-L-methionine
D-alanine
glutathione
&alpha;-ketoglutarate
&beta;-D-glucose
a protein histidine
nicotinamide mononucleotide
&beta;-D-glucose-6-phosphate
ribose-1-phosphate
(deoxynucleotides)(m)
D-erythrose-4-phosphate
adenine
&alpha;-D-glucose 1-phosphate
5-10-METHENYL-THF
a protein-N&pi;-phospho-L-histidine
L-ornithine
PPPi
L-tryptophan
citrulline
a carboxylate
indole-3-glycerol-phosphate
D-ribose
coenzyme B12
deoxyribose-1-phosphate
sulfite
HODCD
CARRP
SULMW
BUCCC
MYCGE
BUCAI
BLASB
BAUCH
BLOFL
WIGBR
BLOPB
MYCHJ
RICTY
CHLTR
WOLTR
WOLPM
BARQU
LAWIP
ORITB
HELPY
STRTD
NEIG2
WOLSU
STRA5
THICR
HAMD5
LACC3
LISMO
XYLFA
BRUME
DESPS
PSEHT
VIBCH
BACA2
YERPE
BACSU
ECOLI
YERPY
SODGM
RHOS4
MYCTU
SALTI
SHIFL
ERWCT
PHOLL
BURMA
PSEE4
ECO57
BACHK
AGRT5
BACAN
CUPTR
PSEAB
FRAAA
RHIME
PSEFS
MYCS2
RALEH
0.0025 0.0075 0.0125 0.0175
Figura 4.19: Grau de entrada de 55 metab´olitos correspondentes aos 10 metab´olitos
com os mais altos graus de entrada em cada grafo de compostos filtrado. O tama-
nho de cada quadrado ´e proporcional ao valor do grau de entrada. Os organismos
est˜ao ordenados de acordo com o tamanho do seu genoma.
70
DELTA3-ISOPENTENYL-PP
pyruvate
ATP
D-glyceraldehyde-3-phosphate
L-glutamate
L-aspartate
AMP
fructose-6-phosphate
S-adenosyl-L-methionine
L-cysteine
coenzyme A
5-phosphoribosyl 1-pyrophosphate
phosphoenolpyruvate
L-serine
D-ribose-5-phosphate
L-alanine
NAD+
GTP
glycine
dihydroxy-acetone phosphate
D-xylulose-5-phosphate
a deoxynucleotide
D-sedoheptulose-7-phosphate
D-erythrose-4-phosphate
glutathione
CTP
trans, trans-farnesyl diphosphate
D-alanine
a protein L-cysteine
C1
&alpha;-ketoglutarate
chorismate
L-methionine
an alcohol
a protein histidine
acetate
fructose-1-phosphate
&alpha;-D-glucose 1-phosphate
formyl-L-methionyl peptide
a protein-N&pi;-phospho-L-histidine
UDP-N-acetyl-D-glucosamine
carbamoyl-phosphate
dimethylallyl-PP
5'-deoxyadenosine
adenosylcobinamide-GDP
Co2+
HODCD
CARRP
SULMW
BUCCC
MYCGE
BUCAI
BLASB
BAUCH
BLOFL
WIGBR
BLOPB
MYCHJ
RICTY
CHLTR
WOLTR
WOLPM
BARQU
LAWIP
ORITB
HELPY
STRTD
NEIG2
WOLSU
STRA5
THICR
HAMD5
LACC3
LISMO
XYLFA
BRUME
DESPS
PSEHT
VIBCH
BACA2
YERPE
BACSU
ECOLI
YERPY
SODGM
RHOS4
MYCTU
SALTI
SHIFL
ERWCT
PHOLL
BURMA
PSEE4
ECO57
BACHK
AGRT5
BACAN
CUPTR
PSEAB
FRAAA
RHIME
PSEFS
MYCS2
RALEH
0.005 0.015 0.025
0.035
Figura 4.20: Grau de sa´ıda de 46 metab´olitos correspondentes aos 10 metab´olitos
com os mais altos graus de sa´ıda em cada grafo de compostos filtrado. O tamanho
de cada quadrado ´e proporcional ao valor do grau de sa´ıda. Os organismos est˜ao
ordenados de acordo com o tamanho do seu genoma.
71
(SULMW). A ´ultima apresenta essas duas v ias bastante degradadas. Dihidroxi-
acetona-fosfato, outro intermedi´ario das mesmas vias, est´a ausente em H. cicadicola
(HODCD), C. ruddii (CARRP) e S. muelleri (SULMW).
Classicamente, os intermedi´arios da via pentose fosfato, como ribose-5-fosfato,
xilulose-5-fosfato, sedoheptulose-7-fosfato e eritrose-4-fosfato, ao altamente conec-
tados. O grau de entrada dos quatro compostos ´e nulo nos grafos de H. cicadicola
(HODCD) e S. muelleri (SULMW); e o grau de entrada dos outros trˆes compostos
´e nulo tamb´em em O. tsutsugamushi (ORITB) e R. typhi (RICTY). Entretanto,
o grau de sa´ıda de ribose-5-fosfato ´e estritamente positivo em todos os grafos. O
grau de sa´ıda de eritrose-4-fosfato ´e nulo no s grafos de H. cicadicola (HODCD),
R. typhi (RICTY) e O. tsutsugamushi (ORITB). Os graus de sa´ıda dos com-
postos xilulose-5-fosfato e sedoheptulose-7-fosfato ao nulos nos grafos das quatro
bact´erias (H. cicadicola (HODCD), S. muelleri (SULMW), R. typhi (RICTY) e
O. tsutsugamushi (O RITB)) .
O composto isopentenil difosfato (IPP), a mencionado anteriormente, pode
ser utilizado para a s´ıntese de lip´ıdios da classe polisoprenil difosfato, os quais ao
formados por repetidas unidades de isopreno. Os ´ultimos podem ser utilizados para
a s´ıntese de quinonas, as quais a maioria dos organismos apresenta um tipo predo-
minante com um tamanho esp ec´ıfico de cadeia de isoprenil. O grau de sa´ıda desse
composto destaca-se especialmente, visto os altos valores em alguns organismos,
como O. tsutsugamushi (O RITB) e W. pipientis wMel (WOLPM).
Coenzima B
12
e adenosilcobinamida-GDP destacam-se nos graus de entrada
e sa´ıda, respectivamente, no grafo de compostos de H. cicadicola (HODCD). Esses
apresentam-se altamente conectados no grafo desses organismos enquanto fraco ou
nulo nos outros. A importˆancia dessa coenzima (vitamina B
12
ou cobalamina) em
H. cicadicola (HODCD) deve-se `a s´ıntese de metionina dependente de cobalamina
via enzima MetH (McCutcheon et al., 2009). Segundo an´alises desses autores, ou-
tras duas α-proteobact´erias teriam a capa cidade de s´ıntese de metionina apenas
pela vers˜ao dependente de cobalamina. O alto grau encontrado para e sse composto
72
pode possivelmente ser explicado pela devo¸ao de, pelo menos, 7% do proteoma de
H. cicadicola (HODCD) na bioss´ıntese dessa coenzima (McCutcheon et al., 2009).
Adenosilcobinamida-GDP ´e um intermedi´ario dessa via biossint´etica. Ciste´ına e
alanina tamb´em se destacam tanto no grafo de entrada quanto no de sa´ıda. Al´em
desse, guanosina monofosfato (GMP) e trifosfato (PPPi) se sobressaem em rela-
¸ao ao grau de entrada, enquanto que ATP, formil-L-metionil-pept´ıdeo, peptidil-
ciste´ına e CO
2
destacam-se em rela¸ao ao grau de sa´ıda.
As duas bact´erias do enero Mycoplasma, M. genitalium (MYCGE) e M. hyop-
neumoniae (MYCHJ), apresentam padr˜oes muito similares e p or vezes diferen-
tes dos outros organismos, como desoxiribose-1-fosfato, AMP, adenina e NAD.
Considerando os intermedi´arios da glic´ose e gliconeogˆenese e via pentose fosfato,
observam-se graus mais elevados nessas duas bact´erias em rela¸ao `a maioria dos or-
ganismos em D-gliceralde´ıdo-3-fosfato, frutose-6-fosfato, dihidroxi-acetona-fosfato,
ribose-5-fosfato e xilulose-5-fosfato.
Elas e outras bact´erias, que apresentam redes metab´olicas reduzidas, ao as
que mais distanciam-se na An´alise de Componentes Principais (ACP) realizada
para os 55 e 46 metab´olitos selecionados com os graus de entrada e de sa´ıda,
respectivamente, mais elevados (Figura 4.21). De fato, essa an´alise ressalta os
com graus elevados em poucos organismos em compara¸ao ao resto. Sendo assim,
observamos alguns dos compostos acima citados pa ra H. cicadicola (HODCD) e
para M. genitalium (MYCGE) e M. hyopneumoniae (MYCHJ) com pontua¸oes
altas na ACP, como coenzima B
12
para H. cicadicola (HODCD) e frutos e-6-fosfato
para M. genitalium (MYCGE) e M. hyopneumoniae (MYCHJ).
73
Figura 4.21: An´alise de componentes principais (ACP) realizada para os 55 e 46
metab´olitos selecionados com os graus de entrada (a) e de sa´ıda (b), respectiva-
mente, mais elevados.
74
4.2.3 Centralidade de intermedia¸ao nos grafos de compostos
A centralidade de intermedia¸ao (betweenness centrality) mede a propor¸ao
dos menores caminhos que passam pelo o i em rela¸ao ao n´umero total de menores
caminhos entre todos os pares de os do grafo. Em um grafo de compostos, a
centralidade de intermedia¸ao de um o pode significar o n´umero de caminhos
metab´olicos nos quais este o participa. Comparando essa medida com o grau,
que ´e uma medida local, o objetivo de calcular a centralidade de intermedia¸ao ´e
considerar o conjunto todo da rede para medir a centralidade de um metab´olito.
Entretanto, o fato de ser uma medida global torna-a ainda mais sens´ıvel `a qualidade
da reconstru¸ao da rede metab´olica.
O valor da centralidade axima ´e bastante vari´avel (Figura 4.22a). Os va-
lores baixos encontrados para C. ruddii (CARRP), O. tsutsugamushi (ORITB),
R. typhi (RICTY) e H. cicadicola (HODCD) podem indicar a ausˆencia de um
metab´olito central. Essa constata¸ao a a uma ideia da topologia do grafo. O
valor m´edio da centralidade ´e relativamente mais constante para a maior parte dos
organismos (Figura 4.22b).
Para uma an´alise mais de talhada da centralidade de intermedia¸ao dos os,
os cinco metab´olitos mais centrais no grafo de compostos de cada organismo foram
selecionados. A uni˜ao desses resultou em 61 metab´olitos (Figura 4.23). A diferen¸ca
no valor da centralidade para alguns os em B. pennsylvanicus (BLOPB) e B. flo-
ridanus (BLOFL) ´e marcante. Alguns exemplos ao delta-3-isopentenil-PP, 4-
(citidina 5’-difosfo)-2-C-metil-D-eritrol e 2-fosfo-4-citidina-5-difosfo-2-C-Met. Ana-
lisando esses trˆes compostos nos grafos das duas bact´erias, nota-se que eles encontram-
se no grande componente conexo que representa a maior parte da rede em B. pennsyl-
vanicus (BLOPB). Enquanto os mesmos encontram-se em pequenos componen-
tes conexos desconectados da maioria dos compostos do grafo em B. floridanus
(BLOFL). Esse resultado po de eventualmente indicar a sensibilidade dessa me-
dida `a reconstru¸ao das redes metab´olicas tendo em vista as semelhan¸cas das duas
bact´erias. Isso sugere uma an´alise mais detalhada das redes dessas bact´erias para
75
avaliar a necessidade de normalizar essa medida de forma a amenizar tais varia¸oes.
Figura 4.22: Centralidade de intermedia¸ao axima e m´edia dos os nos grafos
de compostos dos 58 organismos. Os organismos est˜ao ordenados de aco rdo com o
tamanho do seu genoma.
76
Figura 4.23: Centralidade de intermedia¸ao dos 61 metab´olitos correspondentes
`a uni˜ao dos 5 metab´olitos mais centrais nessa medida nos grafos de compostos
filtrados. O ta manho do quadrado ´e proporcional `a centralidade do metab´olito na
bact´eria corresp ondente. Os organismos est˜ao ordenados de acordo com o tamanho
do seu genoma.
77
Cap´ıtulo 5
Discuss˜ao
A an´alise comparativa realizada colocou em evidˆencia um elemento impor-
tante sobre a evolu¸ao das redes metab´olicas de bact´erias intracelulares estritas.
Observou-se uma propor¸ao de genes metab´olicos em rela¸ao ao n´umero de genes
relativamente constante no conjunto de organismos analisados e praticamente duas
vezes mais elevada nas bact´erias intracelulares mutualistas (MIV) com associa¸oes
essencialmente nutricionais.
Wernegreen (2005) indicou que γ-proteobact´erias mutualistas nutricionais de
insetos mant´em um amplo espectro de genes biossint´eticos para suprir as fun¸oes
simbi´oticas, dedicando uma fra¸ao maior dos seus genomas `a bioss´ıntese do que o
fazem as bact´erias de vida livre e parasitas. As γ-proteobact´erias mutualistas nu-
tricionais de insetos analisadas foram: B. pennsylvanicus (BLOPB), B. floridanus
(BLOFL), trˆes cepas de Buchnera aphidicola,eW. glossinidia (WIGBR). As fun-
¸oes biossint´eticas analisadas foram bioss´ıntese de: (i) amino´acidos; (ii) cofatores,
grupos prost´eticos e carreadores; e (iii) purinas, pirimidinas, nucleot´ıdeos e nucleo-
s´ıdeos. Dessa forma, apenas parte das capacidades metab´olicas dessas bact´erias foi
analisada nesse estudo mencionado. Por outro lado, esses resultados a apontam a
tendˆencia de uma maior fra¸ao do genoma de bact´erias intracelulares mutualistas
nutricionais dedicada `as fun¸oes simbi´oticas.
Al´em disso, observou-se o contraste entre a conservao de um n´ucleo meta-
olico nas bact´erias extracelulares, de vida livre e associadas `a c´elula, e a ausˆencia
78
de partes comuns da rede metab´olica nas intracelulares estritas. Nota-se que o
grupo das mutualistas (MIV) foi o que especialmente contribuiu para os valores
baixos de interse¸ao para compostos e rea¸oes. Enquanto que no grupo CA, as
duas bact´erias do gˆenero Mycoplasma foram as que mais influenciar am a redu¸ao
dos valores das interse¸oes, mostrando o efeito causado pelos genomas reduzidos
na manuten¸ao e no tamanho dos n´ucleos metab´olicos.
Dessa forma, o conceito de metabolismo m´ınimo ao pode ser aplicado dire-
tamente para os endocitobiontes, concordando com Koonin (2000) que indica que
a constru¸ao de conjuntos m´ınimos de genes ao faz s entido sem uma defini¸ao ex-
pl´ıcita das condi¸oes nas quais o respectivo organismo m´ınimo” sobrevive. Tendo
em vista a associa¸ao obrigat´oria dos endocitobiontes com o hospedeiro, ´e impor-
tante considerar o ambiente no qual a bact´eria est´a inserida e as trocas metab´olicas
que permeiam o sistema simbi´otico. Isso significa levar em conta o metabolismo
do hospedeiro e de outros simbiontes potenciais, t endo a rede metab´olica como
a uni˜ao das redes dos diferentes participantes. Em casos como esses, o sistema
pode ser visto como um super-indiv´ıduo”, o qual foi chamado de simbiocosme”
(Nardon e Grenier, 1993). Isso se aplica especialmente para os simbiontes mais
integrados, cuja associa¸ao com o hospedeiro tornou-se indissoci´avel. As fun¸oes
metab´olicas, entre outras, de um organismo se juntam `as capacidades metab´olicas
do segundo, ou mesmo de um terceiro. A complementaridade de diferentes esp´ecies
participando da sobrevivˆencia das outras foi mostrada em diversos estudos (Bau-
mann et al., 1995; Shigenobu et al., 2000; Wu et al., 2006; McCutcheon e Moran,
2007; International Aphid Genomics Consortium, 2010; Cottret et al., 2010b).
No conjunto de dados analisados, exatamente metade das bact´erias apresen-
tam associa¸oes obrigat´orias com seu hospedeiro (Tabela A.1 em anexo), sendo
a outra metade composta pelas do grupo FL e pelas que apresentam associa¸oes
facultativas com o seu hospedeiro, i.e., a bact´eria pode ser encontrada em vida
livre. Como esperado, a interse¸ao de compostos e de rea¸oes para as bact´erias,
cujas a ssocia¸oes ao ao obrigat´orias, resultam em um n´ucleo metab´olico de 183 e
79
80 respectivamente. Esses valores ao bastante pr´oximos aos encontrados para as
interse¸oes dos grupos (Extra+FL), vez que ap ena s quatro bact´erias ao do grupo
PCAH e as 25 restantes ao dos grupos Extra+FL. Enquanto que, a interse¸ao de
compostos e rea¸oes resulta em valores iguais aos globais (para todo o conjunto de
organismos) para as bact´erias cujas asso cia¸oes ao obrigat´orias.
Considerando a obrigatoriedade da associa¸ao para o hospedeiro, apenas as
11 bact´erias do grupo MIV ao simbiontes prim´arios (Tabela A.1 em anexo). Os
valores de interse¸ao de compostos e de rea¸oes para as restantes a ao conside-
ravelmente baixos, 57 e 7 respectivamente. Analisando a dupla de organismos que
mais retira rea¸oes da interse¸ao encontramos as duas esp´ecies de Mycoplasma;
sem elas os valores passariam a 97 c ompostos e 29 rea¸oes. Isso indica que ao
ao apenas os componentes do grupo MIV que resultam em valores baixos de in-
terse¸ao, mas que outros organismos do conjunto de da dos igualmente apresentam
associa¸oes persistentes a longos per´ıodos de tempo acompanhadas de uma redu¸ao
consider´avel das redes metab´olicas.
Em rela¸ao ao modo de transmiss˜ao das bact´erias, existem 16 que apresen-
tam transmiss˜ao vertical (Tabela A.1 em anexo) formando os grupos MIV, PI V e
MCAV. Os valores de interse¸ao de compostos e de rea¸c ˜oes ao iguais aos do grupo
intracelular, 23 e 1, respectivamente. Os 42 organismos restantes apresentam va-
lores de interse¸ao de 69 compostos e 13 rea¸oes. A dupla de organismos que mais
retira rea¸oes ´e novamente formada pelas duas es p´ecies de Mycoplasma, removendo
22 rea¸oes. O trio de organismos com esse mesmo efeito ´e acrescido da bact´eria
C. trachomatis (CHLTR), componente do grupo PIH, removendo 16 rea¸oes.
Os resultados apresentados corroboram com a evolu¸ao dos genomas de pa-
rasitas obrigat´orios e endocitobiontes mutualistas sob condi¸oes radicalmente dife-
rentes daquelas dos organismos que ao apresentam associa¸oes obrigat´orias; sendo
o fator que os distingue, o a mbiente condicionado pelo hospedeiro no caso dos pri-
meiros (Andersson e Kurland, 1998).
A an´alise multivariada dos conjuntos de rea¸oes para as bact´erias intracelu-
80
lares mutualistas (MIV) apontou grupos de endocitobiontes com padr˜oes distintos
de vias metab´olicas presentes de acordo com as respectivas intera¸oes com o hos-
pedeiro, mostrando uma redu¸ao diferencial do metabolismo desses organismos
possivelmente condicionada ao sistema simbi´otico ao qual integram. Dessa forma,
observa-se que por¸oes similares das redes metab´olicas foram conservadas em esp´e-
cies filogeneticamente distantes, mas com fun¸ao simbi´otica ´e pr´oxima. Exemplos
disso incluem a conservao de algumas vias de s´ıntese de amino´acidos essenciais
em γ-proteobact´erias e flavobact´erias, nas quais esses metab´olitos ao importantes
na rela¸ao simbi´otica, como mostrado previamente.
Dessa forma, nota-se que, nos resultados da ACM pa ra o grupo MIV, os or-
ganismos ao est˜ao agrupados com base na sua filogenia, considerando que as duas
flavobact´erias e as duas α-proteobact´eria s est˜ao relativamente afastadas. Cabe sa-
lientar que o grupo MIV ´e formado principalmente por γ-proteobact´erias. Al´em
disso, observa-se que as duas esp´ecies de Blochmannia est˜ao agrupadas, o que ´e
esperado tendo em vista que ambas est˜ao associadas a formigas do enero Cam-
ponotus e apresentam capacidades metab´olicas muito semelhantes (Degnan et al.,
2005).
Por outro lado, a ACM realizada para todo o conjunto de organismos resul-
tou em uma distribui¸ao dos mesmos influenciada de alguma forma pela filogenia.
Neste caso, as bact´erias da Fam´ılia Enterobacteriaceae com redes metab´olicas maio-
res, tomando como referˆencia aproximada o tamanho da rede da bact´eria S. glossi-
nidius (SODGM), distanciaram-se dos outros organismos na segunda componente
da an´alise em quest˜ao.
Isso enfatiza a importˆancia de ter um conjunto de organismos consideravel-
mente homogˆeneo para a realiza¸ao de uma an´alise comparativa, no sentido de ter
organismos filogeneticamente pr´oximos permeando diferentes grupos de estilos de
vida e com genomas de tamanhos diversos. Quando foi feita a sele¸ao dos organis-
mos para o presente estudo, teve-se como crit´erio formar um conjunto de dados em
que houvesse correspondˆencia entre organismos, com associa¸oes obrigat´orias ou
81
com facultativas, filogeneticamente pr´oximos. Essa correspondˆencia foi anterior-
mente exemplificada com a Fam´ılia Enterobacteriaceae da classe γ-proteobacteria
permeando diferentes grupos de estilos de vida. Dentre as 15 bact´erias dessa fam´ı-
lia, seis apresentam associa¸oes facultativas.
´
E importante acrescentar, que assumindo a ausˆencia de transferˆencia hori-
zontal de genes e de eventos de recombina¸ao nos endocitobiontes do grupo MIV
dessa fam´ılia, os genes ort´ologos mais pr´oximos dos genes desses organismos devem
estar presentes nos representantes sem associa¸oes obrigat´orias dessa mesma fam´ı-
lia (Zientz et al., 2004). Portanto, a presen¸ca de grupos filogen´eticos relacionados
permeando diferentes grupos de estilos de vida pode acarretar em contribui¸oes
interessantes para a an´alise comparativa do metabolismo, tendo em vista a rela¸ao
pr´oxima entre bact´erias intracelulares obrigat´orias e organismos sem associa¸oes
obrigat´orias da Fam´ılia Enterobacteriaceae (Zientz et al., 2004).
Com base nos resultados supramencionados, a filogenia dos organismos ana-
lisados influenciou o agrupamento das bact´erias com redes metab´olicas maiores
quanto `a presen¸ca de rea¸oes. Esse efeito a o foi encontrado nas redes menores.
A forte redu¸ao do genoma e do metabolismo, acompanhada do ambiente condi-
cionado pelo hospedeiro podem ser os fatores respons´aveis pelo enfraquecimento
do efeito filogen´etico nos agrupamentos dos organismos que apresentam redes me-
tab´olicas menores.
Ainda sobre a redu¸ao diferencial dos endocitobiontes mutualistas, pares de
simbiontes coresidentes, como S. muelleri (SULMW) e B. cicadellinicola (BAUCH),
e Candidatus Sulcia muelleri SMDSEM (SULMS) e H. cicadicola (HODCD), apre-
sentaram por¸oes distintas das redes metab´olica s conservadas. Isso coloca em
evidˆencia a complementaridade metab´olica de cosimbiontes de um mesmo hosp e-
deiro. A coadapta¸ao de numerosos simbiontes em um mesmo sistema ainda ´e
pouco conhecido, entretanto novos casos vem sendo descritos e modelos evolutivos
ao propostos.
Um ecossistema intracelular formado por bact´erias simbi´oticas que dividem
82
bacteri´ocitos na mosca-branca Bemisia tabaci foi descrito (Gottlieb et al., 2008).
Esse sistema ´e formado por um simbionte prim´ario, Portiera, e cinco secund´a-
rios, Hamiltonella, Arsenophonus, Cardinium, Wolbachia,eRickettsia, ocupando
diferentes nichos nos bacteri´ocitos.
A hip´otese proposta para explicar o desaparecimento de algumas vias de s´ın-
tese de amino´acidos em C. ruddii (CARRP) e B. aphidicola Cc (BUCCC) consiste
na presen¸ca de um ´unico endocitobionte integrado inicialmente; e com a perda
de parte das suas fun¸oes simbi´oticas, essas seriam supridas por um simbionte
secund´ario (P´erez-Brocal et al., 2006; Wu et al., 2006; Tamames et al., 2007).
Um modelo sobre a hist´oria evolutiva de associa¸oes simbi´oticas entre bac-
t´erias e seus hospedeiros foi proposto (Moya et al., 2009). Os passos principais
descrevem o processo evolutivo da redu¸ao do genoma levando `a endocitobiose
prim´aria e a possibilidade de complementa¸ao ou substitui¸ao p o r um simbionte
secund´ario. Esses autores ainda postulam que B. aphidicola Cc (BUCCC) est´a
perdendo a sua capacidade simbi´otica e que est´a sendo complementada (e talvez
ser´a substitu´ıda) pelo abundante coresidente Candidatus Serratia symbiotica.
A an´alise dos grafos de compostos mostrou uma diversidade importante na
topologia das redes metab´olicas das bact´erias intracelulares. As medidas realizadas
apresentaram-se consideravelmente mais vari´aveis nessas bact´erias em rela¸ao aos
resultados dos demais organismos que mantiveram-se mais pr´oximos aos valores
m´edios. Esses resultados mais vari´aveis foram frequentemente encontrados para
as redes das bact´erias que apresentam os menores genomas, o que inclui as duas
esp´ecies de Mycoplasma.
A alta correla¸ao entre tamanho da rede metab´olica (n´umero de os) e diˆa-
metro ou tamanho edio dos caminhos apresentada para as redes menores que 400
os pode concordar com a evolu¸ao do metabolismo descrita para os endocitobion-
tes, em que as vias mais frequentemente perdidas seriam aquelas mais longas e que
necessitariam de mais energia (Moran, 2007). Dessa forma, essa alta correla¸ao
encontrada nas redes menores, e os valores est´aveis em rela¸ao `a m´edia para redes
83
maiores seriam esperados tendo em vista o ambiente condicionado pelo hospedeiro
no caso dos primeiros.
Essa modelagem em grafos metab´olicos permitiu inferir os metab´olit os mais
importantes e aqueles que perderam a sua importˆancia ao longo da redu¸ao do me-
tabolismo. Foi poss´ıvel encontrar compostos importantes para a fun¸ao simbi´otica,
como coenzima B
12
e adenosilcobinamida-GDP para H. cicadicola (HODCD).
84
Cap´ıtulo 6
Conclus˜oes e Perspectivas
Como fruto dessas an´alises foi poss´ıvel observar o contraste entre a conserva-
¸ao de um n´ucleo metab´olico nas bact´erias extracelulares, de vida livre e associadas
`a elula, e a ausˆencia de partes comuns da rede metab´olica nas intracelulares estri-
tas. Nota-se que o grupo das mutualistas (MIV) foi o que especialmente contribuiu
para os valores baixos de interse¸ao para os conjuntos de compostos e de rea¸oes.
Os endocitobiontes mutualistas, os quais estabelecem associa¸oes essencial-
mente nutricionais, apresentam uma propor¸ao maior dos seus genomas dedicada
ao metabolismo. Al´em disso, a redu¸ao do metabolismo afeta de diferentes manei-
ras a composi¸ao e a organiza¸a o das redes metab´olicas das bact´erias intracelulares
mutualistas. Os fatores que possivelmente influenciaram essa redu¸ao diferencial
do metabolismo incluem: (i) a composi¸ao metab´olica da c´elula do hospedeiro;
(ii) a fun¸ao simbi´otica; e (iii) a presen¸ca de outros simbiontes integrando o sis-
tema.
O presente trabalho pode ser complementado de diferentes formas. O con-
junto de organismos pode incluir redes metab´olicas de hospedeiros. A diferen¸ca
encontrada para as bact´erias da fam´ılia Enterobacteriaceae na an´alise multifatorial
para todo o conjunto de organismo pode ser investigada em detalhe.
A compara¸ao dos grafos pode ser melhorada com: (i) medidas espec´ıficas
para grafos metab´olicos; e (ii) diferentes estrat´egias na modelagem das redes me-
tab´olicas, por exemplo, utilizando hipergrafos ou grafos bipartidos.
85
O desenvolvimento de novos algoritmos dedicados `as quest˜oes metab´olicas
mostra-se necess´ario, como uma ferramenta para identificar automaticamente as
vias metab´olicas correspondentes `as rea¸oes em um grafo induzido.
86
Referˆencias Bibliogr´aficas
J. M. Adams. On the release of the formyl group from nascent protein. Journal
of Molecular Biology, 33(3):571–574, 1 968.
L. Akman, A. Yamashita, H. Watanabe, K. Oshima, T. Shiba, M. Hattori, e
S. Aksoy. Genome se quence of the endocellular obligate symbiont of tsetse flies,
wigglesworthia glossinidia. Nature genetics, 32(3):402–407, 2002.
P. Aloy e R. B. Russell. Potential ar tefacts in protein-interaction networks. FEBS
letters, 530(1-3):253–254, 2002.
S. G. Andersson e C. G. Kurland. Reductive evolution of resident genomes. Trends
in microbiology, 6(7):263–268, 1998.
M. Arita. The metabolic world of escherichia coli is not small. Proceedings of
the National Academy of Sciences of the United States of America,
101(6):1543–1547, 2004.
A. L. Barabasi e R. Albert. Emergence of scaling in random networks. Science
(New York, N.Y.), 286(5439):509–512, 1999.
P. Baumann, L. Baumann, C. Y. La i, D. Rouhbakhsh, N. A. Moran, e M. A.
Clark. Genetics, physiology, and evolutionary relationships of the genus buch-
nera: intracellular symbionts of aphids. Annual review of microbiology, 49
(1):55–94, 1995.
A. Casadevall. Evolution of intracellular pathogens. Annual review of micro-
biology, 62(1):19–33, 2008.
87
I. Cases, V. de Lorenzo, e C. A. Ouzounis. Transcription regulation and envi-
ronmental adaptation in bacteria. Trends in microbiology, 11(6):248–253,
2003.
M. Casiraghi, O. Bain, R. Guerrero, C. Martin, V. Pocacqua, S. L. Gardner,
A. Franceschi, e C. Bandi. Mapping the presence of wolbachia pipientis on the
phylogeny of filarial nematodes: evidence for symbiont loss during evolution.
International journal for parasitology, 34(2):191–203, 2004.
R. Caspi, H. Foerster, C. A. Fulcher, P. Kaipa, M. Krummenacker, M. Latendresse,
S. Paley, S. Y. Rhee, A. G. Shearer, C. Tissier, T. C. Walk, P. Zhang, e P. D.
Karp. The metacyc database of metabolic pathways and enzymes and the biocyc
collection of pathway/genome databases. Nucl. Acids Res., 36(suppl 1):D623–
631, 2008.
M. A. Clark, L. Baumann, M. L. Thao, N. A. Moran, e P. Baumann. Degenerative
minimalism in the genome of a psyllid endosymbiont. Journal of bacteriology,
183(6):1853–1861, 2001.
L. Cottret e F. Jourdan. Graph methods for the investigation of me tabolic networks
in parasitology. Parasitology, 137(9):1393–1407, 2010.
L. Cottret, D. Wildridge, F. Vinson, M. P. Barrett, H. Charles, M.-F. Sagot, e
F. Jourdan. Metexplore: a web server to link metabolomic experiments and
genome-scale metabolic networks. Nucleic acids research, 38:W132-7, 2010a.
L. Cottret, P. V. Milreu, V. Acu˜na, A. Marchetti-Spaccamela, L. Stougie, H. Char-
les, e M. F. Sagot. Manuscript in preparation. 2010b.
G. Csardi e T. Nepusz. The igraph software package for complex network research.
InterJournal, Complex Systems:1695, 2006.
C. Dale e I. Maudlin. Sodalis gen. nov. and sodalis glossinidius sp. nov., a microa-
erophilic secondary endosymbiont of the tsetse fly glossina morsitans morsitans.
International journal of systematic bacteriology, 49 Pt 1:267–275, 1999.
88
P. H. Degnan, A. B. Lazarus, e J. J. Wernegreen. Genome sequence of blochmannia
pennsylvanicus indicates parallel evolutionary trends among bacterial mutualists
of insects. Genome research, 15(8):1023–1033, 2005.
S. Dray e A. Dufour. The ade4 package: implementing the duality diagram for
ecologists. Journal of Statistical Software, 22(4):1–20, 2007.
K. Dybvig, C. Zuhua, P. Lao, D. S. Jordan, C. T. French, A.-H. H. Tu, e A. E.
Loraine. Genome of mycoplasma arthritidis. Infection and immunity, 76(9):
4000–4008, 2008.
D. A. Fell e A. Wagner. The small world of metabolism. Nature biotechnology,
18(11):1121–1122, 2000.
J. Foster, M. Ganatra, I. Kamal, J. Ware, K. Makarova, N. Ivanova, A. Bhatta-
charyya, V. Kapatral, S. Kumar, J. Posfai, T. Vincze, J. Ingram, L. Moran,
A. Lapidus, M. Omelchenko, N. Kyrpides, E. Ghedin, S. Wang, E. Goltsman,
V. Joukov, O. Ostrovskaya, K. Tsukerman, M. Mazur, D. Comb, E. Koonin,
e B. Slatko. The wolbachia genome of brugia malayi: endosymbiont evolution
within a human pathogenic nematode. PLoS biology, 3(4), 2005 .
S. Freilich, R. V. Spriggs, R. A. George, B. Al-Lazikani, M. Swindells, e J. M.
Thornton. The complement of enzymatic sets in dierent species. Journal of
molecular biology, 349(4):745–763, 2005.
H.-H. H. Fuxelius, A. Darby, C.-K. K. Min, N.-H. H. Cho, e S. G. Andersson. The
genomic and metabolic diversity of rickettsia. Research in microbiology, 158
(10):745–753, 2007.
R. Gil, F. J. Silva, E. Zientz, F. Delmotte, F. Gonz´alez-Candelas, A. Latorre,
C. Rausell, J. Kamerbeek, J. Gadau, B. H
¨
olldobler, R. C. van Ham, R. Gross, e
A. Moya. The genome sequence of blochmannia floridanus: comparative analysis
of reduced geno mes. Proceedings of the National Academy of Sciences
of the United States of America, 100(16):9388–9393, 2003.
89
R. Gil, A. Latorre, e A. Moya. Bacterial endosymbionts of insects: ins ights from
comparative genomics. Environmental microbiology, 6(11):1109–1122, 2004.
P. Glaser, L. Frangeul, C. Buchrieser, C. Rusniok, A. Amend, F. Baquero,
P. Berche, H. Bloecker, P. Brandt, T. Chakraborty, A. Charbit, F. Chetou-
ani, E. Couv´e, A. de Daruvar, P. Dehoux, E. Domann, G. Dom´ınguez-Bernal,
E. Duchaud, L. Durant, O. Dussurget, K. D. Entian, H. Fsihi, F. Garc´ıa-del
Portillo, P. G arrido, L. Gautier, W. Goebel, N. omez-L´opez, T. Hain, J. Hauf,
D. Jackson, L. M. Jones, U. Kaerst, J. Kreft, M. Kuhn, F. Kunst, G. Kurapkat,
E. Madueno, A. Maitournam, J. M. Vicente, E. Ng, H. Nedjari, G. Nordsiek,
S. Novella, B. de Pablos, J. C. P´erez-Diaz, R. Purcell, B. Remmel, M. Rose,
T. Schlueter, N. Simoes, A. Tierrez, J. A. azquez-Boland, H. Voss, J. Weh-
land, e P. Cossart. Comparative genomics of listeria species. Science (New
York, N.Y.), 294(5543):849–852, 2001.
M. J. J. Gosalbes, A. Lamelas, A. Moya, e A. Latorre. The striking case of tryp-
tophan provision in the cedar aphid cinara cedri. Journal of bacteriology,
190(17):6026–6029, 2008.
Y. Gottlieb, M. Ghanim, G. Gueguen, S. Kontsedalov, F. Vavre, F. Fleury, e
E. Zchori-Fein. Inherited intracellular ecosystem: symbiotic bacteria share bac-
teriocytes in whiteflies. The FASEB journal, 22(7):2591–2599, 2008.
M. Green e P. Karp. A bayesian method for identifying missing enzymes in pre-
dicted metabolic pathway databases. BMC Bioinformatics, 5(1):76+, 2004.
International Aphid Genomics Consortium. Genome sequence of the pea aphid
acyrthosiphon pisum. PLoS biology, 8( 2):e1000313+, 2010.
H. Jeong, B. Tombor, R. Albert, Z. N. Oltvai, e A. L. Barab´asi. The large-scale
organization of metabolic networks. Nature, 407(6804):651–654, 2000.
P. D. Karp, S. Paley, e P. Romero. The pathway tools software. Bi oinformatics
(Oxford, England), 18 Suppl 1, 2002.
90
P. D. Karp, C. A. Ouzounis, C. Moore-Kochlacs, L. Goldovsky, P. Kaipa, D. Ahren,
S. Tsoka, N. Darzentas, V. Kunin, e N. Lopez-Bigas. Expansion of the biocyc
collection of pathway/genome databases to 160 genomes. Nucl. Acids Res.,
33(19):6083–6089, 2005.
E. F. F. Keller. Revisiting scale-free”networks. BioEssays : news and reviews
in molecular, cellular and developmental biology, 27(10):1060–1068, 2005.
I. M. Keseler, C. Bonavides-Martinez, J. Collado-Vides, S. Gama-Castro, R. P.
Gunsalus, D. A. Johnson, M. K rummenacker, L. M. Nolan, S. Paley, I. T. Paul-
sen, M. Peralta-Gil, A. Santos-Zavaleta, A. G. Shearer, e P. D. Karp. Ecocyc: A
comprehensive view of escherichia coli biology. Nucl. Acids Res., 37(suppl 1):
D464–470, 2009.
E. V. Koonin. How many genes can make a cell: the minimal-gene-set concept.
Annual review of genomics and human genetics, 1:99–116, 2000.
V. Lacroix, L. Cottret, P. Th´ebault, e M.-F. Sagot. An introduction to meta-
bolic networks and their structural analysis. IEEE/ACM transactions on
computational biology and bioinformatics / IEEE, ACM, 5(4):594–617,
2008.
T. Lima, A. H. Auchincloss, E. Coudert, G. Keller, K. Michoud, C. Rivoire, V. Bul-
liard, E. de Castro, C. Lachaize, D. Baratin, I. Phan, L . Bougueleret, e A. Bai-
roch. Hamap: a database of completely sequenced microbial proteome sets and
manually curated microbial protein families in uniprotkb/swiss-prot. Nucleic
acids research, 37(Database issue):gkn661+, 2009.
W.-c. C. Liu, W.-h. H. Lin, A. J. Davis, F. Jord´an, H.-t. T. Yang, e M.-j. J.
Hwang. A network perspective on the topological imp ortance of enzymes and
their phylogenetic conservation. BMC bioinformatics, 8(1), 2007.
M. J. opez-S´anchez, A. Neef, J. Peret´o, R. Pati˜no Navarrete, M. Pignatelli, A. La-
torre, e A. Moya. Evolutionary convergence and nitrogen metabolism in blatta-
91
bacterium strain bge, primary endosymbiont of the cockroach blattella germa-
nica. PLoS genetics, 5(11):e1000721+, 2 009.
H. Ma e A.-P. Zeng. Reconstruction of metabolic networks from genome data and
analysis of their global structure for various organisms. Bioinformatics, 19(2):
270–277, 2003.
L. Mamirova, K. Popadin, e M. S. Gelfand. Purifying selection in mitochondria,
free-living and obligate intracellular proteobacteria. BMC evolutionary bio-
logy, 7:17+, 2007.
J. P. McCutcheon e N. A. Moran. Parallel genomic evolution and metabolic inter-
dependence in an ancient symbiosis. Proceedings of the National Academy
of Sciences of the United States of America, 104(49):19392–19397, 2007.
J. P. McCutcheon, B. R. McDonald, e N. A. Moran. Convergent evolution of
metabolic roles in bacterial co-symbionts of insects. Proceedings of the Na-
tional Academy of Sciences of the United States of America, 106(36):
15394–15399, 2009.
V. Merhej, M. Royer-Carenzi, P. Pontarotti, e D. Raoult. Massive comparative
genomic analysis reveals convergent evolution of specialized bacteria. Biology
direct, 4:13+, 2009.
N. A. Moran. Symbiosis as an adaptive process and source of phenotypic comple-
xity. Proceedings of the National Academy of Sciences o f the United
States of America, 104 Suppl 1 (Suppl 1):8627–8633, 2007.
N. A. Moran, J. P. McCutcheon, e A. Nakabachi. Genomics and evolution of
heritable bacterial symbionts. Annual review of genetics, 42(1):165–190,
2008.
A. Moya, J. Peret´o, R. Gil, e A. Latorre. Learning how to live together: genomic
insights into prokaryote-animal symbioses. Nature reviews. G enetics, 9(3):
218–229, 2008.
92
A. Moya, R. Gil, e A. Latorre. The evolutionary history of symbiotic associations
among bacteria and their animal hosts: a model. Clinical microbiology and
infection : the ocial publication of the European Society of Clinical
Microbiology and Infectious Diseases, 15 Suppl 1:11–13, 2009.
S. Nair. Bacterial Associations: Antagonism to Symbiosis, pages 83–89.
National Institute of Oceanography, Goa, 2004.
A. Nakabachi, A. Yamashita, H. Toh, H. Ishikawa, H. E. Dunbar, N. A. Moran, e
M. Hattori. The 160-kilobase genome of the bacterial endosymbiont carsonella.
Science (New York, N.Y.), 314(5797), 2006.
P. Nardon e H. Charles. Morphological aspects of symbiosis. In J. Seckbach, editor,
Symbiosis, volume 4 of Cellular Origin, Life in Extreme Habitats and
Astrobiology, chapter 2 , pages 13–44. Kluwer Academic Publishers, Dordrecht,
2004.
P. Nardon e A. M. Grenier. Symbiose et ´evolution. Annales de la Soci´et´e
entomologique de France, 29(2):113–140, 1993.
B. Nerima, D. Nilsson, e P. M
¨
aser. Comparative genomics of metabolic networks
of free-living and parasitic eukaryotes. BMC genomics, 11:217+, 2010.
K. M. Oliver, P. H. Degnan, G . R. Burke, e N. A. Moran. Facultative symbionts
in aphids and the horizontal transfer of ecologically important traits. Annual
review of entomology, 55:247–266, 2010.
S. Paracer e V. Ahmadjian. Symbiosis: An Introduction to Biological As-
sociations. Oxford University Press, USA, 2 edition, 2000.
V. P´erez-Brocal, R. Gil, S. Ramos, A. Lamelas, M. Postigo, J. M. M. Michelena,
F. J. Silva, A. Moya, e A. Latorre. A small microbial genome: the end of a
long symbiotic relationship? Science (New York, N.Y.), 314(5797):312–313,
2006.
93
R Development Core Team. R: A Language and Environment for Statistical
Computing. R Foundation for Statistical Computing, Vienna, Austria, 2009.
S. A. A. Rahman e D. Schomburg. Observing local and global properties of me-
tabolic pathways: ’load points’ and ’choke points’ in the metabolic networks.
Bioinformatics (Oxford, England), 22(14):1767–1774, 200 6.
P. T. Rajagopalan, A. Datta, e D. Pei. Purification, characterization, and inhibi-
tion o f peptide deformylase from escherichia coli. Biochemistry, 36(45):13910–
13918, 1997.
P. Shannon, A. Markiel, O. Ozier, N. S. Baliga, J. T. Wang, D. Ramage, N. Amin,
B. Schwikowski, e T. Ideker. Cytoscape: a software environment for integrated
models of biomolecular interaction networks. Genome research, 13(11):2498–
2504, 2003.
S. Shigenobu, H. Watanabe, M. Hattori, Y. Sakaki, e H. Ishikawa. Genome se-
quence of the endocellular bacterial symbiont o f aphids buchnera sp. aps. Na-
ture, 407(6800):81–86, 2000.
K. Takemoto, J. C. Nacher, e T. Akutsu. Correlation between structure and
temperature in prokaryotic metabolic networks. BMC bioinformatics, 8:303+,
2007.
J. Tamames, R. Gil, A. Latorre, J. Peret´o, F. J. Silva, e A. Moya. The frontier
between cell and organelle: genome analysis of candidatus carsonella ruddii.
BMC evolutionary biology, 7(1):181+, 2007.
I. Tamas, L. M. Klasson, J. P. Sandstr
¨
om, e S. G. Andersson. Mutualists and
parasites: how to paint yourself into a (metabolic) corner. FEBS letters, 498
(2-3):135–139, 2001.
M. J. Taylor, C. Bandi, e A. Hoerauf. Wolbachia bacterial endosymbionts of filarial
nematodes. Advances in parasitology, 60:245–284, 2005.
94
H. Toh, B. L. Weiss, S. A. Perkin, A. Yamashita, K. Oshima, M. Hattori, e S. Aksoy.
Massive genome erosion and functional adaptations provide insights into the
symbiotic lifestyle of sodalis glossinidius in the tsetse host. Genome research,
16(2):149–156, 2006.
D. Vallenet, S. Engelen, D. Mornico, S. Cruveiller, L. Fleury, A. Lajus, Z. Rouy,
D. Roche, G. Salvignol, C. Scarpelli, e C. M´edigue. Microscope: a platform
for microbial genome annotation and comparative genomics. Database : the
journal of biological databases and curation, 2009(0):bap021+, 2009.
E. van Nimwegen. Scaling laws in the functional content of genomes. Trends in
genetics : TIG, 19(9):479–484, 2003.
A. T. R. Vasconcelos, H. B. Ferreira, C. V. Bizarro, S. L. Bonatto, M. O. Car-
valho, P. M. Pinto, D. F. Almeida, L. G. Almeida, R. Almeida , L. Alves-Filho,
E. N. Assun¸ao, V. A. Azevedo, M. R. Bogo, M. M. Brigido, M. Brocchi, H. A.
Burity, A. A. Camargo, S. S. Camargo, M. S. Carepo, D. M. Ca rraro, J. C.
de Mattos Cascardo, L. A. Castro, G. Cavalcanti, G. Chemale, R. G. Collevatti,
C. W. Cunha, B. Dallagiovanna, B. P. Dambr´os, O. A. Dellagostin, C. Falc˜ao,
F. Fantinatti-Garboggini, M. S. Felipe, L. Fiorentin, G. R. Franco, N. S. Frei-
tas, D. Fr´ıas, T. B. Grangeiro, E. C. Grisard, C. T. Guimar˜aes, M. Hungria,
S. N. Jardim, M. A. Krieger, J. P. Laurino, L. F. Lima, M. I. Lopes, E. L. Lo-
reto, H. M. Madeira, G. P. Manfio, A. Q. Maranh˜ao, C. T. Martinkovics, S. R.
Medeiros, M. A. Moreira, M. Neiva, C . E. Ramalho-Neto, M. F. Nicol´as, S. C.
Oliveira, R. F. Paix˜ao, F. O. Pedrosa, S. D. Pena, M. Pereira, L. Pereira-Ferrari,
I. Pier, L. S. Pinto, D. P. Potrich, A. C. Salim, F. R. Santos, R. Schmitt, M. P.
Schneider, A. Schrank, I. S. Schrank, A. F. Schuck, H. N. Seuanez, D. W. Silva,
R. Silva, S. C. Silva, C. M. Soares, K. R. Souza, R. C. Souza, C. C. Staats,
M. B. Steens, S. M. Teixeira, T. P. Urmenyi, M. H. Vainstein, L. W. Zucche-
rato, A. J. Simpson, e A. Zaha. Swine and poultry pathogens: the complete
95
genome sequences of two strains of mycoplasma hyopneumoniae and a strain of
mycoplasma synoviae. Journal of bacteriology, 187(16):5568–5577, 2005.
A. Wagner e D. A. Fell. The small world inside large metabolic networks. Pro-
ceedings. Biological sciences / The Royal Society, 268(1478):1803–1810,
2001.
D. J. Watts e S. H. Strogatz. Collective dynamics of ’small-world’ networks. Na-
ture, 393(6684):440–442, 1998.
J. J. Wernegreen. For better or worse: genomic consequences of intracellular mu-
tualism and parasitism. Current opinion i n genetics & development, 15
(6):572–583, 2005.
D. Wu, S. C. Daugherty, S. E. Van Aken, G. H. Pai, K. L. Watkins, H. Khouri,
L. J. Tallon, J. M. Zaborsky, H. E. Dunbar, P. L. Tran, N. A. Moran, e J. A.
Eisen. Metabolic complementarity and genomics of the dual bacterial symbiosis
of sharpshooters. PLoS biology, 4(6), 2006.
E. Zientz, T. Dandekar, e R. Gross. Metabolic interdependence o f obligate intracel-
lular bacteria and their insect hosts. Microbiology and molecular biology
reviews : M MBR, 68(4):745–770, 2004.
96
Apˆendice A
A.1 Informa¸oes do conjunto de organismos
97
Tabela A.1: Informa¸oes do conjunto de organismos.
Car´ater da Associa¸ao
odigo Nome N° Genes Associa¸ao Bact´eria Hospedeiro Localiza¸ao Transmiss˜ao
HODCD Candidatus Hodgkinia cicadicola Dsem 203 M O P I V
CARRP Candidatus Carsonella ruddii PV 214 M O P I V
SULMW Candidatus Sulcia muelleri GWSS 266 M O P I V
BUCCC Buchnera aphidicola Cc 396 M O P I V
MYCGE Mycoplasma genitalium G37 553 P O S CA H
BUCAI Buchnera aphidicola APS 619 M O P I V
BLASB Blattabacterium sp. Bge 638 M O P I V
BAUCH Baumannia cicadellinicola str. Hc 657 M O P I V
BLOFL Candidatus Blochmannia floridanus 668 M O P I V
WIGBR Wigglesworthia glossinidia endosymbiont of Glossina brevipalpis 671 M O P I V
BLOPB Candidatus Blochmannia pennsylvanicus B PEN 718 M O P I V
MYCHJ Mycoplasma hyopneumoniae J 754 P O S CA H
RICTY Rickettsia typhi Wilmington 976 P O S I V
CHLTR Chlamydia trachomatis D/UW-3/CX 987 P O S I H
WOLTR Wolbachia pipientis wBm endosymbiont strain TRS of Brugia malayi 1188 M O P I V
WOLPM Wolbachia pipientis wMel endosymbiont of Drosophila melanogaster 1416 P O S I V
Continua¸ao na pr´oxima agina
98
Tabela A.1 continua¸ao da agina anterior
Car´ater da Associa¸ao
odigo Nome N° Genes Associa¸ao Bact´eria Hospedeiro Localiza¸ao Transmiss˜ao
BARQU Bartonella quintana Toulouse 1433 P O S CA H
LAWIP Lawsonia intracellularis PHE/MN1-00 1530 P O S I H
ORITB Orientia tsut sugamushi Boryong 1580 P O S I V
HELPY Helicobacter pylori 26695 1718 P O S CA H
STRTD Streptococcus thermophilus LMD-9 1836 C FA S E H
NEIG2 Neisseria gonorrhoeae NCCP11945 1947 P O S CA H
WOLSU Wolinella succinogenes DSM 1740 2138 C FA S E H
STRA5 Streptococcus agalactiae 2603V/R 2160 P FA S E H
THICR Thiomicrospira crunogena XCL-2 2353 FL FL FL FL FL
HAMD5 Candidatus Hamiltonella defensa T5A 2387 M O S CA V
LACC3 Lactobacillus casei ATCC 334 2949 C FA S E H
LISMO Listeria monocytogenes EGD-e 3084 P FA S CA H
XYLFA Xylella fastidiosa 9a5c 3261 P FA S E H
BRUME Brucella melitensis bv 1 16M 3492 P O S CA H
DESPS Desulfotalea psychrophila Lsv54 3600 FL FL FL FL FL
PSEHT Pseudoalteromonas haloplanktis TAC125 3612 FL FL FL FL FL
VIBCH Vibrio cholerae O1 biovar El Tor str. N16961 4025 P FA S E H
Continua¸ao na pr´oxima agina
99
Tabela A.1 continua¸ao da agina anterior
Car´ater da Associa¸ao
odigo Nome N° Genes Associa¸ao Bact´eria Hospedeiro Localiza¸ao Transmiss˜ao
BACA2 Bacillus amyloliquefaciens FZB42 4033 C FA S E H
YERPE Yersinia pestis CO92 4344 P O S CA H
BACSU Bacillus subtilis 168 4353 FL FL FL FL FL
ECOLI Escherichia coli K-12 4390 C FA S E H
YERPY Yersinia pseudotuberculosis YPIII 4618 P FA S CA H
SODGM Sodalis glossinidius morsitans 4649 M O S CA V
RHOS4 Rhodobacter sphaeroides 2.4.1 4672 FL FL FL FL FL
MYCTU Mycobacterium tuberculosis H37Rv 4679 P O S CA H
SALTI Salmonella enterica serovar Typhi 4712 P FA S CA H
SHIFL Shigella flexneri 2a str. 301 4728 P FA S CA H
ERWCT Erwinia carotovora subsp. atroseptica SCRI1043 4765 P FA S E H
PHOLL Photorhabdus luminescens TTO1 4801 P O S CA H
BURMA Burkholderia mallei ATCC 23344 5129 P O S CA H
PSEE4 Pseudomonas entomophila L48 5241 P FA S E H
ECO57 Escherichia coli O157:H7 5549 P FA S E H
BACHK Bacillus thuringiensis serovar konkukian str. 97-27 5599 P FA S E H
AGRT5 Agrobacterium tumefaciens C58 5700 P FA S E H
Continua¸ao na pr´oxima agina
100
Tabela A.1 continua¸ao da agina anterior
Car´ater da Associa¸ao
odigo Nome N° Genes Associa¸ao Bact´eria Hospedeiro Localiza¸ao Transmiss˜ao
BACAN Bacillus anthracis Ames Ancestor 5886 P O S CA H
CUPTR Cupriavidus taiwanensis LMG19424 5940 M FA S E H
PSEAB Pseudomonas aeruginosa UCBPP-PA14 6254 P FA S E H
FRAAA Frankia alni ACN14a 6763 M FA S E H
RHIME Sinorhizobium meliloti 1021 6933 M FA S E H
PSEFS Pseudomonas fluorescens SBW25 6960 C FA S E H
MYCS2 Mycobacterium smegmatis MC2 155 7223 C FA S E H
RALEH Ralstonia eutropha H16 7279 FL FL FL FL FL
Asso cia¸ao:C,comensal;M,mutualista;P,parasita;FL,vidalivre.Car´ater da Associa¸ao Bact´eria:FA,facultativa;O,obrigat´oria.Car´ater da Associa¸ao Hospedeiro:
P, apresenta simbionte prim´ario; S, apresenta simbionte secund´ario. Localiza¸ao:I,intracelularobrigat´orio;CA:associado`ac´elula;E,extracelular.Transmiss˜ao:H,horizontal;
V, vertical.
101
Livros Grátis
( http://www.livrosgratis.com.br )
Milhares de Livros para Download:
Baixar livros de Administração
Baixar livros de Agronomia
Baixar livros de Arquitetura
Baixar livros de Artes
Baixar livros de Astronomia
Baixar livros de Biologia Geral
Baixar livros de Ciência da Computação
Baixar livros de Ciência da Informação
Baixar livros de Ciência Política
Baixar livros de Ciências da Saúde
Baixar livros de Comunicação
Baixar livros do Conselho Nacional de Educação - CNE
Baixar livros de Defesa civil
Baixar livros de Direito
Baixar livros de Direitos humanos
Baixar livros de Economia
Baixar livros de Economia Doméstica
Baixar livros de Educação
Baixar livros de Educação - Trânsito
Baixar livros de Educação Física
Baixar livros de Engenharia Aeroespacial
Baixar livros de Farmácia
Baixar livros de Filosofia
Baixar livros de Física
Baixar livros de Geociências
Baixar livros de Geografia
Baixar livros de História
Baixar livros de Línguas
Baixar livros de Literatura
Baixar livros de Literatura de Cordel
Baixar livros de Literatura Infantil
Baixar livros de Matemática
Baixar livros de Medicina
Baixar livros de Medicina Veterinária
Baixar livros de Meio Ambiente
Baixar livros de Meteorologia
Baixar Monografias e TCC
Baixar livros Multidisciplinar
Baixar livros de Música
Baixar livros de Psicologia
Baixar livros de Química
Baixar livros de Saúde Coletiva
Baixar livros de Serviço Social
Baixar livros de Sociologia
Baixar livros de Teologia
Baixar livros de Trabalho
Baixar livros de Turismo