Download PDF
ads:
UNIVERSIDADE FEDERAL DE SANTA CATARINA
PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA QUÍMICA
ITAMAR LEITE DE OLIVEIRA
ANÁLISE COMPUTACIONAL DE REDES
METABÓLICAS COM REGULAÇÃO
Florianópolis - SC
2008
ads:
Livros Grátis
http://www.livrosgratis.com.br
Milhares de livros grátis para download.
UNIVERSIDADE FEDERAL DE SANTA CATARINA
PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA QUÍMICA
ITAMAR LEITE DE OLIVEIRA
ANÁLISE COMPUTACIONAL DE REDES
METABÓLICAS COM REGULAÇÃO
Tese submetida à Universidade Federal de Santa Catarina como parte dos requisitos para
obtenção do título de Doutor em Engenharia Química
Prof. Luismar Marques Porto, Ph.D
Orientador
Florianópolis - SC
2008
ads:
ANÁLISE COMPUTACIONAL DE REDES
METABÓLICAS COM REGULAÇÃO
ITAMAR LEITE DE OLIVEIRA
Esta tese foi julgada adequada para a obtenção do Título de Doutor em Engenharia Química e
aprovada em sua forma final pelo Curso de Pós Graduação em Engenharia Química.
Prof. Leonel Teixeira Pinto, Dr. Eng.
Coordenador do Curso
Banca Examinadora:
Prof. Luismar Marques Porto, Ph.D. - Orientador
Universidade Federal de Santa Catarina – EQA/CTC
Presidente
Prof. José Carlos Merino Mombach, D.Sc.
Universidade Federal de Santa Maria – Depto. de Física
Membro Externo
Prof. Eugênio Simão, Dr. Eng.
Universidade do Oeste de Santa Catarina – Centro Tecnológico
Membro Externo
Profa. Sônia Elena Palomino Castro Bean, Dr. Eng.
Universidade Federal de Santa Catarina – MTM/CFM
Membro Externo
Profa. Cíntia Soares, Dr. Eng.
Universidade Federal de Santa Catarina – EQA/CTC
Membro Interno
AGRADECIMENTOS
Ao professor Luismar Marques Porto, pela orientação e incentivo durante o
desenvolvimento deste trabalho. Seu apoio me estimulou a crescer científica, ética,
profissional e pessoalmente.
A minha querida esposa Maristela Corrêa Meller, pelo incansável apoio, dedicação,
carinho e, principalmente, pela sua paciência durante todos estes anos.
Aos meus pais e familiares, pela dedicação e apoio incondicional desde os meus
primeiros momentos de vida.
Aos meus amigos e colegas do grupo de engenharia genômica que contribuíram para
a minha formação científica e pessoal. Um agradecimento especial a Derce O. S. Recouvreux,
Claudimir Antonio Carminatti e Júlia de Vasconcellos Castro.
Ao CNPq (Conselho Nacional de Desenvolvimento Científico e Tecnológico) pelo
apoio financeiro através de financiamento de projetos.
RESUMO
Este trabalho reúne ferramentas computacionais de biologia de sistemas num
aplicativo chamado GEnSys (Genomic Engineering System), desenvolvido usando o
MATLAB
®
, e que é formado por um conjunto de módulos interdependentes que permite a
análise e simulação de redes de reações bioquímicas. Os módulos implementados realizam as
seguintes tarefas: simulação dinâmica determinística, análise de controle metabólico, análise
de fluxo metabólico, análise de balanço de fluxo e determinação de modos elementares. Uma
característica importante do GEnSys é que não há a necessidade da entrada direta da matriz
estequiométrica que representa o modelo biológico, pois existe um módulo que lê um arquivo
contendo as reações da rede metabólica, escritas em uma sintaxe específica. Este
procedimento gera automaticamente a matriz estequiométrica da rede. Para tanto, foi criada
uma linguagem formal batizada de Linguagem de Reações Bioquímicas (LRB), flexível e
intuitiva. Por exemplo, os nomes dos reagentes e produtos de uma reação podem conter
caracteres especiais, tais como +, -, espaço e apóstrofo. Esses símbolos são comuns nos
nomes dos compostos bioquímicos. Da forma como foi projetado, o GEnSys pode ser
facilmente extendido para outros tipos de métodos de análise envolvendo a matriz
estequiométrica.
A partir de dados da literatura foram modeladas e simuladas diversas redes
metabólicas. Para a Clostridium acetobutylicum foram consideradas todas as reações usadas
para a produção de ácidos, solventes e hidrogênio molecular a partir de dois substratos
distintos: glicose e glicerol. A rede modelada captura importantes aspectos qualitativos, de
acordo com padrão de distribuição de fluxos (velocidades de reação) desta bactéria. Em um
dos casos analisados foi possível obter valores quantitativos próximos aos valores reportados
na literatura. Foram determinados 29 modos elementares de fluxo para a produção de
hidrogênio molecular pela C. acetobutylicum. Destes, há 13 modos distintos envolvidos na
produção de H
2
: seis a partir da glicose, seis a partir do glicerol e um relativo ao NADH, o
qual foi considerado externo.
Um estudo de caso em que a regulação da expressão gênica é importante foi
conduzido comparando-se as simulações estocástica e determinística da via de biossíntese do
triptofano da Escherichia coli. Todos os mecanismos de regulação conhecidos do operon trp
(transcrição, tradução e inibição enzimática) foram considerados nas simulações estocástica e
determinística. Em ambas, o comportamento da atividade da enzima antranilato sintase foi
avaliado e comparado aos valores experimentais para uma E. coli selvagem.
ABSTRACT
This work considers a set of computational systems biology tools, written as a
MATLAB
®
toolbox called GEnSys (Genomic Engineering System). GEnSys comprises several
interdependent modules that allow analysis and simulation of biochemical reaction networks.
The developed implemented modules perform the following tasks: deterministic dynamic
simulation, metabolic control analysis, metabolic flux analysis, flux balance analysis and
determination of elementary modes. An important GEnSys feature is that the stoichiometric
matrix representing the biological model does not have to be supplied directly. A module that
reads an external file describing the metabolic network, in a specified, proposed syntax (the
Biochemical Reaction Language – LRB), automatically produces the stoichiometric matrix.
LRB is a flexible but intuitive language, that also allows the use of common biochemical
symbols such as +, -, blank space and primes. Due to its design strategy, GEnSys may be
easily extended for other analytical methods involving the stoichiometric matrix.
Several metabolic networks were modeled from literature data and simulated using
the developed tools. For Clostridium acetobutylicum all important reactions involved in the
production of acids, solvents and molecular hydrogen, using two substrates, glucose and
glycerol, were considered. The modeled network captures essential qualitative behavior,
according to expected flux distribution from that bacterium. In one of the analysed cases,
good quantitative agreement with literature data was found. Twenty-nine flux elementary
modes for the molecular hydrogen production were found, thirteen of them involved in the H
2
biosynthesis: six from glucose, six from glycerol, and one regarding NADH production.
NADH was considered an external metabolite.
A comparison between stochastic and deterministic simulation was carried out using
a model where genetic regulation is important, the tryptophan biosynthesis by Escherichia
coli. All known regulatory mechanisms for the trp operon (transcription, translation and
enzymatic inhibition) were taken into account. In both cases, the catalytic behavior of the
anthranilate synthase enzyme was evaluated and compared to experimental values reported to
wild type E. coli.
LISTA DE FIGURAS
Figura 1: Representação da matriz A.
ij
a é um elemento situado na linha i e coluna j.............3
Figura 2: Os seis possíveis casos do problema de quadrados mínimos (PQM) em relação ao
posto da matriz A e suas dimensões m e n...........................................................................7
Figura 3: Matriz estequiométrica total. ....................................................................................13
Figura 4: Matriz estequiométrica dos metabólitos internos. ....................................................13
Figura 5: a) Exemplo de rede metabólica, onde os b
i
representam os metabólitos externos; v
2
,
v
3
e v
4
são as reações internas e v
1
, v
4
e v
5
as reações de fronteira. ..................................14
Figura 6: Rede metabólica com 4 metabólitos e 6 reações ......................................................19
Figura 7: Matriz kernel de N correspondente a rede da Figura 6.............................................19
Figura 8: Vetores bases do espaço nulo da matriz estequiométrica representados como uma
distribuição de fluxos na rede............................................................................................20
Figura 9: Uma rede metabólica (A) e seus modos elementares (B) e vias extremas (C)
correspondentes .................................................................................................................21
Figura 10: Matriz estequiométrica vista como uma transformação linear. Os quatros
subespaços vetoriais associados a N também são mostrados............................................27
Figura 11: Coeficiente de elasticidade (ε) de uma reação v
j
em relação ao substrato x
i
e um
inibidor I. ...........................................................................................................................30
Figura 12: Ilustração das restrições aplicadas a uma rede metabólica.....................................35
Figura 13: Esquema das diferentes aplicações de análise estequiométrica..............................37
Figura 14: Hierarquia dos módulos que compõem o GEnSys. Os módulos de onde partem as
setas usam (herdam) as informações dos módulos aos quais estão ligados.......................
53
Figura 15: Esquema gráfico para a classificação dos metabólitos como internos ou externos.
Nos casos (a), (b) e (c) o metabólito A é considerado como externo................................
59
Figura 16: Via metabólica representando a primeira parte da glicólise da Saccharomyces
cerevisiae
...........................................................................................................................61
Figura 17: Concentrações dos metabólitos internos ao longo do tempo. Estes gráficos foram
produzidos pelo comando
subplotTrans............................................................................70
Figura 18: Gráficos de todas as concentrações dos metabólitos internos num única figura.
Produzido pelo comando plotTransFig. ............................................................................70
Figura 19: Valores dos fluxos de cada reação (enzima) da rede metabólica no tempo............71
Figura 20: Comparação da atividade enzimática obtida pelos modelos determinístico (linha
pontilhada) e estocástico (linha cheia)...............................................................................
76
Figura 21: Número de moléculas de triptofano ao longo do tempo relacionado ao experimento
de derepression ..................................................................................................................77
Figura 22: Os dois primeiros passos na via de biossíntese de penicilina pela P. chrysogenum.
As linhas tracejadas indicam inibição da reação pelo metabólito .....................................78
vii
Figura 23: Rede bioquímica utilizada pela C. acetobutylicum para a conversão de glicose e
glicerol em hidrogênio, ácidos (acetato e butirato) e solventes (butanol e acetona) em
condições anaeróbicas........................................................................................................82
Figura 24: Esquema gráfico dos modos elementares de produção de H
2
a partir do glicerol,
considerando a Figura 23...................................................................................................87
Figura 25: Restrição de balanço de fluxo para a rede da C. acetobutylicum mostrada da Figura
23 .......................................................................................................................................93
Figura 26: Distribuição de fluxo da ABF ao se maximizar a biomassa com velocidade de
consumo de glicose 8,72 mmol/gdw
-1
h
-1
...........................................................................94
Figura 27: Distribuição de fluxo da ABF ao se maximizar o H
2
com velocidade máxima de
consumo de glicose 8,7 mmol/gdw
-1
h
-1
.............................................................................95
Figura 28: Cada grupo de barras representa um fluxo..............................................................97
Figura 29: Distribuição de fluxo obtida pela ABF ao se maximizar a biomassa ou a
biomassa+H2 ou a biomassa+butirato+acetato ou o butirato+acetato. .............................98
Figura 30: Dados experimentais versus simulados, ambos na fase solventogênica.................99
Figura 31: Dados experimentais versus simulados, ambos na fase acidogênica....................100
LISTA DE QUADROS
Quadro 1: Algoritmo do método direto....................................................................................17
Quadro 2: Cálculo da matriz T, em linguagem MATLAB
®
.......................................................45
Quadro 3: Exemplo de equação cinética. .................................................................................46
Quadro 4: Função MATLAB
®
gerada automaticamente para a equação cinética do Quadro 3. 46
Quadro 5: Exemplos de reações escritas em LRB....................................................................49
Quadro 6: Sintaxe de uma expressão cinética..........................................................................50
Quadro 7: Exemplo de reações da seção 2.5............................................................................51
Quadro 8: Exemplos de equações cinéticas escritas numa sintaxe própria para as equações da
seção 2.5. Os valores dos parâmetros são aleatórios. ........................................................51
Quadro 9: Sintaxe para atribuir valores iniciais aos metabólitos internos. ..............................52
Quadro 10: Exemplo de atribuição de valores iniciais.............................................................52
Quadro 11: Exemplo de reações e outras informações que formam um modelo gravado num
arquivo...............................................................................................................................56
Quadro 12: Exemplo de reações com metabólitos forçados a serem internos ou externos......59
Quadro 13: Reações em LRB da rede mostrada na Figura 16..................................................62
Quadro 14: Sintaxe para a criação de um modelo para a AFM................................................80
Quadro 15: Sintaxe para a construção de um modelo para ABF..............................................91
LISTA DE TABELAS
Tabela 1: Exemplo das informações armazenadas no campo sInf da estrutura modelinf.........57
Tabela 2: Cinéticas pré definidas no GEnSys ..........................................................................67
Tabela 3: Constantes usadas nas simulações determinística e estocástica...............................75
Tabela 4: Valores iniciais para os compostos na simulação estocástica. Estes valores refletem
um experimento de derepression.......................................................................................77
Tabela 5: Coeficiente de controle de fluxo para as quatro enzimas da rede mostrada na Figura
22. ......................................................................................................................................79
Tabela 6: Resultado dos fluxos calculados usando os dados da Tabela 11 como fluxos
medidos..............................................................................................................................81
Tabela 7: Nomes das enzimas (ou fluxos) da rede metabólica da Figura 23. Algumas reações,
sequência linear, foram agrupadas formando uma única reação.......................................
83
Tabela 8: Significados dos nomes dos metabólitos da rede da Figura 23................................84
Tabela 9: Os 29 modos elementares correspondentes à rede da Figura 23..............................86
Tabela 10: Reações globais relacionadas aos 29 modos elementares. O sufixo _x em alguns
metabólitos significa que eles foram tratados como metabólitos externos........................88
Tabela 11: Dados experimentais relacionados à fase solventogênica......................................96
Tabela 12: Dados experimentais relacionados à fase acidogênica...........................................99
LISTA DE SÍMBOLOS E ABREVIATURAS
Abreviatura Significado
ABF Análise de balanço de fluxos
AcAcetil-CoA Aceto acetil coenzima A
AcetatoExt Acetato externo
ACM Análise de controle metabólico
ACVS ACV sintetase
ADP Adenosina difosfato
AFM Análise de fluxo metabólico
ATP Adenosina trifosfato
bisACV bis-(L-aminoadipil)-L-cysteinil-D-valina
ButiratoExt Butirato externo
CCC Coeficiente de controle de concentração
CCF Coeficiente de controle de fluxo
CoA Coenzima A
EDO Equação diferencial ordinária
Elmo Modos elementares
FdOxi Ferredoxina oxidada
FdRed Ferredoxina reduzida
GDH-3-P Gliceraldeído-3-fosfato
GEnSys Genomic Engineering System
H
2
Hidrogênio molecular
i,j Índices das linhas e colunas de uma matriz bidimensional
I
n
Matriz identidade de ordem n
IPNS Isopenicilina N sintetase
LactatoExt Lactato externo
LD Linearmente dependente
LI Linearmente independente
LLD-ACV (L-aminoadipil)-L-cisteinil-D-valina
LRB Linguagem das reações bioquímicas
ME Modo elementar
ModelInfo Módulo do GEnSys que contém os dados básicos do modelo
xi
Abreviatura Significado
N
Matriz estequiométrica dos metabólitos internos
NAD+ Nicotinamida adenina dinucleotídeo
NADH Nicotinamida adenina dinucleotídeo, forma reduzida
PIR Piruvato
PQM Problema de quadrados mínimos
QR Decomposição ortogonal de uma matriz A em outras duas matrizes: Q e R
r
Posto ou rank de uma matriz
S
Matriz estequiométrica total
SVD Decomposição por valores singulares (singular value decomposition)
v
Vetor de fluxos de uma rede metabólica
v1 Velocidade da glicólise
v10 Acetaldeído desidrogenase
v11 CoA transferase 1
v12 CoA transferase 2
v13 Butiril-CoA desidrogenase
v14 Fosfotransbutirilase
v15 Butiraldeído desidrogenase
v16 Velocidade de crescimento celular
v17 ATPase
v18 Transporte de lactato
v19 Transporte de acetato
v2 Glicerol desidrogenase
v20 Transporte de butirato
v3 Velocidade de produção de piruvato
v4 Piruvato-ferredoxina oxidoredutase
v5 NADH-ferredoxina oxidoredutase;
v6 Hidrogenase
v7 Velocidade de produção de lactato
v8 Tiolase
v9 Fosfotransacetilase
VE Vias extremas
xii
Símbolo Significado
n
Espaço vetorial n-dimensional
nm×
Espaço vetorial das matrizes nm
×
<u,v> Produto interno entre os vetores u e v
u
Norma 2 do vetor u
Produtório
ε
Matriz dos coeficientes de elasticidade de uma rede metabólica
As matrizes e vetores foram escritos com letras maiúsculas e em negrito.
SUMÁRIO
1 INTRODUÇÃO...............................................................................................1
1.1 OBJETIVOS.....................................................................................................................1
1.1.1 Objetivo Geral............................................................................................................1
1.1.2 Objetivos Específicos ................................................................................................2
1.2 ORGANIZAÇÃO DO TEXTO........................................................................................2
2 FUNDAMENTAÇÃO TEÓRICA ..................................................................3
2.1 TÓPICOS DE ÁLGEBRA LINEAR................................................................................3
2.1.1 Matrizes .....................................................................................................................3
2.1.2 Espaços Vetoriais.......................................................................................................4
2.1.3 Subespaços de um Espaço Vetorial ...........................................................................4
2.1.4 Combinação Linear, Conjuntos Geradores, Base e Dimensão..................................4
2.1.5 Ortogonalidade...........................................................................................................5
2.1.6 Decomposição Ortogonal ..........................................................................................6
2.1.7 Problemas de Quadrados Mínimos............................................................................6
2.2 MATRIZ ESTEQUIOMÉTRICA ..................................................................................12
2.3 SIMULAÇÃO DINÂMICA...........................................................................................14
2.3.1 Simulação Determinística........................................................................................14
2.3.2 Simulação Estocástica..............................................................................................15
2.4 INFORMAÇÕES ESTRUTURAIS DA MATRIZ ESTEQUIOMÉTRICA..................18
2.4.1 Espaço Nulo da Matriz Estequiométrica .................................................................18
2.4.2 Modos Elementares de Fluxos e Vias Extremas......................................................20
2.4.3 Relações de Conservação.........................................................................................22
2.5 CINÉTICA DAS REAÇÕES BIOQUÍMICAS..............................................................25
2.6 SUBESPAÇOS RELACIONADOS À MATRIZ ESTEQUIOMÉTRICA....................26
2.6.1 Conteúdo dos Subespaços da Matriz Estequiométrica ............................................28
2.7 ANÁLISE DE CONTROLE METABÓLICO...............................................................28
2.7.1 Coeficiente de Elasticidade......................................................................................29
2.7.2 Coeficientes de Controle..........................................................................................30
2.7.3 Relações Estruturais.................................................................................................31
2.8 ANÁLISE DE FLUXO METABÓLICO.......................................................................33
2.9 ANÁLISE DE BALANÇO DE FLUXO........................................................................34
2.10 VISÃO GERAL DA MODELAGEM ESTEQUIOMÉTRICA .....................................36
2.11 PRODUÇÃO DE HIDROGÊNIO BACTERIANO.......................................................37
2.11.1 Simulação in silico da Produção de Biohidrogênio..............................................38
2.12 SIMULAÇÃO DINÂMICA DO OPERON TRP NA ESCHERICHIA COLI................39
xiv
3 METODOLOGIA..........................................................................................42
3.1 MATLAB
®
.....................................................................................................................42
3.2 IMPLEMENTAÇÕES EM MATLAB
®
.........................................................................43
3.2.1 Problemas de Quadrados Mínimos..........................................................................43
3.2.2 Linguagens das Reações Bioquímicas.....................................................................43
3.2.3 Análise de Fluxo Metabólico...................................................................................43
3.2.4 Análise de Balanço de Fluxo ...................................................................................44
3.2.5 Modos Elementares..................................................................................................44
3.2.6 Relação de Conservação..........................................................................................44
3.2.7 Geração da Equação Cinética ..................................................................................45
3.2.8 Simulação Determinística e Análise de Controle Metabólico.................................47
4 RESULTADOS E DISCUSSÃO ..................................................................48
4.1 LINGUAGENS DAS REAÇÕES BIOQUÍMICAS ......................................................48
4.2 EXPRESSÕES CINÉTICAS ENZIMÁTICAS E VALORES INICIAIS......................50
4.3 HIERARQUIA DOS MÓDULOS .................................................................................52
4.3.1 Módulo ModelInfo...................................................................................................54
4.3.2 Pré-processamento da LRB .....................................................................................55
4.3.3 Módulo totalStMat...................................................................................................57
4.3.4 Metabólitos Internos e Externos..............................................................................59
4.3.5 Módulo stMat...........................................................................................................60
4.4 SIMULAÇÃO DINÂMICA COM O GENSYS ............................................................61
4.4.1 Descrição do Exemplo para Simulação Dinâmica...................................................61
4.4.2 Matriz Estequiométrica Total ..................................................................................62
4.4.3 Matriz Estequiométrica Interna................................................................................63
4.4.4 Conjunto de Equações Diferenciais Ordinárias.......................................................64
4.4.5 Cinéticas das Reações..............................................................................................64
4.4.6 Valores Iniciais dos Metabólitos..............................................................................65
4.4.7 Forma Simplificada..................................................................................................66
4.4.8 Simulação Dinâmica do Modelo..............................................................................69
4.5 SIMULAÇÃO ESTOCÁSTICA DO OPERON TRP DA E. COLI ...............................72
4.5.1 Parâmetros ...............................................................................................................75
4.5.2 Resultados................................................................................................................76
4.6 ANÁLISE DE CONTROLE METABÓLICO NA PRODUÇÃO DE PENICILINA....78
4.7 ANÁLISE DE FLUXO METABÓLICO.......................................................................80
4.8 MODELAGEM E SIMULAÇÃO DA PRODUÇÃO DE BIOHIDROGÊNIO.............81
4.8.1 Rede Metabólica da C. acetobutylicum ...................................................................82
4.8.2 Modos Elementares da Rede Metabólica para a Produção de Biohidrogênio.........84
4.8.3 ABF da Produção de Biohidrogênio da C. acetobutylicum .....................................90
5 CONSIDERAÇÕES FINAIS......................................................................101
5.1 CONCLUSÕES............................................................................................................101
5.1.1 GEnSys ..................................................................................................................101
5.1.2 Simulação Estocástica da E. coli ...........................................................................103
5.1.3 Modelagem e Simulação da Rede Metabólica da C. acetobutylicum....................103
5.2 RECOMENDAÇÕES PARA TRABALHOS FUTUROS...........................................104
REFERÊNCIAS................................................................................................106
1 INTRODUÇÃO
Parte dos assuntos abordados neste trabalho situa-se em uma área emergente de
pesquisa conhecida como biologia de sistemas. Os métodos e técnicas usados em biologia de
sistemas requerem algum conhecimento em diversas outras áreas, tais como: biologia
molecular, engenharia, bioquímica, matemática e computação, por exemplo. Isto poderá ser
observado ao longo deste trabalho.
Serão discutidos também alguns métodos estudados em engenharia metabólica,
como análise de fluxo metabólico e análise de controle metabólico. Apesar de haver um forte
componente experimental em ambas as áreas de biologia de sistemas e engenharia metabólica,
serão vistos apenas alguns métodos matemáticos e computacionais para a análise e simulação
de redes metabólicas e de regulação.
Desde o sequenciamento do primeiro genoma completo, em 1995 – depois
impulsionado pelo sequenciamento do genoma humano –, a quantidade de dados públicos
disponíveis cresce rapidamente possibilitando a construção de redes metabólicas em escala
genômica. A obtenção destes dados é possível devido às tecnologias de alto rendimento
aplicado às ciências ômicas – genômica, proteômica, transcriptômica, entre outras.
O papel fundamental de métodos formais computacionais e matemáticos é extrair
informações, e relações entre elas, a partir desta grande quantidade de dados, de forma a
aumentar a compreensão do funcionamento da fisiologia dos organismos vivos. Estes
conhecimentos podem ser aplicados para o desenvolvimento de processos e produtos
biotecnológicos e, principalmente, na saúde humana. Neste contexto, foi desenvolvido o
GEnSys, um programa implementado em MATLAB
®
que reúne os principais métodos
computacionais para a análise e simulação de redes biológicas.
1.1 OBJETIVOS
1.1.1 Objetivo Geral
Sistematizar os principais métodos matemáticos e computacionais usados na biologia
de sistemas em um único aplicativo formando um conjunto de rotinas computacionais para a
modelagem e simulação de sistemas biológicos.
2
1.1.2 Objetivos Específicos
Para atingir o objetivo geral proposto, apresentam-se os seguintes objetivos
específicos:
desenvolver um conjunto de módulos computacionais flexíveis de forma a proporcionar
uma fácil extensão destes módulos para outros tipos de análises que envolvam a matriz
estequiométrica;
criar um conjunto de rotinas em MATLAB
®
para simulação dinâmica e no regime
estacionário de vias bioquímicas;
fazer a análise de balanço de fluxo da rede metabólica para a produção de hidrogênio
bacteriano;
realizar a análise estrutural, através dos modos elementares de fluxos, da rede metabólica
para a produção de hidrogênio bacteriano;
desenvolver um modelo da via reguladora do triptofano na Escherichia coli para
simulação estocástica;
criar uma linguagem para escrever as reações bioquímicas de forma a ser analisada e
processada pelos métodos computacionais.
1.2 ORGANIZAÇÃO DO TEXTO
Este trabalho foi organizado em 5 capítulos, além das referências que se encontram
no último capítulo. No capítulo 2 são abordados os principais conceitos e métodos usados
neste trabalho para as análises de redes metabólicas e reguladoras. No capítulo 3 são descritas
todas as abordagens usadas na implementação do GEnSys para simulação de vias metabólicas
e reguladoras. São descritos, principalmente, os recursos do MATLAB
®
que possibilitaram a
implementação das técnicas descritas no capítulo anterior. No capítulo 4 apresentam-se alguns
resultados e discussão de estudos de casos usando o GEnSys, bem como o próprio GEnSys.
Um destes estudos é para a produção de hidrogênio através da rede metabólica da C.
acetobutylicum
usando a análise de balanço de fluxo e modos elementares. No capítulo 5 são
apresentadas as conclusões e as recomendações para trabalhos futuros.
2 FUNDAMENTAÇÃO TEÓRICA
Neste capítulo serão abordados os principais elementos e métodos usados, neste
trabalho, para as análises de redes metabólicas e reguladoras.
2.1 TÓPICOS DE ÁLGEBRA LINEAR
Nesta seção será feita uma revisão de alguns tópicos de álgebra linear, uma vez que
muitos dos métodos usados fazem uso intensivo dos conceitos de álgebra linear.
2.1.1 Matrizes
Chama-se de matriz uma tabela de elementos dispostos em linhas e colunas. Dados
dois números m e n naturais, não nulos, chama-se matriz m por n toda tabela constituída por
nm × elementos dispostos em m linhas e n colunas. A Figura 1 apresenta esquematicamente
uma matriz
nm×
A cujos elementos são denotados por
ij
a .
Figura 1: Representação da matriz A.
ij
a é um elemento situado na linha i e coluna j.
Posto de uma Matriz
O posto linha de uma matriz A é o número de linhas linearmente independentes. O
posto linha de A é igual ao posto coluna de A e, como são equivalentes, trabalha-se apenas
com o posto (ou
rank) de A.
Matriz de Permutação
Uma matriz de permutação (P) é a matriz identidade (I) com suas linhas
reordenadas. Se P é uma matriz de permutação, então pré-multiplicar A por uma matriz de
permutação equivale a permutar as linhas da matriz A. Pós-multiplicar a matriz A por uma
matriz de permutação equivale a permutar as colunas de A. As matrizes de permutação são
ortogonais, então
T1
PP =
.
mnmm
n
n
aaa
aaa
aaa
L
MOMM
L
L
21
22221
11211
j
i
m linhas
n colunas
nm×
A
4
2.1.2 Espaços Vetoriais
Um espaço vetorial real é um conjunto não vazio V munido de duas operações,
adição e multiplicação por escalar, tais que:
u e Vv , então V+ vu . A operação de adição é fechada em V e além disso:
-
V+=+ vuuvvu ,,
;
-
()()
V
++
=
++ wvuwuvwvu ,,, ;
- Existe em V um único vetor denominado vetor nulo e representado por 0, tal que
V+=+ uu00u ,
;
- Para cada V
u , existe um único vetor denominado vetor oposto e representado por
u , tal que
()
0=+ uu .
Se Vv e k é um escalar então Vk
v . A operação de multiplicação é fechada em V ,
isto é:
-
()
vuvu kkk +=+ , onde k é um escalar e
V
vu,
;
-
()
uuu baba +=+
, onde
a
e b são escalares e V
u ;
- para quaisquer escalares
a
e
b
e qualquer vetor
V
u
,
(
)()
uu baab = ;
- para o escalar 1, uu =1 para qualquer vetor V
u .
2.1.3 Subespaços de um Espaço Vetorial
Um subespaço W de um espaço vetorial V é um subconjunto não vazio contido em V
que satisfaz as seguintes propriedades:
1. se
Wvu, então
W+ vu
;
2.
seja a um escalar, e
Wu
, então
Wa
u
.
O item (1) acima declara que W é fechado em relação à operação de adição de
vetores. O item (2) estabelece que o conjunto W é fechado em relação à operação de
multiplicação. Como
VW , W compartilha as propriedades de V. Todo subespaço W de V
contém o vetor nulo.
2.1.4
Combinação Linear, Conjuntos Geradores, Base e Dimensão
Seja
V
um espaço vetorial sobre
e V
m21
vvv ,,, K . Qualquer vetor em
V
da
forma
m21
vvv
m
aaa +
+
+ K
21
, onde
i
a , é chamado combinação linear de
m21
vvv ,,, K . O conjunto de todas as combinações lineares, denotado por
m21
vvv ,,, K ou
5
()
m21
vvv ,,, Kger , é chamado espaço gerado por
m21
vvv ,,, K . De modo geral, para
qualquer subconjunto
S
,
()
Sger
ou
S consiste de todas as combinações lineares de vetores
de S.
Seja
V um espaço vetorial sobre
. Os vetores
V
m21
vvv ,,, K
são ditos
linearmente dependentes (LD) sobre
se existirem escalares
m
aaa ,,,
21
K não
simultaneamente nulos tais que 0
21
=
+
+
+
m21
vvv
m
aaa K . Caso contrário, são ditos
linearmente independente (LI) ou, simplesmente, independentes.
Um conjunto
{}
n21
uuu ,,, K=S de vetores é uma base de V se são verdadeiras as
condições:
n21
uuu ,,, K são LI e
n21
uuu ,,, K geram V . Em outras palavras, o conjunto S é
uma base de
V se todo vetor V
v pode escrever-se de maneira única como combinação
linear dos vetores da base
S .
2.1.5
Ortogonalidade
Vetores Ortogonais
Dados dois vetores colunas
x e y do
n
quaisquer. Estes dois vetores são ditos
serem ortogonais quando
0, =yx ou 0=yx
T
, onde yx, é o produto interno dos vetores x
e
y.
Conjuntos Ortogonais
Seja
{}
n21
uuu ,,, K=B um conjunto de vetores do
n
.
B
é um conjunto ortogonal
se
0,, ==
jiji
uuuu
t
ji . Se em particular i= ,1
i
u , então
B
é dito ser ortonormal,
ou seja:
=
=
ji
ji
se 0
se 1
,
ji
uu .
Todo conjunto ortogonal é LI e um conjunto de
n vetores ortonormais de um espaço
V n-dimensional é uma base ortonormal para V.
Matriz Ortogonal
Uma matriz
nm
Q
×
qualquer é ortogonal se
n
T
IQQ = e
m
T
IQQ = . Para uma matriz
ortogonal, as seguintes afirmações são equivalentes:
Q possui colunas ortonormais;
Q possui linhas ortonormais;
6
T
QQ =
1
;
22
xQx = para todo
n
x .
2.1.6 Decomposição Ortogonal
Dada a matriz A nm × com posto k; A pode ser decomposta da seguinte forma:
T
HR
K
A = , onde: H é uma matriz ortogonal mm
×
; R é uma matriz nm × triangular
superior;
K é uma matriz ortogonal nn
×
. A decomposição de A, como visto acima, é
chamada de decomposição ortogonal.
Decomposição Ortogonal QR
Toda matriz
nm
A
×
pode ser fatorada como QRA
=
, onde
mm×
Q
é ortogonal e
nm
R
×
é uma matriz triangular superior.
Decomposição Ortogonal por Valores Singulares (SVD
1
)
Qualquer matriz
nm
A
×
pode ser escrita como
T
USVA = , onde U
m×m
e V
n×n
são
matrizes ortogonais e
S
m×n
é uma matriz diagonal com
(
)
(
)
r
Sdiag
σ
σ
σ
,,,
21
K
=
, r é o posto
da matriz
A. Os números não negativos
i
σ
são denominados de valores singulares de A.
Usualmente, adota-se a convenção
r
σ
σ
σ
K
21
. Se a matriz A possui posto r, então A
possui exatamente
r valores singulares estritamente positivos.
2.1.7 Problemas de Quadrados Mínimos
O problema de se achar uma solução, aproximada ou exata, para o sistema bAx
=
é
conhecido como o problema de quadrados mínimos (PQM), e é assim definido: dados uma
matriz
A
de dimensão nm × , com posto
(
)
nmk ,min
, e um vetor m-dimensional b ,
encontrar um vetor
0
x que minimiza bAx . Isto é equivalente a achar
0
x tal que bAx
0
.
Dependendo do posto de
nm
A
×
, de m e n, o sistema
bAx
=
pode ter solução exata
ou aproximada. A
Figura 2 exibe os seis possíveis casos para este problema.
1
SVD: singular value decomposition, em inglês.
7
Figura 2: Os seis possíveis casos do problema de quadrados mínimos (PQM) em relação ao
posto da matriz A e suas dimensões m e n. Nos casos 1a e 3a, é garantido que o sistema tem
solução exata.
A seguir, será apresentado um método geral para a solução do PQM
bAx =
descrito
por Lawson e Hanson (1995). O uso de transformação ortogonal permite expressar a solução
do PQM da seguinte forma:
Suponha que
A é uma matriz nm
×
com posto k e que
T
HR
K
A = é uma
decomposição ortogonal de
A, onde:
H é uma matriz ortogonal mm × ;
R é uma matriz nm × da forma
=
00
0R
R
11
(2.1)
R
11
é uma matriz
kk ×
de posto k;
K é uma matriz ortogonal nn × ;
m = n
posto(A) = k = m = n
=
Caso 1a
m = n
posto(A) = k < m = n
Caso 1b
posto(A) = k = n < m
m > n
Caso 2a
posto(A) = k < n < m
m > n
Caso 2b
m < n
posto(A) = k = m < n
=
Caso 3a
m < n
posto(A) = k < n < m
Caso 3b
8
Definindo o vetor
}
}
km
k
T
==
2
1
g
g
gbH
(2.2)
e introduzindo uma nova variável
}
}
kn
k
T
==
2
1
y
y
yxK
(2.3)
e fazendo
1
~
y a solução única do sistema
1111
gyR =
(2.4)
Então:
todas as soluções que minimizam bAx são dadas por
=
2
1
y
y
Kx
~
ˆ
onde y
2
é arbritário;
(2.5)
o resíduo r da solução x
ˆ
é
==
2
y
0
HxAbr
ˆ
;
(2.6)
a norma de r satisfaz
2
gAxbr == ;
(2.7)
a solução de menor distância (da origem) é obtida por
=
0
y
Kx
1
~
ˆ
.
(2.8)
Por questões de desempenho, o método acima será adaptado para os casos descritos
na
Figura 2. Em cada um dos casos é considerada a decomposição ortogonal QR. Tais
algoritmos foram adaptados de Lawson e Hanson (1995).
9
Sistema Sobredeterminado e Sistema Exato com Posto Completo
Nos casos 1a e 2a da Figura 2, a matriz nn
×
triangular superior R
11
é não singular.
Por isso a solução
x
ˆ
para o PQM pode ser obtida computando:
}
}
nm
n
==
2
1
g
g
gQb
(2.9)
e resolvendo:
111
gxR =
ˆ
(2.10)
para o vetor solução
x
ˆ
. O vetor resíduo é xAbr
ˆ
=
, cuja norma é dada por:
2
gr ==
ρ
(2.11)
Sistema Indeterminado com Posto Completo
Considere o problema PQM,
bAx
=
, para o caso 3a da Figura 2, m < n e posto(A) =
m. O método de solução é descrito pelos seguintes passos:
[]
==
=
=
2
1
21
y
y
QQyx
ybRy
0:RAQ
arbritário com
(2.12)
A matriz Q é ortogonal e R é triangular superior e não singular. O vetor y
1
, m-
dimensional, é único. Para qualquer vetor
mn
2
y , o vetor x satisfaz bAx = . A solução
com comprimento mínimo é conseguida fazendo-se
0y
2
=
.
Sistema com Posto Deficiente
O algoritmo a seguir é aplicado nos problemas onde A tem posto deficiente (A é
singular), que correspondem aos casos 1b, 2b e 3b da
Figura 2:
{
{
}
}
km
k
kn
k
=
22
12
11
R
R
0
R
RQAP
}
}
km
k
c
c
cQb
2
1
==
(2.13)
10
[][]
0:WKR:R
1211
=
arbritário e
211
ycWy =
PKy
y
y
PKx
2
1
=
(
)
0ycyRcAxb
222222
==== se
ρ
O algoritmo determina a matriz ortogonal Q e a matriz de permutação P de modo
que R seja triangular superior e R
11
não singular.
PMQ Usando SVD
Para resolver o PQM
bxA
nm
×
,com nm , a decomposição SVD
()
T
nn
nnm
nn
mmnm
V
0
S
UA
×
×
×
××
=
(2.14)
pode ser usada substituindo-se o problema
bAx
pelo problema equivalente
()
()
}
}
Vpx
bUb
U
U
g
g
g
gp
0
S
T
T
2
T
1
=
=
=
nm
n
2
1
(2.15)
A norma residual associada à solução
x é definida como
bAx =
ρ
(2.16)
Pseudo-inversa
Seja
T
HR
K
A = uma decomposição ortogonal de A, então
T
HK
R
A
##
= é a
pseudo-inversa (PENROSE, 1955) de
A e R
#
é dada por
=
00
0R
R
1
11
#
(2.17)
Esta representação explícita da pseudo-inversa é útil para computação da pseudo-
inversa. Geralmente, não é necessário calcular explicitamente a pseudo-inversa de
A. Por
11
exemplo, para o PMQ, é mais econômico – em termos de tempo e memória – computar a sua
solução usando os três passos a seguir:
bA
0
y
Kx
ygyR
bHg
#
1
11111
T
=
=
=
=
para Resolver
(2.18)
PMQ com Restrição de Igualdade (PMQI)
Dados uma matriz
nm
1
C
×
com posto k, um vetor coluna d de dimensão m
1
, uma
matriz
nm
2
E
×
e um vetor f de dimensão m
2
. Achar o vetor x que minimiza
fEx , sujeito a
dCx
=
(2.19)
Em outras palavras, o problema acima é achar o vetor coluna
x de tamanho m
2
que
minimiza a norma dada na primeira expressão sujeito a restrição de igualdade da segunda
equação.
PMQ com Restrição de Desigualdade
Dados:
E uma matriz nm ×
2
;
f um vetor coluna de dimensão m
2
;
G uma matriz
nm ×
;
h um vetor de tamanho m.
Os PMQs com restrições lineares de desigualdade podem ser enunciados como
segue:
PMQ com restrição de desigualdade (PMQD)
Minimizar
fEx , sujeito a
hGx
;
PMQ com restrição de não negatividade (NNLS, nonnegative least square)
Minimizar
fEx , sujeito a 0x ;
Problema LDP (least distance programming)
Minimizar
x , sujeito a hGx ;
Os problemas PMQI, PMQD e NNLS vêm implementados no M
ATLAB
®
. A seguir
será exibido o algoritmo para o problema LDP:
12
Seja a matriz
(
)
m1n
E
×+
e o vetor coluna f de tamanho n+1
=
T
T
h
G
E
,
T
n
]1,0,0,0[
48476
K=f . Resolver o seguinte problema NNLS para u :
Minimizar
fEu , sujeito a 0u ;
Calcular o vetor fEur = ;
Se 0r , calcular
1
ˆ
+
=
n
j
r
r
j
x para nj ,,2,1 K
=
. Caso contrário, o sistema hGx é
inconsistente, ou seja, problema LDP não tem solução.
2.2 MATRIZ ESTEQUIOMÉTRICA
Nesta seção serão discutidas as propriedades estruturais das redes metabólicas cujos
elementos básicos são:
compostos ou espécies bioquímicas e suas concentrações;
reações ou processos de transporte que alteram as concentrações dos compostos
bioquímicos.
Os elementos acima descritos são sempre considerados variáveis em simulações de
redes metabólicas, chamadas de variáveis de estado (KLIPP
et al., 2005). Além destes,
existem ainda os parâmetros do modelo que influenciam a velocidade da reação como, por
exemplo, o nível da enzima, os metabólitos externos (efetores), os parâmetros cinéticos, entre
outros.
As reações bioquímicas e as espécies consideradas, com seus respectivos
coeficientes estequiométricos, compõem os elementos da chamada matriz estequiométrica,
S.
A interseção de uma linha com uma coluna, na matriz estequiométrica, indica se
certa espécie faz parte ou não de uma reação em particular e, de acordo com o sinal do
elemento da matriz (isto é, de seu coeficiente estequiométrico), pode-se saber se este é um
reagente (valor positivo) ou um produto (valor negativo) da reação. E ainda, pela magnitude
do coeficiente sabe-se a quantidade relativa consumida ou produzida em uma determinada
reação. Desta forma, a estequiometria relaciona o número de moles de uma espécie química
envolvida em uma reação, mas não informa nada sobre a sua velocidade. A matriz
estequiométrica é constante e determinada pela constituição genética do organismo
(PALSSON, 2006). A
Figura 3 mostra a estrutura da matriz estequiométrica total.
13
00
00
:
k
v
j
v
l
b
i
x
S
Figura 3: Matriz estequiométrica total.
Palsson (2006) define a matriz estequiométrica total como mostrado na
Figura 3,
onde as linhas pontilhadas definem partições na matriz. Nesta forma de representação
identificam-se as reações internas (
v
j
), as reações de fronteira (v
k
), os compostos internos (x
i
) e
externos (
b
l
). Considera-se, para algumas análises, a célula viva como um sistema fechado e
trabalha-se apenas com os metabólitos internos, formando a matriz
N(m×n), conforme Figura
4. Esta matriz será usada em todas as análises e métodos descritos neste trabalho. Os
compostos externos (
b
l
), se necessários, são considerados constantes em todas as análises.
k
v
j
v
i
x
:N
Figura 4: Matriz estequiométrica dos metabólitos internos.
Os metabólitos da rede formam o vetor coluna
x(m×1); os fluxos, o vetor coluna
v(n×1); e as concentrações das diferentes enzimas, o vetor coluna e(n×1), conforme equações
(2.20).
()
()
()
T
n
T
n
T
m
eee
vvv
xxx
,...,,
,...,,
,...,,
21
21
21
=
=
=
e
v
x
(2.20)
A título de exemplo, na
Figura 5a apresenta-se uma pequena rede metabólica com
quatro metabólitos internos e três externos. As setas, nesta figura, representam as reações, das
quais, três são de fronteira e as outras três são internas. A matriz estequiométrica total
correspondente é mostrada na
Figura 5b.
14
b
1
x
1
x
3
x
4
b
2
b
3
x
2
v
1
v
2
v
3
v
4
v
5
v
6
x
1
x
2
x
3
x
4
b
1
b
2
b
3
100000
010000
000001
101000
010100
001110
000011
v
1
v
2
v
3
v
4
v
5
v
6
a
)
b
)
Figura 5: a) Exemplo de rede metabólica, onde os b
i
representam os metabólitos externos; v
2
,
v
3
e v
4
são as reações internas e v
1
, v
4
e v
5
as reações de fronteira. A linha pontilhada define o
contorno celular onde x
i
são os metabólitos internos e b
l
os produtos (b
2
e b
3
) e substrato (b
1
).
b) Matriz estequiométrica total da rede metabólica mostrada em (a).
2.3 SIMULAÇÃO DINÂMICA
Serão descritos nesta seção os dois principais métodos de simulação dinâmica de
redes bioquímicas e reguladoras: simulação determinística e simulação estocástica. No
primeiro, são calculados, ao longo de um intervalo de tempo, os níveis de concentração dos
compostos que formam a rede; no segundo, determinam-se o número de moléculas dos
compostos da rede ao longo do tempo.
2.3.1 Simulação Determinística
A variação da concentração dos metabólitos ao longo do tempo é realizada pelo
balanço de massa dinâmico, dado pela equação
(2.21), para os m metabólitos internos de rede
(KLIPP
et al., 2005).
mi para v
dt
dx
n
j
jij
i
,...,1
1
==
=
α
(2.21)
Na equação
(2.21),
α
ij
é o coeficiente estequiométrico do metabólito interno i na
reação
j. A equação (2.21) representa um conjunto de m equações diferenciais ordinárias
(EDO). Cada uma das velocidades
v
j
deve ter uma expressão matemática que determina a
velocidade desta reação em função das concentrações dos reagentes, produtos (se for uma
reação reversível) e dos parâmetros da reação (ver seção
2.5).
Escrevendo a equação
(2.21) em notação matricial, obtém-se a equação (2.22), onde
N é a matriz estequiométrica correspondente aos metabólitos internos. Esta equação, que
15
descreve o balanço de massa dos diversos metabólitos, é a base para qualquer simulação de
redes metabólicas.
Nv
x
=
dt
d
(2.22)
A velocidade da reação (
v
j
) é dada em função dos níveis de concentração dos
metabólitos e dos valores dos parâmetros (parâmetros cinéticos, efetores externos, nível da
enzima, entre outros fatores) que aparecem na equação cinética da reação, equação
(2.23).
Nesta equação, o vetor
p(w×1) contém w parâmetros (ver seção 2.5).
()
px,fv
j
=
para
.,,2,1 nj K
=
(2.23)
2.3.2
Simulação Estocástica
O uso de EDOs para descrever processos bioquímicos faz certas suposições que nem
sempre são justificadas. Uma suposição é que as variáveis possuem valores contínuos. Isto é
uma simplificação, já que as espécies biológicas, moléculas, têm uma natureza discreta
(MCADAMS e ARKIN, 1997; YU
et al., 2006). Se o número de moléculas é suficientemente
grande não há problema com as EDOs, mas se o número de moléculas envolvido na
simulação é da ordem de dezenas ou centenas, essa natureza discreta deve ser levada em
consideração. Outra suposição importante no uso das equações diferenciais é que estas tratam
o processo descrito como sendo determinístico, isto é, as EDOs não levam em consideração as
flutuações aleatórias (MCADAMS e ARKIN, 1997). Novamente, esta suposição não se
sustenta para sistemas com pequenas quantidades de moléculas.
A solução para ambas as limitações é usar simulação estocástica que, explicitamente,
calcula a variação, ao longo do tempo, do número de moléculas das espécies envolvidas em
uma reação química. A seguir é apresentado um algoritmo que descreve a simulação
estocástica para um conjunto de reações químicas.
O algoritmo a seguir está baseado no trabalho de Gillespie (1977). Dado um vetor de
N espécies moleculares S = {S
1
,...,S
N
} com uma população inicial X
0
= {X
01
,...,X
0N
} e um
vetor de
M reações químicas R = {R
1
,...,R
M
}. O algoritmo de simulação estocástica prediz a
evolução no tempo da população
X = {X
1
,...,X
N
} num intervalo de tempo de t
0
(tempo inicial)
a
t
end
(tempo final). Cada reação R
i
é definida pela sua constante de velocidade c
i
e sua
estequiometria, representada por dois vetores de coeficientes
r
i
e p
i
, onde cada r
ik
ou p
ik
é o
coeficiente do
k-ésimo reagente ou produto da i-ésima reação, Mi ,,2,1 K
=
. Num dado
16
intervalo de tempo infinitesimal
dt, a probabilidade de ocorrer a reação R
i
, dado o estado atual
X, é a
i
dt. A função a
i
é chamada de propensidade e é calculada através do produto da
constante
c
i
e o número de combinações possíveis entre os reagentes da reação R
i
. Por
exemplo, sejam as reações:
()
2
1
se tem 2:
se tem:
44
22542
21113211
2
1
=
=+
XX
caSSR
XXcaSSSR
i
i
c
c
Na reação R
1
, o número de combinações entre as moléculas dos reagentes é X
1
X
2
e
na reação R
2
é
(
)
21
44
XX . Uma fórmula genérica para o cálculo da propensidade é dada
pela equação
(2.24), onde
ik
k
r
X
é o coeficiente binomial (ULLAH et al., 2006).
=
=
N
k
ik
k
ii
r
X
ca
1
(2.24)
A partir da população inicial X
0
, o algoritmo de simulação estocástica simula a
evolução de cada estado X respondendo às seguintes perguntas:
Em que tempo τ a próxima reação irá ocorrer?
Qual será a próxima reação (índice j) a ocorrer?
A equação
(2.25) responde à primeira pergunta.
=
10
1
ln
1
ra
τ
(2.25)
O índice j da próxima reação a acorrer é dado pelo menor inteiro que satisfaz a
equação
(2.26).
02
1
ara
j
k
k
>
=
(2.26)
A população é atualizada pela equação
(2.27).
(
)()
ii
prtXtX
+
=+
τ
(2.27)
Nas equações
(2.25) e (2.26), os símbolos r
1
e r
2
são números aleatórios
uniformemente distribuídos entre 0 e 1 e a
0
é definido pela equação (2.28).
17
=
=
N
i
i
aa
1
0
(2.28)
A seguir, no
Quadro 1, é exibido o algoritmo conhecido como método direto
(GILLESPIE, 1977).
Quadro 1: Algoritmo do método direto, proposto por Gillespie (1977).
Este algoritmo, como apresentado acima, é ineficiente em termos de tempo de
execução. Há outras abordagens que visam um melhor desempenho do algoritmo de
simulação estocástica (GIBSON e BRUCK, 2000; RAO e ARKIN, 2003; BURRAGE
et al.,
2004; TURNER
et al., 2004; CAO et al., 2006; MCCOLLUM et al., 2006).
As constantes de velocidades usadas para simulação estocástica e as usadas para
simulação determinística são relacionadas, mas não idênticas. As constantes determinísticas
dependem de concentração e as estocásticas do número de moléculas. A análise dimensional
mostra como as constantes de velocidades clássicas, para as reações de primeira e segunda
ordem, podem ser transformadas apropriadamente para serem usadas em simulações
estocásticas (GILLESPIE, 1977).
Dada uma reação de primeira ordem,
PX
k
. A velocidade da reação, v, é dada por
kXv = , onde k é a constante de velocidade. A dimensão de v em uma descrição
determinística é
L
mol
sLs
mol 1
= e para a estocástica é
moléculas
ss
moléculas 1
= . A dimensão
da constante de velocidade k é, em ambos os casos, 1/s. Portanto, não há necessidade de
conversão para a simulação entre as duas abordagens.
Agora, imagine uma substância P que é produzida pela reação das moléculas X e Y,
esquematicamente,
PYX
k
+
. A velocidade da reação é dada por
kXYv = . A dimensão da
equação determinística é
2
2
L
mol
mols
L
Ls
mol
×
= e, no caso estocástico, é
1. Inicializar t, X
0
e o gerador de números aleatórios;
2. Computar a propensidade a
i
para cada reação R
i
usando a
equação (2.24) (i=1…M) e a
0
a partir da equação (2.28);
3. Gerar 2 números aleatórios r
1
e r
2
;
4. Determinar τ de acordo com a equação (2.25);
5. Determinar o menor inteiro i (índice da reação ocorrida)
que satisfaz a equação (2.26);
6. Fazer t = t + τ, e atualizar X(t) usando r
i
e p
i
, equação
(2.27);
7. Se t>t
end
ou a
0
=0 então pare, senão vá para o passo 2.
18
2
1
moléculas
moléculasss
moléculas
×
= (KLIPP et al., 2005). Para converter a constante de
velocidade de
mols
L
×
para
moléculass ×
1
, o valor numérico tem que ser dividido pelo
volume da reação e pela constante de Avogadro (para converter moles em moléculas). Por
exemplo, uma constante de velocidade de
11
1
sM , que foi medida em um volume de
15
10
L,
é convertido para o valor
11-9
101,66
× smoléculas . De forma geral, deve-se usar a fórmula
VA
k
c
×
=
(2.29)
onde, c é a constante estocástica, k a constante determinística (de segunda ordem), A é a
constante de Avogadro e
V o volume da reação.
2.4 INFORMAÇÕES ESTRUTURAIS DA MATRIZ ESTEQUIOMÉTRICA
A matriz estequiométrica N (Figura 4) contém informações importantes sobre a
estrutura da rede metabólica. Através desta matriz pode-se determinar:
os fluxos possíveis no regime estacionário (espaço de fluxos admissíveis);
os trechos não ramificados da via;
as relações de conservação.
Pode-se determinar, ainda, outras matrizes a partir da matriz estequiométrica
N,
como as matrizes de ligação de metabólitos e de ligação (
link) de fluxos. A seção 2.6 detalha
o uso destas matrizes na análise de controle metabólico.
2.4.1 Espaço Nulo da Matriz Estequiométrica
No regime estacionário não há variação da concentração dos metabólitos internos.
Assim, pode-se escrever a equação
(2.22) da seguinte forma:
0Nv =
(2.30)
Esta equação define um sistema de equações lineares com variáveis
v
j
(fluxos) que
tem solução não trivial somente se posto(
N) < n.
Determina-se como matriz
kernel K (espaço nulo à direita, ou simplesmente espaço
nulo) como sendo a matriz que satisfaz a equação
NK = 0 (REDER, 1988). A matriz K
contém todos os
n posto(N) vetores bases do espaço nulo de N. A escolha da matriz K não é
única, uma vez que qualquer conjunto de
n posto(N) vetores linearmente independentes com
19
dimensão
n×1 também satisfaz esta equação. Todas as possíveis distribuições de fluxos, no
regime estacionário, podem ser expressas como uma combinação linear das colunas
k
i
de K
(SCHILLING
et al., 1999), como mostra equação (2.31).
=
=
)(
1
N
i
kv
poston
i
i
α
(2.31)
Os coeficientes
α
i
, na equação (2.31), devem ter unidade de fluxo, por exemplo,
mM(min)
-1
. Na Figura 6 é exibida uma rede metabólica com quatro metabólitos e seis
reações. O posto da matriz
N(4×6) correspondente é igual ao seu número de linhas (=4).
Assim, a dimensão do espaço nulo é 2 (=6 – 4); logo, há duas colunas na matriz
kernel K (ver
Figura 7.)
Figura 6: Rede metabólica com 4 metabólitos e 6 reações (PALSSON, 2006).
=
10
10
01
11
11
01
K
Figura 7: Matriz kernel de N correspondente a rede da Figura 6.
Os dois vetores colunas da Figura 7 formam uma base para o espaço nulo de N. Por
exemplo, fazendo-se
α
1
= 2 e α
2
= 1, pela equação (2.31), determina-se uma distribuição de
fluxos
v como sendo uma combinação linear de α
i
K
i
:
() ()
=
+
=
1
1
2
1
1
2
1
1
0
1
1
0
1
0
0
1
1
1
1
2
v
A
B
C
D
v
1
v
2
v
3
v
4
v
5
v
6
20
O problema com a matriz
K é que o fluxo nas reações irreversíveis pode dar um
valor negativo. O exemplo da
Figura 6 mostra que todas as reações são irreversíveis e,
portanto, é desejável que os vetores bases tenham apenas valores positivos (SCHUSTER
et
al.
, 1999). Este fato é melhor representado na Figura 8, onde o segundo vetor da matriz K tem
sentido oposto ao sentido das reações. Na próxima seção será visto como calcular estes
vetores bases sem violar a condição de irreversibilidade.
Figura 8: Vetores bases do espaço nulo da matriz estequiométrica representados como uma
distribuição de fluxos na rede (PALSSON, 2006).
O conjunto de vetores colunas de K que possui o mesmo valor em cada linha forma
um ramo linear na rede metabólica (KLIPP
et al., 2005). Portanto, analisando a matriz K da
Figura 7, constata-se que os pares de reações (2, 3) e (5, 6) formam um ramo linear da via.
Isto pode ser conferido na
Figura 6 e na Figura 7.
2.4.2 Modos Elementares de Fluxos e Vias Extremas
Como visto na seção anterior, os vetores bases do espaço nulo (base linear) podem
conter valores negativos para as reações irreversíveis, o que não é viável
termodinamicamente. Particionando o vetor
v em reações reversíveis (v
rev
) e irreversíveis
(
v
irr
) e restringindo v
irr
para que seja positivo obtém-se a equação (2.32) (SCHILLING et al.,
2000; SCHUSTER
et al., 2002; PALSSON, 2006).
0v
irr
>
(2.32)
O problema agora é encontrar um conjunto de vetores com dimensão
n×1 que
satisfaça as equações
(2.30) e (2.32) simultaneamente. Para resolver este problema é usada a
teoria matemática de análise convexa (SCHUSTER
et al., 1999). Esta abordagem é usada por
diversos algoritmos para determinar as vias possíveis. As análises recentes têm se focado em
dois conceitos: vias extremas (SCHILLING
et al., 2000) e modos elementares (SCHUSTER
21
et al., 2002; URBANCZIK e WAGNER, 2005). Ambos os algoritmos retornam as arestas de
um cone – a base convexa – como vias da rede metabólica.
Na
Figura 9 são exibidas uma rede metabólica e as suas respectivas vias extremas
(VE) e modos elementares (ME). Nesta figura, cada ME ou VE indica uma via para a
biossíntese de um produto a partir de um substrato e o sentido das reações irreversíveis não é
violado. Vale lembrar que a estequiometria também é calculada para uma via definida como
um modo elementar ou uma via extrema.
Geralmente, existem, para uma determinada via, mais ME do que VE. A diferença
entre os dois tipos de vias está na representação das reações de fronteira (SCHILLING
et al.,
2000). Se estas reações são todas irreversíveis, os ME e VE são equivalentes. Se as reações de
fronteira são reversíveis há mais modos elementares do que vias extremas, como, por
exemplo, na
Figura 9.
Figura 9: Uma rede metabólica (A) e seus modos elementares (B) e vias extremas (C)
correspondentes (PALSSON, 2006).
A determinação das VE e ME para pequenas redes metabólicas é relativamente fácil.
Entretanto, à medida que o tamanho da rede aumenta, o número de VE e ME cresce de forma
exponencial. Portanto, a determinação das VE e ME relacionadas a uma rede é um problema
NP-difícil (KLAMT e
STELLING, 2002).
22
Os modos elementares podem ser usados para compreender as vias metabólicas em
uma rede, testar um conjunto de enzimas com vista à produção de um determinado metabólito
de interesse, detectar vias não redundantes, reconstruir o metabolismo a partir do genoma
anotado e analisar o efeito de enzimas deficientes (SCHILLING
et al., 1999; SCHUSTER et
al.
, 2000; STELLING et al., 2002; BARRETT et al., 2006).
2.4.3 Relações de Conservação
Existem subgrupos moleculares que são conservados durante a evolução de uma rede
metabólica, isto é, suas concentrações não variam ao longo do tempo (SCHUSTER e
HILGETAG, 1995). Por exemplo, a soma das concentrações de ATP, ADP e AMP pode ser
constante durante a evolução do sistema no tempo. Neste caso, o nucleotídeo adenosina (A) é
conservado (
ADP + AMP + ATP = constante1). Outro exemplo é o sistema formado pelo
NAD+ e o NADH. Neste caso, tem-se
NAD+ + NADH = constante2. Estas somas são
conhecidas como relações de conservação (SCHUSTER e HILGETAG, 1995; CORNISH-
BOWDEN e HOFMEYR, 2002). Cada conjunto de linhas linearmente dependentes (LD) da
matriz estequiométrica forma uma relação de conservação. Em termos computacionais, a
elucidação das relações de conservação em uma rede tem duas implicações práticas (SAURO
e INGALLS, 2004):
a relação de conservação pode ser usada para reduzir o número de EDOs do sistema. Isto é
feito substituindo uma EDO pela equação algébrica correspondente;
pode-se calcular diretamente as concentrações dos metabólitos no regime estacionário ao
eliminar as linhas linearmente dependentes da matriz
N(m×n). Sem a eliminação destas
linhas o sistema de equações não lineares pode ter infinitas soluções.
Se há relações de conservação na rede metabólica, então a matriz
N tem linhas LD, o
que implica que
r < m, onde r é o posto da matriz N. As linhas de N podem ser rearranjadas
de forma que as primeiras
r linhas sejam linearmente independentes (LI) e as últimas mr
linhas LD. Da mesma forma, os metabólitos correspondentes a estas linhas são rearranjados
formando os metabólitos independentes
x
ind
(r×1) e os dependentes x
dep
(m-r×1). Assim, x
pode ser reescrito de acordo com a equação
(2.33):
=
dep
ind
x
x
x
(2.33)
23
Também deve-se particionar
N como descrito acima. Fazendo isso, obtém-se a
equação
(2.34)
=
0
R
N
N
N
(2.34)
Cada linha de
N
0
(m-r×n) na equação (2.34) é uma combinação linear das linhas de
N
R
(r×n). Por isso pode-se definir a matriz link zero L
0
(m-r×r) que satisfaz a equação (2.35)
(SAURO e INGALLS, 2004).
R00
NLN =
(2.35)
Pode ser demonstrado que (SAURO e INGALLS, 2004)
[]
onst
C
x
x
IL
dep
ind
0
=
r-m
(2.36)
onde
I
m-r
é a matriz identidade de ordem m-r×m-r. Fazendo-se
[]
r0
ILT
=
m
e usando
equação
(2.33), obtém-se
onst
CTx =
(2.37)
A matriz
T(m-r×m) é chamada de matriz de conservação e
onst
C
(m-r×1) = x
dep
(0)-
L
0
x
ind
(0) é um vetor determinado pelo valor inicial da concentração dos metabólitos.
Cada linha da matriz
T relaciona um ciclo conservado e, desta forma, o número de
linhas de
T indica o número de relações conservadas (linhas LD da matriz N) na rede. Os
elementos não zero de uma linha de
T indicam quais metabólitos contribuem para um ciclo
em particular.
A equação
(2.37) exibe a relação entre T e x(t), mas não mostra como calcular a
matriz
T. Existe uma variedade de abordagens relacionadas para determinar T (SAURO e
INGALLS, 2004). A seguir duas delas são descritas.
A mais simples delas é através do espaço nulo de
N. Reescrevendo a equação (2.35)
obtém-se a seguinte equação:
24
[]
0
N
N
IL
0
R
0
=
r-m
(2.38)
Substituindo a equação
(2.34) nesta equação, tem-se
[]
0NIL
0
=
r-m
(2.39)
Observe que o primeiro termo desta equação é a matriz de conservação
T. Assim,
0TN =
(2.40)
Pela equação
(2.40) vê-se que as linhas de T formam a base do espaço nulo à
esquerda de
N. Como é mais convencional computar o espaço nulo (à direita) de N, faz-se
0TN =
TT
(2.41)
Na equação
(2.41) o sobrescrito T denota a transposta da matriz correspondente.
Com isto pode-se determinar
T
T simplesmente encontrando uma base para o espaço nulo de
N
t
. No MATLAB
®
, por exemplo, basta fazer T = null(N’)’, onde o apóstrofo () representa a
operação transposta.
Outra forma de calcular a matriz de conservação
T é encontrar a forma reduzida por
linha de
N. Pode-se transformar a matriz N em N
R
se premultiplicar a matriz N por uma série
de matrizes elementares
M
k
. Fazendo o produto destas matrizes elementares igual a M(m×m),
tem-se
=
0
N
MN
R
(2.42)
Pode-se particionar
M como
0
1
M
M
, substituindo em (2.42), obtém-se
=
0
N
N
M
M
R
0
1
Logo, conclui-se que
0NM
0
=
(2.43)
Pela equação
(2.40) e (2.43) tem-se que M
0
= T. Para encontrar T deve-se aumentar
N com a matriz identidade
[]
m
IN . Escalonando esta matriz aumentada, por operações
25
elementares, a matriz identidade é transformada na matriz
M. Feito isto, a matriz de
conservação é obtida tomando-se as últimas
m – r linhas de M. A partir do momento que se
obtém a matriz
T, tem-se também a matriz L
0
e, consequentemente, a matriz L
X
, utilizada na
análise de controle metabólico para calcular os coeficientes de controle.
2.5 CINÉTICA DAS REAÇÕES BIOQUÍMICAS
Na seção 2.4 foi visto que a matriz estequiométrica só fornece as relações estruturais
da rede metabólica. A velocidade da reação – isto é, a quantidade de reagente, em unidade de
concentração, transformado em produto por unidade de tempo por uma reação enzimática –
depende de vários fatores intracelulares, como, por exemplo, pH, temperatura e concentração
dos reagentes (MARANGONI, 2003). Todas as reações no interior da célula são catalisadas
por enzimas que, por sua vez, são produtos da expressão dos genes da célula.
Dada a reação irreversível
PS , catalisada pela enzima E, esta reação pode ser
expandida de forma a representar os eventos que ocorrem durante a catálise da reação:
primeiro o substrato se liga à enzima formando o complexo enzima-substrato (ES) e, depois, a
enzima forma o produto P. Por último, este produto é liberado. Esquematicamente:
PEESSE
cat
Sm
k
K
++
,
É possível – através da lei da ação das massas – elaborar a seguinte equação cinética,
em função do substrato S, para esta reação (LEHNINGER
et al., 2000):
SK
S
Vv
Sm
+
=
,
max
(2.44)
A equação
(2.44) é conhecida como cinética de Michaelis-Menten (LEHNINGER et
al.
, 2000). Nesta equação, V
max
representa a velocidade máxima da reação no sentido
substrato-produto,
K
m,S
é a constante de Michaelis-Menten para o substrato S (afinidade de
ligação entre a enzima e o substrato) e
v é a velocidade da reação.
Da mesma forma, obtém-se a equação
(2.45) para a reação reversível PS :
S
K
P
K
K
P
S
Vv
Pm
Sm
eq
+
+
=
,
,
max
1
(2.45)
26
Na equação
(2.45), K
eq
é a constante de equilíbrio para esta reação, K
m,P
a constante
de Michaelis para o produto
P e V
max
como definido. No entanto, a maioria das reações
bioquímicas possui mais de um substrato e/ou mais de um produto.
Quando há mais de um substrato (ou produto), este pode se ligar de forma aleatória
ou ordenada à enzima. Além disso, a reação reversível é classificada segundo o número de
moléculas do substrato (ou produto) utilizadas na reação (uni, bi, ter, ...) (MARANGONI,
2003). Na equação
(2.46) é apresentada a cinética para um mecanismo com um substrato e
dois produtos,
QPS +
. Este é conhecido como mecanismo uni-bi ordenado. Nesta
equação,
V
max1
é a velocidade máxima no sentido substrato-produto e V
max2
a velocidade
máxima no sentido contrário.
K
m,S
, K
m,P
e K
m,Q
são as constantes de Michaelis para o substrato
S e os produtos P e Q, respectivamente. Além destes, há ainda outros mecanismos. Para mais
detalhes ver Leskovac (2003) e Marangoni (2003).
PQ
K
V
SP
K
V
Q
K
KV
P
K
KV
SVKV
K
PQ
SVV
v
eqPmeq
Pm
eq
Qm
Sm
eq
1max
,
2max
,1max
,1max
2max,2max
2max1max
+++++
=
(2.46)
Uma relação importante para reações reversíveis, conhecida como relação de
Haldane, é dada pela equação
(2.47)
=
k
Sm
i
Pm
eq
k
i
K
K
V
V
K
,
,
2max
1max
(2.47)
Esta equação relaciona todos os parâmetros de uma cinética enzimática. Ela permite,
também, eliminar
V
max2
da equação (2.46), como foi feito na equação (2.45).
2.6 SUBESPAÇOS RELACIONADOS À MATRIZ ESTEQUIOMÉTRICA
Matematicamente, a matriz estequiométrica N pode ser vista como uma
representação de uma transformação linear do vetor de fluxos
v (equação (2.20)) para o vetor
de derivadas, em relação ao tempo, da concentração
x (equação (2.20)) pela equação (2.22),
repetida a seguir (ver
Figura 10).
27
Nv
x
=
dt
d
(2.22)
Existem quatro subespaços vetoriais associados à matriz estequiométrica. Estes
quatro subespaços de
N, mostrados na Figura 10, têm um papel importante na análise de redes
bioquímica (GIANCHANDANI
et al., 2006). Os vetores produzidos pela transformação
linear estão em dois subespaços ortogonais (espaço coluna e espaço nulo à esquerda),
chamado de imagem, e os vetores que estão sendo mapeados estão também em dois espaços
ortogonais (os espaço linha e nulo), chamados domínio da transformação (PALSSON, 2006).
Figura 10: Matriz estequiométrica vista como uma transformação linear. Os quatros
subespaços vetoriais associados a N também são mostrados. Adaptado de Palsson (2006).
As derivadas do espaço coluna de
N, Col(N), pode ser visto pela expansão
n
vvv
dt
d
n21
nnn
x
+++= K
21
(2.48)
onde
n
i
é uma coluna de N. O espaço Col(N) é, portanto, gerado pelos vetores n
i
. Estes
vetores são as características estruturais da rede e são fixos (LLANERAS e PICÓ, 2008),
enquanto os fluxos
v
i
são escalares e variáveis.
Os vetores
l
i
do espaço nulo a esquerda, Lnull(N), são ortogonais ao espaço coluna
de
N, ou seja, 0, =
ij
nl . Os vetores l
i
representam a conservação da massa.
Os vetores de fluxo podem ser decompostos em 2 componentes: dinâmico e
estacionário:
ssdin
vvv +
=
(2.49)
Null(N)
Row(N)
Lnull(N)
Coll(N)
v
ss
v
din
v
N
dt
dx
n
m
28
O componente estacionário satisfaz a equação
(2.30), 0Nv
ss
=
, e assim, v
ss
está no espaço
nulo de
N. O componente dinâmico do vetor de fluxo, v
din
, é ortogonal ao espaço nulo de N e,
consequentemente, ele está no espaço linha de
N. Cada par de subespaços no domínio e
imagem da equação dinâmica do balanço de massa formam conjuntos ortogonais entre si.
2.6.1 Conteúdo dos Subespaços da Matriz Estequiométrica
Os quatros subespaços fundamentais contêm informações sobre uma rede
bioquímica. Seus conteúdos podem ser assim descritos (PALSSON, 2006):
Espaço nulo. O espaço nulo de N contém todas as distribuições de fluxos no regime
estacionário permitidas por uma rede metabólica. Ver seção
2.4.1;
Espaço linha. O espaço linha de N contém todas as distribuições dinâmicas dos fluxos de
uma rede e, desta forma, as forças termodinâmicas que alteram a variação das atividades
das reações;
Espaço nulo à esquerda. O espaço nulo à esquerda de N contém todas as relações de
conservação da rede. Ver seção
2.4.3;
Espaço coluna. O espaço coluna da matriz N contém todos os possíveis vetores de
derivadas da concentração no tempo e, assim, mostra como as forças termodinâmicas
governam o estado das concentrações dos metabólitos da rede.
2.7 ANÁLISE DE CONTROLE METABÓLICO
Um dos objetivos da análise de controle metabólico (ACM) é medir a sensibilidade
das variáveis – fluxos e concentrações (os controlados) – no regime estacionário em relação
às variações dos parâmetros (controladores) das reações (FELL, 1992). Estas sensibilidades
são propriedades globais, uma vez que dependem de todas as interações dentro do sistema
celular. Além disso, deve-se relacionar tais propriedades globais às propriedades locais de
cada reação.
O termo controle é usado aqui no sentido de ser capaz de influenciar alguma coisa.
Quando se diz que uma enzima (reação) controla o fluxo em uma via metabólica, significa
que uma variação na atividade da enzima resulta numa variação do fluxo. Isso não significa
que a enzima exerce um controle completo, ou nenhum, sobre o fluxo ou sobre a concentração
dos metabólitos na rede (FELL, 1998). Todas as reações exercem um controle sobre a via à
qual pertencem, algumas com maior ou menor grau do que as outras. Os coeficientes de
29
controle (sensibilidade) representam uma forma de medida deste grau de controle (influência)
sobre uma via metabólica (KACZER e BURNS, 1973).
O relacionamento entre as variáveis (fluxos e concentrações) e os parâmetros que
afetam a atividade das enzimas num sistema é não linear e não pode ser obtido analiticamente
(FELL, 1998).
Em ACM são definidos três coeficientes de controle adimensionais, um local
(coeficiente de elasticidade) e dois globais (coeficientes de controle de fluxo e de
concentração).
2.7.1 Coeficiente de Elasticidade
A atividade de uma enzima é diretamente influenciada por metabólitos específicos
(substratos, produtos, inibidores e ativadores). Estes metabólitos são aqueles que aparecem na
equação da cinética da enzima. O coeficiente de elasticidade (CE) quantifica a sensibilidade
da velocidade local (atividade) de uma enzima a pequenas variações dos metabólitos que
influenciam, de alguma forma, a atividade da enzima (KACZER e BURNS, 1973). Note que
este conceito é aplicado a cada enzima separadamente (local). Formalmente, o coeficiente de
elasticidade
j
i
v
x
ε
é definido como (STEPHANOPOULOS et al., 1998)
(
)
()
i
j
i
j
j
i
v
x
x
v
x
v
v
x
j
i
ln
ln
=
=
ε
(2.50)
Cada número
j
i
v
x
ε
determina o coeficiente de elasticidade da j-ésima enzima em
relação ao i-ézimo metabólito. Analisando esta última equação, percebe-se que o coeficiente
de elasticidade é a inclinação da tangente à curva obtida traçando-se o gráfico de ln(v
j
) contra
ln(x
i
) (ver Figura 11). O CE descreve uma propriedade isolada de uma unidade funcional
(enzima) do sistema, não informando nada sobre o comportamento global do sistema. Este
coeficiente será usado para determinar os coeficientes de controle.
30
v
j
x
i
P
I
ln(x
i
)
ε
ε
ln(v
j
) ln(v
j
)
ln(I)
Figura 11: Coeficiente de elasticidade (ε) de uma reação v
j
em relação ao substrato x
i
e um
inibidor I.
2.7.2 Coeficientes de Controle
Os coeficientes de controle são uma medida de como a variação do nível de uma
enzima afeta o fluxo (coeficiente de controle de fluxo) ou a concentração de um metabólito
(coeficiente de controle de concentração) (FELL, 1992). Ambos os coeficientes são definidos
em relação a um regime estacionário de referência com níveis de enzima e
j
, níveis de
metabólitos x
i
e fluxo global J
k
constantes. Todos os coeficientes são adimensionais. O
coeficiente de controle de fluxo (CCF) é definido na equação
(2.51) e o coeficiente de
controle de concentração (CCC) na equação
(2.52).
(
)
()
j
k
j
k
k
j
J
j
ed
Jd
de
dJ
J
e
C
k
ln
ln
==
para k,j = 1,...,n
(2.51)
(
)
()
j
i
j
i
i
j
X
j
ed
Xd
de
dX
X
e
C
i
ln
ln
== para j = 1,...,n e i = 1,...,m
(2.52)
As relações entre estes coeficientes são conhecidas como teorema da soma e teorema
da conectividade (KACZER e BURNS, 1973). De acordo com o teorema da soma, a soma dos
CCF de uma via é igual a um e a soma do CCC é igual a zero. Os teoremas de conectividade
relacionam o coeficiente de elasticidade, CE, aos coeficientes de controle CCC e CCF.
Combinados, estes teoremas formam um sistema de equações lineares que permite a
determinação dos coeficientes de controle (propriedade global) a partir dos coeficientes de
elasticidade (propriedade local) (KACZER e BURNS, 1973).
31
2.7.3 Relações Estruturais
Na seção 2.4.3 (relações de conservação) foi definida a matriz L
0
. Combinando L
0
com
I
r
(matriz identidade de ordem r) obtém-se a matriz de ligação L
X
(m×r) dada pela
equação
(2.53).
=
0
r
X
L
I
L
(2.53)
A matriz
L
X
é conhecida como matriz de ligação de metabólitos (REDER, 1988).
Com esta matriz é possível determinar as concentrações dos metabólitos dependentes em
função dos metabólitos independentes, conforme a equação
(2.54):
ind
X
xLx =
(2.54)
A relação de conservação é derivada como (EHLDE e ZACCHI, 1997):
dt
d
dt
d
ind
X
x
L
x
=
(2.55)
Integrando a equação
(2.55), obtém-se:
(
)()
AxLx
ind
X
+= tt
(2.56)
onde
A é um vetor m×1 no qual os primeiros r (posto da matriz N) elementos das linhas são
zeros.
A relação entre os fluxos é derivada de forma similar. Como foi visto na seção
2.4.1,
a equação
(2.30) possui soluções não triviais quando posto(S) < n, isto é, se há dependência
linear entre as colunas de
N. Estas podem ser expressas usando a matriz de ligação de fluxos
L
J
(EHLDE e ZACCHI, 1997).
()
ind
J
R
R
JLJ
NL
LN
=
=
=
,
,0
null
J
J
(2.57)
Ehlde e Zacchi (1997) combinaram as relações estruturais com a análise de
sensibilidade geral e derivaram uma fórmula para o cálculo dos coeficientes a partir do qual
eles chamaram de relações cinéticas. A derivação começa a partir da expressão geral para a
32
velocidade de uma reação, equação
(2.23). Derivando esta equação para v
k
em relação ao
nível da enzima j, tem-se
j
m
m
k
j
k
j
w
w
k
j
k
j
k
de
dx
x
v
de
dx
x
v
de
dp
p
v
de
dp
p
v
de
dv
++
+
++
=
LL
1
1
1
1
(2.58)
Como os parâmetros em p não são acoplados, define-se
=
=
ji
ji
j
i
ep se
ep se
de
dp
,1
,0
(2.59)
Multiplicando a equação
(2.58) por
kj
ve , e levando-se em consideração a equação
(2.59), obtém-se
=
+
=
m
i
i
j
j
i
k
i
i
k
k
j
j
k
j
k
k
j
x
e
de
dx
v
x
x
v
v
e
e
v
de
dv
v
e
1
(2.60)
Se v
k
for considerado o fluxo no regime estacionário da reação k (v
k
=v
k
0
= J
k
0
), pode-
se facilmente reconhecer o coeficiente de elasticidade, equação
(2.50), e os coeficientes de
controle, equações
(2.51) e (2.52). Dessa forma pode-se reescrever a equação (2.60)
()
=
+=
m
i
x
j
k
i
k
j
J
j
ik
CC
1
επ
(2.61)
Em notação matricial:
XJ
εCπC +=
(2.62)
Como a velocidade de uma reação enzimática é proporcional à concentração da
enzima, a matriz
π pode ser substituída pela matriz identidade, pois:
=
=
kj se
kj se
k
j
,1
,0
π
(2.63)
A equação
(2.62) fornece uma relação entre todos os coeficientes definidos até
agora. Nesta equação tem-se
n×n + m×n incógnitas – número de coeficientes de controle – e
apenas
m×n equações. Há relações adicionais que podem ser derivadas das relações
estruturais, equações
(2.56) e (2.57). Pode ser mostrado que (EHLDE e ZACCHI, 1997):
X
ind
X
F
X
CLC =
(2.64)
33
J
ind
J
F
J
CLC =
(2.65)
onde
()
nrn ×
J
ind
C e
()
mr ×
X
ind
C contêm os coeficientes de fluxo e de concentração para as
linhas independentes de
N, respectivamente, e
()
(
)
ind
XX
F
XLXL diagdiag
1
=
(2.66)
()
(
)
ind
J
F
JLJL diagdiag
J
1
=
(2.67)
As equações
(2.64) e (2.65) podem ser inseridas na equação (2.62) obtendo-se,
finalmente, a equação
(2.68)
[]
πεLL
C
C
X
F
J
F
X
ind
J
ind
1
=
(2.68)
onde é possível determinar os CCC (
X
ind
C
) e CCF (
J
ind
C
) para as linhas independentes
(metabólitos) da matriz estequiométrica. Substituindo estes valores nas equações
(2.64) e
(2.65) determinam-se, portanto, todos os m×n CCC e os n×n CCF de uma via metabólica.
2.8
ANÁLISE DE FLUXO METABÓLICO
A análise de fluxo metabólico (AFM) é um método usado para a determinação
estequiométrica dos fluxos internos de uma rede metabólica no regime estacionário
(STEPHANOPOULOS
et al., 1998). Isto é, na AFM são calculados os fluxos não medidos,
geralmente os fluxos internos, dados alguns fluxos medidos experimentalmente; estes são
geralmente fluxos externos. A equação
(2.30) forma a base para a análise de fluxo metabólico.
Seja v
x
os fluxos desconhecidos – os fluxos que serão calculados – e v
c
os fluxos
calculados. Logo, pode-se reescrever a equação
(2.30) segundo o particionamento descrito
acima para se obter a equação
(2.69).
0
v
v
N
N
c
x
c
x
=
(2.69)
Rearranjando a equação
(2.69) e isolando, na equação resultante, o termo
xx
vN ,
tem-se uma expressão para os fluxos não medidos, equação
(2.70):
ccxx
vNvN =
(2.70)
34
A equação
(2.70) forma uma sistema de equações lineares que pode ser (NIELSEN e
VILLADSEN, 1994):
determinado, se N
x
for quadrada e não singular, ou seja, N
x
não pode ter linhas LD.
Assim, a solução é dada por:
()
ccxx
vNNv
1
=
(2.71)
sobredeterminado, se o número de fluxos medidos for maior que o grau de liberdade do
sistema. Neste caso, a matriz N
x
não é quadrada e não pode ser invertida. Usa-se, então,
um dos métodos do PQM ou a pseudo-inversa (PENROSE, 1955). Com isso, pode-se
reescrever a equação
(2.70):
()( )
ccxx
vNNv
#
=
(2.72)
onde
()
#
x
N representa a pseudo-inversa de N
x
;
indeterminado, quando a quantidade de fluxos medidos é menor que o grau de liberdade
do sistema, ou seja, o número de variáveis é maior que o número de equações do sistema.
Sendo assim, a equação
(2.70) possui infinitas soluções. Uma forma de determinar uma
solução única para este caso é definir uma função objetivo – que deve ser linear – e
otimizar esta função de forma a obter um problema de programação linear, caso similar ao
descrito na seção
2.9. Também, pode-se encontrar
x
v usando um dos métodos do PQM
ou a pseudo-inversa, equação
(2.72). Nestes casos,
x
v
é uma solução exata e com a menor
distância da origem.
Para mais detalhes sobre AFM, bem como para exemplos de uso de AFM,
recomenda-se Nielsen e Villadisen (1994) e Stephanopoulos
et al. (1998).
2.9
ANÁLISE DE BALANÇO DE FLUXO
A análise de balanço de fluxo (ABF), por vezes chamada de análise baseada em
restrições, investiga a capacidade teórica e modos de operação do metabolismo envolvendo
restrições na análise da estequiometria (VARMA e PALSSON, 1994a).
A FBA assume que a rede metabólica atingirá o regime estacionário restrito pela
estequiometria, equação
(2.30). Nesta equação,
nm×
N é a matriz estequiométrica e
1×
n
v o vetor de fluxos.
m
e
n
são, respectivamente, o número de metabólito e de reações
35
(fluxos) da rede. Este sistema, na grande maioria das vezes, é indeterminado e possui várias
soluções, o que implica na formação de um espaço de soluções (KAUFFMAN
et al., 2003).
Pode-se adicionar mais restrições a este espaço especificando-se valores máximos ou mínimos
para os fluxos da rede:
jjj
vvv
maxmin
com nj L1
=
(2.73)
Uma ilustração destas três restrições é apresentada na
Figura 12. Cada uma das
restrições imposta a rede reduz o espaço de distribuição dos fluxos.
Figura 12: Ilustração das restrições aplicadas a uma rede metabólica. Todas as restrições
impostas à rede determinam o espaço de distribuição de fluxo permissível, com isso cada
restrição reduz o tamanho do espaço solução.
Estas restrições confinam os fluxos do regime estacionário a um conjunto de
soluções viáveis – a equação
(2.30) tem infinitas soluções quando n>m ou quando n = m e
posto(N) < m. Mas, usualmente, não se consegue uma única solução para a distribuição dos
fluxos. A determinação de uma distribuição de fluxos em particular é formulada como um
problema de programação linear (VARMA e PALSSON, 1994b), como visto acima.
Para aquelas reações que não possuem valores máximos e/ou mínimos conhecidos
atribuem-se, para as reações irreversíveis,
0
min
=
v e
=
max
v e, para as reversíveis,
−∞=
min
v e
=
max
v . Dessa forma, a direção das reações (restrição termodinâmica) são
respeitadas. Estas restrições definem a capacidade da rede metabólica (EDWARDS
et al.,
2002). Há várias soluções para os fluxos neste espaço. O objetivo da FBA é encontrar uma
solução, neste espaço, que otimiza uma função objetivo (VARMA e PALSSON, 1994a):
A determinação de uma distribuição de fluxos em particular é formulada como um
problema de programação linear (VARMA
e PALSSON, 1994b). Geralmente, o objetivo é
Nv = 0 v
j
v
min,
j
v
j
v
max,
j
36
maximizar a velocidade de crescimento ou otimizar (max/min) alguns dos
n fluxos da rede
metabólica (LLANERAS e PICÓ, 2008). A idéia é maximizar uma função objetivo
Z que está
sujeita à estequiometria e às restrições de capacidade. A função
Z é definida pela equação
(2.74), onde os w
j
representam os pesos para as reações individuais. Alguns exemplos usuais
de funções objetivos são: maximização da produção de ATP, minimização do consumo de
nutrientes, maximização do rendimento de um produto desejado, maximização da velocidade
de crescimento, ou uma combinação destas.
máxvwZ
n
j
jj
=
=1
(2.74)
2.10
VISÃO GERAL DA MODELAGEM ESTEQUIOMÉTRICA
A equação geral
(2.30) fornece um conjunto de restrições que ligam os fluxos na rede
metabólica e restringem o espaço de possíveis distribuições de fluxos a um hiperplano,
subespaço
n
, onde os eixos correspondem aos fluxos das reações num rede (Figura 13).
Contudo, aos fluxos das reações irreversíveis são impostos à restrição de não negatividade
(por convenção, a direção natural do fluxo é considerada positiva):
0v
irr
(2.75)
Uma vez que estas restrições são de desigualdade, o sistema resultante não pertence
ao escopo da álgebra linear. No entanto, pela análise convexa, mostra-se que o espaço da
distribuição de fluxos formado pelas equações
(2.30) e (2.75) é um cone poliédrico convexo,
conforme a
Figura 13.
Finalmente, pode-se impor os valores de velocidades máximas derivados das
enzimas ou da capacidade de transporte como mais uma restrição:
max
vv
(2.76)
Se essa informação estiver disponível para todos os fluxos da rede, o espaço de
possíveis soluções fica limitado (na verdade, é suficiente que cada aresta do cone tenha seu
fluxo restrito). Em termos matemáticos, o cone poliedro convexo foi convertido em um
politopo (
Figura 13). As equações (2.30), (2.75) e (2.76) representam a restrição invariante no
tempo mais comum. Elas definem um espaço dentro do qual está qualquer distribuição de
fluxo viável. Assim, elas definem um modelo da capacidade do metabolismo que está sendo
estudado.
37
É possível incorporar mais restrições para restringir mais ainda o espaço de
distribuição de fluxos, inclusive variante no tempo, ou até mesmo prever a própria
distribuição de fluxos. Por exemplo, redes lógicas podem ser incorporadas como restrições
reguladoras (COVERT
et al., 2001).
Figura 13: Esquema das diferentes aplicações de análise estequiométrica. Esta análise pode ser
classificada em duas principais categorias: aquelas que focam nas propriedades do espaço
como um todo das possíveis distribuições de fluxos (ex. ME e VE) e aquelas que determinam
uma distribuição de fluxo particular (ex. ABF e AFM) (LLANERAS e PICÓ, 2008).
2.11
PRODUÇÃO DE HIDROGÊNIO BACTERIANO
O hidrogênio está sendo visto como um componente importante da nova matriz
energética como um portador de energia eficiente e limpa. O hidrogênio molecular, H
2
, tem o
maior conteúdo de energia por unidade de peso entre todos os combustíveis gasosos
conhecidos e é o único combustível que não possui carbono em sua fórmula (SHAMS e
GONZALEZ, 2007). Estas observações, juntamente com o fato de que os mais importantes
métodos industriais de produção de hidrogênio ainda usam fontes de energia não renovável,
fornece argumentos significativos para a busca de uma forma economicamente viável e limpa
para produção de hidrogênio.
Orientada à
análise do
sistema
Solução da
distribuição de
fluxos
Aplicações da
modelagem
este
q
uiométrica
Determina o
fenóti
p
o corrente
Constrói modelos
p
reditivos
Álgebra linear
(
es
p
a
ç
o nulo
)
Análise Convexa
(
ME e VE
)
Análise de fluxo
metabólico
Espectro de
fluxos
Análise de
balan
ç
o de fluxo
{
0Nv
=
=
0v
0Nv
=
=
m
vv
0Nv
=
max,min,
max
mm
vvv
vv
0v
0Nv
=
=
vw
v
0v
0Nv
Z
vvv
v
v
mm
:max
max,min,
max
38
A produção de biohidrogênio a partir de microrganismos é favorável pelo fato do
processo de produção ocorrer em temperatura e pressão ambientes. Sendo assim, este
processo requer menos energia que os métodos convencionais (VARDAR-SCHARA e
MAEDA, 2008). Os desafios técnicos para se conseguir tal objetivo incluem baixar os custos
do processo de produção de hidrogênio e melhorar o rendimento destes processos.
O uso de glicerol, gerado como subproduto na produção de biodiesel, representa uma
alternativa promissora para se ter uma viabilidade econômica (SHAMS e GONZALEZ,
2007).
A produção biológica de H
2
é especialmente atrativa quando se usa o glicerol cru,
isto é, sem qualquer purificação, como fonte de carbono para o microrganismo. O
melhoramento e o desenvolvimento de tecnologias para a produção de biohidrogênio
dependem, principalmente, do uso de microrganismos modelos bem conhecidos. As espécies
do gênero
Clostridium são os mais estudados em processos de fermentação anaeróbicos.
Pelo ponto de vista de bioengenharia, a
C. acetobutylicum é a espécie mais estudada
deste gênero. Os estudos desta bactéria concentram-se no melhoramento da mesma para a
produzir solventes, já que ela é conhecida pela sua habilidade de produzir solventes (JONES e
WOODS, 1986).
A fermentação anaeróbica realizada por esta bactéria tem duas fases: a fase
acidogênica, quando o crescimento é rápido, com maior produção de hidrogênio e os ácidos
acetato e butirato; e a fase solventogênica, quando o crescimento da bactéria é menor e há
diminuição da produção de H
2
. Nesta fase há a formação de solventes com um consumo
parcial dos ácidos formados durante a primeira fase (RAO e MUTHARASAN, 1987).
2.11.1
Simulação in silico da Produção de Biohidrogênio
Tem havido um esforço considerável de pesquisa na caracterização e manipulação
genética do gênero
Clostridium para elucidar e melhorar a produção de solventes, mas pouco
tem sido feito para a produção de H
2
. A caracterização e manipulação genética in silico deste
gênero pode ser explorada pelos métodos de engenharia metabólica e biologia de sistema, tal
como ABA e AFM. Estes métodos podem fornecer uma oportunidade para melhorar a
produção de H
2
e fornecer uma melhor compreensão do metabolismo da C. acetobutylicum.
Através desta abordagem, Senger e Papoutsakis (2008) construíram uma rede
metabólica em escala genômica da
C. acetobutylicum usando ABF para identificar um
conjunto de genes essenciais para o crescimento deste microrganismo, como, por exemplo, o
39
funcionamento do ciclo do ácido tricarboxílico que é incompleto e parcialmente invertido
nesta bactéria, segundo a anotação de seu genoma (NOLLING
et al., 2001). Manish et al.
(2007) e Oh
et al. (2008) aplicaram AFM e ABF numa rede metabólica da E. coli com o
intuito de melhorar a produção de H
2
nesta bactéria. Shinto et al. (2007) desenvolveram um
modelo cinético e efetuaram uma análise da produção de acetona-butanol-etanol baseado num
modelo da
C. acetobutylicum, mas não incluíram as reações para a produção de H
2
. A rede
que eles usaram é semelhante a da
Figura 23, página 82. Em outro trabalho, foi simulado um
modelo estequiométrico para a fermentação da
C. acetobutylicum semelhante a ABF, porém,
as restrições eram formadas por equações não lineares (DESAI; NIELSEN
et al., 1999).
Também foi feito uma AFM da fermentação da
C. acetobuylicum com o objetivo de analisar a
produção de solventes desta bactéria (DESAI; HARRIS
et al., 1999). Nenhuma destas
simulações considerou o glicerol como fonte de carbono.
2.12
SIMULAÇÃO DINÂMICA DO OPERON TRP NA ESCHERICHIA COLI
O triptofano é um dos aminoácidos aromáticos sintetizado por todos os
microrganismos e é utilizado na síntese de proteínas para o crescimento e reprodução celular.
Em algumas bactérias os genes que codificam as enzimas necessárias para a biossíntese do
triptofano estão agrupados formando o
operon trp (YANOFSKY et al., 1981). A via de
biossíntese do triptofano nos microrganismos possui 5 reações (enzimas), mas os genes que
codificam as diferentes subunidades de cada enzima são diferentes. A via do Trp é altamente
regulada naquelas bactérias que os sintetizam. Isto é devido ao fato de que a síntese de uma
molécula de Trp tem um custo energético muito alto (AKASHI e GOJOBORI, 2002).
Na
Escherichia coli os principais mecanismos de regulação da quantidade de
triptofano no meio intracelular ocorrem de três formas distintas: repressão, atenuação
transcricional e inibição enzimática (GOLLNICK e BABITZKE, 2002). Desta forma,
qualquer simulação da via do triptofano deve levar em consideração todos estes mecanismos.
A abordagem conhecida como determinística é realizada através do uso de equações
diferenciais ordinárias. A lei fundamental que governa a velocidade das reações na simulação
determinística é a
lei de ação das massas. Essa lei diz que uma reação em um meio
homogêneo tem velocidade proporcional às concentrações individuais dos reagentes
envolvidos. Usando essa lei as expressões para as velocidades de alteração das concentrações
de cada uma das moléculas podem ser encontradas. Com isso, pode-se expressar qualquer
sistema químico como um conjunto de EDOs acopladas. Geralmente, não se encontra uma
40
solução analítica para a solução das EDOs; entretanto, pode-se usar um método numérico para
integrar o conjunto de EDOs ao longo do tempo para achar uma solução aproximada da
dinâmica do sistema.
Várias simulações determinísticas foram propostas para a simulação dinâmica do
operon trp da E. coli. Nos modelos de Goodwin (1965), Griffith (1968a) e Griffith (1968b)
havia apenas o mecanismo de repressão. Um outro modelo levou em consideração a inibição
enzimática e o retardo de tempo (BLISS
et al., 1982). As previsões do modelo de Bliss
mostraram uma concordância qualitativa com os resultados experimentais, exibindo
oscilações no nível de concentração do triptofano. Baseado em novos dados experimentais um
outro modelo foi desenvolvido, no qual a repressão ocorre em dois passos (SINHA, 1988).
O modelo de Sinha foi modificado usando-se a função cinética de Michaelis-Menten
para representar a demanda de triptofano para a síntese de proteína (SEM e LIU, 1990). Em
ambos os modelos a inibição enzimática pelo triptofano não foi considerada. Em outros
modelos investigou-se o efeito da velocidade de crescimento da bactéria na síntese de
triptofano e a estabilidade do
operon sob variações de vários parâmetros e em função da
concentração intracelular do próprio triptofano (XIU
et al., 1997; XIU et al., 2002).
Outros modelos recentes e mais completos do
operon trp (SANTILLAN e
MACKEY, 2001b; 2001a; SANTILLAN e ZERON, 2004) levaram em consideração todos os
três mecanismos de regulação e o retardo de tempo.
Nestes modelos, os autores tiveram uma consideração especial na estimação dos
parâmetros e os resultados numéricos do sistema de equações diferenciais ordinárias foram
comparados com dados experimentais. Os modelos previram de forma qualitativa as variações
da atividade enzimática em bactérias cultivadas em meio mínimo com e sem triptofano. Além
disso, as simulações reproduziram, qualitativamente, experimentos em mutantes da
E. coli.
Nas equações
(2.77) a seguir é apresentado um modelo composto por quatro
variáveis dependentes desenvolvido por Santillan e Mackey (2001a) o qual foi simplificado
fazendo-se, em relação ao modelo original,
τ
m
= 0 e retirando-se o termo exp(-
μτ
e
) da
expressão da derivada da concentração da enzima antranilato sintase (E) em relação ao tempo,
dE/dt.
41
(
)
()()
()
()( )
()
[]
()()
()()()
()
()
()
()
()
tT
tTK
tT
GtE
tTK
K
K
dt
dT
tEtMK
dt
dE
tMKbebtOK
dt
dM
tOO
KtTK
KtT
dt
dO
g
i
i
eF
FD
CtT
Fp
F
F
tt
t
F
hh
h
μ
μγτ
μ
μ
ηη
η
ρ
+
+
=
+=
++=
++
+
=
max
2
1
1
11
(2.77)
Neste modelo, equações
(2.77), O
F
, M
F
, E e T são variáveis dependentes (todas em
função do tempo) e representam a concentração de operador livre, mRNA relativo ao gene
trpE, enzima antranilato sintase (AS) e triptofano, respectivamente.
Não serão mostrados detalhes dos significados de cada termo neste modelo. Para
tanto ver Santillan e Mackey (2001a; 2001b). Este modelo foi resolvido apenas para efeito de
comparação com a simulação estocástica.
3 METODOLOGIA
Neste capítulo serão descritas todas as abordagens usadas na implementação da
aplicação para simulação de vias metabólicas e reguladoras. Serão descritos, principalmente,
os recursos do M
ATLAB
®
que possibilitaram a implementação das técnicas descritas no
capítulo anterior.
3.1 MATLAB
®
O software MATLAB
® 2
é uma ferramenta comercial bastante usada em ciências
físicas e engenharias e está disponível em muitos centros de pesquisa. A principal vantagem
do M
ATLAB
®
sobre outras linguagens de programação – como C++, Java e outras – é que este
possui uma linguagem de script e ambiente de desenvolvimento interativo, o que permite ao
usuário editar, facilmente, as funções escritas nesta linguagem de acordo com as suas
necessidades (ULLAH et al., 2006). O M
ATLAB
®
tem outras funcionalidades, como: acesso
rápido às ferramentas de análise de dados e otimização; funções para visualização de dados
(amplo recurso para plotagem de gráficos) e recursos para se criar aplicativos contendo uma
interface gráfica. O M
ATLAB
®
possui, ainda, várias toolboxes
3
específicas para modelagem e
simulação em várias áreas das engenharias e ciências físicas. Além disso, o M
ATLAB
®
contém
funções para a representação e manipulação de vetores e matrizes multidimensionais. Há
versões do M
ATLAB
®
para vários sistemas operacionais, como MS-Windows, Linux, entre
outros. Com estas características é fácil escrever scripts relativamente complexos de forma
rápida e compacta.
Uma alternativa de domínio público e plataforma de software livre é o Octave
(www.octave.org). O Octave foi desenvolvido inicialmente pela comunidade de engenharia
química (University of Wisconsin) e está disponível tanto para MS-Windows quanto para
sistemas operacionais Unix-like. O Octave tem sintaxe muito parecida com a do M
ATLAB
®
,
embora seus recursos sejam um pouco mais limitados.
Uma das vantagens de se utilizar o M
ATLAB
®
, no entanto, é sua cultura amplamente
disseminada e a possibilidade de migração direta para aplicativos cliente-servidor.
2
MATLAB é marca registrada da MathWorks, http://www.mathworks.com/
3
Conjunto de rotinas MATLAB projetadas, com ou sem uma interface gráfica, para uma área específica; como
estatística, otimização, processamento de imagens, entre outras.
43
3.2 IMPLEMENTAÇÕES EM MATLAB
®
Nesta seção serão descritas as principais implementações, em linguagem MATLAB
®
,
dos métodos de análise de rede metabólica discutidos no capítulo
2.
3.2.1 Problemas de Quadrados Mínimos
O problema de quadrados mínimos foi implementado usando a função qr do
M
ATLAB
®
. Esta função faz uma decomposição QR da matriz A. Com as matrizes Q e R foram
implementados os algoritmos descritos na seção
2.1.7. Através da matriz R determina-se o
posto de
A e, com isto, a classificação do sistema linear conforme a Figura 2. Comparações
do método usando a decomposição QR com os métodos usando a decomposição SVD e a
pseudo-inversa mostram que o primeiro é por volta de 5 vezes mais rápido que os outros dois.
3.2.2 Linguagens das Reações Bioquímicas
A LRB é uma linguagem formal e, como tal, pode ser processada pelo computador.
Para realizar este processamento foi usado o método conhecido como autômatos finitos
(SIPSER, 1996). Através do uso de autômatos finitos, foi possível analisar e verificar se uma
determinada reação está escrita corretamente e, além disso, produzir a matriz estequiométrica.
Foram criados e implementados 3 autômatos finitos:
identificador;
números;
lado da reação (lado esquerdo ou direito do símbolo de reversibilidade).
Estes autômatos finitos são usados pelo módulo que contém a matriz estequiométrica
total, ou seja, o módulo totalStMatrix. Os autômatos finitos implementados processam a
LRBPP para a análise e geração da matriz
S.
3.2.3 Análise de Fluxo Metabólico
Para a análise de fluxo metabólico foi reaproveitada, com algumas adaptações, uma
toolbox M
ATLAB
®
já implementada (MENDES, 2006). Nesta toolbox foram implementadas as
equações descritas em Stephanopoulos et al. (1998) para AFM, o que inclui:
determinação dos fluxos não medidos a partir dos medidos;
determinação dos novos fluxos medidos;
análise da sensibilidade;
reconciliação estatística.
44
A solução do sistema de equações lineares foi obtida usando-se os métodos de
solução descritos para o problema de quadrados mínimos.
3.2.4 Análise de Balanço de Fluxo
O problema de programação linear da análise de balanço de fluxo é resolvido usando
GLPKMEX, uma interface MEX do pacote glpk (GNU linear programming kit). Além disso,
foram usadas também as rotinas optimizeCbModel e solveCobraLP da toolbox COBRA (em
inglês: constraint-based reconstruction and analysis) (BECKER et al., 2007). A toolbox
COBRA é usada para a análise de fluxo baseada em restrição, como a ABF.
3.2.5 Modos Elementares
Para calcular todos os modos elementares foi usado o programa metatool, também
adaptado para o M
ATLAB
®
(VON KAMP e SCHUSTER, 2006). Este programa usa uma
linguagem semelhante a LRB, com menos flexibilidade, para a descrição das reações da rede
metabólica e armazena as informações da rede em uma estrutura diferente daquela usada pelo
GEnSys. Sendo assim, foi necessário, então, implementar uma interface para que fosse criada
uma estrutura que pudesse ser usada pelo metatool.
3.2.6 Relação de Conservação
A matriz de conservação (T) foi calculada como descrita na equação (2.43). O
primeiro passo é aumentar a matriz
N com a identidade I
m
(seção 2.4.3 - Relações de
Conservação) para formar a equação
(3.1):
[]
m
IN
(3.1)
Reduzindo por linhas esta matriz à forma canônica obtém-se a matriz
T. Usando a
função rref do M
ATLAB
®
faz-se a redução através de eliminação de Gauss-Jordan. A função
rref tem a seguinte sintaxe:
[
R, jb] = rref(A) (3.2)
onde
R é a matriz reduzida e jb contém os índices das colunas de A referentes às variáveis
pivôs (variáveis independentes) da matriz
A. Logo, o tamanho do vetor jb representa o posto r
de
A e R(1:r, jb) é a matriz identidade r×r.
45
No trecho de código usado para calcular
T, que é apresentado no Quadro 2, N é a
matriz estequiométrica dos metabólitos internos.
Quadro 2: Cálculo da matriz T, em linguagem MATLAB
®
.
Uma vez calculada a matriz
T obtém-se a matriz L
0
e, desta última, a matriz L
X
. Os
metabólitos (ou fluxos) independentes e dependentes são todos determinados a partir dos
índices indepCol e depRow calculados conforme
Quadro 2.
3.2.7 Geração da Equação Cinética
Para cada uma das cinéticas, descritas na seção 4.2, é criada uma função em
M
ATLAB
®
que calcula a velocidade da reação, dados os valores dos metabólitos em um
determinado tempo.
Por exemplo, dada a reação v2:S2 <-> P2 (Michaelis-Menten reversível) e a sua
respectiva cinética, como no
Quadro 3.
%determina o número de linhas (m) e colunas (n) de N
[m,n] = size(N);
%calcula o valor de r, posto da matriz N
r = rank(N);
%aumenta a matriz N com uma matriz identidade de ordem m
Na=[N I]
Na = [N eye(m)];
%reduz Na à forma canônica, rb contém os índices das colunas
%dos pivôs
[echelonform, rb] = rref(Na);
%determina os índices das colunas independentes de N
indepCol = rb(1:r);
%determina os índices das linhas dependentes de N
depRow = rb(r+1:end)-n;
%determina, de echelonform, a matriz de conservação
T = echelonform(r+1:m,n+1:end);
46
Quadro 3: Exemplo de equação cinética.
É automaticamente gerado um arquivo .m (arquivo executável no M
ATLAB
®
)
contendo uma função equivalente à equação cinética do
Quadro 3.
Quadro 4: Função MATLAB
®
gerada automaticamente para a equação cinética do Quadro 3.
A primeira parte de função v2 é executada na primeira vez que v2 for chamada;
assim, a inicialização dos parâmetros é feita apenas uma única vez. A instrução F = @v2
atribui à F o handle da segunda função v2 (função aninhada) definida logo abaixo (Fe =
v2(X)); dessa forma, as próximas chamadas a v2 executarão apenas o código dentro da
segunda função v2.
Os nomes dos metabólitos são substituídos pelos valores de suas respectivas
concentrações, que são, por sua vez, passadas à função v2 através de seu argumento de
entrada
X. O vetor X contém as concentrações de todos os metabólitos da rede. Cada
metabólito possui um índice, e o vetor
X é indexado com este valor. No exemplo do Quadro
4, os índices de S2 e P2 são 10 e 4, respectivamente.
v2 % Michaelis-Menten reversível, equação (2.45)
Vmax = 2.0 % mM/min
KmS2 = 0.02 %mM
KmP2 = 1.0E-2 %mM
Keq = 19
v2 = Vmax*(S2 – P2/Keq)/(KmS2*(1 + P2/KmP2) + S2)
%Reaction rate for the v2 reaction
function F = v2(X)
% this block is executed only once
Vmax = 2.0;
KmS2 = 0.02;
KmP2 = 1.0E-2;
Keq = 19;
F = @v2;
%this function contains expressions dependent of metabolite
%concentrations
function Fe = v2 (X)
Fe = Vmax*(X(10) - X(4)/Keq)/(KmS2*(1 + X(4)/KmP2) +
X(10));
end
end
47
3.2.8 Simulação Determinística e Análise de Controle Metabólico
A simulação determinística é realizada pela resolução do conjunto de EDOs
definidas pela equação
(2.22). As velocidades v
j
são calculadas pelas cinéticas descritas vistas
anteriormente. Usou-se a função
ode15s.m, pré-definida no MATLAB
®
, para integrar
numericamente as EDOs em um intervalo de tempo definido pelo usuário. Esta função é um
solver baseado em fórmulas de diferenciação numérica. Geralmente, usa-se a
ode15s quando
a
ode45 falha ou é muito ineficiente ou ainda quando supeita-se que o problema é stiff.
Na determinação das elasticidades, equação
(2.50), foi usado o método de diferenças
finitas centrais para avaliar a derivada de v
j
(j = 1..n) em relação a cada concentração dos
metabólitos x
i
, conforme a equação (3.3):
()
(
)
x
xxvxxv
dx
dv
ijij
i
j
Δ
Δ
Δ+
=
2
(3.3)
Uma vez calculada a matriz ε que contém as elasticidades, os coeficientes de
controle podem ser calculados usando as equações
(2.64) a (2.68), considerando π, na
equação
(2.68), como sendo a matriz identidade.
4 RESULTADOS E DISCUSSÃO
Serão descritos neste capítulo os principais módulos e funções implementadas no
GEnSys. Para esta descrição serão mostrados vários exemplos de uso destes módulos. Alguns
destes exemplos são também resultados de simulações desenvolvidas neste trabalho.
Em vários pontos deste capítulo são usados comandos do M
ATLAB
®
diretamente no
texto. Os resultados destes comandos são exibidos no texto como saídas do próprio M
ATLAB
®
.
4.1 LINGUAGENS DAS REAÇÕES BIOQUÍMICAS
As reações devem ser escritas numa linguagem com sintaxe pré-definida e sem
ambigüidades, proposta aqui com o nome de Linguagem de Reações Bioquímicas (LRB).
Na LRB, cada reação é composta por:
nome da reação seguida de : (dois pontos);
lado esquerdo da reação (reagentes ou substratos);
símbolo de reversibilidade da reação;
lado direito da reação (produtos).
Esquematicamente, uma reação é escrita da seguinte forma:
[][] [][]
[
]
[
]
[
]
[
][][]
[
]
[
]
444444344444421
4434421
444444344444421
43421
(produtos) direito lado
2211
idadereversibil de símbolo
)(reagentes esquerdo lado
2211
reação da nome
*...**xnSímbolo*...**:
qqpp
yyyRxxxNomeRxn
β
β
β
α
α
α
+
++
+
++
onde os
α
i
e
β
j
são os coeficientes estequiométricos e x
i
e y
j
os compostos que participam das
reações. A notação entre colchetes significa que o símbolo ou o caractere é opcional; assim, *
e os coeficientes estequiométricos são opcionais. A palavra RxnSymbol representa um dos
seguintes símbolos: ->, >,=>, <->, = ou <=>.
Nome da reação: identificador composto por letras, números ou sublinhados (_). Deve-se
começar com uma letra ou sublinhado. Exemplo: v1, r5, rGK e _r3. Após o nome da
reação deve aparecer sempre o símbolo :;
Coeficiente estequiométrico: representa o número que precede um reagente (substrato)
ou um produto da reação. O coeficiente estequiométrico é um número inteiro ou real
(decimal ou notação científica). Exemplos: 1.0, 2, 1e-3, 2.5e-1 e 0.5;
Reagentes e produtos da reação: representam os compostos (ou espécies, como às vezes
são chamados) envolvidos numa reação. Eles podem ser formados por letras; números; ‘
(apóstrofo); +; -; espaço; (; ) ou , (vírgula). O nome do composto pode começar com um
dígito, desde que seja sucedido de um ‘ (apóstrofo) ou um dos sinais + ou -. Quando
49
houver um sinal de + ou – formando um composto, este não pode ser precedido de um
espaço em branco (para não ser confundido com o sinal do coeficiente estequiométrico).
Exemplos: G6P; NAD+; F1,6biP; Rib-5-P; 3’ Gln; H2; H- e Xil 5 P;
Sinal do coeficiente estequiométrico: os sinais dos coeficientes estequiométricos são os
símbolos + ou -. Estes devem sempre ser precedidos de um espaço em branco. Isto é
necessário pois estes símbolos também podem ser usados para formar os nomes dos
compostos – sem o espaço. Para o primeiro reagente (após o :) ou o primeiro produto
(após o sinal de reversibilidade, setas), estes sinais são opcionais;
Símbolos de reversibilidade das reações: estes símbolos correspondem, em livros de
bioquímica, às setas que especificam a reversibilidade da reação. Pode-se usar os
seguintes símbolos, ->, > e => para as reações irreversíveis e <->, = e <=> para as reações
reversíveis.
A seguir, no
Quadro 5, apresenta-se um exemplo contendo um conjunto de reações
relacionadas à primeira parte da via glicolítica da Acetobacter xylinum:
Quadro 5: Exemplos de reações escritas em LRB.
r1:Glc(out) -> Glc(in) %transporte de glicose
r2:Glc(in) -> Glc-6-P %glicokinase
r3:Glc-6-P <-> Fru-6-P %fosfoglicoisomerase
r4:Fru1,6,diP -> Fru-6-P %frutose difosfatase
r5:Fru1,6,diP <-> DAcetone-P + GDH-3-P %aldolase
Pode-se usar, no arquivo de reações, os chamados comentários de linha. Isto quer
dizer que, após o comentário, que começa com %, não se pode escrever mais nenhuma reação
nesta linha (ver exemplo acima).
Foram definidos três tipos de reações:
Reações usuais: são aquelas conforme definidas no Quadro 5, com os lados esquerdo e
direito completos.
Reações de degradação: são reações do tipo
α
A -> null. Neste caso, o lado direito é a
palavra reservada null. Isto significa que o reagente será degradado numa determinada
velocidade com estequiometria α.
Reações de geração: são reações do tipo null ->
α
A. Neste caso, o composto A é gerado
numa dada velocidade.
Estes dois últimos tipos de reações, geralmente, são usados para representar o
transporte de metabólitos para fora da célula (degradação) e para dentro da célula (geração),
respectivamente.
50
Uma vez definidas, as reações do modelo devem ser agrupadas em um arquivo texto
– arquivo LRB – de modo que elas possam ser lidas e, consequentemente, gerar a matriz
estequiométrica correspondente. Não há necessidade da utilização de um separador entre as
reações e pode haver várias delas em uma única linha do arquivo.
4.2 EXPRESSÕES CINÉTICAS ENZIMÁTICAS E VALORES INICIAIS
Para fazer uma simulação dinâmica da via metabólica é necessário definir as
expressões cinéticas de cada enzima (ver seção
2.5), bem como os valores iniciais para cada
metabólito interno. Deve-se seguir uma sintaxe própria para escrever a equação da cinética
para enzima da via. A sintaxe geral está descrita no
Quadro 6.
Quadro 6: Sintaxe de uma expressão cinética.
As seguintes definições são aplicadas:
NomeRxn: corresponde ao nome da reação. Deve ser o mesmo nome dado à reação no
arquivo de reações.
Inicializações das constantes: este trecho da cinética é reservado para a inicialização das
constantes, como os K
m
de cada metabólito (constante de Michaelis), as constantes de
inibição K
i
, a velocidade máxima da reação V
max
, entre outros. Este trecho é opcional, uma
vez que os valores das constantes podem ser usados diretamente na equação da cinética.
dep: é uma palavra reservada e deve, sempre, estar precedida de : (dois pontos). Esta
palavra, que significa dependente, separa os valores cujo cálculo depende (depois de :
dep)
das concentrações dos metabólitos daqueles que independem, como as constantes
cinéticas.
Valores dependentes das concentrações: este trecho é usado por cálculos intermediários.
Como, às vezes, a equação da cinética pode ser complexa, usa-se este trecho para dividir a
equação em partes menores.
Expressão definindo a velocidade: esta é a expressão final que determina a velocidade
da reação em função da concentração atual dos metabólitos.
NomeRxn
Inicializações das constantes, se houverem (opcional).
Valores independentes das concentrações.
:dep
Determinação de valores dependentes das concentrações dos
metabólitos (opcional)
NomeRxn = Expressão definindo a velocidade
51
As cinéticas devem ser colocadas num arquivo texto que será usado para gerar, para
cada cinética, uma função no M
ATLAB
®
(arquivo .m). As expressões matemáticas seguem a
sintaxe definida no M
ATLAB
®
. Neste caso, também usa-se o símbolo % para fazer
comentários no arquivo.
Como exemplos, serão usadas as três equações apresentadas na seção
2.5. Dadas as
reações do
Quadro 7.
Quadro 7: Exemplo de reações da seção 2.5.
Para estas reações pode-se definir as cinéticas mostradas no
Quadro 8.
Quadro 8: Exemplos de equações cinéticas escritas numa sintaxe própria para as equações da
seção
2.5. Os valores dos parâmetros são aleatórios.
Os valores iniciais para cada metabólito interno também devem ser colocados em um
arquivo texto separado. A sintaxe deste arquivo é simples e é mostrada no
Quadro 9.
v1:S1 -> P1 % Michaelis-Menten simples
v2:S2 <-> P2 % Michaelis-Menten reversível
v3:P2 <-> P + Q % Mecanismo uni-bi
% Michaelis-Menten simples; equação
%
(2.44)
v1
Vmax = 29.0 % mM/min
Km = 0.4 %mM
v1 = Vmax*S1/(S1 + Km)
%ou alternativamente
v1 = 29.0*S1/(S1 + 0.4)
% Michaelis-Menten reversível, equação (2.45)
v2
Vmax = 2.0 % mM/min
KmS2 = 0.02 %mM
KmP2 = 1.0E-2 %mM
Keq = 19
v2 = Vmax*(S2 – P2/Keq)/(KmS2*(1 + P2/KmP2) + S2)
% Mecanismo uni-bi, equação (2.46)
v3
Vmax1 = 58.0 % mM/min
Vmax2 = 21.0 % mM/min
KmP2 = 11.0E-2 %mM
KmP = 1.0 %mM
KmQ = 0.002 %mM
Keq = 9 %mM, neste caso Keq é dimensional
:dep
Num = Vmax1*Vmax2*(P2 – P*Q/Keq) %numerador da expressão
Den1 = Vmax2*KmP2 + Vmax2*P2 + Vmax1*P*KmQ/Keq +
Vmax1*KmP*Q/Keq
Den2 = Vmax2*P2*P/KmP + Vmax1*P*Q/Keq
v3 = Num/(Den1 + Den2)
%Den1 e Den2 fazem parte do denominador.
52
Quadro 9: Sintaxe para atribuir valores iniciais aos metabólitos internos.
onde Met
i
representa um dos m metabólitos internos e valor
i
o seu respectivo valor. Se o valor
de alguns dos metabólitos não for especificado, será atribuído, a estes metabólitos, o valor 0
(zero). No
Quadro 10 são mostradas as atribuições de valores iniciais considerando o exemplo
anterior.
Quadro 10: Exemplo de atribuição de valores iniciais.
Estes metabólitos devem aparecer em pelo menos uma reação. Se não aparecerem,
serão ignorados.
4.3 HIERARQUIA DOS MÓDULOS
Na Figura 14 é apresentada uma hierarquia dos módulos implementados no GEnSys
para a modelagem e simulação de redes metabólicas e reguladoras.
A principal característica desta organização em módulos é que eles podem ser
herdados por outros módulos e estes podem usar todos os dados e métodos do módulo base.
Dessa forma, há reutilização dos códigos do módulo base.
Met1 = valor1
Met2 = valor2
...
Metm = valorm
S1 = 2 %mM
P1 =0.5 %mM
S2 = 89 %mM
P2 = 6.9e-2 %mM
53
Figura 14: Hierarquia dos módulos que compõem o GEnSys. Os módulos de onde partem as
setas usam (herdam) as informações dos módulos aos quais estão ligados. Os três módulos
superiores, com o título em cinza, têm como função apenas coletar e armazenar as informações
sobre reações, metabólitos e a estequiometria da rede. Modelinfo: informações não
processadas sobre a rede; TotalStMat: estequiometria total; stMatrix: estequiometria interna;
FBA: análise de balanço de fluxo; MCA: análise de controle de fluxo; AFM: análise de fluxo
metabólico; DetSim: simulação dinâmica determinística; elemmode: modos elementares.
Cada módulo nesta hierarquia pode usar os métodos e variáveis do módulo no qual
está ligado. O módulo superior, básico, é o ModelInfo. Este módulo lê o arquivo que contém
as informações para a análise e simulação pretendida. Sendo assim, todos as análises
realizadas pelo GEnSys usam este módulo. A classe totalStMatrix produz a matriz
estequiométrica total (inclui todos os metabólitos da rede metabólica) e a classe stMat a
matriz estequiométrica interna. Os demais são:
FBA: módulo para a análise de balanço de fluxo;
MCA: módulo para a análise de controle metabólico;
MFA: módulo para a análise de fluxo metabólico;
DetSim: módulo para a simulação dinâmica determinística;
Elemmode: módulo para análise e determinação dos modos elemetares.
54
Os outros 3 módulos são ferramentas (toolboxes) auxiliares. O metatool é um
programa que calcula todos os modos elementares dada uma rede metabólica ou reguladora.
O COBRA (constraint-based reconstruction and analysis) é um toolbox que faz análise de
balanço de fluxo estático e dinâmico.
Nas seções a seguir, cada um destes módulos, e seus usos, serão descritos com mais
detalhes.
4.3.1 Módulo ModelInfo
Este é um módulo no topo da hierarquia. Sua principal função é ler todas as
informações do modelo (armazenadas em um arquivo texto ou numa cadeia de caracteres),
fazer um pré-processamento e produzir uma estrutura contendo três campos:
sRxn: é uma cadeia de caracteres que contém os dados das reações escritas em LRB. Tais
dados já passaram por um pré-processamento.
sInf: cadeia de caracteres que contém dados não relacionados à equação das reações, isto
é, são outras informações não referentes à estequiometria, nomes de reações ou de
metabólitos. Elas podem ser usadas para alguma análise ou simulação do modelo. Estes
dados estão após as reações (nem todas as reações precisam conter tais dados) e devem
ser, obrigatoriamente, precedidos por um ponto e vírgula (;).
sBefore: como sInf, é uma cadeia de caracteres que não faz parte das reações. Deve ser
usada para passar informações sobre o modelo. Estas informações devem preceder
qualquer reação do modelo.
As informações contidas em sInf dependem do objetivo do usuário (programador).
Elas podem conter, por exemplo, para uma reação: valor do fluxo (ou atividade) para a análise
de fluxo metabólico; dados cinéticos para simulação dinâmica determinística ou estocástica;
velocidade máxima e mínima para a análise de balanço de fluxo; entre outras. Já em sBefore,
pode ser qualquer informação – também dependente do objetivo da simulação – como por
exemplo, valores iniciais para os metabólitos em uma simulação dinâmica (estocástica ou
determinística).
Este módulo foi definido dessa forma para que possa ser usado na análise e
simulação – implementadas ou não neste trabalho – envolvendo redes metabólicas ou
reguladoras. Qualquer informação extra, não relacionada à estequiometria e nomes das
reações ou dos metabólitos, pode ser passada ao modelo através dos campos sBefore e sInf e
devem ser manipulados de acordo com o objetivo do usuário (programador). Assim definido,
55
este módulo confere reusabilidade do código, uma vez que ele pode ser facilmente estendido
para vários tipos de simulações in silico que envolvem redes metabólicas ou reguladoras. Nos
módulos que serão descritos a seguir, será visto como estas informações são extraídas e
usadas em vários tipos de simulação in silico de redes metabólicas.
4.3.2 Pré-processamento da LRB
A LRB é uma linguagem na qual o usuário deve escrever, de forma não ambígua,
todas as reações que compõe o modelo. O pré-processamento tem por objetivo preparar as
reações para que possam ser extraídos os nomes dos metabólitos e das reações e,
principalmente, a matriz estequiométrica. No pré-processamento da LRB são realizadas as
seguintes atividades:
remoção de comentários, linhas e espaços em branco;
adição de um delimitador das reações (o símbolo @) seguido, entre parênteses, do número
da linha, referente ao arquivo, onde a reação foi lida;
substituição dos símbolos ->, => e > das reações irreversíveis por um único símbolo: >;
substituição dos símbolos =, <-> e <=> das reações reversíveis por um único símbolo: =;
substituição dos símbolos ‘ +’ (espaço seguido de +) e ‘ -’ (espaço seguido de -) por ? e !,
respectivamente. Isto é realizado inclusive onde o sinal ‘ +’ (espaço seguido de +) está
implícito: depois de : ou depois do sinal de reversibilidade da reação. Por exemplo, na
reação DCB A:r1 =>+ , o símbolo ‘ +’ está implícito antes dos metabólitos A e C.
Na verdade, o pré-processamento traduz a LRB para outra linguagem equivalente
(LRB pré-processada, LRBPP), porém mais simples e mais adequada para a análise sintática
do conjunto de reações – realizada por um conjunto de autômatos finitos – que compõem o
modelo.
Além das atividades descritas acima, outra tarefa do pré-processamento é a
separação dos dados em sRxn (string contendo as reações em LRBPP), sBefore e sInf (estas
duas últimas strings contêm outras informações relacionadas ao modelo).
Por exemplo, dado o conjunto de reações gravado no arquivo exemplo.txt mostrado
no
Quadro 11:
56
Quadro 11: Exemplo de reações e outras informações que formam um modelo gravado num
arquivo.
A=0 B=0.3 D = 1e-4
r1:A + B - > C
r2:B + C < -> D; 58
r3:D + E = > E + F; 47
r4:F -> G + D; 789
r5:E + G <=> A
Também, estes dados podem ser atribuídos a uma string strExemplo no M
ATLAB
®
:
strExemplo = 'A=0 B=0.3 D = 1e-4 r1:A + B - > C r2:B + C < -> D; 58 r3:D +
E = > E + F; 47 r4:F -> G + D; 789 r5:E + G <=> A'
strExemplo =
A=0 B=0.3 D = 1e-4 r1:A + B - > C r2:B + C < -> D; 58 r3:D + E = > E + F;
47 r4:F -> G + D; 789 r5:E + G <=> A
O número após o ; para algumas das reações representa o fluxo no regime
estacionário, por exemplo. Após o pré-processamento, que descarta os espaços em branco e
comentários, será criada uma estrutura contendo os dois campos sRxn
e sInf. Para criar o
objeto model a partir das reações acima, basta digitar no M
ATLAB
®
:
model= modelinfo ('exemplo.txt') ou
model= modelinfo (strExemplo , 's')
model =
sBefore: 'A=0 B=0.3 D = 1e-4 '
sInf: [1x5 struct]
sRxn:
'@(1)r1:?A?B>?C@(2)r2:?B?C=?D@(3)r3:?D?E>?E?F@(4)r4:?F>?G?D@(5)r5:?E?G=?A'
No campo sRxn cada reação é separada pelo delimitador @ seguido, entre
parênteses, pelo número da linha do arquivo onde esta reação foi lida. Este número é usado
para que, caso haja algum erro de sintaxe (falta de um : ou do sinal de reversibilidade, por
exemplo), seja emitido uma mensagem de erro informando o possível erro e o número da
linha onde se encontra a reação no arquivo. No caso de o argumento da função modelinfo ser
uma string de reações, o número da linha corresponde a ordem, na string, da reação. As
demais informações correspondem àquelas substituições descritas anteriormente. Isto é, os
sinais ‘ +’ e ‘ –‘ foram substituídos por ? e !, respectivamente; cada sinal de uma reação
reversível ou irreversível foi substituído por = ou >, respectivamente.
Para o campo sInf é criado um array de estrutura (structure array) que contém, em
cada posição deste array, uma estrutura com os campos: FileLine e RxnData que representam,
respectivamente, a linha do arquivo ou ordem da reação na string (com o mesmo propósito
como descrito anteriormente) e a informação relacionada àquela reação. No exemplo anterior,
57
sInf: [1x5 struct] é um array com cinco estruturas, uma para cada reação. O conteúdo de sInf
é mostrada na
Tabela 1:
Tabela 1: Exemplo das informações armazenadas no campo sInf da estrutura modelinf.
Índice: 1 2 3 4 5
FileLine: -1 3 4 5 -1
RxnData: '' ' 58' ' 47' '789' ''
Onde não há dados para uma reação, é atribuído -1 e
'' para os campos FileLine e
RxnData, respectivamente.
Os campos sBefore e sInf não podem possuir o caractere @ (meta-símbolo que
delimita as reações) e nem : (dois pontos) precedido de uma letra (ou o sublinhado, _) seguido
de letras ou sublinhados ou dígitos para que não sejam interpretados como nome de reação
seguido de : (dois pontos).
A partir dos dados em sRxn serão produzidos: uma lista com os nomes das reações,
uma lista com os nomes dos metabólitos e a matriz estequiométrica. Ressalta-se que estes
últimos dados são “constantes” em todas as classes onde são implementados os demais
módulos descritos neste trabalho; por exemplo, a matriz estequiométrica é necessária em
todas as classes referentes a um módulo de simulação (AFM, ABF, simulação dinâmica, etc).
Por outro lado, as informações em sBefore e
sInf variam conforme o módulo de
simulação implementado. Por exemplo, na AFM e na atribuição de fluxos, sInf contém os
valores dos fluxos medidos; na simulação dinâmica determinística, estas informações são
nomes de equações cinéticas para as reações; sBefore pode conter, como visto no exemplo, os
valores iniciais na simulação dinâmica e na ABF elas representam o intervalo que um fluxo
pode variar (valores mínimos e máximos). Portanto, em cada uma destas classes deve haver
um método específico para extrair e interpretar tais informações. No entanto, para as
informações em sRxn
que são úteis em todas as classes e é constante – é necessário apenas
um método que possa extrair, adequadamente, tais informações. Este é o propósito do
próximo módulo a ser descrito.
4.3.3 Módulo totalStMat
Este módulo tem a tarefa de processar o campo sRxn e obtém, como resultado, os
seguintes campos:
58
stMatrix
()
qp × : matriz estequiométrica total (todos os metabólitos) contendo
p
metabólitos eq reações;
ReacMatrix
()
qp
×
: matriz estequiométrica contendo apenas os reagentes de todas as
reações. Sendo assim seus coeficientes são todos negativos;
ProdMatrix
()
qp
×
: matriz estequiométrica contendo apenas os produtos de todas as
reações. Sendo assim seus coeficientes são todos positivos;
lComp: listas dos nomes dos
p
compostos das reações (reagentes e produtos);
lRxn: listas dos nomes das q reações;
Irrev_Rxn: irreversibilidades das q reações (1: irreversível, 0: reversível);
indExt: índices dos metabólitos externos, entre 1 e
p
, em relação às linhas de stMatrix;
indInt: índices dos metabólitos internos, entre 1 e
p
,em relação às linhas de stMatrix;
O construtor desta classe cria uma instância da classe modelinfo, e desta, obtém-se o
campo sRxn de onde são extraídos todos os campos descritos acima. A matriz
stMatrix é
determinada pela soma das matrizes dos regentes (
ReacMatrix) e dos produtos
(
ReacMatrix). Estas duas últimas matrizes serão necessárias na simulação dinâmica
estocástica.
Usando o exemplo anterior, deve-se seguir a seguinte sintaxe no M
ATLAB
®
:
model = totalStMat('exemplo.txt') ou
model= totalStMat(strExemplo , 's')
model =
stMatrix: [7x5 double]
ReacMatrix: [7x5 double]
ProdMatrix: [7x5 double]
lComp: {'A' 'B' 'C' 'D' 'E' 'F' 'G'}
lRxn: {'r1' 'r2' 'r3' 'r4' 'r5'}
Irrev_Rxn: [1 0 1 1 0]
indExt: 5
indInt: [1 2 3 4 6 7]
A seguir a matriz stMatrix é exibida:
model.stMatrix
ans =
-1 0 0 0 1
-1 -1 0 0 0
1 -1 0 0 0
0 1 -1 1 0
0 0 0 0 -1
0 0 1 -1 0
0 0 0 1 -1
59
Observa-se pelo exemplo que há sete metabólitos (7 linhas na matriz
stMatrix),
sendo que um deles foi considerado externo (linha 5, metabólito E) e seis internos (linhas 1, 2,
3, 4, 5 e 7; correspondem aos metabólitos, respectivamente, A, B, C, D, F e G). Há também
cinco reações (r1, r2, r3, r4 e r5) sendo que r1, r3 e r4 são irreversíveis (1) e as demais
reversíveis (0).
O processamento das reações foi implementado usando-se autômatos finitos.
4.3.4 Metabólitos Internos e Externos
É importante identificar os metabólitos considerados internos ou externos numa rede
metabólica. No regime estacionário os metabólitos internos têm concentração constante. Isto
quer dizer que as velocidades de produção e consumo destes metabólitos devem ser iguais.
Nem sempre os metabólitos externos precisam ser extracelulares.
Para ser considerado externo, um metabólito deve satisfazer os seguintes critérios
(
Figura 15):
aparecer apenas no lado esquerdo das reações irreversíveis da qual participa (entrada);
aparecer apenas no lado direito das reações irreversíveis da qual participa (saída);
aparecer apenas uma vez no lado esquerdo ou direito de uma reação reversível.
Nos demais casos os metabólitos são considerado internos.
Figura 15: Esquema gráfico para a classificação dos metabólitos como internos ou externos.
Nos casos (a), (b) e (c) o metabólito A é considerado como externo e no caso (d) como interno.
No entanto, em algumas análises é necessário fazer com que um metabólito torne-se
externo ou interno. No GEnSys adiciona-se o sufixo
_x ou _i ao nome de um metabólito para
que seja considerado externo ou interno, respectivamente. Por exemplo, adicionando os
sufixos
_i ou _x em alguns metabólitos do exemplo anterior:
r1:A_x + B - > C
r2:B + C < -> D
r3:D_x + E_i = > E_i + F
r4:F -> G + D
r5:E_i + G <=> A_x
Quadro 12: Exemplo de reações com metabólitos forçados a serem internos ou externos.
AA A A
(a) (b)
(d)
(c)
60
tem-se o seguinte resultado:
stMatrix: [8x5 double]
ReacMatrix: [8x5 double]
ProdMatrix: [8x5 double]
lComp: {'A_x' 'B' 'C' 'D' 'D_x' 'E_i' 'F' 'G'}
lRxn: {'r1' 'r2' 'r3' 'r4' 'r5'}
Irrev_Rxn: [1 0 1 1 0]
indExt: [1 5]
indInt: [2 3 4 6 7 8]
Neste exemplo, o metabólito E_i tornou-se externo e os metabólitos A_x e D_x se
tornaram externos. Comparar com o exemplo anterior.
4.3.5 Módulo stMat
Este é o módulo que armazena as informações do modelo relacionadas apenas aos
metabólitos internos. Como foi visto, os metabólitos de modelo são classificados como
externos e internos. Os externos, para a maioria das análises, são removidos da rede
metabólica. Sendo assim, ao se remover tais metabólitos, as respectivas linhas da matriz
estequiométrica total correspondente a estes metabólitos também são removidas, obtendo,
então, uma nova matriz estequiométrica. Além disso, os metabólitos externos são removidos
da lista de metabólitos (lComp) . Esta classe possui os seguintes campos:
st
()
nm ×
: matriz estequiométrica interna; contém m linhas correspondentes aos
metabólitos internos e
n colunas correspondentes às reações;
lComp
()
m×1
: listas dos nomes dos m compostos (metabólitos) internos;
lRxn
()
n×1 : listas dos nomes das reações. Mesma lista da classe totalStMat;
Irrev_Rxn: vetor de tamanho n (número de reações na rede). Este vetor indica se a j-
ésima reação é irreversível (1) ou reversível (0);
MoetyCycle
()
mrm × )( : é uma matriz onde cada linha representa um ciclo na rede
(relação de conservação) entre os metabólitos. O número de colunas desta matriz é igual
ao número de metabólitos internos (m) e o número de linhas é igual ao número de ciclos
na rede (m – r). Os elementos da i-ésima linha que possuem o valor diferente de 0 fazem
parte do i-ésimo ciclo. Há tantos destes ciclos quanto há linhas linearmente dependentes
na matriz
st, ver seção 2.4.3;
depRow
()
)(1 rm
× : vetor linha que contém os índices, em relação à matriz st, das linhas
linearmente dependentes. r é o posto da matriz
st;
61
indepRow
()
r×1 : contém os índices, em relação à matriz st, das linhas linearmente
independente, r é o posto da matriz
st;
indepCol
()
)(1 rn × : contém os índices, em relação à matriz st, das colunas linearmente
independentes,
r é o posto da matriz st;
depCol
()
r×1
: contém os índices, em relação à matriz st, das colunas linearmente
dependentes.
onde:
r é o posto da matriz st, m é o número de metabólitos (número de linhas de st) e n o
número de reações (número de colunas de
st). Será usado como exemplo o modelo da rede da
próxima seção para mostrar os conteúdos dos campos descritos acima.
4.4 SIMULAÇÃO DINÂMICA COM O GENSYS
Para se criar um modelo dinâmico, antes de tudo, é necessário definir todas as
reações que o compõem. Isto é feito estudando-se a via de interesse – objeto de estudo do
modelo – através de consultas à literatura e aos bancos de dados disponíveis na
Internet para
coletar as informações estruturais (estequiometria) e cinéticas (simulação dinâmica)
relacionadas às reações da via a ser simulada.
4.4.1 Descrição do Exemplo para Simulação Dinâmica
Será usada como exemplo a rede metabólica descrita na Figura 16. Esta rede
metabólica representa a parte superior da glicólise da
Saccharomyces cerevisiae (HYNNE et
al.
, 2001).
Figura 16: Via metabólica representando a primeira parte da glicólise da Saccharomyces
cerevisiae.
Glicose
Glic-6-P Fruc-6-P Fruc-1,6-P2
ATP
ADP
ATP
ADP
ATP
ADP
v
1
v
2
v
3
v
4
v
5
AD
P
ATP
v
6
ATP
ADP
v
7
ATP + AMP
v
8
2ADP
62
O primeiro passo, uma vez escolhida a rede objeto de estudo, é criar as reações em
LRB (
Quadro 13).
Quadro 13: Reações em LRB da rede mostrada na Figura 16.
v1:Glicose + ATP -> ADP + Glic-6-P
v2:Glic-6-P + ATP -> ADP
v3:Glic-6-P <-> Fruc-6-P
v4:Fruc-6-P + ATP -> Fruc-1,6-P2 + ADP
v5:Fruc-1,6-P2 -> null
v6:ADP -> ATP
v7:ATP -> ADP
v8:ATP + AMP_i <-> 2ADP
Na reação v5, o lado direito,
null, indica que a reação não forma nenhum produto.
Sendo assim, ela é considerada uma reação de saída. Estas reações foram salvas no arquivo
Reactions.m. O seguinte comando, no MATLAB
®
, produzirá um objeto útil para a simulação
determinística.
model = DetSim('Reactions.m')
model =
totalModel: [1x1 struct]
internalModel: [1x1 struct]
lRxn: {'v1' 'v2' 'v3' 'v4' 'v5' 'v6' 'v7' 'v8'}
hJ: {8x1 cell}
O campo hj, de model, armazena um handle para cada uma das reações em lRxn. Um
handle é um recurso do MATLAB
®
para guardar o nome de uma função que será executada
pelo próprio M
ATLAB
®
.
4.4.2 Matriz Estequiométrica Total
O comando acima produziu a estrutura model, que possui, como campos, outras
estruturas. A estrutura
totalModel representa o modelo total, isto é, informações relacionadas
a matriz estequiométrica total (metabólitos externos e internos):
model.totalModel
ans =
stMatrix: [7x8 double]
lComp: {'Glicose' 'ATP' 'ADP' 'Glic-6-P' 'Fruc-6-P' 'Fruc-1,6-P2'
'AMP_i'}
indExt: 1
indInt: [2 3 4 5 6 7]
63
O comando a seguir exibe a matriz estequiométrica total (matriz
S na seção 2.2):
model.totalModel.stMatrix
ans =
-1 0 0 0 0 0 0 0
-1 -1 0 -1 0 1 -1 -1
1 1 0 1 0 -1 1 2
1 -1 -1 0 0 0 0 0
0 0 1 -1 0 0 0 0
0 0 0 1 -1 0 0 0
0 0 0 0 0 0 0 -1
Cada coluna j desta matriz representa uma reação; a ordem das reações é a mesma
dada em
model.lRxn. Para cada metabólito i é criado uma linha nesta matriz. Os coeficientes
com sinais negativos significam que o metabólito
i é um reagente da j-esima reação e aqueles
com sinais positivos são produtos.
4.4.3 Matriz Estequiométrica Interna
A matriz estequiométrica interna, ou simplesmente matriz estequiométrica, é obtido
da matriz total excluindo-se desta as linhas correspondentes aos metabólitos externos.
Também, deve-se excluir estes metabólitos da lista de metabólitos. Assim, obtém-se:
model.internalModel
ans =
st: [6x8 double]
lComp: {'ATP' 'ADP' 'Gluc-6-P' 'Fruc-6-P' 'Fruc-1,6-P2'
'AMP_i'}
Irrev_Rxn: [1 1 0 1 1 1 1 0]
MoetyCycle: [1 1 0 0 0 1]
depRow: 1
indepRow: [2 3 4 5 6]
indepCol: [1 2 3 4 8]
depCol: [5 6 7]
Onde: st representa a matriz estequiométrica interna:
model.internalModel.st
ans =
-1 -1 0 -1 0 1 -1 -1
1 1 0 1 0 -1 1 2
1 -1 -1 0 0 0 0 0
0 0 1 -1 0 0 0 0
0 0 0 1 -1 0 0 0
0 0 0 0 0 0 0 -1
Neste caso há um ciclo, isto é, a matriz MoetyCycle contém uma linha. Este ciclo é
formado pelos metabólitos ATP, ADP e AMP_i.
64
4.4.4 Conjunto de Equações Diferenciais Ordinárias
Uma vez definido o modelo, o seguinte comando exibe as equações diferenciais
ordinárias (ODE, na sigla em inglês) do mesmo:
printODE(model)
ODE system:
d(ADP)/dt = v1 + v2 + v4 - v6 + v7 + 2v8
d(Gluc-6-P)/dt = v1 - v2 - v3
d(Fruc-6-P)/dt = v3 - v4
d(Fruc-1,6-P2)/dt = v4 - v5
d(AMP_i)/dt = -v8
Algebric equations (conservation relationship):
const1 = ATP + ADP + AMP_i
Como se vê, é definida uma EDO para cada metabólito interno da rede. Este
conjunto de EDOs é um exemplo das equações
(2.21) e (2.22). A relação de conservação
(
conservation relationship; que foi originada da matriz MoetyCycle descrita anteriormente) dá
origem a uma equação algébrica. Isto significa que a soma destes metabólitos é constante ao
longo do tempo. Neste caso, o que se conserva, no ciclo de reações, é adenosina (A) em cada
um dos metábolitos envolvidos neste ciclo. O valor de
const1 é determinado a partir dos
valores iniciais dos metabólitos internos ATP, ADP e AMP_i.
4.4.5 Cinéticas das Reações
Para realizar a simulação dinâmica é necessário definir as cinéticas de cada uma das
reações da rede metabólica,
j
v da equação (2.23). Para este exemplo, será criado o arquivo
Kinetics.m contento as seguintes cinéticas (usando o comando type para exibir o conteúdo do
arquivo):
type 'Kinetics.m'
%kinetic expressions
v1
Vmax = 1398
KmATP = 0.1
KmGlucose = 0.37
v1 = (Vmax*Glucose*ATP)/(1 + ATP/KmATP + Glucose/KmGlucose +
(ATP*Glucose)/(KmATP*KmGlucose))
v2
k2 = 2.26; %mM^-1*min^-1
v2 = k2*ATP*Gluc-6-P
65
v3
Vf_max = 140.282
Vr_max = 140.282
KmGluc6P = 0.8
KmFruc6P = 0.15
v3 = ((Vf_max*Gluc-6-P/KmGluc6P) - (Vr_max*Fruc-6-P/KmFruc6P)) / (1 + Gluc-
6-P/KmGluc6P + Fruc-6-P/KmFruc6P)
v4
Vmax = 44.7287
KmFruc6P = 0.021; %mM^2
k = 0.15
v4 = Vmax*Fruc-6-P^2/(KmFruc6P*(1 + k*(ATP/AMP_i)^2) + Fruc-6-P^2)
v5
k5 = 6.04662
v5 = k5*Fruc-1,6-P2
v6
k6 = 68.48
v6 = k6*ADP
v7
k7 = 3.21
v7 = k7*ATP
v8
k8f = 432.9
k8r = 133.33
v8 = k8f*ATP*AMP_i - k8r*ADP^2
Neste arquivo, como pode se ver acima, é definido os valores das constantes
cinéticas e a equação da cinética (
reaction law) de cada uma das reações dadas no arquivo
Reactions.m. A sintaxe para a criação do arquivo de cinéticas foi definida na seção 4.2.
Através deste arquivo, o seguinte comando gera as cinéticas – como funções executáveis no
M
ATLAB
®
– para cada uma das reações do modelo model:
model = setKinetic(model, 'Kinetics.m')
model =
totalModel: [1x1 struct]
internalModel: [1x1 struct]
lRxn: {'v1' 'v2' 'v3' 'v4' 'v5' 'v6' 'v7' 'v8'}
hJ: {8x1 cell}
Este comando gera, a partir das informações em Kinetics.m, as funções em MATLAB
®
com os mesmos nomes das reações em
model.lRxn.
4.4.6 Valores Iniciais dos Metabólitos
Por último, é necessário definir os valores iniciais de todos os metabólitos – de todos
os internos e daqueles externos que aparecem numa expressão da cinética –, uma vez que será
66
resolvido um sistema de equações diferenciais ordinárias. Estes são, também, definidos em
um arquivo separado
InitVal.m:
type 'InitVal.m'
%initial values
Glucose = 12.8174
Gluc-6-P = 1
ATP = 2.01
ADP = 1.4
AMP_i = 0.1
Serão inicializados com zero todos aqueles metabólitos que não estão explicitamente
inicializados no arquivo acima.
Através do comando
initValFromFile todos os valores iniciais são definidos:
model = initValFromFile(model, 'InitVal.m')
model =
totalModel: [1x1 struct]
internalModel: [1x1 struct]
lRxn: {'v1' 'v2' 'v3' 'v4' 'v5' 'v6' 'v7' 'v8'}
hJ: {8x1 cell}
X0: [7x1 double]
LX: [-1.0000 0 0 0 -1]
A: 3.5100
Foram criados dois novos campos em
model: X0 (vetor coluna com m linhas que
contém os valores iniciais de todos os metabólitos) e
LX (matriz ligadora de metabólitos),
definida na seção
2.4.3.
O valor da constante
const1 agora pode ser determinado. Executando o comando
printODE de novo, este valor aparece valendo 3.51:
printODE(model)
ODE system:
d(ADP)/dt = v1 + v2 + v4 - v6 + v7 + 2v8
d(Gluc-6-P)/dt = v1 - v2 - v3
d(Fruc-6-P)/dt = v3 - v4
d(Fruc-1,6-P2)/dt = v4 - v5
d(AMP_i)/dt = -v8
Algebric equations (conservation relationship):
3.51 = ATP + ADP + AMP_i
4.4.7 Forma Simplificada
Existe uma forma mais fácil e simples para a construção de um modelo para
simulação dinâmica determinística. Foi criado no GEnSys algumas funções cinéticas pré
definidas. Estas funções – ou seus nomes – podem ser usadas diretamete no arquivo de
67
reações. Na
Tabela 2 são mostrados os mecanismos e a sintaxe das cinéticas pré definidas no
GEnSys.
Tabela 2: Cinéticas pré definidas no GEnSys. Quando há dois substratos, estes podem se ligar
à enzima de forma ordenada (um depois o outro) ou aleatória. Por isso, alguns mecanismos
com dois substratos podem ser classificados como ordenado ou aleatório. Além disso, se há
um ou dois substratos, a enzima pode ser classificada como uni ou bi, respectivamente.
Símbolos, Vmax: velocidade máxima da reação; kms1, kms2, kmp1 e kmp2 são as constantes
de Michaelis dos substratos 1 e 2 e dos produtos 1 e 2. Recomenda-se Leskovac (2003) para
mais detalhes.
Sintaxe das cinéticas Mecanismo e observações
hill(Vmax, Kms1, n)
Equação de Hill. Cinética com um único substrato.
Usado onde há cooperatividade.
massaction(kf, kr)
Ação das massas. Cinética reversível. Não há um
número definido de substratos e produtos
mm(Vmax, Kms1)
Michaelis-Menten irreversível. Cinética com um
único substrato.
mwc(Vmax, Kms1, L, n, c)
Monod, Wyman e Changeux. Cinética com um
único substrato. Usado onde há cooperatividade.
orderedbibi(Vmax, Kms1,
Kms2, Kmp1, Kmp2, Keq)
Dois substratos e dois produtos ordenados. Cinética
reversível.
orderedbisub(Vmax, Kms1,
Kms2)
Dois substratos ordenados. Cinética irreversível.
orderedunibi(Vmax, Kms1,
Kmp1, Kmp2, Keq)
Um substrato e dois produtos ordenados. Cinética
reversível.
pingpongbibi(Vmax, Kms1,
Kms2, Kmp1, Kmp2, Keq)
Ping pong bisubstrato. Dois substratos e dois
produtos e reversível
randbisub(Vmax, Kms1,
Kms2)
Bisubstrato aleatório. Irrevesível com dois
substratos.
rmm(Vmax, kms1, kmp1, keq)
Michaelis-Menten reversível. Um substrato e um
produto.
theorellchance(Vmax, Kms1,
Kms2, Kmp1, Kmp2, Keq)
Mecanismo theorellchance. Reversível com 2
substratos e dois produtos
Além das cinéticas, pode-se – neste mesmo arquivo – inicializar todos os
metabólitos. Assim, para o exemplo visto anteriormente, considerando a inicialização e as
cinéticas pré definidas, o arquivo do modelo tem a seguinte forma:
type 'Reactions2.m'
%example: subset of reactions of glycolysis in yeast
%initial values
Glucose = 12.8174
Gluc-6-P = 1
ATP = 2.01
ADP = 1.4
AMP_i = 0.1
68
%reactions
v1:Glucose + ATP -> ADP + Gluc-6-P
v2:Gluc-6-P + ATP -> ADP + null; massaction(2.26)
v3:Gluc-6-P <-> Fruc-6-P; rmm(140.282, 0.8, 0.15, 0.1875)
v4:Fruc-6-P + ATP -> Fruc-1,6-P2 + ADP
v5:Fruc-1,6-P2 -> null; massaction(6.04662)
v6:ADP -> ATP; massaction(68.48)
v7:ATP -> ADP; massaction(3.21)
v8:ATP + AMP_i <-> 2ADP; massaction(432.9, 133.33)
Observando o arquivo acima, vê-se que para as reações v1 e v4 não foi definida
cinética alguma. Para as demais foram usadas as cinéticas pré-definidas
massaction (lei de
ação das massas) e
rmm (Michaelis-Menten reversível). As cinéticas para as reações v1 e v4
estão definidas no arquivo
Kinetics2.m; este agora menor que o original:
type 'Kinetics2.m'
%kinetic expressions
v1
Vmax = 1398
KmATP = 0.1
KmGlucose = 0.37
v1 = (Vmax*Glucose*ATP)/(1 + ATP/KmATP + Glucose/KmGlucose +
(ATP*Glucose)/(KmATP*KmGlucose))
%/(KmATP*KmGlucose)
v4
Vmax = 44.7287
KmFruc6P = 0.021; %mM^2
k = 0.15
v4 = Vmax*Fruc-6-P^2/(KmFruc6P*(1 + k*(ATP/AMP_i)^2) + Fruc-6-P^2)
É possível, portanto, criar um modelo dinâmico em apenas um arquivo que conterá
as reações, os valores iniciais e as cinéticas. O usuário, se desejar, pode adicionar novas
cinéticas pré-definidas. Para isso, basta criar um arquivo – extensão .m – com a seguinte
forma:
v
nomePar_1 = par1
nomePar_2 = par2
...
nomePar_N = parN
v = f(par1, par2,…, parN, S1, S2,…, SM, P1, P2,…, PL)
Esta é a sintaxe genérica para a criar uma cinética com
N parâmetros, M substratos e
L produtos. Nesta sintaxe, f(.) significa que a expressão matemática é em função daqueles
parâmetros e variáveis. Por exemplo, a cinética pré-definida de uma reação reversível com
dois substratos e dois produtos usando o mecanismo conhecido como
pingpongbibi é escrita
como:
69
type pingpongbibi.m
%ping pong bi bi reaction law
%
%syntax: pingpongbibi(Vmax, Kms1, Kms2, Kmp1, Kmp2, Keq)
%
v
Vmax = par1
Kms1 = par2
Kms2 = par3
Kmp1 = par4
Kmp2 = par5
Keq = par6
v = Vmax*(S1*S2 - P1*P2/Keq)/(Kms2*S1 + Kms1*S2 + Kms1*Kms2*P1/Kmp1 +
Kms1*Kms2*P2/Kmp2 + Kms2*S1*P1/Kmp1 + Kms1*Kms2*P1*P2/(Kmp2*Kmp1) +
Kms1*S2*P2/Kmp2 + S1*S2)
4.4.8 Simulação Dinâmica do Modelo
Uma vez definido o modelo – pelos passos descritos acima –, o comando [t, X] =
transient(model, tspan), com tspan = [t
0
t
f
], determina as concentrações dos metabólitos no
intervalo de tempo
tspan integrando o sistema de equações diferenciais de t
0
a t
f
com as
condicões iniciais definidas anteriormente. Cada linha na matriz solução
X corresponde aos
tempos retornados no vetor coluna
t e cada coluna de X representa a concentração dos
metabólitos internos. Os comandos abaixo calcularão as concentrações dos metabólitos, na
matriz
X, em cada passo de tempo t, no intervalo tspan. Estes valores não foram exibidos.
tspan = [0 0.5];[t X] = transient(model, tspan);
As concentrações dos metabólitos são melhores visualizadas através de gráficos. O
comando
subplotTrans(model, nGraph, X, t) exibe, em única figura, os gráficos (transientes)
das concentrações de todos os metabólitos internos (
X) ao longo do tempo (t). Cada gráfico
2D relaciona a concentração (eixo y) de cada um dos metabólitos versus o tempo (eixo x).
nGraph representa o número de gráficos na horizontal.
O comando abaixo exibe os gráficos das concentrações dos metabólitos, calculadas
anteriormente, em uma única figura (
Figura 17):
subplotTrans(model,2,X,t);
70
0 0.1 0.2 0.3 0.4 0.5
1.5
2
2.5
time (min)
ATP (mM)
0 0.1 0.2 0.3 0.4 0.5
1
1.5
2
time (min)
ADP (mM)
0 0.1 0.2 0.3 0.4 0.5
0
2
4
6
time (min)
Gluc-6-P (mM)
0 0.1 0.2 0.3 0.4 0.5
0
0.5
1
time (min)
Fruc-6-P (mM)
0 0.1 0.2 0.3 0.4 0.5
0
2
4
6
time (min)
Fruc-1,6-P2 (mM)
0 0.1 0.2 0.3 0.4 0.5
0
0.5
1
time (min)
AMP
i
(mM)
Figura 17: Concentrações dos metabólitos internos ao longo do tempo. Estes gráficos foram
produzidos pelo comando subplotTrans.
0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 0.5
0
0.5
1
1.5
2
2.5
3
3.5
4
4.5
5
time (min)
mM
ATP
ADP
Gluc-6-P
Fruc-6-P
Fruc-1,6-P2
AMP
i
Figura 18: Gráficos de todas as concentrações dos metabólitos internos num única figura.
Produzido pelo comando plotTransFig.
O comando
plotTrans(model, X, t) exibe os m (número de metabólitos internos)
gráficos 2D, como acima, em figuras separadas (não mostradas).
Já o comando
plotTransFig(model, X, t) cria uma figura contendo todos os gráficos
dos metabólitos sobrepostos (
Figura 18):
71
plotTransFig(model,X,t)
Também é possível calcular e exibir os valores dos fluxos (atividade enzimática) de
cada reação ao longo do tempo. Os comandos a seguir, como os anteriores, calculam e exibem
um gráfico com os valores dos fluxos ao longo do tempo:
Fluxes = allRxnRates(model, X);subplotFluxes(model, 2, Fluxes, t)
0 0.1 0.2 0.3 0.4 0.5
47
48
49
time (min)
v1 (mM/time)
0 0.1 0.2 0.3 0.4 0.5
0
10
20
time (min)
v2 (mM/time)
0 0.1 0.2 0.3 0.4 0.5
0
50
100
time (min)
v3 (mM/time)
0 0.1 0.2 0.3 0.4 0.5
0
20
40
time (min)
v4 (mM/time)
0 0.1 0.2 0.3 0.4 0.5
0
20
40
time (min)
v5 (mM/time)
0 0.1 0.2 0.3 0.4 0.5
50
100
150
time (min)
v6 (mM/time)
0 0.1 0.2 0.3 0.4 0.5
4
6
8
time (min)
v7 (mM/time)
0 0.1 0.2 0.3 0.4 0.5
-200
0
200
time (min)
v8 (mM/time)
Figura 19: Valores dos fluxos de cada reação (enzima) da rede metabólica no tempo. Estes
gráficos foram obtidos pelo comando subplotFluxes que exibe os fluxos calculados pela
função AllRxnRates.
Este modelo simula um biorreator funcionando em modo contínuo – a concentração
da glicose (único substrato de entrada) é constante –, por isso faz sentido calcular o valor das
concentrações no regime estacionário:
xss = steadystate(model)
xss =
1.6494
1.4617
4.0252
0.4434
5.3578
0.3990
72
4.5 SIMULAÇÃO ESTOCÁSTICA DO OPERON TRP DA E. COLI
Como visto anteriormente, há duas abordagens para a simulação dinâmica:
estocástica e determinística. Na abordagem estocástica, um conjunto de reações em um meio
espacialmente homogêneo e com volume constante representando o sistema é simulado pelo
algoritmo de simulação estocástica (SSA) (ver seção
2.3.2 para saber mais detalhes sobre este
algoritmo). Embora a abordagem determinística seja adequada na maioria dos casos, ela não
reflete a natureza estocástica do sistema que é importante em muitos sistemas biológicos,
como naqueles onde há alguma espécie com um número pequeno de cópias numa célula
(DNA ou moléculas reguladoras, por exemplo) (MCADAMS e ARKIN, 1997).
Nesta seção serão apresentadas todas as reações que envolvem a síntese do triptofano
(Trp) e a regulação do
operon trp na E. coli. Será levada em consideração, como no modelo
da equação
(2.77), apenas a subunidade TrpE da enzima antranilato sintase (AS). Isto se
justifica pelo fato desta enzima ser a primeira enzima da via e ainda ser inibida (através da
subunidade TrpE) pelo produto final, o triptofano.
Um dos principais mecanismos de regulação do
operon trp na E. coli é a repressão.
No
operon trp existem 5 genes estruturais (trpE-trpD-trpC-trpB-trpA, ou trpEDCFA) os quais
codificam as 5 enzimas que catalisam a síntese de Trp na
E. coli a partir do corismato, o
principal precursor da via de biossíntese do Trp. Este
operon também contém um promotor,
um operador (repressão) e uma região líder (atenuação da transcrição). Os genes
trpEDCBA
são transcritos para um mRNA policistrônico que, por sua vez, são traduzidos para suas
respectivas enzimas.
A repressão ocorre da seguinte forma: uma molécula do repressor ativo liga-se ao
operador que bloqueia a ligação da RNA polimerase (RNAP) ao promotor impedindo, assim,
o início da transcrição. O repressor (um dímero formado por duas subunidades codificadas
pelo gene
trpR) deve estar ativado pelo Trp para se ligar ao operador. Esta ativação se dá pela
ligação não cooperativa de 1 molécula de Trp a cada uma das duas subunidades do TrpR. Esta
ativação é representada pelas reações:
T
kk
RTR
TT
⎯→+
+
,2
e
A
kk
T
RTR
TT
⎯→+
+
2,
(4.1)
onde,
R, T, R
T
, R
A
, K
T
+
e K
T
-
representam, respectivamente, repressor inativo, triptofano,
complexo repressor_ativo–1Trp, repressor ativo, constante de velocidade pra frente e
constante de velocidade reversa.
73
A repressão se dá quando um repressor ativo liga-se ao operador numa reação
reversível:
R
kk
AF
ORO
RR
⎯→+
+
,
(4.2)
Neste caso
O
R
é o complexo operador-repressor, O
F
é o operon livre. A transcrição é
realizada quando uma RNAP se liga ao
O
F
numa reação irreversível com velocidade k
P
+
:
MOO
F
k
F
P
+⎯→
+
(4.3)
onde M representa o mRNA com tamanho suficiente para conter o sítio de ligação do
ribossomo (RBS). Pelas reações
(4.2) e (4.3) percebe-se que a RNAP concorre com o R
A
para
se ligar ao
operon livre.
O mRNA
M pode ter sua transcrição interrompida por outro mecanismo de
regulação, a atenuação da transcrição. Após a RNAP transcrever o RBS, o ribossomo se liga
ao mRNA
M e inicia-se a tradução. Se o nível intracelular de Trp estiver alto, a tradução deste
mRNA promove a formação de um grampo que induz a RNAP a interromper a transcrição.
Por outro lado, se houver pouco Trp no meio intracelular, durante a tradução que é realizada
simultaneamente com a transcrição, o ribossomo faz com que outra estrutura seja formada de
forma a não interromper a transcrição. Tem-se a seguinte reação representando a atenuação da
transcrição:
F
A
MM
T
⎯→
(4.4)
Onde
M
F
é o mRNA livre que será traduzido para formar a enzima AS. A
T
, neste
caso, não é a constante de velocidade de transcrição e, sim, a função
()
(
)
CT
T
ebTA
= 11,
onde
A
T
representa a probabilidade de haver atenuação da transcrição, uma formulação
adequada para simulação estocástica.
O ribossomo ligado ao mRNA livre (
M
F
) que não sofreu atenuação dará origem ao
complexo ribossoma–mRNA (
M
FR
), cuja reação catalítica irreversível é:
FRF
k
F
MMM
L
+⎯→
2/
(4.5)
Nesta reação,
k
L
é dividido por dois porque a AS é formada por duas subunidades.
Assim, o nível de AS será a metade do número de subunidade traduzida por molécula de
M
F
.
A partir do complexo
M
FR
, a enzima AS, representada por E, é alongada pelo
ribossomo através da reação irreversível:
74
()
EtM
trad
k
eFR
⎯→
τ
(4.6)
onde
τ
e
é o atraso de tempo devido à tradução. A tradução leva
τ
e
minutos para alongar o
peptídeo
TrpE, por isso o nível de E é proporcional ao nível de M
FR
τ
e
minutos atrás. Neste
caso, deve-se considerar
M
FR
em função do tempo t.
A inibição alostérica da AS é o último mecanismo de regulação considerado na
biossíntese do Trp. Duas moléculas de Trp ligam-se de forma cooperativa a cada uma das
subunidades TrpE da AS. As duas reações reversíveis que representam a inibição enzimática
são:
T
kk
ETE
ii
⎯→+
+
,2
e
T
kk
T
ETE
ii
2
2,
⎯→+
+
(4.7)
Finalmente, tem-se a reação da produção de
T a partir da atividade enzimática E. A
produção do triptofano
T é dada pela seguinte reação:
ETE
i
k
+⎯→
(4.8)
e o consumo de Trp pela bactéria para a síntese de proteína
pro
P
CT
pro
⎯→
(4.9)
onde
(
)
gpro
KTPP
+
=
μ
é a probabilidade de acontecer esta reação. De novo, foi usado uma
equação em função do nível de triptofano (
T) para denotar a probabilidade de acontecer tal
reação.
Alguns dos compostos presentes nas reações acima são degradados e/ou diluídos. As
reações a seguir representam este fato
Φ⎯→Φ⎯→Φ⎯→Φ⎯→Φ⎯→Φ⎯→
++
μμμμ
μμ
T TE ET E M M
dd
kk
F
,2,,,,
(4.10)
onde μ é a velocidade de crescimento específico da bactéria, e k
d
a velocidade de degradação
do mRNA. O símbolo
Φ, presente no lado direito da reação, representa a degradação do
composto da esquerda com velocidade
μ
ou
d
k
+
μ
. Onde se tem apenas
μ
, como constante
de velocidade da reação, há apenas diluição. Onde há
d
k
+
μ
há degradação com velocidade k
d
e diluição do composto no meio intracelular.
As reações de
(4.1) a (4.10) acima representam a dinâmica de biossíntese do Trp
levando-se em conta todas as regulações existentes no
operon trp da E. coli.
75
4.5.1 Parâmetros
Todos os parâmetros para a simulação determinística e estocástica estão na Tabela 3.
A maioria dos parâmetros usados na simulação foi estimada por Santillan e Mackey (2001b) e
estão na unidade de concentração
μM ou μM
-1
min
-1
. Assim, estes valores devem ser
convertidos para número de moléculas (ver
2.3.2). Por isso, para todos os valores iniciais dos
metábolitos e das constantes de velocidades foi usado o seguinte fator de conversão:
VN
k
c
a
i
i
6
10
= para k
i
em unidades
11
min
M
μ
;
VCNN
amolecule
6
10
= para C em unidades
M
μ
.
(4.11)
onde
N
a
é o número de Avogrado, k
i
e C são as constantes a serem convertidas. Usando o
valor para
V = 8,0E-16 litros e N
a
= 6,02214199E+23, todos os parâmetros foram convertidos
e são mostrados na
Tabela 3.
O parâmetro k
trad
foi estimado considerando que a velocidade de tradução do mRNA
para proteína é de 15 amino ácidos por segundo. Sabendo-se que o TrpE tem 520 amino
ácidos, estimou-se que
k
trad
é 0,0288 s
-1
(1.73 min
-1
) para cada ribossomo que traduz o mRNA
obtido da transcrição do gene
trpE. Para probabilidade
pro
P da reação (4.9), usou-se P =
1,0E6.
P representa a quantidade de triptofano presente em todas as proteínas da célula no regime
estacionário
e
μ
é a velocidade específica de crescimento.
Tabela 3: Constantes usadas nas simulações determinística e estocástica.
Nome da
constante
Valor simulação
determinística
ξ
Valor
simulação
estocástica
Nome da
constante
Valor
simulação
determinística
ξ
Valor simulação
estocástica
k
r
+
460 μM
-1
min
-1
0,96
R
0,8μM
385
k
r
-
1,2 min
-1
1,2
O
3,32E-3μM
2
k
i
+
176 μM
-1
min
-1
0,37
K
g
0,2μM
96
k
i
-
720 min
-1
720
C
2,0E-2μM
10
k
t
+
348 μM
-1
min
-1
0,72 OF
ss
1,31E-004μM
2
k
t
-
2,1E4 min
-1
2,1E4 MF
ss
3,27E-4μM
nu*
k
p
10,14min
-1
10,14
E
ss
0,32μM
nu*
k
ρ
20,01min
-1
20,01
T
ss
4,1μM
1975
k
d
0,6 min
-1
0,6
b
0,85 0,85
μ
1,0E-2 min
-1
1,0E-2
n
h
1,2
nu*
K
149,44 min
-1
149,44
τ
m
0,1 min
nu*
G
25 μM min
-1
1,2E4
τ
e
0,66 min
0,66
k
trad
1,73
P
1,0E6
V
8E-16 L
*não usado.
ξ
determinado por Santillan e Mackey (2001a).
76
4.5.2 Resultados
O algoritmo usado para a simulação está descrito na seção 2.3.2. Foi usada a vesão
descrita em Gibson e Bruck (2000) e implementada no programa DIZZI (RAMSEY
et al.,
2005).
Com estes parâmetros foram realizadas várias simulações imitando um experimento de
derepression
. Isto é, uma cultura de E. coli de uma linhagem selvagem foi cultivada em meio
mínimo com triptofano adicionado ao meio. Após algum tempo, as células são lavadas e
centrifugadas e depois incubadas no mesmo meio, porém, sem triptofano. A partir deste
momento, é medida a atividade enzimática da AS ao longo do tempo. Para simular este
experimento, resolveu-se o modelo acima com a condição inicial apresentada na
Tabela 4.
Esta condição representa o início da segunda parte do experimento, onde as bactérias – por
terem estado no meio com excesso de triptofano – não possuem mRNA nem enzimas ativas
da via do triptofano. Como em Santillan e Mackey
(2001b), para efeito de comparação, os
valores no regime estacionário de ambos resultados (experimento e simulação) foram
forçados a terem o mesmo valor. A
Figura 20 mostra a comparação dos resultados obtidos
experimentalmente e através da simulação usando os dados da
Tabela 3. Pode observar por
esta figura que o resultado de ambas as simulações prediz qualitativamente a dinâmica da
atividade enzimática.
Tempo (min)
Atividade da AS normalizada
Figura 20: Comparação da atividade enzimática obtida pelos modelos determinístico (linha
pontilhada) e estocástico (linha cheia) com os dados experimentais (círculos e pontos). Estes
valores estão normalizados, pois os dados experimentais estão em unidades arbritárias. Os
valores da simulação estocástica foram obtidos pela média de 22 simulações.
77
Tabela 4: Valores iniciais para os compostos na simulação estocástica. Estes valores refletem
um experimento de derepression.
O
R
= 2
R
A
= 383
T =
29625
M = 0
M
F
= 0
E =
0
E
T
= 0
E
2T
= 0
M
FR
= 0
Pela simulação estocástica, na média há 25 moléculas de AS ativa na célula no
regime estacionário (dados não mostrados). Isto dá uma atividade final igual a 0.13
μM de
triptofano formado por segundo. Pela
Figura 20 pode-se ver que nas simulações estocástica e
determinísica, a atividade enzimática leva por volta de 6 minutos para ser maior que zero, ou
seja, para começar a sintetizar o Trp. Este período de tempo é porque há bastante trp no meio
e consequentemente não há síntese da enzima AS ou atividade enzimática da AS até que o
triptofano caia até um valor mínimo, neste caso por volta de 1100 molécula na solução
estocástica, veja
Figura 21. Quando o Trp chega a este valor mínimo, os mecanismos de
regulação recrudessem e a síntese de mRNA relativo à AS aumenta e, consequentemente, a
síntese da enzima AS.
Tempo (min)
Moléculas de triptofano
Figura 21: Número de moléculas de triptofano ao longo do tempo relacionado ao experimento
de derepression. Este gráfico mostra os dados da média de 22 simulações. O Trp decresce
rapidamente até um valor mínimo, depois ele aumenta até atingir o regime estacionário.
78
4.6 ANÁLISE DE CONTROLE METABÓLICO NA PRODUÇÃO DE PENICILINA
Como ilustração, serão calculados os coeficientes da ACM para uma pequena rede
metabólica. Na
Figura 22 é exibida a via metabólica com os primeiros passos na produção de
penicilina pela
Penicillium chrysogenum. Theilgaard e Nielsen (1999) construíram um
modelo cinético para esta via e calcularam uma expressão matemática dos coeficientes de
controle de fluxo para cada reação.
Figura 22: Os dois primeiros passos na via de biossíntese de penicilina pela P. chrysogenum.
As linhas tracejadas indicam inibição da reação pelo metabólito onde se origina a linha. Nesta
via, os metabólitos Isopenicilina N e bisACV inibem a enzima ACVS. Abreviações dos
metabólitos, LLD-ACV: (
L-aminoadipil)-L-cisteinil-D-valina; bisACV: bis-(L-aminoadipil)-L-
cysteinil-
D-valina). Enzimas, J1: ACV Sintetase (ACVS); J2: Isopenicilina N sintetase (IPNS);
J3 (TRS_OX) e J4 (TRS_RED): sistema da tioredoxina redutase.
Nesta via metabólica são incluídos a redução e a formação da bisACV a partir do
primeiro intermediário da via LLD-ACV e a inibição da enzima ACVS (J
1
) pelos metabólitos
bisACV e isopenicilina N. O modelo cinético é baseado na cinética do tipo Michaelis-Menten
com inibição não competitiva da ACVS por ambos metabólitos.
Para se fazer ACM no GEnSys, isto é, calcular os coeficientes de controle, o
primeiro passo é construir o modelo dinâmico determinístico da via (seção
4.4):
m = DetSim('Rxn.m'); m = setKinetic(m, 'kin.m')
m =
totalModel: [1x1 struct]
internalModel: [1x1 struct]
lRxn: {'rACV_J1' 'rIPN_J2' 'rOX_J3' 'rRED_J4'}
X0: [8x1 double]
LX: [0x2 double]
A: [0x1 double]
hJ: {4x1 cell}
Neste caso, como visto anteriormente, m é uma estrutura que representa o modelo
dinâmico e é criado a partir dos arquivos de reações
Rxn.m e de cinéticas kin.m.
Cisteína
Valina
Ácido Aminoadipídico
3ATP
3AMP
LLD-
A
CV
Isopenicilina N
NADPH
NADP+
J
1
J
2
J
3
J
4
0,5O
2
H
2
O
bisACV
79
Uma vez construído o modelo dinâmico, usa-se a função
contrlCoef para calcular o
três coeficientes: elasticidade, controle de fluxo e controle de concentração. Esta função tem a
seguinte sintaxe:
[eps, fcc, ccc] = contrlCoef(m)
onde: eps, fcc e ccc são os coeficientes de elasticidade, de controle de fluxo e de controle de
concentração, respectivamente;
m é o modelo dinâmico. Portanto, para determinar todos os
coeficientes, basta executar o comando no M
ATLAB
®
:
[Eps, fcc, ccc] = contrlCoef(m)
Eps =
0.0737 0
0.8228 0
2.0000 0
0 0.9982
fcc =
1.0984 -0.0984 -0.0000 0.0000
1.0984 -0.0984 -0.0000 0.0000
2.6697 -2.6697 1.0000 0.0000
2.6684 -2.6684 0.9995 0.0000
ccc =
1.3349 -1.3349 -0.0000 0.0000
2.6733 -2.6733 1.0013 -1.0019
Para efeito de visualização, os FCCs deste exemplo estão reproduzidos na
Tabela 5.
Cada coluna
j
representa a variação da atividade enzimática da ésimaj
enzima e cada linha
o
ésimok
fluxo (
k
J ).
Tabela 5: Coeficiente de controle de fluxo para as quatro enzimas da rede mostrada na Figura
22.
j
k
J
j
C
1 2 3 4
J
1
1,0984 -0,0984 0,0000 0,0000
J
2
1,0984 -0,0984 0,0000 0,0000
J
3
2,6697 -2,6697 1,0000 0,0000
J
k
J
4
2,6684 -2,6684 0,9995 0,0000
Estes coeficientes só podem ser comparados entre si, isto é, não podem ser
comparados com coeficientes de outras vias. Uma pequena pertubação na atividade da enzima
ACVS (j = 1) influencia os fluxos J
3
e J
4
com maior intensidade que os outros dois fluxos
(coluna 1 da
Tabela 5). Pela coluna 4, percebe-se que a enzima TRS_RED (j = 4) não
influencia (controla) qualquer fluxo nesta rede.
80
4.7 ANÁLISE DE FLUXO METABÓLICO
Na análise de fluxo metabólico, os fluxos não medidos são calculados, usando a
equação
(2.70), a partir dos fluxos medidos experimentalmente; estes, geralmente, são os
fluxos dos metabólitos externos. Para criar um módelo para a análise de fluxo metabólico
deve-se seguir sintaxe mostrada no
Quadro 14 (estes dados devem ser gravados num arquivo).
Quadro 14: Sintaxe para a criação de um modelo para a AFM.
r_p
1
= v_1
r_p
2
= v_2
...
r_p
q
= v_p
%
%n reações envolvendo m metabólitos, em LRB
%
r_1: reação 1 em LRB
r_2: reação 2 em LRB
...
r_n: reação N em LRB
No arquivo acima,
p
i
, com qi ,,2,1 K
=
, é um subconjunto de
{}
n,,2,1 K onde q é o
número de fluxos medidos e r_
p
i
é o nome destes fluxos (reações). Além disso, as n reações
(r_1, r_2, ..., r_n) da rede devem ser fornecidas e escritas em LRB.
Como exemplo será usada a rede mostrada na
Figura 23, página 82, e os dados
experimentais estão na
Tabela 11, página 96; ambos se encontram na seção 4.8. O modelo de
AFM, com os dados experimentais e as reações, é mostrado abaixo (arquivo H2MFA_EX.m):
%fluxos medidos
v1 = 3.94
v2 = 4.65
v15 = 3.86
v19 = 0.42
v20 = 0.66
v6 = 7.24
v10 = 1.3
%reações em LRB
v1: Glicose + 2ATP -> 2ADP_x + 2GDH-3-P
v2: Glicerol + NAD+_x + ATP -> NADH + ADP_x + GDH-3-P
v3: GDH-3-P + 2ADP_x + NAD+_x -> PIR + 2ATP + NADH
v4: PIR + Fdoxi + CoA -> Acetil-CoA + Fdred
v5: Fdoxi + NADH <-> Fdred + NAD+_x
v6: Fdred -> Fdoxi + H2
v7: PIR + NADH <-> NAD+_x + Lactato
v8: 2Acetil-CoA -> CoA + AcAcetil-CoA
v9: Acetil-CoA + ADP_x <-> ATP + CoA + Acetato
v10: Acetil-CoA + 2NADH -> CoA + 2NAD+_x + Etanol
v11: Acetato + AcAcetil-CoA -> Acetil-CoA + Acetone
v12: Butirato + AcAcetil-CoA -> Butiril-CoA + Acetone
v13: AcAcetil-CoA + 2NADH -> Butiril-CoA + 2NAD+_x
v14: Butiril-CoA + ADP_x <-> CoA + ATP + Butirato
v15: Butiril-CoA + 2NADH -> CoA + 2NAD+_x + Butanol
81
v16: 0.6667Glicose + 0.5833NADH + 9.9ATP -> Biomassa
v17: ATP -> ADP_x
v18: Lactato -> LactatoExt
v19:Acetato -> AcetatoExt
v20:Butirato -> ButiratoExt
O comando a seguir cria uma estrutura representando um módulo de AFM:
modelMFA = mfa('H2MFA_EX.m')
modelMFA =
st: [13x20 double]
lRxn: {1x20 cell}
lComp: {1x13 cell}
vMeasFlux: [7x1 double]
iMeasFlux: [1 2 6 10 15 19 20]
iCalcFlux: [3 4 5 7 8 9 11 12 13 14 16 17 18]
A função mfa retornará a estrutura contendo os seguintes campos:
st: matriz estequiométrica dos metabólitos internos;
lRxn e lComp são, como já descritas, as listas dos nomes das reações (fluxos) e dos
nomes dos metabólitos, respectivamente.
vMeasFlux: vetor coluna contendo os valores dos q fluxos medidos;
iMeasFlux: vetor linha contendo os índices dos q fluxos medidos;
iCalcFlux: vetor linha contendo os índices dos nq fluxos calculados;
No exemplo acima existem 7 fluxos medidos. Como há 20 fluxos, então 13 serão
calculados (não medidos). Para calcular os fluxos não medidos é necessário apenas executar a
função:
solvemfa(modelMFA, pcs). Os fluxos calculados são mostrados na Tabela 6 e a norma
do resíduo é de 3.77E–014.
Tabela 6: Resultado dos fluxos calculados usando os dados da Tabela 11 como fluxos
medidos.
v
3
v
4
v
5
v
7
v
8
v
9
v
11
v
12
v
13
v
14
v
16
v
17
v
18
12,53 11,37 -4,13 1,16 4,82 0,63 0,21 0,09 4,52 0,75 1,34 0,61 1,16
Para mais detalhes dos outros valores calculados, recomenda-se Mendes (2006).
Cabe lembrar que, na AFM, todas as reações são consideradas reversíveis; isto significa que,
mesmo escrevendo uma reação como irreversível, o fluxo calculado para esta reação pode dar
um valor negativo.
4.8 MODELAGEM E SIMULAÇÃO DA PRODUÇÃO DE BIOHIDROGÊNIO
Nesta seção será descrita e estudada uma rede metabólica da bactéria Clostridium
acetobutylicum
. Os estudos desta rede serão efetuados através da análise de balanço de fluxo e
82
por modos elementares, ambos com vista a produção de hidrogênio (H
2
). Esta rede será
aproveitada como estudo de caso para descrever, no GEnSys, os dois métodos mencionados
anteriormente.
4.8.1 Rede Metabólica da C. acetobutylicum
A rede metabólica para este organismo foi construída a partir de dados da literatura
(SHINTO
et al., 2007; JONES et al., 1986) e possui 20 reações e 25 metabólitos (11 externos
e 14 internos), ver
Figura 23. Foram considerados dois substratos como fonte de carbono:
glicose e glicerol.
Figura 23: Rede bioquímica utilizada pela C. acetobutylicum para a conversão de glicose e
glicerol em hidrogênio, ácidos (acetato e butirato) e solventes (butanol e acetona) em
condições anaeróbicas. O hidrogênio é produzido pela reação v
6
. São 20 reações e 25
metabólitos; destes, 11 são considerados metabólitos internos e 14 externos. Há duas reações
auxiliares, v
16
e v
17
que correspondem, respectivamente, a velocidade de crescimento celular e
a ATPase. O número 2 entre parênteses nas reações v
1
e v
8
representa a estequiometria em
relação ao metabólito e a reação próxima a ele. As reações v
11
e v
12
são catalisadas pela mesma
enzima: CoA transferase.
v
16
Glicose
GlicerolGDH-3-P
NADH NAD+
ATPADP
2ATP
2ADP
(2)
PIR
Acetil-CoA
FdOx
FdRed
NAD+
NADH
H
2
CoA
Lactato
NADHNAD+
AcAcetil-CoA
(2)
CoA
2Glicose
1,75NADH
29,7ATP
ADP
ATP
Acetato
ADP
ATP
CoA
Etanol
2NAD+
2NADH
Acetona
Butirato
Butyril-CoA
2NADH
2NAD+
Butanol
2NAD+2NADHATP ADP
CoA
CoA
LactatoExt
AcetatoExt
ButiratoExt
v
1
v
2
v
3
v
4
v
5
v
6
v
7
v
8
v
9
v
10
v
11
v
12
v
13
v
14
v
15
CoA
v
17
v
18
v
19
v
20
3Biomassa
83
Muitas reações nesta rede foram agrupadas como uma única reação. Estes grupos
formam um conjunto de reações lineares – sem ramificação – que, no regime estacionário,
possuem os mesmos fluxos; assim, reduz-se o tamanho da rede sem perda de informação.
Como exemplo, a glicólise não tem todas as reações explícitas nesta rede.
Os principais produtos considerados são os solventes (butanol, acetona e etanol),
os ácidos (acetato, butirato e lactato) e o hidrogênio molecular H
2
. Além destes, a biomassa
também foi considerada como saída e modelada como uma reação. As 20 reações foram
nomeadas por
2021
v,,v,v K e seus significados estão na Tabela 7. As reações v
1
e v
2
são,
respectivamente, de entrada da glicose e do glicerol.
Tabela 7: Nomes das enzimas (ou fluxos) da rede metabólica da Figura 23. Algumas reações,
sequência linear, foram agrupadas formando uma única reação. É o caso da glicólise, por
exemplo.
Nome Nome da enzima (fluxo)
v
1
Velocidade da glicólise
v
2
Glicerol desidrogenase
v
3
Velocidade de produçao de piruvato
v
4
Piruvato-ferredoxina oxidoredutase
v
5
NADH-ferredoxina oxidoredutase;
v
6
Hidrogenase
v
7
Velocidade de produção de lactato
v
8
Tiolase
v
9
Fosfotransacetilase
v
10
Acetaldeído desidrogenase
v
11
CoA transferease 1
v
12
CoA transferease 2
v
13
Butiril-CoA desidrogenase
v
14
Fosfotransbutirilase
v
15
Butiraldeído desidrogenase
v
16
Velocidade de crescimento celular
v
17
ATPase
v
18
Transporte de lactato
v
19
Transporte de acetato
v
20
Transporte de butirato
84
Os nomes e significados dos 25 metabólitos encontram-se na
Tabela 8. Ali não estão
listados os metabólitos cujos nomes estão completos, como etanol, butirato entre outros. Em
algumas análises realizadas neste trabalho, os cofatores (NAD+, NADH, ATP e ADP) e a
CoA foram considerados externos. Isto significa que eles estão disponíveis em quantidades
necessárias para ocorrer a reação na qual participam como substratos.
Tabela 8: Significados dos nomes dos metabólitos da rede da Figura 23.
Metabólito Significado
ATP Adenosina trifosfato
ADP Adenosina difosfato
GDH-3-P Gliciraldeído-3-fosfato
NAD+ Nicotinamida adenina dinucleotídeo
NADH Nicotinamida adenina dinucleotídeo, forma reduzida
PIR Piruvato
FdOxi Ferredoxina oxidada
CoA Coenzima A
FdRed Ferredoxina reduzida
H2 Hidrogênio molecular
AcAcetil-CoA Aceto acetil coenzima A
LactatoExt Lactato externo
AcetatoExt Acetato externo
ButiratoExt Butirato externo
A velocidade de crescimento celular para a
C. acetobutilycum foi a mesma usada por
Papoutsakis (1984):
3Biomassa 29,7ATP 1,75NADH 2Glicose :v
16
+
+
De acordo com o mesmo autor, a glicólise nesta bactéria, durante a fase de
crescimento exponencial e síntese de acetato, produz uma quantidade excessiva de ATP. Isto
implica que um sistema ativo de ATPase deve operar durante o crescimento
(PAPOUTSAKIS, 1984). Sendo assim, a seguinte reação foi adicionada ao modelo:
ADP ATP :v
17
.
4.8.2 Modos Elementares da Rede Metabólica para a Produção de Biohidrogênio
Nesta seção será apresentado o módulo sobre modos elementares. Para tanto, será
usada a rede metabólica da
Figura 23 da Clostridium acetobutylicum como de estudo de caso.
Esta bactéria é muito conhecida e estudada como produtora de solventes e hidrogênio.
85
Para se criar um objeto deste módulo, após ter definido a rede metabólica, entra-se
com o comando (as reações, escritas em LRB, estão gravadas no arquivo
H2GlucoseGlicerol.m):
model = elemmode('H2GlucoseGlicerol.m')
model =
OverallSt: [14x29 double]
intModel: [1x1 struct]
extModel: [1x1 struct]
metatoolStruct: [1x1 struct]
ems: [20x29 double]
Uma estrutura é criada com os seguintes campos:
OverallSt: matriz estequiométrica q
p
×
das reações globais, onde p é o número de
metabólitos externos e
q é o número de modos elementares. Estas reações envolvem
apenas os metabólitos externos.
intModel: modelo dos metabólitos internos, visto na seção 4.3.5;
extModel: modelo dos metabólitos externos, visto na seção 4.3.3;
metatoolStruct: é a estrutura criada pela toolbox metatool (VON KAMP e SCHUSTER,
2006);
ems: matriz
qn ×
dos modos elementares, onde n é o número de reações da rede e q o
número de modos elementares. Cada coluna representa um modo elementar e cada
elemento da coluna é a estequiometria da reação que faz parte daquele modo.
A
Tabela 9 mostra os 29 modos elementares calculados para a rede metabólica da
Figura 23. A coluna da esquerda exibe o número do modo e a coluna da direita todos os
modos elementares com as suas respectivas reações e estequiometria. Todos os modos são
irreversíveis (um modo irreversível é aquele que possui, no mínimo, uma reação irreversível,
caso contrário é considarado reversível). Os modos 8 e 9 são compostos de apenas uma
reação, pois estas reações têm como substratos e produtos apenas compostos externos. Estes
modos são obtidos através do comando
dispElmo(model).
86
Tabela 9: Os 29 modos elementares correspondentes à rede da Figura 23. Todos os modos são
irreversíveis. Os coeficientes negativos que precedem algumas reações significam que o
sentido do modo é o contrário daquele no qual a reação foi escrita. Em negrito encontram-se os
modos de produção de hidrogênio. ME: modo elementar.
ME Reações de cada modo elementar
1
{v1} {2*v3} {2*v4} {2*v6} {2*v10}
2
{v5} {v6}
3 {v2} {v3} {v7} {v18}
4 {v2} {v3} {v4} {-v5} {v10}
5 {2*v2} {2*v3} {2*v4} {-2*v5} {v8} {v9} {v11}
6 {2*v2} {2*v3} {2*v4} {-2*v5} {v8} {v12} {v14}
7 {2*v2} {2*v3} {2*v4} {-2*v5} {v8} {v13} {v15}
8 {v16}
9 {v17}
10 {v2} {v3} {v4} {-v5} {v9} {v19}
11 {2*v2} {2*v3} {2*v4} {-2*v5} {v8} {v13} {v14}
{v20}
12 {v1} {2*v3} {2*v7} {2*v18}
13 {v1} {2*v3} {2*v4} {-2*v5} {2*v10}
14 {v1} {2*v3} {2*v4} {-2*v5} {2*v9} {2*v19}
15 {v1} {2*v3} {2*v4} {-2*v5} {v8} {v9} {v11}
16 {v1} {2*v3} {2*v4} {-2*v5} {v8} {v12} {v14}
17 {v1} {2*v3} {2*v4} {-2*v5} {v8} {v13} {v15}
18 {v1} {2*v3} {2*v4} {-2*v5} {v8} {v13} {v14} {v20}
19
{v2} {v3} {v4} {v6} {v10}
20
{v1} {2*v3} {2*v4} {2*v6} {2*v9} {2*v19}
21
{v2} {v3} {v4} {v6} {v9} {v19}
22
{v1} {2*v3} {2*v4} {2*v6} {v8} {v9} {v11}
23
{v1} {2*v3} {2*v4} {2*v6} {v8} {v12} {v14}
24
{v1} {2*v3} {2*v4} {2*v6} {v8} {v13} {v15}
25
{2*v2} {2*v3} {2*v4} {2*v6} {v8} {v9} {v11}
26
{2*v2} {2*v3} {2*v4} {2*v6} {v8} {v12} {v14}
27
{2*v2} {2*v3} {2*v4} {2*v6} {v8} {v13} {v15}
28
{v1} {2*v3} {2*v4} {2*v6} {v8} {v13} {v14} {v20}
29
{2*v2} {2*v3} {2*v4} {2*v6} {v8} {v13} {v14} {v20}
87
Como visto na
Tabela 9, os modos 1, 2 e de 19 a 29 são as possíveis forma de
produção de H
2
. O modo 2 é apenas um ciclo que não está ligado, de alguma forma, a um dos
2 substratos externos. Na
Figura 24 são apresentados, em forma gráfica, os modos
elementares de produção de H
2
a partir de glicerol. No total são 13 modos de produção de H
2
,
um a partir do NADH, seis a partir da glicose e seis do glicerol. A diferença entre estes dois
últimos grupos é apenas a troca da reação v
1
pela v
2
.
Figura 24: Esquema gráfico dos modos elementares de produção de H
2
a partir do glicerol,
considerando a
Figura 23. ME: modo elementar.
O comando
dispOverallRxn(model) exibe todas as reações globais obtidas a partir
dos modos elementares. Os substratos e produtos destas reações são formados apenas pelos
metabólitos externos. A matriz estequiométrica destas reações é obtida multiplicando-se a
matriz dos metabólitos externos pela dos modos elementares. A
Tabela 10 exibe todas as
reações globais obtidas pelo comando
dispOverallRxn(model).
14
15
1 2
3
4
5 6
7
8
9
10
11
12
13
14
15
18
19
20
ME 1
12
3
4
56
7
8
9
10
11
12
13
14
15
18
19
20
ME 20
1 2
3
4
5 6
7
8
9
10
11
12
13
14
15
18
19
20
ME 22
1 2
3
4
5 6
7
8
9
10
11
12
13
14
15
18
19
20
ME 23
12
3
4
56
7
8
9
10
11
12
13
18
19
20
ME 24
1 2
3
4
5 6
7
8
9
10
11
12
13
14
15
18
19
20
ME 28
88
Tabela 10: Reações globais relacionadas aos 29 modos elementares. O sufixo _x em alguns
metabólitos significa que eles foram tratados como metabólitos externos.
# Reções globais
1
Glicose + 2*ADP_x + 2*NADH_x
2*ATP_x + 2*NAD+_x + 2*H2 + 2*Etanol
2
NADH_x
NAD+_x + H2
3
ADP_x + Glicerol + NAD+_x
ATP_x + NADH_x + LactatoExt
4
ADP_x + Glicerol + NAD+_x
ATP_x + NADH_x + Etanol
5
3*ADP_x + 2*Glicerol + 6*NAD+_x
3*ATP_x + 6*NADH_x + Acetone
6
3*ADP_x + 2*Glicerol + 6*NAD+_x
3*ATP_x + 6*NADH_x + Acetone
7
2*ADP_x + 2*Glicerol + 2*NAD+_x
2*ATP_x + 2*NADH_x + Butanol
8
2*Glicose + 29.7*ATP_x + 1.75*NADH_x
3*Biomassa
9 ATP_x = ADP_x
10
2*ADP_x + Glicerol + 3*NAD+_x
2*ATP_x + 3*NADH_x + AcetatoEx
11
3*ADP_x + 2*Glicerol + 4*NAD+_x
3*ATP_x + 4*NADH_x + ButiratoEx
12
Glicose + 2*ADP_x
2*ATP_x + 2*LactatoExt
13
Glicose + 2*ADP_x
2*ATP_x + 2*Etanol
14
Glicose + 4*ADP_x + 4*NAD+_x
4*ATP_x + 4*NADH_x + 2*AcetatoEx
15
Glicose + 3*ADP_x + 4*NAD+_x
3*ATP_x + 4*NADH_x + Acetone
16
Glicose + 3*ADP_x + 4*NAD+_x
3*ATP_x + 4*NADH_x + Acetone
17
Glicose + 2*ADP_x
2*ATP_x + Butanol
18
Glicose + 3*ADP_x + 2*NAD+_x
3*ATP_x + 2*NADH_x + ButiratoEx
19 ADP_x + Glicerol = ATP_x + H2 + Etanol
20
Glicose + 4*ADP_x + 2*NAD+_x
4*ATP_x + 2*NADH_x + 2*H2 + 2*AcetatoEx
21
2*ADP_x + Glicerol + 2*NAD+_x
2*ATP_x + 2*NADH_x + H2 + AcetatoEx
22
Glicose + 3*ADP_x + 2*NAD+_x
3*ATP_x + 2*NADH_x + 2*H2 + Acetone
23
Glicose + 3*ADP_x + 2*NAD+_x
3*ATP_x + 2*NADH_x + 2*H2 + Acetone
24 Glicose + 2*ADP_x + 2*NADH_x = 2*ATP_x + 2*NAD+_x + 2*H2 + Butanol
25
3*ADP_x + 2*Glicerol + 4*NAD+_x
3*ATP_x + 4*NADH_x + 2*H2 + Acetone
26
3*ADP_x + 2*Glicerol + 4*NAD+_x
3*ATP_x + 4*NADH_x + 2*H2 + Acetone
27
2*ADP_x + 2*Glicerol
2*ATP_x + 2*H2 + Butanol
28
Glicose + 3*ADP_x
3*ATP_x + 2*H2 + ButiratoEx
29
3*ADP_x + 2*Glicerol + 2*NAD+_x
3*ATP_x + 2*NADH_x + 2*H2 + ButiratoEx
89
É possível associar um rendimento a cada modo elementar calculado para uma via.
Este rendimento, que é associado a um par substrato/produto – ambos externos –, mede a
quantidade em mol de produto produzido por mol de substrato.
Pode-se, no GEnSys, calcular o rendimento – associado a um modo elementar – para
qualquer par substrato/produto com comando
yields(model, substrato, produto)
Rendimento Glicose/H2
Os seis modos vistos na Figura 24 tem um rendimento de dois mol de H
2
por mol de
glicose.
yields(model,'Glicose','H2')
Yield(Glicose, H2)
Elmo yield
1 2.000
20 2.000
22 2.000
23 2.000
24 2.000
28 2.000
Rendimento Glicerol/H2
Há um rendimento de 1:1 quando se considera o glicerol como fonte de carbono em
cada um dos seis modos de produção do H
2
.
yields(model,'Glicerol','H2')
Yield(Glicerol, H2)
Elmo yield
19 1.000
21 1.000
25 1.000
26 1.000
27 1.000
29 1.000
Rendimento Glicose/ATP_x
Os modos 14 e 20 são os modos que têm os maiores rendimentos de ATP por
molécula de glicose. Observar que estes são os modos de produção do acetato (ácido). Os
modos 1 (etanol), 12 (lactato), 13 (etanol), 17 (butanol) e 24 (butano) rendem o menor
número de moléculas de ATP por molécula de glicose e estão associados à produção de
solventes. A produção de ácidos é maior durante o crescimento exponencial da bactéria. Isso
justifica uma maior produção de ATP nesta fase.
90
yields(model,'Glicose','ATP_x')
Yield(Glicose, ATP_x)
Elmo yield
1 2.000
12 2.000
13 2.000
14 4.000
15 3.000
16 3.000
17 2.000
18 3.000
20 4.000
22 3.000
23 3.000
24 2.000
28 3.000
Rendimento Glicerol/ATP_x
Já o rendimeno de ATP por molécula de glicerol é menor em relação ao da glicose.
Os maiores rendimentos de ATP são através dos modos 10 (acetato) e 21 (acetato e H
2
). A
diferença entre ambos é que o modo 21 tem a reação v
6
(reação do H
2
) e o modo 10 a v
5
. Se a
reação v
5
for eliminada, ainda assim, a bactéria poderia crescer normalmente produzindo a
mesma quantidade de ATP, porém produzindo H
2
.
yields(model,'Glicerol','ATP_x')
Yield(Glicerol, ATP_x)
Elmo yield
3 1.000
4 1.000
5 1.500
6 1.500
7 1.000
10 2.000
11 1.500
19 1.000
21 2.000
25 1.500
26 1.500
27 1.000
29 1.500
4.8.3 ABF da Produção de Biohidrogênio da C. acetobutylicum
Nesta seção será realizada a análise de balanço de fluxo para a C. acetobutylicum. A
análise de balanço de fluxo foi realizada considerando-se dois substratos: glicose e glicerol.
Esta análise é realizada, como foi visto, através da otimização (maximização ou minimização)
de alguns fluxos e restrição de outros.
91
A sintaxe geral para a criação de um modelo para ABF é mostrada no
Quadro 15;
onde
{}
k
p,,p,p
21
K e
{}
s
q,,q,q
21
K são subconjuntos do conjunto
{}
n,,3,2,1 K e não são,
necessariamente, disjuntos.
Quadro 15: Sintaxe para a construção de um modelo para ABF.
maxZ or minZ (minimizar: minZ; maximizar: maxZ)
lista de metabólitos
MIN
r_p
1
= vmin_1
r_p
2
= vmin_2
...
r_p
k
= vmin_k
MAX
r_q
1
= vmax_1
r_q
2
= vmax_2
...
r_q
s
= vmax_s
%n network reactions
r_1: reaction
r_2: reaction
...
r_n: reaction
O bloco maxZ (ou minZ) denota o objetivo da otimização (maximizar ou minimizar
a função objetivo Z) e quais os metabólitos que serão otimizados (lista dos metabólitos). Os
coeficientes para estes metabólitos são formados pela linha da matriz estequiométrica
relacionada aos metabólitos ali listados. O bloco MIN ou MAX contém os valores dos limites
inferiores (LB) ou superiores (UB), respectivamente, para os fluxos especificados nas reações
(velocidades mínimas e máximas). As reações são listadas no último bloco e devem ser
escritas em LRB; é destas reações que será criada a matriz estequiométrica. Os blocos de
dados: maxZ (ou minZ), MIN e MAX devem aparecer nesta ordem. maxZ (ou minZ), um
destes, e as reações são obrigatórias, os demais são opcionais. Caso um fluxo, por exemplo
r
i
,
não aparecer em um dos blocos MIN ou MAX, seus limites, por
default, serão assim
determinados:
LB(i): , se r
i
for uma reação reversível;
LB(i): 0, se r
i
for uma reação irreversível;
UB(i): , tanto se r
i
for uma reação reversível ou irreversível.
A seguir, é apresentado um modelo para análise de balanço de fluxo usando a rede
metabólica da
C. acetobutylicum. O modelo, com todas as informações necessárias, foi
gravado no arquivo
H2CAcetobutylicum.m. Digitando o seguinte comando no MATLAB
®
aparece o conteúdo do arquivo:
92
type 'H2CAcetobutylicum.m'
maxZ
Biomassa
min
v2 = 0
max
v1 = 8.72
v2 = 0
%vGlyc
v1: Glicose + 2ATP -> 2ADP_x + 2GDH-3-P
%vGlicerol
v2: Glicerol + NAD+_x + ATP -> NADH + ADP_x + GDH-3-P
%vPIR
v3: GDH-3-P + 2ADP_x + NAD+_x -> PIR + 2ATP + NADH
%vPDH
v4: PIR + Fdoxi + CoA -> Acetil-CoA + Fdred
%vNADH
v5: Fdoxi + NADH <-> Fdred + NAD+_x
%vHYD
v6: Fdred -> Fdoxi + H2
%vLAC
v7: PIR + NADH <-> NAD+_x + Lactato
%vTHI
v8: 2Acetil-CoA -> CoA + AcAcetil-CoA
%vPTA
v9: Acetil-CoA + ADP_x <-> ATP + CoA + Acetato
%vADH_Ethanol
v10: Acetil-CoA + 2NADH -> CoA + 2NAD+_x + Etanol
%vCOAT1_Acetone
v11: Acetato + AcAcetil-CoA -> Acetil-CoA + Acetone
%vCOAT2_Acetone
v12: Butirato + AcAcetil-CoA -> Butiril-CoA + Acetone
%vHCOA
v13: AcAcetil-CoA + 2NADH -> Butiril-CoA + 2NAD+_x
%vPTB
v14: Butiril-CoA + ADP_x <-> CoA + ATP + Butirato
%vBADH_Butanol
v15: Butiril-CoA + 2NADH -> CoA + 2NAD+_x + Butanol
%vCrescimento
v16: 0.6667Glicose + 0.5833NADH + 9.9ATP -> Biomassa
%vATPase
v17 : ATP -> ADP_x
%Reações de transporte do interior da bactéria para o ambiente
v18: Lactato -> LactatoExt
v19: Acetato -> AcetatoExt
v20: Butirato -> ButiratoExt
A
Figura 25 exibe a equação (2.30), 0Nv
=
, para as reações mostradas acima. Esta
equação é uma restrição de balanço de fluxo para esta análise.
N é a matriz estequiométrica
interna com 13 linhas (uma para cada metabólito interno) e 20 reações, onde as reações
possuem os nomes
v20,v2,v1, K .
93
Figura 25: Restrição de balanço de fluxo para a rede da C. acetobutylicum mostrada da Figura
23. Esta figura é um exemplo da equação
(2.30): 0Nv
=
.
No modelo acima, deseja-se maximizar a biomassa com velocidade máxima de
consumo de glicose (v
1
) de 8.72 mmol h
-1
gdw
-1
(gdw: grama de massa celular seca).
Maximizar a biomassa corresponde a simular o comportamento da bactéria, supondo que o
objetivo dela é sempre maximizar o seu crescimento. A velocidade de consumo do glicerol é
zero. As velocidades mínimas para as demais reações é zero para as irreversíveis e -
para as
reversíveis. Para as velocidades máximas é atribuído
, independentemente da reversibilidade
da reação.
A função
fba deve ser chamada para poder criar um modelo FBA:
FBAModel = fba('H2CAcetobutylicum.m')
FBAModel =
intModel: [1x1 struct]
beq: [13x1 double]
c: [0 0 0 0 0 -1 0 0 0 0 0 0 0 0 0 -1 0 0 0 0]
lb: [20x1 double]
ub: [20x1 double]
minMax: -1
A função fba retornará a estrutura FBAmodel contendo os seguintes campos:
intModel: estrutura que contém o modelo interno (apenas os metabólitos internos). Os
significados dos campos desta estrutura já foram definidos anteriormente. Um dos campos
é a matriz
st, matriz estequiométrica (m mebabólitos por n reações).
beq: vetor m×1 com todos elementos iguais a zero. Reservado para uso futuro, como
recurso para adicionar fluxos com valores conhecidos;
-2 -1 2 0 0 0 0 0 1 0 0 0 0 1 0 -9,9 -1 0 0 0
2 1 -1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 1 1 0 -1 0 -1 0 0 -2 0 0 -2 0 -2 -0,58 0 0 0 0
0 0 1 -1 0 0 -1 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 -1 -1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 -1 0 0 0 1 1 1 0 0 0 1 1 0 0 0 0 0
0 0 0 1 0 0 0 -2 -1 -1 1 0 0 0 0 0 0 0 0 0
0 0 0 1 1 -1 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 -1 0 0
0 0 0 0 0 0 0 1 0 0 -1 -1 -1 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 1 0 -1 0 0 0 0 0 0 0 -1 0
0 0 0 0 0 0 0 0 0 0 0 -1 0 1 0 0 0 0 0 -1
0 0 0 0 0 0 0 0 0 0 0 1 1 -1 -1 0 0 0 0 0
v1
v2
v3
v4
v5
v6
v7
v8
v9
v10
v11
v12
v13
v14
v15
v16
v17
v18
v19
v20
=
0
94
c: vetor n×1 contendo os n coeficientes da função objetivo. É determinado pela soma das
linhas correspondentes aos metabólitos a serem otimizados;
lb: vetor n×1 onde são armazenados os limites inferiores das velocidades dos fluxos
(velocidade mínima);
ub: vetor n×1 onde são armazenados os limites superiores das velocidades dos fluxos
(velocidade máxima);
minMax: tipo do objetivo: -1 para maximizar e 1 para minimizar.
Para determinar a distribuição de fluxos com as restrições impostas ao modelo, usa-
se o comando:
sol = solveFBA(FBAModel)
sol =
f: 3.5232
x: [20x1 double]
y: [14x1 double]
w: [20x1 double]
stat: 1
solver: 'glpk'
time: 0
A solução encontra-se no campo x, vetor coluna de tamanho n (20 neste caso), da
estrutura
sol (solução). O campo f é o valor da função objetivo e vale 3.5232 mmol/gdw
-1
h
-1
, o
mesmo valor de v
16
. Para mostrar a solução usa-se o comando (exibe os nomes dos fluxos
seguidos dos valores calculados):
printFluxVector(FBAModel.intModel.lRxn, sol.x). O
resultado encontra-se na parte esquerda da
Figura 26.
Figura 26: Distribuição de fluxo da ABF ao se maximizar a biomassa com velocidade de
consumo de glicose 8,72 mmol/gdw
-1
h
-1
.
8,7 0
17,44
17,44
15,4
0
0
17,44
0
0
0
0
00
0
17,44
0
3,52
0
v1 = 8.72
v2 = 0
v3 = 17.44
v4 = 17.44
v5 = 15.3849
v6 = 32.8249
v7 = 0
v8 = 0
v9 = 17.44
v10 = 3.2e-006
v11 = 0
v12 = 0
v13 = 0
v14 = 0
v15 = 0
v16 = 3.5232
v17 = 0
v18 = 0
v19 = 17.44
v20 = 0
32,82
95
O resultado acima mostra que a velocidade de produção de hidrogênio (v
6
) é de
32,8249 mmol/gdw
-1
h
-1
, a de consumo de glicose é 8,72 mmol/gdw
-1
h
-1
(v
1
). Assim o
rendimento de H
2
é de 3,7643 (32,8249 mmol/gdw
-1
h
-1
/8,72 mmol/gdw
-1
h
-1
) mol de H
2
por
mol de glicose consumida. Além do hidrogênio, é produzido apenas o acetato (v
19
= 17,44
mmol/gdw
-1
h
-1
). Este resultado é condizente com dados experimentais; o hidrogênio é
produzido durante a fase de produção de ácidos que também é a fase de crescimento
exponencial da
C. acetobutylicum (JONES e WOODS, 1986).
A próxima simulação é de maximização do hidrogênio. Para tanto, deve-se mudar a
biomassa para H2 no bloco maxZ do arquivo:
maxZ
H2
min
v2 = 0
max
v1 = 8.72
v2 = 0
Para este novo objetivo, deve-se executar o modelo novamente (são três comandos):
m = fba('H2CAcetobutylicum.m');
s = solveFBA(m);
printFluxVector (m.intModel.lRxn, s.x).
O resultado é apresentado na
Figura 27.
Figura 27: Distribuição de fluxo da ABF ao se maximizar o H
2
com velocidade máxima de
consumo de glicose 8,7 mmol/gdw
-1
h
-1
.
v1 = 8.72
v2 = 0
v3 = 17.44
v4 = 17.44
v5 = 17.44
v6 = 34.88
v7 = 0
v8 = 8.72
v9 = 0
v10 = 0
v11 = 0
v12 = 8.72
v13 = 0
v14 = 8.72
v15 = 0
v16 = 0
v17 = 26.16
v18 = 0
v19 = 0
v20 = 0
8,7 0
17,4
17,44
17,44 34,88
0
8,72
0
0
7,72
0
8,72 0
0
0
0
0
26,16
0
96
O rendimento de H
2
nesta simulação é 4 mol H
2
/mol glicose (34,88/8,72). Este é o
rendimento teórico máximo de produção de H
2
por molécula de glicose. Quando se utiliza
glicerol como único substrato, este rendimento máximo é de 3 mol H
2
/mol glicerol (dados não
mostrados) quando se maximiza apenas o H
2
. Mas, como pode ser visto acima, a velocidade
de crescimento, v
16
, é zero. Isto quer dizer que este rendimento de H
2
não poderá ser atingido
experimentalmente. Manish
et al. (2007) chegaram a este mesmo resultado ao maximizar a
produção de H
2
na análise de balanço de fluxo de uma rede metabólica da E. coli.
Foi realizada outra análise de balanço de fluxo usando uma velocidade máxima de
3,94 mmol/gdw
-1
h
-1
e 4,65 mmol/gdw
-1
h
-1
para as velocidades de consumo de glicose e
glicerol, respectivamente. Estes valores, v
1
e v
2
, foram determinados experimentalmente e
estão na
Tabela 11.
Tabela 11: Dados experimentais relacionados à fase solventogênica (VASCONCELOS et al.,
1994).
Fluxos medidos (mmol h
-1
gdw
-1
)
Fonte de carbono Produtos
Glicose
(v
1
)
Glicerol
(v
2
)
Etanol
(v
10
)
Butanol
(v
15
)
Acetona
(v
11
e v
12
)
Acetato
(v
19
)
Butirato
(v
20
)
H2
(v
6
)
3,94 4,65 1,3 3,86 0 0,42 0,66 7,24
Na
Figura 28 são apresentados os resultados para as três simulações distintas de
maximização de:
biomassa;
biomassa e H
2
;
biomassa, butirato e acetato;
butirato e acetato.
Cada grupo de barras na
Figura 28 representa uma velocidade e cada barra de um
grupo uma das simulações descritas acima. O fluxo de produção de acetona é representado
por v11v12, uma vez que ambos os fluxos v11 e v12 produzem este metabólito.
97
v1 v2 v6 v10 v11v12 v15 v1 6 v1 9 v20
0
5
10
15
20
25
30
Rea
ç
ões
Fluxo mmol/(gdw)
max. biomassa
max. biomassa + H
2
max. biomassa + butirato + acetato
max. butirato + acetato
Figura 28: Cada grupo de barras representa um fluxo: v1 e v2 correspondem aos fluxos de
consumo de glicose e glicerol, respectivamente; v6, v10, v11v12, v15, v16, v19 e v20
correspondem aos fluxos de produção de H
2
, etanol, acetona, butanol, biomassa, acetato e
butirato. Em todas as maximizações, o valor máximo de consumo de glicose (v1) e de glicerol
(v2) é de 3,94 mmol/gdw
-1
h
-1
e de 4,65 mmol/gdw
-1
h
-1
, respectivamente.
Em todos os casos, sem exceção, as distribuições de fluxos calculadas para a rede
metabólica coincidiram (
Figura 28). São produzidos apenas H
2
(v
6
= 28,23 mmol/gdw
-1
h
-1
) e
acetato (v
19
= 12,53 mmol/gdw
-1
h
-1
). A velocidade de crescimento (v
16
) é de 2,53
mmol/gdw
-1
h
-1
(Figura 29).
Como já foi dito, durante a velocidade de crescimento exponencial é que há a maior
produção de ácidos e de H
2
. Nestas simulações foi obtido este comportamento; ao se
maximizar a biomassa produz-se muito ácidos e H
2
; ao se maximizar H
2
e biomassa, produz-
se muito ácido; e, por último, ao se maximizar ácido produz-se muito H
2
e biomassa.
Portanto, este comportamento
in silico está condizente com o comportamento padrão da C.
acetobutylicum
.
98
Figura 29: Distribuição de fluxo obtida pela ABF ao se maximizar a biomassa ou a
biomassa+H2 ou a biomassa+butirato+acetato ou o butirato+acetato.
A distribuição de fluxo apresentada na
Tabela 11 corresponde a dados experimentais
obtidos na fase solventogênica (VASCONCELOS
et al., 1994). Para simular esta fase, foi
realizada a análise de balanço de fluxo na qual a velocidade de produção do solvente butanol
foi maximizada. As restrições de velocidades máximas de consumo de glicose e gliceral
permaneceram as mesmas. Foi adicionada a restrição para a velocidade mínima de etanal
(v10) de 1,3 mmol/gdw
-1
h
-1
.
A distribuição de fluxo para esta simulação é mostrada na
Figura 30. Pode-se ver
que, qualitativamente, os valores obtidos pela simulação se parecem com os obtidos
experimentalmente. Os valores determinados pela análise de balanço de fluxo são v6, v11v12,
v15, v19 e v20. Com a exceção do fluxo v11v12 (acetona), cujos valores coincidem – ambos
são zero –, os demais fluxos formam um padrão semelhante aos experimentais.
v1 = 3.94
v2 = 4.65
v3 = 12.53
v4 = 12.53
v5 = 15.70
v6 = 28.23
v7 = 0
v8 = 0
v9 = 12.53
v10 = 0
v11 = 0
v12 = 0
v13 = 0
v14 = 0
v15 = 0
v16 = 2.53
v17 = 0
v18 = 0
v19 = 12.53
v20 = 0
3,94 4,65
12,53
12,53
15,7 28,23
0
0
0
0
0
0
00
0
12,53
0
2,53
0
12,53
99
v1 v2 v6 v10 v11v12 v1 5 v19 v2 0
0
1
2
3
4
5
6
7
8
Reações
Fluxo mmol/(gdw)
dados experimentais
max. butanol
Figura 30: Dados experimentais versus simulados, ambos na fase solventogênica. v1 e v2
correspondem aos fluxos de consumo de glicose e glicerol, respectivamente; v6, v10, v11v12,
v15, v19 e v20 correspondem aos fluxos de produção de H
2
, etanol, acetona, butanol, acetato e
butirato. O valor máximo de consumo de glicose (v1) e de glicerol (v2) é de 3,94 mmol/gdw
-
1
h
-1
e de 4,65 mmol/gdw
-1
h
-1
, respectivamente. O valor mínimo da velocidade de produção de
etanol (v10) é de 1,3 mmol/gdw
-1
h
-1
.
Foi feita também uma simulação para a fase acidogênica e os resultados foram
comparados aos dados experimentais desta mesma fase (
Tabela 12). Como foi visto acima,
independentemente do que for maximizado – se biomassa ou ácidos – o resultado é o mesmo.
Assim, optou-se por, primeiro, maximizar a biomassa juntamente com o H
2
e, depois, apenas
a biomassa. Em ambas as simulações, a única fonte de carbono é a glicose, com uma
velocidade máxima de consumo (v1) igual a 8,72 mmol/gdw
-1
h
-1
. Na segunda simulação –
maximização de biomassa – impôs-se uma velocidade máxima de 3,67 mmol/gdw
-1
h
-1
para o
acetato.
Tabela 12: Dados experimentais relacionados à fase acidogênica (VASCONCELOS et al.,
1994).
Fluxos medidos (mmol h
-1
gdw
-1
)
Fonte de carbono Produtos
Glicose
(v
1
)
Glicerol
(v
2
)
Etanol
(v
10
)
Butanol
(v
15
)
Acetona
(v
11
e v
12
)
Acetato
(v
19
)
Butirato
(v
20
)
H
2
(v
6
)
8,72 0 0,26 0,01 0,02 3,67 6,09 19,1
100
Os resultados estão mostrados na
Figura 31. Ao se maximizar biomassa e H
2
não
houve produção de butirato (v20) e a velocidade de produção de H
2
e acetato foi maior que as
suas velocidades experimentais.
Ao se maximizar apenas a biomassa e limitando a velocidade de consumo da glicose
(v1) e do acetato (v19), os resultados da simulação são muitos próximos dos experimentais;
comparar as barras cinzas com as pretas na
Figura 31.
v1 v6 v10 v11v12 v15 v19 v20
0
5
10
15
20
25
30
35
Reações
Fluxo mmol/(gdw)
max. biomassa + H
2
max. biomassa
dados experimentais
Figura 31: Dados experimentais versus simulados, ambos na fase acidogênica. v1 corresponde
ao fluxo de consumo de glicose; v6, v10, v11v12, v15, v19 e v20 correspondem aos fluxos de
produção de H
2
, etanol, acetona, butanol, acetato e butirato. O valor máximo de consumo de
glicose (v1) é de 8,72 mmol/gdw
-1
h
-1
. A velocidade máxima de acetato (v19) é de 3,67
mmol/gdw
-1
h
-1
.
Estes resultados mostram que o modelo proposto poderá ser útil para guiar pesquisas
e análises de propriedades biológicas da
C. acetobutylicum, o que pode levar na direção de
uma metodologia para melhorar a produção de H
2
e solventes por esta bactéria.
5 CONSIDERAÇÕES FINAIS
5.1 CONCLUSÕES
Como neste trabalho foi descrito um programa para análise e simulação de redes
metabólicas e alguns estudos de caso de modelagem e simulação, as conclusões são separadas
em seções distintas.
5.1.1 GEnSys
Neste trabalho foi descrito o GEnSys (Genomic Engineering System) que é formado
por um conjunto de módulos interdependentes que permite a análise e simulação de redes
bioquímicas. Os módulos implementados realizam as seguintes tarefas:
processamento da LRB para a obtenção da matriz estequiométrica, da lista dos nomes dos
metabólitos e da lista de reações da rede;
determinação dos metabólitos internos e externos da rede e suas matrizes estequiométricas
correspondentes;
determinação das linhas e colunas, em relação à matriz estequiométrica interna,
linearmente independentes e dependentes. Isto é particularmente útil para a determinação
dos
pools de metabólitos conservados, isto é, aqueles metabólitos cuja soma de suas
concentrações é invariante no tempo. A determinação destes metabólitos reduz o número
de EDOs na simulação determinística;
modelagem e simulação determinística de uma forma compacta, onde, num mesmo
arquivo, pode-se definir o modelo contendo as concentrações iniciais, as cinéticas pré-
definidas e as reações da rede metabólica;
análise de controle metabólico para uma rede a partir de um modelo determinístico. Todos
os coeficientes de controle são calculados invocando uma única função;
análise de fluxo metabólico: a partir dos fluxos medidos é possível calcular todos os
demais fluxos da rede. O modelo de AFM é facilmente definido num arquivo onde se
colocam tais fluxos medidos e todas as reações da via. A solução do sistema da AFM é
por quadrados mínimos; isto significa que sempre há uma solução e o vetor solução tem
norma mínima;
análise de balanço de fluxo: para esta análise é necessário especificar, além da equação
geral de conservação da massa, alguns valores de fluxos mínimos e máximos e o
metabólito/fluxo que se deseja otimizar. Todos estes componentes são colocados no
102
arquivo do modelo para serem processados e a distribuição de fluxo determinada de forma
a otimizar a função objetivo;
análise estrutural através de modos elementares: um modo elementar é definido como o
menor conjunto de reações operando conjuntamente para manter o regime estacionário.
Isto significa que um modo elementar é uma via que liga um ou mais metabólitos de
entrada a um ou mais metabólitos de saída. Para determinar os modos elementares de uma
rede usando o GEnSys basta especificar as reações e os metabólitos externos da rede.
Para efetuar qualquer uma das análises descritas anteriormente, é necessário,
a
priori
, criar uma instância (definição dos valores dos campos internos) do módulo de análise.
Somente depois de criada tal instância é que, de fato, realiza-se a análise, usando, para tanto,
as funções definidas especificamente para aquele módulo.
O GEnSys faz uso intensivo da LRB (Linguagem das Reações Bioquímicas) que é
uma linguagem de reações de propósito geral e flexível, desenvolvida neste trabalho. Até
onde se sabe, não há uma linguagem tão flexível e com tantos recursos para a escrita dos
nomes dos metabólitos. As linguagens de reações existentes são bastante limitadas quanto aos
símbolos usados nos nomes dos compostos e nos sinais usados nas reações.
Da forma que foi projetado, o GEnSys pode ser facilmente extendido para outros
tipos de métodos de análise envolvendo a matriz estequiométrica. Todos os módulos foram
cuidadosamente definidos para conterem um conjunto de dados útil de forma que,
dependendo do tipo de análise, sua reutilização seja simples. Por exemplo, o módulo
totalStMat contém, separadamente, as duas matrizes estequiométricas: uma relativa a todos os
substratos e outra a todos os produtos; estas duas matrizes são necessárias para a simulação
dinâmica estocástica.
Finalmente, o GEnSys pode ser muito útil, tanto para usuário que deseja desenvolver
algum programa/módulo, quanto para aquele que deseja fazer apenas uma modelagem e
simulação que envolve a matriz estequiométrica. O primeiro, geralmente, é da área de
ciências exatas e o segundo da área de biologia ou bioquímica. Estes últimos podem
facilmente usar o GEnSys, pois para se criar um modelo neste programa basta editar um texto
no formato ASCII e conhecer as sintaxes usadas pelo GEnSys. Além disso, necessita conhecer
um mínimo do ambiente M
ATLAB
®
para invocar uma função neste ambiente.
103
5.1.2 Simulação Estocástica da E. coli
Foi apresentado e construído um conjunto de reações bioquímicas representando a
via de biossíntese do Trp em
E. coli. Usou-se o algoritmo de simulação estocástica
desenvolvido por Gibson e Bruck (2000) para fazer as simulações estocásticas do
operon trp
desta bactéria. A maioria das constantes de velocidades e concentrações iniciais foi obtida de
Santillan e Zeron (2001b). Em ambas as simulações, o resultado, especificamente a atividade
da enzima AS, previu qualitativamente, para uma
E. coli selvagem, valores próximos aos
dados experimentais.
Todos os mecanismos de regulação conhecidos do
operon trp foram levados em
consideração nesta simulação. Mas foram feitas algumas simplificações, como considerar
apenas a enzima AS, bem como um número constante de moléculas para o repressor
trpR, que
é auto regulado. Outra simplificação foi não considerar a importação ou exportação do Trp
do, ou para, o meio externo à célula.
A simulação estocástica é uma excelente ferramenta de simulação para um conjunto
de reações químicas, principalmente para redes de sinalização, onde o número de moléculas é
pequeno, como o operador
trp ou o TrpR (repressor), comparado ao volume da célula e o
número de outros metabólitos que podem estar presentes em grandes quantidades.
O principal problema a ser superado pela simulação estocástica é o tempo de
execução do algoritmo. A solução do modelo determinístico – solução das EDOs por métodos
numéricos – é muito mais rápida do que a simulação estocástica. Na simulação estocástica,
cada reação é executada separadamente em cada passo do tempo, o que torna sua execução
mais lenta. Sendo assim, pode-se dizer que a simulação estocástica é mais adequada para
pequenas redes metabólicas e que os compostos envolvidos não devem ter altas
concentrações.
5.1.3 Modelagem e Simulação da Rede Metabólica da C. acetobutylicum
Foi construída, a partir de dados da literatura, uma rede metabólica da C.
acetobutylicum
envolvendo todas as reações usadas para a produção de ácidos, solventes e
hidrogênio molecular a partir de dois substratos distintos: glicose e glicerol. No total, a rede
possui 25 metabólitos e 20 reações.
Foram efetuadas duas abordagens diferentes para o estudo da rede metabólica da
bactéria
C. acetobutylicum; a saber: análise de balanço de fluxo e a determinação dos modos
104
elementares desta rede. Até onde se sabe, nenhuma destas análises já foi realizada levando-se
em conisderação o glicerol e a glicose como fontes de carbono.
Foram determinados 29 modos elementares de fluxo para esta via. Destes, há 13
modos distintos envolvidos na produção de H
2
; seis a partir da glicose e seis a partir do
glicerol, o décimo terceiro é a partir do NADH. Foi possível também calcular o rendimento de
H
2
por molécula de substrato. Todos os seis modos de produçao de H
2
a partir de uma
molécula de glicose rendem duas de H
2
. Já para o glicerol este rendimento é de 1:1. Isto
acontece porque para cada molécula de glicose são produzidas duas de piruvato e para o
glicerol é produzida apenas uma.
A determinação dos modos elementares foi útil para elucidar as possíveis vias de
produção de H
2
por esta rede. Dependendo do tamanho da rede, não são possíveis de serem
determinadas.
Através da ABF foram realizadas nove simulações para esta rede metabólica. Estas
análises, com exceção de uma – que deu velocidade de crescimento zero quando se maximiza
o H
2
–, obtiveram, qualitativamente, um resultado que está de acordo com padrão de
comportamento, em termos de distribuição de fluxos, desta bactéria. Na última simulação, os
valores da distribuição de fluxos obtidos foram muito próximos aos valores dos dados
experimentais.
Estes resultados mostram que este modelo pode ser usado para estudar
in silico
possíveis formas de melhorar a produção de H
2
, ou até mesmo de solventes, na C.
acetobutylicum
. O modelo poderá ser usado para simular nocautes de genes (remoção de
reações) e/ou adição de novas reações.
5.2 RECOMENDAÇÕES PARA TRABALHOS FUTUROS
Conforme mostrado na primeira parte deste capítulo, o GEnSys foi projetado para
facilitar a incorporação de outros tipos de análises. Uma delas é a simulação dinâmica
estocástica que seria facilmente implementada usando os módulos do GEnSys.
Uma outra abordagem seria a atribuição de fluxos a modos elementares. Por
exemplo, foi visto na ABF que o rendimento máximo teórico é de 4 moléculas de H
2
por
molécula de glicose. Também foi visto que há vários modos elementares de produção de H
2
.
No entanto, não se sabe quais dos modos dão este rendimento de 4:1. Na verdade, é uma
combinação de mais de um dos modos elementares. A atribuição de fluxos aos modos
elementares pode ser uma solução para este problema, pois se determinaria um fluxo (com
105
unidade) para cada um dos módulos da rede. Este seria um módulo facilmente incorporado ao
GEnSys. Esta atribuição pode ser resolvida como um problema de quadrados mínimos com
restrição de desigualdade. Também pode ser visto como um problema de otimização e ser
resolvido por uma técnica de inteligência artificial conhecida como algoritmos genéticos, por
exemplo.
Conforme demonstrado, a AFM considera todas as reações reversíveis. Seria
possível também implementar um módulo com AFM levando em consideração as restrições
de irreversibilidades de alguma reação. Este, também, pode ser visto como problema dos
quadrados mínimos com restrição de desigualdade.
Com relação à produção do H
2
, existe a possibilidade de realizar análises levando em
consideração a adição ou supressão de enzimas na rede, o que equivale a uma adição ou
nocaute de genes.
REFERÊNCIAS
AKASHI, H.; GOJOBORI, T. Metabolic efficiency and amino acid composition in the
proteomes of
Escherichia coli and Bacillus subtilis. Proceedings of the National Academy
of Sciences, USA
, v.99, n.6, p.3695-3700. 2002.
BARRETT, C. L.; PRICE, N. D.; PALSSON, B. O. Network-level analysis of metabolic
regulation in the human red blood cell using random sampling and singular value
decomposition.
BMC Bioinformatics, v.7, p.132. 2006.
BECKER, S. A.; FEIST, A. M.; MO, M. L.; HANNUM, G.; PALSSON, B. O.;
HERRGARD, M. J. Quantitative prediction of cellular metabolism with constraint-based
models: the cobra toolbox.
Nature Protocols, v.2, n.3, p.727-738. 2007.
BLISS, R. D.; PAINTER, P. R.; MARR, A. G. Role of feedback inhibition in stabilizing the
classical operon.
Journal of Theoretical Biology, v.97, n.2, p.177-193. 1982.
BURRAGE, K.; TIAN, T. H.; BURRAGE, P. A multi-scaled approach for simulating
chemical reaction systems.
Progress in Biophysics & Molecular Biology, v.85, n.2-3, p.217-
234. 2004.
CAO, Y.; GILLESPIE, D. T.; PETZOLD, L. R. Efficient step size selection for the tau-
leaping simulation method.
Journal of Chemical Physics, v.124, n.4, p.044109. 2006.
CORNISH-BOWDEN, A.; HOFMEYR, J. H. The role of stoichiometric analysis in studies of
metabolism: an example.
Journal of Theoretical Biology, v.216, n.2, p.179-191. 2002.
COVERT, M. W.; SCHILLING, C. H.; PALSSON, B. Regulation of gene expression in flux
balance models of metabolism.
Journal of Theoretical Biology, v.213, n.1, p.73-88. 2001.
DESAI, R. P.; HARRIS, L. M.; WELKER, N. E.; PAPOUTSAKIS, E. T. Metabolic flux
analysis elucidates the importance of the acid-formation pathways in regulating solvent
production by
Clostridium acetobutylicum. Metabolic Engineering, v.1, n.3, p.206-213.
1999.
DESAI, R. P.; NIELSEN, L. K.; PAPOUTSAKIS, E. T. Stoichiometric modeling of
Clostridium acetobutylicum
fermentations with non-linear constraints. Journal of
Biotechnology
, v.71, n.1-3, p.191-205. 1999.
EDWARDS, J. S.; COVERT, M.; PALSSON, B. Metabolic modelling of microbes: the flux-
balance approach.
Environmental Microbiology, v.4, n.3, p.133-140. 2002.
EHLDE, M.; ZACCHI, G. A general formalism for metabolic control analysis.
Chemical
Engineering Science
, v.52, n.15, p.2599-2606. 1997.
FELL, D. A. Metabolic control analysis: a survey of its theoretical and experimental
development.
Biochemical Journal, v.286, n.31, p.313–330. 1992.
______. Increasing the flux in metabolic pathways: a metabolic control analysis perspective.
Biotechnology and Bioengineering, v.58, n.2-3, p.121-124. 1998.
107
GIANCHANDANI, E. P.; PAPIN, J. A.; PRICE, N. D.; JOYCE, A. R.; PALSSON, B. O.
Matrix formalism to describe functional states of transcriptional regulatory systems.
PLoS
Compuational Biology
, v.2, n.8, p.e101. 2006.
GIBSON, M. A.; BRUCK, J. Efficient exact stochastic simulation of chemical systems with
many species and many channels.
Journal of Chemical Physics A, v.104, n.9, p.1876-1889.
2000.
GILLESPIE, D. T. Exact stochastic simulation of coupled chemical-reactions.
Journal of
Physical Chemistry
, v.81, n.25, p.2340-2361. 1977.
GOLLNICK, P.; BABITZKE, P. Transcription attenuation.
Biochimica et Biophysica Acta-
Gene Structure and Expression
, v.1577, n.2, p.240-250. 2002.
GOODWIN, B. C. Oscillatory behavior in enzymatic control processes.
Advances in
Enzyme Regulation
, v.3, p.425-438. 1965.
GRIFFITH, J. S. Mathematics of cellular control processes. I. Negative feedback to one gene.
Journal of Theoretical Biology, v.20, n.2, p.202-208. 1968a.
______. Mathematics of cellular control processes. II. Positive feedback to one gene.
Journal
of Theoretical Biology
, v.20, n.2, p.209-216. 1968b.
HYNNE, F.; DANO, S.; SORENSEN, P. G. Full-scale model of glycolysis in
Saccharomyces
cerevisiae
. Biophysical Chemistry, v.94, n.1-2, p.121-163. 2001.
JONES, D.; WOODS, D. Acetone-butanol fermentation revisited.
Microbiology and
Molecular Biology Reviews
, v.50, n.4, p.484-524. 1986.
KACZER, H.; BURNS, J. A. The control of flux.
Journal of Society of Experimental
Botany
, v.27, n.256, p.65-104. 1973.
KAUFFMAN, K. J.; PRAKASH, P.; EDWARDS, J. S. Advances in flux balance analysis.
Current Opinion of Biotechnology, v.14, n.5, p.491 - 496. 2003.
KLAMT, S.; STELLING, J. Combinatorial complexity of pathway analysis in metabolic
networks.
Molecular Biology Reports, v.29, n.1-2, p.233-236. 2002.
KLIPP, E.; HERWIG, R.; KOWALD, A.; WIERLING, C.; LEHRACH, H.
Systems biology
in practice: concepts, implementation and application
. Weinheim: Wiley-VCH. 2005. xix,
465 p.
LAWSON, C. L.; HANSON, R. J.
Solving least squares problems: Englewood Cliffs (N.J.):
Prentice-Hall. 1995
LEHNINGER, A. L.; NELSON, D. L.; COX, M. M.
Principles of biochemistry. New York:
W.H. Freeman & Company. 2000
LESKOVAC, V.
Comprehensive enzyme kinetics. New York: Kluwer Academic Press.
2003. xi, 438 p.
108
LLANERAS, F.; PICÓ, J. Stoichiometric modelling of cell metabolism.
Journal of
Bioscience and Bioengineering
, v.105, n.1, p.1-11. 2008.
MANISH, S.; VENKATESH, K. V.; BANERJEE, R. Metabolic flux analysis of biological
hydrogen production by
Escherichia coli. International Journal of Hydrogen Energy, v.32,
n.16, p.3820-3830. 2007.
MARANGONI, A. G.
Enzyme kinetics: a modern approach. New Jersey: John Wiley &
Sons. 2003. 241 p.
MCADAMS, H. H.; ARKIN, A. Stochastic mechanisms in gene expression.
Proceedings of
National Academy of Science, USA
, v.94, n.3, p.814-819. 1997.
MCCOLLUM, J. M.; PETERSON, G. D.; COX, C. D.; SIMPSON, M. L.; SAMATOVA, N.
F. The sorting direct method for stochastic simulation of biochemical systems with varying
reaction execution behavior.
Computational Biology and Chemistry, v.30, n.1, p.39-49.
2006.
MENDES, E.
Uso racional de ferramentas de engenharia metabólica: produção
bacteriana de hidrogênio e de violaceína
. 2006. 119 f. Dissertação (Mestrado em
Engenharia Química) - Programa de Pós-Graduação em Engenharia Química, Universidade
Federal de Santa Catarina, Florianópolis.
NIELSEN, J. H.; VILLADSEN, J.
Bioreaction engineering principles. New York: Plenum
Press. 1994. xxiv, 456 p.
NOLLING, J.; BRETON, G.; OMELCHENKO, M. V.; MAKAROVA, K. S.; ZENG, Q.;
GIBSON, R.; LEE, H. M.; DUBOIS, J.; QIU, D.; HITTI, J.; WOLF, Y. I.; TATUSOV, R. L.;
SABATHE, F.; DOUCETTE-STAMM, L.; SOUCAILLE, P.; DALY, M. J.; BENNETT, G.
N.; KOONIN, E. V.; SMITH, D. R. Genome sequence and comparative analysis of the
solvent-producing bacterium
Clostridium acetobutylicum. Journal of Bacteriology, v.183,
n.16, p.4823-4838. 2001.
OH, Y.-K.; KIM, H.-J.; PARK, S.; KIM, M.-S.; RYU, D. D. Y. Metabolic-flux analysis of
hydrogen production pathway in
Citrobacter amalonaticus Y19. International Journal of
Hydrogen Energy
, v.33, n.5, p.1471-1482. 2008.
PALSSON, B.
Systems biology: properties of reconstructed networks. Cambridge; New
York: Cambridge University Press. 2006. xii, 322 p.
PAPOUTSAKIS, E. T. Equations and calculations for fermentations of butyric acid bacteria.
Biotechnology and Bioengineering, v.26, n.2, p.174-187. 1984.
PENROSE, R. A generalized inverse for matrices.
Proceedings of Cambridge Philosophy
Society
, v.51, n.406-413. 1955.
RAMSEY, S.; ORRELL, D.; BOLOURI, H. Dizzy: stochastic simulation of large-scale
genetic regulatory networks.
Journal of Bioinformatics and Computational Biology, v.3,
n.2, p.437-454. 2005.
109
RAO, C. V.; ARKIN, A. P. Stochastic chemical kinetics and the quasi-steady-state
assumption: application to the Gillespie algorithm.
Journal of Chemical Physics, v.118,
n.11, p.4999-5010. 2003.
RAO, G.; MUTHARASAN, R. Altered electron flow in continuous cultures of
Clostridium
acetobutylicum
induced by viologen dyes. Applied Environmental Microbiology, v.53, n.6,
p.1232-1235. 1987.
REDER, C. Metabolic control theory: a structural approach.
Journal of Theoretical Biology,
v.135, n.2, p.175-201. 1988.
SANTILLAN, M.; MACKEY, M. C. Dynamic behavior in mathematical models of the
tryptophan operon.
Chaos, v.11, n.1, p.261-268. 2001a.
______. Dynamic regulation of the tryptophan operon: a modeling study and comparison with
experimental data.
Proceedings of the National Academy of Sciences, USA, v.98, n.4,
p.1364-1369. 2001b.
SANTILLAN, M.; ZERON, E. S. Dynamic influence of feedback enzyme inhibition and
transcription attenuation on the tryptophan operon response to nutritional shifts.
Journal of
Theoretical Biology
, v.231, n.2, p.287-298. 2004.
SAURO, H. M.; INGALLS, B. Conservation analysis in biochemical networks:
computational issues for software writers.
Biophysical Chemistry, v.109, n.1, p.1-15. 2004.
SCHILLING, C. H.; LETSCHER, D.; PALSSON, B. O. Theory for the systemic definition of
metabolic pathways and their use in interpreting metabolic function from a pathway-oriented
perspective.
Journal of Theoretical Biology, v.203, n.3, p.229-248. 2000.
SCHILLING, C. H.; SCHUSTER, S.; PALSSON, B. O.; HEINRICH, R. Metabolic pathway
analysis: basic concepts and scientific applications in the post-genomic era.
Biotechnology
Progress
, v.15, n.3, p.296-303. 1999.
SCHUSTER, S.; DANDEKAR, T.; FELL, D. A. Detection of elementary flux modes in
biochemical networks: a promising tool for pathway analysis and metabolic engineering.
Trends Biotechnology, v.17, n.2, p.53-60. 1999.
SCHUSTER, S.; FELL, D. A.; DANDEKAR, T. A general definition of metabolic pathways
useful for systematic organization and analysis of complex metabolic networks.
Nature
Biotechnology
, v.18, n.3, p.326-332. 2000.
SCHUSTER, S.; HILGETAG, C. What information about the conserved-moiety structure of
chemical reaction systems can be derived from their stoichiometry?
The Journal of Physical
Chemistry
, v.99, n.20, p.8017-8023. 1995.
SCHUSTER, S.; HILGETAG, C.; WOODS, J. H.; FELL, D. A. Reaction routes in
biochemical reaction systems: algebraic properties, validated calculation procedure and
example from nucleotide metabolism.
Journal of Mathematical Biology, v.45, n.2, p.153-
181. 2002.
110
SEN, A. K.; LIU, W. M. Dynamic analysis of genetic, control and regulation of amino-acid
synthesis - the tryptophan operon in
Escherichia coli. Biotechnology and Bioengineering,
v.35, n.2, p.185-194. 1990.
SENGER, R. S.; PAPOUTSAKIS, E. T. Genome-scale model for
Clostridium
acetobutylicum
. Part 1: metabolic network resolution and analysis. Biotechnology and
Bioengineering
. Publicado on line em 05/junho. 2008.
SHAMS, S. Y.; GONZALE, R. Anaerobic fermentation of glycerol: a path to economic
viability for the biofuels industry.
Current Opinion in Biothechnology, v.18, p.213-219.
2007.
SHINTO, H.; TASHIRO, Y.; YAMASHITA, M.; KOBAYASHI, G.; SEKIGUCHI, T.;
HANAI, T.; KURIYA, Y.; OKAMOTO, M.; SONOMOTO, K. Kinetic modeling and
sensitivity analysis of acetone-butanol-ethanol production.
Journal of Biotechnology, v.131,
n.1, p.45-56. 2007.
SINHA, S. Theoretical study of tryptophan operon - application in microbial technology.
Biotechnology and Bioengineering, v.31, n.2, p.117-124. 1988.
SIPSER, M.
Introduction to the theory of computation. Boston: PWS Publishing. 1996. xi,
239 p.
STELLING, J.; KLAMT, S.; BETTENBROCK, K.; SCHUSTER, S.; GILLES, E. D.
Metabolic network structure determines key aspects of functionality and regulation.
Nature,
v.420, n.6912, p.190-193. 2002.
STEPHANOPOULOS, G. N.; ARISTIDOU, A. A.; NIELSEN, J.
Metabolic engineering:
principles and methodologies
. San Diego: Academic Press. 1998. xvii, 707 p.
THEILGAARD, H. A.; NIELSEN, J. Metabolic control analysis of the penicillin biosynthetic
pathway: the influence of the LLD-ACV:bisACV ratio on the flux control.
Antonie van
Leeuwenhoek
, v.75, n.1, p.145-154. 1999.
TURNER, T. E.; SCHNELL, S.; BURRAGE, K. Stochastic approaches for modelling in vivo
reactions.
Computational Biology and Chemistry, v.28, n.3, p.165-178. 2004.
ULLAH, M.; SCHMIDT, H.; CHO, K. H.; WOLKENHAUER, O. Deterministic modelling
and stochastic simulation of biochemical pathways using matlab.
Systems Biology, IEE
Proceedings
, v.153, n.2, p.53-60. 2006.
URBANCZIK, R.; WAGNER, C. An improved algorithm for stoichiometric network
analysis: theory and applications.
Bioinformatics, v.21, n.7, p.1203-1210. 2005.
VARDAR-SCHARA, G.; MAEDA, T. Metabolically engineered bacteria for producing
hydrogen via fermentation.
Microbial Biotechnology, v.1, n.2, p.107-125. 2008.
VARMA, A.; PALSSON, B. O. Metabolic flux balancing: basic concepts, scientific and
practical use.
Nature Biotechnology, v.12, n.10, p.994-998. 1994a.
111
______. Stoichiometric flux balance models quantitatively predict growth and metabolic by-
product secretion in wild-type
Escherichia coli W3110. Applied Environment
Microbiology
, v.60, n.10, p.3724-3731. 1994b.
VASCONCELOS, I.; GIRBAL, L.; SOUCAILLE, P. Regulation of carbon and electron flow
in
Clostridium acetobutylicum grown in chemostat culture at neutral PH on mixtures of
glucose and glycerol.
Journal of Bacteriology, v.176, n.5, p.1443-1450. 1994.
VON KAMP, A.; SCHUSTER, S. Metatool 5.0: fast and flexible elementary modes analysis.
Bioinformatics, v.22, n.15, p.1930-1931. 2006.
XIU, Z. L.; CHANG, Z. Y.; ZENG, A. P. Nonlinear dynamics of regulation of bacterial
trp
operon: model analysis of integrated effects of repression, feedback inhibition, and
attenuation.
Biotechnology Progress, v.18, n.4, p.686-693. 2002.
XIU, Z. L.; ZENG, A. P.; DECKWER, W. D. Model analysis concerning the effects of
growth rate and intracellular tryptophan level on the stability and dynamics of tryptophan
biosynthesis in bacteria.
Journal of Biotechnology, v.58, n.2, p.125-140. 1997.
YANOFSKY, C.; PLATT, T.; CRAWFORD, I. P.; NICHOLS, B. P.; CHRISTIE, G. E.;
HOROWITZ, H.; VANCLEEMPUT, M.; WU, A. M. The complete nucleotide sequence of
the tryptophan operon of
Escherichia coli. Nucleic Acids Research, v.9, n.24, p.6647-6668.
1981.
YU, J.; XIAO, J.; REN, X.; LAO, K.; XIE, X. S. Probing gene expression in live cells, one
protein molecule at a time.
Science, v.311, n.5767, p.1600-1603. 2006.
Livros Grátis
( http://www.livrosgratis.com.br )
Milhares de Livros para Download:
Baixar livros de Administração
Baixar livros de Agronomia
Baixar livros de Arquitetura
Baixar livros de Artes
Baixar livros de Astronomia
Baixar livros de Biologia Geral
Baixar livros de Ciência da Computação
Baixar livros de Ciência da Informação
Baixar livros de Ciência Política
Baixar livros de Ciências da Saúde
Baixar livros de Comunicação
Baixar livros do Conselho Nacional de Educação - CNE
Baixar livros de Defesa civil
Baixar livros de Direito
Baixar livros de Direitos humanos
Baixar livros de Economia
Baixar livros de Economia Doméstica
Baixar livros de Educação
Baixar livros de Educação - Trânsito
Baixar livros de Educação Física
Baixar livros de Engenharia Aeroespacial
Baixar livros de Farmácia
Baixar livros de Filosofia
Baixar livros de Física
Baixar livros de Geociências
Baixar livros de Geografia
Baixar livros de História
Baixar livros de Línguas
Baixar livros de Literatura
Baixar livros de Literatura de Cordel
Baixar livros de Literatura Infantil
Baixar livros de Matemática
Baixar livros de Medicina
Baixar livros de Medicina Veterinária
Baixar livros de Meio Ambiente
Baixar livros de Meteorologia
Baixar Monografias e TCC
Baixar livros Multidisciplinar
Baixar livros de Música
Baixar livros de Psicologia
Baixar livros de Química
Baixar livros de Saúde Coletiva
Baixar livros de Serviço Social
Baixar livros de Sociologia
Baixar livros de Teologia
Baixar livros de Trabalho
Baixar livros de Turismo