Download PDF
ads:
DIEGO ENRY BARRETO GOMES
“ESTUDO DA FALCIPAÍNA-2 EM COMPLEXO COM
LIGANTES POR MODELAGEM E DINÂMICA
MOLECULAR COMO SUPORTE AO DESENVOLVIMENTO
RACIONAL DE NOVOS FÁRMACOS ANTIMALÁRICOS”
Tese submetida à Universidade Federal do Rio de Janeiro visando
a obtenção do Grau de Mestre em Ciências Biológicas (Biofísica)
Universidade Federal do Rio de Janeiro
Centro de Ciências da Saúde
Instituto de Biofísica Carlos Chagas Filho
2006
ads:
Livros Grátis
http://www.livrosgratis.com.br
Milhares de livros grátis para download.
Ficha catalográfica:
I.Universidade Federal do Rio de Janeiro – IBCCF
II.Título
Gomes, Diego Enry Barreto
Estudo da Falcipaína-2 em Complexo com Ligantes por Modelagem e Dinâmica
Molecular como Suporte ao Desenvolvimento Racional de novos Fármacos
Antimaláricos
Rio de Janeiro, UFRJ, IBCCF, 2006.
Tese: Mestre em Ciências
1- Malária
2- Cisteíno proteases
3- Dinâmica Molecular
4- E-64
I-Federal do Rio de Janeiro – IBCCF
II-Títulos
ads:
Este trabalho foi realizado no Laboratório Modelagem e Dinâmica
Molecular do Instituto de Biofísica Carlos Chagas Filho, sob orientação do Dr.
Pedro G. Pascutti. Este trabalho foi apoiado pelas entidades:
CAPES
CNPq
Hewlett-Packard Brasil
Resumo
A malária permanece como uma das mais importantes doenças infecciosas no
mundo. O tratamento e controle da malária são complicados pela difusão geográfica e
emergência contínua de formas resistentes de parasitas às principais drogas antimaláricas.
Para contornar estas adversidades novos alvos moleculares têm sido propostos para a
quimioterapia antimalárica, dentre eles a Falcipaína-2 (FP2) uma das principais proteases
do P. falciparum. Esta protease é responsável pela degradação da hemoglobina, principal
fonte de aminoácidos para o parasita. Usando técnicas de Modelagem Comparativa
propomos quatro modelos tridimensionais diferentes para a estrutura da FP2 e por
estudos de Dinâmica Molecular (DM) em 1ns a 310K, usando o software GROMACS,
avaliamos a estabilidade da proteína e a preservação características estruturais globais e
do sítio ativo, para selecionarmos o modelo mais viável para as simulações com ligantes.
A partir deste modelo, investigamos por simulações de DM em 6ns a 310K o
comportamento da FP2 em complexo com os ligantes E64, Z-LR-AMC e CP1, visando
uma melhor descrição do sitio ativo e maior entendimento do mecanismo de ligação.
Avaliamos também as diferenças entre os campos de forças GROMOS96 e OPLS na
qualidade desta descrição. Na análise das simulações de DM consideramos a interface de
contato molecular e ligações hidrogênio dos complexos proteína-ligante e identificamos
os padrões de interação que regem a ligação com os diferentes ligantes, destacando
individualmente a relevância dos resíduos de cada bolsão de interação com cada um dos
ligantes, para que futuramente sejam explorados nas abordagens de desenvolvimento de
fármacos inibidores da FP2.
Abstract
Malaria remains one of the most important infectious diseases in the world. Its
control becomes complicated by the raising and spreading of resistant parasites to
available chemotherapy. A potential target to new treatment is the inhibition of the
cysteine protease Falcipain-2 (FP2), one of the major enzymes of P.falciparum. This
protease causes hemoglobin degradation to provide the main amino acid source for the
parasite and, therefore, is essential to the parasite viability. Using Comparative Molecular
Modeling techniques we proposed four different three-dimensional models for the
structure of FP2 and with Molecular Dynamics (MD) for 1ns and 310K, using
GROMACS software, we evaluated FP2 stability and conservation of the main features
of the global structure and of the active site, to select the most feasible model for MD
simulations with ligands. With this model we investigated by MD simulations for 6ns and
310K the behavior of FP2 complexes with the ligands E64, Z-LR-AMC and CP1,
intending to reach a clear description of the active site and to better understand the
binding mechanism. We also evaluated the differences between the force fields
GROMOS96 and OPLS in the quality of describing these interactions. To the analysis of
MD simulations we considered the contact interface and hydrogen bonds of the protein-
ligand complexes and identified the interaction pattern that drives the binding the ligands,
highlighting the individual contribution of each residue of every binding pocket with each
one of the ligands, so that information could be useful in the future efforts to develop FP2
inhibitors.
Lista de Siglas e Abreviaturas.
1atk Estrutura Cristalográfica da Catepsina-K humana
DGL Variação da Energia Livre de Ligação
DM Dinâmica Molecular
E64 1-[(L-trans-epoxisuccinil)-leucilamino]-4-guanidinobutano]
FP2 Falcipaína-2
FP2/E64 Falcipaína-2 ligada não covalentemente ao E64
FP2_CYS2/E64 Falcipaína-2 com a Histidina 157 protonada Cisteína 25 desprotonada, ligada não
covalentemente ao E64
FP2_HISB/E64 Falcipaína-2 com a Cisteina25 protonada e a Histidina 157 desprotonada, ligada não
covalentemente ao E64
FP2-E64 Falcipaína-2 ligada covalentemente ao E64
GROMACS GROningen MAchine for Chemical Simulation
GROMOS GROningen MOlecular Simulation
K Kelvin
kcal Quilocaloria
kcat Constante catalítica
LIE Linear Interaction Energy - Energia de Interação Linear
LMDM Laboratório de Modelagem e Dinâmica Molecular
MM Modelagem Molecular
OPLS Optimised Potential for Liquid Simulation
PDB Protein Data Bank - Banco de Dados de Proteínas
PME Particle Mesh Ewald - Rede de Partículas Ewald
RMS Root Mean Square - Raiz da Média Quadrática
RMSD Root Mean Square Deviation- Raiz do Desvio da Média Quadrática
RMSF Root Mean Square Fluctuation - Raiz da Flutuação da Média Quadrática
Lista de Figuras
Figura-1.1: Estrutura cristalográfica da papaína. Em destaque é mostrado o par iônico Cys25 e His159.
Em vermelho estão as hélices em ciano estão as fitas beta.
Figura 1.2: Ilustração do mecanismo de catálise comum as cisteíno-proteases (Beveridge, 1996)
Figura-1.3A: Esquema da terminologia usada para descrever as interações enzima-ligante.
Figura-1.3B: Esquema da terminologia usada para descrever as interações enzima-ligante,
exemplificando a variabilidade de propriedades em um sítio de ligação e substrato.
Figura 1.4: O inibidor E64
Figura-1.5: O Ciclo Biológico da Malária (Adaptado de Miller, L. H., D. I. Baruch, et al. (2002).
Figura-1.6: A distribuição global da malária por região administrativa da OMC. (Hay, S. I et al.
(2004)).
Figura 3.1: Exemplo de um alinhamento de seqüências de proteína. Entre as possibilidades plausíveis
uma é escolhida com base em diversos fatores. As setas vermelhas e azuis apontam para os
resíduos idênticos, a seta verde indica qual das duas opções acima tem o melhor resultado.
Figura 3.2: Ilustração da função potencial harmônico que descreve a interação entre dois átomos
ligados de uma biomolécula. Como as constantes de ligação e distância de equilíbrio são
distintas para cada tipo de par de átomos, a imagem da função também varia conforme
demonstrado na figura. (Parâmetros de ffG43a1bon.itp)
Figura 3.3: Gráfico da função potencial harmônico angular que descreve a interação entre três átomos
ligados de uma biomolécula. (Parâmetros de ffG43a1bon.itp)
Figura 3.4: Gráfico da função potencial harmônico angular impróprio que descreve o ângulo entre os
planos i-j-k e j-k-l. São representadas as duas aplicações desse potencial: manutenção da
estrutura planar e tetraédrica, onde o ângulo de equilíbrio é 0o e 35º respectivamente.
(Parâmetros de ffG43a1bon.itp)
Figura 3.5: Gráfico da função potencial torcional que descreve as barreiras para a torção das ligações
químicas, exemplificado para diferentes valores de K e n, que irão determinar a amplitude e
o número de mínimos da imagem da função. (Parâmetros de ffG43a1bon.itp) (Obs: n = 1 é
meramente ilustrativo pois não existe no GROMOS96, somente n = 2, 3 e 6).
Figura 3.6: Interações intermoleculares (linhas cheias), intramoleculares (linhas tracejadas) e
intramoleculares do tipo 1-4 (linhas pontilhadas).
Figura 3.7: Representação gráfica da função potencial de Lennard-Jones (ou van der Waals), mostrando
a atração e repulsão entre átomos não ligados quimicamente, exemplificada para alguns
tipos de pares de átomos. (Parâmetros ffG43a1nb.itp)
Figura 3.8: Gráfico da função de Coulomb mostrando o comportamento da interação entre cargas
parciais, provocadas por deslocamentos nas nuvens eletrônicas dos átomos em uma
molécula. (Parâmetros de ffG43a1nb.itp)
Figura 3.9: Gráfico das funções cossenóides cos(x), cos(2x) e cos(3x) e do produto do somatório
destas, que forma o potencial torcional do OPLS, que descreve as barreiras para a torção
das ligações químicas
Figura 3.10: Representação bidimencional das condições periódicas de contorno que simulam um
ambiente infinito. A caixa central é repetida em todos os lados e é utilizado um Raio de
Corte (círculo pontilhado) que restringe a distância para contabilizar as interações de longo
alcance. Os pequenos círculos em cinza representam grupos de carga adicionados ao
cálculo pela presença de pelo menos um dos átomos no interior do Raio de Corte.
Figura 3.11: Representação dos efeitos da aplicação do Campo de Reação na função potencial de
Coulomb para partículas de mesma carga com e sem o campo de reação. Neste exemplo é
igual 54 e o raio de corte 1.5nm.
Figura 3.12: Representação unidimensional dos componentes da soma de Ewald, em um sistema
unidimensional de cargas pontuais. A esquerda, o espaço direto, ao centro a distribuição de
cargas no espaço direto, a direita distribuição de cargas gerada para o espaço recíproco.
Figura 3.13: Ilustração do método Particle Mesh Ewald. Primeiro as posições atômicas e as cargas são
armazenadas, em seguida é produzida uma rede de pontos, depois as cargas são
interpoladas aos pontos da rede. A soma de Ewald é realizada apenas para os pontos da
rede. Finalmente o potencial é transferido de volta aos átomos e as coordenadas são
atualizadas pra o próximo passo da DM.
Figura 3.14: Ligações Hidrogênio. São três as convenções para determinação de ligações hidrogênio,
dados a distância r e o ângulo : Na figura à esquerda são consideradas distâncias r entre
Doador (D) e Aceitador (A) inferiores a 0,36nm, com variando entre 0º e 60º; Na figura à
direita, são consideradas distâncias r entre Hidrogênio (H) e Aceitador (A) inferiores a
0.27nm, com variando entre 120º e 180º; A terceira convenção é a combinação dos
critérios anteriores.
Figura 3.15: Dados os ângulos  e  de cada resíduo de uma seqüência peptídica e plotando-se no
Gráfico de Ramachandran é possível identificar regiões de estrutura secundária, bem como
violações, nomeadamente nas interações de van der Waals, de resíduos em regiões não
permitidas.
Figura 3.16: Diferença de energia livre entre estados “ ligado” (1) e “não ligado” (2). No estado 1 são
consideradas as energias de interação entre o ligante e o meio, incluindo a proteína. No
estado 2, o meio é somente o solvente. (L : ligante e P: proteína)
Figura 3.17: Superfície Molecular: Uma ponta de prova esférica corre por sobre a superfície de van der
Waals (SvdW), gerando superfícies de contato e superfícies de reentrâncias (SR), que
somadas compõem a superfície molecular ou superfície exposta ao solvente (SM/SES). . O
centro da ponta de prova desenha a superfície acessível ao solvente (SAS). A superfície
intermolecular (SI) é composta quando há sobreposição de SAS entre duas moléculas.
Figura 3.18: Seqüência madura da Falcipaína2.
Figura 3.19A: E-64
Figura 3.19B: Z-LR-AMC
Figura 3.19C: CP1
Figura 4.1: Alinhamento estrutural dos cristais usados como referência para a construção dos Modelos
da Falcipaína-2. Azul 1CQD, amarelo 1ATK, verde 1AEC, ciano 1YAL e cinza 1PPN.
Figuras rotacionadas em 90º no eixo X.
Figura 4.2: As regiões estruturalmente conservadas. Em amarelo, as regiões em hélice-alfa, em verde,
em fita-beta. Em vermelho a maior região de inserção da falcipaína-2 (alça).
Figura 4.3: Sobreposição dos modelos para a Falcipaína-2: Em amarelo está representado o modelo 1
(M1), em azul o modelo 2 (M2), em verde o modelo 3 (M3), e em vermelho o modelo 4
(M4). A diferença entre os modelos é essencialmente a posição da alça à esquerda e no
modelo 2 a ausência desta alça.
Figura 4.4: Detalhe do modelo da estrutura da Falcipaína 2, em vermelho as hélices-alpha, e em
amarelo as fitas-beta. Em bastões, os resíduos Gln19, Cys25, Gly 65, Gly66, His159,
Trp177 e Asn205 (numeração da papaína) importantes para o sítio ativo da enzima.
Figura 5.1: Representação do RMSD dos átomos do esqueleto peptídico, calculados das simulações de
Dinâmica Molecular dos modelos propostos para a Falcipaína-2.
Figura-5.2: Representação do FRMQ dos átomos do esqueleto peptídico, discriminados por resíduo,
calculados das simulações de Dinâmica Molecular dos modelos propostos para a
Falcipaína-2.
Figura 5.3: Representação 3D do RMSF dos átomos do esqueleto peptídico, calculados das simulações
de Dinâmica Molecular dos modelos propostos para a Falcipaína-2. Em preto as hélices alfa
e em cinza as fitas beta.
Figura 5.4: Superfície acessível ao solvente colorida conforme o potencial eletrostático. Em vermelho
potencial negativo, em branco neutro, em azul positivo. A linha amarela indica a região do
sítio ativo e as setas regiões de deformação. Rotação de 90º nos eixos Y e Z em relação às
demais figuras do trabalho.
Figura-5.5: Raio de Giro calculado da simulação de Dinamica Molecular para os modelos propostos
para a Falcipaína-2.
Figura 6.1A: RMSD dos átomos do esqueleto peptídico, calculados das simulações de Dinâmica
Molecular da Catepsina-K, Falcipaína-2 e Falcipaína-2 com ligantes.
Figura 6.1B: Comparação OPLS-GROMACS entre o RMSD dos átomos do esqueleto peptídico,
calculados das simulações de Dinâmica Molecular da Catepsina-K, Falcipaína-2 e
Falcipaína-2 com ligantes.
Figura 6.2: RMSF dos átomos do esqueleto peptídico, discriminados por resíduo, calculados das
simulações de Dinâmica Molecular para a Falcipaína-2.
Figura 6.3A: Representação 3D do RMSF dos átomos do esqueleto peptídico, calculados das simulações
de Dinâmica Molecular no campo de Forças GROMOS96. Em preto as hélices alfa e em
cinza as fitas beta.
Figura 6.3B: Representação 3D do RMSF dos átomos do esqueleto peptídico, calculados das simulações
de Dinâmica Molecular no campo de Forças OPLS. Em preto as hélices alfa e em cinza as
fitas beta.
Figura 6.4: Diferenças de RMSF entre os sistemas FP2+ligante e FP2.
Figura 6.5: Ilustração das regiões com diferenças >0,05nm para o RMSF entre as simulações FP2 e
FP2+ligante. As regiões com maior flutuação em azul e menor flutuação em vermelho.
Figura 6.6: Diferenças de RMSF entre os sistemas FP2+ligante e FP2
Figura 6.7: Ilustração das regiões com diferenças >0,05nm para o RMSF das simulações e
FP2_HISB/E64 e FP2_CYSH/E64 em relação à FP2.
Figura 6.8: Diferença do RMSF entre as formas FP2 livre e FP2 + ligante apenas para os resíduos do
sítio ativo dos sistemas simulados no campo de forças OPLS.
Figura 6.9: Comportamento dos ligantes no sítio ativo da Falcipaína-2 para as simulações no campo de
forças GROMOS96 (G96). Os ligantes estão representados pelo modelo de bastões. O E64
aparece em amarelo e o Z-LR-AMC em verde. A proteína está representada em tubos na
cor cinza, com os subsítios destacados: S1´=amarelo, S1=vermelho, S2=verde, S3=azul.
Figura 6.10: Comportamento dos ligantes no sítio ativo da Falcipaína-2 para as simulações no campo de
forças OPLS. Os ligantes estão representados pelo modelo de bastões. O E64 aparece em
amarelo e o CP1 em azul. A proteína está representada em tubos na cor cinza, com os
subsítios destacados: S1´=amarelo, S1=vermelho, S2=verde, S3=azul.
Figura 6.11: Área Média de Interação Intermolecular (GROMOS96)
Figura 6.12: Área Média de Interação Intermolecular e diferenças quanto à ligação covalente
(GROMOS96)
Figura 6.13A: Área Média de Interação Intermolecular com o E64 (OPLS)
Figura 6.13B: Área Média de Interação Intermolecular com o CP1(OPLS)
Figura 6.14: Área Média de Interação Intermolecular discriminada por porção da molécula do E64
(OPLS)
Figura 6.15: Área Média de Interação Intermolecular para a simulação com o ligante CP1 (OPLS)
Figura 6.16: Diferenças no modo de ligação entre os estados covalente e não covalente, para as
simulações no campo de forças OPLS
Figura 6.17: O comportamento das ligações hidrogênio nos diferentes sistemas simulados, em diferentes
intervalos de tempo. Nas ligações em que o ligante é doador, a ligação é representada em
barras, e nas situações em que o ligante é aceitador, a ligação é representada em linhas.
Lista de Tabelas
Tabela 1.1: Resumo das classes de enzimas proteolíticas e sua classificação (Bairoch, 2000;
Fleischmann, Darsow et al., 2004)
Tabela 1.2: As famílias de cisteíno proteases (Barrett, A. J., 1993; Barrett, A. J, 2004).
Tabela 1.1: As famílias de cisteíno proteases (Barrett, A. J., 1993; Barrett, A. J, 2004).
Tabela 1.2: Atuais alvos moleculares e as novas propostas de alvos terapêuticos para o combate a
Malária (Fidock et al. 2004).
Tabela 3.1: Descrição dos sistemas simulados.
Tabela 3.2: Programas usados.
Tabela-4.1: Regiões estruturalmente conservadas
Tabela-4.2: Previsão do sítio ativo da Falcipna-2 e aminoácidos correspondentes na Catepsina-K
humana.
Tabela 6.1: Ligações Hidrogênio com prevalência acima de 10% para as simulações no campo de
forças GROMOS96.
Tabela 6.2: Ligações Hidrogênio com prevalência acima de 10% para as simulações no campo de
forças OPLS.
Tabela 6.3: Resultado do Cálculo do DGL pelo método LIE e ajuste pelo fator obtido da estimativa de
energia livre de ligação para 310K usando o kcat experimental para a Falcipaína-2
complexada ao Z-LR-AMC. (Sijwali 2002)
Índice Analítico
1 – Introdução........................................................................................................................................................1
1.1 - Enzimas Proteolíticas.................................................................................................................................1
1.1.1 - Função biológica das proteases...........................................................................................................2
1.1.2 - Cisteíno Proteases - A Super-Família da Papaína...............................................................................4
1.1.3 - As Cisteíno Proteases Lisossomais de Mamíferos..............................................................................9
1.1.4 - Cisteíno Proteases de Protozoários e de Parasitas ..............................................................................9
1.1.5 - O Composto E-64, um Inibidor Irreversível de Cisteíno Proteases..................................................11
1.1.6 – Resistência aos inibidores................................................................................................................12
1.2 - A Malária..................................................................................................................................................13
1.2.1 - O ciclo biológico do parasito............................................................................................................13
1.2.2 - Magnitude e Distribuição geográfica................................................................................................15
1.2.3 A Falcipaína-2.....................................................................................................................................16
1.3 Métodos Computacionais. ..........................................................................................................................18
1.3.1 O uso das simulações moleculares para modelar fase condensada é legítimo? ..................................19
1.3.2 Legitimando as simulações de dinâmica molecular............................................................................19
2 – Objetivos ........................................................................................................................................................22
3 – Métodos..........................................................................................................................................................23
3.1 - Modelagem Comparativa.........................................................................................................................23
3.1.1 - Passos na Modelagem Comparativa.................................................................................................24
3.2 - Otimização das Geometrias Moleculares.................................................................................................29
3.2.1 - Método do Máximo Declive (steepest descent)................................................................................30
3.3 Dinâmica Molecular...................................................................................................................................30
3.4 - Campo de Forças......................................................................................................................................32
3.2.1 - Grupo 1: Átomos ligados..................................................................................................................33
3.2.2 - Grupo 2, Interações entre átomos não ligados..................................................................................36
3.2.3 As diferenças entre o GROMOS96 e o OPLS ....................................................................................39
3.5 - Condições Periódicas de Contorno (CPC)................................................................................................40
3.6 - Tratamento das interaçõeso ligadas de longo alcance. ........................................................................41
3.7 Cálculo de cargas dos ligantes pelo ajuste do potencial eletrostático (ESP ElectroStatic Potential)..........45
3.7.1 A escolha da Base...............................................................................................................................46
3.7.2 O método RESP para o ajuste de cargas.............................................................................................46
3.8 - Métodos de análise...................................................................................................................................47
3.8.1 - Raíz do Desvio Quadrático Médio....................................................................................................47
3.8.2 - Ligações Hidrogênio.........................................................................................................................48
3.8.3 - Gráfico de Ramachandram...............................................................................................................49
3.8.4 - Energia Livre de Gibbs de Ligação. .................................................................................................50
3.8.5 Raio de Giro e Momento de Inércia....................................................................................................51
3.8.6 Área de Interação Intermolecular:......................................................................................................52
3.9 Procedimentos ............................................................................................................................................54
3.9.1 - Modelagem Comparativa da Falcipaína-2........................................................................................54
3.92 Condições de Simulação......................................................................................................................55
3.10 - Métodos Computacionais.......................................................................................................................61
4 – Modelagem Comparativa – Resultados e Discussão...................................................................................63
4.1 – Criação dos Modelos....................................................................................................................................63
4.1.1 - Alinhamento.....................................................................................................................................63
4.1.2 – Validação dos modelos. ...................................................................................................................65
4.1.3 - Propriedades do Modelo Estruturais da Falcipaína-2.......................................................................66
5 - Simulações das Proteases Livres – Resultados e Discussões.......................................................................69
5.1 –Dinâmica Molecular dos Modelos propostos: M1 à M4...........................................................................69
5.1.1 - Desvio da raiz média quadrática.......................................................................................................69
5.1.2 – Avaliação da Superfície Molecular Acessível ao Solvente..............................................................72
5.1.3 – Variações estruturais globais. ..........................................................................................................73
6 - Simulações com os Ligantes – Resultados e Discussão................................................................................76
6.1 – Análises Globais......................................................................................................................................76
6.1.1 – Desvio da raiz média quadrática (RMSD).......................................................................................76
6.2 – Modo de ligação do E-64, Z-LR-AMC e CP1 à Falcipaína-2 .................................................................85
6.2.1 Comportamento dos Ligantes. ............................................................................................................85
6.2.2 - Contatos moleculares entre a proteína e os ligantes nas simulações no campo de forças
GROMOS96................................................................................................................................................87
6.2.3 - Contatos moleculares entre a proteína e os ligantes E64 e CP1, para as simulações no campo de
forças OPLS.................................................................................................................................................90
6.3 – Ligações Hidrogênio................................................................................................................................94
6.3.1 Ligações hidrogênio com o campo de forças GROMOS96................................................................94
6.3.2 Ligações hidrogênio com o campo de forças OPLS...........................................................................96
6.3.3 - O comportamento das ligações hidrogênio.......................................................................................98
6.3.4- Estimativa da Energia Livre de Gibbs.............................................................................................100
7 - Conclusões ....................................................................................................................................................102
7.1 - Modelagem Comparativa e Simulações da Falcipaína-2 livre de ligantes. ............................................102
7.2 - Simulações da Falcipaína-2 com os ligantes..........................................................................................103
8 - Perspectivas..................................................................................................................................................106
9 - Referências....................................................................................................................................................108
1 – Introdução ................................................................................................................... 1
1.1 - Enzimas Proteolíticas........................................................................................... 1
1.1.1 - Função biológica das proteases .................................................................... 2
1.1.2 - Cisteíno Proteases - A Super-Família da Papaína...................................... 4
1.1.3 - As Cisteíno Proteases Lisossomais de Mamíferos ...................................... 9
1.1.4 - Cisteíno Proteases de Protozoários e de Parasitas.................................... 10
1.1.5 - O Composto E-64, um Inibidor Irreversível de Cisteíno Proteases........ 11
1.1.6 – Resistência aos inibidores........................................................................... 13
1.2 - A Malária............................................................................................................. 13
1.2.1 - O ciclo biológico do parasito....................................................................... 14
1.2.2 - Magnitude e Distribuição geográfica......................................................... 15
1.2.3 A Falcipaína-2................................................................................................ 17
1.3 Métodos Computacionais..................................................................................... 20
1.3.1 O uso das simulações moleculares para modelar fase condensada é
legítimo?................................................................................................................... 20
1.3.2 Legitimando as simulações de dinâmica molecular.................................... 21
1
1 – Introdução
1.1 - Enzimas Proteolíticas
As enzimas proteolíticas ou proteases pertencem ao grupo das hidrolases as quais
têm em comum o envolvimento da água na formação do produto. Estas enzimas
catalisam a reação de hidrólise que cliva as ligações peptídicas de proteínas e peptídeos
(Mckerrow, Sun et al., 1993) (Whitaker, 1993). As proteases que preferencialmente
catalisam a clivagem de ligações internas da cadeia polipeptídica são denominadas
endopeptidases ou proteinases (EC 3.4. 21-99) e aquelas que catalisam a clivagem de um
ou dois ou até três resíduos somente nas extremidades amino-terminal (aminopeptidases)
ou carboxi-terminal (carboxipeptidases) são denominadas exopetidases (EC 3.4.11-19).
A comparação do sítio ativo, mecanismo de ação e estrutura tridimensional
permite adicionalmente a subclassificação das proteases em mais quatro classes
principais de acordo com o grupo reativo no sítio ativo envolvido com a catálise
(Neurath, 1989) (Barrett, 1994). A determinação do nome das enzimas e seu código EC
associado (EC do inglês Enzyme Commission) é normatizada por um comitê
especializado, o Nomenclature Committee of the International Union of Biochemistry
and Molecular Biology (NC-IUBMB) (Bairoch, 2000; Fleischmann, Darsow et al.,
2004). Um resumo está apresentado na Tabela 1.1.
Serino proteases (EC 3.4.21): Seu sítio catalítico é composto pelos resíduos
serina, histidina e ácido aspártico, sendo a serina o resíduo principal. Esta classe constitui
o maior e mais bem caracterizado grupo de enzimas proteolíticas. Alguns exemplos são a
tripsina, a quimotripsina e a elastase. (Rawlings e Barrett, 1994a)
Cisteíno ou Tiol proteases (EC 3.4.22): Seu sítio catalítico é composto pelos
resíduos cisteína, histidina e asparagina. Estão contidas nesta classe várias catepsinas
lisossomais de mamíferos, proteases citossólicas ativadas por cálcio (calpaínas) e
proteases de origem vegetal como a papaína e a actinidina. (Rawlings e Barrett, 1994b)
Aspartil proteases ou aspártico-proteinases ou endopeptidases (EC 3.4.23): Seu
sítio catalítico é composto por dois resíduos de ácido aspártico que se encontram
geométricamente próximos. Incluem-se neste grupo a pepsina e a renina. (Rawlings e
Barrett, 1995)
2
Metalo proteases ou metaloendopeptidases (EC 3.4.24): Seu sítio catalítico
apresenta um íon metal que desempenha papel essencial na ligação do substrato. Além do
metal, participam do processo catalítico dois ácidos glutâmicos e uma histidina.
As enzimas cujo mecanismo de ação não está completamente elucidado são
classificadas no subgrupo EC. 3.4.99.
Classe tio Ativo Classificão
Cisteino Cys,His, (Asn,Glu) EC 3.4.22
Aspartil 2xAsp EC 3.4.23
Serino Ser,His,Asp EC 3.4.21
Metalo Metal,2xGlu, His EC 3.4.24
Sem classe não definido EC. 3.4.99
Tabela 1-1: Resumo das classes de enzimas proteolíticas e
sua classificação (Bairoch, 2000; Fleischmann, Darsow et
al., 2004)
As proteases podem ainda ser subdivididas de acordo com a faixa de pH de
atividade ótima. As proteases ácidas possuem atividade na faixa de pH 2.0 a 5.0,
perdendo rapidamente sua atividade em valores de pH mais elevados. As proteases
neutras possuem atividade entre pH 7.0 a 8.0. O terceiro grupo de proteinases, são as
proteinases alcalinas tendo pH de atividade entre 9.0 e 11.0 (Bohnensack e Hofmann,
1970).
1.1.1 - Função biológica das proteases
As proteases participam ativamente em diversos processos fisiológicos. Estas
enzimas estão envolvidas em processos biológicos essenciais como a digestão celular,
reciclagem de tecido ósseo, diferenciação celular, agregação plaquetária, regulação da
pressão arterial, etc. A desregulação do controle destas proteases pode resultar numa série
de patologias associadas a uma degradação excessiva de proteínas, tais como: distrofia
muscular, esclerose múltipla, infarto do miocárdio, redução do tecido ósseo e artrite
(Leung-Toung, Zhao et al., 2006). As proteases também atuam em várias etapas
proteolíticas importantes que ocorrem em processos fisiopatológicos como o mecanismo
3
invasivo de tumores e no ciclo de infecção de um grande número de vírus e
microrganismos patogênicos além de enfisema pulmonar, doença de Alzheimer e outras
formas de demência. Estes fatos tornam as proteases um alvo quimioterápico muito
valioso para o desenvolvimento de novos compostos farmacêuticos. A diversidade dos
processos em que as proteases participam reflete a grande especificidade alcançada por
esse grupo de enzimas (Carvalho, 2003).
As enzimas proteolíticas são amplamente utilizadas nas indústrias de
biotecnologia e estão entre os três maiores grupos de enzimas industriais, sendo
responsáveis por 60% da venda internacional de enzimas. As proteases têm uma
variedade de aplicações, principalmente na indústria de detergentes e de alimentos.
Tendo em vista os recentes acordos mundiais para uso de tecnologias não poluentes, as
proteases começaram a ser utilizadas em larga escala no tratamento do couro, em
substituição aos compostos tóxicos e poluentes até então usados.
Na indústria farmacêutica, as proteases são usadas em pomadas cicatrizantes e
têm um uso potencial para outros medicamentos tópicos (Rao, Tanksale et al., 1998). Na
indústria de alimentos são usadas nos processos de fermentação e produção de alimentos
orientais derivados da soja como: molho soja, missô e tempê, na produção de gelatina
hidrolisada e leite de soja (Workman, Mclinden et al., 1986), são utilizadas para a
produção de pães com massa macia com o resultado da hidrólise do glúten (Lyons, 1988),
na clarificação de sucos através da hidrólise das proteínas solúveis neles contidas em
altas concentrações, as quais provocam turbidez e formação de sedimentos indesejáveis
durante a estocagem (Dawes, Struebi et al., 1994).
4
1.1.2 - Cisteíno Proteases - A Super-Família da Papaína
As cisteíno proteases ou enzimas dependentes de tiol possuem dois resíduos que
se encontram diretamente envolvidos no processo catalítico: a cisteína e a histidina. Estes
aminoácidos apresentam-se como um zwitterion onde o grupo tiol nucleofílico da cisteína
encontra-se ionizado e a histidina catalítica protonada (Carvalho, 2003). A primeira
enzima a ser classificada como cisteíno protease foi isolada do látex do mamão papaia e
por isso, denominada papaína (Storer e Menard, 1994).
De acordo com suas semelhanças estruturais e funcionais As cisteíno-proteases de
diversas origens podem ser divididas em 3 superfamílias (Tabela-1.2). A família da
papaína, da qual pertencem cisteíno proteases de plantas (caricaína, bromelaína e
actinidina), mamíferos (proteases lisossomais como catepsina B, L, H, S, C e K) e
protozoários (cruzipaínas, falcipaínas e Lmcps de Leishmania) compõem a superfamília
CA, a maior dentre as superfamílias (Mckerrow, Sun et al., 1993) (Fleischmann, Darsow
et al., 2004).
Superfamílias de Aminoácidos
cisteíno-proteases tio Catalítico
CA Papaína Cys, His, Asn
CD Caspase His, Cys
CE Endopeptidase de Adenovírus His, Glu, Cys
Proteases representativas
Tabela 1.2: As famílias de cisteíno proteases (Barrett, A. J., 1993; Barrett, A. J, 2004).
Por serem abundantes e apresentarem estabilidade às condições dos experimentos
de bancada, as cisteíno proteases de plantas constituíram o primeiro foco de estudo sobre
esta classe de enzimas e a maioria das informações a respeito destas enzimas acabou
vindo das análises realizadas com a papaína e era previsível que esta enzima seria a
5
primeira cisteíno protease a ter sua estrutura tridimensional resolvida por difração de
Raios-X (Drenth, Jansonius et al., 1968; Kamphuis, Kalk et al., 1984; Schroder, Phillips
et al., 1993). Estas investigações pioneiras revelaram que a papaína é uma enzima
globular formada por dois domínios em uma única cadeia, que delimitam a região da
fenda catalítica, o que foi confirmado com as demais enzimas previamente classificadas
como pertencentes da família da papaína.
Figura-1.1: Estrutura cristalográfica da papaína. Em destaque é
mostrado o par iônico Cys25 e His159. Em vermelho estão as hélices
em ciano estão as fitas beta.
1.1.2.1 - O sítio ativo das cisteíno proteases da família da papaína
Seguindo a numeração da papaína, a partir da seqüência madura da enzima, o sítio
ativo desta família de enzimas é composto por uma tríade catalítica formada pela cisteína
na posição 25, a Cys25, uma histidina na posição 159, a His159, e uma asparagina na
posição 175, Asn175. A cisteína e a histidina encontram-se em domínios opostos
formando o par iônico estável em pH neutro responsável pela atividade catalítica (Lewis,
Johnson et al., 1981).
O mecanismo de catálise das cisteíno proteases (Figura-1.2) baseia-se
principalmente em dados experimentais, e em analogia com o mecanismo das serino
proteases. Inicialmente, o sítio ativo existe como um zwitterion: o grupo tiol da cisteína
25 ionizado e o anel imidazólico da histidina 159 protonado na forma Cys25
(-)...
His159
(+)
.
6
A primeira etapa da reação de hidrólise é a ligação não covalente entre enzima e substrato
protéico ou peptídico, formando o complexo de Michaelis (ES).
Em seguida, o ânion tiolato (Cys25-SG
(-)
) altamente reativo da Cys25 realiza o
ataque nucleofílico ao átomo de carbono do grupamento carbonil da ligação peptídica
formando o estado transitório de ligação tetraédrico covalente substrato/enzima. Neste
ponto, acredita-se que a His159
(+)
transfira um próton para o átomo do nitrogênio
peptídico do substrato iniciando a clivagem da ligação peptídica (C-NH). A porção amina
do substrato é substituída por uma molécula de água que hidrolisa o intermediário acil-
enzima restaurando a enzima para o seu estado original (Beveridge, 1996).
Além do par iônico formado pela Cys25 e His159, outros resíduos conservados
são de grande importância para atividade catalítica desta classe de enzimas (Carvalho,
2003). O oxigênio da amida contida na cadeia lateral da asparagina na posição 175 forma
uma ligação de hidrogênio com o nitrogênio da His159, formando a tríade Cys-His-Asn
análoga à tríade Ser-His-Asp das serino proteases.
Estudos indicam que esta ligação de hidrogênio permite a rotação da cadeia lateral
do imidazol da His159 para posições ótimas durante os diferentes passos do mecanismo
catalítico (Beveridge, 1996). Outro aminoácido importante presente na fenda catalítica é
a glutamina 19. Foi proposto que a cadeia lateral da Gln19 e o grupamento amida da
Cys25 tenham importância para a atividade catalítica. O aumento da atividade catalítica
poderia ser atribuído à estabilização de um dos estados de transição; acredita-se que o
ataque nucleofílico do carbono do carbonil do substrato pelo ânion tiolato da Cys25 seria
facilitado pela ligação do oxigênio do carbonil dentro da cavidade oxi-aniônica formada
pelo NH da Cys25 e pela cadeia lateral da Gln19 (Menard, Carriere et al., 1991).
7
Como os resíduos que compõem o par iônico (Cys25-His159) estão localizados
em domínios opostos, acredita-se que um movimento de alargamento da fenda possa
ocorrer durante a catálise. Este movimento seria necessário não só para acomodar o
substrato como também para aumentar a nucleofilicidade do grupo tiolato da Cys25
(Drenth, Kalk et al., 1976; Beveridge, 1996). Sendo assim, as interações interdomínios e
a distância do par iônico durante a acomodação do substrato podem ser importantes
durante o processo catalítico.
Figura 1.2: Ilustração do mecanismo de catálise comum as cisteíno-proteases (Beveridge, 1996).
Estudos realizados por Schechter e Berger em 1967 revelaram que a papaína
possui um extenso sítio ativo, formado por sete bolsões ou subsítios (S
4
a S’
3
), através
dos quais a enzima seria capaz de interagir com resíduos do substrato polipeptídico (P
4
a
P’
3
) (Schechter e Berger, 1967). A partir desses dados, Schechter e Berger propuseram
um modelo para descrever as interações enzima-ligante, onde cada subsítio (S
x
) da
enzima é definido pela região da enzima que interage com o aminoácido (P
x
) do substrato
8
peptídico. Por este modelo, aqueles resíduos localizados na porção amino terminal são
denominado P
1
,P
2,
...P
n
e aqueles que localizados na porção carboxi terminal da ligação a
ser hidrolisada são denominados P’
1
, P’
2
, ...P’
n
(Figura-1.3A).
P4 P3 P2 P1 P1’ P2’ P3’
COOH
H
3
N
+
Sítio de Clivagem
S4 S3 S2 S1 S1’ S2 S3’
P4 P3 P2 P1 P1’ P2’ P3’
COOH
H
3
N
+
Sítio de Clivagem
S4 S3 S2 S1 S1’ S2 S3’
Figura-1.3A: Esquema da terminologia usada para descrever as interações enzima-ligante.
As interações entre aminoácidos de polipeptídeos com os resíduos localizados nos
subsítios S da enzima irão determinar a especificidade de substrato da enzima. Este
modelo simples de bolsões de interação do tipo chave fechadura ainda é impreciso
devendo ser considerado um maior refinamento, que considere as propriedades
eletrostáticas de cada bolsão do sítio ativo bem como as propriedades para cada porção
do ligante, para que as interações de ligação sejam melhor compreendidas (Figura 1.3B).
Além disso, a complementariedade enzima-ligante é ajustada em um processo dinâmico
de acoplamento entre cadeias flexíveis.
P4 P3 P2 P1 P1’ P2’ P3’
COOH
H
3
N
+
Sítio de Clivagem
S4 S3 S2 S1 S1’ S2’ S3’
Neutro
Positivo
Negativo
P4 P3 P2 P1 P1’ P2’ P3’
COOH
H
3
N
+
Sítio de Clivagem
S4 S3 S2 S1 S1’ S2’ S3’
Neutro
Positivo
Negativo
Figura-1.3B: Esquema da terminologia usada para descrever as interações enzima-ligante,
exemplificando a variabilidade de propriedades em um sítio de ligação e substrato.
9
1.1.3 - As Cisteíno Proteases Lisossomais de Mamíferos
Os membros desta classe de enzimas incluem as catepsinas lisossomais B, L, H e
S (Barrett e Kirschke, 1981; Kirschke, Wikstrom et al., 1988). Devido ao alto grau de
similaridade entre algumas das cisteíno proteases de mamíferos e a papaína, é possível
extrapolarmos os dados experimentais contidos na literatura sobre a papaína e inferir
informações a respeito dos detalhes estruturais e do mecanismo de catálise das catepsinas
humanas.
Apesar das similaridades estruturais entre estas enzimas, diferenças significantes
de afinidade de substrato entre a papaína e as catepsinas foram relatadas (Menard,
Carmona et al., 1993). A catepsina B, por exemplo, possui uma especificidade
endopeptidásica ampla como a papaína, entretanto, apresenta propriedades catalíticas
para hidrólise de substrato que se distinguem significativamente da papaína.
A natureza do resíduo na posição P
2
é um fator predominante na definição da
especificidade de substratos desta superfamília, em sua base peptídica forma importantes
pontes de hidrogênio como a com a Gly66. Enquanto a papaína exibe uma forte
preferência por aminoácidos com cadeias laterais hidrofóbicas volumosas em P
2
(Phe), a
catepsina B aceita um aminoácido básico (Arg) tão bem quanto Phe no seu sub-sítio S
2
(Barrett e Kirschke, 1981). O sub-sítio S
2
é considerado um bolsão de especificidade
formado na papaína pelos resíduos Pro68, Val133, Val157, Ala160 e Ser205. A catepsina
L, apesar da sua especificidade não estar bem definida, seu subsítio S
2
prefere resíduos
hidrofóbicos como ocorre na papaína (Carvalho, 2003).
10
1.1.4 - Cisteíno Proteases de Protozoários e de Parasitas
Muitos parasitas como vírus, bactéria, protozoários e vermes helmintos evoluíram
para formas extremamente adaptadas à vida em seus hospedeiros, tanto no interior de
células como em ambientes extracelulares de hospedeiros como o plasma e a matriz
extracelular. O sucesso desses parasitas depende do cumprimento de algumas etapas
fisiológicas fundamentais que compõe seu ciclo biológico como: a invasão do organismo
hospedeiro, a utilização de biomoléculas do hospedeiro como fonte de alimento,
proliferação, reprodução e disseminação e ainda a evasão ao sistema imune do
hospedeiro (Carvalho, 2003).
Estudos exaustivos têm demonstrado que as enzimas proteolíticas cumprem um
papel de grande importância na adaptação destes parasitas (Cazzulo, Stoka et al., 1997).
Dentre as diversas funções sugeridas para as proteases de parasitas destacam-se a
degradação de tecido conjuntivo para facilitar a invasão da célula hospedeira, o
catabolismo de proteínas do hospedeiro para fins nutricionais, evasão e modulação do
sistema imune pela degradação ou ativação de moléculas efetoras ou modulatórias,
interação com o sistema fibrinolítico e de coagulação sangüínea do hospedeiro e em
alguns casos a participação na diferenciação do parasita durante a transição de um estágio
morfológico para outro (Mckerrow, Sun et al., 1993).
Em vista das muitas funções exercidas no ciclo de vida de parasitas, as proteases
têm sido vistas, cada vez mais, como alvos potenciais para o desenvolvimento de
fármacos (Mcgrath, Eakin et al., 1995; Engel, Doyle et al., 1998; Rosenthal, 2004).
Na tentativa de inibir somente as proteases de parasitas em um hospedeiro
infectado é necessário que se obtenham fármacos de altas seletividade e especificidade,
11
devendo inibir apenas as enzimas dos parasitas, sem interferir de forma significativa nas
atividades do organismo hospedeiro, para que o candidato a inibidor seja o menos tóxico
possível. Muitos estudos confirmaram a eficácia de inibidores peptídeo-miméticos e
confirmaram sua eficiência em vivo (Sajid e Mckerrow, 2002). Entretanto podemos nos
beneficiar em muito do uso de inibidores não peptídicos com mais características de
fármaco (drug-like) a fim de evitar a degradação do fármaco pelas demais proteases do
organismo alvo ou mesmo pelas proteases do hospedeiro, mantendo, mesmo em baixas
concentrações, seu potencial para alta atividade in vivo.
O desenvolvimento de fármacos de alta especificidade é uma tarefa bastante
complexa tendo em vista o alto grau de similaridade encontrado entre as proteases dos
organismos parasitas e de seus hospedeiros (Carvalho, 2003). Foram identificadas
cisteíno-proteases em uma série de espécies de Leshmania, nos Plasmodium sp.
(malária), e nos tripanossomatideos como Trypanosoma brucei, (doença do sono) e no
Trypanosoma cruzi (doença de chagas) (Mckerrow, Sun et al., 1993; Rosenthal, 2004).
Em todos estes casos, estas enzimas parecem desempenhar funções essenciais à
sobrevivência destes protozoários.
1.1.5 - O Composto E-64, um Inibidor Irreversível de Cisteíno Proteases.
A avaliação da interação dos inibidores em complexo com cisteíno proteases
ajuda no entendimento do mecanismo de ação dos inibidores e dá fundamento ao
desenvolvimento de compostos com melhor capacidade e seletividade na inibição.
O E-64 [[(L-trans-epoxisuccinil)-leucilamino]-4-guanidinobutano] (Figura 1.4)
foi originalmente identificado como produto do fungo Aspergillus japonicus, quando foi
12
isolado e caracterizado como um potente inibidor irreversível e com alta especificidade
para cisteíno proteases. Este composto é formado por um grupo transepoxidosuccinil e
um dipeptídeo modificado: [(leucilamino)-4-guanidinobutano] (Hanada, Tamai et al.,
1978; Barrett, Kembhavi et al., 1981; Barrett, Kembhavi et al., 1982).
O mecanismo de inibição irreversível é descrito pela formação de ligação
covalente do carbono C2 do grupamento L-trans-epoxisuccinil (grupo ativo) com o
enxofre do grupo tiol da cisteíno protease alvo. O E-64 é um inibidor muito útil para os
ensaios in vivo por que é específico, permeável às células e tecidos, tem baixa toxicidade,
é estável em solução e é facilmente sintetizado. (Katunuma e Kominami, 1995).
Por estas características, o E-64 tornou-se estrutura base (lead structure) para o
desenvolvimento de fármacos para suprimir níveis elevados da atividade de cisteíno
proteases associadas a certas doenças, tal como a distrofia muscular (Komatsu, Inazuki et
al., 1986) e osteoporose (Rich, 1986).
Figura 1.4: O inibidor E64. ( L-trans-Epoxysuccinyl-leucylamido(4-guanidino)butane )
13
1.1.6 – Resistência aos inibidores
O uso de inibidores de proteases, entretanto pode gerar uma rápida seleção de
mutantes resistentes como foi observado por Singh e Roshenthal (Singh e Rosenthal,
2004) num estudo com cepas de Plasmodium falciparum. Estes autores mostraram que a
pressão seletiva de inibidores de cisteíno proteases resultou em mudanças complexas nos
parasitas, envolvendo aumento de cópias no genoma do gene que codifica a protease
inibida, bem como aparecimento de novas vias de transporte ainda desconhecidas para a
extrusão do fármaco. Esta é uma nova preocupação na pesquisa de fármacos porque
agora temos também que contornar a ativação destes mecanismos de resistência a
múltiplas drogas na hora de desenvolver uma formulação.
1.2 - A Malária
A malária é uma doença infecciosa causada por protozoários do gênero
Plasmodium transmitidos pelas fêmeas de mosquitos anofelinos que durante o repasto
sanguíneo inoculam no ser humano as formas infectantes do parasita (esporozoítos)
(Veronesi, 1997). Dentre as espécies conhecidas de Plasmodium apenas quatro são
conhecidamente capazes de se desenvolver no organismo humano atuando como agentes
etiológicos da malária humana. São elas a Plasmodium vivax, causadora da febre terçã
benigna ou malária não complicada; Plasmodium malarie, causadora da febre quartã
benigna; Plasmodium ovale, causadora da febre terçã benigna e restrita ao continente
africano; e finalmente a Plasmodium falciparum, causadora da terçã maligna e agente da
forma mais letal da malária humana (Veronesi, 1997).
14
1.2.1 - O ciclo biológico do parasito.
Na Figura 1.5 é ilustrado o ciclo biológico do Plasmodium no organismo humano.
1.2.1.1 - Ciclo no Homem (Ciclo Assexuado):
As formas infectantes do parasita, esporozoítos, são transmitidas ao homem
através da picada do mosquito fêmea do gênero Anopheles. Durante o repasto sangüíneo
os esporozoítos alojados nas glândulas salivares do inseto são injetados no hospedeiro
humano junto à saliva anticoagulante do mosquito, entrando na corrente sanguínea.
Seguindo o fluxo sangüíneo os esporozoítos invadem os hepatócitos (células do fígado),
aonde se multiplicam por reprodução assexuada e se diferenciam à forma de merozoíto.
Em excesso nos hepatócitos, os merozoítos rompem o hepatócito e atingem novamente a
corrente sanguínea para agora invadir os eritrócitos (hemácias). Nos eritrócitos,
diferenciam-se em trofozoítos e através da esquizogonia (reprodução assexuada por
mitose), cada trofozoíto origina células filhas, chamadas de merozoítos. Os merozoítos
provocam a ruptura da hemácia, e ficam livres no sangue. A partir daí, podem invadir
novas hemácias, como anteriormente, ou invadir células jovens da medula. As febres
periódicas, características da doença, existem devido ao rompimento periódico dos
eritrócitos, e é exatamente por isso que a malária também é chamada de febre terça ou
quartã (dependendo do ciclo de 3 ou 4 dias, respectivamente). Alguns dos parasitos se
diferenciam em células sexuais, os gametócitos: o macrogametócito a fêmea e o
microgametócito o macho, que permanecem certo tempo na circulação do hospedeiro
humano e podem ser ingeridas por uma outra fêmea de Anopheles reiniciando o ciclo no
mosquito.
15
1.2.1.2 - Ciclo no Mosquito (Ciclo Sexuado)
Durante o repasto sangüíneo, a fêmea do mosquito Anopheles ingere os
gametócitos presentes no hospedeiro humano. No organismo do inseto ocorre a
fecundação, e a formação do zigoto. Os zigotos penetram nas células intestinais e formam
um cisto. Dentro do cisto ocorre a esporogônia (reprodução assexuada por meiose)
formando as formas infectantes que em certo ponto rompem o cisto e migram para as
glândulas salivares do inseto. A partir daí, o Anopheles é capaz de infectar outras vítimas
e dar continuidade ao ciclo. Portanto, por definição, o homem é o hospedeiro
intermediário onde ocorre reprodução assexuada, e o mosquito é o hospedeiro definitivo
onde ocorre reprodução sexuada.
Figura-1.5: O Ciclo Biológico da Malária. Adaptado de Miller,2002. (Miller,
Baruch et al., 2002).
1.2.2 - Magnitude e Distribuição geográfica.
A malária persiste como uma das mais importantes doenças infecciosas do
mundo. Ela está presente em mais de 90 países atingindo as regiões tropicais e
subtropicais do planeta. Estima-se que cerca de 41% da população mundial vive em áreas
16
de risco de contágio. Os maiores focos de transmissão são a África Sub-Sahariana onde
ocorrem 86% dos casos no mundo (Figura 1.6). A malária é endêmica em 53 países na
África (incluindo 8 países ao sul), em 21 países nas Américas, 4 países na Europa e 14 na
região leste do Mediterrâneo, e no sudeste Asiático. Estima-se que a cada ano existam de
300 à 500 milhões de casos, com cerca de 1 à 3 milhões de óbitos (Fidock, Rosenthal et
al., 2004). Estes óbitos ocorrem essencialmente no continente Africano, em áreas remotas
com difícil acesso aos serviços de saúde. Dos 25 a 30 milhões de pessoas que viajam para
áreas endêmicas, entre 10 a 30 mil contraem malária.
Região / Índice AFRO AMRO EMRO EURO SEARO WPRO Total
Morbidade 342.814.347 3.798.292 14.894.969 - 32.930.363 2.238.314 396.676.285
Porcentagem 86% 1% 4% 0% 8% 1% 100%
Mortalidade 962.736 1.445 54.570 160 94.380 10.474 1.123.765
Porcentagem 86% 0% 5% 0% 8% 1% 100%
Região / Índice AFRO AMRO EMRO EURO SEARO WPRO Total
Morbidade 342.814.347 3.798.292 14.894.969 - 32.930.363 2.238.314 396.676.285
Porcentagem 86% 1% 4% 0% 8% 1% 100%
Mortalidade 962.736 1.445 54.570 160 94.380 10.474 1.123.765
Porcentagem 86% 0% 5% 0% 8% 1% 100%
Figura-1.6: A distribuição global da malária por região administrativa da OMC. (Hay, Guerra et al.,
2004)
A difusão geográfica e emergência contínua de formas resistentes de parasitas da
malária humana às principais drogas antimaláricas (Rogier, Pradines et al., 2005), em
especial a espécie Plasmodium falciparum, agente da forma mais letal de malária,
associados a práticas deficientes de tratamento e de prevenção, são considerados fatores
chave para a persistência desta enfermidade como um grave problema de saúde mundial.
A maioria dos fármacos antimaláricos usados atualmente não foi desenvolvida baseada
em alvos racionalmente identificados, mas na identificação de atividade antimalárica de
17
produtos naturais (Fidock, Rosenthal et al., 2004). Na esperança de contornar esta
adversidade, diversos alvos bioquímicos em potencial têm sido propostos e perseguidos
para o projeto racional de novos antimaláricos (Tabela-1.2) (Olliaro e Yuthavong, 1999;
Fidock, Rosenthal et al., 2004).
Local do alvo Via metabólica/Mecanismo Molécula alvo
Terapias Existentes Novos compostos
Citosol Metabolismo do Folato Dihidrofolato redutase Pirimetamina, proguanil Cloroproguanil
Dihidrofolato sintase Sulfadoxina, dapsona.
Glicolise Thimidilato sintase 5-fluoroorotato
Lactato deshidrogenase Derivados do Gossipol
Peptideo deformilase Actinonina
Síntese de proteínas Proteína de choque térmico 90 Geldanamicina
Metabolismo da glutationa Glutationa redutase Inibidores enzimaticos
TranSduçao de sinal Cinases proteicas Derivados de oxindol
Desconhecido Ca2+-ATPase Artemisininas
Membrana do Parasita Síntese de fosfolipídios Transportador de colina G25
Transporte de membrana Canais únicos Quinolinas Dimeros de dinucleoside
o
Transportador de hexose Derivados de hexoses
Vacúolo digestivo Polimerização da Heme Hemozoína Cloroquina Novas quinolinas
Hidrolize da Hemoglobina Plasmepsinas Inibidores de protease
Falcipaínas Inibidores de protease
Geração de radicais livres Desconhecido Artemisininas Novos peróxidos
Mitocôndria Transporte de elétrons Citocromo c oxidoredutase Atavaquona
Apicoplasto Síntese de proteínas Ribossomo do apicoplasto Tetraciclinas, clindamicina
Síntese de DNA DNA girase Quinolinas
Transcrição RNA Polimerase Rifampin
Biosíntese de ácidos graxos FabH Tiolactomicina
FabI/PfENR Triclosan
Síntese de isoprenoides DOXP reductoisomerase Fosmidomicina
Farnesilasão de proteínas Farnesil transferase Peptideo miméticos
Extracelular Invasão do eritrócitos Serino proteases Subtilisinas Inibidores de protease
Exemplos de terapias
Tabela 1.2: Atuais alvos moleculares e a
s
novas propostas de alvos terapêuticos para o combate a
Malária (Fidock, Rosenthal et al., 2004).
1.2.3 A Falcipaína-2
Dentre os alvos mais promissores destacam-se as proteases que hidrolisam a
hemoglobina e são conhecidas por representarem papéis vitais em vários estágios do ciclo
de vida do parasita (Klemba e Goldberg, 2002; Rosenthal, Sijwali et al., 2002). O ciclo
intraeritrocítico de infecção é responsável pela manifestação clínica da malária em
humanos. No vacúolo digestivo dos trofozoítos intraeritrocíticos do Plasmodium
falciparum a hemoglobina é hidrolisada em aminoácidos (Rosenthal e Meshnick, 1996),
que são essenciais para a sobrevivência do parasita. Proteases como metalo (Eggleson,
Duffin et al., 1999), aspartil (Francis, Gluzman et al., 1994) e cisteíno proteases (Sajid e
18
Mckerrow, 2002) são as hemoglobinases mais encontradas no vacúolo digestivo do
parasita.
As Falcipaínas (FP) são enzimas essenciais para o metabolismo e ciclo de vida do
Plasmodium falciparum, porque participam ativamente da degradação da hemoglobina e
das etapas de saída do parasita do eritrócito (Rosenthal e Meshnick, 1996) (Soni, Dhawan
et al.). As falcipaínas são classificadas como cisteíno-proteases, enzimas que possuem
um resíduo de cisteína atuando como agente nucleofílico no processo de catálise do seu
substrato. Diversos trabalhos têm demonstrado que o uso de inibidores contra as
Falcipaínas impede o desenvolvimento de parasitas em cultura e consegue curar a malária
em modelo animal (Soni, Dhawan et al., 2005).
Com a conclusão do genoma do P. falciparum, quatro cisteíno proteases do tipo
papaína puderam ser identificadas, caracterizadas e isoladas até agora. A Falcipaína-1 foi
identificada em parasitas eritrocíticos e mostrou-se que esta hidrolisa a hemoglobina
(Salas, Fichmann et al., 1995). Entretanto, a sua baixa abundância e as dificuldades no
desenvolvimento de sistemas de expressão adequados limitaram os estudos.
Recentemente, três cisteíno proteases proximamente relacionadas foram
identificadas. A Falcipaína-2 (FP2 ou FP2A) mostrou ser uma das principais cisteíno
proteases e hemoglobinases do trofozoíto (Shenai, Sijwali et al., 2000), a Falcipaína-3
(FP3) foi identificada no vacúolo digestivo do parasita (Rosenthal, Sijwali et al., 2002) e
com o fim da anotação do genoma foi identificada a Falcipaína-2’ (FP2´ ou FP2B). Estas
proteases requerem um ambiente redutor e um pH ácido para atividade ótima. Entretanto
a Falcipaína-3 torna-se uma enzima ativa apenas em pH ácido. Ela é mais ativa e mais
estável neste pH, e com maior atividade contra a hemoglobina nativa. Foi estimado que a
19
concentração de Falcipaína-2 nos trofozoítos é 1.8 vezes maior que a da Falcipaína-3;
entretanto a última aparentemente cliva a hemoglobina com o dobro da velocidade da
primeira (Rosenthal, Sijwali et al., 2002) fazendo com que a contribuição relativa das
duas enzimas para a hidrólise de hemoglobina nativa seja essencialmente equivalente, o
que torna as Falcipaínas 2A e 3 importantes alvos para inibição da degradação da
hemoglobina. Ainda há pouco descrito sobre Falcipaína-2B fora sua identificação no
genoma e seu papel ainda permanece desconhecido.
Estes achados implicam que os inibidores para estas enzimas podem servir como
potenciais vias para a quimioterapia antimalárica (Rosenthal, Sijwali et al., 2002). De
fato, vários estudos mostraram que inibidores de cisteíno proteases bloquearam a
hidrólise da globina e o desenvolvimento de parasitas em cultura (Rosenthal, Wollish et
al., 1991; Ring, Sun et al., 1993; Rosenthal, Olson et al., 1996; Olson, Lee et al., 1999).
Alguns inibidores de Falcipaína-2 também foram desenvolvidos baseados no seu modelo
por Modelagem Comparativa e mostraram ser ativos em concentração micromolar baixa
(Sabnis, Rosenthal et al., 2002). Assim como as FP-1, FP-2B, FP-3, a estrutura da FP-2A
ainda não foi elucidada experimentalmente, apesar desta estrutura já ter as reflexões
cristalográficas depositas no PDB pelo grupo do Dr. Mckerrow o produto do refinamento
ainda não foi publicado.
20
1.3 Métodos Computacionais.
A caracterização funcional de uma seqüência de proteína é um dos problemas
mais freqüentes na biologia. Esta tarefa é facilitada pela determinação da estrutura
tridimensional (3D) de alta resolução da proteína estudada. A modelagem por
comparativa, técnica fundamentada na similaridade seqüencial e estrutural entre várias
proteínas da mesma família, oferece uma boa alternativa para a obter de estruturas para
estudos de interação com drogas. Neste trabalho a modelagem comparativa de proteínas
foi empregada para obter modelos de estrutura tridimensional (3D) para Falcipaína-2. Os
modelos resultantes foram validados usando ferramentas de verificação de estrutura e
geometria assim como foram efetuados estudos de estabilidade e de interação com drogas
conhecidas por Dinâmica Molecular.
1.3.1 O uso das simulações moleculares para modelar fase condensada é legítimo?
Já se passam 28 anos desde a publicação do primeiro trabalho de Dinâmica
Molecular (DM) de uma proteína, a BPT1 (Mccammon, Gelin et al., 1977). Neste tempo,
as simulações de DM se estabeleceram como poderosa ferramenta complementar às
técnicas experimentais, porém quando se fala em Dinâmica Molecular às vezes surge esta
questão sobre a legitimidade da técnica.
De uma forma rigorosa, o estudo completo de um sistema químico necessitaria
que fosse resolvida a equação de Schrödinger dependente do tempo para o conjunto
completo de elétrons e núcleos. Pela alta complexidade dos cálculos neste tipo de
abordagem é evidente, que mesmo com os progressos nos sistemas computacionais, ainda
não é possível realizar esta tarefa para sistemas muito maiores que uma centena de
21
átomos. Para os sistemas moleculares maiores, temos que nos restringir às descrições
clássicas ou a métodos híbridos que associam a descrição quântica com a clássica. Ainda
assim, pelas limitações computacionais para alcançar escalas de tempo em que alguns dos
eventos moleculares acontecem (como o enovelamento de proteínas que pode levar
microssegundos) o número de partículas das simulações moleculares clássicas e híbridas
continua restrito a poucas centenas de milhares de átomos, quantidade ainda muito
inferior ao número de Avogrado.
1.3.2 Legitimando as simulações de dinâmica molecular.
O princípio da dinâmica molecular é simples, consiste na geração de trajetórias
para um ensamble finito de partículas integrando numericamente as equações clássicas do
movimento. Este enfoque, em princípio discutível, encontra justificação em fatos
importantes:
a) pela aproximação de Born-Oppenheimer, é possível dissociar o movimento dos
núcleos e dos elétrons.
b) considerando que na maior parte dos casos, o comprimento de onde de de
Broglie é muito mais curto que as distâncias intermoleculares típicas, os efeitos quânticos
podem ser dispensados com segurança.
As trajetórias calculadas por este enfoque são utilizadas para determinar
propriedades estáticas e dinâmicas na forma de médias temporais, que, para sistemas
ergódicos, coincidem com as médias estatísticas, porém, os tempos hoje em dia
alcançáveis às simulações de DM de macromoléculas são ainda pequenos para que as
22
médias temporais possam ser
igualadas, porém consideradas próximas às médias
estatísticas desses sistemas:
AA
t
t
=
lim
Equação 1
onde que representa qualquer propriedade observável.
Α
t
Α
é a média temporal e
A
,
sua média estatística.
As simulações ajudam na compreensão dos processos bioquímicos e dão uma
dimensão dinâmica aos dados estruturais. Por causa disto, tornaram-se a ferramenta
chave para a investigação de biomoléculas. Com este método podemos partir de
estruturas obtidas experimentalmente ou de modelos e simular comportamentos das
proteínas em solução através de cálculos computacionais. Desta forma é possível
monitorar, em escala atômica, mudanças conformacionais da molécula que estejam
associadas a sua atividade biológica na escala de nanossegundos. Podemos também
estudar interações da proteína com os possíveis ligantes fisiológicos e a importância
destas interações para a estabilidade e/ou atividade biológica das Falcipaínas, em nosso
caso. Já é possível realizar simulações de sistemas grandes usando funções mais realistas
de contorno e melhor amostragem, sendo assim comum encontrar na literatura
simulações mais realistas de sistemas tão complexos quanto canais transmembranares.
Isto é possível graças ao aumento progressivo da capacidade de processamento dos
computadores e melhorias consideráveis nos campos de forças, que descrevem as
interações atômico-moleculares, e das ferramentas de modelagem molecular.
A última década foi marcada por uma revolução no planejamento racional de
fármacos ao agregar as simulações computacionais como alternativa extremamente
23
poderosa e economicamente viável para substituir e acelerar grande parte dos processos
no desenvolvimento farmacêutico.
Quando se planeja uma das terapias farmacológica, independente que o objetivo a
ser alcançado seja o combate a um organismo patogênico, a regulação da pressão arterial
ou o tratamento de uma simples cefaléia, a especificidade do fármaco ao seu alvo
molecular é um dos fatores de maior relevância quanto à limitação da eficácia destas
terapias. Entretanto a interação de um fármaco com o sítio alvo de ação em um sistema
biológico vai muito além do modelo clássico chave-fechadura. A definição de sua fase
farmacodinâmica de ação envolve forças de interação intermolecular como interações
hidrofóbicas, polares, eletrostáticas e estéricas. Estas interações podem ser descritas por
uma série de funções matemáticas, com parâmetros ajustados experimentalmente,
conhecidas como
campo de forças.
Esta dissertação está organizada em 9 capítulos. A seguir são expostos detalhes
dos métodos empregados, os procedimentos e protocolos de simulações, resultados e
discussões, finalizando com as conclusões gerais.
24
Referências do Capítulo 1.
Bairoch, A. The ENZYME database in 2000.
Nucleic Acids Res, v.28, n.1, Jan 1, p.304-
5. 2000.
Barrett, A. J. Classification of peptidases. Methods Enzymol, v.244, p.1-15. 1994.
Barrett, A. J., A. A. Kembhavi, et al. L-trans-Epoxysuccinyl-leucylamido(4-
guanidino)butane (E-64) and its analogues as inhibitors of cysteine proteinases including
cathepsins B, H and L. Biochem J, v.201, n.1, Jan 1, p.189-98. 1982.
______. E-64 [L-trans-epoxysuccinyl-leucyl-amido(4-guanidino)butane] and related
epoxides as inhibitors of cysteine proteinases. Acta Biol Med Ger, v.40, n.10-11, p.1513-
7. 1981.
Barrett, A. J. e H. Kirschke. Cathepsin B, Cathepsin H, and cathepsin L. Methods
Enzymol, v.80 Pt C, p.535-61. 1981.
Beveridge, A. J. A theoretical study of the active sites of papain and S195C rat trypsin:
implications for the low reactivity of mutant serine proteinases. Protein Sci, v.5, n.7, Jul,
p.1355-65. 1996.
Bohnensack, R. e E. Hofmann. [Theory of pH effect on enzyme kinetics]. Acta Biol Med
Ger, v.24, n.6, p.765-76. 1970.
Carvalho, M. D. L. Análises Termodinâmicas e Estruturais da Ligação de Inibidores a
Enzimas por Técnicas de Dinâmica Molecular: Uma aplicação para cisteíno proteases do
T. cruzi. Instituto de Biofísica Carlos Chagas Filho, Universidade Federal do Rio de
Janeiro, Rio de Janeiro, 2003.
Cazzulo, J. J., V. Stoka, et al. Cruzipain, the major cysteine proteinase from the
protozoan parasite Trypanosoma cruzi.
Biol Chem, v.378, n.1, Jan, p.1-10. 1997.
Dawes, H., P. Struebi, et al. Kiwifruit juice clarification using a fungal proteolytic
enzyme.
Jounal of Food Science, v.59, n.4, p.858 - 861. 1994.
Drenth, J., J. N. Jansonius, et al. Structure of papain.
Nature, v.218, n.145, Jun 8, p.929-
32. 1968.
Drenth, J., K. H. Kalk, et al. Binding of chloromethyl ketone substrate analogues to
crystalline papain.
Biochemistry, v.15, n.17, Aug 24, p.3731-8. 1976.
25
Eggleson, K. K., K. L. Duffin, et al. Identification and characterization of falcilysin, a
metallopeptidase involved in hemoglobin catabolism within the malaria parasite
Plasmodium falciparum.
J Biol Chem, v.274, n.45, Nov 5, p.32411-7. 1999.
Engel, J. C., P. S. Doyle, et al. Cysteine protease inhibitors cure an experimental
Trypanosoma cruzi infection. J Exp Med, v.188, n.4, Aug 17, p.725-34. 1998.
Fidock, D. A., P. J. Rosenthal, et al. Antimalarial drug discovery: efficacy models for
compound screening.
Nat Rev Drug Discov, v.3, n.6, Jun, p.509-20. 2004.
Fleischmann, A., M. Darsow, et al. IntEnz, the integrated relational enzyme database.
Nucleic Acids Res, v.32, n.Database issue, Jan 1, p.D434-7. 2004.
Francis, S. E., I. Y. Gluzman, et al. Molecular characterization and inhibition of a
Plasmodium falciparum aspartic hemoglobinase. Embo J, v.13, n.2, Jan 15, p.306-17.
1994.
Hanada, K., M. Tamai, et al. Isolation and characterization of E-64, a new thiol protease
inhibitor. Agric Biol Chem, n.42, p.523-528. 1978.
Hay, S. I., C. A. Guerra, et al. The global distribution and population at risk of malaria:
past, present, and future. Lancet Infect Dis, v.4, n.6, Jun, p.327-36. 2004.
Kamphuis, I. G., K. H. Kalk, et al. Structure of papain refined at 1.65 A resolution. J Mol
Biol, v.179, n.2, Oct 25, p.233-56. 1984.
Katunuma, N. e E. Kominami. Structure, properties, mechanisms, and assays of cysteine
protease inhibitors: cystatins and E-64 derivatives. Methods Enzymol, v.251, p.382-97.
1995.
Kirschke, H., P. Wikstrom, et al. Active center differences between cathepsins L and B:
the S1 binding region.
FEBS Lett, v.228, n.1, Feb 8, p.128-30. 1988.
Klemba, M. e D. E. Goldberg. Biological roles of proteases in parasitic protozoa. Annu
Rev Biochem, v.71, p.275-305. 2002.
Komatsu, K., K. Inazuki, et al. Beneficial effect of new thiol protease inhibitors, epoxide
derivatives, on dystrophic mice.
Exp Neurol, v.91, n.1, Jan, p.23-9. 1986.
Leung-Toung, R., Y. Zhao, et al. Thiol proteases: inhibitors and potential therapeutic
targets.
Curr Med Chem, v.13, n.5, p.547-81. 2006.
Lewis, S. D., F. A. Johnson, et al. Effect of cysteine-25 on the ionization of histidine-159
in papain as determined by proton nuclear magnetic resonance spectroscopy. Evidence
for a his-159--Cys-25 ion pair and its possible role in catalysis.
Biochemistry, v.20, n.1,
Jan 6, p.48-51. 1981.
26
Lyons, T. P. Proteinases in industry.
Critical Reviews in Biotechnology, v.8, n.2, p.99 -
110. 1988.
Mccammon, J. A., B. R. Gelin, et al. Dynamics of folded proteins. Nature, v.267, p.585-
590. 1977.
Mcgrath, M. E., A. E. Eakin, et al. The crystal structure of cruzain: a therapeutic target
for Chagas' disease.
J Mol Biol, v.247, n.2, Mar 24, p.251-9. 1995.
Mckerrow, J. H., E. Sun, et al. The proteases and pathogenicity of parasitic protozoa.
Annu Rev Microbiol, v.47, p.821-53. 1993.
Menard, R., E. Carmona, et al. The specificity of the S1' subsite of cysteine proteases.
FEBS Lett, v.328, n.1-2, Aug 9, p.107-10. 1993.
Menard, R., J. Carriere, et al. Contribution of the glutamine 19 side chain to transition-
state stabilization in the oxyanion hole of papain. Biochemistry, v.30, n.37, Sep 17,
p.8924-8. 1991.
Miller, L. H., D. I. Baruch, et al. The pathogenic basis of malaria. Nature, v.415, n.6872,
Feb 7, p.673-9. 2002.
Neurath, H. Proteolytic processing and physiological regulation. Trends Biochem Sci,
v.14, n.7, Jul, p.268-71. 1989.
Olliaro, P. L. e Y. Yuthavong. An overview of chemotherapeutic targets for antimalarial
drug discovery. Pharmacol Ther, v.81, n.2, Feb, p.91-110. 1999.
Olson, J. E., G. K. Lee, et al. Antimalarial effects in mice of orally administered peptidyl
cysteine protease inhibitors.
Bioorg Med Chem, v.7, n.4, Apr, p.633-8. 1999.
Rao, M. B., A. M. Tanksale, et al. Molecular and biotechnological aspects of microbial
proteases. Microbiol Mol Biol Rev, v.62, n.3, Sep, p.597-635. 1998.
Rawlings, N. D. e A. J. Barrett. Families of cysteine peptidases. Methods Enzymol,
v.244, p.461-86. 1994a.
______. Families of serine peptidases. Methods Enzymol, v.244, p.19-61. 1994b.
______. Families of aspartic peptidases, and those of unknown catalytic mechanism.
Methods Enzymol, v.248, p.105-20. 1995.
Rich, D. H. Inhibitor of cysteine proteinases. In: (Ed.).
Proteinase inhibitor. Amsterdam:
Elsevier Scientific Publishing Co, 1986. Inhibitor of cysteine proteinases, p.153-178
27
Ring, C. S., E. Sun, et al. Structure-based inhibitor design by using protein models for the
development of antiparasitic agents.
Proc Natl Acad Sci U S A, v.90, n.8, Apr 15,
p.3583-7. 1993.
Rogier, C., B. Pradines, et al. Malaria epidemic and drug resistance, Djibouti. Emerg
Infect Dis, v.11, n.2, Feb, p.317-21. 2005.
Rosenthal, P. J. Cysteine proteases of malaria parasites. Int J Parasitol, v.34, n.13-14,
Dec, p.1489-99. 2004.
Rosenthal, P. J. e S. R. Meshnick. Hemoglobin catabolism and iron utilization by malaria
parasites. Mol Biochem Parasitol, v.83, n.2, Dec 20, p.131-9. 1996.
Rosenthal, P. J., J. E. Olson, et al. Antimalarial effects of vinyl sulfone cysteine
proteinase inhibitors. Antimicrob Agents Chemother, v.40, n.7, Jul, p.1600-3. 1996.
Rosenthal, P. J., P. S. Sijwali, et al. Cysteine proteases of malaria parasites: targets for
chemotherapy. Curr Pharm Des, v.8, n.18, p.1659-72. 2002.
Rosenthal, P. J., W. S. Wollish, et al. Antimalarial effects of peptide inhibitors of a
Plasmodium falciparum cysteine proteinase. J Clin Invest, v.88, n.5, Nov, p.1467-72.
1991.
Sabnis, Y., P. J. Rosenthal, et al. Homology modeling of falcipain-2: validation, de novo
ligand design and synthesis of novel inhibitors. J Biomol Struct Dyn, v.19, n.5, Apr,
p.765-74. 2002.
Sajid, M. e J. H. Mckerrow. Cysteine proteases of parasitic organisms. Mol Biochem
Parasitol, v.120, n.1, Mar, p.1-21. 2002.
Salas, F., J. Fichmann, et al. Functional expression of falcipain, a Plasmodium falciparum
cysteine proteinase, supports its role as a malarial hemoglobinase.
Infect Immun, v.63,
n.6, Jun, p.2120-5. 1995.
Schechter, I. e A. Berger. On the size of the active site in proteases. I. Papain. Biochem
Biophys Res Commun, v.27, n.2, Apr 20, p.157-62. 1967.
Schroder, E., C. Phillips, et al. X-ray crystallographic structure of a papain-leupeptin
complex. FEBS Lett, v.315, n.1, Jan 2, p.38-42. 1993.
Shenai, B. R., P. S. Sijwali, et al. Characterization of native and recombinant falcipain-2,
a principal trophozoite cysteine protease and essential hemoglobinase of Plasmodium
falciparum.
J Biol Chem, v.275, n.37, Sep 15, p.29000-10. 2000.
28
Singh, A. e P. J. Rosenthal. Selection of cysteine protease inhibitor-resistant malaria
parasites is accompanied by amplification of falcipain genes and alteration in inhibitor
transport.
J Biol Chem, v.279, n.34, Aug 20, p.35236-41. 2004.
Soni, S., S. Dhawan, et al. Characterization of events preceding the release of malaria
parasite from the host red blood cell. Blood Cells Mol Dis, v.35, n.2, Sep-Oct, p.201-11.
2005.
Storer, A. C. e R. Menard. Catalytic mechanism in papain family of cysteine peptidases.
Methods Enzymol, v.244, p.486-500. 1994.
Veronesi, R. Doenças infecciosas e parasitárias. 9.ed. Rio de Janeiro: Guanabara-Kogan.
1997
Whitaker, J. R. Principles of Enzymology for the Food Sciences: Marcel Dekker. 1993.
648 p.
Workman, W. E., J. H. Mclinden, et al. Genetic engineering applications to
biotechnology in the genus Bacillus. Critical Reviews in Biotechnology, v.3, n.3, p.199 -
234. 1986.
23
2 – Objetivos..............................................................................................................................24
24
2 – Objetivos
Este trabalho tem como objetivo geral aplicar as técnicas computacionais de
Modelagem Comparativa para propor um modelo tridimensional para a enzima Falcipaína-2 e
usar a técnica de Dinâmica Molecular para estimar o modo de ligação de diferentes ligantes
inibidores ao sítio ativo da enzima.
Na primeira parte do trabalho temos como objetivo específico criar um modelo
tridimensional para a Falcipaína-2 para caracterizar o sítio ativo desta enzima a avaliar a
viabilidade deste modelo para estudos de Dinâmica Molecular.
Na segunda parte do trabalho, pretendemos refinar a descrição do sítio ativo da
Falcipaína-2, caracterização das interações enzima-inibidor (contatos hidrofóbicos, polares,
ligações de H, energia livre de ligação), estabelecendo padrões para as interações com
diferentes ligantes: o inibidor E64, ligado a nas formas covalente e não covalente, o substrato
fluorescente Z-LR-AMC e o inibidor CP1, subsidiando o desenvolvimento racional de novos
inibidores potentes e específicos para a Falcipaína-2.
24
3 – Métodos..............................................................................................................................25
3.1 - Modelagem Comparativa..........................................................................................25
3.1.1 - Passos na Modelagem Comparativa..................................................................26
3.2 - Otimização das Geometrias Moleculares.................................................................31
3.2.1 - Método do Máximo Declive (steepest descent)...................................................32
3.3 Dinâmica Molecular.....................................................................................................32
3.4 - Campo de Forças........................................................................................................34
3.2.1 - Grupo 1: Átomos ligados....................................................................................35
3.2.2 - Grupo 2, Interações entre átomos não ligados. ................................................38
3.2.3 As diferenças entre o GROMOS96 e o OPLS.....................................................41
3.5 - Condições Periódicas de Contorno (CPC)...............................................................42
3.6 - Tratamento das interações não ligadas de longo alcance.......................................43
3.7 Cálculo de cargas dos ligantes pelo ajuste do potencial eletrostático (ESP
ElectroStatic Potential)......................................................................................................47
3.7.1 A escolha da Base...................................................................................................48
3.7.2 O método RESP para o ajuste de cargas.............................................................48
3.8 - Métodos de análise .....................................................................................................49
3.8.1 - Raíz do Desvio Quadrático Médio.....................................................................49
3.8.2 - Ligações Hidrogênio............................................................................................50
3.8.3 - Gráfico de Ramachandram................................................................................51
3.8.4 Raio de Giro e Momento de Inércia.....................................................................52
3.8.5 Área de Interação Intermolecular:.....................................................................53
3.9 Procedimentos...............................................................................................................54
3.9.1 - Modelagem Comparativa da Falcipaína-2........................................................54
3.92 Condições de Simulação.........................................................................................55
3.10 - Métodos Computacionais ........................................................................................62
25
3 – Métodos
3.1 - Modelagem Comparativa
Na ausência de estrutura determinada experimentalmente, a modelagem comparativa
ou por homologia pode algumas vezes providenciar um modelo 3D útil da proteína que está
relacionada à pelo menos uma estrutura conhecida.
A Modelagem Comparativa prediz a estrutura 3D de uma seqüência (seqüência alvo)
baseada primeiramente no seu alinhamento com uma ou mais proteínas de estrutura
semelhante (referências). O processo de predição consiste na determinação do enovelamento,
alinhamento entre o alvo e a referência, construção e avaliação do modelo. O número de
seqüências de proteína que podem ser modeladas por homologia, bem como a acurácia destas
predições, crescem de acordo com o sempre maior número de estruturas conhecidas
depositadas nos bancos de dados, mas crescem também devido ao melhoramento nos
algoritmos de comparação. “Já é possível modelar, com acurácia, regiões importantes de
aproximadamente metade de todas seqüências de proteínas” (Pieper et al., 2002).
Apesar do progresso na predição de estrutura ab-initio (Baker, 2000; Bonneau et al.,
2001) a Modelagem Comparativa permanece como o único método que pode predizer a
estrutura 3D de uma proteína com acurácia comparável a uma estrutura de baixa resolução
determinada experimentalmente (Marti-Renom et al., 2000). Até mesmo modelos com erros
podem ser úteis, pois alguns aspectos da função podem ser previstos mesmo que se tenha
apenas características grosseiras do modelo (Marti-Renom et al., 2000; Baker et al., 2001).
Existem vários programas e servidores que automatizam o processo de modelagem por
comparação. Vários destes servidores estão sendo avaliados de modo automatizado e em larga
escala (http://salilab.org/~eva/). Enquanto os servidores como o SWISS-MODEL são muito
convenientes e úteis, os melhores resultados num caso difícil e não usual de modelagem,
como alinhamento problemático (onde há baixa similaridade entre o alvo e a referência,
seqüências de inserção (loops), existência de múltiplos estados conformacionais e modelagem
26
da ligação com ligante), ainda são obtidos por métodos não automáticos, que requerem
experiência e habilidade no uso de ferramentas de modelagem.
3.1.1 - Passos na Modelagem Comparativa
3.1.1.1 - Determinação de Conformação e Seleção das Referências
O ponto inicial na modelagem comparativa é identificar todas as estruturas de
proteínas relacionadas à seqüência alvo, e então selecionar aquelas estruturas que serão usadas
como referência. Este passo é facilitado por numerosos bancos de dados de seqüência e
estrutura de proteínas, e pelo fato de haver softwares de busca disponíveis na Internet
(Altschul et al., 1994; Holm et al., 1996; Barton, 1998). As referências podem ser encontradas
usando a seqüência alvo para procurar estruturas nos bancos de dados como o PDB, SCOP,
DALI e CATH.
Existem três classes principais de métodos que são úteis na identificação da
conformação. O método mais usado é o que compara a seqüência alvo com cada uma das
seqüências do banco de dados independentemente, e é chamado pairwise sequence-sequence
comparsion (Apostolico et al., 1998). A performance deste método em procurar seqüências e
estruturas de proteínas relacionadas tem sido avaliada exaustivamente (Thompson et al., 1999;
Sauder et al., 2000). Entre os programas que empregam este método, os mais freqüentemente
usados são o FASTA (Pearson et al., 1988) e o BLAST (Altschul et al., 1990).
Uma vez que se obtém a lista de todas as estruturas de proteína relacionadas, é
necessário selecionar as referências que sejam apropriadas para o dado problema de
modelagem. Usualmente, uma maior similaridade geral (identidade e similaridade) entre o
alvo e a referência produz o melhor modelo. Vários outros fatores devem ser levados em
conta quando selecionadas as referências:
27
- A família de proteínas, que inclui o alvo e as referências, pode freqüentemente ser
organizada em sub-famílias. A construção de alinhamento múltiplo e uma árvore filogenética
(Felsenstein, 1985) pode ajudar na seleção das referências da sub-família que está mais
próxima da seqüência alvo.
- O ambiente deve ser comparado ao ambiente requerido para o modelo. O termo ambiente é
usado em um sentido extenso e inclui todos os fatores que determinam a estrutura da proteína,
exceto a seqüência (ex. Solvente, pH, ligantes e interações quaternárias).
- A qualidade da referência estrutural também é outro fator importante na seleção da
referência. A resolução e o fator-R de uma estrutura cristalográfica e o número de restrições
por resíduo de uma estrutura de RMN são indicativos de sua acurácia.
As prioridades de critérios para a seleção de referências dependem da proposta para o
modelo comparativo. Por exemplo, se um modelo de proteína-ligante for construído, a escolha
da referência que contém o mesmo ligante é provavelmente mais importante do que a
resolução da referência. Por outro lado, se o modelo for usado para analisar a geometria do
sítio ativo de uma enzima, é preferível usar uma referência de alta resolução. Não é necessário
selecionar apenas uma referência. Na verdade, o uso de várias referências aproximadamente
eqüidistantes (filogeneticamente) da seqüência alvo geralmente aumenta a precisão do modelo
(Srinivasan et al., 1993; Sanchez et al., 1997).
3.1.1.2 - Alinhamento entre o alvo e a referência
A maioria dos métodos de determinação de conformação tridimensional produz uma
comparação ou alinhamento das seqüências de aminoácidos da proteína alvo com as das
referências estruturais. Um exemplo de alinhamento pode ser visto na Figura 3.1. Entretanto
este primeiro alinhamento geralmente não é o melhor alinhamento alvo-referência para a
modelagem comparativa pois os métodos de busca são geralmente regulados para detectar
28
relações remotas, não para alinhamentos ótimos. Portanto, uma vez selecionadas as
referências, um método especializado deve ser usado para alinhar a seqüência alvo com as
referências estruturais (Holm et al., 1996; Taylor, 1996; Baxevanis, 1998; Briffeuil et al.,
1998; Smith, 1999).
Para seqüências de proteínas proximamente relacionadas, com identidade maior do
que 40%, o alinhamento é quase sempre correto. Regiões com baixa similaridade seqüencial
tornam-se comuns quando a identidade completa fica abaixo de 40% (Saqi et al., 1998). O
alinhamento fica difícil na zona limite de menos de 30% de identidade seqüencial (Rost,
1999).
Com o decréscimo da similaridade seqüencial, os alinhamentos passam a conter um
número maior de gaps e erros de alinhamento, independentemente se é feito manual ou
automaticamente. Por exemplo, apenas 80% dos resíduos parecem estar corretamente
alinhados quando duas proteínas compartilham 30% de identidade seqüencial (Johnson et al.,
1993). Um grande esforço para se obter o alinhamento o mais preciso possível é necessário
porquê nenhum dos métodos atuais de modelagem comparativa é capaz de recuperar-se de um
alinhamento incorreto na hora de construir o modelo.
Existe uma grande variedade de métodos de alinhamento de seqüências de proteínas,
muitos dos quais são baseados em métodos de programação dinâmica (Needleman et al.,
1970; Smith et al., 1981). Um programa freqüentemente usado para alinhamento múltiplo de
seqüências é o CLUSTAL (Thompson et al., 1994; Higgins et al., 1996), que também está
disponível como servidor.
Nos casos mais difíceis de alinhamento, é freqüentemente benéfico basear-se em
alinhamentos múltiplos de seqüência e estrutura (Barton et al., 1987; Taylor et al., 1994).
Primeiro, o alinhamento das referências em potencial é preparado pela sobreposição de suas
estruturas. A seguir, as seqüências que estão claramente relacionadas com as referências, e
29
são facilmente alinhadas entre si, são adicionadas ao alinhamento. O mesmo é feito para a
seqüência alvo. Finalmente os dois perfis são alinhados entre eles, levando em conta a
informação estrutural sempre que possível (Thompson et al., 1994; Koretke et al., 1998; Yang
et al., 2000; Al-Lazikani et al., 2001; Sali et al., 2002)
Figura 3.1: Exemplo de um alinhamento de seqüências de proteína. Entre as possibilidades plausíveis uma é
escolhida com base em diversos fatores. As setas vermelhas e azuis apontam para os resíduos idênticos, a seta
verde indica qual das duas opções acima tem o melhor resultado.
3.1.1.3 - Construção do modelo
Uma vez que um alinhamento inicial alvo-referência foi construído, uma variedade de
métodos pode ser usada para construir um modelo 3D para uma proteína alvo. O método
original e ainda o mais usado é o “rigid body assembly” (Browne et al., 1969; Blundell et al.,
1987; Greer, 1990). Outra família de métodos, modelagem por “segment matching”, é
baseada nas posições aproximadas dos átomos conservados nas referências (Jones et al., 1986;
Claessens et al., 1989; Unger et al., 1989; Levitt, 1992). O terceiro grupo de métodos,
modelagem por “satisfaction of spatial restraints”, usa tanto técnicas de distância geométrica
quanto otimização para satisfazer as restrições espaciais obtidas do alinhamento (Havel et al.,
1991; Brocklehurst et al., 1993; Sali et al., 1993; Srinivasan et al., 1993; Aszodi et al., 1996;
Kolinski et al., 2001).
A qualidade da estrutura obtida com os vários métodos de construção de modelos é
relativamente similar quando usados otimamente (Marti-Renom et al., 2002). Outros fatores,
30
como seleção de referências e qualidade dos alinhamentos geralmente têm maior impacto na
qualidade do modelo, especialmente para modelos baseados em menos de 40% de identidade
com as referências. Existe uma vasta literatura sobre os métodos de Modelagem Comparativa
(Blundell et al., 1987; Bajorath et al., 1993; Johnson et al., 1994; Sali, 1995; Marti-Renom et
al., 2000; Al-Lazikani et al., 2001).
3.1.1.4 - Avaliação do Modelo
A qualidade de um modelo determina a sua utilidade. Um modelo pode ser avaliado
como um todo assim como em regiões individuais. O primeiro passo é determinar se o
modelo tem a conformação adequada (Sanchez et al., 1998). Um modelo geralmente terá a
conformação correta se a seqüência alvo estiver pelo menos alinhada corretamente com a
seqüência da estrutura de referência, já que os processos atuais de modelagem não são
capazes de se recuperar de um alinhamento incorreto (Sanchez et al., 1997). Além disso a
confiança de uma conformação de modelo é geralmente aumentada quanto maior a
similaridade seqüencial às referências e pela conservação de resíduos chaves (funcionais ou
estruturais) na seqüência alvo.
Uma vez que a conformação para o modelo é aceita, uma avaliação mais detalhada da
qualidade como um todo pode ser obtida baseado na similaridade entre o alvo e a referência,
em termos de seqüência (Sanchez et al., 1998). Identidades seqüenciais acima de 30% são
relativamente bons preceptores da qualidade esperada, por causa do relacionamento entre as
similaridades estruturais entre duas proteínas com uma mesma função (Chothia et al., 1986),
além disso, a natureza geométrica dos algoritmos modelagem força o modelo a se aproximar
ao máximo da referência (Sali et al., 1993). A dispersão da sobreposição modelo-alvo
aumenta com o decréscimo na identidade seqüencial. Se a identidade seqüencial cai abaixo
dos 30%, ela se torna duvidosa como uma medida de qualidade esperada de um único modelo.
31
Os modelos que desviam da qualidade média são freqüentes exatamente porque o número de
seqüências disponíveis nos bancos de dados de seqüências é muito superior ao número de
estruturas tridimensionais resolvidas o que faz com que a probabilidade de se encontrar uma
estrutura de referencia com pelo menos mais de 30% de identidade seja muito pequena.
Nestes casos, os métodos de avaliação dos modelos são particularmente úteis.
Junto com a similaridade alvo-referência, o ambiente pode fortemente influenciar a
acurácia do modelo. Por exemplo, algumas proteínas que ligam Cálcio sofrem grandes
modificações conformacionais quando ligadas a este elemento. Se uma referência livre de
Cálcio é usada para modelar um destes alvos ligado ao Cálcio, é claro que o modelo vai estar
incorreto independentemente da similaridade ou qualidade da estrutura da referência
(Pawlowski et al., 1996). Isto também se aplica à determinação de estrutura de proteína pelos
métodos experimentais (Raios X, RMN), uma estrutura dever ser determinada no meio em
que é funcional.
Um requerimento básico é que um modelo tenha uma estereoquímica consistente.
Alguns programas úteis para avaliar a estereoquímica são PROCHECK (Laskowski et al.,
1998), PROCHECK-NMR e AQUA (Laskowski et al., 1996), SQUID (Oldfield, 1992) e
WHATCHECK (Hooft et al., 1996). As características do modelo que são checadas por estes
programas incluem comprimento de ligações, ângulo de ligações (diagrama de
Ramachandram), ligações peptídicas e planaridade de anéis das cadeias laterais, quiralidade,
ângulos de torção das cadeias principais e laterais, sobreposições entre pares de átomos não
ligados.
3.2 - Otimização das Geometrias Moleculares
As forças resultantes em uma configuração inicial para uma estrutura molecular
podem ser demasiadamente grandes, resultando em grandes acelerações locais o que traria um
32
enorme ruído ao sistema inicial, invalidando a simulação. Portanto é necessário empregar um
protocolo de minimização de energia para corrigir a configuração do sistema e eliminar as
tensões locais, ajustando distancias de ligações, espaços não preenchidos na solvatação do
sistema, sobreposição de átomos, etc.
3.2.1 - Método do Máximo Declive (steepest descent)
Dada a equação da força resultante sobre cada átomo do sistema:
{
}
(
)
i
i
i
V
δ
δ
=
r
F
r
[Equação 02]
que é proveniente do gradiente da energia potencial total, o método do máximo declive é
apresentado pela seguinte equação:
()
,
,
,1
,
||
in
in n
in
in
k
+
⎛⎞
=+
⎜⎟
⎜⎟
⎝⎠
F
rr
F
[Equação 03]
em que vai dar a nova posição do átomo
i
no passo
r 1
+
n
e é o parâmetro de ajuste do
tamanho do passo. O que se obtém ao final da minimização é um conjunto de coordenadas
n
k
{
}
i
r
, que representam um mínimo local de energia ao tornar a força próxima do zero.
3.3 Dinâmica Molecular
Na simulação de Dinâmica Molecular são resolvidas as equações clássicas do
movimento, ou seja, as equações de Newton. Inicialmente calcula-se a força
i
F
que atua sobre
cada partícula
i
de um sistema a partir da primeira derivada da função energia potencial
{
}
(
i
V r
)
que descreve a interação entre as partículas:
{
}
(
)
i
i
i
V
δ
δ
=
r
F
r
[Equação 04]
onde
i
= 1,2,3,... até N, o número total de partículas ou átomos do sistema.
33
Dividindo a força
i
F
pela massa i
m
de cada partícula, obtém-se a aceleração a que ela
está submetida:
i
i
i
m
=
F
a
[Equação 05]
em seguida, substitui-se a aceleração no algoritmo de Verlet (Verlet, 1967) para determinar a
propagação das posições em incrementos de tempo
t
δ
:
() ()
2
..
)(2 ttrttrrttr
i
iii
δδδ
+=+
[Equação 06]
A predição das novas posições no instante
tt
δ
+
é feita a partir das posições nos
instantes e
t
tt
δ
e das forças
i
F
sobre cada partícula no instante
t
. As velocidades são
necessárias para o cálculo da energia cinética, que somada à energia potencial, dão a energia
total do sistema. Elas são obtidas a partir do algoritmo de Verlet para a propagação das
velocidades (Verlet, 1967):
()
(
)
(
)
2
ii
i
tt tt
t
t
δδ
δ
+−⎡⎤
=
rr
v
[Equação 07]
As velocidades são necessárias também para o cálculo da temperatura do sistema, que
é definida em termos da energia cinética média.
Na simulação por dinâmica molecular resolve-se portanto as equações de movimento
para cada partícula a cada incremento de tempo
t
δ
. A avaliação das forças para a obtenção
das acelerações é, em geral, o processo mais dispendioso em tempo computacional. O tempo
gasto no cálculo dessas forças depende do tamanho do sistema simulado e da complexidade
da função de energia potencial
{
}
(
)
i
V r
para cada campo de forças empregado. Em sistemas
envolvendo macromoléculas, as funções potenciais mais realistas são compostas de diversos
termos, que descrevem as ligações químicas, os ângulos moleculares, as torções e as
interações eletrostáticas e de van der Waals entre átomos ligados não covalentemente.
34
3.4 - Campo de Forças.
A representação física de um sistema, em simulações computacionais, pode ser feita
através de uma função potencial ou campo de forças. O campo de forças é a descrição de um
sistema de muitas partículas através da sobreposição de termos simples, que descrevem a
interação entre as partículas. Para o tratamento de centenas ou milhares de átomos é
introduzido um conjunto de funções potenciais empíricas, calibradas por informações
experimentais e cálculos quânticos sobre pequenas moléculas (Van Gunsteren et al., 1990).
A escolha de um campo de força em particular deve depender das propriedades do
sistema em que se estiver interessado. Algumas aplicações requerem campos de força mais
refinados do que outras. Além disso, deve existir um equilíbrio entre os níveis de acurácia ou
refinamento para diferentes partes de um modelo molecular. De outra forma o esforço
computacional gasto na descrição muito detalhada ou acurada dos cálculos em uma parte do
sistema pode ser perdida pela distorção causada pelas partes menos detalhadas da descrição
do modelo. Em outras palavras, um campo de forças que tem um potencial muito complexo
para representar as ligações químicas, os ângulos e é muito preciso em termos de reproduzir
as geometrias e as freqüências vibracionais não conseguirá descrever bem as interações
intermoleculares complexas se o modelo de cargas não estiver também com alta qualidade.
Neste trabalho empregamos os campos de forças GROMOS96 (Berendsen., 1988.;
Van Gunsteren, 1996) e OPLS (Jorgensen, 2001) para descrever as interações entre os átomos
da proteína, dos inibidores, do substrato e seus complexos. Em virtude disto, a parametrização
do campo de forças para o solvente, água, foi adequada à parametrização do campo de forças
para a proteína, portanto empregamos os modelos de água SPC (Berendsen, 1984) nas
simulações com o GROMOS96, e TIP4P (Jorgensen, 2000) nas simulações com o OPLS,
respectivamente. Esses campos de forças e respectivas parametrizações então implementados
no pacote de programa GROMACS (Lindahl et al., 2001a) na versão 3.2 e 3.3 já com as
35
correções aos erros da distribuição oficial.
Os dois campos de forças são equivalentes e é possível descrevê-los de uma forma
geral e ao final destacar apenas as diferenças. Num campo de forças qualquer, é possível
separar as funções em dois grupos: o primeiro grupo contendo quatro termos para as
descrições dos átomos ligados, até seus terceiros vizinhos; o segundo grupo contendo dois
termos para as interações entre os átomos não ligados diretamente (átomos de uma mesma
molécula que estão além do terceiro vizinho) e para os não ligados efetivamente em
interações soluto-solvente, solvente-solvente, inibidor-proteína, entre diferentes cadeias em
uma proteína etc.
3.2.1 - Grupo 1: Átomos ligados
A reprodução da ligação química e do movimento vibracional entre um par de átomos
i-j (Figura 3.2) é descrita por um potencial harmônico linear na forma da Equação 08, que
obedece a lei de Hooke para um sistema de massas unidas por molas. Nesta descrição é a
constante de Hooke, é o comprimento instantâneo da ligação e é o comprimento de
equilíbrio da ligação.
b
K
b
0
b
()
2
0
2
1
bbKV
bb
=
[Equação 08]
[Figura 3.2a]
[Figura 3.2b] Ilustração da função potencial harmônico que descreve a interação entre dois átomos ligados de
uma biomolécula. Como as constantes de ligação e distância de equilíbrio são distintas para cada tipo de par de
átomos, a imagem da função também varia conforme demonstrado na figura. (Parâmetros de ffG43a1bon.itp)
i
b
ji ji
b
j
Energia de ligação versus distância
-1,0E+03
0,0E+00
1,0E+03
2,0E+03
3,0E+03
4,0E+03
5,0E+03
6,0E+03
0 0,05 0,1 0,15 0,2 0,25 0,3
Comprimento da ligação
Energia Potencial (kJ/mol)
C_3-CH3
C-N
CZ-NZ
36
O ângulo formado por três átomos ligados consecutivamente (i,j,k) (Figura 3.3), é
dado por um potencial harmônico angular na forma da Equação 09, onde é a constante
de Hooke,
θ
K
θ
o ângulo entre as ligações e
0
θ
é o ângulo de equilíbrio.
()
2
0
2
1
θθ
θθ
= KV
[Equação 09]
[Figura 3.3a]
[Figura 3.3b] Gráfico da função potencial harmônico angular que descreve a interação entre três átomos ligados.
(Parâmetros de ffG43a1bon.itp)
Entre quatro átomos ligados haverá a formação de uma estrutura tridimensional
descrita por um
potencial harmônico (potencial diedral impróprio), que controla o ângulo
entre os planos formados pelos átomos
i-j-k e j-k-l (Figura 3.4) na forma da Equação 10,
onde é a constante de Hooke,
ξ
K
ξ
o ângulo entre os planos e
0
ξ
é o ângulo de equilíbrio.
()
2
0
2
1
ξξ
ξξ
= KV
[Equação 10]
[Figura 3.4a]
j
k
i
θ
j
k
i
k
i
j
θ
Energia angular versus Ângulo
0,0E+00
1,0E+05
2,0E+05
3,0E+05
4,0E+05
5,0E+05
6,0E+05
7,0E+05
8,0E+05
70 90 110 130 150 170
Ângulo (graus)
Energia potencial angular
(kJ/mol)
HC-C-CB
C-N-CA
k
l
j
i
ξ
k
l
j
i
k
l
j
i
k
l
j
i
ξ
37
[Figura 3.4b] Gráfico da função potencial harmônico angular impróprio que descreve o ângulo entre os planos i-
j-k e j-k-l. São representadas as duas aplicações desse potencial: manutenção da estrutura planar e tetraédrica,
onde o ângulo de equilíbrio é 0
o
e 35º respectivamente. (Parâmetros de ffG43a1bon.itp)
Potencia Diedral impróprio
0,0E+00
1,0E+05
2,0E+05
3,0E+05
4,0E+05
5,0E+05
6,0E+05
7,0E+05
8,0E+05
9,0E+05
1,0E+06
-50-30-101030507090
Ângulo entre os planos
Energia Potencial (kJ/mol)
0 graus
35 graus
A rotação
em torno das ligações químicas é modelada por um potencial torcional
(potencial diedral próprio) que descreve a simetria rotacional das barreiras e mínimos de
energia para a torção de cada ligação química com liberdade de rotação (Figura 3.5) na forma
da Equação 11a, onde é uma constante que define a altura da barreira de rotação, é o
número de mínimos da função,
ϕ
K n
ϕ
é a variação angular e
δ
é o ângulo de diferença de fase
(180º ou 0º)
()
[]
δ
ϕ
ϕϕ
+= .cos1 nKV
[Equação 11a]
[Figura 3.5a]
[Figura 3.5b] Gráfico da função potencial torcional que descreve as barreiras para a torção das ligações
químicas, exemplificado para diferentes valores de K e n, que irão determinar a amplitude e o número de
mínimos da imagem da função. (Parâmetros de ffG43a1bon.itp) (Obs: n = 1 é meramente ilustrativo pois não
existe no GROMOS96, somente n = 2, 3 e 6
)
k
l
j
i
ϕ
k
l
j
i
k
l
j
i
ϕ
Energia diedral versus ângulo diedral - GROMOS96
-5
0
5
10
15
20
25
0 50 100 150 200 250 300 350
Ângulo diedral (graus)
Energia Potencial (kcal/mol)
K=10, n=1
K=5, n=2
K=2,5, n=3
38
3.2.2 - Grupo 2, Interações entre átomos não ligados.
As interações entre átomos não ligados diretamente (Figura 3.6) são representadas
pelos termos de potencial de Lennard-Jones
e energia potencial eletrostática. A contribuição
dos átomos ligados consecutivamente até o terceiro vizinho já é considerada ou parcialmente
considerada nos potenciais do primeiro grupo, portanto em alguns campos de forças a
interação até o terceiro vizinho é desconsiderada. Nos campos de forças mais modernos a
interação com o terceiro vizinho (interação do tipo 1-4) é contabilizada, porém com um
potencial reduzido.
[Figura 3.6] Interações intermoleculares
(linhas cheias), intramoleculares (linhas
tracejadas) e intramoleculares do tipo 1-4
(linhas pontilhadas).
O
potencial de Lennard-Jones na forma da Equação 12 dá conta das interações de
van der Waals e é composto por um termo atrativo e um termo repulsivo (Figura 3.7) em que
para um dado átomo i
é computada a sua energia de interação com o átomo j. Os parâmetros
e
dependem do tipo dos átomos envolvidos, e é a distância entre estes átomos.
()
12
ij
C
()
6
ij
C
ij
r
()
(
)
(
)
12 6
12 6
ij ij
LJ ij
ij ij
CC
V =−r
rr
[Equação 12]
[Figura 3.7b]
i ji j
39
[Figura 3.7b] Representação gráfica da função potencial de Lennard-Jones mostrando a atração e repulsão entre
átomos não ligados quimicamente, exemplificada para alguns tipos de pares de átomos. (Parâmetros
ffG43a1nb.itp)
Potencial de Lennard-Jones
-1,0
-0,8
-0,6
-0,4
-0,2
0,0
0,2
0,4
0,6
0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0
Disncia (nm)
Energia potencial (kJ/mol)
C-N
C-O
C-H
A energia potencial eletrostática
é simulada utilizando-se o potencial de Coulomb
(Figura 3.8) na forma da Equação 13, onde q
i
representa a carga do átomo i, q
j
a carga do
átomo j,
0
ε
representa a permissividade elétrica do vácuo,
r
ε
é a constante dielétrica do meio
e é a distancia entre os átomos i e j.
ij
r
ijr
ji
coulomb
r
qq
V
επε
0
4
=
[Equação 13]
[Figura 3.8a]
[Figura 3.8b] Gráfico da função de Coulomb mostrando o comportamento da interação entre cargas parciais,
provocadas por deslocamentos nas nuvens eletrônicas dos átomos em uma molécula. (Parâmetros de
ffG43a1nb.itp)
i j
-+
i j
-+
Potencial de Coulomb
-0,10
-0,08
-0,06
-0,04
-0,02
0,00
0,02
0,04
0,06
0,08
0,10
0,0 5,0 10,0 15,0 20,0
Distância (nm)
Energia Potencial (kJ/mol)
q(i)1=1,q(j)=1
q(i)=-1,q(j)=1
40
A
função energia potencial total é dada pelo somatório das componentes:
()
=
i
rV
Função energia potencial total
()
=
bN
1n
2
0
2
1
nn
n
b
bbK +
Potencial linear somado sobre todas as ligações químicas
()
=
θ
θθ
θ
N
n
nnn
K
1
2
0
2
1
+
Potencial angular somado sobre todos os ângulos entre ligações
consecutivas
()
=
ξ
ξξ
ξ
N
n
nnn
K
1
2
0
2
1
+
Potencial diedral impróprio somado sobre todas as regiões onde é
necessário estabilizar a estrutura 3D
(
[
=
+
ϕ
δϕ
ϕ
N
n
nnnn
nK
1
.cos1
)
]
+
Potencial diedral próprio somado sobre todas as possíveis torções
() ()
<
átomos
N
ji
ij
ij
ij
ij
r
C
r
C
6
6
12
12
+
Potencial de Lennard-Jones somado sobre todos os pares de átomos a partir
dos terceiros vizinhos
<
átomos
N
ji
ijr
ji
r
qq
επε
0
4
Potencial de Coulomb somado sobre todos os pares de átomos a partir dos
terceiros vizinhos
De uma forma resumida, a função energia potencial para um sistema molecular constituído de
N
at
átomos, com vetores posição r
i
(i = 1, 2, ..., N
átomos
), geralmente tem a forma:
() () () ()
()
[]
() ()
<<=
===
++++
++=
átomosátomos
N
ji
ijr
ji
N
ji
ij
ij
ij
ij
N
n
nnnn
N
n
nnn
N
n
nnnnn
n
bi
r
qq
r
C
r
C
nK
KKbbKrV
επε
δϕ
ξξθθ
ϕ
ξ
θ
ϕ
ξθ
0
6
6
12
12
1
1
2
0
1
2
0
N
1n
2
0
4
.cos1
2
1
2
1
2
1
b
[Equação 14]
onde os três primeiros termos são os potenciais harmônicos que descrevem as N
b
ligações
químicas da molécula, os ângulos entre pares de ligações consecutivas e os ângulos
diedrais impróprios, respectivamente. Esses termos determinam como a energia varia
alterando-se os valores dos comprimentos e dos ângulos
θ
N
ξ
N
0
b
0
θ
e
0
ξ
de equilíbrio das ligações
químicas. O quarto termo é o potencial de torção somado sobre os
ϕ
ângulos diedrais
próprios, para as ligações químicas com liberdade de rotação de 360
o
. O termo seguinte
corresponde aos potenciais de van der Waals e Coulomb somados sobre todos os pares de
átomos
i e j excluindo-se os primeiros e segundos vizinhos quimicamente ligados, cujas
N
41
interações já estão embutidas nas descrições pelos termos harmônicos. Os parâmetros , ,
,
b
K
0
b
θ
K
0
θ
, ,
ξ
K
0
ξ
, , ,
ϕ
K
n
δ
, as constantes
(
)
12
ij
C e
(
)
6
ij
C e as cargas atômicas parciais q
i
e q
j
,
para proteínas, ácidos nucléicos, alguns açúcares e alguns inibidores enzimáticos são
encontrados na literatura.
3.2.3 As diferenças entre o GROMOS96 e o OPLS
É evidente que existem diversas outras diferenças como os parâmetros de ligação,
ângulo, cargas e o estado da matéria em que o campo de força foi parametrizado e
particularidades na forma como foram obtidos os parâmetros. Porém há duas diferenças
fundamentais entre estes campos de forças: a primeira delas é que o OPLS não usa o potencial
harmônico impróprio
para manter a planaridade de hidrogênios aromáticos. A segunda
diferença é o uso de uma descrição mais refinada do
potencial torcional próprio pelo
aumento da complexidade da Equação 08, com adição de duas funções cossenóides extras e
usando o somatório das funções para descrever o potencial, permitindo um melhor ajuste da
função potencial diedral aos dados experimentais, como mostrado na Figura 3.9c, trocando a
Equação 08
para a forma da Equação 12, comparadas a seguir.
(
)
[]
δ
ϕ
ϕϕ
+
= .cos1 nKV
[Equação 11a]
()
[]
()
[]
()
[]
ϕϕϕ
ϕ
3cos1
2
2cos1
2
cos1
2
321
++++=
KKK
V
[Equação 11b]
[Figura 3.9] Gráfico das funções cossenóides cos(x), cos(2x) e cos(3x) e do produto do somatório destas, que
forma o potencial torcional do OPLS, que descreve as barreiras para a torção das ligações químicas
Energia diedral versus ângulo diedral - OPLS
-0,5
0
0,5
1
1,5
2
2,5
3
3,5
4
4,5
5
0 100 200 300
Ângulo diedral (graus)
Energia Potencial (kcal/mol)
cos(x)
cos(2x)
cos(3x)
cos(x)+cos(2x)+cos(3x)
42
O termo que representa esta equação na função energia potencial total ficaria:
()
[]
()
[]
()
[]
=
++++
ϕ
ϕϕϕ
N
n
n
n
n
n
n
n
KKK
1
321
3cos1
2
2cos1
2
cos1
2
3.5 - Condições Periódicas de Contorno (CPC).
As simulações de sistemas moleculares isolados, com o solvente em uma caixa de
simulação, podem sofrer os efeitos de fronteira (ou efeitos de borda), uma vez que as
moléculas do solvente presentes nas extremidades da caixa em que confinamos o sistema
passariam a interagir com um número menor de átomos do que aqueles que estivessem no
centro da caixa. Para podermos correlacionar as propriedades do sistema microscópico a
aquelas que descrevem a fase macroscópica, é muito importante que os efeitos de fronteira
sejam eliminados. Evitamos este efeito com o uso de Condições Periódicas de Contorno
(CPC) (Born et al., 1912).
Na prática, as CPC consistem na replicação de um sistema finito de partículas
confinadas numa caixa tridimensional. Em poucas palavras, o método cria imagens
transladadas do sistema entorno do mesmo, produzindo um sistema pseudo-infinito (Figura
3.10). Por esta abordagem, quando um átomo se move na caixa central (real), suas imagens
periódicas em cada uma das caixas vizinhas se movem exatamente da mesma forma, e se uma
molécula deixa a caixa central, uma de suas imagens periódicas irá entrar pela face oposta.
A natureza pseudo-infinita do sistema implica na necessidade de algumas
aproximações para tratar as interações intermoleculares. Em particular, a aproximação da
imagem mínima supõe que cada partícula da caixa central interaja com as partículas j ou sua
imagem mais próxima. Além disso, a introdução de uma esfera de corte (Raio de Corte) pode
ser usada para ignorar as interações mais distantes desde que se restrinja a um valor igual ou
menor que a metade da dimensão da caixa de simulação de maneira que um átomo não
i
43
interaja com sua própria imagem. É claro que a validade dessas aproximações está
condicionada pelo raio das interações intermoleculares consideradas.
[Figura 3.10] Representação bidimencional das
condições periódicas de contorno que simulam um
ambiente infinito. A caixa central é repetida em todos
os lados e é utilizado um Raio de Corte (círculo
pontilhado) que restringe a distância para contabilizar
as interações de longo alcance. Os pequenos círculos
em cinza representam grupos de carga adicionados ao
cálculo pela presença de pelo menos um dos átomos
no interior do Raio de Corte.
3.6 - Tratamento das interações não ligadas de longo alcance.
A contribuição para as interações de van der Waals em distâncias superiores a 0.8
nanômetros é bem próxima de 0, como demonstrado para alguns tipos de pares de átomos na
Figura 3.7b. Entretanto como o tamanho do sistema aumenta com
3
r
não seria aceitável que
as interações que caiam com
n
r
1
, onde n<3, sejam tratadas com a truncagem esférica. Se as
interações de van der Waals não necessitam de atenção especial a longas distâncias, o mesmo
não se pode dizer do caso das interações eletrostáticas. Podemos verificar que a contribuição
do termo de Coulomb a distâncias mais longas (que se estendem além dos 1.5nm) é um
aspecto particularmente crítico nas simulações de DM necessitando de atenção especial. Por
motivos óbvios de custo computacional e eficiência, o truncamento esférico das interações de
longo alcance (Raio de Corte) continua sendo amplamente utilizado ainda mais quando a
escala de tempo necessária à coleta de dados requer algumas dezenas de nanosegundos.
Entretanto este método pode atribuir um grande ruído no sistema, pois se o valor do Raio de
Corte for pequeno (<1.5nm), poderão ser eliminadas as contribuições de um grande número
de interações de longo alcance (Figura 3.8b), que somadas poderiam ser importantes para o
44
sistema. Outro problema é a presença de espécies iônicas, considerando que o uso de uma
esfera de corte induz numerosos artefatos que evidentemente distorcem os resultados da
simulação. Além disso, deve-se destacar que, nos limitando a espécies dipolares, aplicar uma
esfera de corte causa singularidades nas derivadas da energia potencial na fronteira do Raio de
Corte devido ao abandono da contribuição proveniente das interações de longa distância além
do Raio de Corte. Hoje em dia há métodos mais refinados para a truncagem das interações
que permitem reduzir consideravelmente estes efeitos deletérios e contornar estas
dificuldades. Os métodos mais populares são a adoção de Grupos de Cargas, associado com
uma
função de switching, ou uma função de shifting, ou o Campo de Reação (Reaction
Field
), ou então métodos mais rigorosos como o Particle Mesh Ewald (PME) que avaliam as
interações de uma partícula com todas as outras contidas na caixa central bem como com
todas as caixas periódicas replicadas. Este último enfoque aumenta em muito o custo
computacional, todavia é desejável para uma descrição rigorosa das interações de longo
alcance.
Os grupos de cargas são formados por pequenas subunidades das moléculas e, por
regra, a carga de um grupo de cargas é sempre um número inteiro, geralmente a soma das
cargas é nula, com exceção de alguns grupamentos funcionais carregados. Esta abordagem é
necessária, pois o simples truncamento das interações no Raio de Corte pode fazer com que
apenas partes de moléculas, como só o oxigênio de uma molécula de água, sejam
contabilizadas no cálculo, o que introduz um erro considerável na simulação principalmente
quando se trata de interações eletrostáticas. O uso de grupos de cargas visa reduzir o ruído
causado por estas cargas desbalanceadas, agrupando pequenos grupos de átomos. Com a
adoção de grupos de cargas na parametrização de subunidades das moléculas, à medida que
um dos átomos do grupo fica dentro da distância do raio de corte, todos os demais átomos do
grupo são adicionados ao cálculo. Mais especificamente, quando a menor distância entre as
45
imagens de dois centros geométricos de dois grupos de cargas distintos é menor do que o raio
de corte, todos os átomos são contabilizados como cargas individuais. No exemplo da
molécula de água, se esta restrição for satisfeita, toda a molécula seria introduzida no cálculo,
porém, contribuiria com carga zero.
A função de switching substitui o comportamento abrupto do Raio de Corte por um
decréscimo suave em torno da fronteira esférica. Com uma idéia parecida, todavia mais
refinada, o Campo de Reação faz com que o potencial de Coulomb também tenha o valor zero
no Raio de Corte escolhido, ao assumir uma constante dielétrica
rf
ε
que simula o efeito da
blindagem eletrostática causada pelo solvente além do Raio de Corte (Figura 3.11). O
potencial para a interação de Coulomb passa a ser:
12
3
412
)1(
1
4
0
3
3
0
..
.
+
+
+=
rf
rf
c
ji
c
ij
rf
rf
ij
ji
reaçãodecampo
comcoulomb
r
qq
r
r
r
qq
V
ε
ε
πεε
ε
πε
[Equação 12]
[Figura 3.11] Representação dos efeitos da aplicação do Campo de Reação na função potencial de Coulomb para
partículas de mesma carga com e sem o campo de reação. Neste exemplo
rf
ε
é igual 54 e o raio de corte 1.5nm.
0
0,01
0,02
0,03
0,04
0,05
0,06
0,07
0,08
0,09
0 5 10 15
Coulomb com Campo de
Reação
Coulomb
onde e são as cargas dos átomos envolvidos,
i
q
j
q
0
ε
é a permissividade elétrica do vácuo,
rf
ε
é a constante dielétrica para o Campo de Reação, é o Raio de Corte e é a distância
entre os átomos envolvidos.
c
r
ij
r
O método Particle Mesh Ewald é uma adaptação ao enfoque proposto por Ewald, que
46
admite que a somatória de Coulomb
<
átomos
N
ji
ijr
ji
r
qq
επε
0
4
em uma caixa de simulação e nas suas
imagens vizinhas não é capaz de convergir formalmente. O enfoque abordado pelo método
PME é o mais rigoroso entre os métodos citados entretanto ainda é controverso na literatura,
qual dos métodos seria o ideal para as simulações biomoleculares. A idéia central deste
método também conhecido como soma de Ewald, consiste em duas somatórias avaliadas
respectivamente, nos espaços direto e recíproco. No espaço direto, cada carga está rodeada
por uma distribuição gaussiana de cargas, de mesma aplitude mas de sinal inverso e esta
contribuição é contrabalanceada no espaço recíproco por uma outra distribuição de sinal
inverso (Figura 3.12)
rr
=
+
Magnitude da carga
rrr
=
+
Magnitude da carga
r
[Figura 3.12] Representação unidimensional dos componentes da soma de Ewald, em um sistema unidimensional de
cargas pontuais. A esquerda, o espaço direto, ao centro a distribuição de cargas no espaço direto, a direita distribuição
de cargas gerada para o espaço recíproco.
A soma de Ewald tem um enorme custo computacional e alternativas
computacinalmente menos dispendiosas foram desenvolvidas. O Particle Mesh Ewald (PME)
(Figura 3.13) se apóia na avaliação da contribuição do espaço recíproco usando uma
transformada de Fourier rápida (FFT). Uma rede tridimensional é construida contendo o
espaço Cartesiano no qual a simulação de DM está sendo realizada e as cargas pontuais
provenientes das partículas do sistema são interpoladas na rede, em seguida a distribuição
gaussiana é calculada. A contribuição eletrostática é calculada de volta aos pontos da rede e
47
assim para cada partícula do sistema.
[Figura 3.13] Ilustração do método Particle Mesh Ewald. Primeiro as posições atômicas e as cargas são armazenadas,
em seguida é produzida uma rede de pontos, depois as cargas são interpoladas aos pontos da rede. A soma de Ewald é
realizada apenas para os pontos da rede. Finalmente o potencial é transferido de volta aos átomos e as coordenadas
são atualizadas para o próximo passo da DM.
3.7 Cálculo de cargas dos ligantes pelo ajuste do potencial eletrostático (ESP
ElectroStatic Potential)
As cargas ajustadas pela superfície de potencial eletrostático têm muitas vantagens.
Elas reproduzem bem as energias de interação, podem ser calculadas diretamente, e têm
mostrado boa performance em computar as energias conformacionais quando usados fatores
de escala eletrostáticos 1-4, que corrigem os valores para as interações não ligadas até o
terceiro vizinho. O artigo de Cornel et al no JACS (Cornel et al, 1994) contém muitas
validações para o este modelo de cargas. A idéia básica para o ajuste de cargas pelo potencial
eletrostático é o algoritmo de ajuste dos mínimos quadrados (lqst-fit) usado para derivar um
conjunto de cargas pontuais centradas nos átomos de forma a reproduzir da melhor forma o
potencial eletrostático da molécula, calculado a partir da Mecânica Quântica. Nos programas
de ajuste de cargas, o potencial é avaliado em um grande número de pontos definidos por uma
ou mais superfícies além do raio de van der Waals do átomo. O uso de quatro camadas de
superfícies com distâncias de 1,4; 1,6; 1,8; e 2,0 vezes o raio de van der Waals têm se
mostrado apropriado para derivar as cargas que reproduzem as interações intermoleculares
(energias e distâncias), bem como reproduzem o dipolo da molécula.
48
3.7.1 A escolha da Base
Para calcular as cargas dos ligantes selecionamos a base 6-31G* sabidamente exagera
no momento de dipolo para a maioria dos resíduos em 10%-20%. Apesar de aparentemente
parecer errado, este comportamento é desejável para derivar cargas que serão utilizadas nas
simulações de fase condensada, pois embute a quantidade de polarização que deve ser
esperada na solução de fase aquosa (a polarização fica representada implicitamente no
excesso de cargas). Em outras palavras, esperamos que a molécula seja mais polarizada na
fase condensada por causa de um maior número de interações com outros corpos e por isso,
com esta base, nós "pre-polarizamos" as cargas. Esta é uma abordagem necessária já que por
razões de custo computacional não utilizamos campos de forças com algoritmo de polarização
explícita. Em campos de forças polarizáveis a carga parcial sobre cada átomo varia com a
DM, sujeita às variações eletrostáticas nas vizinhanças. Se as cargas fossem derivadas por um
método com maior nível de teoria não seriam necessariamente melhores para estas aplicações
se elas não resultarem em momentos dipolo aumentados em relação à fase gasosa.
3.7.2 O método RESP para o ajuste de cargas.
As cargas RESP (Restrained EletroStatic Potential) (Cieplak et al, 1995) mostram
menor variabilidade conformacional do que as cargas ESP padrão, porque neste método o
ajuste pode ser feito usando diversas conformações ou múltiplas moléculas. As cargas RESP
também reproduzem bem as importantes energias de interação e energias livres de solvatação
e também resultam em boas energias conformacionais para as pequenas moléculas estudadas.
A idéia básica deste algoritmo de ajuste de cargas é que as cargas dos átomos que não
o hidrogênio são restringidas a um valor ótimo. Este modelo evoluiu do trabalho de
Christopher Bayly, que mostrou que as cargas em átomos mais internos (como alkil carbonos)
49
não eram bem determinadas pelos pontos do potencial eletrostáticos. Estes átomos geralmente
assumiam altos valores durante os cálculos de ajuste de cargas, além disso os valores dessas
cargas mostravam grande variabilidade conformacional. A variação de cargas em função da
conformação é um fenômeno perfeitamente normal e esperado para cálculos quânticos, porém
na mecânica clássica, exceto nos campos de forças polarizáveis, as cargas devem fixas. As
restrições implementadas são de natureza hiperbólica, então aproximadamente a mesma força
de restrição é sentida pelas cargas de todas as magnitudes. Isso diminui a magnitude das
cargas que podem ser reduzidas sem afetar muito o ajuste do potencial.
3.8 - Métodos de análise
3.8.1 - Raíz do Desvio Quadrático Médio.
A Raíz do Desvio Quadrático Médio (RMSD do inglês Root Mean Square Deviation
(Spiegel, 1994) é o resultado do cálculo realizado para a comparação de dois conjuntos de
dados, sua aplicação neste trabalho é o cálculo para a comparação das coordenadas dos
átomos (excluindo o solvente) ao longo do tempo das simulações em relação à estrutura
inicial como referência. Nesse caso temos um gráfico do desvio global da estrutura em relação
à conformação inicial versus tempo.
Outra análise com base na raiz da média quadrática é a Raíz da Flutuação Quadrática
Média (do inglês RMSF). Este método difere em relação ao primeiro pelo fato de agora
tomarmos como referência a estrutura média calculada após a simulação de Dinâmica
Molecular e calcularmos a flutuação de cada resíduo aminoácido em relação a sua posição
média. Nesse caso temos um gráfico do desvio ou flutuação conformacional de cada resíduo
versus sua posição na cadeia polipeptídica. A expressão geral do RMS é mostrada na Equação
15:
50
()
=
=
n
i
i
XX
n
RMS
1
2
1
[Equação 15]
onde é o número total de amostras, é a coordenada tridimensional de cada átomo da
amostra e
n
i
X
i
X
a coordenada de referência. O resultado destes cálculos dá idéia do quanto a
proteína variou ao longo do tempo além de permitir observar as variações locais, neste caso,
quais os resíduos que tiveram maior variação.
3.8.2 - Ligações Hidrogênio
As interações não covalentes são essenciais para a manutenção da estrutura da
proteína, para os processos de reconhecimento e para as interações proteína/ligante. As
ligações hidrogênio são um tipo peculiar de interações não-covalentes que possuem um papel
muito importante nos sistemas biológicos. As ligações hidrogênio contribuem para a afinidade
e especificidade das interações receptor-ligante, para a manutenção de conformações bioativas
das macromoléculas e manutenção das estruturas secundárias alfa-hélices e as folhas-beta de
proteínas. Nas biomoléculas essas interações são formadas entre átomos mais eletronegativos
que o carbono, como o oxigênio e o nitrogênio, que atuam como aceitadores e doadores de
hidrogênio (Figura 3.14). A energia envolvida nestas ligações é da ordem de 1 a 6 Kcal/mol,
superior ao ruído térmico para a temperatura ambiente (0,6 Kcal/mol), porém inferior às
energias envolvidas nas ligações iônicas, e bem menor que a das ligações covalentes.
Figura 3.14: Ligações Hidrogênio. São três as conveões para determinação de ligações hidrogênio, dados a
distância r e o ângulo
α
: Na figura à esquerda são consideradas distâncias r entre Doador (D) e Aceitador (A)
inferiores a 0,36nm, com
α
variando entre 0º e 60º; Na figura à direita, são consideradas distâncias r entre
Hidrogênio (H) e Aceitador (A) inferiores a 0.27nm, com
β
variando entre 120º e 180º; A terceira convenção é
a combinação dos critérios anteriores.
D
A
H
α
D A
H
β
r
r
D
A
H
α
D A
H
β
r
r
51
Neste trabalho as ligações hidrogênio foram mapeadas seguindo o critério Doador-
Hidrogênio-Aceitador entre a protease e os compostos com distância máxima: Doador-
Aceitador igual a 3,5 Å e ângulo mínimo
β
(Doador-Hidrogênio-Aceitador) igual a 120º. As
coordenadas foram coletadas a cada picosegundo de simulação e foram também consideradas
as ligações hidrogênio mediadas por moléculas de água do solvente entre a proteína e o
ligante.
3.8.3 - Gráfico de Ramachandram
A partir da análise da repulsão local de esferas rígidas entre átomos que eram terceiros
vizinhos (interação 1-4) ou acima (Ramachandram et al. 1963;), mapearam as regiões em que
os ângulos Phi (φ) e Psi (ψ
) para resíduos de aminoácidos seriam aceitáveis para a
composição tridimensional de proteínas, identificando as regiões referentes às estruturas
secundárias. Posteriormente o Mapa de Ramachandram (Figura 3.15) foi corrigido e refinado
com dados cristalográficos (Ho, B. K., A. Thomas, et al. (2003).
-180 -135 -90 -45 0 45 90 135 180
-135
-90
-45
0
45
90
135
180
φ (graus)
ψ (graus)
B
A
L
b
a
l
p
~p
~b
~a
~l
b
~b
b
~b
~b
-
(
3
10
α
L
α
π
II
C
2.2
7
-180 -135 -90 -45 0 45 90 135 180
-135
-90
-45
0
45
90
135
180
φ (graus)
ψ (graus)
B
A
L
b
a
l
p
~p
~b
~a
~l
b
~b
b
~b
~b
-
(
3
10
α
L
α
π
II
C
2.2
7
Est. Sec.
α
- (
3
10
π
2.2
7
II C
α
L
φ
-57
-119
-139
-49
-57
-78 -79 -51 57
ψ
-47
113
135
-26
70
59 150 153 47
Legenda
Alfa-Hélice [A,a,~a]
Folha Beta [B,b,~b}
Regiões mais favoráveis - [A,B,L] – em vermelho
Regiões adicionais permitidas - [a,b,l,p] – em amarelo
Regiões generosamente permitidas - [~a,~b,~l,~p] – em creme
Regiões não permitidas – em branco
Figura 3.15: Dados os ângulos φ e ψ de cada resíduo de uma seqüência peptídica e plotando-se no Gráfico de
Ramachandran é possível identificar regiões de estrutura secundária, bem como violações, nomeadamente nas
interações de van der Waals, de resíduos em regiões não permitidas.
52
A verificação das estruturas secundárias definidas nesse diagrama é uma importante
checagem para a qualidade de modelos e de estruturas obtidas experimentalmente. Nesse
trabalho, usamos para este fim o programa PROCHECK (Laskowski R A, MacArthur M W,
Moss D S & Thornton J M (1993).
3.8.4 Raio de Giro e Momento de Inércia
Uma analise sobre o formato adquirido pela proteína ao longo da simulação por
Dinâmica Molecular é possível monitorando o comportamento da proteína nos eixos x, y e z,
e calculando os principais momentos de inércia. O momento de inércia pode ser calculado
multiplicando-se o raio de giro pela massa da proteína. O raio de giro é calculado como:
g
R
2
|| ||
ii
i
g
i
i
m
R
m
⎛⎞
=
⎜⎟
⎜⎟
⎝⎠
r
[Equação 16]
onde é a massa do átomo e é a distância do átomo em relação ao cento de massa da
molécula. O momento de inércia é dado por:
i
m i
i
r i
2
g
i
i
RmI
=
[Equação 17]
Os momentos de inércia
I
para os eixos x, y e z com valores próximos indicam uma
forma esférica, enquanto dois valores similares e um componente muito menor indicam um
elipsóide oblato. A compactação total de uma proteína pode ser definida por um valor
α
,
calculado da seguinte forma (Tieleman
et al., 2000)
321
321
2
III
III
++
=
α
[Equação 18]
onde é o momento de inércia de maior valor, é o momento de inércia com o valor
intermediário e é o momento de inércia com o menor valor. Quanto mais próximo do zero
for esse valor, mais esférica é a proteína.
1
I
2
I
3
I
53
3.8.5 Área de Interação Intermolecular:
A avaliação da Área de Interação Intermolecular pelo cálculo da superfície de contato
proteína-ligante, com a discriminação para as áreas médias de contato com cada resíduo
aminoácido, é uma das melhores ferramentas no acesso a informações sobre a qualidade e
quantidade das interações entre a enzima e os ligantes, dando um respeitável subsídio para o
desenvolvimento de um fármaco. Com este exame podemos identificar grupos de contato
comuns aos ligantes que representam os bolsões de ligação (biding pockets) da enzima junto
aos ligantes e determinar, na enzima, não apenas quais seriam os resíduos mais importantes
para a ligação, como também qualificar e quantificar a sua relevância. Além disso, com a
comparação de áreas de contato de diferentes ligantes de mesmo alvo é possível observar
pontos de contato distintos que podem orientar o desenho de novos ligantes com maior
especificidade utilizando a combinação de sítios comuns e dos sítios distintos de contato.
Esta técnica se vale da avaliação da superfície intermolecular (SI) entre duas ou mais
superfícies moleculares ex. Proteína e Ligante. A Superfície Molecular (SM) ou Superfície de
van der Waals (SvdW) e a Superfície Acessível ao Solvente (SAS) (Richards, 1977) são
definidas a partir de uma prova esférica correndo sobre a proteína com seus átomos
representados por suas esferas de van der Waals (Figura 3.16). Diferente da avaliação da
superfície molecular, que leva em conta apenas as esferas de van der Waals, na avaliação da
Superfície Acessível ao Solvente esta ponta de prova tem diâmetro próximo de 0.14nm para
simular uma molécula de água. A partir das superfícies moleculares da proteína e do ligante é
possível determinar a Superfície Intermolecular como sendo a superfície de intersecção entre
a SAS do ligante e a SAS da proteína.
Para esta análise foi desenvolvido o programa LMDM-Surf (Alan Wilter, Diego Enry
B. Gomes & Gabriel Limaverde, 2005) que aplica o algoritmo de Connoly (Connoly 1983)
54
para cálculo da área média da superfície de contato molecular, e também individualiza a
contribuição de interação para cada resíduo de uma proteína.
Figura 3.16: Superfície Molecular: Uma ponta de prova esférica corre por sobre a superfície de van der Waals
(SvdW), gerando superfícies de contato e superfícies de reentrâncias (SR), que somadas compõem a superfície
molecular ou superfície exposta ao solvente (SM/SES). O centro da ponta de prova desenha a superfície
acessível ao solvente (SAS). A superfície intermolecular (SI) é composta quando há sobreposição de SAS entre
duas moléculas.
SAS
SM = SES = SR + SR
SvdW
SI
Ponta de
Prova
SAS
SM = SES = SR + SR
SvdW
SI
Ponta de
Prova
Neste trabalho foi tomado um quadro a cada picossegundo de simulação, descartando
os primeiros 2ns e analisando apenas os últimos 4ns das simulações. Discretizamos a
superfície intermolecular com 8 pontos por Å
2
, empregando raio da esfera de prova igual a 1,4
Å (diâmetro da molécula de água). Devido ao enorme número de contatos temporários
estabelecidos entre proteína-ligante, restringimos a análise aos contatos com média maior ou
igual a 5Å
2
. Porém, quando em um dos sistemas, um aminoácido apresenta área média de
interação dentro do critério de restrição, por motivo de comparação, este mesmo aminoácido
será contabilizado nos demais sistemas.
3.9 Procedimentos
3.9.1 - Modelagem Comparativa da Falcipaína-2
A seqüência da Falcipaína-2 (Figura 3.17) foi obtida do banco de dados SWISS-PROT
e TrEMBL do ExPASy Molecular Biology Server (Bairoch et al., 2000). A seqüência da
Falcipaína-2 foi submetida a uma busca contra o banco de dados de estruturas tridimensionais
55
de proteínas (PDB) (
http://www.rcsb.org/pdb/), usando as opções padrão do algorítimo
BLAST (Altschul et al., 1990), e contra bancos de dados de domínios conservados (Marchler-
Bauer et al., 2002).
QMNYEEVIKKYRGEENFDHAAYDWRLHSGVTPVKDQKNCGSCWAFSSIGSVESQYAIRKNK
LITLSEQELVDCSFKNYGCNGGLINNAFEDMIELGGICPDGDYPYVSDAPNLCNIDRCTEK
YGIKNYLSVPDNKLKEALRFLGPISISVAVSDDFAFYKEGIFDGECGDELNHAVMLVGFGM
KEIVNPLTKKGEKHYYYIIKNSWGQQWGERGFINIETDESGLMRKCGLGTDAFIPLIE
Figura 3.17: Seqüência da Falcipaína2 após o processamento do N-terminal (seqüência madura).
A seqüência do modelo foi alinhada com cada seqüência obtida no banco de dados
usando o método Needleman e Wunsch (Needleman et al., 1970). Gaps foram inseridos nas
seqüências a fim de chegar-se a um alinhamento ótimo. Os resíduos topologicamente
similares nas proteínas foram usados como referência para o alinhamento ótimo entre as
referências.
A derivação das coordenadas para as regiões estruturalmente conservadas e para as
regiões estruturalmente variáveis foi a seguir realizada automaticamente pelo servidor
SWISS-MODEL com base nas referências identificadas.
Foram realizadas alterações manuais no modelo gerado, como a correção de ângulos
de torção das regiões de loop a fim de adequar às coordenadas das referências. Propostas de
loops com geometria de pontes dissulfídricas incorretas e valores positivos de Phi para prolina
foram desconsideradas. O modelo foi re-submetido ao servidor SWISS-MODEL para a
obtenção das coordenadas finais.
3.92 Condições de Simulação
3.9.2.1 Montagem e Preparação dos sistemas
Os sistemas simulados foram montados na forma apresentada na tabela 3.1. Para o
posicionamento aproximado do ligante E64 no sítio ativo do modelo Falcipaína-2 fizemos a
56
sobreposição do modelo da FP2 com um complexo da Catepsina K (PDB: 1ATK) com este
ligante, encontrado no PDB. As coordenadas do ligante são extraídas pela sobreposição do
modelo da FP2 à estrutura cristalográfica da Catepsina K humana (PDB: 1ATK), resolvida
em complexo com o E64. O EP-64 foi formado pela remoção da ligação covalente seguido do
fechamento do grupamento epóxido. O ligante Z-LR-AMC compartilha o leucil e o arginil
centrais com o E64, portanto usamos as coordenadas destes grupos como referência para a
construção do restante do ligante, adicionando os grupamentos Z e AMC, e para o
ancoramente a Falcipaína-2, seguindo por otimização das geometrias. O ligante CP1 foi
ancorado usando opções padrão do programa Autodock.
Tabela-3.1: Descrição dos sistemas simulados
Sistema Descrição
1ATK Catepsina K (controle)
FP2 FP2 (controle)
FP2-E64 E64 ligação covalente
FP2/E64 E64 ligação não covalente
FP2/ZLR Z-LR-AMC ligação não covalente
FP2/CP1 CP1 ligação não covalente
Para as simulações moleculares utilizamos dois pares de campos de forças o
GROMOS96 (Van Gunsteren, W. F. et al., 1996) junto com o modelo SPC de água e o OPLS
(Jorgensen, 2004) junto com o modelo de água TIP4P. Os parâmetros de carga escolhidos
para os resíduos foram padrões de carga mais prováveis quando o resíduo se encontra em pH
7. Em todos os sistemas, os resíduos Arginina (ARG) e Lisina (LYS) foram protonados
ficando com carga líquida +1, as Histidinas (HIS) permaneceram neutras (só um próton,
ND1) nas simulações com o E64 ligado não covalentemente, e protonadas quando simulada
com a forma ligada covalentemente do E64 com o GROMOS96. Nas simulações com o OPLS
produzimos também a situação com a Histidina 157 protonada para a forma não ligada do
E64. Os resíduos GLU ficaram em estados desprotonados, carga –1. Por fim, os terminais
57
amina e carboxila de cada cadeia das proteases ficaram com carga +1
e e -1e, respectivamente.
A FP2 ficou com carga total -12.
Os sistemas foram centralizados em caixas tríclicas com a distância mínima dos lados
à proteína de 1.5nm. As caixas foram preenchidas com aproximadamente 10 mil moléculas de
água num total de aproximadamente 32 mil átomos. Todos os modelos apresentaram carga
total em números inteiros, porém não nula, tornando necessário que as cargas dos sistemas
fossem neutralizadas pela substituição de moléculas de águas por contra-íons (Na+ ou Cl-)
nas posições mais favoráveis eletrostaticamente.
As energias dos sistemas simulados no campo de forças GROMOS96 e OPLS foram
minimizadas pela aplicação do protocolo, na seqüência:
1)
Otimização de Geometrias: Método do Máximo declive (steepest descent) com raios de
corte para Coulomb de 1.5nm e van der Waals 1.4nm, o modelo de água SPC (GROMOS) ou
TIP4P (OPLS) com os átomos da proteína restritos por um potencial (x1000) às suas posições
iniciais, e as moléculas de água, íons e ligante, livres. Esta primeira etapa é crucial para a
adequação do ligante à fenda catalítica da proteína, sem alteração desta, uma vez que a etapa
de sobreposição pode ter criado tensões indesejadas entre a proteína e o ligante.
2)
Otimização de Geometrias com todos os átomos livres: nova aplicação do Método do
Máximo Declive.
3)
Refinamento da Otimização: Método dos Gradientes Conjugados (GROMOS96) ou L-
BFGS (OPLS) com todos os átomos do sistema livres.
4) Simulação de Dinâmica Molecular a 310K de 500ps para o GROMOS e 1000ps para o
OPLS, novamente aplicando as restrições de posição apenas às coordenadas dos átomos da
proteína, liberando o solvente e ligante, a fim alcançar uma solvatação eficiente da proteína.
58
4.1) Para as simulações no OPLS após a etapa 4, repetimos as etapas 1->3 antes de iniciar a
etapa 5, devido a estarem sendo simulados todos os átomos de hidrogênio do sistema,
inclusive os ligados a carbono.
5) Simulação de Dinâmica Molecular preparatória de 1ns para, antes de começar a coleta de
dados, aguardar um período de tempo de equilíbrio, para que o sistema melhor se adapte às
condições de simulação, temperatura, pressão, campo de forças, qualidade do solvente etc.
As simulações de Dinâmica Molecular se estenderam por 6.0ns. O uso de algoritmos
de constrição para ajustar para as distâncias e ângulos de ligação entre átomos (em especial
para os átomos de hidrogênio) nos permitiu um passo de integração
t
Δ
igual a 2.0fs. Usamos
o algoritmo SETTLE (Miyamoto et al., 1992) para o solvente e LINCS (Hess et al., 1997)
para a proteína e ligantes, os quais são os mais rápidos até hoje implementados para
simulações de MD. Simulamos os sistemas à temperatura de 310 K e pressão igual a 1.0 atm,
usando acoplamento térmico e de pressão de Berendsen (Berendsen et al., 1984), modelo de
água SPC (Berendsen et al. 1981) para o GROMOS, e TIP4P para o OPLS, registrando as
coordenadas espaciais atômicas e velocidades a cada 500 passos de tempo e energias a cada
100 passos. Para o acoplamento térmico, os átomos dos sistemas foram divididos em grupos
separados para proteína, solvente, ligante e íons, o que garante aos grupos uma distribuição de
velocidades à temperatura simulada (310K). Além disso, o registro de energias também foi
separado em grupos visando o cálculo da estimativa da variação da energia livre de ligação.
3.9.2.2 Tratamento das interações não ligadas.
Para as interações de van der Waals foi usado um raio de corte de 1.4 nanômetros,
condição em que foi parametrizado o termo de van der Waals do campo de forças. Para as
simulações com o GROMOS o método do Campo de Reação (Schreiber et al., 1992) foi
aplicado para o tratamento das interações eletrostáticas de longo alcance, com Raio de Corte
59
em 1.5 nanômetros e ajustando a permissividade do meio externo em
ε
=54 (valor adequado
para o modelo SPC de água (Smith, 1994), atualizando a lista de vizinhos para a interação
entre 1.0 e 1.5 nanômetros a cada 5 passos. Para as simulações com o OPLS o PME foi o
tratamento eletrostático aplicado com raio de corte de 1.5nm. Por causa do método LIE para
cálculo das diferenças de energia livre de Gibbs de ligação (ΔGL), outras simulações
envolvendo somente os ligantes em solvente explícito foram realizadas nos termos acima,
entretanto sem a adição de contra-íons.
3.9.2.3 Parametrização dos Ligantes.
As coordenadas para todos os ligantes foram construídas no programa Marvin Sketch.
Os parâmetros do campo de força GROMOS96 para proteína já estão bem estabelecidos e
disponíveis em tabelas distribuídas com os softwares de modelagem molecular. Porém, para
estruturas não peptídicas e ou de aminoácidos modificados não há parametrização tabelada.
Na parametrização dos ligantes simulados no campo de forças GROMOS96
(E64, EP64 e Z-
LR-AMC) foram aproveitados os parâmetros dos resíduos Leucina e Arginina que constituem
grande parte destes ligantes.
As constantes de ligação e de ângulo para o grupamento epóxido do E64
foram obtidas a partir de parâmetros aproximados de ligação e ângulo obtidos de grupamentos
similares na tabela do campo de forças. Para o grupamento “Z” (benzil-oxi-carbonil) foram
unidos parâmetros do resíduo Fenilalanina com um óxi-carbonil. A composição do
grupamento AMC (7-metil-4-amino-coumarin) foi um pouco mais complexa, já que não
existe o grupamento coumarina no banco de dados do GROMOS96. Os parâmetros para este
grupo inicialmente passaram por uma adaptação dos parâmetros do anel do resíduo Triptofano
substituindo o Oxigênio pelo Nitrogênio e modificando os parâmetros de ligação obtidos da
do banco de dados do campo de forças.
b
K
θ
K
60
Após esta fase inicial de construção dos ligantes foi iniciado o refinamento da
parametrização dos ligantes, por um protocolo que envolve seqüencialmente cálculos
clássicos, quânticos semi-empíricos e
ab initio. Passo a passo, foi realizada a otimização da
geometria usando parâmetros iniciais para todos os átomos. Em seguida continuamos a
otimização da estrutura usando o método semi-empírico PM3 e terminamos com o cálculo
definitivo de estrutura e cargas pelo cálculo
ab initio usando o GAUSSIAN 98 (Frisch, 1998),
pelo método da teoria de funcional densidade (DFT) Becke-Style 3 (B3LYP) na base 6-
31G** (B3LYP/6-31G**), ajustando as cargas pelo método ChelpG {Breneman, 1990 }, e
assumindo carga total nula para o sistema.
Seguir este protocolo de otimização da estrutura é importante, pois pode economizar
muitas horas de cálculo computacional para sistemas como este. (ex. A otimização da
estrutura do E64 pelo método
ab inito deste sistema levou cerca de 19 horas usando este
protocolo e mais de 80 horas quando a etapa do cálculo semi-empírico é excluída, em um
processador Pentim III 1GHz). O resultado do cálculo de cargas para os resíduos Leucina e
Arginina mostraram-se bastante similares aos parâmetros do campo de força GROMOS96.
Assim como na parametrização para o GROMOS96, os ligantes simulados no campo
de forças OPLS (E64, EP64 e CP1) na medida do possível tiveram os parâmetros extraídos da
tabela do campo de forças. Entretanto, os cálculos de cargas foram realizados de forma
diferente empregando o método
Restrained EletrosStatic Potential fit (RESP) ou ajuste
restrito do potencial eletrostático, uma modificação no método original ESP que produz as
cargas com menor variabilidade conformacional do que as cargas ESP padrão.
1
2
3
4
6
7
9
11
10
24
18
20
15
13
28
29
30
32
35
38
41
44
50
46
47
1
2
3
4
6
7
9
11
10
24
18
20
15
13
28
29
30
32
35
38
41
44
50
46
47
61
Figura 3.18A: E-64
Figura 3.18B: Z-LR-AMC
Figura 3.18C: CP1
1
2
3
4
5
6
8
10
9
11
13
18
19
20
1
23
24
25
26
28
3029
35
36
37
40
39
41
43
44
42
50
48
49
47
46
45
14
15
16
17
1
2
3
4
5
6
8
10
9
11
13
18
19
20
1
23
24
25
26
28
3029
35
36
37
40
39
41
43
44
42
50
48
49
47
46
45
14
15
16
17
46
45
27 28
14
13
31
32
4
6
29
7
2
1
11
9
17
19
21
23
25
1635
34
43
41
39
37
44
46
45
27 28
14
13
31
32
4
6
29
7
2
1
11
9
17
19
21
23
25
1635
34
43
41
39
37
44
3.9.2.3 Construção das Topologias dos ligantes
Um esboço das topologias foi gerado automaticamente pelo servidor PRODRG2 (Van
Aalten et al., 1996) cuja proposta é gerar topologias para diferentes campos de forças. As
topologias foram convertidas manualmente do campo de força GROMOS87 para campos de
força GROMOS96 e OPLS adequando os parâmetros e adicionado os átomos de hidrogênio
dos anéis aromáticos bem como os potenciais de diedro impróprio aos quais participam (não
descritos pelo campo de força GROMOS87 e não utilizados para o OPLS). A principio os
parâmetros referentes a ligações, ângulos, cargas, etc, foram derivados dos parâmetros do
campo de força, comparando as partes do composto com estruturas similares já
parametrizadas. Para as partes em que não houve referência foram usados os dados dos
cálculos quânticos e adicionados novos parâmetros ao campo de forças.
62
3.10 - Métodos Computacionais
As simulações de dinâmica molecular foram realizadas aproveitando o recurso dos
clusters de computadores associados ao instituto virtual de bioinformática e projeto Biopauá.
A Modelagem comparativa foi realizada no SWISS-PDB-VIEWER em conjunto com
servidor SWISS-MODEL (Guex et al., 1997). A análise geométrica e de consistência do
ambiente local foi avaliada com o PROCHECK (Laskowski et al., 1996); a predição da
estrutura secundária foi realizada com o servidor PSIPRED; a topologia bidimensional e
tridimensional dos ligantes foram construída no programa Marvin Sketch e Ghemical,
respectivamente; os cálculos quânticos semi-empíricos e
ab initio foram realizados pelo
Gaussian98; o pacote de programas GROMACS (Lindahl et al., 2001b) foi usado para as
simulações de Dinâmica Molecular e análises dos resultados; as automatizações de execução
e análises das simulações foram realizadas pelos LMDM-2Rungmx e LMDM-USSAP. Os
programas usados neste trabalho estão listados na tabela 3.2
Funcionalidade Programa Informações
Predição de Estrutura Terciária SWISS-MODEL http://www.expasy.ch
Predão das Estruturas Secundárias PSIPRED
Simulações de Dinâmica Molecular GROMACS http://www.gromacs.org
Topologia tridimensional GHEMICAL
Topologia bidimensional MARVIN SKETCH http://www.chemaxon.com
lculos quânticos Gaussian98 http://www.gaussian.com
Superfície Intermolecular LMDM-Surf diego@biof.ufrj.br
Automázação da Execução das Simulações LMDM-2rungmx diego@biof.ufrj.br
Automatização das Análises das Simulações LMDM-USSAP 0.8 diego@biof.ufrj.br
Tabela 3.2 – Programas usados.
62
4 – Modelagem Comparativa – Resultados e Discussão .....................................................63
4.1 – Criação dos Modelos. ....................................................................................................63
4.1.1 - Alinhamento.........................................................................................................63
4.1.2 – Validação dos modelos.......................................................................................65
4.1.3 - Propriedades do Modelo Estruturais da Falcipaína-2.....................................66
5 - Simulações das Proteases Livres – Resultados e Discussões .........................................69
5.1 –Dinâmica Molecular dos Modelos propostos: M1 à M4. ........................................69
5.1.1 - Desvio da raiz média quadrática .......................................................................69
5.1.2 – Avaliação da Superfície Molecular Acessível ao Solvente..............................72
5.1.3 – Variações estruturais globais.............................................................................73
63
4 – Modelagem Comparativa – Resultados e Discussão
4.1 – Criação dos Modelos.
4.1.1 - Alinhamento
Devido à ausência de similaridade com a seqüência completa, apenas a seqüência
madura, começando pelo resíduo Asp18 foi considerada para derivar as coordenadas dos
modelos. As proteínas significantemente similares identificadas por esta busca, de código
PDB: 1CQD, 1ATK, 1AEC, 1YAL e 1PPN, pertencem à família de enzimas hidrolases; com
a fonte variando de Homo sapiens, Carica papaya até Trypanossoma cruzi e Leishmania
major.
Os modelos para a Falcipaína-2 foram construídos com base no alinhamento múltiplo
entre as seqüências e estruturas de proteínas similares identificadas no banco de dados de
estruturas de proteínas. A média de similaridade entre a Falcipaína-2 e as proteínas usadas
como referência foi de 35%. Interessantemente quando comparamos as estruturas de
referência (Figura 4.1), o RMSD entre os fica em torno do 0.72Å indicando uma forte
conservação estrutural na família de cisteíno proteases como previamente observado (Sajid et
al., 2002).
α
C
Figura 4.1: Alinhamento estrutural dos cristais usados como referência para a construção dos Modelos da
Falcipaína-2. Azul 1CQD, amarelo 1ATK, verde 1AEC, ciano 1YAL e cinza 1PPN. Figuras rotacionadas
em 90º no eixo X.
64
Um total de 11 regiões estruturalmente conservadas foi encontrado (Tabela 4.1 e
Figura 4.2), o que constitui o maior segmento (cerca de 80%) da seqüência. As demais partes
triviais da seqüência, que são as regiões estruturalmente variáveis, estão afastadas do sitio de
ligação. Alguns resíduos estratégicos para esta família de enzimas como a cisteína catalítica
(Cys25), histidina 157, e asparagina 187, também aparecem conservadas na Falcipaína-2.
Além disso, a glutamina 19 e o triptofano 189 (Sajid et al., 2002) também estavam
preservados, fechando a “cavidade oxiânion”.
Tabela-4.1: Regiões estruturalmente conservadas
Motivo estrutural Resíduos
Hélice-1 W27-K42
Hélice-2 E50-C56
Hélice-3 E70-E77
Hélice-4 D116-L126
Hélice-5 D137-F141
Fita-1 P88-S91
Fita-2 K105-S113
Fita-3 S130-V135
Fita-4 A158-G165
Fita-5 Y182-N187
Fita-6 G197-T203
A Falcipaína-2 tem um total de 17 aminoácidos de inserções em relação à sua família
de proteínas. Para a região de maior inserção (alça), foram propostas diferentes alternativas
conformacionais a fim de alcançar valores de energia potencial e estereoquímica aceitáveis,
além da manutenção das características conformacionais e eletrostáticas do sítio de ligação.
Para tanto, foram gerados quatro Modelos (M1 a M4) mostrados na Figura 4.3.
fal2 1 DHAAYDWRLH SGVTPVKDQK NCGSCWAFSS IGSVESQYAI RKNKLITLSE QELVDCSFK- -NYGCNGGLI NNAFEDMIEL G-GICPDGDY PYVSDAPNLC NI----DRCT EKY-GIKNYL
1ppn 1 IPEYVDWRQK GAVTPVKNQG SCGSCWAFSA VVTIEGIIKI RTGNLNEYSE QELLDCDRR- -SYGCNGGYP WSALQ-LVAQ Y-GIHYRNTY PY-EGVQRYC RSREKG-PYA AKTDGVRQVQ
1aec 1 LPSYVDWRSA GAVVDIKSQG ECGGCWAFSA IATVEGINKI VTGVLISLSE QELIDCGRTQ NTRGCNGGYI TDGFQ-FIIN NGGINTEENY PY-TAQDGEC N-VDLQNEKY VTIDTYENVP
1atk 1 APDSVDYRKK GYVTPVKNQG QCGSCWAFSS VGALEGQLKK KTGKLLNLSP QNLVDCVSE- -NDGCGGGYM TNAFQ-YVQK NRGIDSEDAY PY-VGQEESC MY--NPTGKA AKCRGYREIP
1cqd 3 LPDSIDWREN GAVVPVKNQG GCGSCWAFST VAAVEGINQI VTGDLISLSE QQLVDCTTA- -NHGCRGGWM NPAFQ-FIVN NGGINSEETY PY-RGQDGIC N-STVN-APV VSIDSYENVP
1yal 1 YPQSIDWRAK GAVTPVKNQG ACGS-WAFST IATVEGINKI VTGNLLELSE QELVDCDKH- -SYGCKGGYQ TTSLQ-YVAN N-GVHTSKVY PY-QAKQYKC RATDKP-GPK VKITGYKRVP
* * . * .*.* **. ****. . ..*. * * *.*.** . ** ** ... . *. * ** *
fal2 113 SVPDNKLKEA LRF-LGPISI SVAVSDDFAF YKEGIFDGE- CGD-QLNHAV MLVGFGMKEI VNPLTKKGEK HYYYIIKNSW GQQWGERGFI NIETDESGLM RKCGLGTDAF IPLIE
1ppn 115 PYNEGALLYS IAN-QPVSVV LEAAGKDFQL YRGGIFVGP- CGN-KVDHAV AAVGYGPN-- ---------- --YILIKNSW GTGWGENGYI RIKRGTGNSY GVCGLYTSSF YPVKN --
1aec 118 YNNEWALQTA VTY-QPVSVA LDAAGDAFKQ YSSGIFTGP- CGT-AIDHAV TIVGYGTEGG ---------- IDYWIVKNSW DTTWGEEGYM RILRNVG-GA GTCGIATMPS YPVK
1atk 115 EGNEKALKRA VARVGPVSVA IDASLTSFQF YSKGVYYDES CNSDNLNHAV LAVGYGIQKG ---------- NKHWIIKNSW GENWGNKGYI LMARNKN--- NACGIANLAS FPKM-
1cqd 117 SHNEQSLQKA VAN-QPVSVT MDAAGRDFQL YRSGIFTGS- CNI-SANHAL TVVGYGTEND ---------- KDFWIVKNSW GKNWGESGYI RAERNIENPD GKCGITRFAS YPVKK
1yal 115 SN-ETSFLGA LAN-QPLSVL VEAGGKPFQL YKSGVFDGP- CGT-KLDHAV TAVGYGTSDG ---------- KNYIIIKNSW GPNWGEKGYM RLKRQSGNSQ GTCGVYKSSY YPFKGFA-
. . . . * * * *.. * .**. **.* ..**** **. *.. **. . *
fal2 1 DHAAYDWRLH SGVTPVKDQK NCGSCWAFSS IGSVESQYAI RKNKLITLSE QELVDCSFK- -NYGCNGGLI NNAFEDMIEL G-GICPDGDY PYVSDAPNLC NI----DRCT EKY-GIKNYL
1ppn 1 IPEYVDWRQK GAVTPVKNQG SCGSCWAFSA VVTIEGIIKI RTGNLNEYSE QELLDCDRR- -SYGCNGGYP WSALQ-LVAQ Y-GIHYRNTY PY-EGVQRYC RSREKG-PYA AKTDGVRQVQ
1aec 1 LPSYVDWRSA GAVVDIKSQG ECGGCWAFSA IATVEGINKI VTGVLISLSE QELIDCGRTQ NTRGCNGGYI TDGFQ-FIIN NGGINTEENY PY-TAQDGEC N-VDLQNEKY VTIDTYENVP
1atk 1 APDSVDYRKK GYVTPVKNQG QCGSCWAFSS VGALEGQLKK KTGKLLNLSP QNLVDCVSE- -NDGCGGGYM TNAFQ-YVQK NRGIDSEDAY PY-VGQEESC MY--NPTGKA AKCRGYREIP
1cqd 3 LPDSIDWREN GAVVPVKNQG GCGSCWAFST VAAVEGINQI VTGDLISLSE QQLVDCTTA- -NHGCRGGWM NPAFQ-FIVN NGGINSEETY PY-RGQDGIC N-STVN-APV VSIDSYENVP
1yal 1 YPQSIDWRAK GAVTPVKNQG ACGS-WAFST IATVEGINKI VTGNLLELSE QELVDCDKH- -SYGCKGGYQ TTSLQ-YVAN N-GVHTSKVY PY-QAKQYKC RATDKP-GPK VKITGYKRVP
* * . * .*.* **. ****. . ..*. * * *.*.** . ** ** ... . *. * ** *
fal2 113 SVPDNKLKEA LRF-LGPISI SVAVSDDFAF YKEGIFDGE- CGD-QLNHAV MLVGFGMKEI VNPLTKKGEK HYYYIIKNSW GQQWGERGFI NIETDESGLM RKCGLGTDAF IPLIE
1ppn 115 PYNEGALLYS IAN-QPVSVV LEAAGKDFQL YRGGIFVGP- CGN-KVDHAV AAVGYGPN-- ---------- --YILIKNSW GTGWGENGYI RIKRGTGNSY GVCGLYTSSF YPVKN --
1aec 118 YNNEWALQTA VTY-QPVSVA LDAAGDAFKQ YSSGIFTGP- CGT-AIDHAV TIVGYGTEGG ---------- IDYWIVKNSW DTTWGEEGYM RILRNVG-GA GTCGIATMPS YPVK
1atk 115 EGNEKALKRA VARVGPVSVA IDASLTSFQF YSKGVYYDES CNSDNLNHAV LAVGYGIQKG ---------- NKHWIIKNSW GENWGNKGYI LMARNKN--- NACGIANLAS FPKM-
1cqd 117 SHNEQSLQKA VAN-QPVSVT MDAAGRDFQL YRSGIFTGS- CNI-SANHAL TVVGYGTEND ---------- KDFWIVKNSW GKNWGESGYI RAERNIENPD GKCGITRFAS YPVKK
1yal 115 SN-ETSFLGA LAN-QPLSVL VEAGGKPFQL YKSGVFDGP- CGT-KLDHAV TAVGYGTSDG ---------- KNYIIIKNSW GPNWGEKGYM RLKRQSGNSQ GTCGVYKSSY YPFKGFA-
. . . . * * * *.. * .**. **.* ..**** **. *.. **. . *
fal2 1 DHAAYDWRLH SGVTPVKDQK NCGSCWAFSS IGSVESQYAI RKNKLITLSE QELVDCSFK- -NYGCNGGLI NNAFEDMIEL G-GICPDGDY PYVSDAPNLC NI----DRCT EKY-GIKNYL
1ppn 1 IPEYVDWRQK GAVTPVKNQG SCGSCWAFSA VVTIEGIIKI RTGNLNEYSE QELLDCDRR- -SYGCNGGYP WSALQ-LVAQ Y-GIHYRNTY PY-EGVQRYC RSREKG-PYA AKTDGVRQVQ
1aec 1 LPSYVDWRSA GAVVDIKSQG ECGGCWAFSA IATVEGINKI VTGVLISLSE QELIDCGRTQ NTRGCNGGYI TDGFQ-FIIN NGGINTEENY PY-TAQDGEC N-VDLQNEKY VTIDTYENVP
1atk 1 APDSVDYRKK GYVTPVKNQG QCGSCWAFSS VGALEGQLKK KTGKLLNLSP QNLVDCVSE- -NDGCGGGYM TNAFQ-YVQK NRGIDSEDAY PY-VGQEESC MY--NPTGKA AKCRGYREIP
1cqd 3 LPDSIDWREN GAVVPVKNQG GCGSCWAFST VAAVEGINQI VTGDLISLSE QQLVDCTTA- -NHGCRGGWM NPAFQ-FIVN NGGINSEETY PY-RGQDGIC N-STVN-APV VSIDSYENVP
1yal 1 YPQSIDWRAK GAVTPVKNQG ACGS-WAFST IATVEGINKI VTGNLLELSE QELVDCDKH- -SYGCKGGYQ TTSLQ-YVAN N-GVHTSKVY PY-QAKQYKC RATDKP-GPK VKITGYKRVP
* * . * .*.* **. ****. . ..*. * * *.*.** . ** ** ... . *. * ** *
fal2 113 SVPDNKLKEA LRF-LGPISI SVAVSDDFAF YKEGIFDGE- CGD-QLNHAV MLVGFGMKEI VNPLTKKGEK HYYYIIKNSW GQQWGERGFI NIETDESGLM RKCGLGTDAF IPLIE
1ppn 115 PYNEGALLYS IAN-QPVSVV LEAAGKDFQL YRGGIFVGP- CGN-KVDHAV AAVGYGPN-- ---------- --YILIKNSW GTGWGENGYI RIKRGTGNSY GVCGLYTSSF YPVKN --
1aec 118 YNNEWALQTA VTY-QPVSVA LDAAGDAFKQ YSSGIFTGP- CGT-AIDHAV TIVGYGTEGG ---------- IDYWIVKNSW DTTWGEEGYM RILRNVG-GA GTCGIATMPS YPVK
1atk 115 EGNEKALKRA VARVGPVSVA IDASLTSFQF YSKGVYYDES CNSDNLNHAV LAVGYGIQKG ---------- NKHWIIKNSW GENWGNKGYI LMARNKN--- NACGIANLAS FPKM-
1cqd 117 SHNEQSLQKA VAN-QPVSVT MDAAGRDFQL YRSGIFTGS- CNI-SANHAL TVVGYGTEND ---------- KDFWIVKNSW GKNWGESGYI RAERNIENPD GKCGITRFAS YPVKK
1yal 115 SN-ETSFLGA LAN-QPLSVL VEAGGKPFQL YKSGVFDGP- CGT-KLDHAV TAVGYGTSDG ---------- KNYIIIKNSW GPNWGEKGYM RLKRQSGNSQ GTCGVYKSSY YPFKGFA-
. . . . * * * *.. * .**. **.* ..**** **. *.. **. . *
Figura 4.2: As regiões estruturalmente conservadas. Em amarelo, as regiões em hélice-alfa, em verde, em fita-beta. Em
vermelho a maior região de inserção da falcipaína-2 (alça).
65
No Modelo 1 (M1) foi considerada uma extensão da folha-beta que origina esta alça;
no Modelo 2 (M2), esta alça foi substituída pela estrutura presente na referência seqüencial
de maior homologia (1ATK – catepsina K humana); no Modelo 3 (M3) é feita uma diferente
proposta para o alinhamento; e no Modelo 4 (M4) um banco de dados de estruturas (SWISS-
MODEL loop database) foi rastreado a fim de encontrar uma conformação de menor energia
para esta alça.
Figura 4.3: Sobreposição dos modelos para a Falcipaína-2: Em amarelo está representado o modelo 1 (M1),
em azul o modelo 2 (M2), em verde o modelo 3 (M3), e em vermelho o modelo 4 (M4). A diferença entre
os modelos é essencialmente a posição da alça à esquerda e no modelo 2 a ausência desta alça.
4.1.2 – Validação dos modelos.
Os gráficos de Ramachandran (Edsall et al., 1966) mostraram uma distribuição normal
de pontos, com ângulos Phi em sua maioria restritos a valores negativos e valores de Psi
agrupados em regiões distintas com 97% dos resíduos ocupando as regiões permitidas. As
distancias das ligações, quiralidade de C-alpha, torção de amidas
(
)
ω
, torções Phi e Psi para
hélices, Phi para prolinas e torções de cadeias laterais (
1
χ
e
2
χ
) mostraram baixo desvio dos
valores permitidos.
A predição de estrutura secundária pelo PSI-PRED (Jones, 1999) sugeriu cinco
hélices-alpha e seis fitas-beta, e o restante da estrutura sendo predita como volta (coil). Estes
resultados (Tabela 4.1) coincidem com a estrutura secundária do modelo final. Em resumo, as
66
análises mencionadas indicam que o modelo é consistente com o presente conhecimento de
estrutura de proteínas.
4.1.3 - Propriedades do Modelo Estruturais da Falcipaína-2.
Como esperado, os modelos mostraram propriedades estruturais características da
família de enzimas das cisteíno proteases (Maes et al., 1996; Gillmor et al., 1997;Selzer et al.,
1997; Zhao et al., 1997;Choi et al., 1999). Os motivos estruturais mais importantes,
compreendendo as cinco hélices, seis fitas e seis voltas estão descritos na Tabela 4.2.
Os resíduos que constituem o sítio de ligação em volta da Cys25 catalítica estão
localizados próximos ao N-terminal da hélice-2, como mostrado na Figura 4.4. Próxima a
Cys25 está a His157 (N-terminal da fita-3), a qual deve estar envolvida na formação do par
iônico thiolato/imidazol, como se tem observado no caso das cisteíno proteases (Leung et al.,
2000). A orientação apropriada para este par é facilitada pela asparagina (Asn 187) que é
aceptora de uma ligação de hidrogênio com o nitrogênio
2
ε
N
da His157.
Um dos eventos essenciais para a hidrólise catalítica das ligações peptídicas é o ataque
nucleofílico do ânion thiolato no carbonil deficiente de elétrons do substrato. Esta adição-1,2
resulta na formação de um intermediário tetraédrico com carga negativa, que acredita-se ser
estabilizado pela cavidade oxiânion formada pelos prótons da amida da cadeia lateral da
glutamina (Gln19) e o hidrogênio indólico do triptofano (Trp189) (Sajid et al., 2002).
Na Falcipaína-2, assim como em outras enzimas da família, a Gln19 e o Trp189 estão
em similar orientação (Figura 4.4) no sítio ativo e, portanto pode se propor que tenham um
papel paralelo na estabilidade deste hemithoketal. Além disso, a região rica em glicina
(Brinen et al., 2000) comprometendo principalmente Gly65 e Gly66 pode prover estabilidade
adicional ao complexo pela formação de uma constelação de ligações de hidrogênio com os
substratos ou inibidores.
67
Figura 4.4: Detalhe do modelo da estrutura da Falcipaína 2, em vermelho as hélices-alpha, e em amarelo as
fitas-beta. Em bastões, os resíduos Gln19, Cys25, Gly 65, Gly66, His159, Trp177 e Asn205 (numeração da
papaína) importantes para o sítio ativo da enzima.
Os resíduos do sítio ativo estão listados na Tabela 4.2 (Sabnis et al., 2003). O sítio
ativo das enzimas da família das cisteíno proteases é geralmente considerado por ser
constituído de quatro bolsões, S1, S2, S1' e S3 (Sajid et al., 2002). O bolsão S1 é o menos
definido entre as cisteíno proteases e tem importância duvidosa na afinidade aos ligantes
(Mcgrath, 1999).
Tabela-4.2: Previsão do sítio ativo da Falcipaína-2 e aminoácidos correspondentes na Catepsina-K humana.
Subsítio Falci
p
aína-2 Cate
p
sina-
K
S1 Q19-G23-C63-N64 Q19-G23-C63-G64
S2 L67-I68-S132-L155-D217 Y67-M68-A134-L160-L209
S1’ V133-V135-S136-A140-H157- D136-A137-S138-F142-H162-W184
S3 K59-N60-Y61-G65-G66 E59-N60-D61-G65-G66
O bolsão mais bem definido, e que governa a especificidade ao ligante é o bolsão S2.
Apesar de todos os resíduos aqui serem hidrofóbicos, ocasionalmente um resíduo polar ou
carregado, como o ácido glutâmico ou aspártico está presente ao final do bolsão, o que
acontece na Falcipaína-2 e na Cruzaína, do Tripanossoma cruzi. Um dos resíduos mais
conservados no bolsão S1' é o triptofano, que é conhecido como participante de interações
hidrofóbicas com os substratos. No entanto os anéis aromáticos do triptofano podem
polarizar-se com facilidade, gerando também interações polares do tipo cátion-pi. A região
68
rica em glicinas do sitio ativo representa o bolsão S3, o que confere flexibilidade a este sub-
sítio. Para o modelo da Falcipaína-2, prevemos a topologia como similar a dos outros
membros da família devido à alta conservação dos resíduos do sítio ativo e alta similaridade
estrutural entre as proteínas da família.
69
5 - Simulações das Proteases Livres – Resultados e Discussões
5.1 –Dinâmica Molecular dos Modelos propostos: M1 à M4.
5.1.1 – Raiz do Desvio Quadrático Médio
De posse dos modelos teóricos para a Falcipaína-2, validados nos passos descritos
anteriormente prosseguiu-se com as simulações de Dinâmica Molecular para refinar e
selecionar o melhor modelo para a alça de Falcipaína-2. Sabe-se que para as proteínas serem
ativas estas precisam apresentar estabilidade conformacional e, no caso de enzimas, o sítio
ativo deve manter-se funcional. Dado um conjunto com várias conformações para qualquer
um dos sistemas em estudo, algumas formas de obter valores quantitativos referentes à
estabilidade destes sistemas são avaliar o resultado do cálculo da raiz da média quadrática (do
inglês RMS – Root Mean Square) e de suas variantes: RMSD e RMSF para o esqueleto da
estrutura da proteína em relação a uma estrutura de referência para este conjunto (Spiegel,
1994b).
Para as avaliações de RMSD (Figura 5.1) e RMSF (Figura 5.2) nossa amostragem foi
de um quadro a cada dois picossegundos de simulação, usando o quadro inicial (0.0 ps) como
estrutura de referência para o RMSD e a estrutura média dos últimos 3 ns da simulação para o
RMSF. Nos cálculos consideramos apenas o esqueleto das proteínas, pois a flexibilidade das
cadeias laterais mascara a do esqueleto. Para a RMSF-3D (Figura 5.3) a amostragem foi de
200 quadros, um a cada 5ps. O resultado do cálculo de RMSD (Figura 5.1) fornece um valor
único ao longo do tempo. Podemos observar que os sistemas tendem ao equilíbrio térmico
logo a partir dos primeiros 100ps e que as evoluções dos Modelos 1 e 4; e 2 e 3 são
semelhantes. Os maiores valores de RMSD para os modelos 1 e 4 refletem a maior
flexibilidade da alça da protease nesses modelos, conforme observa-se nas Figuras 5.2 e 5.3.
De um modo geral, o desvio estrutural no início da dinâmica e a estabilização do
RMSD após 200 ps, em patamares entre 0,2 e 0,3 nm, pode ser interpretado como variações
70
estruturais devido à mudança de ambiente da proteína e às particularidades de cada modelo.
Os modelos foram construídos com base em estruturas cristalográficas, obtidas em baixa
temperatura (~5º C), na presença de co-solventes e empacotadas no ambiente quase sólido do
cristal. Nas simulações, por outro lado, o ambiente mimetiza a fase líquida, a pH 7, na
temperatura aproximada de 37º C.
Figura 5.1: Representação do RMSD dos átomos do esqueleto peptídico, calculados das simulações de
Dinâmica Molecular dos modelos propostos para a Falcipaína-2.
0 200 400 600 800
Tempo (ps)
0
0,1
0,2
0,3
0,4
M1
M2
M3
M4
Desvio da Raíz Média Quadrática
do esqueleto em rela ção ao esqueleto inicial
Os valores para o RMSF (Figura 5.2), em relação à estrutura média são geralmente
menores que 0.15nm o que adicionalmente comprova a estabilização dos sistemas. A análise
das flutuações dos resíduos mostrou que, como previsto, os modelos 1 e 4, por terem a alça
inicialmente mais exterior à proteína, foram mais flexíveis nesta região do que os modelos 2 e
3 (o primeiro sem a alça e o segundo com a alça inicialmente apoiada sobre a proteína (Figura
5.3). Os maiores picos no gráfico de RMSF coincidem com os resíduos localizados nas
regiões mais expostas e extremidades da proteína, sendo natural adquirirem valores altos de
flutuação como pode ser observado em comparação com as representações tridimensionais
das RMSF-3D, apresentadas na Figura 5.3 para os modelos M1-M4 dá uma visão mais clara
da localização tridimensional das regiões de maior flexibilidade.
71
Figura-5.2: Representação do RMSF dos átomos do esqueleto peptídico, discriminados por resíduo,
calculados das simulações de Dinâmica Molecular dos modelos propostos para a Falcipaína-2.
Podemos observar que existem diferenças, às vezes bastante elevadas, alem disso há
variações entre os mesmos resíduos dos diferentes modelos, como é o caso da região em torno
dos resíduos 10 (Figura 5.3), onde o Modelo 4 varia mais do que os demais; na região em
torno do resíduo 60 os Modelos 2 e 3 variam bastante, o Modelo 1 varia de forma
intermediária e o Modelo 4 varia pouco; na região em torno do resíduo 115, onde há maior
flutuação para os modelos M1-M3 ; na região do resíduo 141, o M3 flutua mais que os
demais.
Na região da alça, M1 e M4 se assemelham por terem a alça mais exposta ao solvente;
M2, que possui um loop pequeno nesta região (em torno do resíduo 168) não apresenta grande
variação. M3 apresenta a alça em contato com a superfície da proteína talvez por isso tenha
apresentado a menor variação para esta região dentre os modelos com a alça completa
(M1,M3 e M4). As demais regiões apresentam os picos de variação de forma semelhante.
Ao longo da simulação, a alça do Modelo 1 permaneceu em sua conformação de fita-
beta estendida; no Modelo 2, o pequeno loop que substitui a alça não teve sua conformação
alterada por causa do seu tamanho (pequena fita-beta) e, portanto, menor liberdade de
movimento. O Modelo 3 partiu de uma conFiguração de fita-beta em contato com a superfície
da proteína, e durante a simulação de conFiguração, tornando-se um loop, entretanto
mantendo o contato com a superfície da proteína. Já o Modelo 4 apresentou uma torção na
72
região da alça e se posicionou ao topo da proteína entrando em contato com os resíduos desta
região.
M1
M3
M2
M4
M1
M3
M2
M4
Figura 5.3: Representação 3D do RMSF dos átomos do esqueleto peptídico, calculados das simulações de
Dinâmica Molecular dos modelos propostos para a Falcipna-2. Em preto as hélices alfa e em cinza as fitas
beta.
5.1.2 – Avaliação da Superfície Molecular Acessível ao Solvente.
Uma outra classe de análises para validar os resultados da Dinâmica Molecular é
avaliar a superfície molecular da proteína. A análise tridimensional da superfície molecular
nos permite avaliar de forma mais precisa a estrutura do sítio ativo da proteína. A Figura 5.4
apresenta a superfície acessível ao solvente da estrutura final após a Dinâmica Molecular dos
quatro modelos, coloridas conforme o potencial eletrostático, sendo azul as regiões positivas e
em vermelho as regiões negativas. A reentrância central marcada com linha amarela
corresponde a região do sítio ativo onde podemos notar regiões de colapso nos Modelos 2 e 3
e desestruturação com regiões de abertura demasiada no sítio ativo no Modelo 4. Apenas no
Modelo 1 é preservada a abertura em V (V-shaped) da fenda catalítica, com a concavidade
73
característica desta família de proteases. Este fator contribuiu para a escolha do modelo M1
para os estudos de complexos moleculares com ligantes.
A estabilidade do sítio ativo em M1 está associada à estabilidade global do modelo durante a
dinâmica, como será verificado pela análise do Raio de Giro (próximo tópico), que mostra
numericamente o colapso e desestruturação do sítio ativo da proteína.
Figura 5.4: Superfície molecular colorida conforme o potencial eletrostático. Em vermelho potencial negativo,
em branco neutro, em azul positivo. A linha amarela indica a região do sítio ativo e as setas regiões de
deformação. Rotação de 90º nos eixos Y e Z em relação às demais Figuras do trabalho.
5.1.3 – Variações estruturais globais.
A Figura 5.5 apresenta o comportamento dinâmico dos Raios de para as dimensões X,
Y e Z, dos modelos da Falcipaína-2. A variação do raio de giro permite analisar as
deformações nas estruturas das proteínas ao longo do tempo, nas três direções do espaço.
Acompanhando a evolução das curvas é possível observar que o Modelo 1 permanece com
suas dimensões muito pouco alteradas enquanto que o Modelo 2, já nos primeiros 200ps
apresenta modificações, com achatamento da dimensão Z e alongamento na dimensão X,
indicando que os resíduos da região de inserção são importantes para a estabilização global da
proteína. Os Modelos 3 e 4 resistem um período maior à deformação, a qual se acentua nos
500ps finais com achatamento da dimensão Z e alongamento na dimensão X, e em M3,
alongamento da dimensão Y.
O Modelo 1 foi, portanto, o que apresentou a menor variação global da sua estrutura, o
que indica que a conformação em fita-beta proposta para a região de inserção para este
74
modelo é, a única que permite a estabilização global (da forma) da proteína.
Figura-5.5: Raio de Giro calculado da simulação de Dinamica Molecular para os modelos propostos para a
Falcipaína-2.
Os resultados das simulações das dinâmicas dos quatro modelos indicam que a
conformação assumida pela alça influencia no comportamento da proteína como um todo.
Estes resultados permitiram a escolha do modelo M1 como o melhor dentre os demais para os
estudos de complexos moleculares com ligantes.
Os maiores desvios observados nos gráficos de RMSD em relação à estrutura inicial
no modelo M1 podem ser atribuídos às maiores flutuações da alça quando estendida em folha-
beta, conforme mostrados nos gráficos de RMSF e nas imagens de RMSF-3D. Porém a
estrutura global no modelo M1 sofreu pouca deformação, como mostrado pela superfície
acessível da proteína e pelos Raios de Giro, observando-se uma maior acomodação
estabilidade para o sítio ativo em relação aos demais modelos.
75
O tempo simulado de 1.0 nanossegundo, entretanto, ainda se mostra insuficiente para
, passamos ao estudo dos complexos moleculares formados entre a protease e
estabilizar o core hidrofóbico nos 4 modelos. O modelo M2 foi o mais bem comportado em
termos da análise conformacional de Ramachandran, permanecendo 96.7% nas regiões
favoráveis, porém foi pior que o M1 em aspectos mais relevantes, em especial o
comportamento global avaliado na representação tridimensional da superfície molecular e
numericamente pela evolução do Raio de Giro.
A seguir
os inibidores E-64 (ligado covalentemente) e EP-64 (E-64 com o grupamento epóxido
fechado, portanto ligado não covalentemente), CP1 e o substrato Z-LR-AMC.
75
6 - Simulações com os Ligantes – Resultados e Discussão..................................................76
6.1 – Análises Globais.........................................................................................................76
6.1.1 – Desvio da raiz média quadrática (RMSD) .......................................................76
6.2 – Modo de ligação do E-64, Z-LR-AMC e CP1 à Falcipaína-2................................85
6.2.1 Comportamento dos Ligantes. .............................................................................85
6.2.2 - Contatos moleculares entre a proteína e os ligantes nas simulações no campo
de forças GROMOS96. ..................................................................................................87
6.2.3 - Contatos moleculares entre a proteína e os ligantes E64 e CP1, para as
simulações no campo de forças OPLS..........................................................................90
6.3 – Ligações Hidrogênio..................................................................................................94
6.3.1 Ligações hidrogênio com o campo de forças GROMOS96................................94
6.3.2 Ligações hidrogênio com o campo de forças OPLS. ..........................................96
6.3.3 - O comportamento das ligações hidrogênio.......................................................98
6.3.4- Estimativa da Energia Livre de Gibbs................Erro! Indicador não definido.
76
6 - Simulações com os Ligantes – Resultados e Discussão
6.1 – Análises Globais.
6.1.1 – Desvio da raiz média quadrática (RMSD)
A primeira questão a ser respondida é se as simulações de Dinâmica Molecular estão
suficientemente estáveis durante o seu curso, para que então possamos extrair as valiosas
informações que buscamos nestes sistemas.
Nas avaliações do desvio da raiz média quadrática (do inglês RMSD) e flutuação da
raiz média quadrática (do inglês RMSF) a amostragem foi de uma coleta de coordenadas a
cada picossegundo de simulação, considerando apenas o esqueleto peptídico das proteínas e
tomando as coordenadas iniciais (0.0 ps) como estrutura de referência para o RMSD e a
estrutura média para a avaliação do RMSF.
Considerando os valores para o RMSD (figura 6.1) pode-se observar que, como nos
sistemas simulados no capítulo anterior, a evolução temporal se faz de forma semelhante. As
estruturas tendem ao equilíbrio a partir dos primeiros 200 picossegundos, mas uma
estabilização mais efetiva, com flutuações do desvio menores que 0.15nm, só ocorre após os
primeiros nanosegundos.
É normal para uma trajetória de Dinâmica Molecular que o RMSD permaneça em
torno dos 0,2-0,3nm em relação à estrutura inicial (Smith GR, 2005) o que reflete a adequação
do sistema simulado ao campo de forças, e às condições de simulação, que geralmente são
diferentes das condições nas quais a estrutura simulada foi resolvida experimentalmente.
Valores maiores de RMSD devem ser investigados com cautela, todavia não signifiquem
necessariamente problemas técnicos: eles podem ser o resultado de uma mudança
conformacional.
Valores altos de RMSD são mais comuns quando trabalhamos com modelagem
comparativa, essencialmente por que partimos de uma estrutura moldada por aproximações a
77
estruturas provavelmente semelhantes. O resultado é um modelo também aproximado da
estrutura alvo, que por advento da Dinâmica Molecular passa a realizar pequenas mudanças
conformacionais permitindo que acesse as proximidades de sua conformação nativa.
Na avaliação do RMSD já começam a aparecer as primeiras diferenças derivadas ao
tratamento diferente dado aos conjuntos de sistemas. Nos sistemas simulados no Campo de
Forças OPLS o RMSD é maior do que no GROMOS96. Este talvez seja um efeito do maior
número de átomos descritos, portanto um maior número de osciladores harmônicos para as
ligações, que produzem um efeito global de maior RMSD. Ao realizar uma comparação direta
entre os procedimentos de simulação deste trabalho, deve-se manter sempre em mente que são
empregados dois campos de forças diferentes, dois métodos eletrostáticos distintos além de
diferentes abordagens para iniciar a simulação.
Nas figuras 6.1A e 6.1B são introduzidos valores de RMSD obtidos em simulações da
Catepsina-K (1atk) com os dois campos de forças, para comparação com a Falcipaína-2.
Maiores desvios para o OPLS também são observados.
78
Figura 6.1A: RMSD dos átomos do esqueleto peptídico, calculados das simulações de Dinâmica Molecular da
Catepsina-K, Falcipaína-2 e Falcipaína-2 com ligantes.
RMSD - GROMOS96
0
0,1
0,2
0,3
0,4
0,5
0,6
0 1000 2000 3000 4000 5000 6000
Tempo (ps)
RMSD (nm)
1atk Fp2 Fp2-E64 Fp2 / Ep64 Fp2/Z-LR-AMC
RMSD - OPLS
0
0,1
0,2
0,3
0,4
0,5
0,6
0 1000 2000 3000 4000 5000 6000
Tempo (ps)
RMSD (nm)
1atk Fp2 Fp2_ep64_CYS2 Fp2_ep64_HISB Fp2_e64 Fp2_cp1
.
Figura 6.1B: Comparação OPLS-GROMACS entre o RMSD dos átomos do esqueleto peptídico, calculados
das simulações de Dinâmica Molecular da Catepsina-K, Falcipaína-2 e Falcipaína-2 com ligantes.
RMSD - OPLS versus GROMOS96
0
0,1
0,2
0,3
0,4
0,5
0,6
0 1000 2000 3000 4000 5000 6000
Resíduo
RMSD (nm)
1atk - OPLS 1atk - GROMOS96
RMSD - OPLS versus GROMOS96
0
0,1
0,2
0,3
0,4
0,5
0,6
0 1000 2000 3000 4000 5000 6000
Resíduo
RMSD (nm)
Fp2 - OPLS Fp2 - GROMOS96
RMSD - OPLS versus GROMOS96
0
0,1
0,2
0,3
0,4
0,5
0,6
0 1000 2000 3000 4000 5000 6000
Resíduo
RMSD (nm)
Fp2_e64 - OPLS Fp2-E64 - GROMOS96
RMSD - OPLS versus GROMOS96
0
0,1
0,2
0,3
0,4
0,5
0,6
0 1000 2000 3000 4000 5000 6000
Resíduo
RMSD (nm)
Fp2_ep64_HISB - OPLS Fp2 / Ep64 - GROMOS96
79
6.1.2 – Flutuação da raiz média quadrática (RMSF)
A avaliação das flutuações dos resíduos dos sistemas simulados (RMSF), ilustradas
tridimensionalmente nas figuras 6.3A e 6.3B, mostra que tanto no campo de forças
GROMOS96 (figura 6.2A) quanto no OPLS (figura 6.2B) as regiões com valores elevados
para o RMSF (maior flexibilidade) predominam nas áreas mais externas da proteína. A região
da alça de inclusão foi mais flexível, seguida pelas demais regiões mais externas da proteína.
A alta flexibilidade desta porção, juntamente com a das demais regiões mais externas é um
comportamento normalmente esperado como reflexo da maior liberdade de movimento de
loops expostos ao meio externo.
Com o campo de forças OPLS pode-se observar que nas simulações com a Catepsina-
K (1atk) e Falcipaína-2 com a cisteína protonada (Fp2_ep64_CYS2) existe um aumento
significativo na flutuação da região delimitada pelos resíduos 38-43 (figura 6.7), região que
representa a extremidade superior da hélice central. Uma flutuação um pouco menor (0,25nm)
nesta região foi observada também para o sistema Fp2/Z-LR-AMC simulado no campo de
forças GROMOS96. As razões para este comportamento não estão claras, porém por se tratar
de uma região muito carregada pode ter sofrido mudanças locais.
São observadas diversas outras flutuações apresentando valores elevados: para as
análises diretas >0,15nm; e para as análises comparativas à FP2 >0,05nm (figura 6.10).
80
A
B
Figura 6.2: RMSF dos átomos do esqueleto peptídico, discriminados por resíduo, calculados das simulações
de Dinâmica Molecular para a Falcipaína-2.
RMSF - GROMOS96
0
0,1
0,2
0,3
0,4
0,5
0,6
0 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 160 170 180 190 200 210 220
Resíduo
RMSF (nm)
1atk Fp2 Fp2-E64 Fp2 / Ep64 Fp2/Z-LR-AMC
RMSF - OPLS
0
0,1
0,2
0,3
0,4
0,5
0,6
0 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 160 170 180 190 200 210 220
Resíduo
RMSF (nm)
1atk Fp2 Fp2_ep64_CYS2 Fp2_ep64_HISB Fp2_e64 Fp2_cp1
.
Figura 6.3A: Representação 3D do RMSF dos átomos do esqueleto peptídico, calculados das simulações de
Dinâmica Molecular no campo de Forças GROMOS96. Em preto as hélices alfa e em cinza as fitas beta.
FP2 - GROMOS
FP2-E64 - GROMOS
FP2/EP64 - GROMOS
FP2/Z-LR-AMC - GROMOS
FP2 - GROMOSFP2 - GROMOS
FP2-E64 - GROMOSFP2-E64 - GROMOS
FP2/EP64 - GROMOSFP2/EP64 - GROMOS
FP2/Z-LR-AMC - GROMOSFP2/Z-LR-AMC - GROMOS
.
81
Figura 6.3B: Representação 3D do RMSF dos átomos do esqueleto peptídico, calculados das simulações de
Dinâmica Molecular no campo de Forças OPLS. Em preto as hélices alfa e em cinza as fitas beta.
FP2-E64 - OPLS
FP2/CP1 - OPLS
FP2_HISB/EP64 - OPLS
FP2_HISH - OPLS
FP2_CYS2/EP64 - OPLS
FP2-E64 - OPLSFP2-E64 - OPLS
FP2/CP1 - OPLSFP2/CP1 - OPLS
FP2_HISB/EP64 - OPLSFP2_HISB/EP64 - OPLS
FP2_HISH - OPLSFP2_HISH - OPLS
FP2_CYS2/EP64 - OPLSFP2_CYS2/EP64 - OPLS
.
Na figura 6.4 são mostradas as diferenças globais de RMSF entre os sistemas
FP2+ligante e FP2 livre (estrutura de referência) nas simulações no campo de forças
GROMOS96. Destaca-se que as medidas de RMSF foram tomadas somente sobre os átomos
do esqueleto peptídico. Valores positivos indicam regiões nos complexos que flutuaram mais
que a referência, a enzima livre, enquanto valores negativos indicam o contrário. Os resíduos
aminoácidos com diferenças de RMSF, entre o complexo e a enzima livre, maiores que 0,05
nm são apontados na figura 6.5.
.
82
Figura 6.4: Diferenças de RMSF entre os sistemas FP2+ligante e FP2.
Diferença de RMSF - Gromos
-0,15
-0,1
-0,05
0
0,05
0,1
0,15
0 50 100 150 200
Resíduo
RMSD (FP2+Ligante) - (FP2)
Fp2 Fp2-E64 Fp2 / Ep64 Fp2/Z-LR-AMC
.
Figura 6.5: Ilustração das regiões com diferenças >0,05nm para o RMSF entre as simulações FP2 e
FP2+ligante. As regiões com maior flutuação em azul e menor flutuação em vermelho.
39-42
11-12
19-20 91-96
172-174
Na figura 6.6, analogamente às simulações com o GROMOS96, são mostradas as
diferenças globais de RMSF entre os sistemas FP2+ligante e FP2 livre (estrutura de
referência) nas simulações no campo de forças OPLS. Os resíduos aminoácidos com
diferenças de RMSF, entre o complexo e a enzima livre, maiores que 0,05nm são apontados
na figura 6.7.
68-69
175-179
206-209
148-152
137
99-100
39-42
11-12
19-20 91-96
172-174
99-100
68-69
175-179
206-209
148-152
137
83
Figura 6.6: Diferenças de RMSF entre os sistemas FP2+ligante e FP2
Diferença de RMSF - OPLS
-0,15
-0,1
-0,05
0
0,05
0,1
0,15
0,2
0,25
0,3
0 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 160 170 180 190 200 210 220
RMSF (FP2+ligante) - (FP2)
Fp2_ep64_CYS2 Fp2_ep64_HISB Fp2_e64 Fp2_cp1
.
Figura 6.7: Ilustração das regiões com diferenças >0,05nm para o RMSF das simulações e FP2_HISB/E64 e
FP2_CYSH/E64 em relação à FP2.
170-177
99-100
205-207
37-45
104
84-89
55-59
60-70
135-138
113-115
170-177
99-100
205-207
37-45
104
84-89
55-59
60-70
135-138
113-115
A análise das flutuações locais em relação à estrutura média (RMSF) e das flutuações
3D do esqueleto mostram um padrão semelhante para todos os sistemas: as regiões periféricas
com maior flexibilidade, principalmente nos terminais e loops, incluindo aí a alça de inclusão,
e regiões mais estáveis no interior da proteína que incluem o core hidrofóbico, folhas-beta e
as hélices-alfa. A alta flexibilidade das porções mais externas das proteínas é um
comportamento normalmente esperado, observado tanto em estruturas cristalográficas ou de
ressonância magnética como em simulações de dinâmica, e geralmente reflexo da exposição
destes resíduos ao meio externo, com maior liberdade de movimento.
Porém, ao analisar os detalhes da flutuação por resíduo (RMSF) e as flutuações 3D,
comparando-se todos os sistemas, observam-se diferenças significativas entre os dois campos
84
de força empregados. Verificam-se flutuações locais em regiões diferentes, dependendo do
sistema, que poderiam estar sendo induzidas pelos diferentes tipos de ligante, do estado de
ligação (covalente ou não covalente).
É intrigante observar que alguns dos resíduos do sítio ativo são menos móveis na
forma livre da Falcipaína-2 do que nas formas com um ligante. Este efeito é melhor
observado nas simulações com o OPLS e é mostrado na Figura 6.8, onde a maioria dos
resíduos do sítio ativo mostram valores positivos. Este resultado indica uma semelhança ao
efeito de ligação analisado por Smith GR e colaboradores (Smith GR, 2005) num conjunto de
41 proteínas para investigar qual seria a relação entre a flexibilidade das proteínas e os efeitos
do acoplamento na formação de complexos. Na grande maioria dos casos esses autores
observaram aumento da flexibilidade nas interfaces intermoleculares.
Nossos resultados apontam na mesma direção e reforçam o conceito de que a interação
proteína-ligante é mais arrojada que o modelo “chave-fechadura” e que a complementaridade
estrutural não é rígida. A flexibilidade das moléculas envolvidas leva à adaptação dinâmica
entre proteína e ligante, ajustando-se as estruturas mutuamente. Conforme demonstrado por
Smith GR e colaboradores, o aumento das flutuações conformacionais e estruturais no sítio
ativo com a formação do complexo enzima-ligante contribui para o aumento da entropia de
ligação.
Figura 6.8: Diferença do RMSF entre as formas FP2 livre e FP2 + ligante apenas para os resíduos do sítio
ativo dos sistemas simulados no campo de forças OPLS.
-0,1
-0,05
0
0,05
0,1
0,15
0,2
19
G
LN
23
G
LY
59
LYS
60
AS
N
61
TYR
63
CYS
64
AS
N
65
G
LY
66
G
LY
67
LEU
68
ILE
13
2
SE
R
133
V
AL
135
V
A
L
13
6
SE
R
140
A
LA
155
L
E
U
157
HI
S
217
AS
P
[FP2_CYS2/EP64]-[FP2] [FP2_HISB/EP64]-[FP2] [FP2-E64]-[FP2] [FP2/CP1]-[FP2]
85
6.2 – Modo de ligação do E-64, Z-LR-AMC e CP1 à Falcipaína-2
6.2.1 Comportamento dos Ligantes.
Em modelagem molecular, o dado numérico é de grande importância a fim de
quantificar e até qualificar as análises. Entretanto, se não houver uma detalhada verificação
estrutural, os dados correm o grave risco de serem mal interpretados.
Ao verificar o comportamento estrutural dos ligantes simulados (figura 6.9 para
GROMOS96 e 6.10 para OPLS) foi verificado que no sistema FP2-E64 (ligação covalente) o
E64 apresentou uma grande mudança no espaço tridimensional, levando a saída dos
grupamentos arginil e leucil das proximidades dos seus bolsões de ligação, com grande
exposição do grupamento arginil ao solvente (figura 6.9 e 6.10).
Na situação em que o E64 não estava ligado covalentemente à enzima este fato não foi
observado, e os grupamentos transepoxisuccinil e leucil permaneceram ocupando os subsítios
S1+S1´ e S2 respectivamente, com o arginal ficando a maior parte do tempo estabilizado no
subsítio S3 com poucas transições ao solvente, na simulação com o campo de forças
GROMOS96. Com o OPLS este grupamento ficou um pouco mais livre e transitou diversas
vezes entre o S3 e o fundo do S2, onde forma uma ponte salina com o resíduo Asp217.
Este comportamento, a saída do arginal para o solvente quando ligado quimicamente à
enzima, pode indicar que a interação do grupo arginil com o solvente ou com o sítio ativo da
enzima são equivalentes do ponto de vista energético, uma vez que este grupo é altamente
solúvel. Sua interação com o sub-sítio S2 envolve a formação de uma ponte salina com um
resíduo glutâmico ou aspártico, dependendo da enzima. Como esta ponte salina entre o ligante
e a enzima ocorre na superfície desta última, espera-se que sua estabilidade seja bastante
reduzida.
Por outro lado, a interação do grupo arginil do E64 com sua contra-parte (Glu na
Cruzaína ou Asp na Falcipaína) no sítio ativo de enzimas dessa família é um resultado
86
cristalográfico conhecido. Fica então aberta a questão, se as diferenças entre as condições
experimentais cristalográficas e as da simulação por Dinâmica Molecular, como hidratação,
pH e temperatura, levantadas anteriormente, não seriam os fatores determinantes para o
resultado encontrado. Uma solução para esta questão poderia ser obtida fazendo-se
simulações nas mesmas condições cristalográficas.
Pelos resultados de simulação é possível supor, no entanto, que o grupo arginal do E64
seria utilizado por este inibidor para o reconhecimento do sítio de ligação e que, após o
acoplamento, uma vez ocorrida a reação química que resulta na ligação covalente enzima-
inibidor, o arginal possa voltar-se para o solvente ou seja forçado a isto.
Figura 6.9: Comportamento dos ligantes no sítio ativo da Falcipaína-2 para as simulações no campo de
forças GROMOS96 (G96). Os ligantes estão representados pelo modelo de bastões. O E64 aparece em
amarelo e o Z-LR-AMC em verde. A proteína está representada em tubos na cor cinza, com os subsítios
destacados: S1´=amarelo, S1=vermelho, S2=verde, S3=azul.
G96 FP2-E64
G96 FP2/E64
G96 FP2/Z-LR-AMC
G96 FP2-E64G96 FP2-E64
G96 FP2/E64G96 FP2/E64
G96 FP2/Z-LR-AMCG96 FP2/Z-LR-AMC
.
87
Figura 6.10: Comportamento dos ligantes no sítio ativo da Falcipaína-2 para as simulações no campo de
forças OPLS. Os ligantes estão representados pelo modelo de bastões. O E64 aparece em amarelo e o CP1 em
azul. A proteína está representada em tubos na cor cinza, com os subsítios destacados: S1´=amarelo,
S1=vermelho, S2=verde, S3=azul.
OPLS FP2-E64
OPLS FP2_HISB/E64
OPLS FP2_HISB/E64
OPLS FP2/CP1
OPLS FP2-E64
OPLS FP2_HISB/E64
OPLS FP2_HISB/E64
OPLS FP2/CP1
6.2.2 - Contatos moleculares entre a proteína e os ligantes nas simulações no campo de
forças GROMOS96.
A partir das trajetórias das simulações, foi possível quantificar os contatos de van der
Waals entre a proteína e os ligantes através do cálculo da área média de contato
intermolecular (interface molecular). Os resultados desta análise apontam determinados
resíduos que podem ter relevância na interação desta Falcipaína-2 com os ligantes além de
indicar possíveis modificações no modo de ligação entre a forma ligada covalente e não
covalente.
Nas simulações com o campo de forças GROMOS96 (figura 6.11) os perfis de
ligação (com área média superior a 5Å
2
) que se destacaram foram:
88
Gln19: este resíduo apresentou interação apenas no complexo com o Z-LR-AMC.
Gly23: esta interação encontrar-se presente apenas nos complexos não covalentes FP2/E64 e
FP2/Z-LR-AMC.
Cys25: Apresenta área média de interação equivalente (em torno de 18 Å
2
) em todos os
complexos.
Trp26: Também com área média de interação equivalente (em torno de 10 Å
2
) em todos os
sistemas.
Lys59 e Asn60: Interações com a forma covalente (FP2-E64), porém com área média mais
elevada para o complexo FP2/E64.
Tyr61: Área média equivalente nos complexos FP2-E64 e FP2/E64.
Cys63: Aparece apenas nos complexos não covalentes FP2/E64 e FP2/Z-LR-AMC.
Asn64: Apresenta maior área de interação nos complexos não covalentes e maior no
complexo FP2/E64.
Gly65: Interação presente em todos os complexos, com maior área de interação para o
complexo FP2/E64.
Gly66 e Leu67: Maior área de interação para os complexos com o E64 (FP2-E64 e FP2/E64).
Ile68: Interações apenas nos complexos FP2-E64 e FP2/Z-LR-AMC.
Asn70: Apresenta interação apenas nos complexos FP2-E64 e FP2/E64.
Ile131: Presente em todos os complexos com destaque para todos os complexos.
Ala134: Apresenta interação apenas no complexo FP2/Z-LR-AMC.
Asn156: Apresenta elevada área de contato nos os complexos FP2-E64 e FP2/Z-LR-AMC.
His157: Maior área de contato nos complexos FP2-E64 e FP2/Z-LR-AMC.
Ala158: Interações significativas apenas com os complexos FP2-E64 e FP2/Z-LR-AMC.
Trp189: Elevada área de interação presente apenas para o complexo FP2/Z-LR-AMC.
.
89
Figura 6.11: Área Média de Interação Intermolecular (GROMOS96)
0
10
20
30
40
50
1
9
G
L
N
2
3
GLY
25
C
Y
S
26
T
RP
5
9
L
YS
60
ASN
61
T
YR
63 CYS
64
ASN
6
5
GLY
6
6
GLY
67
LEU
68
I
L
E
70 ASN
1
31
I
LE
13
4
ALA
15
6
ASN
15
7
H
IS
15
8
ALA
189 TRP
Área de Interação (A
2
)
FP2-E64 FP2/EP64 FP2/Z-LR-AMC
5.2.2.1 - Diferenças no modo de ligação entre os estados covalente e não covalente com o
E64 para as simulações no campo de forças GROMOS96.
A partir destas áreas médias de interação podemos verificar as principais diferenças
entre as áreas da forma covalente da não covalente do ligante E64 e determinar quais são as
mudanças em relação aos contatos na ocorrência da ligação. Assumindo um critério de corte
de 5Å
2
, eliminando áreas de interação menores que este valor, pode-se identificar que as
diferenças mais marcantes são as dos resíduos Gly23, Lys59, Ans60, Asn64 e Asn70 que
apresentaram redução da área de interação da forma não covalente para a covalente, e dos
resíduos e Ile68, Asn156 que apresentaram aumento da área de interação (figura 6.12).
Figura 6.12: Área Média de Interação Intermolecular e diferenças quanto à ligação covalente (GROMOS96)
-30
-20
-10
0
10
20
30
40
23 GLY 59 LYS 60 ASN 64 ASN 68 ILE 70 ASN 156 ASN
Área de Interação (A
2
)
FP2-E64 FP2/EP64 [FP2-E64] - [FP2/E64]
90
6.2.3 - Contatos moleculares entre a proteína e os ligantes E64 e CP1, para as simulações
no campo de forças OPLS.
Nas simulações com o campo de forças OPLS as superfícies de contatos
intermoleculares por resíduo (com área média superior a 5Å
2
) que se destacaram, para o E64
(figura 6.13A) foram:
Gln19: Este resíduo apresentou interação apenas no complexo com o FP2-E64.
Gly23: Interação presente em todos os complexos, um pouco maior para o sistema
FP2_CYS2.
Cys25: Apresenta maior área média de interação no complexo covalente (FP2-E64) seguida
do complexo FP2_HYSB/E64 e FP2_CYS2/E64.
Trp26: Significativa apenas nos complexos não covalentes (FP2_HYSB/E64 e
FP2_CYS2/E64).
Asn60: Encontrado apenas para o complexo FP2_HISB/E64.
Asn64: Apresenta elevada área de interação no complexo covalente seguida pelos complexos
FP2_HYSB/E64 e FP2_CYS2/E64, respectivamente.
Gly65 e Gly66: Interação presente de forma equivalente apenas nos complexos não
covalentes (FP2_HYSB/E64 e FP2_CYS2/E64).
Leu67: Presente com valor reduzido para o complexo covalente, com elevada área de
interação para os complexos não covalentes (FP2_HYSB/E64 e FP2_CYS2/E64).
Ile68: Interações apenas nos complexos FP2-E64 e FP2_CYS2/E64.
Ile131: Presente apenas nos complexos não covalentes (FP2_HYSB/E64 e FP2_CYS2/E64).
Val135: Interação elevada para o complexo covalente (FP2-E64), e um pouco menor para o
complexo FP2_CYS2/E64.
Glu154: Área média de interação elevada presente apenas no complexo covalente.
Leu155: Interação presente nos complexos FP2-E64 e FP2_HISB/E64
91
Asn156: Apresenta elevada área de contato em todos os complexos
His157: Há contato em todos os complexos.
Trp189: Interação observada apenas para o complexo covalente (FP2-E64).
Para o Composto CP1 (figura 6.13B), os resíduos com maior área média de interação
neste complexo foram: Tyr61, Asn64, Gly65, Gly66, Leu67, Ile68, Asn70, Ile131, Val135,
Ala140, Leu155, Asn156 e His157, com maior destaque para os resíduos Asn64 (25 Å
2
) e
Leu67 (33 Å
2
).
Figura 6.13A: Área Média de Interação Intermolecular com o E64 (OPLS)
Figura 6.13B: Área Média de Interação Intermolecular com o CP1(OPLS)
0
10
20
30
40
50
19
GLN
2
3 GLY
2
4
S
E
R
25
CYS
26
TRP
6
0
AS
N
6
4
A
S
N
65
GLY
6
6 GLY
6
7 L
E
U
68
IL
E
1
31
I
L
E
135 VA
L
154
GL
U
1
55 L
EU
1
56 ASN
157
HIS
189 TR
P
Área de Interação (A
2
)
FP2-E64 FP2/E64 HISB FP2/E64 CYS2
0
10
20
30
40
50
61
TYR
64
ASN
65
GLY
66
GLY
67
LEU
68 ILE 70
ASN
131
ILE
135
VAL
140
ALA
155
LEU
156
ASN
157
HIS
Área de Interação (A
2
)
FP2/CP1
.
6.2.3.1 – Área média de contato discriminada por porção do ligante.
As simulações no campo de forças OPLS tiveram uma inovação na apresentação das
áreas, com a descrição organizada dos grupamentos do ligante como resíduos independentes,
92
tendo como resultado um maior detalhamento na descrição de como a interação em diferentes
partes do ligante.
Para o E64 (figura 6.14), pode-se observar, na forma covalente, o resíduo 225,
correspondente à porção que interage principalmente com os Subsítios S1 e S1´, que detém a
maior área de interação com a proteína, porém esta situação muda nas formas não covalentes
e o subsítio S2 passa a contribuir com a maior área de interação. A porção contida no 227,
correspondente ao grupamento arginil, contribui em ambos os casos com a menor parte da
área de interação. Talvez se estas áreas de interface fossem normalizadas dividindo-se a área
de superfície molecular de cada um dos grupos pelo número de átomos do grupo o papel do
resíduo 226 seria ainda mais expressivo para a interação, enquanto que a representatividade
do resíduo 227 seria consideravelmente suprimida.
Figura 6.14: Área Média de Interação Intermolecular discriminada por porção da molécula do E64 (OPLS)
0
10
20
30
40
50
60
70
80
90
225 E64 226 E64 227 E64
Área de Interação (A
2
)
FP2-E64 FP2/E64 HISB FP2/E64 CYS2
Para o ligante CP1 (figura 6.15) a descrição foi ainda mais refinada e com isto
pudemos constatar que os grupamentos aromáticos contribuem com as maiores áreas de
interface, com o resíduo 225 (anel central) ocupando parcialmente os subsítios S2 e S3 e o
resíduo 227 (anel da extremidade) ocupando principalmente os subsítios S1´ e S1.
93
Figura 6.15: Área Média de Interação Intermolecular para a simulação com o ligante CP1 (OPLS)
0
10
20
30
40
50
225 CP1 226 CP1 227 CP1 228 CP1 229 CP1 230 CP1 231 CP1
Área de Interação (A
2
)
FP2/CP1
6.2.3.2 - Diferenças no modo de ligação entre os estados covalente e não covalente do
E64, para as simulações no campo de forças OPLS.
Com as médias das áreas de interação em mãos pode-se verificar também para o
OPLS quais as principais diferenças entre as áreas da forma covalente e da não covalente do
ligante E64 e determinar quais são as mudanças em relação aos contatos na ocorrência da
ligação. Vale lembrar que para uma comparação entre os campos de forças GROMOS96 e
OPLS o sistema FP2_HISB/E64 representa o FP2/E64 da simulação no GROMOS96.
Assumindo um critério de corte para áreas médias menores que a 5Å
2
pode-se identificar que
as diferenças mais marcantes são as dos resíduos Trp26, Asn60, Gly66, Leu67 e Ile131 que
apresentaram redução da área de interação, e dos resíduos Gln19 , Ser24, Cys25, Asn64,
Ile68, Val135, Glu154, Trp189 que apresentaram aumento da área de interação (figura 6.16).
Figura 6.16: Diferenças no modo de ligação entre os estados covalente e não covalente, para as simulações no
campo de forças OPLS
-40,0
-30,0
-20,0
-10,0
0,0
10,0
20,0
30,0
40,0
19
GLN
24
SER
25
CY S
26
TRP
60
ASN
64
ASN
65
GLY
66
GLY
67
LEU
68
ILE
131
ILE
135
VAL
154
GLU
189
TRP
Área de Interação (A
2
)
FP2-E64 FP2/E64 HISB [FP2-E64] - [FP2_HISB/E64]
94
6.3 – Ligações Hidrogênio.
A partir dos resultados das simulações de Dinâmica Molecular, foi realizada a verificação da
formação de ligações de hidrogênio entre a proteína e os ligantes, indicando os átomos
envolvidos, o número de ocorrências e a prevalência das ocorrências. Este último parâmetro é
um indicador do grau de estabilidade das ligações hidrogênio verificadas ao longo da
simulação (com raras exceções, foram considerados apenas os resultados com prevalência
maior ou igual a 10% após os 2ns). Deve-se ressaltar que a qualidade e o número de doadores
e aceitadores de ligações hidrogênio entre os diferentes ligantes são distintos. Por convenção
organizamos, do ponto de vista do ligante, seguindo a ordem: aceitador e depois doador, em
ordem alfanumérica. No campo de forças GROMOS96 os ligantes são representados em um
único bloco, pelo resíduo 225, enquanto que no campo de forças OPLS detalhamos algumas
sub-regiões dos ligantes: o E64 é formado pelos resíduos 225-228 (figura 3.18A) e o CP1
pelos nos resíduos 225-231 (figura 3.18C).
Os ligantes das duas formas do E64 formam ligações hidrogênio ou contatos próximos
entre átomos polares do sítio ativo, de uma forma similar já que são moléculas quase
idênticas. O diferente padrão de ligações de hidrogênio entre o complexo covalente e o não
covalente pode apresentar sugestões para futuras modificações no desenvolvimento de
inibidores. Durante a comparação dos resultados entre os campos de forças, um fato relevante,
o perfil das ligações é consideravelmente diferente nos dois campos de forças.
6.3.1 Ligações hidrogênio com o campo de forças GROMOS96.
6.3.1.1 - O ligante E64
Aceitadores:
E64225N4: Na forma covalente (tabela 5.1) faz ligação com os resíduos Asn70 (27,1% de
prevalência no tempo) e Asn156 (10,9%). Na forma não covalente não tem ligação com
95
média acima de 10%.
E64225N5: Na forma covalente faz ligação com o nitrogênio ND2 do resíduo Asn70 (30%) e
com a hidroxila (OH) do resíduo Tyr61 (11,4%). Já na forma não-covalente, liga com o
nitrogênio NZ do resíduo Lys59 (13%) e com o nitrogênio amídico da Tyr61 (10,7%).
E64225O2: Na forma covalente faz ligação com o nitrogênio NE2 do resíduo Gln19 (15,2%),
e na forma não covalente não tem ligação com média acima de 10%.
E64225O4: Na forma covalente faz ligação com o nitrogênio amídico da Gly66 (12,2%), mas
na forma não covalente não tem ligação com média acima de 10%.
Doadores:
E64225N1: Forma covalente liga com o oxigênio da carbonila do Asn156 (95%), esta é uma
das ligações mais prevalentes, porém não possui ligação com média acima de 10% na forma
não covalente.
E64225N2: Nas duas formas aparece interagindo com alta prevalência com o oxigênio da
carbonila do resíduo Gly66 (86,1% covalente e 86,2% não-covalente).
E64225N3: Não faz ligações significativas em nenhuma das formas.
E64225N4: Faz diversas ligações tanto na forma covalente quanto na não-covalente. Na
forma covalente faz ligação com o oxigênico da carbonila da Gly65 (12,6%), com o
nitrogênio amídico da Leu67 (9,8%) e com o oxigênio da carbonila da Lys59 (10,7%). Já na
forma não covalente interage com o nitrogênio ND2 (16,7%) e com o oxigênio OD2 (36,1%)
do Asn70. Assim como na forma covalente, a forma não covalente também interage com o
nitrogênio amídico da Leu67 (18,4%) e com o oxigênio da carbonila da Lys59 (14,8%).
E64225N5: Na forma covalente não faz interações maiores que 10% com nenhum resíduo. Já
na forma covalente faz ligação hidrogênio com os nitrogênios amídicos dos resíduos Asn60
(15,7%) e Gly66 (12,9%) e com o oxigênio da carbonila do resíduo Lys59 (10,9%) e com a
hidroxila do resíduo Tyr61.
96
6.3.1.2 - O ligante Z-LR-AMC
Aceitadores:
ZLR225OAQ: Liga com o nitrogênio amídico da Cys25 (95,1%) e com o nitrogênio NE2 da
Gln19 (24,4%)
ZLR225O: Faz ligação com o nitrogênio amídico do Trp26 (54,7%)
Doadores:
ZLR225N: Liga com o oxigênio da carbonila do Asn156 (13,7%) e com o nitrogênio ND1 da
His157 (10,1%).
Tabela 6.1: Ligações Hidrogênio com prevalência acima de 10% para as simulações no campo de forças
GROMOS96.
Doador->Aceitador Média após 2ns Doador->Aceitador Média após 2ns
ASN156ND2->E64225N4
10,9
LYSH59NZ->E64225N5
13,0
ASN70ND2->E64225N4 27,1 TYR61OH->E64225N5 10,7
ASN70ND2->E64225N5
30,0
E64225N2->GLY66O
86,2
GLN19NE2->E64225O2 15,2 E64225N4->ASN70ND2 16,7
GLY66N->E64225O4
12,2
E64225N4->ASN70OD1
36,1
TYR61N->E64225N5 11,4 E64225N4->LEU67N 18,4
E64225N1->ASN156O
95,4
E64225N4->LYSH59O
14,8
E64225N2->GLY66O
86,1
E64225N5->ASN60N
15,7
E64225N4->GLY65O 12,6 E64225N5->GLY66N 12,9
E64225N4->LEU67N 9,8 E64225N5->LYSH59O
10,9
E64225N4->LYSH59O 10,7 E64225N5->TYR61OH 9,7
Doador->Aceitador Média após 2ns
CYSH25N->ZLR225OAQ 95,1
GLN19NE2->ZLR225OAQ 24,4
TRP26N->ZLR225O 54,7
ZLR225N->ASN156O 13,7
ZLR225N->HISB157ND1 10,1
FP2/ZLRAMC
FP2/E64FP2-E64
6.3.2 Ligações hidrogênio com o campo de forças OPLS.
6.3.2.1 O ligante E64
Aceitadores:
E64225O1 e E64225O2: Na forma covalente (Tabela 6.2), os dois átomos de oxigênio do
grupamento carboxílico do E64 faz ligação com o nitrogênio ND2 da Asn64 (81,4%), com o
nitrogênio NH amídico da Cys25 (78,1%), com o nitrogênio amídico da Ser24 (26,3% e
97
81,9%) e com o oxigênio OG da Ser24 (20,6%). A ligação com o nitrogênio amídico da
Cys25 se repete na forma não-covalente com HISB (27%) bem como a ligação com o
nitrogênio amídico da Ser24 (39,2%), porém para a forma CYS2 estas duas ligações não
aparecem, dando lugar a interações com o nitrogênio amídico da Gly23 (10,5%) e com o
nitrogênio ND2 da His157 (98,9), esta última interação essencial para a reação de catálise.
E64225O6: O oxigênio do grupamento epóxido, na forma covalente (epóxido aberto) aparece
igênio apresenta ligações com média acima de 10% apenas na forma
Este átomo aparece apenas no complexo FP2_CYS2/E64 fazendo ligações
complexo FP2_CYS2/E64 fazendo ligações
ações hidrogênio com prevalência maior que 10% aparecem para este átomo
stema ligado covalentemente, a extremidade do
ligando ao nitrogênio NE do Trp189 (9%). Nas formas não-covalentes (HISB e CYS2), este
oxigênio participa de interações com o nitrogênio ND2 do Asn156 (16,1% e 13,8%
respectivamente).
E64226O: Este ox
covalente do E64, fazendo ligações com o nitrogênio amídico da Leu68 (23,8%).
Doadores:
E64226N:
hidrogênio com o oxigênio O do Asn156 (53%)
E64227N: Este átomo também aparece apenas no
hidrogênio também com o oxigênio O do Asn156 (24,1%) e com o oxigênio da carbonila da
Gly66 (21,6%)
E64227NE: Lig
apenas no sistema ligado covalentemente (FP2-E64), em ligações com os átomos de oxigênio
OE1 (11%) e OE2 (50,9%) do Glu154.
E64227NH1 e E64227NH2: No si
grupamento guanidino-butano faz ligação hidrogênio com o OE1 do Glu154 (40,1%), porém
nos sistemas não covalentes CYS2 e HISB este grupo de átomos faz ligação com os átomos
de oxigênio OD1 de OD2 do Asp217 (somados 55,5% HISB e 30,6% CYS2).
98
6.3.2.2 - O ligante CP1
P1229N2: Fazem ligação com o Asn64 (27,8% e 29,9% respectivamente).
Faz ligação com o oxigênio da carbonila da Gly66 (50,2%).
Aceitadores:
CP1229N1 e C
CP1229O1: Liga com o nitrogênio amídico da Leu67 (11,9%).
Doadores:
CP1229N1:
Tabela 6.2: po de forças
OPLS.
Doador->Aceitador Média após 2ns Doador->Aceitador Média
FP2-E64 FP2_HISB/E64
Ligações Hidrogênio com prevalência acima de 10% para as simulações no cam
após 2ns
ASN64ND2->E64225O2
81,4
ASN156ND2->E64225O6
16,1
CYS225N->E64225O2
78,1
CYSH25N->E64225O2
27,0
ILE68N->E64226O
23,8
GLY66N->E64225O10
56,3
SER24N->E64225O1
26,3
SER24N->E64225O2
39,2
SER24N->E64225O2
81,9
E64227N->GLY66O
46,1
SER24OG->E64225O1
20,6
E64227N->LEU155O
15,3
TRP189NE1->E64225O6 9,0 E64227NH1->ASP217OD1
17,1
E64227NE->GLU154OE1
11,0
E64227NH1->THR216O
11,9
E64227NE->GLU154OE2
50,9
E64227NH2->ASP217OD1
18,5
E64227NH2->GLU154OE1
40,1
E64227NH2->ASP217OD2
17,9
FP2_CYS2/E64
Doador->Aceitador Média após 2ns Doador->Aceitador Média após 2ns
ASN156ND2->E64225O6
13,8
ASN64ND2->CP1229N
27,8
ASN64ND2->E64225O10
34,0
ASN64ND2->CP1229N
29,9
GLY23N->E64225O2
10,5
LEU67N->CP1231O1
11,9
HISH157ND1->E64225O1
98,9
CP1229N->GLY66O
50,2
E64226N->ASN156O
53,0
E64227N->ASN156O
24,1
E64227N->GLY66O
21,6
E64227NH1->ASP217OD1
30,6
FP2/CP1
6.3.3 - O comportamento das ligações hidrogênio.
pos de forças em
prevalência, mas
Pode-se observar uma grande diversidade de ligações nos dois cam
que os ligantes foram simulados e até, em alguns casos uma certa incoerência quando
comparamos as freqüências das ligações. Pode-se verifica que o comportamento do sistema ao
longo do tempo é extremamente dinâmico também em relação às ligações hidrogênio e
poucas são aquelas que se mantém com alta prevalência ao longo do tempo.
Algumas destas ligações em certos períodos de tempo têm grande
desaparecem posteriormente podendo representar estados transitórios da acomodação do
ligante ao seu sítio de ligação na proteína e na maior parte do tempo de simulação não possuir
99
qualquer representatividade, talvez nunca mais ocorram (Figura 6.17). No entanto, quando é
avaliada a média temporal das ligações hidrogênio num período curto de simulação, como
5ns, estas ligações transitórias de alta prevalência acabam se destacando como ligações
importantes para a interação proteína-ligante e podem levar-nos a interpretações equivocadas.
FP2-E64 (GROMOS96)
Figura 6.17: O comportamento das ligações hidrogênio
s diferentes sistemas simulados, em diferentes
tervalos de tempo. Nas ligações em que o ligante é
no
in
doador, a ligação é representada em barras, e nas
situações em que o ligante é aceitador, a ligação é
representada em linhas.
0,0
10,0
20,0
30,0
40,0
50,0
60,0
70,0
80,0
90,0
100,0
0ns-1ns 1ns-2ns 2ns-3ns 3ns-4ns 4ns-5ns 5ns-6ns
Prevalência da Ligação Hidrogênio
ASN156ND2->E64225N4
A SN70ND2- >E64225N4
A SN70ND2- >E64225N5
GLN19NE2->E64225O2
GLY66N->E64225O4
TYR61N->E64225N5
E64225N1->ASN156O
E64225N2->GLY66O
E64225N4->GLY65O
E64225N4->LEU67N
E64225N4->LYSH59O
FP2/E64 (GROMOS96)
0,0
10,0
20,0
30,0
40,0
50,0
60,0
70,0
80,0
90,0
100,0
0ns-1ns 1ns-2ns 2ns-3ns 3ns-4ns 4ns-5ns 5ns-6ns
Prevalência da Ligação Hidrogênio
LYSH59NZ->E64225N5
TYR61OH->E64225N5
E64225N2->GLY66O
E64225N4->ASN70ND2
E64225N4->ASN70OD1
E64225N4->LEU67N
E64225N4->LYSH59O
E64225N5->ASN60N
E64225N5->GLY66N
E64225N5->LYSH59O
E64225N5->TYR61OH
FP2/Z-LR-AMC (GROMOS96)
0,0
10,0
20,0
30,0
40,0
50,0
60,0
70,0
80,0
90,0
100,0
0ns-1ns 1ns-2ns 2ns-3ns 3ns-4ns 4ns-5ns 5ns-6ns
Prevalência da Ligação Hidrogênio
CY SH25N->Z LR225OA Q
TRP26N->ZLR225O
ZLR225N->HISB157ND1
GLN19NE2- >ZLR225OA Q
ZLR225N->ASN156O
FP2-E64 (OPLS)
0,0
10,0
20,0
30,0
40,0
50,0
60,0
70,0
80,0
90,0
100,0
0ns-1ns 1ns-2ns 2ns-3ns 3ns-4ns
Prevalência de Ligação Hidrogênio
A SN64ND2->E6422 5O2
CYS225N->E64225O2
IL E68 N- >E6 4 22 6 O
SER24N->E64225O1
SER24N->E64225O2
SER24OG->E64225O1
TRP189NE1->E64225O6
E64227NE->GLU154OE1
E64227NE->GLU154OE2
E64227NH2- >GLU154OE1
E64227NH2- >GLU154OE2
FP2_CYS2/E64 (OPLS)
100,0
ênio
0,0
10,0
20,0
30,0
40,0
50,0
60,0
70,0
80,0
90,0
0ns-1ns 1ns-2ns 2ns-3ns 3ns-4ns 4ns-5ns 5ns-6ns
Prevalência de Ligação Hidrog
ASN156ND2->E64225O6
ASN64ND2->E64225O10
GLY23N->E64225O2
HISH157ND1->E64225O1
E64226N->ASN156O
E64227N->ASN156O
E64227N->GLY66O
E64227NH1->ASP217OD1
FP2_HISB/E64 (OPLS)
0,0
10,0
20,0
30,0
40,0
50,0
60,0
70,0
80,0
90,0
100,0
0ns-1ns 1ns-2ns 2ns-3ns 3ns-4ns 4ns-5ns 5ns-6ns
Prevalência da Ligação Hidrogênio
A SN156ND2->E642 25O6
CYSH25N->E64225O10
CYSH25N->E64225O2
GLY66N->E64225O10
SER24N->E64225O2
E64227N->GLY66O
E64227N->LEU155O
E64227NH1->ASP217OD1
E64227NH1- >THR216O
E64227NH2->ASP217OD1
E64227NH2->ASP217OD2
FP2/CP1 (OPLS)
0,0
10,0
20,0
30,0
40,0
50,0
60,0
70,0
80,0
90,0
100,0
0ns-1ns 1ns-2ns 2ns-3ns 3ns-4ns 4ns-5ns 5ns-6ns
Prevalência de Ligação Hidrogênio
ASN64ND2->CP1229N
ASN64ND2->CP1229N
LEU67N->CP1231O1
CP1229N->GLY66O
101
7 - Conclusões........................................................................................................................102
7.1 - Modelagem Comparativa e Simulações da Falcipaína-2 livre de ligantes..........102
7.2 - Simulações da Falcipaína-2 com os ligantes ..........................................................103
8- Perspectivas ......................................................................................................................106
102
7 - Conclusões
7.1 - Modelagem Comparativa e Simulações da Falcipaína-2 livre de ligantes.
A validação dos modelos, checando as estruturas secundárias de Ramachandram
usando o programa PROCHEK, resultou em 97% dos resíduos ocupando as regiões
permitidas. As distâncias entre ligações, quiralidade de C-alpha, torção de amidas
()
torções
hélices, Phi para prolinas e torções de cadeias laterais, dentro dos valores permitidos e, enfim,
o resultado da estrutura secundária demonstraram que a metodologia utilizada para a
construção dos modelos teve resultado consistente com o presente conhecimento de estrutura
de proteínas.
ω
Os modelos apresentaram propriedades estruturais compreendendo as cinco hélices,
seis fitas e seis voltas características da família da papaína, além do posicionamento
compatível dos resíduos da fenda catalítica Cys25, His157, Asp187, Gln19 e Trp189, com
demais representantes da família de enzimas cisteíno proteases, onde a Falcipaína-2 foi
classificada a partir da sua seqüência.
O RMSD mostrou que os modelos, já a partir dos primeiros 200ps, se aproximaram da
estrutura de equilíbrio para a temperatura simulada e o RMSD em relação à estrutura média,
com valores menores que 0.15nm confirmou a estabilização. A conformação inicial e a
presença ou não da região de inserção influenciam resíduos distantes desta região além de
comprometer toda a estrutura da proteína compactando as dimensões e deformando a fenda
catalítica.
Apesar da conformação ou presença da alça comprometer a estrutura terciária da
proteína, a estrutura secundária é pouco afetada ao longo das simulações. O efeito da maior
hidratação na simulação, com respeito ao ambiente do cristal, pode ter levado a uma redução
das superfícies hidrofóbicas expostas em todos os modelos aumentando o empacotamento das
regiões hidrofóbicas que não foi totalmente resolvido pelo processo de modelagem por
103
comparativa. O Modelo-1 se mostrou, portanto o mais apto às simulações com ligantes por
melhor preservar as características estruturais previstas para a proteína.
7.2 - Simulações da Falcipaína-2 com os ligantes
As simulações em todos os sistemas, independente do campo de forças ou existência
de ligante, bem como tipo de ligante, começam a se aproximar do equilíbrio após os primeiros
200ps assim como nas simulações anteriores. O RMSD em relação à estrutura média após 2
ns, com valores menores que 0.15nm também confirmou a estabilização.
O exame das RMSF, das áreas de interação e ligações hidrogênio para os sistemas
proteína-ligantes possibilitou a descrição da influência do ligante na flexibilidade de
determinadas regiões da Falcipaína-2, principalmente no sítio ativo, e revelou que os ligantes
caminharam na direção de melhor acomodação na fenda catalítica.
Os resíduos mais importantes para a interação com base na área de contato foram
Gln19, Gly23, Cys25, Asn6, no subsítio S1, Leu67,Ile68 e Ile131 no S2, Asn60, Gly65 e
Gly66, no S3 e Asn156, His157 e Trp189, no S1´.
Com base nas ligações hidrogênio os resíduos mais importantes para a interação
proteína-ligante foram Asn70, Asn156, Gly66, Ser24, Cys25, Asn64, Glu154, His157.
Com o E64 ligado covalentemente, os subsítios S1 e S1’ são de maior relevância. Na
forma não covalente do E64 o subsítio de ligação S2 mostrou-se o mais importante e deve ser
mais bem explorado por grupamentos ligantes hidrofóbicos, porém com as constantes visitas
do grupamento arginil à extremidade do S2 formando ligação com o Asp 217 dá subsídio à
possibilidade de um ligante que explore as características hidrofóbicas da entrada do subsítio
S2 e também da região carregada.
O subsítio S3 se estende em parte na cavidade do sítio ativo e em parte é exposto ao
solvente. Enquanto que os resíduos da cavidade mantêm fortemente as interações dos ligantes
104
através das ligações hidrogênio formadas com Glicinas 65 e 66, os resíduos da região externa,
expostos ao solvente, dificultam a estabilização de pontes salinas com os ligantes, através de
grupos como o arginil.
A região hidrofóbica do subsítio S1’ (Val133, Val135 e Ala140) mostrou grande área
de interação com o anel aromático da extremidade do ligante CP1 e representa uma área em
potencial para a melhoria dos ligantes da FP2.
As ligações hidrogênio nos complexos proteína-ligante são muito dinâmicas e tem
maior prevalência nas porções mais internas da cavidade do sítio ativo, com os resíduos
Cys25/Ser24 no S1, Gly65 e Gly66 no S3 e His157 nos S1´, confirmando que também para a
“constelação” de ligações hidrogênio tem FP2 o papel fundamental para a formação e
manutenção do complexo.
A estimativa da energia livre de Gibbs utilizando o método LIE ainda não foi
satisfatória. O mesmo foi observado em Carvalho, 2003. A razão para isto é que os valores de
α
e
β
, usados neste método foram parametrizados para a protease do HIV-1, sendo
necessária uma parametrização específica para o tipo de enzima estudado no presente
trabalho.
Tendo em vista estas informações, concluímos que a estrutura inicial para o
desenvolvimento de um inibidor protótipo, tendo como alvo a Falcipaína-2, deverá explorar
as características das propriedades hidrofóbicas dos subsítios S1´ na ligação aos resíduos 133,
135 e 140. Por exemplo, usando um anel aromático seguido de um aceitador de hidrogênio
para possibilitar a ligação com o hidrogênio ND1 da histidina 157 e, passando para o subsítio
S1, com um aceitador de hidrogênio para interagir com o H amídico da Cys25 ou da Ser24,
como o faz o inibidor CP1.
105
Ainda no S1, a simulação com o composto CP1 mostra que há possibilidade de ocupar
com sucesso o subsítio S1 com mais um anel aromático, servindo de espaçador e orientador
para a adição subseqüente de um grupo hidrofóbico não muito volumoso, como um leucil ou
isoleucil, direcionado à ocupar o subsítio S2.
Finalmente, a sugestão do projeto deve aproveitar-se do oxigênio da carbonila da
Glicinas 65 e do nitrogênio amídico da Glicina 66, oferecendo-os um doador e um aceitador
de hidrogênio paralelamente. Uma idéia inicial sobre a composição de um protótipo é
apresentada na figura 7.1.
Figura 7.1: Esboço de uma estrutura inicial que cumpriria os requisitos para uma ligação
eficaz ao sítio de ligação da Falcipaína-2.
Solvente
S1’
S1
Cys25, Asn64
S2: Leu67,Ile68,Ile131
Val133, Val135 e Ala140
S3: Gly65 e Gly66
Solvente
S1’
S1
Cys25, Asn64
S2: Leu67,Ile68,Ile131
Val133, Val135 e Ala140
S3: Gly65 e Gly66
106
8- Perspectivas
Este trabalho possibilitou um melhor entendimento do comportamento das interações
proteína-ligante para a Falcipaína-2, estabelecendo padrões de interação que podem ser
explorados para as abordagens de desenvolvimento de fármacos inibidores desta enzima.
Na continuidade deste trabalho, pretende-se propor novos fármacos antimaláricos
através do uso de técnicas de Modelagem e Simulação Molecular Computacional,
empregando estratégias avançadas para a construção de estruturas e análise de interações
intermoleculares. Visar-se-á uma maior compreensão de complexos enzimas-ligantes pelo
estudo detalhado da dinâmica das interações moleculares, trajetórias atômicas e reações entre
as enzimas e os inibidores conhecidos e, a partir do uso destas informações, conduzir o
desenvolvimento racional de novos fármacos com maior especificidade, sintetizá-los e avaliar
experimentalmente as atividades biológicas.
Mais especificamente, pretendemos continuar investigando a Falcipaína-2 e estender
os estudos às enzimas Falcipaínas 1, 2B e 3 e suas contrapartes humanas, as Catepsinas K e L,
serão avaliadas utilizando as técnicas de Modelagem Molecular, Ancoramento Molecular
(docking), cálculos quânticos estruturais e de cargas atômicas, e Simulações de Dinâmica
Molecular (DM). Pretende-se discriminar as particularidades dos sítios ativos das enzimas,
bem como dos complexos enzima-inibidor formados por essas enzimas visando desenvolver
inibidores específicos para as Falcipaínas. Para tanto, serão estudados complexos com
inibidores inespecíficos de cisteíno-proteases e inibidores para Falcipaínas propostos na
literatura. Neste ciclo de desenvolvimento, pretendemos propor novos inibidores que liguem
com maior afinidade as Falcipaínas.
Além disso, pretendemos também utilizar métodos híbridos (MQ/MM) que empregam
Mecânica Molecular (MM) na descrição de proteínas e solventes, tratando, ao mesmo tempo,
sítios ativos e ligantes com a
Mecânica Quântica (MQ), o que nos torna capazes de simular
107
reações químicas e efeitos de polarização dinâmicos, transpondo limitações da Dinâmica
Molecular clássica e refinando a qualidade dos resultados.
Em linhas gerais, pretendemos efetuar o estudo detalhado da dinâmica das interações
moleculares, trajetórias atômicas e reações entre as enzimas e os inibidores conhecidos,
quando se ligam covalentemente, e, a partir do uso destas informações conduzir o
desenvolvimento racional de novos fármacos com maior especificidade e encaminhá-los aos
químicos medicinais para sintetizá-los e avaliar experimentalmente as atividades biológicas
dos mais promissores.
108
9 - REFERÊNCIAS
Al-Lazikani, B., F. B. Sheinerman e B. Honig. Combining multiple structure and sequence
alignments to improve sequence detection and alignment: application to the SH2 domains of
Janus kinases. Proc Natl Acad Sci U S A. 98: 14796-801 p. 2001.
Altschul, S. F., M. S. Boguski, W. Gish e J. C. Wootton. Issues in searching molecular
sequence databases. Nat Genet. 6: 119-29 p. 1994.
Altschul, S. F., W. Gish, W. Miller, E. W. Myers e D. J. Lipman. Basic local alignment search
tool. J Mol Biol, v.215, n.3, Oct 5, p.403-10. 1990.
Apostolico, A. e R. Giancarlo, Eds. Sequence alignment in molecular biology. J Comput Biol,
v.5, p.173-96, J Comput Bioled. 1998.
Aqvist, J., V. B. Luzhkov e B. O. Brandsdal. Ligand binding affinities from MD simulations.
Acc Chem Res. 35: 358-65 p. 2002.
Aszodi, A. e W. R. Taylor. Homology modelling by distance geometry. Fold Des. 1: 325-34
p. 1996.
Bairoch, A. e R. Apweiler. The SWISS-PROT protein sequence database and its supplement
TrEMBL in 2000. Nucleic Acids Res, v.28, n.1, Jan 1, p.45-8. 2000.
Bajorath, J., R. Stenkamp e A. Aruffo. Knowledge-based model building of proteins: concepts
and examples. Protein Sci. 2: 1798-810 p. 1993.
Baker, D. A surprising simplicity to protein folding. Nature2000. 39-42 p.
Baker, D. e A. Sali. Protein structure prediction and structural genomics.
Science. 294: 93-6
p. 2001.
Barrett, A. J.
Classification of peptidases. Methods Enzymol1994. 1-15 p.
Barrett, A. J., N. D. Rawlings, et al. (2004).
Handbook of Proteolytic Enzymes. London,
Academic Press.
Barrett, A. J., A. A. Kembhavi e K. Hanada. E-64 [L-trans-epoxysuccinyl-leucyl-amido(4-
guanidino)butane] and related epoxides as inhibitors of cysteine proteinases.
Acta Biol Med
Ger, v.40, n.10-11, p.1513-7. 1981.
Barton, G. J. Protein sequence alignment techniques. In: (Ed.). Acta Crystallogr D Biol
Crystallogr, v.54, 1998. Protein sequence alignment techniques, p.1139-46
Barton, G. J. e M. J. Sternberg. A strategy for the rapid multiple alignment of protein
sequences. Confidence levels from tertiary structure comparisons. J Mol Biol. 198: 327-37 p.
1987.
Baxevanis, A. D. Practical aspects of multiple sequence alignment. Methods Biochem Anal.
39: 172-88 p. 1998.
109
Berendsen, H. J. C., J. R. Grigera e T. P. Straatsma. The Missing Term in the Effective Pair
Potentials. Journal of Physical Chemistry, v.91, p.6269-6271. 1987.
Berendsen, H. J. C., J. P. M. Postma, A. Dinola e J. R. Haak. Molecular Dynamics with
Coupling to an External Bath. Journal of Chemical Physics., v.81, p.3684-3690. 1984.
Berendsen, H. J. C., J. P. M. Postma, W. F. Van Gunsteren e J. Hermans. Intermolecular
Forces.: Ed. Reidel, Dordrecht (Holanda),. 1981. 331-342. p.
Berendsen., W. G. A. H. GROMOS: GROningen MOlecular Simulation software. (Tech.
Rep.). Laboratory of Physical Chemistry, University of Groningen,1988.
Beveridge, A. J. A theoretical study of the active sites of papain and S195C rat trypsin:
implications for the low reactivity of mutant serine proteinases.
Protein Sci, v.5, n.7, Jul,
p.1355-65. 1996.
Blundell, T. L., B. L. Sibanda, M. J. Sternberg e J. M. Thornton. Knowledge-based prediction
of protein structures and the design of novel molecules.
Nature. 326: 347-52 p. 1987.
Bonneau, R. e D. Baker. Ab initio protein structure prediction: progress and prospects. Annu
Rev Biophys Biomol Struct, 2001. 173-89 p.
Born, M. e T. Von Karman. Uber Schwingungen in Raumgittern. Physik. Z. 13: 297-- 309 p.
1912.
Breman, J. G., A. Egan e G. T. Keusch. The intolerable burden of malaria: a new look at the
numbers. Am J Trop Med Hyg2001. iv-vii p.
Briffeuil, P., G. Baudoux, C. Lambert, X. De Bolle, C. Vinals, E. Feytmans e E. Depiereux.
Comparative analysis of seven multiple protein sequence alignment servers: clues to enhance
reliability of predictions.
Bioinformatics. 14: 357-66 p. 1998.
Brinen, L. S., E. Hansell, J. Cheng, W. R. Roush, J. H. Mckerrow e R. J. Fletterick. A target
within the target: probing cruzain's P1' site to define structural determinants for the Chagas'
disease protease.
Structure Fold Des, v.8, n.8, Aug 15, p.831-40. 2000.
Brocklehurst, S. M. e R. N. Perham. Prediction of the three-dimensional structures of the
biotinylated domain from yeast pyruvate carboxylase and of the lipoylated H-protein from the
pea leaf glycine cleavage system: a new automated method for the prediction of protein
tertiary structure. Protein Sci. 2: 626-39 p. 1993.
Browne, W. J., A. C. North, D. C. Phillips, K. Brew, T. C. Vanaman e R. L. Hill. A possible
three-dimensional structure of bovine alpha-lactalbumin based on that of hen's egg-white
lysozyme. J Mol Biol. 42: 65-86 p. 1969.
Butler, D., J. Maurice e C. O'brien.
Time to put malaria control on the global agenda. Nature.
Apr 10, 1997. 535-6 p.
Carvalho, M. L. Analises Termodinâmicas e Estruturais da Ligação de Inibidores a Enzimas
110
por Técnicas de Dinâmica Molecular: Uma aplicação para cisteíno proteases do T.cruzi. 2003.
Cazzulo, J. J., V. Stoka e V. Turk. Cruzipain, the major cysteine proteinase from the
protozoan parasite Trypanosoma cruzi. Biol Chem, v.378, n.1, Jan, p.1-10. 1997.
Choi, K. H., R. A. Laursen e K. N. Allen. The 2.1 A structure of a cysteine protease with
proline specificity from ginger rhizome, Zingiber officinale. Biochemistry, v.38, n.36, Sep 7,
p.11624-33. 1999.
Chothia, C. e A. M. Lesk. The relation between the divergence of sequence and structure in
proteins. Embo J. 5: 823-6 p. 1986.
Claessens, M., E. Van Cutsem, I. Lasters e S. Wodak. Modelling the polypeptide backbone
with 'spare parts' from known protein structures. Protein Eng. 2: 335-45 p. 1989.
Drenth, J., K. H. Kalk e H. M. Swen. Binding of chloromethyl ketone substrate analogues to
crystalline papain. Biochemistry, v.15, n.17, Aug 24, p.3731-8. 1976.
Edsall, J. T., P. J. Flory, J. C. Kendrew, A. M. Liquori, G. Nemethy, G. N. Ramachandran e
H. A. Scheraga. A proposal of standard conventions and nomenclature for the description of
polypeptide conformation. J Biol Chem, v.241, n.4, Feb 25, p.1004-8. 1966.
Eggleson, K. K., K. L. Duffin e D. E. Goldberg. Identification and characterization of
falcilysin, a metallopeptidase involved in hemoglobin catabolism within the malaria parasite
Plasmodium falciparum. J Biol Chem. 274: 32411-7 p. 1999.
Engel, J. C., P. S. Doyle, I. Hsieh e J. H. Mckerrow. Cysteine protease inhibitors cure an
experimental Trypanosoma cruzi infection. J Exp Med, v.188, n.4, Aug 17, p.725-34. 1998.
Felsenstein, J. Confidence limits on phylogenies: An approach using the bootstrap.
Evolution.
39: 783-791. p. 1985.
Fidock, D. A., P. J. Rosenthal, et al. (2004). "Antimalarial drug discovery: efficacy models for
compound screening."
Nat Rev Drug Discov 3(6): 509-20.
Francis, S. E., I. Y. Gluzman, A. Oksman, A. Knickerbocker, R. Mueller, M. L. Bryant, D. R.
Sherman, D. G. Russell e D. E. Goldberg, Eds.
Molecular characterization and inhibition of a
Plasmodium falciparum aspartic hemoglobinase. Embo J, v.13, p.306-17, Embo Jed. 1994.
Frisch, M. J. T., G. W.; Schlegel, H. B.; Scuseria, G. E.; Robb, M. A.; Cheeseman, J. R.;
Zakrzewski, V. G.; Montgomery, J. A.; Stratmann, R. E.; Burant, J. C.; Dapprich, S.; Millam,
J. M.; Daniels, A. D.; Kudin, K. N.; Strain, M. C.; Farkas, O.; Tomasi, J.; Barone, V.; Cossi,
M.; Cammi, R.; Mennucci, B.; Pomelli, C.; Adamo, C.; Clifford, S.; Ochterski, J.; Petersson,
G.A.; Ayala, P. Y.; Cui, Q.; Morokuma, K.; Malick, D. K.; Rabuck, A. D.; Raghavachari, K.;
Foresman, J. B.; Cioslowki, J.; Ortiz, J. V.; Stefanov, B. B.; Liu, G.; Liashenko, A.; Piskorz,
P.; Komaromi, I.; Gomperts, R.; Martin, R. L.; Fox, D. J.; Keith, T.; Al-Laham, M. A.; Peng,
C. Y.; Nanayakkara, A.; Gonzalez, C.; Challacombe, M.; Gill, P. M. W.; Johnson, B. G.;
Chen, W.; Wong, M. W.; L Andres, J.; Head-Gordon, M.; Replogle, E. S.; Pople, J. A.;.
GAUSSIAN 98, Gaussian, Inc., Pittsburgh, PA. 1998.
111
Gillmor, S. A., C. S. Craik e R. J. Fletterick. Structural determinants of specificity in the
cysteine protease cruzain. Protein Sci, v.6, n.8, Aug, p.1603-11. 1997.
Greer, J. Comparative modeling methods: application to the family of the mammalian serine
proteases. Proteins. 7: 317-34 p. 1990.
Guex, N. e M. C. Peitsch. SWISS-MODEL and the Swiss-PdbViewer: an environment for
comparative protein modeling. Electrophoresis. 18: 2714-23 p. 1997.
Hassinen, T. P., M. J Comput Chem. 22: 1229-1242 p. 2001.
Havel, T. F. e M. E. Snow. A new method for building protein conformations from sequence
alignments with homologues of known structure. J Mol Biol. 217: 1-7 p. 1991.
Hess, B., H. Bekker, H. J. C. Berendsen e J. G. E. M. Fraaije. LINCS: A Linear Constraint
Solver for Molecular Simulations. Journal of Computational Chemistry., v.18, p.1463-1472.
1997.
Higgins, D. G., J. D. Thompson e T. J. Gibson. Using CLUSTAL for multiple sequence
alignments. Methods Enzymol. 266: 383-402 p. 1996.
Holm, L. e C. Sander. Mapping the protein universe. Science. 273: 595-603 p. 1996.
Hooft, R. W., C. Sander e G. Vriend. Positioning hydrogen atoms by optimizing hydrogen-
bond networks in protein structures. Proteins. 26: 363-76 p. 1996.
Johnson, M. S. e J. P. Overington. A structural basis for sequence comparisons. An evaluation
of scoring methodologies. J Mol Biol. 233: 716-38 p. 1993.
Johnson, M. S., N. Srinivasan, R. Sowdhamini e T. L. Blundell. Knowledge-based protein
modeling. Crit Rev Biochem Mol Biol. 29: 1-68 p. 1994.
Jones, D. T. Protein secondary structure prediction based on position-specific scoring
matrices. J Mol Biol, v.292, n.2, Sep 17, p.195-202. 1999.
Jones, T. A. e S. Thirup. Using known substructures in protein model building and
crystallography.
Embo J. 5: 819-22 p. 1986.
Kamphuis, I. G., K. H. Kalk, M. B. Swarte e J. Drenth. Structure of papain refined at 1.65 A
resolution.
J Mol Biol. 179: 233-56 p. 1984.
Kaminski, G.A., Friesner, R.A., Tirado-Rives, J., and Jorgensen, W.L. (2001) Evaluation and
Reparametrization of the OPLS-AA Force Field for Proteins via Comparison with Accurate
Quantum Chemical Calculations on Peptides J. Phys. Chem. B, 105, 28, 6474 - 6487.
Kirschke, H., P. Wikstrom e E. Shaw. Active center differences between cathepsins L and B:
the S1 binding region.
FEBS Lett, v.228, n.1, Feb 8, p.128-30. 1988.
Klemba, M. e D. E. Goldberg. Biological roles of proteases in parasitic protozoa.
Annu Rev
Biochem. 71: 275-305 p. 2002.
112
Kolinski, A., M. R. Betancourt, D. Kihara, P. Rotkiewicz e J. Skolnick. Generalized
comparative modeling (GENECOMP): a combination of sequence comparison, threading, and
lattice modeling for protein structure prediction and refinement. Proteins. 44: 133-49 p. 2001.
Koretke, K. K., Z. Luthey-Schulten e P. G. Wolynes. Self-consistently optimized energy
functions for protein structure prediction by molecular dynamics. Proc Natl Acad Sci U S A.
95: 2932-7 p. 1998.
Laskowski, R. A., M. W. Macarthur e J. M. Thornton. Validation of protein models derived
from experiment. Curr Opin Struct Biol. 8: 631-9 p. 1998.
Laskowski, R. A., J. A. Rullmannn, M. W. Macarthur, R. Kaptein e J. M. Thornton. AQUA
and PROCHECK-NMR: programs for checking the quality of protein structures solved by
NMR.
J Biomol NMR. 8: 477-86 p. 1996.
Leung, D., G. Abbenante e D. P. Fairlie. Protease inhibitors: current status and future
prospects.
J Med Chem, v.43, n.3, Feb 10, p.305-41. 2000.
Levitt, M. Accurate modeling of protein conformation by automatic segment matching. J Mol
Biol. 226: 507-33 p. 1992.
Lewis, S. D., F. A. Johnson e J. A. Shafer. Effect of cysteine-25 on the ionization of histidine-
159 in papain as determined by proton nuclear magnetic resonance spectroscopy. Evidence
for a his-159--Cys-25 ion pair and its possible role in catalysis. Biochemistry. 20: 48-51 p.
1981.
Lindahl, E., B. Hess e D. Van Der Spoel. GROMACS 3.0: A package for molecular
simulation and trajectory. Journal of Molecular Modelling. 7: 306--317 p. 2001a.
Lindahl, E., B. Hess e D. Van Der Spoel. GROMACS 3.0: A package for molecular
simulation and trajectory.
Journal of Molecular Modelling. 7: 306--317 p. 2001b.
Maes, D., J. Bouckaert, F. Poortmans, L. Wyns e Y. Looze. Structure of chymopapain at 1.7
A resolution. Biochemistry, v.35, n.50, Dec 17, p.16292-8. 1996.
Marchler-Bauer, A., A. R. Panchenko, B. A. Shoemaker, P. A. Thiessen, L. Y. Geer e S. H.
Bryant. CDD: a database of conserved domain alignments with links to domain three-
dimensional structure.
Nucleic Acids Res, v.30, n.1, Jan 1, p.281-3. 2002.
Marti-Renom, M. A., M. S. Madhusudhan, A. Fiser, B. Rost e A. Sali. Reliability of
assessment of protein structure prediction methods. Structure (Camb). 10: 435-40 p. 2002.
Marti-Renom, M. A., A. C. Stuart, A. Fiser, R. Sanchez, F. Melo e A. Sali. Comparative
protein structure modeling of genes and genomes. Annu Rev Biophys Biomol Struct. 29: 291-
325 p. 2000.
Mcgrath, M. E. The lysosomal cysteine proteases. Annu Rev Biophys Biomol Struct, v.28,
p.181-204. 1999.
113
Mcgrath, M. E., A. E. Eakin, J. C. Engel, J. H. Mckerrow, C. S. Craik e R. J. Fletterick. The
crystal structure of cruzain: a therapeutic target for Chagas' disease. J Mol Biol, v.247, n.2,
Mar 24, p.251-9. 1995.
Mckerrow, J. H., P. J. Rosenthal e J. Bouvier. The protease and pathogenicity of parasitc
protozoa. 1993. 821-853 p. (Ann. Ver. Microbiol.)
Ménard, R. Structure-function studies in the papain family of cysteine proteases. Ciencia e
Cultura, n.45, p.292-298. 1993.
Menard, R., J. Carriere, P. Laflamme, C. Plouffe, H. E. Khouri, T. Vernet, D. C. Tessier, D.
Y. Thomas e A. C. Storer. Contribution of the glutamine 19 side chain to transition-state
stabilization in the oxyanion hole of papain. Biochemistry, v.30, n.37, Sep 17, p.8924-8.
1991.
Miyamoto, S. e P. A. Kollman. SETTLE: An Analytical Version of the SHAKE and
RATTLE Algorithms for Rigid Water Models. Journal of Computational Chemistry, v.13:,
p.952-962. 1992.
Needleman, S. B. e C. D. Wunsch. A general method applicable to the search for similarities
in the amino acid sequence of two proteins. J Mol Biol. 48: 443-53 p. 1970.
Neurath, H. Proteolytic processing and physiological regulation. Trends Biochem Sci. 14:
268-71 p. 1989.
Oldfield, T. J. SQUID: a program for the analysis and display of data from crystallography
and molecular dynamics. J Mol Graph. 10: 247-52 p. 1992.
Olliaro, P. L. e Y. Yuthavong. An overview of chemotherapeutic targets for antimalarial drug
discovery.
Pharmacol Ther. 81: 91-110 p. 1999.
Olson, J. E., G. K. Lee, A. Semenov e P. J. Rosenthal. Antimalarial effects in mice of orally
administered peptidyl cysteine protease inhibitors.
Bioorg Med Chem. 7: 633-8 p. 1999.
Pawlowski, K., A. Bierzynski e A. Godzik. Structural diversity in a family of homologous
proteins. J Mol Biol. 258: 349-66 p. 1996.
Pearson, W. R. e D. J. Lipman. Improved tools for biological sequence comparison. Proc Natl
Acad Sci U S A. 85: 2444-8 p. 1988.
Pieper, U., N. Eswar, A. C. Stuart, V. A. Ilyin e A. Sali. MODBASE, a database of annotated
comparative protein structure models. Nucleic Acids Res. 30: 255-9 p. 2002.
Rawlings, N. D. and A. J. Barrett (1993). "Evolutionary families of peptidases." Biochem J
290 ( Pt 1): 205-18.
Rich, D. H. Inhibitor of cysteine proteinases.
Proteinase inhibitor. Elsevier Scientific
Publishing Co. Amsterdam: 153-178 p. 1986.
Ring, C. S., E. Sun, J. H. Mckerrow, G. K. Lee, P. J. Rosenthal, I. D. Kuntz e F. E. Cohen.
114
Structure-based inhibitor design by using protein models for the development of antiparasitic
agents. Proc Natl Acad Sci U S A. 90: 3583-7 p. 1993.
Rosenthal, P. J. Hydrolysis of erythrocyte proteins by proteases of malaria parasites. Curr
Opin Hematol. 9: 140-5 p. 2002.
Rosenthal, P. J., G. K. Lee e R. E. Smith. Inhibition of a Plasmodium vinckei cysteine
proteinase cures murine malaria. J Clin Invest. 91: 1052-6 p. 1993.
Rosenthal, P. J. e S. R. Meshnick. Hemoglobin catabolism and iron utilization by malaria
parasites. In: (Ed.). Mol Biochem Parasitol, v.83, 1996. Hemoglobin catabolism and iron
utilization by malaria parasites, p.131-9
Rosenthal, P. J., J. E. Olson, G. K. Lee, J. T. Palmer, J. L. Klaus e D. Rasnick. Antimalarial
effects of vinyl sulfone cysteine proteinase inhibitors.
Antimicrob Agents Chemother. 40:
1600-3 p. 1996.
Rosenthal, P. J., W. S. Wollish, J. T. Palmer e D. Rasnick. Antimalarial effects of peptide
inhibitors of a Plasmodium falciparum cysteine proteinase.
J Clin Invest. 88: 1467-72 p. 1991.
Rost, B. Twilight zone of protein sequence alignments. Protein Eng. 12: 85-94 p. 1999.
Sabnis, Y., P. J. Rosenthal, P. Desai e M. A. Avery. Homology modeling of falcipain-2:
validation, de novo ligand design and synthesis of novel inhibitors. J Biomol Struct DynApr,
p.765-74. 2002
Sabnis, Y. A., P. V. Desai, P. J. Rosenthal e M. A. Avery. Probing the structure of falcipain-3,
a cysteine protease from Plasmodium falciparum: comparative protein modeling and docking
studies. Protein Sci, v.12, n.3, Mar, p.501-9. 2003.
Sajid, M. e J. H. Mckerrow. Cysteine proteases of parasitic organisms. Mar, p.1-21. 2002
Salas, F., J. Fichmann, G. K. Lee, M. D. Scott e P. J. Rosenthal. Functional expression of
falcipain, a Plasmodium falciparum cysteine proteinase, supports its role as a malarial
hemoglobinase.
Infect Immun. 63: 2120-5 p. 1995.
Sali, A. Comparative protein modeling by satisfaction of spatial restraints. Mol Med Today.
1: 270-7 p. 1995.
Sali, A. e T. L. Blundell. Comparative protein modelling by satisfaction of spatial restraints.
J
Mol Biol. 234: 779-815 p. 1993.
Sali, A., A. Fiser, R. Sanchez, M. A. Marti-Renom, B. Jerkovic, A. Badretdinov, F. Melo, J.
Overington e E. Feyfant. MODELLER, A Protein Structure Modeling Program, Release 6v2
2002.
Sanchez, R. e A. Sali. Advances in comparative protein-structure modelling.
Curr Opin Struct
Biol. 7: 206-14 p. 1997.
Sanchez, R. e A. Sali. Large-scale protein structure modeling of the Saccharomyces cerevisiae
115
genome. Proc Natl Acad Sci U S A. 95: 13597-602 p. 1998.
Saqi, M. A., R. B. Russell e M. J. Sternberg. Misleading local sequence alignments:
implications for comparative protein modelling. Protein Eng. 11: 627-30 p. 1998.
Sauder, J. M., J. W. Arthur e R. L. Dunbrack, Jr. Large-scale comparison of protein sequence
alignment algorithms with structure alignments. Jul 1, p.6-22. 2000
Schechter, I. e A. Berger. On the size of the active site in proteases. I. Papain. Biochem
Biophys Res Commun, v.27, n.2, Apr 20, p.157-62. 1967.
Schroder, E., C. Phillips, E. Garman, K. Harlos e C. Crawford. X-ray crystallographic
structure of a papain-leupeptin complex. Jan 2, p.38-42. 1993
Selzer, P. M., X. Chen, V. J. Chan, M. Cheng, G. L. Kenyon, I. D. Kuntz, J. A. Sakanari, F. E.
Cohen e J. H. Mckerrow. Leishmania major: molecular modeling of cysteine proteases and
prediction of new nonpeptide inhibitors. Exp Parasitol, v.87, n.3, Nov, p.212-21. 1997.
Shenai, B. R., P. S. Sijwali, A. Singh e P. J. Rosenthal. Characterization of native and
recombinant falcipain-2, a principal trophozoite cysteine protease and essential
hemoglobinase of Plasmodium falciparum. J Biol Chem. 275: 29000-10 p. 2000.
Sijwali, P. S., B. R. Shenai, J. Gut, A. Singh e P. J. Rosenthal. Expression and
characterization of the Plasmodium falciparum haemoglobinase falcipain-3. Biochem J. 360:
481-9 p. 2001.
Smith, T. F. The art of matchmaking: sequence alignment methods and their structural
implications. Structure Fold DesJan 15, p.R7-R12. 1999
Smith, T. F. e M. S. Waterman. Overlapping genes and information theory.
J Theor Biol. 91:
379-80 p. 1981.
Soni, S., S. Dhawan, et al. (2005). "Characterization of events preceding the release of
malaria parasite from the host red blood cell."
Blood Cells Mol Dis 35(2): 201-11.
Spiegel, M. R. Estatística. In: (Ed.), 1994a. Estatística, p.74-75, 106-110
Spiegel, M. R. Estatística: 74-75, 106-110 p. 1994b.
Srinivasan, N. e T. L. Blundell. An evaluation of the performance of an automated procedure
for comparative modelling of protein tertiary structure. Protein Eng. 6: 501-12 p. 1993.
Storer, A. C. e R. Menard. Catalytic mechanism in papain family of cysteine peptidases. In:
(Ed.). Methods Enzymol, v.244, 1994. Catalytic mechanism in papain family of cysteine
peptidases, p.486-500
Taylor, W. R. Multiple protein sequence alignment: algorithms and gap insertion.
Methods
Enzymol. 266: 343-67 p. 1996.
Taylor, W. R., T. P. Flores e C. A. Orengo. Multiple protein structure alignment. Protein Sci.
116
3: 1858-70 p. 1994.
Thompson, J. D., D. G. Higgins e T. J. Gibson. CLUSTAL W: improving the sensitivity of
progressive multiple sequence alignment through sequence weighting, position-specific gap
penalties and weight matrix choice. Nucleic Acids Res. 22: 4673-80 p. 1994.
Thompson, J. D., F. Plewniak e O. Poch. A comprehensive comparison of multiple sequence
alignment programs. Nucleic Acids Res. 27: 2682-90 p. 1999.
Tieleman, D. P., D. Spoel e H. J. C. Berendsen. Molecular Dynamics of
Dodecylphosphocholine Micelles at three different aggregate sizes: micelar structrure and
chain relaxation. J. Phys. Chem. 104: 6380-6388 p. 2000.
Unger, R., D. Harel, S. Wherland e J. L. Sussman. A 3D building blocks approach to
analyzing and predicting structure of proteins.
Proteins. 5: 355-73 p. 1989.
Van Aalten, D. M., R. Bywater, J. B. Findlay, M. Hendlich, R. W. Hooft e G. Vriend.
PRODRG, a program for generating molecular topologies and unique molecular descriptors
from coordinates of small molecules.
J Comput Aided Mol Des. 10: 255-62 p. 1996.
Van Gunsteren, W. F. e H. J. C. Berendsen. Molecular Dynamics Computer Simulations:
Methodology, Applications and Perspectives in Chemistry. Angewandte Chemie Int. Ed.
Engl. 29: 992--1023. p. 1990.
Van Gunsteren, W. F., Kruger, P., Billeter, S. R., Mark, A. E., Eising, A. A., Scott, W. R. P.,
Huneberger, P. H., Tironi, I. G. Biomolecular Simulation: The GROMOS96 Manual and User
Guide. Groningen/Zurich:. Biomos/Hochschulverlag AG an der ETH Zurich., 1996. p.
Verlet, L. Verlet, L., "Computer Experiments on Classical Fluids I: Thermodynamical
Properties of Lennard-Jones Molecules," v.159. 1967. 98-103 p. (Phys. Rev.)
Veronesi, R. Doenças infecciosas e parasitárias. 9.ed. Rio de Janeiro, Guanabara-
Kogan, 1997. 1997.
Yang, A. S. e B. Honig. An integrated approach to the analysis and modeling of protein
sequences and structures. I. Protein structural alignment and a quantitative measure for
protein structural distance.
J Mol Biol. 301: 665-78 p. 2000.
Zhao, B., C. A. Janson, B. Y. Amegadzie, K. D'alessio, C. Griffin, C. R. Hanning, C. Jones, J.
Kurdyla, M. Mcqueney, X. Qiu, W. W. Smith e S. S. Abdel-Meguid. Crystal structure of
human osteoclast cathepsin K complex with E-64.
Nat Struct Biol, v.4, n.2, Feb, p.109-11.
1997.
Anexo: Topologias dos Ligantes
;ep64.itp
;As cargas foram calculadas pelos programas
;xRED II ==>> http://www.u-picardie.fr/labo/lbpd/RED/index.html
;resp do Amber 8 ==>> http://amber.scripps.edu/Questions/resp.html
;Gaussian98 ==> https://www.gaussian.com
;As cargas RESP foram aproximadas para as do campo de forças OPLSAA (2001).
;Foram realizados pequenos ajustes nas cargas do grupo epoxido,
;auxiliados pelo resultado do Gaussian98, no modo RESP.
;
; Include forcefield parameters
#include "ffoplsaa.itp"
[ moleculetype ]
; name nrexcl
E64 3
[ atoms ]
; nr type resnr residue atom cgnr charge mass typeB chargeB
massB
1 opls_272 1 E64 O1 1 -0.800 15.9994
2 opls_272 1 E64 O2 1 -0.800 15.9994
3 opls_271 1 E64 C3 1 0.700 12.011
4 opls_215 1 E64 C4 2 0.065 12.011
5 opls_185 1 E64 H5 2 0.080 1.008
6 opls_180 1 E64 O6 2 -0.310 15.9994
7 opls_215 1 E64 C7 2 -0.035 12.011
8 opls_185 1 E64 H8 2 0.100 1.008
9 opls_235 1 E64 C9 3 0.500 12.011
10 opls_236 1 E64 O10 3 -0.500 15.9994
11 opls_238 2 E64 N 4 -0.500 14.0067
12 opls_241 2 E64 H 4 0.300 1.008
13 opls_224B 2 E64 CA 4 0.140 12.011
14 opls_140 2 E64 HA 4 0.060 1.008
15 opls_136 2 E64 CB 5 -0.120 12.011
16 opls_140 2 E64 HB1 5 0.060 1.008
17 opls_140 2 E64 HB2 5 0.060 1.008
18 opls_137 2 E64 CG 6 -0.060 12.011
19 opls_140 2 E64 HG 6 0.060 1.008
20 opls_135 2 E64 CD1 7 -0.180 12.011
21 opls_140 2 E64 HD11 7 0.060 1.008
22 opls_140 2 E64 HD12 7 0.060 1.008
23 opls_140 2 E64 HD13 7 0.060 1.008
24 opls_135 2 E64 CD2 8 -0.180 12.011
25 opls_140 2 E64 HD21 8 0.060 1.008
26 opls_140 2 E64 HD22 8 0.060 1.008
27 opls_140 2 E64 HD23 8 0.060 1.008
28 opls_235 2 E64 C 9 0.500 12.011
29 opls_236 2 E64 O 9 -0.500 15.9994
30 opls_238 3 E64 N 10 -0.500 14.0067
31 opls_241 3 E64 H 10 0.300 1.008
32 opls_224B 3 E64 CA 10 0.140 12.011
33 opls_140 3 E64 HA1 10 0.060 1.008
34 opls_140 3 E64 HA2 10 0.060 1.008
35 opls_136 3 E64 CB 11 -0.120 12.011
36 opls_140 3 E64 HB1 11 0.060 1.008
37 opls_140 3 E64 HB2 11 0.060 1.008
38 opls_308 3 E64 CG 12 -0.110 12.011
39 opls_140 3 E64 HG1 12 0.060 1.008
40 opls_140 3 E64 HG2 12 0.060 1.008
41 opls_307 3 E64 CD 14 0.190 12.011
42 opls_140 3 E64 HD1 14 0.060 1.008
43 opls_140 3 E64 HD2 14 0.060 1.008
44 opls_303 3 E64 NE 15 -0.700 14.0067
45 opls_304 3 E64 HE 15 0.440 1.008
46 opls_302 3 E64 CZ 15 0.640 12.011
47 opls_300 3 E64 NH1 16 -0.800 14.0067
48 opls_301 3 E64 HH11 16 0.460 1.008
49 opls_301 3 E64 HH12 16 0.460 1.008
50 opls_300 3 E64 NH2 17 -0.800 14.0067
51 opls_301 3 E64 HH21 17 0.460 1.008
52 opls_301 3 E64 HH22 17 0.460 1.008
[ bonds ]
1 3 1 ; O1 C2
2 3 1 ; O3 C2
3 4 1 0.15430 217568.0 ; CO C3 1 0.15260 217568.0 ; -idem-
; C2 C4
4 5 1 ; C4 H26
4 6 1 0.14250 267776.0 ; C4 O6 ; C3 OS 1 0.14250
267776.0 ; DMP
4 7 1 0.15090 217568.0 ; C4 C7 ; CY CY 1 0.15090
217568.0 ; cyclopropanes- wlj
6 7 1 0.14250 267776.0 ; O5 C6 ; C3 OS 1 0.14250
267776.0 ; DMP
7 8 1 ; C6 H27
7 9 1 0.15000 217568.0 ;CO C3 1 0.15260 217568.0 ; -idem- ;
C6 C7
9 10 1 ; C7 O8
9 11 1 ; C7 N9
11 12 1 ; N H
11 13 1 ; N CA
13 14 1 ; CA HA
13 15 1 ; CA CB
13 28 1 ; CA C
15 16 1 ; CB HB1
15 17 1 ; CB HB2
15 18 1 ; CB CG
18 19 1 ; CG HG
18 20 1 ; CG CD1
18 24 1 ; CG CD2
20 21 1 ; CD1 HD11
20 22 1 ; CD1 HD12
20 23 1 ; CD1 HD13
24 25 1 ; CD2 HD21
24 26 1 ; CD2 HD22
24 27 1 ; CD2 HD23
28 29 1 ; C O
28 30 1 ; -C N
30 31 1 ; N H
30 32 1 ; N CA
32 33 1 ; CA HA1
32 34 1 ; CA HA2
32 35 1 ; CA CB
35 36 1 ; CB HB1
35 37 1 ; CB HB2
35 38 1 ; CB CG
38 39 1 ; CG HG1
38 40 1 ; CG HG2
38 41 1 ; CG CD
41 42 1 ; CD HD1
41 43 1 ; CD HD2
41 44 1 ; CD NE
44 45 1 ; NE HE
44 46 1 ; NE CZ
46 47 1 ; CZ NH1
46 50 1 ; CZ NH2
47 48 1 ; NH1 HH11
47 49 1 ; NH1 HH12
50 51 1 ; NH2 HH21
50 52 1 ; NH2 HH22
[ pairs ]
1 7
2 6
3 6
3 7
6 10
6 11
7 13
9 15
9 28
10 13
11 18
11 29
11 30
11 16
11 17
13 20
13 24
13 32
13 19
13 31
15 29
15 30
15 21
15 22
15 23
15 25
15 26
15 27
20 25
20 26
20 27
24 21
24 22
24 23
28 18
28 35
28 16
28 17
28 33
28 34
29 32
29 31
30 38
30 36
30 37
32 41
32 39
32 40
35 44
35 42
35 43
38 46
38 45
41 47
41 50
14 29
14 30
16 20
16 24
16 19
17 20
17 24
17 19
19 21
19 22
19 23
19 25
19 26
19 27
31 35
31 33
31 34
33 38
33 36
33 37
34 38
34 36
34 37
36 41
36 39
36 40
37 41
37 39
37 40
39 44
39 42
39 43
40 44
40 42
40 43
42 46
42 45
43 46
43 45
45 47
45 50
48 44
48 50
49 44
49 50
51 44
51 47
52 44
52 47
[ angles ]
1 3 2 1 ; O1 C3 O2
1 3 4 1 117.458 669.440 ; O1 C3 C4 ; CA C O 1 120.400
669.440 ; wlj
2 3 4 1 115.211 669.440 ; O2 C3 C4 ; CA C O 1 120.400
669.440 ; wlj
3 4 6 1 117.196 669.440 ; C3 C4 O6 ; CA C O 1 120.400
669.440 ; wlj
3 4 7 1 ; O3 C3 C7
3 4 5 1 114.392 313.800 ;C3 C4 H5 GAMESS= 114.392 C3 C4 HC ;CY
CY HC 1 117.200 313.800 ; cyclopropanes - wlj 10/97
4 6 7 1 62.495 585.760 ; C4 C6 C7 ; CW OS CW 1 106.500
585.760 ;
4 7 6 1 ; C4 C7 O6
4 7 9 1 ; C4 C7 C9
5 4 7 1 118.991 313.800 ; H5 C4 C7 GAMESS= 118.991 ;CY CY HC
1 117.200 313.800 ; cyclopropanes - wlj 10/97
5 4 6 1 113.639 292.880 ; H5 C4 O6 GAMESS= 113.639 ; O C
HC 1 123.000 292.880 ; wlj
6 7 9 1 114.647 669.440 ; O6 C7 C9 ; CA C O 1 120.400
669.440 ; wlj
7 9 10 1 ; C7 C9 H10
7 9 11 1 ; C7 C9 N11
8 7 6 1 115.319 313.800 ; O6 C7 H8 GAMESS=115.319 H27 C6 C5
;CY CY HC 1 117.200 313.800 ; cyclopropanes - wlj
10/97
8 7 4 1 120.745 313.800 ;GAMESS= 120.745 ;CY CY HC 1 117.200
313.800 ; cyclopropanes - wlj 10/97
8 7 9 1 113.730 313.800 ;GAMESS= 113.730 ;CY CY HC 1 117.200
313.800 ; cyclopropanes - wlj 10/97
9 11 13 1 ; C9 N11 C13
9 11 12 1 ; C9 N11 H12
10 9 11 1 ; O10 C9 C11
11 13 14 1 ; N11 C13 H14
11 13 15 1 ; N11 C13 C15
11 13 28 1 ; N11 C13 C28
12 11 13 1 ; H12 N11 C13
13 15 16 1 ; C13 C15 H16
13 15 17 1 ; C13 C15 H17
13 15 18 1 ; C13 C15 C18
13 28 29 1 ; C13 C28 O29
13 28 30 1 ; C13 C28 N30
14 13 15 1 ; H14 C13 C15
14 13 28 1 ; H14 C13 C28
15 13 28 1 ; C15 C13 C28
15 18 19 1 ; C15 C18 H19
15 18 20 1 ; C15 C18 C20
15 18 24 1 ; C15 C18 C24
16 15 17 1 ; H16 C15 H17
16 15 18 1 ; H16 C15 C18
17 15 18 1 ; H17 C15 C18
18 20 21 1 ; C18 C20 C21
18 20 22 1 ; C18 C20 C22
18 20 23 1 ; C18 C20 C23
18 24 25 1 ; C18 C24 C25
18 24 26 1 ; C18 C24 C26
18 24 27 1 ; C18 C24 C27
19 18 20 1 ; H19 C18 C20
19 18 24 1 ; H19 C18 C24
21 20 22 1; H21 C20 H22
21 20 23 1; H21 C20 H23
22 20 23 1; H22 C20 H23
25 24 26 1; H25 C20 H26
25 24 27 1; H25 C20 H27
26 24 27 1; H26 C20 H27
28 30 31 1 ; C28 N30 H31
28 30 32 1 ; C28 N30 C32
29 28 30 1 ; O29 C28 N30
30 32 33 1 ; N30 C32 H33
30 32 34 1 ; N30 C32 H34
30 32 35 1 ; N30 C32 C35
31 30 32 1 ; H31 N30 C32
32 35 36 1 ; C32 C35 H36
32 35 37 1 ; C32 C35 H37
32 35 38 1 ; C32 C35 C38
33 32 34 1 ; H33 H32 H34
33 32 35 1 ; H33 H32 H35
34 32 35 1 ; H34 H32 H35
35 38 39 1 ; C35 C38 H39
35 38 40 1 ; C35 C38 H40
35 38 41 1 ; C35 C38 C41
36 35 37 1 ; H36 C35 H37
36 35 38 1 ; H36 C35 C38
37 35 38 1 ; H37 C35 C38
38 41 42 1 ; C38 C41 H42
38 41 43 1 ; C38 C41 H43
38 41 44 1 ; C38 C41 N44
39 38 40 1 ; H39 C38 H40
39 38 41 1 ; H39 C38 H40
40 38 41 1 ; H40 C38 C41
41 44 45 1 ; C41 N44 H45
41 44 46 1 ; C41 N44 C46
42 41 43 1 ; H42 C41 H43
42 41 44 1 ; H42 C41 N44
43 41 44 1 ; H43 C41 N44
44 46 47 1 ; H43 C46 N47
44 46 50 1 ; H43 C46 N50
45 44 46 1 ; H45 C44 C46
46 47 48 1 ; C46 N47 H48
46 47 49 1 ; C46 N47 H49
46 50 51 1 ; C46 N50 H51
46 50 52 1 ; C46 N50 H52
47 46 50 1 ; N47 C46 N50
48 47 49 1 ; H48 N47 H49
51 50 52 1 ; H51 N50 H52
[ dihedrals ]
; ai aj ak al funct c0 c1 c2 c3
c4 c5
1 3 4 5 3; A1
;1 3 4 6 3; A2******
1 3 4 7 3; A3
2 3 4 5 3; A4
;2 3 4 6 3; A5********
2 3 4 7 3; A6
3 4 7 6 3;B1
3 4 7 8 3;B2
3 4 7 9 3;B3
;3 4 6 8 3; nao rola
5 4 7 6 3;B4
5 4 7 8 3;B5
5 4 7 9 3;B6
4 7 9 10 3;C1
4 7 9 11 3;C2
; 4 6 8 9 3;nao rola
; 6 7 9 10 3; nao rola
; 6 7 9 11 3; nao rola
8 7 9 10 3; C6
8 7 9 11 3; C7
7 9 11 12 3;
;7 9 11 13 3;****** nao há este dihedro na LEU e não há padrao para ele.
;10 9 11 12 3;****** C=O do anterior com NH deste
10 9 11 13 3;
9 11 13 14 3;
9 11 13 15 3;
9 11 13 28 3;
12 11 13 14 3;
12 11 13 15 3;
12 11 13 28 3;
11 13 15 16 3;
11 13 15 17 3;
11 13 15 18 3;
14 13 15 16 3;
14 13 15 17 3;
14 13 15 18 3;
28 13 15 16 3;
28 13 15 17 3;
28 13 15 18 3;
13 15 18 19 3;
13 15 18 20 3;
13 15 18 24 3;
16 15 18 19 3;
16 15 18 20 3;
16 15 18 24 3;
17 15 18 19 3;
17 15 18 20 3;
17 15 18 24 3;
15 18 20 21 3;
15 18 20 22 3;
15 18 20 23 3;
19 18 20 21 3;
19 18 20 22 3;
19 18 20 23 3;
24 18 20 21 3;
24 18 20 22 3;
24 18 20 23 3;
15 18 24 25 3;
15 18 24 26 3;
15 18 24 27 3;
19 18 24 25 3;
19 18 24 26 3;
19 18 24 27 3;
20 18 24 25 3;
20 18 24 26 3;
20 18 24 27 3;
11 13 28 29 3;
11 13 28 30 3;
14 13 28 29 3;
14 13 28 30 3;
15 13 28 29 3;
15 13 28 30 3;
13 28 30 31 3;
13 28 30 32 3;
29 28 30 31 3;
29 28 30 32 3;
28 30 32 33 3;
28 30 32 33 3;
28 30 32 33 3;
31 30 32 33 3;
31 30 32 34 3;
31 30 32 35 3;
30 32 35 36 3;
30 32 35 37 3;
30 32 35 38 3;
33 32 35 36 3;
33 32 35 37 3;
33 32 35 38 3;
34 32 35 36 3;
34 32 35 37 3;
34 32 35 38 3;
32 35 38 39 3;
32 35 38 40 3;
32 35 38 41 3;
36 35 38 39 3;
36 35 38 40 3;
36 35 38 41 3;
37 35 38 39 3;
37 35 38 40 3;
37 35 38 41 3;
35 38 41 42 3;
35 38 41 43 3;
35 38 41 44 3;
39 38 41 42 3;
39 38 41 43 3;
39 38 41 44 3;
40 38 41 42 3;
40 38 41 43 3;
40 38 41 44 3;
38 41 44 45 3;
38 41 44 46 3;
42 41 44 45 3;
42 41 44 46 3;
43 41 44 45 3;
43 41 44 46 3;
41 44 46 47 3;
41 44 46 50 3;
45 44 46 47 3;
45 44 46 50 3;
44 46 47 48 3;
44 46 47 49 3;
50 46 47 48 3;
50 46 47 49 3;
44 46 50 51 3;
44 46 50 52 3;
47 46 50 51 3;
47 46 50 52 3;
; 3 4 7 9 3 2.92880 -1.46440 0.20920 -1.67360 0.00000 0.00000 ;B3
;CT CY CY CY 3 2.92880 -1.46440 0.20920 -1.67360 0.000
00 0.00000 ; cycropropane
; 11 13 15 18 3 ;dih_LEU_chi1_N_C_C_C ;F1 N CA CB CG
dih_LEU_chi1_N_C_C_C
; 28 13 15 18 3 ;dih_LEU_chi1_C_C_C_CO ;F3 CG CB CA C
dih_LEU_chi1_C_C_C_CO
; 30 32 35 38 3 ;dih_ARG_chi1_N_C_C_C ;M1 N CA CB CG
dih_ARG_chi1_N_C_C_C
;[ impropers ]
; 3 1 2 4 improper_O_C_X_Y ;I1 CARBONILA EPOXIDO improper_O_C_X_Y 180.0
43.93200 2
; 7 6 9 8 improper_O_C_X_Y ;I2 peptidica EPO-LEU peptidica EPO-LEU
improper_O_C_X_Y 180.0 43.93200 2
;9 7 28 10 ;I3 peptidica EPO-LEU -C CA N
H improper_Z_N_X_Y
; 9 10 7 28 improper_Z_N_X_Y ;I3 peptidica EPO-LEU -C CA N
H improper_Z_N_X_Y
;15 10 17 16 improper_O_C_X_Y ;I4 peptidica LEU-ARG CA +N C
O improper_O_C_X_Y
; 10 17 15 16 improper_O_C_X_Y ;I4 peptidica LEU-ARG CA +N C
O improper_O_C_X_Y
;17 15 39 18 ;I5 peptidica LEU-ARG -C CA N
H improper_Z_N_X_Y
; 15 18 17 39 improper_Z_N_X_Y ;I5 peptidica LEU-ARG -C CA N
H improper_Z_N_X_Y
;4 3 6 5 ;I6 * 58.5 GRUPAMENTO EPOXIDO ; *** OPLS
doesnt use impropers for chiral atoms
;6 7 4 5 ;I7 * 58.5 GRUPAMENTO EPOXIDO ; *** OPLS
doesnt use impropers for chiral atoms
;10 9 15 11 ;I8 * 35.3 CADEIA LATERAL LEU ; *** OPLS
doesnt use impropers for chiral atoms
;12 11 13 14 ;I9 * 35.3 CADEIA LATERAL LEU ; *** OPLS
doesnt use impropers for chiral atoms
;22 21 23 48 improper_Z_N_X_Y ;I10 CD CZ NE HE
improper_Z_N_X_Y
; 21 23 22 48 improper_Z_N_X_Y ;I10 CD CZ NE HE
improper_Z_N_X_Y
; 22 24 23 25 improper_O_C_X_Y ; EXTRA*** NE NH1 CZ NH2
improper_O_C_X_Y
; 23 49 24 50 improper_Z_N_X_Y ;I11 CZ HH11 NH1 HH12
improper_Z_N_X_Y
; 23 51 25 52 improper_Z_N_X_Y ;I12 CZ HH21 NH2 HH22
improper_Z_N_X_Y
;Z-LR-AMC FINAL
;Esta topologia é o .itp do zlramc.top, ajustado para o formato .itp.
;As cargas foram calculadas pelo
;Gaussian98 ==> https://www.gaussian.com
[ moleculetype ]
;name nrexcl
ZLR 3
[ atoms ]
; nr type resnr resid atom cgnr charge mass
1 C 1 ZLR CBC 1 -0.100 12.011 ;PHE
2 C 1 ZLR CAE 2 -0.100 12.011 ;PHE
3 C 1 ZLR CAD 3 -0.100 12.011 ;PHE
4 C 1 ZLR CAC 4 -0.100 12.011 ;PHE
5 C 1 ZLR CAA 5 -0.100 12.011 ;PHE
6 C 1 ZLR CBD 6 0.000 12.011 ;PHE
7 C 1 ZLR CBE 7 0.060 14.027 ; 0.0585 Molden
8 O 1 ZLR OAB 8 -0.070 15.9994 ; -0.0698 Molden
9 C 1 ZLR CBF 9 0.320 12.011 ; 0.3226 Molden
10 O 1 ZLR OBG 10 -0.310 15.9994 ; -0.3158 Molden
11 N 1 ZLR N 11 -0.280 14.0067 ;LEU
12 H 1 ZLR HAA 12 0.280 1.008 ;LEU
13 CH1 1 ZLR CA 13 0.000 13.019 ;LEU
14 CH2 1 ZLR CB 14 0.000 14.027 ;LEU
15 CH1 1 ZLR CAK 15 0.000 13.019 ;LEU
16 CH3 1 ZLR CAL 16 0.000 15.035 ;LEU
17 CH3 1 ZLR CAM 17 0.000 15.035 ;LEU
18 C 1 ZLR C 18 0.380 15.9994 ;LEU
19 O 1 ZLR O 19 -0.380 12.011 ;LEU
20 N 1 ZLR NAN 20 -0.280 14.0067 ;ARG
21 H 1 ZLR HAB 21 0.280 1.008 ;ARG
22 CH1 1 ZLR CAO 22 0.000 13.019 ;ARG
23 CH2 1 ZLR CAR 23 0.000 14.027 ;ARG
24 CH2 1 ZLR CAS 24 0.000 14.027 ;ARG
25 CH2 1 ZLR CAT 25 0.090 14.027 ;ARG
26 NE 1 ZLR NAU 26 -0.110 14.0067 ;ARG
27 H 1 ZLR HAC 27 0.240 1.008 ;ARG
28 C 1 ZLR CAV 28 0.340 12.011 ;ARG
29 NZ 1 ZLR NAX 29 -0.260 14.0067 ;ARG
30 H 1 ZLR HAH 30 0.240 1.008 ;ARG
31 H 1 ZLR HAG 31 0.240 1.008 ;ARG
32 NZ 1 ZLR NAW 32 -0.260 14.0067 ;ARG
33 H 1 ZLR HAF 33 0.240 1.008 ;ARG
34 H 1 ZLR HAE 34 0.240 1.008 ;ARG
35 C 1 ZLR CAP 35 0.380 12.011 ;ARG
36 O 1 ZLR OAQ 36 -0.380 15.9994 ;ARG
37 N 1 ZLR NAY 37 -0.280 14.0067 ;adaptado de aminoacido
38 H 1 ZLR HAD 38 0.280 1.008 ;adaptado de aminoacido
39 C 1 ZLR CAZ 39 0.0 12.011 ;adaptado do CG da PHE
40 C 1 ZLR CBH 40 -0.100 12.011 ; -.1624
41 C 1 ZLR CBI 41 -0.100 12.011 ; -.0379
42 C 1 ZLR CBJ 42 0.000 12.011 ; -.0984 adaptado do CG da PHE
43 C 1 ZLR CBA 43 -0.160 12.011 ; -.1711
44 C 1 ZLR CBB 44 0.120 12.011 ; .1178
45 O 1 ZLR OBO 45 -0.160 12.011 ; -.1693
46 O 1 ZLR OBN 46 -0.330 12.011 ; .3317
47 C 1 ZLR CBM 47 0.380 12.011 ; .3787
48 C 1 ZLR CBL 48 -0.160 12.011 ; -.1649
49 C 1 ZLR CBK 49 0.0 12.011 ;-.2962adaptado do CG da PHE
50 CH3 1 ZLR CBP 50 0.0 12.011 ;CH3 .3143
51 HC 1 ZLR H 51 0.100 1.008 ;PHE .0861
52 HC 1 ZLR H 52 0.100 1.008 ;PHE .0823
53 HC 1 ZLR H 53 0.100 1.008 ;PHE .0901
54 HC 1 ZLR H 54 0.100 1.008 ;PHE .0945
55 HC 1 ZLR H 55 0.100 1.008 ;PHE .1111
56 HC 1 ZLR H 56 0.100 1.008 ; .1676
57 HC 1 ZLR H 57 0.100 1.008 ; .1131
58 HC 1 ZLR H 58 0.100 1.008 ; .1332
59 HC 1 ZLR H 59 0.100 1.008 ; .1384
[ bonds ]
;ai aj fu c0 c1
1 2 2 gb_15
1 6 2 gb_15
2 3 2 gb_15
3 4 2 gb_15
4 5 2 gb_15
5 6 2 gb_15
6 7 2 gb_15
7 8 2 gb_19
8 9 2 gb_12
9 10 2 gb_4
9 11 2 gb_9
11 12 2 gb_2
11 13 2 gb_20
13 14 2 gb_26
13 18 2 gb_26
14 15 2 gb_26
15 16 2 gb_26
15 17 2 gb_26
18 19 2 gb_4
18 20 2 gb_9
20 21 2 gb_2
20 22 2 gb_20
22 23 2 gb_26
22 35 2 gb_26
23 24 2 gb_26
24 25 2 gb_26
25 26 2 gb_20
26 27 2 gb_2
26 28 2 gb_10
28 29 2 gb_10
28 32 2 gb_10
29 30 2 gb_2
29 31 2 gb_2
32 33 2 gb_2
32 34 2 gb_2
35 36 2 gb_4
35 37 2 gb_9
37 38 2 gb_2
37 39 2 gb_10
39 40 2 gb_15
39 43 2 gb_15
40 41 2 gb_15
41 42 2 gb_15
42 44 2 gb_15
42 49 2 gb_15
43 44 2 gb_15
44 45 2 gb_12
45 47 2 gb_12
46 47 2 gb_4
47 48 2 gb_15
48 49 2 gb_15
49 50 2 gb_26
1 51 2 gb_3
2 52 2 gb_3
3 53 2 gb_3
4 54 2 gb_3
5 55 2 gb_3
40 56 2 gb_3
41 57 2 gb_3
43 58 2 gb_3
48 59 2 gb_3
[ pairs ]
;ai aj fu c0 c1
1 4 1
1 8 1
2 5 1
2 7 1
3 6 1
4 7 1
5 8 1
6 9 1
7 10 1
7 11 1
8 12 1
8 13 1
9 14 1
9 18 1
10 12 1
10 13 1
11 15 1
11 19 1
11 20 1
12 14 1
12 18 1
13 16 1
13 17 1
13 21 1
13 22 1
14 19 1
14 20 1
15 18 1
18 23 1
18 35 1
19 21 1
19 22 1
20 24 1
20 36 1
20 37 1
21 23 1
21 35 1
22 25 1
22 38 1
22 39 1
23 26 1
23 36 1
23 37 1
24 27 1
24 28 1
24 35 1
25 29 1
25 32 1
26 30 1
26 31 1
26 33 1
26 34 1
27 29 1
27 32 1
29 33 1
29 34 1
30 32 1
31 32 1
35 40 1
35 43 1
36 38 1
36 39 1
37 41 1
37 44 1
38 40 1
38 43 1
39 42 1
39 45 1
40 44 1
40 49 1
41 43 1
41 45 1
41 48 1
41 50 1
42 47 1
43 47 1
43 49 1
44 46 1
44 48 1
44 50 1
45 49 1
46 49 1
47 50 1
51 3 1
51 5 1
51 7 1
51 52 1
52 6 1
52 4 1
52 53 1
53 1 1
53 54 1
53 5 1
54 6 1
54 55 1
55 3 1
55 7 1
55 1 1
56 37 1
56 43 1
56 42 1
56 57 1
57 39 1
57 44 1
57 49 1
58 37 1
58 40 1
58 42 1
58 45 1
59 45 1
59 46 1
59 50 1
59 42 1
[ angles ]
;ai aj ak fu c0 c1
50 49 48 2 ga_32
50 49 42 2 ga_32
48 49 42 2 ga_32
49 48 47 2 ga_32
48 47 46 2 ga_26
48 47 45 2 ga_26
46 47 45 2 ga_26
47 45 44 2 ga_9
45 44 43 2 ga_32
45 44 42 2 ga_32
43 44 42 2 ga_32
44 43 39 2 ga_32
49 42 44 2 ga_32
49 42 41 2 ga_32
44 42 41 2 ga_32
42 41 40 2 ga_32
41 40 39 2 ga_32
43 39 40 2 ga_32
43 39 37 2 ga_32
40 39 37 2 ga_32
39 37 38 2 ga_22
39 37 35 2 ga_32
38 37 35 2 ga_31
37 35 36 2 ga_32
37 35 22 2 ga_18
36 35 22 2 ga_29
35 22 23 2 ga_12
35 22 20 2 ga_12
23 22 20 2 ga_12
22 23 24 2 ga_14
23 24 25 2 ga_14
24 25 26 2 ga_12
25 26 27 2 ga_19
25 26 28 2 ga_32
27 26 28 2 ga_22
26 28 29 2 ga_27
26 28 32 2 ga_27
29 28 32 2 ga_27
28 29 30 2 ga_22
28 29 31 2 ga_22
30 29 31 2 ga_23
28 32 33 2 ga_22
28 32 34 2 ga_22
33 32 34 2 ga_23
22 20 21 2 ga_17
22 20 18 2 ga_30
21 20 18 2 ga_31
20 18 19 2 ga_32
20 18 13 2 ga_18
19 18 13 2 ga_29
18 13 14 2 ga_12
18 13 11 2 ga_12
14 13 11 2 ga_12
13 14 15 2 ga_12
14 15 17 2 ga_14
14 15 16 2 ga_14
17 15 16 2 ga_14
13 11 12 2 ga_17
13 11 9 2 ga_30
12 11 9 2 ga_31
11 9 10 2 ga_32
11 9 8 2 ga_26
10 9 8 2 ga_26
9 8 7 2 ga_9
8 7 6 2 ga_26
7 6 5 2 ga_26
7 6 1 2 ga_26
5 6 1 2 ga_26
6 5 4 2 ga_26
5 4 3 2 ga_26
4 3 2 2 ga_26
3 2 1 2 ga_26
6 1 2 2 ga_26
51 1 6 2 ga_24
51 1 2 2 ga_24
52 2 1 2 ga_24
52 2 3 2 ga_24
53 3 2 2 ga_24
53 3 4 2 ga_24
54 4 3 2 ga_24
54 4 5 2 ga_24
55 5 4 2 ga_24
55 5 6 2 ga_24
56 40 39 2 ga_24
56 40 41 2 ga_24
57 41 40 2 ga_24
57 41 42 2 ga_24
58 43 39 2 ga_24
58 43 44 2 ga_24
59 48 47 2 ga_24
59 48 49 2 ga_24
[ dihedrals ]
;ai aj ak al fu c0 c1 m c0 c1 m
49 48 50 42 2 gi_1
47 46 45 48 2 gi_1
44 45 43 42 2 gi_1
42 41 49 44 2 gi_1
39 37 43 40 2 gi_1
37 39 38 35 2 gi_1
35 37 22 36 2 gi_1
26 25 28 27 2 gi_1
28 26 29 32 2 gi_1
29 28 30 31 2 gi_1
32 28 33 34 2 gi_1
20 22 21 18 2 gi_1
18 20 13 19 2 gi_1
11 13 12 9 2 gi_1
9 11 8 10 2 gi_1
6 7 1 5 2 gi_1
22 35 23 20 2 gi_2
13 18 11 14 2 gi_2
15 14 16 17 2 gi_2
44 43 39 40 2 gi_1
43 39 40 41 2 gi_1
39 40 41 42 2 gi_1
40 41 42 44 2 gi_1
41 42 44 43 2 gi_1
42 44 43 39 2 gi_1
6 5 4 3 2 gi_1
5 4 3 2 2 gi_1
4 3 2 1 2 gi_1
3 2 1 6 2 gi_1
2 1 6 5 2 gi_1
1 6 5 4 2 gi_1
1 6 2 51 2 gi_1 ;
2 3 1 52 2 gi_1 ;
3 4 2 53 2 gi_1 ;
4 5 3 54 2 gi_1 ;
5 6 4 55 2 gi_1 ;
40 41 39 56 2 gi_1 ;
41 42 40 57 2 gi_1 ;
43 44 39 58 2 gi_1 ;
48 49 47 59 2 gi_1 ;
50 49 48 47 1 gd_5
50 49 42 41 1 gd_1
45 47 48 49 1 gd_5
48 47 45 44 1 gd_14
42 44 45 47 1 gd_14
43 39 37 35 1 gd_4
22 35 37 39 1 gd_4
20 22 35 37 1 gd_20
24 23 22 35 1 gd_17
35 22 20 18 1 gd_19
25 24 23 22 1 gd_17
26 25 24 23 1 gd_17
28 26 25 24 1 gd_19
25 26 28 32 1 gd_4
26 28 29 31 1 gd_4
26 28 32 34 1 gd_4
13 18 20 22 1 gd_4
11 13 18 20 1 gd_20
15 14 13 18 1 gd_17
18 13 11 9 1 gd_20
13 14 15 16 1 gd_17
8 9 11 13 1 gd_4
11 9 8 7 1 gd_3
6 7 8 9 1 gd_14
8 7 6 1 1 gd_20
;CP1 FINAL
;Esta topologia é o .itp do cp1.rc5.top, ajustado para o formato .itp.
;As cargas foram calculadas pelo
;xRED II ==>> http://www.u-picardie.fr/labo/lbpd/RED/index.html
;resp do Amber 8 ==>> http://amber.scripps.edu/Questions/resp.html
;Gaussian98 ==> https://www.gaussian.com
[ moleculetype ]
;Name nrexcl
CP1 3
[ atoms ]
; nr type resnr residue atom cgnr charge mass typeB chargeB massB
1 opls_145 225 CP1 CG 1 -0.004822 12.011
2 opls_145 225 CP1 CD1 1 -0.122455 12.011
3 opls_146 225 CP1 HD1 1 0.065822 1.008
4 opls_145 225 CP1 CE1 1 -0.122426 12.011
5 opls_146 225 CP1 HE1 1 0.065816 1.008
6 opls_145 225 CP1 CZ 1 -0.004841 12.011
7 opls_145 225 CP1 CE2 1 -0.062560 12.011
8 opls_146 225 CP1 HE2 1 0.044885 1.008
9 opls_145 225 CP1 CD2 1 -0.062569 12.011
10 opls_146 225 CP1 HD2 1 0.044897 1.008
11 opls_137 225 CP1 CH 2 0.076060 12.011
12 opls_140 225 CP1 HC 2 0.056644 1.008
13 opls_549 225 CP1 N 2 -0.187055 14.0067
14 opls_548 225 CP1 N 2 -0.468278 14.0067
15 opls_553 225 CP1 H 2 0.370781 1.008
16 opls_145 225 CP1 CG 3 0.381987 12.011
17 opls_145 225 CP1 CD1 3 -0.243439 12.011
18 opls_146 225 CP1 HD1 3 0.107757 1.008
19 opls_145 225 CP1 CE1 3 -0.080960 12.011
20 opls_146 225 CP1 HE1 3 0.064054 1.008
21 opls_145 225 CP1 CZ 3 -0.179980 12.011
22 opls_146 225 CP1 HZ 3 0.057650 1.008
23 opls_145 225 CP1 CE2 3 -0.009243 12.011
24 opls_146 225 CP1 HE2 3 0.055797 1.008
25 opls_145 225 CP1 CD2 3 -0.238940 12.011
26 opls_271 225 CP1 C 4 0.726693 12.011
27 opls_272 225 CP1 O1 4 -0.718745 15.9994
28 opls_272 225 CP1 O1 4 -0.691662 15.9994
29 opls_137 225 CP1 CH 5 0.076078 12.011
30 opls_140 225 CP1 HC 5 0.056649 1.008
31 opls_549 225 CP1 N 5 -0.187047 14.0067
32 opls_548 225 CP1 N 5 -0.468318 14.0067
33 opls_553 225 CP1 H 5 0.370782 1.008
34 opls_145 225 CP1 CG 6 0.381944 12.011
35 opls_145 225 CP1 CD1 6 -0.243435 12.011
36 opls_146 225 CP1 HD1 6 0.107765 1.008
37 opls_145 225 CP1 CE1 6 -0.080986 12.011
38 opls_146 225 CP1 HE1 6 0.064049 1.008
39 opls_145 225 CP1 CZ 6 -0.179856 12.011
40 opls_146 225 CP1 HZ 6 0.057620 1.008
41 opls_145 225 CP1 CE2 6 -0.009330 12.011
42 opls_146 225 CP1 HE2 6 0.055817 1.008
43 opls_145 225 CP1 CD2 6 -0.238885 12.011
44 opls_271 225 CP1 C 7 0.726669 12.011
45 opls_272 225 CP1 O1 7 -0.718748 15.9994
46 opls_272 225 CP1 O1 7 -0.691635 15.9994
[bonds]
1 2 1
1 9 1
1 11 1
2 3 1
2 4 1
4 5 1
4 6 1
6 7 1
6 29 1
7 8 1
7 9 1
9 10 1
11 12 1
11 13 1 0.13350 410032.0 ; C N 1 0.13350 410032.0 ; AA
13 14 1
14 15 1
14 16 1
16 17 1
16 25 1
17 18 1
17 19 1
19 20 1
19 21 1
21 22 1
21 23 1
23 24 1
23 25 1
25 26 1
26 27 1
26 28 1
29 30 1
29 31 1 0.13350 410032.0 ; C N 1 0.13350 410032.0 ; AA
31 32 1
32 33 1
32 34 1
34 35 1
34 43 1
35 36 1
35 37 1
37 38 1
37 39 1
39 40 1
39 41 1
41 42 1
41 43 1
43 44 1
44 45 1
44 46 1
[pairs]
1 14
1 8
1 6
1 5
2 10
2 8
2 7
2 29
2 12
2 13
3 9
3 11
3 5
3 6
4 11
4 9
4 8
4 30
4 31
5 7
5 29
6 10
6 32
7 11
7 30
7 31
8 10
8 29
9 12
9 13
9 29
10 11
11 15
11 16
12 14
13 17
13 25
14 23
14 26
14 18
14 19
15 17
15 25
16 27
16 28
16 21
16 24
16 20
17 26
17 23
17 22
18 25
18 20
18 21
19 25
19 24
20 22
20 23
21 26
22 24
22 25
23 27
23 28
24 26
29 33
29 34
30 32
31 35
31 43
32 41
32 44
32 36
32 37
33 35
33 43
34 45
34 46
34 39
34 42
34 38
35 44
35 41
35 40
36 43
36 38
36 39
37 43
37 42
38 40
38 41
39 44
40 42
40 43
41 45
41 46
42 44
[angles]
2 1 11 1
2 1 9 1
9 1 11 1
1 2 3 1
1 2 4 1
3 2 4 1
2 4 5 1
2 4 6 1
5 4 6 1
4 6 7 1
4 6 29 1
29 6 7 1
6 7 8 1
6 7 9 1
8 7 9 1
7 9 10 1
7 9 1 1
10 9 1 1
1 11 12 1
1 11 13 1 120.723 585.760 ; CT CW NA 1 121.600 585.760 ; wlj
11 13 14 1 120.514 585.760 ; CT NC NZ 1 120.000 585.760 ; wlj
azide
13 14 15 1
13 14 16 1
14 16 17 1
14 16 25 1
16 17 18 1
16 17 19 1
16 25 23 1
16 25 26 1
18 17 19 1
17 19 20 1
17 19 21 1
20 19 21 1
19 21 22 1
19 21 23 1
22 21 23 1
21 23 24 1
21 23 25 1
24 23 25 1
23 25 26 1
25 26 27 1 119.250 585.760 ; C3 C_3 O2 1 117.000 585.760 ;
GLU(OL) SCH JPC 79,2379
25 26 28 1 119.250 585.760 ; C3 C_3 O2 1 117.000 585.760 ;
GLU(OL) SCH JPC 79,2379
27 26 28 1
6 29 30 1
6 29 31 1 120.723 585.760 ; CT CW NA 1 121.600 585.760 ; wlj
29 31 32 1 120.514 585.760 ; CT NC NZ 1 120.000 585.760 ; wlj
azide
31 32 33 1
31 32 34 1
32 34 35 1
32 34 43 1
34 35 36 1
34 35 37 1
34 43 41 1
34 43 44 1
36 35 37 1
35 37 38 1
35 37 39 1
38 37 39 1
37 39 40 1
37 39 41 1
40 39 41 1
39 41 42 1
39 41 43 1
42 41 43 1
41 43 44 1
43 44 45 1 117.000 585.760 ; C3 C_3 O2 1 117.000 585.760 ;
GLU(OL) SCH JPC 79,2379
43 44 46 1 117.000 585.760 ; C3 C_3 O2 1 117.000 585.760 ;
GLU(OL) SCH JPC 79,2379
45 44 46 1
[dihedrals]
;ciclo central
2 1 11 12 3 ; HB1 CB CG CD1 PHE
2 1 11 12 3 ; HB1 CB CG CD1 PHE
2 1 11 13 3 ; CA CB CG CD1 PHE
9 1 11 12 3 ; HB1 CB CG CD2 PHE
9 1 11 12 3 ; HB1 CB CG CD2 PHE
9 1 11 13 3 ; CA CB CG CD2 PHE
4 6 29 30 3 ; HB1 CB CG CD1 PHE
4 6 29 30 3 ; HB1 CB CG CD1 PHE
4 6 29 31 3 ; CA CB CG CD1 PHE
7 6 29 30 3 ; HB1 CB CG CD1 PHE
7 6 29 30 3 ; HB1 CB CG CD1 PHE
7 6 29 31 3 ; CA CB CG CD1 PHE
11 1 2 3 3 ; CB CG CD1 HD1 anel PHE
11 1 2 4 3 ; CB CG CD1 CE1 anel PHE
9 1 2 3 3 ; CD2 CG CD1 HD1 anel PHE
9 1 2 4 3 ; CD2 CG CD1 CE1 anel PHE
;aqui acabaria pq na PHE os proximos nao se repetiriam.
29 6 7 8 3 ; CB CG CD1 HD1 anel PHE
29 6 7 9 3 ; CB CG CD1 CE1 anel PHE
4 6 7 8 3 ; CD2 CG CD1 HD1 anel PHE
4 6 7 9 3 ; CD2 CG CD1 CE1 anel PHE
;saindo do ciclo central para o Residuo 2
; 1 11 13 14 3 -0.76567 2.70705 4.02501 -5.96639 0.00000 0.00000 ; CG
CB CA N ; CX CT CT_2 N 3 -0.7
6567 2.70705 4.02501 -5.96639 0.00000 0.00000 ; Chi-1 peptides
1 11 13 14 3 13.38880 0.00000 -13.38880 0.00000 0.00000 0.00000 ; (From
wildcard) ; CT CW NA NB 3 13.38880
0.00000 -13.38880 0.00000 0.00000 0.00000 ; (From wildcard)
;este seria para enrijecer a dupla lig.; CT C NC CT 3 58.57600 0.00000 -
58.57600 0.00000 0.00000 0.00000 ; imine
; HA CW NA NB 3 13.38880 0.00000 -13.38880 0.00000 0.00000 0.00000 ;
(From wildcard)
;12 11 13 14 3 20.50160 0.00000 -20.50160 0.00000 0.00000 0.00000 ;C
C N H 3 20.50160 0.00000 -20.50160
0.00000 0.00000 0.00000 ; dicarbonyls BMC 8,1881(2000) ; HB1 CB CA N
12 11 13 14 3 13.38880 0.00000 -13.38880 0.00000 0.00000 0.00000 ; (From
wildcard)
11 13 14 15 3 ; N CA CB HB1 ;???
11 13 14 16 3 ; N CA CB CG ;???
13 14 16 17 3 13.38880 0.00000 -13.38880 0.00000 0.00000 0.00000 ; CT
CW NA NB 3 13.38880 0.00000 -13.38880
0.00000 0.00000 0.00000 ; (From wildcard)
13 14 16 25 3 13.38880 0.00000 -13.38880 0.00000 0.00000 0.00000 ; CT
CW NA NB 3 13.38880 0.00000 -13.38880
0.00000 0.00000 0.00000 ; (From wildcard)
15 14 16 17 3 13.38880 0.00000 -13.38880 0.00000 0.00000 0.00000 ; H
NA CR X 3 13.38880 0.00000 -13.38880
0.00000 0.00000 0.00000 ;
15 14 16 25 3 13.38880 0.00000 -13.38880 0.00000 0.00000 0.00000 ; H
NA CR X 3 13.38880 0.00000 -13.38880
0.00000 0.00000 0.00000 ;
;13 14 16 17 3 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 ; N N
C C ; CT CT NC NZ 3 0.00000 0.00
000 0.00000 0.00000 0.00000 0.00000 ; azides; seria o CA CB CG CD1 da PHE
;13 14 16 25 3 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 ; N N
C C ; CT CT NC NZ 3 0.00000 0.00
000 0.00000 0.00000 0.00000 0.00000 ; azides; seria o CA CB CG CD2 da PHE
;15 14 16 17 3 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 ; H N
C C ; CT CT_2 N H 3 0.00000 0.000
00 0.00000 0.00000 0.00000 0.00000 ; peptides H-N-CA-R ; seria o HB1 CB CG CD1
da PHE
;15 14 16 25 3 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 ; H N
C C ; CT CT_2 N H 3 0.00000 0.000
00 0.00000 0.00000 0.00000 0.00000 ; peptides H-N-CA-R ; seria o HB1 CB CG CD2
da PHE
14 16 17 18 3 ; CB CG CD1 HD1 anel PHE
14 16 17 19 3 ; CB CG CD1 CE1 anel PHE
25 16 17 18 3 ;CD2 CG CD1 HD1 anel PHE
25 16 17 19 3 ;CD2 CG CD1 CE1 anel PHE
;saindo do ciclo central para o Residuo 3
; 6 29 31 32 3 -0.76567 2.70705 4.02501 -5.96639 0.00000 0.00000 ; CG
CB CA N ; CX CT CT_2 N 3 -0.7
6567 2.70705 4.02501 -5.96639 0.00000 0.00000 ; Chi-1 peptides ; CG CB CA N
6 29 31 32 3 13.38880 0.00000 -13.38880 0.00000 0.00000 0.00000 ; (From
wildcard) ; CT CW NA NB 3 13.38880
0.00000 -13.38880 0.00000 0.00000 0.00000 ; (From wildcard)
;30 29 31 32 3 20.50160 0.00000 -20.50160 0.00000 0.00000 0.00000 ;C
C N H 3 20.50160 0.00000 -20.50160
0.00000 0.00000 0.00000 ; dicarbonyls BMC 8,1881(2000) ; HB1 ; HB1 CB CA N
30 29 31 32 3 13.38880 0.00000 -13.38880 0.00000 0.00000 0.00000 ; (From
wildcard)
29 31 32 33 3 ; N CA CB HB1 ;???
29 31 32 34 3 ; N CA CB CG ;???
31 32 34 35 3 13.38880 0.00000 -13.38880 0.00000 0.00000 0.00000 ; CT
CW NA NB 3 13.38880 0.00000 -13.38880
0.00000 0.00000 0.00000 ; (From wildcard)
31 32 34 43 3 13.38880 0.00000 -13.38880 0.00000 0.00000 0.00000 ; CT
CW NA NB 3 13.38880 0.00000 -13.38880
0.00000 0.00000 0.00000 ; (From wildcard)
33 32 34 35 3 13.38880 0.00000 -13.38880 0.00000 0.00000 0.00000 ; H
NA CR X 3 13.38880 0.00000 -13.38880
0.00000 0.00000 0.00000 ;
33 32 34 43 3 13.38880 0.00000 -13.38880 0.00000 0.00000 0.00000 ; H
NA CR X 3 13.38880 0.00000 -13.38880
0.00000 0.00000 0.00000 ;
;31 32 34 35 3 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 ; N N
C C ; CT CT NC NZ 3 0.00000 0.00
000 0.00000 0.00000 0.00000 0.00000 ; azides; seria o CA CB CG CD1 da PHE
; CA CB CG CD1 PHE
;31 32 34 43 3 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 ; N N
C C ; CT CT NC NZ 3 0.00000 0.00
000 0.00000 0.00000 0.00000 0.00000 ; azides; seria o CA CB CG CD2 da PHE
; CA CB CG CD2 PHE
;33 32 34 35 3 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 ; H N
C C ; CT CT_2 N H 3 0.00000 0.000
00 0.00000 0.00000 0.00000 0.00000 ; peptides H-N-CA-R ; seria o HB1 CB CG CD1
da PHE ;HB1 CB CG CD1 PHE
;33 32 34 43 3 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 ; H N
C C ; CT CT_2 N H 3 0.00000 0.000
00 0.00000 0.00000 0.00000 0.00000 ; peptides H-N-CA-R ; seria o HB1 CB CG CD2
da PHE ;HB1 CB CG CD2 PHE
32 34 35 36 3 ; CB CG CD1 HD1 anel PHE
32 34 35 37 3 ; CB CG CD1 CE1 anel PHE
43 34 35 36 3 ;CD2 CG CD1 HD1 anel PHE
43 34 35 37 3 ;CD2 CG CD1 CE1 anel PHE
16 25 26 27 3 8.78640 0.00000 -8.78640 0.00000 0.00000 0.00000 ; CA
CA C O 3 8.78640 0.00000 -8.786
40 0.00000 0.00000 0.00000 ; aryl acid, amide, ester;CG CD2 CW OA
16 25 26 28 3 8.78640 0.00000 -8.78640 0.00000 0.00000 0.00000 ; CA
CA C O 3 8.78640 0.00000 -8.786
40 0.00000 0.00000 0.00000 ; aryl acid, amide, ester; ;CG CD2 CW OB
23 25 26 27 3 8.78640 0.00000 -8.78640 0.00000 0.00000 0.00000 ; CA
CA C O 3 8.78640 0.00000 -8.786
40 0.00000 0.00000 0.00000 ; aryl acid, amide, ester; ;CE2 CD2 CW OA
23 25 26 28 3 8.78640 0.00000 -8.78640 0.00000 0.00000 0.00000 ; CA
CA C O 3 8.78640 0.00000 -8.786
40 0.00000 0.00000 0.00000 ; aryl acid, amide, ester; ;CE2 CD2 CW OB
34 43 44 45 3 8.78640 0.00000 -8.78640 0.00000 0.00000 0.00000 ; CA
CA C O 3 8.78640 0.00000 -8.786
40 0.00000 0.00000 0.00000 ; aryl acid, amide, ester; ;CG CD2 CW OA
34 43 44 46 3 8.78640 0.00000 -8.78640 0.00000 0.00000 0.00000 ; CA
CA C O 3 8.78640 0.00000 -8.786
40 0.00000 0.00000 0.00000 ; aryl acid, amide, ester; ;CG CD2 CW OB
41 43 44 45 3 8.78640 0.00000 -8.78640 0.00000 0.00000 0.00000 ; CA
CA C O 3 8.78640 0.00000 -8.786
40 0.00000 0.00000 0.00000 ; aryl acid, amide, ester; ;CE2 CD2 CW OA
41 43 44 46 3 8.78640 0.00000 -8.78640 0.00000 0.00000 0.00000 ; CA
CA C O 3 8.78640 0.00000 -8.786
40 0.00000 0.00000 0.00000 ; aryl acid, amide, ester; ;CE2 CD2 CW OB
[dihedrals]
;ciclo central
11 1 9 2 1 improper_Z_CA_X_Y ;CB CG CD2 CD1
1 4 2 3 1 improper_Z_CA_X_Y ;CG CE1 CD1 HD1
1 7 9 10 1 improper_Z_CA_X_Y ;CG CE2 CD2 HD2 (CW)
2 6 4 5 1 improper_Z_CA_X_Y ;CD1 CZ CE1 HE1
9 6 7 8 1 improper_Z_CA_X_Y ;CD2 CZ CE2 HE2
4 7 6 29 1 improper_Z_CA_X_Y ;CE1 CE2 CZ HZ
;29 6 4 7 1 improper_Z_CA_X_Y ;CB CG CD2 CD1 igual ao de cima
;ciclo direito
14 16 25 17 1 improper_Z_CA_X_Y ;CB CG CD2 CD1
16 19 17 18 1 improper_Z_CA_X_Y ;CG CE1 CD1 HD1
16 23 25 26 1 improper_Z_CA_X_Y ;CG CE2 CD2 HD2 (CW)
17 21 19 20 1 improper_Z_CA_X_Y ;CD1 CZ CE1 HE1
25 21 23 24 1 improper_Z_CA_X_Y ;CD2 CZ CE2 HE2
19 23 21 22 1 improper_Z_CA_X_Y ;CE1 CE2 CZ HZ
;ciclo esquerdo
32 34 43 35 1 improper_Z_CA_X_Y ;CB CG CD2 CD1
34 37 35 36 1 improper_Z_CA_X_Y ;CG CE1 CD1 HD1
34 41 43 44 1 improper_Z_CA_X_Y ;CG CE2 CD2 HD2 (CW)
35 39 37 38 1 improper_Z_CA_X_Y ;CD1 CZ CE1 HE1
43 39 41 42 1 improper_Z_CA_X_Y ;CD2 CZ CE2 HE2
37 41 39 40 1 improper_Z_CA_X_Y ;CE1 CE2 CZ HZ
;carbonyl
25 27 26 28 1 improper_O_C_X_Y ;C O C O
43 46 44 45 1 improper_O_C_X_Y ;C O C O
;H dos NH
13 16 14 15 1 improper_Z_N_X_Y ;N C N H
31 34 32 33 1 improper_Z_N_X_Y ;N C N H
;Ligacao dupla
1 13 11 12 1 improper_Z_N_X_Y ;CG N CB H
9 31 29 30 1 improper_Z_N_X_Y ;CG N CB H
Livros Grátis
( http://www.livrosgratis.com.br )
Milhares de Livros para Download:
Baixar livros de Administração
Baixar livros de Agronomia
Baixar livros de Arquitetura
Baixar livros de Artes
Baixar livros de Astronomia
Baixar livros de Biologia Geral
Baixar livros de Ciência da Computação
Baixar livros de Ciência da Informação
Baixar livros de Ciência Política
Baixar livros de Ciências da Saúde
Baixar livros de Comunicação
Baixar livros do Conselho Nacional de Educação - CNE
Baixar livros de Defesa civil
Baixar livros de Direito
Baixar livros de Direitos humanos
Baixar livros de Economia
Baixar livros de Economia Doméstica
Baixar livros de Educação
Baixar livros de Educação - Trânsito
Baixar livros de Educação Física
Baixar livros de Engenharia Aeroespacial
Baixar livros de Farmácia
Baixar livros de Filosofia
Baixar livros de Física
Baixar livros de Geociências
Baixar livros de Geografia
Baixar livros de História
Baixar livros de Línguas
Baixar livros de Literatura
Baixar livros de Literatura de Cordel
Baixar livros de Literatura Infantil
Baixar livros de Matemática
Baixar livros de Medicina
Baixar livros de Medicina Veterinária
Baixar livros de Meio Ambiente
Baixar livros de Meteorologia
Baixar Monografias e TCC
Baixar livros Multidisciplinar
Baixar livros de Música
Baixar livros de Psicologia
Baixar livros de Química
Baixar livros de Saúde Coletiva
Baixar livros de Serviço Social
Baixar livros de Sociologia
Baixar livros de Teologia
Baixar livros de Trabalho
Baixar livros de Turismo