Download PDF
ads:
UNIVERSIDADE FEDERAL DE SERGIPE
P
-REITORIA DE PÓS-GRADUAÇÃO E PESQUISA
N
ÚCLEO DE PÓS-GRADUAÇÃO EM QUÍMICA
MARCELO LEITE DOS SANTOS
ESTUDOS TEÓRICOS DA ATIVIDADE E SELETIVIDADE
DE DROGAS INIBIDORAS DA ENZIMA DIIDROFOLATO
REDUTASE
São Cristóvão
Sergipe – Brasil
2006
ads:
Livros Grátis
http://www.livrosgratis.com.br
Milhares de livros grátis para download.
ESTUDOS TEÓRICOS DA ATIVIDADE E SELETIVIDADE
DE DROGAS INIBIDORAS DA ENZIMA DIIDROFOLATO
REDUTASE
MARCELO LEITE DOS SANTOS
Dissertação apresentada ao Núcleo de
Pós-Graduação em Química da
Universidade Federal de Sergipe
como um dos requisitos para a
obtenção do título de Mestre em
Química.
Orientador: Prof. Dr. Nivan Bezerra da Costa Júnior
São Cristóvão
2006
ads:
Santos, Marcelo Leite dos
S237e Estudos teóricos da atividade e seletividade de drogas inibidoras
da enzima diidrofolato redutase / Marcelo Leite dos Santos. – São
Cristóvão, 2006.
xxxf.
Dissertação (Mestrado) – Núcleo de Pós-Graduação em Química,
Pró-Reitoria de Pós-Graduação e Pesquisa, Universidade Federal de
Sergipe, 2006.
Orientador: Prof. Dr. Nivan Bezerra da Costa Júnior.
1. Química. 2. Farmacos. 3. Antifolatos. 4. DHFR. 5. QSAR.
I. Título.
CDU 54:615
i
Dedico este trabalho a todos que direta ou indiretamente contribuíram
para minha formação, especialmente a professora Ledjane Silva Barreto
que me iniciou na carreira científica e, felizmente, é o melhor exemplo de
profissionalismo, ética e competência que um jovem pesquisador pode
seguir.
ii
AGRADECIMENTOS
A minha esposa, Jacqueline Carvalho Peixoto dos Santos, que me ampara nas
horas difíceis e me alegra com seu sorriso;
Ao meu pai, José Bispo dos Santos, e a minha mãe, Magna Almeida Leite dos
Santos, foi com o esforço e carinho de vocês que cheguei até aqui;
Aos meus irmãos, Márcio Leite dos Santos e Márcia Leite dos Santos, irmãos
não só no sangue, mas também na alma;
Aos meus novos pais, José Veríssimo Peixoto e Genilde Carvalho Peixoto, e
novos irmãos, Vinícius Carvalho Peixoto e Tiago Carvalho Peixoto, é muito
bom tê-los como família;
Minha avó materna, Maria Almeida Leite (Dona Nina), você é a raiz mais
profunda da árvore familiar em que brotei;
Aos tios, tias, primos, primas e demais familiares, vocês são peças
fundamentais na engrenagem de minha vida;
Aos colegas de trabalho e alunos da UFS e do CEMB, é bom poder
reconhecê-los como amigos;
Aos amigos de cada dia, especialmente, Jeremias, Porfírio, Xavier, Linda,
Cris, Danilo, Elias, Iata, Danika, Fernandes, Luciano e outros que esqueci no
momento, mas que guardo no coração. Obrigado pela paciência, compreensão
e momentos de algazarra;
Aos meus professores, especialmente, a professora Ledjane, ao professor
Nivan, a professora Djalma e ao professor Luis Eduardo, vocês não são
somente meus professores, são também grandes amigos;
A professora Ana Eleonora do departamento de Engenharia Química da UFS
pela concessão da utilização do programa STATISTICA 6.0.
iii
CURRICULUM VITAE
1. Dados Pessoais
Nome: Marcelo Leite dos Santos
Nome em citações bibliográficas: Santos, M.L.
Naturalidade: Itabaiana-SE Data de Nascimento: 22/03/1981
2. Formação Acadêmica/Titulação:
Nível Superior
Curso: Química Licenciatura, Universidade Federal de Sergipe, UFS.
Ano de Conclusão: 2004
Pós-graduação
Mestrado: Química, Universidade Federal de Sergipe, UFS. Em andamento
3. Atividades Desenvolvidas no Curso de Mestrado
3.1. Atuação Profissional:
1. Colégio Estadual Murilo Braga – CEMB. Professor titular de química. Carga
horária semanal: 25 h. Servidor Público.
2. Universidade Federal de Sergipe – UFS. Professor substituto de físico-
química. Regime de 20 h semanais. Professor contratado. Disciplinas
ministradas: Química, Química Experimental, Química Básica, Química
Geral, Química Inorgânica e Físico-química II.
iv
3.2. Trabalho em Evento (Resumo):
1. SANTOS, Marcelo Leite dos; PORFÍRIO, Leandro Oliveira; ALMEIDA,
Luis Eduardo; BARRETO, Ledjane Silva; COSTA JR, Nivan Bezerra da.
Modelos para a descrição dos índices de atividade e seletividade de
inibidores da enzima diidrofolato redutase (DHFR): um estudo teórico.
In: 28ª REUNIÃO ANUAL DA SOCIEDADE BRASILEIRA DE
QUÍMICA, 2005, Poços de Caldas. Livro de resumos da 28ª Reunião
Anual da Sociedade Brasileira de Química. 2005.
3.3. Trabalhos em Eventos (Resumos submetidos):
1. SANTOS, M.L. dos; PORFÍRIO, L.O.; ALMEIDA, L.E.; BARRETO, L.S.;
COSTA JR, N.B. da. Efeito do Diedro na Construção de Modelos de
Seletividade e Atividade na Inibição da Enzima DHFR do Toxoplasma
gondii: Um Estudo Teórico. In: 29ª REUNIÃO ANUAL DA SBQ, 2006,
Águas de Lindóia, São Paulo.
2. SANTOS, M.L. dos; PORFÍRIO, L.O.; ALMEIDA, L.E.; BARRETO, L.S.;
COSTA JR, N.B. da. Relações quantitativas entre estrutura e atividade de
drogas homólogas a trimetoprima inibidoras da enzima diidrofolato
redutase. In: 29ª REUNIÃO ANUAL DA SBQ, 2006, Águas de Lindóia,
São Paulo.
3. SANTOS, M.L. dos; PORFÍRIO, L.O.; ALMEIDA, L.E.; BARRETO, L.S.;
COSTA JR, N.B. da. Estudos de QSAR da inibição enzimática da
diidrofolato redutase baseadas em drogas homólogas ao trimetrexato. In:
29ª REUNIÃO ANUAL DA SBQ, 2006, Águas de Lindóia, São Paulo.
4. SANTOS, M.L. dos; PORFÍRIO, L.O.; ALMEIDA, L.E.; BARRETO, L.S.;
COSTA JR, N.B. da. Modelagem molecular, docking de ligantes e estudos
teóricos do mecanismo de catálise enzimática da diidrofolato redutase.
In: 29ª REUNIÃO ANUAL DA SBQ, 2006, Águas de Lindóia, São Paulo.
3.4. Outros trabalhos relevantes:
1. SANTOS, Marcelo Leite dos. Modelagem Molecular no Planejamento de
Drogas. Escola de Verão de Iniciação Científica. UFS. 2005. (Curso
ministrado).
v
ÍNDICE
LISTA DE FIGURAS ................................................................................................
LISTA DE TABELAS ..............................................................................................
LISTA DE ABREVIATURAS OU SIGLAS .........................................................
LISTA DE SÍMBOLOS ............................................................................................
CURRICULUM VITAE ..........................................................................................
RESUMO .................................................................................................................
ABSTRACT .............................................................................................................
Capítulo 1 - Introdução ............................................................................................
1.1. A enzima diidrofolato redutase e seus inibidores
1.1.1. Mecanismo de ação dos inibidores
1.1.2. Principais inibidores da síntese de folato
1.2. Modelagem molecular no desenvolvimento de drogas
1.2.1. Modelagem de proteínas
1.2.2. Efeito da solvatação na modelagem de proteínas
1.2.3. Docking molecular
i) Modelagem das interações ligante-receptor
1.2.4. Estudos teóricos dos mecanismos de reações enzimáticas
1.3. Métodos teóricos aplicados na modelagem molecular
1.3.1. Método da mecânica molecular
1.3.2. Método da mecânica quântica
i) Métodos ab initio
ii) Métodos semi-empíricos
iii) Métodos de Solvatação
1.4. Relações quantitativas entre estrutura e atividade
vi
1.4.1. Histórico e desenvolvimento de QSAR
1.4.2. Descritores empregados nos estudos de QSAR
i) Coeficiente de partição octanol-água
ii) Índices de conectividade e topológicos
iii) Área da superfície acessível ao solvente; área e volume de
superfície de van der Waals
iv) Energias dos orbitais moleculares, potencial de ionização e
afinidade eletrônica
v) Densidade dos orbitais de fronteira
vi) Superdelocalizabilidades e cargas atômicas
vii) Momento de dipolo
viii) Descritores de ligações de hidrogênio
1.4.3. Problemas e aplicação das equações de QSAR
1.4.4. Estudos de QSAR baseados na inibição da DHFR
1.5. Regressões lineares múltiplas e procedimento estatístico
1.5.1. Avaliação dos modelos lineares
i) Avaliação do grau de ajuste
ii) Avaliação do grau de significância
iii) Avaliação do grau de previsibilidade
Capítulo 2 - Objetivos .............................................................................................
2.1. Objetivo Geral ........................................................................................
2.2. Objetivos Específicos .............................................................................
Capítulo 3 - Parte Experimental ............................................................................
3.1. Classificação das drogas derivadas do TMP e TMQ
3.2. Modelagem computacional das estruturas
3.3. Alinhamento da seqüência das proteínas
3.4. Docking por superposição
3.5. Cálculos dos descritores moleculares
3.6. Regressões e modelos de QSAR
3.7. Proposição do conjunto de novas estruturas
3.8. Estudos do mecanismo da reação enzimática
Capítulo 4 - Resultados e Discussões .....................................................................
4.1. Estruturas das drogas e das enzimas modeladas
vii
4.2. Estudos de docking
4.3. Modelos de QSAR obtidos através das regressões
4.3.1. Modelos de atividade e seletividade para a série do TMP
i) Previsão do modelo para a atividade contra a enzima do
Pneumocystis carinii
ii) Previsão do modelo para a atividade contra a enzima do
Toxoplasma gondii
iii) Previsão do modelo para a atividade contra a enzima do
Mycobacterium avium
iv) Previsão do modelo para a atividade contra a enzima do
fígado de rato
v) Previsão do modelo para a seletividade contra a enzima do
Pneumocystis carinii
vi) Previsão do modelo para a seletividade contra a enzima do
Toxoplasma gondii
vii) Previsão do modelo para a seletividade contra a enzima do
Mycobacterium avium
4.3.2. Modelos de atividade e seletividade para a série do TMQ
i) Previsão do modelo para a atividade contra a enzima do
Pneumocystis carinii
ii) Previsão do modelo para a atividade contra a enzima do
Toxoplasma gondii
iii) Previsão do modelo para a atividade contra a enzima do
fígado de Rato
iv) Previsão do modelo para a seletividade contra a enzima do
Pneumocystis carinii
v) Previsão do modelo para a seletividade contra a enzima do
Toxoplasma gondii
4.4. Estruturas das novas drogas propostas
4.5. Estudos teóricos do mecanismo da reação enzimática
Capítulo 5 - Conclusões ..........................................................................................
Capítulo 6 - Perspectivas Futuras .........................................................................
Referências Bibliográficas .................................................................
viii
LISTA DE FIGURAS
Figura 01. Estrutura do ácido fólico.
Figura 02. Esquema da redução do folato a diidrofolato e a tetraidrofolato pela
enzima DHFR.
Figura 03. Esquema da síntese do 2-desoxitimidilato.
Figura 04. Estruturas da sulfanilamida e sulfadiazina.
Figura 05. Esquema da ação das sulfonamidas e da trimetoprima sobre a síntese
bacteriana de folato.
Figura 06. Estruturas da trimetoprima e pirimetamina.
Figura 07. Estrutura do metotrexato.
Figura 08. Estruturas da piritrexina e trimetrexato.
Figura 09. Cavidade do sítio ativo da enzima TB-PNP complexada com um análogo
da ImmH.
Figura 10. Sítio ativo da RNase T
1
e o substrato 3GMP.
Figura 11. Estrutura do PNP030 sobreposto na estrutura da ImmH dentro da
cavidade do sítio ativo da enzima TB-PNP.
Figura 12. Estruturas dos complexos ternários formados por um antifolato, NADPH
e DHFR do Pc ou humana.
Figura 13. Redução do folato a 7,8-diidrofolato e 5,6,7,8-tetraidrofolato.
Figura 14. Algumas situações encontradas na investigação qualitativa da falta de
ajuste.
Figura 15. Representação da estrutura do TMP, PTX e híbridos estruturais.
Figura 16. Estrutura base dos derivados do trimetrexato.
Figura 17. Modelos balls-and-sticks das estruturas do TMP, PTX e TMQ após a
otimização da geometria.
ix
Figura 18. Modelos das estruturas da DHFR do P. carinii e Humana.
Figura 19. Resíduos de aminoácidos selecionados ao redor dos substratos TMP e
CO4. Figura 20. Seqüências das enzimas humana e do Pc alinhadas.
Figura 21. Mapas das superfícies das proteínas DHFR humana e do Pc.
Figura 22. Comparação da região de fixação na superfície da DHFR do Pc com os
resíduos de aminoácidos do sítio ativo.
Figura 23. Superfícies das cavidades do sítio ativo da DHFR do Pc e do Hs, dos
complexos de inclusão com o TMP, PTX e TMQ.
Figura 24. Estruturas do TMP, PTX e TMQ acomodadas dentro da cavidade do sítio
ativo da DHFR do Pc e do Hs.
Figura 25. Ligações de hidrogênio formadas entre as drogas TMP, PTX, TMQ e os
resíduos de aminoácidos e moléculas de água conservadas no sítio ativo da DHFR do
Pc e humana.
Figura 26. Valores de lnIC
50
previstos contra os observados para o Pc.
Figura 27. Resíduos do modelo de regressão para a atividade contra o Pc.
Figura 28. Valores de lnIC
50
previstos contra os observados para o Tg.
Figura 29. Resíduos do modelo de regressão para a atividade contra o Tg.
Figura 30. Valores de lnIC50 previstos contra os observados para o Ma.
Figura 31. Resíduos do modelo de regressão para a atividade contra o Ma.
Figura 32. Valores de lnIC50 previstos contra os observados para o fígado de rato.
Figura 33. Resíduos do modelo de regressão para a atividade contra o fígado de rato.
Figura 34. Valores de lnSI previstos contra os observados para o Pc.
Figura 35. Resíduos do modelo de regressão para a seletividade contra o Pc.
Figura 36. Valores de lnSI previstos contra os observados para o Tg.
Figura 37. Resíduos do modelo de regressão para a seletividade contra o Tg.
Figura 38. Valores de lnSI previstos contra os observados para o Ma.
Figura 39. Resíduos do modelo de regressão para a seletividade contra o Ma.
Figura 40. Atividades (lnIC
50
) previstas contra as observadas para o Pc.
Figura 41. Gráfico dos resíduos da regressão para a atividade contra o Pc.
Figura 42. Atividades (lnIC
50
) previstas contra as observadas para o Tg.
Figura 43. Gráfico dos resíduos do modelo de regressão para a atividade contra o
Tg.
Figura 44. Atividades (lnIC50) previstas contra as observadas para o Rl.
x
Figura 45. Gráfico dos resíduos do modelo de regressão para a atividade contra o Rl.
Figura 46. Seletividades (lnSI) previstas contra as observadas para o Pc.
Figura 47. Gráfico dos resíduos do modelo de regressão para a seletividade contra o
Pc.
Figura 48. Seletividades (lnSI) previstas contra as observadas para o Tg.
Figura 49. Gráfico dos resíduos do modelo de regressão para a seletividade contra o
Tg.
Figura 50. Sugestões de locais para modificações estruturais nos compostos base
TMP e TMQ.
Figura 51. Modelo da estrutura do mlp
59
após a otimização de sua geometria.
Figura 52. Cavidade do sítio ativo da DHFR do Pc complexada com o mlp
59
.
Figura 53. Ligações de hidrogênio estabelecidas entre a mlp
59
e os resíduos de
aminoácidos e moléculas de água do sítio ativo da DHFR do Pc.
Figura 54. Localização dos orbitais de fronteira (HOMO-10 até LUMO+9) do
complexo proteico formado pela DHFR do Hs, NADPH e folato.
Figura 55. Localização dos orbitais de fronteira (HOMO-10 até LUMO+9) nos
resíduos de aminoácidos do sítio ativo da DHFR do Hs.
Figura 56. Estrutura do folato e átomos de nitrogênio que correspondem aos sítios
de protonação no mecanismo da reação.
Figura 57. Localização dos orbitais de fronteira para o sistema proteico sem
considerar a protonação do folato.
Figura 58. HOMO-2 e LUMO+6 localizados em posições estratégicas para a
transferência do íon hidreto do NADPH para o folato.
Figura 59. HOMO-1 e LUMO localizados em posições estratégicas para a
transferência do íon hidreto do NADPH para o diidrofolato.
xi
LISTA DE TABELAS
Tabela 01. Códigos de uma e três letras usados para representar os resíduos dos
aminoácidos
Tabela 02. Conjunto de dados, contendo n objetos e m propriedades descritivas
Tabela 03. Análise da variância (ANOVA) do modelo de regressão linear múltipla
Tabela 04. Atividade e seletividade da série homóloga ao TMP e PTX
Tabela 05. Atividade e seletividade da série homóloga ao TMQ
Tabela 06. Descritores calculados para a elaboração dos modelos de QSAR
Tabela 07. Análise da variância (ANOVA) para o modelo de atividade contra o Pc
Tabela 08. Matriz de correlação das variáveis do modelo de atividade contra o Pc
Tabela 09. Análise da variância (ANOVA) para o modelo de atividade contra o Tg
Tabela 10. Matriz de correlação das variáveis do modelo de atividade contra o Tg
Tabela 11. Análise da variância (ANOVA) para o modelo de atividade contra o Ma
Tabela 12. Matriz de correlação das variáveis do modelo de atividade contra o Ma
Tabela 13. Análise da variância (ANOVA) para o modelo de atividade contra o Rl
Tabela 14. Matriz de correlação das variáveis do modelo de atividade contra o
fígado de rato
Tabela 15. Análise da variância (ANOVA) para o modelo de seletividade contra o
Pc
Tabela 16. Matriz de correlação das variáveis do modelo de seletividade contra o Pc
Tabela 17. Análise da variância (ANOVA) para o modelo de seletividade contra o
Tg
Tabela 18. Matriz de correlação das variáveis do modelo de seletividade contra o Tg
Tabela 19. Análise da variância (ANOVA) para o modelo de seletividade contra o
Ma
xii
Tabela 20. Matriz de correlação das variáveis do modelo de seletividade contra o Ma
Tabela 21. Erros para as previsões de atividade e seletividade das drogas do grupo
de teste dos derivados do TMP
Tabela 22. Análise da variância (ANOVA) para o modelo de atividade contra o Pc
Tabela 23. Matriz de correlação para as variáveis do modelo de atividade contra o
Pc
Tabela 24. Análise da variância (ANOVA) para o modelo de atividade contra o Tg
Tabela 25. Matriz de correlação para as variáveis do modelo de atividade contra o
Tg
Tabela 26. Análise da variância (ANOVA) para o modelo de atividade contra o Rl
Tabela 27. Matriz de correlação para as variáveis do modelo de atividade contra o Rl
Tabela 28. Análise da variância (ANOVA) para o modelo de seletividade contra o
Pc
Tabela 29. Matriz de correlação para as variáveis do modelo de seletividade contra o
Pc
Tabela 30. Análise da variância (ANOVA) para o modelo de seletividade contra o
Tg
Tabela 31. Matriz de correlação para as variáveis do modelo de seletividade contra o
Tg
Tabela 32. Erros para as previsões de atividade e seletividade das drogas do grupo
de teste dos derivados do TMQ
Tabela 33. Atividades e seletividades previstas para as melhores estruturas propostas
derivadas do TMP e TMQ
xiii
LISTA DE ABREVIATURAS OU SIGLAS
AIDS Síndrome da imunodeficiência adquirida
DHFR Diidrofolato redutase
Pc Pneumocystis carinii
Tg Toxoplasma gondii
Ma Mycobacterium avium
Rl Fígado de rato (Rat liver)
DNA Ácido desoxirribonucléico
NADPH Nicotinamida adenina dinucleotídeo fosfato na forma reduzida
DUMP Monofosfato de desoxiuridilato
DTMP Monofosfato de desoxitimidilato
TS Timidilato sintetase
PABA Ácido p-aminobenzóico
TMP Trimetoprima
MTX Metotrexato
PTX Piritrexina
TMQ Trimetrexato
TB-PNP Purina nucleotídeo fosforilase do Mycobacterium tuberculosis
ImmH Immucillina-H
HOMO Orbital molecular de mais alta energia ocupado
LUMO Orbital molecular de mais baixa energia vazio
RNase T
1
Enzima ribonuclease T
1
3GMP 3-Guanosina 5-monofosfato
CAChe CAChe WorkSytem Pro Versão 6.01
PDB Protein data bank
PNP030 Derivado da 9-deazaguanina
xiv
MC Método de monte carlo
CoMFA Análise de campo molecular comparativa
FMO Teoria dos orbitais moleculares de fronteira
Ec Escherichia coli
MM Mecânica molecular
EE Energia estérica
MM3 Campo de força utilizado em mecânica molecular
SEP Superfície de energia potencial
SCF Método do campo autoconsistente
CI Interação de configuração
SCF MO Método do campo autoconsistente dentro do contexto da teoria do
orbital molecular
MNDO Modified neglect of diatomic overlap
AM1 Austin model 1
PM3 Parametric model 3
DFT Teoria do funcional de densidade
COSMO Conductor-like screening model
QSAR Relações quantitativas entre estrutura e atividade
2D Duas dimensões
3D Três dimensões
QSAR 4D Relações quantitativas entre estrutura e atividade em quatro dimensões
QSAR 5D Relações quantitativas entre estrutura e atividade em cinco dimensões
G Gráfico molecular
EC Conectividade estendida
k
EC(G) Conectividade estendida de k-ésima ordem
SASA Área de superfície acessível ao solvente
IP Potencial de ionização
EA Afinidade eletrônica
RML Regressão linear múltipla
MMQ Método dos mínimos quadrados
ANOVA Análise da variância
SS Soma dos quadrados
SS
Tot
Soma dos quadrados total
xv
SS
Reg
Soma dos quadrados da regressão
SS
Res
Soma dos quadrados dos resíduos
MS Média da soma dos quadrados
Hs Homo sapiens
NADP
+
Nicotinamida adenina dinucleotídeo fosfato na forma oxidada
AS Área de superfície
VS Volume de superfície
xvi
LISTA DE SÍMBOLOS
FH
4
Tetraidrofolato
FH
2
Diidrofolato
M Matriz do alinhamento seqüencial
M
ij
Par de aminoácidos da matriz do alinhamento seqüencial
W Moléculas de água
Ψ Função de onda
H Operador Hamiltoniano
E Energia
F Teste F
IC
50
Concentração mínima inibitória de 50% da atividade fisiológica
LD
100
Dose letal capaz de matar 100% dos indivíduos
ED
50
Dose capaz de produzir 50% de seu efeito máximo
P Coeficiente de partição octanol-água
LogP Logaritmo do coeficiente de partição octanol-água
M1 Primeiro índice de grupo de Zagreb
M2 Segundo índice de grupo de Zagreb
χ Conectividade molecular
χ
v
Conectividade de valência
Z
i
Número atômico do átomo i
v
i
Z
Número de elétrons de valência do átomo i
1
κ Índice de forma de primeira ordem
2
κ Índice de forma de segunda ordem
3
κ Índice de forma de terceira ordem
E
r
f
Densidade eletrônica de fronteira eletrofílica
xvii
N
r
f
Densidade eletrônica de fronteira nucleofílica
H
OMO,n
C
Coeficientes dos orbitais atômicos no HOMO
X
n
Orbitais atômicos
LUMO,n
C
Coeficiente dos orbitais atômicos no LUMO
S
r
Superdelocalizabilidade
S
E,A
Superdelocalizabilidade eletrofílica
S
N,A
Superdelocalizabilidade nucleofílica
A
m
C
Coeficientes dos orbitais moleculares j
A Número de orbitais de valência
ε
j
Energia do orbital molecular j
Q Cargas atômicas parciais
µ Momento de dipolo molecular
E
Hb
Energias das ligações de hidrogênio
X
1
, X
2
,..., X
k
Variáveis independentes ou explicativas
Y Fenômeno observado
β
0,
Termo constante de ajuste
β
1
, β
2
,..., β
k
Coeficientes das variáveis independentes
ε Erro associado ao modelo
b
0
, b
1
,..., b
k
Estimativas para os valores das variáveis independentes
Ŷ
i
Valores previstos do fenômeno observado
i
Y Média dos valores do fenômeno observado
R Coeficiente de correlação
R
Ajust
Coeficiente de correlação ajustado
s Desvio padrão
e
i
i-ésimo resíduo
R
2
Coeficiente de determinação do modelo
df Graus de liberdade
σ
2
Variância do modelo de regressão
p Probabilidade
T Intervalo de confiança
t Teste de student
xviii
PRESS PREdictive Sum of Squares
Q
2
Coeficiente de correlação da validação cruzada
s
PRESS
Desvio padrão da validação cruzada
SI Índice de seletividade
µM Concentração em micromols por litro
1DYR Código PDB para a enzima DHFR do Pc
1PD9 Código PDB para a enzima DHFR do Hs
CO4 2,5-diamino-5-metil-6-[(3,4,5-trimetoxi-N-
metilanilina)metil]pirido[2,3-d]pirimidina
TOP Trimetoprima
f
H Calor de formação
ε
HOMO
Energia do HOMO
ε
LUMO
Energia do LUMO
η Dureza molecular
χ
M
Eletronegatividade molecular
ρ
HOMO
Densidade do HOMO
ρ
LUMO
Densidade do LUMO
f
r
R
Densidade eletrônica de fronteira radicalar
S
R,A
Superdelocalizabilidade radicalar
lnIC
50
Logaritmo natural do índice de atividade
lnSI Logaritmo natural do índice de seletividade
pH -log da concentração de hidrogênios
p
K
a
-log da constante ácida
xix
RESUMO
Doenças infecciosas causadas por parasitas oportunistas como Pneumocystis
carinii (Pc), Toxoplasma gondii (Tg) e Mycobacterium avium (Ma) estão entre as
principais causas de óbitos entre pacientes aidéticos. Por isso, atualmente, há um
grande interesse no desenvolvimento de novos inibidores da diidrofolato redutase
(DHFR), uma importante enzima alvo no tratamento destas patologias. As terapias
medicamentosas atuais apresentam intensa possibilidade de efeitos colaterais,
tornando necessário o desenvolvimento de drogas mais seletivas. Algumas propostas
encontradas na literatura são baseadas nos análogos do folato trimetoprima (TMP),
piritrexina (PTX) e trimetrexato (TMQ), com o objetivo de unir as características de
alta seletividade do TMP à alta potência do PTX e do TMQ. Estes estudos serviram-
nos de base para a elaboração de relações quantitativas entre estrutura e atividade
(QSAR) através dos valores de IC
50
e índices de seletividade (SI). Estas relações
foram estabelecidas através de regressões lineares múltiplas (RML) no programa
STATISTICA 6.0, utilizando um conjunto de 130 descritores atômicos e
moleculares, clássicos e quânticos, estes últimos foram obtidos através de métodos
semi-empíricos AM1, todos os descritores foram calculados no programa CAChe
Worksystem Pro Versão 6.01. Os modelos de QSAR aqui obtidos apresentaram
consideráveis significâncias estatísticas, destacando-se o modelo para a atividade
contra o Ma (R
2
= 0,9756 e F
8,13
= 64,9278) na série derivada do TMP e, o modelo
para a atividade contra o Tg (R
2
= 0,9446 e F
4,22
= 93,8288) na série homóloga ao
TMQ. Na seqüência, a partir da modelagem molecular e estudos de docking das
estruturas da DHFR humana e do Pc, fizemos a sugestão de novos inibidores mais
potentes e/ou seletivos. Nestes estudos avaliamos as diferenças existentes entre as
duas DHFR através de mapas da superfície das proteínas, das cavidades dos sítios
ativos e do alinhamento das seqüências de aminoácidos, verificando que os
xx
aminoácidos Ile123 na DHFR do Pc e Val115 na DHFR humana devem ser
responsáveis por ligações de hidrogênio diferenciais com as drogas que podem
proporcionar maior seletividade. Uma das novas drogas propostas, o mlp
59
,
apresentou uma elevada atividade (IC
50
= 0,0203µM) e seletividade (SI = 10,7970)
contra a DHFR do Pc. Por fim, avaliamos o mecanismo da reação de conversão do
folato a diidrofolato e a tetraidrofolato, através de cálculos semi-empíricos AM1 dos
orbitais de fronteira do complexo enzimático, utilizando o escalonamento linear
MOZYME e considerando o efeito de solvatação com o COSMO. Verificamos que a
influência do solvente é importante na localização dos orbitais de fronteira e que a
etapa de protonação precede a transferência do íon hidreto.
Palavras-chave: Antifolatos, DHFR, QSAR, modelagem molecular e docking.
xxi
ABSTRACT
Infectious diseases caused by opportunistic parasites as Pneumocystis carinii
(Pc), Toxoplasma gondii (Tg) and Mycobacterium avium (Ma), often found in
patients with AIDS, are the major cause of death in these patients. Therefore,
actually, there is a great interest in the development of new inhibitors of the
dihydrofolate reductase (DHFR), an important target enzymatic in the treatment of
these pathologies. The current therapies present intense possibility of side-effects,
turning necessary the development of more selective drugs. Some proposed found in
the literature are a set of analogous of the antifolates trimethoprim (TMP), piritrexim
(PTX) and trimetrexate (TMQ), with objective of conjugate the characteristics of
high selectivity of TMP and high potency of PTX and TMQ. These studies served us
as base for the elaboration of quantitative structure-activity relationships (QSAR)
through the values of IC
50
and selectivity index (SI). These relationships were
established through multiple linear regressions (RML) in the STATISTICA 6.0
program, using a group of 130 atomic and molecular, classical and quantum
descriptors, these last ones were obtained through AM1 semi-empiric methods, all
the descriptors was calculated in the CAChe Worksystem program Version 6.01. The
QSAR models here obtained presented considerable statistical significance, standing
out the model for the activity against Ma (R
2
= 0,9756 and F
8,13
= 64,9278) to derived
series of TMP and, the model for the activity against Tg (R
2
= 0,9446 and F
4,22
=
93,8288) in the homologous series to TMQ. In the sequence, starting from the
molecular modeling and docking studies of the structures of human and Pc DHFR,
we made the suggestion of new inhibitors more potent and selective. In these studies
we evaluated the differences among two DHFR through of the surface proteins maps,
cavities of the active sites and alignment of the sequences of amino acids, verifying
that the amino acids Ile123 in Pc DHFR and Val115 in human DHFR should be
xxii
responsible for hydrogen bonding differentiate with the drugs that can provide larger
selectivity. One of the new proposed drugs, the mlp
59
, presented a high activity (IC
50
= 0,0203 µM) and selectivity (SI = 10,7970) against DHFR of the Pc, appearing as a
potential molecule for the synthesis and experimental evaluation of the biological
activity. Finally, we evaluated the mechanism of the enzymatic reaction of
conversion of the folate to the dihydrofolate and the tetrahydrofolate, through AM1
semi-empiric calculations of the enzymatic complex frontier orbitals, using the
linear-scaling MOZYME and considering the solvent-effect with COSMO. We
verified that the influence of the solvent is important in the location of the frontier
orbitals and that the protonation stage precedes the transfer of the hydride ion.
Key-words: Antifolates, DHFR, QSAR, molecular modeling and docking.
INTRODUÇÃO
- 1 -
Capítulo 1
Introdução
1.1. A enzima diidrofolato redutase e seus inibidores
Apesar da revolução da saúde nas últimas três décadas ter produzido um
substancial ganho em termos de expectativa de vida e avanços sem precedentes na
medicina, doenças infecciosas, tais como doenças tropicais, ainda acarretam um
grande sofrimento à população dos países pobres e em desenvolvimento. Uma das
causas é a falta de pesquisa e desenvolvimento de medicamentos para o tratamento
de doenças que atingem os povos mais carentes [1]. Trata-se de uma simples questão
de economia: o retorno potencial sobre o investimento determina como as empresas
privadas decidem alocar seus recursos de pesquisa.
As populações dos paises em desenvolvimento que sofrem da síndrome da
imunodeficiência adquirida (AIDS) ficam praticamente as margens de todos os
progressos no tratamento devido aos poucos recursos disponíveis. Como resultado do
limitado acesso aos coquetéis de medicamentos, freqüentemente muito caros,
infecções causadas por diversos parasitas “oportunistas” que afligem pacientes
aidéticos são um problema de saúde pública global, com importantes implicações
políticas e sociais [2].
As doenças causadas por estes microorganismos figuram na primeira posição
de causas de óbitos em pacientes com AIDS, por isso, desde os anos 90, vem
aumentando o interesse no desenvolvimento de inibidores da diidrofolato redutase
(DHFR), um importante alvo no combate desses parasitos [3]. Dois grupos que tem
feito as maiores contribuições nessa área são o de Andre Rosowsky [4] e o de Aleem
Gangjee [5].
INTRODUÇÃO
- 1 -
Os microorganismos frequentemente estudados nestas pesquisas são fungos
como o Pneumocystis carinii (Pc) causador de pneumonia; protozoários como o
Toxoplasma gondii (Tg), responsável pela toxoplasmose, doença autolimitada e até
mesmo assintomática, que pode, porém, causar graves danos ao feto e a indivíduos
imunodeprimidos; e, algumas vezes, bactérias como Mycobacterium avium (Ma),
que pode causar infecções no sangue, hepatite, lesões na pele, pneumonia e muitas
outras doenças graves [3]. Além destes, também são avaliados os efeitos dos
inibidores frente à enzima dos mamíferos usando como modelo o fígado de rato (Rl).
1.1.1. Mecanismo de ação dos inibidores
O mecanismo de ação dessas drogas está relacionado à utilização do ácido
fólico (ácido pteroilglutâmico) pelo parasito. Este é constituído de um anel de
pteridina, ácido para-aminobenzóico e ácido glutâmico, figura 01.
Figura 01. Estrutura do ácido fólico.
Provavelmente não ocorre dessa forma na natureza, mas pode ser considerado
como o composto original de um grupo de folatos de ocorrência natural. Esses
compostos diferem do ácido fólico em diversos aspectos. Podem ocorrer em
diferentes estados de redução do anel pteridina, várias unidades de um carbono
podem ligar-se aos nitrogênios 5 ou 10, ou a ambos, e radicais adicionais de ácido
glutâmico podem ligar-se ao glutamato através de ligações γ-peptídicas incomuns,
produzindo poliglutamatos de folato.
Os folatos são essenciais para a síntese do ácido desoxirribonucléico (DNA),
visto que atuam como cofatores na síntese de purinas e pirimidinas. São também
NN
N
H
2
N
CH
2
NH C NH CH
COOH
(CH
2
)
2
COOH
N
O
Anel de pteridina
Ácido
p
-aminobenzóico
(PABA)
Ácido glutâmico
1
2
3
4
5
6
7
8
9
10
INTRODUÇÃO
- 2 -
necessários para reações envolvidas no metabolismo dos aminoácidos. Em todas as
reações, os poliglutamatos são consideravelmente mais ativos do que os
monoglutamatos. Para adquirir atividade, o folato deve encontrar-se na forma
tetraidro, na qual é mantido pela enzima diidrofolato redutase. Esta enzima reduz o
ácido fólico da dieta a tetraidrofolato (FH
4
) numa reação em duas etapas e também
reduz o diidrofolato (FH
2
) produzido a partir do FH
4
durante a síntese do timidilato.
A catálise ocorre usando o cofator enzimático nicotinamida adenina dinucleotídeo
fosfato (NADPH) como agente redutor [6]. Nesta reação um íon hidreto é
transferido diretamente do anel nicotinamida do NADPH para o anel pteridina do
diidrofolato, figura 02. Como as duas estruturas estão muito próximas, separadas
apenas por uma distância menor do que a de interações de van der Waals, este
contato promove a formação de um estado de transição para a transferência
eletrônica [6].
Figura 02. Esquema da redução do folato a diidrofolato e, em seguida, a
tetraidrofolato pela enzima DHFR. As regiões selecionadas indicam os sítios de
reação.
Os folatos são particularmente importantes na conversão do monofosfato de
desoxiuridilato (DUMP) em monofosfato de desoxitimidilato (DTMP). Esta
conversão é catalisada pela enzima timidilato sintetase (TS), o folato atua como
doador de um grupo metila. Durante essa reação, o FH
4
é oxidado a FH
2
, figura 03,
devendo ser reduzido para que possa novamente atuar. A reação da TS limita a
velocidade na síntese de DNA dos mamíferos.
INTRODUÇÃO
- 3 -
Figura 03. Esquema da síntese do 2-desoxitimidilato.
A síntese de folatos constitui um exemplo de via metabólica encontrada nas
bactérias, mas não no ser humano. O folato é necessário para a síntese de DNA tanto
nas bactérias quanto no ser humano. O ser humano obtém o ácido fólico a partir da
dieta e desenvolveu um mecanismo de transporte para a sua captação no interior das
células. Não precisa sintetizá-lo e, na verdade, não pode fazê-lo. Ao contrário, a
maioria das espécies de bactérias, bem como as formas assexuadas dos protozoários,
não desenvolveram os mecanismos de transporte necessários e não podem utilizar o
folato pré-formado. Necessariamente, devem sintetizar seu próprio folato.
1.1.2. Principais inibidores da síntese de folato
As sulfonamidas contêm o componente sulfanilamida – um análogo estrutural
do ácido p-aminobenzóico (PABA), que é essencial na síntese de folatos. As
sulfonamidas competem com o PABA pela enzima envolvida na síntese de folato, a
saber, a diidropteroato sintetase, e, portanto, inibem o metabolismo das bactérias. Em
geral, as sulfonamidas são utilizadas na forma de sais de sódio. Alguns exemplos de
sulfonamidas de uso clínico incluem: sulfadiazina, sulfametoxazol, sulfadimidina e
sulfametoxazol administrado com trimetoprima (TMP) conhecido como
cotrimoxazol. A figura 04 apresenta a estrutura de duas sulfonamidas.
INTRODUÇÃO
- 4 -
(a (b
SO
2
NH
2
H
2
N SO
2
NHH
2
N
N
N
a) b)
Figura 04. (a) Estrutura da sulfanilamida e (b) da sulfadiazina.
Nos últimos dez anos, vários trabalhos foram realizados com o objetivo de
desenvolver e sintetizar moléculas inibidoras da enzima DHFR [4,7-21], na
esperança de encontrar agentes que possam ser superiores aos regimes que
combinam duas drogas antifólicas, onde um inibidor da diidropteroato sintetase
(sulfametoxazol, por exemplo) é combinado a um inibidor da DHFR tal como TMP
ou pirimetamina, figura 05.
Figura 05. Esquema da ação das sulfonamidas e da trimetoprima sobre a
síntese bacteriana de folato.
Do ponto de vista estrutural, a trimetoprima, figura 06 (a), apresenta alguma
semelhança com o componente pteridina do folato. A semelhança é próxima o
suficiente para confundir a enzima bacteriana relevante. A TMP é quimicamente
relacionada com o agente antimalárico, pirimetamina, figura 06 (b), ambos são
antagonistas do folato [22].
INTRODUÇÃO
- 5 -
N
N
NH
2
H
2
N
OMe
OMe
OMe
N
N
NH
2
H
2
NCH
2
CH
3
Cl
(a)
(b)
Figura 06. (a) Estrutura da trimetoprima e (b) da pirimetamina.
A utilização de folatos, na forma de tetraidrofolato, como cofator na síntese
de timidilato é um exemplo de uma via em que se verifica uma sensibilidade
diferencial das enzimas humanas e bacterianas a substâncias químicas. A DHFR das
bactérias é muitas vezes mais sensível ao antagonista do folato TMP que a enzima
humana.
Por outro lado, a DHFR humana é muito sensível ao efeito do análogo do
folato, metotrexato (MTX), sendo este composto utilizado na quimioterapia de certos
cânceres [23]. O MTX é inativo nas bactérias, visto que, em virtude de sua estrutura
ser muito semelhante à do folato, figura 07, é necessária sua captação ativa pelas
células.
N
N
N
N
NH
2
H
2
N
N
CONH CH
COOH
(CH
2
)
2
COOH
Me
Figura 07. Estrutura do metotrexato.
Este é uma droga usada no tratamento de muitos tumores que crescem
rapidamente, tais como leucemia aguda e coriocarcinoma. No entanto, o MTX é
muito tóxico, destruindo rapidamente as células que se replicam, sendo elas malignas
ou não. Células originadas na medula óssea, células epiteliais do trato intestinal, e
folículo capilar são vulneráveis a ação deste folato antagonista, ocorrendo em muitos
casos seus efeitos tóxicos colaterais.
INTRODUÇÃO
- 6 -
Um aspecto fundamental para o uso de antifólicos como medicamentos é a
necessidade de fortalecer as interações entre as drogas e a DHFR do parasito, em
detrimento das interações com a DHFR dos mamíferos. Isto leva a um aumento da
seletividade em relação à enzima do microorganismo, com a possibilidade de
diminuição dos efeitos colaterais.
Os medicamentos utilizados clinicamente apresentam uma intensa
possibilidade de efeitos adversos, o que dificulta o tratamento dessas doenças.
Algumas drogas lipofílicas inibidoras da DHFR são o TMP, já citado, a piritrexina
(PTX) e o trimetrexato (TMQ), figura 08.
N
NN
H
2
N
H
2
N
Me OMe
OMe
(b)
(a)
N
N
N
H
2
N
NH
2
Me
OMe
OMe
OMe
H
Figura 08. (a) Estrutura da piritrexina e (b) do trimetrexato.
Quando usado sozinho, o TMP não é potente o bastante para alcançar uma
significante redução da parasitemia e, por isso, requer uma coadministração com uma
droga sulfa para aumentar sua eficácia. No entanto, muitos pacientes desenvolvem
sérias reações alérgicas na pele devido às drogas sulfa e, portanto, tem
descontinuidade no tratamento antes da cura completa ser alcançada.
Um inibidor muito mais potente da DHFR do que o TMP, aprovado há
poucos anos para o uso em pacientes aidéticos com pneumonia devido ao fungo
Pneumocystis carinii é o MTX. Ao contrário do TMP, que é muito mais seletivo em
sua capacidade de ligar-se a DHFR do Pc e outros parasitos oportunistas, quando
comparado com a DHFR humana, o MTX perde em seletividade, interagindo
fortemente também com a enzima humana e, por isso, requer uma coadministração
com leucovorin (ácido 5-formiltetraidrofólico) para proteger seletivamente o
paciente dos severos efeitos colaterais hematológicos que podem ocorrer. A
explicação para esta proteção seletiva é que os parasitos sintetizam seu próprio folato
INTRODUÇÃO
- 7 -
e, então, em contraste com as células mamíferas, não possuem proteínas
transportadoras de folato em sua membrana celular [2].
O PTX e o TMQ apresentam certa semelhança com o MTX, possuindo
também alta afinidade pela DHFR dos parasitas, sendo também pouco seletivos a
enzima destes microorganismos, o que acarreta severos efeitos colaterais e requer
coadministração de leucovorim.
Devido às limitações apresentadas pelos regimes já mencionados, um inibidor
da DHFR que combine a potência do MTX, TMQ ou PTX com a especial
seletividade do TMP poderá ser a solução para eliminar a necessidade de
coadministração com uma droga sulfa ou leucovorin.
1.2. Modelagem molecular no desenvolvimento de drogas
Modelos são representações simplificadas de objetos e fenômenos físicos
reais. A modelagem consiste na construção e manipulação de modelos com o
objetivo de compreender mais profundamente os elementos por eles representados
[24].
A modelagem molecular consiste na geração, manipulação e/ou representação
realista de estruturas moleculares e cálculo das propriedades físico-químicas
associadas. Geralmente é assistida por computadores. O instrumento matemático
usado é a química teórica e a computação gráfica é a ferramenta para manusear os
modelos. Atualmente, os sistemas de modelagem molecular estão munidos de
poderosas ferramentas para construção, visualização, análise e armazenamento de
modelos de sistemas moleculares complexos que auxiliam na interpretação das
relações entre a estrutura e a atividade biológica. São realizados cálculos de energias
de conformação, de propriedades termodinâmicas, de orbitais moleculares e
estatísticos.
A modelagem molecular pode ser aplicada ao planejamento de fármacos de
modo direto ou indireto. Diretamente, quando se conhece a estrutura tridimensional
do alvo biológico, na tentativa de compreender as interações dos complexos ligante-
receptor. Indiretamente, quando não se dispõe da estrutura do receptor, na tentativa
de obter parâmetros eletrônicos e estéricos que elucidem as relações estrutura-
INTRODUÇÃO
- 8 -
atividade biológica. Ambos os modos tentam otimizar o encaixe da molécula com o
receptor. A modelagem molecular e suas representações gráficas permitem explorar
aspectos tridimensionais de reconhecimento molecular e gerar hipóteses que levam
ao planejamento e à síntese de novos ligantes.
Normalmente, os ligantes apresentam interações com alto grau de
complementaridade com seu alvo. Esta característica pode ser avaliada de várias
formas. Com o auxílio de computadores e softwares de modelagem, modelos
moleculares de compostos podem ser construídos, desenhando-os em um monitor e
movimentando-os para assumir diferentes conformações. Assim, o uso da
modelagem molecular com o auxílio da computação gráfica permite o
desenvolvimento mais racional de uma droga [25].
Qualquer composto que se mostre promissor pode ser modelado juntamente
com a imagem tridimensional do sítio receptor. O ajuste entre o composto e o
receptor pode sugerir modificações que podem ser feitas para que o composto
resultante tenha ligações mais favoráveis. Neste sentido, a seleção de compostos a
serem sintetizados passa por um processo de filtração, onde a interpretação da
atividade biológica será mais racional e permitirá que compostos
farmacologicamente ativos sejam mais rapidamente descobertos [25].
Muitos ligantes apresentam complementaridade de forma com a região da
macromolécula onde irá se ligar, o sítio de ligação, também chamado de sítio ativo.
Isto pode ser analisado pela construção de superfícies moleculares como superfícies
da cavidade do sítio ativo [26]. Essa superfície é criada acima dos átomos do sítio
ativo da proteína considerando seus raios de van der Waals. O diagrama da superfície
é apresentado na forma de contornos paralelos que permitem avaliar as interações
entre a droga e os átomos do sítio ativo. A superfície é colorida para dar informações
precisas sobre a especificidade química como pode ser observado na figura 09.
INTRODUÇÃO
- 9 -
Figura 09. Cavidade do sítio ativo da enzima purina nucleotídeo fosforilase do
Mycobacterium tuberculosis (TB-PNP) complexada com um análogo da
Immucillina-H (ImmH) [27].
Na superfície apresentada acima as linhas vermelhas representam a região da
proteína que requer grupos aceptores de hidrogênio na droga, as azuis doadores de
hidrogênio e as amarelas representam uma região hidrofóbica da proteína formada
por grupos de aminoácidos apolares. O esquema de cores permite o desenvolvimento
racional de novos ligantes, através de modificações no composto base com o objetivo
de fortalecer as interações, principalmente as ligações de hidrogênio.
É importante lembrar que uma boa droga não é simplesmente aquela que
interage favoravelmente com seu alvo. Depois da administração, a droga deve
alcançar o sítio de ação. Este processo de transporte freqüentemente requer que a
droga passe pela membrana celular, ambiente hidrofóbico, logo, a droga deve ser
suficientemente lipofílica para atravessar a membrana. Uma vez dentro da célula, a
droga pode atingir seu alvo. Porém, durante este processo a droga pode ser removida
do organismo pelo metabolismo, excreção e outros mecanismos.
1.2.1. Modelagem de proteínas
A análise das propriedades de macromoléculas que contém milhares de
átomos como proteínas é mais facilmente realizada fazendo-se uso da computação
INTRODUÇÃO
- 10 -
gráfica, esta reduz a complexidade de observação do sistema e permite focar somente
uma porção relativamente pequena da estrutura da proteína, por exemplo, o sítio
ativo onde a molécula de uma droga se liga [28].
Observando a estrutura de proteínas é possível perceber similaridades na
topologia e até mesmo em detalhes estruturais. A comparação da estrutura de
proteínas pode revelar certas relações evolucionárias. Se a seqüência de aminoácidos
de duas proteínas puder ser alinhada, pode-se contar o número de resíduos idênticos
ou usar um índice de similaridade entre os aminoácidos. Tais índices têm a forma de
uma matriz M, de modo que cada entrada correspondente a um par de aminoácidos
M
ij
dá uma medida da similaridade entre qualquer par de aminoácidos [29]. A
similaridade entre duas seqüências é então a soma dos valores para cada par do
alinhamento dos aminoácidos examinados na matriz, mais uma correção para os
espaços vazios encontrados nas seqüências dos sítios de inserção ou deleção de
aminoácidos.
Normalmente os nomes dos resíduos de aminoácidos das seqüências das
proteínas que estão sendo alinhadas são escritos em códigos de 1 ou 3 letras, a tabela
01 apresenta a relação entre os nomes dos aminoácidos e os seus respectivos códigos.
INTRODUÇÃO
- 11 -
Tabela 01. Códigos de uma e três letras usados para representar os resíduos dos
aminoácidos
Resíduos Código de 1 letra Código de 3 letras
Alanina
A Ala
Arginina
R Arg
Asparagina
N Asn
Ácido aspártico
D Asp
Cisteína
C Cys
Glutamina
Q Gln
Ácido glutâmico
E Glu
Glicina
G Gly
Histidina
H His
Isoleucina
I Ile
Leucina
L Leu
Lisina
K Lys
Metionina
M Met
Fenilalanina
F Phe
Prolina
P Pro
Serina
S Ser
Treonina
T Thr
Triptofano
W Trp
Tirosina
Y Tyr
Valina
V Val
1.2.2. Efeito da solvatação na modelagem de proteínas
A solvatação pode ter um profundo efeito nos resultados de cálculos
moleculares. O solvente pode afetar fortemente as energias de diferentes
conformações. Ela influência o padrão de formação de ligações de hidrogênio, área
da superfície do soluto, e exposição dos grupos hidrofílicos/hidrofóbicos de
moléculas de proteínas [29]. O efeito do solvente pode ser avaliado levando-se em
consideração uma constante dielétrica que representa o efeito provocado por
INTRODUÇÃO
- 12 -
moléculas do solvente através de interações eletrostáticas, esta constante
normalmente varia de 1 (no vácuo) a 7,8 (em água) [28].
O efeito da solvatação provoca uma grande modificação na energia e
distribuição espacial dos orbitais moleculares de uma proteína. Interessantemente, os
orbitais de fronteira, orbital molecular de mais alta energia ocupado (HOMO) e
orbital molecular de mais baixa energia vazio (LUMO), da proteína hidratada são
encontrados localizados na maior parte dos resíduos de aminoácidos importantes,
geralmente os que compõem o sítio ativo, o que difere em fase gasosa [30]. A
explicação para a origem na modificação das energias dos orbitais é atribuída ao
efeito dielétrico da água que abaixa consideravelmente a energia dos orbitais.
A hidratação da proteína causa uma mudança relativa no ordenamento dos
orbitais moleculares, resultando em uma localização dos orbitais de fronteira no sítio
ativo no caso da enzima ribonuclease T
1
(RNase T
1
) hidratada, figura 10.
Figura 10. Sítio ativo da RNase T
1
e o substrato 3-guanosina 5-monofosfato (3GMP).
HOMO-1 e HOMO-2 são representados pelos lóbulos vermelhos e LUMO+2 e
LUMO+3 são representados pelos lóbulos azuis [30].
1.2.3. Docking molecular
Nos estudos de docking molecular procura-se predizer a estrutura, ou
estruturas, de um complexo intermolecular formado entre duas ou mais moléculas. O
docking é amplamente usado para sugerir modos de ligação de inibidores proteicos.
INTRODUÇÃO
- 13 -
Estes estudos são realizados em programas que possuem algoritmos capazes de gerar
um grande número de possíveis estruturas, e também são capazes de avaliar cada
estrutura para identificar aquela mais promissora, normalmente, essa pesquisa
envolve muitos graus de liberdade, entre eles são considerados os translacionais,
rotacionais e conformacionais [28].
Muitos métodos que levam em consideração os graus de liberdade
conformacionais, o fazem apenas para o espaço conformacional do ligante, nestes o
receptor é invariavelmente avaliado como uma cavidade rígida.
O método ideal em docking é aquele onde ambos, ligante e receptor, estão
livres para assumir diferentes conformações. Uma das melhores formas de considerar
esta flexibilidade no sítio de ligação é utilizar simulações de dinâmica molecular do
complexo. No entanto, tais cálculos são muito demorados e na prática somente são
utilizados para refinar estruturas obtidas por outros métodos.
O problema do docking também pode ser atacado manualmente, usando
gráficos computacionais interativos, o que pode ser feito pela superposição de um
análogo sobre o composto base que esta sendo estudado. Isto pode ser muito
proveitoso se houver uma boa idéia sobre as ligações estabelecidas entre o inibidor e
a proteína.
i) Modelagem das interações ligante-receptor
Um modo de determinar a estrutura tridimensional de complexos proteicos
com seus ligantes é utilizando técnicas de difração de raios-x, de ressonância
magnética nuclear, ou ainda, por métodos computacionais baseados na mecânica
quântica ou na mecânica molecular. Os cálculos da mecânica quântica necessitam de
um maior poder computacional ao contrário daqueles da mecânica molecular que por
isso, são uma fonte mais prática nos estudos de estruturas tridimensionais.
Utilizando programas computacionais de modelagem molecular com altos
recursos de computação gráfica como é o caso do programa CAChe WorkSytem Pro
Versão 6.01. (CAChe) [31] é possível sobrepor uma estrutura sobre outra. Em outras
palavras, pode-se sobrepor a estrutura tridimensional de um possível fármaco sobre
um inibidor já conhecido que esteja complexado no sítio alvo de uma enzima, o que
pode ser conseguido em muitas estruturas cristalográficas disponíveis no Protein
INTRODUÇÃO
- 14 -
Data Bank (PDB) [32]. Este processo de encaixe de fármacos em potencial no sítio
alvo é chamado de docking [33], figura 11.
Figura 11. Estrutura de um derivado da 9-deazaguanina (PNP030) em rosa,
sobreposto na estrutura da ImmH em azul, dentro da cavidade do sítio ativo da
enzima TB-PNP [27,34]. Os átomos indicados de 1 a 4 foram os utilizados para a
sobreposição e têm coordenadas coincidentes nas duas estruturas.
Se o fármaco em potencial possuir um bom encaixe e seus grupamentos
funcionais estiverem posicionados de tal modo que possam interagir com a estrutura
do sítio alvo estudado, é provável que este tenha atividade biológica.
Um problema importante com esta abordagem é o fato de que muitas
moléculas não possuem estruturas rígidas, como aquelas que possuem sistemas de
anéis aromáticos ou outros sistemas com insaturações conjugadas. Essas moléculas
apresentam estruturas flexíveis cuja conformação dependerá da energia do ambiente
molecular num determinado momento. Isto significa que as conformações assumidas
pelo novo ligante e pelo sítio ativo não são necessariamente as mesmas que aquelas
determinadas pela cristalografia de raios-x ou pelo docking. Para considerar estes
efeitos pode-se realizar uma análise conformacional, ou ainda utilizar-se de outros
INTRODUÇÃO
- 15 -
métodos da química computacional, tais como, o método Metrópolis Monte Carlo
(MC) e a Análise de Campo Molecular Comparativa (CoMFA).
Em um trabalho recente [2] foram realizadas simulações computacionais da
estrutura tridimensional do complexo ternário formado por um antifolato de notável
seletividade dentro do sítio ativo da DHFR do Pc ou humana, e NADPH. As
coordenadas para o início da simulação foram geradas pela superposição do grupo
pteridínico do antifolato sobre uma 2,4-diamina pteridina dibenzazepina complexada
no sítio ativo da DHFR, estrutura já descrita na literatura [35]. O complexo ternário
resultante foi solvatado em uma caixa de simulação com moléculas de água.
Verificou-se que o inibidor estabelece, em ambas as enzimas, uma interação
comum entre um átomo de nitrogênio protonado do grupo 2-amina do anel
pteridínico com o ácido glutâmico (E32 na enzima do Pc, E30 na enzima humana). O
outro nitrogênio do grupo 4-amina está a uma distância de ligação de hidrogênio do
átomo de oxigênio do grupo amida da isoleucina (I10 e I123 da DHFR do Pc) e,
isoleucina e valina (I7 e V115 da DHFR humana), figura 12.
Figura 12. Estruturas dos complexos ternários formados pelo antifolato (em amarelo)
NADPH na DHFR do Pc em A e, na DHFR humana em B [2].
O inibidor está situado dentro de um canal hidrofóbico que permite o
estabelecimento de interações de van der Waals entre o anel dibenzazepínico com a
fenilalanina (F69, 5,75 Å do centro do primeiro anel), prolina (P66, 3,77 Å do centro
INTRODUÇÃO
- 16 -
do segundo anel), e Leucina (L25, 3,80 Å do centro do terceiro anel) no caso da
enzima do Pc.
O grupo carboxila (COOH) do antifolato está aproximadamente a 3 Å da
cadeia lateral da arginina em ambas enzimas Pc (R75) e humana (R70). Como o
resíduo arginina é conservada nas duas enzimas, presume-se que ele não pode atuar
numa inibição preferencial pela enzima do Pc.
1.2.4. Estudos teóricos dos mecanismos de reações enzimáticas
Desde os primórdios da química quântica foram propostos vários índices que
buscavam indicar qual átomo é mais reativo em uma dada molécula, para uma dada
reação. Muitos desses são índices baseados na Teoria de Orbitais Moleculares de
Fronteira, (FMO) [36,37], principalmente os coeficientes dos orbitais de fronteira
(HOMO ou LUMO) e as cargas atômicas parciais. Quando empregados
adequadamente esses índices produzem resultados satisfatórios [38]. Possibilitando,
por exemplo, o estudo de reações enzimáticas.
A ação da enzima diidrofolato redutase tem sido alvo de muitos trabalhos
teóricos que avaliam o seu mecanismo [39-42]. Mais especificadamente tenta-se
entender os processos de protonação e transferência do íon hidreto que ocorrem entre
os resíduos de aminoácidos do sítio ativo da enzima, NADPH e o folato. As etapas
desse processo podem ser ilustradas pela figura 13. O folato e seus substratos são
apresentados em conjunto com os resíduos de aminoácidos e moléculas de água (W)
que estabelecem ligações de hidrogênio, a ilustração leva em conta as interações
formadas sítio ativo da DHFR da Escherichia coli (Ec) baseada na estrutura de raios-
x [39].
INTRODUÇÃO
- 17 -
Figura 13. Redução do folato a 7,8-diidrofolato e 5,6,7,8-tetraidrofolato [39].
Pode ser observado na figura acima que as modificações em cada etapa do
mecanismo ocorrem no anel pirazina do anel pteridínico substituído. A enzima
catalisa a reação em duas etapas, primeiro com a forma completamente oxidada do
folato e depois com o diidrofolato.
Os estudos teóricos foram realizados através de cálculos híbridos de mecânica
molecular/mecânica quântica semi-empíricos e cálculos quânticos ab initio do folato
e substratos complexados nos resíduos de aminoácidos do sítio ativo da enzima
DHFR, incluindo grupos carboxílicos, outros grupos polares e moléculas de água
conservadas. A protonação foi considerada em cada etapa, juntamente com a
transferência do hidreto. Os efeitos de polarização do restante do sistema enzimático
foram aproximados por um modelo de campo dielétrico utilizando uma constante
dielétrica efetiva igual a 2. Foi observado que moléculas de água conservadas no
sítio ativo são importantes na etapa de protonação. E que esta etapa ocorre antes da
entrada do íon hidreto.
INTRODUÇÃO
- 18 -
1.3. Métodos teóricos aplicados na modelagem molecular
O planejamento de fármacos com o auxílio dos métodos teóricos [43-45], em
conjunto com técnicas de reconhecimento do padrão [46-48] têm gerado nas últimas
décadas uma economia em tempo e em custo na seleção da melhor opção para a
síntese de compostos mais promissores de uma série.
Os métodos de cálculo usados na modelagem molecular podem ser clássicos,
como os da mecânica molecular, ou quânticos, que se dividem basicamente em duas
linhas principais: os que usam dados empíricos (semi-empíricos) e os que não os
usam (ab initio e teoria do funcional densidade) [49].
1.3.1. Método da mecânica molecular
Os cálculos de mecânica molecular (MM), também chamados de cálculos de
campo de força, tratam as moléculas como uma coleção de átomos que pode ser
descrita por forças newtonianas, ou seja, uma coleção de partículas mantidas unidas
por forças harmônicas ou elásticas. Essas forças podem ser descritas como funções
de energia potencial de características estruturais, como comprimentos de ligação,
ângulos de ligação, interações não-ligantes e outras. A combinação dessas funções de
energia potencial é o campo de força. A energia potencial total, ou energia estérica
(EE), da molécula é representada na forma mais simples pela equação de
Westhemeier [24], equação 01.
E = E
s
+ E
b
+ E
w
+ E
nb
(01)
Onde:
E
s
= energia de estiramento (ou compressão) de uma ligação;
E
b
= energia de deformação angular;
E
w
= energia de torção em torno de ligações;
E
nb
= energia de interação não-ligante.
INTRODUÇÃO
- 19 -
2
0
s
()
E
2
l
l
K
ll
=
(02)
Onde:
K
l
= constante de força;
l = comprimento de ligação;
l
0
= comprimento de ligação livre de tensão.
2
0
b
()
E
2
K
θ
θ
θ
θ
=
(03)
Onde:
K
θ
= constante de força;
θ = ângulo de ligação;
θ
0
= ângulo de ligação livre de tensão.
w
(1 cos )
E
2
w
w
Vnw±
=
(04)
Onde:
V
w
= constante de força;
w = ângulo torsional;
n = periodicidade.
()
nb
6
2
E exp 12 1
r
F
α
α
⎧⎫
=−+ ⎡⎤
⎨⎬
⎣⎦
⎩⎭
(05)
Onde:
F
r
= constante de força;
**
12
r
rr
α
=
+
, r = distância interatômica entre átomos não-ligados; r
1
*
e r
2
*
=
constantes de van der Waals.
INTRODUÇÃO
- 20 -
Cada uma dessas funções de energia representa a diferença de energia entre
uma molécula real e uma molécula hipotética, sendo que todos os parâmetros
estruturais, como comprimentos de ligação e ângulos de ligação, estão exatamente
em seus valores ideais ou naturais.
A rapidez e a economia do tempo de computação e a facilidade de
compreensão em relação aos métodos da mecânica quântica são algumas das
vantagens da mecânica molecular. Quando um tratamento mais refinado é requerido,
a geometria otimizada pela MM pode ser usada como ponto de partida para cálculos
da mecânica.
Algumas desvantagens dos métodos de MM são que algumas classes de
moléculas de interesse não estão correntemente parametrizadas e a MM não é
apropriada para as determinações de propriedades em que o efeito eletrônico (por
exemplo: interações de orbitais, quebra de ligações etc.) é predominante. Um dos
campos de força mais utilizados em cálculos de mecânica molecular é denominado
MM3 e foi desenvolvido por Allinger, et all. [50].
Durante um cálculo de MM a geometria de uma molécula é especificada de
acordo com as suas coordenadas atômicas. Assim, a partir de um conjunto de dados
de entrada, uma geometria inicial é especificada e sua energia estérica é calculada.
Todos os parâmetros que definem a geometria do sistema são modificados em
pequenos incrementos e, com o uso de métodos de minimização do gradiente, a
geometria é otimizada (ou seja, a EE é minimizada). É importante lembrar que a
minimização é um método interativo de otimização geométrica que depende da
geometria de partida. A minimização geralmente leva ao mínimo local mais próximo
e não ao mínimo global. Vários problemas nos estudos de relação estrutura-atividade
requerem soluções que podem não ser o mínimo global da molécula isolada. A
varredura completa da superfície de energia potencial (SEP) de uma molécula é
chamada de análise conformacional. Para que a análise conformacional seja feita
com alguma segurança são feitos incrementos nos valores dos ângulos diedros de
todas as ligações passíveis de rotação para explorar o espaço conformacional da
molécula.
INTRODUÇÃO
- 21 -
1.3.2. Método da mecânica quântica
A aplicação da mecânica quântica a problemas de química é chamada
química quântica. A química quântica nas últimas décadas tem se mostrado uma
ferramenta muito importante no estudo de inúmeros problemas de química e física
molecular. Hoje todo o seu aparato é usado para problemas de estrutura molecular,
reatividade e espectroscopia entre outros.
Um fator que tem impulsionado a aplicação dos métodos da mecânica
quântica a problemas químicos é o progresso recente em
hardware de computação e
o desenvolvimento de algoritmos eficientes, que têm acompanhado o
desenvolvimento das rotinas de cálculos. Novos métodos quânticos fornecem
quantidades apreciáveis em um tempo computacional razoável. Desse modo, cálculos
da química quântica são uma fonte atrativa para descritores moleculares que podem
ser utilizados em estudos de relações entre estrutura e atividade [51], estes
descritores são capazes de expressar todas as propriedades eletrônicas e geométricas
das moléculas [52].
i) Métodos ab initio
Os métodos
ab initio procuram solucionar a equação de Schrödinger de forma
aproximada. O método de Hartree-Fock, é em geral, o ponto de partida para a
obtenção de funções de ondas mais próximas da exatidão. Neste método, aproxima-
se a função de onda de um sistema de
N elétrons para produto de N funções de um
elétron (orbitais) anti-simetrizada com referência à troca de duas e quaisquer
coordenadas eletrônicas e de spin. Esta aproximação é conhecida como a
aproximação das partículas independente (não correlacionados), uma vez que a
probabilidade de encontrar simultaneamente quaisquer duas ou mais partículas fica
sendo produto das probabilidades individuais de encontrar cada partícula.
Físicamente, isto significa que os elétrons não sentem o efeito direto dos outros
elétrons e sim um campo médio gerado pelos os demais.
As equações de Hartree-Fock são constituídas de um operador, operador de
Fock, e suas autofunções, os spinorbitais, e seus autovalores, as energias orbital. As
INTRODUÇÃO
- 22 -
equações são calculadas de maneira iterativa, por isso o método também é conhecido
como o método do campo autoconsistente (SCF).
Ele se baseia na simples idéia que particularmente em conjunto com a
expansão dos orbitais espaciais, como no esquema SCF de Roothaan. O esforço
computacional para esse cálculo é proporcional à quarta potência do número de
elétrons. Esse representa o menor nível em que as interações eletrônicas podem ser
descritas completamente.
Cálculos mais precisos podem ser realizados usando tratamentos pós-Hartree-
Fock, como os métodos de interação de configuração (CI) e os métodos baseados na
teoria da perturbação. O esforço computacional para esses métodos é proporcional a
uma determinada potência do número de elétrons.
ii) Métodos semi-empíricos
Como uma alternativa aos métodos
ab initio, os métodos quânticos semi-
empíricos podem ser utilizados para os cálculos de descritores moleculares. Estes
métodos foram desenvolvidos dentro do contexto matemático da teoria do orbital
molecular (SCF MO), mas baseado em simplificações e aproximações introduzidas
no procedimento teórico que reduz drasticamente o tempo computacional. Valores
estimados através da reprodução de propriedades atômicas e moleculares
experimentais são utilizados nos cálculos como parâmetros. Por esta razão, esses
procedimentos são amplamente conhecidos como métodos semi-empíricos.
Devido às dificuldades encontradas na aplicação dos métodos
ab initio para
moléculas com um considerado número de átomos, vários métodos semi-empíricos
foram desenvolvidos. Estes são rápidos e precisos o suficiente para permitir
aplicações rotineiras em sistemas moleculares maiores. O objetivo fundamental dos
métodos semi-empíricos é o desenvolvimento de um tratamento quantitativo de
propriedades moleculares com precisão, confiabilidade e custo computacional com
valor prático em química.
Os métodos semi-empíricos mais populares atualmente são o MNDO [53]
(
Modified Neglect of Diatomic Overlap), AM1 [54] (Austin Model 1) e PM3 [55]
(
Parametric Model 3). O método MNDO é amplamente utilizado para calcular
calores de formação, geometrias moleculares, momentos de dipolo, energias de
INTRODUÇÃO
- 23 -
ionização e afinidades eletrônicas. Este método apresenta problemas nos cálculos de
moléculas que apresentam isomeria estrelada, anéis de quatro membros, ligações de
hidrogênio e compostos hipervalentes. O método AM1 é uma modificação do
MNDO e é, em geral, um método mais preciso para muitos problemas. Ele trata
corretamente as ligações de hidrogênio, realiza previsões precisas de barreiras de
ativação para muitas reações e prevê calores de formação melhor do que o MNDO. O
método PM3 é uma re-parametrização do método AM1, inicialmente usado para
moléculas orgânicas.
Estes métodos encontram uma ampla aplicação no cálculo de um número
muito grande de moléculas pequenas, como no estudo de efeitos de substituintes para
o projeto de fármacos; para inúmeros e repetitivos cálculos de um mesmo tipo de
sistema, como em simulações de dinâmica molecular ou Monte Carlo e; para o
cálculo de macromoléculas.
Até meados da década de 90, os métodos semi-empíricos eram aplicados a
sistemas moleculares que continham até uma centena de átomos, do tamanho que
normalmente aparecem em estudos da química orgânica. Mais recentemente, numa
combinação do avanço computacional com novos métodos numéricos e suas
implementações, estes sistemas passaram a ser domínio dos métodos baseados em
teoria de funcionais de densidade (DFT) [56].
Atualmente, sistemas moleculares com dezenas de milhares de átomos
começam a ser tratados com métodos semi-empíricos, por exemplo, cálculos
completos de orbitais moleculares de sistemas como enzimas, conjuntos de proteínas,
DNA, polissacarídeos, etc. Isto tornou-se possível com o surgimento de métodos de
escalonamento verdadeiramente linear do tipo MOZYME [57]
e LocalSCF [58].
iii) Métodos de Solvatação
Efeitos de solventes podem ser incorporados em cálculos de química
quântica. Muitos métodos consideram o solvente como um meio dielétrico continuo
caracterizado por uma constante dielétrica. Uma técnica muito popular é uma
adaptação do modelo de Born baseada em interações eletrostáticas, permissividade
elétrica e cálculos baseados na sobreposição de orbitais. Os métodos de solvatação
são desenvolvidos para usar ambos cálculos semi-empíricos e
ab initio. Eles são
INTRODUÇÃO
- 24 -
baseados no conceito de superfície acessível ao solvente e são capazes de computar
cargas atômicas parciais, energia livre de solvatação e geometria em solução. O
modelo conhecido por COSMO (
Conductor-like screening model) [59] é um método
continuo que usa uma equação aproximada para a interação eletrostática entre o
solvente e o soluto.
1.4. Relações quantitativas entre estrutura e atividade
Para que um novo composto tenha aplicações medicinais, este deve produzir
os efeitos esperados com o mínimo de efeitos colaterais, demonstrando ser melhor do
que as terapias já estabelecidas [28]. O primeiro passo na descoberta de novas drogas
é identificar um ou mais
compostos base. Um composto base é uma molécula que
apresenta atividade em um determinado sistema. Este composto é então modificado
para aumentar sua potência e seletividade, assegurando, desse modo, que os
compostos homólogos ou algum de seus produtos metabólicos não sejam tóxicos e,
apresentem características de transporte apropriadas que os permitam passar através
das membranas celulares e alcançar seu alvo.
Muitas drogas produzem seus efeitos pela interação com uma macromolécula
biológica tal como uma enzima, o DNA ou uma glicoproteína. Esta interação entre o
ligante, inibidor ou substrato, com seu alvo receptor, enzima, gene, etc.,
normalmente ocorre por forças intermoleculares, entre átomos não ligados, mas em
alguns casos uma ligação covalente pode estar envolvida. Drogas que interagem com
receptores proteicos podem ser classificadas como
agonistas ou antagonistas.
Agonistas produzem o mesmo efeito, ou mais pronunciado, que um substrato natural,
enquanto um antagonista inibe este efeito do ligante natural [22].
No planejamento de drogas, é sempre importante lembrar que uma molécula
deve apresentar outras qualidades além de uma alta atividade
in vitro. O inibidor
mais potente de uma enzima não terá muita utilidade se não puder alcançar seu alvo.
A atividade
in vivo de uma molécula depende freqüentemente de muitos fatores. Um
estudo de estrutura e atividade pode ajudar a decidir que características da molécula
podem aumentar sua atividade, permitindo sugerir mudanças com esse objetivo. Uma
relação quantitativa entre estrutura e atividade (QSAR) [60] relaciona propriedades
INTRODUÇÃO
- 25 -
numéricas da estrutura molecular com a atividade via modelo matemático. Essa
relação é normalmente descrita por uma equação de forma geral:
()vfp= (06)
v é a atividade em questão, p são as propriedades derivadas da estrutura da molécula,
e f é uma função qualquer [61].
1.4.1. Histórico e desenvolvimento de QSAR
Atualmente, encontramos uma enorme quantidade de métodos utilizados para
derivar equações de QSAR, estes vão deste aproximações ‘clássicas’ baseadas na
estrutura molecular bidimensional (2D) dos ligantes, passando por métodos que
consideram a estrutura tridimensional (3D) destes, até aqueles que exploram a
estrutura 3D dos receptores macromoleculares. Estes últimos são impulsionados pela
enorme quantidade de estruturas tridimensionais de receptores disponíveis em bancos
de dados como o PDB. Os termos QSAR 4D [62] e QSAR 5D [63] vem sendo muito
utilizados, entretanto, esses referem-se somente a variações nos modelos de QSAR
3D considerando dimensões extras, respectivamente, as possíveis conformações dos
ligantes e, dos ligantes em conjunto com as possíveis conformações dos receptores
[64].
O QSAR 2D ‘clássico’ é baseado na aproximação pioneira de Hansch [65]
que surgiu por volta de 1960. Esta aproximação ainda continua sendo amplamente
usada. Estes estudos estão baseados num conjunto de descritores moleculares obtidos
da estrutura bidimensional da molécula que relacionam a atividade biológica com
características eletrônicas, hidrofóbicas, etc.
No ano de 1973 foi publicado um artigo de Unger e Hansch [66] considerado
como um marco no desenvolvimento de QSAR, neste foram estabelecidas regras
gerais para a elaboração e validação dos modelos matemáticos que correlacionam
estrutura química e atividade biológica [67]. A idéia era disciplinar a metodologia de
elaboração de modelos de QSAR.
As cinco regras gerais estabelecidas para a proposição de modelos
matemáticos de relações estrutura-atividade são as seguintes:
INTRODUÇÃO
- 26 -
a. Seleção de variáveis independentes: o número de descritores testados deve
ser o máximo possível, incluindo propriedades lipofílicas, eletrônicas,
estruturais, estérea e de polarizabilidade. Incluindo aquelas calculadas por
cálculos quânticos. As variáveis selecionadas na melhor equação devem ser
essencialmente independentes;
b.
Validação estatística das variáveis selecionadas: todas as variáveis que
aparecem no modelo devem ser validadas por testes estatísticos apropriados,
tais como o teste F;
c.
Princípio da parcimônia (Navalha de Occam): quando houver dúvida na
escolha de um entre muitos modelos semelhantes, deve-se escolher o mais
simples;
d.
Número de variáveis em cada modelo: para minimizar a ocorrência de
correlação por coincidência, deve haver, no mínimo, cerca de cinco ou seis
compostos para cada variável incluída no modelo;
e.
Modelo qualitativo para o mecanismo de ação dos compostos: é essencial que
o modelo obtido seja consistente com o mecanismo de ação, em nível
molecular, dos compostos testados.
A derivação das equações de QSAR envolve vários estágios distintos.
Primeiro, é obviamente necessário sintetizar os compostos e determinar suas
atividades biológicas. A medida da atividade é a concentração em mol/L de cada
composto capaz de produzir resposta biológica definida, tais como, IC
50
concentração em mol/L do fármaco capaz de proporcionar 50% de inibição da
atividade fisiológica de um sistema biológico, por exemplo, a atividade catalítica de
uma enzima; LD
100
– a concentração em mol/L do fármaco capaz de matar 100% dos
indivíduos em que é administrado; ED
50
– concentração em mol/L do fármaco capaz
de produzir 50% de seu efeito máximo.
As equações podem ser construídas para um conjunto muito grande de
compostos, no entanto, é mais comum, e mais lógico, considerar apenas uma série de
compostos relacionados, compostos homólogos, que diferem entre si em pequenos
grupos da molécula.
Essas relações quantitativas entre estrutura e atividade são construídas a partir
de descritores (variáveis independentes) usados para predizer complexas
INTRODUÇÃO
- 27 -
propriedades físico-químicas e biológicas [51], principalmente em estudos de
inibição da atividade enzimática [68-71].
1.4.2. Descritores empregados nos estudos de QSAR
Os descritores utilizados na construção dos modelos podem ser de dois tipos:
quânticos e clássicos. São exemplos de descritores clássicos os coeficientes de
partição, dados de área e volume de superfície, geométricos, propriedades
termodinâmicas, etc. Em estudos de QSAR a maior parte dos descritores empregados
são quânticos, onde estes são correlacionados com atividade biológica, tais como, a
inibição da atividade enzimática, atividade alucinógena, etc [72-74]. Isto ocorre
porque, historicamente, a pesquisa das relações quantitativas com a estrutura química
iniciou-se com o desenvolvimento dos métodos de planejamento teórico [75].
Os principais descritores quânticos utilizados para a determinação das
relações quantitativas entre estrutura e atividade em estudos bioquímicos são: as
cargas atômicas, as energias dos orbitais moleculares, as densidades dos orbitais de
fronteira, as superdelocalizabilidades, as polarizabilidades átomo-átomo, a
polarizabilidade molecular, o momento de dipolo, os índices de polaridade, o calor
de formação, etc [51,62].
Em trabalho realizado, sobre a formulação de equações de QSAR
toxicológicas [76], foi demonstrado que o uso de descritores quânticos, calculados
por métodos ab initio, não oferece considerável vantagem quando comparado aos
mesmos modelos obtidos utilizando descritores de cálculos semi-empíricos. O que
em conjunto com o elevado custo computacional e temporal dos cálculos ab initio,
tornam-nos inviáveis em estudos de QSAR.
i) Coeficiente de partição octanol-água
A atividade biológica de vários grupos de compostos pode ser correlacionada
com os seus coeficientes de partição em solventes polares e apolares. Overton e
INTRODUÇÃO
- 28 -
Meyer foram os pioneiros nesses estudos. Recorreram aos coeficientes de partição
primeiramente para explicar a atividade de certos narcóticos e, mais tarde, dos
anestésicos gerais [65].
O coeficiente de partição (P) óleo-água é definido como a relação das
concentrações da substância em óleo e em água. Para determinar o valor de P realiza-
se um experimento no qual se misturam quantidades conhecidas da substância, um
solvente orgânico imiscível com água (n-octanol, clorofórmio, éter etílico, etc.), que
mimetiza a fase oleosa, e água. Após a separação das fases orgânica e aquosa,
determina-se quantidade de substância presente em cada uma das fases.
De todos os parâmetros que podem aparecer em uma equação de QSAR, o
coeficiente de partição é o mais freqüentemente encontrado [28], usualmente na
forma de logaritmo (LogP), isto converte o valor para uma escala de energia livre. A
determinação experimental do coeficiente de partição pode ser muito complicada,
particularmente para compostos zwitteriônicos, ou ainda muito lipofílicos ou polares.
Os valores de P são normalmente medidos entre n-octanol e água como usado
originalmente por Hansch.
Vários métodos teóricos podem ser usados para calcular os coeficientes de
partição. Este é uma constante de equilíbrio e, desse modo, está diretamente
relacionado a uma mudança de energia livre. Os coeficientes de partição podem ser
calculados usando um método de perturbação da energia livre. Porém, mais
amplamente são determinados por aproximações baseadas nos fragmentos
moleculares, a partir da soma das contribuições positivas de fragmentos individuais e
um conjunto de fatores de correção [77].
ii) Índices de conectividade e topológicos
A estrutura química de um composto pode ser expressa através de
ferramentas matemáticas de topologia e teoria gráfica. Gráficos moleculares G
formam a base da caracterização quantitativa da estrutura química. Vários métodos
gráficos expressam a conectividade de átomos em uma molécula [78]. A partir
destes, foi introduzida uma idéia de identidade química estrutural através do conceito
de conectividade estendida (EC), de acordo com este conceito, os graus de um
vértice i, ou número de ligações conectadas ao átomo i, são recalculados em
INTRODUÇÃO
- 29 -
sucessivas etapas como a soma graus com um vértice vizinho j até que o valor
apareça em duas etapas consecutivas. Esta soma,
k
a
i
, em cada etapa k é chamada
conectividade estendida de k-ésima ordem,
k
EC(G):
∑∑
==
=
==
n
i
a
j
ji
k
n
i
i
kk
i
aaGEC
11
1
1
0
)(
(07)
Posteriormente foi desenvolvido o primeiro índice de grupo de Zagreb (M1)
que é definido como a soma do quadrado dos graus do vértice, ao invés de uma
simples soma, enquanto que o segundo índice de grupo de Zagreb M2 é a soma sobre
todos os limites do produto dos graus do vértice de pares de vértices vizinhos:
=
=
n
i
i
aM
1
2
1
;
todos limites
2
ij
M
aa=
(08)
Randic transformou M2 em uma nova função (χ) fazendo o inverso da raiz quadrada
de M2:
2/1
lim
)(
=
itestodos
ji
aa
χ
(09)
Kier e Hall estenderam a idéia de limites em uma única direção, a duas, três e
n direções. Os descritores moleculares construídos a partir desta idéia foram
chamados de conectividades moleculares de primeira, segunda, terceira ordem, etc,
respectivamente. O índice de ordem zero foi definido por complementaridade:
=
=
n
i
i
a
1
2/10
)(
χ
;
1/2
1
todoslimites
()
ij
aa
χ
=
;
1/2
2
limites em duas direções
()
ijk
aa a
χ
=
; ... (10)
INTRODUÇÃO
- 30 -
Foi feita ainda uma extensão importante desta aproximação para moléculas
com hereroátomos pela introdução de um conjunto análogo de índices de
conectividade de valência [79]. Neste caso, a conectividade é dada em termos de
valores delta de valência
v
i
δ
e
v
j
δ
de átomos i e j sendo representada por χ
v
, índice
de conectividade de valência de primeira ordem:
==
ij
v
j
v
i
vv
G
2/1
)()(
δδχχ
(11)
onde a soma é feita sobre todas as ligações ij da molécula. O valor delta de valência
é dado por
1
=
ji
i
v
i
v
i
ZZ
HZ
δ
(12)
onde Z
i
é o número atômico do átomo i,
v
i
Z
é o número de elétrons de valência do
átomo i e H
i
é o número de átomos de hidrogênio ligados ao átomo i. Os índices de
conectividade de valência de ordens superiores é definido analogamente.
Um outro conjunto de índices topológicos muito utilizado quantifica a forma
da estrutura química [80]. Estes quantificam o número de ciclos da molécula, índice
de forma de primeira ordem,
1
κ; o grau de linearidade do composto, índice de forma
de segunda ordem
2
κ; e, o grau de ramificação da molécula,
3
κ.
Índices de conectividades e topológicos são amplamente utilizados em
estudos de QSAR, estes conceitos permitem a construção de uma enorme variedade
de novos descritores que ajudam a correlacionar aspectos estruturais com a atividade
biológica [81].
iii) Área da superfície acessível ao solvente; área e volume de superfície de van
der Waals
INTRODUÇÃO
- 31 -
A área de superfície acessível ao solvente (SASA) é calculada após a
otimização da geometria molecular considerando a água como solvente, o efeito do
solvente é calculado usando um modelo contínuo conhecido como COSMO [59].
A área e o volume de van der Waals são calculados a partir da estrutura
tridimensional da molécula considerando os raios da superfície de van der Waals da
estrutura.
iv) Energias dos orbitais moleculares, potencial de ionização e afinidade
eletrônica
A energia do HOMO e do LUMO estão relacionados diretamente ao potencial
de ionização da molécula (IP) e a sua afinidade eletrônica (EA), respectivamente.
Estes são descritores quânticos muito utilizados e que governam o mecanismo de
muitas reações químicas [51]. De acordo com a teoria dos orbitais de fronteira da
reatividade química, a formação de estados de transição deve-se a interação entre os
orbitais de fronteira HOMO e LUMO das espécies reagentes.
A energia do HOMO, diretamente relacionada ao IP, caracteriza a
susceptibilidade de uma molécula a um ataque eletrofílico. A energia do LUMO,
diretamente relacionada a EA, caracteriza a susceptibilidade de uma molécula sofrer
um ataque nucleofílico. Em reações radicalares ambos HOMO e LUMO são
importantes.
v) Densidade dos orbitais de fronteira
A densidade eletrônica dos orbitais de fronteira (HOMO e LUMO) de átomos
pode fornecer detalhes sobre interações que envolvem a doação e acepção de elétrons
[51]. De acordo com a teoria de reatividade eletrônica de fronteira, na maior parte
das reações químicas é importante a localização e orientação do HOMO e LUMO
dos respectivos reagentes. Neste caso em uma molécula doadora, a densidade do
HOMO é critica para a transferência de carga (densidade eletrônica de fronteira
INTRODUÇÃO
- 32 -
eletrofílica,
E
r
f
) e no caso de uma molécula aceitadora a densidade do LUMO é
importante (densidade eletrônica de fronteira nucleofílica,
N
r
f
).
=
2
,
)(
nHOMO
E
r
Cf
(13)
=
2
,
)(
nLUMO
N
r
Cf
(14)
onde,
,
H
OMO n
C
são os coeficientes do orbital atômico X
n
no HOMO e,
,LUMO n
C
no
LUMO. Esses índices são fundamentais quando se pretende descrever os sítios de
interação entre uma droga e seu receptor.
vi) Superdelocalizabilidades e cargas atômicas
São definidas como um índice de reatividade dos orbitais ocupados e
desocupados. A superdelocalizabilidade (
S
r
) de um átomo r é um somatório
relacionado a contribuição feita pelo átomo
r a energia de estabilização na formação
de um complexo de transferência de carga com uma segunda molécula, ou a
habilidade de um reagente formar ligações através de transferência de carga [51].
Este parâmetro é freqüentemente empregado para caracterizar interações moleculares
e pode ser usado para comparar átomos correspondentes em moléculas diferentes.
Podemos distinguir a superdelocalizabilidade em eletrofílica
(S
E,A
) e,
nucleofílica (
S
N,A
), da mesma forma que são diferenciadas as densidades eletrônicas
de fronteira. Se os elétrons de um orbital de fronteira predominam em uma
determinada interação, o análogo para um orbital da superdelocalizabilidade
calculada pode ser usado.
∑∑
=
=
j
N
m
j
A
jmANAE
A
CSS
1
2
,,
/)(2,
ε
(15)
onde,
A
j
m
C
são os coeficientes dos orbitais moleculares j em relação ao número de
orbitais de valência
A (m = 1,...,N
A
). ε
j
é a energia do orbital molecular j.
INTRODUÇÃO
- 33 -
As superdelocalizabilidades são também chamadas de índices de reatividade
dinâmicos. Enquanto os índices estáticos, como cargas atômicas (
Q), descrevem
moléculas isoladas no seu estado fundamental, os índices dinâmicos referem-se aos
estados de transição das reações.
vii) Momento de dipolo
A polaridade de uma molécula tem influência em diversas propriedades
físico-químicas, por isso, muitos descritores são propostos para quantificar os efeitos
de polaridade. O mais óbvio e mais convencional descritor de polaridade é o
momento de dipolo molecular
µ [51]. O momento de dipolo total, no entanto, reflete
somente uma polaridade global da molécula. Por isso, índices de polaridade locais
são muitas vezes mais úteis.
viii) Descritores de ligações de hidrogênio
Ligações de hidrogênio são interações de extrema importância em muitos
processos químicos e biológicos. Existem vários métodos que estimam
quantitativamente a força deste tipo de interação entre átomos de moléculas
diferentes [82]. Estes tentam reproduzir valores de energia de ligações de hidrogênio
(
E
Hb
) medidas experimentalmente através de descritores teóricos obtidos através de
cálculos da mecânica quântica.
Estes cálculos permitem modelar as capacidades de doação de átomos de
hidrogênio através da energia do LUMO da molécula, cargas atômicas dos átomos de
hidrogênio, superdelocalizabilidade e efeitos de alto polarização de átomos pesados
ligados a doadores de hidrogênios. A acepção é avaliada através da energia do
HOMO, cargas atômicas dos átomos mais negativos da molécula e, do potencial
eletrostático da molécula.
1.4.3. Problemas e aplicação das equações de QSAR
INTRODUÇÃO
- 34 -
Um problema típico no desenvolvimento de modelos de QSAR é a presença
de
outliers. Estes, geralmente, correspondem aos compostos que apresentam algum
problema na medida da atividade biológica e são incapazes de ajustarem-se no
modelo obtido. Ou ainda, representam uma possível fala de ajuste do modelo. Desse
modo, os
outliers devem ser avaliados com uma atenção particular para saber se a
razão de sua presença pode ser determinada. Modelos de QSAR que não apresentam,
ou apresentam poucos,
outliers são considerados bons modelos. A análise destes
outliers pode indicar que estes compostos interagem diferentemente com o receptor
através de um mecanismo incomum ao conjunto de compostos do modelo [83].
Após estabelecer uma equação que correlaciona a atividade biológica com a
estrutura de uma série de compostos homólogos, a equação deve ser empregada para
prever a atividade de um conjunto de moléculas ainda não testadas e possivelmente
ainda não sintetizadas. A habilidade de predição do modelo de QSAR é geralmente
maior para previsões interpolativas, por exemplo, para compostos que tem valores de
parâmetros dentro da região daqueles utilizados na construção do modelo [28].
1.4.4. Estudos de QSAR baseados na inibição da DHFR
Diversos estudos de QSAR baseados na inibição da enzima DHFR são
encontrados na literatura [84-91], uma boa parte destes são baseados na análise de
Hansch. Entre alguns estudos mais recentes está o planejamento de drogas derivadas
da PTX utilizando índices topológicos [92]; a avaliação de um conjunto de 345
inibidores da enzima DHFR, utilizando modelos de QSAR para correlacionar a
estrutura química com o potencial de inibição de três tipos de DHFR:
Rl, Pc e Tg
onde
as relações quantitativas foram construídas usando subconjuntos de descritores
das estruturas moleculares sendo analisados por redes neurais computacionais [93] e;
um estudo de inibidores da DHFR da
Ec também por redes neurais [94].
1.5. Regressões lineares múltiplas e procedimento estatístico
INTRODUÇÃO
- 35 -
No estudo de QSAR procura-se estabelecer uma relação quantitativa entre um
fenômeno observado, a saber, a atividade biológica, e variáveis independentes,
chamadas descritores, que são propriedades de natureza físico-químicas, estruturais,
entre outras. Isto é feito através da construção de um modelo matemático que seja
capaz de explicar o fenômeno observado e proporcione previsões dentro e, se
possível, fora dos limites investigados.
A equação pode ser obtida a partir de uma regressão linear múltipla (
RML)
pelo ajuste do conjunto de dados a um modelo linear e posteriormente deve ser
submetida a um conjunto de testes estatísticos consistentes para fazer sua validação.
O modelo linear é uma combinação linear de variáveis independentes,
também chamadas
explicativas, X
1
, X
2
,..., X
k
, capaz de reproduzir da melhor forma
possível os valores experimentais de um grupo de
n observações do fenômeno Y,
equação 16.
01122
...
kk
YXXX
β
ββ β ε
=+ + ++ + (16)
Na equação 16,
β
0
é o termo constante de ajuste, β
1
, β
2
,..., β
k
são os
coeficientes das variáveis independentes e
ε é o erro associado ao modelo. Em
estatística
β
0
, β
1
,..., β
k
são chamados de parâmetros. Nesta equação são conhecidos
apenas os valores de
X
1
, X
2
,..., X
k
e Y e não os de ε.
No modelo de regressão, para cada valor
X
1i
, X
2i
,..., X
ki
, em que o índice i
refere-se ao
i-ésimo objeto (composto) incluído no modelo, há uma distribuição de
probabilidade total para os valores de
Y. Isto significa que uma dada observação Y
i
nunca poderá ser exatamente prevista. A incerteza relativa a
Y surge por causa da
presença do erro
ε.
Tecnicamente,
estimativa do modelo é o termo correto para se referir às
equações de regressão, muito embora, regularmente, essas equações são chamadas
apenas de modelos. Em estudos de QSAR, a designação de modelo ou estimativa de
modelo é reservada para as equações de regressão que realmente representem alguma
relação entre estrutura e atividade.
A estimativa do modelo é uma equação capaz de fornecer valores previstos
para
Y, que são geralmente representados por Ŷ, equação 17.
INTRODUÇÃO
- 36 -
01122
ˆ
...
kk
YbbX bX bX=+ + ++
(17)
Nesta equação,
b
0
, b
1
,..., b
k
são estimativas para os valores dos parâmetros β
0
,
β
1
,..., β
k
, respectivamente. A construção da estimativa do modelo, representada pela
equação 17, requer a aplicação do método dos mínimos quadrados (MMQ). Este
consiste em encontrar o conjunto de valores
b
0
, b
1
,..., b
k
capaz de minimizar os
desvios (ao quadrado) entre cada um dos valores observados,
Y
i
, e os respectivos
valores previstos,
Ŷ
i
. Ou seja, deve-se minimizar o somatório dos resíduos deixados
pela regressão
()
2
1
ˆ
n
ii
i
YY
=
.
Para facilitar o desenvolvimento do método dos mínimos quadrados vamos
simplificar a equação 17 considerando apenas os dois primeiros termos, equação 18.
01
ˆ
ii
YbbX=+
(18)
Para que o valor de
()
2
1
ˆ
n
ii
i
YY
=
seja mínimo, é preciso que suas derivadas em
relação a b
0
e b
1
se anulem.
()
2
1
0
ˆ
0
n
ii
i
YY
b
=
⎛⎞
∂−
⎜⎟
⎜⎟
⎝⎠
=
(19)
()
2
1
1
ˆ
0
n
ii
i
YY
b
=
⎛⎞
∂−
⎜⎟
⎜⎟
⎝⎠
=
(20)
Substituindo a equação 18 nas equações acima e derivando, chegamos às expressões:
()
()
2
1
01
1
0
ˆ
20
n
ii
n
i
ii
i
YY
Yb bX
b
=
=
⎛⎞
∂−
⎜⎟
⎜⎟
⎝⎠
=− =
(21)
INTRODUÇÃO
- 37 -
()
()
2
1
01
1
1
ˆ
20
n
ii
n
i
ii i
i
YY
XY b bX
b
=
=
⎛⎞
∂−
⎜⎟
⎜⎟
⎝⎠
=− =
(22)
Cortando o fator -2 e desdobrando todos os somatórios, ficamos com um
sistema de duas equações lineares em b
0
e b
1
, que são chamadas equações normais.
01
11
nn
ii
ii
nb b X Y
==
+=
∑∑
(23)
2
01
111
nnn
iiii
iii
bXbX XY
===
+=
∑∑
(24)
Isolando b
0
na equação 23, obtemos:
1
11
0
nn
ii
ii
Yb X
b
n
==
=
∑∑
,
ou
01
bYbX=− . (25)
Substituindo a primeira destas expressões em 24, podemos escrever:
1
111
2
1
11
nnn
iii
nn
iii
iii
ii
Yb X X
bX XY
n
===
==
⎛⎞
⎜⎟
⎝⎠
+=
∑∑
∑∑
,
e daí
2
1
2
11
1
11
n
nn
i
ii
nn
i
ii
iii
ii
X
XY
bX XY
nn
=
==
==
⎛⎞
⎛⎞
⎜⎟
⎜⎟
⎝⎠
⎜⎟
++ =
⎜⎟
⎜⎟
⎜⎟
⎝⎠
∑∑
∑∑
isolando
b
1
, temos finalmente
INTRODUÇÃO
- 38 -
11
1
1
2
2
1
1
nn
ii
n
ii
ii
i
n
i
n
i
i
i
XY
XY
n
b
X
X
n
==
=
=
=
=
⎛⎞
⎜⎟
⎝⎠
∑∑
. (26)
Podemos calcular os valores de
b
0
e b
1
resolvendo uma única equação
matricial. Que podem ser construídas a partir das equações 23 e 24, equação 27.
tt
XXb XY=
(27)
onde
1
2
11
n
i
i
t
nn
ii
ii
nX
XX
XX
=
==
⎛⎞
⎜⎟
⎜⎟
=
⎜⎟
⎜⎟
⎝⎠
∑∑
e
1
1
n
i
i
t
n
ii
i
Y
XY
XY
=
=
⎛⎞
⎜⎟
⎜⎟
=
⎜⎟
⎜⎟
⎝⎠
Para resolver esta equação, devemos multiplicá-la à esquerda pela inversa de
X
t
X. Assim isolamos o vetor b, cujos elementos são os estimadores que procuramos:
(
)
(
)
(
)
11
tt tt
XX XX b XX XY
−−
=
(
)
1
tt
bXXXY
= . (28)
Se as matrizes
X e Y forem ampliadas adequadamente, teremos a solução
geral para o ajuste de um modelo por mínimos quadrados, não importa quantas sejam
as observações ou quantos parâmetros sejam necessários para caracterizar o modelo.
Para que a solução exista, porém, é preciso que.
a) A matriz (
X
t
X)
-1
possa ser calculada, isto é, é preciso que a matriz X
t
X não seja
singular.
b) Os modelos sejam lineares nos parâmetros, ou seja, eles não podem conter termos
como
2
0
b ou
01
bb. Esta restrição, no entanto, não é tão severa quanto parece.
A obtenção do modelo representado pela equação 17 inicia-se com a
construção de um conjunto de dados contendo uma amostra de
n observações, ou
INTRODUÇÃO
- 39 -
objetos, e m variáveis explicativas X, tabela 02. Em QSAR, isso significa selecionar
uma amostra de
n compostos, determinar experimentalmente as respectivas
atividades
Y e escolher um conjunto de m descritores físico-químicos e estruturais
que se acreditam ser capazes de explicar a atividade biológica observada. O símbolo
m refere-se ao número de descritores presentes no conjunto de dados, enquanto que o
símbolo
k, da equação 16, refere-se ao número de descritores efetivamente incluídos
nos modelos de QSAR.
Tabela 02. Conjunto de dados, contendo
n objetos e m propriedades descritivas
Um aspecto importante na construção do conjunto de dados é o
comportamento de
Y
i
, o valor observado do i-ésimo objeto. Caso fossem feitas
diversas medidas experimentais de
Y
i
, dificilmente haveria muitas coincidências. O
erro experimental do processo de medição faz com que cada medida resulte num
valor ligeiramente diferente de
Y
i
, ficando todos esses valores agrupados em torno de
sua média,
i
Y . Um dos pilares do MMQ pressupõe que os valores obtidos em
diversas medições de
Y
i
apresentam distribuição normal em torno de
i
Y
. Nos estudos
de QSAR, isso significa dizer que a execução de diversas medidas da atividade de
um dado composto resultaria numa coleção de valores que apresentaria distribuição
normal em torno de sua média. Apesar dessa suposição ser razoável, raramente vê-se
comprovação experimental desse fato. Quando muito, a atividade biológica de cada
composto é medida em triplicata, o que não é suficiente para observar qualquer
possível padrão de distribuição.
INTRODUÇÃO
- 40 -
O fato de se tentar descrever um conjunto de observações experimentais
através de um modelo linear não significa que essas possam ser bem descritas através
desse modelo. O uso de um modelo linear, bem como de qualquer outro tipo de
modelo, é feito por hipótese. Acreditando-se que as observações possam ser descritas
por esse modelo, cria-se a hipótese de que estas observações são adequadamente
descritas. Entretanto, isso não é necessariamente verdadeiro e, por isso, é necessário
testá-la, submetendo-a a testes para verificar sua veracidade na qual o modelo está
fundamentado.
1.5.1. Avaliação dos modelos lineares
A avaliação consiste em verificar se a equação do modelo adapta-se
convenientemente aos dados observados, podendo ser dividida em três partes: i)
avaliação do grau de ajuste; ii) avaliação do grau de significância e; iii) avaliação do
grau de previsibilidade.
i) Avaliação do grau de ajuste
O grau de ajuste do modelo é medido em termos de sua capacidade de
reproduzir o valor observado dos objetos. Essa parte da avaliação é feita através do
cálculo do coeficiente de correlação (
R), do coeficiente de correlação ajustado
(
R
Ajust
), que permite comparações entre os modelos com número diferente de
variáveis, e do desvio-padrão (
s), além da análise dos resíduos (Y
i
- Ŷ
i
). O que se
espera de um modelo em relação ao grau de ajuste é que ele apresente
R o mais
próximo possível de 1, que o valor de
s seja o mais próximo possível de zero e que os
resíduos apresentem distribuição normal em torno de zero.
A avaliação do ajuste do modelo pode ser feita através da
análise da
variância
(ANOVA) da regressão. Os principais objetivos da ANOVA são a)
verificar se há falta de ajuste no modelo; b) obter estimativa correta para a variância
do modelo de regressão (
s
2
) e; c) estimar o grau de ajuste e significância do modelo.
A análise da variância é construída com base nos valores de
Y (observado), Ŷ
(previsto) e
Y (média global dos valores de Y). Nesta análise é válida a identidade
representada pela equação 29.
INTRODUÇÃO
- 41 -
(
)
(
)
(
)
ˆˆ
iiii
YY YY YY−=+
(29)
Nesta equação,
(
)
i
YY
é o desvio do i-ésimo valor observado de Y em
relação à média de todos os valores de
Y,
(
)
ˆ
i
YY
é o desvio do i-ésimo valor
previsto de Y em relação à média dos seus valores e
(
)
ˆ
ii
YY
é o desvio entre o i-
ésimo valor observado de Y e o seu respectivo valor previsto, também chamado de i-
ésimo resíduo, ou e
i
(
)
ˆ
iii
eYY=− . Num modelo bem ajustado, essa diferença deve
ser pequena.
Se ambos os membros da equação 29 forem elevados ao quadrado e seus
termos forem somados sobre todos os pontos teremos:
(
)
(
)
(
)
2
2
ˆˆ
iiii
YY YY YY
⎡⎤
−= +
⎣⎦
∑∑
(
)
(
)
(
)
(
)
22
ˆˆˆˆ
2
iiiiii
YY YYYY YY=−+ +
∑∑
(30)
O somatório dos produtos
(
)
(
)
ˆˆ
iii
YYYY−−
é igual a zero, portanto,
(
)
(
)
(
)
22
2
ˆˆ
iiii
YY YY YY−= +
∑∑
(31)
Equação esta que também pode ser escrita da seguinte forma:
SS
Tot
= SS
Reg
+
SS
Res
, em que a abreviação SS refere-se à soma dos quadrados dos desvios (sum of
squares
). O termo SS
Tot
é a variabilidade total da regressão, SS
Reg
é a variabilidade
explicada pelo modelo de regressão e
SS
Res
é a variabilidade que o modelo não
consegue explicar e refere-se aos resíduos. Isto quer dizer que uma parte da variação
total das observações
Y
i
em torno da média Y é descrita pela equação de regressão, e
o restante fica por conta dos resíduos. Evidentemente, quanto maior for a fração
descrita pela regressão, melhor será o ajuste do modelo, o que podemos quantificar
por meio da razão,
INTRODUÇÃO
- 42 -
(
)
()
2
2
2
ˆ
i
Reg
Tot
i
YY
SS
R
SS
YY
==
(32)
R
2
é chamado de coeficiente de determinação do modelo. O valor máximo de R
2
é 1,
e só ocorrerá se não houver resíduo nenhum e portanto toda a variação em torno da
média for explicada pela regressão. Quanto mais perto de 1 estiver o valor de
R
2
,
melhor terá sido o ajuste do modelo às respostas observadas. A análise da variância
geralmente é apresentada no formato da tabela 03.
Tabela 03. Análise da variância (ANOVA) do modelo de regressão linear múltipla
Fonte
a
df
b
SS
c
MS
Regressão
k
(
)
2
ˆ
i
YY
SS
Reg
/df
Reg
F = MS
Reg
/s
2
Resíduo nk - 1
(
)
2
ˆ
ii
YY
s
2
= SS
Res
/df
Res
R
2
= SS
Reg
/SS
Tot
Total
n - 1
(
)
2
i
YY
SS
Tot
/df
Tot
a
df = Graus de liberdade (degrees of freedom);
b
SS = Soma dos quadrados (sum of
squares
);
c
MS = Média da soma dos quadrados (mean square).
Como pode ser observado na tabela 03, pode-se definir a média da soma dos
quadrados da regressão como
MS
Reg
= SS
Reg
/k e a média da soma dos quadrados dos
resíduos como
MS
Res
= SS
Res
/(n-k-1). Utilizando-se esta notação, defini-se o quadrado
do desvio-padrão ou estimativa da variância como
s
2
= MS
Res
. Como s
2
é a razão
entre a variabilidade não explicada pelo modelo e o número de graus de liberdade
relativo aos resíduos da regressão, quanto maior for a variabilidade dos valores de
Y
que o modelo for capaz de explicar (maior
R), menor será o desvio-padrão. O teste F
é definido como
F = MS
Reg
/s
2
, sendo portanto uma razão entre a variabilidade
explicada pelo modelo e a variabilidade que permanece sem explicação. O quadrado
INTRODUÇÃO
- 43 -
do coeficiente de correlação ajustado, citado anteriormente, é calculado de acordo
com a equação 33.
()
22 2
1
1
Ajust
k
RR R
nk
⎛⎞
=−
⎜⎟
⎝⎠
(33)
Há uma observação importante acerca da variância. A variância de um
modelo de regressão, σ
2
, somente poderá ser determinada se o verdadeiro modelo de
regressão for construído. Como isso nunca é possível, o valor de σ
2
sempre será
desconhecido.
A falta de ajuste do modelo proposto pode ser realizada através da utilização
dos resíduos da regressão. Os resíduos de um modelo de regressão contêm toda a
informação necessária à compreensão dos motivos que fazem com que o mesmo não
consiga explicar 100% da variabilidade dos valores observados de Y. Existem
basicamente dois motivos para que isso ocorra: a) presença de erros aleatórios
relativos à determinação experimental dos valores de Y e b) especificação imprópria
do modelo (falta de ajuste). Uma vez que os valores de Y tenham origem em medidas
experimentais, os erros aleatórios estarão sempre presentes e, devido a isso, nenhum
modelo consegue explicar 100% da variabilidade de Y.
Quando cada valor de Y
i
presente no conjunto de dados foi determinado uma
única vez, como normalmente é o caso das mediadas de atividade biológica, a
verificação da falta de ajuste pode ser feita qualitativamente através da análise da
distribuição dos resíduos do modelo. Nos casos em que o modelo é bem ajustado, o
conjunto de resíduos e
i
contém apenas os erros aleatórios citados anteriormente.
Portanto, a análise visual gráfica dos resíduos deverá revelar um padrão estritamente
aleatório para a distribuição dos mesmos. Quando o modelo apresenta falta de ajuste,
além dos erros aleatórios, os resíduos contêm erros sistemáticos devidos à
especificação incorreta do modelo. A presença desses erros pode ser detectada com
relativa facilidade na análise visual da distribuição dos resíduos. A figura 14 mostra
quatro situações típicas encontradas na verificação qualitativa da falta de ajuste de
modelos lineares.
INTRODUÇÃO
- 44 -
Figura 14. Algumas situações encontradas na investigação qualitativa da falta de
ajuste [95].
Nos casos 1 e 2 não há falta de ajuste pois os pontos estão dispostos
aleatoriamente ao longo da reta ajustada. Portanto, o modelo obtido nestas situações
deve ser adequado aos dados observados. Os casos 3 e 4 são típicos da falta de ajuste
dos modelos, observa-se clara falta de ajuste devido ao padrão não aleatório da
distribuição dos pontos.
ii) Avaliação do grau de significância
INTRODUÇÃO
- 45 -
O grau de significância é medido através da execução de testes de validação
(teste estatístico de hipótese), sendo que cada teste destina-se a verificar a
significância de diferentes partes do modelo.
Para testar a significância estatística de R
2
, aplica-se um teste de hipótese
conhecido como teste F, cujo valor é obtido na tabela ANOVA associada à
regressão. O teste F verifica o quanto da variabilidade de Y pose ser explicada pelas
variáveis X
1
, X
2
,..., X
k
, e o quanto pode ser atribuída ao efeito do erro aleatório ε. Para
validar R
2
através do teste F, é preciso comparar o valor de F obtido no modelo com
o valor de referência. Este, em geral, se refere ao nível de confiança de 95% e pode
ser encontrado em tabelas apropriadas [95].
Os valores do teste F de dois ou mais modelos de regressão, que possuam
diferentes valores de n e k, em princípio não podem ser comparados. Nesse caso,
deve-se calcular as probabilidades (p-valor) associadas aos valores de F. O p-valor
fornece um meio seguro de comparação do nível de significância de modelos com
diferentes números de objetos e variáveis. Um valor de p = 0,0001, significa que o
valor de R
2
é estatisticamente significante e o erro envolvido na afirmação dessa
hipótese é de 0,01%. Para dois modelos, aquele que tiver o menor p-valor, terá maior
significância estatística.
A significância estatística dos coeficientes da regressão é testada mediante o
cálculo de seus intervalos de confiança (T), geralmente referentes a um nível de
confiança de 95% (t). O resultado do teste é mostrado em associação com o
respectivo coeficiente, equação 34.
(
)
(
)
(
)
(
)
00 111
ˆ
... ...
iii kkk
Yb T b TX b TX b TX+± ++± ++± (34)
O valor de T
i
é calculado de acordo com a equação 35.
()
()
1
1,95
,
..'
i
nk
ii
Tst XX
−−
= (35)
em que s é o desvio-padrão da regressão, t
(n-k-1,95)
é o valor da distribuição t de
Student para a probabilidade de 95% e o argumento da raiz quadrada refere-se ao
elemento diagonal (linha i, coluna i) da matriz resultante da operação indicada com a
INTRODUÇÃO
- 46 -
matriz das variáveis independentes, X. Se T
i
for maior do que o valor do próprio
coeficiente b
i
, significa que o valor b
i
= 0 pertence ao intervalo de confiança de 95%
considerado. Isso implica em que a variável X
i
, em relação à qual b
i
está associada,
não contribui para a explicação da variabilidade dos valores observados de Y.
Naturalmente quanto mais T
i
se aproxima de b
i
, menor será a significância estatística
de b
i
.
iii) Avaliação do grau de previsibilidade
O grau de previsibilidade do modelo é testado através da validação cruzada
(cross validation) [96-98]. O processo de validação cruzada consiste nas seguintes
etapas: (a) excluir um dos objetos do modelo; (b) reconstruir o modelo sem esse
objeto; (c) utilizar esse modelo para calcular o valor do objeto excluído; (d) obter o
desvio entre o valor observado e o valor previsto para esse objeto; (e) refazer as
etapas a-d para os demais objetos do conjunto de dados, um por vez; (f) calcular o
valor da estatística PRESS (PREdictive Sum of Squares), que corresponde à soma dos
quadrados dos desvios obtidos no item d e; (g) calcular o quadrado do coeficiente de
correlação da validação cruzada (Q
2
) e o desvio-padrão da validação cruzada (s
PRESS
).
A forma de calcular PRESS, Q
2
e s
PRESS
é mostrada nas equações 36, 37 e 38.
(
)
2
ˆ
P
RESS Y Y=−
(36)
()
2
2
1
P
RESS
Q
YY
=−
(37)
1
PRESS
P
RESS
s
nk
=
−−
(38)
Um modelo com elevado grau de previsibilidade para objetos não incluídos
no mesmo apresentaQ
2
próximo de 1 e s
PRESS
próximo de zero.
INTRODUÇÃO
- 47 -
Capítulo 2
Objetivos
2.1. Objetivo Geral:
Estudar as relações entre propriedades moleculares, atividade e seletividade
de inibidores da enzima DHFR, através do docking molecular, do QSAR e dos
cálculos de mecanismos enzimáticos.
2.2. Objetivos Específicos:
Classificar as drogas derivadas do TMP e TMQ em conjunto de treinamento,
utilizado para construção dos modelos, e conjunto de teste dos modelos,
através de sorteio;
Modelar a estrutura tridimensional das drogas derivadas e da enzima DHFR
do Pc e humana;
Localizar os resíduos de aminoácidos que compõem o sítio ativo das enzimas
estudadas;
Alinhar sequencialmente os resíduos de aminoácidos das enzimas;
Investigar as interações estabelecidas entre as drogas e os resíduos de
aminoácidos presentes no sítio ativo da enzima DHFR através de estudos de
docking;
OBJETIVOS
- 49 -
Avaliar as ligações de hidrogênio formadas entre as drogas e os resíduos de
aminoácidos do sítio ativo;
Calcular as energias das ligações de hidrogênio que serão utilizadas como
descritores na construção dos modelos;
Calcular as propriedades, quânticas e clássicas, das drogas, para a construção
do conjunto de descritores moleculares;
Estabelecer modelos de QSAR para o conjunto de treinamento através de
regressões lineares múltiplas;
Avaliar os modelos obtidos através de procedimentos estatísticos: R
2
, teste F,
análise de resíduos, etc.;
Avaliar a capacidade de previsão dos modelos obtidos aplicando-os as
estruturas as estruturas do grupo teste;
Propor um conjunto de novas drogas com potencial atividade e seletividade
baseando-se nos estudos de modelagem molecular;
Prever a atividade e seletividade das drogas propostas utilizando os modelos
de QSAR construídos;
Estudar o mecanismo da reação enzimática de conversão do folato a
diidrofolato a tetraidrofolato.
OBJETIVOS
- 49 -
Capítulo 3
Parte Experimental
3.1. Classificação das drogas derivadas do TMP e TMQ
Com base em estudos de síntese e medida da atividade inibitória de drogas
antifólicas descritas na literatura, selecionamos duas séries homólogas com valores
de IC
50
medidos contra a DHFR do Pc, Tg, Ma e Rl. A primeira série escolhida é
intimamente relacionada com a trimetoprima [4,7,99,100] e a segunda é derivada do
trimetrexato [5, 101-103].
A série homóloga que tem como composto base o TMP foi, na realidade,
idealizada para ser uma classe de compostos estruturalmente híbridos da
trimetoprima e piritrexina, figura 15, e, dessa forma, unir as características de alta
seletividade apresentada pelo TMP e a alta potência do PTX.
PARTE EXPERIMENTAL
- 51 -
Figura 15. Representação da estrutura do TMP em (a), PTX em (b), híbridos
estruturais em (c) sem o grupo benzila (p
1
-p
18
) e híbridos com o grupo benzila (p
19
-
p
30
) em (d). As partes destacadas referem-se aquelas derivadas dos precursores TMP
e PTX. Os átomos numerados referem-se aqueles utilizados para o cálculo das
propriedades atômicas.
Na tabela 04, são apresentados os grupos substituintes das drogas homólogas
da trimetoprima, bem como os valores de atividade (IC
50
) contra o Pc, Tg, Ma e Rl e;
os índices de seletividade (SI) que são definidos como o quociente entre a atividade
N
N
OMe
OMe
OMe
H
2
N
NH
2
N
NN
H
2
N
H
2
N
CH
3
OMe
OMe
(a)
(b)
N
N
NH
2
H
2
N
R
1
R
2
R
3
R
4
4
15
5
6
3
14
2
1
(d)
R
5
N
N
NH
2
H
2
N
R
1
R
2
R
3
R
4
4
15
5
6
3
14
2
1
(c)
PARTE EXPERIMENTAL
- 52 -
das drogas em relação à DHFR do fígado de rato e à DHFR dos parasitas (IC
50
Rl /
IC
50
parasita).
PARTE EXPERIMENTAL
- 52 -
Tabela 04. Atividades e seletividades da série homóloga ao TMP e PTX [4,7,99,100]
IC
50
(µM) SI
Drogas R
1
R
2
=R
3
R
4
R
5
Pc Tg Ma Rl
Pc Tg Ma
p
1
OCH
3
H O(CH
2
)
4
CH
3
-
19,000 6,500 0,310 44,000
2,300 6,800 140,000
p
2
OCH
3
H O(CH
2
)
5
CH
3
-
14,000 9,200 0,390 29,000
2,100 3,100 74,000
p
3
OCH
3
H O(CH
2
)
6
CH
3
-
5,600 5,000 0,890 11,000
1,900 2,100 12,000
p
4
OCH
3
H O(CH
2
)
7
CH
3
-
44,000 15,000 3,300 30,000
0,690 2,000 9,100
p
5
OCH
3
H O(CH
2
)
8
CH
3
-
51,000 32,000 32,000 86,000
1,700 2,700 2,700
p
6
OCH
3
H O(CH
2
)
3
COOH -
0,250 0,180 0,005 2,700
11,000 16,000 560,000
p
7
OCH
3
H O(CH
2
)
4
COOH -
0,054 0,110 0,058 4,600
85,000 42,000 79,000
p
8
OCH
3
H O(CH
2
)
5
COOH -
0,800 0,480 0,150 17,000
21,000 35,000 110,000
p
9
OCH
3
H O(CH
2
)
6
COOH -
2,600 0,180 0,190 12,000
4,500 65,000 63,000
p
10
OCH
3
H O(CH
2
)
7
COOH -
7,100 0,360 0,130 12,000
1,700 33,000 92,000
p
11
OCH
3
H O(CH
2
)
8
COOH -
4,800 0,430 0,150 12,000
2,500 28,000 80,000
p
12
OCH
3
H C C(CH
2
)
2
COOH -
0,130 0,097 0,004 4,000
31,000 41,000 910,000
p
13
OCH
3
H C
C(CH
2
)
3
COOH -
0,028 0,032 0,008 2,200
79,000 69,000 280,000
p
14
OCH
3
H C C(CH
2
)
4
COOH -
0,870 0,072 0,041 25,000
28,000 340,000 590,000
p
15
OCH
3
H (CH
2
)
4
COOH -
0,150 0,058 0,035 3,200
21,000 54,000 91,000
PARTE EXPERIMENTAL
- 53 -
Atividades e seletividades da série homóloga ao TMP e PTX
p
16
OCH
3
H (CH
2
)
5
COOH -
0,150 0,008 0,016 4,100
27,000 490,000 260,000
p
17
OCH
3
H (CH
2
)
6
COOH -
0,530 0,030 0,089 4,600
8,600 150,000 52,000
p
18
H OCH
3
CC(CH
2
)
3
COOH -
0,001 0,034 0,002 5,000
5000,000 150,000 2100,000
p
19
OCH
3
H OCH
2
3-COOH
0,890 0,600 0,120 19,000
21,000 31,000 150,000
p
20
OCH
3
H OCH
2
4-COOH
1,200 2,000 0,060 21,000
17,000 11,000 340,000
p
21
OCH
3
H C=CCH
2
O 2-COOH
2,300 0,500 0,036 6,200
2,700 13,000 170,000
p
22
OCH
3
H C=CCH
2
O 3-COOH
5,600 1,600 0,057 14,000
2,400 8,300 240,000
p
23
OCH
3
H CH=CHCH
2
O 2-COOH
8,600 2,500 0,380 6,400
0,740 2,600 17,000
p
24
OCH
3
H (CH
2
)
3
O 2-COOH
7,800 0,710 0,310 25,000
3,200 35,000 81,000
p
25
OCH
3
H (CH
2
)
3
O 3-COOH
1,100 0,210 0,025 4,000
3,600 19,000 160,000
p
26
OCH
3
H C
C 2-COOH
4,100 1,900 0,100 25,000
6,000 13,000 250,000
p
27
OCH
3
H C
C 3-COOH
0,023 0,006 0,002 0,650
28,000 120,000 430,000
p
28
OCH
3
H C
C 4-COOH
1,300 0,340 0,004 8,200
6,300 24,000 2200,000
p
29
OCH
3
H (CH
2
)
2
4-COOH
7,100 1,500 0,025 13,000
1,800 8,700 520,000
p
30
H OCH
3
C
C 4-COOH
1,200 0,420 0,008 88,000
73,000 210,000 11000,000
TMP
H OCH
3
OCH
3
-
12,000 2,800 0,300 180,000
14,000 65,000 610,000
PARTE EXPERIMENTAL
- 54 -
Os compostos derivados do TMQ apresentam estrutura básica apresentada na
figura 16. Os números de 1 a 11 indicam os átomos que foram considerados nos
cálculos dos descritores atômicos, a escolha deve-se ao fato de que os mesmos são
conservados em todas as estruturas das drogas utilizadas na elaboração do modelo de
QSAR.
N
N
R
1
R
3
R
4
NH
2
H
2
N
R
2
R
5
5
7
11
8
2
6
10
3
9
4
1
12
( )
n
Figura 16. Estrutura base dos derivados do trimetrexato.
Um total de 37 compostos homólogos ao trimetrexato (q
1
-q
37
), PTX e o
próprio TMQ, foram inicialmente utilizados na elaboração e teste dos modelos de
QSAR. Após a elaboração destes modelos, foram encontradas na literatura [3] mais
34 estruturas (q
38
-q
72
) com medidas de atividade contra os parasitos estudados. Estes
últimos foram utilizados somente para completar o conjunto de teste dos modelos.
Todos os grupos substituintes das drogas estruturalmente derivadas do TMQ,
incluindo o próprio e o PTX, seus valores de atividade contra a DHFR do Pc, Tg, Rl
e, seus índices de seletividade são apresentados na tabela 05.
PARTE EXPERIMENTAL
- 55 -
Tabela 05. Atividades e seletividades da série homóloga ao TMQ [5, 101-103]
IC
50
(µM) SI
Drogas n R
1
R
2
R
3
R
4
R
5
Pc Tg Rl
Pc Tg
q
1
0 N CH
3
CH
2
NH 3,4,5-(OCH
3
)
3
0,086 0,007 0,002
0,024 0,284
q
2
0 N CH
3
CH
2
NCH
3
3,4,5-(OCH
3
)
3
0,013 0,001 0,008
0,585 8,941
q
3
0 N CH
3
CH
2
NH 3,4,5-(Cl)
3
0,063 0,012 0,033
0,524 2,750
q
4
0 N CH
3
CH
2
NCH
3
3,4,5-(Cl)
3
0,105 0,038 0,036
0,347 0,953
q
5
0 N CH
3
CH
2
NH 3,4-(OCH
3
)
2
0,044 0,009 0,008
0,173 0,864
q
6
0 N CH
3
CH
2
NCH
3
3,4-(OCH
3
)
2
0,320 0,029 0,044
0,138 1,517
q
7
0 N CH
3
CH
2
NCH
3
2,5-(OCH
3
)
2
0,216 0,030 0,407
1,884 13,522
q
8
0 N CH
3
CH
2
NH 3,4-(Cl)
2
0,320 0,028 0,053
0,166 1,893
q
9
0 N CH
3
CH
2
NCH
3
3,4-(Cl)
2
0,100 0,027 0,042
0,420 1,556
q
10
0 N CH
3
CH
2
NH H
0,080 0,017 0,170
2,125 10,000
q
11
0 N CH
3
CH
2
NH 2-OCH
3
0,117 0,023 0,169
1,444 7,348
q
12
0 N CH
3
CH
2
NH 3-OCH
3
0,069 0,007 0,080
1,163 10,824
q
13
0 N CH
3
CH
2
NH 4-OCH
3
0,095 0,012 0,056
0,583 4,633
q
14
0 N CH
3
CH
2
NH 2-Cl
0,047 0,007 0,088
1,872 12,394
PARTE EXPERIMENTAL
- 56 -
Atividades e seletividades da série homóloga ao TMQ
q
15
0 N CH
3
CH
2
NH 3-Cl
0,023 0,011 0,037
1,609 3,364
q
16
0 N CH
3
CH
2
NH 4-Cl
0,055 0,019 0,051
0,921 2,684
q
17
0 N CH
3
CH
2
NH 4-Br
0,081 0,010 0,035
0,432 3,674
q
18
0 N CH
3
CH
2
NCH
3
3-OCH
3
0,030 0,006 0,018
0,600 2,857
q
19
0 N CH
3
CH
2
NCH
3
4-OCH
3
0,035 0,007 0,013
0,371 1,781
q
20
0 N CH
3
CH
2
NCH
3
2-Cl
0,084 0,018 0,100
1,190 5,556
q
21
0 N CH
3
CH
2
NCH
3
4-Cl
0,029 0,005 0,026
0,897 4,815
q
22
0 N CH
3
CH
2
NCH
3
4-Br
0,037 0,030 0,036
0,973 1,200
q
23
0 N H CH
2
NH 3,4,5-(OCH
3
)
3
1,500 0,300 1,900
1,267 6,333
q
24
0 N H CH
2
NCH
3
3,4,5-(OCH
3
)
3
0,240 0,009 0,280
1,167 31,111
q
25
0 N H CH
2
NH H
2,220 0,270 2,300
1,036 8,519
q
26
0 N H CH
2
NH 3-OCH
3
0,520 0,210 0,790
1,519 3,762
q
27
0 N H CH
2
NH 2,5-(OCH
3
)
2
6,100 0,450 5,000
0,820 11,111
q
28
0 N H CH
2
NH 3,4-(OCH
3
)
2
0,430 0,330 0,560
1,302 1,697
q
29
0 N H CH
2
NH 2,5-(Cl)
2
0,440 0,300 6,900
15,682 23,000
q
30
0 N H CH
2
NH 3,4-(Cl)
2
0,250 0,230 0,480
1,920 2,087
PARTE EXPERIMENTAL
- 57 -
Atividades e seletividades da série homóloga ao TMQ
q
31
0 N H CH
2
NH 3,4,5-(Cl)
3
0,350 0,980 4,600
13,143 4,694
q
32
0 N H CH
2
NH 2,3-C
4
H
4
0,070 0,096 0,600
8,571 6,250
q
33
0 N H CH
2
NH 3,4-C
4
H
4
2,000 0,830 4,900
2,450 5,904
q
34
0 N CH
3
CH
2
NCH
3
H
100,000 - 395,000
3,950 -
q
35
0 N CH
3
CH
2
NCH
3
3,4-(Cl)
2
0,131 0,110 0,180
1,374 1,636
q
36
0 N CH
3
CH
2
NCH
3
3,4,5-(Cl)
3
0,196 1,980 0,270
1,378 0,136
q
37
0 N H NCH
3
CH
2
2,5-(OCH
3
)
2
0,084 0,006 0,057
0,679 9,048
q
38
0 N H CH
2
- 2,5-(OCH
3
)
2
0,280 0,034 0,054
0,190 1,600
q
39
0 N H CH
2
- 3,4-(OCH
3
)
2
0,240 0,064 0,210
0,880 3,300
q
40
0 N H CH
2
- 3,5-(OCH
3
)
2
0,210 0,036 0,370
1,800 10,300
q
41
0 N H CH
2
- 2-Cl
0,510 0,017 0,073
0,140 4,300
q
42
0 N H CH
2
- 4-F
0,520 0,040 0,130
0,250 3,300
q
43
0 CH H CH
2
- 2-OCH
3
0,310 0,011 0,054
0,170 4,900
q
44
0 CH H CH
2
- 3-OCH
3
0,200 0,010 0,038
0,190 3,800
q
45
0 CH H CH
2
- 4-OCH
3
0,230 0,018 0,100
0,430 5,600
q
46
0 CH H CH
2
- 2,5-(OCH
3
)
2
0,110 0,010 0,009
0,085 0,940
PARTE EXPERIMENTAL
- 58 -
Atividades e seletividades da série homóloga ao TMQ
q
47
0 CH H CH
2
- 3,4-(OCH
3
)
2
0,092 0,013 0,028
0,300 2,200
q
48
0 CH H CH
2
- 3,5-(OCH
3
)
2
0,110 0,010 0,030
0,270 3,000
q
49
0 CH H CH
2
- 3,4,5-(OCH
3
)
3
0,150 0,017 0,042
0,280 2,500
q
50
0 CH H CH
2
- 2-Cl
0,110 0,006 0,011
0,100 1,200
q
51
0 CH H CH
2
- 3-Cl
0,170 0,016 0,040
0,240 2,500
q
52
0 CH H CH
2
- 4-Cl
0,150 0,022 0,040
0,270 1,800
q
53
0 CH H CH
2
- 3,4-(Cl)
2
0,050 0,056 0,028
0,560 0,500
q
54
0 CH H CH
2
- 4-F
0,670 0,026 0,068
0,100 2,600
q
55
0 N H NH CH
2
H
2,700 0,520 2,100
0,800 4,000
q
56
0 N H NCH
3
CH
2
H
0,068 0,032 0,140
2,100 4,400
q
57
0 N H NH CH
2
3,4,5-(OCH
3
)
3
14,100 0,350 3,300
0,230 9,400
q
58
0 N H NCH
3
CH
2
3,4,5-(OCH
3
)
3
0,061 0,014 0,033
0,500 2,400
q
59
0 N H NH CH
2
3,4,5-(OCH
3
)
3
15,300 0,670 3,240
0,200 4,800
q
60
0 N H NCH
3
CH
2
3,4,5-(OCH
3
)
3
0,079 0,026 0,030
0,400 1,200
q
61
0 N H NH CH
2
3,4,5-(OCH
3
)
3
20,700 0,230 1,200
0,060 5,200
q
62
0 N H NH CH
2
3,4,5-(OCH
3
)
3
5,500 0,480 1,100
0,200 2,300
PARTE EXPERIMENTAL
- 59 -
Atividades e seletividades da série homóloga ao TMQ.
q
63
0 N H NH CH
2
3,4-(OCH
3
)
2
4,800 0,730 1,500
0,300 2,100
q
64
0 N H NH CH
2
3,4-(OCH
3
)
2
5,700 1,200 3,400
0,600 2,800
q
65
0 N H NCH
3
CH
2
3,4-(OCH
3
)
2
0,076 0,031 0,072
0,900 2,300
q
66
0 N H NH CH
2
3,4-(OCH
3
)
2
3,800 0,310 0,350
0,090 1,100
q
67
0 N H NH CH
2
2,3-C
4
H
4
3,900 0,980 0,240
0,060 0,200
q
68
0 N H NH CH
2
4-OCH
3
, 2,3-C
4
H
4
8,200 0,380 0,430
0,050 1,100
q
69
0 N H NH CH
2
6-OCH
3
, 2,3-C
4
H
4
15,400 0,710 0,370
0,020 0,500
q
70
0 N H NH CH
2
4-OC
6
H
5
24,300 3,700 2,900
0,120 0,800
q
71
1 N H NH CH
2
H
1,940 4,450 0,280
0,140 0,060
q
72
1 N H NCH
3
CH
2
H
1,800 0,920 1,400
0,800 1,500
PTX
0 N CH
3
CH
2
- 2,5-(OCH
3
)
2
0,031 0,011 0,002
0,048 0,136
TMQ
0 CH CH
3
CH
2
NH 3,4,5-(OCH
3
)
3
0,042 0,010 0,003
0,071 0,300
PARTE EXPERIMENTAL
- 60 -
As duas séries homólogas estudadas foram divididas um conjunto de
treinamento, utilizado para a determinação dos modelos, e num conjunto de teste
para avaliar os modelos. Essa divisão foi realizada através de sorteio.
Das 32 drogas derivadas do TMP aquelas que compõem o conjunto de
treinamento são: p
1
-p
7
, p
9
, p
11
, p
14
-p
23
e p
26
-p
28
(22 estruturas); e, aquelas que
compõem o conjunto teste: p
8
, p
10
, p
12
, p
13
, p
18
, p
24
, p
25
, p
30
, TMP e PTX (10
estruturas).
O sorteio para a série homóloga ao TMQ levou em conta somente o conjunto
inicial de 37 estruturas (q
1
-q
37
), já que as demais 34 estruturas (q
38
-q
72
) ainda não
tinham sido localizadas, por isso, estas foram empregadas somente na etapa de
avaliação dos modelos. O conjunto de treinamento sorteado foi: q
2
-q
7
, q
9
, q
11
-q
14
,
q
16
-q
22
, q
26
, q
28
-q
31
, q
36
, q
37
, PTX e TMQ (27 estruturas); e o conjunto de teste ficou:
q
1
, q
8
, q
10
, q
15
, q
23
-q
25
, q
27
e q
32
-q
35
(12 estruturas), juntamente com as 34 estruturas
restantes q
38
-q
72
, totalizando 46 estruturas para os testes. No entanto, a estrutura q
34
foi excluída deste conjunto por apresentar valores de IC
50
duvidosos, como pode ser
verificado na tabela 1 da referência [5]. Assim, o total de estruturas utilizadas na
avaliação do modelo é 45.
3.2. Modelagem computacional das estruturas
Todas as estruturas dos grupos de treinamento e grupo de teste foram
construídas por modelagem molecular utilizando os recursos disponíveis no
programa CAChe. A geometria foi otimizada completamente para cada molécula
livre no estado gasoso, ou seja, sem considerar efeito de solvente ou outras
interações. A otimização foi realizada através de cálculos semi-empíricos do tipo
AM1.
As estruturas das proteínas aqui estudadas foram obtidas através do banco de
dados PDB, estas foram determinadas por cristalografia de raios-x. Utilizamos as
enzimas DHFR do Pc, código PDB: 1DYR, e DHFR humana (Homo sapiens, Hs),
código PDB: 1PD9. Não localizamos as enzimas DHFR do Tg e do Ma, muito
provavelmente por ainda não terem sido resolvidas.
PARTE EXPERIMENTAL
- 61 -
Baseando-se no fato de que a maior parte dos resíduos de aminoácidos, no
sítio ativo da DHFR humana e do rato são conservados [104], a enzima humana foi
utilizada como modelo para avaliar as interações entre as drogas estudadas e os
aminoácidos do sítio ativo, possibilitando, desse modo, a utilização da energia dessas
interações como descritores na construção dos modelos de atividade para o Rl e
modelos de seletividade.
Modelamos as estruturas das enzimas supra citadas a partir do arquivo
disponível no PDB, utilizando a interface gráfica do programa CAChe. Inicialmente
fixamos todos os átomos em suas posições cristalográficas originais, com exceção
dos átomos de hidrogênio que foram adicionados na seqüência. Procedemos a um
balanceamento de cargas do sistema, corrigimos alguns problemas de ligação e
estados de oxidação que eventualmente são encontrados nos cofatores enzimáticos
(NADPH, NADP
+
) e drogas complexadas, 2,5-diamino-5-metil-6-[(3,4,5-trimetoxi-
N-metilanilina)metil]pirido[2,3-d]pirimidina (CO4) na enzima humana e
trimetoprima (TOP) na enzima do P. carinii.
As posições dos átomos de hidrogênio adicionados foram ajustadas através de
cálculos de mecânica molecular do tipo MM3.
Localizamos o sítio ativo das enzimas através da seleção dos resíduos de
aminoácidos, moléculas de água e cofatores enzimáticos vizinhos, aproximadamente
a uma esfera de 3 Å do substrato.
3.3. Alinhamento da seqüência das proteínas
Procedemos ao alinhamento seqüencial [105] dos resíduos de aminoácidos
das duas enzimas estudadas para verificar a semelhança em sua estrutura primária,
bem como para avaliar diferenças entre os aminoácidos que compõem o sítio ativo da
DHFR do Hs e do Pc. As seqüências foram posicionadas de acordo com a máxima
relação no alinhamento usando o BLOSUM50 [106] que é uma matriz de substituição
no algoritmo de alinhamento Needleham-Wunsh [107] implementados no programa
CAChe.
PARTE EXPERIMENTAL
- 62 -
3.4. Docking por superposição
Os estudos de docking foram realizados no programa CaChe WorkSystem Pro
Versão 6.01, a partir da superposição das moléculas estudadas (conjunto treinamento
e teste) sobre os ligantes complexados nos sítios ativos das enzimas DHFR do Pc
(TMP) e humana (CO4), ambas contendo NADPH. As conformações das estruturas
foram ajustadas manualmente através de mudanças nos valores de ângulos de diedro,
observando a cavidade da superfície do sítio ativo para maximizar as interações com
os resíduos de aminoácidos.
Na seqüência, a geometria dos novos sistemas foram otimizadas através de
cálculos de mecânica molecular MM3, nesta etapa todos os átomos do sítio ativo,
resíduos de aminoácidos, moléculas de água, cofator NADPH e droga, foram
liberados da condição de rigidez imposta anteriormente pela fixação dos mesmos em
suas coordenadas obtidas por cristalografia de raios-x. Isto possibilitou uma melhor
acomodação da nova estrutura molecular na cavidade do sítio ativo.
Identificamos as ligações de hidrogênio estabelecidas entre os resíduos de
aminoácidos e os átomos das drogas. Selecionamos estes pares para posteriormente
calcular as energias destas interações.
3.5. Cálculos dos descritores moleculares
Com as geometrias das drogas otimizadas, procedemos ao cálculo das
propriedades físico-químicas e estruturais que foram utilizadas como descritores
moleculares. Todas as propriedades foram calculadas no programa CAChe. Os
coeficientes de partição foram calculados pelo esquema de fragmentos moleculares;
as propriedades eletrônicas foram calculadas através do método semi-empírico AM1;
a área de superfície acessível ao solvente foi determinada utilizando cálculos AM1 e
o modelo COSMO; as energias das ligações de hidrogênio foram calculadas a partir
da diferença entre os calores de formação (
f
H) obtidos pelos cálculos AM1 do par
droga-aminoácido e, da droga e do aminoácido separadamente, equação 39.
()
(
)
(droga-aminoácido) (droga) (aminoácido)Hb f f f
EH H H=∆ +
(39)
PARTE EXPERIMENTAL
- 63 -
Todos os descritores que foram calculados para a elaboração dos modelos são
apresentados na tabela 06
Tabela 06. Descritores calculados para a elaboração dos modelos de QSAR
Descritores Definição
a,c
LogP Coeficiente de partição octanol-água.
a,c
0
χ,
1
χ,
2
χ Índices de conectividade de ordem 0, 1 e 2.
a,c
0
χ
v
,
1
χ
v
,
2
χ
v
Índices de conectividade de valência de ordem 0, 1 e 2.
a,c
1
κ,
2
κ,
3
κ Índices de forma de ordem 1, 2 e 3.
a,d
AS Área da superfície de van der Waals.
a,d
VS Volume da superfície de van der Waals.
a,d
SASA Área de superfície acessível ao solvente.
a,d
f
H
Calor de formação.
a,d
ε
HOMO
, ε
LUMO
Energias do HOMO e do LUMO
a,d
µ
Momento de dipolo molecular.
a,d
EA Afinidade eletrônica.
a,d
IP Potencial de ionização.
a,d
η
Dureza absoluta = (ε
HOMO
- ε
LUMO
)/2.
a,d
χ
M
Eletronegatividade molecular = (ε
HOMO
+ ε
LUMO
)/2.
b,d
ρ
HOMO
, ρ
LUMO
Densidade do HOMO e do LUMO.
b,d
Q Cargas atômicas parciais.
b,d
f
r
E
Densidade eletrônica de fronteira eletrofílica.
b,d
f
r
N
Densidade eletrônica de fronteira nucleofílica.
b,d
f
r
R
Densidade eletrônica de fronteira radicalar.
b,d
S
E,A
Superdelocalizabilidade eletrofílica.
b,d
S
N,A
Superdelocalizabilidade nucleofílica.
b,d
S
R,A
Superdelocalizabilidade radicalar.
a,d
E
Hb
Energia da ligação de hidrogênio do par droga-aminoácido.
a
Propriedades calculadas considerando toda a estrutura molecular,
b
propriedades
atômicas calculadas para os átomos enumerados em cada estrutura,
c
propriedades
clássicas e
d
propriedades obtidas por métodos quânticos semi-empíricos.
PARTE EXPERIMENTAL
- 64 -
Podemos diferenciar as propriedades calculadas em clássicas ou quânticas e,
atômicas ou moleculares. A obtenção das propriedades clássicas não leva em
consideração quaisquer aspectos eletrônicos, enquanto que as quânticas estão
diretamente relacionadas a estes. Os descritores atômicos foram calculados somente
para os átomos enumerados nas estruturas dos homólogos do TMP (N
1
, C
2
, C
3
, C
4
,
N
5
, C
6
, N
14
e N
15
), figura 15, e dos homólogos do TMQ (C
1
, N
2
, C
3
, C
4
, C
5
, N
6
, C
7
,
C
8
, C
9
, C
10
, N
11
e N
12
), figura 16. As propriedades moleculares foram calculadas
considerando toda a estrutura da molécula.
3.6. Regressões e modelos de QSAR
Os modelos de QSAR estabelecidos neste trabalho foram obtidos através de
RML. As técnicas de análise aqui utilizadas estão disponíveis no programa
STATISTICA 6.0 [108], este pacote permitiu-nos construir matrizes de correlação,
proceder às regressões lineares múltiplas e análise da variância.
Para encontrar a melhor previsão de modelo de QSAR construímos,
inicialmente, uma matriz de correlação entre os valores dos descritores calculados e
as medidas de atividade biológica e índices de seletividade. A partir dessa matriz foi
possível identificar as propriedades que melhor descrevem o valor de lnIC
50
ou lnSI
para cada DHFR. Escolhemos o descritor que apresentava maior correlação,
elaboramos uma regressão e, procedemos à análise dos resíduos desta regressão.
Utilizamos os resíduos da regressão para construir uma nova matriz de correlação e
identificar a propriedade que melhor descreveria este conjunto de resíduos.
Consideramos este novo descritor juntamente com o anterior para proceder a uma
nova regressão. Refizemos estas etapas até estabelecer uma equação que apresentasse
parâmetros estatísticos de avaliação dos modelos aceitáveis, como um valor de R
2
o
mais próximo de 1 e, um valor de teste F maior do que o tabelado a 95% de
confiança.
Realizamos a análise da variância e construímos uma tabela de ANOVA para
cada modelo obtido. Aplicamos os modelos obtidos as drogas dos conjuntos de teste
e, calculamos os erros na determinação dos valores de lnIC
50
e lnSI.
PARTE EXPERIMENTAL
- 65 -
3.7. Proposição do conjunto de novas estruturas
Procedemos à proposição de conjuntos de novas drogas potencialmente ativas
e/ou seletivas. Estes conjuntos foram construídos através de uma análise das
interações estabelecidas entre o TMP, TMQ, PTX e a superfície da cavidade do sítio
ativo da DHFR do Pc. Estas interações foram utilizadas para sugerir modificações
estruturais nos compostos base.
As novas estruturas formuladas foram modeladas no programa CAChe. Suas
geometrias foram otimizadas através de cálculos semi-empíricos AM1 para as
moléculas livres no estado gasoso. Os descritores que apareceram nos modelos de
QSAR obtidos foram calculados para os conjuntos propostos. As equações de QSAR
foram aplicadas na previsão da atividade e seletividade destas novas drogas. As
estruturas indicadas para uma possível síntese e avaliação biológica foram escolhidas
através dos valores de IC
50
e SI previstos.
3.8. Estudos do mecanismo da reação enzimática
De posse da estrutura cristalográfica da enzima DHFR humana (1PD9) já
modelada e refinada, realizamos o docking por superposição sobre o ligante CO4
para incluir na cavidade do sítio ativo desta enzima a molécula do folato. Ajustamos
as posições dos grupos moleculares do folato com base na cavidade da superfície do
sítio ativo e, otimizamos a geometria do novo sistema através de cálculos de
mecânica molecular MM3.
Realizamos ainda uma otimização da geometria do complexo formado entre
enzima, folato de NADPH, através de cálculos semi-empíricos AM1 utilizando o
escalonamento MOZYME, sendo que todos os átomos do sistema, com exceção
daqueles que compõem o sítio ativo, foram mantidos fixos em suas posições
cristalográficas. Calculamos os orbitais de fronteira do sistema proteico (HOMO-10
até o LUMO+9) em duas situações diferentes: uma com o sistema livre em fase
gasosa, e outra considerando o efeito de solvente, no caso água (constante dielétrica
igual a 7,8), através do modelo COSMO.
PARTE EXPERIMENTAL
- 66 -
Avaliamos as etapas de protonação e transferência do íon hidreto do
mecanismo enzimático da conversão de folato a diidrofolato e a tetraidrofolato,
através da localização dos orbitais de fronteira.
RESULTADOS E DISCUSSÕES
- 67 -
Capítulo 4
Resultados e Discussões
4.1. Estruturas das drogas e das enzimas modeladas
Tendo em vista a enorme quantidade de estruturas moleculares modeladas,
neste capítulo serão apresentados apenas os resultados obtidos para a trimetoprima,
piritrexina e trimetrexato livres e, complexados nas enzimas DHFR do Pc e Hs,
levando em consideração o fato de que todas as drogas que compõem as séries
homólogas são estruturalmente derivadas destes compostos base.
As estruturas do TMP, PTX e TMQ após a otimização de suas geometrias,
livres no estado gasoso, através de cálculos AM1, são apresentadas na figura 17.
Figura 17. Modelos balls-and-sticks das estruturas do TMP (a), PTX (b) e TMQ
(c) após a otimização da geometria.
(a)
(b)
(c)
RESULTADOS E DISCUSSÕES
- 68 -
As estruturas das proteínas modeladas, enzimas diidrofolato redutase, através
dos cálculos de mecânica molecular MM3, são apresentadas na figura 18.
Figura 18. Modelos das estruturas da DHFR do P. carinii com 3963 átomos (a) e
Humana com 3341 átomos (b).
Uma observação importante a respeito das enzimas modeladas é o fato de que
os átomos de enxofre dos resíduos de cisteína não foram protonados juntamente com
os demais resíduos, o que ocasionou problemas nos cálculos quânticos, pois,
tratavam-se de sistemas com um número ímpar de elétrons. Este problema foi
solucionado adicionando manualmente o átomo de hidrogênio ao átomo de enxofre
com elétron desemparelhado.
As cargas dos dois sistemas enzimáticos foram balanceadas levando em
consideração o pH do meio em que as enzimas foram cristalizadas e os valores de
pK
a
dos resíduos de aminoácidos. Nos dados cristalográficos da DHFR do Pc não
consta o valor de pH [109], por isso, não alteramos as cargas dos resíduos, equação
40.
Q
DHFR Pc
= [N-terminal: Asn(+1)] + [18Lys(+1)] + [11Arg(+1)] + [12Glu(-1)] +
+ [12Asp(-1)] + [NADPH: 4PO
4
2-
(-1)] +
+[C-terminal: Leu(-1)] = +1 (40)
(a) (b)
RESULTADOS E DISCUSSÕES
- 69 -
O pH no qual a DHFR humana foi cristalizada é igual a 8,00 [110]. Os
valores de pK
a
de referência das cadeias laterais, bem como do N-terminal e C-
terminal, dos resíduos de aminoácidos são encontrados em livros texto de bioquímica
[6] ou química orgânica [25]. A equação 41 apresenta a carga total do sistema da
DHFR humana.
Q
DHFR Hs
= [N-terminal: Val(+1)] + [17Lys(+1)] + [8Arg(+1)] + [3His(+1)] +
+ [16Glu(-1)] + [9Asp(-1)] + [NADPH: 4PO
4
2-
(-1)] +
+ [C-terminal: Asp(-1)] = -1 (41)
Na seqüência, localizamos os resíduos de aminoácidos que em conjunto com
o NADPH e moléculas de água conservadas compõem o sítio ativo destas enzimas.
Os resíduos foram selecionados considerando uma esfera de 3 Å ao redor dos
substratos complexados nas enzimas estudadas, figura 19.
Figura 19. Resíduos de aminoácidos selecionados (modelo: balls-and-sticks) ao redor
dos substratos (modelo: space filling) TMP (TOP) na DHFR do Pc (a) e CO4 na
DHFR do Hs (b).
Após a localização do conjunto de átomos que compõem o sítio ativo das
enzimas estudadas, realizamos um alinhamento das seqüências completas de
(a) (b)
RESULTADOS E DISCUSSÕES
- 70 -
aminoácidos e comparamos os resíduos que são conservados nos sítios ativos das
duas enzimas, figura 20.
Figura 20. Seqüências das enzimas humana (1PD9) e do Pc (1DYR) alinhadas. Os
resíduos de aminoácidos que compõem os sítios ativos estão destacados.
Podemos notar que a maior parte dos resíduos que compõem o sítio ativo das
duas enzimas são conservados, o que pode explicar a falta de especificidade das
drogas utilizadas na inibição da enzima dos parasitos quando comparadas com a
humana. Os espaços em branco na figura 20 representam partes da seqüência que não
foram conservadas nas proteínas humana e do Pneumocystis.
Além dos resíduos destacados também compõem o sítio ativo da DHFR
humana uma molécula de água (W190) e da DHFR do Pc quatro moléculas de água
(W408, W520, W522 e W525).
Em seguida analisamos as superfícies das proteínas com o objetivo de
encontrar uma cavidade que pudesse identificar possíveis sítios de ligação [111], e
até mesmo o canal de entrada do substrato. A figura 21 apresenta os mapas das
superfícies das proteínas.
RESULTADOS E DISCUSSÕES
- 71 -
Figura 21. Mapas das superfícies das proteínas DHFR humana (a) e do Pc (b).
As cores das superfícies criadas dependem da topologia, regiões mais
profundas na proteína, onde ligantes podem fixar-se são coloridas de azul e as outras
áreas de amarelo. Pode-se notar uma cavidade colorida de azul mais intenso na
enzima do Pc. Esta é a região da superfície que deve ser um bom sítio de ligação, ou
canal de entrada, devido a sua forma e profundidade.
Após a comparação desta região com a localização dos aminoácidos do sítio
ativo desta enzima pôde-se verificar que se trata da mesma área, figura 22, portanto,
muito provavelmente, os inibidores da DHFR alcançam o sítio ativo por esse canal.
Figura 22. Comparação da região de fixação na superfície da DHFR do Pc com os
resíduos de aminoácidos do sítio ativo.
Após a modelagem e análises iniciais das estruturas proteicas procedemos à
realização da inclusão das drogas estudadas nos sítios ativos das enzimas.
(a)
Potencial sítio de
ligação
(b)
RESULTADOS E DISCUSSÕES
- 72 -
4.2. Estudos de docking
A inclusão das drogas estudadas foi realizada através do docking por
superposição, as estruturas otimizadas dos compostos das séries homólogas, da
trimetoprima, da piritrexina e do trimetrexato, foram superpostas sobre a estrutura
cristalográfica do TMP (TOP) na DHFR do Pneumocystis carinii e sobre o ligante
CO4 na DHFR humana. As estruturas dos complexos de inclusão formados durante o
docking molecular são apresentadas na figura 23.
Figura 23. Superfícies das cavidades do sítio ativo da DHFR do Pc (a-c) e do Hs (d-
f), dos complexos de inclusão formados pelo TMP (a) e (d), PTX (b) e (e), e TMQ
(c) e (f). As estruturas em azul correspondem aos compostos base e as rosas aos
compostos incluídos.
(a) (b)
(c) (d)
(e) (f)
RESULTADOS E DISCUSSÕES
- 73 -
Pela análise da figura anterior podemos observar que a simples inclusão não
corresponde a uma geometria adequada dentro da cavidade do sítio ativo, isto pode
ser observado mais facilmente na inclusão de compostos com estruturas maiores que
os de base, como é o caso do PTX e do TMQ que apresentaram grupos fora da
cavidade do sítio ativo. Outro fato importante é que as geometrias das drogas livres
no estado gasoso, não correspondem, necessariamente, a geometria das drogas
quando complexadas no sítio ativo das enzimas. Para ajustar as estruturas inclusas,
procedemos a mudanças manuais nos valores de ângulos diedrais dos grupos que
ficaram fora da cavidade do sítio ativo e, realizamos cálculos de mecânica molecular
MM3. As estruturas das drogas após o ajuste manual e a otimização da geometria são
apresentadas na figura 24.
Figura 24. Estruturas do TMP (a) e (d), PTX (b) e (e), e TMQ (c) e (f) acomodadas
dentro da cavidade do sítio ativo da DHFR do Pc (a-c) e do Hs (d-f).
(a) (b)
(c)
(d)
(e) (f)
RESULTADOS E DISCUSSÕES
- 74 -
Após a otimização das estruturas moleculares das drogas estudadas dentro da
cavidade do sítio ativo das enzimas, realizamos uma análise das ligações de
hidrogênio estabelecidas entre grupos funcionais das moléculas das drogas e resíduos
de aminoácidos do sítio ativo e moléculas de água conservadas. Tal análise levou em
consideração a orientação e proximidade dos pares droga-aminoácido ou droga-água.
Na figura 25 são apresentadas as principais ligações de hidrogênio formadas.
Figura 25. Ligações de hidrogênio formadas entre as drogas TMP, PTX, TMQ e os
resíduos de aminoácidos e moléculas de água conservadas no sítio ativo da DHFR do
Pc (a-c) e humana (d-f).
(a) (b)
(c)
(d)
(e) (f)
RESULTADOS E DISCUSSÕES
- 75 -
Podemos observar na figura 25 que as principais ligações de hidrogênio
formadas na enzima diidrofolato redutase do P. carinii são com os resíduos de
aminoácidos Ile10, Ile123, Glu32 e com algumas moléculas de água, W520 e W525.
Na DHFR humana os resíduos são: Ile7, Val115, Glu30 e com a molécula de água
W190. Quando comparamos as interações nas duas enzimas e, observamos os
resíduos de aminoácidos que são importantes, percebemos que somente a Ile123 na
DHFR do Pc e a Val115 na DHFR do Hs devem colaborar para um ganho de
seletividade, pois, os outros resíduos equivalem nas duas enzimas, como pode ser
verificado na seqüência de aminoácidos alinhados na figura 20.
Esse aumento de seletividade pode ser conseguido fortalecendo a interação
entre as drogas e o resíduo Ile123 na enzima do parasita, concomitantemente com a
diminuição da interação entre o resíduo Val115 da enzima humana e as drogas. As
interações com as moléculas de água são mais específicas, não ocorrendo com todas
as drogas estudadas. Mas, como já foi sugerido na literatura, devem ter papel
fundamental no mecanismo enzimático de protonação do substrato [39].
4.3. Modelos de QSAR obtidos através das regressões
Após calcular os descritores moleculares que representam as propriedades das
drogas, procedemos à elaboração dos modelos de QSAR através das regressões
lineares múltiplas, na seqüência são apresentadas as previsões de modelos obtidas
para as séries de drogas estudadas.
4.3.1. Modelos de atividade e seletividade para a série do TMP
i) Previsão do modelo para a atividade contra a enzima do Pneumocystis carinii
A equação estabelecida que descreve a atividade inibitória das drogas
derivadas do TMP contra a enzima diidrofolato redutase do P. carinii é apresentada
abaixo, equação 42.
RESULTADOS E DISCUSSÕES
- 76 -
lnIC
50
Pc = -195,39 + 2,53 LogP + 588,02 QC
4
+ 528,49 ρ
HOMO
C
2
+
+ 783,51 S
R,A
N
14
+ 3,53 E
Hb
Ile123Pc (42)
O grau de ajuste do modelo obtido foi avaliado através da análise da
variância, esta avaliação está desenvolvida na tabela 07.
Tabela 07. Análise da variância (ANOVA) para o modelo de atividade contra o Pc
Fonte
df SS MS
Regressão
5 84,1241 16,8248 F = 35,6779
Resíduo
16 7,5452 s
2
= 0,4716 R
2
= 0,9177
Total
21 91,6693 4,3652
Podemos observar que o valor do coeficiente de determinação do modelo (R
2
)
é maior que 90% o que demonstra um bom ajuste do modelo às respostas observadas.
Isto quer dizer que a maior parte da variação em torno da média é explicada pelo
modelo, ou seja, são poucos os resíduos da regressão. O valor de F obtido é cerca de
12,5 vezes maior que o tabelado a 95% de confiança (F
5,16
= 2,85). Indicativo de que
o modelo explica a maior parte da variabilidade dos dados, como pode ser observado
na figura 26 onde são avaliados os valores de lnIC
50
previstos contra os observados a
95% de confiança.
RESULTADOS E DISCUSSÕES
- 77 -
Figura 26. Valores de lnIC
50
previstos contra os observados para o Pc.
O elevado valor de F também valida o coeficiente de determinação do
modelo. O quadrado do coeficiente de correlação ajustado obtido para este modelo é
2
A
just
R
= 0,8920 e o da probabilidade associada ao valor de F é p < 0,0001. Este valor
ratifica a significância estatística do coeficiente de correlação sendo que o erro
envolvido na afirmação dessa hipótese é menor que 0,01%.
A falta de ajuste do modelo proposto foi ainda avaliada através da utilização
dos resíduos da regressão como pode ser observado na figura 27.
RESULTADOS E DISCUSSÕES
- 78 -
Figura 27. Resíduos do modelo de regressão para a atividade contra o Pc.
Através da análise do gráfico dos resíduos podemos observar a estrutura
aleatória dos pontos, um indicativo de que o modelo não possui erros sistemáticos
devido à especificação incorreta do mesmo. Somente erros aleatórios estão presentes
e, desse modo, o modelo proposto não apresenta falta de ajuste.
A significância estatística dos coeficientes da regressão foi testada através dos
seus intervalos de confiança a 95% como pode ser observado na equação 43.
lnIC
50
Pc = -195,39 (± 33,20) + 2,53 (± 0,22) LogP + 588,02 (± 177,33) QC
4
+
+ 528,49 (± 163,67) ρ
HOMO
C
2
+ 783,51 (± 150,79) S
R,A
N
14
+
+ 3,53 (0,51) E
Hb
Ile123Pc (43)
Percebe-se facilmente que todos os coeficientes são estatisticamente
significantes, pois, os valores dos intervalos de confiança não são maiores do que o
próprio valor do coeficiente.
O número de variáveis utilizadas para explicar a variabilidade dos valores de
atividade observados é igual a cinco, esta quantidade corresponde aquela enumerada
por Hansch para minimizar a ocorrência de correlação das variáveis por
coincidência. “Deve haver no mínimo cinco ou seis compostos para cada variável
RESULTADOS E DISCUSSÕES
- 79 -
incluída no modelo”. Entretanto, como pode ser observado na tabela 08 existem dois
descritores que apresentam uma moderada correlação.
Tabela 08. Matriz de correlação das variáveis do modelo de atividade contra o Pc
LogP QC
4
ρ
HOMO
C
2
S
R,A
N
14
E
Hb
Ile123Pc
LogP 1,00
QC
4
0,01 1,00
ρ
HOMO
C
2
-0,08 0,36 1,00
S
R,A
N
14
-0,22 -0,07 -0,53 1,00
E
Hb
Ile123Pc -0,08 -0,40 0,30 -0,35 1,00
As variáveis superdelocalizabilidade radicalar do átomo de nitrogênio 14 e a
densidade do HOMO do carbono 2 apresentam correlação maior que 50%, porém,
todas duas são importantes na determinação do modelo e representam características
fundamentais do mecanismo de inibição enzimática das drogas estudadas.
A primeira variável, LogP, esta relacionada a processos de permeabilidade
em meios hidrofílicos e lipofílicos, sendo, por isso, de fundamental importância no
transporte das drogas. Pela análise da equação 42 podemos perceber que quanto
maior for o valor do coeficiente de partição octanol-água, maior será a estimativa de
atividade das drogas, ou seja, quanto mais lipossolúveis forem as drogas melhor.
Para todas as demais variáveis um incremento no seu valor eleva a potência do
composto.
Segundo a mesma equação, a carga do átomo de carbono 4 também é
importante, quanto mais positiva for sua carga melhor. Tal idéia condiz com o fato
de que é numa posição equivalente a esta, que um átomo de carbono do folato,
recebe um íon hidreto do cofator enzimático NADPH durante sua redução a
diidrofolato.
A densidade do HOMO do carbono 2, juntamente com a
superdelocalizabilidade do nitrogênio 14, devem representar a interação que um dos
grupos amino das drogas realiza com a Ile10 e Ile123 do Pc.
A energia da ligação de hidrogênio com a Ile123 também aparece no modelo
de regressão como variável importante, esta interação é específica para a enzima do
RESULTADOS E DISCUSSÕES
- 80 -
Pneumocystis carinii, levando a um ganho de atividade e seletividade, pois, na
enzima humana o aminoácido correspondente é a Val115.
ii) Previsão do modelo para a atividade contra a enzima do Toxoplasma gondii
A previsão do modelo para a atividade contra a enzima do T. gondii
estabelecida através das RML é apresentada na equação 44.
lnIC
50
Tg = 228,70 + 0,90 µ + 1,61 LogP - 0,79
3
κ + 1074,21 ρ
HOMO
C
2
+
- 246,10 S
E,A
C
3
- 3661,57 ρ
LUMO
N
5
(44)
A análise da variância para o modelo apresentado acima está desenvolvida na
tabela 09.
Tabela 09. Análise da variância (ANOVA) para o modelo de atividade contra o Tg
Fonte
df SS MS
Regressão
6 101,3433 16,8905 F = 19,6323
Resíduo
15 12,9051 0,8603 R
2
= 0,8870
Total
21 114,2484 5,4404
O valor de R
2
é cerca de 89% o que ainda representa um modelo com um bom
grau de ajuste. F obtido é cerca de sete vezes maior que o valor tabelado a 95% de
confiança (F
6,15
= 2,79), desse modo, o modelo é capaz de explicar uma boa parcela
da variabilidade dos dados. Na figura 28 podemos observar a capacidade de previsão
dos valores de atividade, bem como as estruturas que não se ajustam muito bem ao
modelo de regressão (outliers).
RESULTADOS E DISCUSSÕES
- 81 -
Figura 28. Valores de lnIC
50
previstos contra os observados para o Tg.
O valor do coeficiente de correlação ajustado para este modelo é 0,8419,
menor que o obtido para o modelo contra o Pc e, por isso, indica de que a equação 42
apresenta maior grau de ajuste que a equação 44. A probabilidade associada ao valor
de F é menor que 0,0001, o que valida o coeficiente de correlação.
A análise qualitativa da falta de ajuste do modelo de regressão é apresentada
na figura 29.
RESULTADOS E DISCUSSÕES
- 82 -
Figura 29. Resíduos do modelo de regressão para a atividade contra o Tg.
A análise visual dos resíduos no gráfico acima revela um padrão estritamente
aleatório para a distribuição dos mesmos, sugerindo que o modelo representado pela
equação 44 não apresenta falta de ajuste e que não devem existir erros sistemáticos
devido à especificação incorreta do mesmo.
Os intervalos de confiança para os coeficientes das variáveis do modelo de
atividade contra o Tg são apresentados na equação 45. Pode-se notar que todos os
coeficientes da regressão são estatisticamente significantes, já que todos os valores a
95% de confiança são maiores que o próprio coeficiente.
lnIC
50
Tg = 228,70 (± 52,94) + 0,90 (± 0,41) µ + 1,61 (± 0,31) LogP +
- 0,79 (± 0,30)
3
κ + 1074,21 (± 180,00) ρ
HOMO
C
2
+
- 246,10 (± 47,06) S
E,A
C
3
- 3661,57 (± 728,24) ρ
LUMO
N
5
(45)
O número de seis variáveis utilizadas no modelo de regressão está no limite
da faixa proposta, para os 32 derivados do TMP o número máximo de variáveis
utilizadas deve ser seis, com o objetivo de minimizar a ocorrência de correlação entre
as mesmas. Como pode ser observado na tabela 10 nenhuma das variáveis apresenta
correlação apreciável.
RESULTADOS E DISCUSSÕES
- 83 -
Tabela 10. Matriz de correlação das variáveis do modelo de atividade contra o Tg
µ
LogP
3
κ ρ
HOMO
C
2
S
E,A
C
3
ρ
LUMO
N
5
µ
1,00
LogP
0,01 1,00
3
κ
-0,46 0,24 1,00
ρ
HOMO
C
2
-0,15 -0,08 0,33 1,00
S
E,A
C
3
0,27 -0,28 -0,32 0,23 1,00
ρ
LUMO
N
5
-0,26 -0,03 0,11 -0,08 -0,23 1,00
Segundo a equação 44 quanto maior for o momento de dipolo elétrico
molecular maior será a atividade do composto avaliado, isto reflete a importância da
polaridade nos processos de interação das drogas com o substrato. Do mesmo modo,
quanto maior o coeficiente de partição octanol-água maior será a atividade prevista,
ou seja, é preferível drogas um pouco mais lipofílicas que hidrofílicas.
O índice de forma de ordem 3 (
3
κ) reflete o grau de ramificação da molécula,
observando o modelo verificamos que um aumento na quantidade de ramificações
leva a uma diminuição da atividade, fato que deve estar relacionado a impedimentos
estéricos que dificultam a entrada e acomodação das moléculas na cavidade do sítio
ativo das enzimas.
A densidade do HOMO do carbono 2, como já foi citado para o Pc, deve estar
relacionada com as interações estabelecidas entre o grupo amina diretamente ligado a
este e aminoácidos importantes na enzima do Toxoplasma gondii.
Uma diminuição da superdelocalizabilidade eletrofílica do carbono 3 leva a
um aumento da atividade, isto condiz com a etapa de transferência do íon hidreto do
mecanismo enzimático, pois, para que o íon hidreto seja adicionado ao carbono 3,
átomo que possui uma posição equivalente a um carbono do diidrofolato onde ocorre
a conversão a tetraidrofolato, sua capacidade de ser atacado por um eletrófilo deve
ser mínima.Na realidade este carbono deve sofrer um ataque de um nucleófilo.
A densidade do LUMO do átomo de nitrogênio 5 pode ser relacionada com a
etapa de protonação do átomo de nitrogênio no folato.
RESULTADOS E DISCUSSÕES
- 84 -
iii) Previsão do modelo para a atividade contra a enzima do Mycobacterium
avium
O modelo de regressão obtido para a atividade das drogas estudadas contra a
enzima diidrofolato redutase do Mycobacterium avium é apresentado na equação 46.
lnIC
50
Ma = 375,46 + 0,83 µ + 1,23 LogP - 0,59
2
χ + 288,44 QN
5
+
+ 596,31 ρ
HOMO
C
2
- 129,35 S
E,A
C
3
- 173,18 S
E,A
N
15
+
- 2571,97 ρ
LUMO
N
5
(46)
A equação acima, obtida após as regressões lineares múltiplas, teve seu grau
de ajuste avaliado através da análise da variância da regressão. Os dados da ANOVA
são apresentados na tabela 11.
Tabela 11. Análise da variância (ANOVA) para o modelo de atividade contra o Ma
Fonte
df SS MS
Regressão
8 101,3513 12,6689 F = 64,9278
Resíduo
13 2,5366 0,1951 R
2
= 0,9756
Total
21 103,8879 4,94710
O modelo de regressão para a atividade contra o Ma apresenta o maior
coeficiente de determinação dentre todas as equações estabelecidas, seu valor é
maior que 97%, o que demonstra seu ótimo grau de ajuste e o mínimo de resíduos da
regressão. O valor de F é maior que 24 vezes o tabelado a 95% de confiança (F
8,13
=
2,77), por esta razão a validade do coeficiente de determinação do modelo é certa. Os
valores das atividades previstas pelo modelo estão muito próximas dos valores
observados, figura 30.
RESULTADOS E DISCUSSÕES
- 85 -
Figura 30. Valores de lnIC50 previstos contra os observados para o Ma.
O valor obtido para o quadrado do coeficiente de correlação ajustado é
0,9606, possibilitando comparar as correlações entre os modelos e, demonstrando
que esta é sem dúvida a melhor equação de regressão entre todas as estudadas. A
probabilidade associada ao valor de F é menor que 0,0001, sendo assim, o erro
envolvido na significância estatística de F é menor que 0,01%.
A análise qualitativa da falta de ajuste do modelo de regressão através pode
ser feita através da observação do gráfico dos resíduos apresentado na figura 31.
RESULTADOS E DISCUSSÕES
- 86 -
Figura 31. Resíduos do modelo de regressão para a atividade contra o Ma.
A estrutura apresentada pelos resíduos do modelo de regressão é
indiscutivelmente aleatória, esta informa qualitativamente que não há falta de ajuste
no modelo de regressão e que os erros do mesmo são unicamente de natureza
aleatória.
A análise da significância estatística dos coeficientes da regressão, avaliada
através dos intervalos de confiança dos mesmos a 95% de confiança, é apresentada
na equação 47.
lnIC
50
Ma = 375,46 (± 32,72) + 0,83 (± 0,21) µ + 1,23 (± 0,18) LogP +
- 0,59 (± 0,13)
2
χ + 288,44 (± 65,12) QN
5
+ 596,31 (± 117,54) ρ
HOMO
C
2 +
- 129,35 (± 34,21) S
E,A
C
3
- 173,18 (± 43,47) S
E,A
N
15
+
- 2571,97 (± 408,44) ρ
LUMO
N
5
(47)
Todos os coeficientes são significativos, pois, os valores dos intervalos de
confiança não são maiores que os próprios coeficientes.
Todas as oito variáveis da equação de regressão apresentam significância
estatística, porém, há correlação por coincidência entre algumas delas como pode ser
observado na tabela 12.
RESULTADOS E DISCUSSÕES
- 87 -
Tabela 12. Matriz de correlação das variáveis do modelo de atividade contra o Ma
µ
LogP
2
χ QN
5
ρ
HOMO
C
2
S
E,A
C
3
S
E,A
N
15
ρ
LUMO
N
5
µ
1,00
LogP
0,01 1,00
2
χ
-0,01 0,19 1,00
QN
5
-0,38 -0,06 -0,02 1,00
ρ
HOMO
C
2
-0,15 -0,08 -0,69 0,12 1,00
S
E,A
C
3
0,27 -0,28 -0,30 -0,54 0,23 1,00
S
E,A
N
15
0,46 -0,51 -0,20 -0,41 0,05 0,75 1,00
ρ
LUMO
N
5
-0,26 -0,03 -0,17 0,19 -0,08 -0,23 -0,36 1,00
As variáveis LogP e S
E,A
N
15
apresentam uma baixa correlação, bem como a
QN
5
e a S
E,A
C
3
. Entretanto, as variáveis
2
χ e ρ
HOMO
C
2
, e as S
E,A
C
3
e S
E,A
N
15
tem
correlação relativamente grande, por essa razão apenas uma delas, dentro de cada
par, deveria ser considerada no modelo de regressão, já que devem conter o mesmo
tipo de informação. Porém, nesta situação, a significância estatística do modelo,
avaliada através da análise da variância, diminui absurdamente. Assim decidimos
considerar todas elas.
As variáveis LogP e µ aparecem novamente como descritores moleculares
importantes para a atividade biológica das drogas estudadas. O índice de
conectividade de segunda ordem (
2
χ) representa a quantidade de vizinhos de um dado
átomo em duas direções. A análise da equação 47 informa que quanto menor for seu
valor, maior será a atividade do composto no conjunto estudado.
Um aumento no valor da carga do átomo de nitrogênio 5 implica num
aumento da atividade. Este fato pode estar relacionado com uma maior facilidade de
protonação do nitrogênio durante a inibição enzimática. Da mesma forma deve aturar
a diminuição da densidade do LUMO do mesmo átomo.
A densidade do HOMO do carbono 2 já foi discutida, um aumento desta
propriedade eleva o valor da atividade prevista, o que pode estar relacionado com o
fortalecimento das interações entre um dos grupos amina e resíduos de aminoácidos
próximos. Com uma alta densidade eletrônica, o átomo de nitrogênio do grupo
RESULTADOS E DISCUSSÕES
- 88 -
amina, diretamente ligado ao carbono 2, deve ficar também como uma densidade
eletrônica elevada e formar ligações de hidrogênio mais fortes.
Pelas mesmas razões expostas para a atividade contra o Tg, a diminuição da
superdelocalizabilidade eletrofílica do carbono 3 leva a um aumento da atividade.
Uma superdelocalizabilidade eletrofílica do nitrogênio 15 pequena é
indicativa de que este átomo atua como nucleófilo, ou seja, possui densidade
eletrônica elevada. Este átomo estabelece importantes ligações de hidrogênio com
resíduos de aminoácidos de ácido glutâmico na enzima humana e do P. carinii.
iv) Previsão do modelo para a atividade contra a enzima do fígado de rato
A última equação estabelecida para a atividade da série derivada do TMP é
apresentada abaixo, equação 48, onde podemos observar as variáveis que descrevem
a atividade das drogas estudadas contra a enzima do fígado de rato.
lnIC
50
Rl = - 207,13 + 0,59 µ + 1,33 LogP - 414,16 QC
2
+
+ 362,17 ρ
HOMO
N
1
+ 280,20 S
R,A
C
3
+ 570,03 S
R,A
N
14
+
+ 99,70 S
E,A
N
1
- 5,54 E
Hb
Val115Hs (48)
Esta equação foi analisada através da análise da variância da regressão. Os
parâmetros de avaliação do grau de ajuste do modelo são apresentados na tabela 13.
Tabela 13. Análise da variância (ANOVA) para o modelo de atividade contra o Rl
Fonte
df SS MS
Regressão
8 23,1697 2,8962 F = 21,2976
Resíduo
13 1,7678 0,1360 R
2
= 0,9291
Total
21 24,9375 1,1875
O modelo de regressão apresenta um valor de R
2
bastante elevado, próximo
de 93 %, este parâmetro indica que há um bom ajuste do modelo às respostas
observadas. O valor de F é cerca de 7,7 vezes o tabelado a 95% de confiança (F
8,13
=
2,77). Este modelo apesar apresentar menor capacidade de previsão quando
RESULTADOS E DISCUSSÕES
- 89 -
comparado aos outros, ainda assim, é capaz de explicar a maior parte da
variabilidade dos dados, figura 32.
Figura 32. Valores de lnIC50 previstos contra os observados para o fígado de rato.
O valor do quadrado do coeficiente de correlação ajustado obtido para este
modelo é
2
A
just
R
= 0,8855 e o da probabilidade associada ao valor de F é p < 0,0001,
demonstrando que apesar da menor capacidade de previsão, o coeficiente de
correlação apresenta significância estatística.
A análise do gráfico dos resíduos do modelo de regressão indica que o
modelo não apresenta falta de ajuste devido a sua especificação, figura 33.
RESULTADOS E DISCUSSÕES
- 90 -
Figura 33. Resíduos do modelo de regressão para a atividade contra o fígado de rato.
A distribuição dos pontos no gráfico dos resíduos assume uma estrutura
aleatória, indicando a inexistência de erros sistemáticos.
A avaliação dos intervalos de confiança demonstrou a significância estatística
dos coeficientes da regressão, equação 49.
lnIC
50
Rl = - 207,13 (± 35,55) + 0,59 (± 0,22) µ + 1,33 (± 0,16) LogP +
- 414,16 (± 69,26) QC
2
+ 362,17 (± 160,32) ρ
HOMO
N
1
+
+ 280,20 (± 61,74) S
R,A
C
3
+ 570,03 (± 85,86) S
R,A
N
14
+
+ 99,70 (± 29,23) S
E,A
N
1
- 5,54 (± 0,63) E
Hb
Val115Hs (49)
Do mesmo modo que para o modelo de atividade contra o Mycobacterium
avium, um total de oito variáveis foram utilizadas na equação de regressão, número
superior as seis variáveis sugeridas com o objetivo de minimizar as correlações por
coincidência. Porém, neste caso, somente três variáveis apresentaram correlação e,
mesmo assim, esta foi relativamente pequena, tabela 14.
RESULTADOS E DISCUSSÕES
- 91 -
Tabela 14. Matriz de correlação das variáveis do modelo de atividade contra o fígado
de rato
µ
LogP QC
2
ρ
HOMO
N
1
S
R,A
C
3
S
R,A
N
14
S
E,A
N
1
E
Hb
Val115Hs
µ
1,00
LogP
0,01 1,00
QC
2
0,43 0,07 1,00
ρ
HOMO
N
1
0,02 0,02 0,29 1,00
S
R,A
C
3
-0,11 0,08 0,51 0,34 1,00
S
R,A
N
14
0,31 -0,22 0,38 -0,15 -0,17 1,00
S
E,A
N
1
0,46 -0,55 0,28 0,31 0,15 0,18 1,00
E
Hb
Val115Hs
0,41 0,01 0,52 0,17 0,43 0,31 0,36 1,00
Novamente as variáveis momento de dipolo e coeficiente de partição octanol-
água aparecem nos modelos, isto indica que estes são descritores fundamentais para a
atividade dos compostos estudados derivados do TMP.
Um aumento da carga do carbono 2 leva a uma diminuição da atividade, o
que fortalece a idéia de que o átomo de carbono 2 influência a interação formada
entre o átomo de nitrogênio 14 do grupo amina e os resíduos de aminoácidos, que no
presente caso correspondem a Ile7 e Val115. A superdelocalizabilidade radicalar do
nitrogênio 14 também deve estar associada a sua capacidade de estabelecer esta
interação.
A densidade do HOMO do nitrogênio 1 e a sua superdelocalizabilidade
eletrofílica devem estar relacionadas com a protonação deste átomo, um aumento nos
seus valores contribui positivamente para a atividade, ou seja, um aumento na
densidade do HOMO e no seu caráter nucleófilico facilitam a protonação do átomo
de nitrogênio.
Quanto menor for a energia da ligação de hidrogênio entre o grupo amina e o
aminoácido Val115 maior será a elevação da atividade. Um fato muito importante a
ser mencionado é a especificidade da Ile123 na enzima do Pc que deve proporcionar
não só um ganho de atividade, mas também na seletividade para este parasita. No
caso da Val115 temos a mesma situação, está interação é específica com a enzima
humana que, na pretensão de elaborar substâncias com o mínimo de efeitos
colaterais, deve ser desfavorecida.
RESULTADOS E DISCUSSÕES
- 92 -
v) Previsão do modelo para a seletividade contra a enzima do Pneumocystis
carinii
A equação que tenta descrever a seletividade das drogas derivadas do TMP
contra a enzima diidrofolato redutase do P. carinii é apresentada na equação 50.
lnSIPc = - 101,77 + 1,03
3
κ - 318,02 QC
4
+ 555,83 S
R,A
N
5
- 0,05 VS (50)
A análise da variância para o modelo apresentado acima está desenvolvida na
tabela 15.
Tabela 15. Análise da variância (ANOVA) para o modelo de seletividade contra o Pc
Fonte
df SS MS
Regressão
4 28,1634 7,0409 F = 13,8481
Resíduo
17 8,6434 0,5084 R
2
= 0,7652
Total
21 36,8069 1,7527
Podemos observar facilmente que o primeiro modelo para seletividade
apresenta um grau de ajuste muito menor quando comparado aos modelos de
atividade das drogas derivadas do TMP. O valor de F é apenas 4,6 vezes o tabelado a
95% de confiança (F
4,17
= 2,96). Este indica que uma parte razoável da variabilidade
dos dados é explicada como pode ser observado na figura 34.
RESULTADOS E DISCUSSÕES
- 93 -
Figura 34. Valores de lnSI previstos contra os observados para o Pc.
O valor de
2
A
just
R
= 0,7099 em comparação com os modelos de atividade
ratifica o menor grau de ajuste obtido para os modelos de seletividade. A
probabilidade associada ao valor de F ainda assim apresenta valor menor que 0,0001.
Apesar do menor grau de ajuste podemos observar através da análise dos resíduos de
regressão que não devem existir erros sistemáticos no modelo proposto, figura 35.
RESULTADOS E DISCUSSÕES
- 94 -
Figura 35. Resíduos do modelo de regressão para a seletividade contra o Pc.
A significância estatística dos coeficientes de regressão avaliada através dos
intervalos de confiança a 95% é apresentada na equação 51.
lnSIPc = - 101,77 (± 33,64) + 1,03 (± 0,29)
3
κ - 318,02 (± 148,34) QC
4
+
+ 555,83 (± 149,55) S
R,A
N
5
- 0,05 (± 0,01) VS (51)
Todos os coeficientes são estatisticamente significantes, contudo é importante
observar que os valores dos intervalos de confiança estão relativamente próximos dos
valores dos coeficientes, o que diminui sua significância estatística.
O número de variáveis utilizadas no modelo para seletividade corresponde ao
valor sugerido com intuito de minimizar as correlações por coincidência, entretanto,
pode-se observar na tabela 16 que três das variáveis estudadas apresentam correlação
considerável.
RESULTADOS E DISCUSSÕES
- 95 -
Tabela 16. Matriz de correlação das variáveis do modelo de seletividade contra o Pc
3
κ QC
4
S
R,A
N
5
VS
3
κ
1,00
QC
4
-0,30 1,00
S
R,A
N
5
-0,65 0,21 1,00
VS
0,71 -0,17 -0,51 1,00
A correlação existente entre as variáveis
3
κ, S
R,A
N
5
e VS é relativamente
grande. Por isso, somente uma dentre as três deveria constar na equação de
regressão, no entanto, sem elas a especificação do modelo conteria apenas duas
variáveis.
O índice de forma de ordem 3 é um indicativo do grau de ramificação como
já foi citado anteriormente, e segundo a equação 51 um aumento no número de
ramificações eleva a seletividade das drogas contra o Pc. De certa forma isto vai de
encontro com o discutido para a atividade contra o Tg aonde um aumento de
3
κ leva
a uma redução da atividade.
Um aumento da carga do átomo de carbono 4 diminui a seletividade. Este
átomo corresponde a um sítio equivalente no folato onde ocorre a entrada o íon
hidreto.
A superdelocalizabilidade radicalar do átomo de nitrogênio 5 deve estar
associada com o processo de protonação do mesmo.
Por fim, um aumento no volume da superfície de van der Waals leva a uma
diminuição da seletividade, esta propriedade pode representar diferenças no tamanho
entre as cavidades dos sítios ativos da enzima humana e do Pc.
vi) Previsão do modelo para a seletividade contra a enzima do Toxoplasma
gondii
A previsão do modelo que tenta descrever a seletividade da série homóloga
ao TMP contra a enzima diidrofolato redutase do T. gondii é apresentada na equação
52.
RESULTADOS E DISCUSSÕES
- 96 -
lnSITg = - 557,74 - 1,10 µ + 0,66
0
χ - 516,74 QC
4
+ 216,25 S
E,A
C
3
+
+ 339,31 S
E,A
N
14
+ 2513,31 ρ
LUMO
N
5
(52)
A equação apresentada acima foi avaliada através da análise da variância da
regressão. Os parâmetros da ANOVA para o modelo de seletividade contra o Tg
estão apresentados na tabela 17.
Tabela 17. Análise da variância (ANOVA) para o modelo de seletividade contra o Tg
Fonte
df SS MS
Regressão
6 46,0164 7,6694 F = 13,7931
Resíduo
15 8,3405 0,5560 R
2
= 0,8466
Total
21 54,3569 2,5884
O coeficiente de determinação para este modelo de seletividade é próximo de
85% e o valor do teste F é aproximadamente 5 vezes o tabelado a 95% de confiança
(F
6,15
= 2,79). Tais parâmetros sugerem que apenas uma parte da variabilidade dos
dados é explicada, figura 36.
Figura 36. Valores de lnSI previstos contra os observados para o Tg.
RESULTADOS E DISCUSSÕES
- 97 -
Como pode ser observado na figura acima o modelo de seletividade para o
Tg, do mesmo modo que o modelo de seletividade para o Pc, apresenta uma menor
capacidade de previsão dos valores observados quando comparado aos modelos de
atividade. O coeficiente de correlação ajustado é igual a 0,7852 e a probabilidade é
menor que 0,0001. Embora menos ajustados que os modelos de atividade, a análise
dos resíduos da regressão demonstra uma distribuição aleatória dos pontos, figura 37.
Figura 37. Resíduos do modelo de regressão para a seletividade contra o Tg.
A estrutura aleatória na distribuição dos pontos do gráfico acima demonstra a
não ocorrência de erros sistemáticos. Tal análise sugere que apesar da menor
capacidade de previsão do modelo de seletividade este, ainda assim, é
estatisticamente significante.
Os intervalos de confiança avaliados a 95% para os coeficientes das variáveis
do modelo de regressão sugerem que todos são significativos, equação 53.
lnSITg = - 557,74 (± 92,16) - 1,10 (± 0,32) µ + 0,66 (± 0,17)
0
χ +
- 516,74 (± 189,53) QC
4
+ 216,25 (± 38,40) S
E,A
C
3
+
+ 339,31 (± 81,87) S
E,A
N
14
+ 2513,31 (± 661,66) ρ
LUMO
N
5
(53)
RESULTADOS E DISCUSSÕES
- 98 -
O número de variáveis utilizadas na especificação do modelo corresponde ao
valor máximo para evitar correlação por coincidência, mesmo assim as variáveis
0
χ e
S
E,A
N
14
apresentam uma correlação apreciável, tabela 18.
Tabela 18. Matriz de correlação das variáveis do modelo de seletividade contra o Tg
µ
0
χ QC
4
S
E,A
C
3
S
E,A
N
14
ρ
LUMO
N
5
µ
1,00
0
χ
-0,06 1,00
QC
4
0,37 -0,26 1,00
S
E,A
C
3
0,27 -0,39 0,44 1,00
S
E,A
N
14
0,22 -0,69 0,14 0,24 1,00
ρ
LUMO
N
5
-0,26 -0,18 -0,43 -0,23 0,14 1,00
O momento de dipolo molecular também aparece no modelo de seletividade
como variável importante, entretanto, aqui quanto maior for o valor de µ menor será
a seletividade do composto.
O índice de conectividade de ordem zero indica o número de vizinhos mais
próximos de um dado átomo. Segundo a equação 53 um aumento no valor de
0
χ
contribui para um aumento de seletividade.
A carga do carbono 4 e superdelocalizabilidade eletrofílica do carbono 3
devem estar relacionadas com a etapa de entrada do íon hidreto no mecanismo
enzimático do folato.
A superdelocalizabilidade eletrofílica do nitrogênio 14 deve estar relacionada
com as interações entre um dos grupos amina e os resíduos de aminoácidos do sítio
ativo das enzimas.
A densidade do LUMO do nitrogênio 5 deve estar relacionada a protonação
do mesmo.
RESULTADOS E DISCUSSÕES
- 99 -
vii) Previsão do modelo para a seletividade contra a enzima do Mycobacterium
avium
A equação obtida para a seletividade das drogas derivadas do TMP contra a
enzima diidrofolato redutase do M. avium é apresentada na equação 54.
lnSIMa = - 255,38 - 1,13 µ +268,39 ρ
HOMO
N
15
+ 440,38 S
R,A
N
1
+
+ 417,18 S
R,A
N
14
+ 86,51 S
E,A
C
6
- 1,16 E
Hb
Glu30Hs (54)
Tal equação teve seu grau de ajuste avaliado através da análise da variância
que é apresentada na tabela 19.
Tabela 19. Análise da variância (ANOVA) para o modelo de seletividade contra o
Ma
Fonte
df SS MS
Regressão
6 45,8731 7,6455 F = 20,7487
Resíduo
15 5,5272 0,3685 R
2
= 0,8925
Total
21 51,4003 2,4476
Pode ser observado na tabela acima que o coeficiente de determinação do
modelo R
2
apresenta valor próximo de 90% e o valor de F é maior que o tabelado a
95% de confiança cerca de 7,5 vezes. Entre todos os modelos de seletividade este é
sem dúvida o melhor. O que pode ser comprovado através do valor de
2
A
just
R
= 0,8494
e da probabilidade associada ao valor de F, p < 0,0001. A capacidade de previsão
deste modelo é apresentada na figura 38.
RESULTADOS E DISCUSSÕES
- 100 -
Figura 38. Valores de lnSI previstos contra os observados para o Ma.
Podemos perceber pelo gráfico acima que uma boa parte das estruturas não se
ajustaram ao modelo, esta situação foi avaliada através dos resíduos da regressão que
são apresentados na figura 39.
Figura 39. Resíduos do modelo de regressão para a seletividade contra o Ma.
RESULTADOS E DISCUSSÕES
- 101 -
A estrutura dos resíduos apresentados demonstra certa aleatoriedade o que
valida a equação obtida para o modelo de seletividade. No entanto, é importante
ressaltar a menor capacidade de previsão dos modelos de seletividade.
Todos os coeficientes do modelo de regressão apresentam significância
estatística, o que pode ser verificado através dos intervalos de confiança a 95%
apresentados na equação 55.
lnSIMa = - 255,38 (± 30,51) - 1,13 (± 0,34) µ + 268,39 (± 46,16) ρ
HOMO
N
15
+
+ 440,38 (± 123,79) S
R,A
N
1
+ 417,18 (± 156,50) S
R,A
N
14
+
+ 86,51 (± 26,72) S
E,A
C
6
- 1,16 E
Hb
Glu30Hs (± 0,26) (55)
Das seis variáveis utilizadas na equação de regressão três apresentam
correlação considerável como pode ser visto na tabela 20.
Tabela 20. Matriz de correlação das variáveis do modelo de seletividade contra o Ma
µ
ρ
HOMO
N
15
S
R,A
N
1
S
R,A
N
14
S
E,A
C
6
E
Hb
Glu30Hs
µ
1,00
ρ
HOMO
N
15
-0,08 1,00
S
R,A
N
1
0,69 0,13 1,00
S
R,A
N
14
0,31 0,20 0,61 1,00
S
E,A
C
6
0,22 -0,29 0,13 -0,31 1,00
E
Hb
Glu30Hs
-0,02 0,23 0,05 -0,21 0,23 1,00
A maioria das variáveis do modelo de seletividade já foram discutidas
anteriormente, porém, a superdelocalizabilidade eletrofílica do carbono 6 aparece
neste modelo como variável importante, isto pode ser devido a um efeito no
fortalecimento de interações entre o grupo amina do nitrogênio 15 e alguns resíduos
de aminoácidos nas enzimas. Um desses resíduos aparece no modelo, na realidade,
um enfraquecimento da ligação de hidrogênio do grupo amina com a Glu30 na
enzima humana eleva a seletividade das drogas frente a enzima do Ma.
Após avaliar os modelos de atividade e seletividade obtidos e verificar a
capacidade de previsão dos valores observados, procedemos a aplicação das
equações ao conjunto de drogas reservadas para o teste dos modelos, e desse modo
RESULTADOS E DISCUSSÕES
- 102 -
suas validações. Os erros para as previsões de atividade e seletividade das drogas do
grupo de teste são apresentados na tabela 21.
Tabela 21. Erros para as previsões de atividade e seletividade das drogas do grupo de
teste dos derivados do TMP
Erros para lnIC
50
(%) Erros para lnSI
(%)
Drogas
Pc Tg Ma Rl
Pc Tg Ma
p
8
247,11 8299,08 41,40 86,44
62,00 111,18 24,33
p
10
84,32 6096,23 94,06 4,10
39,93 104,79 68,21
p
12
56,55 2443,73 1,89 72,35
23,75 30,83 1,30
p
13
54,54 1737,89 11,66 78,73
18,26 22,12 23,27
p
18
196,45 750,86 114,24 1123,57
111,86 602,23 520,92
p
24
3187,88 4103,33 105,58 328,78
34,04 76,75 8,31
p
25
62,32 8990,71 61,95 36,30
83,90 91,14 12,70
p
30
8825,04 2942,73 108,60 402,69
146,54 540,93 418,14
TMP
306,82 4745,39 895,76 47,12
17,65 23,91 64,89
PTX
1164,79 2330,27 1894,65 411,31
2043,07 8525,23 999,68
Em azul mais escuro são apresentados os erros que ficaram na faixa de 0,00 a
30,00 %, sendo considerados como pequenos. Os valores em azul claro representam
os erros na faixa de 30,01 a 50,00 % considerados como erros medianos. Os demais
valores representam erros superiores a 50,01% e, desse modo, são indicativos de
previsões mal sucedidas.
Podemos perceber que, ao contrário do que esperávamos, os menores erros
ocorreram para os modelos de seletividade. O modelo para atividade contra o Ma foi
o que apresentou maior capacidade de previsão do conjunto teste dentre os demais
modelos de atividade. É fácil perceber que a estrutura p
30
e o PTX não devem
pertencer a uma série considerada homóloga ao TMP, para o PTX o motivo devem
ser as consideráveis diferenças estruturais apresentadas.
RESULTADOS E DISCUSSÕES
- 103 -
4.3.2. Modelos de atividade e seletividade para a série do TMQ
i) Previsão do modelo para a atividade contra a enzima do Pneumocystis carinii
A equação estabelecida para a atividade inibitória das drogas derivadas do
TMQ contra a enzima diidrofolato redutase do P. carinii é apresentada abaixo,
equação 56.
lnIC
50
Pc = - 113,79 - 100,47 QN
12
- 18,39 f
r
N
N
10
+ 62,11 S
N,A
C
4
+
+ 236,95 S
R,A
C
3
- 287,57 S
R,A
C
9
+ 199,95 S
R,A
N
12
(56)
O grau de ajuste da equação apresentada acima foi avaliado através da análise
da variância. Na tabela 22 é apresentado o resultado desta análise.
Tabela 22. Análise da variância (ANOVA) para o modelo de atividade contra o Pc
Fonte
df SS MS
Regressão
6 22,2511 3,7085 F = 26,6344
Resíduo
20 2,7847 0,1392 R
2
= 0,8888
Total
26 25,0358 0,9629
Os parâmetros obtidos da ANOVA demonstram que o modelo para a
atividade dos derivados do TMQ contra a DHFR do Pc é estatisticamente
significante. O valor de F é 10 vezes maior que o tabelado a 95% de confiança (F
6,20
= 2,60). O coeficiente de correlação ajustado é
2
A
just
R
= 0,8554 e a probabilidade
associada ao valor de F é p < 0,0001. A maior parte da variabilidade dos dados é
explicada pelo modelo de regressão como pode ser observado na figura 40.
RESULTADOS E DISCUSSÕES
- 104 -
Figura 40. Atividades (lnIC
50
) previstas contra as observadas para o Pc.
Pela análise da figura acima algumas estruturas não se ajustaram muito bem
aos modelos. A análise da falta de ajuste do modelo foi realizada através do gráfico
dos resíduos da regressão, figura 41.
Figura 41. Gráfico dos resíduos da regressão para a atividade contra o Pc.
RESULTADOS E DISCUSSÕES
- 105 -
Os resíduos da regressão apresentam distribuição aleatória, comprovando o
bom ajuste do modelo e indicando que os erros pertencentes ao mesmo não são de
origem sistemática.
Todos os coeficientes da regressão apresentam significância estatística como
pode ser observado na equação 57. A avaliação destes coeficientes foi realizada com
base nos intervalos de confiança a 95 %, em parênteses.
lnIC
50
Pc = - 113,79 (± 24,73) - 100,47 (± 16,03) QN
12
- 18,39 (± 5,58) f
r
N
N
10
+
+ 62,11 (± 7,78) S
N,A
C
4
+ 236,95 (± 56,87) S
R,A
C
3
+
- 287,57 (± 83,06) S
R,A
C
9
+ 199,95 (± 83,07) S
R,A
N
12
(57)
Nenhuma das seis variáveis do modelo de regressão apresentou correlação
significativa, tabela 23. Nesta nova série de estruturas derivadas do TMQ o número
máximo de variáveis propostas para evitar correlação por coincidência é sete.
Tabela 23. Matriz de correlação para as variáveis do modelo de atividade contra o Pc
QN
12
f
r
N
N
10
S
N,A
C
4
S
R,A
C
3
S
R,A
C
9
S
R,A
N
12
QN
12
1,00
f
r
N
N
10
0,36 1,00
S
N,A
C
4
-0,04 0,15 1,00
S
R,A
C
3
0,29 -0,00 -0,19 1,00
S
R,A
C
9
0,43 -0,23 -0,03 0,46 1,00
S
R,A
N
12
-0,11 -0,09 -0,16 -0,28 0,14 1,00
Uma variável que aparece com importância elevada para a atividade contra o
Pc é a carga atômica do nitrogênio 12. Átomo do grupo amina que estabelece
importantes interações com os aminoácidos Glu30 na enzima humana e Glu32 na
enzima do Pc. Segundo a equação 56 quanto mais negativa for a carga desse átomo
maior será sua contribuição para a atividade dos compostos, isto pode ser explicado
pelo fortalecimento da ligação de hidrogênio.
A segunda variável que aparece no modelo é a densidade eletrônica de
fronteira nucleofílica do átomo de nitrogênio 10. Uma diminuição no seu valor leva a
RESULTADOS E DISCUSSÕES
- 106 -
um aumento da atividade, isto esta de acordo com a etapa de protonação do
nitrogênio no mecanismo de conversão do folato a diidrofolato.
Um aumento na superdelocalizabilidade nucleofílica do carbono 4 contribui
positivamente para o aumento da atividade. Do mesmo modo ocorre com a
superdelocalizabilidade radicalar do carbono 3 e do nitrogênio 12. Ao contrário, uma
diminuição na superdelocalizabilidade radicalar do carbono 9 eleva a atividade. O
átomo de carbono 9 corresponde ao sítio de entrada do íon hidreto no folato, e esta
diminuição pode estar relacionada com uma maio facilidade de entrada deste íon.
ii) Previsão do modelo para a atividade contra a enzima do Toxoplasma gondii
A previsão do modelo para a atividade contra a enzima do T. gondii
estabelecida através das RML é apresentada na equação 58.
lnIC
50
Tg = - 170,18 + 0,51
2
χ
v
- 330,90 QN
12
+ 152,46 S
N,A
N
12
+
- 78,93 ρ
LUMO
C
8
(58)
A análise da variância para o modelo apresentado acima está desenvolvida na
tabela 24.
Tabela 24. Análise da variância (ANOVA) para o modelo de atividade contra o Tg
Fonte
df SS MS
Regressão
4 77,5090 19,3772 F = 93,8288
Resíduo
22 4,5434 0,2065 R
2
= 0,9446
Total
26 82,0523 3,1559
O valor de R
2
é cerca de 94% o que representa um modelo com um ótimo
grau de ajuste. F obtido é cerca de trinta e três vezes maior que o valor tabelado a
95% de confiança (F
4,22
= 2,82), desse modo, o modelo é capaz de explicar a maior
parte da variabilidade dos dados. Na figura 42 podemos observar a capacidade de
previsão dos valores de atividade.
RESULTADOS E DISCUSSÕES
- 107 -
Figura 42. Atividades (lnIC
50
) previstas contra as observadas para o Tg.
O valor do coeficiente de correlação ajustado para este modelo é 0,9346, o
maior coeficiente obtido para os modelos de atividade e seletividade da série
derivada do TMQ. A probabilidade associada ao valor de F é menor que 0,0001, o
que valida o coeficiente de correlação.
A análise qualitativa da falta de ajuste do modelo de regressão é apresentada
na figura 43.
RESULTADOS E DISCUSSÕES
- 108 -
Figura 43. Gráfico dos resíduos do modelo de regressão para a atividade contra o Tg.
A análise visual dos resíduos no gráfico acima revela um padrão estritamente
aleatório para a distribuição dos mesmos, sugerindo que o modelo representado pela
equação 57 não apresenta falta de ajuste e que não devem existir erros sistemáticos
devido à especificação incorreta do mesmo.
Os intervalos de confiança para os coeficientes das variáveis do modelo de
atividade contra o Tg são apresentados na equação 59. Pode-se notar que todos os
coeficientes da regressão são estatisticamente significantes, já que todos os valores a
95% de confiança são maiores que o próprio coeficiente.
lnIC
50
Tg = - 170,18 (± 12,79) + 0,51 (± 0,18)
2
χ
v
- 330,90 (± 17,73) QN
12
+
+ 152,46 (± 23,53) S
N,A
N
12
+ 78,93 (± 16,25) ρ
LUMO
C
8
(59)
O número de quatro variáveis utilizadas no modelo de regressão está abaixo
do limite proposto, para os 37 derivados do TMQ o número máximo de variáveis
utilizadas deve ser sete, com o objetivo de minimizar a ocorrência de correlação
entre as mesmas. Como pode ser observado na tabela 25 nenhuma das variáveis
apresenta correlação apreciável.
RESULTADOS E DISCUSSÕES
- 109 -
Tabela 25. Matriz de correlação para as variáveis do modelo de atividade contra o Tg
2
χ
v
QN
12
S
N,A
N
12
ρ
LUMO
C
8
2
χ
v
1,00
QN
12
0,08 1,00
S
N,A
N
12
-0,10 0,08 1,00
ρ
LUMO
C
8
0,14 -0,35 -0,00 1,00
O primeiro descritor do modelo de regressão, índice de conectividade de
valência de segunda ordem, representa o número de vizinhos diretamente ligados a
um dado átomo em duas direções. O aumento de seu valor implica em um aumento
da atividade.
A segunda variável do modelo já foi discutida anteriormente e como foi
sugerido esta deve ter importância fundamental nas interações com os aminoácidos
Glu30 e Glu32. A terceira variável deve exercer praticamente a mesma importância
nestas interações.
A densidade do LUMO do carbono 8, átomo que assume uma posição
equivalente a um carbono do diidrofolato, deve estar relacionada com a etapa de
entrada do íon hidreto na conversão do diidrofolato a tetraidrofolato.
iii) Previsão do modelo para a atividade contra a enzima do fígado de Rato
A última equação estabelecida para a atividade da série derivada do TMQ é
apresentada abaixo, equação 60, onde podemos observar as variáveis que descrevem
a atividade das drogas estudadas contra a enzima do fígado de rato.
lnIC
50
Rl = - 213,76 + 137,27 QN
11
- 317,50 QN
12
+ 73,19 S
N,A
C
1
+
+ 338,17 S
R,A
C
4
- 0,55E
Hb
Val115Hs (60)
Esta equação foi analisada através da análise da variância da regressão. Os
parâmetros de avaliação do grau de ajuste do modelo são apresentados na tabela 26.
RESULTADOS E DISCUSSÕES
- 110 -
Tabela 26. Análise da variância (ANOVA) para o modelo de atividade contra o Rl
Fonte
df SS MS
Regressão
5 90,7119 18,1424 F = 36,3337
Resíduo
21 10,4858 0,4993 R
2
= 0,8964
Total
26 101,1977 3,8922
O modelo de regressão apresenta um valor de R
2
próximo de 90 %, este
parâmetro indica que há um bom ajuste do modelo às respostas observadas. O valor
de F é cerca de 13,6 vezes o tabelado a 95% de confiança (F
5,21
= 2,68). Este modelo
apresenta uma elevada capacidade de previsão e, por isso, é capaz de explicar a
maior parte da variabilidade dos dados, figura 44.
Figura 44. Atividades (lnIC50) previstas contra as observadas para o Rl.
O valor do quadrado do coeficiente de correlação ajustado obtido para este
modelo é
2
A
just
R
= 0,8717 e o da probabilidade associada ao valor de F é p < 0,0001,
demonstrando que o coeficiente de correlação apresenta significância estatística.
A análise do gráfico dos resíduos do modelo de regressão indica que o
modelo não apresenta falta de ajuste devido a sua especificação, figura 45.
RESULTADOS E DISCUSSÕES
- 111 -
Figura 45. Gráfico dos resíduos do modelo de regressão para a atividade contra o Rl.
A distribuição dos pontos no gráfico dos resíduos assume uma estrutura
aleatória, indicando a inexistência de erros sistemáticos.
A avaliação dos intervalos de confiança demonstrou a significância estatística
dos coeficientes da regressão, equação 61.
lnIC
50
Rl = - 213,76 (± 32,99) + 137,27 (± 52,88) QN
11
- 317,50 (± 29,77) QN
12
+
+ 73,19 (± 17,78) S
N,A
C
1
+ 338,17 (± 77,27) S
R,A
C
4
+
- 0,55 (± 0,19) E
Hb
Val115Hs (61)
Um total de oito variáveis foram utilizadas na equação de regressão, número
inferior as sete variáveis sugeridas com o objetivo de minimizar as correlações por
coincidência. Estas variáveis e as correlações existentes entre elas são apresentadas
na tabela 27.
RESULTADOS E DISCUSSÕES
- 112 -
Tabela 27. Matriz de correlação para as variáveis do modelo de atividade contra o Rl
QN
11
QN
12
S
N,A
C
1
S
R,A
C
4
E
Hb
Val115Hs
QN
11
1,00
QN
12
0,48 1,00
S
N,A
C
1
-0,01 -0,02 1,00
S
R,A
C
4
0,24 0,13 0,01 1,00
E
Hb
Val115Hs
0,04 0,20 0,10 -0,06 1,00
Nenhuma das variáveis utilizadas no modelo apresentou correlação. O
descritor carga atômica do nitrogênio 11 parece ter a mesma importância que a QN
12
,
porém, quanto mais negativa for a carga no nitrogênio 12 maior será a atividade, ao
contrário do nitrogênio 11.
A superdelocalizabilidade nucleofílica do carbono 1 pode estar relacionada
com o fortalecimento da interação entre o grupo amina do nitrogênio 12 e o Glu30 na
enzima humana.
Quanto menor for a energia da ligação de hidrogênio entre o grupo amina e o
aminoácido Val115 maior será a elevação da atividade. Está interação é específica
com a enzima humana e deve ser suprimida para que se alcance uma maior
seletividade das drogas frente às enzimas dos parasitos.
iv) Previsão do modelo para a seletividade contra a enzima do Pneumocystis
carinii
A equação que tenta descrever a seletividade das drogas derivadas do TMQ
contra a enzima diidrofolato redutase do P. carinii é apresentada na equação 62.
lnSIPc = - 43,89 + 1,41 IP + 157,17 QN
11
- 141,91 QN
12
+
+ 11,81 S
E,A
N
10
+ 125,89 ρ
LUMO
C
3
- 0,17 E
Hb
Glu30Hs (62)
A análise da variância para o modelo apresentado acima está desenvolvida na
tabela 28.
RESULTADOS E DISCUSSÕES
- 113 -
Tabela 28. Análise da variância (ANOVA) para o modelo de seletividade contra o Pc
Fonte
df SS MS
Regressão
6 37,5336 6,2556 F = 26,4747
Resíduo
20 4,7257 0,2363 R
2
= 0,8882
Total
26 42,2594 1,6254
Podemos observar facilmente, através do coeficiente de determinação do
modelo, que o primeiro modelo para seletividade apresenta um considerável grau de
ajuste. O valor de F é 10 vezes maior que o tabelado a 95% de confiança (F
6,20
=
2,60). Este indica que a maior parte da variabilidade dos dados é explicada como
pode ser observado na figura 46.
Figura 46. Seletividades (lnSI) previstas contra as observadas para o Pc.
O valor de
2
A
just
R
= 0,8546 é comparável com os obtidos para os modelos de
atividade, o que demonstra a boa capacidade de previsão dos modelos de seletividade
para os derivados do TMQ. A probabilidade associada ao valor de F apresenta valor
menor que 0,0001. Através da análise dos resíduos de regressão podemos perceber a
não existência de erros sistemáticos no modelo proposto, figura 47.
RESULTADOS E DISCUSSÕES
- 114 -
Figura 47. Gráfico dos resíduos do modelo de regressão para a seletividade contra o
Pc.
A significância estatística dos coeficientes de regressão avaliada através dos
intervalos de confiança a 95% é apresentada na equação 63.
lnSIPc = - 43,89 (± 13,20) + 1,41 (± 0,60) IP + 157,17 (± 38,39) QN
11
+
- 141,91 (± 23,16) QN
12
+ 11,81 (± 1,99) S
E,A
N
10
+
+ 125,89 (± 25,14) ρ
LUMO
C
3
- 0,17 (± 0,08) E
Hb
Glu30Hs (63)
Todos os coeficientes são estatisticamente significantes e o número de
variáveis utilizadas no modelo para seletividade corresponde é menor que o sugerido
com intuito de minimizar as correlações por coincidência, entretanto, pode-se
observar na tabela 29 que quatro das variáveis estudadas apresentam correlação
mínima.
RESULTADOS E DISCUSSÕES
- 115 -
Tabela 29. Matriz de correlação para as variáveis do modelo de seletividade contra o
Pc
IP
QN
11
QN
12
S
E,A
N
10
ρ
LUMO
C
3
E
Hb
Glu30Hs
IP
1,00
QN
11
-0,48 1,00
QN
12
-0,57 0,48 1,00
S
E,A
N
10
0,42 -0,11 -0,23 1,00
ρ
LUMO
C
3
-0,53 0,26 0,29 -0,23 1,00
E
Hb
Glu30Hs
-0,51 0,46 0,50 -0,19 0,59 1,00
Uma nova variável aparece como descritor importante para a seletividade, a
saber, o potencial de ionização. Este caracteriza a susceptibilidade da molécula a um
ataque eletrofílico. Quanto maior for o valor de IP maior será a seletividade do
composto segundo o modelo de regressão.
Os demais descritores já foram discutidos. É importante ressaltar o papel da
energia das ligações de hidrogênio também nos modelos de seletividade.
v) Previsão do modelo para a seletividade contra a enzima do Toxoplasma gondii
A previsão do modelo que tenta descrever a seletividade da série homóloga
ao TMQ contra a enzima diidrofolato redutase do T. gondii é apresentada na equação
64.
lnSITg = 68,71 - 0,27
0
χ
v
- 81,44 QN
6
+ 255,53 QN
11
+ 44,63 S
N,A
C
9
+
+ 66,58 S
N,A
N
11
- 160,50 S
N,A
N
12
– 1294,98 ρ
LUMO
C
4
+
- 0,72 E
Hb
Val115Hs (64)
A equação apresentada acima foi avaliada através da análise da variância da
regressão. Os parâmetros da ANOVA para o modelo de seletividade contra o Tg
estão apresentados na tabela 30.
RESULTADOS E DISCUSSÕES
- 116 -
Tabela 30. Análise da variância (ANOVA) para o modelo de seletividade contra o Tg
Fonte
df SS MS
Regressão
8 39,7383 4,9673 F = 22,1104
Resíduo
18 4,0438 0,2246 R
2
= 0,9076
Total
26 43,7821 1,6839
O coeficiente de determinação para este modelo de seletividade é maior que
90% e o valor do teste F é aproximadamente 9 vezes o tabelado a 95% de confiança
(F
8,18
= 2,51). Tais parâmetros sugerem que a maior parte da variabilidade dos dados
é explicada, figura 48.
Figura 48. Seletividades (lnSI) previstas contra as observadas para o Tg.
Como pode ser observado na figura acima o modelo de seletividade para o
Tg, do mesmo modo que o modelo de seletividade para o Pc, apresenta uma
capacidade de previsão dos valores observados comparável com a dos modelos de
atividade. O coeficiente de correlação ajustado é igual a 0,8666 e a probabilidade é
menor que 0,0001. A análise dos resíduos da regressão demonstra uma distribuição
aleatória dos pontos, figura 49.
RESULTADOS E DISCUSSÕES
- 117 -
Figura 49. Gráfico dos resíduos do modelo de regressão para a seletividade contra o
Tg.
A estrutura aleatória na distribuição dos pontos do gráfico acima demonstra a
não ocorrência de erros sistemáticos. Tal análise sugere que este modelo de
seletividade, do mesmo modo que contra o Pc, é estatisticamente significante.
Os intervalos de confiança avaliados a 95% para os coeficientes das variáveis
do modelo de regressão sugerem que todos são significativos, equação 65.
lnSITg = 68,71 (± 20,06) - 0,27 (± 0,09)
0
χ
v
- 81,44 (± 24,44) QN
6
+
+ 255,53 (± 40,29) QN
11
+ 44,63 (± 6,96) S
N,A
C
9
+ 66,58 (± 24,27) S
N,A
N
11
+
- 160,50 (± 30,66) S
N,A
N
12
- 1294,98 (± 307,00) ρ
LUMO
C
4
+
- 0,72 (± 0,13) E
Hb
Val115Hs (65)
O número de variáveis utilizadas na especificação do modelo é maior do que
o valor máximo para evitar correlação por coincidência, mesmo assim as somente as
variáveis QN
6
e QN
11
apresentam correlação significativa, tabela 31.
RESULTADOS E DISCUSSÕES
- 118 -
Tabela 31. Matriz de correlação para as variáveis do modelo de seletividade contra o
Tg
0
χ
v
QN
6
QN
11
S
N,A
C
9
S
N,A
N
11
S
N,A
N
12
ρ
LUMO
C
4
E
Hb
Val115Hs
0
χ
v
1,00
QN
6
-0,15 1,00
QN
11
-0,10 0,62 1,00
S
N,A
C
9
-0,15 0,50 0,13 1,00
S
N,A
N
11
-0,26 0,17 0,17 -0,03 1,00
S
N,A
N
12
-0,18 -0,02 0,03 -0,06 0,50 1,00
ρ
LUMO
C
4
0,11 -0,07 -0,06 -0,11 -0,26 -0,26 1,00
E
Hb
Val115Hs
-0,02 -0,05 0,04 -0,13 0,10 -0,24 0,06 1,00
O índice de conectividade de valência de ordem zero aparece na equação da
regressão como variável importante. Uma diminuição no seu valor leva a um
aumento da atividade. Este índice reflete o número de vizinhos mais próximos,
diretamente ligados a um dado átomo.
Quanto menor for a carga do átomo de nitrogênio 6 maior será a atividade
prevista pelo modelo. Esta carga deve estar associada a protonação do átomo de
nitrogênio no anel pteridínico.
As demais variáveis já foram discutidas e em sua maioria podem ser
associadas ao mecanismo de conversão do folato a diidrofolato e posteriormente a
tetraidrofolato.
Após avaliar os modelos de atividade e seletividade obtidos para a série
derivada do TMQ e verificar a capacidade de previsão dos valores observados,
procedemos a aplicação das equações ao conjunto de drogas reservadas para o teste
dos modelos, e desse modo suas validações. Os erros para as previsões de atividade e
seletividade das drogas do grupo de teste são apresentados na tabela 32.
RESULTADOS E DISCUSSÕES
- 119 -
Tabela 32. Erros para as previsões de atividade e seletividade das drogas do grupo de
teste dos derivados do TMQ
Erros para lnIC
50
(%) Erros para lnSI (%)
Drogas
Pc Tg Rl Pc Tg
q
1
3,31 29,13 389,00
87,99 120,10
q
8
20,90 29,30 0,08
80,63 156,43
q
10
8,98 16,13 41,84
308,91 161,10
q
15
22,56 56,65 12,69
116,96 51,95
q
23
22,45 3,75 15,05
5,83 103,42
q
24
6,41 188,71 21,31
3,24 93,42
q
25
26,65 17,70 10,08
3316,44 10,21
q
27
43,58 24,29 36,03
442,88 79,20
q
32
27,08 25,22 4,64
100,83 72,13
q
33
30,43 23,22 26,92
29,14 31,55
q
35
23,13 27,37 45,40
322,42 268,22
q
38
21,20 17,42 19,10
290,76 493,98
q
39
9,28 23,95 24,49
2837,10 123,17
q
40
9,67 42,24 0,70
468,22 43,11
q
41
21,01 81,66 43,96
286,30 75,04
q
42
25,33 58,83 21,95
321,43 56,63
q
43
39,97 50,83 46,60
153,78 51,89
q
44
35,17 95,89 27,61
158,14 78,44
q
45
31,92 48,84 38,85
206,01 34,54
q
46
21,55 85,53 29,06
150,74 1875,18
q
47
24,27 11,59 30,27
166,21 286,89
q
48
32,27 75,18 47,03
164,40 60,43
q
49
29,48 63,83 19,62
196,47 51,43
q
50
20,14 93,95 11,12
131,46 1112,45
q
51
16,68 61,18 3,77
171,08 71,37
q
52
28,20 29,24 28,73
175,63 156,42
q
53
4,95 9,05 26,28
239,30 405,09
RESULTADOS E DISCUSSÕES
- 120 -
Erros para as previsões de atividade e seletividade das drogas do grupo
de teste dos derivados do TMQ
q
54
41,50 4,34 27,93
143,27 217,60
q
55
19,41 55,90 73,56
478,44 796,68
q
56
32,31 1,63 4,43
28,30 48,92
q
57
37,98 33,52 77,82
17,61 627,58
q
58
52,86 90,46 60,28
259,52 216,60
q
59
28,89 43,89 100,46
53,50 985,47
q
60
13,29 4,69 36,72
153,31 797,85
q
61
46,03 51,13 77,51
77,23 211,70
q
62
40,19 62,56 63,80
90,96 146,75
q
63
17,88 69,03 53,00
22,26 983,07
q
64
31,06 61,23 83,15
297,91 1034,90
q
65
51,04 22,06 1,91
403,88 236,73
q
66
31,04 133,47 66,59
146,33 6894,46
q
67
29,27 52,45 81,20
447,08 206,11
q
68
43,03 68,39 97,43
151,46 2856,54
q
69
74,84 65,17 181,90
601,82 731,33
q
70
37,66 63,84 80,23
2,23 4183,52
q
71
13,93 67,86 32,60
87,38 196,88
q
72
8,74 63,49 46,62
213,00 2048,17
Em azul mais escuro são apresentados os erros que ficaram na faixa de 0,00 a
30,00 %, sendo considerados como pequenos. Os valores em azul claro representam
os erros na faixa de 30,01 a 50,00 % considerados como erros medianos. Os demais
valores representam erros superiores a 50,01% e, desse modo, são indicativos de
previsões mal sucedidas.
Podemos perceber que para a série derivada do TMQ os modelos de atividade
são validados pelo conjunto testes, ao contrário dos modelos de seletividade. Estes
últimos, apesar de apresentarem parâmetros estatísticos de determinação do grau de
ajuste melhores do que os modelos de seletividade da série do TMP, não
apresentaram uma previsão do grupo teste tão boa.
RESULTADOS E DISCUSSÕES
- 121 -
Dentre os modelos obtidos o melhor foi sem dúvida aquele que descreve a
atividade das drogas derivadas do TMQ na inibição da enzima do Pneumocystis
carinii.
4.4. Estruturas das novas drogas propostas
A proposição de novas estruturas foi feita com base na análise da superfície
da cavidade do sítio ativo da enzima DHFR do Pneumocystis carinii, com o objetivo
de formular drogas mais potentes e seletivas. Foram imaginadas substituições
moleculares nos compostos base, de forma que as interações com os resíduos de
aminoácidos fossem maximizadas. A análise das cavidades e as regiões de possíveis
interações são apresentadas na figura 50.
Figura 50. Sugestões de locais para modificações estruturais, grupos destacados, dos
compostos base TMP (a) e TMQ (b).
As modificações sugeridas para o TMP foram baseadas nas regiões dos
grupos indicados como segue: R
1
(região azul) grupos doadores de hidrogênio como
–NH
2
; R
2
(região amarela) grupos hidrofóbicos como –CH
3
; R
3
=R
4
(região azul e
vermelha) grupos doadores e/ou aceitadores de hidrogênio como –COOH, –CONH
2
ou –COCH
3
; R
5
(região vermelha) grupos aceitadores de hidrogênio como –COOH
e; R
6
(região amarela e vermelha) grupos hidrofóbicos ou aceitadores de hidrogênio
como –CH
3
ou –COOH.
(a)
R
1
R
2
R
3
R
4
R
5
R
6
(b)
R
1
R
2
R
3
R
4
R
5
R
6
R
7
RESULTADOS E DISCUSSÕES
- 122 -
Da mesma forma foram imaginadas as substituições no TMQ: R
1
(região
azul) átomo de nitrogênio no anel aromático; R
2
(região predominantemente azul)
átomo de nitrogênio no anel aromático ou grupo –NH
2
; R
3
=R
4
=R
5
=R
6
(região
predominantemente azul e vermelha) grupos –OH, –NH
2
, –COOH, –CONH
2
ou –
COCH
3
, e; R
7
(região amarela) grupo –CH
3
.
Após a construção, modelagem e cálculo dos descritores realizamos a
previsão dos valores de IC
50
(atividade) e SI (seletividade) das novas drogas, com
base nas equações de QSAR estabelecidas. Num total foram propostas 112 novas
estruturas derivadas do TMP (mlp
1
-mlp
112
) e, 160 novas estruturas derivadas do
TMQ (mlq
1
-mlq
160
). Na tabela 33 são apresentados os grupos substituintes e os
valores de atividade e seletividade para as melhores propostas baseadas no TMP e
TMQ. Os valores de todas as demais previsões são apresentados nas tabelas do
apêndice.
RESULTADOS E DISCUSSÕES
- 123 -
Tabela 33. Atividades e seletividades previstas para as melhores estruturas propostas derivadas do TMP e TMQ
IC
50
(µM) SI
Drogas R
1
R
2
R
3
R
4
R
5
R
6
R
7
Pc Tg Ma
Pc Tg
mlp
7
H CH
3
CONH
2
H H H
-
5,8207 0,0002 ?
9,3590 14,1082
mlp
17
H H H H COOH H
-
? 0,0002 ?
? 13,4970
mlp
23
H CH
3
CONH
2
H COOH H
-
2,1120 0,0001 ?
42,7180 13,9057
mlp
24
H CH
3
COCH
3
H COOH H
-
5,4051 0,0002 ?
9,1886 19,0827
mlp
43
NH
2
H CONH
2
H H CH
3
-
0,0596 ? 0,0016
12,2919 ?
mlp
55
H CH
3
CONH
2
H COOH CH
3
-
1,4992 0,0007 ?
6,8099 17,3170
mlp
59
NH
2
H CONH
2
H COOH CH
3
-
0,0203 ? 0,0002
10,7970 ?
mlp
66
H H H CONH
2
H H
-
4,5442 0,0001 ?
36,7500 10,0144
mlp
87
NH
2
CH
3
H CONH
2
COOH H
-
0,0710 ? 0,0014
14,5602 ?
mlq
15
N N NH
2
COCH3 H H H
1,7787 3,2650
-
0,3104 16,4929
mlq
83
N -C-NH2 NH
2
H H H H
0,3803 1,9866
-
? 11,5451
mlq
88
N -C-NH2 CONH
2
COOH H H H
0,0603 ?
-
? 4,7514
mlq
96
N -C-NH2 CONH
2
COCH3 H H H
0,0731 ?
-
? ?
mlq
112
N -C-NH2 CONH
2
COCH3 H H CH3
0,0412 7,2724
-
? 2,2054
mlq
140
N -C-NH2 CONH
2
H H COOH H
0,0763 9,0232
-
? 1,6148
RESULTADOS E DISCUSSÕES
- 124 -
Os valores previstos representados por (?) são aqueles que apresentaram
resultados superestimados, que muito provavelmente ocorreram devido à
incapacidade dos modelos em prever as atividades destas moléculas propostas. A
estrutura mlp
59
, em azul, aparece como a melhor proposta de inibidor da enzima do
P. carinii, figura 51.
Figura 51. Modelo da estrutura do mlp
59
após a otimização de sua geometria.
Tal estrutura apresenta um valor de IC
50
para o Pneumocystis carinii menor
do que os valores do PTX (IC
50
= 0,031 µM) e do TMQ (IC
50
= 0,042 µM) que são
inibidores muito potentes da DHFR, este valor indica que a droga proposta, mlp
59
, é
mais potente que o PTX e o TMQ. O valor do índice de seletividade do mlp
59
para o
Pc é muito próximo do valor da trimetoprima (SI = 14,000) que é um inibidor
seletivo da DHFR do parasito. Estes resultados sugerem que a droga proposta
apresenta uma alta atividade e seletividade para a DHFR do P. carinii, surgindo
como um promissor inibidor desta enzima. Obviamente é necessário verificar a
possibilidade de síntese deste composto e avaliar sua atividade biológica
experimentalmente, para que se possam comprovar nossas previsões.
Com o intuito de avaliar as possíveis interações que proporcionam elevada
atividade e seletividade contra o P. carinii, a estrutura da mlp
59
foi colocada na
cavidade do sítio da DHFR do Pc. Este complexo de inclusão foi otimizado através
de cálculos de mecânica molecular MM3 e, a superfície da cavidade do sítio ativo foi
construída, figura 52.
RESULTADOS E DISCUSSÕES
- 125 -
Figura 52. Cavidade do sítio ativo da DHFR do Pc complexada com o mlp
59
sob dois
ângulos de visualização.
Pela simples observação da cavidade representada na figura 52 é fácil
perceber que as modificações sugeridas na estrutura base do TMP levam a uma
maximização das interações e, a um melhor encaixe da droga no sítio ativo da
enzima, com a acomodação dos grupos hidrofóbicos na região amarela, dos grupos
ácidos nas regiões vermelhas e dos grupos básicos nas regiões azuis.
A conformação assumida pela mlp
59
favorece ainda o estabelecimento de
ligações de hidrogênio especificas para este composto, o que pode contribuir para um
aumento da atividade e seletividade. Todas as interações com os resíduos de
aminoácidos e moléculas de água conservadas são apresentadas na figura 53.
Figura 53. Ligações de hidrogênio estabelecidas entre a mlp
59
e os resíduos de
aminoácidos e moléculas de água do sítio ativo da DHFR do Pc.
RESULTADOS E DISCUSSÕES
- 126 -
Como pode ser observado na figura acima, além das interações que já eram
formadas pela trimetoprima, três novas ligações de hidrogênio foram estabelecidas
com moléculas de água conservadas no sítio ativo da enzima. Estas interações podem
ser responsáveis pela maior atividade e seletividade prevista nos modelos de
regressão.
4.5. Estudos teóricos do mecanismo da reação enzimática
Após realizar a modelagem, otimização do folato dentro da cavidade do sítio
ativo da DHFR humana e, cálculo dos orbitais de fronteria do sistema proteíco livre
em fase gasosa, observamos que os orbitais não se localizavam nos resíduos de
aminoácidos do sítio ativo, figura 54.
Figura 54. Localização dos orbitais de fronteira (HOMO-10 até LUMO+9) do
complexo proteico formado pela DHFR do Hs, NADPH e folato. Os lóbulos
representados em amarelo e vermelho correspondem aos LUMOs e os lóbulos em
azul e ver aos HOMOs.
RESULTADOS E DISCUSSÕES
- 127 -
É fácil de perceber que os orbitais de fronteira calculados localizam-se nos
resíduos de aminoácidos da superfície da proteína, isto pode ser explicado pela
natureza ionizada da maior parte destes resíduos. Entretanto, devido a natureza
dielétrica da água, quando o efeito do sovente é considerado, ocorre uma modifiação
no campo elétrico desses resíduos da superfície neutralizando-os.
O efeitro de solvatação foi avaliado a partir dos cálculos do complexo
enzimático formado entre o folato, o cofator NADPH e a DHFR humana
considerando a água como solvente (constante dielétrica 78,4) através do modelo
COSMO. Pudemos perceber que a maior parte dos orbitais de fronteira HOMO e
LUMO localizam-se nos resíduos de aminoácidos que compoem o sítio ativo da
enzima.
Figura 55. Localização dos orbitais de fronteira (HOMO-10 até LUMO+9) nos
resíduos de aminoácidos do sítio ativo da DHFR do Hs.
RESULTADOS E DISCUSSÕES
- 128 -
Para avaliar o mecanismo da reação enzimática do folato a diidrofolato e
posteriormente a tetraidrofolato realizamos cálculos dos orbitais moleculares do
complexo proteico considerando sua solvatação. A análise das etapas do mecanismo
de conversão do folato a diidrofolato foi realizada inicialmente através dos cálculos
do sistema sem considerar a protonação dos nitrogênios do folato, figura 56.
Figura 56. Estrutura do folato e átomos de nitrogênio que correspondem aos sítios de
protonação no mecanismo da reação.
Pudemos observar que a protonação é uma etapa fundamental no mecanismo
de reação enzimática, pois, quando o cálculo foi realizado desconsiderando a
protonação dos nitrogênios do folato não houve localização de orbitais moleculares
de fronteira em nenhum dos átomos do folato, estes aparcem apenas nos resíduos de
aminoácidos do sítio ativo e no cofator enzimático NADPH, figura 57.
RESULTADOS E DISCUSSÕES
- 129 -
Figura 57. Localização dos orbitais de fronteira para o sistema proteico sem
considerar a protonação do folato.
Após protonar um dos nitrogênios do folato, algo possível de ocorrer dentro
da enzima através da interação com algum resíduo de aminoácido ácido ou até
mesmo com alguma molécula de água, como sugerido na literatura para a DHFR da
Escherichia coli [39] e como pode ser observado na figura 13, realizamos um novo
cálculo dos orbitais de fronteira e verificamos que estes são localizados em posições
estratégicas para a segunda etapa da conversão do folato a diidrofolato, a
transferência do íon hidreto do NADPH para o folato, figura 58.
RESULTADOS E DISCUSSÕES
- 130 -
Figura 58. HOMO-2 e LUMO+6 localizados em posições estratégicas para a
transferência do íon hidreto do NADPH para o folato.
Podemos observar na figura acima que o HOMO-2 está localizado no anel do
NADPH que sofre oxidação, isto sugere que este grupo deve ser um bom reagente
nucleofílico, capaz de doar o íon hidreto, o que está de acordo com o mecanismo
proposto para a reação estudada, na qual o NADPH é oxidado à NADP
+
. O
LUMO+6 localiza-se principalmente no átomo de carbono onde ocorre a entrada do
íon hidreto na conversão do folato a diidrofolato, o que o caracteriza como um bom
reagente eletrofílico.
No processo de conversão do diidrofolato a tetraidrofolato também avaliamos
as etapas de protonação e transferência do íon hidreto do mecanismo enzimático
através da localização dos orbitais de fronteira. Foi possível verificar novamente que
sem a protonação do segundo átomo de nitrogênio do folato não ocorre a localização
dos orbitais. Após protoná-lo observamos a localização do HOMO-1 no anel do
NADPH e do LUMO no diidrofolato, figura 59.
RESULTADOS E DISCUSSÕES
- 131 -
Figura 59. HOMO-1 e LUMO localizados em posições estratégicas para a
transferência do íon hidreto do NADPH para o diidrofolato.
Podemos observar na figura acima que o HOMO-1 está localizado no anel do
NADPH que sofre oxidação durante a transferência do hidreto para o diidrofolato,
caracterizando-o como um bom reagente nucleofílico. O LUMO esta localizado
principalmente no átomo de carbono onde ocorre a entrada do íon hidreto na
conversão do diidrofolato a tetraidrofolato, o que o caracteriza como um bom
reagente eletrofílico.
Estes estudos do mecanismo enzimático através da localização dos orbitais de
fronteira sugerem que a etapa de protonação é fundamental para a transferência do
hidreto. Uma análise mais aprofundada das etapas da reação pode ser realizada
através de índices de reatividade descritos na teoria dos orbitais de fronteira,
chamdos índices de Fukui.
CONCLUSÕES
- 132 -
Capítulo 5
Conclusões
Todas as estruturas das drogas foram modeladas satisfatoriamente inclusive
as estruturas das enzimas diidrofolato redutase do Pneumocystis carinii e
humana;
Os resíduos de aminoácidos dos sítios ativos das enzimas estudadas foram
determinados através da análise dos vizinhos dos substratos complexados;
As seqüências de aminoácidos das duas enzimas estudadas foram alinhadas e
através dessa análise foi possível perceber que os resíduos Ile123 na DHFR
do Pc e Val115 na DHFR do Hs devem contribuir para um aumento da
seletividade das drogas estudadas;
As interações estabelecidas entre as drogas estudadas e os resíduos de
aminoácidos, após sua inclusão, foram analisadas através dos mapas das
superfícies das cavidades dos sítios ativos das enzimas;
Pudemos identificar as principais ligações de hidrogênio formadas entre as
drogas e o receptor enzimático, na enzima do Pc os principais grupos que
estabelecem ligações de hidrogênio são a Ile10, Ile123, Glu32, W520 e W525,
na enzima humana são Ile7, Val115, Glu30 e W190;
CONCLUSÕES
- 133 -
As energias das ligações de hidrogênio calculadas foram utilizadas como
descritores moleculares e, através dos modelos de regressão, foi possível
perceber que estas variáveis são importantes na previsão da atividade e
seletividade dos conjuntos de drogas estudadas;
Dentre todos os descritores clássicos calculados aquele que aparece com
maior freqüência em nossas equações é o coeficiente de partição octanol-
água, demonstrando que as características de permeabilidade são importantes,
os descritores de conectividade e topológicos também demonstraram
relevância como variáveis;
Vários descritores quânticos foram utilizados como variáveis nas equações de
QSAR, entre estes, as densidades dos orbitais HOMO e LUMO, as
superdelocalizabilidades e o momento de dipolo apresentaram maior
ocorrência. As propriedades atômicas associadas às características do
mecanismo de reação enzimática encontraram boa aplicação nos modelos
obtidos;
Todos os modelos de QSAR estabelecidos apresentaram significância
estatística o que pode ser observado através da análise de sua variância. Os
modelos de atividade para o conjunto de drogas derivadas do TMP
demonstraram melhor grau de ajuste que os de seletividade. Para as drogas
derivadas do TMQ todos os modelos de atividade e de seletividade
apresentaram elevada grau de ajuste;
A melhor previsão de modelo para o conjunto de drogas derivadas do TMP
foi o que tenta descrever a atividade dos compostos na inibição da enzima
DHFR do Mycobacterium avium. O melhor modelo proposto para a série
homóloga ao TMQ foi o da atividade contra a DHFR do Toxoplasma gondii;
Através da avaliação da capacidade de previsão para o grupo teste foi
possível perceber que ao contrário do esperado, as previsões foram melhores
sucedidas para os modelos de seletividade das drogas derivadas do TMP.
CONCLUSÕES
- 134 -
Para as drogas derivadas do TMQ os menores erros na previsão ocorreram
para os modelos de atividade, destacando-se o modelo para a atividade contra
o Pc;
Nossas propostas de estruturas potencialmente mais ativas e/ou seletivas,
baseadas em modificações estruturais com o objetivo de maximizar as
interações entre as drogas e o os aminoácidos da enzima do P. carinii,
apresentaram nove candidatos em potencial derivados do TMP (mlp
7
, mlp
17
,
mlp
23
, mlp
24
, mlp
43
, mlp
55
, mlp
59
, mlp
66
e mlp
87
), sendo o mlp
59
uma proposta
de inibidor mais ativo e seletivo contra o Pc. Um total de seis potenciais
candidatos foi obtido para os derivados do TMQ.
Os estudos teóricos do mecanismo da reação enzimática de conversão do
folato a diidrofolato e posteriormente a tetraidrofolato demonstraram a
importância da primeira etapa, protonação dos nitrogênios, para que a
segunda etapa possa ocorrer, transferência do íon hidreto do cofator NADPH
para o folato e diidrofolato. Pudemos ainda comprovar o efeito da solvatação
na localização dos orbitais de fronteira do sistema enzimático, como já havia
sido sugerido na literatura.
PERSPECTIVAS FUTURAS
- 135 -
Capítulo 6
Perspectivas Futuras
Proceder a avaliação do grau de previsibilidade dos modelos obtidos através
da validação cruzada (cross validation);
Ampliar os estudos do mecanismo de reação enzimática pela análise dos
índices de reatividade derivados da teoria dos orbitais de fronteira, índices de
Fukui;
Aprofundar os estudos das ligações de hidrogênio através de cálculos ab
initio;
Redigir pelo menos três artigos, sendo um deles baseados nos estudos de
QSAR para a série homóloga ao TMP, outro baseado na série de homólogos
ao TMQ e um terceiro sobre os estudos de modelagem molecular, docking
dos ligantes e mecanismo de reação da enzima diidrofolato redutase. E
submete-los a publicação em periódicos indexados.
REFERÊNCIAS BIBLIOGRÁFICAS
- 136 -
Referências Bibliográficas
[1] Pink, R.; et al. Opportunities and challenges in antiparasitic drug discovery.
Nature Reviews – Drug Discovery, v.4, p.727-740, Sep. 2005.
[2] Rosowsky, A.; et al. Synthesis of 2,4-diamino-6-[2’-O-(ω-
carboxyalkyl)oxydibenz[b,f]azepin-5-yl]-methylpteridines as potent and selective
inhibitors of Pneumocystis carinii, Toxoplasma gondii, and Mycobacterium
avium 4dihydrofolate reductase.
Journal of Medicinal Chemistry, v.47, p.2475-
2485, 2004.
[3] Kompis, I.M.; Islam, K.; Then, R.L. DNA and RNA synthesis: antifolates.
Chemical Review, v.105, p.593-620, 2005.
[4] Rosowsky, A.; Forsch, R.A.; Queener, S.F. Further studies on 2,4-diamino-5-
(2’,5’-disubstituted benzyl)pyrimidines as potent and selective inhibitors of
dihydrofolate reductases from three major opportunistic pathogens of AIDS.
Journal of Medicinal Chemistry, v.46, p.1726-1736, 2003.
[5] Gangjee, A.; Adair, O.; Queener, S.F. Synthesis and biological evaluation of 2,4-
diamino-6-(arylaminomethyl)pyrido[2,3-d]pyrimidines as inhibitors of
Pneumocystis carinii and Toxoplasma gondii dihydrofolate reductase and as
antiopportunistic infection and antitumor agents.
Journal of Medicinal
Chemistry
, v.46, n.23, p.5074-5082, 2003.
[6] LUBERT, S. Biochemistry. 4
th
ed. New York, W. H. Freeman and Company,
1996.
REFERÊNCIAS BIBLIOGRÁFICAS
- 137 -
[7] Rosowsky, A.; Forsch, R.A.; Queener, S.F. Inhibition of Pneumocystis carinii,
Toxoplasma gondii, and Mycobacterium avium dihydrofolate reductase by 2,4-
diamino-5-[2-methoxy-5-(ω-carboxyalkyloxy)benzylpyrimidines: marked
improvement in potency relative to trimethoprim and species selectivity relative
to piritrexim.
Journal of Medicinal Chemistry, v.45, p.233-241, 2002.
[8] Gangjee, A.; Dubash, N.P.; Queener, S.F. The Synthesis of new diaminofuro[2,3-
d]pyrimidines with 5-biphenyl, phenoxyphenyl and tricyclic substitutions as
dihydrofolate reductase inhibitors.
Journal Heterocyclic Chemistry, v.37,
p.935-942, 2000.
[9] Gangjee, A.; Adair, O.; Queener, S.F. Synthesis of 2,4-diamino-6-
(thioarylmethyl)pyrido[2,3-d]pyrimidines as dihydrofolate reductase inhibitors.
Bioorganic & Medicinal Chemistry, v.9, p.2929-2935, 2001.
[10] Gangjee, A.; et al. Synthesis of Classical and Nonclassical, Partially Restricted,
Linear, Tricyclic 5-deazaantifolates.
Journal of Medicinal Chemistry, v.45,
p.5173-5181, 2002.
[11] Piper, J.R.; et al. Lipophilic antifolates as agents against opportunistic
infections. 1. Agents superior to trimetrexate and piritrexim against Toxoplasma
gondii and Pneumocystis carinii in vitro evaluations.
Journal of Medicinal
Chemistry
, v.39, p.1271-1280, 1996.
[12] Suling, W.J.; et al. Antimycobacterial activites of 2,4-diamino-5-deazapteridine
derivatives and effects on mycobacterial dihydrofolate reductase.
Antimicrobial
Agents Chemotherapy, v.44, p.2784-2793, 2000.
[13] Stevens, M.F.G.; et al. Structural studies on bioactive compounds. 28. Selective
activity of triazenyl-substituted pyrimethamine derivatives against Pneumocystis
carinii dihydrofolate reductase.
Journal of Medicinal Chemistry, v.40, p.1886-
1893, 1997.
REFERÊNCIAS BIBLIOGRÁFICAS
- 138 -
[14] Cody, V.; et al. Structural studies on bioactive compounds. 30. Crystal structure
and molecular studies on the Pneumocystis carinii dihydrofolate reductase
cofactor complex with TAB, a highly selective antifolate.
Biochemistry, v.39,
p.3556-3564, 2000.
[15] Robson, C.; et al. Nonclassical 2-diamino-5-aryl-6-ethylpyrimidine antifolates:
Activity as inhibitors of dihydrofolate reductase from Pneumocystis carinii and
Toxoplasma gondii and as antitumor agents.
Journal of Medicinal Chemistry,
v.40, p.3040-3048, 1997.
[16]
Rosowsky, A.; et al. Structure-based design of selective inhibitors of
dihydrofolate reductase: synthesis and antiparasitic activity of 2,4-
diaminopteridine anlaogues with a bridged diarylamine side chain.
Journal of
Medicinal Chemistry
, v.42, p.4853-4860, 1999.
[17] Rosowsky, A.; Fu, H.; Queener, S.F. Synthesis of new 2,4-diaminopyrido[2,3-
d]pyrimidines and 2,4-diaminoquinazolines with bulky dibenz[b,f]azepine and
dibenzo[a,d]cycloheptene substituents at the 6-positiion as inhibitors of
dihydrofolate reductases from Pneumocystis carinii, Toxoplasma gondii, and
Mycobacterium avium.
Journal Heterocyclic Chemistry, v.37, p.921-926, 2000.
[18] Gangjee, A.; Adair, O.; Queener, S.F.. Pneumocystis carinii and Toxoplasma
gondii dihydrofolate reductase inhibitors and antitumor agents: synthesis and
biological activities of 2,4-diamino-5-methyl-6-[(monosubstituted
anilino)methyl]-pyrido[2,3-d]pyrimidines.
Journal of Medicinal Chemistry,
v.42, p.2447-2455, 1999.
[19] Mattioni, B.E.; Jurs, P.C.. Prediction of dihydrofolate reductase inhibition and
selectivity using computational neural networks and linear discriminant analysis.
Journal of Molecular Graphics and Modelling, v.21, p.391-419, 2003.
[20] Rosowsky, A.; et al. New 2,4-Diamino-5-(2’,5’-substituted benzyl)pyrimidines
as Potential Drugs against Opportunistic Infections of AIDS and Other Immune
REFERÊNCIAS BIBLIOGRÁFICAS
- 139 -
Disorders. Synthesis and Species-Dependent Antifolate Activity. Journal of
Medicinal Chemistry
, v.47, p.1475-1486, 2004.
[21] Nordberg, M.G.; et al. Design, synthesis, computational prediction, and
biological evaluation of ester soft drugs as inhibitors of dihydrofolate reductase
from Pneumocystis carinii.
Journal of Medicinal Chemistry, v.44, p.2391-
2402, 2001.
[22] Rang, H.P.; Dale, M.M.; Ritter, J.M. Farmacologia. 4ª edição. Rio de Janeiro,
Editora Guanabara Koogan S.A., 2001.
[23] Berman, E.M.; Werbel, L.M. The renewed potential for folate antagonists in
contemporary cancer chemotherapy.
Journal of Medicinal Chemistry, v.34,
n.2, p.479-485, Feb. 1991.
[24] Andrei, C.C.; et al. Da química medicinal à química combinatória e modelagem
molecular: um curso prático. 1ª edição. Barueri, Editora Manole Ltda., 2003.
[25] Bruice, P.Y. Organic chemistry. 3
rd
ed. New Jersey, Prentice-Hall Inc., 2001.
[26] Bohacek, R.S.; McMartin, C. Definition and Display of Steric, Hydrophobic,
and Hydrogen-Bonding Properties of Ligand Binding Sites in Proteins Using Lee
and Richards Accessible Surface: Validation of a High-Resolution Graphical
Tool for Drug Design.
Journal of Medicinal Chemistry, v.35, p.1671-1684,
1992.
[27] FUJITSU CACHE GROUP. Getting Started with BioMedCAChe: Molecular
Modeling in Drug Design. Oregon, Oxford Molecular Limited, 2003. 54p.
[28] Leach, A.R.
Molecular Modeling: principles and applications. Singapura,
Addison Wesley Longman Limited, 1998.
REFERÊNCIAS BIBLIOGRÁFICAS
- 140 -
[29] Tsai, C.S. An introduction to Computational Biochemistry. Wiley-Liss, Inc.,
2002.
[30] Ohno, K.; et al. Effects of Hydration on the Electronic Structure of an Enzyme:
Implications for the Catalytic Function.
Journal of the American Chemical
Society
, v.123, p. 8161-8162, 2001.
[31] Fujitsu Limited. (2000-2003). CaChe Worksystem Pro (computer-aided
molecular design (CAMD) modeling tool) version 6.01.
http://www.cachesoftware.com/
[32] Protein Data Bank. 2001, Research Collaboratory for Structural Bioinformatics,
The San Diego Supercomputer Center, San Diego, CA.
[33] Thomas, G. Química medicinal: uma introdução. Rio de Janeiro, editora
Guanabara Koogan S.A., 2003.
[34] Farutin, V.; et al. Structure-Activity Relationships for a Class of Inhibitors of
Purine Nucleoside Phosphorylase.
Journal of Medicinal Chemistry, v.42,
p.2422-2431, 1999.
[35] Cody V.; et al. Structure-based enzyme inhibitor design: modeling studies and
crystal structure analysis of Pneumocystis carinii dihydrofolate reductase ternary
complex with PT653 and NADPH.
Acta Crystallographica, v.D58, p.946-954,
2002.
[36] Amelin, E.A.; Donate, P.M.; Galembeck, S.E. Effect of the Environment on the
Reactivity of 4’-Substituted Flavones and Isoflavones.
Tetrahedron, v.56, n.29,
p.5105-5111, 2000.
[37] Jikyo, T.; Eto, M.; Harano K. Cycloaddition behavior of unsymmetric
cyclopentadienone. Peri- and regioselectivities.
Journal of the Chemical
Society
, v.20, p.3463-3470, 1998.
REFERÊNCIAS BIBLIOGRÁFICAS
- 141 -
[38] Galembeck, S.E.; Caramori, G.F. Qual é o sítio de Reação? Um experimento
computacional.
Química Nova, v.26, n.6, p.957-959, 2003.
[39] Peter, L.C.; Jill, E.G. Energetically Most Likely Substrate and Active-Site
Protonation Sites and Pathways in the Catalytic Mechanism of Dihydrofolate
Reductase.
Journal of the American Chemical Society, v.123, p.3418-3428,
2001.
[40] Peter, L.C.; et al. Computational methods for the study of enzymic reaction
mechanisms. 1. Applications to the hydride transfer step in the catalysis of
dihydrofolate reductase.
Journal Physics Chemical B, v.106, p.9934-9944,
2002.
[41] Peter, L.C.; Jill, E.G. Computational methods for the study of enzymic reaction
mechanisms. II. An overlapping mechanically embedded method for hybrid
semi-empirical-QM/MM calculations.
Journal of Molecular Structure
(Theochem)
, v.632, p.247-257, 2003.
[42] Peter, L.C.; Jill, E.G. Computational methods for the study of enzymic reaction
mechanisms III: A perturbation plus QM/MM approach for calculating relative
free energies of protonation.
Journal of Computational Chemistry. v.26, n.6,
p.561-568, 2005.
[43] Thanikaivelan, P.; et al. Application of quantum chemical descriptor in
quantitative structure activity and structure property relationship.
Chemical
Physics Letters
, v.323, p.59-70, 2000.
[44] Gupta, S.P. Quantitative structure-activity relationship studies on local-
anesthetics.
Chemical Reviews, v.91, n.6, p.1109-1119, 1991.
[45] Besalu, E.; et al. Molecular quantum similarity and the fundamentals of QSAR.
Accounts of Chemical Research, v.35, n.5, p.289-295, 2002.
REFERÊNCIAS BIBLIOGRÁFICAS
- 142 -
[46] Matter, H.; et al. Design and quantitative structure-activity relationship of 3-
amidinobenzyl-1H-indole-2-carboxamides as potent, nonchiral, and selective
inhibitors of blood coagulation factor X
a
. Journal of Medicinal Chemistry,
v.45, n.13, p.2749-2769, 2002.
[47] Ferreira, M.M.C.. Multivariate QSAR.
Journal of the Brazilian Chemical
Society,
v.13, n.6, p.742-753, 2004.
[48] Wold, S.; et al. Some recent developments in PLS modeling.
Chemometrics
and Intelligent Laboratory Systems,
v.58, p.131-150, 2001.
[49] Júnior, N.B. da Costa. Desenvolvimento de novas técnicas para o cálculo de
átomos, moléculas e compostos de coordenação. Recife – PE, 2000. Tese de
doutorado – Departamento de química fundamental, Universidade Federal de
Pernambuco.
[50] Allinger, N.L.; Yuh, Y.H.; Lii, Jenn-Huei. Molecular Mechanics. The MM3
Force Field for Hydrocarbons.
Journal of the American Chemical Society,
v.111, n.23, p.8551-8566, 1989.
[51] Karelson, M.; Lobanov, V.S. Quantum-chemical descriptors in QSAR/QSPR
studies.
Chemical Reviews, v.96, p.1027-1043, 1996.
[52] Marchand-Geneste, N.; Carpy, A.J.M. e-Quantum Chemistry Free Resources.
SAR and QSAR in Environmental Research, v.15, n.1, p.43-54, 2004.
[53] Dewar, M.J.S.; Thiel, W. Ground States of Molecules. 38. The MNDO Method.
Approximations and Parameters.
Journal of the American Chemical Society,
v.99, n.15, p.4899-4907, 1977.
REFERÊNCIAS BIBLIOGRÁFICAS
- 143 -
[54] Dewar, M.J.S.; et al. AM1: A New General Purpose Quantum Mechanical
Molecular Model.
Journal of the American Chemical Society, v.107, p.3902-
3909, 1985.
[55] Stewart, J.J.P. Optimization of parameters for semiempirical methods. II.
Applications. Journal of Computational Chemistry, v.10, n.2, p.221-264, 1989.
[56] St-Amant, A. Density Functional Methods in Biomolecular Modeling, in
Reviews in Computational Chemistry, Ed. K. B. Lipkowitz and D. B. Boyd,
VCH Publishing, New York, v.7, 1996.
[57] Stewart, J.J.P. Application of localized molecular orbitals to the solution of
semiempirical self-consistent field equations. International
Journal of Quantum
Chemistry
, v.58, n.2, p.113-146, 1996.
[58] Anikin, N.A.; et al. LocalSCF method for semiempirical quantum-chemical
calculation of ultralarge biomolecules.
Journal of Chemical Physics, v.121, n.3,
p.1266-1270, 2004.
[59] Klamt, A.; Schüürmann, G. COSMO: a new approach to dielectric screening in
solvents with explicit expressions for the screening energy and its gradient.
Journal of the Chemical Society, v.2, p.799-805, 1993.
[60] Katritzky, A.R.; Petrukhin, R.; Tatham, D. Interpretation of quantitative
structure-property and –activity relationships.
Journal of Chemical Compute
Sciences,
v.41, n.3, p.679-685, 2001.
[61] Livingstone, D.J. The caracterization of chemical structures using molecular
properties. A survey.
Journal Chemical Information Science, v.40, p.195-209,
2000.
REFERÊNCIAS BIBLIOGRÁFICAS
- 144 -
[62] Hopfinger, A.J.; et al. Construction of 3D-QSAR models using 4D-QSAR
analysis formalism.
Journal of the American Chemical Society, v.119,
p.10509-10524, 1997.
[63] Vedani, A.; Dobler, M. 5D-QSAR: the key for simulating induced fit?
Journal
of Medicinal Chemistry
, v.45, p.2139-2149, 2002.
[64] Wade, R.C.; Henrich, S.; Wang, T. Using 3D protein structures to derive 3D-
QSARs.
Drug Discovery Today: Technologies, v.1, n.3, p.241-246, 2004.
[65] Korolkovas, A. Fundamentos de Farmacologia Molecular: base para o
planejamento de fármacos. 2ª edição. São Paulo, EDART, 1977.
[66] Unger, S.H.; Hansch, C. On model building in structure-activity relationships. A
reexamination of adrenergic blocking activity of beta-halo-beta-arylalkylamines.
Journal of Medicinal Chemistry, v.16, n.7, p.745-749, 1973.
[67] Gaudio, A.C.; Zandonade, E. Proposição, validação e análise dos modelos que
correlacionam estrutura química e atividade biológica.
Química Nova, v.24, n.5,
p.658-671, 2001.
[68] Kiralj, R.; Ferreira, M.M.C. A priori molecular descriptors in QSAR: a case of
HIV-1 protease inhibitors I. The chemometric approach
. Journal of Molecular
Graphics and Modelling,
v.21, p.435–448, 2003.
[69] Pan, D.; Tseng, Y.; Hopfinger, A.J. Quantitative structure-based design:
formalism and application of receptor-dependent RD-4D-QSAR analysis to a set
of glucose analogue inhibitors of glycogen phosphorylase.
Journal of Chemical
and Information Computer Sciences,
v.43, p.1591-1607, 2003.
[70] Silva, C.H.T.P.; Sanches, S.M.; Taft, C.A. A molecular modeling and QSAR
study of suppressors of the growth of Trypanosoma cruzi epimastigotes.
Journal
of Molecular Graphics and Modelling,
Article in Press, 2004.
REFERÊNCIAS BIBLIOGRÁFICAS
- 145 -
[71] Leitão, A.; et al. Structure–activity relationships of novel inhibitors of
glyceraldehyde-3-phosphate dehydrogenase.
Bioorganic & Medicinal
Chemistry Letters,
v.14, p.2199–2204, 2004.
[72] Franke, R. Theoretical drug design methods.
Elsevier, Amsterdam. p.115-123,
1984.
[73] Gupta, S.P.; Singh, P.; Bindal, M.C. Qsar studies on hallucinogens.
Chemical
Reviews,
v.83, n.6, p.633-649, 1983.
[74] Gupta, S.P. Qsar studies on enzyme-inhibitors.
Chemical Reviews, v.87, n.5,
p.1183-1253, 1983.
[75] Carbó-Dorca, R.; et al. Quantum mechanical origin of QSAR: theory and
applications.
Journal of Molecular Structure (Theochem), v.504, p.181-228,
2000.
[76] Netzeva, T.I.; et al. Description of the electronic structure of organic chemicals
using semiempirical and ab initio methods for development of toxicological
QSARs.
Jounal Chemical Information Model, p.A-I, 2000.
[77] Ghose, A.K.; Pritchett, A.; Crippen, G.M. Atomic physicochemical parameters
for three dimensional structure directed quantitative structure-activity
relationships III: modeling hydrophobic interactions.
Journal of Computational
Chemistry
, v.9, n.1, p.80-90, 1988.
[78] Bonchev, D. Overall connectivities/topological complexities: a new powerful
tool for QSPR/QSAR.
Journal Chemical Information Computer Science,
v.40, p.934-941, 2000.
REFERÊNCIAS BIBLIOGRÁFICAS
- 146 -
[79] Agrawal, V.K.; Sohgaura, R.; Khadikar, P.V. QSAR Studies on Biological
Activity of Piritrexim Analogues against pc DHFR.
Bioorganic & Medicinal
Chemistry
, v.10, p.2919-2926, 2002.
[80] Hall, L.H.; Kier, L.B. Reviews in computational chemistry. In: Lipkowitz, K.B.;
Boyd, D.B., chapter 9, 1992.
[81] Roy, K. Topological descriptors in drug design and modeling studies.
Molecular diversity, v.8, p.321-323, 2004.
[82] Gancia, E.; Montana, J.G.; Manallack, D.T. Theoretical hydrogen bonding
parameters for drug design.
Journal of Molecular Graphics and Modelling,
v.19, p.349-362, 2001.
[83] Verma, R.P.; Hansch, C. An approach toward the problem of outliers in QSAR.
Biooganic & Medicinal Chemistry, v.13, p.4597-4621, 2005.
[84] Hansch, C.; et al. Comparison of the Inhibition of Escherichia coli
and
Lactobacillus casei Dihydrofolate Reductase by 2,4-Diamino-5-(Substituted-
benzyl)pyrimidines: Quantitative Structure-Activity Relationships, X-ray
Crystallography, and Computer Graphics in Structure-Activity Analysis.
Journal
of Medicinal Chemistry
, v.25, p.777-784, 1982.
[85] Hathaway, B.A.; et al. Inhibition of Human Dihydrofolate Reductase by 4,6-
Diamino-1,2-dihydro-2,2-dimethyl-1-(substituted-phenyl)-s-triazines. A
Quantitative Structure-Activity Relationship Analysis.
Journal of Medicinal
Chemistry
, v.27, p.144-149, 1984.
[86] Hansch, C.; et al. Crystallography, Quantitative Structure-Activity
Relationships, and Molecular Graphics in a Comparative Analysis of the
Inhibition of Dihydrofolate Reductase from Chicken Liver and Lactobacillus
casei by 4,6-Diamino-1,2-dihydro-2,2-dimethyl-1-(substituted-phenyl)-s-
triazines.
Journal of Medicinal Chemistry, v.27, p.129-143, 1984.
REFERÊNCIAS BIBLIOGRÁFICAS
- 147 -
[87] Coats, E.A.; et al. Quantitative Structure-Activity Relationship of Antifolate
Inhibition of Bacteria Cell Cultures Resistant and Sensitive to Methotrexate.
Journal of Medicinal Chemistry, v. 28, p.1910-1916, 1985.
[88] Selassie, C.D.; et al. Inhibition of Chicken Liver Dihydrofolate Reductase by 5-
(Substituted benzyl)-2,4-diaminopyrimidines. A Quantitative Structure-Activity
Relationship and Graphics Analysis.
Journal of Medicinal Chemistry, v.29,
p.621-626, 1986.
[89] Booth, R.G.; et al. Quantitative Structure-Activity Relationship of Triazine-
Antifolate Inhibition of Leishmania Dihydrofolate Reductase and Cell Growth.
Journal of Medicinal Chemistry, v.30, p.1218-1224, 1987.
[90] Selassie, C.D.; et al. On the Structure Selectivity Problem in Drug Design. A
Comparative Study of Benzylpyrimidine Inhibition of Vertebrate and Bacterial
Dihydrofolate Reductase via Molecular Graphics and Quantitative Structure-
Activity Relationships.
Journal of Medicinal Chemistry, v.32, p.1895-1905,
1989.
[91] Selassie, C.D.; et al. On the Optimization of Hydrophobic and Hydrophilic
Substituent Interactions of 2,4-Diamino-5-(substituted-benzyl)pyrimidines with
Dihydrofolate Reductase.
Journal of Medicinal Chemistry, v.34, p.46-54, 1991.
[92] Agrawal, V.K.; Sohgaura, R.; Khadikar, P.V. QSAR studies on biological
activity of piritrexim analogues against pc DHFR.
Bioorganic & Medicinal
Chemistry,
v.10, p.2919–2926, 2002.
[93] Mattioni, B.E.; Jurs, P.C.. Prediction of dihydrofolate reductase inhibition and
selectivity using computational neural networks and linear discriminant analysis.
Journal of Molecular Graphics and Modelling, v.21, p.391–419, 2003.
REFERÊNCIAS BIBLIOGRÁFICAS
- 148 -
[94] Chiu, T.L.; So, S.S. Development of neural network QSPR models for Hansch
substituent constants. 2. Applications in QSAR studies of HIV-1 reverse
transcriptase and dihydrofolate reductase inhibitors.
Journal of Chemical and
Information Computer Sciences,
v.44, p.154-160, 2004.
[95] Neto, B.B.; Scarminio, I.S.; Bruns, R.E. Como Fazer Experimentos. Pesquisa e
desenvolvimento na ciência e na indústria. 2ª edição. Campinas, Editora da
Unicamp, 2002.
[96] Baroni, M.; et al. Predictive ability of regression models. Part II. Selection of the
best predictive PLS model.
Journal of Chemometrics, v.6, n.6, p.347-356,
1992.
[97] Cruciani, G.; et al. Comparison of chemometric models for QSAR.
Quantitative Structure-Activity Relationships, v.9, n.2, p.101-107, 1990.
[98] Cruciani, G.; et al. Predictive ability of regression models. Part I. Standard
deviation of preciction errors (SDEP).
Journal of Chemometrics, v.6, n.6,
p.335-346, 1992.
[99] Rosowsky, A.; et al. New 2,4-Diamino-5-(2’,5’-substituted benzyl)pyrimidines
as Potential Drugs against Opportunistic Infections of AIDS and Other Immune
Disorders. Synthesis and Species-Dependent Antifolate Activity.
Journal of
Medicinal Chemistry
, v.47, p.1475-1486, 2004.
[100] Forsch, R.A.; Queener, S.F.; Rosowsky, A. Preliminary in vitro studies on two
potent, water-soluble trimethoprim analogues with exceptional species selectivity
against dihydrofolate reductase from Pneumocystis carinii and Mycobacterium
avium.
Bioorganic & Medicinal Chemistry Letters, v.14, p.1811-1815, 2004.
[101] Gangjee, A.; Adair, O.; Queener, S.F. Pneumocystis carinii and Toxoplasma
gondii dihydrofolate reductase inhibitors and antitumor agents: synthesis and
biological activities of 2,4-diamino-5-methyl-6-[(monosubstituted
REFERÊNCIAS BIBLIOGRÁFICAS
- 149 -
anilino)methyl]-pyrido[2,3-d]pyrimidines. Journal of Medicinal Chemistry,
v.42, p.2447-2455, 1999.
[102] Gangjee, A.; et al. 2,4-Diamino-5-deaza-6-Substituted Pyrido[2,3-
d]pyrimidines Antifolates as Potent and Selective Nonclassical Inhibitors of
Dihydrofolate Reductase.
Journal of Medicinal Chemistry, v.39, p.1438-1446,
1996.
[103] Rosowsky, A.; Synthesis of New 2,4-Diaminopyrido[2,3-d]pyrimidine and 2,4-
Diaminopyrrolo[2,3-d]pyrimidine Inhibitors of Pneumocystis carinii,
Toxoplasma gondii, and Mycobacterium avium Dihydrofolate Reductase.
Bioorganic & Medicinal Chemistry, v.11, p.59-67, 2003.
[104] Wang, Y.; et al. Isolation of rat dihydrofolate reductase gene and
characterization of recombinant enzyme.
Antimicrobial Agents
Chemotherapy
, v.45, p.2517-2523, 2001.
[105]
Gotoh, O. An Improved Algorithm for Matching Biological Sequences.
Journal Molecular Biological, v.162, p.705-708, 1982.
[106] Durbin, R.; et al. Biological Sequence Analysis: Probabilistic Models of
Proteins and Nucleic Acids, Cambridge University Press, 1997.
[107] Needleman, S.B.; Wunsch, C.D. A General Method Applicable to the Search
for Similarities in the Amino Acid Sequence of Two Proteins.
Journal
Molecular Biological
, v.48, p.443-453, 1970.
[108] StatSoft, Inc. (2004). STATISTICA (data analysis software system), version 6.
www.statsoft.com.
[109] Champness, J.N.; et al. The Structure of Pneumocystis Carinii Dihydrofolate
Reductase to 1.9 Angstroms Resolution.
Structure, v.2, p.915, 1994.
REFERÊNCIAS BIBLIOGRÁFICAS
- 150 -
[110] Cody, V.; et al. Analysis of Three Crystal Structure Determinations of a 5-
Methyl-6-N-Methylanlilino Pyridopyrimidine Antifolate Complex with Human
Dihydrofolate Reductase.
Acta Crystallographic Section D, v.59, p.1603, 2003.
[111]
G.P. Brady; P.F.W. Stouten. Fast prediction and visualization of protein
binding pockets with PASS.
Journal of Computer-Aided Molecular Design,
v.14, n.4, p.383-401, 2000.
APÊNDICE
- 151 -
APÊNDICE
Valores de atividade de seletividade previstos para o Pneumocystis
carinii, Toxoplasma gondii, Mycobacterium avium e fígado de rato.
APÊNDICE
- 152 -
Tabela 01. Atividades e seletividades previstas para as novas estruturas propostas derivadas do TMP
IC
50
(µM) SI
Drogas R
1
R
2
R
3
R
4
R
5
R
6
Pc Tg Ma Rl
Pc Tg Ma
mlp1 H H H H H H
1,6176E+02 2,6044E-55 7,4001E+04 6,9252E-04
7,8769E+01 6,3256E+37 4,8218E+02
mlp2 H H COOH H H H
1,5919E+00 5,8723E-04 4,5951E+03 2,2452E+04
1,0651E+02 2,6303E+00 1,5980E+04
mlp3 H H CONH
2
H H H
5,3075E+00 5,4406E-04 6,9988E+03 8,0785E-04
6,6153E+01 5,7662E-01 8,1527E+04
mlp4 H H COCH
3
H H H
1,9010E+01 1,9268E-03 9,3603E+03 4,9873E-04
4,2265E+01 2,8740E-01 1,1692E+05
mlp5 H CH
3
H H H H
1,7385E+02 3,8149E-53 2,8221E+05 1,0245E-03
4,5074E+01 5,1363E+35 3,1522E+04
mlp6 H CH
3
COOH H H H
7,3617E+00 7,4700E-03 3,2311E+04 6,9608E+04
1,5842E+01 8,7989E+00 1,7000E+05
mlp7 H CH
3
CONH
2
H H H
5,8207E+00 2,2948E-04 3,4213E+04 5,3884E-05
9,3590E+00 1,4108E+01 3,8826E+04
mlp8 H CH
3
COCH
3
H H H
1,0180E+00 1,1247E-02 4,8931E+04 2,4383E+04
8,5776E+00 6,2901E+00 3,4416E+04
mlp9 NH
2
H H H H H
2,9124E+00 5,6899E-20 1,4389E-02 3,3715E-05
1,0780E+01 8,6808E+20 1,2604E+03
mlp10 NH
2
H COOH H H H
7,7404E+00 4,8430E-13 6,7555E-04 9,8463E-05
4,3158E+01 3,5069E+14 6,0472E+04
mlp11 NH
2
H CONH
2
H H H
4,2741E-01 6,0320E-13 1,2935E-03 2,2878E-05
1,5063E+01 4,0997E+14 6,1397E+03
mlp12 NH
2
H COCH
3
H H H
1,5094E+00 3,8268E-13 1,4274E-03 4,5589E-05
1,7254E+01 1,0068E+15 1,3108E+04
mlp13 NH
2
CH
3
H H H H
8,1379E+00 3,4092E-16 6,4049E-02 1,1600E-05
1,1157E+01 7,0703E+18 3,3106E+02
mlp14 NH
2
CH
3
COOH H H H
8,8325E+00 7,7020E-13 6,6516E-03 3,4629E-06
7,2588E+00 7,6395E+14 7,3008E+02
mlp15 NH
2
CH
3
CONH
2
H H H
6,1425E-01 1,3167E-12 3,0923E-02 3,7600E-06
3,1563E+00 1,0562E+14 1,1558E+01
mlp16 NH
2
CH
3
COCH
3
H H H
8,9893E-01 2,1266E-12 2,0859E-02 9,6223E-06
5,0366E+00 1,5092E+14 4,3308E+01
mlp17 H H H H COOH H
1,2437E+02 2,3383E-04 2,2863E+03 4,6188E-04
1,0694E+02 1,3497E+01 2,4864E+06
APÊNDICE
- 153 -
Atividades e seletividades previstas para as novas estruturas propostas derivadas do TMP
mlp18 H H COOH H COOH H
8,0753E+01 4,1452E-05 2,2542E+02 2,4346E-04
1,1264E+02 2,4033E+00 1,0340E+07
mlp19 H H CONH
2
H COOH H
8,2735E-01 4,5801E-05 3,7276E+02 4,6246E-04
1,1984E+02 3,5917E-01 1,8921E+06
mlp20 H H COCH
3
H COOH H
6,4480E+00 8,8974E-05 8,4293E+02 7,0846E-04
4,4339E+01 4,8042E-01 2,4328E+06
mlp21 H CH
3
H H COOH H
3,5092E+02 2,4192E-03 1,4772E+04 2,8645E-03
3,4317E+01 1,6919E+01 1,3544E+06
mlp22 H CH
3
COOH H COOH H
4,8491E+01 1,3791E-04 8,0657E+02 2,7836E-04
3,7502E+01 1,4163E+00 1,7376E+06
mlp23 H CH
3
CONH
2
H COOH H
2,1120E+00 9,2643E-05 6,1844E+02 4,5754E-05
4,2718E+01 1,3906E+01 2,6181E+06
mlp24 H CH
3
COCH
3
H COOH H
5,4051E+00 2,2489E-04 8,5555E+02 6,5184E-05
9,1886E+00 1,9083E+01 4,7712E+06
mlp25 NH
2
H H H COOH H
1,7605E+00 7,7256E-13 2,0322E-03 5,0403E-05
3,4280E+01 4,2308E+15 1,2400E+04
mlp26 NH
2
H COOH H COOH H
9,6363E-01 1,6533E-14 5,5879E-05 1,5105E-05
7,9822E+01 1,7819E+15 1,5202E+05
mlp27 NH
2
H CONH
2
H COOH H
3,0508E-02 3,3798E-14 9,8744E-05 1,3829E-05
3,9102E+01 8,8782E+14 1,2661E+04
mlp28 NH
2
H COCH
3
H COOH H
8,5537E-02 2,8339E-14 1,1594E-04 1,3237E-05
3,2088E+01 1,0955E+15 1,1451E+04
mlp29 NH
2
CH
3
H H COOH H
3,0900E+00 1,0916E-12 6,1484E-03 1,2468E-05
2,0713E+01 1,2410E+16 1,0678E+03
mlp30 NH
2
CH
3
COOH H COOH H
2,3002E+00 1,8015E-13 2,0879E-03 1,3319E-06
1,0410E+01 1,0942E+16 2,0880E+03
mlp31 NH
2
CH
3
CONH
2
H COOH H
1,6033E-01 3,7850E-14 3,2029E-04 9,3453E-08
1,0792E+01 5,2590E+16 9,6597E+03
mlp32 NH
2
CH
3
COCH
3
H COOH H
7,0625E-01 8,6633E-14 1,9465E-03 6,2193E-06
5,1590E+00 3,1992E+15 2,0290E+02
mlp33 H H H H H CH
3
2,4935E+00 9,1917E-52 1,2380E+05 2,9401E+04
2,3671E+01 2,2461E+34 4,3179E+02
mlp34 H H COOH H H CH
3
2,1577E+00 1,8098E-03 1,2846E+04 9,2309E+04
3,4455E+01 2,7762E+00 1,3128E+04
mlp35 H H CONH
2
H H CH
3
5,5897E+00 2,7188E-03 1,4001E+04 8,1512E-04
3,9741E+01 2,9384E+01 1,7369E+03
mlp36 H H COCH
3
H H CH
3
6,1770E+01 5,9419E-03 3,2126E+04 3,4037E-03
1,3590E+01 5,1936E+00 1,5314E+03
APÊNDICE
- 154 -
Atividades e seletividades previstas para as novas estruturas propostas derivadas do TMP
mlp37 H CH
3
H H H CH
3
1,5248E+03 6,3755E-57 5,8389E+05 5,0424E-03
1,0750E+01 5,0548E+39 6,3809E+02
mlp38 H CH
3
COOH H H CH
3
2,7995E+00 1,6271E-02 9,5133E+04 6,9522E+04
6,9540E+00 5,0679E-01 3,5355E+03
mlp39 H CH
3
CONH
2
H H CH
3
4,6596E-02 7,8660E-03 3,5016E+04 3,3335E+03
7,7760E+00 3,2878E+01 2,1493E+04
mlp40 H CH
3
COCH
3
H H CH
3
9,5750E-01 1,1063E-01 4,3564E+05 4,4183E+05
2,7169E+00 4,8163E-01 4,7177E+03
mlp41 NH
2
H H H H CH
3
1,0651E+01 1,4376E-19 2,4312E-02 3,5001E-05
3,3274E+00 3,9873E+20 1,5211E+03
mlp42 NH
2
H COOH H H CH
3
1,7478E+01 2,7811E-12 3,2190E-03 3,6065E-04
1,0748E+01 1,1507E+14 3,0146E+04
mlp43 NH
2
H CONH
2
H H CH
3
5,9551E-02 1,5265E-12 1,5975E-03 1,4204E-05
1,2292E+01 9,4653E+14 2,8868E+03
mlp44 NH
2
H COCH
3
H H CH
3
3,4084E+00 1,2156E-12 2,5384E-03 7,6821E-05
7,5665E+00 4,0977E+14 5,4127E+03
mlp45 NH
2
CH
3
H H H CH
3
1,0327E+01 8,5516E-24 1,1778E-01 1,7661E-05
2,8779E+00 1,2431E+24 1,1737E+02
mlp46 NH
2
CH
3
COOH H H CH
3
1,9117E+01 1,1392E-12 9,2653E-03 7,0256E-06
3,1816E+00 6,1455E+14 5,4939E+02
mlp47 NH
2
CH
3
CONH
2
H H CH
3
1,2521E+00 5,7256E-12 6,0113E-02 1,2200E-05
1,3938E+00 1,7610E+13 1,9722E+01
mlp48 NH
2
CH
3
COCH
3
H H CH
3
1,9234E+00 1,3805E-11 1,2602E-01 5,1074E-06
1,2663E+00 8,7657E+13 1,2830E+01
mlp49 H H H H COOH CH
3
4,5382E+02 5,7143E-04 3,8352E+03 6,8387E-04
2,0276E+01 1,2874E+01 1,8422E+06
mlp50 H H COOH H COOH CH
3
7,8433E+01 5,2321E-05 4,3810E+02 2,4950E-04
6,6170E+01 1,3559E+00 2,5451E+06
mlp51 H H CONH
2
H COOH CH
3
1,3407E+00 9,2467E-05 9,1570E+02 2,3339E-04
2,3549E+01 7,0482E-01 2,6039E+05
mlp52 H H COCH
3
H COOH CH
3
1,0890E+01 1,8618E-04 1,5133E+03 5,5507E-04
1,5319E+01 4,5868E-01 4,7338E+05
mlp53 H CH
3
H H COOH CH
3
1,8100E+02 2,3852E-03 2,1228E+04 2,0841E-03
1,6563E+01 8,1759E+00 5,1510E+05
mlp54 H CH
3
COOH H COOH CH
3
9,1258E+01 3,1997E-04 1,9346E+03 9,7929E-04
5,9904E+00 2,7013E+00 7,5083E+05
mlp55 H CH
3
CONH
2
H COOH CH
3
1,4992E+00 6,7565E-04 4,0657E+03 3,5629E-05
6,8099E+00 1,7317E+01 2,6516E+05
APÊNDICE
- 155 -
Atividades e seletividades previstas para as novas estruturas propostas derivadas do TMP
mlp56 H CH
3
COCH
3
H COOH CH
3
8,4549E+00 1,0522E-03 3,9014E+03 1,1132E-04
5,7672E+00 4,2896E+00 6,6033E+05
mlp57 NH
2
H H H COOH CH
3
7,2079E+00 1,9400E-12 2,4280E-03 9,9372E-05
5,1614E+00 1,2792E+15 1,7771E+04
mlp58 NH
2
H COOH H COOH CH
3
2,2700E+00 9,4706E-14 1,2638E-04 5,5163E-05
9,3049E+00 5,2019E+14 3,0191E+05
mlp59 NH
2
H CONH
2
H COOH CH
3
2,0342E-02 1,3195E-13 2,4894E-04 3,5755E-06
1,0797E+01 9,7515E+14 3,4710E+04
mlp60 NH
2
H COCH
3
H COOH CH
3
1,8579E-01 1,1885E-13 4,3350E-04 2,4709E-05
3,7182E+00 2,1826E+14 3,8605E+04
mlp61 NH
2
CH
3
H H COOH CH
3
3,6447E+00 1,2706E-12 9,0915E-03 6,1999E-06
4,4322E+00 6,3426E+15 1,3276E+03
mlp62 NH
2
CH
3
COOH H COOH CH
3
1,2159E+01 4,8353E-13 3,7385E-03 4,8056E-06
3,9457E+00 1,2652E+16 4,8311E+03
mlp63 NH
2
CH
3
CONH
2
H COOH CH
3
7,6271E-02 1,4944E-13 7,7238E-04 1,7631E-07
4,1689E+00 3,5340E+15 2,4118E+03
mlp64 NH
2
CH
3
COCH
3
H COOH CH
3
8,0903E-01 3,1997E-13 6,1050E-03 1,9380E-06
1,1483E+00 1,5077E+15 2,9230E+02
mlp65 H H H COOH H H
2,0169E+02 5,4967E-04 2,2661E+03 2,3818E-03
1,0689E+02 5,1642E+00 1,1974E+04
mlp66 H H H CONH
2
H H
4,5442E+00 1,3926E-04 1,7486E+03 9,0498E-05
3,6750E+01 1,0014E+01 5,8081E+05
mlp67 H H H COCH
3
H H
1,8678E+01 3,4741E-04 2,8569E+03 3,2247E-04
7,5211E+01 5,9414E+00 6,3172E+05
mlp68 H CH
3
H COOH H H
1,4891E+02 1,1399E-03 7,6706E+03 1,4824E-03
2,4573E+01 6,6106E-01 3,1321E+05
mlp69 H CH
3
H CONH
2
H H
3,6532E+00 1,2189E-03 1,0228E+04 7,4492E-05
2,0663E+01 2,0996E+00 2,0979E+05
mlp70 H CH
3
H COCH
3
H H
5,2121E+01 2,2243E-03 1,0349E+04 6,8084E-04
1,7135E+01 1,0006E+00 4,0749E+05
mlp71 NH
2
H H COOH H H
7,9695E+00 2,4889E-13 4,4935E-04 1,1776E-04
2,4942E+01 6,9766E+14 1,5575E+05
mlp72 NH
2
H H CONH
2
H H
3,4342E-01 2,7809E-13 1,0165E-03 2,6867E-05
1,5146E+01 8,1963E+14 5,4833E+03
mlp73 NH
2
H H COCH
3
H H
1,2344E+00 5,9313E-13 8,8614E-04 8,6311E-05
1,7498E+01 9,7987E+14 1,3070E+04
mlp74 NH
2
CH
3
H COOH H H
6,9823E+00 2,2767E-13 2,4555E-03 9,2573E-06
1,1863E+01 6,6280E+15 5,8919E+03
APÊNDICE
- 156 -
Atividades e seletividades previstas para as novas estruturas propostas derivadas do TMP
mlp75 NH
2
CH
3
H CONH
2
H H
5,1379E-01 1,2920E-12 1,1641E-02 5,7604E-06
9,3270E+00 5,3682E+14 1,7529E+02
mlp76 NH
2
CH
3
H COCH
3
H H
1,9472E+00 9,1846E-13 5,7683E-03 5,3024E-06
6,1314E+00 3,4553E+15 1,0043E+03
mlp77 H H H COOH COOH H
3,5159E+01 9,6862E-05 3,4462E+02 2,9649E-03
1,1761E+02 3,5633E+00 1,0687E+05
mlp78 H H H CONH
2
COOH H
1,9029E+00 1,4070E-05 1,2194E+02 5,3982E-05
5,2328E+01 6,8833E+00 2,8238E+06
mlp79 H H H COCH
3
COOH H
6,3831E+00 1,5584E-04 4,8173E+02 6,1437E-04
2,6422E+01 8,8096E+00 3,0941E+04
mlp80 H CH
3
H COOH COOH H
2,6035E+01 1,6160E-04 7,0598E+02 1,7200E-03
3,9394E+01 1,9713E+00 3,0430E+06
mlp81 H CH
3
H CONH
2
COOH H
1,4872E+00 7,1726E-05 3,8433E+02 1,5537E-04
3,0132E+01 2,2635E+00 1,4205E+06
mlp82 H CH
3
H COCH
3
COOH H
4,4989E+00 3,4162E-04 1,8269E+03 3,2636E-04
1,5733E+01 5,3328E+00 1,4078E+06
mlp83 NH
2
H H COOH COOH H
9,9610E-01 5,8307E-14 9,2061E-05 9,6111E-05
1,6643E+01 1,2003E+15 1,5777E+05
mlp84 NH
2
H H CONH
2
COOH H
3,6653E-02 2,7835E-14 6,2344E-05 2,9120E-06
1,7646E+01 3,5163E+15 4,3531E+04
mlp85 NH
2
H H COCH
3
COOH H
1,1280E-01 5,4534E-14 1,3465E-04 2,6727E-06
1,9764E+01 3,6161E+15 1,3337E+04
mlp86 NH
2
CH
3
H COOH COOH H
8,1574E-01 1,5127E-13 8,8482E-04 2,0981E-05
1,7463E+01 1,4321E+15 3,7389E+03
mlp87 NH
2
CH
3
H CONH
2
COOH H
7,1047E-02 4,2882E-13 1,4133E-03 4,9731E-07
1,4560E+01 5,8366E+15 4,8807E+03
mlp88 NH
2
CH
3
H COCH
3
COOH H
2,4306E-01 1,2248E-13 1,8974E-03 1,0106E-06
9,5285E+00 3,2113E+16 1,8625E+03
mlp89 H H H COOH H CH
3
3,7031E+02 5,3910E-03 1,5878E+04 3,0164E-03
3,4249E+01 2,8377E+00 8,2812E+03
mlp90 H H H CONH
2
H CH
3
8,8279E+00 5,4748E-04 5,5106E+03 1,2899E-04
3,5808E+01 6,0846E+00 3,5339E+05
mlp91 H H H COCH
3
H CH
3
7,4364E-01 4,7723E-03 2,3805E+04 5,3978E+04
1,7517E+01 3,1404E+00 1,0451E+05
mlp92 H CH
3
H COOH H CH
3
2,6862E+02 4,5206E-03 2,3673E+04 3,4025E-03
1,4517E+01 5,3312E-01 2,0820E+05
mlp93 H CH
3
H CONH
2
H CH
3
1,1728E+01 3,3981E-03 1,6789E+04 1,8482E-04
8,7892E+00 1,4308E+00 1,5323E+05
APÊNDICE
- 157 -
Atividades e seletividades previstas para as novas estruturas propostas derivadas do TMP
mlp94 H CH
3
H COCH
3
H CH
3
4,0408E+01 1,0525E-02 4,2946E+04 5,4379E-04
1,0195E+01 3,5975E-01 4,6199E+04
mlp95 NH
2
H H COOH H CH
3
1,7743E+01 4,1658E-13 7,5530E-04 1,5587E-04
1,0775E+01 5,2476E+14 5,8280E+04
mlp96 NH
2
H H CONH
2
H CH
3
1,5920E-01 3,2023E-13 5,8178E-04 8,5544E-05
5,0890E+00 6,4240E+14 1,9314E+04
mlp97 NH
2
H H COCH
3
H CH
3
2,9182E+00 1,1336E-12 3,0523E-03 7,1499E-05
7,6311E+00 6,8205E+14 3,4819E+03
mlp98 NH
2
CH
3
H COOH H CH
3
1,7404E+01 2,4958E-12 9,9616E-03 4,1300E-05
5,1512E+00 1,4001E+15 3,5895E+03
mlp99 NH
2
CH
3
H CONH
2
H CH
3
6,1246E-01 6,5796E-12 2,9993E-02 1,9610E-06
2,3324E+00 2,4449E+14 1,5255E+02
mlp100 NH
2
CH
3
H COCH
3
H CH
3
4,9748E+00 2,5424E-12 2,5469E-02 7,8992E-06
1,5417E+00 1,8320E+15 6,3187E+02
mlp101 H H H COOH COOH CH
3
6,5545E+01 4,1837E-04 2,9070E+03 1,7463E-03
2,3553E+01 2,4612E+00 1,2411E+04
mlp102 H H H CONH
2
COOH CH
3
9,9149E-01 5,0818E-04 2,5477E+03 4,4615E-05
6,5359E+00 4,3767E+00 2,8656E+03
mlp103 H H H COCH
3
COOH CH
3
1,0260E+01 9,1322E-04 4,2732E+03 7,8308E-04
9,5683E+00 4,1893E+00 3,5622E+03
mlp104 H CH
3
H COOH COOH CH
3
1,8106E+02 1,0749E-02 1,8959E+04 1,2111E-02
4,5555E+00 2,4912E-01 9,2409E+03
mlp105 H CH
3
H CONH
2
COOH CH
3
7,9391E-01 7,9693E-04 4,3435E+03 8,6857E-05
4,8060E+00 2,9612E-01 7,9009E+04
mlp106 H CH
3
H COCH
3
COOH CH
3
1,5625E+01 6,6331E-03 1,3366E+04 6,1243E-04
3,1847E+00 3,2124E-01 4,1832E+05
mlp107 NH
2
H H COOH COOH CH
3
2,0710E+00 1,3128E-13 3,9434E-04 1,1195E-04
4,4381E+00 1,1711E+14 1,5711E+05
mlp108 NH
2
H H CONH
2
COOH CH
3
7,1416E-02 4,6533E-14 1,0608E-04 1,0467E-05
1,9394E+00 5,3994E+13 9,6603E+03
mlp109 NH
2
H H COCH
3
COOH CH
3
1,8653E-01 4,8620E-13 1,3591E-03 2,6770E-05
4,2261E+00 3,7555E+14 4,2813E+03
mlp110 NH
2
CH
3
H COOH COOH CH
3
2,3066E+00 1,5432E-12 2,2926E-03 1,9317E-05
3,8215E+00 3,0968E+14 2,7452E+03
mlp111 NH
2
CH
3
H CONH
2
COOH CH
3
9,1634E-02 2,3357E-12 1,0647E-02 7,9197E-07
7,6312E-01 2,0354E+14 1,3149E+03
mlp112 NH
2
CH
3
H COCH
3
COOH CH
3
4,1286E-01 4,0111E-12 1,0008E-02 8,6603E-06
5,1282E-01 2,2594E+14 8,3349E+02
APÊNDICE
- 158 -
Tabela 02. Atividades e seletividades previstas para as novas estruturas propostas derivadas do TMQ
IC
50
(µM) SI
Drogas R
1
R
2
R
3
R
4
R
5
R
6
R
7
Pc Tg Rl
Pc Tg
mlq1 N N H H H H H
7,3195E-01 5,6675E-01 3,2025E+02
2,9089E-01 7,2328E+02
mlq2 N N OH H H H H
1,1513E+00 3,9185E-01 1,6147E+02
1,2849E-01 3,4489E+02
mlq3 N N NH
2
H H H H
6,1117E-01 2,7123E-01 3,9770E+02
1,7257E-01 1,0656E+03
mlq4 N N CONH
2
H H H H
1,8691E+00 1,0551E+00 1,7781E+01
5,5019E-01 1,1013E+02
mlq5 N N H COOH H H H
1,0200E+00 2,3335E+00 1,2939E+02
1,3265E+00 3,4159E+02
mlq6 N N OH COOH H H H
2,8019E+00 5,7319E-01 8,7436E+01
1,4502E-01 1,1503E+02
mlq7 N N NH
2
COOH H H H
7,8462E+00 4,7631E+00 2,4865E+02
3,2443E-01 3,6656E+00
mlq8 N N CONH
2
COOH H H H
2,1777E+00 4,2366E-01 8,2977E+01
1,1543E+00 2,7151E+02
mlq9 N N H CONH
2
H H H
5,6263E-01 5,5246E-01 1,3688E+02
4,2625E-01 2,6079E+03
mlq10 N N OH CONH
2
H H H
1,4968E+00 3,9627E-01 1,1601E-08
2,7624E-01 4,7610E-11
mlq11 N N NH
2
CONH
2
H H H
2,8161E+00 4,7772E+00 4,1599E+02
6,1430E-01 2,3330E+01
mlq12 N N CONH
2
CONH
2
H H H
3,0882E+00 1,4479E+00 7,5254E+01
2,5410E-01 8,0417E+01
mlq13 N N H COCH3 H H H
5,0775E-01 8,0407E-01 5,2708E+01
6,2269E-01 5,2420E+02
mlq14 N N OH COCH3 H H H
4,4114E+00 7,2616E-01 2,0158E+02
7,7533E-02 6,9239E+02
mlq15 N N NH
2
COCH3 H H H
1,7787E+00 3,2650E+00 2,6131E+02
3,1039E-01 1,6493E+01
mlq16 N N CONH
2
COCH3 H H H
1,9875E+00 1,1576E+00 8,4727E+01
2,9556E-01 1,0945E+02
mlq17 N N H H H H CH3
6,5808E-01 2,3364E-01 9,9912E+01
1,2452E-01 7,6232E+02
APÊNDICE
- 159 -
Atividades e seletividades previstas para as novas estruturas propostas derivadas do TMQ
mlq18 N N OH H H H CH3
1,1023E+00 9,1660E-01 9,4519E+01
1,3232E-01 2,6448E+02
mlq19 N N NH
2
H H H CH3
9,0118E-01 3,2083E+00 7,9439E+01
2,4583E-01 2,7947E+01
mlq20 N N CONH
2
H H H CH3
2,0790E+00 5,9969E+00 4,0527E+01
7,5414E-01 3,4549E+01
mlq21 N N H COOH H H CH3
2,8308E-01 6,0560E-01 6,5307E+01
7,9659E-01 6,6981E+02
mlq22 N N OH COOH H H CH3
1,4393E+00 9,5693E-01 5,3557E+02
2,4431E-01 7,2467E+02
mlq23 N N NH
2
COOH H H CH3
3,4075E+00 1,5834E+01 4,6857E+02
4,7664E-01 2,7880E+00
mlq24 N N CONH
2
COOH H H CH3
1,4718E+00 5,0036E-01 8,3090E+01
4,1388E-01 5,2944E+01
mlq25 N N H CONH
2
H H CH3
4,5291E+00 9,2857E+00 5,6268E+03
1,3106E+00 4,2893E+02
mlq26 N N OH CONH
2
H H CH3
7,9099E+00 3,9075E-01 2,8395E+02
2,6352E-01 4,0626E+02
mlq27 N N NH
2
CONH
2
H H CH3
3,6432E+00 3,0318E+01 1,1233E+03
8,5181E-01 2,5202E+00
mlq28 N N CONH
2
CONH
2
H H CH3
2,9306E+00 3,9856E-01 1,3681E+02
2,1198E-01 4,2902E+02
mlq29 N N H COCH3 H H CH3
6,6302E-01 2,3289E+00 7,5188E+01
5,2149E-01 1,4481E+02
mlq30 N N OH COCH3 H H CH3
2,4844E+00 1,1275E+00 1,4501E+02
7,1534E-02 6,6364E+02
mlq31 N N NH
2
COCH3 H H CH3
1,3651E+00 4,8079E+00 7,0875E+01
2,5912E-01 3,9337E+00
mlq32 N N CONH
2
COCH3 H H CH3
6,8381E+00 1,0189E+00 7,4482E+01
5,1735E-01 3,5891E+01
mlq33 N N H H COOH H H
5,6913E-01 1,5217E+00 1,0582E+02
5,1944E-01 1,3120E+02
mlq34 N N OH H COOH H H
1,6248E+00 7,1675E+00 2,4395E+02
5,0405E-01 1,2741E+02
mlq35 N N NH
2
H COOH H H
6,0896E-01 2,8677E+00 3,0633E+02
3,1863E-01 1,9907E+03
mlq36 N N CONH
2
H COOH H H
8,4009E+00 2,8920E+01 5,7887E+01
3,0726E-04 1,8379E+01
APÊNDICE
- 160 -
Atividades e seletividades previstas para as novas estruturas propostas derivadas do TMQ
mlq37 N N H H CONH
2
H H
5,8245E-01 6,8710E-01 5,1728E+02
5,1459E-01 5,7465E+03
mlq38 N N OH H CONH
2
H H
8,9485E-01 1,0465E+00 7,0383E+01
2,4526E-01 2,2466E+02
mlq39 N N NH
2
H CONH
2
H H
1,2791E+00 2,2446E+00 1,2842E+02
1,0725E+00 7,9423E+01
mlq40 N N CONH
2
H CONH
2
H H
3,6649E+00 4,6003E+00 3,2362E+01
8,0229E-01 1,2856E+01
mlq41 N N H H COCH3 H H
4,8255E-01 7,6065E-01 9,9243E+01
3,8191E-01 2,3689E+02
mlq42 N N OH H COCH3 H H
5,6142E-01 3,3014E-01 5,1350E+01
1,8850E-01 3,4359E+02
mlq43 N N NH
2
H COCH3 H H
4,9850E-01 3,8176E+00 1,2397E+02
1,4602E-01 5,0240E+02
mlq44 N N CONH
2
H COCH3 H H
1,8124E+00 8,1462E-01 1,4460E+01
4,4604E-02 4,7517E+01
mlq45 N N H H COOH H CH3
1,3674E+00 7,0427E+00 3,6871E+02
5,7345E-01 7,4215E+01
mlq46 N N OH H COOH H CH3
4,7868E-01 1,3775E+00 2,8994E+01
2,9668E-01 1,9507E+02
mlq47 N N NH
2
H COOH H CH3
1,8621E+00 7,6848E+00 3,4042E+02
1,4838E-01 1,0817E+03
mlq48 N N CONH
2
H COOH H CH3
2,1053E+00 2,2406E+00 1,4558E+02
2,9765E-01 1,1851E+02
mlq49 N N H H CONH
2
H CH3
4,7398E-01 9,1104E-01 3,4522E+02
3,0797E-01 2,5568E+03
mlq50 N N OH H CONH
2
H CH3
2,8285E-01 1,6194E+00 9,5629E+01
2,0108E-01 6,9049E+02
mlq51 N N NH
2
H CONH
2
H CH3
9,4267E-01 3,4546E+00 4,7551E+01
3,0070E-01 1,0234E+01
mlq52 N N CONH
2
H CONH
2
H CH3
8,8069E-01 1,8417E+00 2,1973E+01
1,1080E+00 3,0255E+01
mlq53 N N H H COCH3 H CH3
7,5969E-01 1,4647E+00 3,4886E+02
5,2804E-01 4,9530E+02
mlq54 N N OH H COCH3 H CH3
1,2589E+00 2,0769E+00 7,5162E+01
2,0817E-01 1,2772E+02
mlq55 N N NH
2
H COCH3 H CH3
1,3833E+00 1,4390E+00 1,4453E+02
3,3814E-01 1,7413E+02
APÊNDICE
- 161 -
Atividades e seletividades previstas para as novas estruturas propostas derivadas do TMQ
mlq56 N N CONH
2
H COCH3 H CH3
4,7208E+00 7,4271E+01 7,6719E+02
7,0912E-01 9,1015E+00
mlq57 N N H H H COOH H
6,2679E-01 6,6427E-01 1,3685E+02
5,8238E-01 5,6536E+02
mlq58 N N OH H H COOH H
2,7195E+00 4,5680E-01 8,2164E+01
2,9050E-01 1,8276E+02
mlq59 N N NH
2
H H COOH H
4,2888E+00 3,4979E+00 1,3149E+02
8,3974E-01 8,9317E+00
mlq60 N N CONH
2
H H COOH H
6,9924E-01 7,7186E+02 2,7645E-01
3,7090E-11 5,2828E+00
mlq61 N N H H H CONH
2
H
1,1352E+00 2,3404E+00 1,8675E+03
8,1711E-01 2,8910E+03
mlq62 N N OH H H CONH
2
H
1,6599E+00 6,2177E+00 6,4312E+01
3,6864E-01 3,8957E+01
mlq63 N N NH
2
H H CONH
2
H
4,3616E+00 8,7185E+00 1,2545E+02
7,3455E-01 1,1407E+00
mlq64 N N CONH
2
H H CONH
2
H
5,7306E-01 2,2149E+00 3,4882E+02
3,4532E-01 6,3592E+02
mlq65 N N H H H COCH3 H
5,3497E-01 4,7493E-01 3,7344E+02
5,1599E-01 1,9202E+03
mlq66 N N OH H H COCH3 H
1,0334E+01 9,2424E-01 5,2765E+02
6,7990E-01 3,1325E+02
mlq67 N N NH
2
H H COCH3 H
2,7679E+00 2,1930E+01 1,2106E+02
5,2171E-01 3,8843E-01
mlq68 N N CONH
2
H H COCH3 H
3,0349E+00 1,7069E+00 3,2764E+02
2,3155E-01 1,1314E+02
mlq69 N N H H H COOH CH3
6,9941E+00 2,5531E+00 1,5948E+03
7,5633E-01 2,2561E+02
mlq70 N N OH H H COOH CH3
1,0227E+00 4,2353E-01 4,0256E+01
2,7316E-01 2,5098E+02
mlq71 N N NH
2
H H COOH CH3
1,3716E+00 1,9279E+00 1,0571E+02
4,8220E-01 2,9130E+01
mlq72 N N CONH
2
H H COOH CH3
4,1769E+00 3,0593E+02 1,1748E+03
6,2826E-04 1,5074E+03
mlq73 N N H H H CONH
2
CH3
3,0280E+00 1,9779E+00 1,0792E+03
6,7448E-01 1,2120E+03
mlq74 N N OH H H CONH
2
CH3
7,8184E+00 9,6504E-01 5,6347E+02
3,0880E-01 1,4241E+02
APÊNDICE
- 162 -
Atividades e seletividades previstas para as novas estruturas propostas derivadas do TMQ
mlq75 N N NH
2
H H CONH
2
CH3
1,2319E+00 5,1667E+00 2,7745E+02
4,5167E-01 3,9241E+01
mlq76 N N CONH
2
H H CONH
2
CH3
7,5368E+00 5,6016E+01 4,9995E+04
3,5875E+00 1,8504E+03
mlq77 N N H H H COCH3 CH3
9,6626E-01 3,5298E+00 4,5052E+02
5,7216E-01 2,8726E+03
mlq78 N N OH H H COCH3 CH3
3,9538E-01 3,6285E+00 1,3679E+02
2,8379E-01 6,9844E+02
mlq79 N N NH
2
H H COCH3 CH3
1,6305E+00 5,5491E+00 8,1696E+02
5,2230E-01 1,6797E+01
mlq80 N N CONH
2
H H COCH3 CH3
1,1961E+00 5,8162E-01 1,2420E+02
4,0146E-01 1,6805E+03
mlq81 N -C-NH2 H H H H H
8,3237E-01 5,5487E+00 3,3969E+00
1,2652E+03 2,5763E-02
mlq82 N -C-NH2 OH H H H H
3,6647E-01 5,5740E-01 1,9561E+00
4,9444E+02 4,2387E+00
mlq83 N -C-NH2 NH
2
H H H H
3,8035E-01 1,9866E+00 2,0165E+00
2,7614E+02 1,1545E+01
mlq84 N -C-NH2 CONH
2
H H H H
7,6620E-01 7,9973E+00 1,1287E+01
1,4940E+03 2,2822E+00
mlq85 N -C-NH2 H COOH H H H
6,1242E-01 6,7377E+02 3,4158E+00
3,4045E-10 6,5781E-01
mlq86 N -C-NH2 OH COOH H H H
4,7740E-03 1,0580E+00 1,0125E-03
5,7064E-11 6,9244E+00
mlq87 N -C-NH2 NH
2
COOH H H H
1,2346E+00 1,2412E+00 7,1833E+00
1,3064E+03 3,8043E+00
mlq88 N -C-NH2 CONH
2
COOH H H H
6,0343E-02 5,8323E+01 2,0427E-01
1,2391E-10 4,7514E+00
mlq89 N -C-NH2 H CONH
2
H H H
5,5798E-01 1,7158E+00 4,8878E+01
1,8830E+03 2,5216E-03
mlq90 N -C-NH2 OH CONH
2
H H H
4,5005E+00 2,8336E+01 2,0574E+00
1,2661E-06 5,6313E-03
mlq91 N -C-NH2 NH
2
CONH
2
H H H
3,4235E-01 1,4513E+00 1,6634E+00
4,4053E+02 4,1615E-01
mlq92 N -C-NH2 CONH
2
CONH
2
H H H
1,6341E+00 1,0889E+01 2,4871E+01
1,1626E+03 1,0416E-04
mlq93 N -C-NH2 H COCH3 H H H
2,8259E+00 4,0355E+00 8,3955E+00
6,7509E+02 9,2159E-04
APÊNDICE
- 163 -
Atividades e seletividades previstas para as novas estruturas propostas derivadas do TMQ
mlq94 N -C-NH2 OH COCH3 H H H
1,6015E+00 1,3673E+01 1,6080E+01
3,2893E-06 1,1193E-01
mlq95 N -C-NH2 NH
2
COCH3 H H H
1,3292E+00 4,5049E-01 1,8662E+01
8,4253E+02 5,3452E+00
mlq96 N -C-NH2 CONH
2
COCH3 H H H
7,3051E-02 5,6872E+01 1,3913E+00
2,3174E-10 5,3250E+01
mlq97 N -C-NH2 H H H H CH3
3,4769E-01 7,4223E-01 4,1724E+00
6,8414E+02 1,7608E+00
mlq98 N -C-NH2 OH H H H CH3
2,6501E-01 4,4367E-01 1,1624E+00
3,6616E+02 5,2211E+00
mlq99 N -C-NH2 NH
2
H H H CH3
4,3997E-01 3,3361E+00 1,3639E+00
2,3253E+02 1,4994E+01
mlq100 N -C-NH2 CONH
2
H H H CH3
3,6812E-01 4,5476E+00 3,7137E+00
1,8786E+03 3,7760E+00
mlq101 N -C-NH2 H COOH H H CH3
4,9875E-01 3,7678E+02 5,0901E-01
1,4233E-10 5,0498E-01
mlq102 N -C-NH2 OH COOH H H CH3
1,1572E+00 3,8449E+01 1,1965E+01
1,9380E-10 7,8900E+00
mlq103 N -C-NH2 NH
2
COOH H H CH3
5,9269E-01 1,3401E+00 6,6142E+00
9,8385E+02 2,3973E+00
mlq104 N -C-NH2 CONH
2
COOH H H CH3
4,0026E-01 1,3359E+01 3,2102E-01
1,2535E-10 1,4186E+01
mlq105 N -C-NH2 H CONH
2
H H CH3
2,8569E+00 3,9859E+00 1,8256E+02
1,4750E+03 6,2234E-04
mlq106 N -C-NH2 OH CONH
2
H H CH3
9,7203E-01 1,5394E+00 6,6106E+02
4,4648E+02 1,4693E+00
mlq107 N -C-NH2 NH
2
CONH
2
H H CH3
6,1288E-01 3,6718E-01 3,9001E+00
3,4972E+02 1,1848E+00
mlq108 N -C-NH2 CONH
2
CONH
2
H H CH3
3,1062E+00 1,8972E+00 1,1819E+02
1,6563E+03 1,8576E-03
mlq109 N -C-NH2 H COCH3 H H CH3
3,2177E+00 2,1039E+00 2,3267E+02
1,3537E+03 6,1602E-03
mlq110 N -C-NH2 OH COCH3 H H CH3
1,0925E+00 3,0830E+01 5,2172E+01
1,6660E-07 1,6241E-01
mlq111 N -C-NH2 NH
2
COCH3 H H CH3
1,6666E+00 1,0991E+00 3,5727E+00
6,0092E+02 9,2453E-01
mlq112 N -C-NH2 CONH
2
COCH3 H H CH3
4,1185E-02 7,2724E+00 6,6773E-03
3,7567E-11 2,2054E+00
APÊNDICE
- 164 -
Atividades e seletividades previstas para as novas estruturas propostas derivadas do TMQ
mlq113 N -C-NH2 H H COOH H H
7,9931E-01 2,5848E+00 4,6659E+01
1,9571E+03 2,8459E-03
mlq114 N -C-NH2 OH H COOH H H
2,4859E+00 2,0192E+01 1,4632E+01
5,0849E+00 1,3078E-04
mlq115 N -C-NH2 NH
2
H COOH H H
6,0598E-01 1,0183E+00 3,8141E+00
1,5961E+03 7,5314E-01
mlq116 N -C-NH2 CONH
2
H COOH H H
5,4517E-01 6,8426E+00 2,5574E+00
5,0107E-04 2,4630E-05
mlq117 N -C-NH2 H H CONH
2
H H
8,9486E-01 4,5534E+00 3,2848E+01
3,2696E+03 5,7414E-03
mlq118 N -C-NH2 OH H CONH
2
H H
6,5123E-01 3,3390E+00 1,6068E+01
5,2969E+02 1,4951E+00
mlq119 N -C-NH2 NH
2
H CONH
2
H H
1,7263E+00 1,0549E+00 5,0105E+00
1,5929E+03 5,4503E-01
mlq120 N -C-NH2 CONH
2
H CONH
2
H H
4,8892E-01 2,3078E+00 1,8719E+01
4,7245E+02 1,1652E-04
mlq121 N -C-NH2 H H COCH3 H H
8,0137E-01 3,1767E+00 1,2851E+02
2,7306E+03 2,6029E-03
mlq122 N -C-NH2 OH H COCH3 H H
2,1723E+00 2,8300E+00 2,9987E+01
4,9246E+01 7,5920E-04
mlq123 N -C-NH2 NH
2
H COCH3 H H
7,8647E-01 7,1705E-01 3,4445E+00
8,8886E+02 3,4471E+00
mlq124 N -C-NH2 CONH
2
H COCH3 H H
5,2624E-01 4,4199E+00 9,3454E+00
2,2554E+00 4,3567E-05
mlq125 N -C-NH2 H H COOH H CH3
1,1056E+00 5,9814E+00 6,1859E+01
3,1368E+03 4,6070E-04
mlq126 N -C-NH2 OH H COOH H CH3
1,5646E+00 1,1260E+01 4,9236E+01
6,0964E+01 1,4882E-03
mlq127 N -C-NH2 NH
2
H COOH H CH3
1,4128E+00 3,7284E+00 1,4677E+00
1,0232E+03 8,7152E-02
mlq128 N -C-NH2 CONH
2
H COOH H CH3
2,5870E-01 2,1156E+00 4,9214E+00
3,5717E-02 8,7472E-05
mlq129 N -C-NH2 H H CONH
2
H CH3
1,4287E+00 1,6566E+00 6,8595E+01
2,7870E+03 1,7502E-02
mlq130 N -C-NH2 OH H CONH
2
H CH3
3,9052E+00 1,4088E+00 5,7098E+01
4,6838E+02 2,1550E-03
mlq131 N -C-NH2 NH
2
H CONH
2
H CH3
8,0694E-01 2,2131E+00 3,1352E+00
1,0663E+03 7,5513E-01
APÊNDICE
- 165 -
Atividades e seletividades previstas para as novas estruturas propostas derivadas do TMQ
mlq132 N -C-NH2 CONH
2
H CONH
2
H CH3
1,4348E+00 5,3511E+00 6,8941E+01
9,5981E+02 2,1254E-04
mlq133 N -C-NH2 H H COCH3 H CH3
1,1577E+00 8,5616E+00 7,9816E+01
1,7560E+03 2,6893E-03
mlq134 N -C-NH2 OH H COCH3 H CH3
5,9331E+00 4,9917E+00 5,7002E+01
1,7550E+02 1,9660E-03
mlq135 N -C-NH2 NH
2
H COCH3 H CH3
6,5291E-01 1,4191E+00 4,8257E+00
7,5480E+02 3,1213E-01
mlq136 N -C-NH2 CONH
2
H COCH3 H CH3
3,6372E+00 1,8556E+00 9,3580E+01
1,0365E+01 4,6775E-05
mlq137 N -C-NH2 H H H COOH H
1,1164E+00 5,7057E+00 1,4356E+00
4,2952E-02 4,9326E-02
mlq138 N -C-NH2 OH H H COOH H
2,2706E+00 3,2758E+00 1,5828E+00
9,2225E+02 6,5265E-01
mlq139 N -C-NH2 NH
2
H H COOH H
1,1113E+00 2,2663E+00 2,3790E+00
1,1236E+03 8,1739E-01
mlq140 N -C-NH2 CONH
2
H H COOH H
7,6264E-02 9,0232E+00 6,0513E-02
3,8287E-10 1,6148E+00
mlq141 N -C-NH2 H H H CONH
2
H
7,7618E-01 1,1937E+01 3,4428E+00
5,8419E+02 3,4622E-03
mlq142 N -C-NH2 OH H H CONH
2
H
1,4687E+00 1,9011E+00 4,0240E+01
1,2186E+03 6,4813E-03
mlq143 N -C-NH2 NH
2
H H CONH
2
H
1,9056E-01 3,1168E+00 4,0837E+00
1,5667E+03 2,9520E+00
mlq144 N -C-NH2 CONH
2
H H CONH
2
H
1,0696E+00 1,8035E+00 2,2528E+01
1,1240E+03 1,3244E-03
mlq145 N -C-NH2 H H H COCH3 H
1,8005E+00 4,0098E+00 1,0547E+01
5,1460E+02 4,3562E-02
mlq146 N -C-NH2 OH H H COCH3 H
2,1892E+00 1,9944E+01 3,8758E+00
2,0622E-03 2,4503E-02
mlq147 N -C-NH2 NH
2
H H COCH3 H
1,7590E-01 4,8871E+00 1,1079E+00
1,4557E+03 1,8144E+00
mlq148 N -C-NH2 CONH
2
H H COCH3 H
1,9855E-01 1,4492E+02 3,1558E+00
2,6583E-09 6,8217E-01
mlq149 N -C-NH2 H H H COOH CH3
1,0850E+00 5,4688E+00 3,3919E+01
6,8447E+02 4,0711E-03
mlq150 N -C-NH2 OH H H COOH CH3
3,1446E+00 2,4467E+00 3,7889E+01
1,0680E+03 4,8895E-03
APÊNDICE
- 166 -
Atividades e seletividades previstas para as novas estruturas propostas derivadas do TMQ
mlq151 N -C-NH2 NH
2
H H COOH CH3
3,7252E-01 1,6753E+00 1,2744E+00
1,1659E+03 1,5393E+00
mlq152 N -C-NH2 CONH
2
H H COOH CH3
1,1278E+00 4,3857E+00 8,2930E+00
3,9704E-01 2,1208E-04
mlq153 N -C-NH2 H H H CONH
2
CH3
6,6567E-01 2,1316E+00 1,7361E+01
2,6411E+02 1,7291E-02
mlq154 N -C-NH2 OH H H CONH
2
CH3
3,7712E-01 1,7191E+00 1,8959E+01
6,5540E+02 3,4040E-01
mlq155 N -C-NH2 NH
2
H H CONH
2
CH3
2,7881E-01 8,8106E-01 1,3807E+00
7,4352E+02 7,2448E+00
mlq156 N -C-NH2 CONH
2
H H CONH
2
CH3
9,2125E-01 3,7379E+00 3,9340E+01
1,5462E+03 5,1108E-04
mlq157 N -C-NH2 H H H COCH3 CH3
2,0223E+00 1,8844E+00 2,1340E+01
9,1172E+02 3,4148E-03
mlq158 N -C-NH2 OH H H COCH3 CH3
1,2051E+00 1,3049E+00 8,0431E+00
8,1095E+02 3,5735E-01
mlq159 N -C-NH2 NH
2
H H COCH3 CH3
3,3118E+00 7,5851E+00 5,0028E+00
2,7701E+03 3,4021E-02
mlq160 N -C-NH2 CONH
2
H H COCH3 CH3
1,4663E+00 2,4217E+00 3,1470E+01
1,9851E+03 9,8607E-05
Livros Grátis
( http://www.livrosgratis.com.br )
Milhares de Livros para Download:
Baixar livros de Administração
Baixar livros de Agronomia
Baixar livros de Arquitetura
Baixar livros de Artes
Baixar livros de Astronomia
Baixar livros de Biologia Geral
Baixar livros de Ciência da Computação
Baixar livros de Ciência da Informação
Baixar livros de Ciência Política
Baixar livros de Ciências da Saúde
Baixar livros de Comunicação
Baixar livros do Conselho Nacional de Educação - CNE
Baixar livros de Defesa civil
Baixar livros de Direito
Baixar livros de Direitos humanos
Baixar livros de Economia
Baixar livros de Economia Doméstica
Baixar livros de Educação
Baixar livros de Educação - Trânsito
Baixar livros de Educação Física
Baixar livros de Engenharia Aeroespacial
Baixar livros de Farmácia
Baixar livros de Filosofia
Baixar livros de Física
Baixar livros de Geociências
Baixar livros de Geografia
Baixar livros de História
Baixar livros de Línguas
Baixar livros de Literatura
Baixar livros de Literatura de Cordel
Baixar livros de Literatura Infantil
Baixar livros de Matemática
Baixar livros de Medicina
Baixar livros de Medicina Veterinária
Baixar livros de Meio Ambiente
Baixar livros de Meteorologia
Baixar Monografias e TCC
Baixar livros Multidisciplinar
Baixar livros de Música
Baixar livros de Psicologia
Baixar livros de Química
Baixar livros de Saúde Coletiva
Baixar livros de Serviço Social
Baixar livros de Sociologia
Baixar livros de Teologia
Baixar livros de Trabalho
Baixar livros de Turismo