Download PDF
ads:
Classificação de Moléculas com Atividade
Antitumoral e Antibiótica por meio de Análise de
Componentes Principais e Redes Neurais
Alexandre Adriano Neves de Paula
Orientador: Paulo Monteiro Vieira Braga Barone
Dissertação apresentada ao Departamento
de Física da Universidade Federal de Juiz
de Fora como parte dos requisitos para a
obtenção do título de Mestre em Física
Juiz de Fora
(2006)
Universidade Federal de Juiz de Fora
ads:
Livros Grátis
http://www.livrosgratis.com.br
Milhares de livros grátis para download.
i
Agradecimentos
Ao Professor Paulo Monteiro Vieira Braga Barone pela oportunidade de trabalho,
paciência e amizade.
À Gisele Garcia, pelo companheirismo, apoio, paciência, amor, suporte, incentivo e
compreensão, pois sem ela, a conclusão desse curso jamais seria possível.
Ao meu filho Caio Neves Garcia, que encheu meu coração de alegrias nas horas mais
difíceis e ao meu outro filho que já está chegando.
A minha mãe Nieta Neves Moreira que acreditou em mim quando eu precisei.
Aos grandes amigos de curso e de todas as horas, Alex , Denise, Luis Fernando,
Marciano, Mariana, Tarcisio e Victor.
Aos amigos da UFJF pelo apoio e incentivo, mas principalmente pela tolerância,
paciência e companheirismo que tiveram comigo.
A Carlos Eduardo Cardoso Galhardo e Louraine Cláudia de Melo, pela grande ajuda no
inicio deste trabalho.
Aos professores do Departamento de Física da Universidade Federal de Juiz de Fora.
À Universidade Federal de Juiz de Fora.
À CAPES, pelo apoio financeiro.
ads:
ii
Sumário
Agradecimentos..............................................................................................................i
Sumário ..........................................................................................................................ii
Resumo ..........................................................................................................................iv
Abstract ...........................................................................................................................v
Lista de figuras ...........................................................................................................vi
Lista de tabelas ...........................................................................................................vii
Abreviaturas ............................................................................................... ix
Capítulo 1 – Introdução ..........................................................................................1
Referências.............................................................................................................5
Capítulo 2 – Métodos
............................................................................................... 7
2.1 Análise de componentes principais ........................................................... 7
2.1.1. – Introdução ................................................................................... 7
2.1.2. – Obtendo as Componentes Principais .......................................... 9
2.2 Redes neurais artificiais. ........................................................................... 17
2.2.1 Neurônios Biológicos................................................................. 17
2.2.2
O Neurônio Artificial ................................................................ 22
2.2.3
Perceptrons ................................................................................ 23
2.2.3.1 Princípio de aprendizado de Hebb .............................. 24
2.2.3.2 Implementações de Funções Booleanas XOR . 25
2.2.3.3 Aprendizado por Retropropagação de Erro ................ 27
Referências...........................................................................................................31
Capítulo 3 – Metodologia utilizada......................................................................3
iii
Referências ..........................................................................................................34
Capítulo 4 – Elipticinas .........................................................................................35
4.1- Introdução.....................................................................................................35
4.2- Metodologia..................................................................................................38
4.3- Resultados.....................................................................................................42
4.4- Conclusão.....................................................................................................46
Referências ..........................................................................................................48
Capítulo 5 – Flúor-quinolonas ............................................................................49
5.1- Introdução.....................................................................................................49
5.2- Metodologia..................................................................................................55
5.1.1- Otimização ....................................................................................55
5.2.2 - PCA ..............................................................................................57
5.2.3- Redes neurais artificiais ............................................................... 59
5.3- Resultados.....................................................................................................60
5.4- Conclusão.....................................................................................................62
Referências .........................................................................................................64
Capítulo 6 – Conclusões finais e perspectivas ...............................................66
Referências ......................................................................................................... 68
iv
Resumo
Há uma crescente necessidade de que novas drogas sejam desenvolvidas no
intuito de possibilitar a obtenção de fármacos mais eficazes com menores custos para a
indústria farmacêutica. Correlacionando a atividade biológica das drogas às suas
propriedades moleculares e procurando classificá-las a partir dos padrões obtidos,
podemos contribuir para direcionar, racionalizar e acelerar as pesquisas in vitro e in vivo
para o desenvolvimento de novas drogas com atividade otimizada.
Escolhemos duas famílias de moléculas: as elipticinas, que são fármacos
antitumorais, e as flúor-quinolonas, que são fármacos antibióticos. Analisamos drogas
destas famílias, com atividade conhecida experimentalmente, e propusemos novos
fármacos para serem pesquisados pela comunidade cientifica e indústria farmacêutica.
Para viabilizar a proposição de novos fármacos, realizou-se um intenso estudo
sobre as redes neurais artificiais (RNA) e análise de componentes principais (ACP), que
possibilitaram a classificação das moléculas. Aplicamos o método ACP para uma
seleção das propriedades eletrônicas mais relevantes das estruturas e RNA para o
reconhecimento de padrões de atividade.
v
Abstract
There is a increasing necessity to develop new drugs in intention to make
possible the attainment of more efficient fármacos, decreasing the costs of the
pharmaceutical industry. Correlating the biological activity of the drugs to its molecular
properties and classifying them from the obtained patterns, we can contribute to direct,
rationalize and speed up the research in vitro and in vivo for the development of new
drugs with optimized activity.
We chose two molecule families: the ellipticines, which are pharmaceutics
antitumorais, and the fluoroquinolones, which are pharmaceutics antibiotics. We
analyzed drugs of these families, with experimentally known activity, and we proposed
new pharmaceutics to be searched by the scientific community and pharmaceutical
industry.
To make possible the proposal of new pharmaceutics, we did an intense study on
artificial neural nets (ANN) and principal components analysis (PCA), that made
possible the classification of molecules. We applied the method of PCA to make a
selection of the most relevant electronic properties of the structures and ANN for the
recognition of activity patterns.
vi
Lista de figuras
Figura 2.1 – Neurônio biológico ……...……………………......…………...….…... 17
Figura 2.2 – Conexão Sináptica ……………………………….………….………….. 18
Figura 2.3 – Potencial de ação …..…………………………….………………….….. 19
Figura 2.4 – Representação esquemática da integração espacial-temporal dos estímulos
por um neurônio ............................................................................................……......... 20
Figura 2.5 – Relação entre a Freqüência de pulsos de um neurônio e a intensidade do
estímulo de longa duração .......................................................................................... 21
Figura 2.6 – Funções mais comumente empregadas como funções de ativação na
modelagem de neurônios ..................…………………………………………….…. 21
Figura 2.7 – Representação de um neurônio artificial por diagramas de blocos ..….... 22
Figura 2.8 – Rede neural multicamada .....…………………….………….………….. 23
Figura 2.9 – Funções booleanas (E, OU e XOR) ...…………….………………….. 25
Figura 2.10 – Implementação da função XOR .....…………….………….………….. 26
Figura 2.11 – Representação de um neurônio artificial ....…….………….………….. 27
Figura 4.1 – Núcleo comum das elipticinas .......…………….………….………….. 35
Figura 5.1 – Núcleo comum das flúor-quinolonas ...........…….………….………….. 50
Figura 5.2 – Regiões investigadas das flúor-quinolonas .............................................. 50
Figura 5.3a – Flúor-quinolonas inativas ....................................................................... 51
Figura 5.3b – Flúor-quinolonas ativas .......................................................................... 51
Figura 5.3c – Flúor-quinolonas com atividade experimental desconhecida ................ 52
Figura 5.4 – Estrutura lomefloxacin, em que verificamos uma ponte de hidrogênio .. 55
Figura 5.5 – Núcleo das estruturas com cauda longa. .................................................. 62
vii
Lista de tabelas
Tabela 4.1 – Elipticinas e derivados estudados no presente trabalho ........................... 36
Tabela 4.2 – Parâmetros iniciais da RNA para as elipticinas ...................................... 38
Tabela 4.3 – Propriedades das elipticinas com atividade conhecida (DM, DH, AnL(D)
e nH(B)) …………………………………………………………………………… 40
Tabela 4.4 – Propriedades das elipticinas com atividade conhecida (SAA, SAG,
Volume, HE, Log P, Refrat, Polariz e Massa) ……………………………………… 41
Tabela 4.5 – Os melhores conjuntos de estruturas usadas como padrão e comparação
dos resultados da RNA e os outros métodos com o experimental …………................ 43
Tabela 4.6 – Porcentagem de concordância dos métodos com a atividade experimental.
........................................................................................................................................ 43
Tabela 4.7 – Propriedades das elipticinas com atividade desconhecida (DM, DH,
AnL(D) e nH(B)) ……………………………………………………………………. 44
Tabela 4.8 – Propriedades das elipticinas com atividade desconhecida (SAA, SAG,
Volume, HE, Log P, Refrat, Polariz e Massa) ……………………………………… 44
Tabela 4.9 – Comparação da atividade usando os métodos de análise para as moléculas
de atividade experimental desconhecida ....................................................................... 45
Tabela 4.10 – Porcentagem de concordância dos métodos com RNA nas elipticinas . 45
Tabela 4.11 – Número de tipos de métodos que são ativas e nativas ........................... 45
Tabela 5.1 Atividade das drogas contra Streptococcus pneumoniae ......................... 53
Tabela 5.2 – Flúor-quinolonas com atividade das drogas desconhecida. ..................... 54
Tabela 5.3 – Propriedades das flúor-quinolonas (Rep/NTA, DL, AnH1_A, AnH_A,
nH_A, AnL_C) .............................................................................................................. 58
Tabela 5.4 Parâmetros iniciais das RNA das flúor-quinolonas ................................. 59
viii
Tabela 5.5 – Os melhores conjuntos de estruturas usadas como padrão e comparação
dos resultados da RNA com os dados experimentais .................................................... 60
Tabela 5.6 – Resultados segundo o método RNA da atividade para as moléculas de
atividade experimental desconhecida............................................................................. 61
ix
Abreviaturas
ANN Î Artificial Neural Nets
MIE Î Métodos de Índices Eletrônicos
PCA Î Pricipal Component Analisis)
HCA Î Hierarchical Clustering Analysis)
SAR Î Structure-Activity Relationships)
MNDO Î Modiefied Neglect of Differential Overlap
MIC Î Minimum inhibitory concentration)
HOMO Î Highest Occupied Molecular Orbital
LUMO Î Lowest Unoccupied Molecular Orbital
HOMO-1 Î Highest Occupied Molecular Second Orbital
LUMO+1 Î Lowest Unoccupied Molecular Second Orbital
DOS Î Density Of States
LDOS Î Local Density Of States
HF Î Heat Formation
EE Î Electronic Energy
RepCC Î Core-Core Repulsion)
PSDD Î Perceptron Simulater for Drug Design
PC Î Principal Components
DM Î Dipolo Moment
1
Capitulo 1 – Introdução
O desenvolvimento de novas drogas, em função da existência de organismos
resistentes às drogas mais antigas em uso, de fármacos mais eficientes que apresentem
resultados mais rápidos com menos efeitos colaterais ou mesmo da minimização do
custo de produção, acarreta um alto custo à industria farmacêutica. Se a atividade
biológica dessas drogas puder ser correlacionada às propriedades moleculares,
produzindo padrões para a sua classificação, estas informações poderão ser utilizadas
para propor novos fármacos e direcionar, racionalizar e acelerar as pesquisas in vitro e
in vivo para o desenvolvimento de novas drogas, com atividade otimizada.
Neste trabalho, estudamos duas famílias de moléculas, com o objetivo de
classificá-las segundo as suas atividades antitumoral e antibiótica, respectivamente,
utilizando os métodos de reconhecimento de padrões PCA (Análise de Componentes
Principais) e RNA (Redes Neurais Artificiais). Estes métodos são discutidos no capítulo
2, enquanto que a metodologia utilizada para investigar estas questões é apresentada no
capítulo 3.
Os estudos reportados no trabalho - apresentados nos capítulos 4 e 5 - estão
baseados em conceitos como as diferenças em energia entre os orbitais LUMO (Lowest
Unoccupied Molecular Orbital), HOMO (Highest Occupied Molecular Orbital) e seus
vizinhos próximos (aqui chamados HOMO-1, orbital cuja energia é imediatamente
inferior ao HOMO, e LUMO+1, imediatamente superior ao LUMO)
12 nívelnível
EED
=
,
e também em contribuições desses orbitais para uma propriedade chamada densidade de
estados (DOS, do inglês Density of States). Sabemos que os níveis de energia
permitidos para os sistemas quânticos como os átomos e as moléculas são quantizados,
isto é, são valores especiais, que formam um conjunto discreto. A densidade de estados
é a propriedade que indica como esses níveis de energia estão distribuídos, e é definida
como o número de níveis (ou estados de energia permitidos) por unidade de energia. A
densidade de estados calculada sobre uma região específica da molécula é chamada de
densidade de estados local (LDOS, Local DOS). Essas grandezas permitem obter
(1.1)
2
informações de determinadas partes das moléculas para a reatividade química e,
consequentemente, sobre o seu comportamento bioquímico, entre outras propriedades.
Os cálculos da LDOS para um dado nível eletrônico consideram a distribuição
de cada átomo, medida pelo quadrado do coeficiente correspondente no orbital
molecular. Para cálculos envolvendo vários orbitais ou regiões moleculares a LDOS é
obtida somando as contribuições dos orbitais atômicos selecionados (n
i
a n
f
) [16, 17]:
=
=
f
i
n
nm
mii
cELDOS
2
2)(
Também utilizaremos a diferença de energia entre as contribuições de níveis
eletrônicos específicos para a LDOS, como os níveis HOMO e HOMO-1 ou então
LUMO e LUMO+1:
(
)
=
=
f
i
n
nm
mnívelmnível
ccn
2
2
2
1
2
Esses parâmetros, ao lado do calor de formação (HF), da energia eletrônica (E
el
),
da energia de repulsão caroço-caroço (RepCC) e do momento de dipolo (DIPOLO),
serão utilizados inicialmente até se obter os parâmetros mais relevantes para a
classificação da atividade biológica das estruturas das famílias estudadas.
Nos capítulos 4 e 5 apresentamos, respectivamente, um grupo de elipticinas,
com atividade antitumoral, e um grupo de flúor-quinolonas, com atividade antibiótica, e
os resultados da investigação entre estrutura e atividade biológica desenvolvida neste
trabalho.
A elipticina e derivados [3, 4] apresentam atividade citotóxica e antitumoral que
pode ser atribuída a uma variedade de mecanismos de ação, como a intercalação entre
pares de bases do DNA (da sigla em inglês para ácido desoxirribonucléico) ou a
interferência na atividade catalítica da topoisomerase II. A estrutura molecular da
elipticina (capítulo 4) permite a síntese de uma série de derivados com a variação de
grupos laterais ligados ao núcleo aromático, o que pode intensificar ou atenuar a
atividade antitumoral. Além da alta citotoxicidade em células cancerosas, estas
moléculas são especialmente interessantes do ponto de vista clínico devido aos efeitos
(1.2)
(1.3)
3
colaterais reduzidos [3]. O modo de ação das elipticinas tem sido amplamente estudado,
entretanto, conclusões definitivas sobre os aspectos moleculares relevantes para a ação
biológica não foram ainda relatadas na literatura [4].
Recentemente, foram feitos estudos [1] relacionados à geometria, às
propriedades eletrônicas, aos espectros de absorção e à densidade local de estados
eletrônicos de 40 derivados da elipticina, utilizando os métodos semi-empíricos PM3 e
ZINDO/S-CI. Para o estudo de classificação quanto à atividade antitumoral foram
utilizados os métodos de reconhecimento de padrões: PCA [7 e 8], HCA (Hierarchical
Clustering Analysis) e Electronic Indices Methods (EIM) [14], cujos resultados
mostraram a correlação de alguns descritores eletrônicos com a atividade antitumoral
das drogas [1 e 2]. Neste trabalho, investigamos a atividade antitumoral utilizando outro
método de reconhecimento de padrões, as redes neurais artificiais. Na classificação por
meio de RNA escolhemos um grupo de derivados com atividade experimental
conhecida para o treinamento da rede. No treinamento foi usado o pacote computacional
PSDD (Perceptron Simulator for Drug Design) [18], com o algoritmo backpropagation,
numa rede perceptron. Os resultados obtidos com a metodologia de redes neurais
permitiram classificar as moléculas ativas e inativas com índice de acerto superior a 90
por cento. Para os derivados sem informação experimental (total de 15 moléculas), uma
comparação entre os diferentes métodos de reconhecimento de padrões (PCA, EIM,
HCA - Ref. 2 - e ANN) utilizados para o estudo, mostra que nove, das quinze moléculas
estudadas, apresentaram a mesma classificação em todos os cinco métodos, outras cinco
moléculas foram igualmente classificadas em quatro métodos diferentes, apresentando
divergência em apenas um método, e apenas uma obteve classificações contraditórias
(sendo classificada, em três métodos, como inativa e, em dois, como ativa).
Outra série de moléculas estudadas foi a família das flúor-quinolonas, que
apresentam atividade antibiótica e são utilizadas clinicamente no tratamento de diversas
doenças infecciosas [9, 11]. Nesta investigação, aplicamos os métodos PCA e ANN
para o reconhecimento de padrões de atividade antibiótica de um conjunto de flúor-
quinolonas anteriormente estudadas pelo grupo de pesquisa. Para isso, estudamos a
geometria molecular e as propriedades eletrônicas de um grupo de 31 flúor-quinolonas,
dentre as quais dezessete drogas apresentam atividade conhecida e quatorze dessas
drogas, propostas, apresentam atividade desconhecida. Os cálculos da otimização da
estrutura geométrica das moléculas e das propriedades eletrônicas foram realizados
utilizando métodos semi-empíricos implementados nos pacotes CACHÊ [5], que possui
4
o MOPAC [15] incorporado, e Chem2Pac [6].
Aplicamos PCA em todas as flúor-quinolonas com atividade conhecida,
objetivando identificar as variáveis mais relevantes para a classificação da atividade das
moléculas e RNA, utilizando as variáveis detectadas como mais relevantes em PCA,
para a classificação das moléculas, com o objetivo de identificar, dentre as quatorze
flúor-quinolonas de atividade desconhecida, quais têm atividade antibiótica, a partir de
uma porcentagem de acertos das dezessete moléculas observadas experimentalmente
contra o Streptococcus peneumonae [9, 10, 11, 12 e 13]. Com esta metodologia, as
moléculas ativas e inativas são identificadas com índice de acerto superior a noventa por
cento. Os resultados obtidos das duas metodologias, PCA e ANN, são comparados e
discutidos no final do capítulo 5.
A classificação dos dois grupos de fármacos, com a metodologia aplicada,
apresentou excelentes resultados o que nos faz avançar com este estudo e propor a
aplicação dos métodos aqui utilizados em outros trabalhos futuros, mencionados no
capítulo 6.
5
Referências
1. Scheila F. Braga, Louraine C. de Melo e P. M. V. B. Barone, J. Mol. Struct.
(Theochem) 710 (2004) 51-59.
2. Louraine C. de Melo, Scheila F. Braga e P. M. V. B. Barone, submetido.
3. Sizum, P.; Auclair, C.; Lescot, E.; Paoletti, C.; Perly, B.; Fermandjian, S.;
Biopolymers 1988, 27, 1096.
4. Auclair, C.; Arch. Biochem. Biophys. 1987, 259, 1.
5. Cache 5.0, fujitsu Limited, Chiba City, Chiba 2618588, japan;
6. Cyrillo, M.; Galvão D.S.; EPA Newsletter 67, 31-34 e 34-38 (1999).
http://www.ifi.unicamp.br/gsonm/chem2pac;
7. LA Rezende; “ Estrutura Eletrônica de Hidrocarbonetos Aromáticos Heterociclicos”;
Dissertação de Mestrado, DF/UFJF. Juiz de Fora, 2002.
8. Chatfield C. and Collins ªJ. “ Introduction to Multivariate Analysis” (Cambrigde
University press, Cambridge (1980)).
9. Da Silva, A.D.; De Almeida, M.V.; De Souza, M.V.M.; Couri, M.R.C.; Biological
Activity and Synthetic Metodologics for the Preparation of Fluorquinolones, a class of
Potent Antibacterial Current medicinal Chemistry, 2003, 10(1):21-39;
10. <www.ahc.umn.edu> em 14/11/2003;
11. Appelbaum, P.C.; Hunter, P.A.; The fluoroquinolone antibacterial: past, present
ans future perspective, PA Int. Antimicrob. Ag. , 2000, 16, 5-15;
6
12. Ma, Z.; Chu, D.T.W.; Cooper, C.S.; Li, Q.; Fung, A.K.L.; Wang, S.; Shen,
L.L.;Flamm, R.K.; Nillus, A.M.; Alder, J.D.; Meulbroek, J.A.; Or, Y.S. J. Synthesis and
antimicrobial Activity of 4H-4-Oxoquinolizine Derivatives: Consequences of
Structural Modification at the C-8 Position Med. Chem., 1999, 42, 4202-4213;
13. Schmitz, F.J.; Verhoef, J.; Fluit, A.C.; the SENTRY PARTICIPANTS GROUP,
Compaative activities of six different fluorquinolones against 9,682 clincal bacterial
isolates from 20 European university hospital participating in the European SENTRY
surveillance programme, Int Journal of Antimicrobial Agentes,1999,12, 311-317;
14. Coluci, V.R.; Braga, S.F.; Vedrame, R.; Barone, P.M.V.B.; Galvão, D.S.; Teoria
eletrônica do câncer e a origem da vida: base para o desenvolvimento de parâmetros
“universais” para métodos de estrutura-atividade; VIII Escola Brasileira de Estrutura
Eletrônica, VIII (2002) 202-223, Juiz de Fora - MG
15. MOPAC program, version 6.0, Quantum Chemistry Exchange No 433.
16. P.M.V.B. Barone, A. Camilo Jr., D.S. Galvão, Phys. Rev. Lett. , 77 (1996) 1186.
17. R.S. Braga, P.M.V.B. Barone e D.S. Galvão, J. Mol. Struct. (Theochem) 464, 257
(1999).
18. H.Ichikawa, PSDD: Perceptron-type Neural Network Simulator, QCPE 615,
Indiana, USA;
7
Capítulo 2 – Métodos
2.1. Análise de componentes principais [1, 2]
2.1.1. Introdução
O problema de muitos dados é comum em diversas áreas da ciência e tecnologia,
onde encontramos sistemas com muitas variáveis, em que todas precisam ser analisadas.
O homem possui capacidade de realizar este tipo de análise, uma vez que toda nossa
aprendizagem está relacionada com a capacidade cerebral de identificar, isolar, associar
objetos concretos e conceitos de forma a definir padrões. Essa capacidade humana é
tema de pesquisas recentes. Bons exemplos são as redes neurais e a inteligência
artificial.
Para um estudo de dados multivariados, existem inúmeras técnicas disponíveis
na literatura, basta uma escolha cautelosa, pois cada método tem suas peculiaridades
que podem trazer dificuldades na análise final dos dados. Existe uma diferença
marcante entre os métodos que podem classificá-los da seguinte maneira: os métodos
“variável-dirigidas” onde o relevante, durante a análise, é a relação entre as variáveis, e
os métodos “indivíduo-dirigidas” que aborda principalmente as relações entre os
indivíduos.
O papel principal da análise multivariada é reduzir a grande quantidade de dados
para um número menor de parâmetros significativos, para fornecer uma visão
estatisticamente privilegiada do conjunto de dados. Por exemplo, em um composto
orgânico, são necessários diferentes tipos de dados para determinação de algum
processo de atividade biológica, como as energias dos orbitais LUMO e HOMO, a
densidade de estados, o calor de formação, etc. Então, para realizar uma análise, nos
perguntamos: quais desses dados são, ou não, relevantes para o processo? Para isso
escolhemos um método estatístico de análise multivariada, como a análise de
componentes principais (PCA).
Para examinar as relações entre um conjunto de variáveis correlacionadas,
transformamos o conjunto de variáveis originais para um conjunto de variáveis não
correlacionadas, chamadas componentes principais (PC – principal components). A
8
técnica para obter as componentes principais é chamada PCA. As componentes
principais são obtidas em ordem decrescente de importância, pois a primeira
componente é a combinação linear das variáveis com maior variância nos dados
originais.
A PCA foi desenvolvida por Karl Peason início do século XX, e aperfeiçoada
em 1930 por Halrold Hotelling e colaboradores. Em resumo, o objetivo da técnica é
verificar se algumas poucas componentes principais respondem pela maior parte das
variáveis originais. Se isso ocorre, a dimensionalidade efetiva do problema é
drasticamente reduzida se comparada com a dimensionalidade original. Em outras
palavras, muitas das variáveis originais estavam correlacionadas. Assim poucas
componentes são realmente significativas, podendo ajudar-nos na melhor compreensão
dos dados que serão úteis nas análises subseqüentes, uma vez que trabalharemos com
um número muito menor de dados.
9
2.1.2. Obtendo as Componentes Principais
Antes da obtenção das componentes principais é necessário definirmos alguns
itens que virão a ser necessários. Para representar uma variável aleatória p-dimensional
utilizaremos o vetor aleatório, representado por X.
onde
p
XX ,...,
1
, são as variáveis aleatórias. Os vetores serão sempre representados sem
sub-índices.
O vetor média
[
]
p
T
µµµ
,...,
1
= tem como componentes
onde f
i
(x) é uma função peso. Essas componentes são as médias das componentes de X.
A variância da i-ésima componente é dada por
A variância é usualmente denotada por
2
i
σ
no caso univariado, mas para
corresponder à notação da covariância que será definida a seguir, iremos representá-la
por
ii
σ
no caso multivariado.
A covariância de duas variáveis X
i
e X
j
é definida por
.
Dessa forma a covariância é o produto dos desvios de duas variáveis em relação
às suas respectivas médias. Em particular, se i=j, a covariância nada mais é do que a
variância da variável i. Assim não temos necessidade de definir a variância, uma vez
que ela é um caso particular da covariância. A covariância de X
i
e X
j
é usualmente
== dxxxfX
ii
T
)(
µ
(2.2)
(2.1)
p
T
XXX ,...,
1
=
(
)
222
)(
iiiii
XXXVar
µµ
==
(2.3)
)
)
jjiiji
XXXXCov
µµ
=),(
(2.4)
10
representada por
ij
σ
; se i=j, a variância de X
i
é representada por
ii
σ
, como foi dito
anteriormente.
A equação 2.4 é muitas vezes escrita em forma equivalente,
Com p variáveis, existem p variâncias e 1/2p(p-1) covariâncias. É útil apresentar
estas quantidades na forma matricial, representada por
Σ
, cujo elemento (i,j) é
ij
σ
.
Essa matriz é muitas vezes chamada matriz de dispersão, matriz variância-
covariância ou simplesmente matriz covariância. Os termos da diagonal são as
variâncias, enquanto os termos fora da diagonal são as covariâncias. Como
jiij
σ
σ
= a
matriz Σ é simétrica.
A matriz
Σ pode ser representada em relação às variáveis e as respectivas
médias, utilizando as equações 2.4 e 2.5.
Ilustraremos o uso das covariâncias na procura da variância de qualquer
combinação linear das componentes de X. Consideremos a seguinte combinação linear
onde
[
]
p
T
aaa ,...,
1
= é um vetor de constantes. Então Y
i
é uma variável simples
aleatória, cuja média é dada por
jijiij
XX
µµσ
= ,
(2.5)
=Σ
pppp
p
p
σσσ
σσσ
σσσ
L
MOMM
L
L
21
22221
11211
(2.6)
T
XX
µµ
=Σ
TT
XX
µµ
=Σ
(2.9)
(2.8)
(2.7)
XaY
T
=
11
enquanto a variância é obtida por
Como a
T
(X-
µ
) é um escalar e todo escalar é igual a sua transposta, podemos
expressar Var(Y) em termos de
Σ , usando a equação 2.7:
Consideremos o caso p=2, onde a
T
X=a
1
X
1
+ a
2
X
1
. Podemos escrever
o segundo membro se reduz a
As equações 2.10 e 2.12 podem ser generalizadas pela notação que se A é
qualquer matriz (p x m) de constantes, então pode facilmente ser mostrado que A
T
X
possui vetor médio e a matriz de covariância e dados por
(2.12)
(2.11)
(2.10)
µ
T
aY =
()
[
]
2
)(
µ
= XaYVar
T
(
)
(
)
aXXaYVar
T
T
µµ
=)(
(
)
(
)
aXXa
T
T
µµ
=
aa
T
Σ=
),()()()(
221122112211
XaXaCovXaVarXaVarXaXaVar
+
+
=+
),(2)()(
21212
2
2
1
1
2
XXCovaaXVaraXVara ++=
(2.13)
[]
2
1
221
211
21
)(),(
),()(
a
a
XVarXXCov
XXCovXVar
aa
(2.14)
µ
TT
AXA =
AAXAVar
TT
Σ=)(
(2.16)
(2.15)
12
Embora as covariâncias sejam úteis para muitas propostas matemáticas, elas são
raramente utilizadas como estatísticas descritivas. Se duas variáveis estão linearmente
relacionadas, então a covariância será positiva ou negativa, dependendo se a inclinação
da reta que a representa é positiva ou negativa. E ainda, os coeficientes são de difícil
interpretação por dependerem das unidades nas quais as duas variáveis foram medidas.
Deste modo introduzimos um elemento, o coeficiente de correlação, que é dado pela
covariância normalizada pelo produto dos desvios padrões das duas variáveis. A
correlação de X
i
e X
j
será denotada
ij
ρ
,
onde
i
σ
é o desvio padrão de X
i
.
Com p variáveis, existem p variâncias e p(p-1)/2 distintas correlações. É muito
útil representar as correlações por uma matriz (p x p) cujos elementos são os
coeficientes de correlação. Essa matriz será denotada por P, os termos da diagonal de P
são unitários e os fora da diagonal são tais que a matriz é simétrica.
Para relacionarmos a matriz P com a matriz
Σ
introduziremos a matriz D,
diagonal de ordem (p x p), cujos elementos diagonais são os desvios padrão das
componentes de X.
As matrizes de covariância e correlação, ficam então, relacionadas por
ou
,
onde os termos da diagonal de D
-1
são recíprocos dos respectivos desvios padrões.
ji
ij
ij
σσ
σ
ρ
=
(2.17)
=
p
D
σ
σ
σ
L
MOMM
L
L
00
00
00
2
1
(2.18)
DPD
=
Σ
11
Σ
=
DD
P
(2.20)
(2.19)
13
Voltemos às componentes principais.
Suponhamos que
[
]
p
T
XXX ,...,
1
= seja uma variável aleatória com média
µ
e
matriz de covariância Σ . O objetivo é determinar, por meio de combinações lineares
das variáveis originais, um novo conjunto de variáveis não correlacionadas, cujas
variâncias diminuem a partir da primeira para a última variável. Denominemos as novas
variáveis ou coordenadas por Y
1,
Y
2,
...,Y
p
, que são combinações lineares das variáveis
originais:
onde
[]
pjj
T
j
aaa ,...,
1
= é um vetor constituído por constantes. As novas variáveis
possuem unidade arbritária. Impomos a restrição que
=
==
p
k
kjj
T
j
aaa
1
2
1 de modo que
este procedimento particular de normalização assegura que toda transformação é
ortogonal, ou, em outras palavras, que as distâncias no espaço p são preservadas.
Para encontrarmos a primeira componente principal devemos determinar a
1
de
tal modo a maximizar a variância (a
1
T
X), com a restrição de a
1
T
a
1
=1. A segunda
componente principal é encontrada determinando a
2
, tal que Y
2
tenha0.092.0452 c6014 01o deiância possuivel sãej0.09egunda
14
i=1,2,...,p .
no ponto estacionário.
Essas p equações, juntas com as restrições, são suficientes para determinar as
coordenadas dos pontos estacionários. É também necessário verificar se um ponto
estacionário é máximo, mínimo ou ponto de sela. Para isso usamos a função L(x), tal
que
onde os termos entre colchetes é nulo. Então os conjuntos de equações obtidas em eq.
2.23 podem ser escritos simplesmente como
No nosso caso, queremos maximizar a função
DPD
=
Σ
com a restrição
01
11
=aa
T
, e a nova função pode ser escrita, como
Derivando em relação a a
1,
Fazendo esta igual a zero,
A matriz unitária I foi inserida na equação 2.28 de modo que o termo entre
colchetes é da mesma ordem, isto é (p x p). Agora temos um passo crucial no
argumento. Se a equação 2.28 possui solução não trivial para a
1
, então )( I
λ
Σ deve
ser uma matriz singular. Deste modo
λ
deve ser escolhido de forma que
0=
ii
x
g
x
f
λ
(2.23)
])([)()( cxgxfxL
=
λ
(2.24)
0=
x
L
(2.25)
]1[)(
11111
Σ= aaaaaL
T
T
λ
11
1
22 aa
a
L
λ
Σ=
(2.27)
(2.26)
0)(
1
=
Σ
aI
λ
(2.28)
15
Assim, uma solução não nula para a equação 2.28 existe, se e só se,
λ
é um
autovalor de Σ . De modo geral Σ tem p autovalores, que deverão ser todos positivos, já
que Σ é semidefinida positiva (ver eq. 2.4, 2.5 e 2.8). Supondo que os autovalores são
p
λ
λ
λ
...,
,2,1
, e que estes são distintos e obedecem a
p
λ
λ
λ
>>> ...
21
, então
escolheremos um desses valores para determinar a primeira componente principal,
efetuando o cálculo da variância
Como nós queremos maximizar esta variância, escolhemos
1
λ
. Então, de posse
da equação 2.30, a componente principal, a
1
, que nós estávamos procurando, deve ser o
autovetor correspondente de Σ para o maior autovalor
A segunda componente principal, isto é Y
2
= a
2
T
X , é obtida pelos mesmo
argumentos anteriores, adicionando a restrição a
2
T
a
2
– 1 = 0 , que asseguramos que Y
2
será não correlacionada com Y
1
. Assim
Devemos exigir que esta seja nula, mas desde que
11
aa
λ
=
Σ
, é equivalente a
impor que a
1
e a
2
sejam ortogonais.
Com o objetivo de maximizar a variância Y
2
, isto é a
2
T
a
1
, estamos sujeitos a
duas restrições. Então será necessário o uso de dois multiplicadores de Lagrange, que
iremos escrever como
λ
e
δ
, considerando:
0=Σ I
λ
Eq. 2.29
11
1
)( aaXaVar
T
T
Σ=
11
Iaa
T
λ
=
λ
=
(2.30)
),()(
12
21
XaXaCovYYCov
TT
=
)
)
12
aXXa
TT
µµ
=
TT
aa
12
Σ=
(2.31)
1222222
]1[)( aaaaaaaL
T
T
T
δλ
Σ=
(2.32)
16
e seguindo o mesmo raciocínio para Y
1
encontramos Y
2.
No ponto estacionário, teremos.
multiplicando por a
1
T
chegamos a:
pois a
1
T
a
2
= 0 . Pela eq. 2.31, vemos que 0
21
=Σ
TT
aa , tal que
δ
se anule no ponto
estacionário. Assim eq 2.33 se torna
E desta vez devemos escolher
2
λ
, o segundo maior autovalor. Seguindo os
mesmos argumentos podemos encontrar a j-ésima componente associada ao j-ésimo
maior autovalor.
Isso resume o procedimento utilizado para o calculo das PCs, mas é importante
ressaltar que maiores refinamentos e outras informações desse método não foram aqui
apresentadas para não desviar o foco desse trabalho, mas podem ser encontradas na
ampla literatura sobre o assunto.
12
2
)(2 aaI
a
L
δλ
Σ=
(2.33)
02
21
=Σ
δ
aa
T
(2.34)
0)(
2
=
Σ
aI
λ
(2.35)
17
2.2. Redes neurais artificiais [3, 4, 5, 6]
2.2.1. Neurônios Biológicos
O neurônio é a célula responsável por todas características conhecidas dos seres
vivos inteligentes (automatismo, decisões, adaptação ao ambiente, adaptação do
organismo etc). Eles formam todos os sistemas nervosos conhecidos, estando presentes
em nosso cérebro em uma grande quantidade da ordem de 10
11
, com cerca de 10
15
conexões entre eles. Como qualquer célula biológica, um neurônio é constituído por um
corpo celular, ou soma, de onde se estendem ramificações (dendritos) formando a
árvore dendrítica. Está célula possui um prolongamento fino e longo, único, chamado
axônio, que pode ainda apresentar ramificações (Figura 2.1).
Figura 2.1 – Neurônio biológico
No soma acontecem os processos metabólicos da célula nervosa em que os
estímulos eletroquímicos “somam-se”, gerando um pulso que poderá ser transmitido
para outra célula. O axônio, conhecido também como fibra nervosa, tem a função básica
de propagar informação por meio de pulsos nervosos sem atenuações. Os dendritos
cobrem um volume muitas vezes maior que o próprio corpo celular e formam
complexas árvores dendríticas, responsáveis pela recepção do neurônio. As conexões
entre os dendritos e o axônio são chamadas sinapses e são as grandes responsáveis pela
comunicação das células.
As sinapses (Figura 2.2) estão entre duas membranas celulares, a membrana pré-
sináptica (do axônio) e a pós-sináptica (do dentrito), sendo estas regiões
18
eletroquimicamente ativas. Um estímulo nervoso chega de outra célula na membrana
pré-sináptica sendo transferido à membrana dentrital através de neurotransmissores,
produzindo uma alteração do potencial elétrico da membrana pós-sináptica.
Dependendo do tipo de neurotransmissores, as sinapses podem se classificar quanto à
sua natureza inibitória, caso sua função seja no sentido de inibir a formação do pulso
elétrico (potencial de ação), ou exitatória, caso seja de facilitar a formação do pulso.
Figura 2.2 – Conexão sináptica
A produção do potencial de ação começa no axônio ou fibra nervosa de um
neurônio, que é um tubo filamentar delimitado por uma membrana celular. Sem a
presença de impulso nervoso, o interior da membrana tem uma concentração de íons de
potássio que, junto com a concentração dos íons de sódio no exterior, cria um potencial
eletronegativo de algumas dezenas de milivolts em relação ao exterior, conhecido como
potencial de repouso da membrana. A permeabilidade aos íons de potássio é muito
maior do que aos íons de sódio, aparecendo uma corrente maior de íons do interior da
membrana para seu exterior do que no sentido contrário, processo este conhecido como
bomba de sódio. Esse processo cria uma diferença de concentração de íons dos dois
lados da membrana que sustenta o potencial de repouso.
Quando um impulso nervoso de duração T
n
ocorre no axônio, ele despolariza a
membrana, ou seja, diminui o potencial da membrana em relação ao potencial de
repouso. Se esta despolarização for suficientemente grande para ultrapassar um
determinado valor limiar de disparo, há a formação de um potencial de ação na
membrana axonal (Figura 2.3), evento este que determina a geração e propagação de um
pulso nervoso na célula. Após a despolarização, a membrana entra no período que
conhecemos como período de refração absoluta (T
a
), em que a membrana não tem
condições de produzir outro potencial de ação, independente da intensidade da
19
despolarização. Logo após a célula passa por um período de refração relativa (T
r
) em
que há uma elevação no limiar de disparo, que depois retorna ao seu valor normal.
Durante este último período, se tivermos uma intensidade de despolarização muito
intensa, podemos produzir outro potencial de ação.
Figura 2.3 – potencial de ação
O potencial de ação é provocado no axônio pela soma de todos os estímulos
excitatórios e inibitórios que chegam à árvore dentrital do neurônio. Este fenômeno tem
sido denominado como a integração espacial-temporal dos estímulos pelo neurônio.
Uma representação esquemática desta integração é observada na fig. 2.4, onde
tomamos um neurônio com seis entradas A,B,C,D,E e F e uma saída H, sendo a entrada
B inibitória e as demais excitatórias. Os impulsos chegam a estas entradas nos instantes
t1, t2, t3, t4, t5 e t6. O potencial pós-sináptico (PPS) no topo do axônio em G cruza o
limiar de disparo após a chegada do quinto pulso na sinapse excitatória E no instante t5,
e o axônio responde com um potencial de ação. Com a chegada subseqüente de um
pulso excitatório em F, o PPS em G permanecerá acima do limiar por um tempo
suficiente para o disparo, em sucessão, de dois novos potenciais de ação.
T
a
T
n
T
r
ms
mV
-80
-60
+40
0
20
Este resultado apresentado na Figura 2.4 permite estabelecer um modelo de
primeira ordem para o neurônio biológico, segundo o qual a freqüência média de
impulsos nervosos em um intervalo de tempo T representa a integração espacial-
temporal de toda atividade da árvore dentrital, isto é:
onde os
()
tw
i
representam os pesos das entradas na sinapse, os
()
tx
i
as entradas do
neurônio e a função
()
vg é freqüentemente referida como função de ativação do
neurônio. Esta função possui características indicadas na Figura. 2.5, entre as quais
estão o comportamento monotônico sobre uma faixa do argumento
v, conhecida como
faixa dinâmica e a saturação fora desta faixa.
+
-
+
+
+
+
A
D
C
E
B
F
t1
t4
t2
t5
t3
t6
axônio
Corpo celular
ou soma
H
G
Limiar de disparo
Potencial pós-sináptico(PPS)
no topo do axônio (G)
Figura 2.4 – Representação esquemática da integração espacial-temporal
dos estímulos por um neurônio
() ()
=
T
i
iiT
dttxtwgf
(2.36)
21
f
max
freqüência
de pulsos
depolarização
da membrana
limiar
Figura 2.5 – Relação entre a freqüência de pulsos de um neurônio e a
intensidade do estímulo de longa duração.
Existem várias funções que se aproximam da função de ativação tentando
manter estas características com maior ou menor fidelidade. Na Figura 2.6
apresentamos algumas destas funções.
Figura 2.6 – Funções mais comumente empregadas como funções de ativação na
modelagem de neurônios.
-2 0 2
-2
0
2
)tanh()( vvg
α
=
1=
α
6=
α
0,0 0,5 1,0 1,5 2,0
-0,5
0,0
0,5
1,0
1,5
(
)
ααα
5.0/)( += vvvg
8=
α
3=
α
-2 0 2
-2
0
2
1=
α
vvg
α
=)(
-2 0 2
-2
0
2
)()( vhvg
=
reta degrau
siebert
tanh
22
2.2.2 O Neurônio Artificial
A modelagem dos neurônios corresponde à especificação da estrutura e
funcionamento do operador neurônio, também chamado Neurônio Artificial. O modelo
de Neurônio Artificial foi introduzido em 1943 por McCulloch e Pitts [5], embora seja
rudimentar quando comparado aos modelos hoje disponíveis.
O neurônio artificial é uma estrutura lógico-matemática que procura simular a
forma, o comportamento e as funções de um neurônio biológico. Assim sendo, os
dendritos foram substituídos por entradas, cujas ligações com o corpo celular artificial
são realizadas através de elementos chamados de pesos, simulando as sinapses. Os
estímulos captados pelas entradas são processados pela função de soma e o limiar de
disparo do neurônio biológico foi substituído pela função de ativação.
Figura 2.7 – Representação de um neurônio artificial por diagrama
de
blocos.
O neurônio da Figura 2.7 é um exemplo de discriminador linear que é definido
como um neurônio com n entradas e uma saída. A função de um discriminador linear é
separar de um grupo dois subgrupos, que estariam aglomerados pelas suas
funcionalidades existentes. Esta separação se dá por um hiper plano que separa o espaço
de R
n
. Quando esta operação é possível, dividindo o grupo em dois subgrupos, o grupo
é chamado linearmente separável.
+
)(vgY =
wxv
=
1
w
n
w
2
w
1
x
2
x
n
x
23
2.2.3 Perceptrons
No final da década de 50, Rosenblatt, apoiando-se nas idéias de McCullooch e
no fato de que neurônios iguais conectam-se uns aos outros através de sinapses, criou
uma rede de múltiplos neurônios artificiais do discriminador linear, que denominou
Perceptron.
Um perceptron é uma rede com uma topologia como a representada na Figura
2.8. Apresenta os neurônios dispostos em várias camadas, sendo a primeira camada a
camada de entrada, a última camada a camada de saída e as camadas do meio as
camadas ocultas. Tem como característica mais importante a capacidade de
aprendizado.
Para isto, é necessário estipular um algoritmo que determine os valores dos
ganhos de modo que, para uma determinada entrada, a rede forneça a saída conhecida a
priori. Deste modo, a partir de ganhos iniciais aleatórios, estabelece-se uma correção
para que os mesmos garantam a saída desejada.
Figura 2.8 - Rede neural multicamada
1,0
x
2,0
x
0,0 j
x
1,1
U
Mm =
2,1
U
1,1 j
U
2,2
U
1,2
U
2,2 j
U
2
=
m
11,
YU
M
=
1=m
jMjMM
YU
=
,
22,
YU
M
=
24
2.2.3.1 Princípio de aprendizado de Hebb
Hebb, em 1949, estudando o comportamento de animais, propôs um princípio
pelo qual o aprendizado em sistemas nervosos complexos poderia ser reduzido a um
processo puramente local, em que a intensidade das conexões sinápticas é alterada
apenas em função dos erros detectáveis localmente.
Analisando o funcionamento de um neurônio ligado a outro sinapticamente,
podemos interpretar “
AB
w
” como o ganho da sinapse entre o neurônio “A” e o neurônio
B”, “
A
x ” como a intensidade do processo no axônio “A” e “
B
y ” como a resposta do
dentrito de “B”. Em cada passo do processo de aprendizagem, o ganho “
AB
w ” é alterado
de uma quantidade “
AB
w
”.
Este princípio pode ser aplicado, com as devidas adaptações, a um discriminador
linear no processo de correção dos ganhos “w ”, de modo a garantir convergência da
saída para o valor desejado. Matematicamente isso pode ser expresso como:
Assim a alteração do i-ésimo parâmetro depende somente do produto da i-ésima
entrada pelo erro de saída. Na equação 2.38 “
y
” é a saída da rede com os “w” velhos
do discriminador, “
d
y ” a saída desejada e o parâmetro “
η
”representa a taxa de
aprendizado.
i
velho
i
novo
i
www +=
(
)
.
i
d
i
xyyw =
η
(2.37)
(2.38)
25
2.2.3.2 Implementação de Funções Booleanas (utilizando linguagem Fortran)
O neurônio de McCulloch pode ser descrito como um caso particular de um
discriminador linear e assim pode implementar funções booleanas. Para funções
booleanas como as funções “E” e “OU” poderemos usar neurônios simples, como
discriminadores lineares, para implementá-las.
Figura 2.9 – Funções booleanas de 2 variáveis representadas num
espaço euclidiano onde as bolinhas pretas representam uma saída
igual a um, as bolinhas brancas zero e dentro dos parênteses estão as
entradas. E fácil verificar que a função booleana XOR (OU exclusiva)
não é linearmente separável, pois não existe um único plano capaz de
separar os pontos em regiões distintas, associadas aos valores zero ou
um.
Entretanto para a função booleana XOR (OU exclusiva) existe um problema:
não é possível a implementação desta função por um único neurônio, já que esta não é
uma função não linearmente separável. No entanto, este problema pode ser contornado
utilizando-se uma rede de neurônios (2 ou 3) tal que, associando as funções “E” e
“OU”, chega-se à representação desejada.
26
Figura 10 – Duas alternativas de uma rede neural que implementa a função XOR.
Cada neurônio funciona como um discriminador linear tornando possível a
separação dos resultados em dois grupos com duas ou três retas.
X1
F1
F2
X2
F2
F1
X1
X2
F3
N3
N3
N1
N1
N2
27
2.2.3.3 Aprendizado por Retropropagação de Erro
Na mesma época em que Frank Rosenblatt desenvolveu os perceptrons, Widrow
desenvolveu um outro modelo generalizado multidimensional, criando uma nova regra
de aprendizagem, chamada de Regra Delta de Widrow. A partir deste modelo,
Rummelhart, Hinton e Willians (RHW) generalizam esta regra chamando-a de Regra de
Delta Generalizada ou Backpropagation (Retropropagação do Erro). Este algoritmo
passou a ser aplicado em funções de ativação contínuas como a tangente hiperbólica.
A regra delta generalizada consiste em obter o ponto de mínimo através de um
processo de iteração local, basicamente na minimização do erro quadrático carregado
pelas correções dos ganhos. Este método também é conhecido como método do
gradiente e foi proposto por Windrow.
Figura 11 – Representação de um neurônio artificial (RHW).
Para fazermos as correções nos pesos pelo método do gradiente, vamos partir de
um ponto arbitrário
)0(w
r
(vetor peso de parâmetros iniciais do neurônio) e caminhar
pela superfície da função erro
)(wE
r
(equação 2.39) na direção e sentido do ponto de
mínimo.
Para andarmos na direção do mínimo do erro quadrático médio temos que
calcular o gradiente da função
)(wE
r
. Fazendo
xwv
r
r
=
, temos
, (2.40)
. (2.39)
() ( )
2
1
2
1
,
1
2
)()(
∑∑
===
=
==
L
l
d
l
L
l
d
l
n
i
d
lii
L
l
d
ll
yxwgyxwgyywE
r
v
r
()
()
()
()
(
)
(
)
∑∑∑∑
==
=
=
L
l
n
i
i
d
lii
d
l
L
l
n
i
i
d
lw
i
dw
xwd
dv
vgd
yvgi
dw
vgd
yvgwE
1
,
1
ˆ
)(
)(2
ˆ
)(
)(2)(
r
r
+
)(vgY =
xwv
r
r
=
1
w
n
w
2
w
1
x
2
x
n
x
28
onde
Então temos a regra delta generalizada:
Escrevendo para cada componente temos:
onde o parâmetro
η
nos dá a velocidade com que vamos para este mínimo. Este
parâmetro não poderá ser grande, pois caso contrário não teremos garantia de que nos
aproximaremos do mínimo, devido ao fato de podermos ficar oscilando próximo do
mínimo sem nos aproximarmos dele.
Nas equações (2.47)a (2.59) temos:
W é a matriz peso;
M é número da última camada;
m é o número da camada;
J
m
é o número de neurônios da camada m;
j
m
é o neurônios da camada m;
L é o número de exemplos;
l é o número do exemplo.
, (2.41)
. (2.42)
(2.43)
. (2.44)
, (2.46)
()
()
(
)
==
=
=
L
l
d
ll
L
l
d
l
d
llw
xx
dv
vgd
yywE
11
2
)(
2)(
rrr
r
δ
(
)
(
)
dv
vgd
yy
l
d
ll
)(
=
δ
()
)(
2
)()1( wEkwkw
w
r
r
rr
=+
η
=
=+
L
l
d
ll
xkwkw
1
)()1(
v
rr
δη
=
=+
L
l
d
lilii
xkwkw
1
,
)()1(
δη
29
Assim,
Minimizando o erro para os parâmetros da camada de saída,
)1(,, MjjMM
w ,
teremos as correções
)1(,,
MjjMM
w , que são:
Definimos
(248)
. (2.49)
. (2.54)
(2.53)
(2.52)
(2.51)
(2.50)
()
∑∑ ∑∑
=
=
==
L
l
JM
jM
d
ljMM
MJ
Mj
d
lMjMMjjMM
L
l
JM
jM
d
ljMMljMM
yuwgyyWE
1
2
,,
)1(
)1(
),1(),1()1(,,
1
2
,,,,
)(
∑∑
=
=
L
l
JM
jM
d
ljMM
MJ
Mj
MJ
Mj
J
j
d
ljjjMjMjMMjjMM
yxwgwgwgWE
1
2
,,
)1(
)1(
)2(
)2(
0
0
,0,00,1,1)2(),1(),1()1(,,
)( LL
(
)
)1(,,
)1(,,
)(
2
=
MjjMM
MjjMM
dw
WEd
w
η
(2.47)
()
(
)
=
=
L
l
d
lMjM
jMM
jMM
ljMM
d
ljMMMjjMM
u
dv
vgd
yyw
1
),1(),1(
,
,
,,,,)1(,,
)(
η
()
(
)
jMM
jMM
ljMM
d
ljMMljMM
dv
vgd
yy
,
,
,,,,,,
)(
=
δ
=
=
L
l
d
lMjMljMMMjjMM
uw
1
),1(),1(,,)1(,,
δη
=
+=+
L
l
d
lMjMljMMMjjMMMjjMM
ukwkw
1
),1(),1(,,)1(,,)1(,,
)()1(
δη
(
)
jMM
jMM
y
ljMMljMM
dv
vgd
,
,
,,,,
)(
δδ
=
d
lMjMljMMMjjMMMjjMM
ukwkw
),1(),1(,,)1(,,)1(,,
)()1(
+=+
ηδ
30
Minimizando o erro para os parâmetros das camadas ocultas,
)1(,, mjjmm
w
, pelo
método do gradiente, teremos as correções
)1(,,
mjjmm
w , que são:
onde
então
Com os estudos realizados nesta seção podemos aplicar o algoritmo de
Retropropagação do Erro (Backpropagation) que nos permite fazer a implementação
de uma rede com qualquer número de entradas, saídas, camadas ocultas e neurônios por
camadas, treiná-la e utilizá-la.
. (2.59)
(2.58)
, (2.57)
, (2.56)
(2.55)
=
=
L
l
d
lmjmljmmmjjmm
uw
1
),1(),1(,,)1(,,
δη
(
)
)1(,,
)1(,,
)(
2
=
mjjmm
mjjmm
dw
WEd
w
η
(
)
jmm
jmm
mJ
mj
jmmjmlmjmljmm
dv
vgd
w
,
,
)1(
)1(
),1(),1(),1(),1(,,
)(
=
+
+
++++
δδ
=
+=+
L
l
d
lmjmljmmmjjmmmjjmm
ukwkw
1
),1(),1(,,)1(,,)1(,,
)()1(
δη
d
lmjmljmmmjjmmmjjmm
ukwkw
),1(),1(,,)1(,,)1(,,
)()1(
+=+
ηδ
31
Referências
1. Chatfield C. and Collins ªJ. “ Introduction to Multivariate Analysis” (Cambrigde
University press, Cambridge (1980)).
2. LA Rezende; PMVB Barone; “ Estrutura Eletrônica de Hidrocarbonetos Aromáticos
Heterociclicos”; Dissertação de Mestrado, DF/UFJF. Juiz de Fora, 2002.
3. Kovács, Zsolt László, Redes Neurais Artificiais: Fundamentos e Aplicações, 3.ed.,
São Paulo: Editora Livraria da Física, 2002.
4. Sato, F.; Galvão D.S.; “Estudo da Estrutura-atividade das Esterilquinolonas e
Tetraciclinas Através de Descritores Quânticos”; Tese de Doutorado, Departamento de
Física Aplicada – DFA, Instituto de Física Gleb Wataghin – IFGW, Universidade
Estadual de Campinas – UNICAMP;
5. Abreu, J.F.F.; Barone, P.M.V.B.; “Redes Neurais Artificiais e Aplicações” ”,
Monografia de Bacharelado, DF/UFJF, Juiz de Fora, 2000;
6. Beale, R, e Jackson, T, Neural Computing: An Introduction, Institute of Physics
Publishing, Bristol and Philadelphia, 1992;
32
Capítulo 3 – Metodologia utilizada
Para se conseguir uma boa relação entre esforço computacional e precisão dos
dados, escolhem-se os métodos semi-empíricos para o cálculo das propriedades
eletrônicas, os quais substituem algumas integrais por parâmetros empíricos, ao invés de
resolvê-las, uma vez que, para os métodos ab initio (de primeiros princípios), temos um
alto custo computacional devido ao número de integrais, correspondentes às interações
entre pares de elétrons, crescer rapidamente com o tamanho das moléculas. De estudos
anteriores em compostos orgânicos a partir de métodos semi-empíricos, os
desenvolvidos a partir do MNDO (Modified Neglect of Differential Overlap), como o
PM3 e o AM1, são extensivamente utilizados na literatura. O método PM3 obteve os
melhores resultados em compostos biológicos planares [01-05].
Com o pacote computacional HyperChem [06] foram construídas e pré-
otimizadas as estruturas dos compostos estudados. A partir destas estruturas, o sistema
CAChê [07], que possui o MOPAC [08] incorporado, foi utilizado para otimizar as
mesmas, percorrendo uma vasta região de espaços de parâmetros, visto que pequenas
alterações nas estruturas podem causar significativas mudanças nas propriedades
eletrônicas.
Com essa estrutura, otimizamos a molécula novamente no programa HyperChem,
para obtermos arquivos de saída na extensão *.zmt para cada estrutura. Esses arquivos
foram utilizados para entrada de dados para o sistema Chem2Pac (sistema
computacional que controla uma série de outros programas para a edição e visualização
de estruturas moleculares e para o cálculo de estrutura eletrônica através de métodos
semi-empíricos). O principal objetivo é o de auxiliar o preparo de arquivos provenientes
do HyperChem pra que estes possam ser processados pelo pacote MOPAC.
Entre as funções do Chem2Pac, destaca-se a função de efetuar o cálculo da
LDOS automaticamente. Essa foi a grande importância do sistema para este trabalho.
Para automatizar a coleta dos dados foi utilizado o programa Controle de Arquivos [05]
que funciona percorrendo os dados do arquivo de saída do Chem2Pac e organizando-os
em forma de uma tabela.
Utilizamos a metodologia de PCA com o objetivo de reduzir a grande
quantidade de dados baseados nos descritores eletrônicos utilizados pela Metodologia
de Índices Eletrônicos (MIE) [09] para um número menor de parâmetros. O método foi
33
utilizado através do programa Ein*Sight, um sistema de análise de dados multivariados,
baseando-se nos métodos estatísticos PCA e HCA (da sigla em inglês para Análise de
Agrupamentos Hierárquicos). Os dados do PCA foram auto-escalados, utilizando as
médias dos valores de cada variável como zero e o desvio padrão correspondente como
unidade, evitando possíveis efeitos artificiais em que alguma variável dominasse a
análise em função de seu valor absoluto elevado. Primeiro foram analisados os gráficos
de cada variável em relação à atividade biológica, observando quais variáveis
produziam melhor separação e quais moléculas apresentavam maior erro. Foram
também analisados os gráficos de cada variável em relação a outra, nos fornecendo qual
par de variáveis apresentava uma possível contribuição para a separação. A partir destes
dados preliminares, modificamos as escolhas das variáveis para o cálculo de PCA até
obtermos uma separação das estruturas com uma boa variância para as variáveis. Assim
chegamos nas variáveis mais relevantes para a classificação destas estruturas.
Classificamos as estruturas utilizando o método RNA, implementado
pelo programa PSDD [10] de distribuição livre com código aberto, com estas variáveis.
Para esta classificação escolhe-se uma parte do grupo das estruturas com atividade
conhecida. Esta escolha para o treinamento da rede é feita por meio de uma varredura
em várias moléculas até a obtenção de um resultado satisfatório, medido através da
verificação do índice de acerto para o restante das estruturas com atividade conhecida.
Com a rede treinada, é feita predição da atividade das estruturas com atividade
desconhecida.
Paras as elipticinas foi feita apenas a classificação com RNA, pois outros
métodos de classificação já haviam sido utilizados em trabalhos anteriores [11, 12].
34
Referências
01. MC Zener, in Reviews in computational Chemistry (VCH Publishers, N.Y., 1991),
KB Lipkowitz, DB Boyd (Eds.) p 313;
02. LYA Dávila and MJ Caldas J. Comput. Chem. 23, 1135 (2002);
03. MF Budyka, TS Zyubina and AG Ryabenko J. Quantum Chem 88, 625 (2002);
04. P Scano, and C Thompson, J Comp Chem 12, 172 (1991);
05. PMVB Barone, A Camilo Jr, and DS Galvão, Syntetic Metals 102, 1410 (1999);
06. HyperChen, versão 5.0, HyperCube, INC., Gainesville, FL 32601, USA;
07. Cache 5.0, fujitsu Limited, Chiba City, Chiba 2618588, japan;
08. MOPAC program, version 6.0, Quantum Chemistry Exchange No 433;
09. Coluci, V.R.; Braga, S.F.; Vedrame, R.; Barone, P.M.V.B.; Galvão, D.S.; Teoria
eletrônica do câncer e a origem da vida: base para o desenvolvimento de parâmetros
“universais” para métodos de estrutura-atividade; VIII Escola Brasileira de Estrutura
Eletrônica, VIII (2002) 202-223, Juiz de Fora - MG;
10. H.Ichikawa, PSDD: Perceptron-type Neural Network Simulator, QCPE 615,
Indiana, USA;
11. Scheila F. Braga, Louraine C. de Melo e P. M. V. B. Barone, J. Mol. Struct.
(Theochem) 710 (2004) 51-59.
12. Louraine C. de Melo, Scheila F. Braga e P. M. V. B. Barone, submitido.
35
Capítulo 4 – Elipticinas
4.1 Introdução
Recentemente, foram estudados [1] a geometria, as propriedades eletrônicas, os
espectros de absorção e a densidade local de estados eletrônicos de 40 derivados da
elipticina, utilizando os métodos semi-empíricos PM3 e ZINDO/S-CI. Todas as
moléculas estudadas possuem um núcleo em comum (Figura 4.1.). Dessas 40
moléculas, 25 eram moléculas com indicadores atividade antitumoral
experimentalmente conhecido e 15 ainda não testadas.
A elipticina (5,1-dimetil-6H-pyrido[4,3]carbazole), molécula orgânica planar
aromática, foi isolada pela primeira vez em 1959 [3] de folhas da planta Ochrosia
elliptica, tendo sua atividade biológica, assim como a de alguns derivados, evidenciada
em 1967 durante estudos sobre atividade anticancerígena de algumas plantas [4]. O
alcalóide elipticina é um composto orgânico que possui uma estrutura planar simples,
cujo núcleo é composto da metade de um carbazol ligado a um anel de piridina (Figura
4.1). Sua atividade no tratamento quimioterápico contra vários tipos de câncer como a
leucemia mieloblástica, adenocarcinoma, câncer de mama e alguns tumores sólidos,
associada aos efeitos colaterais limitados e à ausência de toxidade hematológica [5],
reforçam o interesse por suas propriedades biológicas.
As estruturas básicas dos 40 derivados da elipticina e compostos análogos
olivacina e isoelipticina incluídos neste trabalho são apresentas das na Figura e na
Tabela 4.1. As olivacinas, E32 a E37, diferem da elipticina somente pela troca do grupo
metil da posição R11 para R1. As isoelipticinas, E38 a E40, são derivados com um
átomo de nitrogênio em uma posição diferente no anel piridínico – ver Tabela 1.
Figura 4.1 - Núcleo comum das elipticinas
R5
R11
R1
R2
R3
R4
R6
R7
R9
R8
R10
N
N
36
n
o
Nomenclatura R
1
R
2
R
4
R
6
R
7
R
8
R
9
R
10
A.A
E01 Elipticina H - H H H H H H A
E02 9-aminoelipticina H - H H H H NH
2
H I
E03 9-hidroxielipticina H - H H H H OH H A
E04 7-hidroxielipticina H - H H OH H H H I
E05 9-metoxielipticina H - H H H H OCH
3
H A
E06* elipticinium H CH
3
H H H H H H A
E07* 2N-metil, 9-
hidroxielipticina
H CH
3
H H H H OH H A
E08* 2N-metil, 1-metil,
elipticina
CH
3
CH
3
H H H H H H A
E09* 2N-metil, 6N-metil,
elipticina
H CH
3
H CH
3
H H H H A
E10* 2N-metil, 6N-metil, 9-
hidroxielipticina
H CH
3
H CH
3
H H OH H A
E11 9-hidroxi-6-metilelipticina H - H CH
3
H H OH H A
E12 6-metilellipticina H - H CH
3
H H H H A
E13 9-metoxy-1-
aminoellipticina
NH
2
- H H H H OCH
3
H A
E14 9-bromoellipticina H - H H H H Br H I
E15* 7-hidroxy-2-
metilellipticinium
H CH
3
H H OH H H H I
E16* 9-metoxy-2-
metilellipticinium
H CH
3
H H H H OCH
3
H A
E17* 9-hidroxy 7-
metilellipticinium
H CH
3
H H CH
3
H OH H A
E18* 9-hidroxy 8,10-
dimetilellipticinium
H CH
3
H H H CH
3
OH CH
3
I
E19* 9-hydroxy-2-
(2detilamino)etilellipticiniu
m
H DEAEt H H H H OH H A
E20* 2-etil-9-hidroxyellipticina H CH
2
CH
3
H H H H OH H A
E21 9-metoxy-6-
metilellipticina
H - H CH
3
H H OCH
3
H -
E22 11-demetil-1-CHO-9-
metoxyellipticina
CH
O
- H H H H OCH
3
H -
E23 11-demetil-1-CH
2
OH-9-
metoxyellipticina
CH
2
OH
- H H H H OCH
3
H -
E24 6-etilellipticina H - H CH
2
CH
3
H H H H -
E25 9-metilellipticina H - H H H H CH
3
H -
E26 7-metilellipticina H - H H CH
3
H H H -
E27 11-demetil-9-
hidroxyellipticina
H - H H H H OH H -
E28* 4-HO-9-metoxy-2-
metilellipticinium
H CH
3
HO H H H OCH
3
H -
E29* 4-CO
2
CH
3
-9-metoxy-2-
metilellipticinium
H CH
3
CO
2
CH
3
H H H OCH
3
H -
E30* 9-metil-2-metilellipticinium H CH
3
H H H H CH
3
H -
E31* 2-CH
2
OCH
3
ellipticina H CH
2
OCH
3
H H H H H H -
E32 Olivacina CH
3
- H H H H H H I
E33 7-hidroxyolivacina CH
3
- H H OH H H H I
E34 9-hidroxyolivacina CH
3
- H H H H OH H A
E35* 9-hidroxy-2-
metilolivacinium
CH
3
CH
3
H H H H OH H A
E36* 9-hidroxy-2,8,10-
trimetilolivacinium
CH
3
CH
3
H H H CH
3
OH CH
3
A
E37 9-metoxyolivacina CH
3
H H H H H OCH
3
H -
E38 3N-isoellipticina ** H H H H H H H H -
E39 1N-11demetil-
2,4dimetilellipticina **
H CH
3
CH
3
H H H H H -
E40 4N-ellipticina ** H H - H H H H H -
Tabela 4.1 – Elipticinas e derivados estudados no presente trabalho. O número do radical se
refere à estrutura da figura 4.1.; * moléculas de cadeia aberta; ** o número que precede o
símbolo N indica a posição onde o átomo de nitrogênio está ligado no átomo de carbono no anel
piridínico. Os dados da atividade antitumoral (A.A) são adaptados para a escala de Cavaliere e
índice IC
50
experimental. A e I referem-se a moléculas ativas e inativas respectivamente.
37
Para o estudo da LDOS, foram selecionadas diversas regiões no núcleo das
elipticinas e seus derivados. Neste trabalho focalizamos duas regiões, a região D,
referente ao átomo de carbono na posição R9 e região B, referente ao anel piridínico [1].
A classificação quanto à atividade antitumoral, em trabalhos recentes [1, 2],
utilizou os seguintes métodos de reconhecimento de padrões:
Análise de Momento de Dipolo e Potencial Eletrostático Molecular
Metodologia de Índices Eletrônicos (MIE)
Principal Component Analysis (PCA)
Hierarchical Clustering Analysis (HCA)
Os resultados destes estudos mostraram a correlação de alguns descritores
eletrônicos com a atividade antitumoral das drogas [1, 2].
No presente trabalho, o método RNA foi utilizado para identificar as moléculas
da família das elipticinas quanto à sua atividade antitumoral e os resultados foram
comparados com os dos outros métodos, anteriormente utilizados.
38
4.2. Metodologia
Na classificação das elipticinas por meio de redes neurais, utilizamos uma rede
do tipo perceptron com 3 camadas: de entrada, oculta e de saída. A rede ainda possui os
seguintes parâmetros iniciais (Tabela 4.2):
camada neurônios k n
θ
1 8
2 15 2 0.10 0.0001
3 2 15.5 0.05 0.0001
Tabela 4.2 - Parâmetros iniciais das RNA.
k : parâmetro da função sigmóide (equação 4.1).
()
)exp(1
1
)(
υ
υ
k
f
+
= (
4.1)
O valor de k é um parâmetro não linear da função sigmóide que, quanto maior,
faz com que ela convirja mais rapidamente para zero ou um. Então, como precisamos de
resultados claramente distintos na camada de saída, o parâmetro k desta camada deve
ser bem maior que o da camada oculta.
η
: é um parâmetro que dá a taxa de aprendizado, ou seja, determina um
peso para a correção dos ciclos de aprendizado do algoritmo backpropagation. O valor
de
η
não pode ser grande, pois isto poderia fazer com que, ao percorrermos a superfície
da função erro na direção do seu mínimo, passássemos pelo mínimo, oscilando em torno
dele sem o atingir; nem muito pequeno, pois isto aumentaria o custo computacional de
cálculo.
θ
: é o valor do limiar da função erro. O valor
θ
deve que ser bem
menor do que um, para garantir um aprendizado completo dos padrões utilizados.
O número de neurônios na segunda camada (ou camada oculta), não pode ser
muito pequeno, pois isto reduz a capacidade de resolução da rede, e nem muito grande,
visto que consome tempo considerável na fase de treinamento. A partir de testes e dados
39
encontrados na literatura [6], é aconselhável utilizar um número que se encontre entre o
número de neurônios da camada de entrada e seu dobro.
Na camada de entrada, o número de neurônios deve ser igual ao de propriedades
analisadas e, na terceira camada (ou camada de saída), teremos dois neurônios, visto que
nossa classificação indicará a molécula como ativa ou inativa, ou seja, se na saída
tivermos sinal no neurônio 1 e não tivermos no neurônio 2, a molécula é ativa e, se for o
contrário, inativa. O programa utilizado foi Perceptron Simulator for Drug Design
(PSDD) [6] de distribuição livre e código aberto.
No treinamento da rede foram utilizadas 25 elipticinas com atividade conhecida,
sendo sete inativas e dezoito ativas, com suas respectivas propriedades (Tabela 4.3 e
Tabela 4.4). As propriedades da Tabela 4.2 foram extraídas de cálculos reportados na
ref. [1], caracterizadas como as mais significativas para a atividade da droga com
relação à patologia estudada.
As propriedades globais, que se referem à molécula como um todo, são:
momento de dipolo (DM), gap de energia HOMO – (HOMO-1) (DH), área de superfície
aproximada (SAA), área de superfície (grid) (SAG), volume molecular (Volume),
energia de hidratação (HE), coeficiente de partição molecular água-octanol (Log P),
refratividade (Refrat), polarizabilidade (Polariz) e massa molecular (massa). Estas
propriedades foram calculadas usando o pacote computacional HyperChem com o
método PM3. As unidades são as utilizados pelo HyperChem.
Por outro lado, as propriedades que se referem a determinadas regiões
moleculares são: valor da LDOS na região D para o orbital LUMO (AnL(D)) e
diferença entre o valor da LDOS na região B para o orbital HOMO e o valor da LDOS
na região B para o orbital HOMO-1 (nH(B)).
40
Molécula DM DH AnL(D) nH(B)
E01 2.843 0.658 0.021 0.027
E02 2.884 0.808 0.023 0.035
E03 2.342 0.952 0.019 0.044
E04 2.608 0.669 0.034 0.067
E05 1.895 0.802 0.018 0.027
E06 1.984 1.131 0.025 0.076
E07 2.456 0.983 0.015 0.067
E08 1.862 1.087 0.020 0.098
E09 2.003 1.102 0.013 0.067
E10 2.868 0.967 0.008 0.059
E11 1.769 0.785 0.013 0.025
E12 2.840 0.636 0.020 0.024
E13 2.225 0.683 0.018 0.104
E14 2.852 0.692 0.029 0.029
E15 2.580 1.119 0.009 0.109
E16 1.330 0.980 0.015 0.063
E17 2.267 0.956 0.017 0.078
E18 2.222 0.979 0.017 0.073
E19 3.820 1.055 0.021 0.069
E20 2.618 1.004 0.017 0.065
E32 2.731 0.614 0.023 0.051
E33 1.728 0.402 0.028 0.068
E34 1.723 0.758 0.015 0.044
E35 0.979 1.094 0.020 0.086
E36 2.322 1.061 0.015 0.058
Tabela 4.3 - momento de dipolo (DM), gap de energia HOMO – (HOMO-1) (DH),
valor da LDOS na região D para o orbital LUMO (AnL(D)) e diferença entre os
valores da LDOS na região B para o orbital HOMO e o orbital HOMO-1 (nH(B)).
As propriedades da Tabela 4.4 foram incluídas no trabalho com o intuito de se
explorar a possibilidade de que variáveis classicamente utilizadas em estudos de
Relações Estrutura-Atividade tenham influência na classificação destas drogas.
41
Moléculas SAA SAG Volume HE Log P Refrat Polariz Massa
E01 336.05 435.72 732.4 -6.85 2.65 78.34 30.9 246.31
E02 339.79 452.12 767.69 -10.78 1.87 83.05 32.25 261.33
E03 340.03 444.45 751.79 -11.31 2.2 82.35 30.99 262.31
E04 332.39 438.99 750.11 -10.77 2.2 82.35 30.99 262.31
E05 391.72 477.57 808.28 -8.54 2.4 84.81 33.37 276.34
E06 383.57 469.19 794.23 -2.72 3.51 84.2 32.51 261.35
E07 400.09 479.51 815.57 -9.36 3.23 85.89 33.15 277.35
E08 401.13 479.68 826.87 -2.42 4.01 86.7 33.81 275.37
E09 412.25 486.41 831.98 -0.08 3.76 89.1 34.35 275.37
E10 429.16 497.16 853.36 -6.73 3.47 90.79 34.99 291.37
E11 381.32 460.41 790.2 -10.87 2.61 84.94 33.37 276.34
E12 364.49 450.23 769.64 -4.23 2.9 83.24 32.74 260.34
E13 370.93 489.73 836.31 -8.92 3.26 87.17 34.18 291.35
E14 381.67 465.14 793.17 -6.54 2.63 86.7 33.53 325.21
E15 392.81 478.88 813.6 -8.77 3.23 85.89 33.15 277.35
E16 439.85 510.62 870.01 -4.4 3.26 90.66 34.99 291.37
E17 431.93 501.92 862.66 -7.86 3.69 90.94 34.99 291.37
E18 449.53 512.47 891.25 -5.88 4.16 95.98 36.82 305.4
E19 530.24 598.45 1069.63 -7.82 3.89 113.41 43.68 362.49
E20 428.8 507.24 862.72 -8.84 3.57 90.64 34.99 291.37
E32 337.51 447.49 745.21 -4.42 1.74 75.23 30.36 246.31
E33 345.52 458.73 766.02 1.46 76.92 30.99 30.99 262.31
E34 354.78 458.14 767.43 -11.15 1.46 76.92 30.99 262.31
E35 406.93 480.87 818.85 -9.33 3.41 85.75 33.15 277.35
E36 457 516.74 902.21 -5.88 4.34 95.83 36.82 305.4
Tabela 4.4 - área de superfície aproximada (SAA), área de superfície (grid) (SAG),
volume molecular (Volume), energia de hidratação (HE), coeficiente de partição
molecular água-octanol (Log P), refratividade (Refrat), polarizabilidade (Polariz) e
massa molecular (massa).
Para o grupo de treinamento, é aconselhável usar cerca de um terço das
moléculas com atividade conhecida. Temos 25 moléculas com atividade conhecida,
dentre as quais selecionamos 7 que serviriam como padrão de treinamento, utilizando as
restantes para avaliar a capacidade de discriminação da rede. Como algumas moléculas
podem caracterizar melhor a atividade da molécula do que outras, procuramos aquelas
que permitiriam um melhor treinamento da rede. Para isto escolhemos aleatoriamente as
moléculas para o conjunto de treinamento e mudamos este conjunto para alcançar
melhor resultado no treinamento. Este treinamento também depende de quais
propriedades das moléculas utilizaremos e dos parâmetros iniciais que são k,
η
,
θ
e o
número de neurônios na segunda camada (ou camada oculta) (Tabela 4.2). Este
procedimento foi aplicado para os parâmetros da Tabela 4.3 e depois se juntou a esses
parâmetros um ou mais parâmetros da Tabela 4.4 até se obter um treinamento da rede
satisfatório.
Para o treinamento da rede utilizamos o programa PSDD [6] com o algoritmo
backpropagation, considerando o limiar do erro (
θ
) como 0,0001. Para isso foram
necessários 11107 ciclos.
42
4.3 Resultados
Nesta seção, apresentaremos os resultados obtidos para as propriedades
eletrônicas das estruturas estudadas, utilizando redes neurais artificiais descritas nos
capítulos anteriores.
Na primeira parte do treinamento usamos só as quatro primeiras propriedades
eletrônicas (Tabela 4.3) e treinamos a rede, fazendo logo depois, a verificação deste
treinamento. Esta verificação é feita com as moléculas que não foram usadas no
treinamento, observando o grau de acerto da rede treinada, pois só assim podemos
realmente ter uma confiabilidade no treinamento da rede. Este procedimento indicou
quais moléculas eram melhores para serem utilizadas como padrões no treinamento. Na
segunda etapa introduzimos uma a uma as novas propriedades adicionais (Tabela 4.4),
treinando a rede novamente e verificando o seu treinamento, para identificarmos qual
delas nos forneciam um bom treinamento. Depois começamos a agrupar as quatro
primeiras com duas ou mais propriedades adicionais.
Verificamos que, para o treinamento da rede, só as quatro propriedades
eletrônicas (Tabela 4.3) já eram suficientes para se ter um bom índice de acerto na
classificação das moléculas. Foram usadas sete moléculas como padrões no treinamento
e as dezoito restantes para a verificação dos resultados. Destas, apenas as moléculas E15
e E18 não foram corretamente classificadas. Entretanto, quando as novas propriedades
da Tabela 4.4 foram incluídas, verificamos que apenas SAG, Volume e Polarização são
relevantes para o treinamento, pois, apesar de não melhorarem o percentual de
confiabilidade da rede, o seu uso permitia que a rede se aproximasse mais de outros
métodos de classificação (como PCA, HCA, EIM - Ref. 2), quando aplicada ao grupo
de elipticinas com atividade experimental desconhecida.
Assim, o treinamento da rede foi feito com os parâmetros iniciais (Tabela 4.2),
com as propriedades eletrônicas da tabela 4.3 e com as três citadas da tabela 4.4, usando
as moléculas E01, E02, E06, E16, E19, E32 e E33 como padrões. É importante
ressaltar que temos que ter no conjunto de treinamento, necessariamente, moléculas
ativas e inativas, na proporção próxima de 1:1. O treinamento da rede é comparado com
resultados de outros métodos e com dados experimentais na Tabelas 4.5 e 4.6.
43
Molécula
Dados de saída dos
neurônios da camada de
saída
Padrão de
treinamento
Redes
Neurais
PCA HCA EIM Ref.1 A.A
E01
0.993 0.007
1 0 A I I I A A
E02
0.008 0.992
0 1 I I I I I I
E03
0.730 0.180
A A A A A A
E04
0.000 1.000
I I I I I I
E05
0.977 0.020
A A A A A A
E06
0.996 0.005
1 0 A A A A A A
E07
1.000 0.000
A A A A A A
E08
1.000 0.000
A A A A A A
E09
1.000 0.000
A A A A A A
E10
1.000 0.000
A A A A A A
E11
1.000 0.000
A A A A A A
E12
0.993 0.008
A I I A I A
E13
1.000 0.000
A A I A A A
E14
0.001 0.999
I I I I I I
E15
1.000 0.000
A A A A I I
E16
1.000 0.000
1 0 A A A A A A
E17
1.000 0.000
A A A A A A
E18
1.000 0.000
A A A A I I
E19
0.998 0.003
1 0 A A A A I A
E20
1.000 0.000
A A A A A A
E32
0.002 0.997
0 1 I I I I I I
E33
0.002 0.998
0 1 I I I I I I
E34
1.000 0.000
A A A A A A
E35
1.000 0.000
A A A A A A
E36
1.000 0.000
1 0 A A A A A A
Tabela 4.5 - Os melhores conjuntos de estruturas usadas como padrão. A segunda
e terceira coluna se refere ao sinal de saída dos dois neurônios da ultima camada
da rede neural treinada, para a segunda coluna >0.5 e para terceira <0.5 molécula
ativa (A) e no caso inverso molécula inativa (I).
comparando os métodos com os dados experimentais
PCA HCA EIM ref.2 RNA
incluindo todas
as estruturas
84 80 88 92 92
incluindo
apenas as 17
restantes
82,35 76,47 88,4 88,24 88,24
Tabela 4.6 – Porcentagem de concordância dos métodos com à atividade
experimental, incluindo todas as estruturas e incluindo apenas as estruturas que
não foram usados no treinamento da rede.
Após o treinamento, submetemos à rede neural as elipicinas com atividade
desconhecida experimentalmente, usando as propriedades eletrônicas e as adicionais
SAG, Volume e Polarização (Tabela 4.7 e tabela 4.8). Os resultados são apresentados na
Tabela 4.9.
44
molécula DM DH AnL(D) nH(B)
E21 1,852 0,779 0,015 0,023
E22 2,012 0,795 0,008 0,009
E23 2,901 0,776 0,015 0,031
E24 3,134 0,669 0,022 0,031
E25 2,932 0,684 0,025 0,029
E26 3,038 0,603 0,022 0,038
E27 2,012 0,774 0,015 0,022
E28 2,918 0,922 0,005 0,056
E29 2,461 0,844 0,008 0,059
E30 1,102 1,085 0,023 0,069
E31 2,32 1,121 0,024 0,066
E37 3,751 0,763 0,017 0,047
E38 2,667 0,756 0,022 0,032
E39 2,433 0,548 0,02 0,081
E40 1,691 0,668 0,021 0,08
Tabela 4.7 - momento de dipolo (DM), gap de energia HOMO – (HOMO-1) (DH),
valor da LDOS na região D para o orbital LUMO (AnL(D)) e valor da LDOS na
região B para o orbital HOMO menos o valor da LDOS na região B para o orbital
HOMO-1 (nH(B)).
Moléculas SAA SAG Volume HE Log P Refrat Polariz Massa
E21 421.02 489.86 844.66 -5.93 2.65 89.7 35.21 290.36
E22 395.46 490.64 823.73 3.86 2.18 86.39 33.46 290.32
E23 405.4 504.24 843.96 -12.06 0.94 83.39 33.47 292.34
E24 374.18 465.27 812.25 -3.93 3.24 87.99 34.57 274.37
E25 377.41 461.69 782.92 -5.76 3.12 83.39 32.74 260.34
E26 367.5 455.38 779.64 -5.59 3.12 83.39 32.74 260.34
E27 335.32 434.55 719.76 -14.61 1.9 75 29.7 248.28
E28 469.12 528.83 913.17 3.59 2.23 95.74 36.91 319.38
E29 514.69 576.72 795.17 -5.83 2.67 101.43 39.38 349.41
E30 425.56 498.18 844.93 -1.62 3.98 89.24 34.35 275.37
E31 439.21 519.02 876.92 -3.7 3.71 90.05 34.99 291.37
E37 397.66 490.66 821.83 -6.07 1.49 81.69 32.83 276.34
E38 335.52 434.36 731.76 -6.86 2.65 78.34 30.9 246.31
E39 365.84 463.96 758.92 -5.86 2.09 77.77 29.81 246.31
E40 334.08 440.02 736.94 -5.87 3.24 78.13 30.36 246.31
Tabela 4.8 – área de superfície aproximada (SAA), área de superfície (grid) (SAG),
volume molecular (Volume), energia de hidratação (HE), coeficiente de partição
molecular água-octanol (Log P), refratividade (Refrat), polarizabilidade (Polariz) e
massa molecular (massa).
Os dados de saída do programa, assim como a previsão da atividade antitumoral
correspondente e a comparação com outros métodos, são mostrados na Tabela 4.9
abaixo:
45
molécula
Dados de saída dos neurônios da
camada de saída
Redes Neurais PCA HCA EIM Ref.2
E21 1.000 0.000
A
A A A A
E22 1.000 0.000
A
A A A A
E23 0.991 0.009
A
I I A I
E24 0.052 0.955
I
I I I I
E25 0.043 0.966
I
I I I I
E26 0.028 0.969
I
I I I I
E27 1.000 0.000
A
A A A A
E28 1.000 0.000
A
A A A I
E29 1.000 0.000
A
A A A I
E30 1.000 0.000
A
A A A A
E31 0.993 0.009
A
A A A A
E37 0.134 0.851
I
I I A I
E38 0.300 0.661
I
I I I I
E39 0.990 0.006
A
A I A A
E40 1.000 0.000
A
A I A A
Tabela 4.9 – Comparação da atividade para as moléculas de atividade
experimental desconhecida. A segunda e terceira coluna se refere ao sinal de saída
dos dois neurônios da ultima camada da rede neural treinada, para a segunda
coluna >0.5 e para terceira <0.5 molécula ativa (A) e no caso inverso molécula
inativa (I).
Os resultados obtidos com o método RNA concordam com os anteriormente
utilizados [1, 2] em 80% a 93%, como mostra a Tabela 4.10.
Comparação entre diferentes métodos e redes neurais (%)
PCA HCA
EIM ref.2
93 80
93 80
Tabela 4.10 – Porcentagem de concordância dos métodos com RNA.
A Tabela 4.11 apresenta o número de previsões idênticas, obtidas usando
diferentes métodos de análise, para cada molécula do conjunto com atividade
antitumoral não investigada.
Número de métodos com previsões de atividade idêntica
E21 E22 E23 E24 E25 E26 E27 E28 E29 E30 E31 E37 E38 E39 E40
Ativa
5 5 2 0 0 0 5 4 4 5 5 1 0 4 4
Inativa 0 0 3 5 5 5 0 1 1 0 0 4 5 1 1
Tabela 4.11 – Número de tipos de métodos que são ativas e nativas.
46
4.4 Conclusão
Neste capítulo estudamos as propriedades eletrônicas de um grupo de 40
estruturas, composto de 25 derivadas das elipticinas com atividade experimental
conhecida e 15 com atividade experimental desconhecida.
A metodologia de redes neurais é um método não algorítmico, diferente dos
outros métodos utilizados na Ref. 2. Através deste método, obtivemos um treinamento
da rede com índices de acertos superiores a 90 por cento (Tabela 4.6) na identificação
da atividade antitumoral das moléculas já estudadas experimentalmente. No
treinamento, verificou-se que apenas as estruturas E15 e E18, além de não serem
classificadas corretamente, também não produziram bons resultados quando incluídas
no conjunto de treinamento. Outros quatro métodos também não classificaram
corretamente estas estruturas [1, 2].
Para os derivados sem informação experimental (total de 15 moléculas), uma
comparação entre os diferentes métodos de reconhecimento de padrões (PCA, MIE,
HCA, Ref. 2. e redes neurais artificiais) utilizados para o estudo (tabela 4.9, mostra que,
se desconsiderarmos a molécula E23, todo os métodos de análise apresentam excelente
concordância entre si. Isto pode ser visto na Tabela 4.11, em que nove dentre as
moléculas estudadas apresentam a mesma classificação em todos os métodos e cinco
outras moléculas, em quatro métodos diferentes (Tabela 4.11).
Desta investigação podemos propor que RNA possa ser efetivamente aplicada
como guia nas investigações para a síntese de novos fármacos derivados da elipticina
com atividade antitumoral otimizada, utilizando a rede neural já treinada para verificar
quais moléculas são possivelmente ativas.
Poderíamos supor que os resultados encontrados sejam particulares para a
família de compostos, porém a mesma metodologia aqui aplicada foi utilizada em outras
classes de compostos com diferentes tipos de atividade biológica, apresentando o
mesmo padrão de resultados. No próximo capítulo apresentaremos a aplicação destas
redes neurais para o estudo de moléculas da família das flúor-quinolonas.
A relevância de estudos que envolvam a investigação sistemática de
propriedades teóricas e sua correlação com atividade biológica é evidenciada pela
observação de que pequenas variações na estrutura química podem ser responsáveis por
alterações na atividade biológica de compostos de uma família. Apesar da complexidade
47
envolvida nos processos de interação composto-alvo biológico e em sua rota metabólica
do organismo, as propriedades moleculares dos fármacos são fundamentais para a
definição do caráter de atividade que ela apresenta. As investigações de atividade
biológica qualitativamente, baseadas em fatores que dependam diretamente da estrutura
e dos átomos constituintes de um composto, representam um avanço na formulação e
seleção de novos fármacos.
48
Referências
1.
Scheila F. Braga, Louraine C. de Melo e P. M. V. B. Barone, J. Mol. Struct.
(Theochem) 710 (2004) 51-59.
2.
Louraine C. de Melo, Scheila F. Braga e P. M. V. B. Barone, submetido.
3.
Goodwin, S., Smith, A F. and Horning, E.C.. Alkaloids of Ochrosia-Elliptica Labil.
J. Am. Chem. Soc.
1959, 81, 1903-1908; Woodward, R.B., lacobucci, G. A. and
Honchstein, F. A.. The Synthesis of Ellipticine. J. Am. Chem. Soc.
1959, 81, 4434-4435.
4.
Gribble, G. W., in the alkaloids, (Academic Press, 1990) Vol. 39, p.239.
5.
Diop, B., Toure, P., Sow, M. T., Toure, M., Halliez, M. L., J. P., Mondesir, J. M.,
and De Jaeger, R. Med. Afr. Noire
1984, 31, 107-110.
6.
H.Ichikawa, PSDD: Perceptron Simulater for Drug Design, QCPE 615, Indiana,
USA;
49
Capítulo 5 Flúor-quinolonas
5.1 Introdução
Selecionamos para este estudo um grupo de 31 flúor-quinolonas, das quais 17
foram testadas em relação à atividade antibiótica [1, 2, 3, 4, 5] e 14 não foram
experimentalmente testadas [6]. Para as flúor-quinolonas com atividade conhecida, o
critério de escolha levou em conta 2 fatores: a existência de dados bibliográficos sobre a
atividade das estruturas em questão e a importância clínica das bactérias para as quais as
drogas são ativas. Para este grupo, foi verificada a atividade antibiótica das drogas no
combate às pneumonias bacterianas causadas por Streptococcus pneumoniae, que é
importante causa de óbitos no mundo, provocando cerca de 4.000 mortes ao ano. As
demais flúor-quinolonas, com atividade desconhecida, foram sintetizadas no
Departamento de Química da UFJF, como parte de estudos cuja finalidade é produzir
alternativas às drogas existentes. Recentemente, foi observado um alarmante aumento
no número de variedades do bacilo Streptococcus pneumoniae resistentes às drogas
ofloxacin e ciprofloxacin, que leva à necessidade de encontrar novas drogas para
combatê-lo.
O estudo envolveu cálculos para a determinação das propriedades moleculares
por meio de métodos semi-empíricos, incluindo a análise conformacional para
determinar as geometrias de menor energia. A partir dos resultados destes estudos,
50
Figura 5.1 – Núcleo comum das flúor-quinolonas.
De acordo com a literatura da área e com o estudo anteriormente realizado [8],
são três as regiões do núcleo comum de maior importância para atividade, que iremos
chamar de regiões A, B e C (Figura 5.2).
Figura 5.2 – Regiões investigadas.
Investigamos as relações estrutura atividade das flúor-quinolonas dispostas nas
figuras 5.3a, em que são representadas as estruturas inativas, 5.3b, onde estão as
estruturas ativas, e 5.3c, onde estão as novas estruturas propostas para a classificação.
51
Figura 5.3a – Inativas [1, 2, 8]
Figura 5.3b – Ativas[1, 2, 8]
(03)
N
CO
2
H
F
N
H
3
CN
O
S
N
N
CO
2
H
F
C
2
H
5
N
HN
O
N
CO
2
H
F
C
2
H
5
N
H
3
CN
O
F
N
CO
2
H
F
C
2
H
5
N
HN
O
N
CO
2
H
F
C
2
H
5
N
HN
O
F
CH
3
N
CO
2
H
F
C
2
H
4
F
N
H
3
CN
O
F
(01)
(04) (05) (06)
(02)
(09) (07)
(10) (11) (12)
(08)
N
CO
2
H
F
O
N
HN
N
CO
2
H
F
N
H
3
CN
O
O
CH
3
N
CO
2
H
F
N
H
3
CN
O
O
CH
3
N
CO
2
H
F
O
N
HN
F
CH
3
CH
3
NH
2
N
CO
2
H
F
O
N
HN
CH
3
CH
3
N
CO
2
H
F
O
N
HN
CH
3
CH
3
H
3
CO
NN
CO
2
H
F
O
N
F
F
H
H
H
3
N
52
Figura 5.3c – Atividade desconhecida [6]
(20) (18)
(21) (22)
(19)
N
CO
2
H
F
O
N
N
H
4
C
2
Cl
N
CO
2
H
F
O
N
N
galactose
N
CO
2
H
F
O
N
N
glico se
N
CO
2
H
F
O
N
N
NC
3
OH
7
N
CO
2
H
F
O
N
H
3
CO
(CH
2
)
2
N
(CH
2
)
7
CH
3
N
CO
2
H
F
O
N
H
3
CO
(CH
2
)
2
N
(CH
2
)
9
CH
3
N
CO
2
H
F
O
N
H
3
CO
(CH
2
)
2
N
(CH
2
)
11
CH
3
(23) (24)
(25) (26)
(27) (28)
(29) (30)
N
CO
2
H
F
O
N
H
3
CO
(CH
2
)
2
N
(CH
2
)
13
CH
3
N
CO
2
H
F
O
N
H
3
CO
(CH
2
)
2
N
(CH
2
)
15
CH
3
N
CO
2
H
F
O
N
H
3
CO
(CH
2
)
3
N
(CH
2
)
7
CH
3
N
CO
2
H
F
O
N
H
3
CO
(CH
2
)
3
N
(CH
2
)
9
CH
3
N
CO
2
H
F
O
N
H
3
CO
(CH
2
)
3
N
(CH
2
)
11
CH
3
(31)
N
CO
2
H
F
O
N
H
3
CO
(CH
2
)
3
N
(CH
2
)
13
CH
3
N
CO
2
H
F
O
N
H
3
CO
(CH
2
)
3
N
(CH
2
)
15
CH
3
53
Na literatura [3], o critério encontrado para a classificação das estruturas
mostradas acima como ativas ou inativas contra o Streptococcus peneumonae é: se
MIC
90
< 4 mg/l, o composto é ativo. O índice MIC
90
(minimum inhibitory
concentration) indica a concentração mínima da droga para inibir 90% dos
microorganismos na amostra. Este índice é inversamente proporcional à atividade da
droga, pois quanto maior a dose necessária para neutralizar a bactéria em questão maior
é o MIC. Na Tabela 5.1 temos as 17 estruturas com atividade conhecida com a
numeração adotada neste texto, os nomes comerciais das drogas estudadas, o MIC
90
e a
classificação de suas atividades.
Número Flúor-quinolona MIC
90
(mg/l) Atividade
1 Rufloxacin 16 Inativa
2 Enoxacin 12,5-16 Inativa
3 Fleroxacin 12,5 Inativa
4 Norfloxacin 8-12,5 Inativa
5 Lomefloxacin 8 Inativa
6 Perfloxacin 8 Inativa
7 Ciprofloxacin 2-4 Ativa
8 Ofloxacin 2-4 Ativa
9 Levofloxacin 2 Ativa
10 Sparfloxacin 0,5 Ativa
11 Grepafloxacin 0,5 Ativa
12 Gatifloxacin 0,5 Ativa
13 Trovafloxacin 0,25 Ativa
14 Moxifloxacin 0,25 Ativa
15 Clinafloxacin 0,125 Ativa
16 Sitafloxacin 0,125 Ativa
54
Na Tabela 5.2 temos as 14 moléculas propostas com a numeração e a
codificação para a sua identificação.
Número Flúor-quinolona Número Flúor-quinolona
18
Ci_2_cl
25
M_2_13_2
19
Ci_galac
26
M_2_15_2
20
Ci_glic
27
M_3_07_2
21
Ci_N_OH
28
M_3_09_2
22
M_2_07_2
29
M_3_11_2
23
M_2_09_2
30
M_3_13_2
24
M_2_11_2
31
M_3_15_2
Tabela 5.2 – Atividade das drogas desconhecida [6].
55
5.2 Metodologia
5.2.1 Otimização
As estruturas foram construídas e pré-otimizadas utilizando o programa
HyperChem [ref.] e, em seguida, submetidas a uma análise conformacional utilizando o
programa CACHÊ [ref.]. O método semi-empírico PM3 [ref.] foi utilizado em todos os
cálculos. Durante o processo de otimização, conseguimos duas conformações diferentes,
uma identificando uma ponte de hidrogênio envolvendo o átomo de oxigênio ligado ao
átomo de carbono no sítio 4 (Figura 5.1) que aparecia em todas as estruturas, sempre
associada às estruturas de mais baixo calor de formação (Fig. 5.4) e outra de sem a
formação desta ponte. A conformação das estruturas utilizadas foi com a ponte
hidrogênio devido ao calor de formação menor e de observações em trabalhos
experimentais utilizando difração de raios X nas estruturas trovafloxacin e ciprofloxacin
[9,10].
Figura 5.4 Estrutura lomefloxacin, em que verificamos uma ponte de hidrogênio,
na posição indicada.
O programa CaChe nos fornece a superfície de energia potencial em um gráfico.
A partir desse gráfico, selecionamos a geometria de menor energia.
56
As estruturas otimizadas foram utilizadas como entrada de dados para o sistema
Chem2Pac, que fez o cálculo das LDOS. Para automatizar a coleta desses dados foi
utilizado o programa Controle de Arquivos [11], que funciona percorrendo os dados do
arquivo de saída do Chem2Pac e organizando-os em forma de uma tabela.
As propriedades eletrônicas analisadas foram as seguintes:
calor de formação (HF)
energia eletrônica (E
el
)
energia de repulsão caroço-caroço (RepCC)
momento de dipolo (DIPOLO)
as energias dos orbitais de fronteira (HOMO-1, HOMO, LUMO, LUMO+1) e suas
respectivas diferenças:
DH= HOMO – (HOMO-1)
DL= (LUMO+1)-LUMO
DE= LUMO-HOMO.
Foram calculadas também:
HF/NTA = HF / número total de átomos
HF/NAP = HF / número de átomos pesados
E
el
/NTE* = Eel / número total de elétrons das camadas externas
E
el
/NTE = Eel / número total de elétrons
Rep/NTA = RepCC / número total de átomos
Rep/NAP = RepCC / número de átomos pesados.
Calculamos as LDOS e suas diferenças em cada uma das regiões com o
Chem2Pac. Estas são denotadas da seguinte maneira:
AnH1_A: Valor da LDOS na região A para o orbital HOMO-1
AnH_A: Valor da LDOS na região A para o orbital HOMO
AnL_A: Valor da LDOS na região A para o orbital LUMO
AnL1_A: Valor da LDOS na região A para o orbital LUMO+1
nH_A= AnH_A - AnH1_A
nL_A= AnCL1_A - AnL_A
Obtivemos assim 35 variáveis envolvendo as 3 regiões investigadas.
57
5.2.2 PCA
Utilizamos a metodologia PCA a partir das propriedades eletrônicas calculadas
no Chem2Pac, com a metodologia descrita no capítulo 3, de modo a distinguir as
propriedades mais relevantes para a classificação das flúor-quinolonas. Desta forma
identificamos as seguintes propriedades, cujos valores são apresentados na Tabela 5.3
abaixo:
Rep/NTA = RepCC / número total de átomos
DL = (LUMO+1)-LUMO
AnH1_A = Valor da LDOS na região A para o orbital HOMO-1
AnH_A = Valor da LDOS na região A para o orbital HOMO
nH_A = AnH_A - AnH1_A
AnL_C = Valor da LDOS na região C para o orbital LUMO
58
Moléculas Rep/NTA DL nH_A AnH1_A AnH_A AnL_C
01
660,6277 0,19326 0,3150414 0,000232 0,3152734 0,0017769
02
640,0108 0,1343 0,0517212 0,2821883 0,3339095 0,0051102
03
668,1401 0,16184 -0,6249428 0,6271575 0,0022147 0,0486321
04
619,3765 0,18299 0,4283454 0,0910667 0,5194121 0,0003596
05
677,0614 0,14413 -0,5282375 0,5834157 0,0551782 0,0011743
06
717,8245 0,18073 -0,6289842 0,6294865 0,0005023 0,057802
07
636,1635 0,15676 0,4977443 0,0575314 0,5552757 0,0009421
08
679,7253 0,103 0,5175235 0,0298537 0,5473772 0,0244894
09
683,7253 0,11442 -0,5573345 0,5646772 0,0073427 0,0117072
10
724,6826 0,17097 -0,2721971 0,2730562 0,0008591 0,0517543
11
649,4656 0,18009 0,4832554 0,0482304 0,5314858 0,002413
12
695,1223 0,17975 0,6016655 0,0000896 0,6017551 0,0224616
13
762,9925 0,05661 -0,3135786 0,4856806 0,172102 0,0385937
14
702,3077 0,11075 0,6120109 0,0000209 0,6120318 0,0151107
15
682,2212 0,16732 0,5787381 0,0003681 0,5791062 0,012034
16
750,8763 0,19173 0,576247 0,000738 0,576985 0,01393
17
708,3115 0,12053 0,123233 0,2716382 0,3948712 0,0195714
18
677,7518 0,16286 0,463669 0,0734278 0,5370968 0,0004487
19
805,1876 0,16268 0,4867498 0,0629163 0,5496661 0,0003392
20
803,5536 0,15686 0,2534803 0,1742963 0,4277766 0,0019675
21
680,9616 0,16098 0,388107 0,1078413 0,4959483 0,0008469
22
624,4379 0,15875 0,4656814 0,0870688 0,5527502 0,0011093
23
617,6046 0,15879 0,4575489 0,0911993 0,5487482 0,0011921
24
611,9941 0,15605 0,4579243 0,090572 0,5484963 0,0014749
25
608,0253 0,15784 0,4619762 0,0887327 0,5507089 0,001261
26
604,1944 0,15708 0,4645114 0,087396 0,5519074 0,0013251
27
621,1671 0,14847 0,4722831 0,0836048 0,5558879 0,0020381
28
614,9254 0,14874 0,4667976 0,0868265 0,5536241 0,0020778
29
610,6039 0,15086 0,4680172 0,0864972 0,5545144 0,0016423
30
605,6625 0,14588 0,4680258 0,0854536 0,5534794 0,0027133
31
602,2958 0,14672 0,4670809 0,0861384 0,5532193 0,0025398
Tabela 5.3 – Propriedades das flúor-quinolonas: RepCC / número total de átomos
(Rep/NTA); (LUMO+1)-LUMO (DL); valor da LDOS na região A para o orbital
HOMO-1 (AnH1_A); valor da LDOS na região A para o orbital HOMO (AnH_A);
AnH_A - AnH1_A (nH_A); valor da LDOS na região C para o orbital LUMO
(AnL_C).
59
5.2.3 Redes Neurais Artificiais
Para a classificação com redes neurais foi usado o software PSDD. Como há
certas limitações na forma da entrada de dados deste programa, os valores de entrada
foram convenientemente normalizados para conterem no máximo 5 algarismos. O
critério escolhido para escalonar os dados não é relevante, pois o programa também, re-
escala estas variáveis para o intervalo entre 0,1 e 0,9.
As propriedades foram analisadas utilizando Redes Neurais tipo perceptron para
a classificação segundo a atividade antibiótica, como descrito anteriormente. Neste
estudo envolvendo as flúor-quinolonas usamos, entre as moléculas de atividade
conhecida, cinco moléculas como padrões para o treinamento, e as demais doze, para
verificação do índice de acertos da rede. Aplicamos a rede para predizer o restante das
estruturas com atividade desconhecida.
camada neurônios
k
η
θ
1 5
2 8 2 0.10 0.0001
3 2 15.5 0.05 0.0001
Tabela 5.4 – Parâmetros iniciais das RNA.
Os parâmetros iniciais usados na rede são os da Tabela 5.4. O limiar utilizado
para o erro do método backpropagation foi 0,0001 e o número de ciclos, 19901.
60
5.3 Resultados
Nesta sessão, apresentaremos os resultados obtidos para as propriedades
eletrônicas das estruturas estudadas, utilizando a rede neural artificial descrita
anteriormente.
Primeiro é feito o treinamento da rede (Tabela 5.5), que foi feito com os
parâmetros iniciais (Tabela 5.4) e com as propriedades eletrônicas da Tabela 5.3,
usando as moléculas 01, 04, 07, 10 e 13 como padrões e logo depois a verificação deste
treinamento. Esta verificação é feita com as moléculas que não foram usadas no
treinamento, verificando o grau de acerto da rede treinada, de modo a aferir a
confiabilidade no treinamento da rede.É importante ressaltar que temos que ter no
conjunto de treinamento, necessariamente, moléculas ativas e inativas, na proporção
próxima de 1:1. O treinamento da rede é comparado com resultados de dados
experimentais na Tabelas 5.5.
molécula
Dados de saída dos
neurônios da camada de
saída
Padrão de
treinamento
Redes
Neurais
Experimental
01
0.994 0.006
1 0 Inativa Inativa
02
1.000 0.000
Inativa Inativa
03
1.000 0.000
Inativa Inativa
04
0.993 0.006
1 0 Inativa Inativa
05
1.000 0.000
Inativa Inativa
06
1.000 0.000
Inativa Inativa
07
0.008 0.992
0 1 Ativa Ativa
08
0.000 1.000
Ativa Ativa
09
1.000 0.000
Inativa Ativa
10
0.000 1.000
0 1 Ativa Ativa
11
0.003 0.997
Ativa Ativa
12
0.000 1.000
Ativa Ativa
13
0.002 0.998
0 1 Ativa Ativa
14
0.000 1.000
Ativa Ativa
15
0.000 1.000
Ativa Ativa
16
0.000 1.000
Ativa Ativa
17
0.000 1.000
Ativa Ativa
Tabela 5.5 - Os melhores conjuntos de estruturas usadas como padrão. A segunda
e terceira coluna se refere ao sinal de saída dos dois neurônios da ultima camada
da rede neural treinada, para a segunda coluna >0.5 e para terceira <0.5 molécula
inativa e no caso inverso molécula inativa (I).
Legenda:
texto Foi classificada erradamente
texto Foi usada como padrão de treinamento
61
Comparando os resultados da rede neural artificial e experimental, de todas as
estruturas com atividade conhecida, verificamos um índice de acerto de 94%. Os
resultados se mostram bastante satisfatórios, visto que atingimos uma taxa de acerto da
rede acima de 90%, uma taxa de aprendizado muito boa para uma rede neural.
Após o treinamento, submetemos à rede neural as flúor-quinolonas com
atividade desconhecida experimentalmente (Tabela 5.6).
Molécula
Dados de saída dos
neurônios da camada de
saída
Redes
Neurais
Experimental
18
0.002 0.998
Ativa Desconhecido
19
0.000 1.000
Ativa Desconhecido
20
0.000 1.000
Ativa Desconhecido
21
0.045 0.953
Ativa Desconhecido
22
0.058 0.942
Ativa Desconhecido
23
0.215 0.784
Ativa Desconhecido
24
0.369 0.629
Ativa Desconhecido
25
0.484 0.511
Ativa Desconhecido
26
0.600 0.394
Inativa Desconhecido
27
0.054 0.947
Ativa Desconhecido
28
0.163 0.837
Ativa Desconhecido
29
0.298 0.700
Ativa Desconhecido
30
0.395 0.602
Ativa Desconhecido
31
0.554 0.441
Inativa Desconhecido
Tabela 5.6 – Resultados segundo o método RNA da atividade para as moléculas de
atividade experimental desconhecida. A segunda e terceira coluna se refere ao
sinal de saída dos dois neurônios da ultima camada da rede neural treinada, para a
segunda coluna >0.5 e para terceira <0.5 molécula inativa e no caso inverso
molécula ativa.
Nas moléculas 18 a 21, que são derivadas da ciprofloxacin (estrutura 07 – com
atividade biológica), todas são ativas. Verificou-se que o radical inserido na estrutura
não mudou a sua atividade.
Nos dois grupos de estruturas com cadeias laterais longas, 22 a 26 e 27 a 31,
verificamos que o sinal de saída do neurônio representado pela segunda coluna (Tabela
5.6) vai aumentando enquanto o sinal de saída do neurônio representado pela terceira
coluna vai diminuindo, mostrando que quanto maior o grupo lateral menor a atividade.
A atividade das estruturas diminui até se tornar inativa, caso verificado nas estruturas 26
e 31.
62
5.4. Conclusão
Neste capítulo, utilizando métodos de reconhecimento de padrões PCA e RNA,
investigamos os descritores eletrônicos utilizados pela MIE, para um grupo de 31
estruturas da família das flúor-quinolonas, composto de 17 moléculas com atividade
experimental conhecida e 14 com atividade experimental desconhecida sobre o
patógeno Streptococcus peneumonae.
O objetivo foi treinar uma rede neural artificial que conseguisse predizer quais
flúor-quinolonas, com atividade experimental desconhecida, apresenta atividade contra
o Streptococcus peneumonae.
Através da RNA, obtivemos uma rede neural artificial que errou apenas uma
classificação de atividade antibiótica das flúor-quinolonas já estudadas
experimentalmente na verificação confiabilidade da rede, nos fornecendo índices de
acertos superiores a 91 % no seu treinamento (Tabela 5.5). No treinamento, verificou-se
que apenas a estrutura 07, além de não ser classificada corretamente, também não
produzia bom resultado quando incluída no conjunto de treinamento. Os resultados do
treinamento da rede se mostraram satisfatórios, além de indicar que quanto maior a
cadeia lateral das estruturas 22 a 31 (Figura 5.5) menor a atividade da estrutura, como se
verifica com as moléculas 26 e 31 (Tabela 5.6), chegando até a classificação como
inativa.
Figura 5.5 – Núcleo das estruturas com cauda longa. (X representa a cadeia
lateral).
Desta análise podemos propor que RNA possa ser efetivamente aplicada como
guia nas investigações para a síntese de novos fármacos das flúor-quinolonas com
atividade antibiótica otimizada, utilizando a rede neural já treinada para verificar quais
moléculas são possivelmente ativas. Embora a interação entre estes compostos e a
células seja, em geral, bastante complexa, as propriedades moleculares dos fármacos são
N
C
O
2
H
F
O
N
H
3
CO
X
63
fundamentais para a definição do caráter de atividade que ela apresenta. Como vimos no
capítulo anterior as investigações qualitativas de atividade biológica, baseadas em
fatores que dependam diretamente da estrutura e dos átomos constituintes de um
composto, podem ser utilizadas como ferramentas avançadas na formulação e seleção
de novos fármacos.
64
Referências
1. Da Silva, A.D.; De Almeida, M.V.; De Souza, M.V.M.; Couri, M.R.C.; Biological
Activity and Synthetic Metodologics for the Preparation of Fluorquinolones, a class of
Potent Antibacterial Current medicinal Chemistry, 2003, 10(1):21-39;
2. <www.ahc.umn.edu> em 14/11/2003;
3. Appelbaum, P.C.; Hunter, P.A.; The fluoroquinolone antibacterial: past, present
ans future perspective, PA Int. Antimicrob. Ag. , 2000, 16, 5-15;
4. Ma, Z.; Chu, D.T.W.; Cooper, C.S.; Li, Q.; Fung, A.K.L.; Wang, S.; Shen,
L.L.;Flamm, R.K.; Nillus, A.M.; Alder, J.D.; Meulbroek, J.A.; Or, Y.S. J. Synthesis and
antimicrobial Activity of 4H-4-Oxoquinolizine Derivatives: Consequences of
Structural Modification at the C-8 Position Med. Chem., 1999, 42, 4202-4213;
5. Schmitz, F.J.; Verhoef, J.; Fluit, A.C.; the SENTRY PARTICIPANTS GROUP,
Comparative activities of six different fluorquinolones against 9,682 clincal bacterial
isolates from 20 European university hospital participating in the European SENTRY
surveillance programme, Int Journal of Antimicrobial Agentes,1999,12, 311-317;
6. Mauro V. Almeida e Adilson D. da Silva, comunicação privada.
7. Coluci, V.R.; Braga, S.F.; Vedrame, R.; Barone, P.M.V.B.; Galvão, D.S.; Teoria
eletrônica do câncer e a origem da vida: base para o desenvolvimento de parâmetros
“universais” para métodos de estrutura-atividade;
8. (a) Galhardo, C.E.C.; Barone, P.M.V.B.;VIII Escola Brasileira de Estrutura
Eletrônica, VIII (2002) 202-223, Juiz de Fora – MG; (b) Galhardo, C.E.C.; “Relação
estrutura-atividade de drogas Antibióticas”, Monografia de Bacharelado, DF/UFJF,
Juiz de Fora, 2004.
65
9. Brighty, K.E.; Gootz, T.D.; The chemistry and biological profile of trovafloxacin,
journal of Antimicrobial Chemotherapy, 1997, 39, Suppl. , 1-14.
10. Petra Drevensek; Amalija Golobie; Iztok Turel; Natasa Poklar; Kristina Sepeie;
Crystal structure, characterisation and biological activity of coperr(II)-ciprofloxacin
ionic compound, Acta Chim. Slov., 2002, 49, 857-870.
11. Rezende, L.A. Software não registrado
66
Capítulo 6 – Conclusões e Perspectivas
Neste trabalho estudamos as propriedades eletrônicas de duas famílias de
moléculas: as elipticinas, que são fármacos com propriedades antitumorais, e as flúor-
quinolonas, que são fármacos usados como antibióticos. Utilizando as metodologias de
PCA e ANN, investigamos relações estrutura – atividade biológica para estas drogas.
Para as elipticinas comparamos os resultados da ANN com outras metodologias [1] e
para as flúor-quinolonas verificamos quais eram as propriedades eletrônicas mais
relevantes para a sua classificação, utilizando PCA, e as classificamos segundo a
atividade, utilizando ANN. Os resultados encontrados no estudo de moléculas cuja
atividade foi experimentalmente determinada foram utilizados para propor a
classificação de outras moléculas ainda não testadas.
O objetivo principal foi correlacionar as propriedades moleculares com a
atividade biológica dessas drogas, produzindo padrões para a identificação de drogas
ativas e inativas. Os critérios de identificação assim obtidos poderão ser utilizados para
propor novos fármacos e direcionar, racionalizar e acelerar as pesquisas in vitro e in
vivo para o desenvolvimento de novas drogas, com atividade otimizada.
As elipticinas foram estudadas utilizando a metodologia ANN. Através deste
método, obtivemos um treinamento da rede com índices de acertos superiores a 90%
(Tabela 4.6) na identificação da atividade antitumoral das moléculas já estudadas
experimentalmente. No treinamento, verificou-se que apenas as estruturas E15 e E18,
além de não serem classificadas corretamente, também não produziram bons resultados
quando incluídas no conjunto de treinamento. Outros quatro métodos também não
classificaram corretamente estas estruturas [1, 2].
Para os derivados sem informação experimental (total de 15 moléculas), uma
comparação entre os diferentes métodos de reconhecimento de padrões (PCA, EIM,
HCA – Ref. 2 – e ANN) utilizados para o estudo (Tabela 4.9), mostra que, se
desconsiderarmos a molécula E23, os métodos ANN, PCA e HCA, a concordância entre
os métodos de análise é excelente. Isto pode ser visto na Tabela 4.11, em que nove
dentre as moléculas estudadas apresentam a mesma classificação em todos os métodos e
cinco outras moléculas, em quatro métodos diferentes (Tabela 4.11).
67
Investigamos também os descritores eletrônicos utilizados pela EIM, utilizando
metodologias para reconhecimento de padrões PCA e ANN, para as moléculas de flúor-
quinolonas, com atividade antibiótica contra a bactéria Streptococcus peneumonae.
Através deste método, obtivemos um treinamento da rede com índices de acertos
superiores a 91% (Tabela 5.5) na identificação da atividade antibiótica das moléculas já
estudadas experimentalmente. No treinament
68
Referências
1. Scheila F. Braga, Louraine C. de Melo e P. M. V. B. Barone, J. Mol. Struct.
(Theochem) 710 (2004) 51-59.
2. Louraine C. de Melo, Scheila F. Braga e P. M. V. B. Barone, submetido.
Livros Grátis
( http://www.livrosgratis.com.br )
Milhares de Livros para Download:
Baixar livros de Administração
Baixar livros de Agronomia
Baixar livros de Arquitetura
Baixar livros de Artes
Baixar livros de Astronomia
Baixar livros de Biologia Geral
Baixar livros de Ciência da Computação
Baixar livros de Ciência da Informação
Baixar livros de Ciência Política
Baixar livros de Ciências da Saúde
Baixar livros de Comunicação
Baixar livros do Conselho Nacional de Educação - CNE
Baixar livros de Defesa civil
Baixar livros de Direito
Baixar livros de Direitos humanos
Baixar livros de Economia
Baixar livros de Economia Doméstica
Baixar livros de Educação
Baixar livros de Educação - Trânsito
Baixar livros de Educação Física
Baixar livros de Engenharia Aeroespacial
Baixar livros de Farmácia
Baixar livros de Filosofia
Baixar livros de Física
Baixar livros de Geociências
Baixar livros de Geografia
Baixar livros de História
Baixar livros de Línguas
Baixar livros de Literatura
Baixar livros de Literatura de Cordel
Baixar livros de Literatura Infantil
Baixar livros de Matemática
Baixar livros de Medicina
Baixar livros de Medicina Veterinária
Baixar livros de Meio Ambiente
Baixar livros de Meteorologia
Baixar Monografias e TCC
Baixar livros Multidisciplinar
Baixar livros de Música
Baixar livros de Psicologia
Baixar livros de Química
Baixar livros de Saúde Coletiva
Baixar livros de Serviço Social
Baixar livros de Sociologia
Baixar livros de Teologia
Baixar livros de Trabalho
Baixar livros de Turismo