Download PDF
ads:
ads:
Livros Grátis
http://www.livrosgratis.com.br
Milhares de livros grátis para download.
ads:
Em comunh˜ao com aqueles que me ajudaram a desvencilhar os novelos da vida.
Agradecimentos
Certo dia ao longo de uma das crises acerca de nossos investimentos na car-
reira de f´ısicos um amigo perguntou-me:
- Pedro, o que ser´a que nos lembrar´ıamos daqui a dez anos se abandonassemos
a f´ısica ?
Ele me questionou se saber´ıamos por exemplo o que seriam osons e f´ermions
1
.
Terminamos a conversa rindo e dizendo que afirmar´ıamos que um era um v´ırus e ou-
tro era uma bact´eria, mas ao saber´ıamos identificar qual era o que. Hoje passados
quase oito anos dessa conversa olho para tr´as e vejo um rastro formado por livros
e artigos lidos, por listas de exerc´ıcios e exames cumpridos. Tamem ´e poss´ıvel
vislumbrar companheiros de farras, noites em praias e viol˜oes, comidas saborosas
e discuss˜oes acaloradas. De certo ´e necess´ario que se registrem aqueles que contri-
buiram para que o estudante secund´ario que ingressou nessa institui¸ao a dez anos
atr´as, se convertesse nesse candidato a doutor, e se eles ao o tornaram um mel-
hor f´ısico, definitivamente foram decisivas em sua forma¸ao como um ser humano
melhor.
Embora a enumera¸ao possa ser perigosa, arrisco-me a citar alguns nomes
mesmo que a mem´oria me traia. Agrade¸co aos meus pais Maria e Jo˜ao, e a minha
irm˜a Elisa que durante anos investiram paciˆencia e apostaram em minha forma¸ao,
mesmo sem entenderem muitas vezes o que eu fazia. Aos amigos do in´ıcio da camin-
hada que faziam da biblioteca sua casa: Wilton, Paulo Henrique, Patr´ıcia Fcanha,
Daniella Collier, Cibelle Nascimento, Chico Vieira e Mardson. Aos amigos de turma:
Eric Parteli, Helinando Pequeno, Ana Maia, Cl´esio Le˜ao, Frederico Brito e Jonas
1
Se vocˆe ao ´e f´ısico ao se preocupe, osons e ermions ao classifica¸oes ecnicas para as
part´ıculas fundamentais constituintes da mat´eria. osons ao part´ıculas de spin inteiro enquanto
que ermions ao part´ıculas de spin semi-inteiro.
ii
Campelo. As garotas Karlla Adriana e Priscila Silva respons´aveis por boa parte da
alegria do ano de 2005. Aos matem´aticos baianos Alex Ramos e Calit´eia. Aos co-
legas “das turmas da frente” La´ercio Dias, ario Henrique, ercia Liane, Fernando
Par´ısio, Antˆonio de adua, Renˆe e Cl´ecio Clemente; e “das turmas posteriores” Caio
Veloso (encosto), Guga, arcio Her´aclito, Marcelo Alencar, Leonardo Cavalcanti,
Felipe Fernando, Gerson Cortˆes. Ao meu afilhado e amigo de tantas escaladas:
Ailton Fernandes, com quem compreendi que competˆencia e humildade podem co-
existir. Ao amigo Jos´e Ferraz, pelas tantas conversas e pensamentos compartilhados.
`
A assia Donato, uma grande amiga, que de perto ou de longe sempre se soube fazer
presente de forma positiva. Aos companheiros de grupo Hallan Silva, Washington
Lima e Lenira e aos ex-companheiros Gustavo Camelo Neto e Alexandre Rosas.
Em especial a Marcelo Miranda e Josie Rabelo por terem colaborado para
que o ano de 2006 fosse um ano de feliz aprendizado e cumplicidade no ingresso `a
vida adulta.
Aos mestres do ciclo asico Cl´audio Furtado e Carlos Alberto. Aos primeiros
mestres de pesquisa Marco Gameiro, Marc´ılia Andrade Campos e Fernando Morais,
pelos exemplos de ´etica, bom humor e profissionalismo.
Ao professor S´ergio Coutinho que ao longo destes seis anos de convivˆencia
mostrou-se um orientador atento, propiciando a lib erdade, a confian¸ca e a ex-
periˆencia necess´arias para a consolida¸ao desse trabalho. Aos professores Marcelo
A. Moret e Edvaldo Nogueira, pelas colabora¸oes e pelo competente aprendizado
cient´ıfico acerca dos sistemas prot´eicos.
Aos funcion´arios Joaquim, Ivo, Humberto, Cristina, Ricardo (in memorian),
Paulo Pinto, Jo˜ao, Ana e Joana os quais deram e ao suporte para que a estrutura
desse departamento funcione eficientemente.
Tese de Doutorado
iii
Ao CNPq e a FACEPE que forneceram o suporte financeiro para esta pes-
quisa.
Por fim, acredito que daqui a dez anos osons e f´ermions continuar˜ao nos
livros e poder˜ao ser consultados, mas definitivamente as pessoas citadas acima con-
tinuar˜ao em minha mem´oria.
Tese de Doutorado - Departamento de F´ısica - UFPE
Resumo
A maneira na qual uma prote´ına se enovela a partir de uma espiral aleat´oria para
um estado nativo ´unico, em um intervalo de tempo relativamente curto, ´e um dos
problemas fundamentais da biof´ısica molecular.
´
E bem aceito que esta estrutura
tridimensional ´unica, caracter´ıstica de cada prote´ına e de sua seq¨uencia de amino
´acidos, determina as fun¸oes da prote´ına. Nesta Tese, duas abordagens distintas
ser˜ao empregadas para estudar aspectos gerais deste problema: 1) uma modela-
gem estoastica da cadeia principal e de forma¸ao de estruturas secund´arias, para
explorar os aspectos espaciais do estado nativo; 2) uma modelagem de dinˆamica mo-
lecular, para analisar e caracterizar estatisticamente a evolu¸ao temporal da energia
conformacional, durante o processo de enovelamento.
Na primeira abordagem, o modelo proposto gera uma cadeia principal com
uma fra¸ao de estruturas secund´arias atrav´es de um caminhante aleat´orio angular
no espa¸co tridimensional, cuja trajet´oria, com passo de tamanho fixo e os ˆangulos
diedrais e Ψ) das liga¸oes pept´ıdicas escolhidos por duas distribui¸oes de proba-
bilidades gaussianas, cujas edias est˜ao associadas com as estruturas secund´arias e
a variˆancia δ
2
como um parˆametro ajust´avel do modelo. Este modelo permite con-
struir uma grande variedade de cadeias distintas, desde aquelas totalmente aleat´orias
`as condizentes com dados experimentais. Algumas propriedades geom´etricas de
prote´ınas globulares compostas por uma fra¸ao f de elices-α e/ou fitas-β ao par-
ticularmente estudadas. O comportamento de escala obtido para o raio de gira¸ao
(R
g
) em fun¸ao do tamanho da cadeia (N); o grau de compacta¸ao (γ); a distri-
bui¸ao do n´umero de coordena¸ao ( z
c
) de carbonos C
α
na estrutura e a energia total
ii
envolvida, nestes contatos, foram explorados e comparados com dados extra´ıdos
de centenas de prote´ınas depositadas do wwPDB (worldwide Protein Data Bank).
Os resultados encontrados mostram que, para a fra¸ao m´edia f 0.6 de estrutu-
ras secund´arias (h´elice-α e/ou fita-β), as cadeias geradas com distribui¸oes de desvio
padr˜ao finito e pr´oximo de δ 0.15π ao mais compactas do que aquelas constru´ıdas
com outros pares de ˆangulos diedrais. Independente dos detalhes dos mecanismos
f´ısico-qu´ımicos subjacentes, a constru¸ao de cadeias principais de prote´ınas com
m´etodo geral proposto nesta Tese sugere que tais estruturas ao governadas por
distribui¸oes de probabilidades estreitas e a estocasticidade desempenha um papel
fundamental na sua compacta¸ao.
Na segunda abordagem, investigamos as propriedades multifractais de eries
temporais da energia conformacional de pequenas estruturas em h´elice-α, especifi-
camente de uma fam´ılia das polialaninas. Atrav´es do etodo de an´alise multifractal
de flutua¸oes destendenciadas (MF-DFA, do inglˆes multifractal detrended fluctua-
tion analysis), estimamos o expoente de Hurst generalizado h(q) e os associados
expoentes de escala multifractal τ (q), para diversas eries, geradas numericamente
por simula¸oes de dinˆamica molecular de sistemas em diferentes conforma¸oes in-
iciais. As simula¸oes foram realizadas utilizando-se o campo de for¸ca GROMOS
implementado no programa THOR. Os resultados mostram que todas as s´eries ana-
lisadas exibem um comportamento multifractal que depende do n´umero de res´ıduos
e da temperatura do sistema. Al´em disso, as propriedades multifractais das eries
revelam aspectos importantes sobre a evolu¸ao temporal do sistema e sugerem que
o processo de nuclea¸ao de estruturas secund´arias, durante `as visitas da prote´ına `a
sua hiper-superf´ıcie de energia potencial conformacional, ao essenciais no processo
de enovelamento.
Tese de Doutorado
iii
Palavras-chave: Enovelamento Prot´eico, Caminhantes Aleat´orios, S´eries Tem-
porais, Multifractais.
Tese de Doutorado - Departamento de F´ısica - UFPE
Abstract
The manner in which a protein folds from a random coil into a unique na-
tive state in a relatively short time is one of the fundamental puzzles of molecular
biophysics. It is well accepted that a unique native three-dimensional structure,
characteristic of each protein and determined by the sequence of its amino-acids,
dictates protein functions. In this Thesis two distinct approaches are considered to
study general aspects of such problem: 1) a stochastic modeling of the backbone
chain of the protein secondary structures to explore the general spacial aspects of
the native state; 2) an analysis of the time evolution of the protein conformatio-
nal potential energy calculated during the folding process mimicked by methods of
molecular dynamics.
In the first approach the proposed model generates a general backbone chain
with a fixed fraction f of secondary like structures by means of a three-dimensional
off-lattice random walk with fixed steps and the Φ and Ψ dihedral angles within
the peptide bonds chosen by Gaussian probability distributions. Such probability
distributions have their mean value corresponding to the angles associated with
the chosen secondary structures and the variance δ
2
left as a free parameter to
be determined. This model allows the construction of a great variety of backbone
chains running from full random structures up to the biological ones observed in
proteins. Some geometrical properties of globular structures, composed by a fraction
f of α-helix and/or β-strands, were particulary studied. The scaling behavior of
the ratio of gyration (R
g
) with the chain size (N); the degree of compactness (γ);
the distribution of coordination number (z
c
) of the Carbon C
α
atoms and energy
ii
involved on such contacts were explored and compared with data of hundreds of
proteins extracted from the wwPDB (worldwide Protein Data Bank ). The results
indicate that simulated structures are more compact when a fraction of f 0.6 of
secondary portions (α-helices and/or β-strands) are present than those built with
other sets of dihedral angles, whenever the standard deviation of the probability
distributions are finite and close to δ 0.15π. Independent of the details of all
underlying physical chemistry mechanisms, building protein backbones with the
method proposed in the present Thesis suggests that these structures are driven by
narrow distributions leading to the conclusion that stochasticity has a fundamental
role on the its compactness.
The second approach investigate the multifractal properties of the time-series
of the conformational energy of small α-helix structures, in particular that of poly-
alanine family. Using the multifractal detrended fluctuation analysis method (MF-
DFA) the generalized Hurst exponent h(q) and its associated multifractal scaling
exponent τ(q) were estimated for several time-series numerically generated by mole-
cular dynamic simulations considering distinct initial configurations. Such simulati-
ons were done using the force field GROMOS implemented by the software THOR.
In general, the analyzed time series exhibit a multifractal behavior, which depends
on the number of residues N and the temperature T of the system. Furthermore,
whenever represented by the h(q) or τ (q) spectra, the time-series multifractal pro-
perties reveal important aspects of the time evolution of the system. In particular,
suggesting that the nucleation process of secondary structures, which should occurs
during the walk of the protein on the corresponding portion of the conformational
potential energy hyper-surface landscape, is essential for the folding process.
Keywords: Protein Folding, Random-Walks, Time Series, Multifractals.
Tese de Doutorado
iii
Tese de Doutorado - Departamento de F´ısica - UFPE
Conte´udo
1 Introdu¸ao 2
2 Caracter´ısticas Gerais dos Sistemas Prot´eicos 8
2.1 Caracter´ısticas gerais dos sistemas prot´eicos . . . . . . . . . . . . . . 8
2.1.1 Liga¸oes qu´ımicas fundamentais . . . . . . . . . . . . . . . . . 10
2.1.2 Forma¸oes estruturais t´ıpicas . . . . . . . . . . . . . . . . . . 15
2.1.3 A hipersuperf´ıcie de energia e a hip´otese termodinˆamica . . . 23
2.2 Abordagens para o problema do enovelamento prot´eico . . . . . . . . 27
3 Modelo de caminhantes angulares Gaussianos 36
3.1 Caminhantes aleat´orios e caminhantes auto-excludentes . . . . . . . . 36
3.2 Modelo de caminhantes angulares Gaussianos . . . . . . . . . . . . . 40
3.3 An´alise das grandezas relevantes . . . . . . . . . . . . . . . . . . . . . 44
3.3.1 O raio de gira¸ao . . . . . . . . . . . . . . . . . . . . . . . . . 45
3.3.2 O comprimento de contorno . . . . . . . . . . . . . . . . . . . 55
3.3.3 O n´umero de coordena¸ao e a energia de contato. . . . . . . . 59
4 Aspectos multifractais de eries temporais da energia potencial de
polipept´ıdeos 72
iv
CONTE
´
UDO v
4.1 A energia potencial de prote´ınas . . . . . . . . . . . . . . . . . . . . . 72
4.2 Dinˆamica molecular dos sistemas prot´eicos . . . . . . . . . . . . . . . 75
4.3 S´eries temporais da energia potencial de polialaninas . . . . . . . . . 79
4.4 O m´etodo MF-DFA . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
4.5 Caracteriza¸ao multifractal das eries de energia potencial . . . . . . 93
5 Conclus˜oes e perspectivas 100
A alculo do expoente de escala ν para o modelo de Flory 106
B Determina¸ao das coordenadas cartesianas do caminhante 108
Bibliografia 110
Tese de Doutorado - Departamento de F´ısica - UFPE
Lista de Figuras
1.1 ons Jacob Berzelius propositor da existˆencia das prote´ınas - 1838. . . 5
2.1 Estrutura qu´ımica dos amino´acidos. . . . . . . . . . . . . . . . . . . . 10
2.2 Rela¸ao dos 20 amino´acidos codificados pelos organismos vivos. . . . 11
2.3 Valores dos ˆangulos de tor¸ao Φ e Ψ envolvidos nas liga¸oes pept´ıdicas. 16
2.4 Mapa de Ramachandran exibindo regi˜oes permitidas para os valores
de Φ e Ψ nas estruturas prot´eicas . . . . . . . . . . . . . . . . . . . . 17
2.5 Diferentes representa¸oes de uma estrutura secund´aria em h´elice-α . . 19
2.6 Estrutura secund´aria em folha-β e suas configura¸oes paralela e anti-
paralela . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.7 Estrutura terci´aria composta por h´elices-α, folhas-β e loops . . . . . . 21
2.8 Representa¸ao de uma hemoglobina exibindo suas cadeias de prote´ınas
constituintes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.9 Diagramas esquem´aticos das prote´ınas, exibindo os quatro n´ıveis estru-
turais. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.10 Representa¸ao da hipersuperf´ıcie de energia potencial caracter´ıstica
das prote´ınas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
vi
LISTA DE FIGURAS vii
3.1 Padr˜oes t´ıpicos, obtidos atraes de simula¸ao numa rede quadrada,
para caminhantes aleat´orios (em preto) e caminhantes aleat´orios auto-
excludentes (em vermelho), ambos com 250 passos e partindo do
ponto (250 , 250). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
3.2 Comportamento do raio edio < R > em fun¸ao do n´umero de
amino´acidos N para um conjunto de 1826 cadeias prot´eicas, com ex-
poente ν 0.40 ± 0.02. A linha cont´ınua indica o ajuste linear dos
dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
3.3 (a) Padr˜ao t´ıpico de uma cadeia composta por 250 res´ıduos, com 60%
de estruturas tipo elice-α, gerado pelo modelo com distribui¸ao de
largura δ = 0.1. (b) Mapa de Ramachandran para 100 simula¸oes
realizadas com os mesmos parˆametros da Figura 3.3 (a) . . . . . . . . 45
3.4 (a) Padr˜ao t´ıpico de uma cadeia composta por 250 res´ıduos, com 60%
de estruturas tipo folha-β, gerado pelo modelo com distribui¸ao de
largura δ = 0.1. (b) Mapa de Ramachandran para 100 simula¸oes
realizadas com os mesmos parˆametros da Figura 3.4 (a) . . . . . . . . 46
3.5 (a) Padr˜ao t´ıpico de uma cadeia composta por 250 res´ıduos, com
30% de estruturas tip o h´elice-α e 30% de estruturas tipo folha-β,
gerado pelo modelo com distribui¸ao de largura δ = 0.1. (b) Mapa
de Ramachandran para 100 simula¸oes realizadas com os mesmos
parˆametros da figura 3.5 (a) . . . . . . . . . . . . . . . . . . . . . . . 47
Tese de Doutorado - Departamento de F´ısica - UFPE
viii LISTA DE FIGURAS
3.6 Raio de gira¸ao m´edio em fun¸ao do n ´umero de res´ıduos obtidos por
simula¸ao com f = 0.60 para estruturas: elice-α (), misturadas
() e folhas-β () com exp oente de escala 0.401±0.002, 0.409±0.002
e 0.417 ± 0.002, respectivamente. As linhas tracejadas indicam a
regress˜ao linear. Em todos os casos as barras de erro ao menores
que os s´ımbolos e δ = 0.1. . . . . . . . . . . . . . . . . . . . . . . . 49
3.7 Dependˆencia do expoente de escala ν com a porcentagem das estru-
turas secund´arias f para motivos tipo: elice-αs (), folhas-β () e
misturadas (). Em todos os casos as barras de erro ao menores que
os s´ımbolos e δ = 0.1. A linha tracejada indica o valor experimental
ν
exp
0.405. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
3.8 Dependˆencia do expoente de escala ν, com a variˆancia δ da distri-
bui¸ao de probabilidade Gaussiana para os ˆangulos diedrais (em uni-
dades de π), para estruturas em elice-α. Considerando os valores de
f = 0(), f = 0.40(), f = 0.60(), f = 0.80() and f = 1.0(). A
linha tracejada horizontal indica o valor experimental ν
exp
0.405,
enquanto que a linha vertical indica o valor δ = 0.15, que minimiza
ν para qualquer valor de f. . . . . . . . . . . . . . . . . . . . . . . . . 51
3.9 Grandezas envolvidas na determina¸ao do “parˆametro de compacta¸ao”
γ para uma estrutura bidimensional arbitr´aria. Raio de gira¸ao R
g
(preto) e distˆancia axima D
max
(azul). . . . . . . . . . . . . . . . . 53
Tese de Doutorado
LISTA DE FIGURAS ix
3.10 Dependˆencia do parˆametro γ (mediado sobre 10
4
amostras) com a
porcentagem de estruturas secund´arias f para motivos tipo: h´elice-
αs (), folhas-β () e misturadas (). A linha tracejada indica o
valor aximo γ
max
, em todos os casos, para f = 0.60. A cadeia
inteira possui N = 250 res´ıduos e largura δ = 0.15. . . . . . . . . . 54
3.11 Histograma do parˆametro γ calculado para 1356 diferentes estruturas
globulares com 125 < N < 450 res´ıduos, extra´ıdas do PDB. Valor
m´edio da distribui¸ao γ
exp
= 0.32 ±0.02. Os dois picos mais pronun-
ciados correspondem aos valores N = 163 e N = 369. . . . . . . . . . 56
3.12 Histograma do tamanho N das 1356 diferentes estruturas globulares
utilizadas ao longo deste Cap´ıtulo. Os dois picos mais pronunciados
correspondem aos valores N = 162 e N = 372. . . . . . . . . . . . . . 57
3.13 Histograma do parˆametro γ calculado para as 1356 diferentes estru-
turas globulares, utilizadas no histograma da Figura 3.11, atraes
do modelo proposto com δ = 0.15 e com f = 60% de estruturas
tipo elice-α. Valor edio da distribui¸ao γ
f=0.60
= 0.32 ± 0.02. Os
dois picos mais pronunciados correspondem aos valores N = 162 e
N = 372. O valor de γ das estruturas simuladas ´e determinado por
m´edias para 10
4
estruturas similares aquelas reais. . . . . . . . . . . . 58
3.14 Figura esquem´atica exemplificando o alculo da distˆancia direta r
(vermelho) e do comprimento de contorno l
ij
, entre dois elementos
(azul) de uma estrutura bidimensional arbitr´aria. . . . . . . . . . . . 59
Tese de Doutorado - Departamento de F´ısica - UFPE
x LISTA DE FIGURAS
3.15 Comportamento do comprimento de contorno < l
c
>, como fun¸ao da
distˆancia direta r, mediado sobre 10
4
amostras, e com uma varia¸ao
da largura da distribui¸ao angular para trˆes valores δ = 0.00(),
δ = 0.15 () e δ = 0.15 (). Neste caso fixamos a fra¸ao de
estruras t´ıpicas f = 0.00. . . . . . . . . . . . . . . . . . . . . . . . . . 60
3.16 Comportamento do comprimento de contorno < l
c
>, como fun¸ao
da distˆancia direta r, com os mesmos parˆametros da figura 3.15. Aqui
fixamos a fra¸ao de estruturas t´ıpicas f = 0.60. . . . . . . . . . . . . 61
3.17 Comportamento de η como fun¸ao de δ para f = 0.00 (), f =
0.60 () e f = 1.00 (). Para cada ponto realizamos 10
4
amostras e
fixamos o n´umero de res´ıduos em N = 300. . . . . . . . . . . . . . . . 62
3.18 Exemplo do alculo do n ´umero de contatos para uma estrutura bi-
dimensional arbitr´aria. Nesta figura, o elemento indicado possui 28
contatos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
3.19 Comportamento do n´umero de contatos < n
c
>, como fun¸ao do
comprimento da cadeia N, para diversos valores da fra¸ao f . Em
todas as simula¸oes utilizamos como motivos apenas estruturas tipo
h´elice-α e mediamos sobre 10
4
amostras. As retas em preto ao ajustes
seguindo o comportamento de escala proposto na Equa¸ao 3.14. . . . 64
3.20 Comportamento do n´umero m´edio de coordena¸ao < z
c
> como
fun¸ao do comprimeto da cadeia N , para os mesmos parˆametros uti-
lizados na Figura 3.19. Observe o comportamento de satura¸ao para
grandes valores de N. . . . . . . . . . . . . . . . . . . . . . . . . . . 66
Tese de Doutorado
LISTA DE FIGURAS xi
3.21 Distribui¸oes dos valores do n´umero de coordena¸ao z
c
obtidas pelo
modelo para diversos valores da fra¸ao f = 0 (vermelho), f = 0.20
(azul), f = 0.40 (verde), f = 0.60 (laranja), f = 0.80 (ciano),
f = 1.00 (lil´as) e para 1356 diferentes estruturas extra´ıdas do PDB
(preto). Em todas as simula¸oes utilizamos 10
4
amostras, largura
δ = 0.15 e raio de contato r
c
= 7
˚
A. . . . . . . . . . . . . . . . . . . 67
3.22 Histogramas das distribui¸oes de energia (em u.a.) obtidas pelo mo-
delo para diversos valores da fra¸ao f = 0 (vermelho), f = 0.20 (azul),
f = 0.40 (verde), f = 0.60 (laranja), f = 0.80 (ciano), f = 1.00 (lil´as)
e para 1356 diferentes estruturas contidas no PDB (preto). Em todas
as simula¸oes utilizamos 10
4
amostras, δ = 0.15 e raio de contato
r
c
= 7
˚
A. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
4.1 S´eries temporais da energia potencial de polialaninas com diferentes
n´umeros de res´ıduos: N=10 (preto), N=12 (vermelho), N=15(verde),
N=17 (azul) e N=18 (laranja). Em todos os casos a temperatura final
de termaliza¸ao ´e T = 275K. . . . . . . . . . . . . . . . . . . . . . . . 82
4.2 S´eries temporais da energia potencial de polialaninas com diferentes
n´umeros de res´ıduos: N=10 (preto), N=13 (vermelho), N=15 (verde),
N=17 (azul) e N=18 (laranja). Em todos os casos a temperatura final
de termaliza¸ao ´e T = 300K. . . . . . . . . . . . . . . . . . . . . . . . 83
4.3 S´eries temporais da energia potencial de polialaninas com diferentes
n´umeros de res´ıduos: N=10 (preto), N=14 (vermelho), N=15 (verde),
N=17 (azul) e N=18 (laranja). Em todos os casos a temperatura final
de termaliza¸ao ´e T = 325K. . . . . . . . . . . . . . . . . . . . . . . . 84
Tese de Doutorado - Departamento de F´ısica - UFPE
xii LISTA DE FIGURAS
4.4 Detalhes da regi˜ao entre 2ns e 3ns, para s´eries temporais com N=10
res´ıduos e diferentes temperaturas de termaliza¸ao: T = 275K (preto),
T = 300K (vermelho) e T = 325K (azul). . . . . . . . . . . . . . . . 85
4.5 Energia potencial das polialaninas em fun¸ao do n´umero de res´ıduos,
em T = 275K. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
4.6 Energia potencial das polialaninas em fun¸ao do n´umero de res´ıduos,
em T = 300K. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
4.7 Energia potencial das polialaninas em fun¸ao do n´umero de res´ıduos,
em T = 325K. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
4.8 Comportamento de escala da flutua¸ao F
q
(s) em fun¸ao da escala s,
para as eries temporais de energia exibidas na Figura 4.1 (T = 275K). 94
4.9 (a) Expoentes de Hurst generalizados h(q) em fun¸ao de q. (b) Espec-
tro multifractal τ(q) em fun¸ao de q. Os dados referem-se `as poliala-
ninas cujas F
q
(s) ao mostradas na Figura 4.8. . . . . . . . . . . . . . 95
4.10 Comportamento de escala da flutua¸ao F
q
(s) em fun¸ao da escala s,
para as eries temporais de energia exibidas na Figura 4.2 (T = 300K). 96
4.11 (a) Expoentes de Hurst generalizados h(q) em fun¸ao de q. (b) Espec-
tro multifractal τ(q) em fun¸ao de q. Os dados referem-se `as poliala-
ninas cujas F
q
(s) ao mostradas na Figura 4.10. . . . . . . . . . . . . 97
4.12 Comportamento de escala da flutua¸ao F
q
(s) em fun¸ao da escala s,
para as eries temporais de energia exibidas na Figura 4.3 (T = 325K). 98
4.13 (a) Expoentes de Hurst generalizados h(q) em fun¸ao de q. (b) Espec-
tro multifractal τ(q) em fun¸ao de q. Os dados referem-se `as poliala-
ninas cujas F
q
(s) ao mostradas na Figura 4.12. . . . . . . . . . . . . 99
Tese de Doutorado
Lista de Tabelas
2.1 Classifica¸ao e nomenclatura dos 20 amino´acidos, sintetizados pelos
organismos vivos, por hidrofobicidade, hidrofilicidade e carga el´etrica. 12
3.1 Sete poss´ıveis pares para ˆangulos diedrais (Φ,Ψ) e suas conforma¸oes
associadas [86]. Configura¸oes em h´elice-α denotadas por A e folha-β
por B. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
3.2 Valores dos expoentes χ e resp ectivos desvios obtidos atrav´es da
rela¸ao de escala definida na Equa¸ao 3.14, como fun¸ao da fra¸ao
f . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
3.3 Valores dos n´umeros de coordena¸ao e respectivos desvios para as
distribui¸oes da Figura 3.21, como fun¸ao da fra¸ao f, e para 1356
estruturas do PDB . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
3.4 Valores das energias edias e desvios para as distribui¸oes da Figura
3.22, como fun¸ao da fra¸ao f , e para as 1356 estruturas do PDB . . 70
Cap´ıtulo 1
Introdu¸ao
“N˜ao devemos nos sentir desencorajados pela dificuldade de interpretar a vida a
partir das leis comuns da f´ısica.”
Erwin Schr¨odinger - O que ´e vida ?
Mais notadamente nas duas ´ultimas ecadas, a f´ısica, a mais “natural” de
todas as ciˆencias e a de menor contato com o ublico leigo em geral, tem participado
de um processo de intera¸ao com as demais ´areas do conhecimento. Tal processo de
intercˆambio que vai das ciˆencias sociais aplicadas como a economia [1] at´e as ciˆencias
biol´ogicas [2], passando pela imunologia [3, 4], pela psicof´ısica [5], pela sociologia
[6], pela lingu´ıstica [7] e pelo urbanismo [8], entre outras; tem permitido avan¸cos
ao o na descri¸ao e previs˜ao dos fenˆomenos destas ´areas, como tamb´em tem aju-
dado no desenvolvimento de uma erie de ferramentas te´oricas e experimentais que
possiblitam o desbravamento de novos e velhos problemas f´ısicos.
Com m´etodos comprovadamente eficazes desde os limites do mundo mi-
crosc´opico, como as dimens˜oes dos motores moleculares [9] ao mundo regido pelas
2
3
escalas astronˆomicas [10], as contribui¸oes da f´ısica mostram-se percept´ıveis e robu-
stas todas as vezes em que se faz necess´ario abordarmos os elementos constituintes de
um sistema e suas intera¸oes, atraes de uma linguagem matem´atica que possa for-
necer informa¸oes ao o qualitativas como quantitativas acerca do comportamento
macrosc´opico do sistema.
Neste contexto as colabora¸oes ocorridas entre a biologia e a f´ısica tem sido
um dos exemplos mais prof´ıcuos e emblem´aticos. Contribui¸oes historicamente im-
pactantes da f´ısica `a biologia remontam `as suas pr´oprias origens com as discuss˜oes
de Galileu a respeito da altura caracter´ıstica dos seres humanos [11], passa pe-
las observoes de Newton acerca da vis˜ao [12], chegando `as sugest˜oes de Erwin
Schr¨odinger que abririam o caminho para a biologia molecular [13].
Do eculo XVI at´e os dias atuais [2] ambos os campos desenvolveram-se ge-
rando uma grata intera¸ao que tem reunido, matem´aticos, epidemiologistas, f´ısicos,
virologistas, cientistas da computa¸ao, qu´ımicos, neurologistas, te´oricos evolucion´arios,
dentre outras tantas ´areas; todos em ´ultima an´alise movidos por perguntas funda-
mentais a cerca da vida como: Qual a sua origem? De que forma ela evoluiu at´e as
formas que conhecemos hoje? Quais as possibilidades de sua existˆencia sob outras
condi¸oes distintas das observadas na Terra? De que maneira e em que n´ıvel a-se
o processamento de sinais neurol´ogicos? Nesta tese abordaremos um dos aspectos
centrais de um dos constituintes asicos de todas as formas de vida conhecida: as
prote´ınas.
Diversas justificativas podem ser dadas na motivao de tal estudo. A pri-
meira trata-se fundamentalmente do impacto que a determina¸ao das estruturas
prot´eicas tem para a ind´ustria farmacˆeutica, uma vez que a ao dos chamados me-
dicamentos inteligentes est´a reladionada `a ancoragem dos agentes medicamentosos
Tese de Doutorado - Departamento de F´ısica - UFPE
4 Introdu¸ao
`as prote´ınas, como no caso dos inibidores de protease do HIV utilizados na terapia
de tratamento para a AIDS. A segunda ´e que se credita `a ocorrˆencia de diversas
doen¸cas [14, 15] como anemias falciformes, fibroses, catarata, mal de Alzheimer e
de Parkinson, bem como dist´urbios como o da encefalopatia espongiforme (“mal da
vaca louca”), `a a-forma¸ao das prote´ınas (“miss-folding”), o que impediria sua
correta fun¸ao no organismo [16]. Desta forma a elucida¸ao de tais doen¸cas passa
por uma profunda compreenss˜ao do que ocorre estruturalmente com as prote´ınas
em quest˜ao.
Al´em disso as analogias entre o problema biol´ogico e seu mapeamento em
problemas de cunho f´ısico, bem como a utiliza¸ao de ferramentas f´ısicas tornam o
assunto por si o interessante.
´
E importante lembrar que nas duas ´ultimas ecadas
a f´ısica, e em particular a denominada f´ısica da mat´eria condensada, respons´avel
pelo estudo das propriedades estruturais e de transporte em sistemas f´ısicos ma-
crosc´opicos, tem dado grandes contribui¸oes na caracteriza¸ao dos chamados sis-
temas macios [17]. Exemplos de sistemas desse tipo ao: os cristais l´ıquidos; os
pol´ımeros; os col´oides; e as emuls˜oes, que embora descritos por intera¸oes distintas,
ao caracterizados por uma intensa resposta quando estimulados por campos exter-
nos. Da mesma forma, as prote´ınas como heteropol´ımeros flex´ıveis, ao candidatas
potenciais a serem investigadas pelos etodos f´ısicos.
A primeira identifica¸ao das prote´ınas, como unidade fundamental biol´ogica,
´e creditada ao qu´ımico ons Jacob Berzelius (1779-1848) (ver Figura 1). Quando
nos seus estudos acerca da alimenta¸ao constatou que um ´oxido orgˆanico parecia
ser asico para a nutri¸ao animal, da´ı o nome origin´ario do grego πρωτιoξ que
significaria primevo, primitivo. Posteriormente, no in´ıcio do eculo XX, o qu´ımico
alem˜ao Emil Fischer (1825-1919) descobriu que as prote´ınas eram formadas por
Tese de Doutorado
5
cadeias pept´ıdicas, compostas por amino´acidos. Desde ent˜ao, muitos passaram a
atribuir ao sucesso da vida no planeta Terra, o trabalho conjunto de dois grupos
de macromol´eculas: o ADN acido dessoxiribonucl´eico) e as prote´ınas. O primeiro
respons´avel pelas instru¸oes de constru¸ao e opera¸ao das estruturas e o segundo
respons´avel pela constru¸ao per se [18], estabelecendo-se assim um esquema de “soft-
ware” (programa) e “hardware” (m´aquina).
Figura 1.1: ons Jacob Berzelius propositor da existˆencia das prote´ınas - 1838.
Em ´ultima an´alise seriam as prote´ınas as unidades respons´aveis pelas prin-
cipais atividades enzim´aticas, como no caso da lactase respons´avel pela digest˜ao da
lactose; pelo transporte e armazenamento de substˆancias, como no caso da hemoglo-
bina; pela regula¸ao e controle do sistema imunol´ogico, tarefa dos anticorpos; pela
contra¸ao dos m´usculos, oes da actina e miosina; pela transmiss˜ao dos impulsos
nervosos no interior das c´elulas, como por exemplo, a rodopsina receptora dos bas-
tonetes na retina; bem como no car´ater estrutural dos organismos nos ligamentos e
tend˜oes constitu´ıdos por col´ageno e queratina.
Para realizar adequadamente essas diferentes tarefas, acima citadas, as prote´ınas
adotam uma ´unica e bem definida configura¸ao tridimensional, ditada p or uma dada
sequˆencia de amino´aciodos, que recebe a denomina¸ao de estado enovelado ou nativo
Tese de Doutorado - Departamento de F´ısica - UFPE
6 Introdu¸ao
[19]. A determina¸ao e classifica¸ao dessas estruturas em sido um dos grandes de-
safios aos pesquisadores da ´area, pois exigem a utiliza¸ao de ecnicas exp erimentais
de boa resolu¸ao. Duas ecnicas tˆem dado grandes contribui¸oes neste sentido:a cris-
talografia de raios-X ou e a Ressonˆancia Magn´etica Nuclear(RMN)[19]. Aplica¸oes
dessas t´ecnicas tem possibilitado o aumento no umero de prote´ınas catalogadas
no WWPDB
1
(do inglˆes Worldwide Protein Data Banking). De fato esse n´umero
cresceu de 250 em 1988, para mais de 37392 na atualidade
2
, gra¸cas sobretudo `as
contribui¸oes oriundas de centros de pesquisa e universidades espalhadas em todo o
mundo
3
. No entanto, hoje, um paradigma se apresenta em rela¸ao `as pesquisas na
´area de biologia molecular, que pode ser resumidamente exposto da seguinte forma:
como dar um passo al´em?, ou seja, como ao apenas catalogar, mas, acima de tudo,
prever a estrutura das prote´ınas e constru´ı-las para um prop´osito espec´ıfico?
Nesta Tese, apresentaremos duas abordagens para discutir a importante
quest˜ao do enovelamento das prote´ınas. Na primeira, proporemos uma metodologia
para constru¸ao de cadeias prote´ıcas com um controlado processo de forma¸ao de
estruturas secund´arias. Na segunda, combinaremos recursos da dinˆamica molecular
e da an´alise estat´ıstica multifractal, para analisarmos propriedades estat´ısticas asso-
ciadas `as flutua¸oes, presentes em eries temporais de energia potencial de prote´ınas.
A Tese est´a organizda da seguinte maneira: No Cap´ıtulo 2, descreveremos as prin-
cipais caracter´ısticas dos sistemas prot´eicos, procurando relacion´a-las ao problema
do enovelamento prot´eico [20] e discutiremos os principais modelos propostos para
abordagem desse problema. No Cap´ıtulo 3, apresentamos uma abordagem espa-
cial simples, para a constru¸ao de pol´ımeros que possuem arias das caracter´ısticas
1
http://www.wwp db.org
2
27 de Junho de 2006
3
Research Collaboratory for Strutctural Bioinformatics - http://www.rcsb.org
Tese de Doutorado
7
estruturais de prote´ınas reais. Diversas grandezas, tais como: o raio de gira¸ao,
o n´umero de contatos e a energia de intera¸ao entre os mesmos, ser˜ao obtidas e
analisadas [21, 22]. No Cap´ıtulo 4, estudamos uma proposta para a caracteriza¸ao
multifractal das eries temporais, da energia conformacional de prote´ınas, obtidas
por meio da dinˆamica molecular de sistemas prot´eicos [23]. No Cap´ıtulo 5, apresen-
tamos nossas conclus˜oes gerais e perspectivas. No Apˆendice A, derivamos resultados
anal´ıticos associados ao expoente de escala ν do modelo de Flory e no Apˆendice B,
apresentamos o sistema de coordenadas utilizado no modelo do caminhante Gaus-
siano.
Tese de Doutorado - Departamento de F´ısica - UFPE
Cap´ıtulo 2
Caracter´ısticas Gerais dos
Sistemas Prot´eicos
“... come¸car pelo princ´ıpio, como se esse princ´ıpio fosse a ponta sempre invis´ıvel
de um fio mal enrolado que bastasse puxar e ir puxando at´e chegarmos `a outra
ponta, a do fim, e como se, entre a primeira e a segunda, tiv´essemos tido nas aos
uma linha lisa e cont´ınua em que ao havia sido preciso desfazer os nem
desenredar estrangulamentos, coisa imposs´ıvel de acontecer na vida dos novelos e,
se uma outra frase de efeito ´e permitida, nos novelos da vida.”
Jos´e Saramago - A caverna
2.1 Caracter´ısticas gerais dos sistemas prot´eicos
A despeito de toda variedade de organismos vivos existentes, o processo da
vida tal como conhecemos na Terra e como procuramos encontrar em outros pontos
do Cosmo, baseia-se numa unidade qu´ımica denominada amino´acido. Do ponto de
8
2.1 Caracter´ısticas gerais dos sistemas prot´eicos 9
vista funcional cada amino´acido ´e um elemento com caracter´ısticas pr´oprias como:
massa, carga, tamanho e hidrofobicidade que determinam as diferentes e poss´ıveis
estruturas denominadas prote´ınas. Essas “composi¸oes” de amino´acidos ao deter-
minantes na execu¸ao de fun¸oes que proeem a manuten¸ao da grande estrutura
que pode definir um organismo vivo.
Do ponto de vista qu´ımico um amino´acido ´e uma mol´ecula constitu´ıda por
um carbono central C
α
conectado a um ´atomo de hidrogˆenio (H); um grupo amina
(NH
2
); um grupo ´acido carbox´ılico (COOH) e um radical orgˆanico R, como ilus-
trado na Figura 2.1. A principal propriedade que determina as caracter´ısticas estru-
turais dos amino´acidos e, portanto, das prote´ınas ´e a hidrofobicidade (ap olaridade)
ou hidrofilicidade (polaridade) do radical orgˆanico R, que est´a conectado ao carbono
central denominado carbono-C
α
, o qual mant´em, por sua vez, duas liga¸oes simp-
les: uma com o nitrogˆenio (N) do grupo amina e outra com o carbono C
c
do grupo
carbox´ılico. Um res´ıduo ´e composto por um radical R e pelos ´atomos que fazem
parte da cadeia principal da prote´ına. Finalmente devemos ressaltar que embora
sejam conhecidos cerca de 100 amino´acidos, apenas 20 destes ao geneticamente
codificados, sendo portanto encontrados em todos os seres vivos.
A s´ıntese prot´eica ocorre quando um res´ıduo conecta-se a outro por meio
de uma liga¸ao pept´ıdica; tal liga¸ao consiste de um condensamento do grupo
carbox´ılico C
c
de um amino´acido ao grupo amina N do amino´acido seguinte, libe-
rando assim uma mol´ecula de ´agua ( H
2
O). A repeti¸ao de tal processo por meio
de sucessivas liga¸oes pept´ıdicas cria uma estrutura denominada cadeia principal ou
“esqueleto” (“backbone”) da prote´ına. Na Figura 2.2 apresentamos os vinte tipos
de amino´acidos existentes, enquanto que na Tabela 2.1 listamos sua nomenclatura,
separados em trˆes grupos: o primeiro constitu´ıdo por amino´acidos hidrof´ılicos (po-
Tese de Doutorado - Departamento de F´ısica - UFPE
10 Caracter´ısticas Gerais dos Sistemas Prot´eicos
Figura 2.1: Estrutura qu´ımica dos amino´acidos.
lares), o segundo por grupos eletricamente carregados e o terceiro por amino´acidos
hidrof´obicos (apolares)
1
.
Os amino´acidos formados pelos trˆes grupos, acima citados, ao mol´eculas
quirais, ou seja, podem existir em duas diferentes formas, denominadas lev´ogira
(forma-L) e dextr´ogira (forma-D), em que uma ´e a imagem especular da outra. Na
natureza apenas as formas lev´ogiras ao encontradas. Este fato ´e um dos grandes
enigmas
2
que ainda permeiam a qu´ımica e que parece possuir conex˜ao estreita com
a origem da vida em nosso planeta [18, 24]. Uma vez que o funcionamento dos
sistemas biol´ogicos est´a conectado com a especificidade estrutural das prote´ınas a
existˆencia dos dois tipos L e D poderia acarretar em deficiˆencias no organismo.
2.1.1 Liga¸oes qu´ımicas fundamentais
A princ´ıpio todos os potenciais e, consequentemente, as for¸cas envolvidas
1
O amino´acido Glicina (G=Gly), omitido na tab ela 2.1 ´e constituido por apenas um ´unico
´atomo de hidrogˆenio e possui caracter´ısticas especiais de forma que muitas vezes ´e considerado um
quarto grupo.
2
Do ponto de vista das for¸cas que unem as mol´eculas ao a distin¸ao entre uma forma ou
outra
Tese de Doutorado
2.1 Caracter´ısticas gerais dos sistemas prot´eicos 11
Figura 2.2: Rela¸ao dos 20 amino´acidos codificados pelos organismos vivos.
na estabiliza¸ao conformacional das prote´ınas ao de natureza eletrost´atica e en-
contram descri¸ao quˆantica, de modo que o problema poderia, em princ´ıpio, ser
sol´uvel exatamente. No entanto, esse procedimento torna-se impratic´avel do ponto
de vista qu´ımico, uma vez que o n´umero de res´ıduos constituintes de uma prote´ına
pode alcan¸car a ordem de centenas, neste contexto falamos de liga¸oes qu´ımicas
efetivas. Para entendermos melhor essa quest˜ao; inicialmente vamos estabelecer a
Tese de Doutorado - Departamento de F´ısica - UFPE
12 Caracter´ısticas Gerais dos Sistemas Prot´eicos
Classifica¸ao Nomenclatura
Hidrof´ılicos Serina (S=Ser), Ciste´ına (C=Cys),
Tirosina (Y=Tir), Asparagina (N=Asn)
Glutamina (Q=Gln), Triptofano (W=Trp)
e Teronina (T=Thr)
Hidrof´obicos Alanina (A=Ala), Valina (V=Val), Fenilalanina (F=Phe),
Prolina (P=Pro), Metionina (M=Met),
Isoleucina (I=Ile) e Leucina (L=Leu)
Eletricamente
carregados
´
Acido Asp´artico (D=Asp),
´
Acido Glutˆamico (E=Glu),
Lisina (K=Lis), Arginina (R=Arg) e Histidina (H=His)
Tabela 2.1: Classifica¸ao e nomenclatura dos 20 amino´acidos, sintetizados pelos
organismos vivos, por hidrofobicidade, hidrofilicidade e carga el´etrica.
escala de energia e as unidades utilizadas nesses sistemas. Frequente, trabalha com
unidades de kilocaloria por mol (kcal/mol)
3
. Uma boa maneira de termos uma
id´eia da ordem de grandeza com estes valores ´e observarmos que o corpo humano a
uma temperatura de 310K (37C
) corresponderia a uma energia de 0,642kcal/mol
e que o banho t´ermico de uma sala `a 298K (25C
) corresponderia a uma energia
de 0,617kcal/mol, esta equivalˆencia pode ser feita por meio da express˜ao k
B
T onde
k
B
´e a constante de Boltzmann e T ´e a temperatura absoluta do sistema. Esta-
belecido o padr˜ao passaremos agora a examinar as for¸cas [25, 26] e os tipos de
liga¸oes qu´ımicas envolvidas, bem como seus valores t´ıpicos. As liga¸oes qu´ımicas e
intera¸oes associadas a estabilidade estrutural das prote´ınas ao:
Liga¸oes covalentes: Dentre as intera¸oes presentes na estabiliza¸ao estrutu-
ral das prote´ınas as liga¸oes covalentes ao as mais intensas
4
, com energias ab-
rangendo varia¸oes entre 50 - 250 kcal/mol. Estas liga¸oes ao as respons´aveis
3
para converter em el´etron-volts utilizar o fator 1eV = 23.06 kcal/mol
4
para quebrar liga¸oes dessa ordem por meio de radia¸ao necessitar´ıamos incidir ondas eletro-
magn´eticas na faixa de ultra-violeta ( 10
15
Hz)
Tese de Doutorado
2.1 Caracter´ısticas gerais dos sistemas prot´eicos 13
pela intera¸ao entre res´ıduos que ao se encontram pr´oximos na sequˆencia dos
amino´acidos, mas que se aproximam no estado enovelado, como no caso das
pontes dissulf´ıdicas que ao formadas por dois ´atomos de enxofre presentes em
diferentes partes da estrutura tridimensional. Tipicamente originadas de dois
res´ıduos de Ciste´ınas, as pontes dissulf´ıdicas ao constru´ıdas a partir do pro-
cesso de oxida¸ao em que ´atomos de enxofre adjacentes “perdem” seus ´atomos
de hidrogˆenio como descrito esquematicamente abaixo:
2(CH
2
SH) + 1/2O
2
CH
2
S S CH
2
+ H
2
O. (2.1)
Efeitos Eletrost´aticos: Na Tabela 2.1 observamos que cinco dos vinte amino´acidos
geneticamente codificados possuem carga l´ıquida. Estas cargas est˜ao expostas
`a ao de solventes, comumente a ´agua, e de momentos de dipolo de outras
mol´eculas, ou at´e mesmo de outros amino´acidos como, por exemplo, os hi-
drof´ılicos. Para se ter uma id´eia dos valores t´ıpicos desses momentos de dipolo
vale a pena observar que a mol´ecula da ´agua possui um momento de dipolo
de 1.85D
5
. Outra fonte de carga l´ıquida na estrutura prot´eica prov´em do des-
balanceamento espacial de el´etrons, nas liga¸oes covalentes, este desequil´ıbrio
tem sua origem nas diferentes eletronegatividades dos elementos que formam
os amino´acidos. Os dipolos p ept´ıdicos ao uma das grandes contribui¸oes para
a estabilidade local de macromol´eculas biol´ogicas. As energias associadas a es-
tes efeitos eletrost´aticos ao descritos pelo potencial Coulombiano:
V
ele
=
1
4π
r
i<j
q
i
q
j
r
ij
, (2.2)
5
Um pr´oton de carga +e separado de um el´etron de carga -e por uma distˆancia de 1
˚
A possui
momento de dipolo de aproximadamente 4.8 Debye.
Tese de Doutorado - Departamento de F´ısica - UFPE
14 Caracter´ısticas Gerais dos Sistemas Prot´eicos
onde o somat´orio inclui as contribui¸oes entre pares de ´atomos i e j, nas
posi¸oes r
ij
representa suas distˆancias relativas, q
i
eq
j
suas respectivas cargas
e
r
´e a constante diel´etrica do meio. Esta constante pode ter valores muito
distintos dependendo do meio em que as cargas se encontrem. A ´agua p or
exemplo, principal solvente biol´ogico, possui uma constante diel´etrica pr´oxima
a 80, enquanto que no interior de uma prote´ına esse valor cai para cerca de 4.
Tal varia¸ao faz com que o potencial Coulombiano entre dois ´atomos separados
por uma distˆancia de 4
˚
A tenha um valor de 1kcal/mol na ´agua e de 20kcal/mol
no interior de uma prote´ına. Em abordagens tipo dinˆamica molecular para
descrever o movimento de uma prote´ına [27], o valor da constante diel´etrica
desempenha fator decisivo e deve ser minuciosamente modelada afim de evitar
divergˆencias num´ericas.
Liga¸oes ponte de hidrogˆenio: Como pode ser observado na estrutura do
radical orgˆanico R, que determina os amino´acidos presentes na prote´ına, os
´atomos de hidrogˆenio H encontram-se ligados por meio de liga¸oes covalen-
tes a elementos fortemente eletronegativos como nitrogˆenio (N), oxigˆenio O e
enxofre S. Devido a rela¸ao entre a eletronegatividade destes elementos e a ele-
tropositividade do hidrogˆenio H, se estabelece um desbalanceamento espacial
de carga que se traduz num momento de dipolo efetivo. A intera¸ao entre este
momento de dipolo e um ´atomo parcialmente negativo em suas proximidades
´e denominada liga¸ao de hidrogˆenio, ou ponte de hidrogˆenio. O alcance desta
intera¸ao, ou seja, a distˆancia caracter´ıstica entre um ´atomo doador e outro
aceitador de carga ´e tipicamente da ordem de 3.5
˚
A e sua intensidade ´e da
ordem de 1-7 kcal/mol.
Intera¸oes de van der Waals: ao exemplos t´ıpicos de liga¸oes qu´ımicas
Tese de Doutorado
2.1 Caracter´ısticas gerais dos sistemas prot´eicos 15
efetivas, compostas pela combina¸ao de duas intera¸oes: uma primeira repul-
siva de curto alcance e uma segunda atrativa de longo alcance. Do ponto de
vista fundamental a primeira intera¸ao ´e de origem quˆantica, e resulta da re-
puls˜ao das nuvens eletrˆonicas, devido ao Princ´ıpio da Exclus˜ao de Pauli e a
da for¸ca eletrost´aticas entre os n´ucleos atˆomicos. A segunda intera¸ao resulta
das flutua¸oes quˆanticas do momento de dipolo dos ´atomos. Intera¸oes de van
der Waals tˆem um comprimento caracter´ıstico
6
da ordem de 1.2
˚
A- 2.2
˚
A e
um valor m´ınimo de energia em torno da energia ermica, ou seja, da ordem
de d´ecimos de kcal/mol e ao descritas por:,
V
vdw
=
i<j
C
12
(ij)
r
12
ij
C
6
(ij)
r
6
ij
, (2.3)
onde r
ij
representa a distˆancia entre os ´atomos i e j dentro da estrutura e o
somat´orio leva em conta todos os pares de ´atomos. Embora menos intensas
que as intera¸oes discutidas anteriormente, as intera¸oes tipo van der Waals
possuem um importante ingrediente de exclus˜ao, que restringe o n´umero de
configura¸oes acess´ıveis `as prote´ınas
7
. Tal efeito pode se acentuar caso este-
jamos tratando de muitos contatos formados, o que ocorre quando superf´ıcies
moleculares complementares interagem, num mecanismo tipo chave-fechadura.
2.1.2 Forma¸oes estruturais t´ıpicas
Como discutido acima, as intera¸oes de van der Waals levam a uma restri¸ao
no n´umero de possibilidades dos arranjos espaciais entre amino´acidos consecuti-
vos. Aliado a este fato devemos observar que as liga¸oes pept´ıdicas ao planares,
6
Denominado raio de van der Waals.
7
Este efeito de exclus˜ao possui o nome ecnico de efeito est´erico.
Tese de Doutorado - Departamento de F´ısica - UFPE
16 Caracter´ısticas Gerais dos Sistemas Prot´eicos
de modo que rota¸oes em torno dos grupos N-C
α
e C
α
-C
c
de amino´acidos con-
secutivos, possuem valores espec´ıficos. Estas rota¸oes ao descritas por meio dos
chamados ˆangulos diedrais ou de tor¸ao associados com a rota¸ao do plano formado
por 4 ´atomos (O,N,C,H), em rela¸ao `a dire¸ao da cadeia principal da prote´ına. O
ˆangulo diedral que corresp onde `a rota¸ao em torno da liga¸ao N-C
α
´e denominado
Φ, enquanto que o correspondente `a liga¸ao C
α
-C
c
´e denominado Ψ, conforme a
Figura 2.3. A distribui¸ao dos valores desses ˆangulos, como exposta na Figura 2.4,
apresenta um car´ater universal, na medida em que todas as prote´ınas conhecidas
podem ser classificadas dentro de determinados grupos ou formas t´ıpicas. Primeira-
mente estabelecida pelo biof´ısico indiano G. N. Ramachandran, a distribui¸ao dos
valors de ΦeΨ, denominado mapa de Ramachandran [28, 29, 30] constitui-se hoje
numa das caracteriza¸oes quantitativas mais importantes no estudo conformacional
de prote´ınas.
Figura 2.3: Valores dos ˆangulos de tor¸ao Φ e Ψ envolvidos nas liga¸oes pept´ıdicas.
Morfologicamente as prote´ınas podem ser classificadas como: globulares
(estruturas esf´ericas) e fibrosas (morfologia tipo bast˜ao, formada por arias cadeias
prote´ıcas). Nesta Tese trataremos basicamente de cadeias de prote´ınas globulares,
cujo n´umero de amino´acidos est´a entre 50 e 500 res´ıduos, o que corresponderia a uma
Tese de Doutorado
2.1 Caracter´ısticas gerais dos sistemas prot´eicos 17
Figura 2.4: Mapa de Ramachandran exibindo regi˜oes permitidas para os valores de
Φ e Ψ nas estruturas prot´eicas
escala de comprimento que varia entre 25
˚
A e 100
˚
A. As prote´ınas globulares podem
existir em quatro diferentes conforma¸oes: nativa (ordenada), “agregado globular”,
“pr´e-agregado globular” e desenovelada. Embora possamos observar uma distin¸ao
morfol´ogica entre globulares e fibrosas em ambos, podemos identificar “motivos” ou
n´ıveis estruturais comuns a todas as prote´ınas:
1. Estrutura Prim´aria: corresponde a sequˆencia de amino´acidos que defines
as prote´ınas. Prote´ınas podem ser comparadas com rela¸ao `as suas sequˆencias
prim´arias, por uma t´ecnica denominada de homologia, utlizada para deter-
minar qu˜ao similar uma estrutura prot´eica ´e de outra. Similaridades entre
polipept´ıdeos podem existir gra¸cas a permanˆencia de estruturas selecionadas
pela evolu¸ao biol´ogica dos organismos.
2. Estrutura Secund´aria: devido `a intera¸ao hidrof´obica entre a ´agua, que
envolve a prote´ına, e grupos que a comp˜oem, certos grupos de amino´acidos
agrupam-se de forma a criarem dom´ınios os quais ao caracterizados por
Tese de Doutorado - Departamento de F´ısica - UFPE
18 Caracter´ısticas Gerais dos Sistemas Prot´eicos
possu´ırem um n´ucleo hidrof´obico, uma superf´ıcie hidrof´ılica e curta dimens˜ao
espacial
8
. Estes padr˜oes regulares ao formados por liga¸oes tipo ponte de
hidrogˆenio entre a cadeia principal e os grupos NH e C
c
O; correspondendo a
valores espec´ıficos para o par de ˆangulos Φ e Ψ no mapa de Ramachandran.
Estes arranjos espaciais recebem nomes particulares:
h´elice-α: estruturas cl´assicas da biologia molecular, ao elas as formas
preditas por Linus Pauling (em 1951) e, independentemente, pela dupla
James Watson e Francis Crick (em 1953) como sendo os padr˜oes ener-
geticamente favor´aveis `a existˆencia do DNA [31]. As h´elices-α foram
experimentalmente comprovadas, em 1958, por meio de t´ecnicas de cris-
talografia de baixa resolu¸ao para a mioglobina, por Max Perutz e, pos-
teriormente, com alta resolu¸ao por John Kendrew em 1958. De acordo
com o mapa de Ramachandran, as h´elices-α corresponderiam a regi˜ao
localizada no terceiro quadrante = 60
e Ψ = 40
) da Figura 2.4.
Outros parˆametros que caracterizam as elices ao: seu comprimento,
de aproximadamente 15
˚
A, seu umero de res´ıduos, em torno de 3.6
(res´ıduos/passo) e o passo da elice
9
, que ´e da ordem de 5.4
˚
A. Como to-
dos os ´atomos de hidrogˆenio dentro da elices- α est˜ao alinhados na mesma
dire¸ao, os momentos de dipolo formados em cada amino´acido somam-se,
de forma que toda a estrutura se comporta como um grande momento
de dipolo. Devido a hidrofobicidade e a eletronegatividade caracter´ıstica
de cada amino´acido, apenas alguns dos 20 listados na Tabela 2.1 ao pre-
ferencialmente observados na forma¸ao de uma estrutura tipo αelice;
estando a alanina, o ´acido glutˆamico, a leucina e a metionina no grupo
8
Quando comparados ao tamanho da prote´ına como um todo
9
Tecnicamente a altura caracter´ıstica de uma volta (passo) ´e recebe o nome em inglˆes de pitch.
Tese de Doutorado
2.1 Caracter´ısticas gerais dos sistemas prot´eicos 19
dos melhores formadores. A Figura 2.5 ilustra representa¸oes azimutais
(c) e laterais (a,b,d) de uma estrutura secund´aria tipo αelice.
Figura 2.5: Diferentes representa¸oes de uma estrutura secund´aria em h´elice-α
fita-β: estruturas compostas de 5 a 10 res´ıduos e que ao determinadas
por ˆangulos presentes no segundo quadrante do mapa de Ramachandran
tipicamente cujos valores est˜ao entre Φ = 117
e Ψ = 142
. Compara-
tivamente `as elices-α, os motivos tipo fita-β ao bem menos compactos,
apresentando-se com uma morfologia de fita, as quais podem se alinhar
paralelamente ou anti-paralelamente, formando padr˜oes, topologicamente
similares a um plano, denominados folhas-β. Junto com as estruturas em
h´elice perfazem aproximadamente 60% do total de motivos tipicamente
observados nas prote´ınas
10
. Na Figura 2.6 ilustramos esquematicamente,
uma estrutura secund´aria tipo folha-β.
10
Consultar http://en.wikipedia.org/wiki/Secondary structure.
Tese de Doutorado - Departamento de F´ısica - UFPE
20 Caracter´ısticas Gerais dos Sistemas Prot´eicos
Figura 2.6: Estrutura secund´aria em folha-β e suas configura¸oes paralela e anti-
paralela
3. Estrutura Terci´aria: a unidade fundamental da estrutura terci´aria ´e um
dom´ınio, que pode ser definido como uma cadeia polipet´ıdica ou parte da
mesma, ou seja, essencialmente um dom´ınio ´e uma estrutura secund´aria. Em
geral, o conjunto formado pelos dom´ınios globulares ao estabilizados p elo
empacotamento de motivos, elice-α e/ou folha-β, ligados por pontes dis-
sulf´ıdicas. Estruturas terci´arias possuem tipicamente 200 amino´acidos e ao de
crucial entendimento no processo de enovelamento, uma vez que cada dom´ınio
pode se empacotar separadamente. As conex˜oes entre estruturas secund´arias
ao feitas pelas denominadas regi˜oes de loop, de formas irregulares e de ta-
manhos diversos. A Figura 2.7 mostra uma estrutura terci´aria esquem´atica,
composta de h´elices-α, fitas-β e loops.
4. Estrutura Quatern´aria: num n´ıvel hier´arquico crescente, chegamos `a com-
posi¸ao de arias estruturas terci´arias determinando o que ´e denominado de
estrutura quatern´aria. Estes complexos globulares consistem de dois (d´ımero),
trˆes (tr´ımero), quatro (tetrˆamero) ou mais prote´ınas individuais; e podem ser
classificados como homom´erico ou heterom´erico, caso sejam constitu´ıdos por
Tese de Doutorado
2.1 Caracter´ısticas gerais dos sistemas prot´eicos 21
Figura 2.7: Estrutura terci´aria composta por h´elices-α, folhas-β e loops
um ´unico tipo ou mais tipos de cadeias de prote´ınas. Embora pare¸ca estranho
falar de uma prote´ına composta por prote´ınas, lembramos que esta classifica¸ao
´e esquem´atica, pois na realidade a prote´ına ´e a estrutura que desempenha uma
fun¸ao espec´ıfica. Um caso cl´assico de estudo e bastante elucidativo ´e a he-
moglobina, um hetero-tetrˆamero composto por quatro “prote´ınas” distintas,
duas elices-α, duas folhas-β e seus loops, como mostrado esquematicamente
na Figura 2.8.
Finalizando esta se¸ao, destacamos ainda que `a luz dos n´ıveis estruturais,
discutidos acima, vemos que o estado denominado “agregado globular”, caracteriza-
se pela ausˆencia de uma cooperatividade da estrutura terci´aria da prote´ına, o que
implica num raio hidrodinˆamico, em m´edia, 15% maior que o da estrutura nativa
implicando num acr´escimo de 50% em seu volume. Pelos mesmos argumentos
o estado “pre-agregado globular” seria caracterizado por uma estrutura terci´aria
“derretida” onde apenas aproximadamente 50% dos motivos secund´arios da estrut-
ura nativa final estariam presentes. Observamos ainda que, existem ind´ıcios de que
a chave para o entendimento da estrutura prot´eica encontra-se em sua estrutura
Tese de Doutorado - Departamento de F´ısica - UFPE
22 Caracter´ısticas Gerais dos Sistemas Prot´eicos
Figura 2.8: Representa¸ao de uma hemoglobina exibindo suas cadeias de prote´ınas
constituintes.
Figura 2.9: Diagramas esquem´aticos das prote´ınas, exibindo os quatro n´ıveis estru-
turais.
prim´aria. Sob este aspecto cada prote´ına pode ser entendida como uma palavra
constru´ıda a partir de um alfabeto de 20 letras (amino´acidos). Embora essa ana-
logia pare¸ca tentadora, ´e importante observar que cada palavra isoladamente ao
Tese de Doutorado
2.1 Caracter´ısticas gerais dos sistemas prot´eicos 23
traz informa¸ao relevante `a semˆantica desse texto biol´ogico, o que est´a intimamente
ligada ao contexto (meio) em que se encontra [32, 33, 34]. Na Figura 2.9, resumimos
a composi¸ao estrutural das prote´ınas mostrando sequencialmente sua hierarquia
estrutural.
2.1.3 A hipersuperf´ıcie de energia e a hip´otese termodinˆamica
´
E importante observar que o padr˜ao espacial da estrutura prot´eica ´e uma
consequˆencia direta das intera¸oes f´ısicas de atra¸ao e repuls˜ao entre as cargas que
comp˜oem a mol´ecula e destas com as existentes no meio onde a mesma se encon-
tra imersa. Neste processo cada ´atomo se compromete a satisfazer um princ´ıpio de
minimiza¸ao da energia da estrutura como um todo, mesmo que localmente se veja
obrigado a estar submetido a um potencial mais elevado. Essa “frustra¸ao”, t´ıpica
de sistemas com muitas part´ıculas, em outros problemas de interesse f´ısico como nos
vidros de spin [35, 36]. Nestes sistemas, os momentos magn´eticos
11
com intera¸oes
ferro e antiferromagn´eticas, competem de modo a atingir uma configura¸ao de me-
nor energia, em contraposi¸ao `as flutua¸oes ermicas. Isto significa que, todos os
´atomos ou momentos magn´eticos que os representam ao podem localmente satisfa-
zer uma configura¸ao que minimize a energia com todos os elementos constituintes
do sistema. No caso magn´etico o n´umero de configura¸oes estruturais poss´ıveis de
serem geradas cresce exponencialmente com o n´umero de elementos envolvidos, de
forma que, num processo de resfriamento, o sistema pode se encontrar preso em
m´ınimos locais de energia do sistema. Estes estados, denominados meta-est´aveis,
encontram-se separados por barreiras de energia com altura infinita e entrela¸cados
em uma estrutura hier´arquica.
11
A origem de tais momentos magn´eticos ´e puramente quˆantica.
Tese de Doutorado - Departamento de F´ısica - UFPE
24 Caracter´ısticas Gerais dos Sistemas Prot´eicos
Uma elucidativa analogia mecˆanica para tais tipos de problemas, consiste
em imaginar a hipersuperf´ıcie de energia corresp ondente a cada uma das diversas
configura¸oes como sendo uma paisagem topogr´afica inundada formada por vales
de diversas profundidades. Quando a estrutura encontra-se totalmente inundada a
part´ıcula ao enxerga qualquer um dos vales. Contudo `a medida que o n´ıvel da
´agua baixa (correspondendo a uma diminui¸ao da temperatura) a part´ıcula pode fi-
car armadilhada num dos tantos vales que comp˜oem a estrutura. Nesse quadro uma
temperatura elevada pode ser identificada a um estado paramagn´etico do sistema
magn´etico ou a uma mol´ecula totalmente desenovelada. Enquanto que baixas tem-
peraturas corresponderia a um estado ordenado ou ao “estado-nativo”, ou enovelado
da prote´ına.
Figura 2.10: Representa¸ao da hipersuperf´ıcie de energia potencial caracter´ıstica
das prote´ınas
Ao longo da Tese, utilizamos a palavra enovelada ou desenovelada referindo-
se ao estado estrutural de uma prote´ına, mas sem indicarmos com precis˜ao do que
Tese de Doutorado
2.1 Caracter´ısticas gerais dos sistemas prot´eicos 25
se trataria. Tecnicamente define-se enovelamento como sendo o processo no qual
uma prote´ına assume uma forma tridimensional espec´ıfica, denominada tamb´em de
estado nativo, que a permite realizar sua fun¸ao biol´ogica. Uma prote´ına, assim
como outros tipos de heteropol´ımeros, podem enovelar-se ou desenovelar-se reversi-
velmente, por mudan¸cas causadas pelo pH do meio aquoso, onde se encontre, ou por
varia¸oes da temperatura desse meio. Neste caso, as prote´ınas usualmente perdem
suas atividades biol´ogicas e ao denominadas denaturadas. Embora existam estu-
dos, para o problema da denatura¸ao, desenovelamento parcial ou total da prote´ınas,
desde a d´ecada de trinta [37, 38, 39], foi somente a partir da ecada de cinquenta que
os trabalhos de Anfisen [40] e outros levaram `a formula¸ao da chamada “hip´otese
termodinˆamica”, que estabeleceria bases quantitativas para a explica¸ao do enove-
lamento.
Em linhas gerais, essa hip´otese afirma que a informa¸ao contida na sequˆencia
de amino´acidos (estrutura prim´aria) determinaria sua estrutura enovelada e que
esta corresponderia a um m´ınimo global da energia livre configuracional do hetero-
pol´ımero. Aparentemente, existem algumas exce¸oes a esta regra, mas estas parecem
ser atribu´ıdos a estados meta-est´aveis, armadilhados cineticamente durante o eno-
velamento [41]. Um caso intrigante que difere conceitualmente da referˆencia [41]
consiste de uma fam´ılia de prote´ınas nativas intrinsecamente desenoveladas que ao
possuem propriedades estruturais uniformes [42].
Termodinamicamente as contribui¸oes relevantes para caracterizarmos a se-
para¸ao energ´etica entre os estados enovelado (nativo) e desenovelado (denaturado)
de uma prote´ına ao: a Entalpia e a Entropia. A primeira deriva das ener-
gias envolvidas nas liga¸oes ao-covalentes entre os pept´ıdeos (essencialmente as
intera¸oes hidrof´obicas, liga¸oes de hidrogˆenio e onicas).
´
E sabido que as liga¸oes
Tese de Doutorado - Departamento de F´ısica - UFPE
26 Caracter´ısticas Gerais dos Sistemas Prot´eicos
covalentes diferem muito pouco entre o estado nativo e denaturado, as liga¸oes
ao-covalentes exibem um comportamento bem diverso, sendo muito intensas e de
longo alcance no caso nativo e quase que irrelevantes no caso denaturado. Enquanto
que a entropia conformacional possui valores baixos no caso nativo, uma vez que
a organiza¸ao estrutural ´e elevada, e muito elevados no caso denaturado, devido
a desordem, tamb´em denominado “random-coil”.
´
E importante ressaltar que para
que a entropia diminua na prote´ına o valor desta grandeza no meio deve se elevar.
A ordem de grandeza da barreira de energia que separa estes dois estados,
denominada energia livre, ´e da ordem de 5 - 15kcal/mol, um valor t´ıpico de algumas
pontes de hidrogˆenio. Contudo esta pequena diferen¸ca energ´etica ´e um resultado
envolvendo dois grandes n´umeros, comumente da ordem de centenas de kcal/mol.
´
E importante notar que na ausˆencia de algum fator que compense a entropia, o
sistema tenderia a estar no estado denaturado, entropicamente mais favor´avel, assim
a estabilidade da estrutura prot´eica, ´e assegurada por um ajuste qu´ımico, envolvendo
varia¸oes de pH e temperatura do meio. Se do ponto de vista da previs˜ao estrutural
tal comportamento mostra-se tecnicamente complicado, ´e importante observar que
isso assegura o sucesso da vida, uma vez que o funcionamento do organismo ao
deve envolver um elevado gasto energ´etico para transformar prote´ınas de uma forma
funcional para outra.
A quest˜ao que se coloca ´e a seguinte: como a prote´ına “encontraria” seu
estado de m´ınima energia num tempo razoavelmente aceit´avel? Se partirmos da
considera¸ao, de que as prote´ınas realizam uma busca aleat´oria, entre as 3 regi˜oes
permitidas no mapa de Ramachandran (α, β e L) (uma estimativa bastante simpli-
ficada), at´e atingirem um estado “congelado”, numa conforma¸ao de menor energia,
enao uma cadeia de 150 amino´acidos (uma prote´ına p equena) teria aproximada-
Tese de Doutorado
2.2 Abordagens para o problema do enovelamento prot´eico 27
mente 3
150
10
68
conforma¸oes distintas poss´ıveis. Se o tempo requerido para
converter uma conforma¸ao em outra for de 1ps = 10
12
s
12
, ent˜ao uma busca sis-
tem´atica por todas as configura¸oes levaria um tempo de aproximadamente 10
56
segundos ou seja 10
48
anos
13
, conflitando com as observoes experimentais, de
que partindo de sua estrutura desenovelada, as prote´ınas mais apidas atingem seu
estado enovelado em tempos da ordem de 1ms e 1s in vivo e in vitro. Este comporta-
mento aparentemente anacrˆonico denominado Paradoxo de Levinthal [43, 44, 45],
em homenagem ao seu propositor o biof´ısico Cyrus Levinthal.
No final da d´ecada de 1960 Levinthal, mostrou que tal busca ao seria
poss´ıvel, ou de outra forma, haveriam caminhos favorecidos nessa busca. As id´eias
iniciais para explicar o Paradoxo de Levinthal partem do pressuposto de que exis-
tem trajet´orias espec´ıficas para o enovelamento, ou seja, haveriam mol´eculas que
restringiriam o n´umero de caminhos, assim as cadeias ao necessitariam varrer todo
o espa¸co configuracional [43]. A descoberta de estruturas intermedi´arias, parcial-
mente organizadas, como os agregados globulares e os dom´ınios, ao longo do processo
de enovelamento, parecem apoiar esta id´eia e, embora ainda exista uma grande re-
sistˆencia entre os pesquisadores, alguns [46, 47, 48, 49] come¸cam aceitar elucida¸oes
para o “paradoxo de Levinthal”.
2.2 Abordagens para o problema do enovelamento
prot´eico
As duas principais ecnicas utilizadas para determina¸ao da estrutura tri-
12
Este seria o tempo em que uma liga¸ao atˆomica se reorganizaria.
13
Para efeito de compara¸ao ´e importante notar que a idade do universo ´e estimada em 10-15
10
9
anos.
Tese de Doutorado - Departamento de F´ısica - UFPE
28 Caracter´ısticas Gerais dos Sistemas Prot´eicos
dimensional das prote´ınas ao: a cristalografia de raios-X [50] e a Ressonˆancia
Magn´etica Nuclear (RMN) [51]. Aliadas a estas, outras como a espectroscopia de
massa, a espectroscopia de infra-vemelho e a espectroscopia de ultra-violeta ao
fundamentais para caracteriza¸ao dinˆamica dos processos de enovelamento. Os pri-
meiros experimentos, que inauguraram a forma de estudar o problema, do enovela-
mento foram realizados por Anfisen [40] seu principal objetivo nessas pesquisas era
entender de que forma a conforma¸ao de equil´ıbrio de pequenas prote´ınas se alterava
sob a varia¸ao c´ıclica de parˆametros como o pH e a temperatura do solvente, onde a
mesma estava mergulhada. Como as prote´ınas atingiam a mesma configura¸ao, sem-
pre que as condi¸oes fisiol´ogicas eram reproduzidas independente da trajet´oria, estes
experimentos ajudaram a fundamentar a conjectura asica de que a conforma¸ao
da prote´ına o dependeria da sequˆencia dos amino´acidos que a constituiam.
Um exame do grau de enovelamento de uma prote´ına, ou seja, que fra¸ao de
sua estrutura encontra-se enovelada pode ser medida atrav´es de dicro´ısmo circular
[52]. Essencialmente o que estes experimentos descrevem ´e de que maneira a po-
lariza¸ao da luz incidente numa dada amostra ´e afetada. Tal etodo se baseia na
propriedade das estruturas secund´arias h´elice-α e fita-β girarem a polariza¸ao da
luz
14
. Assim podemos acompanhar a popula¸ao relativa de estruturas a enoveladas
a medida que modificamos algum parˆametro externo, podendo ent˜ao caracterizar a
transi¸ao de fase estrutural dos heteropol´ımeros biol´ogicos.
Um prote´ına t´ıpica consiste de algumas pontes salinas, uma centena de
liga¸oes de hidrogˆenio e milhares de intera¸oes de Van der Waals. Afim de simu-
larmos este tipo sistema precisamos selecionar modelos apropriados que satisfa¸cam
uma rela¸ao entre precis˜ao e custo computacional. A priori poder´ıamos executar
14
A onda eletromagn´etica ´e composta por campos el´etrico e magn´etico, a dire¸ao de oscila¸ao
do campo el´etrico ´e denominada de dire¸ao de polariza¸ao da luz.
Tese de Doutorado
2.2 Abordagens para o problema do enovelamento prot´eico 29
alculos com a precis˜ao desejada a partir das posi¸oes e velocidades de todos os
´atomos que constituem a prote´ına, construindo um Hamiltoniano com todas as in-
tera¸oes entre estas part´ıculas, contudo tal abordagem computacionalmente ao se
mostra eficiente
15
. Primeiro, p orque sabemos que algumas dessas intera¸oes ao
mais relevantes do que outras (a magnitude de determinadas intera¸oes pode che-
gar a ser de at´e duas ordens de grandeza maior do que outras); segundo, porque
dependendo dos observ´aveis de interesse, um grau extremo de detalhamento pode
ser totalmente irrelevante e por fim, pelo tempo e recursos computacionais que se
disp˜oe. Assim, n´ıveis de aproxima¸ao podem ser impostos aos sistemas de maneira
a focalizarmos certos aspectos, como sua dinˆamica temporal, sua geometria espacial
ou aspectos da dinˆamica evolucion´aria de um certo grupo de prote´ınas.
Diversos modelos em sido propostos com diferentes metodologias e objetivos,
a seguir descreveremos algumas classes desses modelos existentes, suas principais
caracter´ısticas, limita¸oes e objetivos. A inten¸ao aqui ao ´e fornecer uma vis˜ao
completa da “fauna” de modelos existente, mas sim discutir as principais id´eias
envolvidas em cada tipo de abordagem.
Nos modelos de cin´etica qu´ımica diversas conforma¸oes ao identificadas
como alguns estados macrosc´opicos, comumente categorizados em trˆes grupos. O
primeiro grupo descreve os poss´ıveis estados desenovelados (U, do inglˆes unfolded),
correspondendo a todas as conforma¸oes ao estruturadas da prote´ına. O segundo
grupo consiste do estado nativo (N, do inglˆes native) da prote´ına que correspon-
deria a uma ´unica conforma¸ao. O terceiro e ´ultimo grupo caracteriza os estados
intermedi´arios (I, do inglˆes intermediate) que conectariam os estados U e N, por
meio de uma cadeia de eventos descrita pela sequˆencia:
15
Neste caso estamos nos referindo `a alculos ab initio.
Tese de Doutorado - Departamento de F´ısica - UFPE
30 Caracter´ısticas Gerais dos Sistemas Prot´eicos
U I
1
I
2
. . . N.
Cada estado encontra-se separado do outro por meio de uma barreira energ´etica,
de modo que as transi¸oes entre cada um dos estados ao governadas por equa¸oes
estoasticas, descritas pelas rela¸oes de Kramers [53, 54] utilizando-se de um perfil
unidimensional de energia que dirige o caminho do enovelamento [55]. Este tipo
de abordagem oferece uma descri¸ao para as distriubi¸oes dos temp os de folding,
podendo ser utilizado em conex˜ao com potenciais de energia livre emp´ıricos para
predizer o efeito de muta¸oes na estabilidade e na cin´etica de uma dada prote´ına
[56]. Contudo, ele se mostra inadequado para descrever mecanismos moleculares
na dinˆamica de enovelamento. Al´em disso, ele descreve o sistema por meio de um
parˆametro unidimensional, o perfil de energia, uma simplifica¸ao que ao oferece
nenhum aspecto geom´etrico da estrutura.
Uma segunda abordagem envolve uma compreens˜ao mais detalhada da paisa-
gem de energia livre e da entropia associadas `a sua conforma¸ao espacial. Assim, nos
denominados modelos baseados em entropia, ao geradas um grande n´umero de
conforma¸oes atrav´es de simula¸oes computacionais. As cadeias prot´eicas ao ent˜ao
caracterizadas energeticamente por meio de um potencial de energia, obtido atrav´es
de uma soma de termos de contato entre dois elementos da estrutura. Um exem-
plo cl´assico deste tipo de abordagem pode ser encontrado no modelo de Go [57],
no qual cada amino´acido de uma prote´ına pode ser descrito atrav´es de uma repre-
senta¸ao onde cada ´atomo figura explicitamente na estrutura, ou por meio de uma
representa¸ao simplificada em que cada amino´acido apresenta-se como uma conta
esf´erica sem estrutura interna.
A id´eia asica neste tipo de modelo, ´e que a geometria da prote´ına ´e o
principal fator guiando o processo de enovelamento, e desta forma a energia li-
Tese de Doutorado
2.2 Abordagens para o problema do enovelamento prot´eico 31
vre do sistema pode ser associada aos estados conformacionais por meio de um
termo entr´opico. Sua grande virtude ´e a capacidade de descrever a existˆencia de
fenˆomenos cooperativos na forma¸ao da estrutura espacial da prote´ına. Simula¸oes
realizadas para pequenas prote´ınas [58] confirmam, por exemplo, a existˆencia de
contatos espec´ıficos a partir dos quais a estrutura desenovelada atinge o estado na-
tivo. Tal evidˆencia indica que a prote´ına ao se enovela de forma aleat´oria, seguindo
na realidade uma sequˆencia bem definida de passos. Por outro lado estes modelos
ao abordam a intera¸ao entre os 20 diferentes tipos de amino´acidos existentes na
natureza e a possibilidade de que estes contatos possam formar intera¸oes inexis-
tentes na estrutura nativa final. Ou seja, estes modelos negligenciam tanto o papel
da sequˆencia espec´ıfica de amino´acidos para a forma¸ao de cada prote´ına, como a
existˆencia de estados metaest´aveis que armadilhem o processo de enovelamento.
Uma outra abordagem termodinˆamica para o problema do enovelamento,
pode ser dada considerando-se a informa¸ao contida na sequˆencia de amino´acidos
que constitui a prote´ına. Nesta vis˜ao, a heterogeneidade das intera¸oes entre os
amino´acidos produz uma paisagem de energia essencialmente rugosa, com diver-
sos estados metaest´aveis sendo formados. O objetivo dos modelos baseados em
energia ´e entender de que forma uma prote´ına caracterizada por uma sequˆencia
espec´ıfica de amino´acidos difere de um sistema aleat´orio. O principal elemento neste
tipo de modelagem ´e a fun¸ao de energia potencial que descreve a intera¸ao entre
os contatos de dois amino´acidos da estrutura. Uma matriz para estas intera¸oes foi
determinada por Miyazawa and Jernigan [59] em 1985.
O ponto de partida dos modelos baseados em energia ´e o estudo de cadeias for-
madas por uma sequˆencia aleat´oria de amino´acidos, assim num modelo simplificado
a energia de cada intera¸ao ´e escolhida aleatoriamente e a energia total para uma
Tese de Doutorado - Departamento de F´ısica - UFPE
32 Caracter´ısticas Gerais dos Sistemas Prot´eicos
configura¸ao de N contatos ´e dada pela soma das energias de intera¸ao entre pares
de amino´acidos na estrutura. Como consequˆencia destas considera¸oes estabelece-
se um primeiro modelo denominado modelo de energia aleat´oria (REM do inglˆes,
Random Energy Model) [60], o qual prevˆe um estado fundamental E
c
e, a partir
deste, um espectro cont´ınuo. Como mostrado por Shakhnovich [61], a paisagem
de energia para este modelo ´e composta por diversos m´ınimos locais, todos separa-
dos por pequenas barreiras de energia, que o distingue do comportamento de uma
prote´ına real, a qual possui um m´ınimo global bem mais profundo do que os dos esta-
dos meta-est´aveis. Nesse quadro, as caracter´ısticas cin´eticas do problema tamb´em
tornam-se muito distintas daquela exibida por prote´ınas reais, uma vez que segundo
esta prescri¸ao uma prote´ına facilmente poderia ser armadilhada num desses estados
meta-est´aveis [62].
O desenvolvimento de computadores cada vez mais velozes tem permitido
uma descri¸ao mais detalhada da estrutura atˆomica das prote´ınas e dos potenciais
de energia envolvidas na intera¸ao entre estes ´atomos. A constru¸ao da denominada
modelagem molecular[27] baseia-se na simula¸ao dos movimentos atˆomicos por
meio de um campo de for¸cas, para valores de temperatura e press˜ao conhecidos.
´
E
poss´ıvel atrav´es desta abordagem analisar as intera¸oes provenientes entre a estru-
tura prot´eica e o solvente, onde a mesma se encontra imersa, tratando-o como um
cont´ınuo, ou at´e mesmo pela descri¸ao explicita das mol´eculas que o comp˜oem.
Essencialmente este tipo de modelo pretende resolver as equa¸oes de mo-
vimento de Newton atrav´es de um processo de integra¸ao num´erica, o que per-
mite investigar a evolu¸ao temporal entre arias conforma¸oes. Tecnicamente, a
resolu¸ao das equa¸oes de movimento envolvem a utiliza¸ao de potenciais efetivos
cl´assicos parametrizados, os quais descrevem as intera¸oes intra e inter-moleculares.
Tese de Doutorado
2.2 Abordagens para o problema do enovelamento prot´eico 33
O “cora¸ao” da dinˆamica molecular reside em ´ultima instˆancia, na fun¸ao poten-
cial escolhida, a qual deve ser realista o suficiente para fornecer descri¸oes preci-
sas da estrutura do sistema e ao mesmo tempo de acil e apida implementa¸ao
num´erica. Embora exista na literatura uma grande diversidade de potenciais e
de programas, tanto de uso comercial quanto acadˆemico (GROMACS, AMBER,
CHARMM e THOR) [63, 64, 65, 66, 67], todos possuem dois fatores comuns: a
existˆencia de potenciais “ligados”, usualmente representados por termos harmˆonicos,
e de potenciais de intera¸ao `a distˆancia. Os primeiros ao utilizados para descrever
as liga¸oes covalentes entre pares de ´atomos ˆangulos entre liga¸oes qu´ımicas vizinhas
e ˆangulos de tor¸ao em torno de liga¸oes; enquanto que o segundo descreve intera¸oes
entre ´atomos ao ligados covalentemente, levando em conta as atra¸oes e repuls˜oes
eletrost´aticas, bem como as intera¸oes dipolares.
Como a discutido nas se¸oes anteriores, devido ao elevado n´umero de elemen-
tos constituintes, o n´umero de graus de liberdade de um sistema molecular pode ser
astronˆomico e desta forma torna-se imposs´ıvel cobrir toda a superf´ıcie de energia.
Como solu¸ao alternativa, os algoritmos tentam vasculhar ao toda a superf´ıcie,
mas sim o caminho que leva o sistema para uma configura¸ao de menor energia.
Para tanto entra em cena a segunda parte do problema de dinˆamica molecular,
a otimiza¸ao de geometria. A otimiza¸ao consiste essencialmente de um procedi-
mento para obten¸ao, a cada passo de tempo fixado pelo algoritmo, do conjunto de
cooordenadas que minimiza a energia do sistema como um todo.
Nesse esp´ırito podem ser encontrados na literatura diversos tipos de algorit-
mos para efetuar tal minimiza¸ao, tais como: o “steepest-descent” [68], o etodo
dos gradientes conjugados [69] e os etodos de busca aleat´oria como o “Generali-
zed Simulated Annealing [70].
´
E importante observar que assim como o potencial
Tese de Doutorado - Departamento de F´ısica - UFPE
34 Caracter´ısticas Gerais dos Sistemas Prot´eicos
de energia precisa ser acurado o suficiente para descrever as grandezas de inter-
esse, a otimiza¸ao precisa ser eficiente para que o sistema possa ser avaliado em
tempos razo´aveis. Dinˆamicas que pretendem chegar a tempos da ordem de 1µs po-
dem necessitar de tempos computacionais efetivos da ordem de dias, dependendo
do tamanho do sistema, uma vez que cada passo da dinˆamica gira em torno de 1fs.
Embora se constitua de um poderoso etodo para a an´alise tanto de estruturas
prot´eicas, como da intera¸ao destas com membranas e solventes, a grande limita¸ao
dos etodos de dinˆamica molecular reside no fato de que atualmente a maior parte
dos alculos cobrem apenas uma pequena fra¸ao do tempo real envolvido no processo
de enovelamento.
Um quarta abordagem ao os modelos de rede indicados para estudar
caracter´ısticas gerais do enovelamento prot´eico. Tradicionalmente, se baseiam na
aproxima¸ao de que a estrutura interna dos amino´acidos (seus ´atomos) pode ser ne-
gligenciada como consequˆencia o car´ater entr´opico associado aos graus de liberdade
internos podem ser tamb´em negligenciados. E assim, qualquer intera¸ao dever´a
ser considerada isotropicamente desta forma, os amino´acidos ao representados por
contas, conectadas em redes. Cada s´ıtio pode estar vazio ou contendo uma conta,
o que simularia o efeito do volume exclu´ıdo. No caso de uma rede quadrada os
ˆangulos de liga¸ao entre cada amino´acido est˜ao restritos aos valores π/2, π ou 3π/2
radianos, enquanto que o comprimento das liga¸oes tem um valor fixo caracterizado
pelo parˆametro de rede. Estes modelos, tamb´em denominados de modelos mini-
malistas, est˜ao preocupados em elucidar perguntas asicas acerca do enovelamento
a saber: como uma cadeia polim´erica pode enovelar-se num estado nativo ´unico,
como se ao os mecanismos de cooperatividade ao longo do processo, por quˆe al-
gumas sequˆencias prim´arias enovelam-se enquanto que outras ao ? E o car´ater da
Tese de Doutorado
2.2 Abordagens para o problema do enovelamento prot´eico 35
frustra¸ao na evolu¸ao do processo [71].
O mais conhecido desta classe ´e o modelo HP [72], onde apenas dois tipos de
amino´acidos ao considerados: um denominado H, de car´ater hidrof´obico e outro P
de car´ater polar estes amino´acidos ao distribu´ıdos aleatoriamente numa rede c´ubica
ou quadrada.
´
E assumido nesse caso um potencial de intera¸ao entre s´ıtios vizinhos
dependendo dos amino´acidos que os ocupam (H ou P), dessa forma o modelo con-
templa a p ossibilidade de amino´acidos, que ao ao consecutivos sequˆencia prim´aria,
poderem formar “contatos”. Como observado por Tang [73] em sua revis˜ao a res-
peito de modelos dessa natureza, a maior parte das estruturas geradas nesse tipo
de modelo ao se enovelam num ´unico estado, o que ao descreve a situa¸ao real
prot´eica.
Em suas vers˜oes mais recentes [73], os modelos em rede consideram uma
matriz de intera¸ao para um alfabeto composto por 20 amino´acidos, no mesmo con-
texto dos modelos baseados em energia.
´
E da heterogeneidade destas itera¸oes que
se revela o car´ater frustrado do sistema, que passa a exibir uma superf´ıcie de energia
rugosa. Um dos grandes resultados obtidos com esse tipo de metologia ´e a a forma¸ao
de estruturas elementares locais durante o processo de enovelamento. Essa forma¸ao
ocorre numa sequˆencia de eventos hier´arquicos que se mostram fundamentais para
o mecanismo de estabiliza¸ao da estrutura como um todo [74].
Tese de Doutorado - Departamento de F´ısica - UFPE
Cap´ıtulo 3
Modelo de caminhantes angulares
Gaussianos
“... voe marcha, Jos´e! Jos´e, para onde?
Carlos Drummond de Andrade - Jos´e
3.1 Caminhantes aleat´orios e caminhantes auto-
excludentes
Em 1828, o botˆanico escoes Robert Brown (1773-1858) realizou experiˆencias
nas quais observou, com a ajuda de um microsc´opio, que numa suspens˜ao de gr˜aos de
olen em ´agua cada gr˜ao se movia irregularmente, numa trajet´oria err´atica que seria
posteriormente denominada de Browniana [75]. Constatando que esse fenˆomeno era
reproduzido com o uso de diversas substˆancias orgˆanicas, Brown acreditou haver
encontrado a mol´ecula primitiva da mat´eria viva. Esse suposi¸ao foi posteriormente
36
3.1 Caminhantes aleat´orios e caminhantes auto-excludentes 37
refutada pelo pr´oprio Brown, ao perceber que substˆancias inorgˆanicas pulverizadas
tamem possuiam comportamento similar. Ap´os essa primeira incurs˜ao “equivo-
cada” pela biologia, os caminhantes aleat´orios (ou “random walks” ; RW), resur-
giriam com fundamenta¸ao matem´atica, no contexto econˆomico em 1900, gra¸cas
ao francˆes Louis Bachelier (1870-1946), em sua tese Teoria da Especula¸ao
1
, sobre
op¸oes de pre¸co em mercados especulativos [76].
Uma descri¸ao corpuscular da mat´eria, fundamentada num modelo de camin-
hante aleat´orio, foi introduzida por Albert Einstein (1879-1955) em 1905 [77]. Com
a proposi¸ao do n´umero de Avogadro, Einstein relacionou as grandezas estat´ısticas
do movimento Browniano com o comportamento dos ´atomos e deu aos experimenta-
listas um m´etodo de contagem dos ´atomos, o que foi comprovado experimentalmente
por Jean-Baptiste Perrin (1870-1942)
2
em 1908. Atualmente estudos de processos
difusivos est˜ao interessados em propriedades estat´ısticas associadas `a caminhantes
deslocando-se de maneira errante sobre um substrato. Essa dinˆamica ´e recorrente-
mente utilizada como um conceito importante para se determinar as propriedades
de escala de muitos fenˆomenos f´ısicos [78, 79, 80, 81].
No modelo de caminhante aleat´orio, cada passo ´e completamente indepen-
dente de todos os passos anteriores, tais processos estot´asticos ao tamb´em chama-
dos de Markovianos. Contudo, para diversos processos f´ısicos essa suposi¸ao ao ´e
apropriada. Ao idealizarmos um pol´ımero, por exemplo, como uma longa cadeia
flex´ıvel destitu´ıda de qualquer estrutura interna, onde cada liga¸ao corresponde
a um passo do caminhante, temos de levar em conta a exclus˜ao espacial. Uma
caminhada aleat´oria submetida a tal condi¸ao ´e denominada caminhada aleat´oria
1
Orientada pelo tamb´em matem´atico Henri Poincar´e(1854-1912), a tese de Bachelier foi prete-
rida por seus contemporˆaneos e permaneceria na obscuridade at´e meados da ecada de 1960.
2
Por suas medi¸oes Perrin receberia o prˆemio Nobel em 1926.
Tese de Doutorado - Departamento de F´ısica - UFPE
38 Modelo de caminhantes angulares Gaussianos
auto-excludente (ou self-avoiding walk; SAW). Na Figura 3.1, apresentamos padr˜oes
t´ıpicos gerados por uma caminhada aleat´oria e uma caminhada auto-excludente,
ambas sobre uma rede quadrada. Em geral, as quantidades geom´etricas analisadas
nesse tipo de modelo ao: o deslocamento quadr´atico m´edio em rela¸ao `a origem
< r
2
> e o raio de gira¸ao da estrutura final R
g
, definido como a distˆancia quadr´atica
m´edia de cada posi¸ao ao centro de massa da estrutura,
R
g
N
i=1
ρ
2
i
N + 1
, (3.1)
onde ρ
i
´e a distˆancia de cada um dos elementos da estrutura ao centro de massa e
N ´e o n´umero de passos do caminhante.
Tais grandezas exibem uma rela¸ao de escala, ou seja, o raio de gira¸ao, por
exemplo, exibe um comportamento tipo lei de potˆencia com o n´umero de passos N
do caminhante,
R
g
N
ν
, (3.2)
onde ν ´e o expoente que caracteriza o tipo de difus˜ao subjacente ao processo, com
a seguinte classifica¸ao:
ν < 1/2 (subdifusivo),
ν = 1/2 (difusivo),
ν > 1/2 (superdifusivo).
(3.3)
Um modelo tipo campo m´edio para forma¸ao de estruturs polim´ericas em-
bebidas em um bom solvente, desenvolvido por Flory[82, 83], prevˆe um expoente
Tese de Doutorado
3.1 Caminhantes aleat´orios e caminhantes auto-excludentes 39
240 250 260 270
220
230
240
250
260
Figura 3.1: Padr˜oes t´ıpicos, obtidos atrav´es de simula¸ao numa rede quadrada, para
caminhantes aleat´orios (em preto) e caminhantes aleat´orios auto-excludentes (em
vermelho), ambos com 250 passos e partindo do ponto (250, 250).
dependente da dimens˜ao D, dado por:
ν
F lor y
=
3
D + 2
, (3.4)
de modo que ν
F lor y
= 3/5 para o caso em trˆes dimens˜oes pertencendo, tamb´em,
a um regime superdifusivo, este resultado encontra-se reproduzido no Apˆendice A
desta Tese. Recentes simula¸oes [84] de RW e SAW em trˆes dimens˜oes apresentam
resultados diferentes para o expoente com ν
RW
= 1/2 e ν
SAW
= 0.588, indicando
que no caso auto-excludente a part´ıcula escapa mais apido da origem que no regime
Tese de Doutorado - Departamento de F´ısica - UFPE
40 Modelo de caminhantes angulares Gaussianos
difusivo.
3.2 Modelo de caminhantes angulares Gaussianos
Ao tratarmos de cadeias prot´eicas, observamos que o raio das estruturas com
o n´umero de amino´acidos, tamb´em obedece um comportamento de escala, como pode
ser observado no gr´afico log-log experimental, baseado em 1826 cadeias prot´eicas,
exibido na Figura 3.2. No contexto discutido na se¸ao anterior, este comportamento
pertence a um regime sud-difusivo, com ν
exp
= 0.40±0.02, diferente daquele previso
por Flory, ν
F lor y
= 0.60 e observado no contexto de superf´ıcies amassadas como
indicado por Gomes e colaboradores [85]. Constatamos dessa forma que mesmo
as estimativas constru´ıdas em argumentos de camp o m´edio, onde a entropia da
superf´ıcie da estrutura ´e levada em conta, ao ´e capaz de descrever esta caracter´ıstica
geom´etrica asica.
Como discutido no cap´ıtulo 2, diversas abordagens para descri¸ao das pro-
priedades estruturais das prote´ınas em sido propostas. Devido ao n´umero astrˆonomico
de poss´ıveis configura¸oes para prote´ınas globulares (compostas por 50 a 500 amino´acidos),
metodologias convencionais fundamentadas em Monte Carlo ou dinˆamica molecular
tornam-se impratic´aveis, devido ao seu alto custo computacional.
Nesta se¸ao, apresentamos uma estrat´egia alternativa, baseada num modelo
de caminhante aleat´orio em trˆes dimens˜oes, como forma de construirmos cadeias
prot´eicas com diferentes comprimentos e porcentagens de estruturas secund´arias. No
modelo, cada passo possui um comprimento radial l
0
fixo, mas os ˆangulos diedrais,
Φ e Ψ que comp˜oem a cadeia ao escolhidos independentemente por meio de uma
distribui¸ao de probabilidades Gaussiana, seguindo a proposta de Shaw e colabora-
dores [79]. Os valores m´edios e o desvio de cada distribui¸ao ao definidos de acordo
Tese de Doutorado
3.2 Modelo de caminhantes angulares Gaussianos 41
1 10 100 1000
1
10
100
N
Figura 3.2: Comportamento do raio edio < R > em fun¸ao do n´umero de
amino´acidos N para um conjunto de 1826 cadeias prot´eicas, com expoente ν
0.40 ± 0.02. A linha cont´ınua indica o ajuste linear dos dados
com as regi˜oes permitidas para Φ e Ψ presentes no mapa de Ramachandran. Aqui
utilizamos os valores calculados por estat´ıticas de diversas estruturas secund´arias,
propostos pelo programa PRELUDE [86] a Tabela 3.1 indica sete poss´ıveis pares de
ˆangulos diedrais e suas conforma¸oes associadas.
Desta forma, as distribui¸oes Gaussianas para os ˆangulos ao explicitamente
descritas como:
Tese de Doutorado - Departamento de F´ısica - UFPE
42 Modelo de caminhantes angulares Gaussianos
P (Φ) =
1
2πδ
2
exp
Φ
o
)
2
2δ
2
, (3.5)
e
P (Ψ) =
1
2πδ
2
exp
Ψ
o
)
2
2δ
2
, (3.6)
onde δ ´e o desvio padr˜ao de cada distribui¸ao, enquanto que Φ
o
e Ψ
o
ao respecti-
vamente os valores m´edios dos ˆangulos diedrais Φ e Ψ.
Φ
o
Ψ
o
Conforma¸ao
-65
-40
A
-89
-1
C
-117
142
B
-69
140
P
78
20
G
103
-176
E
-83
133
O
Tabela 3.1: Sete poss´ıveis pares para ˆangulos diedrais (Φ,Ψ) e suas conforma¸oes
associadas [86]. Configura¸oes em elice-α denotadas por A e folha-β por B.
Para simularmos prote´ınas com uma determinada p orcentagem de estruturas
secund´arias f, fixamos o n´umero de passos do caminhante N e estabelecemos um
processo de crescimento descrito pelas seguintes regras:
1. Nos primeiros l
g
× f passos escolhe-se um dos pares de ˆangulos da Tab ela
3.1 e por meio das distribui¸oes descritas nas Equa¸oes 3.5 e 3.6, constru´ımos
sequencialmente a pr´oxima posi¸ao como fun¸ao da posi¸ao anterior.
Tese de Doutorado
3.2 Modelo de caminhantes angulares Gaussianos 43
2. Nos pr´oximos l
g
× (1 f) passos utilizamos, a cada passo, ˆangulos aleato-
riamente escolhidos entre os sete poss´ıveis pares, utilizando mais uma vez as
distribui¸oes descritas nas Equa¸oes 3.5 e 3.6, constru´ımos sequencialmente a
pr´oxima posi¸ao como fun¸ao da posi¸ao anterior.
3. Nos pr´oximos l
g
passos as regras 1 e 2 ao repetidas, at´e construirmos uma
cadeia de tamanho N.
A determina¸ao da posi¸ao (x
i
, y
i
, z
i
), como fun¸ao da posi¸ao anterior (x
i1
, y
i1
, z
i1
),
envolve uma transforma¸ao entre coordenadas cartesianas e internas, descritas pelos
ˆangulos Φ e Ψ, como observado por Park e colaboradores [87]
3
. Neste modelo mi-
nimalista, a constru¸ao do esqueleto pept´ıdico envolve apenas os ˆangulos diedrais.
Todos os potenciais efetivos descritos no Cap´ıtulo 3, sejam eles de contato ou de
ao `a distˆancia, ao levados em considera¸ao indiretamente atrav´es da escolha dos
ˆangulos da Tabela 3.1. Uma vez que a distribui¸ao de ˆangulos diedrais encontra-
se confinada `as regi˜oes permitidas pelo mapa de Ramachandran, espera-se que os
fenˆomenos est´ericos estejam inclusos nessa abordagem implicitamente. Devido `a
sua simplicidade computacional, o etodo permite a constru¸ao de uma elevada
quantidade de amostras, ou seja, de diferentes conforma¸oes (da ordem de 10
4
).
´
E importante perceber, que nesse modelo, a
regra 1
induz um crescimento
ordenado, durante um comprimento caracter´ıstico ( l
g
× f), enquanto que a regra
2 descreve a quebra desse padr˜ao estrutural, quebra esta que pode ser entendida
como resultante da instabilidade das for¸cas envolvidas na forma¸ao de conforma¸oes
espec´ıficas, como no caso dos momentos de dipolo efetivos das estruturas elice-α.
Pode-se ent˜ao simular diversas destas configura¸oes, variando-se a fra¸ao f e o
tipo de estrutura secund´aria utilizada na regra 1 do modelo. Em nosso estudo utiliz-
3
Para detalhes consultar o Apˆendice B desta Tese.
Tese de Doutorado - Departamento de F´ısica - UFPE
44 Modelo de caminhantes angulares Gaussianos
amos: (a) estruturas elice-α; (b) folhas-β ou (c) uma mistura de h´elice-α e folha-β.
A escolha desses motivos estruturais decorre de sua relevˆancia nos est´agios iniciais
do enovelamento prot´eico e por estes serem os blocos fundamentais na forma¸ao
de estruturas terci´arias [88, 89]. Nas Figuras 3.3, 3.4 e 3.5 exibimos configura¸oes
t´ıpicas compostas por N = 250 res´ıduos, para os trˆes casos acima especificados,
assim como os respectivos os mapas de Ramachandran para um conjunto de 100
amostras, em cada um desses casos. Em todas as simula¸oes a largura da distri-
bui¸ao vale δ = 0.1, o comprimento l
g
= 100 e o comprimento caracter´ıstico entre
cada res´ıduo (distˆancia radial) vale l
o
= 3.8
˚
A.
3.3 An´alise das grandezas relevantes
Uma vez criadas diferentes configura¸oes, atrav´es do algor´ıtmo descrito na
se¸ao anterior, utilizamos algumas grandezas a fim de caracterizar estruturalmente
as cadeias geradas artificialmente e compar´a-las `as cadeias reais. Seguindo a sugest˜ao
de Tang e colaboradores [90], elegemos o raio de gira¸ao R
g
; o comprimento de
contorno l
c
; o n´umero de contatos n
c
; o n´umero de coordena¸ao z
c
e a energia entre
os contatos E. Al´em destes parˆametros introduzimos outra quantidade denominada
“parˆametro de compacta¸ao”, definido como:
γ
R
g
D
max
, (3.7)
onde R
g
´e o raio de gira¸ao da estrutura e D
max
´e a maior distˆancia entre dois res´ıduos
da mesma. Discutiremos a seguir a relevˆancia de cada uma dessas grandezas e de
que forma os parˆametros de nosso modelo as descrevem.
Tese de Doutorado
Livros Grátis
( http://www.livrosgratis.com.br )
Milhares de Livros para Download:
Baixar livros de Administração
Baixar livros de Agronomia
Baixar livros de Arquitetura
Baixar livros de Artes
Baixar livros de Astronomia
Baixar livros de Biologia Geral
Baixar livros de Ciência da Computação
Baixar livros de Ciência da Informação
Baixar livros de Ciência Política
Baixar livros de Ciências da Saúde
Baixar livros de Comunicação
Baixar livros do Conselho Nacional de Educação - CNE
Baixar livros de Defesa civil
Baixar livros de Direito
Baixar livros de Direitos humanos
Baixar livros de Economia
Baixar livros de Economia Doméstica
Baixar livros de Educação
Baixar livros de Educação - Trânsito
Baixar livros de Educação Física
Baixar livros de Engenharia Aeroespacial
Baixar livros de Farmácia
Baixar livros de Filosofia
Baixar livros de Física
Baixar livros de Geociências
Baixar livros de Geografia
Baixar livros de História
Baixar livros de Línguas
Baixar livros de Literatura
Baixar livros de Literatura de Cordel
Baixar livros de Literatura Infantil
Baixar livros de Matemática
Baixar livros de Medicina
Baixar livros de Medicina Veterinária
Baixar livros de Meio Ambiente
Baixar livros de Meteorologia
Baixar Monografias e TCC
Baixar livros Multidisciplinar
Baixar livros de Música
Baixar livros de Psicologia
Baixar livros de Química
Baixar livros de Saúde Coletiva
Baixar livros de Serviço Social
Baixar livros de Sociologia
Baixar livros de Teologia
Baixar livros de Trabalho
Baixar livros de Turismo