Download PDF
ads:
UNIVERSIDADE DE BRASÍLIA
INSTITUTO DE BIOLOGIA
DEPARTAMENTO DE BIOLOGIA CELULAR
PROGRAMA DE PÓS-GRADUAÇÃO EM BIOLOGIA MOLECULAR
C
C
a
a
r
r
a
a
c
c
t
t
e
e
r
r
i
i
z
z
a
a
ç
ç
ã
ã
o
o
m
m
o
o
l
l
e
e
c
c
u
u
l
l
a
a
r
r
d
d
e
e
p
p
r
r
o
o
t
t
e
e
í
í
n
n
a
a
s
s
d
d
e
e
s
s
e
e
d
d
a
a
s
s
d
d
e
e
a
a
r
r
a
a
n
n
h
h
a
a
s
s
d
d
a
a
b
b
i
i
o
o
d
d
i
i
v
v
e
e
r
r
s
s
i
i
d
d
a
a
d
d
e
e
b
b
r
r
a
a
s
s
i
i
l
l
e
e
i
i
r
r
a
a
Por
Daniela Matias de Carvalho Bittencourt
Tese apresentada ao Departamento de Biologia
Celular curso de pós-graduação em Biologia
Molecular como parte do requisito à obtenção do
título de DOUTOR EM BIOLOGIA
MOLECULAR
Orientador: Prof. Dr. Elíbio Leopoldo Rech Filho
Brasília,
Julho de 2007
ads:
Livros Grátis
http://www.livrosgratis.com.br
Milhares de livros grátis para download.
“ Ao meu querido esposo, Flávio
Bittencourt, por fazer dos meus
sonhos também os seus.”
ads:
AGRADECIMENTOS
P
P
r
r
i
i
m
m
e
e
i
i
r
r
a
a
m
m
e
e
n
n
t
t
e
e
e
e
u
u
g
g
o
o
s
s
t
t
a
a
r
r
i
i
a
a
d
d
e
e
a
a
g
g
r
r
a
a
d
d
e
e
c
c
e
e
r
r
a
a
m
m
i
i
n
n
h
h
a
a
f
f
a
a
m
m
í
í
l
l
i
i
a
a
p
p
e
e
l
l
o
o
a
a
p
p
o
o
i
i
o
o
c
c
o
o
n
n
s
s
t
t
a
a
n
n
t
t
e
e
d
d
u
u
r
r
a
a
n
n
t
t
e
e
t
t
o
o
d
d
a
a
a
a
m
m
i
i
n
n
h
h
a
a
f
f
o
o
r
r
m
m
a
a
ç
ç
ã
ã
o
o
.
.
A
A
o
o
m
m
e
e
u
u
o
o
r
r
i
i
e
e
n
n
t
t
a
a
d
d
o
o
r
r
D
D
r
r
.
.
E
E
l
l
í
í
b
b
i
i
o
o
R
R
e
e
c
c
h
h
,
,
q
q
u
u
e
e
f
f
o
o
i
i
o
o
r
r
e
e
s
s
p
p
o
o
n
n
s
s
á
á
v
v
e
e
l
l
p
p
e
e
l
l
o
o
o
o
m
m
e
e
u
u
s
s
u
u
c
c
e
e
s
s
s
s
o
o
,
,
p
p
e
e
l
l
o
o
s
s
c
c
o
o
n
n
s
s
e
e
l
l
h
h
o
o
s
s
e
e
i
i
n
n
c
c
e
e
n
n
t
t
i
i
v
v
o
o
s
s
.
.
A
A
o
o
s
s
m
m
e
e
u
u
s
s
c
c
o
o
l
l
e
e
g
g
a
a
s
s
d
d
o
o
L
L
a
a
b
b
o
o
r
r
a
a
t
t
ó
ó
r
r
i
i
o
o
d
d
e
e
T
T
r
r
a
a
n
n
s
s
f
f
e
e
r
r
ê
ê
n
n
c
c
i
i
a
a
d
d
e
e
G
G
e
e
n
n
e
e
s
s
d
d
a
a
E
E
m
m
b
b
r
r
a
a
p
p
a
a
R
R
e
e
c
c
u
u
r
r
s
s
o
o
s
s
G
G
e
e
n
n
é
é
t
t
i
i
c
c
o
o
s
s
e
e
B
B
i
i
o
o
t
t
e
e
c
c
n
n
o
o
l
l
o
o
g
g
i
i
a
a
,
,
e
e
m
m
e
e
s
s
p
p
e
e
c
c
i
i
a
a
l
l
B
B
e
e
t
t
ú
ú
l
l
i
i
a
a
,
,
P
P
a
a
u
u
l
l
a
a
e
e
N
N
a
a
t
t
á
á
l
l
i
i
a
a
.
.
A
A
o
o
D
D
r
r
.
.
R
R
a
a
n
n
d
d
o
o
l
l
p
p
h
h
L
L
e
e
w
w
i
i
s
s
e
e
s
s
u
u
a
a
e
e
q
q
u
u
i
i
p
p
e
e
d
d
a
a
U
U
n
n
i
i
v
v
e
e
r
r
s
s
i
i
d
d
a
a
d
d
e
e
d
d
o
o
W
W
y
y
o
o
m
m
i
i
n
n
g
g
,
,
p
p
o
o
r
r
m
m
e
e
r
r
e
e
c
c
e
e
b
b
e
e
r
r
e
e
m
m
d
d
e
e
p
p
o
o
r
r
t
t
a
a
s
s
a
a
b
b
e
e
r
r
t
t
a
a
s
s
e
e
m
m
s
s
e
e
u
u
l
l
a
a
b
b
o
o
r
r
a
a
t
t
ó
ó
r
r
i
i
o
o
.
.
A
A
o
o
I
I
B
B
A
A
M
M
A
A
e
e
C
C
E
E
G
G
E
E
N
N
p
p
o
o
r
r
a
a
u
u
t
t
o
o
r
r
i
i
z
z
a
a
r
r
e
e
m
m
a
a
c
c
o
o
l
l
e
e
t
t
a
a
d
d
o
o
m
m
a
a
t
t
e
e
r
r
i
i
a
a
l
l
b
b
i
i
o
o
l
l
ó
ó
g
g
i
i
c
c
o
o
p
p
a
a
r
r
a
a
o
o
d
d
e
e
s
s
e
e
n
n
v
v
o
o
l
l
v
v
i
i
m
m
e
e
n
n
t
t
o
o
d
d
e
e
s
s
t
t
a
a
p
p
e
e
s
s
q
q
u
u
i
i
s
s
a
a
.
.
A
A
o
o
I
I
n
n
s
s
t
t
i
i
t
t
u
u
t
t
o
o
B
B
u
u
t
t
a
a
n
n
t
t
a
a
n
n
,
,
p
p
e
e
l
l
o
o
f
f
o
o
r
r
n
n
e
e
c
c
i
i
m
m
e
e
n
n
t
t
o
o
d
d
e
e
p
p
a
a
r
r
t
t
e
e
d
d
o
o
m
m
a
a
t
t
e
e
r
r
i
i
a
a
l
l
g
g
e
e
n
n
é
é
t
t
i
i
c
c
o
o
e
e
s
s
t
t
u
u
d
d
a
a
d
d
o
o
.
.
A
A
o
o
D
D
e
e
p
p
a
a
r
r
t
t
a
a
m
m
e
e
n
n
t
t
o
o
d
d
e
e
B
B
i
i
o
o
l
l
o
o
g
g
i
i
a
a
C
C
e
e
l
l
u
u
l
l
a
a
r
r
d
d
a
a
U
U
n
n
i
i
v
v
e
e
r
r
s
s
i
i
d
d
a
a
d
d
e
e
d
d
e
e
B
B
r
r
a
a
s
s
í
í
l
l
i
i
a
a
p
p
e
e
l
l
a
a
o
o
p
p
o
o
r
r
t
t
u
u
n
n
i
i
d
d
a
a
d
d
e
e
d
d
e
e
d
d
e
e
s
s
e
e
n
n
v
v
o
o
l
l
v
v
e
e
r
r
e
e
s
s
t
t
e
e
t
t
r
r
a
a
b
b
a
a
l
l
h
h
o
o
.
.
A
A
o
o
C
C
o
o
n
n
s
s
e
e
l
l
h
h
o
o
N
N
a
a
c
c
i
i
o
o
n
n
a
a
l
l
d
d
e
e
P
P
e
e
s
s
q
q
u
u
i
i
s
s
a
a
(
(
C
C
N
N
P
P
q
q
)
)
,
,
p
p
e
e
l
l
o
o
s
s
u
u
p
p
o
o
r
r
t
t
e
e
f
f
i
i
n
n
a
a
n
n
c
c
e
e
i
i
r
r
o
o
.
.
Á
Á
E
E
m
m
b
b
r
r
a
a
p
p
a
a
R
R
e
e
c
c
u
u
r
r
s
s
o
o
s
s
G
G
e
e
n
n
é
é
t
t
i
i
c
c
o
o
s
s
e
e
B
B
i
i
o
o
t
t
e
e
c
c
n
n
o
o
l
l
o
o
g
g
i
i
a
a
p
p
e
e
l
l
a
a
d
d
i
i
s
s
p
p
o
o
n
n
i
i
b
b
i
i
l
l
i
i
d
d
a
a
d
d
e
e
d
d
a
a
s
s
i
i
n
n
s
s
t
t
a
a
l
l
a
a
ç
ç
õ
õ
e
e
s
s
f
f
í
í
s
s
i
i
c
c
a
a
s
s
,
,
e
e
q
q
u
u
i
i
p
p
a
a
m
m
e
e
n
n
t
t
o
o
s
s
e
e
p
p
e
e
l
l
a
a
c
c
a
a
p
p
a
a
c
c
i
i
t
t
a
a
ç
ç
ã
ã
o
o
d
d
e
e
r
r
e
e
c
c
u
u
r
r
s
s
o
o
s
s
h
h
u
u
m
m
a
a
n
n
o
o
s
s
.
.
E
E
n
n
f
f
i
i
m
m
,
,
a
a
t
t
o
o
d
d
o
o
s
s
a
a
q
q
u
u
e
e
l
l
e
e
s
s
q
q
u
u
e
e
d
d
e
e
u
u
m
m
a
a
m
m
a
a
n
n
e
e
i
i
r
r
a
a
o
o
u
u
d
d
e
e
o
o
u
u
t
t
r
r
a
a
,
,
e
e
s
s
t
t
i
i
v
v
e
e
r
r
a
a
m
m
p
p
r
r
e
e
s
s
e
e
n
n
t
t
e
e
s
s
e
e
p
p
a
a
r
r
t
t
i
i
c
c
i
i
p
p
a
a
r
r
a
a
m
m
d
d
e
e
s
s
t
t
a
a
g
g
r
r
a
a
n
n
d
d
e
e
c
c
o
o
n
n
q
q
u
u
i
i
s
s
t
t
a
a
,
,
o
o
m
m
e
e
u
u
m
m
u
u
i
i
t
t
o
o
o
o
b
b
r
r
i
i
g
g
a
a
d
d
a
a
.
.
ÍNDICE
Índice
ii
Índice de figuras e tabelas
v
Resumo
vii
Abstract
viii
Capítulo 1 – Introdução 1
Relacionamentos evolutivos 2
Arquitetura molecular 5
Tipos de seda 6
Ampolada principal 6
Ampolada secundária 9
Tubuliforme 9
Aciniforme 10
Flageliforme 10
Agregata 11
Piriforme 11
Biologia da seda 14
Propriedades mecânicas 18
Produção de seda sintética 22
Capítulo 2 - Espidroínas da aranha Nephilengys cruentata 25
Introdução 26
Resultados 28
Biblioteca de cDNA 28
Análise das seqüências 29
Freqüência de codons 31
Análise filogenética 33
Discussão 37
Capítulo 3 - Propriedades Mecânicas da fibra da glândula Ampolada
principal de N. cruentata
42
ii
Introdução 43
Resultados 44
Diâmetro da fibra 44
Testes mecânicos 45
Microscopia de força atômica 46
Discussão 48
Capítulo 4 - Espidroínas da aranha Avicularia juruensis 51
Introdução 52
Resultados 53
Biblioteca de cDNA 53
Análise das seqüências 54
Freqüência de codons 57
Discussão 57
Capítulo 5 - Relacionamento evolutivo da MaSp entre as diferentes espécies
de aranhas
60
Introdução 61
Resultados e discussão 62
Referências
67
Anexo 1 - Material e métodos 78
Extração de RNA 78
Construção das bibliotecas de cDNA 78
Seleção e análise de seqüências 79
RT-PCR 80
Árvore filogenética de N. cruentata 80
Coleta da fibra ampolada principal de N. cruentata 81
Medida do diâmetro da fibra 81
Testes mecânicos 81
Microscopia de força atômica 82
Análise filogenética de A. juruensis, mapeamento de caracteres e
reconcialiação da árvore
82
Anexo 2
Seqüências de cDNA das espidroínas de N. cruentata
Seqüências de cDNA das espidroínas de A. juruensis
85
85
96
iii
Anexo 3 – Artigo: Spidroins from the Brazilian spider Nephilengys
cruentata (Araneae: Nephilidae)
105
Anexo 4 – Artigo: How old are major ampullate silks?
116
iv
ÍNDICE DE FIGURAS E TABELAS
Capítulo 1
Figura 1 - Representação da relação filogenética de Araneae 3
Figura 2 - Glândulas de sedas de aranha 4
Figura 3 - Desenho esquemático da microestrutra da fibra
ampolada principal
8
Figura 4 - Representação artística da estrutura glandular geral 14
Figura 5 - Histologia da glândula sericígena 17
Tabela 1 - Motivos de aminoácidos encontrados em 3
diferentes tipos de espidroínas e sua estrutura adotada
6
Tabela 2 - Comparação entre diferentes propriedades
mecânicas de sedas de aranha, seda do bicho-da-seda, fibras
naturais e polímeros sintéticos
7
Tabela 3 - Comparação do teor de aminoácidos, do
desempenho mecânico e da função ecológica de cinco sedas
identificadas até o momento
13
Tabela 4 - Compilação de alguns atributos materiais,
propriedade correspondente e unidades de medida
20
Capítulo 2
Figura 1 - RT-PCR com RNA total da(s) glândula(s)
sericígena(s) de N.cruentata
29
Figura 2 - Alinhamento das regiões repetitivas de duas
espidroínas de N. cruentata com espidroínas de diferentes
espécies de aranhas
30
Figura 3 - Esquema da região repetitiva de espidroínas da
glândula Flagelliforme de diferentes espécies de aranhas
31
Figura 4 - Alinhamento da região repetitiva da espidroína da
glândula Tubuliforme de N. cruentata com as de diferentes
espécies de aranhas
32
Figura 5 - Alinhamento da região C-terminal das espidroínas
de N. cruentata com espidroínas de diferentes espécies de
35
v
aranhas
Figura 6 - Árvore sem raíz da topologia resultante da análise
de ML (- lnL: 16456.89) das seqüências da região C-terminal
de várias espidroínas
36
Tabela 1 - Escolha de codons para os aminoácidos mais
freqüentes nas espidroínas de N. cruentata
33
Capítulo 3
Figura 1 - Desempenho mecânico da fibra ampolada principal
de N. Cruentata
46
Figura 2 - Imagens obtidas da fibra ampolada principal de N.
cruentata por meio da microscopia de força atômica
47
Tabela 1 - Resultados dos testes mecânicos das fibras de duas
aranhas N. cruentata
44
Tabela 2 - Propriedades mecânicas (valores de engenharia) da
seda ampolada principal de diferentes espécies de aranha
45
Capítulo 4
Figura 1 - RT-PCR com RNA total da(s) glândula(s)
sericígena(s) de A. juruensis
54
Figura 2 - Região repetitiva das Espidroínas 1 e 2 expressas
pela A. juruensis
55
Figura 3 - Alinhamento da região C-termninal das três
traduções supostamente parálogas para o gene da Espidroína
1 (1A, 1B e 1C) de A. juruensis
55
Figura 4 - Alinhamento da região C-terminal da Espidroína 2
de A. juruensis com proteínas MaSp2 de diferentes espécies
de aranhas
56
Tabela 1 - Escolha de codons para os aminoácidos mais
freqüentes nas espidroínas de A. juruensis
57
Capítulo 5
Figura 1 – A) Relacionamentos filogenéticos entre as
espidroínas de A. juruensis com diferentes seqüências de
espidroínas publicamente disponíveis. B) Árvore filogenética
de aranha com dados da ML de Ayoub et al., 2007.
64
vi
RESUMO
As aranhas produzem até seis tipos diferentes de seda, cada um para uma função
biológica específica. As sedas de aranhas também são conhecidas por suas exclusivas
propriedades mecânicas. A possibilidade de produzir novos materiais com propriedades
semelhantes motivou a pesquisa sobre essas proteínas da seda (espidroínas). Neste
trabalho foram identificados diferentes espidroínas produzidas pelas glândulas
sericígenas das aranhas Nephilengys cruentata, produtora de teias em orbital, e
Avicularia juruensis, da família das caranguejeiras, aranhas rudimentares possuídoras
de apenas uma ou duas glândulas produtoras de seda; ambas encontradas na fauna
brasileira. As seqüências das espidroínas de N. cruentata mostraram uma considerável
semelhança com outras espidroínas anteriormente descritas, com alto teor de alanina e
glicina devido à presença dos motivos altamente repetitivo (poli-Ala, (GlyGlyX)
n
,
(GlyProGlyGlyX)
n
). Estudos mecânicos e estruturais da fibra ampolada principal, uma
das produzidas pela aranha N. cruentata, também foram conduzidos no intuito de
esclarecer as correlações entre estrutura e função desta espidroína. Nos últimos anos, a
maioria das pesquisas sobre as proteínas de seda de aranhas se concentrou nas aranhas
de fiação orbicular e em suas intrigantes teias. Outras aranhas de construção não
orbicular, tais como a "primitiva" Mygalomorphae, foram em grande parte
negligenciadas, assim criando uma nítida lacuna de conhecimento na evolução da seda
de aranhas. Neste estudo, foram identificadas duas espidroínas produzidas pela
glândula globular da aranha migalomorfa Avicularia juruensis, uma aranha nativa da
Amazônia brasileira. A análise das seqüências e da filogenia usando 77 C-terminais a
partir de 35 espécies de aranhas classificaram, de modo evidente, uma das espidroínas
da Avicularia dentro da classe da ampolada maior (MaSp2), contribuindo para o melhor
entendimento de vários aspectos evolutivos das sedas de aranhas.
Palavras-chave: aranhas, espidroínas, evolução, fauna brasileira, estrutura molecular,
propriedades mecânicas
vii
ABSTRACT
Spiders are able to produce up to six different kinds of silk, each one for a
specific biological function. Spiders’ silks are also known for their unique mechanical
properties. The possibility to produce new materials with similar properties led to an
advance in the studies about the silks’ proteins (spidroins). In this work were identified
spidroins produced by the silk glands from the Brazilian spiders Nephilengys cruentata,
an orb-weaver spider, and Avicularia juruensis, from the tarantula family which has
only one or two silk glands. N. cruentata spidroins sequence showed great similarity to
other spidroins previously described, with high content of alanine and glycine amino
acids due to the presence of highly repetitive motifs (poly-Ala, (GlyGlyX)
n
,
(GlyProGlyGlyX)
n
). In order to establish a comparison between the amino acid
sequence motifs found in the major ampullate silk from N. cruentata and its mechanical
properties, structural and mechanical analyses were also done. Most research on spider
silk proteins in recent years has concentrated on orb weaving spiders and their
intriguing webs. Other non-web building spiders, such as the “primitive”
Mygalomorphae have been largely neglected, creating a clear knowledge gap in spider
silk evolution. In this study we have identified two spidroins produced by the globular
gland of the mygalomorph spider Avicularia juruensis, a native spider from the
Brazilian Amazon. Sequence and phylogenetic analysis using 77 C-termini from 35
spider species clearly place one of the Avicularia spidroins within the major ampullate
(MaSp2) clade, contributing for the better understanding of several evolutionary aspects
of the spider silks.
Key words: spiders, spidroins, evolution, Brazilian fauna, molecular structure,
mechanical properties
viii
Capítulo 1
Introdução
1
Relacionamentos evolutivos
As sedas podem ser produzidas por pelo menos 39.725 espécies de aranhas até o
momento identificadas, e agrupadas em 108 famílias (Platnick, 2007). O primeiro fóssil
de aranha data de 380 milhões de anos e é a mais antiga espécie de que se tem
conhecimento até o momento (Shear et al., 1989, Selden et al., 1991). As aranhas
formam um grupo monofilético, sua monofilia é apoiada basicamente por caracteres
morfológicos
que incluem apêndices abdominais modificados, tais como fiandeiras,
glândulas sericígenas e fúsulas. Há duas infraordens monofiléticas atualmente
reconhecidas na ordem Araneae: Mesothelae e Opisthotheleae, sendo a última
constituída pelas aranhas Mygalomorphae (aranhas rudimentares) e Araneomorphae
(aranhas mais especializadas) (Figura 1). Mesothelea é o menor grupo e é representado
por aranhas que possuem caracteres antigos (ex. abdômen segmentado); nenhuma
seqüência de proteína da seda de quaisquer dessas aranhas foi descrita. O grupo
Mygalomorphae (caranguejeiras e seus parentes) tem aproximadamente 2.500 famílias
reconhecidas (Platnick, 2007) e este grupo inclui a aranha Euagrus chisoseus cuja
seqüência da proteína de sua seda foi relatada (Gatesy et al., 2001). A Araneomorphae,
também conhecida como aranha verdadeira, é a mais diversa em número de famílias
(94), e compreende o grande grupo de aranhas tecedoras de teias orbiculares
(Orbiculariae: Araneoidea e Deinopoidea) (Foelix, 1996), a maior parte dos dados
descritos até o momento sobre as proteínas das sedas de aranha vem desse grupo (Xu e
Lewis, 1990; Hinman e Lewis, 1992; Hayashi et al., 2004; Huang et al., 2006). As
seqüências parciais das proteínas de sedas descritas nesta dissertação vêm de aranhas
das famílias Nephilidae (Nephilengys cruentata) e Theraphosidae (Avicularia
juruensis), pertencentes às subordens Araneomorphae e Mygalomorphae,
respectivamente. Com base no mais antigo fóssil de aranha conhecido, Attercospus
(Selden et al., 1991), a divergência das migalomorfas para as araneomorfas teria
ocorrido há 340-390 milhões de anos atrás (Ayoub et al., 2007).
2
Figura 1: Representação da relação filogenética de Araneae (Coddington e Levi, 1991;
Hormiga et al., 2000; Gatesy et al., 2001; Ayoub et al., 2007). Espécies extintas,
Attercospus e Macryphantes estão indicadas por círculos pretos. O gênero de aranhas
utilizado neste trabalho está sublinhado.
Tetragnatha
A
ttercospus
340-390 MY
L
actrodectus
A
rgiope
A
vicularia
N
ephilengys
A diversibilidade de espécies se deve, em grande parte, à capacidade das aranhas
de produzir sedas durante seu ciclo de vida como também a utilização especializada dos
diferentes tipos de sedas produzidos. Durante sua evolução e colonização em diferentes
ecossitemas, as aranhas desenvolveram uma estrutura glandular mais especializada
capaz de produzir diferentes tipos de seda. Atualmente, de acordo com a espécie,
aranhas podem possuir até sete tipos diferentes de glândulas sericígenas, seis delas
produtoras de sedas, sendo cada uma utilizada para um propósito específico e
3
caracterizadas por um impressionante desempenho mecânico (Blackledge e Hayashi,
2006); e uma glândula capaz de produzir uma substância glicoproteica adesiva
(Vollrath, 1992). Embora a organização geral das glândulas responsáveis pela produção
dos mais diferentes tipos de seda seja muito similar entre as espécies de aranhas, cada
uma delas possui uma morfologia única (Figura 2).
Seda rígida externa de casulos
Glândula agregata
Glândula fla
eliforme
Glândula tubuliforme
Glândula
ampolada
secundária
Glândula
p
iriforme
Espiral de tei
a
orbiculares
Solução aquosa e adesi
v
da espiral de captura
Glândula
aciniforme
Glândula
ampolada
p
rincipal
Envoltório d
e
p
resas
Linha de
moldura
da
maioria
das teias
Camada interior
do casulo
Linha de
segurança
Junção entre sedas e
su
p
erfícies
Espiral de captura
Figura 2: Glândulas de sedas de aranha (Vollrath, 1992). Aranhas podem produzir até
seis tipos de sedas. Cada tipo é responsável por uma função e é produzida por um
sistema único de glândulas especializadas localizadas no abdômen da aranha como
mostrado acima. Cada tipo de glândula se apresenta em pares.
Nos últimos anos, as relações controversas entre os diferentes gêneros e ordens
de aranhas estão sendo analisadas por meio da geração de dados a partir do
seqüenciamento de DNA e da construção de árvores filogenéticas. Por exemplo, as
tentativas para dirimir as relações amplamente debatidas entre as viúvas-negras (gênero
Lactrodectus) foram relatadas com base no DNA mitocondrial (Garb et al., 2004) e
DNA ribossomal (Zhang et al., 2004). Mais recentemente, relações filogenéticas das
migalomorfas foram baseadas no fator de alongamento-1γ e nos genes nucleares dos
RNAs ribossomais 18S e 28S (Hedin e Bond, 2006; Ayoub et al., 2007). As seqüências
das proteínas de sedas (espidroínas) também podem ser usadas para as análises
4
filogenéticas e para a determinação das relações evolutivas entre elas (Hayashi et al.,
2004; Garb e Hayashi, 2005; Challis et al., 2006, Garb et al., 2006).
Arquitetura Molecular
Independente do tipo, todas as sedas de aranha são compostas por grandes
proteínas, calculadas em até 500 kD. Essas proteínas podem ser examinadas de acordo
com a hierarquia da sua arquitetura molecular. A análise da seqüência de aminoácidos
possibilita não apenas uma perspectiva de evolução, mas também de estrutura e função
das espidroínas. As diferentes sedas produzidas pelas espécies de aranha que fiam uma
teia orbicular aérea, são de importância decisiva na luta pela sobrevivência e, portanto,
as mudanças evolutivas são raras e de grande importância. O exame das seqüências de
aminoácidos da espidroína da seda da glândula ampolada principal de uma variedade de
diferentes espécies de aranha que produzem a teia orbicular, revelou não apenas um alto
grau de conservação das seqüências, mas também identificou um subconjunto repetitivo
de seqüências-motivo (Gatesy et al., 2001). Além das considerações evolutivas, as
séries concatenadas de motivos repetitivos de aminoácidos expõem uma estrutura de
nanocomponentes na qual os domínios ricos em alanina e glicina (poli-Ala e (Gly-
Ala)
n
) adotam uma estrutura em folhas-β responsável pela formação de cristais (Lucas,
1964; Parkhe et al., 1997; Qin et al., 1997; Hayashi e Lewis, 1998; Grubb e Ji, 1999;
Hayashi e Lewis, 2000; Riekel et al., 2000); e a região GlyGlyX (X=Leu, Tyr, Ser, Ala)
forma 3
10
-hélices que conectam os cristais de modo a estabilizar e orientar a estrutura da
fibra (Tamburro et al., 1991; Tatham e Shewry, 2000). Hipoteticamente, a base para a
elasticidade da fibra deve ser a prolina presente no motivo GlyProGlyXX (X=Gly, Gln,
Tyr, Ala, Ser), que é considerado responsável por formar uma matriz móvel e um tanto
amorfa (Dong et al., 1991; Hayashi e Lewis, 1998; Gosline et al., 2002) (Tabela 1). As
implicações de tal disposição de motivos podem ser deduzidas a partir de estudos
moleculares dinâmicos baseados em outros nanocomponentes de polímero que sugerem
que o movimento das regiões internas de um nanocomponente contribui
significativamente para o aumento da sua resistência (Gersappe, 2002).
5
Tabela 1
Motivos de aminoácidos encontrados em 3 diferentes tipos de espidroínas e sua
estrutura adotada
X - indica a presença do motivo na estrutura.
Espiral-β elástica *
GPGXX
Folhas-β *
Rico em Ala
3
10
-
hélice*
Espaçador**
Estrutura
desconhecida
C-
terminal**
Estrutura
desconhecida
Proteína
GPGGX GPGQQ
(
(
G
G
A
A
)
)
n
n
A
n
G
G
G
G
X
X
Ú
Ú
n
n
i
i
c
c
o
o
Ù
Ù
n
n
i
i
c
c
o
o
MaSp1
X X
X
X
X
X
MaSp2
X
X
X
X
X
X
X
MiSp1
X X
X
X
X
X
X
X
MiSp2
X X
X
X
X
X
X
X
Flag
X
X
X
X
X
X
X
X
*Cada motivo de aminoácido é responsável por uma determinada propriedade mecânica na espidroína.
** As regiões C-terminal e região espaçadora não repetitivos ainda não foram identificadas como
responsáveis por adicionar propriedade mecânica as espidroínas.
Tipos de Seda
Ampolada principal: A maioria dos estudos científicos foi realizada com base na fibra
da ampolada maior que serve como linha de seguraça da aranha e como a seda de
moldura estrutural para sua teia. As razões para importância da fibra ampolada maior
são duas: -primeiro, a glândula ampolada maior é a mais volumosa no abdômen da
aranha e sua forma distinta de ampola faz com que seja fácil identificar e dissecar; -
segundo, as propriedades físicas desta seda, tais como o diâmetro da fibra e a facilidade
de coleta (por meio da confecção forçada da seda), sem mencionar as propriedades
mecânicas (Tabela 2) dessa super-resistente fibra, faz com que seja relativamente fácil
realizar uma variedade de experiências.
6
Tabela 2
Comparação entre diferentes propriedades mecânicas de sedas de aranha, seda do
bicho-da-seda, fibras naturais e polímeros sintéticos
Hinman et al., 2000
Material Tensão (Pa) Extensibilidade (%)
Energia para romper
(J/kg)
Seda ampolada
principal
4x10
9
35 1x10
5
Seda ampolada
secundária
1x10
9
5 3x10
4
Seda flagelliform 1x10
9
>200 1x10
5
Seda do bicho-da-seda 1.3x10
9
Kevlar 4x10
9
5 3x10
4
Borracha 1x10
6
600 8x10
4
Tendão 1x10
9
5 5x10
3
Nylon, Tipo 6 7x10
7
200 6x10
4
A modelagem molecular da seda ampolada maior seca utiliza extensas
quantidades de dados apresentando o modelo aceito de folhas-β incorporadas em uma
matriz móvel, um tanto amorfa, que formam um composto de fibra nano-estruturado
(Termonia, 1994) (Figura 3). A base para as duas fases distintas (isto é, rígida e móvel)
dessa fibra de biopolímero reside em sua amalgamação de duas proteínas distintas:
MaSp1 e MaSp2. Embora a natureza da interação de MaSp1 com MaSp2 não seja
identificada, o fato de que ambas as proteínas estão sempre acopladas na fibra da
ampolada maior, independente da espécie da tecedora da teia orbicular, indica que a
associação entre as duas proteínas é conservada (Tian e Lewis, 2004). Esta relação
estabelece as bases para uma série de conclusões com relação ao propósito do alto grau
de conservação das proteínas, como também uma base para as correlações entre as
seqüências-motivo de aminoácidos e das propriedades mecânicas da fibra sólida.
7
Figura 3: Desenho esquemático da microestrutra da fibra ampolada principal. Dentro
da fibra, blocos de aminoácido formam regiões de folhas-β (abaixo), que promovem a
organização de cristais. Estes cristais são intercalados por regiões amorfas que criam um
material nanoestruturado (meio).
Independentemente das funções da seda ou da ecologia da aranha e, apesar das
diferenças na seqüência de aminoácidos das fibras, todas apresentam um impressionante
desempenho mecânico (Blackledge e Hayashi, 2006). Ademais, certos motivos (isto é,
poli-Ala) na seqüência de aminoácidos da fibra foram mantidos, independente da
estratégia predatória da aranha (Gatesy et al., 2001; Tian e Lewis, 2004). Essas
observações no contexto de correlação das propriedades mecânicas da fibra com sua
seqüência de aminoácidos são o alicerce para a sugestão de que a evolução de uma fibra
forte e resistente antecede a teia orbicular (Swanson et al., 2006).
As fibras da glândula ampolada maior são conhecidas como possuidoras de
resistência na mesma ordem de magnitude daquela da fibra Kevlar de alto desempenho,
mas com aproximadamente sete vezes sua elasticidade. Grande parte dos dados é de
espécies ecologicamente similares. Para constatar o potencial da seda de aranha para a
aplicação comercial e a fim de verdadeiramente entender os princípios de concepção da
8
sua natureza, são necessários estudos mais extensos sobre as propriedades mecânicas
dessa superconsistente fibra (Tabela 2).
Ampolada secundária: Restrições contraditórias de design: a necessidade de ser forte o
suficiente para parar a vítima voadora e manter ainda sua elasticidade e a necessidade
simultânea de poder absorver a energia cinética do impacto da presa, fazem da teia
orbicular com sua organização de múltiplas fibras uma estrutura aperfeiçoada durante a
evolução das aranhas (Lucas, 1964; Denny, 1976; Wirth e Barth, 1992). A seda da
ampolada secundária forma a espiral auxiliar da teia. As propriedades mecânicas da
seda da ampolada secundária (Tabela 2) também precisam ser totalmente elucidadas,
mas as curvas preliminares de tensão indicam que ela tem cerca de um quarto da
resistência da seda da ampolada maior e, em linhas gerais, a mesma elasticidade de fibra
Kevlar (Gosline et al., 1999).
A análise das seqüências das ampolada secundárias revela que da mesma forma
que a seda da ampolada maior, esta é uma combinação de duas proteínas. Entretanto,
uma comparação mais detalhada demonstra uma ausência do motivo GlyProGlyXX,
como também a presença de uma região espaçadora única não repetitiva (Colgin e
Lewis, 1998). Embora não haja uma função designada para esta região, reconhece-se
como sendo conservada entre as espécies produtoras da teia orbicular. Além disso, a
total falta de GlyProGlyXX em qualquer uma das proteínas das ampolada secundárias,
quando consideradas no contexto das propriedades mecânicas, proporciona crédito
adicional à suposição de que GlyProGlyXX confere elasticidade à fibra.
Tubuliforme: Embora os aracnídeos não sejam os únicos artrópodes a ter evoluído a
seda, certamente são os mais adeptos e especializados em seu uso. Ao contrário de
muitos outros usuários de seda, ao longo de suas vidas, as aranhas evoluíram a
capacidade de produzir muitas de suas sedas; entretanto, a seda da tubuliforme, utilizada
na construção do casulo, só é produzida durante o período reprodutivo do ciclo de vida
de uma aranha. As comparações de seqüências a partir de uma variedade de espécies
indicam que apesar das origens antigas desta seda, as proteínas ortólogas das
tubuliformes (TuSp1) possuem repetições de seqüências altamente conservadas (Tian e
Lewis, 2005; Garb e Hayashi, 2005). A análise da composição de aminoácidos revela
apenas uma proteína da tubuliforme com alto teor de serina e baixo teor de glicina
devido a uma série de motivos repetitivos (Ala
n3
, Ser
n
, (SerAla)
n
, (SerGln)
n
, GlyX) não
9
vistos em quaisquer outras sedas de aranhas (Tian e Lewis, 2005; Garb e Hayashi, 2005;
Hu et al., 2005b; Hu et al., 2006).
Embora a seqüência da proteína da tubuliforme seja conhecida, as informações
com relação à mecânica da seda do casulo das aranhas orbiculares são escassas
(Blackledge e Hayashi, 2006). Entretanto, as observações no contexto da função
biológica da seda tubuliforme sugerem que essa fibra em particular teria que ser
suficientemente forte para proteger os ovos, ainda frágeis, de modo a fazer com que seja
possível a prole ser chocada. Na realidade, a seda da tubuliforme tem um módulo de
Young mais elevado quando comparado à seda da ampolada maior, mas um limite de
ruptura e resistência inferiores (Blackledge e Hayashi, 2006).
Aciniforme: Ao contrário de muitas outras sedas, a análise de aminoácido indica que a
seda da aciniforme tem um percentual relativamente baixo de glicina e alanina (Hayashi
et al., 2004). Além disso, a seda da aciniforme é produzida como uma secreção fibrosa
por múltiplas fúsulas localizadas nas fiandeiras medianas posteriores. Essa seda é
utilizada não apenas para envolver a presa, mas a aranha também a usa para decorar a
teia (visto nas espécies de Argiope), construir teias de espermatozóides e serve como
uma camada primária na confecção do casulo. A seda da aciniforme contém apenas
uma proteína conhecida, AcSp1, com unidades repetitivas únicas: poli-Ser e
ThrGlyProSerGly não vista na seda da ampolada maior, na seda da ampolada
secundária, na seda da tubuliforme ou na seda da flageliforme (Hayashi et al., 2004).
Apesar das diferenças na subestrutura das seqüências, a arquitetura molecular da
seda da aciniforme mantém a extraordinária resistência, demonstrando um aumento
maior do que 50% na resistência quando comparada à seda da ampolada maior. Esta
espantosa resistência é conseqüência de uma extensibilidade que é mais alta do que a da
seda da ampolada principal ou secundária; e uma resistência que é menor do que a da
seda da ampolada maior, mas maior do que a da seda da ampolada secundária (Hayashi
et al. 2004; Blackledge e Hayashi, 2006).
Flageliforme: Grande parte das informações disponíveis sobre a base molecular da
elasticidade natural nas fibras da seda de aranhas foi produzida a partir de estudos da
seda da flageliforme. A observação da composição natural da teia e da mecânica nos
informa que a espiral de captura, que é uma combinação de produtos de duas glândulas:
fibra da glândula flageliforme e cola líquida de glândula agregata, é a parte mais
10
extensível da teia. Embora a solução adesiva da aggregate seja extremamente
importante para a habilidade da espiral de captura e enlaçar da presa, é a fibra da
flageliforme que deve ser extensível o suficiente para manter a integridade da teia. Na
realidade, testes mecânicos demonstram que a seda da flageliforme tem uma
elasticidade superior a 200%, além do desempenho de qualquer borracha natural
(Hayashi et al., 1999).
Analisando a seqüência da proteína da flageliforme, a composição de motivos
apóia os estudos mecânicos e empresta credibilidade à suposição de que o motivo
pentapeptídeo, GlyProGlyXX, é a base da elasticidade (Hayashi e Lewis, 1998). A
arquitetura da seqüência mostra que o motivo GlyProGlyXX forma uma unidade
repetitiva da proteína da flageliforme com até 63 repetições concatenadas antes da
interrupção por outro motivo. Com base em uma extensiva pesquisa de outras proteínas
contendo repetições de Pro-Gly na sua estrutura primária e na corroboração de estudos
estruturais sobre o glúten de trigo e a elastina W4, a estrutura secundária resultante do
motivo pentâmero iterado é hipoteticamente voltas-β do tipo II (Hutchinson e Thornton,
1994; Urry et al., 1995; Urry e Parker, 2002). Além disso, há uma evidente falta de
domínios ricos em alanina que corresponde à resistência à tensão diminuída da fibra
quando comparada às fibras da ampolada maior (Hayashi e Lewis, 1998).
Agregata: A glândula agregata produz a cola pegajosa da seda flageliforme que reveste
o núcleo da espiral de captura da teia. As modificações glicoproteicas, não vistas em
outras proteínas das sedas de aranhas, são cogitadas por serem responsáveis pelas
qualidades adesivas às proteínas da agregata (Tillinghast et al., 1991). Há também
evidência de que esta cola glicoproteica contenha sais que agem como bactericidas
(Vollrath e Knight, 2001) e compostos orgânicos que atraem a água atmosférica
(Edmonds e Vollrath, 1992). Essa água serve para plastificar a fibra flageliforme que
esta cola reveste (Vollrath e Edmonds, 1989).
Piriforme: Embora a seda da piriforme seja fundamental à teia orbicular aérea, nem a
seqüência ou as propriedades mecânicas dessa seda responsável pela adesão da teia a
superficies é conhecida. A análise da composição de aminoácido desta glândula mostra
uma abundância de resíduos polares e carregados (isto é, ácido glutâmico, serina,
lisina). De fato, a composição da seda da piriforme é mais similar ao produto protéico
da glândula aggregate do que as fibras de teias mais tradicionais (Andersen, 1970).
11
Identificar as excelentes propriedades mecânicas da seda de aranha é fácil,
porém a fonte de tal extraordinário design permanece desconhecida. Há três explicações
possíveis para o conjunto de atributos materiais, aparentemente incomparáveis.
Primeiro, a resposta reside na arquitetura molecular das proteínas, em sua seqüência
(Tabela 3). Segundo, a chave encontra-se no aparato de fiação da aranha. Por último e
talvez o mais realista, uma combinação de ambas, da seqüência das proteínas junto com
o inconfundível aparato de fiação, responderia pelo equilíbrio entre resistência e
elasticidade.
Considerando a extensa variação das propriedades mecânicas resultantes de um
simples subconjunto de motivos de aminoácidos que se combinam de modo a criar uma
pequena variedade de proteínas, essa variação propicia uma forte evidência do potencial
significativo de se adaptar um biomaterial à base de seda (Tabela 3). Por conseguinte,
entender como uma única fibra de um décimo até um centésimo do diâmetro de um
único fio de cabelo humano pode ser mais forte que aço e mais elástica que qualquer
outra borracha natural estimula a imaginação e leva a uma pesquisa no intuito de
produzir uma fibra sintética de alto desempenho que possa emular e, potencialmente,
melhorar as capacidades da seda de aranha para aplicações médicas (isto é, substituição
de tendões e suturas ultrafinas de cirurgia óptica e neurocirurgia), militares (isto é,
uniformes de campanha
à prova de balas leves) e outras aplicações comerciais (isto é,
airbags (bolsas de ar) e pneus). A utilização da seda de aranha como base para as
potenciais aplicações descritas acima, só será possível a partir do momento que a
natureza básica dessas fibras for compreendida detalhadamente, não apenas a sua
seqüência de aminoácidos, mas também de todos os caminhos de produção da seda
como uma base para o controle das diversas e altamente desejáveis propriedades
mecânicas.
12
Tabela 3
Comparação do teor de aminoácidos, do desempenho mecânico e da função ecológica de cinco sedas identificadas até o momento
(modificado de Blackledge e Hayashi, 2006).
Os aminoácidos estão indicados por abreviações de uma letra: A, alanina; G, glicina; P, prolina; S, serina; X, glicina ou outro aminoácido.
1
(Gatesy et al, 2001),
2
(Xu e Lewis, 1990),
3
(Parkhe et al., 1997),
4
(Thiel et al., 1997),
5
(Garb e Hayashi, 2005),
6
(Tian e Lewis, 2005),
7
(Barghout et al., 2001),
8
(Barghout et al.,
1999),
9
(Dicko et al., 2004),
10
(Hayashi et al., 2004),
11
(Hayashi e Lewis, 2000),
12
(Gosline et a1., 1984),
13
(Hayashi e Lewis, 1998),
14
(Hayashi e Lewis,
2001),
15
(Vollrath e Edmonds, 1989).
Seda
Elementos moleculares Desempenho mecânico Função ecológica
Ampolada
principal
Composição: motivos GA e poli(A), repetições curtas de
motivos GPGX
n
1,2
Estrutura 2ª: cristais de folha-β posicionados ao longo do
eixo da fibra e incorporados em matriz amorfa
3,4
Alta resistência à tração, baixa
extensibilidade, exibe supercontração
quando umedecida.
Linha de segurança, elementos
estruturais primários secos da
maioria das teias de captura.
Tubuliforme
Composição: rica em A e S, repetições longas e complexas
faltando motivos de sub-repetições
5,6
Estrutura 2ª: folhas -β serpenteiam em paralelo à fibra e
incorporadas em matriz amorfa
3,7,8,9
Módulo de Young alto, baixa força, muito
pequeno endurecimento após o rendimento
da fibra, diâmetro grosso.
Seda externa rígida de casulos.
Ampolada
secundária
Composição: motivos (GA)
n
com ausência de motivos
poli(A)
l
Estrutura 2ª: cristais de folha-β posicionados ao longo do
eixo da fibra e incorporados em matriz amorfa
9
Módulo de Young e extensibilidade altos,
resistência à tração moderada e robustez.
Espiral temporária do orbe.
Aciniforme
Composição: rica em A e S, repetições longas e complexas
faltando motivos de sub-repetições
10
Estrutura 2ª: não caracterizada
Módulo de Young, alta extensibilidade e
robustez, folha de multi-filamentos de
fibras finas.
Envoltório de presas, decorações
de teia, camada interior de
casulos.
Espiral de
captura
Composição: fibra da espiral da teia (glândula sericígena
flageliforme) revestida com cola de glicoproteínas, a fibra
do núcleo possui longas repetições de motivos GPGX
n
11
Estrutura 2ª: falta β-folha, sub-repetições se duplicam em
“nanomolas” moleculares, fibra plastificada
12,13,14,15.
Extremamente extensível e elástica
altamente complacente, fibra úmida
revestida de cola.
Espiral pegajosa de teias
orbiculares da ecribellate
13
Biologia da seda
As aranhas desenvolveram um sistema complexo de glândulas distintas
especializadas em secretar seda. Essas glândulas não apenas mantêm reservatórios
separados de proteínas de seda individuais, mas as observações da estrutura total do
aparato de fiação revelam que cada glândula se conecta as fúsulas das fiandeiras. Esta
organização não apenas permite que a aranha reserve certas sedas para usos específicos,
mas também proporciona a produção de múltiplas fibras simultaneamente. Compreender,
e assim, reproduzir como a aranha tece a seda exige conhecimento sobre como a seda é
secretada e armazenada na glândula; e também sobre as forças necessárias para produzir
e expelir uma fibra sólida a partir de uma solução líquida cristalina de fiação, sem usar
solventes extremos ou outras condições ambientais (Vollrath e Knight, 2001). Uma vez
que a glândula ampolada principal é a mais volumosa e a mais acessível de todas as
glândulas produtoras de seda, ela foi usada como modelo para decifrar as tênues
características morfológicas e funcionais desse avançado mecanismo de fiação.
Lúmen:
Acúmulo
Cauda:
Síntese e
secreção
Duto:
Alinhamento e
desidaratação
Fiandeira:
Produção da fibra
Alinhamento
moderado
Alinhamento
intermediário
Altamente alinhado:
folhas-β, voltas-β e
hélices de glicina
Algum alinhamento das
proteínas presentes na solução
líquida cristalina
Figura 4: Representação artística da estrutura glandular geral. As funções hipotéticas
foram designadas a áreas específicas da glândula. Reprodução cortesia do Dr. Michael
Hinman.
14
A partir da observação inicial, a glândula pode ser dividida em 4 seções
diferentes: o lúmen que serve como repositório de armazenamento para a solução de
fiação; a cauda que abriga as células epiteliais especializadas que secretam as espidroínas
(proteínas constituintes da seda); o duto que orienta as proteínas da seda e também
reabsorve a água da solução de fiação; e a fiandeira que funciona como válvula e possui
funções de controle da produção da fibra final (Figura 4). Porém, um exame mais
minucioso revela duas zonas transversais distintas na porção da cauda da glândula
(Vollrath e Knight, 2001) (Figura 5). A zona A é composta por células colunares altas
que secretam gotas de mucopolissacarídeos (Hijirida et al., 1996; Rising et al., 2005) na
matriz aquosa de espidroínas que nesta fase possui uma concentração de 25-30% (p/v)
(Chen et al., 2002). À medida que a solução de fiação caminha em direção à fiandeira, as
gotas de mucopolissacarídeos crescem e se aglutinam. Enquanto a coalescência acontece,
o maior obstáculo a tão alto conteúdo de proteínas se torna aparente. A habilidade de
tecer uma fibra sólida a partir de uma solução altamente viscosa, porém aquosa, é única e
incomparável na química dos polímeros. Independentemente se em um sistema biológico
natural ou em uma situação sintética, evitar a auto-organização e a interação das proteínas
antes de abandonar o abdômen da aranha é um assunto que deve ser elucidado.
Compreender como a aranha confronta e supera este assunto exige um olhar
retrospectivo para as seqüências-motivo das espidroínas. As seqüências-motivo que são
típicas para a seda de aranha podem ser divididas em duas categorias: domínios
hidrofóbicos e domínios hidrofílicos. Não é apenas a presença de blocos hidrofílicos e
hidrofóbicos de aminoácidos, mas o mais importante é o arranjo dos domínios que
permite que uma solução líquida e cristalina de fiação seja processada em uma fibra
sólida, ao mesmo tempo em que se impede as interações prematuras que fariam com que
as proteínas da seda se precipitassem. Os aminoácidos hidrofóbicos são agrupados para
excluir a água à medida que a solução flui através da glândula afunilada, com isso
criando cristais de folhas-β para confeccionar fios fortes e insolúveis (Knight e Vollrath,
2002). Para manter a solubilidade da solução de fiação, domínios hidrofílicos flanqueiam
um centro principalmente hidrofóbico (Bini et al., 2004). Além da interação entre os
domínios hidrofílicos, domínios hidrofóbicos e o ambiente aquoso, a contribuição da
região C-terminal não repetitiva e altamente conservada das proteínas MaSp na formação
15
de fibras não pode ser negligenciada. Uma análise do domínio C-terminal das principais
proteínas das glândulas sericígenas ampullate revela um único resíduo conservado de
cisteína que poderia permitir a formação de dímeros, o que, conseqüentemente,
contribuiria substancialmente para as propriedades mecânicas da fibra tecida. Não
obstante o papel do resíduo de cisteína é evidente que a C-terminal encontra-se presente
nos conteúdos glandulares, como também na fibra final (Sponner et al., 2005). Estudos
adicionais ilustram, de maneira conclusiva, a necessidade do domínio C-terminal para a
adequada orientação e polimerização da fibra (Sponner et al., 2005; Ittah et al., 2006),
como também sugerem uma função na preservação da solubilidade ou na promoção da
agregação das espidroínas, dependendo das condições ambientais (Sponner et al., 2005).
Notavelmente, observe-se que a região C-terminal não é necessária para a fiação de fibras
sintéticas. Depois de abandonar a zona A e entrar na zona B, a matéria-prima da seda é
revestida por outra solução viscosa da zona B que é secretada a partir das células
colunares, que diferem ligeiramente em sua morfologia quando comparadas às células
colunares da zona A (Figura 5; Vollrath e Knight, 1999). A fase líquida cristalina, que é
fundamental para a velocidade com a qual a aranha pode tecer uma fibra de seda,
possibilita que a suspensão de espidroínas flua pela glândula ao mesmo tempo em que
mantém uma orientação simultaneamente similar àquela encontrada em um cristal com as
moléculas sendo organizadas em paralelo ao longo do eixo (Vollrath e Knight, 2001).
16
Figura 5: Histologia da glândula sericígena. Os painéis de A-G destacam a histologia da
parte de glândula responsável pelo o processo de tecelagem (lúmen, L). A parte inferior
detalha as funções que ocorrem em partes específicas da glândula. A produção da solução
de fiação ocorrendo nas zonas A e B são mostradas nos painéis A e B, respectivamente.
Note a diferença na morfologia das células de secretoras. Os painéis C e D mostram a
histologia de epitélio no primeiro e segundo membros, respectivamente. Os painéis V-Z
demonstram a natureza afilada do extenso duto. O processo de polimerização é
principalmente interno e começa no terceiro membro do duto (painel X), que é
aproximadamente 4mm da fúsula de saída. As funções do estreitamento da glândula são
reter água, alinhar as proteínas, produzir a fibra final sob tensão no passo final de
polimerização, e finalmente produzir uma fibra mecanicamente equilibrada com custos
metabólicos mínimos. Reproduzido de Vollrath e Knight, 2001.
17
Entender como a aranha pode armazenar tal solução de proteínas aquosa
altamente concentrada é apenas parte da equação que explica a base para a compreensão
das excelentes propriedades mecânicas da fibra da glândula ampolada principal (Tabela
1, Tabela 2). A outra parte da equação consiste no processo de extrusão. A força de
cisalhamento envolvida na compactação da solução de fiação extremamente viscosa à
medida que prossegue em direção à fiandeira propicia a evidência de que a separação de
fases induzida por este mecanismo desempenha um papel essencial na formação de uma
fibra sólida (Chen et al., 2002).
Combinar as forças necessárias para tecer uma fibra sólida com a alta viscosidade
da solução de fiação proporciona à aranha a flexibilidade de alterar a velocidade do
processo natural de fiação e produzir uma fibra sólida com forças externas relativamente
pequenas que se distendem sobre a fibra (isto é, gravidade ou as pernas da aranha). Até o
momento, recriar não apenas as condições da solução de fiação altamente concentrada,
mas também reproduzir as forças de fiação no laboratório foi relativamente mal sucedido.
A fiação sintética ou de laboratório emprega um conjunto completamente diferente de
forças, sendo necessário separar o processo de organização e desidratação das espidroínas
extraindo a solução de fiação por meio de uma agulha com um diâmetro pequeno (produz
o alinhamento das proteínas) em um banho de coagulação (imita a desidratação).
Antecipa-se que a discrepância entre as forças naturais e sintéticas usadas para produzir
uma fibra de seda possui alguma influência nas propriedades mecânicas da fibra
produzida sinteticamente.
Propriedades Mecânicas
Os testes de tensão da seda da ampolada principal da Nephila clavipes são o
princípio básico para a maioria dos estudos sobre as propriedades mecânicas das sedas de
aranha. Historicamente, com base em estudos rudimentares, os resultados de testes da
seda da aranha N. clavipes, que podem ser aplicados a outras tecedoras de teia orbicular,
embora haja diferenças entre as espécies (Brooks et al., 2005), demonstram a mistura
ecologicamente ideal das propriedades mecânicas para realizar uma ampla variedade de
funções exigidas durante a vida da aranha (Termonia, 1994). Porém, compreender o
18
design prototípico desta fibra necessita de um entendimento das funções biológicas da
seda em particular (Gosline et al., 2002). A teia precisa ser forte o bastante para deter um
inseto voador, e ainda, não tão elástico para evitar que o inseto seja catapultado fora da
mesma devido ao recuo elástico (Denny, 1976; Wirth e Barth, 1992; Gosline et al., 2002).
Conseqüentemente, a maioria dos estudos se concentra na resistência da seda, como
medida pela capacidade de tensão (definida como força dividida pela área da seção
transversal original da fibra, supondo um corte transversal circular (Lucas, 1964), em um
volume constante (Vollrath e Knight, 2001; Guinea et al., 2006), e na extensibilidade da
seda medida pela tração (a tração de engenharia é a mudança no comprimento dividida
pelo comprimento original da fibra). Observe-se que a suposição de volume constante
contradiz o comportamento observado de afunilamento ou estreitamento que ocorre
durante o teste de tensão. A maioria dos estudos que considera essas duas propriedades
(isto é, tensão e tração) com a adição da energia para romper (a quantidade de energia
exigida para fragmentar a fibra como descrito pela área sob a curva de tensão-tração), e o
módulo de Young (rigidez quantificada pelo declive do segmento linear inicial da curva
de tensão-tração antes do primeiro ponto de rendimento ou transição de fase/alinhamento
das proteínas da fibra) propicia um quadro relativamente abrangente dos princípios de
design que governam as funções mecânicas da seda da ampolada principal (Tabela 4).
Entretanto, quantificar determinadas propriedades, tais como o módulo de Young,
que é normalmente usado como uma medida da elasticidade da fibra, não propicia um
entendimento abrangente sobre a verdadeira elasticidade da fibra. A maioria dos estudos
que utilizam o módulo de Young e a extensibilidade para definir a elasticidade dá um
quadro incompleto da elasticidade apenas medindo a deformação recuperável ou a
deformação elástica. A fim de completar o conceito, é necessário considerar a
deformação plástica ou a deformação irrecuperável. É a interação tanto da deformação
elástica quanto da plástica que proporciona à fibra natural o devido equilíbrio de
extensibilidade e o recuo elástico (Beard, 1992). Historicamente, um número limitado de
histerese ou experiências cíclicas de carregamento/descarregamento foi concluído.
Basicamente, esses estudos foram realizados para revelar a energia que foi perdida.
Estudos adicionais contribuiriam substancialmente para a compreensão da elasticidade.
19
Tabela 4
Compilação de alguns atributos materiais, propriedade correspondente e unidades de
medida.
Atributo funcional Propriedade material Unidade
Rigidez Módulo de elasticidade
Módulo de Young
Nm
-2
,
Pascals
Força
Tensão de fratura, σ
max
Nm
-2
,
Pascals
Dureza Energia necessária para quebrar a fibra Jm
-3
, Jm
-2
, Pascals
Extensibilidade
Tração de fratura, ε
max
mm/mm, %
Uma vez que há um corpo da literatura que defende o uso dessa medida
alternativa de força e elasticidade para avaliar a seda da aranha, uma completa
compreensão do desempenho mecânico das fibras da seda da ampolada principal exige o
conhecimento dos parâmetros relacionados com as medições da real tensão e tração. Em
contraste com a tensão e tração de engenharia, há algumas reivindicações de que a real
tensão e tração seriam uma medida mais precisa das forças e, portanto, deveria ser usada
para todas as comparações dos dados do teste mecânico (Blackledge e Hayashi, 2006;
Guinea et al., 2006). No entanto, calcular a real tensão e tração para as fibras de seda é
tecnicamente desafiante, uma vez que uma única fibra da ampolada principal possui um
diâmetro muito pequeno, ainda que potencialmente variável. O cálculo da real tensão
necessita conhecer a área da seção transversal instantânea em cada valor da extensão. Os
benefícios de tal intenso teste mecânico e as análises resultantes são discutíveis.
Felizmente, a suposição de volume constante da fibra durante o teste de tensão foi
recentemente confirmada de maneira experimental (Guinea et al., 2006) e possibilita que
a tensão ou tração de engenharia seja matematicamente relacionada com a real tensão ou
tração, por meio das seguintes equações onde σ
tr
é a real tensão, σ
eng
é a tensão de
20
engenharia, ε
tr
é a real tração, e ε
eng
é a tração de engenharia. (Brooks et al., 2005;
Blackledge e Hayashi, 2006; Guinea et al. 2006):
)1( engengtr
ε
σ
σ
+
=
Equação 1
ε
tr = ln(1
+
ε
eng)
Equação 2
A controvérsia sobre as propriedades de tensão e tração não é a única questão para
complicar o teste e a comparação das fibras. O assunto bem mais urgente da variação
intra e entre as espécies nas propriedades físicas, como também a natureza viscoelástica
da seda de aranha, estabelece generalidades concernentes às propriedades mecânicas e,
dessa maneira, faz com que a avaliação das diferenças entre as espécies seja imprecisa
(Madsen et al., 1999; Brooks et al., 2005). Ter as características tanto de um sólido
quanto de um líquido (viscoelasticidade) possibilita que a fibra possua algumas incríveis
propriedades físicas, mas também traduz a possibilidade de variação sendo introduzida no
próprio sistema de teste. As condições ambientais, como também a taxa de tração, são
todos os parâmetros decisivos de testes que podem introduzir variação aos dados (Gosline
et al., 1986, Guess e Viney, 1998; Shao et al., 1999; Liu et al., 2005; Perez-Rigueiro et
al., 2005). Inversamente, a viscoelasticidade e a supercontração, a habilidade de uma
fibra ampolada principal não extendida de contrair até a metade de seu comprimento
original na presença da água (Bell et al., 2002; Elices et al., 2004), foram informadas
como uma maneira de reduzir a variação nas propriedades mecânicas (Guinea et al.,
2005). Não obstante, a extensa variação inata é evidente a partir dos desvios padrão
produzidos a partir de uma coorte de indivíduos (Madsen et al., 1999; Brooks et al.,
2005). O primeiro potencial para divergência ocorre no nível fundamental da anatomia do
aparato de fiação. A diminuição gradual do duto no ponto de polimerização permite que a
aranha controle o diâmetro da fibra produzida (Rising et al., 2005). Essa diminuição
gradual não apenas permite a aranha controlar o diâmetro de uma fibra naturalmente
fiada, mas o efeito é ainda mais aparente nas fibras que são obtidas por meio da produção
induzida da seda. Uma vez que todos os tipos de testes mecânicos contam com a área da
21
seção transversal da fibra para transformar força em tensão, as variações no diâmetro
impactarão a tensão de ruptura da fibra. Por conseguinte, a maioria dos testes usa um
diâmetro médio calculado a partir do diâmetro em vários pontos ao longo do
comprimento da fibra. A variação no diâmetro da fibra pode apenas explicar os desvios
nas propriedades da fibra até certo ponto. É necessário que haja fontes adicionais de
discrepância nas propriedades mecânicas de fibras isoladas a partir de aranhas de uma
mesma espécie, ainda que a diversidade nas propriedades físicas de sedas de diferentes
espécies tenha sido relacionada às diferenças na seqüência das proteínas (Brooks et al.,
2005; Swanson et al., 2006). Independentemente da base da diversidade mecânica amplas
variações impedem o uso de sedas de aranhas nativas como uma fonte de biomateriais, e
traz a necessidade de se desenvolver um biomimético da seda sintético para aproveitar a
capacidade de alto desempenho da seda de aranha.
Embora os princípios de design fundamentais que regem as propriedades
mecânicas da seda de aranha sejam conhecidos, estabelecer a função conferida por um
motivo de aminoácido é decisivo para a capacidade de explorar e reproduzir as
propriedades mecânicas das fibras da seda de aranha e, desse modo, ser capaz de adaptar
essas propriedades de forma a criar uma fibra sintética que se ajuste a certos critérios.
Produção de Seda Sintética
Uma única aranha pode produzir até 6.100 metros de seda em um minuto, sob
confecção induzida; trabalho de toda uma vida de cerca de 5.000 aranhas para produzir
seda suficiente para fazer um vestido (Toner, 1992; Vollrath et al., 2002). Infelizmente, a
natureza territorial, o limitado tempo de vida, a baixa densidade e a falta de consistência
no processo de fiação das aranhas tornam impossível aproveitar a seda nativa e adaptá-la
a um novo biomaterial. Desse modo, mesmo que as sedas de aranhas sejam uma fonte
cobiçada para novos biomateriais, utilizar a seda natural não é prático.
Além disso, a falta de dados de seqüências genéticas das aranhas e a natureza
essencial da seda de aranha, impossibilitam o uso de alguns dos recentes avanços
tecnológicos na biologia molecular (isto é, RNAi (RNA interferente)) para descobrir a
contribuição específica de cada proteína de seda aos atributos físicos destas fibras.
22
Assim, as técnicas de clonagem clássica e de produção de proteínas foram exploradas em
uma tentativa de aproveitar e manipular as propriedades mecânicas de seda da ampolada
principal de aranhas.
A produção de fibras de seda de aranha está sendo investigada atualmente em
cinco sistemas diferentes: bactérias, fungos, células de insetos, plantas e mamíferos. Há
cinco áreas principais de comparação entre os sistemas: capacidade comercial, facilidade
de expressão de proteínas, limitações de tamanho das proteínas, técnicas disponíveis e
expressão estável. Produzir seda em fungos tem quatro vantagens básicas: proteínas
maiores podem ser produzidas de forma a imitar mais acuradamente as proteínas da seda
natural, a produção em grande escala é relativamente acessível, a purificação de proteínas
é simplificada em Pichia pastoris através da secreção eficiente, as cepas produtoras de
seda podem ser mantidas com estabilidade para, pelo menos, 100 duplicações
(Fahnestock e Bedzyk, 1997). Apesar dessas atrativas características a maioria dos
pesquisadores ainda escolhe produzir a seda sintética em bactérias, uma vez que o
sistema de clonagem é mais definido, a expressão de proteína em grande escala é
conveniente e factível, e as condições de purificação são bem estabelecidas (Lewis et al.,
1996; Fahnestock e Irwin, 1997; Brooks e Lewis, 2004). A produção de seda sintética
usando o sistema de expressão de células de insetos está em seus primeiros estágios de
desenvolvimento, embora a expressão da proteína da seda da flageliforme tenha sido
recentemente realizada com sucesso (Miao et al., 2006). A principal vantagem de tal
sistema é a clonagem rápida e a produção de uma linha de células estáveis. A produção
de seda sintética em plantas tem grande potencial para produzir uma grande quantidade
de proteínas de seda. Também possui a capacidade de expressar proteínas maiores e mais
similares às naturais. Além disso, os protocolos desenvolvidos para o isolamento de
proteínas propiciam a esse sistema um benefício ecológico distinto (Schellar e Conrad,
2005). Porém, um eficiente isolamento de proteínas para o uso comercial ainda não é
possível. Talvez o sistema mais promissor, embora o de custo mais proibitivo, é a cultura
de células de mamíferos. Usando as proteínas de seda sintética, produzidas e isoladas a
partir do leite de cabra, as primeiras fibras de seda biomimética leve foram tecidas
(Lazaris et al., 2002). A pesquisa básica que acontece em todos esses sistemas está
rapidamente convergindo para produzir uma versão necessária e totalmente sintética da
23
seda de aranhas com propriedades adaptadas de modo a revelar e manipular a relação
estrutura/função.
24
CAPÍTULO 2
Espidroínas da
aranha Nephilengys
cruentata
Este capítulo foi baseado na seguinte publicação (Anexo 3):
Bittencourt, D., Souto, B.M., Verza, N.C., Vinecky, F., Dittmar, K., Silva, P.I. Jr,
Andrade, A.C., da Silva, F.R., Lewis, R.V., Rech, E.L, 2007. Spidroins from the
Brazilian spider Nephilengys cruentata (Araneae: Nephilidae). Comp Biochem Physiol B
Biochem Mol Biol. 4, 597-606.
25
Introdução
Aranhas de teia orbicular podem produzir uma variedade de sedas com exclusivas
propriedades mecânicas para os mais diversos propósitos práticos (Foelix, 1996). Os
componentes das fibras são proteínas (espidroínas) que são sintetizadas nas células
epiteliais de glândulas especializadas e secretadas no lúmen glandular, onde são
armazenadas como uma soluçao de fiação líquida e cristalina altamente concentrada
(Hijirida et al., 1996; Scheibel, 2004). Acredita-se que o agrupamento das fibras aconteça
durante a passagem da solução de fiação pelo duto da glândula sericígena onde a extração
de água, sódio e cloreto são acompanhados por uma diminuição do pH de 6,9 a 6,3 até a
sua extrusão pelas fiandeiras como fibra insolúvel (Vollrath e Knight, 2001; Rising et al.,
2005; Vollrath, 2005). Apesar do conhecimento disponível sobre alguns detalhes, o
processo de fiação de fibras ainda não é claramente entendido.
As tecedoras de teia orbicular possuem até sete tipos diferentes de glândulas, seis
que produzem uma seda específica e uma a cola (Vollrath, 1992). A maioria das
espidroínas descrita até o momento foi gerada a partir de EST (seqüência expressa
identificada) (Xu e Lewis, 1990; Hinman e Lewis, 1992; Hayashi et al., 2004; Tian e
Lewis, 2005). Embora haja limitações principalmente quanto ao uso de mRNAs (RNA
mensageiros) de tamanho grande, a produção de cDNAs a partir das ESTs provou ser
uma técnica rápida e econômica para a identificação de genes de interesse biológico
(Adams et al., 1991). Estudos moleculares das várias seqüências de cDNAs (DNAs
complementares) produzidas a partir das glândulas sericígenas de diferentes aranhas
demonstraram que elas compartilham características estruturais comuns (Xu e Lewis,
1990; Gatesy et al., 2001). Independente do tipo, todas as sedas de aranha são compostas
por grandes proteínas, calculadas como sendo entre 300-500 kD, constituídas por um N-
terminal e C-terminal não repetitivos e conservados, e uma região interna altamente
repetitiva rica em aminoácidos alanina, glicina e serina. A região repetitiva da maioria
das espidroínas é formada pelo agrupamento de até quatro motivos de aminoácidos
responsáveis por módulos estruturais distintos como segue: polialanina (poli-Ala), glicina
e alanina alternadas (GlyAla)
n
, grupos de três aminoácidos composto de duas glicinas e
um terceiro aminoácido variável (GlyGlyX)
n,
e módulos de glicina-prolina-glicina
26
(GlyProGlyXX)
n
(Gatesy et al., 2001). Baseado em vários estudos, as diferentes
combinações desses módulos formando um bloco repetitivo maior são responsáveis pelas
distintas propriedades mecânicas das fibras (Hayashi et al., 1999; Fahnestock et al., 2000;
Scheibel, 2004; Vollrath, 2005). Os módulos poli-Ala e (GlyAla)
n,
por exemplo, formam
folhas-β cristalinas que propiciam resistência à tensão, (GlyGlyX)
n
provavelmente forma
uma estrutura helicoidal Gly-II, e (GlyProGlyXX)
n
forma as espirais-β; que podem estar
envolvidas na formação de uma matriz amorfa responsável pela elasticidade. Mais
recentemente, novas espidroínas foram identificadas compostas por um novo tipo de
módulo repetitivo, com longas e complicadas repetições contendo altos níveis de serina
(Garb e Hayashi, 2005; Hu et al., 2005a; Hu et al., 2005b; Tian e Lewis, 2005; Huang et
al., 2006).
A região N-terminal de diferentes espidroínas é a parte mais conservada das
proteínas da seda (Smith et al., 2005). Esta possui codons de iniciação da transcrição
adicionais abaixo do primeiro criando, possivelmente, diferentes inícios de tradução
(Smith et al., 2005). Embora a função da região N-terminal esteja relacionada ao
transporte das espidroínas para o lúmen glandular devido a presença de um peptídeo sinal
(Hayashi e Lewis, 1998; Smith et al., 2005), a sua função na estrutura protéica permanece
desconhecida. A região C-terminal constituída por 100 aminoácidos também é um
domínio altamente conservado entre as espidroínas. Devido a sua alta conservação,
sugeriu-se que essa região desempenhe um importante papel na polimerização das fibras
(Jin e Kaplan, 2003; Spooner et al., 2005). Recentemente, demonstrou-se que a
organização das proteínas em uma estrutura macromolecular com correta densidade e
orientação das fibras deve depender do domínio C-terminal (Ittah et al., 2006).
Neste capítulo descrevemos quatro seqüências parciais de cDNA que codificam as
espidroínas produzidas pelas glândulas sericígenas ampolada principal, ampolada
secundária, flageliforme e tubuliforme da aranha Nephilengys cruentata (Araneae:
Nephilidae). Objetivando a possível produção de fibras usando as abordagens de
biotecnologia capazes de imitar as propriedades naturais das sedas produzidas por
aranhas, nossos resultados mostram proteínas possuídoras de uma seqüência de
aminoácidos altamente conservada e contribuem para o entendimento entre estrutura e
função destas proteínas.
27
Resultados
Biblioteca de cDNA
A fim de identificar as novas seqüências que codificam as diferentes proteínas da
seda da aranha N. cruentata, 960 clones aleatórios da biblioteca de cDNA (DNA
complementar) das glândulas sericígenas foram parcialmente seqüenciados e analisados
(material e métodos – Anexo 1). Outros noventa e seis clones selecionados a partir do
Southern Blot feito em 24 placas de 96 poços foram parcialmente seqüenciados e
analisados. Desses, 21 clones foram selecionados de acordo com o tamanho e semelhança
com espidroínas previamente descritas. Todos os clones selecionados eram transcrições
parciais na direção 5’ terminal. Quatro clones contendo a região C-terminal e a seqüência
repetitiva foram classificados como sendo cDNAs correspondentes a MaSp1, e o clone
maior para este grupo de seda foi de 3241 pares de base (pb). Três outros clones foram
classificados como cDNAs MiSp1, onde dois deles continham apenas a seqüência
repetitiva, e o maior com 3486 pb continha tanto a seqüência repetitiva quanto o C-
terminal não repetitivo. O cDNA da espidróina da glândula flageliforme foi o mais
altamente representado na biblioteca, com nove clones parciais também contendo a
seqüência repetitiva e C-terminal, o mais longo dos quais tinha 3277 pb de comprimento.
Embora tendo os menores clones de cDNAs, a espidroína da tubuliforme também foi
identificada na biblioteca de cDNA da N. cruentata com dois clones de 1600 pb e 1636
pb (Anexo 2). Três outros clones contendo novas seqüências repetitivas foram
selecionados para estudo adicional.
RT-PCR (reação em cadeia da polimerase via transcriptase reversa) foi executada
a fim de verificar a presença de cDNAs das espidroínas identificadas nas glândulas
sericígenas da N. cruentata. O RNA total da(s) glândula(s) sericígena(s) foi usado como
um molde para a polimerização da primeira fita de cDNA, e os iniciadores escolhidos a
partir das seqüências das espidroínas encontradas nas bibliotecas de cDNA foram usados
para amplificar a região C-terminal. Todos os cDNAs analisados foram positivos devido
a sua presença na(s) glândula(s) sericígena(s) (Figura 1), eliminando a possibilidade de
contaminação de transcritos ou recombinação de clone.
28
1Kb
L
adde
r
1 234 5
1 kb
500
p
b
400
p
b
350
p
b
300
p
b
Figura 1: RT-PCR com RNA total da(s) glândula(s) sericígena(s) de N.cruentata. 1,
Espidroína Flageliforme cDNA (287 pb); 2, MaSp cDNA (356 pb); 3, MiSp cDNA (304
pb); 4, TuSp cDNA (302 pb); 5, controle negativo. 1Kb DNA ladder (Invitrogen).
Análise das seqüências
Todos os clones de cDNA selecionados possuiam uma fase de leitura para uma
espidroína de seda de aranha, com um sinal de poliadenilação. Seguindo a nomenclatura
para as espidroínas de seda de aranha publicadas, os genes identificados em N. cruentata
foram denominados: NCMaSp1-like (N. cruentata espidroína ampolada principal 1-like),
NCMiSp1-like (N. cruentata espidroína ampolada secundária 1-like), NCFlag-like (N.
cruentata espidroína flagelliforme-like) e NCTuSp-like (N. cruentata espidroína
tubuliforme-like), de acordo com suas traduções. As espidroínas da N. cruentata
codificam proteínas repetitivas constituídas por simples motivos de aminoácidos ricos em
alanina e glicina. As espidroínas NCMaSp1-like e a NCMiSp1-like possuem seqüências
com os motivos de aminoácidos (GlyGlyX)
n
e com poli-Ala, este sendo substituído por
repetições (GlyAla)
n
na NCMiSp1-like (Figura 2). Também foi identificada uma região
29
A. MaSp1
N.cruentata GG-AGQGGYGGLGGQ------GAG----------QGAGAAAAAA- 27
N.clavipes GG-AGQGGYGGLGSQ------GAGRGGLGG----QGAGAAAAAA- 33
N.i.madagascariensis GG-AGQGGYGGLGSQ------GAGRGGYGG----QGAGAAAAAA- 33
A.trifasciata GGQGGQGGYGGLGXQGAGQGYGAGSGGQGGXG--QGGAAAAAAAA 43
A.diadematus(ADF-2) GGQGGQGGQGGLGSQ------GAGGAGQGGYGAGQGGAAAAAAAA 39
** .**** **** * *** **..******
B. MiSp1
Região repetitiva:
N.cruentata GAGAGGAGGFGRGAGAGAGAGAGAAAGAGAGGAGGYGAGQGYGAGAGAGAAAAAGA 56
N.clavipes --GAGGAGGYGRGAGAGAGAAAGAGA-----GAGGYGGQGGYGAGAGAGAAAAAGA 49
A.diadematus(ADF-1) --GAGAAGGYGGGAGAGAG------------GAGGYGQ--GYGAGAGAGAAAAAGA 40
N.antipodiana -GGYGGLVGYGAGAGAAAGAGAGAG------GAGGYIGQGGY--GAGAGAAAAAGA 47
* * * * **** ** ***** ** ************
Região espaçadora:
N.cruentata GNAFAQSLSSNLLSSGDFVQMISTTTSTDQAVSVATSVAQNVGNQLGLDANAMNNLLAAV 60
N.clavipes GNAFAQSLSSNLLSSGDFVQMISSTTSTDHAVSVATSVAQNVGSQLGLDANAMNNLLGAV 60
N.antipodiana GNAFAQSLSSNLLSSGDFVQMISSTTSTDQAVSVATSVAQNVGNQLGLDANAMNSLLGAV 60
A.diadematus(ADF-1) -----------------------------HESSYAAAMAASTRN---------------- 15
: * *:::* .. .
N.cruentata GGYVSSLGGAVADAAAYANAISSAIGNVLANTGSINESTASSAASSAASSVTTTLTSYGP 120
N.clavipes SGYVSTLGNAISDASAYANALSSAIGNVLANSGSISESTASSAASSAASSVTTTLTSYGP 120
N.antipodiana SGYVSTLGNAISDASAYANAISSAIGNVLANSGSISESTASSAASSAASSVTTTLTSYGP 120
A.diadematus(ADF-1) --------------SDFIRNMSYQMGRLLSNAGAITESTASSAASSASSTVTESIRTYGP 61
: : . :* :*.:*:*:*:*.***********:*:** :: :***
N.cruentata AVFY------ 124
N.clavipes AVFYAPSASS 130
N.antipodiana AVFYAPTSSA 130
A.diadematus(ADF-1) AAIFSGAGAG 71
*.::
Figura 2: Alinhamento das regiões repetitivas de duas espidroínas de N. cruentata com
espidroínas de diferentes espécies de aranhas. (A) região repetitiva de NCMaSp. (B)
Região repetitiva e espaçadora de NCMiSp. Aminoácidos estão abreviados com uma
letra. “-”, indica “gaps” nas seqüências para um melhor alinhamento; “*”, indica que o
aminoácido presente naquela coluna é idêntico em todas as seqüências; “:”, indica que
uma substituição conservada o correu de acordo com as cores (vermelho-aa pequeno,
azul- aa ácido, rosa- aa básico, verde-hidroxila+amino+básico-Q); e “.”, indica que
substituições semi-concervativas ocorreram. A seqüência de N. cruentata está
identificada em negrito.
30
espaçadora não repetitiva entre as seqüências repetitivas de NCMiSp1-like (Figura 2B).
A NCFlag-like também é constituída por uma seqüência repetitiva com motivos
(GlyProGlyXX)
n
interespaçada por uma seqüência não repetitiva (Figura 3). Ao
contrário das proteínas acima, a NCTuSp-like mostrou pouco dos motivos de
aminoácidos comumente encontrados na maiorias das espidroínas. A seqüência contém
repetições de 174 aminoácidos, compostos em grande maioria por alanina e serina,
formando novos motivos tais como Ser
n
, (SerX)
n
(X representa Gln, Leu, Ala, Val e Phe),
e GlyX (X representa Gln, Asn, Ile, Leu, Ala e Val) (Figura 4).
N.cruentata [GPGGX]
19
[GGX]
3
TVIEDLDITVNGPGGPITISEELTVGGPGAGGS [GPGGX
n
]
24
N.clavipes [GPGGX]
41
TIIEDLDITIDGADGPPITISEELTIS-GAGGS [GPGGX
n
]
26
N.i.madagascariensis [GPGGX]
36
[GGX]
7
TVIEDLDITIDGADGPITISEELTIGGAGAGGS [GPGGX
n
]
19
A.trifasciata [GPGGX
n
]
6
GPVTVDVDVSVGGAPGG [GPGGX
n
]
5
[GGX]
6
[GPGGX
n
]
7
Figura 3: Esquema da região repetitiva de espidroínas da glândula Flageliforme de
diferentes espécies de aranhas. “-”, indica “gaps” nas seqüências para um melhor
alinhamento. A seqüência de N. cruentata está identificada em negrito.
Freqüência de codons
Os codons utilizados com maior freqüência para os aminoácidos mais abundantes
das espidroínas da N. cruentata (Tabela 1) segue a preferência para adenina (A) e timina
(T) como o terceiro nucleotídeo entre os três codificadores de cada aminoácido, com a
exceção da espidroína NCTuSp-like. A NCMaSP1-like e a NCMiSp1-like possuem um
alto teor de glicina, alanina e glutamina em suas seqüências de aminoácidos, todas elas
usando A ou T como o terceiro nucleotídeo no uso de codons. A preferência de codons
para glutamina e alanina foi CAA e GCA/T respectivamente, com CAA presente em
100% dos casos na NCMaSP1-like e em 96% na NCMiSp1-like. Glicina, o aminoácido
mais preponderante em ambas as proteínas, mostrou uma preferência de 93% e 90% para
GGA/T na NCMaSp1-like e na NCMiSp1-like, nessa ordem. Glicina e alanina também
estavam presentes em grandes quantidades na seqüência da proteína NCFlag-like. O uso
de codons delas segue a mesma preferência encontrada para as seqüências de cDNA da
31
NCMaSp1-like e da NCMiSp1-like, com 89% para GGA/T e 94% para GCA/T.
Comparado com a alta freqüência da preferência de codons para A e T na posição de
oscilação nas seqüências codificando as proteínas NCMaSp1-like, NCMiSp1-like e
NCFlag-like, os usos de códon para alanina, serina e glutamina, o três aminoácidos mais
freqüentes na proteína NCTuSp-like são apenas moderadamente tendenciosos para A e T,
com 63% para alanina, 57% para serina e 50% para glutamina.
N.cruentata TTTTTSASGSQSASQSASSSS--ASASAFAQQSSASLAASSSFSQAFASAASASAVGNVA 58
N.clavipes TTTTTSAARSQAASQSASSSY----SSAFAQAASSSFAISSALSRAFSSVSSASAASSLA 56
A.argentata TTTTTSTSGSQAASQSASSSASQASASSFAQASSASLAASSSFSSAFSSANTLSALGNVA 60
A.gemmoides KTTSTSTSGSQADSRSASSSASQASASAFAQQSSASLSSSSSFSSAFSSATSISAVGNVG 60
.**:**:: **: *:***** :*:*** :*:*:: **::* **:*. : ** ..:.
N.cruentata YQLGLSAAQSLGIANAGALASALAQSVSSVGVGASSSAYANAVAGAVGQFLANQGILNTG 118
N.clavipes YSIGLSAARSLGIADATGLAGALARAVGALGQGATAASYGNALSTAAAQFFATAGLLNAG 116
A.argentata YQLGFNVANTLGLGNTAGLGAALSQAVSSVGVGASSATYANAVSNAVGQFLAGQGILNGA 120
A.gemmoides YQLGLKVANSLGLGNAQALASSLSQAVSAVGVGASSNAYANAVSNAVGQVLAGQGILNAA 120
*.:*:..*.:**:.:: .*..:*:::*.::* **:: :*.**:: *..*.:* *:** .
N.cruentata NASSLASSFSSALSASAAAAQSQSFAQS------QAAASAFQQAASQSASQSAAQSGSQS 172
N.clavipes NASALASSFARAFSASAE---SQSFAQS----QAFQQASAFQQAASRSASQSAAEAGSTS 169
A.argentata NAASLASSFASALSASAASVASSSAAQS--ATQSQAAASAFSRAASQSASQSAARSGAQS 178
A.gemmoides NAGSLASSFASALSSSAASVASQSASQSQAASQSQAAASAFRQAASQSASQSDSRAGSQS 180
**.:*****: *:*:** *.* :** **** :***:***** :.:*: *
N.cruentata SS 174
N.clavipes SS 171
A.argentata SS 180
A.gemmoides ST 182
*:
Figura 4: Alinhamento da região repetitiva da espidroína da glândula Tubuliforme de N.
cruentata com as de diferentes espécies de aranhas. Abreviações são as mesmas descritas
para o alinhamento da figura 2.
32
Tabela 1
Escolha de codons para os aminoácidos mais freqüentes nas espidroínas de N. cruentata
Freqüência (%) Freqüência (%)
AmAc Codon
FLAG MiSp MaSp TuSp
AmAc Codon
FLAG MiSp MaSp TuSp
Ala GCG 5 1 1 4 Pro CCG 2 0 0 10
Ala GCA 22 24 48 30 Pro CCA 27 33 50 20
Ala GCT 72 61 33 33 Pro CCT 60 33 50 50
Ala GCC 1 14 18 34 Pro CCC 11 33 0 20
Gln CAG 25 4 0 50 Ser AGT 4 19 21 15
Gln CAA 75 96 100 50 Ser AGC 2 4 11 11
Glu GAG 31 0 0 0 Ser TCG 4 2 11 11
Glu GAA 69 100 100 100 Ser TCA 30 12 13 11
Gly GGG 1 2 0 0 Ser TCT 49 48 32 31
Gly GGA 47 45 52 46 Ser TCC 11 15 13 21
Gly GGT 42 45 41 31 Thr ACG 0 0 0 0
Gly GGC 10 9 8 23 Thr ACA 91 20 0 31
Tyr TAT 41 67 90 40 Thr ACT 4 70 67 38
Tyr TAC 59 33 10 60 Thr ACC 4 10 33 31
Análise filogenética
A análise de probabilidade máxima (ML) examinou a relação entre as seqüências
de aminoácidos da região C-terminal a partir das espidroínas da N. cruentata e dos genes
de espidroínas anteriormente informados a partir de diferentes glândulas sericígenas e
espécies de aranha. O alinhamento da região C-terminal de todas as espidroínas
identificadas com seqüências conhecidas de outras proteínas de seda gerado usando
CLUSTALW encontra-se ilustrado na Figura 5. A fim de executar a análise filogenética,
um alinhamento das seqüências de aminoácidos do C-terminal também foi executado em
MAFFT (5.8) (dados não mostrados). A topologia resultante da análise de ML (- lnL:
16456.89) encontra-se descrita na Figura 6, e representada como uma árvore sem raíz.
Os resultados mostraram que as espidroínas encontradas na biblioteca da N. cruentata
pertencem à família de genes das espidroínas, e todas elas foram corretamente
classificadas de acordo com seu grupo ortólogo.
33
MaSp1-Ncruen SRLSSPEASSRVSSAVS----NLVSSG---PTNSAALSNTISSVVSQISASNPGLSGCDVLVQALLEVVSALIHILGS 71
MaSp1-Nclavi SRLSSPQASSRVSSAVS----NLVASG---PTNSAALSSTISNVVSQIGASNPGLSGCDVLIQALLEVVSALIQILGS 71
MaSp1-Nmadag SRLSSPQASSRVSSAVS----NLVASG---PTNSAALSSTISNAVSQIGASNPGLSGCDVLIQALLEVVSALIHILGS 71
MaSp1-Atrifa SRLSSPGAASRVSSAVT----SLVSSGG--PTNSAALSNTISNVVSQISSSNPGLSGCDVLVQALLEIVSALVHILGS 72
MaSp1-Udiver SRLQSPASSSRVSSAVS----TLASAG---AANSGALSSVISNLSSSVASAHPDLSGCELLVQILLEVISALVALLGS 71
ADF3-Adiade SRLSSPAASSRVSSAVS----SLVSSG---PTKHAALSNTISSVVSQVSASNPGLSGCDVLVQALLEVVSALVSILGS 71
MiSp1-Ncruen SRLSSAQASSRISAAAS----TLISGG---YLNTSALPSVISDLFAQVSASSPGVSDSEVLIQVLLEIVSSLIHILSS 71
MiSp1-Nclavi SRLSSAEASSRISSAAS----TLVSGG---YLNTAALPSVISDLFAQVGASSPGVSDSEVLIQVLLEIVSSLIHILSS 71
MiSp1-Nantip SRLSTAEASSRISTAAS----TLVSGG---YLNTAALPSVIADLFAQVGASSPGVSDSEVLIQVLLEIVSSLIHILSS 71
MiSp1-Udiver NRIVSAPAVNRMSAASS----TLVSNG---AFNVGALGSTISDMAAQIQAGSQGLSSAEATVQALLEVISVLTHMLSS 71
MiSp1-Dspino SRLASGQATDRVKDVVS----TLVSNG----INGDALSNAISNVMTQVNAAVPGLSFCERLIQVLLEIVAALVHILSS 70
ADF1-Adiade NRLSSAGAASRVSSNVA----AIASAG------AAALPNVISNIYSGVLSS--GVSSSEALIQALLEVISALIHVLGS 66
TuSp-Ncruen SGLASSSATSRVGSLAQSLASALQSSG--GTLDVSTFLNLLSPISTQIQANTS-LNASQAIVQVLLEAVAALLQIING 75
TuSp-Nclavi SGLSSASANARVSSLAQSFASALSASR--GTLSVSTFLTLLSPISSQIRANTS-LDGTQATVQVLLEALAALLQVINA 75
TuSp-Agemmo SGLASSAASARVSSLAQSIASAISSSG--GTLSVPIFLNLLSSAGAQATASSS-LSSSQVTSQVLLEGIAALLQVING 75
TuSp-Aargen SGLGSSAASARVSSLANSVASAISSSG--GSLSVPTFLNFLSSVGAQVSSSSS-LNSSEVTNEVLLEAIAALLQVLNG 75
TuSp-Udiver NGLSSSSASSRINSIASGLSTALSSSR---GVSLENLSSSLSSVFSEIQNNSFGVSAEQALIQALFEVLTGTVQVLNR 75
TuSp-Dspino AGLSSAAATSRASSLASSVASAISSAGSAGGVDVGLFASGLSSLVSQIQSSNLGLQPDQVLLEALLEGYSALAQVLIS 78
Flag-Ncruen -----SRVPDLVNGIMR----SMQGSG----FNYQMFGNMLSKYASGSGACNS--NDVNVLMDALLAALHCLSSH-GS 63
Flag-Nclavi -----SRVPDMVNGIMS----AMQGSG----FNYQMFGNMLSQYSSGSGTCNP--NNVNVLMDALLAALHCLSNH-GS 63
Flag-Nmadag -----SRVPDMVNGIMS----AMQGSG----FNYQMFGNMLSQYSSGSGSCNP--NNVNVLMDALLAALHCLSNH-GS 63
Flag-Atrifa -----ERLPNLINGIKS----SMQGGG----FNYQNFGNILSQYATGSGTCNY--YDINLLMDALLAALHTLNYQ-GA 63
Flag-Aventr -----SRLPSLVNGLMG----SMQPTG----FNYQNFGNVLSQYATGSGTCNS--NDVNLLMDALMAALHCLSYG-SG 63
Flag-Dspino SNLHSPSANVRVGNIVD----RISSGG---VGVMEILPRILSELYANIRESSPGMSDCERFMQVLLDIVSALMHVLLY 71
: : :: : : : *:
MaSp1-Ncruen SSIG-PVNYGSASQSTQIVGQSVYQALG--- 98
MaSp1-Nclavi SSIG-QVNYGSAGQATQIVGQSVYQAL---- 97
MaSp1-Nmadag SSIG-QVNYGSAGQATQ-------------- 87
MaSp1-Atrifa ANIG-QVNSSGVGRSASIVGQSINQAFS--- 99
MaSp1-Udiver STVG-PVDIGQSSQYSGLVANAIGNALA--- 98
ADF3-Adiade SSIG-QINYGASAQYTQMVGQSVAQALA--- 98
MiSp1-Ncruen SSVG-QVDFNSVGSSAAAVGQSMQVVMG--- 98
MiSp1-Nclavi SSVG-QVDFSSVGSSAAAVGQSMQVVMG--- 98
MiSp1-Nantip SSVG-QVDFSSVGSSAAAVGQSMQVVMG--- 98
MiSp1-Udiver ANIG-YVDFSRVGDSASAVSQSMAYAG---- 97
MiSp1-Dspino SNVG-SIDYGSTSRTAIGVSNALASAVAGAF 100
ADF1-Adiade ASIG-NVSSVGVNSALNAVQNAVGAYAG--- 93
TuSp-Ncruen AQIT-SVNFGSVSSVNTALATALAG------ 99
TuSp-Nclavi AQIT-EVNVSNVSSANAALVSALAG------ 99
TuSp-Agemmo AQIR-SVNLANVPNVQQALVSALSG------ 99
TuSp-Aargen AQIT-SVNLRNV------------------- 86
TuSp-Udiver GQTS-FVSVSSPTVISSSF------------ 93
TuSp-Dspino SQIS-SVSVSSSSALGPALLNYLVG------ 102
34
Flag-Ncruen PSFGSSPTPSAMNAYSNSVRRMFQF------ 87
Flag-Nclavi SSFAPSPTPAAMSAYSNSVGRMFAY------ 87
Flag-Nmadag SSFAPSPTPAAMSAYSNSVGRMFAY------ 87
Flag-Atrifa SYVPSYPSPSEMLSYTENVRRYF-------- 85
Flag-Aventr S-VPSTPTYSAMSAYNQSIRRMFTY------ 86
Flag-Dspino EDVRRGIPGDTAEAVANAVAGVVLSVV---- 98
Figura 5: Alinhamento da região C-terminal das espidroínas de N. cruentata com
espidroínas de diferentes espécies de aranha. Aminoácidos estão abreviados com uma
letra e numerados no sentido N- para o C-terminal. Abreviações são as mesmas descritas
para o alinhamento da figura 2. As seqüências de N. cruentata estão identificadas em
negrito. Araneus diadematus ADF-3 foi adicionada como representante do grupo da
MaSp2. As abreviações das espécies de aranha usadas nesta figura (de cima para baixo):
Ncruen, N. cruentata; Nclavi, Nephila clavipes; Nmadag, Nephila inaurata
madagascariensis; Atrifa, Argiope trifasciata; Udiver, Uloborus diversus; Adiade, A.
diadematus; Nantip, Nephila antipodiana; Agemmo, Araneus gemmoides; Aargen,
Argiope argentata; Dspino, Deinopis spinosa; Aventr, Araneus ventricosus. Abreviações
utilizadas para as espidroínas: MaSp1, espidroína ampolada principal 1; ADF3, fibroína 3
(espidroína ampolada principal 2); MiSp1, espidroína ampolada secundária 1; ADF1,
fibroína 1; TuSp, espidroína tubuliforme; Flag, espidroína flageliforme. Acessos do
GenBank: MaSp1-Nclavi (P19837), MaSp1-Nmadag (AAK30606), MaSp1-Atrifa
(AAK30595), MaSp1-Udveri (ABD61596), ADF3-Adiade (AAC47010), MiSp1-Nclavi
(AAC14589), MiSp1-Nantip (ABC72645), MiSp1-Udiver (ABD61597), MiSp1-Dspino
(ABD61589), ADF1-Adiade (AAC47008), TuSp-Nclavi (AAX45295), TuSp-Agemmo
(AAX45293), TuSp-Aargen (AAY28932), TuSp-Udiver (AAY28933), TuSp-Dspino
(AAY28934), Flag-Nclavi (AAC38847), Flag-Nmadag (AAF36092), Flag-Atrifa
(AAK30594), Flag-Aventr (AAT36347) and Flag-Dspino (ABD61590).
35
-lnL: 16456.89
97
99
98
61
96
91
100
100
96
100
80
83
66
83
59
100
92
80
96
M
iSp1Nc
M
iSp1Na
M
iSp1Nc
M
iSp1Ud
M
aSp1Ud
ADF1Ad
M
aSp1Nm
M
aSp1Nc
M
aSp1Nc
A
DF3Ad
M
aSp1A
t
M
iSpDs
F
lagAv
F
lagA
t
F
lagNm
F
lagNc
l
FlagNc
TuSpNc
TuSpNc
TuSpAa
TuSpAg
TuSpDs
TuSpUd
F
lagDs
1
Figura 6: Árvore sem raíz da topologia resultante da análise de ML (- lnL: 16456.89) das
seqüências da região C-terminal de várias espidroínas. As seqüências de N. cruentata
estão identificadas em negrito. As abreviações das espécies de aranha usadas nesta figura:
Ncr, N. cruentata; Ncla, N. clavipes; Nma, N. i. madagascariensis; Atr, A. trifasciata;
Udi, U. diversus; Adi, A. diadematus; Nan, N. antipodiana; Age, A. gemmoides; Aar, A.
argentata; Dsp, D. spinosa; Ave, A. ventricosus. Abreviações utilizadas para as
espidroínas e números de acesso do GenBank são as mesmas utilizadas no alinhamento
da figura 5.
36
Discussão
Durante muitos anos, as sedas de aranhas têm suscitado o interesse da
humanidade por causa de suas extremas propriedades mecânicas. Com os avanços na
biotecnologia, surgiu a possibilidade de produzir novos materiais com base nos polímeros
da seda de aranhas. Neste trabalho, identificamos diferentes genes de seda da aranha N.
cruentata.. Usando os cDNAs das glândulas sericígenas das aranhas pudemos identificar
transcrições parciais das glândulas ampolada principal, ampolada secundária,
flageliforme e tubuliforme de N. cruentata. Embora essa estratégia tenha demonstrado
possuir suas limitações para obter transcrições completas da seda de aranhas, ela é usada
com freqüência para identificar novos genes da seda de aranhas (Hayashi et al., 2004;
Lawrence et al., 2004; Pouchkina-Stantcheva e McQueen-Mason, 2004; Tian et al.,
2004).
De acordo com as seqüências previamente descritas que codificam as proteínas de
seda de aranhas (Xu e Lewis, 1990; Hinman e Lewis, 1992), o uso de códon para os
aminoácidos mais abundantes nas espidroínas da N. cruentata, com a exceção da
NCTuSp-like, seguem a preferência por adenina (A) e timina (T) como a terceira base de
três que codifica cada aminoácido. Esta diferença nos usos de códon entre as espidroínas
também foi encontrada nas seqüências codificadoras de TuSp1 da Araneus gemmoides e
da Nephila clavipes (Tian e Lewis, 2005). A prevalência de T e A nas seqüências que
codificam as espidroínas NCMaSp1-like, NCMiSp1-like e NCFlag-like ocorre no intuito
de evitar a formação de numerosos grampos nas regiões próximas ricas em guanina e
citosina presentes nos codons de suas seqüências repetitivas (poli-Ala, (GlyAla)
n
,
(GlyGlyX)
n
, (GlyProGlyXX)
n
) (Hinman e Lewis, 1992). Tais regiões não existem na
proteína NCTuSp-like.
Como as proteínas de sedas de aranha anteriormente descritas (Xu e Lewis, 1990;
Gatesy et al., 2001; Tian et al., 2004; Lewis, 2006), nossos achados também
demonstraram proteínas com alto teor dos aminoácidos alanina e glicina devido à
presença de motivos altamente repetitivos. A proteína análoga NCMaSp1 é composta de
repetições similar com motivos poli-Ala e (GlyGlyX)
n
, onde os resíduos de X são Ala,
Tyr, Leu ou Gln. Seus blocos repetitivos são muito semelhantes àqueles encontrados nas
37
proteínas da N. clavipes e da Nephila inaurata madagascariensis com uma identidade de
96%. Como todas essas aranhas pertencem à família Nephilidae, a semelhança não é
totalmente inesperada. Entretanto, as repetições da N. cruentata variam no comprimento
e na quantidade de motivos GlyGlyX. Foi proposto que esses motivos adotam uma
estrutura secundária na forma de hélice proporcionando elasticidade. Usando a
microscopia FTIR (infravermelho com transformada de Furier) foi observado que a
estrutura secundária das espidroínas da glândula ampolada principal possui
predominantemente estruturas helicoidais (38%) em comparação com estruturas em
folhas e voltas (Winkler e Kaplan, 2000; van Beek et al., 2002; Dicko et al., 2004). Por
outro lado, essa hélice é muito rígida para ser elástica; é mais provável que os motivos
(GlyGlyX)
n
sejam responsáveis por outra estrutura proteica similar à folha-β. Embora as
sedas da ampolada principal apresentem um alto teor de motivos (GlyGlyX)
n
, elas são
conhecidas por suas alta resistência à tração e robustez proporcionadas pelo motivo poli-
Ala, com valores de força entre 1-2 GPa (Gosline et al., 1999; Gosline et al., 2002;
Blackledge e Hayashi, 2006). Em contrapartida, a seda da glândula ampolada secundária
possui uma resistência diminuída, mas uma maior extensibilidade em comparação com as
sedas da principal, o que pode estar relacionado com a menor presença de motivos poli-
Ala e maior quantidade de (GlyAla)
n
e (GlyGlyX)
n
em seus blocos repetitivos
(Blackledge e Hayashi, 2006). Esses motivos também foram encontrados na seqüência da
espidroína NCMiSp1-like. Embora suas repetições tenham demonstrado organização
muito similar com as espidroínas da ampolada secundária descritas anteriormente, o
número de repetições (GlyAla)
n
é bastante variável entre essas proteínas. Entretanto, a
região espaçadora de NCMiSp1-like constituído por uma seqüência não repetitiva de 124
aminoácidos é quase idêntica a da MiSp de N. clavipes e N .i. madagascariensis, com
poucas substituições e deleções de aminoácidos (89% e 91% de identidade,
respectivamente). A principal função dessa região permanece desconhecida, mas
acredita-se que possa servir para separar as regiões cristalinas, como também para
participar nas associações entre as cadeias proteicas através de resíduos carregados
(Lewis, 2006).
A proteína NCFlag-like também é composta por uma seqüência altamente
repetitiva formada pelos motivos (GlyProGlyXX)
n
(X representa Ala, Val, Ser e Tyr) e
38
três motivos GlyGlyX (X representa Ala, Ser e Thr), separados por uma seqüência não
repetitiva constituída por aminoácidos carregados e hidrofílicos. A seqüência da NCFlag-
like também é muito similar com outras espidroínas da glândula flageliforme previamente
descritas (Hayashi e Lewis, 2000). A seda da glândula flageliforme é a seda mais elástica
(Blackledge e Hayashi, 2006), e é responsável pela formação da espiral de captura na teia
orbicular. Foi proposto que o motivo GlyProGlyXX possua uma estrutura secundária
similar a uma espiral-β similar a uma mola que poderia facilmente contribuir para o
mecanismo elástico da fibra, com as ligações entre prolinas gerando força para a retração
da seda após seu estiramento (Hayashi et al., 1999).
As sedas das glândulas tubuliforme e da aciniforme são únicas entre as
espidroínas de aranhas devido a sua complexa composição de aminoácidos, e a proteína
NCTuSp-like não é diferente. Ela é composta de grandes repetições ricas em aminoácidos
alanina e serina com vários novos motivos (Ser
n
, (SerX)
n
, e GlyX). Em contraste com
outras espidroínas, NCTuSp-like contém altas quantidades de serina e baixas quantidades
de glicina. Além disso, ela também apresenta uma maior quantidade de aminoácidos com
cadeias laterais grandes como valina e leucina. As predições de estruturas secundárias das
espidroínas da glândula tubuliforme usando difração de raio-X indicaram a presença de
grandes quantidades de folha-β. A difração de raio-X também mostrou que a seda do
casulo tem um maior valor b dimensional na folha-β que as sedas da ampolada principal e
secundária, o que indica a presença de aminoácidos de cadeia lateral grande (Parkhe et
al., 1997). Os dados de difração em TEM (microscopia eletrônica de transmissão)
também concordam com os obtidos pela difração de raios-X (Barghout et al., 1999). A
falta das repetições habituais ricas em motivos de alanina e/ou glicina encontradas na
maioria das espidroínas de aranhas está provavelmente relacionada com a função. As
espidroínas da tubuliforme são usadas para construir as estruturas para a reprodução,
diferentemente das sedas da ampolada principal e secundária ou da flageliforme, que
servem como fibras estruturais para a captura de presas. Porém, dados mecânicos
recentes de sedas da glândula tubuliforme da Argiope argentata mostraram que essas
fibras também possuem boas propriedades em comparação com as estruturais, com um
valor de resistência de 0,47 GPa (Blackledge e Hayashi, 2006).
39
O alinhamento das unidades repetitivas da NCTuSp-like com as repetições da
tubuliforme de diferentes espécies de aranhas demonstrou uma alta similaridade entre
elas. Surpreendentemente o bloco repetitivo da N. cruentata foi mais semelhante às
repetições da A. gemmoides e da A. argentata do que as repetições da N. clavipes, mesmo
que pertençam a famílias diferentes de acordo com evidências morfológicas. NCtuSp-like
também mostrou semelhanças com a Fibroína 1 da aranha Mygalomorphae Euagrus
chisoseus (AF350271
). As espidroínas da tubuliforme, previamente descritas, exibiram
um extraordinário grau de homogeneidade entre as consecutivas repetições intragênicas
(Garb e Hayashi, 2005; Tian e Lewis, 2005). Entretanto, não conseguimos verificar esta
evidência de evolução coordenada na NCtuSp1-like por causa do pequeno tamanho do
transcrito obtido na biblioteca de cDNA que mostrou apenas uma repetição completa.
A região C-terminal não repetitiva e altamente conservada também foi
identificada em todas as espidroínas descritas de N. cruentata. O alinhamento da
seqüência de aminoácidos da região C-terminal descrito para essas espidroínas com
aquelas de espidroínas previamente descritas mostrou que esta é uma região altamente
conservada entre as espécies. A maioria das proteínas de seda de aranhas compartilha
30% de identidade entre a sua região C-terminal, sendo as flageliformes as mais
divergentes. Porém, todas as seqüências compartilham uma determinada região
conservada na seqüência de aminoácidos QALLE, até mesmo entre as aranhas tecedoras
de teia orbicular e não orbicular. Essa região corresponde àquela com maior
hidrofobicidade na região C-terminal, e as predições de estrutura secundária sugerem que
essa região QALLE é também responsável pela formação de α-hélices (Spooner et al.,
2005; Challis et al., 2006). Uma vez que a seqüência da região C-terminal é muito mais
conservada que a região repetitiva entre as diferentes espécies de aranha, sugere-se que
ela possa desempenhar um importante papel, de maneira que os motivos de aminoácidos
importantes para o desempenho de uma determinada função foram preservados pela
seleção natural. Várias funções foram atribuídas a região C-terminal das proteínas de
sedas. Ela pode ser responsável pela formação de micelas de tamanho irregular na
solução de fiação a fim de evitar a formação prematura da fibra (Jin e Kaplan, 2003) ou
ter uma função no correto dobramento das proteínas, uma vez que foi demonstrado que a
40
região C-terminal fica retida na fibra polimerizada (Sponner et al., 2004; Ittah et al.,
2006).
Em resumo, foram estudadas as diferentes espidroínas da seda das aranhas
brasileiras N. cruentata. Conseguimos identificar as seqüências de proteínas das sedas
responsáveis pela construção da teia orbicular e pela captura de presas (MaSp, MiSp e
Flag), como também pela construção do casulo (TuSp) de N.cruentata. Durante todo o
nosso estudo foi possível demonstrar um alto grau de semelhança entre essas seqüências e
as seqüências de outras espécies de aranhas. Similaridades também foram observadas
entre as seqüências de diferentes grupos de genes, com a exceção da espidroína da
tubuliforme de N. cruentata, que desempenha uma função distinta na vida da aranha (Hu
et al., 2005a; Tian e Lewis, 2005). O estudo adicional mecânico e estrutural das
diferentes sedas de N. cruentata propiciará importantes informações sobre o argumento
de que as propriedades mecânicas das diferentes espidroínas estão correlacionadas com
suas seqüências de aminoácidos (Hayashi et al., 1999; Rising et al., 2005).
41
Capítulo 3
Propriedades mecânicas da fibra da glândula
Ampolada principal de N. cruentata
42
Introdução
A fibra produzida pela glândula ampolada principal, também conhecida pelo
nome da glândula que a produz, utilizada como linha de segurança e moldura estrutural
para teia, é a mais estudada entre todos os tipos de sedas produzidas por aranhas devido
às suas excepcionais propriedades mecânicas. A seda ampolada principal de aranhas
orbiculárias são conhecidas por serem super-resistentes com dureza superior à do aço e
até mesmo do kevlar (Gosline et al., 1999). Estudos moleculares da MaSp de N.
cruentata (NCMaSp1-like, Capítulo 2) mostraram que, semelhante a outras MaSp1
descritas anteriormente em diferentes espécies de aranhas, esta proteína também é
composta por módulos repetitivos constituído pelos motivos de aminoácidos poli-Ala e
(GlyGlyX)
n
. Tais motivos estruturais são considerados como os responsáveis por
proporcionar as características mecânicas à fibra (Hayashi et al., 1999; Rising et al.,
2005).
No intuito de estabelecer uma comparação entre os motivos de aminoácidos
encontrados na seqüência de NCMaSp1-like e suas propriedades mecânicas, curvas de
tensão/tração foram obtidas, sendo que “tensão” (GPa) define a força máxima exercida na
fibra momentos antes do seu rompimento, e “tração” (%) a extensibilidade da fibra. Os
valores do módulo de Young (GPa) ou rigidez também foram quantificados pelo declive
do segmento linear inicial da curva de tensão/tração antes do primeiro ponto de
rendimento ou transição de fase da fibra. A análise da fibra por meio de microscopia de
força atômica também foi realizada no intuito de esclarecer a organizaçao nanoestrutural
da fibra e adicionar dados para o desenvolvimento de hipóteses que correlacionem não
apenas a seqüência primária da proteína, mas também a estrutura tri-dimensional com as
propriedades mecânicas da seda.
A partir do momento em que houver uma melhor compreensão da relação entre
estrutura molecular e função da fibra de aranha, será possível determinar se a seda
ampolada principal proporciona ou não um bom modelo para a produção de biomateriais
por meio da engenharia genética.
43
Resultados
Diâmetro da fibra
As fibras da glândula ampolada principal de N. cruentata possuíam em média
4,58 ± 0,73 µm de diâmetro. A fibra #1 da aranha N1 (N1masp#1) teve o maior diâmetro
observado de 5,90 µm, entretanto a aranha N2 apresentou a fibra com menor diâmetro, a
fibra #2 (N2masp#2) possuía um diâmetro de 3,26 µm (Tabela 1).
Uma análise geral mostra que a média dos diâmetros encontrados para as fibras da
aranha N1 foi maior do que para a aranha N2, 4,93 ± 0,60µm e 4,04 ± 0,60µm
respectivamente. Claramente, observa-se uma variação entre as os diâmetros das fibras da
mesma aranha e entre as aranhas, por isso a necessidade de utilizar várias amostras de
diferentes aranhas para a obtenção de análises mecânicas mais próximas do valor médio.
Tabela 1
Resultados dos testes mecânicos das fibras de duas aranhas N. cruentata.
Amostra
Diâmetro (µm)
Tensão (GPa) Tração (%) Rigidez (GPa)
N1masp1 5,90 1,25 28,23 7,45
N1masp2 4,53 1,74 33,30 13,60
N1masp3 4,86 1,08 33,87 3,71
N1masp4 5,60 1,38 24,89 12,50
N1masp5 5,10 1,42 33,98 8,74
N1masp6 4,06 1,92 10,73 17,90
N1masp7 5,26 1,43 45,12 3,80
N1masp8 4,86 1,46 33,15 8,55
N1masp9 4,26 1,33 33,11 9,24
N2masp1 4,13 0,59 21,16 5,43
N2masp2 3,26 2,15 27,47 22,80
N2masp3 4,13 1,19 22,69 15,00
N2masp4 3,73 1,83 28,63 11,10
N2masp5 3,93 1,24 17,28 19,00
N2masp6 5,10 1,13 24,10 16,90
MÉDIA 4,58 1,40 27,84 11,71
DESVIO
PADRÃO
0,73 0,38 8,26 5,76
44
Tabela 2
Propriedades mecânicas (valores de engenharia) da seda ampolada principal de
diferentes espécies de aranha
RIGIDEZ (GPa) TENSÃO (GPa) TRAÇÃO (%)
N. cruentata
11,71 ± 5,76 1,40 ± 0,38 27,84 ± 8,26
N. clavipes*
13,8 ± 0,76 1 ± 0,004 20 ± 1,1
A. trifasciata*
8,2 ± 0,63 1,2 ± 0,003 23 ± 0,6
A. diadematus*
8.3 ± 0.54 1,06 ± 0,005 29 ± 2,4
L. geometricus**
12,91 ± 7,38 0,83 ± 0 ,19 14 ± 6
*Swanson et al., 2006
**Motriuk-Smith e Lewis, 2004
Testes mecânicos
Os valores de engenharia obtidos para a tensão das amostras analisadas, variaram
de 0,59 GPa para a fibra N2masp1 até 2,15 GPa para N2masp2, o valor mais elevado para
a aranha N1 foi de 1,92 GPa. A média de força para todas as fibras testadas foi de 1,40 ±
0,38 GPa. Os valores de engenharia para a tração em porcentagem, isto é quanto a fibra
se estendeu em relação ao seu comprimento inicial, foi em média de 27,84 ± 8,26 %. O
menor valor encontrado para a tração da fibra foi de 10,73 % para N1masp6 e o maior
valor foi de 33,89% para a amostra N1masp5. O valor médio da rigidez (módulo de
Young) encontrado para as amostras analisadas foi de 11,71 ± 5,76 GPa, o menor e o
maior valor encontrado foi 3,71 GPa e 22,80 GPa, para N1masp3 e N2masp2,
respectivamente. A correlação existente entre os valores de tensão e tração obtidos pelo
teste mecânico da fibra ampolada principal de N. cruentata (N1masp2 – desempenho
mecânico com valores similares às médias obtidas), pode ser visto na Figura 1. Os
valores reais de tensão (σ
tr
) e tração (ε
tr
) também foram calculados a partir dos valores de
engenharia, onde a média dos respectivos valores encontrados foram 1,79 ± 0,49 GPa e
10,42 ± 0,02 %.
45
A Tabela 2 também mostra os valores obtidos pela análise mecânica das fibras de
N. cruentata em comparação com os valores obtidos da seda ampolada principal de
diferentes espécies de aranha.
0.00E+00
2.00E+08
4.00E+08
6.00E+08
8.00E+08
1.00E+09
1.20E+09
1.40E+09
1.60E+09
1.80E+09
2.00E+09
0 5 10 15 20 25 30 35
Tração (%)
Tensão (Pa)
Fibra dragline de
N. cruentata
Fibra ampolada principal de N. cruentata
Figura 1: Desempenho mecânico da fibra ampolada principal de N. cruentata.
Microscopia de força atômica
Por meio da análise da fibra ampolada principal utilizando a microscopia de força
atômica (MFA) foi possível observar que esta é uma fibra cilíndrica, constituída por
nanofibras arranjadas obliquamente ao seu eixo longitudinal (Figura 2). Foi também
possível observar a intercalação de nanofibras mais macias (escuras), e mais duras
(claro), e a presença de imperfeições ao longo da mesma (Figura 2b, 2d).
46
-28.22
[deg]
-60.48
5.00 um 10.00 x 10.00 um
Nephylengis-Major-18
1.20
[um]
0.00
5.00 um 10.00 x 10.00 um
Nephylengis-Major-18
268.29
[nm]
0.00
2.00 um 8.44 x 8.44 um
Nephylengis-Major-9
-21.86
[deg]
-30.85
2.00 um 8.44 x 8.44 um
Nephylengis-Major-9
d
d
c
c
b
b
a
a
Figura 2: Imagens obtidas da fibra ampolada principal de N. cruentata por meio da
microscopia de força atômica. (a, c) Topografia da fibra ampolada principal de N.
cruentata em superfície de grafite investigada por meio da microscopia de força atômica
no modo contato. (b, d) Imagens da modulação de força das mesmas regiões de
topografia obtidas “a” e “c”, respectivamente. As regiões mais macias da fibra são
mostradas em preto.
47
Discussão
A análise da fibra ampolada principal de N. cruentata por meio da MFA mostrou
que esta é composta por regiões (nanofibras) com diferentes graus de dureza (regiões
macias alternadas por regiões mais rígidas), o que indica diferentes interações
moleculares entre as proteínas constituintes da fibra ou diferenças nas composições das
nanofibras. Tal resultado vai de acordo com o modelo aceito da estrutura molecular
adotada pelas espidroínas de modo a formar um composto de fibra nano-estruturado. De
acordo com os motivos de aminoácidos presentes nas proteínas constituintes da
Ampolada principal, folhas-β formadas pelos motivos ricos em resíduos de alanina
estariam incorporados em uma matriz móvel, um tanto amorfa, constituída pelos motivos
(GlyGlyX)
n
(Termonia, 1994). Oroudjev et al. (2002) também propôs um modelo similar
para a organização nanoestrutural de fibras sintéticas baseadas na seqüência de
aminoácidos de MaSp1 produzidas por E. coli.
Os resultados obtidos por meio do teste mecânico da fibra ampolada principal de
N. cruentata também concorda com os dados da MFA, uma vez que esta possui duas
características extremas, força e elasticidade, também atribuídas a diferentes estruturas
moleculares presentes na fibra (Hayashi et al., 1999). Entretanto, nenhum tipo de
estrutura molecular pôde ser determinada claramente por meio da resolução obtida na
MFA.
Trabalhos anteriores discutem a presença de uma fina camada presente ao redor
da seda ampolada principal de N. clavipes caracterizando a “pele” da fibra (Work, 1985;
Augsten et al., 2000). Dessa forma, pode-se especular que a região mais escura
longitudinal, e provavelmente mais macia, vista na fibra de N. cruentata nas imagens de
MFA corresponda a esta estrutura. Li et al. (1994) também observou uma potencial
região que caracterizaria a “pele” da fibra em resoluções obtidas em MFA de cortes
transversais (45º) da fibra ampolada principal de N. clavipes.
Imperfeições na fibra também podem ser vistas na análise por MFA, o que não é
surpreendente. Apesar das extremas propriedades mecânicas das fibras de teia de aranha,
aranhas são inconsistentes tecedoras. Tal afirmação pode ser confirmada apenas pela
observação da variação do diâmetro e propriedades mecânicas das fibras tecidas por
48
diferentes aranhas da mesma espécie, e até mesmo pela mesma aranha (Madsen et al.,
1999; Motriuk-Smith e Lewis, 2004, Brooks et al., 2005). O diâmetro das fibras coletadas
tanto da aranha N1 quanto da N2, apresentaram uma variação de ±0,6µm de diâmetro
entre elas. Da mesma forma, a fibra #6 da aranha N1 era mais forte do que a amostra de
#7, entretanto esta apresentou uma capacidade de tração muito maior do que a anterior. A
variação das propriedades mecânicas entre fibras produzidas por diferentes indivíduos
também foi observada em N. cruentata, com uma variação de até ± 0,38 GPa na força
máxima exercida para o rompimento da fibra. Entretanto, a possibilidade destas
imperfeições serem produto da manipulação da fibra durante o preparo da amostra para a
análise não é totalmente descartado.
A seda ampolada principal de N. cruentata apresentou excelentes propriedades
mecânicas, embora seja mais forte do que as de A. diadematus, A. trifasciata e N.
clavipes, a fibra de N. cruentata é menos elástica do que a fibra das duas primeiras,
entretanto a de N. clavipes ainda é mais rígida do que todas (Motriuk-Smith e Lewis,
2004; Swanson et al., 2006). Elasticidade é definida como sendo a habilidade de
deformação reversível de uma fibra sem a perda de energia, ou a habilidade de
deformação em valores altos de tração, mas baixos de tensão. Desta maneira, proteínas
elásticas devem possuir baixos valores de rigidez (módulo de Young ou módulo de
elasticidade) (Gosline et al., 2002). De uma maneira geral, podemos concluir que a seda
ampolada principal de N. cruentata possui propriedades mecânicas com ordem de
magnitude similar à de outras espécies de aranhas, inclusive não orbiculares (Blackledge
e Hayashi, 2006; Swanson et al., 2006).
Em contraste com a tensão e tração de engenharia, pode-se também calcular os
reais valores de tensão e tração, os quais seriam uma medida mais precisa das forças e,
portanto, devem ser usados para todas as comparações dos dados do teste mecânico
(Blackledge e Hayashi, 2006; Guinea et al., 2006). O cálculo da real tensão necessita
conhecer a área da seção transversal instantânea em cada valor da extensão da fibra,
entretanto, a suposição de volume constante da mesma durante o teste de tensão foi
recentemente confirmada de maneira experimental (Guinea et al., 2006), possibilitando o
cálculo dos valores de σ
tr
e ε
tr
utilizando simples fórmulas (Capítulo 1). Os valores
médios de σ
tr
e ε
tr
encontrados para a fibra de moldura de N. cruentata mostram que esta
49
ainda é mais forte do que previsto pelo cálculo de engenharia, entretanto o valor real de
tração mostra que esta possui uma extensibilidade menor do que a apresentada pela tração
de engenharia.
A produção de novos materiais baseados na estrutura da ampolada principal de
aranha é o objetivo final da maioria dos estudos sobre esta fibra. Este trabalho forneceu
indícios sobre as relações entre estrutura e função desta fibra, entretanto o conhecimento
das propriedades mecânicas por si só não nos dá certeza destas relações. Análises físicas
mais aprofundadas deste material devem ser realizadas para a melhor compreensão do
comportamento mecânico desta fibra, para então sim, identificar o design responsável
pelas propriedades deste extremo biomaterial.
50
CAPÍTULO 4
Espidroínas da aranha
Avicularia juruensis
Este capítulo foi baseado no artigo a ser submetido para publicação (Anexo 4):
Bittencourt, D., Dittmar, K., Lewis, R.V., Rech, E.L. How old are ampolada principal
silks?
51
Introdução
As aranhas (Araneae) consistem de duas linhagens principais, a saber, a
Mesothelae, e a Opisthothelae, que contém a Mygalomorphae, (caranguejeiras e
semelhantes), e a Araneomorphae (aranhas verdadeiras). Recente prova filogenética
mostra nitidamente a relação de monofilia e de grupo-irmão das infraordens
migalomorfas e araneomorfas (Coddington et al., 2004; Hedin e Bond, 2006, Ayoub et
al., 2007). Os cálculos da divergência de tempo estimam suas respectivas origens de 392
até 340 milhões de anos atrás (Ayoub et al., 2007).
Todas as aranhas produzem seda, mas usam grupos de proteínas da seda de
tarefas específicas para tecer as teias, construir casulos ou dispersar (Garb e Hayashi,
2005). Acredita-se que a síntese de diferentes proteínas das sedas esteja intimamente
ligada a diferenciação morfológica das glândulas sericígenas; motivo pelo qual as sedas
são normalmente classificadas de acordo com sua glândula de origem (Vollrath, 1992,
Challis et al., 2006). As migalomorfas possuem apenas um ou dois tipos de glândulas,
elas não constroem teias orbiculares, e acredita-se que teçam apenas um tipo de seda
"ancestral" (Vollrath, 1992). Por outro lado, as aranhas de fiação orbicular
(Araneomorphae: Orbiculária) podem ter até sete glândulas morfologicamente distintas
que, conseqüentemente, sintetizam tipos diferentes de seda. Por exemplo, considera-se
que três tipos de glândulas sejam responsáveis pela produção de fibras usadas na teia
orbicular para a captura de presas: as glândulas ampoladas principais (espidroínas da
ampolada principal 1 e 2 - MaSp), as glândulas ampoladas secundárias (espidroínas da
ampolada secundária 1 e 2 - MiSp) e as glândulas flageliformes (espidroínas das
flageliformes - Flag) (Gatesy et al., 2001). Embora as proteínas análogas de seda MaSp1
sejam conhecidas a partir de aranhas não orbiculárias (Tai et al., 2004, Tian et al., 2004),
a presença de MaSp, MiSP e Flag na base da divergência Deinopidae (tecedoras
orbiculares com cribelo)- Araneidae (tecedoras orbiculares sem cribelo) seja interpretada
como apoio pela origem única das aranhas orbiculares (Garb et al., 2006).
Porém, a maioria dos estudos com referência às características moleculares das
sedas de aranhas é baseada na Orbiculariae (Aranaeomorphae), apenas algumas
seqüências são conhecidas das espidroínas de migalomorfas (Gatesy et al., 2001, Tai et
52
al., 2004). Aqui relatamos as seqüências de cDNA de dois genes de seda de uma aranha
migalomorfa (Avicularia juruensis) encontrada na região da Amazônia, Brasil. Embora
um gene seja típico de outras espidroínas isoladas de migalomorfas (por exemplo,
Euagrus chisoseus), o outro, curiosamente, mostra uma clara relação entre as sedas da
ampolada principal.
Resultados
Biblioteca de cDNA
Apesar da presença de apenas uma ou duas glândulas sericígena na A. juruensis,
interessantemente, foi possível agrupar os trinta e quatro clones positivos, entre os 1.248
clones analisados na biblioteca de cDNA, em dois grupos distintos. O transcrito mais
abundante foi chamado de Espidroína 1 (3.154 pb), e o segundo cDNA de espidroína foi
denominado Espidroína 2 (1.874 pb) (Anexo 2). Todos os clones de cDNA seqüenciados
foram parciais na direção 5’ e como as outras espidroínas suas traduções caracterizou
unidades repetidas de aminoácidos seguidas por uma região C-terminal não repetitiva.
Foram descobertas três transcrições supostamente parálogas para o gene da Espidroína 1
(Espidroína 1A - 2 clones, 1B - 9 clones e 1C - 17 clones). Outros cinco clones contendo
apenas a seqüência repetitiva da Espidroína 1 também foram identificados. O maior
número de clones representando a Espidroína 1 em comparação com o gene da
Espidroína 2 (somente um clone), sugere que esse gene seja mais expresso.
A fim de confirmar a expressão de ambas as espidroínas na glândula sericígena da
A. juruensis, a RT-PCR foi realizada usando-se iniciadores flanqueando a região C-
terminal das transcrições da Espidroína 1 (219 pb) e da Espidroína 2 (356 pb) (Figura
1). Todos os cDNAs analisados foram positivos devido a sua presença na(s) glândula(s)
sericígena(s) (Figura 1), eliminando a possibilidade de contaminação de transcritos ou
recombinação de clone.
53
1Kb
Ladder
2
3
1
1 kb
500
p
b
400
p
b
350
p
b
300
p
b
Figura 1: RT-PCR com RNA total da(s) glândula(s) sericígena(s) de A. juruensis. 1,
Espidroína 1 cDNA (219 pb); 2, Espidroína 2 cDNA (356 pb); 3, controle negativo. 1Kb
DNA ladder (Invitrogen).
Análise das seqüências
Entre todos os transcritos analisados foi possível identificar traduções para duas
proteínas distintas (Figura 2). A seqüência de aminoácidos da Espidroína 1 apresentou
uma seqüência longa repetitiva (183 pb através da tradução do trancrito 1C) rica em
serina e alanina, com uma cadeia de treoninas. Entretanto, a Espidroína 2 apresentou uma
seqüência altamente repetitiva com os motivos (GlyAla)
n
e (GlySer)
n
. Ambas proteínas
também possuíam uma região C-terminal não repetitiva altamente conservada em
comparação com espidroínas descritas previamente (Figuras 3 e 4).
54
Espidroína 1
YSLASSIASAASSSASSAAAAASSSSAAAGAAAASEAAASAAATSTTTTTSTSRAAAAASAAAAASASGAAG
AAGAASAASAASASSSLQQSLGSALAQSSSFAAAFAQASSAASAAAIAYALAQTVANQIGFSSYSSAFARAA
SSAVYSIGGLASASAYAFAFASAFSQVLSNYGLLNINNA
Espidroína 2
GAG(A/S)GSGSGSGS
Figura 2: Região repetitiva das Espidroínas 1 e 2 expressas pela A. juruensis. Os motivos
de aminoácidos encontrados nas espidroínas estão representados como: verde-A
n
,
vermelho-GA e azul-GS.
1A GLLPPLFVLPSNSATERISSMVSSLLSAVSSNGLDASSFGDTIASLVSQISVNNSDLSSS 60
1B GLLPPLSILPSDSANERISSVVSSLLAAVSSNGLDASSLGDNLASLVSQISANNADLSSS 60
1C NLLPPLSVLPSDSANERISSVVSSLLSAISSNGLDASSLGGTIASLVSQISVSNAKLSSS 60
.***** :***:**.*****:*****:*:*********:*..:********..*:.****
1A QVLLEALLEILSGMVQILSYAEVGTVNTKTVSSTSAAVAQAISSAFSGNQNS 112
1B QVMVEALLEVLSGIVQILSYAEVGAVNTETVSSTSSAVAQAISSAVLG---- 108
1C QVFLEALLEVLSGMVQILSYAEVGAVNTDTVISTSSAVAQAISSAVSG---- 108
**::*****:***:**********:***.** ***:*********. *
Figura 3: Alinhamento da região C-termninal das três traduções supostamente parálogas
para o gene da Espidroína 1 (1A, 1B e 1C) de A. juruensis. Aminoácidos estão
abreviados com uma letra. “-”, indica “gaps” nas seqüências opara um melhor
alinhamento; “*”, indica que o aminoácido presente naquela coluna é idêntico em todas
as seqüências; “:”, indica que uma substituição conservada ocorreu de acordo com as
corres (vermelho-aa pequeno, azul - aa ácido, rosa - aa básico, verde-
hidroxila+amino+básico-Q); e “.”, indica que substituições semi-concervativas
ocorreram.
55
Espidroína2 A.jur ARLSSPQASSRVSSAFFSLVSSGPTSPGALSNAISSVVSQVSASNPGLSGCDVLVQALLE 60
MaSp2a D.spi SRMSTPGSGSRISNAVSNILSSGVSSSSGLSNAISNISSSISASNPGLSGCDVLVQVLLE 60
MaSp2 A.amo SRLSSPQASSRVSSAVSSLVSSGPTNPAALSNAMSSVVSQVSASNPGLSGCDVLVQALLE 60
MaSp2 A.tri SRLSSPQASSRVSSAVSTLVSSGPTNPASLSNAISSVVSQVSSSNPGLSGCDVLVQALLE 60
MaSp2 A.aur SRLSSPQASSRVSSAVSTLVSSGPTNPAALSNAISSVVSQVSASNPGLSGCDVLVQALLE 60
MaSp2 A.bic SRLSSSAASSRVSSAVSSLVSSGPTTPAALSNTISSAVSQISASNPGLSGCDVLVQALLE 60
MaSp2 L.hes SALSSPTTHARISSHASTLLSSGPTNAAALSNVISNAVSQVSASNPGSSSCDVLVQALLE 60
MaSp2 L.geo SALSSPTTHARISSHASTLLSSGPTNSAAISNVISNAVSQVSASNPGSSSCDVLVQALLE 60
MaSp2 N.cla SRLASPDSGARVASAVSNLVSSGPTSSAALSSVISNAVSQIGASNPGLSGCDVLIQALLE 60
MaSp2 N.mad SRLASPDSGARVASAVSNLVSSGPTSSAALSSVISNAVSQIGASNPGLSGCDVLIQALLE 60
MaSp2 N.sen SRLASPDSGARVASAVSNLVSSGPTSSAALSSVIXNAVSQIGASNPGLSGCDVLIXALLE 60
MaSp2 G.mam SRLSSPQAGARVSSAVSALVASGPTSPAAVSSAISNVASQISASNPGLSGCDVLVQALLE 60
MaSp2 U.div SRLNSPASTSRVASAVSSLASAGAPSVGSLSSVISSLSSSVSASNPGLSGCELLTQVLLE 60
MaSp2 A.ven NRLSSSGAANRVSSNVAAIASGG---AAALPNVMSNIYSGVLGS--GVSSSEALIQALLE 55
ADF-3 A.dia SRLSSPAASSRVSSAVSSLVSSGPTKHAALSNTISSVVSQVSASNPGLSGCDVLVQALLE 60
ADF-4 A.dia SVYLRLQPRLEVSSAVSSLVSSGPTNGAAVSGALNSLVSQISASNPGLSGCDALVQALLE 60
. .::. : :.* ..:...: . * : .* * *..: * .***
Espidroína2 A.jur IVS--------------------QYASLVGQ-SVNQALRY 79
MaSp2a D.spi VISALVHILGSASVGQVG--SSPQNAQMVAANAVANAFS- 97
MaSp2 A.amo IVSALVHILGSSSIGQINYAASSQYAQMVGQ-SVAQALA- 98
MaSp2 A.tri IVSALVHILGSSSIGQINYAASSQYAQLVGQ-SLTQALG- 98
MaSp2 A.aur LVSALVHILGSSSIGQINYAAS------------------ 82
MaSp2 A.bic VVSALVHILGSSSVGQINYGASAQYAQMV----------- 89
MaSp2 L.hes IITALISILDSSSVGQVNYGSSGQYAQIVGQ-SMQQAMG- 98
MaSp2 L.geo LITALISIVDSSNIGQVNYGSSGQYAQMVG---------- 90
MaSp2 N.cla IVSACVTILSSSSIGQVNYGAASQFAQVVGQ-SVLSAF-- 97
MaSp2 N.mad IVSACVTILSSSSIGQVNYGAA------------------ 82
MaSp2 N.sen IVSACVTILSSSSIGQVNYGAA------------------ 82
MaSp2 G.mam IVSALVSILSSASIGQINYGASGQYAAMI----------- 89
MaSp2 U.div VVSALVALLGSARVGPVDVSSSQQYAGLVSS-AIAQAL-- 97
MaSp2 A.ven VISALMHVLGSASIGNVSSAGLDSTLNVVQN-AVSQYAG- 93
ADF-3 A.dia VVSALVSILGSSSIGQINYGASAQYTQMVGQ-SVAQALA- 98
ADF-4 A.dia LVSALVAILSSASIGQVNVSSVSQSTQMISQ-ALS----- 94
: : :
Figura 4: Alinhamento da região C-terminal da Espidroína 2 de A. juruensis com
proteínas MaSp2 de diferentes espécies de aranhas. Abreviações são as mesmas descritas
para o alinhamento da figura 2. Abreviações das espécies de aranhas e número de acesso
no GenBank (de cima para baixo): A.jur, Avicularia juruensis; D.spi, Deinopis spinosa
(ABD61593); A.amo, Argiope amoena (AAR13813); A.tri, Argiope trifasciata
(AAK30596); A.aur, Argiope aurantia (AAK30592); A.bic, Araneus bicentenarius
(AAC04503); L.hes, Latrodectus hesperus (AAY28936); L.geo, Latrodectus geometricus
(AAK30603); N.cla, Nephila clavipes (AAT75315); N.mad, Nephila inaurata
madagascariensis (AAZ15322); N.sen, Nephila senegalensis (AAK30609); G.mam,
Gasteracantha mammosa (AAK30601); U.div, Uloborus diversus (ABD61599); A.ven,
Araneus ventricosus (AAN85281); A.dia, A. diadematus (AAC47010 e AAC47011).
56
Freqüência de codons
A Espidroína 2 da A. juruensis mostrou uma preferência por A (adenina) ou T
(timina) como a terceira base de três para codificar os aminoácidos mais prevalecentes
em sua seqüência de proteínas (Tabela 1). A preferência de codons para glicina foi
GGA/T em 82% dos casos, para serina a preferência para A e T foi de 91%, e os codons
de alanina também usaram A ou T na posição de oscilação em 86% dos casos. Por outro
lado, semelhante à seqüência das espidroínas da glândula tubuliforme, os codons da
Espidroína 1 para os aminoácidos alanina e serina são apenas moderadamente
tendenciosos para A e T, com valores de 67 % e 56 %, respectivamente.
Tabela 2
Escolha de codons para os aminoácidos mais freqüentes nas espidroínas de A. juruensis
Freqüencia (%) Freqüencia (%)
AmAc Codon
Espidroína
1 Espidroína 2
AmAc Codon
Espidroína 1 Espidroína 2
Ala GCG 10 06 Gly GGC 10 14
Ala GCA 45 61 Ser AGT 06 34
Ala GCT 22 25 Ser AGC 12 03
Ala GCC 23 07 Ser TCG 13 02
Gly GGG 13 04 Ser TCA 18 41
Gly GGA 33 39 Ser TCT 32 16
Gly GGT 44 43 Ser TCC 19 03
Discussão
As aranhas da espécie A. juruensis possuem apenas uma ou duas glândula
sericígena indiferenciadas, entretando foram identificadas duas espidroínas diferentes,
Espidroínas 1 e 2. Embora não seja comum, diferentes proteínas de seda produzidas pela
mesma glândula foram também encontradas nas aranhas orbiculáreas com glândulas
especializadas. Por exemplo, a MaSp1 foi identificada como sendo produzida pelas
glândulas tubuliformes das aranhas Aranues diadematus e Latrodectus hesperus
(Guerette et al., 1996; Garb e Hayashi, 2005). Foi igualmente demonstrado que duas
57
proteínas podem estar presentes na mesma seda, como a MaSp1 e a MaSp2 na seda
ampolada principal (Xu e Lewis, 1990), sugerindo que a combinação de proteínas deve
possuir aplicações funcionais com relação às qualidades mecânicas da seda. Entretanto,
não se sabe até que ponto as espidroínas produzidas por A. juruensis são ou não usadas
simultaneamente na produção de suas fibras.
A maioria das proteínas da seda de aranhas é conhecida como sendo composta de
combinações de quatro motivos simples de aminoácidos (poli-Ala, (GlyAla)
n
, GlyGlyX
(onde X representa um pequeno subconjunto de aminoácidos), e GlyProGlyX(X)
n
.
Entretanto, esses três motivos são deficientemente representados nas espidroínas
encontradas na biblioteca de cDNA da glândula sericígena de A. juruensis.
As traduções dos três transcritos encontrados para Espidroína 1 mostraram alta
similaridade entre as suas repetições e as regiões C-terminais com poucas substituições e
deleções de aminoácidos, com identidades de até 85% em ambos os casos. A proteína da
seda Fibroína 1 de Euagrus chisoseus, também uma aranha migalomorfa, possui unidades
repetitivas de ~180 aminoácidos de comprimento, e semelhantemente a Espidroína 1, é
composta por uma seqüência rica em serina e alanina, inclusive com uma cadeia de
treoninas (Gatesy et al., 2001). Embora as regiões ricas em alanina sejam encontradas em
diferentes sedas de aranhas, a treonina é um aminoácido raro nas espidroínas de
Araneidae (tecedoras de teia orbicular). Análises utilizando o programa BLASTX
(Altschul, 1997) mostraram que a seqüência repetitiva da Espidroína 1 também é similar
a cylindrical silk protein 1 (BAE54450) da aranha Nephila clavata.
A Espidroína 2 mostrou um padrão completamente novo em sua seqüência de
aminoácidos se comparada com outras proteínas de seda descritas de aranhas
migalomorfas. Embora tenhamos encontrado o motivo (GlyAla)
n
na composição
repetitiva de aminoácidos da Espidroína 2, um motivo importante na composição das
espidroínas de aranhas tecedoras de teia orbicular, também achamos em uma grande
quantidade de motivo (GlySer)
n
, até o momento um motivo descrito apenas nas
espidroínas das aranhas de tecedoras de teia não orbicular Kukulcania hibernalis e
Agelenopsis aperta (Tian et al., 2004). Outra característica interessante é que a região C-
terminal da Espidroína 2 é bem parecida com aquela das aranhas Araneomorphae, a
MaSp2. O alinhamento entre as seqüências de aminoácidos da região C-terminal da
58
Espidroína 2 da A. juruensis com a MaSps 2 de diferentes aranhas mostrou valores de
identidade de 86% para a Argiope amoena e 83% para a Argiope trifasciata. Tai et al.
(2004) também descobriram uma alta similaridade entre as regiões C-terminal de um
gene análogo da MaSp1 da aranha migalomorfa Macrothele holsti com a MaSp1 de
aranhas de tecedoras de teia orbicular. As aranhas migalomorfas são conhecidas por
possuir apenas uma glândula sericígena não diferenciada e suas fiandeiras pouco
desenvolvidas (Foelix, 1996), sugerindo que a região C-terminal das principais
espidroínas foi conservada desde antes da separação filogenética das aranhas
araneomorfas e migalomorfas há aproximadamente 340-390 milhões de anos (Ayoub et
al., 2007). Uma razão para a conservação da região C-terminal durante evolução entre as
espidroínas de diferentes aranhas poderia estar relacionada com uma função importante.
Sugere-se que a função da região C-terminal poderia evitar a prematura formação de
fibras enquanto a proteína ainda estivesse na glândula, ou estar relacionada com o
enovelamento das proteínas, uma vez que essa região ainda encontra-se presente na fibra
polimerizada (Beckwitt e Arcidiacono, 1994; Sponner, 2004).
A falta dos motivos poli-Ala, (GlyAla)
n
, GlyGlyX e GlyProGlyXX encontrada na
maioria das proteína de aranhas tecedores de teia orbicular nas espidroínas da A.
juruensis, uma aranha rudimentar que não constrói teias orbiculares, apóia a correlação
entre as seqüências primárias de proteínas, estrutura secundária e propriedades mecânicas
onde as repetições habituais ricas em motivos de alanina e/ou glicina pode ser
fundamental para sedas envolvidas na captura de presas (Hayashi et al., 1999). Embora a
Espidroína 1 apresente o motivo poli-Ala e a Espidroína 2 (GlyAla)
n
em suas seqüências
de aminoácidos, a presença de apenas um desses motivos não deve ser suficiente para
produzir uma teia para a captura de presas, uma vez que a combinação de diferentes sedas
compostas por proteínas com motivos variáveis é necessária para a produção de uma teia
orbicular (Vollrath, 1994).
59
Capítulo 5
Relacionamento evolutivo
da MaSp entre as
diferentes espécies de
aranhas
Este capítulo foi baseado no artigo a ser
submetido para publicação (Anexo 4):
Bittencourt, D., Dittmar, K., Lewis, R.V.,
Rech, E.L. How old are ampolada principal
silks?
60
Introdução
As mais elaboradas teias de aranha são contruídas pelas aranhas orbiculárias do
grupo das Araneomorphaes, as Araneoidea e Deinopoidea. Suas teias possuem espirais de
captura envoltas por uma linha de suporte, tais fibras são extremamente resistentes,
capazes de absorver a energia cinética produzido por uma presa voadora. Acredita-se que
ambas linhagens tenham evoluído a partir de um ancestral em comum, e duas de suas
fibras (Espidroína ampolada principal 2 – MaSp2, e espidroína flageliforme – Flag)
foram identificadas como suporte da monofilia das orbiculárias (Garb et al., 2006).
Entretanto, as aranhas Mygalomorphae, o grupo irmão das Araneomorphae, não
produzem teia em orbital, e usam suas sedas apenas para a construção de casulos e tocas,
diferentemente das orbiculárias que as utilizam para caça.
Por este motivo não apenas as espidroínas das migalomorfas são pouco estudadas,
mas estas são também conhecidas como aranhas “primitivas”. É bem sabido que aranhas
orbiculárias utilizam uma variedade de sedas específicas para realizar diferentes tarefas, e
assim, presupõem-se que aranhas mygalomorfas não produzam tais fibras.
Adicionalmente, esta linha de pensamento leva a suposicão que estas aranhas apenas
possuam sedas “ancestrais” (basal filogeneticamente). No intuito de identificar a seda
ancestral a partir de uma aranha migalomorfa, Avicularia juruensis (Theraposidae), uma
descoberta interessante foi feita, que desafia pareceres comuns sobre a evolução das sedas
de aranha.
Três tipos de sedas, produzidos por glândulas diferentes, são responsáveis pela
produção de teias em orbital; MaSp 1 e 2, MiSp e espidroína flageliforme (Gatesy et al.,
2001). A partir dos cDNAs de A. juruensis, nós identificamos duas espidroínas sendo
expressas. Enquanto a Espidroína 1 mais abundante, é bem semelhante a Fibroína 1 da
migalomorfa Euagrus chisoseus, a Espidroína 2 possui semelhanças claras com a MaSp2
do grupo orbiculárias da família Araneomorphae.
A fim de validar estes resultados, foi investigada a posição evolutiva das
seqüências da Avicularia a partir da análise da filogenia molecular da seqüência de
aminoácidos de 77 C-terminais de diferentes espidroínas de 35 espécies de aranha, e
61
exploramos suas implicações para a origem das sedas de aranha em geral, e para a fiação
rbicular em particular.
implementando-se o modelo
GTR+I
ncipais classes funcionais.
ou araneomorfas não orbiculárias.
o
Resultados e Discussão
A análise da filogenia molecular das regiões C-terminais examinou a relação das
duas espidroínas isoladas da A. juruensis com outras espidroínas conhecidas. O resultante
alinhamento de nucleotídeos consistiu em 366 pb. Todas as abordagens analíticas
resultaram em topologias similares. Apresentamos a árvore de ML (Maximum likelihood)
(Figura 1). A análise de MP gerou 25 árvores mais parcimoniosas (comprimento: 4074;
IC: 0,423; IR: 0,602). O rigoroso consenso desintegrou todos os nós basais. A melhor
árvore de ML (- lnL = -7671.60611) foi computado
+G identificado por Modeltest v3.7 (Posada e Bucley, 2004). Os valores bootstrap
(PB) não indicam nenhum apoio na maioria das ramificações basais (Figura 1).
Consistente com as análises anteriores, a maioria das seqüências que foram
classificadas funcionalmente como MaSps, MiSps, Flag, AcSps e TuSps formam
agrupamentos ortólogos discerníveis, intercaladas com terminais que não parecem
pertencer a qualquer grupo funcional (Garb e Hayashi, 2005; Challis et al., 2006). Dentro
de algumas dessas classes, os padrões de especiação de aranhas são claramente
preservados (por exemplo, TuSp), indicando uma origem a partir da duplicação para
todas as pri
Em geral, nenhum apoio foi encontrado para quaisquer dos nós basais, contudo,
várias classes individuais recebem altos PBs. Assim, não se pode chegar a nenhuma
conclusão quanto à sucessão de descendência entre as classes da principal seda funcional,
e a noção comum de que as espidroínas são as produtoras de sedas mais "antigas" não
pode ser confirmada. Isto pode vir a mudar com a adição de outros grupos de aranhas,
atualmente subamostrados, como as migalomorfas
62
63
Figura 1: A) Relacionamentos filogenéticos entre as espidroínas de A. juruensis com
diferentes seqüências de espidroínas publicamente disponíveis. As Araneomorphae
incluídas: Plectreurys tristis [1 (AAK30610); 2 (AAK30611); 3 (AAK30612); 4
(AAK30613)], Deinopsis spinosa [1b (ABD61592); 1a (ABD61591); 2a (ABD61593);
2b (ABD61594); 4 (ABD61590)], Dolomedes tenebrosus [1 (AAK30598); 2
(AAK30599)], Argiope aurantia [2 (AAK30592); 3 (AAX45292)], Argiope trifasciata [1
(AAK30595); 2 (AAK30596); 4 (AAK30593); 5 (AAR83925)], Argiope amoena [2
(AAR13813)], Argiope argentata [3 (AAY28932)], Latrodectus hasselti
[3(AAY28941)], Latrodectus hesperus [1(AAY28935); 2(ABD66603); 3 (AAY28931)],
Latrodectus geometricus [1 (AAK30602), 2 (AAK30604), 3 (AAY28940)], Latrodectus
mactans [3 (AAY28938)], Cyrtophora moluccensis [3 (AAY28944)], Psechrus sinensis
[1 (AAV48939)], Octonoba varians [1 (AAV48931)], Uloborus diversus [ 1
(ABD61596), 2 (ABD61599), 3 (AAY28933), 5 (ABD61598), 6 (ABD61597)], Araneus
diadematus [1 (AAC47008), 2 (AAC47009), 3 (AAC47010), 4 (AAC47011)], Araneus
ventricosus [1 (AAN85280), 2 (AAN85281), 4 (ABK00016)], Araneus bicentenarius [2
(AAC04503)], Araneus gemmoides [3 (AAX45294)], Gea heptagon [3(AAY28943)],
Gasteracantha mammosa [2 (AAK30601)], Agelenopsis aperta [ 1 (AAT08436)],
Nephila clavipes [1 (AAT75312), 2 (AAT75315), 3 (AAX45295), 4 (AAF36089), 6
(AAC14589)], Nephila clavata [3 (BAE54450)], Nephila antipodiana [1 (ABC72644), 3
(AAY90151), 6 (ABC72645)], Nephila madagascarensis [1 (AAK30606), 2
(AAK30607), 4 (AAF36092)], Nephila pilipes [1 (AAV48946)], Nephila senegalensis [1
(AAK30608), 2 (AAK30609)], Nephilengys cruentata [ 1 (EF638446), 3 (EF638445), 4
(EF638444), 6 (EF638447)], Euprosthenops sp. [1 (Pouchkina-Stanteva e McQueen-
Mason, 2004)], Tetragnatha versicolor [1 (AAK30615)], Tetragnatha kauaiensis [1
(AAK30614)], Mygalomorphae: Macrothele holsti [1 (AAV48940)], e Euagrus
chisoseus [1 (AAK30600)]. B) Árvore filogenética de aranha com dados da ML de
Ayoub et al., 2007. U = Uloboridae, D = Deinopidae, A = Araneidae, L = Latrodectidae,
P = Pisauridae, Pl = Plectreuridae, T = theraphosidae, D = Dipluridae, H = Hexathelidae.
D – separação filogenética entre araneomorfas e migalomorfas (Ayoub et al., 2007).
Ramos azuis – presença de MaSps.
64
Entretanto, o que é mais importante, a Espidroína 2 da A. juruensis se aninha
claramente dentro de um grupo de seqüências da MaSp2, e encontra-se posicionado no
mesmo agrupamento que contém uma seqüência de outra aranha migalomorfa - a
Macrothele holsti, que foi classificada uma seda análoga da MaSp1 (Tai et al., 2004).
Nossa evidência sugere que, pelo menos, duas aranhas migalomorfas expressam
C-terminais que possuem uma alta identidade de seqüências e afinidade filogenética com
as sedas da ampolada principal. Seguindo a prática comum, uma função similar às outras
MaSps poderia ser deduzida. Porém isso deve ser testado, e o fato de que as repetições
são ligeiramente diferentes das repetições da MaSp das tecedoras orbiculares, combinado
com o estilo de vida das tecedoras não orbiculares das migalomorfas sugere uma função
diferente de outras MaSps.
Porém, a partir de uma perspectiva evolutiva, a topologia recuperada possibilita
duas linhas de raciocínio: A) as aranhas migalomorfas evoluíram a ampolada principal
como as regiões C-terminais (e sedas) independentemente depois de sua ramificação a
partir das araneomorfas, o que seria um exemplo patente, mas improvável da evolução
paralela; ou B) A região C-terminal da análoga MaSp das migalomorfas é a sobrevivente
de duplicações de genes de seda na base da divergência migalomorfa-araneomorfa. Isto
também insinuaria que a origem das MaSps de fiação orbicular pode ser colocada em um
ponto de tempo antes da origem da aranha orbiculária e da fiação orbicular, o que será
discutido abaixo.
O mapeamento da presença ou ausência das regiões C-terminais na análoga
ampolada principal na árvore de espécies de aranhas tem como resultado a identificação
do nó mais basal que une as araneomorfas e migalomorfas como o ponto de origem da
MaSp, tanto sob a otimização ACCTRAN quanto DELTRAN. Com base nos dados
disponíveis, a reconciliação da árvore resultou na identificação de 23 eventos de
duplicações (62 perdas, contagem D/L: 77) por toda a árvore da C-terminal. Algumas
dessas duplicações deduzidas estão conectadas as relações debilmente apoiadas, e assim,
é provável que mudem com uma amostragem ampliada de táxons, contudo todos os
grupos principais - MaSp, MiSp, TuSp, Flag, como também MaSp + MiSp - registram
uma duplicação. Entretanto, nosso interesse específico estava na possibilidade de MaSp2
B=85%) ser uma seda comum, em vez de uma característica específica da orbiculária. (P
65
NOTU
o
araneom
e é autapomórfico a Orbiculária são as sedas da tubuliforme,
e até m
de anos.
NG leva em consideração a estimação de limites mais baixos no tempo de
duplicação, isto sendo descrito como as espécies/especiação mais antigas na qual a
duplicação deve ter estado presente. Sob todos os cenários possíveis de raízes mais
parcimoniosa, o limite mais baixo para a MaSp foi calculado como sendo a divisã
orfa-migalomorfa. De maior importância, o mesmo limite também é calculado
para a classe contendo a seqüência da Espidroína 2 da Avicularia (classe da MaSp2), e da
Macrothele (MaSp1). Portanto, MaSp2, e as sedas da ampolada principal, em geral, não
podem ser classificadas como uma sinapomorfia para a Orbiculária (Garb e Hayashi,
2005), mas têm que ser consideradas plesiomórficas, e apesar de não refutar a monofilia
da orbiculária, eles certamente não a apóiam de modo único. Aparentemente, o único
grupo de seda de aranhas qu
esmo isso pode mudar, dado a amostragem mais intensiva.
O padrão filogenético geral combinado com nossos resultados confirma uma
importante influência da duplicação de genes na evolução de seda de aranhas, com
exceção de outros padrões, tais como conversão de genes e a homogeneização intragênica
(Garb e Hayashi, 2005; Challis et al., 2006). Devido à aparente importância da
duplicação de genes para a evolução de novas funções biológicas sobre todas as escalas
de tempo evolutivas, isso faz sentido para as sedas de aranhas, e é concebível que a base
funcional para seus diferentes usos tenha evoluído no princípio da radiação de aranhas, há
340 – 390 milhões
66
REFERÊNCIAS
Adams, M.D., Kelley, J.M., Gocayne, J.D., Dubnick, M., Polymeropoulos, M.H., Xiao,
H., Merril, C.R., Wu, A., Olde, B., Moreno, R.F., 1991. Complementary DNA
sequencing: expressed sequence tags and human genome project. Science 252,
1651-1656.
Altschul, S.F., Madden, T.L., Schaffer, A.A., Zhang, J., Zhang, Z., Miller, W., Lipman,
D.J., 1997. Gapped BLAST and PSI-BLAST: a new generation of protein database
search programs. Nucleic Acids Res. 25, 3389-3402.
Andersen, S.O., 1970. Amino Acid Composition of Spider Silks. Comp.
Biochem.Physiol. 35: 705-711.
Augsten, k., Mühlig, P., Herrmann, C., 2000. Glycoproteins and skin-core structure in
N
cocoon silk fibres. Polymer 42, 5797-5800.
Barghout, J.Y.T., Thiel, B.L., Viney, C., 1999. Spider Araneus diadematus. cocoon silk:
a case of non-periodic lattice crystals with a twist? Int. J. Biol. Macromol. 24, 211-
217.
Beckwitt, R., Arcidiacono, S., 1994. Sequence conservation in the C-terminal region of
spider silk proteins (Spidroin) from Nephyla clavipes (Tetragnathidae) and Araneus
bicentenarius (Araneidae). J. Biol. Chem. 269, 6661-6663.
Beard, J., 1992. Warding off Bullets by a Spider’s Thread. New Scientist 14, 18.
Bell, F.I., McEwen, I.J., Viney, C., 2002. Fiber science: supercontraction stress in wet
spider dragline. Nature 416, 37.
Bini, E., Knight, D.P., Kaplan, D.L., 2004. Mapping domain structures in silks from
insects and spiders related to protein assembly. J Mol Biol. 335, 27-40.
ephila clavipes spider silk observed by light and electron microscopy. Scanning
22, 12-15.
Ayoub, N.A., Garb, J.E., Hedin, M., Hayashi, C.Y., 2007. Utility of the nuclear protein-
coding gene, elongation factor-1 gamma (EF-1γ), for spider systematics,
emphasizing family level relationships of tarantulas and their kin
(Araneae:Mygalomorphae). MPE 42, 394-409.
Barghout, J.Y.J., Czernuszka, J.T., Viney, C., 2001. Multiaxial anisotropy of spider
(Araneus diadematus)
67
Blackledge, T.A., Hayashi, C.Y., 2006. Silken toolkits: biomechanics of silk fibers spun
by the orb web spider Argiope argentata (Fabricius 1775). J. Exp. Biol. 209, 2452-
Brook
Brooks, A.E., Steinkraus, H.B., Nelson, S.R., Lewis, R.V., 2005. An investigation of the
Chall n of spider silks: conservation
Chen, X., Knight, D.P., Vollrath, F., 2002. Rheological characterization of nephila
Codd
the Tree of Life, Cracraft J, Donoghue MJ. (eds.) (Oxford University
Codd
Colgi ecundária silk proteins contain new
Dicko, C., Knight, D., Kenney, J.M., Vollrath, F., 2004. Secondary structures and
secundária silk proteins. Temperature and concentration effects.
Biomacromolecules 5, 2105-2115.
. 284, 53-57.
2461.
s, A.E., Lewis, R.V., 2004. Probing the elastic nature of spider silk in pursuit of the
next designer fiber. Biomed Sci Instrum. 40, 232-237.
divergence of ampolada principal silk fibers from Nephila clavipes and Argiope
aurantia. Biomacromolecules 6, 3095-3099.
is, R.J., Goodacre, S.L., Hewitt, G.M., 2006. Evolutio
and diversification of the C-terminal. Insect. Mol. Biol. 15, 45-56.
spidroin solution. Biomacromolecules 3, 644-648.
ington, J.A., Giribet, G., Harvey, M.S., Prendini, L., Walter, D.E., 2004. In:
Assembling
Press, New York).
ington, J.A., Levi, H.M., 1991. Systematics and evolution of spiders (Araneae).
Ann. Rev. Ecol. Syst. 22, 565-592.
n, M.A., Lewis, R.V., 1998. Spider ampolada s
repetitive sequences and highly conserved non-silk-like "spacer regions". Protein
Sci. 7, 667-672.
Denny, M.. 1976. The Physical Properties of Spider’s Silk and Their Role in the Design
of Orb-Webs. J.Exp.Biol. 65, 483-506.
conformational changes in flagelliform, cylindrical, major, and ampolada
Dong, Z., Lewis, R.V., Middaugh, C.R., 1991. Molecular Mechanism of Spider Silk
Elasticity. Arch Biochem Biophys
Durand, D., Halldorsson, B.V., Vernot., B., 2006. A hybrid micro-macroevolutionary
approach to gene tree reconstruction. J Comput Biol. 13, 320-335.
68
Edmonds, D., Vollrath, F., 1992. The contribution of atmospheric water vapour to the
formation and effciency of a spider's web. Proc. R. Soc. Lond. 248, 145-148.
Elices, M., Perez-Rigueiro, J., Plaza, G., Guinea, G.V., 2004. Recovery in Spider Silk
Fibers. J. Appl. Pol. Sci. 92: 3537-3541.
Ewing, B., Green, P., 1998. Base-calling of automated sequencer traces using phred. II.
Error probabilities. Genome Res. 8, 186-194.
Ewing, B., Hillier, L., Wendl, M.C., Green, P., 1998. Base-calling of automated
sequencer traces using phred. I. Accuracy assessment. Genome Res. 8, 175-185.
Fahnestock, S.R., Bedzyk, L.A., 1997. Production of synthetic spider dragline silk protein
in Pichia pastoris. Appl Microbiol Biotechnol 47, 33-39.
Fahnestock, S.R., Irwin, S.L., 1997. Synthetic spider dragline silk proteins and their
production in Escherichia coli. Appl Microbiol Biotechnol. 47, 23-32.
Fahnestock, S. R., Yao, Z., Bedzyk, L. A., 2000. Microbial production of spider silk
proteins. J. Biotechnol. 74, 105-119.
Foelix, R. F., 1996. Biology of Spiders. Oxford University Press, Inc. and Georg Thieme
Verlag, New York.
Garb, J.E., Dimauro, T., Vo, V., Hayashi, C.Y., 2006. Silk genes support the single origin
of orb webs. Science 312, 1762.
Garb, J.E., Gonzales, A., Gillsepe, R.G., 2004. The black widow spider genus
Lactrodectus (Araneae:Theridiidae): phylogeny, biogeography, and invasion
history. MPE 31, 1127-1142.
Garb, J.E., Hayashi, C.Y., 2005. Modular evolution of egg case silk genes across orb-
Gates
Gersappe, D., 2002. Molecular mechanisms of failure in polymer nanocomposites. Phys
Rev Lett. 89, 058301.
Gosline, J.M., DeMont, M.E., Denny, M.W., 1986. The Structure and Properties of
weaving spider superfamilies. Proc. Natl. Acad. Sci. USA 102, 11379-11384
.
y, J., Hayashi, C., Motriuk, D., Woods, J., Lewis, R.V., 2001. Extreme diversity,
conservation, and convergence of spider silk fibroin sequences. Science 291, 2603-
2605.
Spider Silk. Endevour. 10: 37-43.
69
Gosline, J.M., Denny, M.W., Demont, M. E., 1984. Spider silk as rubber. Nature 309,
551-552.
Gosline, J.M., Guerette, P.A., Ortlepp, C.S., Savage, K.N., 1999. The mechanical design
of spider silks: from fibroin sequence to mechanical function. J. Exp. Biol. 202,
3295-3303.
Gosline, J.M., Lillie, M., Carrington, E., Guerette, P., Ortlepp, C., Savage, K., 2002.
Elastic proteins: biological roles and mechanical properties. Philos. Trans. R. Soc.
Lond. B. Biol. Sci. 357, 121-132.
Grubb, D.T., Ji, G., 1999. Molecular Chain Orientation in Supercontracted and Re-
extended Spider Silk. Int. J. Biol. Macromo. 24, 203-210.
ily. Science
Guess alysis of ampolada principal (dragline) spider
ood. Syst Biol. 52, 696-704.
4.
e. Science 287, 1477-1479.
tion. BioEssays 23, 750-756.
Guerette, P.A., Ginzinger, D.G., Weber, B.H., Gosline, J.M., 1996. Silk properties
determined by gland-specific expression of a spider fibroin gene fam
272, 112-115.
, K.B., Viney, C., 1998. Thermal an
silk: the effect of spinning rate on tensile modulus. Thermochimica Acta. 315, 61-
66.
Guindon, S., Gascuel, O., 2003. A simple, fast, and accurate algorithm to estimate large
phylogenies by maximum likelih
Guinea, G.V., Elices, M., Perez-Rigueiro, J., Plaza, G.R., 2005. Stretching of
supercontracted fibers: a link between spinning and the variability of spider silk. J.
Exp. Biol. 208, 25-30.
Guinea, G.V., Perez-Rigueiro, J., Plaza, G.R., Elices, M. 2006. Volume constancy during
stretching of spider silk. Biomacromolecules 7, 2173-7.
Hayashi, C.Y. Lewis, R.V., 1998. Evidence from flagelliform silk cDNA for the
structural basis of elasticity and modular nature of spider silks. J. Mol. Biol. 275,
773–78
Hayashi, C.Y., Lewis, R.V., 2000. Molecular architecture and evolution of a modular
spider silk protein gen
Hayashi, C.Y., Lewis, R.V., 2001. Spider flagelliform silk: lessons in protein design,
gene structure, and molecular evolu
70
Hayashi, C.Y., Shipley, N.H., Lewis, R.V., 1999. Hypotheses that correlate the sequence,
structure, and mechanical properties of spider silk proteins. Int. J. Biol. Macromol.
24, 271-275.
Hayashi, C.Y., Blackledge, T.A., Lewis, R.V., 2004. Molecular and mechanical
characterization of aciniform silk: uniformity of iterated sequence modules in a novel
member of the spider silk fibroin gene family. Mol. Biol. Evol. 21, 1950-1959.
Hedin, M., Bond, J.E., 2006. Molecular phylogenetics of the spider infraorder
Mygalomorphae using nuclear rRNA genes (18S and 28S): conflict and agreement
with the current system of classification. Mol. Phylogenet Evol. 41, 454-71.
Hijirida, D. H., Do, K.G., Michal, C.,Wong, S., Zax, D., Jelinski, L.W., 1996. C13 NMR of
Nephila clavipes ampolada principal silk gland. Biophys. J. 71, 3442-3447.
Hinman, M.B., Jones, J.A., Lewis, R.V., 2000. Synthetic spider silk: a modular fiber.
Trends Biotechnol.18, 374-379.
Hinman, M.B., Lewis, R.V., 1992. Isolation of a clone encoding a second dragline silk
protein. J. Biol. Chem. 267, 19320–19324.
Hormiga, G., Scharff, N., Coddington, J.A., 2000. The phylogenetic bases of sexual size
dimorphism in orb-weaving spiders (Araneae, Orbiculeriae). Systematic Biol. 49,
435-462.
Hu, X., Kohler, K., Falick, A.M., Moore, A.M., Jones, P.R., Sparkman, O.D., Vierra, C.,
2005a. Egg case protein-1. A new class of silk proteins with fibroin-like properties
from the spider Latrodectus hesperus. J. Biol. Chem. 280, 21220-21230
.
Hu, X., Lawrence, B., Kohler, K., Falick, A.M., Moore, A.M., McMullen, E., Jones, P.R.,
Vierra, C., 2005b. Araneoid egg case silk: a fibroin with novel ensemble repeat units
from the black widow spider, Latrodectus hesperus. Biochemistry 44, 10020-10027.
Hu X., Kohler K., Falick A.M., Moore A,M., Jones P.R., Vierra C. 2006. Spider egg case
core fibers: trimeric complexes assembled from TuSp1, ECP-1, and ECP-2.
Biochemistry. 45, 3506-3516.
71
Huang, W., Lin, Z., Sin, Y.M., Li, D., Gong, Z., Yang, D., 2006. Characterization and
expression of a cDNA encoding a tubuliform silk protein of the golden web spider
Nephila antipodoana. Biochimie. 88, 849-858.
Huels
ioinformatics 17, 754-755.
Ittah, S., Cohen, S., Garty, S., Cohn, D., Gat, U., 2006. An essential role for the C-
ucleic Acids Res. 33, 511-518.
Lawrence, B.A., Vierra, C.A., Moore, A.M., 2004. Molecular and mechanical properties
Lazar ., Welsh,
Lewis
ion of a spider silk protein: a new strategy for producing repetitive
Lewis
Li, S.F., McGhie, A.J., Tang, S.L., 1994. New internal Structure of Spider Dragline Silk
Revealed by Atomic Force Microscopy. Biophys J., 66, 1209-1212.
Huang, X., Madan, A., 1999. CAP3: A DNA sequence assembly program. Genome Res.
9, 868–877.
enbeck, J.P., Ronquist, F., 2001. MRBAYES: Bayesian inference of phylogenetic
trees. B
Hutchinson, E.G., Thornton, J.M., 1994. A revised set of potentials for beta-turn
formation in proteins. Protein Sci. 3, 2207-16.
terminal domain of a dragline spider silk protein in directing fiber formation.
Biomacromolecules 7, 1790-1795.
Jin, H.J., Kaplan, D.L., 2003. Mechanism of silk processing in insects and spiders. Nature
424, 1057–1061.
Katoh, K., Kuma, K., Toh, H., Miyata, T., 2005. MAFFT version 5: improvement in
accuracy of multiple sequence alignment. N
Knight, D.P., Vollrath, F., 2002. Biological liquid crystal elastomers. Philos. Trans. R.
Soc. Lond. B. Biol. Sci. 357, 155-63.
of ampolada principal silk of the black widow spider, Latrodectus hesperus.
Biomacromolecules 5, 689-695.
is, A., Arcidiacono, S., Huang, Y., Zhou, J.F., Duguay, F., Chretien, N
E.A., Soares, J.W., Karatzas, C.N., 2002. Spider silk fibers spun from soluble
recombinant silk produced in mammalian cells. Science 295, 472-6.
, R.V., Hinman, M., Kothakota, S., Fournier, M.J., 1996. Expression and
purificat
proteins. Protein Exp.r Purif. 7, 400-6.
, R.V., 2006. Spider silk: ancient ideas for new biomaterial. Chem. Rev. 106, 3762-
3734.
72
Liu, Y., Shao, Z., Vollrath, F., 2005. Extended wet-spinning can modify spider silk
Properties. Chem. Commun (Camb), 19, 2489-2491.
Lucas, F., 1964. Spiders and Their Silks. Discovery 25, 20-26.
Maddison, D.R., Maddison, W.P., 2006. Sinauer Associates, Inc. Mac Clade Version 4.08.
Madsen, B., Shao, Z.Z., Vollrath, F., 1999. Variability in the mechanical properties of
spider silks on three levels: interspecific, intraspecific and intraindividual. Int J Biol
Macromol. 24, 301-6.
Miao, Y., Zhang, Y., Nakagaki, K., Zhao, T., Zhao, A., Meng, Y., Nakagaki, M., Park,
E.Y., Maenaka, K., 2006. Expression of spider flagelliform silk protein in Bombyx
mori cell line by a novel Bac-to-Bac/BmNPV baculovirus expression system. Appl
Microbiol Biotechnol. 71, 192-9.
Motriuk-Smith, D., Lewis, R.V., 2004. Brown Widow (Latrodectus geometricus) ampolada
principal silk protein and its material properties. Biomed. Sci. Instrum. 40, 64-69.
Oroudjev, E., Soares, J., Thompson, J.B., Fossey, S.A., Hansma, H.G., 2002. Segmented
nanofibers of spider dragline silk: atomic force microscopy and single-molecule force
spectroscopy. Proc. Natl. Acad. Sci. USA 99, 6460-6465.
Parkhe, A.D., Seeley, S.K., Gardner, K., Thompson, L., Lewis, R.V., 1997. Structural
studies of spider silk proteins in the fiber. J. Mol. Recognit. 10, 1-6.
Perez-Rigueiro, J., Elices, M., Plaza, G., Real, J.I., Guinea, G.V., 2005. The effect of
spinning forces on spider silk properties. J. of Exp. Biology 208, 2633-2639.
Platnick, N.I., 2007. The world spider catalog, version 6.5. American Museum of Natural
History, online at <http://research.amnh.org/entomology/spiders/catalog/index.html>
Posada, D., Buckley, T.R., 2004. Model selection and model averaging in phylogenetics:
advantages of akaike information criterion and bayesian approaches over likelihood
ratio tests. Syst. Biol. 53, 793-808.
Pouchkina-Stantcheva, N.N., McQueen-Mason, S.J., 2004. Molecular studies of a novel
dragline silk from a nursery web spider, Euprosthenops sp. Pisauridae. Comp.
Biochem. Physiol. B. Biochem. Mol. Biol. 138, 371-376.
73
Qin, X., Coyne, K.J., Waite, H.J., 1997. Tough Tendons. Mussel Byssus Has Collagen
With Silk Like Domains. J. of Biological Chemistry. 272, 32623-32627.
Riekel C., Madsen B., Knight D., Vollrath F., 2000. X-Ray Diffraction on Spider Silk
romolecules 1, 622-626.
22, 273-81.
Schei
Microb. Cell Fact. 3, 14.
Selden, P.A., Shear, W.A., Bonamo, P.M., 1991. A spider and other arachnids from the
Shao, ider silk studied by
45.
02.
During Controlled Extrusion Under a Synchrotron Radiation X-ray Beam.
Biomac
Rising A., Nimmervoll H., Grip S., Fernandez-Arias A., Storckenfeldt E., Knight D.P.,
Vollrath F., Engstrom W. 2005. Spider silk proteins--mechanical property and gene
sequence. Zoolog. Sci.
Sambrook, J., Russell, D.W., 2001. Molecular Cloning: A Laboratory Manual. 3
th
ed.
Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY.
bel, T., 2004. Spider silks: recombinant synthesis, assembly, spinning, and
engineering of synthetic proteins.
Scheller J., Conrad U. 2005. Plant-based material, protein and biodegradable plastic.
Curr. Opin. Plan.t Biol. 8, 188-96.
Devonian of New York, and reinterpretation of Devonian Araneae. Paleontology
34, 241-245.
Z., Young, R.J., Vollrath, F., 1999. The effect of solvents on sp
mechanical testing and single-fibre Raman spectroscopy. Int. J. Biol. Macromol.
24, 295-300.
Shear, W.A., Palmer, J.A., Coddington, J.A., Bonamo, P.M., 1989. A Devonian
spinneret: early evidence of spiders and silk use. Science 246, 479-481.
Smith, D.M., Smith, A., Hayashi, C.Y., Lewis, R.V., 2005. Analysis of the conserved N-
terminal domains in ampolada principal spider silk proteins. Biomacromolecules 6,
3152-3159.
Sponner, A., Unger, E., Grosse, F., Weisshart, K., 2004. Conserved C-termini of
Spidroínas are secreted by the ampolada principal glands and retained in the silk
thread. Biomacromolecules 5, 840-8
Spooner, A., Vater, W., Rommerskirch, W., Vollrath, F., Unger, E., Grosse, F.,
Weisshart, K., 2005. The conserved C-termini contribute to the properties of spider
silk fibroins. Biochem. Biophys. Res. Commun.338, 897-9
74
Stauffer, S.L., Coguill, S.L., Lewis, R.V., 1994. Comparison of physical properties of
three silks from Nephila clavipes and Araneus gemmoides. J. Arachnol.22, 2437-
Stoth
sequences. Biotechniques 28, 1102-1104.
Tai, P.L., Hwang, G.Y., Tso, I.M., 2004. Inter-specific sequence conservation and intra-
nthetic Poly(X-Gly-Gly). Chirality 3, 318-323.
Tatham, A.S., Shewry, P.R., 2000. Elastomeric Proteins: Biological roles, Structures and
Mechanisms. Trends Biochem. Sci. 25, 567-571.
Thiel, B. L., Guess, K. B., Viney, C., 1997. Non-periodic lattice crystals in the
hierarchical microstructure of spider (ampolada principal) silk. Biopolymers 41,
703-719.
2446.
ard, P., 2000. The sequence manipulation suite: JavaScript programs for analyzing
and formatting protein and DNA
Swanson, B.O., Blackledge, T.A., Beltan, J., Hayashi, C.Y., 2006. Variation in the
Material Properties of Spider Dragline Silk Across Species. Appl. Phys. A 82, 213-
218.
Swofford, D.L., 2002. PAUP* version 4.0b10. Sinauer Associates, Sunderland, Mass.
individual sequence variation in a spider silk gene. Int. J. Biol. Macromol. 34, 295-
301.
Tamburro, A.M., Guantieri, V., Scopa, A., Drabble, J.M., 1991. Polypeptide Models of
Elastin: CD and NMR Studies on Sy
Telles, G.P., Braga, M.D.V., Dias, Z., Lin, T.Z., Quitzau, J.A.A., da Silva, F.R.,
Meidanis, J., 2001. Bioinformatics of the sugarcane EST project. Genet. Mol. Biol.
24, 8-15.
Telles, G.P., da Silva, F.L., 2001. Trimming and clustering sugarcane ESTs. Genet. Mol.
Biol. 24, 17-23.
Termonia, Y. 1994. Molecular Modeling of Spider Silk Elasticity. Macromolecules 27,
7378-7381.
Thompson, J.D., Higgins, D.G., Gibson, T.J., 1994. CLUSTAL W: improving the
sensitivity of progressive multiple sequence alignment through sequence weighting,
75
position-specific gap penalties and weight matrix choice. Nucleic Acids Res. 22,
4673-4680.
Tian, M., Lewis, R.V., 2005. Molecular characterization and evolutionary study of spider
Tian, s from
Tillin
of orb web hygroscopicity and adhesive spiral composition in three araneid
Urry,
on and pathology. Ciba Found Symp. 192, 4-22; discussion 22-30.
23, 543-559.
van Beek, J.D., Hess, S., Vollrath, F., Meier, B.H., 2002. The molecular structure of
spider dragline silk: folding and orientation of the protein backbone. Proc. Natl.
Vollr
Vollrath, F., 1994. General Properties of some spider silks. In: Kaplan, D., Adams, W.w.,
, Washington, DC.
Vollrath, F., Barth, P., Basedow, A., Engstrom, W., List, H., 2002. Local tolerance to
spider silks and protein polymers in vivo. In Vivo 16, 229-34.
Vollrath, F., Edmonds, D., 1989. Modulation of the mechanical properties of spider silk
coating with water. Nature 34, 305-307.
Vollrath, F., Knight, D., 1999. Structure and function of the silk production pathway in
Vollr
548.
tubuliform eggcase silk protein. Biochemistry 44, 8006-8012.
M., Liu, C., Lewis, R.V., 2004. Analysis of ampolada principal silk cDNA
two non-orb-weaving spiders. Biomacromolecules 5, 657-660.
ghast, E.K., Townley, M.A., Bernstein, D.T., Gallagher, K.S., 1991. Comparative
study
spiders. J. Exp. Zool. 25, 154-165.
Toner, M., 1992. Spin Doctor. Discover. May: 32-36.
D.W., Luan, C.H., Peng, S.Q., 1995. Molecular biophysics of elastin structure,
functi
Urry, D.W., Parker, T.M., 2002. Mechanics of Elastin: Molecular Mechanism of
Biological Elasticity and its Relationship to Contraction. J Muscle Res Cell Motil.
Acad. Sci. USA 99, 10266-10271.
ath, F., 1992. Spider web and silks. Sci. Am. 266, 70-76
farmer, B., Viney, C. Silk polymers materials science and biotechnology. American
chemical Society
Vollrath, F., 2005. Spider’s web. Curr. Biol. 15, R364-5.
the spider Nephila edulis. Int. J. Biol. Macromol. 24, 243-249.
ath, F., Knight, D., 2001. Liquid crystalline spinning of spider silk. Nature 410, 541-
76
Wink
eidae). J. Arachnol.
Xu, M
.
NA variation of two black widow
ler, S., Kaplan, D.L., 2000. Molecular biology of spider silk. J. Biotechnol. 74, 85-
93.
Wirth, E., Barth, F.G., 1992. Forces in the Spider Orb Web. J.Comp.Physio.l A. 171, 359-
371.
Work, R.W., 1985. Viscoelastic behavior and wet supercontraction of ampolada principal
silk fibers of certain orb-web-building spiders (Araneae, Aran
15, 65-80.
., Lewis, R.V., 1990. Structure of a protein superfiber: spider dragline silk. Proc.
Natl. Acad. Sci. USA 87, 7120-7124
Zhang, D., Cook, W.D., Horner, N.V., 2004. ITS2 rD
species, Lactrodectus mactans and Lactrodectus hesperus (Araneae, Theridiidae).
J. Arachnol. 32, 349-352.
77
ANEXO 1
s N. cruentata e A. juruensis foram coletadas nas regiões nativas da
(Mon ' 31"), no Brasil respectivamente. As aranhas
sericí
foi co aranhas A. juruensis por sua vez, são caranguejeiras
(aranhas arborículas) e possuem apenas uma ou duas glândulas produtoras de seda
indiferenciadas. As glândulas sericígenas foram isoladas sob um estereomicroscópio e,
imediatamente, congeladas em nitrogênio líquido. Após pulverização, a extração de RNA
total foi realizada usando o reagente TRIZOL (Invitrogen, EUA) seguindo as
recomendações do fabricante. O rendimento, pureza e a integridade do RNA total foram
determinados pela medição da absorbância em 260/280 nm e por meio de eletroforese em
gel de agarose. O kit Oligotex (Qiagen, Alemanha) foi usado para a purificação de
mRNA de acordo com o manual técnico, e a concentração e pureza do mRNA isolado
também foram determinadas através da absorbância (260/280 nm).
Construção das bibliotecas de cDNA
As bibliotecas de cDNA foram construídas utilizando o kit "SUPERSCRIPT II
Plasmid System with GATEWAY Technology" (Invitrogen, EUA.), de acordo com as
instruções do fabricante. Após a transformação de Escherichia coli DH5α utilizando a
eletroporação (Sambrook e Russell, 2001), as bibliotecas foram cultivadas em placas com
meio seletivo e os clones positivos para inserção de cDNA foram escolhidos e
transferidos para placas de 96 poços. Os plasmídeos foram usados para seqüenciamento
após a sua extração das bactérias por lise alcalina (Sambrook e Russell, 2001) e
Materiais e Métodos
Extração de RNA
As aranha
Floresta Atlântica (São Paulo/SP, 23 º 33' 54" e W 46º 46' 09") e Floresta Amazônica
te Negro/RO S 10 º 17' 40" e W 60 º 19
N. cruentata são orbiculárias e possuem todos os diferentes tipos de glândulas
genas, para a construção da biblioteca de cDNA o RNA total de todas as glândulas
letado em conjunto. As
78
quantificação. As reações de seqüenciamento foram realizadas usando-se para tal o kit
ig Dye (Applied Biosystems, EUA), seguindo as instruções do fabricante, e o
ABI 3700. Os cromatogramas resultantes foram diretamente
ansferidos para um banco de dados central semelhante ao descrito por Telles et al.
amento e análise.
Seleção
aptações secundárias
ara este projeto. Os conjuntos resultantes de seqüências de nucleotídeos foram reunidos
repostas usando-se os programas cap3 (Huang e
adan, 1999) ou phrap (http://www.phrap.org/phredphrap/phrap.html), com qualidade de
base in
B
seqüenciador de DNA
tr
(2001) para process
e análise de seqüências
Potenciais clones positivos foram determinados utilizando BLASTX (Altschul,
1997) através da identificação de seqüências homólogas às regiões repetitiva e C-
terminal. Várias combinações de enzimas de restrição foram usadas para conferir o
tamanho das inserções. Os clones com inserções maiores que 1,5 kb foram tratados com
exonuclease III (kit Erase-a-Base, Promega, EUA.) e usados para seqüenciamento.
Fragmentos dos clones positivos para os cDNAs das espidroínas das glândulas ampolada
principal e flageliforme de N. clavipes foram usados como sondas na análise Southern
Blot (Sambrook e Russell, 2001), por meio de marcação aleatória do iniciador com [α-
32
P] dCTP, para a identificação de novos clones positivos.
O Base calling e quality assignment de bases individuais foram realizados através
do uso de Phred (Ewing e Green, 1998; Ewing et al., 1998). As caudas poli(A)
ribossômicas, seqüências de baixa qualidade, vetor e regiões de adaptadores foram
removidos conforme descrito por Telles e da Silva (2001) com ad
p
em agrupamentos de seqüências sob
M
dividual e parâmetros pré-definidos. Alinhamentos múltiplos de seqüências foram
executados usando ClustalW versão 1.8 (Thompson et al., 1994) com valores pré-
definidos e refinados através de exame. O conjunto de repetições dentro de cada
espidroína foi alinhado, e uma repetição de consenso de aminoácidos foi gerada para cada
proteína traduzida. A análise do uso de codons foi realizada utilizando o software
CodonUsage com o código genético padrão (Stothard, 2000).
79
RT-PCR
A fim de verificar os clones positivos encontrados na biblioteca, o RNA total
da(s) glândula(s) sericígena(s) foi usado como molde para a transcrição reversa.
Superscript II (Invitrogen, EUA) foi utilizado nas reações, seguindo as instruções do
ão em cadeia da polimerase (PCR) foi conduzida usando-se a
A) nas seguintes condições: a desnaturação inicial do
oldel foi ajustada para 2 minutos a 94
o
, os 35 ciclos repetidos foram 30 segundos a 94
o
,
1 minu
TuSp reverse- 5’-ACCAGC
GAGA
fabricante. A análise da reaç
Taq Polimerase (Invitrogen, EU
m
to a 56
o
e 30 segundos a 72
o
, a extensão final foi de 72
o
por 10 minutos. Os
oligonucleotídeos usados foram designados de acordo com a seqüência C-terminal dos
clones positivos de cDNA. Os respectivos primers reverso e direto usados para cada
cDNA da seda de aranha foram, para N. cruentata: MaSp foward- 5’-
TGCAGGTCAAGGTGGATATGGTG-3’, MaSp- 5’-CCTAGAGCTTGGTAAACCGA
TTGAC-3’, MiSp- 5’-CTCTGCGGGTGTAGGTGTTGG-3’, MiSp reverse- 5’-TGCAG
CAGACGAACCAACAGA-3’, Flag Spidroína forward- 5’-GCATATGGAGCTGGTTC
TGGTACAC-3’, Flag Spidroína reverse- 5’-CTTCGAACAGAGTTGGAATATGCAT-
3’, TuSp foward- 5’-CATCTTCCGGCTTAGCATC-3’ and
GCAGTTGC-3’; para A. juruensis: Spidroína 1 forward- 5-’TGTCCGCAGTTT
CTTCCAATGG-3’, Spidroína 1 reverse- 5’-CCACAGCAGCGGAAGTTGAAC-3’,
Spidroína 2 forward- 5’-GGACCAGCACGCCAAGGACC-3’ e Spidroína 1 reverse- 5’-
CGAAGAGCTTGATTTACAGATTGGCC-3’.
Árvore filogenética de N. cruentata
A análise filogenética foi conduzida usando o alinhamento das seqüências de
aminoácidos da região C-terminal realizado em MAFFT (5.8), sob o algoritmo E-INS-i
(mafft --genafpair --maxiterate 1000 input_file > output_file) orientado para a precisão,
conforme implementado no servidor online da Universidade de Kyushu, Japão
(http://align.bmr.kyushu-u.ac.jp/mafft/online/server/
) (Katoh et al., 2005). A análise
filogenética foi executada no grupo de computadores do laboratório do Dr. David
iberles, Universidade de Wyoming. A topologia foi reconstruída usando a probabilidade L
80
máxima como implementada em PHYML (Guindon e Gascuel, 2003), utilizando o
modelo Blosum 62 de evolução das proteínas. Os valores não paramétricos bootstrap
(método de simulação) foram avaliados com 1000 réplicas bootstrap.
Coleta da fibra ampolada principal de N. cruentata
As aranhas N. cruentata (N1 e N2) foram anestesiadas com dióxido de carbono,
imobilizadas numa superfície plastica com pedaços de fita adesiva com as fiandeiras
voltadas para cima. A fibra ampolada principal foi identificada a partir da localização da
espinereta anterior sob um estereomicroscópio. Dez amostras com aproximadamente 5
cm de comprimento foram coletadas de cada aranha, e montadas num cartão para análise
mecânica como descrito anteriormente (Stauffer et al., 1994).
Medida do diâmetro da fibra
As fibras foram analisadas utilizando o microscópio Nikon Eclipse E200
equipado com uma câmera fotográfica. Cada fibra foi observada num aumento de 800X
e visualizadas por meio do programa SPOT Basic. Os diâmetros foram medidos usando o
programa ImageJ versão 1.32 (http://rsb.info.nih.gov/ij/
), os valores finais foram
determininados pela média de cinco medidas tomadas ao longo da fibra.
Testes mecânicos
Cada fibra foi testada por meio do aparelho MTS (Sistema Mecânico de Prova)
Synerg
ie 100 usando uma célula com 10g de carga. A fibra foi esticada com uma
velocidade de 2 mm/min, e cada ponto analisado foi coletado num índice de 35 Hz. Os
dados foram coletados usando Testworks 4 software (Corporação de Sistemas de MTS,
Cary, NC) e curvas de tensão-tração foram construídas usando Microsoft Office Excel
2003. As seguintes equações foram usadas para calcular valores de engenharia de tensão,
tração, e rigidez:
σ
eng
(tensão)=F/A, onde F é a força aplicada e A é a área do corte transversal da fibra.
81
ε
eng
(tração)=L/L
0
, onde L é a mudança de comprimento da fibra e L
0
é o comprimento
inicial.
Y (rigidez ou modulo de young)= σ/ ε
As seguintes equações foram usadas para calcular valores reais de tensão e tração:
tr
(tração)= ln (1 + ε
eng)
contato e imagens de
odulação de força também foram obtidas. O equipamento utilizado foi um
tômica Shimadzu SPM-9600 com um scanner
presentando dimensão de varredura máxima de 125 µm x 125 µm. Ponteiras
de ni
de varredura
ncluindo traço-retraço e variações de ângulo da amostra) foram
esma região no intuito de confirmar que nenhuma alteração
orfológica estivesse ocorrendo durante o procedimento de análise. As
imagen
de
σ
tr
(tensão)= σ
eng
(1 + ε
eng
)
ε
Microscopia de força atômica
As fibras de teia de aranha avaliadas por meio de microscopia de força
atômica foram diretamente enroladas na superfície de grafite. O
microscópio de força atômica foi operado no modo
m
microscópio de força a
a
treto de silício (Si3N4) piramidais com uma constante de mola de
aproximadamente 0,032 N/m foram utilizadas. A força aplicada e a
velocidade de varredura nas amostras durante o procedimento foram
determinados nunca excedendo 10 nN. A resolução adotada foi de 512 x 512
linhas a uma freqüência de 1 Hz. Repetidos procedimentos
(i
realizados na m
m
s foram processadas e as características nanoestruturais foram
aferidas utilizando os softwares de aquisição e análise que acompanham
os equipamentos.
Análise filogenética de A. juruensis, mapeamento de caracteres e reconciliação da
árvore
As seqüências de nucleotídeo da região C-terminal de 77 genes de seda a partir
82
35 espécies de aranhas foram baixadas do GenBank ou estraídas da literatura. Essas
seqüências incluíram todas as proteínas distintas conhecidas funcionalmente: a)
de teia orbicular), b) ampolada principal 1+2
ura de
iSp, espiral temporária), e) tubuliforme
onalmente indeterminada (por exemplo, "fibroínas"). Todas as
8 seqüências (76 + 2 x Avicularia) foram traduzidas em suas respectivas seqüências de
do-se o algoritmo G-Ins-i orientado para a precisão, que
tiliza as informações globais de alinhamento informação de alinhamento formado em
pares,
oram descartados como debug. As probabilidades posteriores de 95%
ram consideradas como apoiadoras da relação topológica. Consistente com o trabalho
1 da Euagrus chisoseus e para a Espidroína 1 da seda da aranha Avicularia
lomorfas, irmãs das araneomorfas).
flageliforme (Flag, espiral de captura
(MaSp, linha de moldura e segurança), c) Aciniforme (AcSp, teia de esperma, capt
presas, decoração), d) Ampolada secundária (M
(TuSp, casulo), e f) funci
7
aminoácidos, e alinhadas usan
u
conforme implementado em MAFFT 5.861 (desvantagem de abertura de lacuna
(gap open penalty) = 3) (Katoh et al., 2005). As seqüências foram então novamente
traduzidas para seus respectivos alinhamentos de nucleotídeos (documento de biopython
(módulo de python para Biologia Molecular), e submetidas à análise filogenética por
meio das abordagens de Máxima Parcimônia (MP), Probabilidade Máxima (ML) (PAUP*
v4.0b10, Swofford, 2002), e abordagem bayesiana com MCMC (MrBayes v.3.1.2,
Huelsenbeck e Ronquist, 2001). As pesquisas heurísticas de MP foram conduzidas com
branch swapping do tipo TBR e 10.000 adições de seqüências aleatórias (RSA), as
lacunas foram tratadas como o 5
°
estado. A análise de ML foi realizada usando-se o
modelo de melhor ajuste de evolução conforme estimado pelo Modeltest v3.7 (AIC
Criterion, Posada e Buckley, 2004), combinado com 100 réplicas de RSA (algoritmo de
encriptação de dados). O suporte bootstrap foi avaliado através de 1000 pseudo-
réplicas/100 RSA, e 100 pseudo-réplicas/1 RSA para MP e ML, respectivamente. A
análise bayesiana incluiu três execuções independentes a 3x10
6
gerações, cada uma com
quatro cadeias (temperatura: 0.15), e árvores aleatórias de partida; a freqüência da
amostragem foi 1000. Os pontos de amostra antes de atingirem o patamar de contagens
de probabilidade f
fo
anterior (Garb e Hayashi, 2005; Challis et al., 2006), as árvores foram enraizadas para a
Fibroína
juruensis (miga
Para localizar a presença [1] ou ausência [0] de sedas da ampolada principal (1
83
e/ou 2) em uma árvore da espécie, as topologias das aranhas foram construídas no
MacClade 4.08 (Maddison e Maddison, 2006). Nossa amostragem das aranhas
migalomorfas incorpora três famílias: Dipluridae (Euagrus chisoseus), Hexathelidae
(Macrothele holsti), ambas comumente denominadas como aranhas de teia de folhas, teia
de funil ou teia de cortina, e a Theraphosidae (Avicularia juruensis). A recente pesquisa
filogenética mostrou que a Dipluridae e a Hexathelidae fazem parte de um agrupamento
parafilético na base do clado das não Atypidae (Hedin e Bond, 2006; Ayoub et al., 2007),
enquanto que as Theraphosidae são monofiléticas e derivadas. Por conseguinte, sob nosso
cenário de três táxons, relações dipluridae-hexathelidae foram invocadas como o grupo-
irmão para a Avicularia na árvore das espécies. A localização seguiu a otimização
ACCTRAN e DELTRAN.
A fim de avaliar a contribuição relativa de duplicações de gene, e suas
colocações topológicas contra os eventos de especiação por toda a evolução de sedas de
aranhas, a reconciliação de árvores de genes com base nas regiões C-terminais com
árvores de espécies de aranhas e baseada nas recentes filogenias de aranhas (Hedin e
Bond, 2006; Ayoub et al., 2007) foi conduzida em NOTUNG v.2.1. (Durand et al.,
2006). Apenas os táxons representados através das regiões C-terminais das aranhas foram
incluídos. Os pesos limites foram atribuídos pelos valores bootstrap de ML, o custo de
duplicação foi ajustado para 2.0, e o custo de perda para 0.5. O programa também foi
usado para testar o enraizamento otimizando o número de duplicação e perdas sob
diferentes cenários de raízes, e para avaliar o menor limite de duplicação.
84
ANEXO 2
Seqüências de cDNA das espidroínas de N. cruentata
Seqüência do cDNA parcial de NCFlag-like
1 GCGGGAGGTTCAGGTGGAACAACAGTCATAGAAGATTTGGACATAACAGTTAATGGTCCA
1 A G G S G G T T V I E D L D I T V N G P
61 GGAGGCCCGATAACAATCTCAGAAGAGCTAACAATTGGTGGTCCAGGTGCTGGAGGTTCA
21 G G P I T I S E E L T I G G P G A G G S
121 GGACCTGGTGGTGCTGGACCAGGAGGCGCAGGACCCGGTGGTGCAGGACCAGGAGGCGCA
41 G P G G A G P G G A G P G G A G P G G A
101 P Y G P G G A Y G P G G P G G P G G P G
361 GGACCCGGTTCTGGCGGACCTTACGGACCTGGTGGTGCTTACGGACCTGGTGGTGCTTAC
541 CCAGGTGGTGCTGGTGGACCTTATGGACCAGGAGGTGCTGGACCTGGCGGATACGGACCT
181 P G G A G G P Y G P G G A G P G G Y G P
601 GGAGGCGCTGGACCTGGTGGATACGGACCTGGCGGTTCTGGACCTGGAGGCGCTGGACCT
201 G G A G P G G Y G P G G S G P G G A G P
661 GGTGGATACGGACCTGGCGGTTCTGGACCTGGTGGTGCTGGACCCGGTGGATATGGACCT
221 G G Y G P G G S G P G G A G P G G Y G P
721 GGTGGTGCTGGACCCGGTGGATACGGACCTGGTGGTGCTGGACCTGGCGGTGCTGGACCT
241 G G A G P G G Y G P G G A G P G G A G P
781 GGTGGTGCTGGTCCTGGTGGATACGGACCTGGCGGTTCTGGACCAGGTGGTCCTGGATCT
261 G G A G P G G Y G P G G S G P G G P G S
841 GGTGGCCCAGGCGGAGCGGGAGGTTCAGGTGGAACAACAGTCATAGAAGATTTGGACATA
281 G G P G G A G G S G G T T V I E D L D I
901 ACAGTTAATGGTCCAGGAGGCCCGATAACAATCTCAGAAGAGCTAACAGTTGGTGGTCCA
181 GGACCTGGTGGTGCAGGACCAGGAGGAGTAGGACCTGGTGGTGCTGGAGGCCCTGGTGGT
61 G P G G A G P G G V G P G G A G G P G G
241 GCTGGAGGACCTTTCGGTCCAGGTGGTTCCGGACCCGGAGGTGCAGGCGGCGCTGGAGGA
81 A G G P F G P G G S G P G G A G G A G G
301 CCTTATGGACCTGGTGGAGCTTACGGACCTGGTGGACCTGGAGGGCCTGGTGGTCCTGGA
121 G P G S G G P Y G P G G A Y G P G G A Y
421 GGACCTGGTGGTGCTTATGGTCCTGGTGGAGCTGGTGGACCAGGTGGAGCTGGTGGACCA
141 G P G G A Y G P G G A G G P G G A G G P
481 TATGGACCCGGTGGACCTTACGGACCAGGTGGTCCATACGGACCTGGTGGAGCTGGTGGA
161 Y G P G G P Y G P G G P Y G P G G A G G
85
301 T V N G P G G P I T I S E E L T V G G P
961 GGTGCTGGAGGTTCAGGACCTGGTGGTGCTGGACCAGGAGGCGCAGGACCCGGTGGTGCA
G G A G P G G A
021 GGACCAGGAGGAGTAGGACCTGGTGGTGCTGGAGGCCCTGGTGGTGCTGGAGGACCTTTC
A G G P G G A G G P F
081 GGTCCAGGTGGTTCCGGACCCGGAGGTGCAGGCGGCGCTGGAGGACCTTATGGACCTGGT
61 G P G G S G P G G A G G A G G P Y G P G
321 G A G G S G P G G A G P
1
341 G P G G V G P G G
1
3
1141 GGAGCTTACGGACCTGGTGGACCTGGAGGGCCTGGTGGTCCTGGAGGACCCGGTTCTGGC
81 G A Y G P G G P G G P G G P G G P G S G 3
1201 GGACCTTACGGACCTGGTGGTGCTTACGGACCTGGTGGTGCTTACGGACCTGGTGGTGCT
01 G P Y G P G G A Y G P G G A Y G P G G A 4
1261 TATGGACCTGGTGGAGCTGGTGGACCATATGGACCCGGTGGACCTTACGGACCAGGTGGT
21 Y G P G G A G G P Y G P G G P Y G P G G 4
1321 CCATACGGACCTGGTGGAGCTGGTGGACCAGGTGGTGCTGGTGGACCTTATGGACCAGGA
41 P Y G P G G A G G P G G A G G P Y G P G 4
1381 GGTGCTGGACCTGGCGGATACGGACCTGGAGGCGCTGGACCTGGTGGATACGGACCTGGC
61 G A G P G G Y G P G G A G P G G Y G P G 4
1441 GGTTCTGGACCTGGAGGCGCTGGACCTGGTGGATACGGACCTGGCGGTTCTGGACCTGGT
81 G S G P G G A G P G G Y G P G G S G P G 4
1501 GGTGCTGGACCCGGTGGATATGGACCTGGTGGTGCTGGACCCGGTGGATACGGACCTGGT
01 G A G P G G Y G P G G A G P G G Y G P G 5
1561 GGTGCTGGACCTGGCGGTGCTGGACCTGGTGGTGCTGGTCCTGGTGGATACGGACCTGGC
21 G A G P G G A G P G G A G P G G Y G P G 5
1621 GGTTCTGGACCAGGTGGTCCTGGATCTGGTGGCCCAGGCGGAGCGGGAGGTTCAGGTGGA
41 G S G P G G P G S G G P G G A G G S G G 5
1681 ACAACAGTCATAGAAGATTTGGACATAACAGTTAATGGTCCAGGAGGCCCGATAACAATC
61 T T V I E D L D I T V N G P G G P I T I 5
1741 TCAGAAGAGCTAACAGTTGGTGGTCCAGGTGCTGGAGGTTCAGGACCTGGTGGTGCTGGA
81 S E E L T V G G P G A G G S G P G G A G 5
1801 CCAGGAGGCGCAGGACCCGGTGGTGCAGGACCAGGAGGCGCAGGACCTGGTGGTGCAGGA
01 P G G A G P G G A G P G G A G P G G A G 6
1861 CCAGGAGGAGTAGGACCTGGTGGTGCTGGAGGCCCTGGTGGTGCTGGAGGACCTTTCGGT
21 P G G V G P G G A G G P G G A G G P F G 6
1921 CCAGGTGGTTCCGGACCCGGAGGTGCAGGCGGCGCTGGAGGACCTTATGGACCTGGTGGA
41 P G G S G P G G A G G A G G P Y G P G G 6
1981 GCTTACGGACCAGGTGGACCCGGAGGACCTGGAGGGCCTGGTGGTCCTGGAGGACCCGGT
61 A Y G P G G P G G P G G P G G P G G P G 6
2041 TCTGGCGGACCTTACGGACCTGGTGGTGCTTACGGACCTGGTGGTGCTTACGGACCTGGT
86
681 S G G P Y G P G G A Y G P G G A Y G P G
2101 GGTGCTTATGGACCTGGTGGAGCTGGTGGACCAGGTGGAGCTGCTGGACCATATGGACCC
701 G A Y G P G G A G G P G G A A G P Y G P
2161 GGTGGACCTTACGGACCAGGTGGTCCATACGGACCTGGTGGAGCTGGTGGACCAGGTGGT
721 G G P Y G P G G P Y G P G G A G G P G G
2221 GCTGGTGGACCTTATGGACCAGGAGGTGCTGGACCTGGCGGATACGGACCTGGAGGCGCT
741 A G G P Y G P G G A G P G G Y G P G G A
2281 GGACCTGGTGGATACGGACCTGGCGGTTCTGGACCTGGAGGCGCTGGACCTGGTGGATAC
761 G P G G Y G P G G S G P G G A G P G G Y
2341 GGACCTGGCGGTTCTGGACCTGGTGGTGCTGGACCCGGTGGATATGGACCTGGTGGTGCT
781 G P G G S G P G G A G P G G Y G P G G A
2401 GGACCCGGTGGATACGGACCTGGTGGTGCTGGACCTGGCGGTGCTGGACCTGGTGGTGCT
801 G P G G Y G P G G A G P G G A G P G G A
2461 GGTCCTGGTGGATACGGACCTGGCGGTTCTGGACCAGGTGGTCCTGGATCTGGTGGCCCA
821 G P G G Y G P G G S G P G G P G S G G P
2521 GGCGGAGCGGGAGGTTCAGGTGGAACAACAGTAATAGAAGATTTGGACATAACACTTAAT
841 G G A G G S G G T T V I E D L D I T L N
2581 GGTCCAGGAGGCCCGATAACAATCTCAGAAGAGCTAACAGTTGGTGGTCCAGGTGCTGGA
861 G P G G P I T I S E E L T V G G P G A G
2641 GGTTCAGGACCTGGTGGTGCTGGACCAGGAGGCGCAGGACCCGGTGGTGCAGGACCAGGA
881 G S G P G G A G P G G A G P G G A G P G
2701 GGCGCAGGACCAGGAGGAGTAGGACCTGGTGGTGCTGGAGGACCTTATGGTTCTGGTGGT
901 G A G P G G V G P G G A G G P Y G S G G
2761 TTCGGATTCGGAGGTGCAGGCGGCTCTGGAGGACCTTATGTACCTGGTGGAGCATATGGA
921 F G F G G A G G S G G P Y V P G G A Y G
2821 GCTGGTTCTGGTACACCATCTTATAGTGGATCTCGTGTTCCTGATTTGGTGAATGGTATA
941 A G S G T P S Y S G S R V P D L V N G I
2881 ATGCGTTCGATGCAAGGCTCTGGTTTCAACTATCAAATGTTTGGCAACATGTTATCGAAA
961 M R S M Q G S G F N Y Q M F G N M L S K
2941 TATGCCTCCGGATCAGGTGCATGCAATTCAAATGATGTTAATGTTTTAATGGATGCTCTT
981 Y A S G S G A C N S N D V N V L M D A L
3001 CTTGCGGCTTTGCACTGTCTCAGTAGCCATGGATCCCCATCATTTGGGTCTTCTCCAACC
1001 L A A L H C L S S H G S P S F G S S P T
3061 CCTTCTGCAATGAATGCATATTCCAACTCTGTTCGAAGAATGTTCCAATTCTAAGGTTAT
1021 P S A M N A Y S N S V R R M F Q F * G Y
3121 ACTCCTTTAAACTTGAATTTATTTTCAAATCATTTTGATGAACCTTAGTTACTCATTTGA
1041 T P L N L N L F S N H F D E P * L L I *
3181 AGAAAAAAATAAATATCTTTTTAGCAGAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
87
1061 R K K * I S F * Q K K K K K K K K K K K
3241 AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
1081 K K K K K K K K K K K K
Seqüência do cDNA parcial de NCMaSp-like
1 CAAGGTGCCGGAGCAGCAGCAGCAGCAGCAGCCGCAGGTGGAGCTGGACAAGGCGGATAT
1 Q G A G A A A A A A A A G G A G Q G G Y
1 GGAGGTCTTGGTGGCCAAGGAGCTGGAGCCGCAGCTGCAGCAGCTGGTGGTGCTGGACAA 6
21 G G L G G Q G A G A A A A A A G G A G Q
21 GGAGGATATGGAGGTCAAGGTGCTGGACAAGGTGCAGCCGCAGCAGCAGCTAGTGGTGCC 1
41 G G Y G G Q G A G Q G A A A A A A S G A
81 GGACAAGGAGGATATGAAGGTCCAGGTGCCGGACAAGGTGCAGGTGCAGCCGCAGCAGCA 1
61 G Q G G Y E G P G A G Q G A G A A A A A
41 GCTGGTGGTGCCGGACAAGGAGGATATGGAGGTCTTGGTGGCCAAGGAGCTGGACAAGGA 2
81 A G G A G Q G G Y G G L G G Q G A G Q G
01 GCTGGAGCCGCAGCTGCAGCAGCTGGTGGTGCCGGACAAGGAGGATATGGAGGTCTTGGT 3
101 A G A A A A A A G G A G Q G G Y G G L G
61 GGCCAAGGAGCTGGACAAGGAGCTGGAGCCGCAGCTGCAGCAGCTGGTGGTGCCGGACAA 3
121 G Q G A G Q G A G A A A A A A G G A G Q
21 GGAGGATATGGAGGTCAAGGTGCTGGACAAGGTGCAGCAGCAGCAGCAGCTGGTGGTGCT 4
141 G G Y G G Q G A G Q G A A A A A A G G A
81 GGACAAGGAGGATATGGAGGCCTAGGTTCTGGACAAGGCGGATATGGTAGACAAGGTGCC 4
161 G Q G G Y G G L G S G Q G G Y G R Q G A
41 GGAGCAGCAGCAGCAGCAGCAGCCGCAGGTGGAGCTGGACAAGGCGGATATGGAGGTCTT 5
181 G A A A A A A A A G G A G Q G G Y G G L
01 GGTGGCCAAGGAGCTGGAGCCGCAGCTGCAGCAGCTGGTGGTGCTGGACAAGGAGGATAT 6
201 G G Q G A G A A A A A A G G A G Q G G Y
61 GGAGGTCAAGGTGCTGGACAAGGTGCAGCCGCAGCAGCAGCTAGTGGTGCCGGACAAGGA 6
221 G G Q G A G Q G A A A A A A S G A G Q G
21 GGATATGGAGGTCCAGGTGCCGGACAAGGTGCAGGTGCAGCCGCAGCAGCAGCTGGTGGT 7
241 G Y G G P G A G Q G A G A A A A A A G G
81 GCCGGACAAGGAGGATATGGAGGTCTTGGTGGCCAAGGAGCTGGACAAGGAGCTGGAGCC 7
261 A G Q G G Y G G L G G Q G A G Q G A G A
41 GCAGCTGCAGCAGCTGGTGGTGCCGGACAAGGAGGATATGGAGGTCAAGGTGCTGGACAA 8
281 A A A A A G G A G Q G G Y G G Q G A G Q
01 GGTGCAGCAGCAGCAGCAGCTGGTGGTGCCGGACAAGGAGGATATGGAGGCCTAGGTTCT 9
301 G A A A A A A G G A G Q G G Y G G L G S
88
961 GGACAAGGCGGATATGGTGGACAAGGTGCCGGAGCAGCAGCAGCCGCAGGTGGAGCTGGA
A A A G G A G
21 CAAGGCGGATATGGAGGTCTTGGTGGCCAAGGAGCTGGACAAGGTGCTGGAGCCGCAGCT
1 Q G G Y G G L G G Q G A G Q G A G A A A
081 GCAGCTGCTGGTGGTTCCGGAAGAGGAGGATATGGAAGTCAAGGTGCTGGACAAGGAGCA
61 A A A G G S G R G G Y G S Q G A G Q G A
lone 11H11
321 G Q G G Y G G Q G A G A A
10
34
1
3
1141 GCAGCAGCAGCAGCTGGTGGTGCAGGTCAAGGTGGATATGGTGGTGCAGGTTCTGGAGCT
81 A A A A A G G A G Q G G Y G G A G S G A 3
1201 GCTGCGGCCTCTGCAGCTGCTTCCCGTTTGTCTTCTCCTGAAGCTAGTTCGAGAGTTTCA
01 A A A S A A A S R L S S P E A S S R V S 4
1261 TCTGCAGTTTCTAATTTGGTTTCAAGTGGTCCTACTAATTCGGCTGCCTTGTCGAATACC
21 S A V S N L V S S G P T N S A A L S N T 4
1321 ATCAGTAGTGTTGTCTCCCAAATTAGCGCAAGCAATCCTGGTCTCTCTGGATGTGATGTC
41 I S S V V S Q I S A S N P G L S G C D V 4
1381 CTTGTTCAAGCTCTTTTGGAAGTCGTTTCTGCTCTTATCCATATTTTGGGATCTTCTAGC
61 L V Q A L L E V V S A L I H I L G S S S 4
1441 ATCGGCCCAGTTAACTATGGCTCAGCTAGCCAATCCACTCAAATCGTTGGTCAATCGGTT
81 I G P V N Y G S A S Q S T Q I V G Q S V 4
1501 TACCAAGCTCTAGGTTAATTATGAAATCAAATTTCCTCAAAATTATTTTGATAGAATTAC
01 Y Q A L G * L * N Q I S S K L F * * N Y 5
1561 TAAGTTTTTGTAATAATTTTGTAAAATTGGTTTTCAATAAATAGTATGCATATNANAAAA
21 * V F V I I L * N W F S I N S M H X X K 5
1621 AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
41 K K K K K K K K K K K K K K K K K K K K 5
1681 AAAAAAAAAAAAAAAAAA
61 K K K K K K 5
Seqüência do cDNA parcial de NCMiSp-like
C
1 GCTGGTGGTGCTGGAGGATATGGCGTTGGACAAGGCTATGGTGCAGGTGCAGGAGCTGGG
1 A G G A G G Y G V G Q G Y G A G A G A G
61 GCTGCCGCCGGTGCAGGAGCTGGTGGTGCTGGAGGATATGGCGCTGGACAAGGCTATGGT
21 A A A G A G A G G A G G Y G A G Q G Y G
121 GCAGGTGCAGGAGTTGGTGCTGCCGCCGCTGCTGGAGCAGGTGCAGGAGTTGGTGGTGCT
41 A G A G V G A A A A A G A G A G V G G A
89
181 GGAGGTTACGGAAGAGGTGCTGGAGCCGGAGCTGGAGCTGGAGCTGGAGCTGCTGCCGGA
1 GCTGGAGCTGGAGCTGCTGCTGGAGCAGGAGCTGGTGGTGCTGGAGGATATGGCGCTGGA
1 CAAGGCTATGGTGCAGGTGCAGGAGTTGGTGCTGCCGCCGCTGCTGGAGCAGGTGCAGGA
1 GTTGGTGGTGCTGGAGGTTACGGAAGAGGTGCTGGAGCTGGAGCTGGTGCTGGTGCTGGT
1 GGTGCAGGAGGTTACGGAAGAGGTGCTGGTGCTGGAGCTGGAGCTGGTGCAGGAGCTGGT
1 GGTGCTGGAGGATATGGCGCTGGACAAGGCTATGGTGCAGGTGCAGGAGCTGGTGCAGCC
1 GCCGCTGCTGGAGCCGGTGCAGGTGCTGGTGGTGCTGGAGGTTACGGAAGAGGTGCTGGT
1 GCTGGAGCTGGAGCTGGTGCAGGAGCTGGTGGTGCTGGAGGATATGGCGCTGGACAAGGC
1 TATGGTGCAGGTGCAGGAGCTGGTGCAGCCGCCGCTGCTGGAGCCGGTGCAGGTGCTGGT
1 GGTGCTGGAGGTTACGGAAGAGGTGCTGGTGCTGGAGCTGGAGCTGGTGCAGGAGCTGGT
1 GGTGCTGGAGGATATGGCGCTGGACAAGGCTATGGTGCAGGTGCAGGAGCTGGTGCAGCC
1 GCCGCTGCTGGAGCCGGTGCAGGTGCTGGTGGTGCTGGAGGTTACGGAAGAGGTGCTGGT
1 GCTGGAGCTGGAGCTGGTGCAGGTGCTGGTGGTGCTGGAGGTTACGGAAGAGGTGCTGGA
G A G G A G G Y G R G A G
61 GCTGGAGCTGGGGCTGGAGCTGCTGCAGGAGCAGGAGCTGGTGGTGCTGGACGATATGGC
321 A G A G A G A A A G A G A G G A G R Y G
021 GCTGGACAAGGCTATGGTGCAGGTGCAGGAGCTGGGGCTGCCGCCGGTGCAGGAGCAGGT
41 A G Q G Y G A G A G A G A A A G A G A G
TGCTGGAGGATATGGCGCTGGACAAGGCTATGGTGCAGGTGCAGGAGCTGGTGCTGCC
61 G A G G Y G A G Q G Y G A G A G A G A A
61 G G Y G R G A G A G A G A G A G A A A G
24
81 A G A G A A A G A G A G G A G G Y G A G
30
101 Q G Y G A G A G V G A A A A A G A G A G
36
121 V G G A G G Y G R G A G A G A G A G A G
42
141 G A G G Y G R G A G A G A G A G A G A G
48
161 G A G G Y G A G Q G Y G A G A G A G A A
54
181 A A A G A G A G A G G A G G Y G R G A G
60
201 A G A G A G A G A G G A G G Y G A G Q G
66
221 Y G A G A G A G A A A A A G A G A G A G
72
241 G A G G Y G R G A G A G A G A G A G A G
78
261 G A G G Y G A G Q G Y G A G A G A G A A
84
281 A A A G A G A G A G G A G G Y G R G A G
90
301 A G A G A G A
9
1
3
1081 GG
3
1141 GCCGCTGCTGGAGCAGGTGCAGGAGTTGGTGGTGCTGGAGGTTACGGAAGTGGTGCTGGA
381 A A A G A G A G V G G A G G Y G S G A G
1201 GCCGGAGCTGGAGCTGGAGCTGGAGCTGCTTCTGGAGCTGCTGCTGGAGCTGCTGCTGGA
401 A G A G A G A G A A S G A A A G A A A G
1261 GCAGGAGCTGGTGGTGCTGGAGGATATGGCACTGGACAAGGCTATGGTGCAGGTGCAGGT
421 A G A G G A G G Y G T G Q G Y G A G A G
90
1321 GCTGGAGCTGGTGCTGGTGCTGGTGGTGCAGGAGGTTACGGAAGAGGTGCTGGAGCTGGA
441 A G A G A G A G G A G G Y G R G A G A G
1381 GCTGGTGCAGGAGCTGGTGGTGCTGGAGGATATGGCGCTGGACAAGGCTATGGTGCAGGT
461 A G A G A G G A G G Y G A G Q G Y G A G
1441 GCAGGAGCTGGTGCAGCCGCCGCTGCTGGAGACGGTGCAGGTGCTGGTGGTGCTGGAGGT
481 A G A G A A A A A G D G A G A G G A G G
1501 TACGGAAGAGGTGCTGGAGCTGGAGCTGGGGCTGGAGCTGCTGCAGGAGCAGGAGCTGGT
501 Y G R G A G A G A G A G A A A G A G A G
1561 GGTGCTGGAGGATATGGCGCTGGACAAGGCTATGGTGCAGGTGCAGGAGCTGGGGCTGCC
521 G A G G Y G A G Q G Y G A G A G A G A A
1621 GCCGGTGCAGGAGCAGGTGGTGCTGGAGGATATGGCGCTGGACAAGGCTATGGTGCAGGT
541 A G A G A G G A G G Y G A G Q G Y G A G
1681 GCAGGAGCTGGTGCTGCCGCCGCTGCTGGAGCAGGTGCAGGAGTTGGTGGTGCTGGAGGT
561 A G A G A A A A A G A G A G V G G A G G
1741 TACGGAAGAGGTGCTGGAGCCGGAGCTGGAGCTGCTGCCGGAGCTGGAGCTGGAGCTGCT
581 Y G R G A G A G A G A A A G A G A G A A
1801 GCTGGAGCAGGAGCTGGTGGTGCTGGAGGATATGGCACTGGACAAGGCTATGGTGCAGGT
601 A G A G A G G A G G Y G T G Q G Y G A G
1861 GCAGGTGCTGGAGCTGGTGCTGGTGGTGCAGGAGGTTACGGAAGAGGTGCTGGTGCTGGA
621 A G A G A G A G G A G G Y G R G A G A G
1921 GCTGGAGCTGGTGCAGGAGCTGGTGGTGCTGGAGAATATGGCGCTGGACAAGGCTATGGT
641 A G A G A G A G G A G E Y G A G Q G Y G
1981 GCAGGTGCAGGAGCTGGTGCAGCCGCCGCTGCTGGAGCCGGTGCAGGTGCTGGAGGTGCT
661 A G A G A G A A A A A G A G A G A G G A
2041 GGAGGTTACGGAAGAGGTGCTGGAGCTGGAGCTGGGGCTGGAGCTGCTGCAGGAGCAGGA
681 G G Y G R G A G A G A G A G A A A G A G
2101 GCTGGTGGTGCTGGAGGATATGGCGCTAGACAAGGCTATGGTGCAGGTGCAGGAGCTGGG
701 A G G A G G Y G A R Q G Y G A G A G A G
2161 GCTGCCGCCGGTGCAGGAGCTGGAGGTGCTGGAGGATATGGCGCTGGACAAGGCTATGGT
721 A A A G A G A G G A G G Y G A G Q G Y G
2221 GCAGGTGCAGGAGCTGGTGCAGCCGCCGCTGCTGGAGCCGGTGCAGGTGCTGGTGGTGCT
741 A G A G A G A A A A A G A G A G A G G A
2281 GGAGGTTACGGAAGAGGTGCTGGAGCTGGAGCTGGAGCTGGGGCTGGAGCTGCTGCAGGA
761 G G Y G R G A G A G A G A G A G A A A G
2341 CAAGGCTATGGTTCAGGTGCAGGTGCTGGAGCTGGTGCCAGTGCTGGTGGTGCAGGAAGT
781 Q G Y G S G A G A G A G A S A G G A G S
2401 TACGGAAGAGGTGCCGGAGCTGGTGCTGCCGCCGCTTCTGGAGCCGGTGCTGGAGGATAT
801 Y G R G A G A G A A A A S G A G A G G Y
91
2461 GGCGCTGGACAAGGCTATGGTGCAGGTGCAGGAGCTGTTGCTTCTGCCGCTGCTGGAGCC
821 G A G Q G Y G A G A G A V A S A A A G A
2521 GGTTCAGGAGCTGGTGGTGCTGGAGGTTACGGAAGAGGTGCCGTTGCTGGTTCTGGAGCT
841 G S G A G G A G G Y G R G A V A G S G A
2581 GGTGCCGGAGCAGGAGCTGGTGGTGCTGGAGGATATGGTGCAGGAGCTGGTGCTGGTGCC
861 G A G A G A G G A G G Y G A G A G A G A
2641 GCTGCTGGAGCAGTTGCTGGTGGTTCTGGAGGATATGGCGGCAGACAAGGCGGTTATAGC
881 A A G A V A G G S G G Y G G R Q G G Y S
2701 GCAGGTGCGGGAGCTGGTGCGGCGGCTGCTGCTGGAGCAGGTGCAGGTGGAACTGGAGGC
901 A G A G A G A A A A A G A G A G G T G G
2761 TACGGAAGAGGTTCTGGTGCTGGAGCCGCAGCTGGTGCTGCTGCTGGAGCTGGTGCTGCT
921 Y G R G S G A G A A A G A A A G A G A A
2821 GGAGGATATGGTGGCTATGGCGCAGGTGCTGGAGCTGGTGCCGGTGGTGCTAGAGGTTAC
941 G G Y G G Y G A G A G A G A G G A R G Y
2881 GGAGGAGGTGCTGGTGCTGGAGCAGGTGCCGCTGCTGGAGGTTATGGAAGAAGAGCAGGT
961 G G G A G A G A G A A A G G Y G R R A G
2941 GGATCCATTGTAGGAACTGGAATAAGTGCAATTTCTTCTGGAACTGGTTCTAGCTATTCC
981 G S I V G T G I S A I S S G T G S S Y S
3001 GTTTCTTCCGGCGGTTACGCCTCTGCGGGTGTAGGTGTTGGATCCACTGTTGCATCTACC
1001 V S S G G Y A S A G V G V G S T V A S T
3061 ACATCTCGTTTGAGTTCAGCACAAGCATCTTCTAGAATATCTGCTGCTGCTTCTACTTTA
1021 T S R L S S A Q A S S R I S A A A S T L
3121 ATATCTGGAGGTTACTTGAATACATCTGCCTTACCATCAGTCATTTCTGATTTGTTTGCC
1041 I S G G Y L N T S A L P S V I S D L F A
3181 CAAGTCAGTGCTTCATCCCCTGGTGTATCAGATAGTGAAGTTTTGATTCAAGTTTTGTTG
1061 Q V S A S S P G V S D S E V L I Q V L L
3241 GAAATTGTTTCTTCCCTTATCCATATTCTCAGTTCTTCCAGTGTAGGGCAAGTTGACTTC
1081 E I V S S L I H I L S S S S V G Q V D F
3301 AATTCTGTTGGTTCGTCTGCTGCAGCTGTTGGACAGTCCATGCAAGTTGTCATGGGTTAA
1101 N S V G S S A A A V G Q S M Q V V M G *
3361 TTAAAATGGCTGTCTCTCCCCAATTAATTCTTTAAATACAGTTAAGCATTTAAAAATAAA
1121 L K W L S L P N * F F K Y S * A F K N K
3421 AAATAATGTAAAATTTTCTGCATAAATAAAAATATTTTCCTGCTTGGAAAAAAAAAAAAA
1141 K * C K I F C I N K N I F L L G K K K K
3481 AAAAA
1161 K
92
Clone 11F12
1 TACGGAAGAGGTGCTGGTGCTGGAGCCGGAGCTGGTGCTGGAGCTGCCGCCGGAGCAGGA
Y G R G A G A G A G A G A G A A A G A G 1
61 GCTGGTGGTGCTGGAGGATATGGCGCTGGACAAGGCTATGGTGCAGGTGCAGGAGCTGGT
1 A G G A G G Y G A G Q G Y G A G A G A G 2
121 GCAGCCGCCGCTGCTGGAGCCGGTGCAGGTGCTGGTGGTGCTGGAGGTTTCGGAAGAGGT
1 A A A A A G A G A G A G G A G G F G R G 4
181 GCTGGTGCTGGAGCCGGAGCTGGTGCTGGAGCTGCCGCCGGAGCAGGAGCTGGTGGTGCT
1 A G A G A G A G A G A A A G A G A G G A 6
241 GGAGGATATGGCGCTGGACAAGGCTATGGTGCAGGTGCAGGAGCTGGTGCAGCCGCCGCT
1 G G Y G A G Q G Y G A G A G A G A A A A 8
301 GCTGGAGCTGGTGCCGGTGCTGGTGGTGCTGGAGGTTACGGAAGAGGTGCTGGTGCTGGA
01 A G A G A G A G G A G G Y G R G A G A G 1
361 GCCGGAGCTGGTGCTGCCGCCGCTGCTGGAGCAGGAGCTGGTGGTGCTGGAGGATATGGC
21 A G A G A A A A A G A G A G G A G G Y G 1
421 GCTGGACAAGGCTATGGTGCAGGTGCAGGAGCTGGTGCTGCCGCCGCTGCTGGAGCCGGT
41 A G Q G Y G A G A G A G A A A A A G A G 1
481 GCAGGAACTGGTGGTGCTGGAGGATATGGTGCAGGACAAGGCTATGGTGCAGGTGCTGGA
61 A G T G G A G G Y G A G Q G Y G A G A G 1
541 GCTGGTGCAGGTGCTGGAGCTGGTGCCGGTGCTGGTGGTGCTGGAGGTTACGGAAGAGGT
81 A G A G A G A G A G A G G A G G Y G R G 1
601 GCTGGTGCTGGAGCTGGGGCCGGAGCAGGAGCTGGTGGTGCTGGAGGATATGGCGTCGGA
01 A G A G A G A G A G A G G A G G Y G V G 2
661 CAAGGCTATGGTGCAGGTGCTGGAGCTGGTGCTGGAGCAGGAAGTGCAGCTGGAAACGCT
21 Q G Y G A G A G A G A G A G S A A G N A 2
721 TTCGCACAATCCCTCTCATCCAATCTCCTCTCATCAGGAGATTTTGTTCAAATGATCTCC
41 F A Q S L S S N L L S S G D F V Q M I S 2
781 ACCACAACTTCTACTGATCAGGCTGTGAGCGTTGCAACGAGCGTTGCTCAAAATGTTGGA
61 T T T S T D Q A V S V A T S V A Q N V G 2
841 AATCAACTTGGCCTCGATGCCAATGCTATGAACAATTTACTGGCTGCTGTTGGTGGGTAT
81 N Q L G L D A N A M N N L L A A V G G Y 2
901 GTTTCATCATTGGGTGGTGCTGTTGCAGATGCTGCAGCTTATGCAAATGCAATATCTTCA
01 V S S L G G A V A D A A A Y A N A I S S 3
TG961 GCTAT
21 A I
GCAATGTTTTAGCTAACACTGGTTCTATTAATGAAAGTACCGCATCTTCCGCT
G N V L A N T G S I N E S T A S S A
021 GCTTCGAGTGCTGCTTCGTCGGTTACAACAACATTGACATCTTATGGGCCAGCCGTATTT
341 A S S A A S S V T T T L T S Y G P A V F
3
1
93
1081 TACGGAAGAGGTGCTGGAGCTGGTGCTGCAGCCGCTGCTGGAGCAGGTGCAGGTGGCGCT
61 Y G R G A G A G A A A A A G A G A G G A
GCAAGCCAGAGCGCTAGCAGCAGCAGTGCTTCGGCCTCTGCATTCGCACAACAGTCCTCT
GCTTCCCTTGCAGCCTCCTCTTCTTTCAGCCAGGCCTTCGCTTCGGCCGCTTCCGCCTCT
1 GCCGTCGGAAACGTTGCTTACCAGCTAGGCTTATCCGCAGCACAATCTCTCGGAATAGCC
1 AATGCTGGAGCACTCGCTAGTGCTTTAGCTCAGTCTGTTTCTTCTGTAGGCGTTGGAGCC
1 AGTTCAAGTGCCTACGCCAATGCAGTCGCCGGTGCCGTTGGACAGTTCTTAGCCAATCAG
1 GGTATTTTGAACACAGGCAATGCATCTTCCCTAGCCTCCTCGTTCTCCAGTGCCCTCTCC
1 GCCTCGGCAGCAGCCGCGCAATCCCAATCATTCGCACAGAGTCAAGCAGCAGCTTCGGCC
1 TTCCAACAAGCAGCATCACAGAGTGCTAGCCAGAGTGCTGCCCAATCTGGTTCTCAGTCC
1 TCTTCCACCACTACCACCACCTCGGCCTCAGGAAGTCAATCCGCAAGCCAGAGCGCTAGC
1 AGCAGCAGTGCTTCGGCCTCTGCATTCGCACAACAGTCCTCTGCTTCCCTTGCAGCCTCC
1 TCTTCTTTCAGCCAGGCCTTCGCTTCGGCCGCTTCCGCCTCTGCCGTCGGAAACGTTGCT
1 TACCAGCTAGGCTTATCCGCAGCACAATCTCTCGGAATAGCCAATGCTGGAGCACTCGCT
1 AGTGCTTTAGCTCAGTCTGTTTCTTCTGTAGGCGTTGGAGCCAGTTCAAGTGCCTACGCC
3
1141 GGAGGATACGGAAGTGGTGCTGGAGCTGGTGGTGCTGGAGGATATGGTGCAGGAGCTGGT
81 G G Y G S G A G A G G A G G Y G A G A G 3
1201 GCTGGTGCGGCTGCTGGAGCAGGAGCTGGTGGTTCTGGAGGATATGGCGGCAGACAAGGT
01 A G A A A G A G A G G S G G Y G G R Q G 4
1261 GGTTATGGCGCAGGTGCTGGAGCTGGTTCC
21 G Y G A G A G A G S 4
Seqüência do cDNA parcial de NCTuSp-like
1
1 A S Q S A S S S S A S A S A F A Q Q S S
61
21 A S L A A S S S F S Q A F A S A A S A S
12
41 A V G N V A Y Q L G L S A A Q S L G I A
18
61 N A G A L A S A L A Q S V S S V G V G A
24
81 S S S A Y A N A V A G A V G Q F L A N Q
30
101 G I L N T G N A S S L A S S F S S A L S
36
121 A S A A A A Q S Q S F A Q S Q A A A S A
42
141 F Q Q A A S Q S A S Q S A A Q S G S Q S
48
161 S S T T T T T S A S G S Q S A S Q S A S
54
181 S S S A S A S A F A Q Q S S A S L A A S
60
201 S S F S Q A F A S A A S A S A V G N V A
66
221 Y Q L G L S A A Q S L G I A N A G A L A
72
241 S A L A Q S V S S V G V G A S S S A Y A
94
781 AATGCAGTCGCCGGTGCCGTTGGACAGTTCTTAGCCAATCAGGGTATTTTGAACACAGGC
1 AATGCATCTTCCCTAGCCTCCTCGTTTTCTAATGCGCTTTCGTCATCCGCCGCTAATTCA
1 GTTGGTTCTGGATTGTTATTGGGTCCTTCACAATACGTTGGAAGTATTGCTCCAAGTATA
1 GGAGGTGCTGCTGGAATATCAATCGCTGGTCCTGGAATTTTATCATACTTACCTCCTGTT
G I L S Y L P P V
021 TCTCCGCTGAATGCACAGATAATCTCCTCTGGTTTACTTGCTTCTTTGGCACCAGTATTA
341 S P L N A Q I I S S G L L A S L A P V L
081 TCATCTTCCGGCTTAGCATCATCCAGTGCGACTTCTAGAGTTGGCAGTTTAGCTCAATCT
61 S S S G L A S S S A T S R V G S L A Q S
261 N A V A G A V G Q F L A N Q G I L N T G
84
281 N A S S L A S S F S N A L S S S A A N S
90
301 V G S G L L L G P S Q Y V G S I A P S I
96
321 G G A A G I S I A G P
1
1
3
1141 TTGGCATCCGCATTGCAATCTTCGGGAGGTACACTGGATGTTTCGACCTTCTTGAATCTT
81 L A S A L Q S S G G T L D V S T F L N L 3
1201 CTGTCTCCCATTTCTACACAAATTCAAGCCAATACTTCTCTAAATGCATCACAGGCGATT
01 L S P I S T Q I Q A N T S L N A S Q A I 4
1261 GTCCAAGTTTTACTTGAAGCTGTAGCTGCTCTGCTGCAAATTATCAACGGAGCTCAAATA
21 V Q V L L E A V A A L L Q I I N G A Q I 4
1321 ACTTCTGTCAATTTTGGCAGTGTCTCCAGCGTAAACACAGCCTTGGCAACTGCTCTCGCT
41 T S V N F G S V S S V N T A L A T A L A 4
1381 GGTTGATTTTTATGTCCCTTTTGAAGAATTCTTTGCCTACTGGAAACTTATAAAATGTAT
61 G * F L C P F * R I L C L L E T Y K M Y 4
1441 AATCTTTATTTTATTTCTGATTTCAACTCAATATTGCATTCGTTATCTTTGCTTGTCTGT
81 N L Y F I S D F N S I L H S L S L L V C 4
1501 GCAATTATTGATTTTTAAAATTATATTATGAACCCTGAAATTTTCCTGATAATAAATATT
01 A I I D F * N Y I M N P E I F L I I N I 5
1561 CTTGAATGCCAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
21 L E C Q K K K K K K K K K K K K K K K K 5
1621 AAAAAAAAAAAAAAAA
41 K K K K K 5
95
Seqüências de cDNA das espidroínas de A. juruensis
Seqüência do cDNA parcial de Espidroína 1
Espidroína 1A
1 TACTCTCTAGCAAGCTCCATTGCAAGCGCTGCATCCTCGAGTGCATCTTCGGCAGCAGCA
GCGGCGTCATCTTCTTCCGCAGCAGCAGGAGCAGCCGCGGCTTCGGAAGCAGCAGCTTCT
1 GCCGCCGCCACTTCCACGACAACAACAACAAGTACTTCTCGTGCCGCAGCAGCAGCATCC
1 GCCGCAGCCGCGGCCTCTGCCTCGGGAGCCGCCGGCGCAGCGGGAGCAGCATCAGCCGCT
1 AGCGCTGCTTCAGCTTCTTCGTCCTTGCAACAGTCTCTGGGATCTGCCTTAGCACAAAGT
1 AGCTCATTTGCAGCAGCCTTCGCCCAAGCAAGTAGCGCTGCTTCTGCAGCAGCCATAGCA
1 TATGCTCTTGCACAGACCGTGGCGAATCAAATCGGTTTCTCTTCCTACTCCTCAGCTTTC
1 GCAAGAGCAGCTTCATCAGCCGTATACAGCATAGGGGGCTTGGCTTCTGCATCTGCATAT
1 GCCTTTGCTTTTGCCAGCGCCTTTTCACAAGTTCTCTCAAATTACGGTTTACTTAACATA
1 AATAACGCGTACTCTCTAGCAAGCTCCATTGCAAGCGCTGCATCCTCGAGTGCATCTTCG
1 GCAGCAGCAGCAGCGGCGTCATCTTCTTCCGCAGCAGCAGGAGCAGCCGCGGCTTCAGGT
S S S S A A A G A A A A S G
61 ACAGCAGCTTCTGCCGCCGCCACTTCCACCACCACAACAACAAGTACTTCTAGAGCCGCT
221 T A A S A A A T S T T T T T S T S R A A
21 GCAGCAGCATCCGCCGCAGCCGCGGCCTCTGCCTCGGGAGCCGCCGACGCAGCGGGAGCA
41 A A A S A A A A A S A S G A A D A A G A
81 GCATCAGCCGCTAGCGCTGCTTCAGCTTCTTCGTCCTTGCAACAATCTCTGGGATCTGCC
61 A S A A S A A S A S S S L Q Q S L G S A
41 TTAGCACAAAGTAGCTCATTTGCAGCAGCCTTCGCCCAAGCAAATAGCGCTGCTTCTGCA
281 L A Q S S S F A A A F A Q A N S A A S A
901 GCAGCCATAGCATATGCTCTTGCACAGACCGTGGCAAATCAAATCGGTTTCTCTTCCTAC
1 Y S L A S S I A S A A S S S A S S A A A
61
21 A A S S S S A A A G A A A A S E A A A S
12
41 A A A T S T T T T T S T S R A A A A A S
18
61 A A A A A S A S G A A G A A G A A S A A
24
81 S A A S A S S S L Q Q S L G S A L A Q S
30
101 S S F A A A F A Q A S S A A S A A A I A
36
121 Y A L A Q T V A N Q I G F S S Y S S A F
42
141 A R A A S S A V Y S I G G L A S A S A Y
48
161 A F A F A S A F S Q V L S N Y G L L N I
54
181 N N A Y S L A S S I A S A A S S S A S S
60
201 A A A A A A
6
7
2
7
2
8
96
301 A A I A Y A L A Q T V A N Q I G F S S Y
61 TCCTCAGCTTTCGCAAGCGCAGCTTCTTCAGCCGTATCCAGCTTAGGGGGCTTCGCTTCT
S A V S S L G G F A S
021 GCATCTGCATATGCCTTTGCTTTTGCCAGCGCCTTTTCACAAGTTCTCTCAAATTACGGT
41 A S A Y A F A F A S A F S Q V L S N Y G
CTTAACATAAATAACGCCTACTCTCTAGCAAGCTCCATTGCAAGCGCTGCATCCTCG
61 L L N I N N A Y S L A S S I A S A A S S
9
321 S S A F A S A A S
1
3
1081 TTA
3
1141 AGTGCATCTTCGGCAGCAGCAGCGGCATCATATTCCTTCTCAGCAACAGGAGCAGCCTCT
381 S A S S A A A A A S Y S F S A T G A A S
1201 TCGGCAGCAGTAGGTGCGGCAGCGACATCTGGTGCAGCGACATCTGGTGCAGCGACTTCC
401 S A A V G A A A T S G A A T S G A A T S
1261 TCTAGCTCTGCGACGGGTGTCGGAGGAAGTGTCTCCTCTGGAGCATCACCCGCTTCCGCT
421 S S S A T G V G G S V S S G A S P A S A
1321 GGAACTGCAACAGGTGGCGGTATCTCATTTCTACCTGTCCAGACACAACGTGGTTTCGGG
441 G T A T G G G I S F L P V Q T Q R G F G
1381 CTTGTGCCCTCTCCTTCAGGTAATATTGGTGCAAATTTTCCTGGTTCTGGTGAATTTGGT
461 L V P S P S G N I G A N F P G S G E F G
1441 CCATCACCTTTGACATCACCAGTTTATGGTCCGGGTATTCTTGGCCCTGGGCTTGTCGTG
481 P S P L T S P V Y G P G I L G P G L V V
1501 CCCTCATTACAGGGGCTGTTGCCACCTTTATTTGTTTTACCATCGAATTCGGCAACTGAA
501 P S L Q G L L P P L F V L P S N S A T E
1561 AGAATTTCGTCCATGGTATCGTCTTTGTTGTCCGCAGTTTCTTCCAATGGATTGGATGCT
521 R I S S M V S S L L S A V S S N G L D A
1621 TCTTCTTTTGGTGATACCATAGCTTCCCTGGTTTCGCAGATATCCGTGAATAATTCCGAT
541 S S F G D T I A S L V S Q I S V N N S D
1681 CTTTCTTCGTCACAAGTCTTGCTTGAGGCGCTCCTTGAAATTTTGTCTGGAATGGTACAA
561 L S S S Q V L L E A L L E I L S G M V Q
1741 ATCCTTTCTTATGCTGAAGTCGGGACTGTTAATACGAAGACCGTGAGTTCAACTTCCGCT
581 I L S Y A E V G T V N T K T V S S T S A
1801 GCTGTGGCTCAAGCTATCTCTTCGGCTTTTTCGGGAAATCAGAATTCTTGAGCTGCCTAA
601 A V A Q A I S S A F S G N Q N S * A A *
1861 TGAAGGTTTTTTTTCATCAAATATTTTTAAAATATTATGACCCACTGATTTAATTTTTAT
621 * R F F F I K Y F * N I M T H * F N F Y
1921 TACTATCAATATTGGAAGTGAAATTTAATAGGTGTTGTTATTTCTGCTGTGTAATGTTGG
641 Y Y Q Y W K * N L I G V V I S A V * C W
1981 TAATGGTTGTAAATGTAACTAGTATGGTATTGGTAAAAAAAAAAAAAAAAAAAAAAAAAA
661 * W L * M * L V W Y W * K K K K K K K K
2041 AAAAAAAAAAAAAAAAAAAAAAAAAAAA
97
681 K K K K K K K K K
Espidroína 1B
1 ACAACAAGCACTTCTACAGCCGCAGCAGCAGCCGCAGCAGCGGACTTCGGCTCGGGAGCC
1 T T S T S T A A A A A A A A D F G S G A
1 GCCCGCGCAGCGCAAACAGCATCAGCCGCTAGCGCTGCTTCAGCTTCTTCGTCCTTGCAA 6
21 A R A A Q T A S A A S A A S A S S S L Q
21 CAGTCTTTGGGATCTGCCTTAGCACAAAGTAGCTCATTTGCAGCAGCCTTCGACCAAGCA 1
41 Q S L G S A L A Q S S S F A A A F D Q A
81 AATAGCGCTGCTTCTGCAGCAGCCATAGCATACGCTCTTGCACAGTCCGCGGCGAATCAA 1
61 N S A A S A A A I A Y A L A Q S A A N Q
41 GTCGGTTTGTCTTCCTACTCCGCAGCTATCTCAAACGCAGCTGCAGCAGCCGTAGGAAGC 2
81 V G L S S Y S A A I S N A A A A A V G S
01 GTAGGTGGCTACGCTTCTGCATCTGCCTATGCCTTTGCTTTTGCCAGCGGCGTTTCACAA 3
101 V G G Y A S A S A Y A F A F A S G V S Q
61 GTTCTATCAAATTACGGTTTAATTAACCTAAGTAACGCCTTATTTTTAGCAAGTTCGATA 3
121 V L S N Y G L I N L S N A L F L A S S I
21 GCAAACGCTGCATCGGCGAGTGCATCTTCGGCAGCAGCAGCGGCGTCATCTTCTTCCGCA 4
141 A N A A S A S A S S A A A A A S S S S A
81 GCAACAGGAGCAGCCGCGGCTTTGGGAGGCGCTGGTTCTGCCGCCGCCACTTCCACCACC 4
161 A T G A A A A L G G A G S A A A T S T T
41 ACAATAACAAGCACTTCTACAGCCGTAGCAGCAGCCTCTGGCTCGGGAGCCGCCCGCGCA 5
181 T I T S T S T A V A A A S G S G A A R A
01 GCGCAAACAGCATCAGCCGCTAGCGCTGCTTCAGCTTCTTCGTCCCTTGCACAGTCTTTG 6
201 A Q T A S A A S A A S A S S S L A Q S L
61 GGATCTGCCTTAGCACAAAGTAGCTCATTTGCAGCAGCCTTCGACCAAGGCAATAGCGCT 6
221 G S A L A Q S S S F A A A F D Q G N S A
21 GCTTCTGCAGCAGCCATAGCATACGTTCTTGCACAGTCCGCGGCGAATAAAGTCGGTTTG 7
241 A S A A A I A Y V L A Q S A A N K V G L
81 TCTTCCTACTCCGCAGCTATCTCAAACGCTGCTTCAGCAGCCGTAGAAAGCGTAGGTGGC 7
261 S S Y S A A I S N A A S A A V E S V G G
41 TACGCTTCCGCATCTGCCCATGCCTTTGCTTTTGCCAGCGCCGTTTCACAAGTTCTATCA 8
281 Y A S A S A H A F A F A S A V S Q V L S
01 AATTACGGTTTAATTAACCTAAGTAACGCCTTGTCCCTAGCAAGTTCGATAGCAAACGCT 9
301 N Y G L I N L S N A L S L A S S I A N A
61 GTATCGGCGAGTGCATCTTCGGCAGCAGCTGTGTCATCTGCTGCAGCAGCAACAGGTGCA 9
321 V S A S A S S A A A V S S A A A A T G A
98
1021 ACCTCTTCGGCAGCAGTAGGTGCAGCAGCGACATGTGGGGCAGCGACTTCCGCTAGTTCT
341 T S S A A V G A A A T C G A A T S A S S
081 GCGACGGGCGTCGGAGAAACTGTTGCCTGTGCAACATCGCCCGCGTCCACTGGAACCGCG
61 A T G V G E T V A C A T S P A S T G T A
TCAAATTACGGTTTGCTTAACATAAATAACGCTTACTCTCTAGCAAGTTCGATTGCAAAC
1
3
1141 GCAGGTGGCGGTATCTCATCTTTACCTGTTCAGACACAACCTGGTTTTGGGTTTTTGCTC
81 A G G G I S S L P V Q T Q P G F G F L L 3
1201 TCTCCCTCAGGTAATATTGGTCCAAGTGTTTCTGGTTCTGGTGGGTTTGGTCCATCACCT
01 S P S G N I G P S V S G S G G F G P S P 4
1261 TTGCCATCTCCAGCTTCTGACGGATTTAGCCCATCGCCTTTGCCATCACAAGTTTATGGT
21 L P S P A S D G F S P S P L P S Q V Y G 4
1321 CCTGGTATTCTTGGTCCCGGTCTCGTCGCACCTTCGTTAGAAGGGCTGTTGCCACCTTTA
41 P G I L G P G L V A P S L E G L L P P L 4
1381 TCAATTTTGCCATCGGATTCTGCAAATGAAAGAATTTCGTCTGTAGTATCTTCTTTGTTG
61 S I L P S D S A N E R I S S V V S S L L 4
1441 GCCGCCGTTTCTTCCAATGGATTGGATGCTTCTTCTCTTGGCGATAACTTAGCTTCACTG
81 A A V S S N G L D A S S L G D N L A S L 4
1501 GTTTCGCAGATATCCGCGAATAATGCCGATCTTTCTTCGTCACAAGTTATGGTTGAGGCT
01 V S Q I S A N N A D L S S S Q V M V E A 5
1561 CTTCTTGAAGTTTTGTCTGGAATAGTTCAGATCCTTTCTTATGCTGAAGTTGGGGCTGTT
21 L L E V L S G I V Q I L S Y A E V G A V 5
1621 AATACGGAAACCGTAAGTTCAACTTCCTCTGCTGTGGCTCAAGCTATTTCTTCGGCTGTT
41 N T E T V S S T S S A V A Q A I S S A V 5
1681 TTGGGATAATCAAAATTCTTGAGCTGCCTAATGAAACTGTTTTTTTTTTAACAAATATTT
61 L G * S K F L S C L M K L F F F * Q I F 5
1741 TAAAAATATTATGGCCCACTGATTTAATTTTCATTAGTATCAATGTTGGAAGTGGGAATT
81 * K Y Y G P L I * F S L V S M L E V G I 5
1801 TAATATGTTTTGTTTATTTCTGCTGTGTAATGTTGTTAATGGTTGTATATGTAACTAGTA
01 * Y V L F I S A V * C C * W L Y M * L V 6
1861 TGGTATTGGTAATAAAAACATTGCATTTGAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
21 W Y W * * K H C I * K K K K K K K K K K 6
1921 AAAAA
41 K 6
Espidroína 1C
1
1 S N Y G L L N I N N A Y S L A S S I A N
99
61 GCTGCATCAGCGAGTGCATCTTCTGCAGCAGCGGCAGCGGCGTCATCGTCTTCCGCAGCA
1 GCAGCAGCAGCCGCGGCTTCGGGAGCAGCAGGTTCTGCCGCCGCCACTTCCACCACAACA
1 TCAACAAGCTCTTCTACAGCCGCAGCAGCAGCATCCGCCGCGGCTTCAGCCGCCGCTTCC
1 GCTTCGGGAGCCGCCCGCGCTGCGGGAGCGTCATCAGCCGCTAGCGATGCTTCAGCTTCT
1 TCGTCCTTGCAACAGTCTCTGGGATCTGCTTTAGCACAAAGTAGCTCATTTGCAGCAGCC
1 TTCGCCCAAGCAAATAGCGCTGCTTCTGCAGCAGCCATAGCATATGCTCTTGCACAGATC
1 GTGGCGAATCAAATCGGTTTCTCTTCCTACTCCTCAGCTTTTGCAAGCGCCGCCTCATCA
1 GCCGTATCCAGCTTAGGGAGCTTCGCTTCTGCATCTGCATATGCCTTTGCTTTTGCCAGC
1 GCCTTTTCACAAGTTCTCTCAAATTACGGTTTGCTTAACATAAGTAACGCTTACTCTCTA
1 GCAAGTTCGATTGCAAGCGCTGCATCAGCAAGTGCATCTTCTGCAGCAGCGGCAGCGGCG
1 TCATCGTCTGCCGCAGCAGCAGGAGCAGCCGCGGCTTCGGGAGCAGCAGGTTCTGCCGCC
1 TCCACTTCCACCACAACATCAACAAGCACTTCTACAGCCGCAGCAGCAGCATCCGCCGCG
1 GCTGCAGCCGCCGCCTCCGCTTCGGGAGCCGCCCGCGCTGCGGGAGCGTCATCAGCCGCT
1 AGCGCTGCTTCAGCTTCTTCGTCCTTGCAACAGTCTCTGGGATCTGCTTTAGCACAAAGT
1 AGCTCATTTGCAGCAGCCTTCGCCCAAGCAAATAGCGCTGCTTCTGCAGCAGCCATAGCA
1 TATGCTCTTGCACAGACCGTGGCGAATCAAATCGGTTTCTCTTCCTATTCCTCAGCTTTT
L A Q T V A N Q I G F S S Y S S A F
021 GCAACCGCCGCCTCATCAGCCGTATCCAGCTTAGGGAGCTTCGCTTCTGCATCTGCATAT
341 A T A A S S A V S S L G S F A S A S A Y
081 GCCTTTGCTTTTGCCAGCGCCTTTTCACAAGTTCTCTCAAATTACGGTTTGCTTAACATA
61 A F A F A S A F S Q V L S N Y G L L N I
21 A A S A S A S S A A A A A A S S S S A A
12
41 A A A A A A S G A A G S A A A T S T T T
18
61 S T S S S T A A A A A S A A A S A A A S
24
81 A S G A A R A A G A S S A A S D A S A S
30
101 S S L Q Q S L G S A L A Q S S S F A A A
36
121 F A Q A N S A A S A A A I A Y A L A Q I
42
141 V A N Q I G F S S Y S S A F A S A A S S
48
161 A V S S L G S F A S A S A Y A F A F A S
54
181 A F S Q V L S N Y G L L N I S N A Y S L
60
201 A S S I A S A A S A S A S S A A A A A A
66
221 S S S A A A A G A A A A S G A A G S A A
72
241 S T S T T T S T S T S T A A A A A S A A
78
261 A A A A A S A S G A A R A A G A S S A A
84
281 S A A S A S S S L Q Q S L G S A L A Q S
90
301 S S F A A A F A Q A N S A A S A A A I A
96
321 Y A
1
1
3
1141 AGTAACGCTTACTCTCTAGCAAGTTCGATTGCAAACGCTGCATCAGCGAGTGCATCTTCT
81 S N A Y S L A S S I A N A A S A S A S S 3
100
1201 GCAGCAGCGGCAGCGGCGTCATCTTCTTCCGCAGCAGCAGGAGCAGCCGCAGCTTCGGGA
401 A A A A A A S S S S A A A G A A A A S G
1261 GCAGCAGGTTCTGTCGCCGCCACTTCCACCACCACAACAGCAAGCACTTCGACAGCCGCA
421 A A G S V A A T S T T T T A S T S T A A
1321 GCAGCAGCATCAGCCGCGGCTGCAGCCGCCGCCTCGGCTTCGGGAGCCGCCCGCGCTGCG
441 A A A S A A A A A A A S A S G A A R A A
1381 GGAGCGTCATCAGCCGCTAGCGCTGCTTCAGCTTCTTCGTCCTTGCAACAGTCTCTGGGA
461 G A S S A A S A A S A S S S L Q Q S L G
1441 TCTGCTTTAGCACAAAGTAGCTCATTTGCAGCAGCCTTCGCCCAAGCAAATAGCGCTGCT
481 S A L A Q S S S F A A A F A Q A N S A A
1501 TCTGCAGCAGCTATAGCATATGCTCTTGCACAGACCGTGGCGAATCAAATCGGTTTCTCT
501 S A A A I A Y A L A Q T V A N Q I G F S
1561 TCATACTCCTCAGCTTTTGCAAGCGCCGCCTCATCAGCCGTATACAGCTTAGGCAGCTTC
521 S Y S S A F A S A A S S A V Y S L G S F
1621 GCTTCTGCATCTGCATATGCCTTTGCTTTTGCCAGCGCCTTTTCACAAGTTCTCTCAAAT
541 A S A S A Y A F A F A S A F S Q V L S N
1681 TACGGTTTGCTTAACATAAATAACGCTTACTCTCTAGCAAGTTCGATTGCAAACGCTGCA
561 Y G L L N I N N A Y S L A S S I A N A A
1741 TCAGCGAGTGCATCTTCTGCAGCAGCGGCAGCGGCGTCATCGTCTTCCGCAGCAGCAGGA
581 S A S A S S A A A A A A S S S S A A A G
1801 GCAGCCGCGGCTTCGGGAGCAGCAGGTTCTGCCGCCTCCACTTCCACCACAACATCAACA
601 A A A A S G A A G S A A S T S T T T S T
1861 AGCACTTCTACAGCCGCAGCAGCAGCATCCGCCGCCTCCGCTTCGGGAGCCGCCCGCGCT
621 S T S T A A A A A S A A S A S G A A R A
1921 GCGGGAGCGTCATCAGCCGCTAGCGCTGCTTCAGCTTCTTCGTCCTTGCAACAGTCTCTG
641 A G A S S A A S A A S A S S S L Q Q S L
1981 GGATCTGCTTTAGCACAAAGTAGCTCATTTGCAGCAGCCTTCGCCCAAGCAAATAGCGCT
661 G S A L A Q S S S F A A A F A Q A N S A
2041 GCTTCTGCAGCAGCCATAGCATATGCTCTTGCACAGGCCGTGGCGAATGAAATCGGTTTC
681 A S A A A I A Y A L A Q A V A N E I G F
2101 TCTTTCTACTCCTCAGCTTTTGCTAGCGCAGCTTCATCAGCCGTATTCGGCTTAGGGAGC
701 S F Y S S A F A S A A S S A V F G L G S
2161 TTCGCTTCTGCATCTGCATATGCCTTTGCTTTTGCCAGCGCCTTTTCACAAGTTCTCTCA
721 F A S A S A Y A F A F A S A F S Q V L S
2221 AATTACGGTTTGCTTAACATAAATAACGCCTACTCTCTAGCAAGCTCGATTGCAAACGCT
741 N Y G L L N I N N A Y S L A S S I A N A
2281 GCATCAACGAGTGCATCTTCCGCAGCAGCAGCAGCAGTAGTGGCGTCATCTTCTTCTGCA
761 A S T S A S S A A A A A V V A S S S S A
101
2341 GCAACAGCTGCAGGCGCGGCATCGACATCTGTTCCCGCGACTTCCTTGAGTTCTGCGACC
781 A T A A G A A S T S V P A T S L S S A T
2401 AGAGTCGGTGGAAGTCTCTCCTCTGCAGTTTCACCCGCTTCTGCTAGAACCGCAACAGGT
801 R V G G S L S S A V S P A S A R T A T G
2461 GACGGTACCACATATCTACCTGTCCAGATACAACCTGGTATCGGGTTTGTGCCTTCTCTT
821 D G T T Y L P V Q I Q P G I G F V P S L
2521 TCAGGTGATATTGGCCCAAATGTTCCTGGTTCTGGTGGATTTGGTTCACCAGCTTTGCCA
841 S G D I G P N V P G S G G F G S P A L P
2581 TCCCCAGTTTATGGTCCTGCTATTCTTGGTCCCGGTCTTGTCGCACCTGCATTAGCGAAT
861 S P V Y G P A I L G P G L V A P A L A N
2641 CTGTTGCCACCATTATCAGTTTTACCATCGGATTCTGCAAATGAAAGAATTTCCTCCGTC
881 L L P P L S V L P S D S A N E R I S S V
2701 GTATCTTCTTTGTTGTCCGCAATTTCTTCCAATGGATTGGATGCTTCTTCTCTTGGCGGT
901 V S S L L S A I S S N G L D A S S L G G
2761 ACCATAGCTTCACTAGTTTCGCAGATATCCGTGAGTAATGCCAAACTTTCTTCGTCACAA
921 T I A S L V S Q I S V S N A K L S S S Q
2821 GTCTTTCTTGAGGCTCTTCTTGAAGTTTTGTCTGGAATGGTTCAGATTCTTTCCTATGCT
941 V F L E A L L E V L S G M V Q I L S Y A
2881 GAAGTTGGGGCTGTTAATACAGACACCGTAATTTCAACTTCGTCTGCTGTGGCTCAGGCT
961 E V G A V N T D T V I S T S S A V A Q A
2941 ATCTCTTCGGCTGTTTCGGGATAAACTGTATTTTTTTTCAACGAATGTTTATAAAACGTT
981 I S S A V S G * T V F F F N E C L * N V
3001 ATGTTCCACTCATTTAATTTTTAATTGTACCAATATTGGAAGTGGGAATTTAGTATGTGT
1001 M F H S F N F * L Y Q Y W K W E F S M C
3061 TGTTATTTCTGCTGTGTTATGTTGGTAATGGTTGTAAATGTAACTAGTGTGGTATTGATA
1021 C Y F C C V M L V M V V N V T S V V L I
3121 ATAAAAACATTGCATTTAAAAAAAAAAAAAAAA
1041 I K T L H L K K K K K
Seqüência do cDNA parcial de Espidroína 2
1 TCGGGATCTGGTTCTGGAAGTGGAGCAGGGTCTGGTGGAGGAAGTGGTGCGGGATCTGGT
1 S G S G S G S G A G S G G G S G A G S G
1 TCTGGAAGCGGAGCAGGAGCAGGATCTGGTAGTGGCTCAGGTTCAGGAAGTGGAGCAGGA 6
21 S G S G A G A G S G S G S G S G S G A G
21 TCTGGTAGTGGCTCAGGTTCAGGAAGTGGAGCAGGTTCAGGTAGTGGCTCAGGTTCAGGA 1
41 S G S G S G S G S G A G S G S G S G S G
81 AGTGGAGCACGATCTGGTAGTGGCTCAGGTTCAGGAAGTGGAGCAGGTTCGGGTAGTGGC 1
102
61 S G A R S G S G S G S G S G A G S G S G
241 TCAGGTTCAGGAAGTGGGGCAGGTGCAGGTAGTGGTTCAGGTTCAGGAAGTGGAGCAGGT
1 TCAGGTAGTGGAGCAGGTTCAGGTAGTGGCTCAGGTTCAGGAAGTGGGGCAGGTTCAGGT
1 AGTGGCTCAGGTTCAGGAAGTGGGGCAGGCGCAGGTAGTGGCTCAGGTTCAGGACGTGGA
1 GCAGGTTCAGGTAGTGGTTCAGGTTCAGGAAGTGGAGCAGGTTCAGGTAGTGGCTCAGGT
1 TCAGGACGTGGAGCAGGTTCAGGTAGTGGCTCAGGTTCAGGAAGTGGGGCAGGTGCAGGT
1 AGTGGCTCAGGTTCAGGAAGTGGAGCAGGTTCAGGTAGTGGCTCAGGTTCAGGAAGTGGA
1 GCAGGTTCAGGTAGTGGCTCAGGTTCAGGAAGTGGAGCTGGATCTGGTAGTGGCTCAGGT
1 TCAGGAAGTGGAGCAGGATCTGGTAGTGGCTCAGGTTCAGGAAGTGGAGCAGGTTCAGGT
1 AGTGGCTCAGGTTCAGGAAGTGGAGCAGGTTCAGGTAGTGGCTCAGGTTCAGGAAGTGGA
1 GCAGGCTCAGGTAGTGGCTCAGGTTCAGGAAGTGGAGCAGGAGCTGGTAGTGGTTCAGGT
1 TCATGTAGAAAAGATGCAGGTGGTCATGATGGCGGATATGGGAAAAAGCTTGGTTTTGAA
1 TTCGGTACGCCTGCAGCAGCAGCTGTTACCCTTGGACCTGGAGCTGGACAACAAGGCCCA
1 GGTGGAGCTGGACAACAAGGACCAGGAGGCCAAGGACCATATGGACCAGTTGCTAGCGCC
P Y G P V A S A
021 GCCGCAGCTGTTGCTGGAGGTTATGGACCTGGAGCTTTACCACAAGGACCAGCACGCCAA
341 A A A V A G G Y G P G A L P Q G P A R Q
081 GGACCTTCCGGTCCTGTTTCTTCAGCACCAGTTGCATCGGCAGCTGCTGCTCGCCTTTCT
61 G P S G P V S S A P V A S A A A A R L S
81 S G S G S G A G A G S G S G S G S G A G
30
101 S G S G A G S G S G S G S G S G A G S G
36
121 S G S G S G S G A G A G S G S G S G R G
42
141 A G S G S G S G S G S G A G S G S G S G
48
161 S G R G A G S G S G S G S G S G A G A G
54
181 S G S G S G S G A G S G S G S G S G S G
60
201 A G S G S G S G S G S G A G S G S G S G
66
221 S G S G A G S G S G S G S G S G A G S G
72
241 S G S G S G S G A G S G S G S G S G S G
78
261 A G S G S G S G S G S G A G A G S G S G
84
281 S C R K D A G G H D G G Y G K K L G F E
90
301 F G T P A A A A V T L G P G A G Q Q G P
96
321 G G A G Q Q G P G G Q G
1
1
3
1141 TCTCCTCAGGCTAGTTCTAGAGTATCTTCAGCTTTTTTTTCTTTGGTATCAAGTGGTCCA
81 S P Q A S S R V S S A F F S L V S S G P 3
1201 ACTAGTCCTGGTGCACTTTCTAATGCCATCAGTAGTGTTGTTTCACAAGTTAGTGCAAGC
01 T S P G A L S N A I S S V V S Q V S A S 4
1261 AATCCAGGTCTCTCTGGTTGCGATGTACTCGTGCAAGCATTGCTGGAAATTGTATCCGCC
21 N P G L S G C D V L V Q A L L E I V S A 4
1321 CTTGTATCTATCCTTGCGTCATCTAGTATCGGGCAAATCAACTATGGAGCTTCCGCTCAG
103
441 L V S I L A S S S I G Q I N Y G A S A Q
1381 TATGCCTCTTTGGTTGGCCAATCTGTAAATCAAGCTCTTCGTTATTAATTTAGCAAATGA
461 Y A S L V G Q S V N Q A L R Y * F S K *
1441 TTTGCAAACTTTTTTCAATGTTACTAACACATACTTTTAAAATTTCTCAATAAATTTGAA
481 F A N F F Q C Y * H I L L K F L N K F E
1501 GCATATTATATTTCCTCTTGTGTTATTTATTTGTTACATGCGGAGATGAACATTGATCCT
501 A Y Y I S S C V I Y L L H A E M N I D P
1561 GTTACAAATTTATATTTAAAATTATTTCTTTAAATAATCGAAAGTGGATTAAAAGTACTT
521 V T N L Y L K L F L * I I E S G L K V L
1621 TTACAAAACTTTGCATTTAGATTTCATGAAAAAATATTTGTTTCAGCGTTAGTAAACGAT
541 L Q N F A F R F H E K I F V S A L V N D
1681 AAACATTTTTGGTCCTATCAATTATTAATTTTTTTTATAATCTTTTGATTGCCATATTTA
561 K H F W S Y Q L L I F F I I F * L P Y L
1741 TAATTTCTTTAAAATTATTTACGATTTCTCCTACATTTTCTTTTTTAAATCCATTTTCAT
581 * F L * N Y L R F L L H F L F * I H F H
1801 GTGTCTTTCAAGAATTTTGTGATTAAATGTGGTATTTTTTCATGATAAAAAAAAAAAAAA
601 V S F K N F V I K C G I F S * * K K K K
1861 AAAAAAAAAAAA
621 K K K K
104
ANEXO 3
Bittencourt, D., Souto, B.M., Verza, N.C., Vinecky, F., Dittmar, K., Silva, P.I. Jr,
Andrade, A.C., da Silva, F.R., Lewis, R.V., Rech, E.L, 2007. Spidroins from the
Brazilian spider Nephilengys cruentata (Araneae: Nephilidae). Comp Biochem Physiol B
Biochem Mol Biol. 4, 597-606.
105
This article was originally published in a journal published by
Elsevier, and the attached copy is provided by Elsevier for the
author’s benefit and for the benefit of the author’s institution, for
non-commercial research and educational use including without
limitation use in instruction at your institution, sending it to specific
colleagues that you know, and providing a copy to your institution’s
administrator.
All other uses, reproduction and distribution, including without
limitation commercial reprints, selling or licensing copies or access,
or posting on open internet sites, your personal or institution’s
website or repository, are prohibited. For exceptions, permission
may be sought for such use through Elsevier’s permissions site at:
http://www.elsevier.com/locate/permissionusematerial
Author's personal copy
Spidroins from the Brazilian spider Nephilengys cruentata
(Araneae: Nephilidae)
D. Bittencourt
a,d,
, B.M. Souto
a,d
, N.C. Verza
d
, F. Vinecky
d
, K. Dittmar
b
, P.I. Silva Jr.
c
,
A.C. Andrade
d
, F.R. da Silva
d
, R.V. Lewis
e
, E.L. Rech
d
a
Instituto de Ciências Biológicas, Departamento de Biologia Celular, Universidade de Brasília, BrasíliaDF, Brazil
b
Department of Molecular Biology, Bioinformatics Group, University of Wyoming, LaramieWY, USA
c
Laboratório Especial de Toxicologia Aplicada de Artrópodes-Instituto Butantan, São PauloSP, Brazil
d
Núcleo de Biotecnologia, EMBRAPA Recursos Genéticos e Biotecnologia, BrasíliaDF, Brazil
e
Department of Molecular Biology, University of Wyoming, LaramieWY, USA
Received 31 January 2007; received in revised form 28 March 2007; accepted 31 March 2007
Available online 6 April 2007
Abstract
Spiders produce up to six different kinds of silk, each one for a specific biological function. Spider silks are also known for their unique
mechanical properties. The possibility of producing new materials with similar properties motivated research on these silk proteins (spidroins).
Using expression sequence tags, we identified four spidroins produced by major ampullate, minor ampullate, flagelliform and tubuliform silk
glands from the Brazilian spider Nephilengys cruentata (Araneae: Nephilidae). The new protein sequences showed substantial similarity to other
spidroins previously described, with high content of alanine and glycine due to the presence of the highly repetitive motifs (polyAla, (GA)
n
,
(GGX)
n
, (GPGGX)
n
). Similarities among sequences were also observed between the different spidroins with the exception of tubuliform spidroin,
which presents a unique complex amino acid sequence with high amounts of serine and low amounts of glycine.
© 2007 Elsevier Inc. All rights reserved.
Keywords: EST; Sequence; Silk; Spider; Spidroins
1. Introduction
Orb-web spiders can produce a variety of silks with unique
mechanical properties for diverse practical purposes (Foelix,
1996). The fibers constituents are proteins (spidroins) which are
synthesized in the epithelial cells of specialized glands and
secreted into the glandular lumen where they are stored in a
highly concentrated (50% w/v) liquid crystalline spin dope
(Hijirida et al., 1996; Scheibel, 2004). Fiber assembly is believed
to occur during the passage of the spin dope through the spinning
duct, where extraction of water, sodium and chloride is
accompanied by a decrease of pH from 6.9 to 6.3 until extrusion
from spinnerets as insoluble fibers (Vollrath and Knight, 2001;
Rising et al., 2005; Vollrath, 2005). Despite knowledge available
on some of the details, the process of spinning fibers is still not
clearly understood.
Orb-web weavers have up to seven different types of glands,
six producing a specific silk and one the glue (Table 1)
(Vollrath, 1992). Studies on various Araneoid spidroin cDNAs
sequences from different silk glands have shown that they share
common structural featu res (Xu and Lewis, 1990; Gatesy et al.,
2001). All cDNAs are large transcripts consisting of a non-
repetitive and conserved N-terminal and C-terminal, and an
internal highly repetitive region rich in alanine, glycine and
serine amino acids. The repetitive region of most spidroins is
formed by assembly of up to four amino acid motifs responsible
for distinct structural modules as follows: poly-alanine (A
n
),
alternating glycine and alanine (GA)
n
, amino acid triplets
composed of two glycines and a third variable amino acid
(GGX)
n,
and glycine-proline-glycine m odules (GPGXX)
n
Comparative Biochemistry and Physiology, Part B 147 (2007) 597 606
www.elsevier.com/locate/cbpb
Corresponding author. Instituto de Ciências Biológicas, Departamento de
Biologia Celular, Universidade de Brasília, BrasíliaDF, Brazil. Tel./fax: +55
61 3448 4694.
E-mail address: dmatias@cenargen.embrapa.br (D. Bittencourt).
1096-4959/$ - see front matter © 2007 Elsevier Inc. All rights reserved.
doi:10.1016/j.cbpb.2007.03.013
Author's personal copy
(Gatesy et al., 2001). Different combinations of these modules
forming a larger ensem ble repeat have been suggested to be
responsible for the distinct mechanical properties of the fibers
produced by silk glands, on the basis of several studies
(Scheibel, 2004; Vollrath, 2005; Hayashi et al., 1999; Fahne-
stock et al., 2000)A
n
and (GA)
n
form crystalline β-sheets
thought to provide tensile strength, (GGX)
n
probably forms a
Gly-II helical structure, and (GPGXX)
n
forms β-spirals; the last
may be involved in forming an amorphous matrix which would
provide elasticity. More recently, spidroin genes were identified
which were composed of a novel type of consensus assembly,
with long and complicated repeats containing high levels of
serine (Garb and Hayashi, 2005; Hu et al., 2005a,b; Tian and
Lewis, 2005; Huang et al., 2006).
The N-terminal region analyzed from different spiders' silks
has been shown to be the most conserved part of the silk
proteins (Smith et al., 2005 ). In one instance it has addit ional
Met codons downstream of the first one creating possible
additional translation starts (Smith et al., 2005). Although the
N-terminal function is related to the transport of the spidroins
into the glandular lumen due the presence of a signal peptide
(Hayashi and Lewis, 1998; Smith et al., 2005), the function of
the mature N-terminal remains unknown. The C-terminal region
of 100 amino acids is also a highly conserved domain among
spidroins. Due to its high conservation this region was proposed
to play an important role in fiber assembly (Jin and Kaplan,
2003; Spooner et al., 2005). Recently, it was demonstrated that
the proteins' organization into a macromolecular fiber stru cture
may depend on the C-terminal domain for the correct fiber
density and orientation (Ittah et al., 2006).
The majority of the described spidroin sequences were
generated from EST (expressed sequence tag) (Xu and Lewis,
1990; Hinman and Lewis, 1992; Hayashi et al., 2004; Tian and
Lewis, 2005). Although there are limitations mainly using large
sized mRNAs, EST has proven to be a rapid and economical
technique for the identification of genes of biological interest
(Adams et al., 1991). In this article we describe four partial
cDNA sequences that encode spidroins produced by major
ampullate, minor ampullate, flagelliform and tubuliform silk
glands from the Brazilian spider Nephilengys cruentata
(Araneae: Nephilidae). Aiming at possible fiber production
using biotechnology approa ches c apable of mimicing the
natural properties of the silks produced by spiders, our results
contribute to understanding the effective mechanical properties
of fiber silks by providing important information about their
protein structure.
2. Materials and methods
2.1. RNA isolation
N. cruentata spiders were collected in the Atlantic Forest
native regions (Brazil). The spider silk glands were isolated in
the laboratory under a stereo microscope and immediately
frozen in liquid nitrogen. The isolated glands included the
major ampullate, minor ampullate, tubuliform, flagelliform,
aciniform, and pyriform glands. After pulverization, total RNA
extraction was performed using TRIZOL reagent (Invitrogen,
USA) following the manuf acturers recommendation s. The
yield, purity and integrity of total RNA were determined by
measuring absorbance at 260/280 nm and by agarose gel
electrophoresis. The Oligotex kit (Qiagen, Germany) was used
for mRNA purification according to the technical manual and
the concentration and purity of the isolated mRNA was also
determined by measuring absorbance at 260/280 nm.
2.2. Construction of the cDNA Library
The cDNA library was made using the SUPERSCRIPT II
PlasmidSystemwithGATEWAYTechnology (I nvitrogen),
according to th e manufac tur er's instructions. After Escheri-
chia coli DH5α transformation using electro-transformation
(Sambrook and Russell, 2001), the libraries were plated on
selective media, the positive clones f or cDNA insertion were
picked an d t ra nsfe rr ed to 96 well pl at es. Plasmid DNAs w as
used for sequencing after alkaline lyses plasmid DNA
extraction (Sambrook and Russell, 2001) and quantification
of templates. The s equencing reactions were performed using
the Big Dye kit (Appli ed Biosystems, USA), foll owing the
manufacturer's instructions. The purified reactions were
sequenced with an ABI 3700 DNA sequencer. The resulting
chromatogram s were directly transferred to a cen tral data base
similar to the one described by Telles et al. (2001) for p ro-
cessing and anal ys is.
2.3. Screening and gene identification
BLASTX (Altschul et al., 1997) was used to deter mine
potential positive clones by searching for homologous repetitive
and C-terminal sequences. Several combinations of restriction
enzymes were used to check the size of the inserts. Clones with
inserts bigger than 1.5 kb were treated with exonuclease III
(Erase-a-Base kit, Promega, USA) and used in a nested deletion
strategy for sequencing. The positive clones for MaSp1 and
flagelliform cDNAs were then used as probes by random primer
labeling with [ α -
32
P]dCTP in Southern Blots analysis (Sam-
brook and Russell, 2001) for identification of additional related
sequences in the silk gland libraries.
Table 1
Spider glands, proteins and their uses
Spider gland Product Function
Major ampullate gland Major ampullate
spidroins 1 and 2
Drag line,
structural silk
Minor ampullate gland Minor ampullate
spidroins 1 and 2
Auxiliary spiral
Flagelliform gland Flagelliform spidroin Core fibers of
capture spiral
Tubuliform gland Tubuliform spidroin Egg sac
Aciniform gland Aciniform spidroin Swathing pray
Piriform gland Piriform spidroin Cement for joints
and attachments
Aggregate gland Adhesive molecules Aqueous coating
of the capture spiral
598 D. Bittencourt et al. / Comparative Biochemistry and Physiology, Part B 147 (2007) 597606
Author's personal copy
2.4. RT-PCR
In order to verify the positives clones found in the library, silk
gland total RNA was used to perform reverse transcription.
Superscript II (Invitrogen, USA) was used in the reactions fol-
lowing the manufacturer's instructions. Polymerase chain
reaction (PCR) analysis were conducted using Taq Polymerase
(Invitrogen, USA) in the following conditions: initial template
denaturation was set for 2 min at 94°, 35 repeated cycles were
30 s at 94°, 1 min at 56° and 30 s at 68°, the final extension at
72° for 10 min. Oligonucleotides used were designed according
to the C-terminal sequence of the spider silk cDNA positive
clones. The respective forward and reverse primers used for each
spider silk cDNA were: Major ampullate spidroin foward-
TGCAGGTCAAGGTGGATATGGTG, Major ampullate spi-
droin reverse-CCTAGAGCTTGGTAAACCGATTGAC, Minor
ampullate spidroin forward-CTCTGCGGGTGTAGGTGTTGG,
Minor ampullate spidroin reverse-TGCAGCAGACGAACCAA-
CAGA, Flagelliform spidroin forward-GCATATG-
GAGCTGGTTCTGGTACAC, Flagelliform spidroin reverse-
CTTCGAACAGAGTTGGAATATGCAT, Tubuliform spidroin
foward-CATCTTCC GGCTTAGCATC and Tu buliform spidroin
reverse-ACCAGCGAGAGCAGTTGC.
2.5. Sequence analysis and phylogenetic tree
Base calling and quality assignment of individual bases were
done through the use of Phred (Ewing and Green, 1998; Ewing
et al., 1998). Ribosomal poly( A) tails, low-quality sequences,
vector and adapter regions were removed as described by Telles
and da Silva (2001) with minor adaptations to this project. The
resulting sets of cleaned sequences were assembled into clusters
of overlapping sequences using the cap3 (Huang and Madan,
1999) or phrap (http://www.phrap.org/phredphrap/phrap.html)
assembler, with individual base quality and default parameters.
BLAST (Altschul et al., 1997) and FASTA (Pearson, 1990) were
also used to analyze the sequences. Multiple sequence align-
ments were performed using ClustalW version 1.8 (Thompson
et al., 1994) with default settings and refined by examination.
Ensemble repeats within each spidroin were aligned, and a
consensus repeat was generated for each translated protein.
Codon usage analysis was made utilizing t he software
CodonUsage with standard genetic code (Stothard, 2000).
Phylogenetic analysis was conducted using the alignment of
the amino acid C-terminal sequences performed in MAFFT
(5.8), under the accuracy oriented E-INS-i algorithm (mafft-
genafpair-maxiterate 1000 input_fileNoutput_file ), as imple-
mented on the online server of Kyushu Univers ity, Japan (http://
alig n.bmr.kyushu-u .ac.jp/mafft/online/server/)(Katoh et al.,
2005). Phylogenetic analysis was performed on the computa-
tional cluster of the David Liberles laboratory, University of
Wyoming. The topology was reconstructed using maxi mum
likelihood as implemented in PHYML (Guindon and Gascuel,
2003), using the Blosum 62 model of protein evolution. Non-
parametric bootstrap values were assessed with 1000 bootstrap
replicates.
3. Results
3.1. cDNA library
In order to identify novel sequences encoding different
spider silk proteins from the spider N. cruentata, 960 random
clones from the silk gland cDNA library were partially
sequenced and analyzed. Ninety-six more positive clones
selected from another 24 96-well plates were also partially
sequenced and analyzed after Southern Blot analysis. Of these,
21 clones were selected after BLAST searches according to their
size and their amino acid translation by comparing their
similarity with previously described spidroins. All selected
clones in the library were partial transcripts as noted by 5 end
heterogeneity. Four clones containing the C-terminal region and
repetitive sequence were class ified as being MaSp1-like cDNAs
and the largest clone for this silk group was 3241 bp. Three
other clones were classified as MiSp1 cDNAs, where two of
them contained only the repetitive sequence, and the largest one
with 3486 bp contained both the repetitive sequence and the
non-repetitive C-terminal. The most highly represented cDN A
from the library encoded flagelliform spidroin, with nine partial
cDNAs also containing the repetitive sequence and C-terminal,
the longest of which was 327 7 bp long. Although having the
smallest cDNAs clones, tubuliform spidroin was also identified
in the N. cruentata cDNA library with two clones of 1600 bp
and 1636 bp. Three other clones containing novel repetitive
sequences were selected for further study.
RT-PCR was performed in order to verify the presence of the
spidroin cDNAs in N. cruentata silk glands. Total RNA from all
silk glands combined was used as a template for polymerization
of the cDNA first strand and primers designed from spidroin
sequences found in the cDNA library were used to amplify the
C-terminal region. All cDNAs analyzed were positive for their
presence in the silk glands (Fig. 1), eliminating the possibility of
transcript contamination or clone recombination.
Fig. 1. RT-PCR was performe d using total RNA from silk glands. 1,
Flagelliform spidroin cDNA (287 bp); 2, MaSp cDNA (356 bp); 3, MiSp
cDNA (304 bp); 4, TuSp cDNA (302 bp); 5, negative control. 1 Kb DNA ladder
used was obtained from Invitrogen. The oligonucleotides used in the PCR are
described in the Materials and methods.
599D. Bittencourt et al. / Comparative Biochemistry and Physiology, Part B 147 (2007) 597606
Author's personal copy
3.2. Sequence analysis
All selected cDNA clones had an open reading frame for a
spider silk spidroin with a polyadenylation signal (data not shown).
Following the nomenclature for published spider silk spidroins the
identified genes were named as NCMaSp1-like (N. cruentata
major ampullate spidroin-like), NCMiSp1-like (N. cruentata
minor ampullate spidroin-like), NCFlag-like (N. cruentata flagelli-
form spidroin-like) and NCTuSp-like (N. cruentata tubuliform
spidroin-like) according to their transcripts. N. cruentata spidroins
Fig. 2. ClustalW alignment of amino acid sequences of the consensus repetitive sequence of different orb-web weavers spider silk proteins. (A) Repetitive sequence of
major ampullate spidroins. (B) Repetitive sequence and spacer of minor ampullate spidroins. Amino acids are indicated by one letter abbreviations. Hyphens indicate
gaps introduced to obtain the best alignment.
means that the residues or nucleotides in that column are identical in all sequences in the alignment, : means that
conserved substitutions have been observed, according to the color (redSmall aa (small + hydrophobic (incl. aromatic-Y)), blueAcidic aa, magentaBasic aa,
greenHydroxyl+ Amine+ Basic-Q), and . means that semi-conserved substitutions are observed. Sequences from N. cruentata are identified in bold. (For
interpretation of the references to colour in this figure legend, the reader is referred to the web version of this article.)
Fig. 3. Flagelliform spidroin schematic of consensus sequences of different orb-web weavers spiders. Hyphens indicate gaps introduced to obtain the best alignment.
Sequence from N. cruentata is identified in bold.
600 D. Bittencourt et al. / Comparative Biochemistry and Physiology, Part B 147 (2007) 597606
Author's personal copy
encode repetitive alanine and glycine rich proteins dominated by
simple amino acid motifs. The NCMaSp1-like and NCMiSp1-like
spidroins are highly repetitive protein sequences with the amino
acids motifs (GGX)
n
and polyAla, this being replaced by (GA)
n
repeats in NCMiSp1-like protein (Fig. 2). We also identified a non-
repetitive spacer between the repetitive sequences from
NCMiSp1-like spidroin (Fig. 2B). NCFlag-like spidroin also
contained a repetitive sequence with (GPGGX)
n
motifs separated
by a non-repetitive sequence (Fig. 3). Unlike the previous N.
cruentata silk proteins, NCTuSp-like spidroin shows few of the
common spidroin amino acid motifs; instead the sequence contains
repeats of 174 amino acids, largely composed by alanine and
serine, forming new motifs such as S
n
,(SX)
n
(X represents Q, L, A,
V and F), and GX (X represents Q, N, I, L, A and V) (Fig. 4).
The codon usage for N. cruentata spidroins' most abundant
amino acids (Table 2) follows the preference for adenine (A)
and thymine (T) as the wobble base encoding each amino acid,
with the exception of NCTuSp-like spidroin. NCMaSp1-like
and NCMiSp1-like had a high content of glycine, alanine and
glutamine in their amino acid sequences, all of them using A or
T as the third nucleotide in their codon usage. The codon bias
for glutamine and alanine was CAA and GCA/T respectively,
with CAA presented in 100% of the cases in NCMaSp1-like and
96% in NCMiSp1-like. Glycine, the most prevalent amino acid
Fig. 4. ClustalW alignment of the consensus repetitive amino acid sequence of tubuliform proteins from different orb-web weaver spiders. Sequence alignment
abbreviations are the same as in Fig. 2. Sequence from N. cruentata is identified in bold.
Table 2
Codon frequencies for N. cruentata silk proteins most abundant amino acids
Am
Acid
Codon Frequency (%) Am
Acid
Codon Frequency (%)
FLAG MiSp MaSp TuSp FLAG MiSp MaSp TuSp
Ala GCG 5 1 1 4 Pro CCG 2 0 0 10
Ala GCA 22 24 48 30 Pro CCA 27 33 50 20
Ala GCT 72 61 33 33 Pro CCT 60 33 50 50
Ala GCC 1 14 18 34 Pro CCC 11 33 0 20
Gln CAG 25 4 0 50 Ser AGT 4 19 21 15
Gln CAA 75 96 100 50 Ser AGC 2 4 11 11
Glu GAG 31 0 0 0 Ser TCG 4 2 11 11
Glu GAA 69 100 100 100 Ser TCA 30 12 13 11
Gly GGG 1 2 0 0 Ser TCT 49 48 32 31
Gly GGA 47 45 52 46 Ser TCC 11 15 13 21
Gly GGT 42 45 41 31 Thr ACG 0 0 0 0
Gly GGC 10 9 8 23 Thr ACA 91 20 0 31
Tyr TAT 41 67 90 40 Thr ACT 4 70 67 38
Tyr TAC 59 33 10 60 Thr ACC 4 10 33 31
601D. Bittencourt et al. / Comparative Biochemistry and Physiology, Part B 147 (2007) 597606
Author's personal copy
in both proteins, showed a preference of 93% and 90% for
GGA/T in NCMaSp1-like and NCMiSp1-like, in that order.
Glycine and alanine were also present in large amounts in the
NCFlag-like protein sequence. Their codon usage follows the
same bias found for NCMaSp1-like and NCMiSp1-like cDNA
sequences, with 89% for GGA/T and 9 4% for GCA/T.
Compared with the high frequency of codon bias toward A
and T at the wobble position in the sequenc es encoding
NCMaSp1-like, NCMiSp1-like and NCFlag-like proteins, the
codon usages for alanine, serine and glutamine, the three most
Fig. 5. ClustalW alignment of C-terminal amino acid sequences. Amino acids are indicated by one letter abbreviations and numbered from N- to C-terminal. Sequences
alignment abbreviations are the same as in Fig. 2. Sequences from Nephilengys cruentata are identified in bold. Araneus diadematus ADF-3 was added as a
representative of MaSp2 group. Abbreviations of spider species used in this figure (from top to bottom): Ncruen, N. cruentata; Nclavi, Nephila clavipes; Nmadag,
Nephila inaurata madagascariensis; Atrifa, Argiope trifasciata; Udiver, Uloborus diversus; Adiade, A. diadematus; Nantip, Nephila antipodiana; Agemmo, Araneus
gemmoides; Aargen, Argiope argentata; Dspino, Deinopis spinosa; Aventr, Araneus ventricosus. Abbreviations used for silk spidroins: MaSp1, major ampullate
spidroin 1; ADF3, fibroin 3 (major ampullate spidroin 2); MiSp1, minor ampullate spidroin 1; ADF1, fibroin 1; TuSp, tubuliform spidroin; Flag, flagelliform spidroin.
602 D. Bittencourt et al. / Comparative Biochemistry and Physiology, Part B 147 (2007) 597606
Author's personal copy
frequent amino acid in the NCTuSp-like protein, are only
moderately biased toward A and T, with 63% for alanine, 57%
for serine and 50% for glutamine.
3.3. Phylogenetic analysis
Maximum likelihood (ML) analysis examined the relation-
ship between the C-terminal amino acid sequences from N.
cruentata spidroins and previously reported spidroin genes
from different spider silk glands and species. Alignment of the
C-terminal region from all identified spidroins with known
sequences from other silk proteins generated using ClustalW is
shown in Fig. 5. In order to perform the phylogenetic analysis
an alignment of the amino acid C-terminal sequences was also
performed in MAFFT (5.8) (data not shown). The topology
resulting from the ML analysis (-lnL: 16456.89) is depicted in
Fig. 6, and rendered as an unrooted tree. The results showed that
the spidroins found in the N. cruentata library belong to the
spidroin gene family, and all of them were correctly classified
according to their ortholog group.
4. Discussion
For many years spider silks have piqued the interest of
mankind because of their extreme mechanical properties. With
advances in biotechnology, the possibility arose of producing new
materials based on spider silk polymers. In this work we identified
different silk genes from the spider N. cruentata. Using cDNAs
from the spider silk glands we were able to identify partial
transcripts from major ampullate, minor ampullate, flagelliform
and tubuliform glands. Although this strategy has been shown to
have its limitations in obtaining full spider silk transcripts, it is
commonly used to identify novel spider silk genes (Hayashi et al.,
Fig. 5 (continued ).
Fig. 6. Unrooted tree from spider silk C-terminal sequence phylogenetic analysis. Nephilengys cruentata spidroins are identified in bold. Abbreviations of spider species
used in this figure: Ncr, N. cruentata; Ncla, Nephila clavipes; Nma, Nephila inaurata madagascariensis; Atr, Argiope trifasciata; Udi, Uloborus diversus; Adi,
Araneus diadematus; Nan, Nephila antipodiana; Age, Araneus gemmoides; Aar, Argiope argentata; Dsp, Deinopis spinosa; Ave, Araneus ventricosus. Abbreviations
used for silk spidroins: MaSp1, major ampullate spidroin 1; ADF3, fibroin 3; MiSp1, minor ampullate spidroin 1; ADF1, fibroin 1; TuSp, tubuliform spidroin; Flag,
flagelliform spidroin. GenBank accessions: MaSp1NclP19837, MaSp1NmaAAK30606, MaSp1AtrAAK30595, MaSp1UdiABD61596, ADF3Adi
AAC47010, MiSp1NclAAC14589, MiSp1Na nABC72645, MiSp1UdiABD61597, MiSp1DspABD61589, ADF1AdiAAC4 7008, TuSpNcl
AAX45295, TuSpAgeAAX45293, TuSpAarAAY28932, TuSpUdiAAY28933, TuSpDspAAY28934, FlagNclAAC38847, FlagNmaAAF36092, Fla-
gAtrAAK30594, FlagAveAAT36347 and FlagDspABD61590.
603D. Bittencourt et al. / Comparative Biochemistry and Physiology, Part B 147 (2007) 597606
Author's personal copy
2004; Lawrence et al., 2004; Pouchkina-Stantcheva and McQu-
een-Mason, 2004; Tian et al., 2004).
In agreement with previously described sequences encoding
spider silk prote ins (Xu and Lewis, 1990; Hinman and Lewis,
1992), the codon usage for N. cruentata spidroins most
abundant amino acids, with the exception of NCTuSp-like
spidroin, follows the preference for adenine (A) and thymine
(T) as the third base of three encoding each amino acid. This
difference in the biased codon usages were also found for Ar-
aneus gemmoides and Nephila clavipes TuSp1 coding
sequences, although they have a higher amount of glycine
instead of glutamine in their amino acid sequences than found in
NCTuSp-like spidroin (Tian and Lewis, 2005 ). The prevalence
of T and A in major ampullat e, minor ampullate and flagelliform
coding sequences may prevent the formation of numerous
hairpin loops in nearby G/C-rich regions present in the codons
of their repetitive sequences (polyAla, (GGX)
n
, (GPGGX)
n
)
(Hinman and Lewis, 1992). Such regions do not exist in
tubulifom proteins.
Like previously described spider silk proteins (Xu and Lewis,
1990; Gatesy et al., 2001; Tian et al., 2004; Lewis, 2006), our
findings also demonstrated proteins with high content of alanine
and glycine amino acids due to the presence of highly repetitive
motifs. NCMaSp1-like protein is composed of similar repeats
with polyAla and (GGX)
n
motifs, where the X residues are A, Y,
L or Q. Its ensemble repeats are very similar to the ones found in
N. clavipes and Nephila inaurata madagascariensis proteins
with a 96% identity. As all of these spiders belong to the
Nephilidae family, similarity is not entirely unexpected.
However N. cruentata repeats vary in length lacking GGX
motifs. Those motifs were proposed to ado pt a Gl y-II helix
forming an amorphous matrix that connects crystalline regions
and provides elasticity. It was also found using FTIR microscopy
that the seconda ry stru cture of major ampullate spidroins has
predominantly (38%) helical structures in comparison with
sheets and turns (Winkler and Kaplan, 2000; Van Beek et al.,
2002; Dicko et al., 2004). On the other hand this helix is too rigid
to be elastic; it is more likely that the (GGX)
n
motifs are
responsible for another interprotein link similar to the β-sheet.
Although major silks present a high content of (GGX)
n
motifs,
they are known for their high tensile strengths and toughness
provided by the polyAla stretches, with strength values in the
range of 12 GPa (Gosline et al., 1999, 2002; Blackledge and
Hayashi, 2006). In contrast, minor ampullate silk has decreased
strength but increased extensibility in comparison with major
silks, which can be related to the presence of fewer polyAla
stretches and higher numbers of (GA)
n
and (GGX)
n
motifs in the
minor protein ensemble repeats (Blackledge and Hayashi,
2006). Those motifs were also found in NCMiSp1-like spidroin
sequence. Although consensus repeats showed very similar
organization with previously described minor ampullate spi-
droins, the number of (GA)
n
repeats varies in comparison
between those proteins. However, a highly conserved non-
repetitive 124 amino acid sequence (spacer) was found
interrupting the repetitive regions of NCMiSp1-like spidroin
and it is almost identical with the spacer from N. clavipes and N.
i. madagascariensis minor ampullate spidroins with few amino
acid substitutions and deletions (89% and 91% identity
respectively). The main function of this region remains
unknown, but it may serve to separate crystalline regions as
well as participate in inter-chain protein associations through
charged residues (Lewis, 2006).
NCFlag-like protein is also composed of highly repetitive
sequence formed by the (GPGGX)
n
(X represents A, V, S and Y)
and three GGX (X represents A, S and T) motifs separated by a
non-repetitive sequence with many charged and hydrophilic
amino acids. This sequence is also very similar to previously
described flagelliform spidroins (Hayashi and Lewis, 2000).
Flagelliform silk, the most extensible silk (Blackledge and
Hayashi, 2006), is responsible for the formation of the capture
spiral in the orb-web. The GPGGX motif has been suggested to
conform to a β-spiral secondary structure similar to a spring that
could easily contribute to the elastic mechanism of the fiber, with
the proline bonds generating force for retraction of the silk after
stretching (Hayashi et al., 1999).
Tubuliform and aciniform silks are unique among spider silk
spidroins due to their complex amino acid composition and
NCTuSp-like protein was similar. It is composed of large repeats
rich in alanine and serine amino acids with several new motifs (S
n
,
(SX)
n
, and GX). In contrast to other silk spidroins, NCTuSp-like
spidroin contains high amounts of serine and low amounts of
glycine. In addition it also showed more amino acids with large
side chains such as valine and leucine. Secondary structure
predictions of tubuliform spidroins using X-ray diffraction
indicated the presence of large amounts of β-sheet. It also
showed that eggcase silk has a larger b dimensional value in the
β-sheet than major and minor ampullate silks, which indicates the
presence of large-side-chain amino acids (Parke et al., 1997).
TEM (transmission electron microscopy) diffraction data also
agrees with that obtained from X-ray diffraction (Barghout et al.,
1999). The lack of the usual repeats rich in alanine and/or glycine
motifs found in most spiders spidroins is probably related to
function. Tubuliform spidroins are used to construct structures for
reproduction different from major or minor ampullate or flagelli-
form silks that serve as structural fibers for prey capture.
However, recent mechanical data from Argiope argentata
tubuliform silks showed that these fibers perform quite well in
comparison with structural ones, with a 0.47 GPa strength value
(Blackledge and Hayashi, 2006).
Alignment of the repeat units from NCTuSp-like with tubuli-
form repeats from different spider species showed a high similarity
between them. Surprisingly the N. cruentata repeat unit sequence
was more similar to A. gemmoides and A. argentata unit repeats
than to N. clavipes repeats, even though they belong to different
families according to morphological evidence. NCtuSp-like
sidroin also showed sequence similarities with fibroin 1 from the
mygalomorphae spider Euagrus chisoseus (AF350271). Previ-
ously described tubuliform spidroins exhibited a remarkable
degree of homogeneity between consecutive intragenic repeats
(Garb and Hayashi, 2005; T ian and Lewis, 2005). Unfortunately
we were unable to verify this evidence of concerted evolution in
NCtuSp1-like spidroin because of the small size of the obtained
transcript in the cDNA library which showed only one complete
repeat.
604 D. Bittencourt et al. / Comparative Biochemistry and Physiology, Part B 147 (2007) 597606
Author's personal copy
The nonrepetitive and highly conserved C-terminal region
was also identified in all described N. cruentata spidroins.
Alignment of the C-terminal amino acid sequence described for
these spidroins with those of the known fibroin genes showed
great sequence conservation, with the more highly conserved
sequences among ortholog gene groups than among paralogous
genes. Most spider silk proteins share 30% identity among their
C-terminal, w ith flagelliform spidroins the most highly
diverged. However all sequences share a particular conserved
region at the QALLE amino acid sequence even between orb-
web and non-orb-web weavers spiders. This region correspon ds
to the region with higher hydrophobicity in the C-terminal, and
secondary structure predictions suggest that this QALLE region
is also responsible for the formati on of α-helices (Spooner et al.,
2005; Challis et al., 2006). Since the C-terminal sequence is
much more conserved than the repetitive region among different
spiders' species, it is suggested that it might play an important
role with certain amino acid motifs being preserved by selection
against mutations that could disrupt the C-termina l function
during evolution. Several functions have been attributed to the
C-terminal from silk proteins. It might be responsible for the
formation of irregular sized micelles in the spinning dope in
order to prevent premature fiber formation (Jin and Kaplan,
2003) or have a function in correct protein folding since it has
been demonstrated that the C-terminal is retained in the fiber
(Sponner et al., 2004; Ittah et al., 2006).
Because of its high sequence conservation, C-terminal region
alignment was used for phylogenetic analysis. The result shows
that different ortholog genes cluster together rather than by
species, agreeing with previously phylogenetic analysis of the
spidroin gene family (Gar b and Hayashi, 2005; Challis et al.,
2006; Garb et al., 2006); all identified N. cruentata spidroins
grouped together in their specific gene order. The observation
that silk proteins cluster according to their type suggests that
their evolution may be due to a divergent evolution involving a
common ancestor, rather than by a model of concerted evolution,
where one would expect genes to cluster within species and not
within the same gene order (Challis et al., 2006; Garb et al.,
2006). Based on fossil evidence, a possible common ancestor
could be the extinct Macryphants, dating from the lower
cretaceous at least 136 million years ago (Selden, 1989).
In summary, we have studied different silk spidroins from the
Brazilian spider N. cruentata. We were able to identify the
protein sequences from sil ks responsible for orb-web building
and prey capture (MaSp, MiSp and Flag), as well as for the
construction of the eggcase (TuSp). Throughout our study it was
possible to demonstrate a high degree of similarity between
these sequences and sequences from other spider species. It was
also observed similarities among sequences from different gene
groups with the exception of tubuliform spidroin that present a
complete different protein structure, and which play a distinct
function in the spiders' life (Hu et al., 2005a; Tian and Lewis,
2005). These results support the argument that mechanical
properties are correlated to their protein sequences (Hayashi
et al., 1999; Rising et al., 2005). Further mechanical and
structural study of N. cruentata spidroins shoul d also provide
more evidence for this correlation.
Acknowledgements
We would like to thank Dr Michael Hinman and Dr David
Perry (University of Wyoming) for reviewing this work and
Kelly Martins de Brito for technical assistance. This research
was funded by CNPq (Conselho Nacional de Desenvolvimento
Cientifico e Tecnologico-Brazil), grant: 486492/2006-0.
References
Adams, M.D., Kelley, J.M., Gocayne, J.D., Dubnick, M., Polymeropoulos, M.H.,
Xiao, H., Merril, C.R., Wu, A., Olde, B., Moreno, R.F., 1991. Complementary
DNA sequencing: expressed sequence tags and human genome project.
Science 252, 16511656.
Altschul, S.F., Madden, T.L., Schaffer, A.A., Zhang, J., Zhang, Z., Miller, W.,
Lipman, D.J., 1997. Gapped BLAST and PSI-BLAST: a new generation of
protein database search programs. Nucleic Acids Res. 25, 33893402.
Barghout, J.Y.T., Thiel, B.L., Viney, C., 1999. Spider Araneus diadematus.
cocoon silk: a case of non-periodic lattice crystals with a twist? Int. J. Biol.
Macromol. 24, 211217.
Blackledge, T.A., Hayashi, C.Y., 2006. Silken toolkits: biomechanics of silk
fibers spun by the orb web spider Argiope argentata (Fabricius 1775).
J. Exp. Biol. 209, 24522461.
Challis, R.J., Goodacre, S.L., Hewitt, G.M., 2006. Evolution of spider silks:
conservation and diversification of the C-terminal. Insect. Mol. Biol. 15,
4556.
Dicko, C., Knight, D., Kenney, J.M., Vollrath, F., 2004. Secondary structures
and conformational changes in flagelliform, cylindrical, major, and minor
ampullate silk proteins. Temperature and concentration effects. Biomacro-
molecules 5, 21052115.
Ewing, B., Green, P., 1998. Base-calling of automated sequencer traces using
phred. II. Error probabilities. Genome Res. 8, 186194.
Ewing, B., Hillier, L., Wendl, M.C., Green, P., 1998. Base-calling of automated
sequencer traces using phred. I. Accuracy assessment. Genome Res. 8,
175185.
Fahnestock, S.R., Yao, Z., Bedzyk, L.A., 2000. Microbial production of spider
silk proteins. J. Biotechnol. 74, 105119.
Foelix, R.F., 1996. Biology of Spiders 1996 Oxford University Press Inc. and
Georg Thieme Verlag New York.
Garb, J.E., Hayashi, C.Y., 2005. Modular evolution of egg case silk genes across orb-
weavingspidersuperfamilies.Proc.Natl.Acad.Sci.U.S.A.102,113791 1 384.
Garb, J.E., DiMauro, T., Vo, V., Hayashi, C.Y., 2006. Silk genes support the single
origin of orb webs. Science 312, 1762.
Gatesy, J., Hayashi, C., Motriuk, D., Woods, J., Lewis, R.V., 2001. Extreme div ersity,
conservation, and convergence of spider silk fibroin sequences. Science 291,
26032605.
Gosline, J.M., Guerette, P.A., Ortlepp, C.S., Savage, K.N., 1999. The mechanical
design of spider silks: from fibroin sequence to mechanical function. J. Exp.
Biol. 202, 32953303.
Gosline, J., Lillie, M., Carrington, E., Guerette, P., Ortlepp, C., Savage, K., 2002.
Elastic proteins: biological roles and mechanical properties. Philos. Trans. R.
Soc. Lond., B Biol. Sci. 357, 121132.
Guindon, S., Gascuel, O., 2003. A simple, fast, and accurate algorithm to estimate
large phylogenies by maximum likelihood. Syst. Biol. 52, 696704.
Hayashi, C.Y., Lewis, R.V., 1998. Evidence from flagelliform silk cDNA for the
structural basis of elasticity and modular nature of spider silks. J. Mol. Biol.
275, 773784.
Hayashi, C.Y., Lewis, R.V., 2000. Molecular architecture and evolution of a
modular spider silk protein gene. Science 287, 14771479.
Hayashi, C.Y., Shipley, N.H., Lewis, R.V., 1999. Hypotheses that correlate the
sequence, structure, and mechanical properties of spider silk proteins. Int. J.
Biol. Macromol. 24, 271275.
Hayashi, C.Y., Blackledge, T.A., Lewis, R.V., 2004. Molecular and mechanical
characterization of aciniform silk: uniformity of iterated sequence modules
in a novel member of the spider silk fibroin gene family. Mol. Biol. Evol. 21,
19501959.
605D. Bittencourt et al. / Comparative Biochemistry and Physiology, Part B 147 (2007) 597606
Author's personal copy
Hijirida, D.H., Do, K.G., Michael, C., Wong, S., Zax, D., Jelinkis, L.W., 1996.
C13 NMR of Nephila clavipes major ampullate silk gland. Biophys. J. 71,
34423447.
Hinman, M.B., Lewis, R.V., 1992. Isolation of a clone encoding a second dragline
silk protein. J. Biol. Chem. 267, 1932019324.
Hu, X., Kohler, K., Falick, A.M., Moore, A.M., Jones, P.R., Sparkman, O.D.,
Vierra, C., 2005a. Egg case protein-1. A new class of silk proteins with
fibroin-like properties from the spider Latrodectus hesperus. J. Biol. Chem.
280, 2122021230.
Hu, X., Lawrence, B., Kohler, K., Falick, A.M., Moore, A.M., McMullen, E.,
Jones, P.R., Vierra, C., 2005b. Araneoid egg case silk: a fibroin with novel
ensemble repeat units from the black widow spider, Latrodectus hesperus.
Biochemistry 44, 1002010027.
Huang, X., Madan, A., 1999. CAP3: A DNA sequence assembly program. Genome
Res. 9, 868877.
Huang, W., Lin, Z., Sin, Y.M., Li, D., Gong, Z., Yang, D., 2006. Characterization
and expression of a cDNA encoding a tubuliform silk protein of the golden
web spider Nephila antipodoana. Biochimie 88, 849858.
Ittah, S., Cohen, S., Garty, S., Cohn, D., Gat, U., 2006. An essential role for the C-
terminal domain of a dragline spider silk protein in directing fiber formation.
Biomacromolecules 7, 17901795.
Jin, H.J., Kaplan, D.L., 2003. Mechanism of silk processing in insects and spiders.
Nature 424, 10571061.
Katoh, K., Kuma, K., Toh, H., Miyata, T., 2005. MAFFT version 5: improvement
in accuracy of multiple sequence alignment. Nucleic Acids Res. 33, 511518.
Lawrence, B.A., Vierra, C.A., Moore, A.M., 2004. Molecular and mechanical
properties of major ampullate silk of the black widow spider, Latrodectus
hesperus. Biomacromolecules 5, 689695.
Lewis, R.V., 2006. Spider silk: ancient ideas for new biomaterial. Chem. Rev.
106, 37623734.
Parke, A.D., Seeley, S.K., Gardner, K., Thompson, L., Lewis, R.V., 1997.
Structural studies of spider silk proteins in the fiber. J. Mol. Recognit. 10,
16.
Pearson, W.R., 1990. Rapid and sensitive sequence comparison with FASTP and
FASTA methods. Enzymology 183, 6398.
Pouchkina-Stantcheva, N.N., McQueen-Mason, S.J., 2004. Molecular studies of a
novel dragline silk from a nursery web spider, Euprosthenops sp. Pisauridae.
Comp. Biochem. Physiol. Part B Biochem. Mol. Biol. 138, 371376.
Rising, A., Nimervoll, H., Grip, S., Fernandez-Arias, A., Storckenfeldt, E.,
Knight, D., Vollrath, F., Engstron, W., 2005. Spider silk proteins
mechanical property and gene sequence. Zoolog. Sci. 22, 273281.
Sambrook, J., Russell, D.W., 2001. Molecular Cloning: A Laboratory Manual,
3th ed. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY.
Scheibel, T., 2004. Spider silks: recombinant synthesis, assembly, spinning, and
engineering of synthetic proteins. Microb. Cell Fact. 3, 14.
Selden, P.A., 1989. Orb weaving spiders in the early Cretaceous. Nature 340,
711713.
Smith, D.M., Smith, A., Hayashi, C.Y., Lewis, R.V., 2005. Analysis of the conserved
N-terminal domains in major ampullate spider silk proteins. Biomacromolecules
6, 3152 3159.
Sponner, A., Unger, E., Grosse, F., Weisshart, K., 2004. Conserved C-termini of
spidroins are secreted by the major ampullate glands and retained in the silk
thread. Biomacromolecules 5, 840845.
Spooner, A., Vater, W., Rommerskirch, W., Vollrath, F., Unger, E., Grosse, F.,
Weisshart, K., 2005. The conserved C-termini contribute to the properties of
spider silk fibroins. Biochem. Biophys. Res. Commun. 338, 897
902.
Stothard, P., 2000. The sequence manipulation suite: JavaScript programs for
analyzing and formatting protein and DNA sequences. Biotechniques 28,
11021104.
Telles, G.P., da Silva, F.L., 2001. Trimming and clustering sugarcane ESTs. Genet.
Mol. Biol. 24, 1723.
Telles, G.P., Braga, M.D.V., Dias, Z., Lin, T.Z., Quitzau, J.A.A., da Silva, F.R.,
Meidanis, J., 2001. Bioinformatics of the sugarcane EST project. Genet.
Mol. Biol. 24, 815.
Thompson, J.D., Higgins, D.G., Gibson, T.J., 1994. CLUSTAL W: improving
the sensitivity of progressive multiple sequence alignment through sequence
weighting, position-specific gap penalties and weight matrix choice. Nucleic
Acids Res. 22, 46734680.
Tian, M., Lewis, R.V., 2005. Molecular characterization and evolutionary study
of spider tubuliform eggcase silk protein. Biochemistry 44, 80068012.
Tian, M., Liu, C., Lewis, R.V., 2004. Analysis of major ampullate silk cDNAs
from two non-orb-weaving spiders. Biomacromolecules 5, 657660.
van Beek, J.D., Hess, S., Vollrath, F., Meier, B.H., 2002. The molecular structure
of spider dragline silk: folding and orientation of the protein backbone. Proc.
Natl. Acad. Sci. U. S. A. 99, 1026610271.
Vollrath, F., 1992. Spider web and silks. Sci. Am. 266, 7076.
Vollrath, F., 2005. Spider's web. Curr. Biol. 15, R364R365.
Vollrath, F., Knight, D., 2001. Liquid crystalline spinning of spider silk. Nature
410, 541548.
Winkler, S., Kaplan, D.L., 2000. Molecular biology of spider silk. J. Biotechnol.
74, 8593.
Xu, M., Lewis, R.V., 1990. Structure of a protein superfiber: spider dragline silk.
Proc. Natl. Acad. Sci. U. S. A. 87, 71207124.
606 D. Bittencourt et al. / Comparative Biochemistry and Physiology, Part B 147 (2007) 597606
ANEXO 4
How old are spider major ampullate silks?
Daniela Bittencourt
a,c,b
; Katharina Dittmar
b,d
; Randolph V. Lewis
b
; Elíbio L. Rech
c
a) Departamento de Biologia Celular, Universidade de Brasília, Brazil
b) Department of Molecular Biology, University of Wyoming
c) Núcleo de Biotecnologia, EMBRAPA, Brazil
d) Department of Biological Sciences, SUNY Buffalo
The most elaborate spider webs have evolved within the araneomorph orb-weaving
spiders – the Araneoidea and the Deinopoidea. Their nets have intricate frames and radial
support lines, which are spun from silks with the ability to absorb kinetic energy
produced by flying and struggling prey. Both lineages are highly likely to have evolved
from one common ancestor, and two spider silks (major ampullate spidroin 2 – MaSp2,
and flagelliform spidroin - Flag) have been identified as supporting orbicularian
monophyly uniquely (1). Mygalomorphae however, the sistergroup to the
Araneomorphae, do not build orb webs, and only use their silk for seemingly simple tasks
as protecting their eggs or lining burrows. Not only is this the reason why not much is
known about mygalomorph spidroins, but also why they are often regarded as “primitive”
spiders.
It is well known that spiders use specific assemblages of silks to accomplish
different tasks, and accordingly, it is tacitly assumed that mygalomorph spiders generally
116
do not have silks similar to those used in orb web weaving. Additionally, this line of
thought is equated with them having “ancestral” silks (phylogenetically basal). In our
quest to find the original “ancestral” silk in a basal mygalomorph spider – Avicularia
juruensis (Theraphosidae) – we came across an interesting discovery, which challenges
common views about spider silk evolution.
Three types of silk, produced by different glands, are thought to be responsible for
the production of fibers used in the orb-web; MaSp 1 and 2, minor ampullate spidroin
(MiSp) and Flag (1). From the cDNAs of the mono-glandular Avicularia juruensis, we
identified two expressed spidroins (7). While “spidroin1” was the more abundant
transcript, and by initial BLAST searches most similar to the mygalomorph Euagrus
chisoseus spidroin, “spidroin 2” showed clear similarities to MaSp2 from the orb-
weaving araneoid clade (supplementary material).
To validate these findings, phylogenetic analyses involving 77 silk C-terminals
from 35 spider species were conducted (7). Consistent with previous results, most
sequences form orthologous clusters according to function, interspersed with terminals
that do not seem to belong to either functional group (1,2,3) (Fig. 1). Within some of
these clades patterns of spider speciation are clearly preserved. Generally, no support was
found for any of the basal nodes, thus, no inferences can be made as to the succession of
descent among the major functional silk clades, and the notion that mygalomorph
spidroins are “ancestral” silks cannot be corroborated.
More importantly, however, mygalomorph “spidroin 2” clearly nests within
orbicularian MaSp2 sequences, and is positioned in the same cluster encompassing a
sequence from another mygalomorph spider – Macrothele holsti - which was classified as
117
a MaSp1 silk (4). From an evolutionary perspective, the most likely reasoning is that
mygalomorph MaSp-like silks are the survivors of gene duplications (3), which would
imply that the origin of orb weaver MaSps should be placed to a time point before the
origin of Orbicularia. In fact, reconciling the species tree with the silk gene tree does just
that; it pinpoints the oldest speciation in which MaSps must have been present on the
mygalomorph-araneomorph split, 340 – 390 MYA (5,7). Therefore, while not refuting
orb weaver monophyly, MaSp2s, and major ampullate silks in general cannot be
classified as orbicularian synapomorphies (1), but have to be considered plesiomorphic
for Opisthothelae.
The overall phylogenetic pattern attests to a major influence of gene duplication
in silk evolution, aside from other following processes such as gene conversion or
intragenic homogenization (2,3). Given the apparent importance of gene duplication for
the evolution of new biological functions, this makes sense for spider silks, and it is
conceivable that the functional basis for their different uses arose at the outset of spider
radiation, even before gland or spinneret differentiation. In order to advance in the
production of synthetic silk, it is imperative to fully understand the connection between
silk sequence divergence and expression, gland anatomy, and function (6). Therefore, in
the future more emphasis should be placed on sampling mygalomorph and araneomorph
non-orbicularian taxa.
References and Notes
1. J.E. Garb, T. DiMauro, V. Vo, C. Hayashi, Science 312, 1762 (2006).
118
2. J.E. Garb, C. Hayashi, PNAS 102, 11379-11384 (2005).
3. R.J. Challis, S.L. Goodacre, G.M. Hewitt, Insect Molecular Biology 15, 45-56
(2006).
4. P.L. Tai, G.Y. Hwang, I.M. Tso, Int. J. Biol. Macromol. 34, 295-301 (2004).
5. N.A. Ayoub, J.E. Garb, M. Hedin, C. Hayashi. MPE 42, 394-409 (2007).
6. A. Sponner et al., Biochem. Biophys. Res. Commun. 338, 897 (2005).
7. Materials and Methods online.
8. Betúlia M. Souto provided assistance. Megan L. Porter commented on drafts.
Work was supported by CNPq – Brazil (#486492/2006-0, DB), NIH (RVL) and
AFOSR (RVL). Sequences were deposited with accession # X and X. IBAMA
collecting permit: 1984-06
Figure Legends:
Figure 1.
A. ML phylogram (lnL = -7671.60611). Bold branches = BP>75. Red Branches = Non-
orbicularian taxa, black = Orbicularia. # = MaSp node estimated to be result of
duplication (among 23 others, not shown).
B. Spider family tree using ML data from Ayoub et al. 2007. U = Uloboridae, D =
Deinopidae, A = Araneidae, L = Latrodectidae, P = Pisauridae, Pl = Plectreuridae, T =
Theraphosidae, D = Dipluridae, H = Hexathelidae). D = Lower bound of duplication at
mygalomorph-araneomorph split, date from Ayoub et al. 2007. Blue branches: Presence
of MaSPs.
119
120
Supporting Online Material for
How old are major ampullate silks?
Daniela Bittencourt; Katharina Dittmar*; Randolph V. Lewis; Elíbio L. Rech
*To whom correspondence should be addressed. E-mail: katharinad@gmail.com
This supporting material includes:
Materials and Methods
References
Figs. S1 and S2
121
Materials and Methods
Two Avicularia juruensis spiders were collected in the Amazon Forest native regions in
Brazil (Monte
Negro/RO S10
o
1740"/W 60
o
19' 31"). Avicularia has only one gland, and
each was isolated under a stereomicroscope and immediately frozen in liquid nitrogen.
The cDNA libraries were constructed using “SUPERSCRIPT II Plasmid System with
GATEWAY Technology” (Invitrogen, USA), according to the manufacturer’s
instructions. From the clones we identified two distinct silk cDNAs called Spidroin 1
(3154bp) and Spidroin 2 (1874bp) (Fig. S1, S2). The respective forward and reverse
primers used for each spider silk cDNA (RT-PCR) were: AJSpid1f: 5-
’TGTCCGCAGTTTCTTCCAATGG-3’, JSpid1r:5’CCACAGCAGCGGAAGTTGAAC-
3’, AJSpid2f:5’GGACCAGCACGCCAAGGACC-3’ andAJSpid2r: 5’ CGAAGAGCTT
GATTTACAGATTGGCC-3’.
Silks were classified into orthologous groups according to established criteria (S1). Top
BLASTX hit to A. juruensis “spidroin 1” in open reading frame was E. chisoseus (E = 9e-
06), whereas A. juruensis “spidroin 2” blasted to Argiope trifasciata MaSp 2 (E= 5e-79
).
Phylogenetic relationships of the spidroins reported here (GenBank accession# X and X)
were analyzed with publicly available data. From the Araneomorphae we included
Plectreurys tristis [1 (AAK30610); 2 (AAK30611); 3 (AAK30612); 4 (AAK30613)],
Deinopsis spinosa [1b (ABD61592); 1a (ABD61591); 2a (ABD61593); 2b (ABD61594);
4 (ABD61590)], Dolomedes tenebrosus [1 (AAK30598); 2 (AAK30599)], Argiope
aurantia [2 (AAK30592); 3 (AAX45292)], Argiope trifasciata [1 (AAK30595); (2
(AAK30596); 4 (AAK30593); 5 (AAR83925)], Argiope amoena [2 (AAR13813)],
122
Argiope argentata [3 (AAY28932)], Latrodectus hasselti [3(AAY28941)], Latrodectus
hesperus [1(AAY28935); 2(ABD66603); 3 (AAY28931)], Latrodectus geometricus [1
(AAK30602), 2 (AAK30604), 3 (AAY28940)], Latrodectus mactans [3 (AAY28938)],
Cyrtophora moluccensis [3 (AAY28944)], Psechrus sinensis [1 (AAV48939)], Octonoba
varians [1 (AAV48931)], Uloborus diversus [ 1 (ABD61596), 2 (ABD61599), 3
(AAY28933), 5 (ABD61598), 6 (ABD61597)], Araneus diadematus [1 (AAC47008), 2
(AAC47009), 3 (AAC47010), 4 (AAC47011)], Araneus ventricosus [1 (AAN85280), 2
(AAN85281), 4 (ABK00016)], Araneus bicentenarius [2 (AAC04503)], Araneus
gemmoides [3 (AAX45294)], Gea heptagon [3(AAY28943)], Gasteracantha mammosa
[2 (AAK30601)], Agelenopsis aperta [ 1 (AAT08436)], Nephila clavipes [1
(AAT75312), 2 (AAT75315), 3 (AAX45295), 4 (AAF36089), 6 (AAC14589)], Nephila
clavata [3 (BAE54450)], Nephila antipodiana [1 (ABC72644), 3 (AAY90151), 6
(ABC72645)], Nephila madagascarensis [1 (AAK30606), 2 (AAK30607), 4
(AAF36092)], Nephila pilipes [1 (AAV48946)], Nephila senegalensis [1 (AAK30608), 2
(AAK30609)], Nephilengys cruentata [ 1 (EF638446), 3 (EF638445), 4 (EF638444), 6
(EF638447)], Euprosthenops sp. [1 (S2)], Tetragnatha versicolor [1 (AAK30615)],
Tetragnatha kauaiensis [1 (AAK30614)], from the Mygalomorphae: Macrothele holsti [1
(AAV48940)], and Euagrus chisoseus [1 (AAK30600)].
Spidroin C-terminals were translated into their respective amino acid sequences,
and aligned using the accuracy oriented G-Ins-i algorithm, which utilizes global pairwise
alignment information, as implemented in MAFFT 5.861 [gap opening penalty = 3] (S3).
Sequences were then back-translated to their respective nucleotide alignments (Biopython
123
script, 366 bp), and subjected to phylogenetic analysis by Maximum Parsimony (MP),
Maximum Likelihood (ML) [PAUP* v4.0b10, S4], and Bayesian Markov Chain Monte
Carlo (MrBayes v.3.1.2, S5) approaches. . Heuristic MP searches were conducted with
TBR branch swapping and 10.000 random sequence additions (RSA), [gaps = 5
th
state, 25
trees, length: 4074]. ML analysis (presented, Fig. 1A) was performed using the best-fit
model of evolution as estimated by Modeltest v3.7 (AIC Criterion, GTR+I+Γ, S6),
combined with 100 replicates of RSA. Bootstrap support (BP) was evaluated by 1000
pseudoreplicates /100 RSA, and 100 pseudoreplicates/1 RSA for MP, and ML,
respectively. Bayesian analysis included three runs at 3x10
6
generations, implementing
GTR+I+Γ, each with four chains (temperature: 0.15), and random starting trees; sampling
frequency was 1000. Clade posterior probabilities (pP) in the 95 percentile (after burn-in)
were taken as supportive of a topological relationship. Consistent with previous work (1,
3) trees were rooted to mygalomorphs. Analyses reached similar overall topologies, but
differed slightly in the position of individual terminals. The MP strict consensus collapses
all basal nodes, and ML-BP and pP indicate no support.
The relative contribution of gene duplications, and their topological placement versus
speciation events was tested in NOTUNG v.2.1 (S7) by reconciling gene trees with
species trees (species tree according to (5), [edge weights = ML-BP, duplication = 2.0,
loss cost = 0.5]). Additionally, different roots were tested by optimizing the number of
duplications (D) and losses (L), and lowest bounds of duplications were evaluated.
Presence [1] and absence [0], (ambiguous = missing) of MaSps was traced in MacClade
4.08 under ACCTRAN and DELTRAN on the species tree (Fig. 1B, S8). Under all
124
possible most parsimonious root scenarios (= same # of Ds [23] and Ls [62]) the lower
bound for MaSps was estimated to be the araneomorph-mygalomorph split, which
recently was estimated at ca. 340-390 MYA (5). Character tracing clearly maps MaSps at
the base of the spider tree.
References:
S1. J. Gatesy, C. Hayashi, D. Motriuk, J. Woods, R. Lewis, Science 291, 2603 (2001).
S2. N.N. Pouchkina-Stantcheva, S.J. McQueen-Mason, CPB 138, 371–376 (2004).
S3. K. Katoh, K. Kuma, H. Toh and T. Miyata, Nucleic Acids Res. 33, 511-518 (2005).
S4. D.L. Swofford, PAUP* version 4.0b10. Sinauer Associates, Sunderland, Mass.
(2002).
S5. J.P. Huelsenbeck, F. Ronquist, Bioinformatics 17, 754 (2001).
S6. D. Posada D, T.R. Buckley. Systematic Biology 53, 793-808 (2004).
S7. D. Durand, B. V. Halldorsson, B. Vernot. Journal of Computational Biology 13, 320-
335 (2006).
S8. D.R. Maddison, W.P. Maddison. Sinauer Associates, Inc. Mac Clade Version 4.08
(2006)
125
Supplementary Figure Legends
Figure S1. Spidroins expressed by Avicularia juruensis. (A) General molecular structure
from spider silks proteins. (B) Ensemble repeats from Spidroin 1 and Spidroins 2. The
amino acid motifs found in A. juruensis spidroins are represented by: green-A
n
, red-GA
and blue-GS.
Figure S2. ClustalW alignment of C-terminal amino acid sequences from Spidroin 2
from A. juruensis (A.jur) and MaSp2 from Argiope amoema (A.amo), highlighted in
green and yellow respectively (86% identity). Amino acids are indicated by one letter
abbreviations and numbered from N- to C-terminal. Hyphens indicate gaps introduced to
obtain the best alignment. "*" means that the residues or nucleotides in that column are
identical in all sequences in the alignment, ":" means that conserved substitutions have
been observed.
126
Figures
S1
A.
N-terminal Repeats C-terminal
B.
Spidroin 1
YSLASSIASAASSSASSAAAAASSSSAAAGAAAASEAAASAAATSTTTTTSTSRAAAAASAAAAASASGAAG
AAGAASAASAASASSSLQQSLGSALAQSSSFAAAFAQASSAASAAAIAYALAQTVANQIGFSSYSSAFARAA
SSAVYSIGGLASASAYAFAFASAFSQVLSNYGLLNINNA
Spidroin 2
GAG(A/S)GSGSGSGS
S2
A.jur ARLSSPQASSRVSSAFFSLVSSGPTSPGALSNAISSVVSQVSASNPGLSGCDVLVQALLE 60
A.amo SRLSSPQASSRVSSAVSSLVSSGPTNPAALSNAMSSVVSQVSASNPGLSGCDVLVQALLE 60
:**************. ********.*.*****:**************************
A.jur IVS--------------------QYASLVGQSVNQALRY 79
A.amo IVSALVHILGSSSIGQINYAASSQYAQMVGQSVAQALA- 98
*** ***.:***** ***
127
Livros Grátis
( http://www.livrosgratis.com.br )
Milhares de Livros para Download:
Baixar livros de Administração
Baixar livros de Agronomia
Baixar livros de Arquitetura
Baixar livros de Artes
Baixar livros de Astronomia
Baixar livros de Biologia Geral
Baixar livros de Ciência da Computação
Baixar livros de Ciência da Informação
Baixar livros de Ciência Política
Baixar livros de Ciências da Saúde
Baixar livros de Comunicação
Baixar livros do Conselho Nacional de Educação - CNE
Baixar livros de Defesa civil
Baixar livros de Direito
Baixar livros de Direitos humanos
Baixar livros de Economia
Baixar livros de Economia Doméstica
Baixar livros de Educação
Baixar livros de Educação - Trânsito
Baixar livros de Educação Física
Baixar livros de Engenharia Aeroespacial
Baixar livros de Farmácia
Baixar livros de Filosofia
Baixar livros de Física
Baixar livros de Geociências
Baixar livros de Geografia
Baixar livros de História
Baixar livros de Línguas
Baixar livros de Literatura
Baixar livros de Literatura de Cordel
Baixar livros de Literatura Infantil
Baixar livros de Matemática
Baixar livros de Medicina
Baixar livros de Medicina Veterinária
Baixar livros de Meio Ambiente
Baixar livros de Meteorologia
Baixar Monografias e TCC
Baixar livros Multidisciplinar
Baixar livros de Música
Baixar livros de Psicologia
Baixar livros de Química
Baixar livros de Saúde Coletiva
Baixar livros de Serviço Social
Baixar livros de Sociologia
Baixar livros de Teologia
Baixar livros de Trabalho
Baixar livros de Turismo