Download PDF
ads:
UNIVERSIDADE DE SÃO PAULO
INSTITUTO DE QUÍMICA
PROGRAMA DE PÓS-GRADUAÇÃO EM BIOQUÍMICA
ANÁLISE DA EXPRESSÃO DE RNAs
INTRÔNICOS NÃO-CODIFICADORES EM
CARCINOMAS DE CÉLULA RENAL
GLAUBER COSTA BRITO
Orientador: Prof. Dr. Eduardo Moraes Rego Reis
Tese de Doutoramento apresentada ao
Departamento de Bioquímica da
Universidade de São Paulo
São Paulo
Data do Depósito na SPG:
08/10/2007
ads:
Livros Grátis
http://www.livrosgratis.com.br
Milhares de livros grátis para download.
2
GLAUBER COSTA BRITO
ANÁLISE DA EXPRESSÃO DE RNAs
INTRÔNICOS NÃO-CODIFICADORES EM
CARCINOMAS DE CÉLULA RENAL
Tese apresentada ao Instituto de
Química da Universidade de São Paulo
para obtenção do Título de Doutor em
Bioquímica.
Orientador: Prof. Dr. Eduardo Moraes Rego Reis
São Paulo
2007
ads:
3
Glauber Costa Brito
Análise da expressão de RNAs intrônicos não-codificadores em carcinomas de
célula renal
Dissertação apresentada ao Instituto de
Química da Universidade de São Paulo
para obtenção do Título de Doutor em
Bioquímica
Aprovado em: ____________
Banca Examinadora
Prof. Dr. _____________________________________________________
Instituição: ___________________________________________________
Assinatura: ___________________________________________________
Prof. Dr. _____________________________________________________
Instituição: __________________________________________________
Assinatura: ___________________________________________________
Prof. Dr. _____________________________________________________
Instituição: __________________________________________________
Assinatura: ___________________________________________________
Prof. Dr. _____________________________________________________
Instituição: __________________________________________________
Assinatura: ___________________________________________________
Prof. Dr. _____________________________________________________
Instituição: __________________________________________________
Assinatura: ___________________________________________________
4
A Eurico Gracindo de Brito (in memoriam) e Lindaura da Costa de Brito, que sempre
batalharam pela minha educação. Essa tese é fruto dessa batalha.
5
AGRADECIMENTOS
Ao meu orientador, Prof. Dr. Eduardo Reis, pela paciência na orientação e tirocínio lógico-
dedutivo, indispensáveis para indicar, muito acertadamente, a incoerência de muitas das
minhas idéias. Obrigado por mostrar que "uma câmera na mão e uma idéia na cabeça" só
funciona bem com o Glauber do cinema.
Ao Prof. Dr. Sergio Verjovski, pela dedicação ao projeto dessa tese e pela estrutura de
laboratório, ambiente científico e condições de trabalho incomuns num país como o nosso.
Poder usufruir disso foi um privilégio.
À Universidade de São Paulo, pela minha formão acadêmica nesses quase 15 anos e, por
extensão, ao Departamento de Bioquímica do IQ/USP.
A Renato, Denise, Adriana e Camile pelos momentos agradáveis de bandejão, e também,
claro, pelo auxílio técnico.
A Fabrício, à época funcionário do Instituto Ludwig, por ter me ensinado as técnicas de análise
de metilação.
Ao Prof. Dr. André Vettore, à época pesquisador do Instituto Ludwig, pela colaboração nas
análises de metilação.
A Ana Paula Lopes Vidal, indispensável na minha relação com a Fapesp e na organização
burocrática do laboratório.
A Tarik, pelas discussões científicas e culturais, por compartilhar idéias e opiniões.
A Ângela, pela colaboração com dados de pacientes, amostras e RNAs.
A Mílton, Apuã e Abimael, pelas dicas de Perl e Unix.
A Thiago, pelas opiniões científicas, quase sempre discordantes das minhas.
A Jeferson, pelos papos de cafezinho e ajuda no laboratório.
Aos demais colegas de laboratório, especialmente a Ana Cláudia, Kátia, Renato, Denise, Ana
Paula, Tarik, Jeferson, Felipe, Camila, Hélder, Yuri, Giulliana, Lauren, Rodrigo e Ricardo, por
terem tornado o ambiente de trabalho mais leve e divertido.
A Rosane, a quem não dediquei o tempo merecido, em função do tempo dedicado a essa tese.
A Tatiana, grande amiga.
Ao apoio financeiro da FAPESP e CNPq.
6
“E não me esquecer, ao começar o trabalho, de me preparar
para errar. Não esquecer que o erro muitas vezes havia se
tornado o meu caminho. Todas as vezes em que não dava certo
o que eu pensava ou sentia - é que se fazia enfim uma brecha, e,
se antes eu tivesse tido coragem já teria entrado por ela. Mas
eu sempre tivera medo de delírio e erro. Meu erro, no entanto,
devia ser o caminho de uma verdade: pois só quando erro é que saio
do que conheço e do que entendo. Se a “verdade” fosse aquilo
que posso entender - terminaria sendo apenas uma verdade pequena,
do meu tamanho. A verdade tem que estar exatamente no que
não poderei jamais compreender.”
Clarice Lispector, A paixão segundo G.H.
7
RESUMO
Brito, G. C. Análise da expressão de RNAs intrônicos não-codificadores
em carcinomas de célula renal. 2007. 126 p.. Tese (Doutorado) - Programa
de Pós-Graduação em Bioquímica. Instituto de Química, Universidade de São
Paulo, São Paulo.
O carcinoma de célula renal (CCR) subtipo célula clara é o câncer mais letal e
prevalente do sistema urinário. A transformação maligna no CCR está
possivelmente associada à mudanças no perfil de expressão de oncogenes e
genes supressores de tumor, e acredita-se que estas alterações sejam críticas
para o desenvolvimento do fenótipo maligno. Para identificar novos genes e
vias moleculares associadas à transformação maligna no CCR célula clara,
foram analisados perfis de expressão gênica de amostras pareadas de tumor e
tecido não tumoral adjacente de 6 pacientes. Foi utilizada uma plataforma de
microarrays de cDNA contendo 2.292 sondas mapeando éxons de genes
codificadores e 822 sondas de RNAs não-codificadores mapeando em regiões
intrônicas. A transcrição intrônica foi detectada em todos os tecidos normais e
neoplásicos. Utilizando uma combinação de dois testes estatísticos e uma
validação por leave-one-out, foi selecionado um subconjunto de 64 transcritos
com expressão significativamente alterada em CCR célula clara em relação ao
tecido não tumoral adjacente, estando a maior parte (86%) com expressão
diminuída em CCR. Entre os transcritos com expressão diminuída, 49
mapearam em regiões não-traduzidas ou éxons de genes codificadores e 6
mapearam em regiões intrônicas de genes codificadores conhecidos. Os níveis
de expressão diminuída de SIN3B, TRIP3, SYNJ2BP e NDE1 (p < 0,02), e de
transcritos intrônicos derivados dos loci de SND1 e ACTN4 (p < 0,05), foram
confirmados em CCR célula clara por Real-time RT-PCR. Um subconjunto de
25 transcritos se mostrou alterado em 6 amostras adicionais de CCR
nãocélula clara, indicando alterações transcricionais comuns em CCR
independentemente do subtipo histológico ou do estado de diferenciação do
tumor. Além disso, foi analisado o perfil de metilação dos genes com expressão
diminuída em tumor SIN3B, TRIP3, SYNJ2BP e GPX3. Nossos resultados
indicam um novo conjunto de candidatos a gene supressor de tumor, que
8
podem desempenhar um papel importante na transformação maligna de
células renais normais.
Palavras-chave: carcinoma de célula renal, RNA não codificante, transcrição
intrônica, microarrays de cDNA, supressor de tumor.
9
ABSTRACT
Brito, G. C. Expression analysis of intronic noncoding RNAs in renal cell
carcinomas. 2007. 126 p.. Thesis (Doctoral) - Graduate Program in
Biochemistry. Instituto de Química, Universidade de São Paulo, São Paulo.
The clear cell subtype of renal cell carcinoma (RCC) is the most lethal and
prevalent cancer of the urinary system. The carcinogenesis in RCC is thought to
be associated with changes in the expression of several genes, and this
alteration in gene expression is believed to be critical to the development of the
malignant phenotype. To investigate new genes and molecular pathways
associated with malignant transformation in clear cell RCC, gene expression
profiles of matched samples of tumor and adjacent non-neoplastic tissue
obtained from 6 patients were analysed. A custom-built cDNA microarray
platform was used, comprising 2,292 probes that map to exons of genes and
822 probes for noncoding RNAs mapping to intronic regions. Intronic
transcription was detected in all normal and neoplastic renal tissues. A subset
of 64 transcripts with levels significantly deregulated in clear cell RCC relative to
the matched non-tumor tissue, mostly (86%) downregulated in CCR, was
identified by a combination of two statistical tests and leave-one-out patient
cross-validation. Among the down-regulated transcripts, 49 mapped to
untranslated or coding exons and 6 were intronic relative to known exons of
protein-coding genes. Lower levels of expression of SIN3B, TRIP3, SYNJ2BP
and NDE1 (p < 0.02), and of intronic transcripts derived from SND1 and ACTN4
loci (p < 0.05), were confirmed in clear cell RCC by Real-time RT-PCR. A
subset of 25 transcripts was deregulated in additional 6 non-clear cell RCC
samples, pointing to common transcriptional alterations in RCC irrespective of
the histological subtype or differentiation state of the tumor. In addition, the
methylation profile of SIN3B, TRIP3, SYNJ2BP, and GPX3 was analyzed. Our
results indicate a novel set of tumor suppressor gene candidates, including
noncoding intronic RNAs, which may play a significant role in malignant
transformations of normal renal cells.
Keywords: Renal Cell Carcinoma, noncoding RNA, intronic transcription, cDNA
microarray, tumor suppressor.
10
LISTA DE ABREVIATURAS
bp
Pares de bases
CCR
Carcinoma de Célula Renal
CAGE
Cap Analysis Gene Expression
CGAP
Cancer Genome Anatomy Project
ChIP
Imunoprecipitação da cromatina
CT
Cycle Threshold
ENCODE
The Encyclopedia of DNA Elements
EST
Expressed Sequence Tag
FDR
False Discovery Rate
GEO
Gene Expression Omnibus
GO
Gene Ontology
HCGP
Human Cancer Genome Project
kb
Quilobase
miRNA
Micro RNA
MPSS
Massively Parallel Signature Sequencing
mRNA
RNA mensageiro
MSP-PCR
Methylation-Specific PCR
ncRNA
RNA não-codificador para proteínas
nt
Nucleotídeos
OMIM
Online Mendelian Inheritance in Man
ORF
Open Reading Frame
PCR
Reação em Cadeia da Polimerase
qPCR
PCR quantitativo
RACE
Rapid Amplification of cDNA Ends
RefSeq
Reference Sequence
RT-PCR
Transcrição Reversa Reação em Cadeia da Polimerase
SAGE
Serial Analysis of Gene Expression
SAM
Significance Analysis of Microarrays
11
LISTA DE FIGURAS
Página
Figura 1 – Esquema da determinação do status de metilação de ilhas CpG
utilizando as técnicas de BSP e MSP
26
Figura 2 – Desenho esquemático das hibridizações realizadas 38
Figura 3 – Imagem representativa das hibridizações de CCR com microarray
enriquecido em RNAs não-codificadores
39
Figura 4 – Normalização dos dados de expressão 40
Figura 5 – Dependência entre a intensidade média e o desvio-padrão das
réplicas
41
Figura 6 – Matriz de correlação das medidas de intensidade 47
Figura 7 – Expressão de transcritos codificadores para proteínas, e ncRNAs
intrônicos e intergênicos em tecido renal.
49
Figura 8 – Perfil de expressão de CCR célula clara 50
Figura 9 – Perfil de expressão de CCR independente do subtipo histológico 54
Figura 10 – Locus genômico de TACC1 e SLC2A1 55
Figura 11 – Genes diferencialmente expressos em um maior número de
amostras pareadas tendem a estar diminuídos em CCR
57
Figura 12 – Avaliação dos genes alterados em CCR segundo a marcação com
Cy3 ou Cy5
59
Figura 13 – Genes alterados em CCR em diversos estudos 61
Figura 14 – Expressão por Real-Time PCR de candidatos a marcadores de
CCR
62
Figura 15 – Região genômica do cromossomo 16 contendo os loci de MYH11
e NDE1
63
Figura 16 – Verificação do tratamento com bissulfito 65
Figura 17 – Perfil de metilação de sítios CpG de genes sub-expressos em
CCR
66
Figura 18 - Gráfico de saída do programa SAM AnexoII
12
LISTA DE TABELAS
Página
Tabela 1 – Estudos publicados em CCR utilizando Microarrays 22
Tabela 2 – Dados clínico-patológicos dos pacientes 35
Tabela 3 – Primers usados para PCR em tempo real 43
Tabela 4 – Primers usados em BSP 45
Tabela 5 – Relação dos 83 transcritos diferencialmente expressos em CCR 51
13
ÍNDICE
1. INTRODUÇÃO .................................................................................................. 15
1.1 O Carcinoma de Célula Renal (CCR) ............................................................ 15
1.2 Genética do CCR ............................................................................................ 16
1.3 Características Clínicas do CCR .................................................................... 18
1.4 Identificação de marcadores moleculares em CCR ........................................ 20
1.5 Metilação e Câncer ......................................................................................... 24
1.6 RNAs intrônicos não-codificadores................................................................ 27
1.7 Papel dos RNAs não-codificadores no câncer ................................................ 31
2. OBJETIVOS ....................................................................................................... 33
2.1 Objetivos Gerais ............................................................................................. 33
2.2 Objetivos Específicos ..................................................................................... 33
3. MATERIAIS E MÉTODOS ............................................................................... 34
3.1 Amostras de pacientes .................................................................................... 34
3.2 Extração de RNA e marcação de alvos fluorescentes.....................................36
3.3 Hibridização de alvos fluorescentes com microarrays enriquecidos
em ncRNAs intrônicos ................................................................................... 37
3.4 Filtragem e normalização dos dados de expressão gênica ............................. 39
3.5 Identificação de transcritos diferencialmente expressos em CCR.................. 41
3.6 PCR em Tempo Real ...................................................................................... 42
3.7 Análise de Metilação ...................................................................................... 44
4. RESULTADOS .................................................................................................. 47
4.1 Avaliação da qualidade das hibridizações realizadas ..................................... 47
4.2 Expressão de RNAs intrônicos em CCR ........................................................ 48
4.3 Identificação de genes diferencialmente expressos ........................................ 49
4.5 Análise do padrão de metilação de genes com expressão
diminuída em CCR ......................................................................................... 65
5. DISCUSSÃO ...................................................................................................... 69
5.1 Desenho experimental utilizado para identificação de transcritos
diferencialmente expressos em CCR .............................................................. 69
5.2 Comparação dos genes identificados com outros estudos de CCR ................ 70
5.3 Expressão de RNAs não-codificadores em CCR ........................................... 71
5.4 Análises de metilação ..................................................................................... 73
5.5 Genes diferencialmente expressos em CCR ................................................... 74
6. CONCLUSÕES .................................................................................................. 81
7. REFERÊNCIAS ................................................................................................. 82
ANEXO I Curriculum Vitae
ANEXO II Abordagens estatísticas utilizadas para seleção de genes
diferencialmente expressos
14
ANEXO III Artigo submetido para publicação
15
1. INTRODUÇÃO
1.1 O Carcinoma de Célula Renal (CCR)
O Carcinoma de Célula Renal (CCR) é o tipo de câncer mais comum entre
aqueles que surgem no rim de indivíduos adultos, representando 3% de todos os
cânceres no mundo (Kopper et al. 2006). Trata-se de uma doença histopatologicamente
heterogênea, sendo que a maior parte dos casos (70-80% dos CCRs) é do tipo
histológico célula clara, 15-20% são CCR subtipo papilar, 4-5% CCR subtipo
cromófobo, < 1% carcinoma do ducto coletor de Bellini e <1% carcinoma medular renal
(Eble et al. 2004). Os CCRs podem ser classificados em subtipos específicos usando o
sistema de classificação histopatológica da OMS (Organização Mundial de Saúde). Esta
classificação é um preditor importante de comportamento clínico (Yin-Goen et al.
2006). Cada subtipo de tumor renal no sistema da OMS é definido por critérios
patológicos específicos, que enfatizam o padrão de crescimento, morfologia nuclear e
características morfológicas e citoplasmáticas (Amin et al. 2002). Algumas
características adicionais do tumor (Grau nuclear Fuhrman e estadiamento) e variáveis
clínicas, incluindo trombocitose peri-operatória, também são correntemente usadas
como fatores prognósticos para prever a evolução da doença (O'Keefe et al. 2002).
Os diferentes tipos de CCRs podem ser normalmente distinguidos por
características histológicas e anatômicas. Tipicamente os CCRs célula clara são
caracterizados por uma massa infiltrante solitária com padrões de crescimento sólido,
alveolar ou acinar e contendo células de tumor “claras” associadas a anastomose de
vasos sangüíneos. O aspecto “claro” dessas células na microscopia óptica está associado
à presença de lipídeos no citoplasma. Já os tumores CCR papilares são descritos como
16
uma massa circunscrita com cápsula fibrosa, contendo células neoplásicas num padrão
de crescimento papilar, imersas em áreas de necrose. Os CCRs cromófobos apresentam
padrão de crescimento alveolar, com células tumorais contendo núcleos irregulares,
halos perinucleares e citoplasma eosinofílico claro ou granular. Apesar dos critérios
microscópicos evidentes, os tumores CCR freqüentemente apresentam mais de um
componente, fazendo com que muitas vezes a identificação do subtipo histológico seja
difícil e subjetiva. Por exemplo, tumores epiteliais de qualquer tipo podem apresentar
padrões de crescimento sólido, alveolar ou papilar, conter células neoplásicas com
citoplasma claro ou granular, ou apresentar a variante histológica sarcomatóide, a qual
embora não faça parte formalmente do sistema de gradação nuclear (grau Fuhrman),
apresenta um prognóstico bastante negativo, com muitos pacientes morrendo em menos
de 12 meses. A variante sarcomatóide é definida pelo elevado pleomorfismo de suas
células, que apresentam grau variável de células epiteliais claras ou granulares que
caracterizam o CCR (Cangiano et al. 1999).
1.2 Genética do CCR
A maioria dos casos de CCR é esporádica, sendo os principais fatores de risco a
obesidade, o tabagismo e a exposição ocupacional a fatores carcinogênicos. Embora
correspondam a menos de 3% do total de casos. o número absoluto de casos de
síndromes de CCR hereditárias não é desprezível, e apresentam implicações clínicas
importantes. Deve-se suspeitar de uma síndrome herdada quando o CCR é bilateral e/ou
multifocal, ou surge em tenra idade. O diagnóstico pode ser confirmado pela análise dos
principais genes de predisposição (VHL, MET, FH, BHD) (Kopper et al. 2006). O
principal CCR célula clara de origem hereditária está associado à doença de von Hippel-
Lindau (VHL), uma síndrome dominante autossômica de suscetibilidade a tumor (Inoue
17
et al. 2007). Esta doença é causada pela perda de função por mutação em células
embrionárias do gene supressor de tumor VHL no cromossomo 3p25. Além disso, a
perda de função de VHL é a alteração genética mais comum em CCR célula clara
esporádico. Mutações em VHL promovem hipervascularização tumoral; a proteína VHL
atua na ubiquitinização e degradação de HIF1A (fator 1 alfa induzível por hipoxia), o
regulador positivo primário de angiogênese (Na et al. 2003). Raramente o CCR célula
clara surge em outras condições hereditárias, sendo uma exceção a síndrome de
translocação constitucional do cromossomo 3, mapeada em vários sítios de quebra
distintos do locus de VHL (Van Erp et al. 2003).
Os subtipos histológicos de tumor renal estão associados a lesões citogenéticas
distintas, sugerindo a importância da classificação tumoral a partir de marcadores
moleculares e o potencial papel do diagnóstico molecular no tratamento clínico. Várias
abordagens citogenéticas e moleculares têm sido utilizadas para identificar as alterações
genéticas subjacentes ao CCR (Furge et al. 2004). Análise de cariótipo, perda de
heterozigosidade e hibridização genômica comparativa são técnicas que têm contribuído
para estabelecer correlações entre alterações cromossômicas e subtipos histológicos,
resultando num modelo de subclassificação molecular para este câncer (Furge et al.
2004). Os CCRs célula clara tem sido caracterizados por apresentarem deleção do
cromossomo 3p ou ganho de 5q combinados com deleções de dois ou mais
cromossomos 6q, 8p, 9p ou 14q; o CCR papilar é caracterizado por um ganho de dois
ou mais cromossomos 3q, 7, 8, 12, 16, 17 ou 20 e nenhuma perda de 3p; finalmente, o
CCR cromófobo é caracterizado pela perda de dois ou mais cromossomos 1, 2, 6, 10, 13
ou 17. Além disso, evidências sugerem que um ganho do cromossomo 5q em tumores
célula clara pode significar um prognóstico mais favorável, enquanto que uma perda de
14q pode resultar num prognóstico menos favorável (Furge et al. 2004).
18
1.3 Características Clínicas do CCR
Um terço dos pacientes diagnosticados com CCR apresenta ou apresentará
lesões metastáticas durante o curso da doença (Flanigan et al. 2003). O CCR metastático
é atualmente um dos tumores malignos mais resistentes ao tratamento. A quimioterapia
citotóxica clássica apresenta pouca atividade antitumoral contra o CCR (Motzer et al.
2000), sendo que o CCR célula clara apresenta a mais alta taxa de invasão local,
metástase e mortalidade dentre os tumores renais em adultos (Moch et al. 2000; Adjei et
al. 2003) . Os carcinomas papilares e cromófobos são relativamente indolentes, mas
podem metastatizar ou se transformar em malignidades sarcomatóides de grau elevado.
Além disso, o CCR papilar apresenta uma taxa mais elevada de multifocalidade e
associação com doença renal em estágio final em comparação com os outros subtipos de
CCR (Amin et al. 2002).
A nefrectomia radical é a terapia padrão para o CCR localizado, que pode ser
curado por cirurgia. No entanto, 25-40% dos casos apresentam crescimento extra-renal
ou metástase (Amin et al. 2002), e um terço das lesões aparentemente localizadas
desenvolve metástase no período pós-operatório (Gieseg et al. 2002). Para o CCR célula
clara em estágio avançado, a terapia sistêmica de primeira linha envolve interleucina-2
(IL-2) e interferon-alfa (IFN-α). No entanto, a maioria dos tumores subtipo célula clara
não apresenta resposta satisfatória à imunoterapia (Atkins et al. 2004), que em geral
tampouco apresenta bons resultados em subtipos de CCR com histologia diferente de
célula clara (Motzer et al. 2000). As taxas de resposta objetiva com IFN-α variam de
10% a 15% em estudos de Fase III, com aumento de sobrevida mediana de apenas 3-7
meses em comparação à terapia equivalente com placebo (Fossa 2000). Assim, o
19
prognóstico para pacientes com CCR avançado é extremamente ruim e a sobrevida
mediana é de aproximadamente 10 meses (Motzer et al. 2000).
Alguns avanços na elucidação dos mecanismos moleculares subjacentes à
progressão do CCR, tem levado à identificação de alvos promissores para o tratamento
deste tumor e uma mudança no padrão de desenvolvimento de novos fármacos de uma
abordagem por seleção aleatória para uma mais mecanística e racional (Sosman et al.
2007). Inibidores da tirosina quinase, como sorafenib e sunitinib, já foram aprovados
para o tratamento de CCR avançado (Sosman et al. 2007). Outros agentes, como
bevacizumab, um anticorpo direcionado contra o fator de crescimento vascular
endotelial (VEGF) A, também apresentou atividade clínica promissora (Sosman et al.
2007). Os benefícios desses agentes foram reconhecidos devido a elevadas taxas de
resposta objetiva (sunitinib), aumento significativo de sobrevida sem doença (sunitinib,
sorafenib e bevacizumab) ou melhora significativa de sobrevida sem progressão de
doença (temsirolimus) (Sosman et al. 2007). No entanto, a resposta do CCR em estágio
avançado à terapia sistêmica com essas novas drogas ainda é insuficente para aumentar
significativamente a sobrevida de pacientes após 5 anos, que correspondem a menos de
10% dos casos (Motzer et al. 2000).
Uma revisão da literatura não identificou nenhum marcador capaz de
individualmente diagnosticar ou prognosticar com eficácia o surgimento ou evolução
deste câncer (Ficarra et al. 2002). Assim, a identificação de genes diferencialmente
expressos entre tecido normal e tumoral, o foco do presente trabalho, pode contribuir
para o desenvolvimento de novos marcadores tumorais capazes de diagnosticar
prematuramente o CCR e conseqüentemente aumentar a chance de sobrevida ou cura
dos pacientes. Uma outra aplicação da identificação de genes diferencialmente
expressos em tumores renais é fornecer subsídios para o desenvolvimento de
20
ferramentas anti-neoplásicas que tenham como alvo estes genes ou as vias de regulação
em que estes estão envolvidos. Por exemplo, pode-se desenvolver anticorpos
terapêuticos como aqueles descritos contra o receptor de fator de crescimento
epidérmico, os quais apresentaram atividade in vitro contra o carcinoma de célula renal
(Michael et al. 2003).
1.4 Identificação de marcadores moleculares em CCR
Os métodos clássicos de análise de expressão gênica, como northern blot e RT-
PCR, se limitam a avaliação de um número limitado de genes e amostras. Por outro
lado, os microarrays de DNA são ferramentas poderosas porque podem quantificar o
nível de expressão de milhares de transcritos de uma única vez. Os chamados chips de
DNA são matrizes sólidas (tipicamente lâminas de vidro) contendo milhares de
elementos arranjados com alta densidade, sendo cada elemento (chamados de “sondas”)
constituido por moléculas de DNA identicas. Nos experimentos de expressão gênica, os
microarrays são hibridizados contra cDNA ou cRNA derivados de mRNA das amostras
biológicas que se pretende estudar (chamados “alvos”), tipicamente marcados com uma
molecula fluorescente. A quantidade de alvos fluorescentes hibridizados por
complementaridade com as sondas representadas nos microarrays fornecem uma
medida relativa da expressão gênica (Quackenbush 2002). Há fortes evidências recentes
de que o perfil de expressão gênica global possa revelar subtipos clínicos com base na
heterogeneidade subjacente dos mecanismos neoplásicos do CCR (Takahashi et al.
2001; Young et al. 2001; Skubitz et al. 2002). Assim, o uso clínico do perfil de
transcrição pode resultar em diagnósticos mais exatos e objetivos, bem como melhores
prognósticos de doença ou de resposta a tratamento.
21
Utilizando microarrays de DNA, é possível comparar simultaneamente os níveis
de expressão relativa de vários milhares de genes em diferentes tipos celulares.
Considerando que dos 20.000 - 25.000 genes humanos, segundo recente estimativa do
IHGSC (International Human Genome Sequencing Consortium) (2004), menos da
metade desses tem sua função compreendida, sendo que a análise em larga escala da
expressão pode revelar genes co-regulados pertencentes a uma mesma via
eventualmente implicada na patologia do CCR. Deve-se ressaltar ainda que menos de
3% dos genes identificados foram caracterizados em doença renal, sugerindo a
necessidade de técnicas de genômica funcional nesta área de pesquisa (Kurella et al.
2001). Nesse sentido, o uso de microarrays de DNA tem se constituído uma importante
abordagem na identificação de genes diferencialmente expressos e de eventos
moleculares envolvidos no CCR, particularmente a subclasse histológica célula clara.
Vários grupos avaliaram se a expressão gênica poderia complementar o exame
histopatológico para classificação de tumores renais (Boer et al. 2001; Young et al.
2001; Gieseg et al. 2002; Skubitz et al. 2002; Higgins et al. 2003; Takahashi et al. 2003;
Yamazaki et al. 2003; Furge et al. 2004; Schuetz et al. 2005; Sultmann et al. 2005; Yao
et al. 2005; Rohan et al. 2006), auxiliar na classificação prognóstica (Motzer et al. 1999;
Takahashi et al. 2001; Twine et al. 2003; Vasselli et al. 2003; Kosari et al. 2005) ou
identificar expressão diferencial entre tecido tumoral e tecido não-tumoral adjacente
(Moch et al. 1999; Boer et al. 2001; Takahashi et al. 2001; Young et al. 2001; Gieseg et
al. 2002; Skubitz et al. 2002; Higgins et al. 2003; Hirota et al. 2006). Um resumo dos
trabalhos realizados em CCR, indicando as amostras analisadas e a plataforma utilizada
em cada um deles é apresentado na Tabela 1.
22
Tabela 1 - Estudos publicados em CCR utilizando microarrays.
ESTUDO AMOSTRAS PLATAFORMA OBSERVAÇÕES
Yang et al., 2006 9-CC-CCR, 4 P-CCR, 2
CM-CCR, 1 ONC
cDNA (21.632
clones)
Classificação diagnóstica
Sultmann et al.,
2005
65 CC-CCR, 13 P-CCR, 9
CM-CCR
cDNA (4.200
clones)
Classificação diagnóstica;
classificação prognóstica;
correlação com citogenética
Yao et al., 2005 29 CC-CCR, 3 CM-CCR, 1
TW
Affymetrix U95A
(10.000 genes)
Classificação diagnóstica;
identificação de marcadores
imunohistoquímicos
Yao et al., 2005 29 CC-CCR, 3 CM-CCR, 1
TW
Affymetrix U95A
(10.000 genes)
Classificação diagnóstica;
identificação de marcadores
imunohistoquímicos
Schuetz et al.,
2005
13 CC-CCR, 5 P-CCR, 4
CM-CCR, 3 ONC, 6 AML
Affymetrix HG-
Focus (8.700
genes)
Classificação diagnóstica;
identificação de marcadores
imunohistoquímicos
Furge et al., 2004 60 CC-CCR, 5 P-CCR, 16
CM-CCR, pareado
cDNA (23.000
clones)
Classificação diagnóstica,
inferência de anormalidades
citogenéticas
Liou et al., 2004 Pool de CC-CCR e de
linhagens celulares de CCR
Affymetrix Hugene
FL (5.600 genes)
Discriminação de CCR de rim
não-neoplásico
Higgins e al.,
2003
28 convencionais (CC-
CCR), 4 P-CCR, 3 CM-
CCR, 2 ONC, 1 AML
cDNA (23.000
clones)
Classificação diagnóstica;
identificação de marcadores
imunohistoquímicos
Takahashi et al.,
2003b
39 CC-CCR, 8 P-CCR, 5
CM-CCR, 6 G-CCR, 5 S-
CCR, 2 ONC, 3 CU, 5 TW,
rim não-neoplásico.
cDNA (23.000
clones)
Classificação diagnóstica;
classificação prognóstica;
identificação de marcadores
imunohistoquímicos
Lenburg et al,
2003
18 CC-CCR, 9 pareados Affymetrix
U133A/B (45.000
sondas)
Discriminação entre CCR e rim
não-neoplásico; comparação
com perfis de expressão de
outros estudos
Copland et al.,
2003
CCR localizado ou
metastático, linhagens
celulares de CCR
Affymetrix U95A
(10.000 genes)
Identificação de TGF-β
aberrante como envolvido na
carcinogênese e progressão do
CCR
Yamazaki et al.,
2003
10 CC-CCR, 2 P-CCR, 3
CM-CCR
Affymetrix U95A
(10.000 genes)
Classificação diagnóstica;
identificação de marcadores
imunohistoquímicos
Vasselli et al.,
2003
58 CCR estágio IV, 8
pareados
cDNA (64.000
clones)
Classificação prognóstica
Young et al.,
2001; Young et
al., 2003
4 CC-CCR, 3 P-CCR, 2
CM-CCR, 1 ONC, pareado
cDNA (7.000
clones)
Classificação diagnóstica;
identificação de marcadores
imunohistoquímicos
Skubitz e Skubitz,
2002
8 CC-CCR, 11 amostras
normais e 8 tumorais, 256
outros tecidos
Affymetrix U95
(63.000 sondas)
Padrão de expressão para
diferenciar CCR de rim não-
neoplásico e de outros tecidos
Gieseg et al., 2002 9 CC-CCR, 2 CM-CCR, 1
CU, 1 AM, 8 amostras
pareadas
Affymetrix Hugene
FL (5.600)
Classificação diagnóstica;
discriminação entre CCR de rim
não-neoplásico
Takahashi et al.,
2001
29 CC-CCR, pareado cDNA (22.000
clones)
Classificação prognóstica
Boer et al., 2001 37 tumores renais, pareado cDNA (31.500
clones)
Classificação diagnóstica;
correlação com estágio do tumor
CC-CCR: Carcinoma de célula renal (CCR) subtipo célula clara; P-CCR: CCR subtipo papilar; CM-CCR:
CCR subtipo cromófobo; G-CCR: CCR granular; S-CCR: CCR subtipo sarcomatóide; ONC:
23
Oncocitoma; AML: Angiomiolipoma; CU: carcinoma urotelial; TW: tumor de Wilms; AM: adenoma
metanéfrico. Tabela baseada em Yin-Goen et al., 2006.
Boer et al. estudaram 32 CCRs primários e 5 metastáticos utilizando um chip de
cDNA com 31.500 seqüências (21.875 transcritos distintos), das quais
aproximadamente 30% representavam genes conhecidos, enquanto que o restante eram
ESTs que não mapeavam em genes conhecidos (Boer et al. 2001). Nesse estudo, foram
identificados 1.738 genes diferencialmente expressos entre tecido tumoral e normal
adjacente. Muitos dos genes identificados com expresão aumentada em CCR estavam
envolvidos em adesão celular e metabolismo de ácido nucléico. Por outro lado, genes
que codificam proteínas de transporte e proteínas envolvidas em transporte de elétrons
estavam com expressão diminuída. Em um estudo subseqüente, o mesmo grupo estudou
um conjunto mais amplo de 112 CCRs, onde foram identificados 32 genes marcadores
capazes de discriminar entre os carcinomas célula clara, papilar e cromófobo. Nesse
estudo foi possível correlacionar as alterações de expressão gênica com anormalidades
cariotípicas, presença de metástases e progressão do tumor (Sultmann et al. 2005).
Outros investigadores exploraram a função geral de grupos de genes com
expressão alterada e encontraram resultados semelhantes. Liou et al., utilizando
microarrays de oligonucleotídeo Affymetrix, estudaram seis amostras de CCR célula
clara em comparação a tecidos normais adjacentes (Liou et al. 2004). Estes
investigadores observaram que genes de adesão celular tendiam a apresentar expressão
aumentada, enquanto que os genes de transporte estavam diminuídos. Gieseg et al.
estudaram oito rins normais em comparação a nove CCRs célula clara, dois carcinomas
cromófobos, um carcinoma urotelial e um adenoma metanéfrico. Eles identificaram que
o CCR célula clara apresenta expressão relativamente elevada de genes envolvidos em
transdução de sinal, organização de matriz celular e adesão (Gieseg et al. 2002). Um
estudo utilizando um array de 60.000 elementos comparou amostras de CCR célula
24
clara com rim norma, identificando 151 genes e 115 ESTs com nível de expressão em
CCR quatro vezes maior do que no rim normal e 35 genes e 19 ESTs 10 vezes menos
expressos em CCR em comparação ao rim normal (Skubitz et al. 2002). Jones e
colaboradores compararam amostras de rim normal com CCR célula clara identificando
como diferencialmente expressos em tumores genes que codificam especificamente para
proteínas secretadas e receptores de superfície celular (Jones et al. 2005). O racional
desta abordagem foi que proteínas secretadas representam potenciais candidatos a
diagnóstico sérico, enquanto que os receptores poderiam ser potenciais alvos
terapêuticos (Jones et al. 2005). Lenburg et al. utilizaram um chip Affymetrix com
45.000 seqüências para estudar 18 amostras de CCR, identificando por meio desta
abordagem 1.234 genes diferencialmente expressos entre tecido tumoral e normal. A
análise mostrou que os genes com expressão alterada em tumores estavam associados a
hipoxia, angiogênese, fator de necrose de tumor, apoptose, interferon, resistência a
medicamento e metástase (Lenburg et al. 2003).
Embora esses trabalhos tenham revelado diversos genes e vias metabólicas
associadas a malignidade dos tumors renais, o conhecimento gerado a partir de análises
globais de expressão gênica não se traduziu até o momento no desenvolvimento de
novas abordagens mais efetivas para o diagnóstico, prognóstico ou tratamento do CCR.
1.5 Metilação e Câncer
No genoma de mamíferos, a metilação do DNA é escassa e ocorre apenas em
bases de citosina localizadas a 5’ de uma guanosina num dinucleotídeo CpG e resulta da
atividade de uma família de enzimas DNA metiltransferases (DNMT 1, 3a ou 3b) que
catalisam a adição de um grupo metila da S-adenosilmetionina (SAM) para o carbono 5
25
da citosina em dinucleotídeos CpG (Bird 2002). Este dinucleotídeo está sub-
representado no genoma, porém regiões curtas de até 4 kb, conhecidas como ilhas CpG,
são ricas em conteúdo CpG (Bird 2002; Takai et al. 2002).
Em eucariotos superiores, a maior parte das ilhas CpG se localiza na vizinhança
de regiões promotoras, próximas ao início de transcrição. Cerca de metade dos genes de
mamíferos apresentam ilhas CpG nas regiões promotoras, que geralmente encontram-se
não-metiladas em células normais. A hipermetilação de ilhas CpG em promotores é a
alteração epigenética mais bem caracterizada em neoplasias e é encontrada em
virtualmente todos os tipos de câncer, estando associada ao silenciamento transcricional
inadequado de genes (Jones et al. 1999; Baylin et al. 2000). O silenciamento da
expressão gênica causado por hipermetilação da região promotora é tão comum em
tumores quanto a inativação clássica de genes supressores de tumor por meio de
mutação. De fato, quase 50% dos genes que causam formas hereditárias de câncer
quando mutados em células germinativas, apresentam também silenciamento mediado
por metilação em várias formas esporádicas de câncer (Jones et al. 2007).
Existem vários métodos para detecção de alterações do padrão de metilação em
ilhas CpG, sendo que a maioria dessas técnicas utiliza tratamento com bissulfito de
sódio para detecção do estado de metilação do DNA (Grunau et al. 2001). O bissulfito
de sódio induz a conversão de citosina não-metilada em uracila, a qual é convertida a
timina em uma reação de PCR subsequente. A citosina metilada, 5-metilcitosina, é
resistente ao tratamento com bissulfito e desse modo é amplificada no PCR como
citosina. O status de metilação da região de interesse pode ser determinada através de
seqüenciamento de DNA tratado com bissulfito. Para executá-lo, é necessário antes
26
amplificar uma determinada região da ilha CpG utilizando primers complementares ao
DNA convertido por bissulfito (BSP Bisulfite-Specific PCR) (Jeronimo et al. 2001).
Alternativamente, o status de metilação de uma determinada região pode ser
avaliado através da amplificação por PCR do DNA tratado com bissulfito utilizando
pares de primers que discriminam citosinas metiladas e não-metiladas (MSP
Methylation-Specific PCR). Um esquema das técnicas de BSP e MSP é apresentado na
Figura 1 a seguir.
Figura 1 – Esquema da determinação do status de metilação de ilhas CpG utilizando as técnicas
de BSP e MSP. Na análise de BSP (Bissulfite-Specific PCR), apenas o DNA tratado com
bissulfito é amplificado, já que o par de primers diferencia citosina não convertida em uracila
(U) da citosina convertida em U. Na análise por MSP (Methylation-Specific PCR), são
utilizados dois pares de primers, um deles específico para citosina metilada, e o outro par,
específico para citosina não-metilada. A obteção de produto indica o estado de metilação do
DNA na região dos primers utilizados.
Existe na literatura uma lista crescente de genes metilados em CCR,
incluindo VHL, p16INK4A, APC, GSTP, DAPK, CDH1I, RASSFA1, DAL-1/4.1B, γ-
catenina, SPINT2 e HOXB13 (Breault et al. 2005; Morris et al. 2005; Okuda et al. 2006;
Yamada et al. 2006). No entanto, a maioria desses genes supressores de tumor apresenta
uma freqüência relativamente baixa de metilação em CCR. Diferente de outros
27
carcinomas, as freqüências de metilação anormal da maioria dos genes supressores de
tumor clássicos, como VHL, p16, APC, GSTP, ARF, DAPK, CHFR, MLH1 e CDH1 são
menores que 30% em CCR (Herman et al. 1994; Sanz-Casla et al. 2003; Dulaimi et al.
2004; Okuda et al. 2006) sugerindo que esses genes não são provavelmente os alvos
principais para silenciamento por metilação nesse câncer. Assim, são necessários mais
estudos para identificar potenciais biomarcadores epigenéticos com um perfil de
metilação mais robusto para uso em diagnóstico ou prognóstico de CCR. Neste trabalho
foi investigado o padrão de metilação de genes com expressão diminuída em CCR com
o objetivo de avaliar a frequência de alterações epigenéticas do tipo hipermetilação da
região promotora em tumores renais.
1.6 RNAs intrônicos não-codificadores
A transcrição de RNA é a primeira etapa na transferência de informações
codificadas num genoma a fim de produzir as características fenotípicas de um
organismo. Até recentemente, o esforço de caracterização da atividade transcricional
nas células foram desenvolvidos no sentido de caracterizar a abundância e/ou variações
na sequência (polimorfismos, splicing alternativo) de transcritos codificadores para
proteínas. Estudos recentes têm demonstrado que a maior parte do genoma humano é
transcrito na forma de RNAs, embora apenas uma pequena fração (2 a 5% do total)
corresponda a regiões exônicas de genes codificadores para proteína (Shoemaker et al.
2001; Kapranov et al. 2002; Bertone et al. 2004; Cheng et al. 2005). Esses estudos são
principalmente baseados na utilização de tiling arrays genômicos, onde sondas são
colocadas em intervalos regulares ao longo de todo o genoma ou de uma região de
interesse, independente de anotação ou evidência anterior de transcrição (Shoemaker et
28
al. 2001; Kapranov et al. 2002; Bertone et al. 2004). Utilizando tilling arrays cobrindo a
seqüência genômica dos cromossomos 21 e 22, foi possível observar um número de
regiões transcricionalmente ativas entre 2 a 10 vezes maior do que o esperado para
regiões exônicas dos genes humanos conhecidos (Kapranov et al. 2002; Rinn et al.
2003; Kampa et al. 2004).
Um estudo recente realizado por nosso grupo, analisando o conjunto de
seqüências expressas no Genebank, identificou que 74% dos genes humanos apresentam
evidência de transcrição intrônica (Nakaya et al. 2007). Um oligoarray com 44 mil
elementos contendo sondas para um conjunto de transcritos intrônicos selecionados
aleatoriamente foi hibridizado com 3 tecidos humanos diferentes e revelou que esses
transcritos são expressos com orientação senso ou antisenso em frações equivalentes
(Nakaya et al. 2007). Interessantemente, os ncRNAs intrônicos mais abundantes
mapeiam em genes codificandores para proteína que têm função relacionada com a
regulação da transcrição (Nakaya et al. 2007). A análise dos dados identificou ainda
conjutos de ncRNAs totalmente ou parcialmente intrônicos com expressão tecido-
específica, alguns dos quais apresentam padrão de expressão correlacionado
(diretamente ou inversamente) com o do transcrito codificante para proteína
correspondente (Nakaya et al. 2007).
Mais recentemente, o projeto ENCODE se propôs catalogar todos os elementos
funcionais do genoma humano utilizando vários métodos de análise em larga-escala,
começando por coletar e analisar dados em 1% do genoma (~ 300 Mb) na fase piloto do
projeto. Um aspecto importante do projeto ENCODE é que estão sendo utilizadas
técnicas diferentes para se abordar a mesma questão, combinando microarrays de DNA
e técnicas de seqüenciamento com análises computacionais. Os primeiros resultados
29
obtidos nesse estudo colaborativo confirmam as observações anteriores de que uma
parte muito maior do que se acreditava do DNA genômico é transcrita na forma de
RNAs não-codificadores para proteínas (ncRNAs) (Birney et al. 2007). Embora ainda
seja desconhecida a função da maior parte dos ncRNAs, estudos em outros organismos
têm demonstrado que em mamíferos o número de RNAs não-codificadores é
substancialmente maior que em eucariotos inferiores, especialmente quando se
considera que o número de genes codificadores para proteínas não diverge
significativamente entre espécies muito distantes em termos evolutivos. Essa
observação tem sido utilizada como argumento para explicar o aumento da
complexidade dos eucariotos superiores a partir da expansão do número de ncRNAs
nesses organismos, que constituiriam uma camada adicional de elementos controladores
da expressão gênica (Mattick 2003; Mattick 2004).
Alguns ncRNAs podem produzir silenciamento transcricional através da
regulação da estrutura da cromatina. O exemplo mais clássico dessa regulação em
eucariotos é a inativação transcricional do segundo cromossomo X em fêmeas
(compensação de dose). Isto envolve um ncRNA muito grande, conhecido como X-
inactive-specific transcript (Xist). A transcrição de Xist no cromossomo X é crucial
para manutenção do estado inativo, porém seu mecanismo exato não é bem esclarecido
(Goodrich et al. 2006). Recentemente, foi mostrado que ncRNAs curtos, além de ter por
alvo a estrutura de cromatina, onde atuam para silenciar a expressão gênica, eles
também direcionam a degradação de RNA e bloqueiam a tradução. Os ncRNAs
envolvidos apresentam tipicamente 21-28 nucleotídeos de comprimento, e são
coletivamente conhecidos como microRNAs (miRNAs) e RNAs curtos de interferência
(siRNAs), cujo funcionamento se dá por meio de seqüências homólogas em genes alvos
(Almeida et al. 2005). O silencimento mediado por RNA foi inicialmente caracterizado
30
em Arabidopsis thaliana, e mais recentemente foi também identificado em células
humanas, mostrando que este mecanismo de controle de transcrição é conservado
(Almeida et al. 2005). No caso dos siRNAs, a transcrição é bloqueada quando eles,
como parte integrante de um grande complexo protéico, são direcionados para
seqüências homólogas em genes. Isto resulta no recrutamento de fatores, como a DNA
metiltransferase e a histona metiltransferase que metilam DNA e histonas,
respectivamente, resultando no silenciamento da transcrição a partir de regiões-alvo do
genoma. Os siRNAs podem portanto direcionar a regulação gene-específica de
modificações da cromatina, e assim controlar a transcrição (Almeida et al. 2005).
Análises informáticas dos bancos de dados de seqüências expressas (Yelin et al.
2003) e experimentos de tiling arrays (Kapranov et al. 2005) revelaram que uma fração
significativa dos RNAs transcritos no genoma humano formam pares senso-antisenso. A
maioria desses transcritos antisenso é codificada em cis, ou seja, são transcritos a partir
da fita oposta do mesmo loci genômico a partir de seus pares senso. Resultados
semelhantes foram observados a partir da análise do transcriptoma de camundongo,
sugerindo que a transcrição de pares senso-antisenso tenha uma função biológica
relevante e que por isso tenha sido mantida ao longo da evolução (Kiyosawa et al. 2003;
Katayama et al. 2005; Siddiqui et al. 2005).
A regulação por transcritos antisenso parece estar envolvida em muitos aspectos
da regulação gênica, incluindo regulação da tradução, imprinting genômico,
interferência de RNA, splicing alternativo, inativação do cromossomo X, edição de
RNA e silenciamento da heterocromatina (revisados em (Lavorgna et al. 2004)), além
de estados patológicos como câncer (Lavorgna et al. 2004; Reis et al. 2004) ou doenças
neurológicas (Korostishevsky et al. 2004; Korneev et al. 2005). Estudos recentes têm
31
sugerido que a regulação antisenso é provavelmente um mecanismo de regulação gênica
bastante comum em humanos, podendo atuar de modo positivo ou negativo (Chen et al.
2005; Chen et al. 2005). No entanto, os aspectos funcionais dessa regulação não estão
bem estabelecidos, de modo que a identificação de pares senso-antisenso regulados em
diferentes contextos pode lançar luz sobre os mecanismos subjacentes a esses processos.
1.7 Papel dos RNAs não-codificadores no câncer
O câncer tem sido considerado há quase três décadas como uma doença
resultante de mutações que afetam a expressão ou a estrutura de ongenes e/ou genes
supressores de tumor codificadores de proteína. No entanto, com a identificação de
genes que produzem RNAs sem uma ORF significativa, tornou-se evidente que a
complexidade do câncer não poderia mais ser abordada exclusivamente através da
porção do genoma que codifica para proteínas. Dessa mudança de paradigma, resultou a
percepção de que transcritos não-codificadores poderiam auxiliar no diagnóstico e
prognóstico do câncer. Por exemplo, as alterações no nível de expressão dos
microRNAs (miRNAs) - pequenos RNAs não-codificadores de 20-22 nucleotídeos
envolvidos em processos biológicos importantes, incluindo desenvolvimento,
diferenciação, apoptose e proliferação - foram identificadas inicialmente em leucemia
linfocítica crônica de célula B (Calin et al. 2002). O mecanismo de ação de microRNAs
no silenciamento da expressão gênica já é bastante conhecido atualmente, e envolve a
regulação transcricional e/ou pós-transcricional de mRNAs-alvo dependente de
pareamento entre o miRNA e o mRNA–alvo e ativação de sistemas enzimáticos
específicos (Bartel 2004). Alterações nos níveis de miRNAs foram posteriormente
detectadas por vários grupos em diferentes tipos de tumores humanos (Calin et al. 2004;
32
Iorio et al. 2005; Lu et al. 2005; Volinia et al. 2006). O potencial uso de microRNAs na
clínica é evidenciado pelo trabalho de Lu e colaboradores, que utilizaram o perfil de
expressão de miRNAs para classificar corretamente 12 de 17 carcinomas mal-
diferenciados, enquanto que um método baseado em apenas mRNAs classificou
corretamente somente um desses carcinomas (Lu et al. 2005).
Utilizando um microarray de DNA inovador, enriquecido em fragmentos de
seqüências expressas em íntrons de genes conhecidos e em regiões intergênicas, nosso
grupo mostrou pela primeria vez que ncRNAs intrônicos longos, sem splicing,
apresentam transcrição ubíqua no tecido prostático humano, e que os níveis de
expressão de um subconjunto desses ncRNAs intrônicos se correlacionam com o grau
de malignidade de tumores de próstata (Reis et al. 2004). Mais recentemente, nosso
grupo também mostrou que ncRNAs intrônicos regulados por andrógeno podem
modular, provavelmente agindo em cis, a abundância ou o padrão de uso de éxon em
uma linhagem celular de tumor próstata em cultura (Louro et al. 2007).
Uma característica comum a todos os trabalhos de análise da expressão gênica
em CCR baseados em microarrays de DNA é que as plataformas utilizadas estavam
enriquecidas em sondas para transcritos codificadores de proteínas. Neste estudo,
pretendemos extender a caracterização da expressão de ncRNAs intrônicos a amostras
de CCR de modo a avaliar um possível papel dessa classe de transcritos nos processos
de transformação maligna de tumores renais. Além de contribuir para o entendimento
das bases moleculares do CCR, esse estudo também pretende colaborar para a
identificação de novos marcadores tumorais, incluindo ncRNAs intrônicos, com
potencial aplicação no diagnóstico e/ou tratamento da doença.
33
2. OBJETIVOS
2.1 Objetivos Gerais
Analisar perfis de expressão gênica em amostras clínicas de tecido renal para
determinar o padrão de expressão de RNAs intrônicos não-codificadores.
Identificar novos candidatos a marcadores moleculares para diagnóstico ou alvos
para tratamento de CCR.
2.2 Objetivos Específicos
Obter perfis de expressão gênica de uma coleção de amostras de carcinoma de
célula renal e tecido não-tumoral adjacente utilizando microarrays de DNA
contendo sondas para RNAs não-codificadores intrônicos e transcritos codificadores
para proteína.
Identificar genes diferencialmente expressos entre o tecido tumoral e não-tumoral
adjacente em amostras de CCR subtipo histológico célula clara.
Validar a expressão de transcritos com expressão alterada em CCR por metodologia
independente (RT-PCR quantitativo).
Avaliar o padrão de metilação da região promotora de genes com expressão
diminuída em CCR.
34
3. MATERIAIS E MÉTODOS
3.1 Amostras de pacientes
Foram analisados perfis de expressão gênica de 24 amostras pareadas de tumor e
tecido não-tumoral adjacente de 12 pacientes com CCR submetidos a nefrectomia
radical no Instituto Nacional de Câncer INCA (Rio de Janeiro, Brasil). Nos
experimentos de validação por qRT-PCR, foram analisadas 10 amostras adicionais de
tecido tumoral/não-tumoral adjacente pareadas, obtidas de 5 pacientes com CCR. As
amostras de tecido fresco foram obtidas de pacientes submetidos a nefrectomia radical,
sendo congeladas em nitrogênio líquido até cerca de 15 minutos após a ressecção
cirúrgica e mantidas nessa condição até o processamento para extração do RNA. Todos
os pacientes assinaram termo de consentimento informado autorizando a utilização das
amostras para este projeto de pesquisa, também aprovado pelo Comitê de Ética do
INCA. Posteriormente, todas os fragmentos de tecido foram revisados e classificados
por um mesmo patologista de acordo com a “WHO Histological Classification of
Tumors of the Kidney” (Eble et al. 2004) e diagnosticadas como CCR célula clara (10
amostras de tumor), CCR papilar (4 amostras de tumor), CCR cromófobo (1 amostra), 1
CCR célula clara com extensa diferenciação sarcomatóide e 1 CCR com origem não
determinada. O grau Fuhrman das amostras variou de II a IV. A maior parte dos
tumores apresentou evidência de necrose (76%) e tamanho maior que 5 cm (82%). O
estado clínico da doença se mostrou heterogêneo entre os pacientes: seis apresentaram
metástase, três apresentaram doença localmente avançada e quatro apresentaram
tumores localizados. A análise de seções coradas de tecido utilizando
35
hematoxilina/eosina (HE) mostrou que o estroma estava pouco desenvolvido entre todas
as amostras analisadas. Os fragmentos de tecido não-tumoral adjacente foram
analisados por HE para verificar a ausência de células neoplásicas. Os dados
anatomopatológicos das amostras de tumor analisadas estão apresentados na Tabela 2.
Tabela 2 – Dados clínico-patológicos dos pacientes cujas amostras foram utilizadas nas análises
de microarray, metilação e qRT-PCR.
Paciente
Grau
Nuclear
Fuhrman
Subtipo
Histológico
Dimensões
do Tumor
Primário
(cm)
Evidência
de
Necrose
Estádio
Clínico
Acompanhamento
(mêses)
Estadio da
Doença
3 IV célula clara 6 x 7 x 4 Sim pT3bN0M1 21 metastático
5 II/IV célula clara 8 x 8 x 5 Sim pT2N1M1 6 metastático
9 II célula clara 8 x 6 Sim pT3aN0Mx 54 localmente
avançado
12 II célula clara 4 x 3 x 2 Não pT1aN0Mx n.a.* localizado
15 IV célula clara 10 x 10 x 8 Sim T3N2Mx n.a. n.a.
24 IV célula clara 15 x 11 x 7 Sim pT3aN0Mx 16 metastático
26 II célula clara 7 x 6 x 5 Não T3aNXM0 58 localizado
28 III célula clara 5 x 3 x 3 Sim pT1bN0Mx 20 localizado
31 II célula clara 8 x 6 Sim pT3bN2M1 40 metastático
32 II célula clara 13 x 8 Não pT3aN0Mx 17 localmente
avançado
27 III cromófobo 7 x 6 x 3 Não pT2N0Mx 68 localizado
4 III/IV papilar 16 x 11 x 8 Sim pT3aN0Mx n.a. n.a.
14 IV papilar 8 x 7 x 6 Sim pT3bN0M0 58 localmente
avançado
16 III papilar 16 x 12 Sim pT3aN2Mx n.a. n.a.
19 III papilar 8 x 7 Sim pT3aN0Mx 49 n.a.
23 IV sarcomatóide
(célula clara)
9 x 7 Sim pT3bN0Mx n.a. metastático
22 II CCR não-
classificado
15 x 10 x 9 Sim pT3aN0Mx 7 metastático
n.a.: informação não disponível.
36
3.2 Extração de RNA e marcação de alvos fluorescentes
Para isolamento do RNA total, cerca de 200 mg de tecido das amostras
congeladas foram pulverizados em um almofariz contendo nitrogênio líquido,
ressuspendidos no reagente TRIZOL (Invitrogen), seguido por extração com
clorofórmio e precipitação com álcool de acordo com as instruções do fabricante.
Alíquotas de RNA total extraído de cada amostra foram separadas em gel de agarose
para avaliação da integridade do RNA, medida pela observação de bandas intactas
correspondentes às subunidades 28S e 18S do RNA ribossomal. A quantidade de RNA
nas frações foi estimada pela leitura da absorbância a 260 nm. O grau de pureza das
prepações de RNA em relação a contaminantes protéicos foi avaliada pela leitura e
cálculo da razão 260/280 nm. Foi definido como critério de qualidade que todas as
amostras utilizadas nas análises de microarray deveriam apresentar razão 260/280 > 1,8
e, por inspeção visual, as bandas 28S e 18S deveriam apresentar razão igual ou superior
a 1.
A marcação fluorescente das amostras de RNA para obtenção de alvos para
hibridização foi realizada através de reação de transcrição reversa, com a utilização de
primers randômicos e oligo-dT, além de análogos fluorescentes de dCTP, utilizando o
kit CyScribe first-strand cDNA labeling kit (GE Healthcare), de acordo com o protocolo
do fabricante. Esta marcação foi realizada com o uso da química Cy3 ou Cy5 de modo a
obter duas populações diferentes de cDNAs marcados, o que permitiu realizar
comparações diretas, na mesma lâmina, entre as duas amostras em estudo (RNA de
tecido tumoral ou não-tumoral adjacente do mesmo paciente). Em cada marcação foram
utilizados 10 μg de RNA total. Os cDNAs marcados foram purificados utilizando placas
de filtro (Millipore), transferidos para cubetas de quartzo e quantificados medindo-se a
37
absorbância da solução a 550 nm (Cy3) ou 650 nm (Cy5). Antes da hibridização, os
alvos de cDNA marcados com Cy3 ou Cy5 foram combinados e evaporados num
speedvac a 30ºC. Imediatamente antes da hibridização com os microarrays, os alvos de
cDNA foram ressuspensos num volume total de 300 µl de solução de hibridização
(Microarray hybridization Buffer v.2 – Amersham Biosciences) em formamida 50% e
incubados a 92ºC por 2 minutos para desnaturação do cDNA.
3.3 Hibridização de alvos fluorescentes com microarrays enriquecidos em
ncRNAs intrônicos
As sondas de cDNA depositadas no microarray foram selecionadas a partir de
uma coleção de 1 milhão de clones de ESTs gerados durante o Human Cancer Genome
Project, uma iniciativa de seqüenciamento em larga escala de ESTs que utilizou
bibliotecas de cDNA geradas a partir de mRNA com poli(A) derivado de 20 tipos
diferentes de tumores (Dias-Neto et al. 2000; Camargo et al. 2001). Após análise
bioinformática do conjunto de ESTs relacionadas com câncer, nosso grupo observou
que quase 30% das seqüências transcritas mapeavam em regiões intrônicas ou não-
anotadas do genoma humano (Reis et al. 2004). Com base na evidência de transcrição
em pelo menos 2 bibliotecas de cDNA diferentes, um subconjunto de aproximadamente
4.000 sondas de cDNA foi selecionado em nosso grupo para amplificação e deposição
em lâminas de vidro Tipo 7 STAR utilizando o robô Generation III Microarray Spotter
(GE Healthcare, Piscataway, NJ, EUA), como descrito em Reis et al. 2004. As sondas
selecionadas incluíam 2.292 ESTs representando exons codificadores para proteínas já
relacionados com câncer identificados a partir de buscas nos bancos de dados Entrez,
OMIM e CGAP, com funções relacionadas a apoptose, carcinogênese, metástase,
38
metabolismo e progressão do câncer. Foi incluído no microarray um conjunto de clones
sem similaridade com genes conhecidos amostrados aleatoriamente, dos quais 822
foram posteriormente mapeados em regiões intrônicas de genes codificadores, e 241
em regiões intergênicas do genoma. O tamanho médio das sondas de cDNA
depositadas é de 600 pb. A incubação das lâminas de microarray com os alvos
marcados e todas as etapas de lavagem foram realizadas em um processador automático
de lâminas (ASP GE HealthCare) a 42
o
C por 16 horas. Em cada hibridização foram
comparadas amostras de RNA de tumor e tecido não-tumoral adjacente (margem livre
de tumor) do mesmo paciente marcadas com Cy5 ou Cy3, respectivamente. Todas as
hibridizações foram feitas em duplicata, sendo que na réplica foi feita a troca do
fluoróforo entre o RNA de tumor e tecido normal adjacente (dye-swap), a fim de
controlar possíveis artefatos resultantes da incorporação preferencial de um dos
análogos fluorescentes de dCTP no resultado dos experimentos (Figura 2). Como cada
microarray contem duas réplicas para cada sonda foram geradas 4 réplicas das medidas
de intensidade de transcrito, para cada amostra analisada.
Figura 2 – Desenho esquemático das hibridizações realizadas. Amostras de tumor (TUMOR) e
de tecido não-tumoral adjacente (NORMAL) provenientes de cada paciente foram marcadas
com fluoróforos distintos (Cy 3 ou Cy5) e hibridizadas na mesma lâmina (Réplica A). Foi
realizada também uma segunda hibridização em outra lâmina (Réplica B) onde os fluoróforos
foram invertidos (“dye-swap”). Cada lâmina possui 2 cópias de todos os cDNAs depositados
(“spots”). Portanto, no total foram obtidas 4 réplicas técnicas da expressão de cada gene, para
cada tecido tumoral e não-tumoral analisado.
39
3.4 Filtragem e normalização dos dados de expressão gênica
Após a hibridização, as imagens do array foram obtidas usando o Generation III
Array Scanner (Molecular Dynamics) e visualizadas com o programa ImageQuant
(Molecular Dynamics). Um exemplo de imagem obtida é apresentado na Figura 3.
Figura 3 – Imagem representativa das hibridizações de CCR com microarray enriquecido em
RNAs não-codificadores. Lâmina do paciente P9, típica de uma hibridização de tecido tumoral
de rim (marcado com Cy3) contra tecido normal adjacente (marcado com Cy5). Na figura é
apresentado apenas o lado direito da lâmina.
As intensidades de fluorescência de Cy3 e Cy5 de cada sonda no array foram
extraídas usando o software ArrayVision (Imaging Research Inc.). Para cada lâmina, as
intensidades de Cy3 e Cy5, subtraídas do ruído (background), foram normalizadas para
remover efeitos dependentes do canal, assim como a incorporação diferencial de
40
fluoróforos pela transcriptase revesa (Quackenbush 2002) usando o algoritmo LOWESS
escrito em R (http://www.r-project.org/).
A correção por LOWESS utiliza uma função de regressão ponderada dentro de
cada intervalo pré-definido a partir da abscissa do gráfico da razão versus intensidade, R
x I , onde R = log2(Cy5 / Cy3), e I = 0,5 * log2(Cy5 * Cy3), de modo a detectar desvios
sistemáticos e corrigí-los usando aquela função de regressão (Quackenbush 2002)
(Figura 4).
Figura 4 - Normalização dos dados de expressão. A) O gráfico R-I (R = log2(Cy5/Cy3) e I =
0,5*log2 (Cy5*Cy3)) apresenta o logaritmo (base 2) da razão (Cy5/Cy3) para cada gene no chip
como uma função do produto das intensidades (I), revelando assim efeitos sistemáticos
dependentes da intensidade. B) O uso de LOWESS para corrigir a variação sistemática
observada no painel A): LOWESS calcula uma função (linha vermelha, painel A) que melhor
descreve os dados apresentados no gráfico e ajusta os mesmos para razão local média igual a 1
(igual a zero na escala logarítmica) com base naquela função.
As intensidades normalizadas por LOWESS foram então processadas no
software ArrayStat (Imaging Research Inc.) para detecção e eliminação de valores
espúrios de baixa qualidade, utilizando um modêlo de distribuição de erro estimado a
partir de todas as réplicas de todas as sondas analisadas (Figura 5). Primeiro, o
programa centraliza os dados de intensidade das 4 réplicas de cada sonda. Em seguida,
41
foram eliminadas as sondas com menos de 3 entre 4 réplicas com menos de 3 desvios
absolutos da mediana (MADs), sendo calculada a média das sondas restantes. Para cada
amostra, foi calculada a média trimada excluindo os valores 20% menores e os 20%
maiores. Média esta que em seguida foi usada para normalizar os dados entre os
experimentos e torná-los comparáveis (Spotfire Decision Site, Spotfire Inc.).
Figura 5 – Dependência entre a intensidade média e o desvio-padrão das réplicas. A linha azul
indica a função de regressão dos dados plotados entre a intensidade média (eixo X, “Mean”) e o
desvio-padrão das réplicas (eixo Y, “Standard Deviation”). Para cada faixa de intensidade, o
programa ArrayStat exclui como “outliers” as réplicas que apresentam valor maior que 3
desvios absolutos da mediana (MAD).
3.5 Identificação de transcritos diferencialmente expressos em CCR
A fim de garantir maior confiabilidade aos resultados obtidos, foram utilizados
dois programas estatísticos com a finalidade de identificar transcritos diferencialmente
expressos entre as amotras de tumor e de tecido normal, Significance Analysis of
Microarrays (SAM) (Tusher et al. 2001) e teste-Z (Nadon et al. 2002). Cada um desses
programas foi executado com base nos mesmos dados de expressão, sendo os resultados
comparados entre si a fim de identificar e selecionar para análises subsequentes apenas
42
os transcritos identificados em ambas as análises. Acreditamos que este procedimento é
bastante estringente pois considera como válidos apenas os resultados que satisfizeram
dois critérios baseados em métodos diferentes de estimativa estatística, o que diminui a
probabilidade de falso-positivos (erro Tipo I). No anexo I é apresentada uma descrição
detalhada de cada uma das abordagens estatísticas utilizadas para seleção de transcritos
diferencialmente expressos em CCR.
3.6 PCR em Tempo Real
Os níveis de expressão dos selecionados foram medidos em amostras de CCR e
tecido não-tumoral adjacente por RT-PCR quantitativo. Para evitar contaminação com
DNA genômico, alíquotas de RNA total (2 μg) foram tratadas com 1 unidade de DNAse
RQ1 sem RNAse (Promega) por 30 minutos a 37ºC num volume de 15μl na presença de
20 unidades de inibidor de ribonuclease RNasin (Promega). Para os transcritos
exônicos, foram usados 2 μg de RNA total para gerar cDNA em reações de 20 μl
contendo 1 unidade de Superscript III (Invitrogen) e primers oligo-dT. Para os
transcritos intrônicos, o RNA total tratado com DNAse (~600 ng), obtido com o kit de
purificação RNAeasy (Qiagen), foi linearmente amplificado para produzir RNA
complementar (cRNA) (Adams et al. 2000; Wang et al. 2000). Em torno de 600 ng de
cRNA foram subseqüentemente usados como "template" em reações de transcrição
reversa usando como iniciadores primers de 9 oligonucleotídeos aleatórios.
Para quantificação relativa da abundância dos transcritos exônicos e intrônicos
nas amostras de tumor e tecido não-tunoral adjacente foram utilizados 2,5 μl do cDNA
obtido por transcrição reversa como "template" em reações de PCR em tempo real (20
μl de volume total) num equipamento GeneAmp 5700 (Applied Biosystems) usando o
43
kit SYBR Green PCR e seguindo as instruções do fabricante (Applied Biosystems).
Para cada amostra, como controle negativo foi feita uma reação paralela sem adição de
transcriptase reversa para verificar a ausência de contaminação genômica. Os primers
usados no PCR em tempo real estão apresentados na Tabela 3.
Tabela 3- Primers usados para PCR em tempo real.
Locus gênico
Mapeamento em
Éxon/íntron
Seqüência
SND1 íntron F: CTTCGTAATTCGTGCCTTATCAGA
R: GGAGTGAATAGGAAAGCAAGCAA
HDAC5
íntron F: GCCTGTGCTTCCTGTTTGC
R: TCTCCCACCAGCCTGTCACT
ACTN4 íntron F: AGGAGTCAGGGACTGACCTCTGT
R: CATGCTGCGGGACACACA
NIBP
íntron F: TGATTGGTCTGTGCTGTCTTTCA
R: GCCTTCACATCACAGCTCAGAA
SYNJ2BP éxon F: TGGATCCA GCTATTTGGTTTGA
R: CCAAGTATGTAACCAACAATAGAAGAAGTAG
SIN3B éxon F: CTCGATCTCGTTGAGCAAGCT
R: AGGCTGTGAACTTCAAGCAGAAC
TRIP3 éxon F: AATAGTGATGAGGAAGAAGACAGAGTTTC
R: ACCATCAACTGCCTGAGGTGT
MYH11 éxon F: GACCTGGTCAGCTCCAAGGAT
R: GCTGCGTCTTCATCTCCTCC
NDE1 éxon F: CAGCAAGAACAGAGATGGCG
R: GACCTGGTTGTT GATTTGGACA
F: seqüência direta; R: seqüência reversa.
Para a quantificação relativa dos transcritos nas várias amostras, os níveis de
cada transcrito detectado por PCR quantitativo em tempo real foram normalizados
tomando como referência o nível do gene estrutural β-tubulina, e representado como
variação usando o método ΔCt (Pfaffl 2001). Para cada par de amostras pareadas, os
níveis de transcrito na amostra de tumor foram expressos na amostra de tumor como
44
variação relativa ao valor no tecido não-tumoral adjacente, o qual foi considerado como
sendo igual à unidade.
3.7 Análise de Metilação
O programa MethPrimer (Amin et al. 2002) foi utilizado para identificar as
ilhas CpG em trechos de 1.000 nucleotídeos flanqueando cada lado do sítio de início de
transcrição dos genes selecionados (parâmetros: extensão da janela 200 nt, %GC 55,
CpG obervado/CpG esperado 0,65), e para desenhar primers para amplificação por
PCR de ilhas CpG identificadas usando DNA modificado por bissulfito. Os critérios
para seleção dos primers utilizados para amplificação e seqüenciamento das ilhas CpG
identificadas dos genes foram basicamente os mesmos critérios utilizados para seleção
de primers num PCR convencional: evitar formação de self-annealing e
complementaridade entre os primers forward e reverse, conteúdo GC e temperatura de
desnaturação (Tm). O programa leva em consideração que no caso de uma seqüência
tratada com bissulfito, todas as citosinas não-metiladas são transformadas em uracilas,
que por sua vez são transformadas em timina na reação de PCR. Em virtude desse
tratamento, que resulta no aumento do número de timinas, o programa restringe o
número de repetições consecutivas de bases “T” a no máximo oito, enquanto que para
os outros nucleotídeos o padrão é cinco. Além disso, como a modificação por bissulfito
nem sempre é completa, é importante a amplificação seletiva apenas de seqüência
totalmente tratada. Para tanto, é necessário desenhar os primers a partir de uma região
com número suficiente de citosinas não-CpG na seqüência original não-tratada.
45
Os primers usados para amplificação de fragmentos de DNA modificado por
bissulfito estão apresentados na Tabela 4.
Tabela 4 - Primers usados em BSP
Gene Seqüência
Temperatura de
Anelamento (°C)
Tamanho
do amplicon
(pb)
SIN3B (1A) F: GAAAGTAGGTAGAGAAGTTAGGTAAA
R: ATACTCTTTAAAAAACTCTTCTAAAAACCT
55 284
NDE1 F: GTAGAGTAGTAGTTAATGGGAGG
R: AACAAAAAAACTTTTCAACC
51 212
SIN3B (1B) F: AATTATTAATTATGATATTAATTTTAAGGA
R: AAATCCAAAAAATAAATTCCCC
55 331
SIN3B (2) F: GGGGAATTTATTTTTTGGATTT
R: AAATACTACCCATTTCCATTTTTATTAC
57 507
SYNJ2BP
F: TTATTTTATGTTTGGTTTTGGGAAT
R: ACCCTCTAATAAAATTAATCTCTTCCTC
65 287
TRIP3 F: TTTTGTTAAGAATAAGTAGATGAGATGG
R: TTAAACTTCTCCAAACAAATCAC
55 500
GPX3 F: TGTTTAGATTTGTTTATGTTATTGT
R: CCTAAAAATTACCCATCTAAC
51 441
F: seqüência direta; R: seqüência reversa.
O perfil de metilação das regiões promotoras preditas dos genes selecionados
como sub-expressos em CCR (SIN3B, NDE1, SYNJ2BP, GPX3 e TRIP3) foi avaliado
em amostras pareadas (tecido tumoral e não-tumoral adjacente) de 4 pacientes com
CCR (P9, P15, P27 e P32). O DNA foi isolado e submetido a tratamento com bissulfito
basicamente como descrito em (Jeronimo et al. 2001). Este tratamento converte as
citosinas não-metiladas em uracila, que é então convertida em timidina durante a etapa
de PCR subseqüente, resultando em diferenças entre DNA metilado e não-metilado, que
são por conseguinte analizados por seqüenciamento dideoxi. Inicialmente, 2 μg de DNA
genômico foram desnaturados em 500 μL de solução bissulfito (1,4 ml NaOH 3 M +
500 μL hidroquinona 1 M + 5 mL bissulfito 3 M) por 3 horas a 70°C. Em seguida, o
46
DNA modificado por bissulfito foi purificado usando Wizard DNA Cleanup System
(Promega) seguido por precipitação em etanol. O PCR foi realizaod em 25 μL de
volume total contendo 2 μL de DNA modificado por bissulfito, 2,5 μL de tampão PCR,
2,0 μL de deoxinucleotídeo trifosfatos 2,5 mM, 0,5 μL de cada solução 20 μM de cada
primer e 0,2 μL Platinum
®
Taq DNA Polymerase (Invitrogen). O PCR foi realizado em
40 ciclos como segue: 95°C por 1 minuto, 95°C por 30 segundos, anelamento a 52-65°C
por 45 segundos, 68°C por 45 segundos e uma extensão final a 68°C por 1 minuto. Para
cada amostra testada, o DNA não-tratado foi testado em paralelo como controle
negativo no ensaio. Os produtos de PCR foram separados em gel de agarose 1%, corado
com brometo de etídio e visualizado sob luz UV. Os produtos de PCR foram purificados
e seqüenciados pelo método dideoxi usando um seqüenciador ABI Prism 3700 DNA de
modo direto (GPX3) ou após clonagem no vetor de seqüenciamento pGEM T-Easy
(Promega) (SIN3B, NDE1, SYNJ2BP, TRIP3). Foram gerados cinco a doze leituras
(reads) para cada produto gênico seqüenciado, para cada amostra. Caso não fosse
detectada evidência de metilação de CpG nas primeiras duas amostras tumorais
analisadas, o gene foi considerado como não regulado por metilação e nenhum
seqüenciamento adicional foi realizado.
47
4. RESULTADOS
4.1 Avaliação da qualidade das hibridizações realizadas
A precisão das medidas de expressão é dada por altos coeficientes de correlação
entre as réplicas técnicas no mesmo slide (intra-slide) ou numa hibridização diferente
(inter-slide) após a normalização. A correlação média das réplicas intra-slide das 24
amostras hibridizadas foi de 0,98 +
0,03 e a média das correlações inter-slides foi de
0,82 +
0,12. Vale notar que foi também observada alta correlação média entre medidas
de amostras diferentes, o que indica que os níveis de expressão da maior parte dos
transcritos são relativamente constantes entre as amostras (correlação média de 0,79 +
0,12). A Figura 6 mostra os valores individuais de correlação entre as amostras. Pode-
se observar que a maior parte das correlações com valores menores que 0,7 (células
hachuradas em vermelho) foram melhoradas após a normalização por LOWESS.
Figura 6 – Matriz de correlação das medidas de intensidade. A matriz apresenta o coeficiente
de correlação de Pearson entre cada par de amostras utilizando os respectivos dados de
intensidade. Foram considerados apenas os spots que apresentaram intensidade maior que o
sinal do background. Em azul, as correlações maiores que 0,7, e em vermelho, aquelas menores
que 0,7. São mostrados os valores antes da normalização (triângulo inferior) e após a
normalização (triângulo superior).
48
As altas correlações médias observadas após normalização inter-slide foram
independentes do estado patológico do tecido (tumor ou tecido normal adjacente), sendo
a correlação média inter-slide das amostras igual a 0,84 + 0,06 e 0,84 + 0,05 para
amostras de tumor e de tecido não-tumoral adjacente, respectivamente. Os valores de
correlação observados são altos, especialmente para uma plataforma de cDNA espotado,
e indicando uma elevada reprodutibilidade das medidas de expressão geradas. Essa
análise indicou que os dados de expressão gênica de tecidos tumorais e não-tumorais
dos 12 pacientes hibridizados apresentavam qualidade adequada para a as análises
subsequentes.
4.2 Expressão de RNAs intrônicos em CCR
A expressão dos ncRNAs representados no microarray foi avaliada nas 24
amostras isoladas de tumor ou tecido renal não-tumoral adjacente de 12 pacientes com
CCR. Para serem consideradas expressas numa dada amostra, a intensidade da sonda
tinha que exceder um limiar definido pela intensidade média mais três desvios-padrões
de um conjunto de spots contendo DNA de planta, sem similaridade com sequências
humanas, utilizados como controles de hibridização inespecífica nos experimentos
(controles negativos de hibridização).
Foi observado que uma fração comparável de transcritos intrônicos, intergênicos
e exônicos são detectados nas amostras de rim com neoplasia ou não-tumorais, sendo
que quase 80% das sondas em cada classe de transcritos (intrônicos, intergênicos e
exônicos) estão expressas em pelo menos 5 amostras, independente da histologia da
amostra analisada (tumor ou tecido não-tumoral adjacente) (Figura 7).
49
Figura 7 - Expressão de transcritos codificadores para proteínas, e ncRNAs intrônicos e
intergênicos em tecido renal. As lâminas de microarray foram hibrizadas com 24 amostras
pareadas de tumor e tecido não-tumoral adjacente. Para ser considerada como expressa, cada
sonda teria que apresentar intensidade pelo menos 3 desvios absolutos da mediana acima do
sinal mediano de ruído dos controles negativos. A percentagem de sondas expressas em cada
uma das 3 classes de transcritos (exônicos, intrônicos ou intergênicos) se refere ao número
mínimo de amostras de tumor ou tecido não-tumoral adjacente em que a expressão foi
observada. O número total de sondas em cada classe é mostrado entre parênteses.
Em seguida, foram avaliados os valores de intensidade média nas três classes de
transcritos exônicos, intrônicos e intergênicos, expressos em pelo menos a metade das
amostras, os quais apresentaram valores de intensidade média de 5,7, 4,7 e 3,2,
respectivamente. Portanto, observamos uma intensidade média menor dos transcritos
não-codificadores, sugerindo uma menor abundância desses transcritos no tecido renal
em comparação aos transcritos codificadores para proteínas.
4.3 Identificação de genes diferencialmente expressos
Para identificar genes alterados no subtipo histológico mais prevalente de CCR,
o perfil de expressão de 6 amostras de CCR célula clara foi comparado de forma
pareada com o de 6 amostras não-tumorais adjacentes. A fim de reduzir o número de
falso-positivos (erro tipo I), foram utilizadas duas abordagens estatísticas independentes
50
(teste Z e o SAM). A intersecção de 181 transcritos diferencialmente expressos
identificados por SAM (FDR < 10%) com uma lista de 227 transcritos identificados por
teste Z (p < 0,001) resultou num conjunto de 83 transcritos identificados em ambas
análises, incluindo 8 seqüências que mapeiam em regiões intrônicas (Figura 8 e Tabela
5).
Figura 8 - Perfil de expressão de CCR célula clara. Heat map dos níveis de expressão de 83
genes (linhas) que apresentaram níveis de expressão significativamente alterado (p < 0,001 e
FDR < 10%) entre 12 amostras pareadas de tumor (T) e tecido não-tumoral adjacente (N) de 6
pacientes com CCR célula clara (colunas). Para cada transcrito, os valores de expressão relativa
são apresentados como log
2
(T/N): vermelho indica expressão maior em tumor; azul, expressão
maior em tecido não-tumoral adjacente. Os trancritos intrônicos são indicados por setas e são
referidos pelo nome do gene no qual eles mapeiam.
51
Tabela 5 - Relação dos 83 transcritos diferencialmente expressos em CCR.
Probe
accession
Locus Gênico
Mapeamento
em
Éxon/Íntron
Log2
(T/N)
Anotação
Validação
por LOO
Alterado
em CCR
não-
célula
clara
AW83703
6
GPX3 Exônico -3,7 Glutathione peroxidase 3 6/6 não
AW88343
9
PRKAG1 Exônico -2,8 AMPK-gamma1 5/6 sim
AW60339
5
YEATS4 Exônico -2,5 Glioma amplified sequence 41 5/6 sim
AW36502
7
CSNK1G2 Exônico -2,5 Casein kinase 1, gamma 2 6/6 sim
AW93599
8
FUS Exônico -2,5 Fusion t(12;16) in malignant
liposarcoma)
6/6 sim
BF751544 ICT1 Exônico -2,5 Immature colon carcinoma
transcript 1
5/6 sim
AW84274
8
SIN3B Exônico -2,4 SIN3 homolog B, transcription
regulator (yeast)
6/6 sim
CK327135 SYNJ2BP Exônico -2,4 Synaptojanin 2 binding protein 5/6 sim
BF087349 MAP3K7IP1 Exônico -2,4 Mitogen-activated protein kinase
kinase kinase 7 interacting
protein 1
5/6 sim
BF368747 SLC2A1 Intrônico -2,4 Solute carrier family,member 1 6/6 sim
BF922962 CTSB Exônico -2,3 Cathepsin B 5/6 sim
BE762727 FVT1 Exônico -2,3 Follicular variant translocation
gene
5/6 sim
BG876687 MYH11/NDE1 Exônico -2,3 Myosin heavy chain, smooth
muscle isoform / NUDE1
6/6 sim
AW17599
1
FLJ34165 Exônico -2,3 CDNA FLJ34165 fis, clone
FCBBF3014770
5/6 sim
BF890754 UQCRH Exônico -2,2 Ubiquinol cytochrome c reductase
hinge protein
5/6 sim
AW75312
8
P2RY1 Exônico -2,2 Purinoceptor P2Y1 5/6 sim
BF857797 C10orf104 Exônico -2,1 Chromosome 10 open reading
frame 104
6/6 sim
AW83674
7
EPAS1
Exônico -2,1 Endothelial PAS domain protein 1 6/6 sim
AW37394
3
CAPNS1 Exônico -2,0 Calpain, small subunit 1 6/6 sim
BF378949 RAB27A Exônico -2,0 RAB27A 5/6 sim
BE697369 C16orf34 Exônico -2,0 Chromosome 16 open reading
frame 34
6/6 sim
AW36443
5
LDLRAD3 Exônico -2,0 Hypothetical protein LOC143458 6/6 sim
AW88467
5
MTMR9 Exônico -2,0 Myotubularin related protein 9 5/6 sim
AW86249
1
KIAA0984 Exônico -2,0 Hypothetical protein LOC23329 5/6 não
BF892704 GSN Exônico -1,9 Gelsolin 6/6 sim
BF831599 VRK2 Exônico -1,9 Vaccinia related kinase 2 5/6 não
BF089987 SND1 Intrônico -1,8 Staphylococcal nuclease and tudor
domain containing 1
6/6 não
BF155287 SRF Exônico -1,7 Serum response factor 5/6 não
52
BF882783 ACTN4 Intrônico -1,7 Actinin alpha 4 5/6 não
BF898656 TRIP3 Exônico -1,6 Thyroid hormone receptor
interactor 3
6/6 sim
BQ349967 PRDX3 Exônico -1,6 Peroxiredoxin 3 6/6 não
BF736784 SFPQ Exônico -1,6 Splicing factor proline/glutamine-
rich
5/6 não
AW81977
0
RAB4A Exônico -1,6 Ras associated protein Rab4 5/6 não
AW36926
5
ERCC5 Exônico -1,5 Excision repair, group 5 6/6 não
BF891123 TFEC Exônico -1,5 Transcription factor EC 6/6 não
BE836304 NR4A3 Exônico -1,5 Nuclear receptor subfamily 4,
group A, member 3
6/6 não
BF333281 NIBP Intrônico -1,4 NIK and IKK binding protein 5/6 não
AW88317
5
CASP7 Exônico -1,3 Caspase 7 5/6 sim
BE816027 TFDP2 Exônico -1,3 Transcription factor DP2 5/6 não
BF365294 TACC1 Intrônico -1,3 Transforming, acidic coiled-coil
containing protein 1
6/6 não
BF751539 FOXK2 Exônico -1,2 Forkhead box K2 5/6 não
BE153247 MBD2 Exônico -1,2 Methyl CpG binding domain
protein 2
5/6 não
BF990000 ENPP1 Exônico -1,2 Ectonucleotide
pyrophosphatase/phosphodiesteras
e 1
5/6 não
BE720500 S100A2 Exônico -1,1 S100 calcium binding protein A2 5/6 não
BF946916 CHEK1 Exônico -1,0 Cell cycle checkpoint kinase 5/6 não
BF856925 WDR23 Exônico -1,0 WD repeat domain 23 5/6 não
AW36106
4
PICALM Exônico -1,0 Phosphatidylinositol binding
clathrin assembly protein
5/6 não
AW85997
9
FLJ39067 Exônico -1,0 CDNA FLJ39067 fis, clone
NT2RP7014910
5/6 não
BQ366120 PRCC Exônico -1,0 Renal cell carcinoma, papillary 1 5/6 não
BE697269 SH3PX3 Exônico -0,9 Hypothetical protein MGC32065 5/6 não
BF922401 EPB41 Exônico -0,9 Erythrocyte membrane protein
band 4,1
5/6 não
AW93942
1
MAP2K3 Exônico -0,9 Mitogen-activated protein kinase
kinase 3
4/6 não
BQ314686
MSH3 Exônico -0,9 MutS homolog 3 5/6 não
BF946928 DEPDC5 Exônico -0,9 DEP domain containing 5 5/6 não
BG010306 HDAC5 Intrônico -0,9 Histone deacetylase 5 5/6 não
BF994346 NDC80 Exônico -0,8 Kinetochore complex component
(S. cerevisiae)
4/6 não
BF360792 RAB25 Intrônico -0,8 Ras associated protein RAB25 4/6 não
BF082556 Intergênico -0,7 4/6 não
BQ338721 MCM2 Exônico -0,6 Minichromosome maintenance
protein 2
3/6 não
BF092089 TCF3 Exônico -0,6 Transcription factor 3 4/6 não
BE163794 ZBED4 Exônico -0,5 Zinc finger BED domain
containing 4
3/6 não
AW74871
4
ZNF447 Exônico -0,4 Hypothetical protein FLJ12895 5/6 não
BE697330 SAT2 Exônico -0,4 Spermidine/spermine N1-
acetyltransferase 2
4/6 não
AW83704
3
IL11RA Exônico -0,4 Interleukin 11 receptor alpha 4/6 não
53
BF087474 GAA Exônico 0,1 Lysosomal alpha glucosidase 3/6 não
AW85212
5
AK055564 Exônico 0,1 AK055565 3/6 não
BE935243 MDM2 Exônico 0,1 Transformed 3T3 cell double
minute 2
2/6 não
AW79606
6
TP53I3 Exônico 0,1 p53 induced gene 3 2/6 não
BG005977 MLLT7 Exônico 0,1 Myeloid/lymphoid, translocated to
7
3/6 não
BE070310 SDC2 Exônico 0,1 Syndecan 2 2/6 não
BF810617 ADORA2A Exônico 0,1 Adenosine A2 receptor 2/6 não
BF871631 FOXK1 Exônico 0,1 Forkhead box K1 3/6 não
BF957566 TMF1 Exônico 0,1 TATA element modulatory factor
1
2/6 não
BF949348 TCF2 Exônico 0,3 Transcription factor 2 2/6 não
BE837647 POFUT2 Exônico 0,3 Protein O-fucosyltransferase 2 5/6 não
BF987726 H2AFY Intrônico 0,3 H2A histone family member Y 5/6 não
BE702107 MAP4 Exônico 0,6 Microtubule associated protein 4 5/6 não
AW88061
4
RBMX Exônico 0,7 RNA binding motif protein, X-
linked
5/6 não
BF997724 PAPPA/AY623011 Exônico 0,7 Pregnancy associated plasma
protein A / DIPLA1-antisense
mRNA
5/6 não
BF328211 AK091566 Exônico 1,1 AK091566 5/6 não
AW90112
7
ARNTL Exônico 1,1 Aryl hydrocarbon receptor nuclear
translocator-like
5/6 não
AW37737
0
POLL Exônico 1,1 DNA polymerase lambda 5/6 não
AW38394
7
CD68 Exônico 1,7 CD68 antigen 6/6 não
Para limitar a contribuição individual das amostras analisadas para a
identificação de genes diferencialmente expressos em CCR célula clara, realizamos uma
análise de leave-one-out, que consiste na retirada de um paciente do conjunto analisado
e a subseqüente reanálise dos pacientes remanescentes em cada ciclo, obtendo-se assim
um conjunto de genes diferencialmente expressos para cada ciclo de leave-one-out. Por
fim, é obtida uma freqüência com que cada gene é identificado no conjunto dos ciclos.
Assim, observamos que 64 dos 83 transcritos (77%), inicialmente identificados como
diferencialmente expressos por teste Z e SAM, estavam também presentes em pelo 5
dos 6 ciclos possíveis de leave-one-out.
Em seguida, foi avaliado se os transcritos identificados como diferencialmente
expressos em CCR célula clara estavam também alterados em outros estados ou
54
subtipos histológicos de CCR. Para isso, analisamos os perfís de expressão de um
conjunto adicional de 12 amostras pareadas de pacientes com CCR, incluindo quatro
amostras de CCR papilar, uma amostra de CCR célula clara, mas com extenso
componente sarcomatóide e uma amostra de CCR de origem não-classificada (ver
Tabela 2). Esta nova análise resultou em um conjunto de 104 transcritos com níveis
significativamente alterados utilizando SAM (FDR = 5%) em tumor em comparação ao
tecido não-tumoral adjacente. A análise de leave-one-out das amostras de CCR não-
célula clara identificou 84 transcritos presentes em pelo menos 5 de 6 ciclos de leave-
one-out.
O cruzamento desta lista de 84 transcritos com a lista de 64 transcritos obtida
após leave-one-out das amostras de CCR célula clara resultou na identificação de 25
transcritos alterados em amostras de CCR independente do estado de diferenciação ou
subtipo histológico (Tabela 5, Figura 9).
Figura 9 - Perfil de expressão de CCR independente do subtipo histológico. Heat map dos
níveis de expressão de 25 genes (linhas) comuns resultantes do cruzamento do conjunto de 64
genes obtidos por leave-one-out em CCR célula clara e o conjunto de 84 genes obtidos por
leave-one-out em CCR não-célula clara. Para cada transcrito, os valores de expressão relativa
são apresentados como log
2
(T/N): vermelho indica expressão maior em tumor; azul, expressão
maior em tecido não-tumoral adjacente. Os trancritos intrônicos são indicados por setas e são
referidos pelo nome do gene no qual eles mapeiam.
55
A significância da sobreposição destas duas listas de genes foi avaliada por 1
milhão de amostragens aleatórias com reposição, resultando numa alta significância
estatística (p < 10
-6
), indicando que a sobreposição dos 25 genes não foi ao acaso.
Entre os 25 transcritos identificados, observamos transcritos mapeando em
regiões intrônicas dos genes SLC2A1 ou TACC1 (Figura 10).
Figura 10Locus genômico de TACC1 e SLC2A1. A; Região genômica do cromossomo 1
contendo o locus de SLC2A1. A seta vermelha indica a seqüência depositada no microarray que
corresponde a um fragmento do transcrito de SLC2A1. B; Região genômica do cromossomo 8
contendo o locus de TACC1. A seta vermelha indica o fragmento depositado no chip do
transcrito de TACC1. Observe que em A o transcrito depositado no chip é unspliced, enquanto
que em B temos um transcrito spliced.
A
B
56
Nenhum dos RNAs intrônicos identificados com expressão alterada em CCR
apresenta potencial codificante, segundo análise realizada utilizando o programa
ESTScan (Iseli et al. 1999). Para investigar se os RNAs intrônicos são transcritos
primários não processados que poderiam gerar RNAs pequenos regulatórios já
descritos, a seqüência dos RNAs intrônicos alterados em CCR foi comparada com a de
346 snoRNAs (Lestrade et al. 2006) e 383 microRNAs (Griffiths-Jones et al. 2006)
documentados na literatura. Não foi observada similaridade entre os ncRNAs intrônicos
e as sequências de snoRNAs e microRNAs conhecidos, o que não significa que os
ncRNAs intrônicos não possam representar precursores de pequenos RNAs regulatórios
ainda não descritos.
Durante as análises, chamou-nos atenção a predominância de genes diminuídos
em tumor em comparação ao número de genes aumentados relativamente ao tecido não-
tumoral adjacente (Figuras 8 e 9). Assim, levantamos a hipótese de que o efeito
observado poderia ser decorrente de uma maior degradação do RNA mensageiro nas
amostras de tumor relativamente ao tecido não-tumoral adjacente. Nesse caso,
esperaria-se observar uma maior fração de genes aparentemente diminuídos no tumor
quando as amostras pareadas tumor/tecido não-tumoral adjacente fossem analisadas
individualmente. Para tanto, consideramos como diferencialmente expresso todo gene
cujo log
2
(T/N) fosse diferente de 0 (zero), onde T = expressão média normalizada do
57
gene no tecido tumoral e N = expressão média normalizada do gene no tecido não-
tumoral adjacente. Em seguida, computamos a fração resultante do número de genes
com expressão aumentada sobre o número de genes com expressão diminuída para cada
par de amostras de um mesmo paciente. Na Figura 11 estão plotadas a fração entre o
número de genes com expressão aumentada/diminuída em função do número mínimo de
amostras em que um dado gene foi identificado como diferencialmente expresso. Essa
análise sugere que, nas amostras de tumor, o maior número de genes diminuídos em
relação aos genes aumentados não é efeito de nenhuma amostra em particular, já que
esse efeito aumenta à medida que aumenta o número mínimo de amostras consideradas,
ou seja, esse efeito não parece depender de nenhuma amostra específica (Figura12).
58
Figura 11 – Genes diferencialmente expressos em um maior número de amostras pareadas
tendem a estar diminuídos em CCR. O gráfico apresenta a razão entre o número de genes
aumentados e diminuídos em tumor relativamente ao tecido não-tumoral adjacente em função
do número mínimo de amostras em que a expressão diferencial do gene é observada. Foi
considerado como diferencialmente expresso todo gene cujo log2(T/N) fosse diferente de 0
(zero), onde T = expressão média normalizada do gene no tecido tumoral e N = expressão média
normalizada do gene no tecido não-tumoral adjacente.
Levantamos em seguida uma outra hipótese, a de que, eventualmente, o maior
número de genes com expressão diminuída em tumor poderia se dever a artefatos
durante a marcação dos alvos fluorescentes de cDNA. Por exemplo, a existência de
incorporação preferencial de um dos fluoróforos nas amostras de tecido não-tumoral
adjacente poderia resultar, apesar da normalização por LOWESS e do desenho
experimental baseado em dye-swap, numa aparente predominância de expressão
diminuída em amostras de tumor. A marcação desigual do RNA poderia ser resultante
tanto da quantidade de fluoróforo incorporado na molécula quanto do efeito da emissão
desigual de fluorescência dos corantes Cy3 e Cy5, visto que a intensidade de emissão de
fluorescência de Cy3 é maior que a de Cy5. Para descartar essa possibilidade de
59
marcação desigual, refizemos as análises da Figura 11 utilizando os dados de cada
réplica separadamente, ou seja, de modo que as amostras de tumor dessa vez fossem
analisadas de acordo com o fluoróforo com que a mesma foi marcada (tumor-Cy5/não-
tumor-Cy3 e tumor-Cy3/não-tumor-Cy5). Caso houvesse algum efeito do fluoróforo
não corrigido pelo normalização LOWESS, poderíamos esperar que quando as amostras
de tumor fossem marcadas com Cy3, observaríamos uma predominância de genes
aumentados em tumor relativamente ao tecido não-tumoral adjacente, já que esse
fluoróforo emite com maior intensidade. Ao contrário, quando as amostras de tumor
fossem marcadas com Cy5, haveria predominância de genes diminuídos em tumor. No
entanto, o resultado dessa nova análise confirmou que independentemente do fluoróforo
utilizado, observa-se uma tendência de maior número de genes diminuídos em tumor à
medida que se aumenta a estringência das análises (Figura 12), sugerindo que o maior
número de genes diminuídos em relação aos aumentados em tumor não é decorrente de
um artefato da técnica.
60
Figura 12 – Avaliação dos genes alterados em CCR segundo a marcação com Cy3 ou Cy5. O
gráfico apresenta a razão entre o número de genes aumentados e diminuídos em tumor
relativamente ao tecido não-tumoral adjacente em função do número mínimo de amostras. Foi
considerado como diferencialmente expresso todo gene cujo log
2
(T/N) fosse diferente de 0
(zero), onde T = expressão média normalizada do gene no tecido tumoral e N = expressão média
normalizada do gene no tecido não-tumoral adjacente.
Fizemos ainda uma outra análise comparando estudos publicados de microarray
com amostras de CCR. Para isso, foram utilizados dados publicados de Lenburg et al.
(Lenburg et al. 2003), onde são comparados genes diferencialmente expressos
identificados em comum em pelo menos três estudos com CCR utilizando microarrays
(Figura 13). De 113 genes identificados como diferencialmente expressos em pelo
menos três trabalhos, 82 apresentaram expressão diminuída em CCR (73% dos genes
diferencialmente expressos). Esta observação está de acordo com nossos resultados, ao
mostrar a tendência de identificação de um maior número de genes diminuídos em
tumor comparativamente ao tecido não-tumoral adjacente.
61
4.4 Validação por RT-PCR em tempo real
Inicialmente, foram selecionados cinco transcritos codificadores (SIN3B, TRIP3,
SYNJ2BP, SDC-2 e MYH11) para validação por RT-PCR em tempo real da expressão
diferencial em CCR detectada nos experimentos de microarray. Estes experimentos
confirmaram que os transcritos exônicos de TRIP3 (p < 0,01), SYNJ2BP (p < 0,01) e
SIN3B (p < 0,02), apresentaram níveis significamente reduzidos em amostras de CCR
em comparação ao tecido não-tumoral adjacente (Figura 14, painéis A, B e C,
respectivamente), enquanto aqueles de MYH11 apresentaram níveis aumentados em
tumor (p < 0,02) (Figura 14, painel D). A amplificação de SDC-2 não resultou numa
banda única de RT-PCR, não sendo portanto confirmada sua expressão aumentada nas
análises de microarray.
62
Figura 13 – Genes com expressão alterada em CCR identificados em estudos de expressão
gênica em larga-escala. A figura mostra genes identificados como diferencialmente expressos
em pelo menos três estudos com microarrays analisando amostras de CCR. Nas colunas estão
os estudos, e nas linhas, os genes comuns diferencialmente expressos. Foram identificados 31
genes aumentados em tumor contra 82 genes diminuídos. Os estudos analisados foram Gieseg et
al., 2002; Young et al., 2001; Higgins et al., 2003; Takahashi et al., 2001; Boer et al., 2001 e
Lenburg et al, 2003. Figura adaptada de Lenburg et al. (2003).
Giesig Young HIggins Takahashi Boer Lenburg Giesig Young HIggins Takahashi Boer Lenburg
IGF BP3 HIBCH
ASS FLJ12541
SERPINA5 CLDN1 0
MAL SELENBP1
VEGF PECI
FBP1 FLJ10761
FLJ20920 GPD1
MT1H FLJ20315
SUCLG1 TAP1
GATM FTCD
SORD SFXN2
ANGP TL4 TIMP1
Hs.21103 DKFZP58 6B1621
ALDOB SIPL
LOX NP
KL LOC92840
PLOD2 GGH
GLYAT MGC2827
MT1L GCHFR
CALB1 Hs.18612
KNG FLJ14957
DPEP1 SLC27A2
KCNJ15 ALD H8A 1
VWF Hs.27092
CXCR4 PDZK1
HPD APOE
PCK2 HGD
TACS TD2 RGS5
SEMA3B LRP2
HSD11 B2 C3
DDC CTSH
GPC3 IF
EGF SULT1C1
SLC13A3 ATP6V1B1
PCK1 CSPG2
GPX3 C1QB
S100A2 GBP2
ADH6 IN HBB
SLC22A3 LGALS9
GRB14 LST1
MT1G FOLR1
EGLN3 FGF1
Hs.238927 ALDH6A1
CAV1 FABP1
RGS1 hS.381097
PLG SFRP1
APOC1 PAH
ALDH4A1 PCCA
PIPOX CA2
ACADS B FLJ12783
TNFAIP6 ARHGDIB
FN1 PVALB
HLA-DQB1 VIM
KIAA1949 FCGR3A
GABARAPL1 TGFA
BPHL ANXA1
PTR4
Gene com expressão aumentada em tumo
r
Gene com expressão diminuída em tumo
r
Gene ausent
e
63
Figura 14 – Expressão por Real-Time PCR de candidatos a marcadores de CCR. Os níveis
relativos de transcritos exônicos (AD; TRIP3, SYNJ2BP, SIN3B, MYH11, e NDE1) e
intrônicos (E; ACTN4 e SND1) selecionados em amostras de tumor em comparação ao tecido
não-tumoral adjacente do mesmo paciente foram determinados por RT-PCR em tempo real. As
diferenças significativas são marcadas com um asterisco. A; TRIP3 (p < 0,01); B; SYNJ2BP (p <
0,01); C; SIN3B (p < 0,02); D; MYH11 (p < 0,02), NDE1 (p < 0,02); E; ACTN4 (p < 0,05),
SND1 (p < 0,05). Para cada gene, os ensaios foram realizados em triplicata. São mostrados os
valores médios com as respectivas barras de erro. Para cada gene testado, foi usado o gene
housekeeping TUB-B como referência para normalização.
Embora significativo, o aumento dos níveis transcricionais de MYH11 em CCR
analisado por RT-PCR em tempo real não concordou com os resultados de microarray,
que mostraram uma expressão diminuída de MYH11 em tumor relativamente ao tecido
não-tumoral adjacente.
64
Uma análise mais detalhada do locus de MYH11 revelou a presença de um outro
gene, NDE1, que se sobrepõe à extremidade 3' de MYH11 (Figura 15).
Figura 15 – Região genômica do cromossomo 16 contendo os loci de MYH11 e NDE1. A caixa
vermelha indica a seqüência depositada (GenBank Acession: BG876687) no chip e que foi
anotada como um fragmento do transcrito de MYH11. Note que uma extremidade da sonda de
cDNA é ao mesmo tempo complementar a um éxon 5’ de MYH11 e ao éxon 3’ de NDE1. A
orientação oposta dos transcritos de MYH11 e NDE1 é representada pelas cabeças de setas em
azul, que estão nas regiões intrônicas dos dois genes.
Além disso, foi observado que a sonda de cDNA dupla-fita depositada no
microarray (Genbank accession: BG876687) é complementar ao éxon 3’ exon do
transcrito NDE1 e a um éxon mais 5’ de MYH11. Como o protocolo de marcação
favorece alvos próximos à extremidade 3' de transcritos poli(A)
+
devido a utilização de
primers oligo dT, levantamos a hipótese de que o sinal medido pelo microarray foi na
verdade derivado de mensagens originadas do gene NDE1. Para testar essa hipótese,
foram realizados experimentos de RT-PCR em tempo real para medir os níveis de
NDE1 em amostras de tumor e de tecido não-tumoral adjacente. Os resultados
mostraram que dos 8 pares avaliados de amostras pareadas, NDE1 estava
significativamente sub-expresso (p < 0,02) em 3 amostras de RCC em comparação ao
tecido não-tumoral adjacente (Figura 14, painel D, pacientes P3, P27 e P32). Em duas
65
amostras adicionais, NDE1 apresentou uma tendência, embora não-significativa, de
estar com expressão reduzida em CCR (Figura 14, painel D, pacientes P5 e P26).
Quatro transcritos intrônicos não-codificadores mapeando em regiões intrônicas
de genes codificadores, SND1, ACTN4, HDAC5 e NIBP, foram selecionados para
experimentos de RT-PCR em tempo real; a sub-expressão de RNAs intrônicos foi
confirmada para transcritos mapeando íntrons de SND1 e ACTN4 (Figura 14, painel E).
Não foi possível obter a amplificação de produtos de PCR correspondentes aos
transcritos intrônicos HDAC5 e NIBP utilizando os primers disponíveis, e a diferença de
expressão desses transcritos não foi confirmada.
4.5 Análise do padrão de metilação de genes com expressão diminuída em CCR
Cinco genes identificados como sub-expressos em CCR (GPX3, NDE1,
SYNJ2BP, TRIP3 e SIN3B) foram selecionados para avaliação do perfil de metilação de
ilhas CpG localizadas em regiões promotoras dos respectivos genes em amostras
pareadas de tumor e tecido não-tumoral adjacente de pacientes com CCR. Foram
analisadas para identificação das ilhas CpG seqüências cobrindo até 2 Kb à montante
do início de transcrição do gene, acrescida do respectivo primeiro éxon e
primeiro/segundo íntrons. Como algumas ilhas CpG eram longas, foi necessário
desenhar mais de um par de primers para essas ilhas.
66
A eficiência do tratamento por bissulfito foi avaliada utilizando primers
complementares à seqüência convertida por bissulfito de uma região genômica contendo
uma ilha CpG do gene CDKN2A, cuja expressão é sabidamente regulada por metilação
da região promotora em linhagens de tecido DLD1 (carcinoma de cólon) e H1299
(câncer de pulmão) (Figura 16).
Figura 16 - Verificação do tratamento com bissulfito e análise do perfil de metilação para
região regulatória do gene CDKN2A. Reações de PCR utilizando primers MSP do gene
CDKN2A. L : marcador de peso molecular (100 pb). U: primer complementar a DNA não-
metilado, M: primer complementar a DNA metilado. 32T, 32N, 9N, 9T, 15N, 15T, 27N, 27T
correspondem a amostras de CCR (T) e tecido não-tumoral adjacente (N). Linhagens onde o
gene CDKN2A é sabidamente metilado (Controles positivos de metilação): DLD1, H1299.
Controle negativo de tratamento com bissulfito: MCF7. Linhagens onde o gene CDKN2A é
sabidamente não-metilado (controle negativo de metilação): 37L, HT1376, 18C. Esse
experimento mostra que, embora não haja metilação nos sítios interrogados pelos primers nas
amostras de CCR, o tratamento com bissulfito foi eficiente, pois foram amplificadas bandas
com tamanho compatível utilizando primers complementares à seqüência de DNA convertido.
Neste ensaio, foram realizadas reações de PCR utilizando separadamente
primers específicos para formas metiladas ou não-metiladas dos genes (Methylation-
Specific PCR – MSP). Embora não tenha sido verificada a existência de metilação na
ilha CpG testada do gene CDKN2A em amostras de CCR, a observação de uma banda
com o tamanho esperado em DNA de linhagens sabidamente metiladas e tratadas em
paralelo, confirmou que o tratamento com bissulfito nas amostras foi eficiente.
U L M U M U M U M U M U M U M
9N 9T 15N 15T 27N 27T 32N
U L M U M U M U M U M U M U M
9N 9T 15N 15T 27N 27T 32N
U L M U M U M U M U M U M U M
9N 9T 15N 15T 27N 27T 32N
150 bp150 bp150 bp150 bp
U M L U M U M U M U M U M U M
32T 18C 37L 1376 MCF7 DLD1 H1299
HT
U M L U M U M U M U M U M U M
32T 18C 37L 1376 MCF7 DLD1 H1299
U M L U M U M U M U M U M U M
U M L U M U M U M U M U M U M
32T 18C 37L 1376 MCF7 DLD1 H1299
HT
67
Foi observado que SIN3B possui evidência de metilação, em CpGs localizadas
numa região compreendendo um trecho à montante do início de transcrição até o
segundo íntron do gene (Figura 17).
Figura 17 - Perfil de metilação de sítios CpG de genes sub-expressos em CCR. Os produtos de
PCR obtidos a partir de DNA genômico tratado com bissulfito e utilizando primers flanqueando
regiões em torno do início de transcrição (TSS) de genes sub-expresssos em CCR (SIN3B,
SYNJ2BP, GPX3 e TRIP3). Para cada amostra seqüenciada, os quadrados pretos representam
CpGs onde foi observada metilação em pelo menos 20% dos clones seqüenciados. Os
quadrados cinza representam CpGs não-metilados (menos de 20% dos clones seqüenciados). Os
quadrados brancos representam sítios CpGs onde não houve seqüenciamento de qualidade. Para
cada gene analisado, os CpGs foram seqüencialmente numerados da esquerda para direita.
No entanto, não foi observada nenhuma correlação entre o perfil de metilação
dos CpGs e o padrão histológico do tecido (tecido tumoral ou tecido não-tumoral
adjacente) nos 4 pares de amostras avaliadas. Não foi observada metilação em ilhas
localizadas na região promotora de GPX3, SYNJ2BP e TRIP3 (Figura 17). Este
resultado indica que a metilação do promotor não é um fator importante na regulação
68
negativa dos genes GPX3, SYNJ2BP, TRIP3 e SIN3B em amostras de CCR. A ausência
de metilação observada para GPX3 sugere que o mecanismo de regulação negativa deste
gene em CCR seja distinto do que ocorre em adenocarcinomas de próstata, onde a
diminuição da expressão está associada ao aumento da metilação da região promotora
de GPX3 (Lodygin et al. 2005).
O seqüenciamento de DNA tratado com bissulfito apresenta desafios inerentes à
transformação de longos trechos de DNA em homopolímeros de poli-T ou poli-A. O
DNA convertido freqüentemente contém regiões de baixa complexidade que dificultam
o desenho de primers específicos e compatíveis com as condições utilizadas nas reações
de amplificação, o que limita a obtenção de produtos de amplificação específicos e/ou
em quantidade suficiente para o sequenciamento direto e/ou a clonagem em vetor para
posterior seqüenciamento. Como exemplo dessas limitações, embora tenhamos obtido
produto de amplificação usando os primers para NDE-1, não conseguimos seqüenciá-lo
diretamente com nenhum dos dois primers disponíveis.
69
5. DISCUSSÃO
5.1 Desenho experimental utilizado para identificação de transcritos
diferencialmente expressos em CCR
A abordagem utilizada neste trabalho, ou seja, a hibridização de amostras
pareadas de tecido tumoral e tecido normal adjacente na mesma lâmina (experimentos
com 2 canais) e posterior utilização de razões relativas de expressão gênica, é um
desenho experimental que garante uma precisão e acurácia maior nas medidas de
expressão em relação a estratégias baseadas na hibridização individual de cada amostra
(experimentos com 1 canal) (Yang et al. 2002; Peixoto et al. 2006). A necessidade de
medidas acuradas de expressão gênica é tanto maior quanto menor for o número de
réplicas biológicas e técnicas disponíveis. Um estudo recente avaliou o número de
amostras necessário para que haja poder de análise estatística na identificação de genes
diferencialmente expressos, a partir de dados de diversos trabalhos de expressão gênica
disponívei na literatura (Allison et al. 2006). Esse estudo demonstrou que para
desenhos experimentais onde dois grupos de amostras são avaliados para comparação
de classe (expressão diferencial), 5 amostras biológicas por grupo são geralmente
suficentes para identificação de genes diferencialmente expressos com significado
biológico, não restrito às amostras utilizadas na análise (Allison et al. 2006). Isto se
aplica unicamente a casos de comparação de classe (expressão diferencial), mas não a
predição de classe (classificação). Neste trabalho, identificamos um conjunto de 83
genes com expressão significativamente alterada em CCR tipo célula clara utilizando 12
amostras pareadas de 6 pacientes. Desse conjunto, um sub-conjunto de 25 genes
também se mostrou diferencialmente expresso em 6 outros pacientes com CCR não-
célula clara. Em função do desenho experimental empregado, acreditamos que os
70
resultados obtidos, além de possuírem significância estatística, sugerem que os genes
identificados possuam relevância biológica e poderão contribuir para o entendimento
das bases moleculares do CCR.
Durante nossas análises, chamou-nos atenção a predominância de genes
diminuídos em tumor em comparação ao número de genes aumentados relativamente ao
tecido não-tumoral adjacente. Em princípio, isso poderia ser uma conseqüência de uma
maior degradação do RNA nas amostras de tumor devido à necrose intensa que acomete
esses tecidos. Contudo, a avaliação da qualidade dos RNAs utilizados nas hibridizações
não indicou diferença na qualidade dos RNAs provenientes de tecido tumoral ou
margens cirúrgicas livres de tumor. Além disso, uma análise individual das amostras
pareadas revelou que a proporção de genes com expressão aumentada e diminuída em
tumores é comparável, e que o maior número de genes com expressão diminuída em
tumores só se torna evidente quando o conjunto das amostras é analisado. Esse
resultado indica que uma pior qualidade do RNA não deve ser um fator preponderante
para explicar a diminuição da expressão de genes nos tumores, o que é reforçado com
outros artigos já publicados mostrando a mesma tendência (Lenburg et al. 2003).
5.2 Comparação dos genes identificados com outros estudos de CCR
Embora todos os microarrays de DNA se baseiem na hibridização de ácidos
nucléicos, as variações técnicas diferem amplamente entre as plataformas (Draghici et
al. 2006). Entre as diferenças, destacam-se o comprimento das sondas, o método de
deposição do DNA na lâmina, protocolos de marcação e hibridização, etc. Cada uma
dessas abordagens exige considerações em termos da quantidade de RNA necessário,
aquisição de dados e técnicas de transformação e normalização de dados, e que resultam
71
freqüentemente em baixa reprodutibilidade das plataformas. (Draghici et al. 2006).
Essa é uma questão importante porque, dada uma hipótese biológica avaliada em duas
plataformas diferentes, cumpre saber se há diferenças específicas entre as plataformas
de modo a interferir nos resultados, mascarando assim a resposta biológica subjacente.
Nesse sentido, observamos nessa tese uma baixa sobreposição da nossa lista de
genes diferencialmente expressos com a lista de outros trabalhos publicados com CCR
utilizando metodologia de microarrays. Por exemplo, GPX3 e S100A2 foram também
descritos com expressão diminuída entre CCR em dois trabalhos publicados (Boer et al.
2001; Takahashi et al. 2001). Não encontramos sobreposição com nenhuma lista de
genes de alguns trabalhos publicados ((Jones et al. 2005), (Young et al. 2001), (Higgins
et al. 2003), (Skubitz et al. 2002)). Acreditamos que esta baixa sobreposição se explica
principalmente por i) número limitado de genes codificadores para proteína
representados em nossa plataforma e que podem ser mapeados nas plataformas
utilizadas nos outros estudos já realizados em CCR, ii) a presença de diferentes regiões
dos transcritos, que interrogam diferentes isoformas do mesmo gene e iii) a
heterogeneidade na atribuição de identificadores para as sondas nas diferentes
plataformas.
5.3 Expressão de RNAs não-codificadores em CCR
Neste trabalho observamos a expressão ubíqua de ncRNAs intrônicos e
intergênicos em amostras de tecido tumoral renal, assim como em margens livres de
neoplasia. Também observamos que em média, a abundância dos ncRNA é menor que a
de transcritos codificadores para proteínas. Estes resultados estão de acordo com
resultados obtidos anteriormente por nosso grupo durante a análise de tumores de
72
próstata utilizando essa mesma plataforma de microarrays (Reis et al. 2004). A
expressão em menor nível de ncRNAs já foi também descrita em outros trabalhos da
literatura (Kampa et al. 2004; Sasaki et al. 2007). No trabalho anterior com tumores de
próstata foram utilizados primers oligo-dT na síntese de cDNA a partir de mRNA,
diferentemente do presente trabalho, que além de oligo-dT tambem utilizou primers
randômicos para gerar cDNA a partir de RNA total. A estratégia de utilização
combinada de oligo-dT e primers randômicos teve como intenção garantir a marcação
de alvos que não necessariamente possuissem uma cauda de poliA, além de obter uma
marcação mais eficiente de regiões 5’ de transcritos longos. A quantidade limitada de
RNA disponível para os experimentos não permitiu que fosse feito tratamento com
DNAse. Embora essa contribuição não deva ser significativa, visto que a transcriptase
reversa utiliza preferencialmente RNA no seu processo de síntese de cDNA, essa
limitação do desenho experimental pode resultar em que uma pequena fração do sinal
detectado nos microarrays seja proveniente de contaminação residual com DNA
genômico. De todo modo, a eventual contaminação com DNA genômico não afetaria a
identificação de genes diferencialmente expressos entre tumor e tecido não-tumoral
adjacente, já que isso ocorreria aleatoriamente nas amostras tumorais e não-tumorais e
em pequena quantidade.
O trabalho de nosso grupo em tumores de próstata mostrou que uma
considerável porção de RNAs com nível de expressão correlacionados ao grau de
agressividade de tumores de próstata são RNAs transcritos em regiões intrônicas,
apontando para uma possível relevância biológica dessas mensagens em doenças
complexas como o câncer (Reis et al., 2004). Uma fração desses transcritos intrônicos
mostrou pertencer a uma nova classe de RNAs longos, sem splicing, sem potencial
codificante, e expressa com orientação antisenso a genes codificantes para proteína já
73
conhecidos, sugerindo que transcritos intrônicos antisenso possam estar envolvidos no
processo de oncogênese. Uma hipótese plausível para apoiar uma função biológica é
que os transcritos intrônicos agiriam em cis, tendo como alvo sua mensagem senso
intrônica complementar (no pré-mRNA). A formação de pares antisenso-senso
intrônicos poderiam assim desempenhar um papel regulatório em alguma etapa do
processamento dos transcritos codificantes para proteína correspondentes (Reis et al.,
2005). Essa hipótese é apoiada por resultados recentes mostrando o efeito de ncRNAs
intrônicos induzidos por andrógeno sobre a estabilidade ou o padrão de splicing do
mRNA correspondente (Louro et al., 2007). A observação de que ncRNAs intrônicos
são ubíquamente expressos em tecido renal permite extender para tecidos renais as
observações feitas em tecido prostático, abrindo novas perspectivas para o estudo dos
mecanismos de regulação gênica envolvidos com a transformação maligna no CCR.
5.4 Análises de metilação
A inibição funcional de genes supressores de tumor pode ocorrer via mutações
pontuais, deleções alélicas, deleções homozigóticas ou por metilação anormal da região
promotora. A metilação de dinucleotídeos CpG na região promotora de genes
supressores de tumor, resultando em inibição transcricional, é um mecanismo
importante de inativação desses genes. A freqüência de inativação por metilação de
novo varia entre genes e entre cânceres. Assim, o espectro de genes freqüentemente
inativados por metilação difere entre os tipos de cânceres, de modo que certos tumores
podem apresentar padrões específicos de metilação (Esteller et al. 2001). Atualmente,
existe pouca informação sobre a freqüência e padrão de metilação em tumores renais em
comparação a outros cânceres (Morris et al. 2003). Além disso, a caracterização dos
74
perfís de metilação de genes supressores de tumor pode revelar mecanismos de
carcinogênese, sendo que a definição de padrões de metilação tumor-específicos abre a
possibilidade de desenvolvimento de novos testes diagnósticos. Assim, uma
conseqüência natural da análise de genes com expressão diminuída é a análise de
alterações de metilação em ilhas CpGs. Dentre os genes selecionados para análise de
metilação, SIN3B foi o único no qual observamos CpGs metiladas, mas que no entanto
não apresentou correlação entre os níveis de metilação e o status histológico, ou seja,
entre tumor ou tecido não-tumoral adjacente e, por extensão, nenhuma correlação com a
expressão diferencial. A presença de metilação em amostras de tecido não-tumoral
adjacente sugere que o uso de SIN3B como marcador epigenético em CCR para
identificação prematura de tumores não é uma boa abordagem para o desenvolvimento
de novas ferramentas diagnósticas nessa neoplasia. O perfil de metilação das regiões
promotoras foi também avaliada nos genes NDE1, SYNJ2BP, GPX3 e TRIP3, mas
nenhum deles apresentou metilação. Curiosamente, está descrito na literatura que a
hipermetilação de GPX3 causa o silenciamento deste gene em tumores de próstata
(Lodygin et al. 2005). Embora tenhamos utilizado a mesma metodologia de avaliação de
metilação e primers complementares as mesmas regiões descritas por Lodygin et al.,
não observamos metilação de GPX3 em CCR, o que indica que o silenciamento deste
gene pode ocorrer através de mecanismos distintos em diferentes neoplasias.
5.5 Transcritos diferencialmente expressos em CCR
Com relação à confiabilidade, a tecnologia de microarray apresenta
aproximadamente 90% dos genes identificados como “significativos” sendo
confirmados por uma técnica alternativa, como o RT-PCR quantitativo (Larkin et al.
75
2005). Além disso, Lenburg et al. comparando CCR com tecido normal adjacente,
observaram que, dos 37 genes também identificados como diferencialmente expressos
em três ou mais dos cinco estudos anteriores analisados, 33 deles (89%) confirmaram a
expressão diferencial (Lenburg et al. 2003). Neste trabalho, conseguimos uma taxa de
validação de 100%, ou seja, todos os genes selecionados e amplificados tiveram sua
expressão diferencial confirmada por PCR em tempo real em amostras, na maioria,
independentes. A seguir, discutimos o papel na biologia celular de alguns genes
identificados como diferencialmente expressos em CCR.
CASP7
A ativação de caspase é um evento importante na geração de alterações
bioquímicas associadas a morte celular (Twiddy et al. 2006), sendo que a caspase-7 é
uma caspase de importância central nesse processo (Korfali et al. 2004). A ativação da
caspase-7 foi relatada em células T e B em apoptose (Marsden et al. 2002). Fibroblastos
embriônicos de camundongo, células T ou B de murinos e hepatócitos deficientes em
caspase-7, no entanto, apresentam apenas uma leve vantagem de sobrevivência quando
tratados com indutores de apoptose (Lakhani et al. 2006), sugerindo uma variabilidade
na resposta de caspase-7 na propagação de morte celular. Neste trabalho, foi observada
uma diminuição da expressão do mRNA de caspase-7 em tumores de CCR, sugerindo
uma atividade supressora de tumor para este gene, reforçando a idéia de um gene pró-
apoptótico.
EPAS1
HIF é um fator de transcrição heterodimérico consistindo de uma subunidade
beta constitutivamente expressa e uma subunidade alfa regulada. HIF-2
α
, codificado
pelo gene EPAS1, apresenta alta similaridade de seqüência com HIF-1
α
, um fator de
76
transcrição com função na resposta transcricional a hipoxia (Korfali et al. 2004). HIF
não é apenas suficiente, como também necessário para formação do CCR (Iliopoulos
2006). De acordo com nossas análises, EPAS1 é sub-expresso em CCR, sugerindo uma
complexidade adicional nesta via durante a carcinogênese do CCR.
Intrônico de SND1
A família de fatores de transcrição STAT (Signal transducer and activator of
transcription) converte sinais extracelulares de citocina em respostas biológicas através
da modulação da transcrição gênica (Levy et al. 2002). A ativação constitutiva de
proteínas STAT e a sinalização STAT anormal já foram observadas em tumores sólidos,
tumores hematopoiéticos não-leucêmicos e leucemias (Levy et al. 2002). Yang et al.
identificaram a proteína p100, codificada por SND1, como uma proteína que interage
com STAT6, aumentando a ativação transcricional mediada por STAT6 (Yang et al.
2002). Neste sentido, observamos um transcrito alterado no íntron de SND1, sugerindo
um envolvimento da via STAT na carcinogênese do CCR. A proteína p100 também
interage com outros fatores de transcrição como TFIIE, c-Myb e STAT5 (Levy et al.
2002).
CHEK1
Os chekpoints de dano ao DNA são ativados a fim de bloquear células e
promover a sobrevivência sob condições genotóxicas, sendo que alguns estudos têm se
dedicado ao uso de uma quinase codificada por CHEK1 como alvo de intervenção
terapêutica (Gao et al. 2006). CHEK1 é também uma quinase essencial para preservar a
estabilidade do genoma. Estudos recentes (Syljuasen et al. 2005) propuseram que
CHEK1 é necessário durante a fase S normal para evitar início anormal da replicação do
DNA, protegendo-o assim contra quebra. Neste sentido, as células tumorais
77
freqüentemente são deficientes no chekpoint G1 devido a perda de função de p53
(estimada em 50–70% de todos os cânceres) e assim deve depender da quinase de
chekpoint CHEK1 para induzir bloqueio nas fases S e G2 a fim de sobreviver (Huang et
al. 2006). Todos esses estudos sugerem que CHEK1 atua como um importante gene
supressor de tumor em câncer, sendo que isto foi confirmado em nossas análises onde
identificamos CHEK1 sub-expresso em CCR.
Intrônico de TACC1
As proteínas TACC (Transforming acidic coiled-coil) são proteínas associadas a
centrossomo e microtúbulo, sendo essenciais para a função de fuso mitótico. A
desregulação desses genes é considerada importante no desenvolvimento e progressão
de mieloma múltiplo, câncer de mama e câncer gástrico, sendo que Lauffart et al.,
utilizando dados de SAGE, conseguiram mostrar que 78,5% dos tumores de ovário não
apresentam expressão considerável de TACC1 e/ou TACC3 (Lauffart et al. 2005).
TACC1 mapeia em 8p11, uma região amplificada e rearranjada em câncer de mama
(Still et al. 1999). Devilard et al mostraram que TACC1 apresenta níveis muito mais
elevados de expressão em carcinoma de próstata humana do que em amostras de tecido
prostático normal, tanto em nível de mRNA quanto de proteína (Devilard et al. 2006).
Intrônico de SLC2A1
SLC2A1I (ou GLUT1) codifica para uma proteína que participa da detecção de
glicose pela célula (Richardson et al. 2007). Como a membrana plasmática é
impermeável a moléculas polares, a captura de glicose necessita do uso de proteínas
carreadoras associadas a membrana, como a proteína codificada por SLC2A1I. Os
transportadores de glicose (GLUTs) facilitam a translocação de glicose através da
membrana, garantindo assim um suprimento contínuo de glicose para maioria dos
78
tecidos, sendo atualmente aceito que o aumento da captura de glicose por células
malignas está associada ao aumento da expressão de GLUTs (Suganuma et al. 2007). A
super-expressão de SLC2A1I foi descrita em câncer de fígado, pâncreas, rim (CCR
célula clara), pulmão, mama, estômago, cabeça e pescoço e de tireóide (Suganuma et al.
2007). Como o intrônico mapeando SLC2A1I foi identificado como diminuído em
tumor em nossas análises, nós postulamos que este transcrito intrônico poderia ter o
papel de diminuir o nível transcricional de SLC2A1I em células normais, sendo que o
aumento da transcrição de SLC2A1I observado em vários tumores seria paralelo à
diminuição correspondente do transcrito intrônico, como de fato observamos.
Intrônico de NIBP
NIBP atua como um facilitador (enhancer) da ativação de NF-κB mediada por
citocina. A função oncogência de NF-κB em cânceres sólidos já foi descrita
anteriormente em câncer de mama, cólon, ovário, tireóide e pâncreas (Rayet et al.
1999). Oya et al. descreveram a atividade aumentada de NF-κB em CCR, a qual está
relacionada com a capacidade de invasão tumoral (Oya et al. 2003). Nossos achados
sugerem que a diminuição de expressão do transcrito intrônico de NIBP pode estar
envolvida na via de NF-κB e pode assim estar atuando como um ator importante na
biologia de CCR. Além disso, estudos in vitro preliminares também sugerem que NIBP
pode ser um regulador da expressão do gene Bcl-xL, assim como da diferenciação
neuronal, sendo identificado como uma nova proteína ligante de NIK e IKK
β
que é
expressa principalmente em cérebro, músculo, coração e rim (Hu et al. 2005).
Uma observação extremamente interessante foi a identificação de uma possível
regulação negativa entre os genes NDE1/MYH1 em CCR a partir da formação de um
par senso-antisenso. Esses dois genes apresentam sobreposição conservada em vários
79
genomas de mamíferos, como camundongo, chimpanzé e cão, além de galinha e mosca-
de-frutas, sugerindo que eles formam um par regulatório funcional. De fato, existem
estudos com murinos sugerindo que a expressão de um parálogo de MYH11, que
codifica para uma cadeia pesada da miosina, e que é regulado pelas mensagens
antisenso transcritas na fita minus do gene (Luther et al. 2005).
Em conclusão, os transcritos codificadores e não-codificadores identificados
nesta tese representam um conjunto interessante para exploração futura, cujas vias de
regulação podem ser úteis como objeto de estudo para diagnóstico e tratamento de
CCR, assim como em estudos da biologia molecular dessa classe de tumores. Como
discutimos inicialmente, embora o uso da metilação de SIN3B como marcador precoce
em CCR possa ser dificultado pela ausência observada de metilação diferencial entre o
tumor e o tecido não tumoral adjacente, a lista apresentada de genes com expressão
diminuída representa ainda potenciais alvos de estudos adicionais de metilação, já que
estes genes podem ter tido sua expressão diminuída através de um mecanismo
envolvendo metilação da região promotora. Como existe evidência acumulada de que a
metilação é freqüente e pode ocorrer no início do processo de formação tumoral (Cairns
2007), a detecção de metilação diferencial entre tumor e o tecido normal adjacente pode
ser assim de especial interesse em tumores que se tornam clinicamente evidentes apenas
num estágio avançado, como é o caso do CCR, o qual é difícil de diagnosticar num
estágio inicial devido à ausência de sintomas clínicos evidentes. De fato, quando o CCR
se torna clinicamente sintomático, em torno de 30% dos pacientes já apresentam
metástases (Engwegen et al. 2007). Nesse sentido, vale ainda notar que se o CCR for
detectado e tratado na sua fase inicial, enquanto o tumor estiver restrito ao rim, os
pacientes apresentam uma boa sobrevida (95% em 5 anos). Porém, quando os pacientes
80
se apresentam com doença avançada, eles apresentam sobrevida de apenas 18% em dois
anos (Linehan et al. 2004).
Como discutido na introdução desta tese, a identificação de alvos promissores
para o tratamento do CCR é importante para uma mudança no padrão de
desenvolvimento de novos fármacos de uma abordagem por seleção aleatória para uma
mais mecanística e racional. Assim, nossos resultados contribuem, por meio dos genes
identificados como diferencialmente expressos, para identificação de potenciais vias
regulatórias envolvidas com a biologia do CCR e, por conseqüência, de potenciais alvos
terapêuticos merecedores de estudos mais aprofundados, com vistas ao
desenvolvimento de ferramentas de tratamento mais seguras e eficazes.
81
6. CONCLUSÕES
1) A análise dos níveis de expressão de amostras de carcinoma de célula renal e seu
tecido não-tumoral adjacente, revelou, além de transcritos codificadores, uma
fração de transcritos não-codificadores com expressão diferencial.
2) Há uma expressão ubíqua de transcritos não-codificadores nunca antes descrita
em CCR.
3) Transcritos não-codificadores não diferem essencialmente dos transcritos
codificadores em termos de amplitude de expressão, ou seja, a distribuição da
atividade transcricional desses transcritos não difere significativamente daquela
dos transcritos codificadores.
4) Foram identificados 55 transcritos com expressão significativamente diminuída
em CCR célula clara em relação ao tecido não tumoral adjacente, apontando
para novos genes e vias com possível papel supressor de tumor em CCR.
5) Entre os genes com expressão diminuída em CCR selecionados para análise de
metilação, apenas um deles (SIN3B) mostrou evidência de metilação na região
promotora. d No entanto, não foi observada metilação diferencial entre as
amostras de CCR e as amostras de tecido não-tumoral adjacente. Esses
resultados sugerem que outros mecanismos regulatórios devem ser
preponderantes na regulação dos transcritos identificados com expressão
diminuida em CCR.
6) Em conjunto, os resultados apontam para um possível papel de transcritos não-
codificadores em processos biológicos relacionados a oncogênese e/ou
progressão de CCR.
82
7. REFERÊNCIAS
(2004). "Finishing the euchromatic sequence of the human genome." Nature 431(7011):
931-45.
Adams, M. D., S. E. Celniker, et al. (2000). "The genome sequence of Drosophila
melanogaster." Science 287(5461): 2185-2195.
Adjei, A. A., G. A. Croghan, et al. (2003). "A Phase I trial of the farnesyl protein
transferase inhibitor R115777 in combination with gemcitabine and cisplatin in
patients with advanced cancer." Clin Cancer Res 9(7): 2520-6.
Allison, D. B., X. Cui, et al. (2006). "Microarray data analysis: from disarray to
consolidation and consensus." Nat Rev Genet 7(1): 55-65.
Almeida, R. and R. C. Allshire (2005). "RNA silencing and genome regulation." Trends
Cell Biol 15(5): 251-8.
Amin, M. B., M. B. Amin, et al. (2002). "Prognostic impact of histologic subtyping of
adult renal epithelial neoplasms: an experience of 405 cases." Am J Surg Pathol
26(3): 281-91.
Atkins, M. B., M. Regan, et al. (2004). "Update on the role of interleukin 2 and other
cytokines in the treatment of patients with stage IV renal carcinoma." Clin
Cancer Res 10(18 Pt 2): 6342S-6S.
Bartel, D. P. (2004). "MicroRNAs: genomics, biogenesis, mechanism, and function."
Cell 116(2): 281-97.
Baylin, S. B. and J. G. Herman (2000). "DNA hypermethylation in tumorigenesis:
epigenetics joins genetics." Trends Genet 16(4): 168-74.
Bertone, P., V. Stolc, et al. (2004). "Global identification of human transcribed
sequences with genome tiling arrays." Science 306(5705): 2242-2246.
Bird, A. (2002). "DNA methylation patterns and epigenetic memory." Genes Dev 16(1):
6-21.
Birney, E., J. A. Stamatoyannopoulos, et al. (2007). "Identification and analysis of
functional elements in 1% of the human genome by the ENCODE pilot project."
Nature 447(7146): 799-816.
Boer, J. M., W. K. Huber, et al. (2001). "Identification and classification of
differentially expressed genes in renal cell carcinoma by expression profiling on
a global human 31,500-element cDNA array." Genome Res
11(11): 1861-70.
Breault, J. E., H. Shiina, et al. (2005). "Methylation of the gamma-catenin gene is
associated with poor prognosis of renal cell carcinoma." Clin Cancer Res
11(2 Pt
1): 557-64.
Cairns, P. (2007). "Gene methylation and early detection of genitourinary cancer: the
road ahead." Nat Rev Cancer 7(7): 531-43.
Calin, G. A., C. D. Dumitru, et al. (2002). "Frequent deletions and down-regulation of
micro- RNA genes miR15 and miR16 at 13q14 in chronic lymphocytic
leukemia." Proc Natl Acad Sci U S A 99(24): 15524-9.
83
Calin, G. A., C. Sevignani, et al. (2004). "Human microRNA genes are frequently
located at fragile sites and genomic regions involved in cancers." Proc. Natl.
Acad. Sci. USA 101(9): 2999-3004.
Camargo, A. A., H. P. Samaia, et al. (2001). "The contribution of 700,000 ORF
sequence tags to the definition of the human transcriptome." Proc Natl Acad Sci
U S A 98(21): 12103-8.
Cangiano, T., J. Liao, et al. (1999). "Sarcomatoid renal cell carcinoma: biologic
behavior, prognosis, and response to combined surgical resection and
immunotherapy." J Clin Oncol 17(2): 523-8.
Chen, J., M. Sun, et al. (2005). "Genome-wide analysis of coordinate expression and
evolution of human cis-encoded sense-antisense transcripts." Trends Genet
21(6): 326-9.
Chen, J., M. Sun, et al. (2005). "Human antisense genes have unusually short introns:
evidence for selection for rapid transcription." Trends Genet 21(4): 203-7.
Cheng, J., P. Kapranov, et al. (2005). "Transcriptional maps of 10 human chromosomes
at 5-nucleotide resolution." Science 308(5725): 1149-54.
Comander, J., S. Natarajan, et al. (2004). "Improving the statistical detection of
regulated genes from microarray data using intensity-based variance estimation."
BMC Genomics 5(1): 17.
Devilard, E., F. Bladou, et al. (2006). "FGFR1 and WT1 are markers of human prostate
cancer progression." BMC Cancer 6: 272.
Dias-Neto, E., R. G. Correa, et al. (2000). "Shotgun sequencing of the human
transcriptome with ORF expressed sequence tags." Proc. Natl. Acad. Sci. USA
97(7): 3491-3496.
Draghici, S., P. Khatri, et al. (2006). "Reliability and reproducibility issues in DNA
microarray measurements." Trends Genet 22(2): 101-9.
Dulaimi, E., I. Ibanez de Caceres, et al. (2004). "Promoter hypermethylation profile of
kidney cancer." Clin Cancer Res
10(12 Pt 1): 3972-9.
Eble, J. N., World Health Organization., et al. (2004). Pathology and genetics of
tumours of the urinary system and male genital organs. Lyon
Oxford, IARC Press ;
Oxford University Press (distributor.
Engwegen, J. Y., N. Mehra, et al. (2007). "Validation of SELDI-TOF MS serum protein
profiles for renal cell carcinoma in new populations." Lab Invest 87(2): 161-72.
Esteller, M., P. G. Corn, et al. (2001). "A gene hypermethylation profile of human
cancer." Cancer Res 61(8): 3225-9.
Ficarra, V., R. Righetti, et al. (2002). "Prognostic factors in patients with renal cell
carcinoma: retrospective analysis of 675 cases." Eur Urol 41(2): 190-8.
Flanigan, R. C., S. C. Campbell, et al. (2003). "Metastatic renal cell carcinoma." Curr
Treat Options Oncol 4(5): 385-90.
Fossa, S. D. (2000). "Interferon in metastatic renal cell carcinoma." Semin Oncol 27(2):
187-93.
84
Furge, K. A., K. A. Lucas, et al. (2004). "Robust classification of renal cell carcinoma
based on gene expression data and predicted cytogenetic profiles." Cancer Res
64(12): 4117-21.
Gao, Q., J. Zhou, et al. (2006). "Selective targeting of checkpoint kinase 1 in tumor cells
with a novel potent oncolytic adenovirus." Mol Ther 13(5): 928-37.
Gieseg, M. A., T. Cody, et al. (2002). "Expression profiling of human renal carcinomas
with functional taxonomic analysis." BMC Bioinformatics 3: 26.
Goodrich, J. A. and J. F. Kugel (2006). "Non-coding-RNA regulators of RNA
polymerase II transcription." Nat Rev Mol Cell Biol 7(8): 612-6.
Griffiths-Jones, S., R. J. Grocock, et al. (2006). "miRBase: microRNA sequences,
targets and gene nomenclature." Nucleic Acids Res 34(Database issue): D140-4.
Grunau, C., S. J. Clark, et al. (2001). "Bisulfite genomic sequencing: systematic
investigation of critical experimental parameters." Nucleic Acids Res 29(13):
E65-5.
Herman, J. G., F. Latif, et al. (1994). "Silencing of the VHL tumor-suppressor gene by
DNA methylation in renal carcinoma." Proc Natl Acad Sci U S A 91(21): 9700-
4.
Higgins, J. P., R. Shinghal, et al. (2003). "Gene expression patterns in renal cell
carcinoma assessed by complementary DNA microarray." Am J Pathol 162(3):
925-32.
Hirota, E., L. Yan, et al. (2006). "Genome-wide gene expression profiles of clear cell
renal cell carcinoma: identification of molecular targets for treatment of renal
cell carcinoma." Int J Oncol 29(4): 799-827.
Hu, W. H., J. S. Pendergast, et al. (2005). "NIBP, a novel NIK and IKK(beta)-binding
protein that enhances NF-(kappa)B activation." J Biol Chem 280(32): 29233-41.
Huang, S., R. M. Garbaccio, et al. (2006). "Development of 6-substituted
indolylquinolinones as potent Chek1 kinase inhibitors." Bioorg Med Chem Lett
16(22): 5907-12.
Iliopoulos, O. (2006). "Molecular biology of renal cell cancer and the identification of
therapeutic targets." J Clin Oncol
24(35): 5593-600.
Inoue, H., N. Nonomura, et al. (2007). "Somatic mutations of the von Hippel-Lindau
disease gene in renal carcinomas occurring in patients with long-term dialysis."
Nephrol Dial Transplant
22(7): 2052-5.
Iorio, M. V., M. Ferracin, et al. (2005). "MicroRNA gene expression deregulation in
human breast cancer." Cancer Res
65(16): 7065-70.
Iseli, C., C. V. Jongeneel, et al. (1999). "ESTScan: a program for detecting, evaluating,
and reconstructing potential coding regions in EST sequences." Proc. Int. Conf.
Intell. Syst. Mol. Biol.: 138-148.
Jeronimo, C., H. Usadel, et al. (2001). "Quantitation of GSTP1 methylation in non-
neoplastic prostatic tissue and organ-confined prostate adenocarcinoma." J Natl
Cancer Inst 93(22): 1747-52.
85
Jones, J., H. Otu, et al. (2005). "Gene signatures of progression and metastasis in renal
cell cancer." Clin Cancer Res 11(16): 5730-9.
Jones, P. A. and S. B. Baylin (2007). "The epigenomics of cancer." Cell 128(4): 683-92.
Jones, P. A. and P. W. Laird (1999). "Cancer epigenetics comes of age." Nat Genet
21(2): 163-7.
Kampa, D., J. Cheng, et al. (2004). "Novel RNAs Identified From an In-Depth Analysis
of the Transcriptome of Human Chromosomes 21 and 22." Genome Res. 14(3):
331-342.
Kapranov, P., S. E. Cawley, et al. (2002). "Large-scale transcriptional activity in
chromosomes 21 and 22." Science 296(5569): 916-919.
Kapranov, P., J. Drenkow, et al. (2005). "Examples of the complex architecture of the
human transcriptome revealed by RACE and high-density tiling arrays."
Genome Res 15(7): 987-97.
Katayama, S., Y. Tomaru, et al. (2005). "Antisense transcription in the mammalian
transcriptome." Science 309(5740): 1564-6.
Kiyosawa, H., I. Yamanaka, et al. (2003). "Antisense transcripts with FANTOM2 clone
set and their implications for gene regulation." Genome Res. 13(6B): 1324-1334.
Kopper, L. and J. Timar (2006). "Genomics of renal cell cancer-- does it provide
breakthrough?" Pathol Oncol Res 12(1): 5-11.
Korfali, N., S. Ruchaud, et al. (2004). "Caspase-7 gene disruption reveals an
involvement of the enzyme during the early stages of apoptosis." J Biol Chem
279(2): 1030-9.
Korneev, S. and M. O'Shea (2005). "Natural antisense RNAs in the nervous system."
Rev Neurosci 16(3): 213-22.
Korostishevsky, M., M. Kaganovich, et al. (2004). "Is the G72/G30 locus associated
with schizophrenia? single nucleotide polymorphisms, haplotypes, and gene
expression analysis." Biol Psychiatry
56(3): 169-76.
Kosari, F., A. S. Parker, et al. (2005). "Clear cell renal cell carcinoma: gene expression
analyses identify a potential signature for tumor aggressiveness." Clin Cancer
Res 11(14): 5128-39.
Kurella, M., L. L. Hsiao, et al. (2001). "DNA microarray analysis of complex biologic
processes." J Am Soc Nephrol 12(5): 1072-8.
Lakhani, S. A., A. Masud, et al. (2006). "Caspases 3 and 7: key mediators of
mitochondrial events of apoptosis." Science 311(5762): 847-51.
Larkin, J. E., B. C. Frank, et al. (2005). "Independence and reproducibility across
microarray platforms." Nat Methods 2(5): 337-44.
Lauffart, B., M. M. Vaughan, et al. (2005). "Aberrations of TACC1 and TACC3 are
associated with ovarian cancer." BMC Womens Health 5: 8.
Lavorgna, G., D. Dahary, et al. (2004). "In search of antisense." Trends Biochem Sci
29(2): 88-94.
86
Lenburg, M. E., L. S. Liou, et al. (2003). "Previously unidentified changes in renal cell
carcinoma gene expression identified by parametric analysis of microarray
data." BMC Cancer 3: 31.
Lestrade, L. and M. J. Weber (2006). "snoRNA-LBME-db, a comprehensive database
of human H/ACA and C/D box snoRNAs." Nucleic Acids Res 34(Database
issue): D158-62.
Levy, D. E. and J. E. Darnell, Jr. (2002). "Stats: transcriptional control and biological
impact." Nat Rev Mol Cell Biol 3(9): 651-62.
Linehan, W. M. and B. Zbar (2004). "Focus on kidney cancer." Cancer Cell 6(3): 223-8.
Liou, L. S., T. Shi, et al. (2004). "Microarray gene expression profiling and analysis in
renal cell carcinoma." BMC Urol 4: 9.
Lodygin, D., A. Epanchintsev, et al. (2005). "Functional epigenomics identifies genes
frequently silenced in prostate cancer." Cancer Res 65(10): 4218-27.
Louro, R., H. I. Nakaya, et al. (2007). "Androgen responsive intronic non-coding
RNAs." BMC Biol 5(1): 4.
Lu, J., G. Getz, et al. (2005). "MicroRNA expression profiles classify human cancers."
Nature 435(7043): 834-8.
Luther, H. P., H. Bartsch, et al. (2005). "Regulation of naturally occurring antisense
RNA of myosin heavy chain (MyHC) in neonatal cardiomyocytes." J Cell
Biochem 94(4): 848-55.
Marsden, V. S., L. O'Connor, et al. (2002). "Apoptosis initiated by Bcl-2-regulated
caspase activation independently of the cytochrome c/Apaf-1/caspase-9
apoptosome." Nature 419(6907): 634-7.
Mattick, J. S. (2003). "Challenging the dogma: the hidden layer of non-protein-coding
RNAs in complex organisms." Bioessays 25(10): 930-9.
Mattick, J. S. (2004). "RNA regulation: a new genetics?" Nat Rev Genet 5(4): 316-23.
Michael, A. and H. S. Pandha (2003). "Renal-cell carcinoma: tumour markers, T-cell
epitopes, and potential for new therapies." Lancet Oncol
4(4): 215-23.
Moch, H., T. Gasser, et al. (2000). "Prognostic utility of the recently recommended
histologic classification and revised TNM staging system of renal cell
carcinoma: a Swiss experience with 588 tumors." Cancer
89(3): 604-14.
Moch, H., P. Schraml, et al. (1999). "High-throughput tissue microarray analysis to
evaluate genes uncovered by cDNA microarray screening in renal cell
carcinoma." Am J Pathol 154(4): 981-6.
Morris, M. R., D. Gentle, et al. (2005). "Tumor suppressor activity and epigenetic
inactivation of hepatocyte growth factor activator inhibitor type 2/SPINT2 in
papillary and clear cell renal cell carcinoma." Cancer Res 65(11): 4598-606.
Morris, M. R., L. B. Hesson, et al. (2003). "Multigene methylation analysis of Wilms'
tumour and adult renal cell carcinoma." Oncogene 22(43): 6794-801.
Motzer, R. J., M. Mazumdar, et al. (1999). "Survival and prognostic stratification of 670
patients with advanced renal cell carcinoma." J Clin Oncol 17(8): 2530-40.
87
Motzer, R. J. and P. Russo (2000). "Systemic therapy for renal cell carcinoma." J Urol
163(2): 408-17.
Na, X., G. Wu, et al. (2003). "Overproduction of vascular endothelial growth factor
related to von Hippel-Lindau tumor suppressor gene mutations and hypoxia-
inducible factor-1 alpha expression in renal cell carcinomas." J Urol 170(2 Pt 1):
588-92.
Nadon, R. and J. Shoemaker (2002). "Statistical issues with microarrays: processing and
analysis." Trends Genet 18(5): 265-71.
Nakaya, H. I., P. P. Amaral, et al. (2007). "Genome mapping and expression analyses of
human intronic noncoding RNAs reveal tissue-specific patterns and enrichment
in genes related to regulation of transcription." Genome Biol 8(3): R43.
Novoradovskaya, N., M. L. Whitfield, et al. (2004). "Universal Reference RNA as a
standard for microarray experiments." BMC Genomics
5(1): 20.
O'Keefe, S. C., F. F. Marshall, et al. (2002). "Thrombocytosis is associated with a
significant increase in the cancer specific death rate after radical nephrectomy."
J Urol
168(4 Pt 1): 1378-80.
Okuda, H., M. Toyota, et al. (2006). "Epigenetic inactivation of the candidate tumor
suppressor gene HOXB13 in human renal cell carcinoma." Oncogene 25(12):
1733-42.
Oya, M., A. Takayanagi, et al. (2003). "Increased nuclear factor-kappa B activation is
related to the tumor development of renal cell carcinoma." Carcinogenesis 24(3):
377-84.
Peixoto, B. R., R. Z. Vencio, et al. (2006). "Evaluation of reference-based two-color
methods for measurement of gene expression ratios using spotted cDNA
microarrays." BMC Genomics 7: 35.
Pfaffl, M. W. (2001). "A new mathematical model for relative quantification in real-
time RT-PCR." Nucleic Acids Res
29(9): e45.
Quackenbush, J. (2002). "Microarray data normalization and transformation." Nat
Genet 32 Suppl: 496-501.
Rayet, B. and C. Gelinas (1999). "Aberrant rel/nfkb genes and activity in human
cancer." Oncogene 18(49): 6938-47.
Reis, E. M., H. I. Nakaya, et al. (2004). "Antisense intronic non-coding RNA levels
correlate to the degree of tumor differentiation in prostate cancer." Oncogene
23(39): 6684-6692.
Richardson, C. C., K. Hussain, et al. (2007). "Low levels of glucose transporters and
K+ATP channels in human pancreatic beta cells early in development."
Diabetologia
50(5): 1000-5.
Rinn, J. L., G. Euskirchen, et al. (2003). "The transcriptional activity of human
Chromosome 22." Genes Dev. 17(4): 529-540.
Rohan, S., J. J. Tu, et al. (2006). "Gene expression profiling separates chromophobe
renal cell carcinoma from oncocytoma and identifies vesicular transport and cell
junction proteins as differentially expressed genes." Clin Cancer Res
12(23):
6937-45.
88
Saito, M., I. Szakall, et al. (2004). "Mouse striatal transcriptome analysis: effects of oral
self-administration of alcohol." Alcohol 32(3): 223-41.
Sanz-Casla, M. T., M. L. Maestro, et al. (2003). "Loss of heterozygosity and
methylation of p16 in renal cell carcinoma." Urol Res 31(3): 159-62.
Sasaki, Y. T., M. Sano, et al. (2007). "Identification and characterization of human non-
coding RNAs with tissue-specific expression." Biochem Biophys Res Commun
357(4): 991-6.
Schuetz, A. N., Q. Yin-Goen, et al. (2005). "Molecular classification of renal tumors by
gene expression profiling." J Mol Diagn 7(2): 206-18.
Shoemaker, D. D., E. E. Schadt, et al. (2001). "Experimental annotation of the human
genome using microarray technology." Nature 409(6822): 922-927.
Siddiqui, A. S., J. Khattra, et al. (2005). "A mouse atlas of gene expression: large-scale
digital gene-expression profiles from precisely defined developing C57BL/6J
mouse tissues and cells." Proc Natl Acad Sci U S A 102(51): 18485-90.
Skubitz, K. M. and A. P. Skubitz (2002). "Differential gene expression in renal-cell
cancer." J Lab Clin Med 140(1): 52-64.
Sosman, J. A., I. Puzanov, et al. (2007). "Opportunities and obstacles to combination
targeted therapy in renal cell cancer." Clin Cancer Res 13(2 Pt 2): 764s-769s.
Still, I. H., M. Hamilton, et al. (1999). "Cloning of TACC1, an embryonically
expressed, potentially transforming coiled coil containing gene, from the 8p11
breast cancer amplicon." Oncogene 18(27): 4032-8.
Suganuma, N., F. Segade, et al. (2007). "Differential expression of facilitative glucose
transporters in normal and tumour kidney tissues." BJU Int 99(5): 1143-9.
Sultmann, H., A. von Heydebreck, et al. (2005). "Gene expression in kidney cancer is
associated with cytogenetic abnormalities, metastasis formation, and patient
survival." Clin Cancer Res 11(2 Pt 1): 646-55.
Syljuasen, R. G., C. S. Sorensen, et al. (2005). "Inhibition of human Chk1 causes
increased initiation of DNA replication, phosphorylation of ATR targets, and
DNA breakage." Mol Cell Biol 25(9): 3553-62.
Takahashi, M., D. R. Rhodes, et al. (2001). "Gene expression profiling of clear cell
renal cell carcinoma: gene identification and prognostic classification." Proc
Natl Acad Sci U S A 98(17): 9754-9.
Takahashi, M., X. J. Yang, et al. (2003). "Molecular subclassification of kidney tumors
and the discovery of new diagnostic markers." Oncogene
22(43): 6810-8.
Takai, D. and P. A. Jones (2002). "Comprehensive analysis of CpG islands in human
chromosomes 21 and 22." Proc Natl Acad Sci U S A 99(6): 3740-5.
Tusher, V. G., R. Tibshirani, et al. (2001). "Significance analysis of microarrays applied
to the ionizing radiation response." Proc. Natl. Acad. Sci. USA 98(9): 5116-
5121.
Twiddy, D., G. M. Cohen, et al. (2006). "Caspase-7 is directly activated by the
approximately 700-kDa apoptosome complex and is released as a stable XIAP-
caspase-7 approximately 200-kDa complex." J Biol Chem 281(7): 3876-88.
89
Twine, N. C., J. A. Stover, et al. (2003). "Disease-associated expression profiles in
peripheral blood mononuclear cells from patients with advanced renal cell
carcinoma." Cancer Res 63(18): 6069-75.
Van Erp, F., C. Van Ravenswaaij, et al. (2003). "Chromosome 3 translocations and the
risk to develop renal cell cancer: a Dutch intergroup study." Genet Couns 14(2):
149-54.
Vasselli, J. R., J. H. Shih, et al. (2003). "Predicting survival in patients with metastatic
kidney cancer by gene-expression profiling in the primary tumor." Proc Natl
Acad Sci U S A 100(12): 6958-63.
Volinia, S., G. A. Calin, et al. (2006). "A microRNA expression signature of human
solid tumors defines cancer gene targets." Proc Natl Acad Sci U S A 103(7):
2257-61.
Wang, E., L. D. Miller, et al. (2000). "High-fidelity mRNA amplification for gene
profiling." Nat Biotechnol 18(4): 457-9.
Yamada, D., S. Kikuchi, et al. (2006). "Promoter hypermethylation of the potential
tumor suppressor DAL-1/4.1B gene in renal clear cell carcinoma." Int J Cancer
118(4): 916-23.
Yamazaki, K., M. Sakamoto, et al. (2003). "Overexpression of KIT in chromophobe
renal cell carcinoma." Oncogene 22(6): 847-52.
Yang, J., S. Aittomaki, et al. (2002). "Identification of p100 as a coactivator for STAT6
that bridges STAT6 with RNA polymerase II." Embo J 21(18): 4950-8.
Yang, Y. H. and T. Speed (2002). "Design issues for cDNA microarray experiments."
Nat Rev Genet 3(8): 579-88.
Yao, M., H. Tabuchi, et al. (2005). "Gene expression analysis of renal carcinoma:
adipose differentiation-related protein as a potential diagnostic and prognostic
biomarker for clear-cell renal carcinoma." J Pathol 205(3): 377-87.
Yelin, R., D. Dahary, et al. (2003). "Widespread occurrence of antisense transcription in
the human genome." Nat. Biotechnol.
21(4): 379-386.
Yin-Goen, Q., J. Dale, et al. (2006). "Advances in molecular classification of renal
neoplasms." Histol Histopathol
21(3): 325-39.
Young, A. N., M. B. Amin, et al. (2001). "Expression profiling of renal epithelial
neoplasms: a method for tumor classification and discovery of diagnostic
molecular markers." Am J Pathol
158(5): 1639-51.
90
ANEXO I Curriculum Vitae
GLAUBER COSTA BRITO
Data de nascimento: 29 de novembro de 1968 – Local: Nanuque-MG
TITULAÇÃO:
Doutorado em Ciências
Departamente de Bioquímica
Universidade de São Paulo
2002 -
Mestrado em Biotecnologia
Departamente de Bioquímica
Universidade de São Paulo
2000 - 2002
Graduação em Farmácia-bioquímica
Faculdade de Ciências Farmacêuticas
Universidade de São Paulo
1993 - 1999
EXPERIÊNCIA EM ENSINO:
Monitor do Programa de Aperfeiçoamento de Ensino (PAE) da Universidade de São Paulo na
disciplina QBQ 214 - Bioquímica: Metabolismo e Biologia Molecular sob supervisão do Prof.
Dr. Mario José Politi no 2º semestre de 2005.
Monitor do Programa de Aperfeiçoamento de Ensino (PAE) da Universidade de São Paulo na
disciplina QBQ 214 - Bioquímica: Metabolismo e Biologia Molecular sob supervisão do Prof.
Dr. Mario José Politi no 2º semestre de 2004.
Professor do curso "DNA: Técnicas e Aplicações" realizado durante a XXXII Reunião Anual da
Sociedade Brasileira de Bioquímica (SBBq) em maio de 2003 em Caxambu/MG sob supervisão
do Prof. Dr. Bayardo Torres.
Professor do curso "DNA: Técnicas e Aplicações" realizado durante a XXXI Reunião Anual da
Sociedade Brasileira de Bioquímica (SBBq) em maio de 2002 em Caxambu/MG sob supervisão
do Prof. Dr. Bayardo Torres.
Professor do curso de verão "Tecnologia do DNA" realizado na Universidade de São Paulo em
janeiro de 2002 sob supervisão do Prof. Dr. Bayardo Torres.
TRABALHOS EM CONGRESSOS:
Trabalho em evento nacional:
91
1. Brito, G. C.; Fachel, A; Campos, F. S. ; Barcinski, M. A.; Verjovski, S; E. M. Reis.
Identification of Novel Candidate Markers of Renal Cell Carcinoma by cDNA Microarrays
Analysis. 51
o
Congresso Brasileiro de Genética, 2005, Águas de Lindóia, SP, Brasil.
2. Brito, G. C. ; E. M. Reis ; Fachel, A; Verjovski, S. Differential Gene Expression of Renal
Cell Carcinoma Using cDNA Microarrays. In: 50
o
Congresso Brasileiro de Genética, 2004,
Florianópolis, Brasil. p. 48-48.
3. E. M. Reis ;Brito, G. C.; Verjovski, S.. Antisense Intronic Non-coding RNA Levels
Correlate to the Degree of Tumor Differentiation in Prostate Cancer. In: 50
o
Congresso
Brasileiro de Genética, 2004, Florianópolis, Brasil. p. 53-53.
4. Brito, G. C. ; E. M. Reis ; Verjovski-Almeida, S. Gene Expression Profiling of Renal Cell
Carcinoma by Using cDNA Microarrays. In: XXXII Encontro Anual da Sociedade Brasileira de
Bioquímica, SBBq, 2003, Caxambu, Brasil. p. 12-12.
5. Torres, B.B.; Brito, G. C.. A Molecular Biology Course for Biology Teachers. In: XXXI
Encontro Anual da Sociedade Brasileira de Bioquímica, SBBq, 2002, Caxambu, Brasil. p. 118-
118.
Trabalho em evento internacional:
1. Brito, G.C. ; Fachel, A.A. ; Campos, F.S. ; Barcinski, M.A. ; Verjovski-Almeida, S.; Reis,
E.M. Novel molecular markers of renal cell carcinoma identified by gene expression analysis
using cDNA microarrays In: In: Keystone Symposia: Emerging Genomic Biomarkers: Impact
on Drug Discovery and Clinical Practice, 2006, Victoria, Canadá.
CURSOS:
Genomes, Browsers and Databases: Tools for Automated Data Integration Across Multiple
Genomes. Curso internacional realizado no “14th Annual Meeting of the International Society
for Computational Biology” em 6-10 de agosto de 2006. Fortaleza, Ceará.
Acessing the Human Genome Sequence. The Wellcome Trust / Cold Spring Harbor Joint
Course. Curso internacional realizado no Instituto Ludwig em 7-9 de fevereiro de 2006. São
Paulo, SP.
PUBLICAÇÕES CiENTÍFICAS:
Reis EM, Nakaya HI, Louro R, Canavez FC, Flatschart AV, Almeida GT, Egidio CM, Paquola
AC, Machado AA, Festa F, Yamamoto D, Alvarenga R, da Silva CC, Brito G.C, Simon SD,
Moreira-Filho CA, Leite KR, Camara-Lopes LH, Campos FS, Gimba E, Vignal GM, El-Dorry
H, Sogayar MC, Barcinski MA, da Silva AM, Verjovski-Almeida S. Antisense intronic non-
coding RNA levels correlate to the degree of tumor differentiation in prostate cancer. Oncogene.
2004, 23(39):6684-92.
Brito G.C., Fachel A.A., Vettore A.L., Campos F.C., Barcinski M.A., Verjovski-Almeida S.
and Reis E.M. Identification of coding and noncoding RNAs down-regulated in renal cell
carcinoma. (versão revisada re-submetida para revista Molecular Carcinogenesis em
agosto/2007).
92
ANEXO II Descrição das abordagens estatísticas utilizadas para seleção
de genes diferencialmente expressos
Significance Analysis of Microarrays (SAM)
A abordagem estística Significance Analysis of Microarrays (SAM) descrita em
(Tusher et al. 2001) está implementada como um add-in do Excel ou um programa
standalone no ambiente R. Trata-se de uma abordagem baseada na variação aleatória
dos dados, ou seja, considerando que a razão sinal/ruído (signal-to-noise ratio)
geralmente diminui com a diminuição do sinal, há casos em que, mesmo para um dado
nível de expressão, as variações - isto é, a variância do sinal - são gene-específicas e
independem do intervalo de intensidade ao qual pertencem. Para administrar essas
variações específicas, o programa define uma estatística baseada na diferença relativa
d(i):
0
)(
)()(
)(
sis
ixix
id
BA
+
=
onde
)(ix
A
e
)(ix
B
são os níveis médios de expressão do gene
)(i
nas condições A e
B, respectivamente;
)(is
é o desvio-padrão de todas as réplicas das condições A e B. A
fim de comparar os valores de
)(id
entre todos os genes e poder compará-los entre si, a
distribuição de
)(id
deve ser independente do nível de expressão do gene. Para garantir
que a variância de
)(id
seja independente da expressão do gene, já que existe uma
relação entre nível de expressão e variância, o programa adiciona uma pequena
constante positiva
0
s
ao denominador da equação acima. O coeficiente de variação de
93
)(id
é calculado como uma função de
)(is
nas janelas ao longo dos dados. O valor de
0
s
é escolhido pelo programa de modo a minimizar o coeficiente de variação de
)(id
.
Quando é construído o gráfico de
)(id
versus
)(is
a partir de amostras diferentes
(por exemplo, A e B) e amostras idênticas (por exemplo, A e A ou B e B), há no
primeiro caso uma dispersão maior dos dados, ou seja, a variância de
)(id
é maior,
resultado da expressão diferencial dos genes mais a variância técnica, a qual pode ser
avaliada comparando-a com a dispersão de
)(id
no gráfico obtido a partir de amostras
idênticas, as quais apresentam, em tese, apenas variância técnica. A fim de simular essa
situação, o programa realiza permutações entre os dados de expressão das 2 classes
sendo comparadas (A e B) gerando novos conjuntos de dados aleatórios misturando as 2
classes e calculando a diferença relativa
)(id
p
entre esses conjuntos. Para identificar
diferenças significativas na expressão dos genes, os mesmos são ordenados segundo a
magnitude de
)(id
. Para cada permutação, os genes são igualmente ordenados segundo
as diferenças relativas
)(id
p
. A diferença relativa esperada,
)(id
E
, é definida como
sendo a média entre as permutações,
= pidid
ppE
/)()(
, onde p é o número de
permutações.
A fim de identificar diferenças potencialmente significativas, o programa utiliza o
gráfico da diferença relativa observada
)(id
versus a diferença relativa esperada
)(id
E
. Genes que apresentam um deslocamento (Δ) acentuado da linha que define
=)(id )(id
E
, istoé, que apresentam uma diferença relativa observada maior do que a
esperada a partir da permutação aleatória dos dados, são candidatos a expressão
diferencial entre as condições testadas. O valor de
Δ
é pré-estabelecido pelo usuário e
94
irá definir o limiar a partir do qual o programa considerará uma diferença como
significativa (Figura 18).
Figura 18 – Gráfico de saída do programa SAM mostrando a diferença relativa observada
)(id
(eixo Y no gráfico) versus a diferença relativa esperada
)(id
E
(eixo X no gráfico). A linha azul
indica a região onde
=)(id
)(id
E
. A linha preta tracejada delimita a região a partir da qual
qualquer ponto dista um valor maior que
Δ
da linha azul. No caso,
=
Δ
1,82614. Em vermelho
e verde, os genes com expressão diferencial significativa.
Para calcular o número de falso-positivos, a faixa de corte é definida a partir do
menor
)(id
entre os genes considerados significativamente induzidos e o
)(id
menos
negativo entre os genes considerados significativamente reprimidos. O número de falso-
positivos é calculado em cada permutação considerando o número de genes que
ultrapassaram aquela faixa de corte, e finalmente é calculada uma média do número de
falso-positivos entre todas as permutações.
SAM Plot
-20
-10
0
10
20
30
40
-10-8-6-4-2 0 2 4 6 810
Expected
Observed
Significant: 208
Median # false significant: 12.41454
Delta 1.82614
Fold Change
95
O programa calcula ainda um q-valor, que é a menor taxa de falso-positivo em que o
gene é considerado significativo. O q-valor mede quão significativo é um gene: à
medida que
|)(| id
aumenta, o q-valor correspondente diminui.
Teste Z (ArrayStat)
Em princípio, qualquer análise estatística para identificar genes diferencialmente
expressos depende da medida de variância dos genes nas amostras a fim de determinar
se a diferença de expressão observada entre 2 condições se deve a um evento aleatório
ou reflete de fato um fenômeno biológico. Genes com alta variância na razão de
expressão entre condições (por exemplo, entre tumor e normal) apresentam baixa
probabilidade de estarem verdadeiramente diferencialmente expressos. Esta idéia pode
ser expressa matematicamente como um teste estatístico em que o numerador contém
uma estimativa do tamanho do efeito (razão tumor/normal, por exemplo) e o
denominador inclui o valor da variância. O ponto crítico é a escolha do numerador e
denominador do teste estatístico a fim de fazer melhor uso dos dados disponíveis. O
teste t de Student, por exemplo, é calculado segundo:
Onde M
avg
é o logratio (ou razão) médio, σ
M
é o desvio-padrão das réplicas e N
o número de réplicas. Assim, quanto maior o valor de t, mais significativa é a diferença
de expressão entre as condições. Considerando esta expressão, fica evidente que um
valor de t alto pode ser o resultado ou de um M
avg
alto ou de um σ
M
baixo. Como a
N
M
t
M
avg
σ
=
96
variância da população é tomada como sendo a própria variância das réplicas, este tipo
de teste pode apresentar resultados pouco satisfatórios quando aplicado a um pequeno
número de réplicas (p. ex., N = 4) porque, devido ao acaso, as réplicas podem
ocasionalmente ser muito semelhantes, produzindo um σ
M
baixo e conseqüentemente
um t elevado, resultando num falso-positivo. Para superar este inconveniente, alguns
métodos buscam obter uma medida mais precisa da variância de cada gene a partir da
estimativa da variância de todos os genes medidos no microarray. Essa estratégia é
empregada na implementação do teste Z disponível no programa ArrayStat (Imaging
Research Inc.) e baseia-se em uma propriedade já conhecida dos dados de microarray: a
dependência da variância em relação à média da intensidade dos spots, ou seja, quanto
menor a intensidade do sinal, maior a variância do mesmo (Nadon et al. 2002).
Resumidamente, dado um spot com intensidade média X, é possível estimar a sua
variância Y interpolando com a função de regressão do gráfico intensidade média versus
variância, de modo que todos os spots com intensidade dentro de um determinado
intervalo passam a ter variância correspondente à interpolação daquela função (Figura
5).
Estas estimativas do desvio-padrão são mais confiáveis do que o erro medido a partir
das poucas réplicas de cada gene na lâmina, e podem ser utilizadas para calcular
diretamente a estatística Z, usando a mesma fórmula da estatística t, mas que apresenta
uma distribuição diferente. Como o teste Z do ArrayStat faz uma estimativa da variância
da população a partir de todos os spots do array com mesma intensidade, isto permite
que se utilize menos réplicas, 4 ou 6 por exemplo, em vez das 30, no mínimo, que o
teste Z padrão preconiza. Por essa razão, o teste Z tem sido utilizado com o objetivo de
identificar genes diferencialmente expressos em análises de microarray (Comander et
al. 2004; Novoradovskaya et al. 2004; Saito et al. 2004).
97
ANEXO III Artigo submetido para publicação
For Peer Review
Identification of protein-coding and intronic noncoding RNAs down-
regulated in clear cell renal carcinoma
Journal: Molecular Carcinogenesis
Manuscript ID: MC-07-0156
Wiley - Manuscript type: Research Article
Date Submitted by the
Author:
09-Aug-2007
Complete List of Authors: Brito, Glauber; Universidade de São Paulo, Bioquímica
Fachel, Angela; Universidade de São Paulo, Bioquímica
Vettore, André; Universidade Federal de São Paulo, Campus
Diadema
Vignal, Giselle; Instituto Nacional de Câncer, Hospital do Câncer
Gimba, Etel; Instituto Nacional de Câncer, Hospital do Câncer
Campos, Franz; Instituto Nacional de Câncer, Hospital do Câncer
Barcinski, Marcello; Instituto Nacional de Câncer, Hospital do
Câncer
Verjovski-Almeida, Sergio; Universidade de São Paulo, Bioquímica
Reis, Eduardo; Universidade de São Paulo, Bioquímica
Keywords:
renal cell carcinoma, noncoding RNA, intronic transcription, tumor
suppressor, cDNA microarray
John Wiley & Sons
Molecular Carcinogenesis
For Peer Review
1
Identification of protein-coding and intronic noncoding RNAs down-regulated in clear
cell renal carcinoma
Glauber Costa Brito
a
, Ângela A. Fachel
a
, Andre Luiz Vettore
c
, Giselle M Vignal
b
, Etel R. P.
Gimba
b
, Franz S. Campos
b
, Marcello A. Barcinski
b
, Sergio Verjovski-Almeida
a
and Eduardo
M. Reis
a*
a
Departamento de Bioquímica, Instituto de Química, Universidade de São Paulo, SP, Brasil;
b
Hospital do Câncer, Instituto Nacional de Câncer/MS, RJ, Brasil;
c
Universidade Federal de
São Paulo, São Paulo, SP, Brasil.
*Corresponding author:
Dr. Eduardo M. Reis
Tel. +55-11-3091-2173
Fax: +55-11-3091-2186
Page 1 of 29
John Wiley & Sons
Molecular Carcinogenesis
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
For Peer Review
2
Abstract
The clear cell subtype of renal cell carcinoma (RCC) is the most lethal and prevalent cancer of
the urinary system. To investigate the molecular changes associated with malignant
transformation in clear cell RCC, the gene expression profiles of matched samples of tumor and
adjacent non-neoplastic tissue were obtained from 6 patients. A custom-built cDNA microarray
platform was used, comprising 2,292 probes that map to exons of genes and 822 probes for
noncoding RNAs mapping to intronic regions. Intronic transcription was detected in all normal
and neoplastic renal tissues. A subset of 55 transcripts was significantly down-regulated in
clear cell RCC relative to the matched non-tumor tissue as determined by a combination of two
statistical tests and leave-one-out patient cross-validation. Among the down-regulated
transcripts, 49 mapped to untranslated or coding exons and 6 were intronic relative to known
exons of protein-coding genes. Lower levels of expression of SIN3B, TRIP3, SYNJ2BP and
NDE1 (p < 0.02), and of intronic transcripts derived from SND1 and ACTN4 loci (p < 0.05),
were confirmed in clear cell RCC by Real-time RT-PCR. A subset of 25 transcripts was
deregulated in additional 6 non-clear cell RCC samples, pointing to common transcriptional
alterations in RCC irrespective of the histological subtype or differentiation state of the tumor.
Our results indicate a novel set of tumor suppressor gene candidates, including noncoding
intronic RNAs, which may play a significant role in malignant transformations of normal renal
cells.
Keywords: clear cell Renal Cell Carcinoma, noncoding RNA, intronic transcription, cDNA
microarray, tumor suppressor.
Running title: Intronic transcription in renal cell carcinoma
Page 2 of 29
John Wiley & Sons
Molecular Carcinogenesis
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
For Peer Review
3
INTRODUCTION
Renal cell carcinoma (RCC) is the most common cancer in the adult kidney, representing 3%
of all malignancies worldwide [1]. RCC is a heterogeneous disease, displaying various distinct
histological patterns, genetic alterations and clinical and biological behaviors. RCCs are
usually classified according to their histological characteristics into clear cell RCC, papillary
RCC (15–20%), chromophobe RCC (4–5%), carcinoma of the collecting ducts of Bellini
(<1%) and renal medullary carcinoma (<1%) [2]. Clear cell RCC is the most predominant form
of renal neoplastic disease, accounting for 70-80% of all RCC cases [3].
Several studies based on gene expression profiling have been conducted with the aim of
identifying the molecular alterations associated with malignant transformation of renal tissue;
they have all focused on array platforms containing probes for protein-coding genes [4-7].
These efforts have contributed greatly to delineating the changes in gene expression in renal
cancer and identifying molecular targets for prognosis and treatment. Despite these major
advances, understanding of the molecular mechanisms underlying renal carcinogenesis has
remained limited because of the complex and multifactorial nature of the disease.
Our group showed for the first time that long intronic noncoding RNAs mapping to
introns of protein-coding genes are ubiquitously transcribed in human prostate tissues, and that
the expression levels of a subset of these noncoding RNAs correlate with the degree of
malignancy of prostate tumors [8]. More recently, we showed that intronic RNAs may regulate
the abundance or the pattern of exon usage in cultured prostate cancer cells [9]. These results
are in line with a growing body of evidence in the literature indicating that noncoding RNAs
play an important role in regulating gene expression in eukaryotes [10-12] and a change in their
expression may play a role in malignancy [13].
Page 3 of 29
John Wiley & Sons
Molecular Carcinogenesis
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
For Peer Review
4
The possible correlation between changes in expression of noncoding RNAs and renal
cancer has not been studied. In this work, we have analyzed the expression profiles of matched
samples of RCC and non-malignant renal tissue using a microarray enriched in cancer-related
genes and noncoding intronic RNAs. We found that intronic transcription is ubiquitous in renal
tissue. Moreover, we identified an expression signature comprising both exonic and intronic
transcripts that are predominantly down-regulated in the most prevalent histological subtypes
of RCC. These provide novel insights into the general molecular mechanisms associated with
malignant transformations in renal tissue, and indicate potential new targets for diagnosis and
treatment of RCC.
MATERIALS AND METHODS
Tissue samples
A total of 24 matched samples of tumor and adjacent non-malignant tissue were obtained from
12 RCC patients submitted to radical nephrectomy at the Instituto Nacional de Câncer − INCA
(Rio de Janeiro, Brasil) and were used in microarray experiments. Ten additional matched
tumor/non-tumor tissue samples from 5 RCC patients were used in quantitative RT-PCR
validation experiments. Fresh tissue samples were obtained from the patients, with informed
consent, and fragments were frozen within 15-20 min after surgery and stored in liquid nitrogen
until use. Tissue sections from each RCC sample were reviewed and classified by a pathologist
according to the WHO histological classification of tumors of the kidney [2] as clear cell RCC
(10 samples), papillary RCC (4 samples), chromophobe RCC (1 sample), 1 clear cell RCC with
extensive sarcomatoid differentiation, and 1 RCC with unclassified origin. The Fuhrman grade
of the samples ranged from II to IV. Most tumor samples showed evidence of necrosis (76%)
Page 4 of 29
John Wiley & Sons
Molecular Carcinogenesis
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
For Peer Review
5
and were larger than 5 cm (82%). The clinical status of the disease was heterogeneous across
the patients: six showed metastasis, three showed locally advanced disease, four showed
localized tumors. Information regarding the evolution of the disease was not available for four
patients. Analysis of hematoxylin/eosin (HE) stained tissue sections showed that the stromal
component was poorly developed across all samples analyzed. Tumor tissue fragments
subsequently processed for RNA isolation should contain at least 80% neoplastic cells, as
determined by HE staining of tissue sections. Histologically normal adjacent renal tissue
fragments were collected from the same patients and examined by HE staining to check that no
neoplastic cells were present. Anatomopathological data from the tumor samples are given in
Table 1.
RNA isolation and target labeling
Total RNA was isolated from the tissue samples (approximately 200 mg) with Trizol reagent
(Invitrogen), quantified by UV spectrophotometry (Nanodrop ND1000) and analyzed for
integrity by inspection of the 18S/28S ribosomal RNA ratios after separation by gel
electrophoresis. For each patient, aliquots containing 20
µ
g total RNA from tumor or adjacent
non-tumor tissue were labeled in parallel with either Cy3- or Cy5-derivatized
deoxyribonucleotides (CyScribe first-strand cDNA labeling kit; GE Healthcare) using a
mixture of oligo-dT and 9-mer random oligonucleotides as primers. We used both oligo-dT and
9-mer random primers to minimize the 3’ bias of the labeled targets, thus optimizing the
detection of noncoding intronic transcripts eventually represented in the arrays by 5’ sequence
clones (see below).
Page 5 of 29
John Wiley & Sons
Molecular Carcinogenesis
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
For Peer Review
6
Microarray experiments
The cDNA probes spotted on the microarray were selected from the over 1 million EST clone
collections generated during the Human Cancer Genome Project, a large-scale EST sequencing
project that used cDNA libraries generated from poly(A) mRNA derived from over 20 different
types of human tumors [14,15]. The construction of the custom-spotted cDNA microarray has
been described elsewhere [8], along with its use for obtaining and comparing gene expression
profiles from a collection of prostate tumor samples. Following an informatics analysis of the
cancer EST dataset, we found that nearly 30% of the transcribed sequences mapped to intronic
or to non-annotated regions of the human genome. On the basis of several criteria, which
included evidence of transcription from at least two different cDNA libraries, we selected a
subset of approximately 4,000 cDNA clones for microarray spotting [8]. These comprised
2,292 cancer-related genes compiled from the Entrez, OMIM and CGAP databases, covering
apoptosis, tumorigenesis, metastasis, cancer metabolism and cancer progression. An additional
set of randomly-sampled no-match clones was included in the microarray, of which 822 were
putative intronic transcript fragments and 241 were fragments from unannotated genomic
regions. The average size of the cDNA probes spotted was 600 bp. Fluorescently-labeled
cDNA targets derived from tumor and non-tumor tissues from each patient were combined and
hybridized to microarrays with an automated slide processor (GE Healthcare), using the
protocols recommended by the manufacturer. Each sample was hybridized to two separate
microarrays, each containing two replicate spots for each probe. Thus, 4 replicate
measurements were generated for each probed transcript from each sample, which allowed
outliers to be excluded and expression measurements to be averaged. For each patient, a
replicate hybridization was performed with dye-swap of labeled targets. Raw and normalized
microarray intensities were deposited in the Gene Expression Omnibus database (GEO −
http://www.ncbi.nlm.nih.gov/geo/) under accession number GSE7367.
Page 6 of 29
John Wiley & Sons
Molecular Carcinogenesis
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
For Peer Review
7
Microarray analysis
After hybridization, array images were acquired using a GenerationIII Array Scanner (GE
Healthcare) and visualized with the ImageQuant program (Molecular Dynamics). Cy3 and Cy5
fluorescence intensities from each probe in the array were extracted using ArrayVision
software (Imaging Research Inc.). For each slide, the raw Cy3 and Cy5 intensities were
normalized to each other using a Locally Weighted Scatter plot Smoother (Lowess) algorithm
[16] written in R (http://www.r-project.org/) and filtered by ArrayStat software (Imaging
Research Inc.) to detect and eliminate low-quality outliers. For each sample, the trimmed mean
excluding the 20% lowest and the 20% highest values was calculated and was used to
normalize the data across the experiments [16] to make them comparable (Spotfire Decision
Site, Spotfire Inc.). Further details of microarray experiments and analyses are provided as
supplementary information. The accuracy of the expression measurements is demonstrated by
the high correlation coefficients between technical replicates in the same (intra-slide) or a
different (inter-slide) hybridization. The average correlation coefficient for the intra-slide
replicates was 0.978 + 0.026 and for the inter-slide replicates 0.824 + 0.116. Notably, a high
average correlation was also observed across measurements from different samples, which
indicates that the expression levels of most transcripts interrogated by the 4k microarray are
relatively invariable across the samples tested (average correlation 0.785 + 0.115).
Statistical Analysis
Two-class paired Significance Analysis of Microarrays (SAM) [17] and a paired Z-test [18],
implemented in the ArrayStat analysis suite (Imaging Research Inc.), were used to identify
Page 7 of 29
John Wiley & Sons
Molecular Carcinogenesis
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
For Peer Review
8
transcripts differentially expressed in RCC and adjacent non-tumor tissue. Lists of genes shown
by each approach (SAM or Z-test) to be differentially expressed were combined and only those
found in both lists were considered for further analysis. The robustness of the RCC gene
expression signature was evaluated by sample leave-one-out cross-validation [19]. Essentially,
one sample is removed and a new set of significantly altered genes is determined using the
remaining samples. This procedure was repeated for each of the matched tumor/adjacent non-
tumor tissue samples and the frequency with which each gene from the RCC signature
appeared in the various “leave-one-out” datasets at the chosen significance cutoff (Z-test: p <
0.001; SAM: FDR < 10%) was annotated.
Real-Time RT-PCR
The expression levels of selected transcripts were measured in RCC and matched non-tumor
RNA samples using quantitative real-time RT-PCR essentially as described [9]. To avoid
contamination with genomic DNA, all RNA samples were treated with 1 unit RQ1 RNAse-free
DNAse (Promega) for 30 min at 37ºC in a 15
µ
l volume in the presence of 20 units RNasin
ribonuclease inhibitor (Promega). For exonic transcripts, 2
µ
g total RNA were used to generate
cDNA in 20
µ
l reactions containing 1 unit Superscript III (Invitrogen) and oligo-dT primers.
For intronic transcripts, DNAse-treated total RNA (~600 ng) obtained with an RNAeasy
purification kit (Qiagen) was linearly amplified to produce complementary RNA (cRNA) [20].
The cRNA was subsequently used as template in reverse transcription reactions primed by
random 9-mer oligonucleotides. A 2.5
µ
l sample of reverse-transcribed cDNA was used as
template in real-time PCR reactions (20
µ
l total volume) on a GeneAmp 5700 (Applied
Biosystems) using the SYBR Green PCR kit as described in the manufacturer’s instructions
Page 8 of 29
John Wiley & Sons
Molecular Carcinogenesis
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
For Peer Review
9
(Applied Biosystems). For each sample, a reaction using the template from a mock reverse
transcription (no enzyme added) was performed as a negative control to check for the absence
of genomic contamination. The primers used for real-time PCR are shown as Supplementary
Table 1. For quantitative results, the level of each transcript detected by real-time quantitative
PCR was normalized to the level of
-tubulin and represented as fold change using the
Ct
method [21]. For each pair of matched patient samples, transcript levels in the tumor sample
were expressed as relative fold changes with respect to the value of the target transcript in the
non-tumor adjacent tissue, which was set at unity.
RESULTS
Expression of intronic RNAs in RCC
To assess the expression of intronic noncoding RNAs (ncRNAs) in the kidney, we interrogated
24 RNA samples isolated from tumor or adjacent non-tumor renal tissue from 12 RCC patients
with various histological subtypes, using custom-built microarrays. The tumor samples showed
poorly developed stromal components and the fragments processed for RNA isolation were
enriched (> 80%) in renal epithelial cells. These arrays contain probes mapping to transcribed
regions located in intronic segments of known genes (822 probes), to intergenic regions of the
genome (241 probes), or to coding or untranslated exons of protein–coding genes (2,292
probes). To be considered “expressed” in a given sample, the probe intensities had to exceed a
threshold defined by the average intensity plus three standard deviations of a set of plant-
derived negative control probes deposited in the arrays. We found that comparable fractions of
intronic, intergenic and exonic transcripts were expressed in kidney, both in tumor and in
adjacent non-tumor tissue samples (Figure 1); thus, nearly 80% of the probes in each class
Page 9 of 29
John Wiley & Sons
Molecular Carcinogenesis
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
For Peer Review
10
(intronic, intergenic and exonic) were expressed in at least 5 samples, irrespective of the
histology of the sample (tumor or adjacent non-tumor tissue) (Figure 1). This result shows that
intronic and intergenic RNAs are ubiquitously transcribed in kidney tissues. It also reveals that
the bulk of the intronic transcription occurs equally in tumor and non-neoplastic tissues,
indicating that these messages are likely to have roles in non-pathological cellular states.
Gene expression signatures of clear cell RCC
To identify genes altered in the most prevalent histological type of RCC, we compared the
expression profiles from 6 clear cell RCC samples with those from 6 patient-matched adjacent
non-tumor tissue samples. To reduce the number of false positives (type I errors), we combined
two independent statistical approaches (Z-test and SAM, see Methods for details) to identify
transcripts differentially expressed in RCC tumors. The intersection of 181 differentially-
expressed transcripts identified by SAM (FDR < 10%) with a list of 227 transcripts identified
by the Z-test (p < 0.001) comprised a set of 83 transcripts identified in both analyses, including
8 sequences that map to intronic regions (Table 2). To limit the contribution of individual
samples to identifying a clear cell RCC gene expression signature, we performed a leave-one-
out cross-validation procedure [19]. We found that 64 of the 83 transcripts (77%) identified as
differentially expressed in clear cell RCC by both Z-test and SAM were present in at least 5 out
of the 6 leave-one-out data sets (Figure 2). Most of the selected transcripts (55 out of 64) were
down-regulated in tumors relative to matched adjacent non-malignant tissue (Table 2). Notably,
7 sequences mapped to introns of known genes among the 64-gene set, being 6 of them down-
regulated in RCC. All these intronic RNAs except one are unspliced sequences, the exception
mapping to TACC1 (Genbank accession BF365294). None of the intronic RNAs down-
regulated in RCC has coding potential as determined by ESTScan analysis [22]. To investigate
Page 10 of 29
John Wiley & Sons
Molecular Carcinogenesis
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
For Peer Review
11
whether these 6 intronic RNAs down-regulated in RCC are unprocessed primary transcripts
that could generate known small regulatory RNAs, we compared their sequences with those of
346 snoRNAs [23] and 383 microRNAs [24]; no similarity was found.
Next, we asked whether some of the transcripts identified in the clear cell RCC gene
expression signature were also down-regulated in other differentiation states or histological
subtypes of RCC. To that end, we analyzed the expression profiles of an additional set of 12
matched tumor and adjacent non-tumor tissue samples from 6 RCC patients, including four
samples of papillary RCC, one RCC sample with clear cell origin but exhibiting an extensive
sarcomatoid component, and one RCC sample of unclassified origin (see Table 1). This latter
analysis resulted in a set of 104 transcripts with significantly altered levels (FDR = 5%) in
tumor compared to matched adjacent non-tumor tissues. Cross-validation analysis of the non-
clear cell RCC gene signature (see Methods for details) pointed to 84 transcripts present in at
least 5 out of the 6 leave-one-out datasets. By cross-referencing the 64-gene identified in the
clear cell RCC signature with the 84-gene non-clear cell RCC signature, we found 25
transcripts that were altered in RCC tumor samples irrespective of their differentiation state or
histological subtype (Table 2 and Supplementary Figure 1). The overlap between the
expression signatures of clear cell and non-clear cell RCC was evaluated by randomly sampling
each dataset 1 million times and calculating the frequency at which an overlap of 25 or more
genes was found; this showed high statistical significance (p < 1 x10
-6
). The expression profiles
of these 25 transcripts, which included two transcripts mapping to intronic regions of SLC2A1
or TACC1, were very similar across all RCC subtypes (Supplementary Figure 1).
Validation of novel markers of clear cell RCC by real-time RT-PCR
Five protein-coding transcripts (SIN3B, TRIP3, SYNJ2BP, SDC-2 and MYH11) deregulated in
clear cell RCC were selected for validation by real-time RT-PCR. These experiments
Page 11 of 29
John Wiley & Sons
Molecular Carcinogenesis
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
For Peer Review
12
confirmed that the levels of exonic transcripts from TRIP3 (p < 0.01), SYNJ2BP (p < 0.01) and
SIN3B (p < 0.02) were significantly reduced in clear cell RCC compared to matched adjacent
non-tumor tissues (Figure 3A, B, and C, respectively), while those from MYH11 showed
increased levels in clear cell RCC (p < 0.02) (Figure 3D). Deregulation of these four transcripts
was confirmed in one non-clear cell (subtype chromophobe) RCC sample (Figure 3A−D,
patient P27). Amplification of SDC-2 did not result in a single PCR band and overexpression of
this gene in RCC was not confirmed. The independent validation of selected transcripts in 5
additional clear cell samples by qRT-PCR corroborates the notion that the gene expression
signature identified is consistent across clear cell RCC samples.
Although significant, the increase of MYH11 transcript levels in clear cell RCC tumors
detected by quantitative real-time RT-PCR (Figure 3D) was not in agreement with the
microarray results, which showed reduced expression of MYH11 in tumor relative to adjacent
non-tumor tissue (Table 2 and Figure 2). A more detailed analysis of the genomic region
encompassing the MYH11 locus revealed the presence of another gene, NDE1, which overlaps
the 3’ end of MYH11. In addition, we noted that the double-stranded cDNA probe deposited in
the microarray (Genbank accession: BG876687) is complementary both to the 3’ exon of the
NDE1 transcript and to the 5’- most exon of MYH11. As the labeling protocol favors the
labeling of targets near the 3’ end of poly(A)
+
transcripts, we inferred that the signals measured
in the microarrays were mainly derived from messages originating from NDE1. To test this
hypothesis, we carried out real-time RT-PCR experiments to measure the levels of NDE1
transcripts in tumor and non-tumor samples. The results showed that out of the 8 pairs of
matched samples tested, NDE1 was significantly down-regulated (p < 0.02) in 3 RCC samples
compared to adjacent normal tissues (Figure 3D, patients P3, P27 and P32). In two additional
samples, NDE1 showed a tendency (although not significant) to be reduced in RCC (Figure 3D,
patients P5 and P26).
Page 12 of 29
John Wiley & Sons
Molecular Carcinogenesis
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
For Peer Review
13
Four noncoding intronic transcripts mapping to intronic regions of protein-coding
genes, SND1 (regulation of transcription), ACTN4 (regulation of apoptosis and of progression
through cell cycle), HDAC5 (regulation of transcription and of progression through cell cycle)
and NIBP (enhancer of NF-kappa-B activation) were selected for real time RT-PCR
experiments; down-regulation of intronic RNAs was confirmed for transcripts mapping to
introns of SND1 and ACTN4 loci in RCC tumors relative to adjacent non-tumor tissues (Figure
3E).
Methylation analysis of promoter regions of genes downregulated in RCC
Recent studies have demonstrated that the silencing of tumor suppressor genes by
hypermethylation of promoter CpG islands is common to many types of malignancy [25,26].
Five genes that our analysis showed to be down-regulated in RCC tumors (GPX3, NDE1,
SYNJ2BP, TRIP3 and SIN3B) were tested in 8 matched samples (tumor and adjacent non-tumor
tissue) from 4 RCC patients (P9, P15, P27, and P32) (see Supplementary Information for
details) to investigate the methylation status of CpG islands in their promoter regions. Only
SIN3B showed evidence of methylation, which encompassed CpGs extending from a region
upstream from the transcription start site through the second intron of the gene (see
Supplementary Figure S2). However, no correlation between the methylation pattern of the
CpGs and the histological status of the tissue (tumor, adjacent non-tumor) was observed in the
4 pairs of tumor and matched non-tumor samples tested. This result indicates that promoter
methylation is not a key factor in the down-regulation of these genes in RCC.
DISCUSSION
Page 13 of 29
John Wiley & Sons
Molecular Carcinogenesis
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
For Peer Review
14
In this study, we analyzed gene expression profiles of 12 matched samples of tumor and non-
neoplastic epithelium from RCC patients using a custom-built cDNA microarray enriched in
intronic noncoding RNA probes. Using stringent statistical criteria, we identified 64 transcripts
differentially expressed in tumors and matched non-tumor tissue samples from 6 patients with
clear cell RCC. The list of genes significantly deregulated in clear cell RCC samples relative to
matched non-tumor tissue was cross-referenced to the list of transcripts deregulated in an
additional set of 6 non-clear cell RCC, and 25 genes proved to be common to both sets, with a
significant overlap (p < 1x10
-6
). The aim of this specific analysis was to identify transcripts that
are deregulated in all RCC irrespective of the differentiation state or histological subtype of the
primary tumor. The histological subtypes represent genetically and phenotypically dissimilar
entities. Nevertheless, our observation that some gene expression changes are common to
different RCC subtypes, and significantly correlated to the neoplastic phenotype, suggests that
these transcriptional alterations may play a role in the process of malignant transformation in
the kidney. Further experiments will be required to clarify these aspects.
The list of protein-coding genes found here to be downregulated in clear cell RCC
was manually cross-referenced with lists of protein-coding genes that previous microarray-
based gene expression studies had shown to be altered in RCC [4,5,27-29]. GPX3, S100A2,
CTSB and EPB41 are known to be down-regulated in RCC [4,27]. Some genes detected in the
present study showed an expression pattern in RCC that was opposite to previous reports
(SLC2A1, up-regulated in [4,27]; CD68, CAPNS1, GSN and ERCC5, up-regulated in [4]). We
found no overlap between the genes identified here with those described in [5,28,29]. Thus,
while some genes have been detected in large-scale gene expression studies comparing tumor
and non-neoplastic renal tissues, most of the protein-coding genes that this work has shown to
be down-regulated in RCC have not been documented previously, making them novel tumor
suppressor candidates for this neoplasia. The expression levels of TRIP3, SIN3B, SYNJ2BP and
Page 14 of 29
John Wiley & Sons
Molecular Carcinogenesis
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
For Peer Review
15
NDE1 were confirmed by real time RT-PCR to be down-regulated in RCC. Retinoic acid (RA)
modulates growth and induces differentiation and apoptosis in neuroblastoma cells in vitro; the
increased expression of TRIP3 in RA−treated cells [30] is in line with a possible tumor
suppressor role for this gene in RCC, as suggested here. SIN3B encodes a protein involved in
transcriptional inhibition through binding to histone deacetylases [31]. SYNJ2BP participates in
the activin signaling pathway [32] and has not previously been associated with cancer. The
NDE1 gene product is part of a centrosome-located protein complex, the disruption of which
leads to abnormal cell division [33].
The genomic coordinates of NDE1 overlap with those of MYH11 and the products of
both loci form a naturally-transcribed sense/antisense transcript pair. Interestingly, we verified
that MYH11 is up-regulated in RCC. MYH11 was previously shown to be up-regulated in RCC
cell lines relative to RCC tissues [6], and in acute myeloid leukemia [34]. In contrast, it is
reportedly down-regulated in metastases relative to primary solid tumors in various tissue types
[35], indicating complex expression of this gene during malignant cell transformation. The
inverse expression patterns of NDE1 and MYH11 in RCC suggests that they may form a
functional regulatory pair. NDE1 and MYH11 show sequence and mapping conservation in
several vertebrate genomes (chimpanzee, mouse, chicken). Moreover, there is evidence
indicating that mouse MYH6, a paralog of human MYH11, is regulated by a naturally-
transcribed antisense RNA [36]. These results warrant further investigation of the relevance of
these findings to the malignant transformation associated with RCC.
Recent work in the literature indicates that a large fraction of the human genome is
transcribed in the form of noncoding RNAs [12,37,38]. Several lines of investigation suggest
that these ncRNAs are not biological noise, but rather parts of yet-uncharacterized regulatory
networks that may modulate gene expression in higher eukaryotes (see [10,13,39] for reviews).
Page 15 of 29
John Wiley & Sons
Molecular Carcinogenesis
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
For Peer Review
16
So far, only a few reports in the literature have related altered expression of certain ncRNAs to
cancer [40-42]. Here we show that intronic ncRNAs are ubiquitously transcribed in tumor and
adjacent non-tumor kidney tissue, extending our previous observations in prostate [8] and head
and neck [43] tissues. A comparable fraction of intronic RNAs were detected in tumor and non-
tumor kidney samples, indicating that intronic transcription is not a characteristic of neoplastic
renal tissues but rather part of the transcriptional output of normal kidney cells. Notably, we
found that a subset of these intronic ncRNAs expressed in kidney was significantly
downregulated in RCC and may therefore have a role in renal carcinogenesis. Among these are
transcripts mapping to intronic segments of ACTN4, HDAC5, SND1, SLC2A1, NIBP and
TACC1. Down-regulation of intronic transcripts mapping to the ACTN4 and SND1 loci in RCC
was further confirmed by quantitative real time RT-PCR.
None of the six intronic RNAs that were downregulated in RCC have protein coding
potential, as determined by ESTScan analysis [22]. It has been proposed that these intronic
ncRNAs may act as cis-regulatory factors, modulating the stability and/or the processing of the
corresponding protein-coding transcript [9,39]. Our group has provided experimental evidence
that intronic RNAs transcribed in antisense orientation may act in cis to modulate the
abundance or the processing of the corresponding protein-coding mRNA in androgen-treated
prostate cancer cells [9]. This cis-acting effect would occur by Watson-Crick base-pairing
between the antisense intronic RNA and the corresponding premature messenger RNA. An
independent group has recently shown that expression of an intronic antisense RNA (Saf gene)
transcribed from the first intron of the FAS gene causes an alternative exon of the protein-
coding sense FAS transcript to be retained [44]. In fact, all the genomic loci that the present
work has shown to harbor intronic transcripts with significantly reduced expression in RCC are
also sources of protein-coding genes that have previously been associated with, or to have
functions that may be related to, cancer. Thus, increased expression of actinin-4, the protein
Page 16 of 29
John Wiley & Sons
Molecular Carcinogenesis
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
For Peer Review
17
product of ACTN4, has been shown to induce cell motility and specifically to promote lymph
node metastasis in colorectal cancer [45]. Down-regulation of HDAC5 has been documented in
patients with colorectal cancer [46,47] and acute myeloid leukemia [48]. SND1 encodes a
Stat6-interacting protein that enhances Stat6-mediated transcriptional activation and gene
expression [49]. Constitutive activation of STAT proteins and aberrant STAT signaling has
been found in solid and hematological tumors [50]. In this context, down-regulation of intronic
SND1 may indicate the involvement of the STAT pathway in RCC carcinogenesis.
Overexpression of SLC2A1 has been associated to the increase in glucose uptake observed in
clear cell RCC [51]. Down-regulation of an intronic transcript mapping to the SLC2A1 locus
raises the possibility that this intronic message may negatively regulate the transcriptional level
of protein-coding SLC2A1. On the basis of the results described above, it is conceivable that the
intronic transcripts shown here to be deregulated in RCC may modulate the level or the
processing of their protein-coding counterparts in a similar manner.
In conclusion, we have described a set of protein-coding and intronic ncRNAs that
are down-regulated in RCC and constitute a valuable resource for identifying novel tumor
suppressor candidates. Although additional studies with larger sets of samples will be required
to produce high-resolution mapping of global transcriptional alterations in intronic noncoding
RNAs in renal neoplastic tissues, the results presented in this report indicate that changes in
some of these transcripts are very homogeneous and reproducible across clear cell RCC
samples, warranting further investigation to determine their role in renal cell carcinogenesis.
Further characterization of these transcripts may shed light into yet-unappreciated molecular
mechanisms involved in tumorigenesis and progression of RCC, and may also contribute to the
development of novel biomarkers and therapeutic targets for the disease.
Page 17 of 29
John Wiley & Sons
Molecular Carcinogenesis
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
For Peer Review
18
ACKNOWLEDGMENTS
The authors thank Dr. Paulo Antônio Faria from the Instituto Nacional de Câncer
(INCA) for additional revision of the anatomopathological data. This work was supported by a
grant from Fundação de Amparo a Pesquisa do Estado de São Paulo, FAPESP to SVA and
EMR and by fellowships from FAPESP and Conselho Nacional de Desenvolvimento Científico
e Tecnológico, CNPq, Brasil.
REFERENCES
1. Kopper L, Timar J. Genomics of renal cell cancer-- does it provide breakthrough?
Pathol Oncol Res 2006;12(1):5-11.
2. WHO Classification of Tumours: Pathology and Genetics of Tumours of the Urinary
System and Male Genital Organs. Eble JN, Sauter G, Epstein JI, Sesterhenn IA, editors:
WHO Press; 2004. 359 p.
3. Reuter VE, Presti JC, Jr. Contemporary approach to the classification of renal epithelial
tumors. Semin Oncol 2000;27(2):124-137.
4. Boer JM, Huber WK, Sultmann H et al. Identification and classification of differentially
expressed genes in renal cell carcinoma by expression profiling on a global human
31,500-element cDNA array. Genome Res 2001;11(11):1861-1870.
5. Skubitz KM, Skubitz AP. Differential gene expression in renal-cell cancer. J Lab Clin
Med 2002;140(1):52-64.
6. Liou LS, Shi T, Duan ZH et al. Microarray gene expression profiling and analysis in
renal cell carcinoma. BMC Urol 2004;4:9.
7. Hirota E, Yan L, Tsunoda T et al. Genome-wide gene expression profiles of clear cell
renal cell carcinoma: identification of molecular targets for treatment of renal cell
carcinoma. Int J Oncol 2006;29(4):799-827.
8. Reis EM, Nakaya HI, Louro R et al. Antisense intronic non-coding RNA levels
correlate to the degree of tumor differentiation in prostate cancer. Oncogene
2004;23(39):6684-6692.
9. Louro R, Nakaya HI, Amaral PP et al. Androgen responsive intronic non-coding RNAs.
BMC Biol 2007;5(1):4.
Page 18 of 29
John Wiley & Sons
Molecular Carcinogenesis
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
For Peer Review
19
10. Mattick JS. RNA regulation: a new genetics? Nat Rev Genet 2004;5(4):316-323.
11. Prasanth KV, Spector DL. Eukaryotic regulatory RNAs: an answer to the 'genome
complexity' conundrum. Genes Dev 2007;21(1):11-42.
12. Nakaya HI, Amaral PP, Louro R et al. Genome mapping and expression analyses of
human intronic noncoding RNAs reveal tissue-specific patterns and enrichment in
genes related to regulation of transcription. Genome Biol 2007;8(3):R43.
13. Willingham AT, Gingeras TR. TUF Love for "Junk" DNA. Cell 2006;125(7):1215-
1220.
14. Dias-Neto E, Correa RG, Verjovski-Almeida S et al. Shotgun sequencing of the human
transcriptome with ORF expressed sequence tags. Proc Natl Acad Sci USA
2000;97(7):3491-3496.
15. Camargo AA, Samaia HP, Dias-Neto E et al. The contribution of 700,000 ORF
sequence tags to the definition of the human transcriptome. Proc Natl Acad Sci USA
2001;98(21):12103-12108.
16. Quackenbush J. Microarray data normalization and transformation. Nat Genet 2002;32
Suppl:496-501.
17. Tusher VG, Tibshirani R, Chu G. Significance analysis of microarrays applied to the
ionizing radiation response. Proc Natl Acad Sci USA 2001;98(9):5116-5121.
18. Nadon R, Shi P, Skandalis A et al. Statistical inference methods for gene expression
arrays. Microarrays: Optical Technologies and Informatics. Proceedings of SPIE
2001;4266:46-55.
19. van 't Veer LJ, Dai H, van de Vijver MJ et al. Gene expression profiling predicts
clinical outcome of breast cancer. Nature 2002;415(6871):530-536.
20. Wang E, Miller LD, Ohnmacht GA, Liu ET, Marincola FM. High-fidelity mRNA
amplification for gene profiling. Nat Biotechnol 2000;18(4):457-459.
21. Pfaffl MW. A new mathematical model for relative quantification in real-time RT-PCR.
Nucleic Acids Res 2001;29(9):e45.
22. Iseli C, Jongeneel CV, Bucher P. ESTScan: a program for detecting, evaluating, and
reconstructing potential coding regions in EST sequences. Proc Int Conf Intell Syst Mol
Biol 1999:138-148.
23. Lestrade L, Weber MJ. snoRNA-LBME-db, a comprehensive database of human
H/ACA and C/D box snoRNAs. Nucleic Acids Res 2006;34(Database issue):D158-162.
24. Griffiths-Jones S, Grocock RJ, van Dongen S, Bateman A, Enright AJ. miRBase:
microRNA sequences, targets and gene nomenclature. Nucleic Acids Res
2006;34(Database issue):D140-144.
Page 19 of 29
John Wiley & Sons
Molecular Carcinogenesis
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
For Peer Review
20
25. Costello JF, Fruhwald MC, Smiraglia DJ et al. Aberrant CpG-island methylation has
non-random and tumour-type-specific patterns. Nat Genet 2000;24(2):132-138.
26. Esteller M, Corn PG, Baylin SB, Herman JG. A gene hypermethylation profile of
human cancer. Cancer Res 2001;61(8):3225-3229.
27. Takahashi M, Rhodes DR, Furge KA et al. Gene expression profiling of clear cell renal
cell carcinoma: gene identification and prognostic classification. Proc Natl Acad Sci U
S A 2001;98(17):9754-9759.
28. Jones J, Otu H, Spentzos D et al. Gene signatures of progression and metastasis in renal
cell cancer. Clin Cancer Res 2005;11(16):5730-5739.
29. Skubitz KM, Zimmerman W, Kammerer R, Pambuccian S, Skubitz AP. Differential
gene expression identifies subgroups of renal cell carcinoma. J Lab Clin Med
2006;147(5):250-267.
30. Lovat PE, Annicchiarico-Petruzzelli M, Corazzari M et al. Differential effects of
retinoic acid isomers on the expression of nuclear receptor co-regulators in
neuroblastoma. FEBS Lett 1999;445(2-3):415-419.
31. Romm E, Nielsen JA, Kim JG, Hudson LD. Myt1 family recruits histone deacetylase to
regulate neural transcription. J Neurochem 2005;93(6):1444-1453.
32. Tsuchida K, Nakatani M, Matsuzaki T et al. Novel factors in regulation of activin
signaling. Mol Cell Endocrinol 2004;225(1-2):1-8.
33. Hirohashi Y, Wang Q, Liu Q et al. p78/MCRS1 forms a complex with centrosomal
protein Nde1 and is essential for cell viability. Oncogene 2006;25(35):4937-4946.
34. Gutierrez NC, Lopez-Perez R, Hernandez JM et al. Gene expression profile reveals
deregulation of genes with relevant functions in the different subclasses of acute
myeloid leukemia. Leukemia 2005;19(3):402-409.
35. Ramaswamy S, Ross KN, Lander ES, Golub TR. A molecular signature of metastasis in
primary solid tumors. Nat Genet 2003;33(1):49-54.
36. Luther HP, Bartsch H, Morano I, Podlowski S, Baumann G. Regulation of naturally
occurring antisense RNA of myosin heavy chain (MyHC) in neonatal cardiomyocytes. J
Cell Biochem 2005;94(4):848-855.
37. Kampa D, Cheng J, Kapranov P et al. Novel RNAs Identified From an In-Depth
Analysis of the Transcriptome of Human Chromosomes 21 and 22. Genome Res
2004;14(3):331-342.
38. Bertone P, Stolc V, Royce TE et al. Global identification of human transcribed
sequences with genome tiling arrays. Science 2004;306(5705):2242-2246.
39. Reis EM, Louro R, Nakaya HI, Verjovski-Almeida S. As antisense RNA gets intronic.
Omics 2005;9(1):2-12.
Page 20 of 29
John Wiley & Sons
Molecular Carcinogenesis
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
For Peer Review
21
40. Ji P, Diederichs S, Wang W et al. MALAT-1, a novel noncoding RNA, and thymosin
beta4 predict metastasis and survival in early-stage non-small cell lung cancer.
Oncogene 2003;22(39):8031-8041.
41. Angeloni D, ter Elst A, Wei MH et al. Analysis of a new homozygous deletion in the
tumor suppressor region at 3p12.3 reveals two novel intronic noncoding RNA genes.
Genes Chromosomes Cancer 2006;45(7):676-691.
42. Wang XS, Zhang Z, Wang HC et al. Rapid identification of UCA1 as a very sensitive
and specific unique marker for human bladder carcinoma. Clin Cancer Res
2006;12(16):4851-4858.
43. Reis EM, Ojopi EP, Alberto FL et al. Large-scale transcriptome analyses reveal new
genetic marker candidates of head, neck, and thyroid cancer. Cancer Res
2005;65(5):1693-1699.
44. Yan MD, Hong CC, Lai GM, Cheng AL, Lin YW, Chuang SE. Identification and
characterization of a novel gene Saf transcribed from the opposite strand of Fas. Hum
Mol Genet 2005;14(11):1465-1474.
45. Honda K, Yamada T, Hayashida Y et al. Actinin-4 increases cell motility and promotes
lymph node metastasis of colorectal cancer. Gastroenterology 2005;128(1):51-62.
46. Ozdag H, Teschendorff AE, Ahmed AA et al. Differential expression of selected
histone modifier genes in human solid cancers. BMC Genomics 2006;7:90.
47. Scanlan MJ, Welt S, Gordon CM et al. Cancer-related serological recognition of human
colon cancer: identification of potential diagnostic and immunotherapeutic targets.
Cancer Res 2002;62(14):4041-4047.
48. Bradbury CA, Khanim FL, Hayden R et al. Histone deacetylases in acute myeloid
leukaemia show a distinctive pattern of expression that changes selectively in response
to deacetylase inhibitors. Leukemia 2005;19(10):1751-1759.
49. Yang J, Aittomaki S, Pesu M et al. Identification of p100 as a coactivator for STAT6
that bridges STAT6 with RNA polymerase II. Embo J 2002;21(18):4950-4958.
50. Benekli M, Baer MR, Baumann H, Wetzler M. Signal transducer and activator of
transcription proteins in leukemias. Blood 2003;101(8):2940-2954.
51. Suganuma N, Segade F, Matsuzu K, Bowden DW. Differential expression of facilitative
glucose transporters in normal and tumour kidney tissues. BJU Int 2007;99(5):1143-
1149.
Page 21 of 29
John Wiley & Sons
Molecular Carcinogenesis
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
For Peer Review
22
FIGURE LEGENDS
Figure 1. Expression of intronic noncoding RNAs in renal tissue. Microarray slides were
hybridized to 24 matched samples of tumor or adjacent non-tumor tissue and positive probes
were identified (see Methods for details). To be considered "expressed", a probe should have an
intensity signal at least 3 standard deviations above the average signal of a set of plant-derived
negative control probes deposited in the arrays. The percentage of expressed probes from each
of the 3 different probe categories (exonic, intronic and intergenic) (Y axis) refers to the
minimum number of tumor or adjacent non-tumor renal tissue samples in which their
expression was observed (X axis). The total number of probes in each category is shown in
parenthesis.
Figure 2. Molecular signature of clear cell RCC. Heat map with the expression levels of 64
genes (rows) with transcript levels significantly altered (p < 0.001 and FDR < 10% in at least 5
out of 6 leave-one-out cross-validation datasets, see Methods for details) among 12 paired
samples of tumor (T) and adjacent non-tumor (N) renal tissue from 6 patients with clear cell
RCC (columns). For each transcript, the relative expression values are given as log2 ratios
(T/N): red indicates higher expression in tumor tissue; blue, higher expression in non-tumor
tissue. Intronic transcripts are indicated by arrows and each is named after the corresponding
protein-coding gene mapping in the same genomic locus.
Figure 3. Expression of candidate markers of RCC. Relative levels of selected exonic (A−D)
and intronic (E) transcripts in tumor tissue samples compared to matched adjacent non-tumor
renal tissue from the same patient were determined by real-time RT-PCR. Genes significantly
altered in tumors relative to matched adjacent non-tumor samples below the p-value threshold
(within parenthesis) are marked with an asterisk: TRIP3 (p < 0.01) (A); SYNJ2BP (p < 0.01)
Page 22 of 29
John Wiley & Sons
Molecular Carcinogenesis
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
For Peer Review
23
(B); SIN3B (p < 0.02) (C); MYH11 and NDE1 (p < 0.02) (D); ACTN4 and SND1 (p < 0.05) (E).
For each gene, assays were performed in triplicate. Mean values with error bars are shown. For
each gene tested, the house-keeping gene TUBB was used as the reference for normalization
across patient samples.
Page 23 of 29
John Wiley & Sons
Molecular Carcinogenesis
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
For Peer Review
168x115mm (600 x 600 DPI)
Page 24 of 29
John Wiley & Sons
Molecular Carcinogenesis
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
For Peer Review
88x183mm (600 x 600 DPI)
Page 25 of 29
John Wiley & Sons
Molecular Carcinogenesis
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
For Peer Review
213x191mm (600 x 600 DPI)
Page 26 of 29
John Wiley & Sons
Molecular Carcinogenesis
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
For Peer Review
Table 1. Clinicopathological data from renal cell carcinoma tissue samples.
Patient n° Fuhrman
nuclear
Grade
Histological
subtype
Primary tumor
size (cm)
Evidence of
necrosis
Pathological
staging
Follow-up
(months)
Disease
status
3 IV clear cell 6x7x4 Yes pT3bN0M1 21 metastatic
5 II/IV clear cell 8x8x5 Yes pT2N1M1 6 metastatic
9 II clear cell 8x6 Yes pT3aN0Mx 54 Locally
advanced
12 II clear cell 4x3x2 No pT1aN0Mx n.a. Localized
15 IV clear cell 10x10x8 Yes T3N2Mx n.a. n.a.
24 IV clear cell 15x11x7 Yes pT3aN0Mx 16 metastatic
26 II clear cell 7x6x5 No T3aNXM0 58 Localized
28 III clear cell 5x3x3 Yes pT1bN0Mx 20 Localized
31 II clear cell 8x6 Yes pT3bN2M1 40 metastatic
32 II clear cell 13x8 No pT3aN0Mx 17 Locally
advanced
27 III chromophobe 7x6x3 No pT2N0Mx 68 Localized
4 III/IV papillary 16x11x8 Yes pT3aN0Mx n.a. n.a.
14 IV papillary 8x7x6 Yes pT3bN0M0 58 Locally
advanced
16 III papillary 16X12 Yes pT3aN2Mx n.a. n.a.
19 III papillary 8X7 Yes pT3aN0Mx 49 n.a.
23 IV sarcomatoid
(clear cell)
9x7 Yes pT3bN0Mx n.a. metastatic
22 II unclassified 15x10x9 Yes pT3aN0Mx 7 metastatic
Page 27 of 29
John Wiley & Sons
Molecular Carcinogenesis
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
For Peer Review
1
Table 2. The 83-gene set found to be differentially expressed in clear cell renal cell carcinoma.
Probe
accession
Gene locus
Exon/intron
mapping
Log2
T/N
Annotation
Leave-one-out
cross-
validation
Altered in
non-clear
cell RCC
AW837036
GPX3 Exonic -3.7 Glutathione peroxidase 3 6/6 no
AW883439
PRKAG1 Exonic -2.8 AMPK-gamma1 5/6 yes
AW603395
YEATS4 Exonic -2.5 Glioma amplified sequence 41 5/6 yes
AW365027
CSNK1G2 Exonic -2.5 Casein kinase 1, gamma 2 6/6 yes
AW935998
FUS Exonic -2.5 Fusion t(12;16) in malignant liposarcoma) 6/6 yes
BF751544
ICT1 Exonic -2.5 Immature colon carcinoma transcript 1 5/6 yes
AW842748
SIN3B Exonic -2.4 SIN3 homolog B, transcription regulator
(yeast)
6/6 yes
CK327135
SYNJ2BP Exonic -2.4 Synaptojanin 2 binding protein 5/6 yes
BF087349
MAP3K7IP1 Exonic -2.4 Mitogen-activated protein kinase kinase
kinase 7 interacting protein 1
5/6 yes
BF368747
SLC2A1 Intronic -2.4 Solute carrier family,member 1 6/6 yes
BF922962
CTSB Exonic -2.3 Cathepsin B 5/6 yes
BE762727
FVT1 Exonic -2.3 Follicular variant translocation gene 5/6 yes
BG876687 MYH11/NDE1 Exonic -2.3 Myosin heavy chain, smooth muscle
isoform / NUDE1
6/6 yes
AW175991
FLJ34165 Exonic -2.3 CDNA FLJ34165 fis, clone FCBBF3014770 5/6 yes
BF890754
UQCRH Exonic -2.2 Ubiquinol cytochrome c reductase hinge
protein
5/6 yes
AW753128
P2RY1 Exonic -2.2 Purinoceptor P2Y1 5/6 yes
BF857797
C10orf104 Exonic -2.1 Chromosome 10 open reading frame 104 6/6 yes
AW836747
EPAS1 Exonic -2.1 Endothelial PAS domain protein 1 6/6 yes
AW373943
CAPNS1 Exonic -2.0 Calpain, small subunit 1 6/6 yes
BF378949
RAB27A Exonic -2.0 RAB27A 5/6 yes
BE697369
C16orf34 Exonic -2.0 Chromosome 16 open reading frame 34 6/6 yes
AW364435
LDLRAD3 Exonic -2.0 Hypothetical protein LOC143458 6/6 yes
AW884675
MTMR9 Exonic -2.0 Myotubularin related protein 9 5/6 no
AW862491
KIAA0984 Exonic -2.0 Hypothetical protein LOC23329 5/6 yes
BF892704
GSN Exonic -1.9 Gelsolin 6/6 yes
BF831599
VRK2 Exonic -1.9 Vaccinia related kinase 2 5/6 no
BF089987
SND1 Intronic -1.8 Staphylococcal nuclease and tudor domain
containing 1
6/6 no
BF155287
SRF Exonic -1.7 Serum response factor 5/6 no
BF882783
ACTN4 Intronic -1.7 Actinin alpha 4 5/6 no
BF898656
TRIP3 Exonic -1.6 Thyroid hormone receptor interactor 3 6/6 yes
BQ349967 PRDX3 Exonic -1.6 Peroxiredoxin 3 6/6 no
BF736784
SFPQ Exonic -1.6 Splicing factor proline/glutamine-rich 5/6 no
AW819770
RAB4A Exonic -1.6 Ras associated protein Rab4 5/6 no
AW369265
ERCC5 Exonic -1.5 Excision repair, group 5 6/6 no
BF891123
TFEC Exonic -1.5 Transcription factor EC 6/6 no
BE836304
NR4A3 Exonic -1.5 Nuclear receptor subfamily 4, group A,
member 3
6/6 no
BF333281
NIBP Intronic -1.4 NIK and IKK binding protein 5/6 no
AW883175
CASP7 Exonic -1.3 Caspase 7 5/6 no
BE816027
TFDP2 Exonic -1.3 Transcription factor DP2 5/6 no
Page 28 of 29
John Wiley & Sons
Molecular Carcinogenesis
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
For Peer Review
2
BF365294 TACC1 Intronic -1.3 Transforming, acidic coiled-coil containing
protein 1
6/6 yes
BF751539
FOXK2 Exonic -1.2 Forkhead box K2 5/6 no
BE153247
MBD2 Exonic -1.2 Methyl CpG binding domain protein 2 5/6 no
BF990000
ENPP1 Exonic -1.2 Ectonucleotide
pyrophosphatase/phosphodiesterase 1
5/6 no
BE720500
S100A2 Exonic -1.1 S100 calcium binding protein A2 5/6 no
BF946916
CHEK1 Exonic -1.0 Cell cycle checkpoint kinase 5/6 no
BF856925
WDR23 Exonic -1.0 WD repeat domain 23 5/6 no
AW361064
PICALM Exonic -1.0 Phosphatidylinositol binding clathrin
assembly protein
5/6 no
AW859979
FLJ39067 Exonic -1.0 CDNA FLJ39067 fis, clone NT2RP7014910 5/6 no
BQ366120 PRCC Exonic -1.0 Renal cell carcinoma, papillary 1 5/6 no
BE697269
SH3PX3 Exonic -0.9 Hypothetical protein MGC32065 5/6 no
BF922401
EPB41 Exonic -0.9 Erythrocyte membrane protein band 4.1 5/6 no
AW939421
MAP2K3 Exonic -0.9 Mitogen-activated protein kinase kinase 3 4/6 no
BQ314686 MSH3 Exonic -0.9 MutS homolog 3 5/6 no
BF946928
DEPDC5 Exonic -0.9 DEP domain containing 5 5/6 no
BG010306 HDAC5 Intronic -0.9 Histone deacetylase 5 5/6 no
BF994346
NDC80 Exonic -0.8 Kinetochore complex component (S.
cerevisiae)
4/6 no
BF360792
RAB25 Intronic -0.8 Ras associated protein RAB25 4/6 no
BF082556
Intergenic -0.7 4/6 no
BQ338721
MCM2 Exonic -0.6 Minichromosome maintenance protein 2 3/6 no
BF092089
TCF3 Exonic -0.6 Transcription factor 3 4/6 no
BE163794
ZBED4 Exonic -0.5 Zinc finger BED domain containing 4 3/6 no
AW748714
ZNF447 Exonic -0.4 Hypothetical protein FLJ12895 5/6 no
BE697330
SAT2 Exonic -0.4 Spermidine/spermine N1-acetyltransferase 2 4/6 no
AW837043
IL11RA Exonic -0.4 Interleukin 11 receptor alpha 4/6 no
BF087474
GAA Exonic 0.1 Lysosomal alpha glucosidase 3/6 no
AW852125
AK055564 Exonic 0.1 AK055565 3/6 no
BE935243
MDM2 Exonic 0.1 Transformed 3T3 cell double minute 2 2/6 no
AW796066
TP53I3 Exonic 0.1 p53 induced gene 3 2/6 no
BG005977
MLLT7 Exonic 0.1 Myeloid/lymphoid, translocated to 7 3/6 no
BE070310
SDC2 Exonic 0.1 Syndecan 2 2/6 no
BF810617
ADORA2A Exonic 0.1 Adenosine A2 receptor 2/6 no
BF871631
FOXK1 Exonic 0.1 Forkhead box K1 3/6 no
BF957566
TMF1 Exonic 0.1 TATA element modulatory factor 1 2/6 no
BF949348
TCF2 Exonic 0.3 Transcription factor 2 2/6 no
BE837647
POFUT2 Exonic 0.3 Protein O-fucosyltransferase 2 5/6 no
BF987726
H2AFY Intronic 0.3 H2A histone family member Y 5/6 no
BE702107
MAP4 Exonic 0.6 Microtubule associated protein 4 5/6 no
AW880614
RBMX Exonic 0.7 RNA binding motif protein, X-linked 5/6 no
BF997724
PAPPA/AY623011 Exonic 0.7 Pregnancy associated plasma protein A /
DIPLA1-antisense mRNA
5/6 no
BF328211
AK091566 Exonic 1.1 AK091566 5/6 no
AW901127
ARNTL Exonic 1.1 Aryl hydrocarbon receptor nuclear
translocator-like
5/6 no
AW377370
POLL Exonic 1.1 DNA polymerase lambda 5/6 no
AW383947
CD68 Exonic 1.7 CD68 antigen 6/6 no
Page 29 of 29
John Wiley & Sons
Molecular Carcinogenesis
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
Livros Grátis
( http://www.livrosgratis.com.br )
Milhares de Livros para Download:
Baixar livros de Administração
Baixar livros de Agronomia
Baixar livros de Arquitetura
Baixar livros de Artes
Baixar livros de Astronomia
Baixar livros de Biologia Geral
Baixar livros de Ciência da Computação
Baixar livros de Ciência da Informação
Baixar livros de Ciência Política
Baixar livros de Ciências da Saúde
Baixar livros de Comunicação
Baixar livros do Conselho Nacional de Educação - CNE
Baixar livros de Defesa civil
Baixar livros de Direito
Baixar livros de Direitos humanos
Baixar livros de Economia
Baixar livros de Economia Doméstica
Baixar livros de Educação
Baixar livros de Educação - Trânsito
Baixar livros de Educação Física
Baixar livros de Engenharia Aeroespacial
Baixar livros de Farmácia
Baixar livros de Filosofia
Baixar livros de Física
Baixar livros de Geociências
Baixar livros de Geografia
Baixar livros de História
Baixar livros de Línguas
Baixar livros de Literatura
Baixar livros de Literatura de Cordel
Baixar livros de Literatura Infantil
Baixar livros de Matemática
Baixar livros de Medicina
Baixar livros de Medicina Veterinária
Baixar livros de Meio Ambiente
Baixar livros de Meteorologia
Baixar Monografias e TCC
Baixar livros Multidisciplinar
Baixar livros de Música
Baixar livros de Psicologia
Baixar livros de Química
Baixar livros de Saúde Coletiva
Baixar livros de Serviço Social
Baixar livros de Sociologia
Baixar livros de Teologia
Baixar livros de Trabalho
Baixar livros de Turismo