Download PDF
ads:
CENTRO UNIVERSITÁRIO DA FEI
Nelson Augusto Oliveira de Aguiar
COMPARAÇÃO ENTRE AS ANÁLISES ESTATÍSTICAS
UNIVARIADA E MULTIVARIADA NO DIAGNÓSTICO DA
DOENÇA CEREBRAL DE ALZHEIMER
São Bernardo do Campo
2007
ads:
Livros Grátis
http://www.livrosgratis.com.br
Milhares de livros grátis para download.
Nelson Augusto Oliveira de Aguiar
COMPARAÇÃO ENTRE AS ANÁLISES ESTATÍSTICAS
UNIVARIADA E MULTIVARIADA NO DIAGNÓSTICO DA
DOENÇA CEREBRAL DE ALZHEIMER
Dissertação de Mestrado apresentada ao
Centro Universitário da FEI como parte dos
requisitos necessários para a obteão do título
de Mestre em Engenharia Elétrica.
Orientador: Prof. Dr. Carlos Eduardo Thomaz
São Bernardo do Campo
2007
ads:
Aguiar, Nelson Augusto Oliveira de
Comparação entre as análises estatísticas univariada e
multivariada no diagnóstico da doença cerebral de Alzheimer. /
Nelson Augusto Oliveira de Aguiar. – São Bernardo do Campo, 2007.
150f: il.
Dissertação de Mestrado em Engenharia Elétrica Centro
Universitário da FEI.
1. Pesquisa Científica. 2. Método Científico. I. Título.
CDU 001.8
NELSON AUGUSTO OLIVEIRA DE AGUIAR
COMPARAÇÃO ENTRE AS ANÁLISES ESTATÍSTICAS
UNIVARIADA E MULTIVARIADA NO DIAGNÓSTICO DA
DOENÇA CEREBRAL DE ALZHEIMER
Dissertação de Mestrado
Centro Universitário da FEI
Departamento de Engenharia Elétrica
Banca Examinadora
_________________________________________
Prof. Dr. Carlos Eduardo Thomaz (orientador) – FEI
_________________________________________
Prof. Dr. Geraldo Busatto Filho – IPQ – USP
_________________________________________
Profª. Drª. Maria Cláudia Ferrari de Castro– FEI
São Bernardo do Campo
Dedico este trabalho a minha querida mãe Ana
Julia Faria de Oliveira e a meu irmão Fernando
Henrique Oliveira de Aguiar que me apoiaram
desde o início dessa jornada, sendo
fundamentais para que eu pudesse concluir
esse trabalho.
AGRADECIMENTOS
Neste espaço deixarei o meu agradecimento de forma breve e sucinta, caso contrário
seriam necessárias inúmeras páginas para que o mesmo fosse realizado.
Primeiramente agradeço à minha mãe Ana Julia Faria de Oliveira e ao meu irmão
Fernando Henrique Oliveira de Aguiar, pela força fornecida e tempo gasto a meu favor,
pois se não fosse por eles, não teria conseguido concluir esse curso.
Ao meu grande orientador, amigo e professor, Prof. Dr. Carlos Eduardo Thomaz,
pela paciência, pelos ensinamentos, conselhos e inúmeras correções que contribuíram muito
neste trabalho. Aos professores Flávio Tonidandel, Paulo Eduardo Santos e Reinaldo
Bianchi pelos valiosos ensinamentos transmitidos. Aos amigos do mestrado Edson Kitani
pelos conhecimentos compartilhados, ao Sérgio Henry companheiro de estudos nos finais de
semana; ao Rodolfo Coura, Luiz Celiberto, Murilo Martins, Julio Sgarbi, Marcel Lira e
Leandro Demari, pelo espírito de equipe demonstrado durante os créditos realizados no
curso. Aos também amigos do mestrado Alexandre Ribeiro Imperatore e Adriane
Colossetti pela força dada na reta final deste mestrado.
Aos meus grandes amigos, Michel Galo, Stênio de Oliveira e Helen Sinésio, pelo
apoio, força e tempo dispensado durante o curso. À minha namorada Luciana Elena
Sarmento pelo incentivo e apoio dados durante o curso, por compreender a minha ausência e
impossibilidade de ficar mais tempo com ela. Ao diretor do curso de extensão da
Universidade São Judas Tadeu (USJT) e também meu tio Fernando Ferrari Duch por
sempre me incentivar e acreditar em mim; à Dinéia Hypolitto, professora no curso de
Pedagogia e Formação de Professores na USJT, por também sempre me apoiar e incentivar.
Às minhas amigas Flávia Mendes, Tatiana Pricoli e Nathalia Buesa que me deram muita
força durante o período da qualificação. Aos meus amigos e familiares por sempre me
ampararem e terem que abrir mão da minha presença em determinadas situações.
Aos membros da banca, Prof. Dr. Geraldo F. Busatto e Profª. Drª. Maria Cláudia,
que contribuíram muito com críticas e sugestões enriquecedoras para este trabalho. Ao Prof.
Renato Giacomini que me deu força para ingressar no curso de Mestrado. Agradeço também
à Adriana e Rejane da secretaria do mestrado e a todos que colaboraram diretamente e
indiretamente para que este trabalho fosse concluído.
A vocês os meus sinceros agradecimentos!
“É melhor acender uma vela do que
amaldiçoar a escuridão.”
Confúcio
"Você coisas e diz: Por que? Mas eu sonho
com coisas que nunca existiram e digo: Por
que não?"
George Bernard Shaw
"Grandes realizações não são feitas por
impulso, mas por uma soma de pequenas
realizações.”
Vincent Van Gogh
"A maior de todas as ignorâncias é rejeitar
uma coisa sobre a qual você nada sabe."
H. Jackson Brown
“Tudo que não se conhece é tido como
magnífico.”
Tácito
RESUMO
A doença de Alzheimer é considerada uma das desordens cerebrais mais comuns e suas
conseqüências são devastadoras, pois o cérebro humano tende a degenerar progressivamente e
áreas como a memória, o raciocínio, a comunicação e a coordenação motora são
particularmente afetadas. Embora a doença de Alzheimer seja a demência mais comum, ainda
não existe uma cura para a mesma, e também não se sabe qual é a razão principal para que
esta doença se manifeste. Um dos grandes avanços das pesquisas nesta área tem sido
observado em trabalhos científicos que utilizam técnicas de neuroimagem de alta resolução,
tais como imagens de ressonância magnética, para avaliar a estrutura, a função cerebral e a
ativação de certas áreas do cérebro. Essa dissertação apresenta um estudo comparativo de
imagens cerebrais de ressonância magnética, entre pessoas diagnosticadas previamente com a
doença de Alzheimer e controle. Tomando as imagens cerebrais como ponto de partida,
investiga-se duas técnicas de análise estatística: a análise univariada denominada Statistical
Parametric Mapping (SPM), comumente utilizada em problemas deste tipo; e a análise
multivariada, proposta recentemente, formada pela composição das técnicas Principal
Component Analysis (PCA) e Maximum uncertainty Linear Discriminant Analysis (MLDA).
Nos resultados obtidos em ambas análises, observou-se diferenças nas imagens extremamente
relevantes, isto é, as áreas cerebrais onde foram encontradas as diferenças são onde realmente
ocorrem alterações provocadas pela doença de Alzheimer. Essas áreas são o hipocampo,
ventrículo, hipotálamo, corpo caloso, córtex cerebral, giro do cíngulo e amígdala. Discute-se
também a potencialidade dessas análises estatísticas e o grande benefício que um especialista
da área médica desfrutaria se tivesse acesso a ambos os resultados auxiliando-o em eventuais
pesquisas e diagnósticos da doença em questão.
Palavras-chave: Análise Estatística Univariada. Análise Estatística Multivariada. Alzheimer.
SPM. PCA. LDA. MLDA.
ABSTRACT
Alzheimer’s disease is considered one of the most common cerebral disorders and its
consequences are devastating, because the human brain deteriorates progressively and areas
such as the memory, reasoning, personal communication and coordination are particularly
affected. Although the Alzheimer’s disease is the most common brain dementia, its cure is
still unknown and it has not been possible yet to determine its main reason of occurrence. The
main research advances in this area have been observed in scientific works that have used
techniques of neuro-images with high resolution, such as magnetic resonance (MR) imaging,
to verify the structure, function and activation of specific human brain regions. This
dissertation presents a comparative study of MR brain images between subjects previously
diagnosed with Alzheimer and controls. Using these MR images, we investigate two
statistical methods of analysis: Statistical Parametric Mapping (SPM), a mass-univariate
statistical method commonly used on image brain analysis; and a multivariate statistical
framework proposed recently which is composed of Principal Component Analysis (PCA)
and Maximum uncertainty Linear Discriminant Analysis (MLDA). Our experimental results
have shown that both statistical methods extract relevant changes between the groups, and
such changes are among the areas thought to be the most prominently affected by atrophic
changes in Alzheimer’s disease. These areas are the hippocampus, ventricular system,
hypothalamus, corpus callosum, brain cortex, cingulate gyrus and amigdala. We discuss also
the benefit of using such mass-univariate and multivariate statistical models in the medical
field leading clinicians to an automated detection of abnormalities which may be beneficial
for understanding brain disorders in general and diagnoses.
Keywords: Univariate Statistical Method. Multivariate Statistical Method. Alzheimer. SPM.
PCA. LDA, MLDA.
SUMÁRIO
1 INTRODUÇÃO...................................................................................................... 20
1.1 OBJETIVOS ................................................................................................................ 22
1.2 CONTRIBUIÇÕES........................................................................................................ 22
1.3 ORGANIZAÇÃO DO TRABALHO ................................................................................... 22
2 CONCEITOS PRELIMINARES........................................................................... 24
2.1 A DOENÇA DE ALZHEIMER......................................................................................... 24
2.2 ESTÁGIOS DA DOENÇA............................................................................................... 26
2.3 DIAGNÓSTICO DA DOENÇA......................................................................................... 28
2.4 REGIÕES CEREBRAIS.................................................................................................. 29
2.4.1 O encéfalo ............................................................................................................ 29
2.4.2 Diferenças cerebrais causadas pela doença de Alzheimer...................................... 39
2.5 RESSONÂNCIA MAGNÉTICA ....................................................................................... 44
2.6 CONCLUSÕES E COMENTÁRIOS ADICIONAIS ................................................................ 47
3 MÉTODOS ............................................................................................................. 48
3.1 ANÁLISE UNIVARIADA .............................................................................................. 48
3.1.1 Modelo Linear Geral ............................................................................................ 48
3.1.2 Testes de significância.......................................................................................... 49
3.2 ANÁLISE MULTIVARIADA .......................................................................................... 52
3.2.1 Análise de Componentes Principais ...................................................................... 53
3.2.2 Análise de Discriminantes Lineares ...................................................................... 55
3.2.3 O Método PCA+MLDA ....................................................................................... 58
3.3 COMENTÁRIOS ADICIONAIS ....................................................................................... 62
4 EXPERIMENTOS.................................................................................................. 63
4.1 BANCO DE IMAGENS .................................................................................................. 63
4.2 TIPOS DE EXPERIMENTOS........................................................................................... 63
4.2.1 Análise Univariada ............................................................................................... 64
4.2.2 Análise Multivariada ............................................................................................ 79
4.3 COMENTÁRIOS ADICIONAIS ....................................................................................... 89
5 RESULTADOS....................................................................................................... 92
5.1 ANÁLISE UNIVARIADA .............................................................................................. 92
5.2 ANÁLISE MULTIVARIADA .......................................................................................... 97
5.3 COMPARAÇÕES DOS RESULTADOS ........................................................................... 112
5.4 COMENTÁRIOS ADICIONAIS ..................................................................................... 122
6 CONCLUSÕES E TRABALHOS FUTUROS .................................................... 123
REFERÊNCIAS BIBLIOGRÁFICAS............................................................................ 127
APÊNDICE A ARTIGO DO SIBGRAPI 2006............................................................ 132
APÊNDICE B – RELATÓRIO TÉCNICO – FEI – 2007............................................... 141
LISTA DE FIGURAS
Figura 1.1 – Causas de demência. ........................................................................................ 20
Figura 2.1 - Efeito relativo ao cérebro dos pacientes que tenham a doença de Alzheimer. .... 25
Figura 2.2– As principais partes do encéfalo e os hemisférios cerebrais. .............................. 30
Figura 2.3 – Cérebro humano, com destaque para os lobos................................................... 31
Figura 2.4 – Cérebro humano, com destaque para os sulcos cerebrais................................... 32
Figura 2.5 – Localização das principais funções cerebrais. ................................................... 33
Figura 2.6 – Regiões cerebrais como o 1º, 2º, e 4º ventrículos, hipotálamo, tálamo e
cerebelo........................................................................................................................ 34
Figura 2.7 – Visão lateral do cérebro, destacando o 3º e 4º ventrículos................................. 35
Figura 2.8 – Estruturas cerebrais: Hipotálamo, Tálamo, Amígdala e Hipocampo.................. 36
Figura 2.9 – As divisões do hipotálamo em: lateral, medial e periventricular........................ 37
Figura 2.10 – Divisão do Tronco encefálico. ........................................................................ 38
Figura 2.11 Ilustração das estruturas do neurônio: Corpo celular, núcleo, axônio, dendrito e
bainha de mielina. ........................................................................................................ 40
Figura 2.12 Núcleo basal de Meynert, local comumente afetado pela doença de Alzheimer.
..................................................................................................................................... 41
Figura 2.13 Placa amilóide, essas placas são encontradas nos cérebros dos pacientes
portadores da doença de Alzheimer. ............................................................................. 42
Figura 2.14 Emaranhados neurofibrilares, que são causados pela morte da proteína tau que
sustenta o neurônio....................................................................................................... 43
Figura 2.15 – Tomógrafo de ressonância magnética. ............................................................ 46
Figura 3.1 – Valores da tábua do teste t................................................................................ 52
Figura 3.2 – Imagem de um espalhamento de amostras, com o 1º e o 2º autovetores. ........... 54
Figura 3.3 – A figura (a) ilustra um hiper-plano onde o vetor tenta separar as imagens em dois
grupos, e na figura (b) o vetor consegue fazer a separação dos grupos com sucesso...... 57
Figura 3.4 – Processo da Análise Multivariada. (Adaptado de THOMAZ et. al., 2006). ....... 59
Figura 4.1 – Etapa de criação das imagens de referência. ..................................................... 66
Figura 4.2 – Normalização – imagem utilizada como modelo (T1.img) e imagem normalizada.
..................................................................................................................................... 67
Figura 4.3 – Segmentação cerebral em três novas imagens: substância cinza, branca e LCR. 68
Figura 4.4 – Pré-Processamento de imagens......................................................................... 71
Figura 4.5 – Imagem de referência IRef1.img. ..................................................................... 72
Figura 4.6 Imagem de referência IRef2.img e um exemplo de imagem de massa cinzenta
normalizada.................................................................................................................. 73
Figura 4.7 Imagem de referência IRef2.img e um exemplo de imagem de massa branca
normalizada.................................................................................................................. 74
Figura 4.8 – Imagem de referência IRef2.img e um exemplo de imagem do LCR normalizado.
..................................................................................................................................... 75
Figura 4.9 – Pré-Processamento final. .................................................................................. 76
Figura 4.10 – Imagem cerebral modulada............................................................................. 77
Figura 4.11 – Imagem cerebral suavizada............................................................................. 78
Figura 4.12 – Processamento das imagens para a análise estatística multivariada. ................ 80
Figura 4.13 – Imagem do cérebro, sendo que a imagem A ilustra o cérebro original, a imagem
B o rebro normalizado e a C o cérebro após a retirada do crânio e tecidos extra-
cerebrais....................................................................................................................... 81
Figura 4.14 – Imagem da média global de todas as imagens cerebrais utilizadas neste trabalho.
..................................................................................................................................... 83
Figura 4.15 – Ilustração dos três primeiros autovetores. ....................................................... 86
Figura 4.16 - Gráfico da classificação das imagens em dois grupos, controles e pacientes. O
triângulo destaca a fronteira de decisão, os círculos são os desvios do grupo de controle e
os quadrados os do grupo de paciente........................................................................... 88
Figura 5.1 – Análise da substância cinzenta.......................................................................... 94
Figura 5.2 – Análises da substância branca........................................................................... 95
Figura 5.3 – Análises do LCR. ............................................................................................. 96
Figura 5.4 Gráfico da classificação das imagens em dois grupos, controles e pacientes, e a
distribuição gaussiana desta classificação ocorrida. ...................................................... 98
Figura 5.5 – As ilustrações acima são as imagens de controle e paciente que estão nas
extremidades. Sendo que a imagem A é a quinta imagem do grupo de controles
relacionada na Figura 5.4. Já a imagem B é a décima quarta imagem do grupo de
pacientes também ilustrada na Figura 5.4. .................................................................... 99
Figura 5.6 - Comparação entre o cérebro do controle e do paciente. O cérebro ilustrado está
dividido ao meio, sendo que a metade da esquerda ilustra o rebro do controle e a
metade da direita ilustra o cérebro do paciente............................................................ 100
Figura 5.7 As figuras A e B são as imagens de controle e paciente que estão mais próximas
da fronteira de decisão, ou seja, que estão próximas a linha que separa os dois grupos. A
figura de controle está representada pela imagem A, a qual é a terceira imagem do grupo
de controles ilustrado na Figura 5.4. A figura B ilustra uma imagem do grupo de
pacientes, e essa imagem é a quarta imagem do grupo, a qual foi ilustrada também na
Figura 5.4................................................................................................................... 101
Figura 5.8 – Gráfico da classificação das imagens em dois grupos, controles e pacientes. .. 102
Figura 5.9 – Imagens do corte coronal, ilustram as diferenças encontradas na região do
ventrículo e do hipotálamo, entre as imagens que representam o grupo de controles e o
grupo de pacientes. Sendo que o ventrículo está destacado com a letra A, e o hipotálamo
com a letra B.............................................................................................................. 103
Figura 5.10 Imagens do corte coronal, utilizando as linhas de contorno para ilustrar as
diferenças encontradas na região do ventrículo e do hipotálamo, entre as imagens que
representam o grupo de controles e o grupo de pacientes. Sendo que o ventrículo está
destacado com a letra A, e o hipotálamo com a letra B. .............................................. 103
Figura 5.11 Imagens do corte transaxial, ilustram as diferenças encontradas na região do
ventrículo, entre as imagens que representam o grupo de controles e o grupo de
pacientes. ................................................................................................................... 105
Figura 5.12 Imagens do corte transaxial, utilizando as isolines para ilustrar as diferenças
encontradas na região do ventrículo, entre as imagens que representam o grupo de
controles e o grupo de pacientes. ................................................................................ 105
Figura 5.13 Imagens do corte coronal, ilustram as diferenças encontradas na região do
hipocampo, entre as imagens que representam o grupo de controles e o grupo de
pacientes. ................................................................................................................... 106
Figura 5.14 Imagens do corte coronal, utilizando as isolines para ilustrar as diferenças
encontradas na região do hipocampo, entre as imagens que representam o grupo de
controles e o grupo de pacientes. ................................................................................ 106
Figura 5.15 Imagens do corte sagital, ilustram as diferenças encontradas na região do corpo
caloso, entre as imagens que representam o grupo de controles e o grupo de pacientes.
................................................................................................................................... 108
Figura 5.16 – Imagens do corte sagital, utilizando as isolines para ilustrar as diferenças
encontradas na região do corpo caloso, entre as imagens que representam o grupo de
controles e o grupo de pacientes. ................................................................................ 108
Figura 5.17 – Imagens do corte sagital, utilizando as isolines para ilustrar as diferenças
encontradas na região do giro do cíngulo, entre as imagens que representam o grupo de
controles e o grupo de pacientes. ................................................................................ 109
Figura 5.18 Imagens do corte coronal, ilustram as diferenças encontradas na fissura
longitudinal, entre as imagens que representam o grupo de controles e o grupo de
pacientes. ................................................................................................................... 110
Figura 5.19 Imagens do corte coronal, utilizando as isolines para ilustrar as diferenças
encontradas na fissura longitudinal, entre as imagens que representam o grupo de
controles e o grupo de pacientes. ................................................................................ 110
Figura 5.20 – Imagens do corte coronal, sendo duas delas sem a utilização das isolines, e duas
com isolines. Essas imagens ilustram as diferenças encontradas no córtex cerebral, entre
as imagens que representam o grupo de controles e o grupo de pacientes.................... 111
Figura 5.21 Imagens do corte transaxial, utilizando as isolines para ilustrar as diferenças
encontradas no córtex cerebral, entre as imagens que representam o grupo de controles e
o grupo de pacientes................................................................................................... 111
Figura 5.22 – Gráfico de comparação de tempo computacional da fase de criação das imagens
de referência entre os experimentos realizados. .......................................................... 113
Figura 5.23 – Gráfico de comparação de tempo computacional do pré-processamento das duas
análises estudadas....................................................................................................... 113
Figura 5.24 Gráfico de comparação de tempo computacional da análise estatística
univariada e multivariada. .......................................................................................... 114
Figura 5.25 Gráfico de comparação de tempo computacional total entre as análises
estatísticas utilizadas neste trabalho............................................................................ 114
Figura 5.26 – Imagens dos resultados da análise univariada e multivariada, ilustrando a
estrutura do hipocampo. ............................................................................................. 117
Figura 5.27 – Imagens dos resultados da análise univariada e multivariada, ilustrando algumas
alterações encontradas no córtex cerebral. .................................................................. 118
Figura 5.28 – Imagens dos resultados da análise univariada e multivariada, ilustrando a
estrutura do corpo caloso............................................................................................ 119
Figura 5.29 – Imagens dos resultados da análise univariada e multivariada, ilustrando a fissura
longitudinal................................................................................................................ 120
Figura 5.30 Imagens dos resultados da análise univariada e multivariada, ilustrando o giro
do cíngulo. ................................................................................................................. 121
Figura 6.1 – Análises da substância branca......................................................................... 124
LISTA DE TABELAS
Tabela 3.1 – Tabela com os conceitos de hipótese nula e hipótese alternativa....................... 50
Tabela 4.1 – Tabela com os valores de cada autovalor e seu respectivo autovetor................. 85
Tabela 4.2 Tabela com os tempos das análises univariada e multivariada, e a comparação
dos mesmos.................................................................................................................. 91
Tabela 5.1 Tabela de comparações entre as análises estatísticas univariada e multivariada.
................................................................................................................................... 115
LISTA DE SÍMBOLOS
t Teste de significância t.
p Nível de significância p.
1
k
x
Média das amostras do grupo 1.
1
k
σ
Desvio padrão do grupo 1.
1
n
Quantidade de amostras do grupo 1.
H
o
Hipótese Nula.
H
1
Hipótese Alternativa.
k
Um determinado voxel da imagem.
N
Número de imagens cerebrais
n Quantidade de variáveis de cada imagem
Σ
Matriz de covariância
W
pca
Base vetorial que maximiza a matriz de covariância.
φ Autovetor.
λ
Autovalor.
b
S
Matriz de espalhamento entre as classes (inter-classes).
w
S
Matriz de espalhamento dentro de cada classe (intra-classes).
R Razão de Fisher.
W
lda
Projeção ortonormal, da melhor separação linear entre os grupos de amostras.
Z
pca
Matriz de dados, com imagens representadas nos autovetores contidos na
matriz
pca
W .
Z
lca
Matriz de dados, com imagens representadas no autovetor de W
lda
.
H Matriz das imagens originais.
h
Média global da matriz H.
n
a
é o valor médio do voxel n.
Z
Matriz de imagens concatenadas com a média zero.
T
Z
Matriz transposta das imagens concatenadas
Matriz de autovetores
*
Λ
Matriz de autovalores
Z
A
Vetor com as informações mais expressivas do ponto escolhido para ser
reconstruído.
Z
B
Vetor com as características mais discriminantes da imagem.
Z
C
Imagem reconstruída.
LISTA ABREVIATURAS
ACP – Análise de Componentes Principais.
ADL – Análise de Discriminantes Lineares.
CSF – Cerebrospinal Fluid.
DSM-IV – Diagnostic and Statistical Manual of Mental Disorders.
DIL – Decaimento de Indução Livre.
DP – Densidade de protons
FEI Fundação Educacional Inaciana
FID – Free Induction Decay
IRM – Imagens de Ressonância Magnética
LCR – Líquido cefaloraquidiano
LDA – Linear Discriminant Analysis
MBV – Morfometria Baseada em Voxel
MEEM – MiniExame do Estado Mental
MLDA – Maximum uncertainty Linear Discriminant Analysis
MRI – Magnetic Resonance Imaging
PCA – Principal Component Analysis
PPA – Proteína precursora do amilóide
SPM – Statistical Parametric Mapping
TC – Tomografia Computadorizada
20
1 INTRODUÇÃO
A doença de Alzheimer é considerada uma das desordens cerebrais mais comuns e
suas conseqüências o devastadoras, pois o cérebro humano tende a degenerar
progressivamente e áreas como a memória, o raciocínio, a comunicação e a coordenação
motora são particularmente afetadas (ALMEIDA; CROCCO, 2000) (KAWAS, 2003)
(BUSATTO FILHO, 2007). Segundo Petersen (PETERSEN, 2006), a doença de Alzheimer é
responsável aproximadamente por 56% de todas as demências, conforme ilustra a Figura 1.1 a
seguir.
Figura 1.1 – Causas de demência.
(Adaptado de PETERSEN, 2006).
Com a evolução da desordem cerebral de Alzheimer, os pacientes começam a ter
lapsos de memória que, muitas vezes, passam desapercebidos pelos familiares e amigos
próximos, pois as pessoas que possuem essa doença têm normalmente idade superior a 60
anos e, por isso, os esquecimentos são tratados como caduquice. Assim, quando
diagnosticada, o rebro do paciente já foi afetado, e em muitas situações a doença se
encontra em estágio avançado (CAOVILLA; CANINEU, 2002).
21
Embora a doença de Alzheimer seja a demência mais comum, ainda não existe uma
cura para a mesma, e também não se sabe qual é a razão principal para que esta doença se
manifeste. Por isso, existem muitos estudos desenvolvidos sobre a doença de Alzheimer que
têm caracterizado as alterações dessa desordem na estrutura cerebral, ou seja, os pacientes
dessa doença têm os ventrículos alargados, o cérebro encolhe como um todo, e uma das
principais regiões afetadas é onde se localiza a função da memória (DAMASCENO, 1999)
(OLIVEIRA et. al., 2005) (CAOVILLA; CANINEU, 2002). Um dos grandes avanços das
pesquisas nesta área tem sido observados em trabalhos científicos que utilizam técnicas de
neuroimagem de alta resolução, tais como Imagens de Ressonância Magnética (IRM), para
avaliar a estrutura, a função cerebral e a ativação de certas áreas do cérebro.
Como comentado anteriormente a doença em questão atinge principalmente pessoas
acima de 60 anos, chamadas de terceira idade, e o número de pessoas que passam dessa idade
está cada vez maior, então os casos com a doença de Alzheimer também tende a aumentar
(PETERSEN, 2006). Com isso necessita-se cada vez mais de estudos que auxiliem na busca
de novas evidências dessa doença, ajudando assim a encontrar a causa e também auxiliando
no diagnóstico médico.
Neste trabalho, investiga-se imagens de ressonância magnética que são analisadas
estatisticamente para encontrar diferenças cerebrais entre grupos de pacientes diagnosticados
com Alzheimer e de pessoas sem a doença, denominadas controles. Estuda-se duas técnicas
de análises estatísticas comumente empregadas em análise de imagens em geral, que são as
análises univariada e multivariada. Na análise univariada as diferenças encontradas são
localizadas, pois a análise define-se por comparações voxel a voxel. Na análise multivariada,
por sua vez, compara-se todos os voxels simultaneamente, obtendo-se assim as diferenças que
acontecem na imagem como um todo. Para o estudo da análise univariada, investiga-se o
software SPM2 (FRISTON et al., 1995) que trabalha com o modelo linear geral, o teste de
significância t, a hipótese nula e o nível de significância p, para localizar as diferenças
existentes em cada voxel. Na análise multivariada estuda-se basicamente duas técnicas de
estatística multivariada: Principal Components Analysis (PCA) (FUKUNAGA, 1990)
(JOHNSON; WICHERN, 1982), e Linear Discriminant Analysis (LDA) (FISHER, 1936). O
método utilizado neste trabalho é uma combinação dessas técnicas estatísticas, PCA+MLDA,
sendo que o MLDA (Maximum uncertainty Linear Discriminant Analysis) (THOMAZ;
GILLIES, 2005b) é uma variação da técnica LDA proposta por Thomas e Gillies (THOMAZ;
GILLIES, 2005b).
22
1.1 Objetivos
O objetivo principal deste trabalho é a comparação entre as análises estatísticas
univariada e multivariada no diagnóstico da desordem cerebral de Alzheimer. Realiza-se
comparações matemáticas entre as técnicas, nos procedimentos adotados para executar os
experimentos de maneira eficaz em ambas as análises, e nos resultados obtidos entre as duas
metodologias investigadas, com o intuito de visualizar as diferenças cerebrais encontradas
pelas duas análises.
1.2 Contribuições
As principais contribuições deste trabalho são:
A comparação de um procedimento matemático univariado comumente
utilizado em análise de imagens médicas, o método Statistical Parametric
Mapping (SPM) (FRISTON et al., 1995), com uma nova abordagem
multivariada de análise dessas imagens, denominada aqui de PCA+MLDA;
Um detalhamento maior do método MBV-otimizado (GOOD et al., 2001)
(AGUIAR et al., 2007) utilizado no SPM (FRISTON et al., 1995);
Um melhor entendimento das principais estruturas cerebrais alteradas pela
doença de Alzheimer e possíveis de serem caracterizadas e capturadas em
imagens de ressonância magnética.
1.3 Organização do trabalho
Este trabalho está dividido em 6 capítulos. No próximo capítulo, o capítulo 2,
descreve-se as funções cerebrais que comumente são afetadas pela doea de Alzheimer, suas
principais características, e uma das modalidades de imagens médicas mais utilizadas como
auxílio no diagnóstico dessa desordem investigadas nesse trabalho: a imagem de ressonância
magnética. No capítulo 3, discute-se os modelos estatísticos estudados nesta dissertação, com
um detalhamento maior para o modelo estatístico adotado e aplicado neste estudo. Já no
capítulo 4, relata-se os experimentos realizados com ambas as análise estatísticas estudadas
23
(univariada e multivariada). Apresenta-se no catulo 5, os resultados obtidos nos
experimentos realizados, e faz-se uma comparação entre os resultados das análises estatísticas
univariada e multivariada. Por fim, no capítulo 6, tem-se a conclusão desta dissertação e
possibilidades de trabalhos futuros.
24
2 CONCEITOS PRELIMINARES
A desordem cerebral de Alzheimer é a forma mais comum dentre mais de sessenta
diferentes tipos de demências, sendo responsável por aproximadamente cinqüenta e seis por
cento dos casos (CAOVILLA; CANINEU, 2002) (PETERSEN, 2006). A doença de
Alzheimer atinge tanto homens quanto mulheres, de todas as raças e classes sociais, sendo
conhecida como uma doença do envelhecimento, pois é mais comum acometer pessoas que
atingiram sessenta anos ou mais. As modificações que essa doença costuma trazer ao paciente
são lentas e progressivas. Inicialmente, o paciente tem dificuldades de memória e com a
progressão da doença outras funções do cérebro começam a ser afetadas. Este capítulo
descreve as funções cerebrais que comumente são afetadas pela doença de Alzheimer, bem
como suas principais características de diagnóstico. Além disso, esse capítulo explica em
detalhes uma das modalidades de imagens dicas mais utilizadas como auxílio no
diagnóstico dessa doença, a imagem de ressonância magnética (IRM) ou “Magnetic
Resonance Image” (MRI) (CAOVILLA; CANINEU, 2002).
2.1 A doença de Alzheimer
Alzheimer é uma desordem cerebral progressiva que gradualmente destrói a memória
e a habilidade de aprender, raciocinar, fazer julgamentos, se comunicar e desempenhar
atividades do dia a dia. Mais de vinte e cinco milhões de pessoas no mundo m a demência
de Alzheimer, sendo que no Brasil esse número ultrapassa um milhão (CAOVILLA;
CANINEU, 2002). Muitas dessas pessoas, no entanto, ainda não sabem que são acometidos
desse mal, pois geralmente seu diagnóstico é tardio, principalmente em idosos (PETERSEN,
2006). Na verdade, a demência de Alzheimer é hoje considerada a demência mais comum que
existe entre as mais de sessenta demências existentes (BUSATTO FILHO, 2007)
(ALMEIDA; CROCCO, 2000) (KAWAS, 2003).
A denominação demência não se refere somente a um tipo de doença ou patologia. Ela
é considerada uma síndrome, ou seja, um grupo de sinais físicos e sintomas que o paciente
apresenta, sendo comum em rias doenças diferentes (OLIVEIRA et. al., 2005). As
principais características das demências são: déficit de memória, dificuldades de executar
tarefas domésticas, problemas com o vocabulário, desorientação no tempo e espaço,
incapacidade de julgar situações, problemas com o raciocínio abstrato, alterações de humor,
25
de comportamento e personalidade, perda da iniciativa e passividade, ansiedade, agitação,
desilusão e alucinações (ALZHEIMER’S ASSOCIATION, 2006).
Os sintomas da doença de Alzheimer foram, pioneiramente, descritos e diagnosticados
pelo psiquiatra e neuropatologista alemão Alois Alzheimer em 1986 (OLIVEIRA et. al.,
2005). A doença de Alzheimer conduz à morte dos neurônios por fatores que ainda são
desconhecidos e que o estão relacionados com a falta de oxigenação e circulação local
como acontece mais comumente (CAOVILLA; CANINEU, 2002). Com o passar do tempo, o
cérebro encolhe dramaticamente, e quase todas as suas funções ficam comprometidas.
Quando tal doença está em estágio avançado, o paciente tem o córtex afetado havendo
portanto danos nas áreas que envolvem, por exemplo, o pensamento, o planejamento e a
memorização (ALZHEIMER’S ASSOCIATION, 2006). A Figura 2.1 (A) mostra a
comparação do tamanho de um cérebro saudável e um cérebro de uma pessoa com a doença
de Alzheimer. Observa-se que o cérebro do paciente com Alzheimer teve seu tamanho
reduzido de forma significante. A Figura 2.1 (B) mostra mais um efeito relativo ao cérebro
dos pacientes diagnosticados com essa desordem. Através de um corte coronal, pode-se
observar o ventrículo e os sulcos dos cérebros, os quais se alargam no cérebro afetado pela
doença.
(A)
(B)
Figura 2.1 - Efeito relativo ao cérebro dos pacientes que tenham a doença de Alzheimer.
(Adaptado de ALZHEIMER’S ASSOCIATION, 2006).
Conforme mencionado anteriormente, as pessoas que são afetadas pela doença de
Alzheimer são na maioria idosos. Porém, não se sabe ao certo qual a principal causa da
doença (DAMASCENO, 1999). Acredita-se que a desordem de Alzheimer se por várias
causas, a saber:
26
Idade avançada: pessoas com idade acima de sessenta e cinco anos m mais
propensão de ter a doença. Problemas como arteriosclerose podem também
contribuir para o surgimento da doença. A probabilidade de se ter Alzheimer
dobra a cada cinco anos após os sessenta e cinco anos de idade.
Hereditariedade: segundo estudos relacionados com essa hipótese, a doença de
Alzheimer é uma disfunção genética que é herdada de indivíduo para
indivíduo.
Traumatismo craniano: pessoas que sofreram traumatismo craniano têm uma
probabilidade maior de desenvolver a doença.
Escolaridade: estudos mostram que quanto menor a escolaridade maiores são
as chances de se desenvolver essa doença (OLIVEIRA et. al., 2005)
(CAOVILLA; CANINEU, 2002) (BUSATTO FILHO, 2007).
No entanto, pode-se dizer que a desordem de Alzheimer tem sintomas avassaladores.
Um dos principais sintomas é a perda de memória. Existem alguns tipos de memórias mais
afetadas como, por exemplo, a memória episódica, que responde pelo armazenamento de
informações relativas aos episódios da vida; a memória de curto prazo, que é relativa às
lembranças mais recentes; a memória semântica que se refere basicamente à informação
relativa ao significado das palavras; e, por fim, a memória de procedimento que responde pela
condução dos atos, seja mental ou fisicamente. A perda da memória de procedimento acarreta
na dificuldade de cumprir tarefas diárias.
Outras características comuns da doença de Alzheimer são a apraxia, que é a perda da
capacidade de efetuar movimentos; a afasia, ou seja, a perda da compreensão da linguagem,
tanto falada, como escrita; e a agnosia, que acontece quando o paciente não consegue mais
reconhecer os objetos e nem saber qual sua utilidade. De forma geral, o paciente de Alzheimer
apresenta mudanças físicas, de personalidade e de comportamento.
2.2 Estágios da doença
A doença de Alzheimer não afeta todos os pacientes da mesma forma nem na mesma
seqüência de acontecimento, mas existe um padrão de evolução dessa desordem cerebral que
pode ser dividido basicamente em três estágios, conforme descrito a seguir.
27
Na primeira fase, a doença de Alzheimer faz com que o paciente apresente problemas
moderados de memória, como, por exemplo, o esquecimento de nomes de pessoas e números
telefônicos. No entanto, esses esquecimentos o tão sutis que, na maioria das vezes, passa
despercebido pelos familiares e amigos. Na verdade, como a maioria dos pacientes são idosos,
esses esquecimentos são entendidos como naturais, que acontecem com as pessoas de idade
avançada. Depois os pacientes passam a ter problemas de atenção, que começa a comprometer
o desempenho de conversas; além de haver uma simplificação do vocabulário utilizado para
se comunicar. Outro problema que aparece neste estágio é referente à orientação no espaço,
sendo que a pessoa que tem a doença se confunde e, muitas vezes, chega a se perder até
mesmo em ambientes familiares. Alguns pacientes adquirem o gosto por cores berrantes em
roupas, outros apresentam falta de espontaneidade e de ação, e outros m incapacidade de
mudar a posição dos olhos. No fim desse primeiro estágio, as pessoas começam a ter
problemas com representações abstratas e formas simbólicas (OLIVEIRA et. al., 2005)
(CAOVILLA; CANINEU, 2002) (BALLONE, 2002).
No segundo estágio, também chamado de fase intermediária, os pacientes tornam-se
ainda mais dependentes de outras pessoas. A memória continua sendo afetada e
acontecimentos recentes passam a ser esquecidos pelos pacientes que começam a ter
dificuldades em reconhecer inclusive a própria família. Os sentidos também começam a ser
afetados, impactando diretamente a rotina do paciente, havendo perda de apetite, dificuldade
na leitura, e ocorrência de alucinações. Perde-se também a noção entre dia e noite, e a insônia
começa a aparecer constantemente. Atividades diárias não podem mais ser feitas sem a ajuda
de uma terceira pessoa, e os pacientes perdem a coordenação de movimentos e a estabilidade
corporal. Adicionalmente, os pacientes passam a ter mudanças de humor, ficam agitados e
agressivos. Nesse estágio, o problema com a linguagem é acentuado, o paciente começa a ser
incapaz de compreender tanto a linguagem escrita quanto a falada, e inicia-se a perda do
controle da bexiga (ALZHEIMER’S ASSOCIATION, 2006) (CAOVILLA; CANINEU,
2002) (OLIVEIRA et. al., 2005).
No último estágio, as funções cognitivas desaparecem por completo. O problema com
a linguagem se acentua ainda mais e a comunicação torna-se monossilábica, desaparecendo
totalmente mais tarde. Os pacientes passam a depender completamente da ajuda de terceiros,
pois na fase final estes perdem a capacidade de se sentar, andar e engolir, e em muitos casos
passam a fazer uso de uma sonda (ALZHEIMER’S ASSOCIATION, 2006). O paciente fica
cada vez mais agitado, o que acentua as mudanças de comportamento já iniciadas no segundo
estágio. Perde-se completamente o controle da bexiga e do intestino, e as articulações passam
28
a ficar enrijecidas. Por fim, as pessoas que desenvolvem a doença de Alzheimer se tornam
mais vulneráveis a outras doenças, como por exemplo, a pneumonia (OLIVEIRA et. al.,
2005).
2.3 Diagnóstico da doença
Quando uma pessoa tem problemas de memória e alteração de humor,
possibilidades de estar desenvolvendo a doença de Alzheimer. Entretanto, o diagnóstico
médico é feito por meio de eliminação das outras possibilidades de doenças. Isso ocorre
porque ainda não existe um teste definitivo que mostre alterações biológicas ou fisiológicas
ligadas somente à doença de Alzheimer. Normalmente, a probabilidade de diagnóstico é de
90% de certeza, sendo que somente se tem certeza absoluta quando é realizada a autópsia no
paciente (PETERSEN, 2006).
Um dos principais exames realizados para o diagnóstico da doença é o MiniExame do
Estado Mental (MEEM). Este exame verifica a capacidade de orientação, tanto temporal
quanto espacial, e avalia a memória do paciente, bem como o nível de atenção e do uso da
linguagem verbal. O MEEM demora em torno de 10 minutos para ser aplicado e sua
pontuação máxima é de 30 pontos. Embora o MEEM seja um exame muito utilizado para
diagnosticar quadros de demências instaladas, o início de um transtorno cognitivo passa
muitas vezes despercebido, sem falar que a pontuação pode sofrer influências de acordo com
o nível de escolaridade do paciente (BUSATTO FILHO, 2007). Apesar das limitações do
MEEM, esse exame tem um papel importante para diagnosticar a doença.
Segundo Petersen (PETERSEN, 2006), outros critérios para diagnosticar a doença de
Alzheimer foram feitos pela Associação Americana de Psiquiatria e são encontrados no
Manual de Diagnóstico e Estatísticas dos Distúrbios Mentais (Diagnostic and Statistical
Manual of Mental Disorders DSM-IV). De acordo com os critérios do DSM-IV, para se
diagnosticar que uma pessoa tem a doença de Alzheimer esta precisa atender aos seguintes
requisitos. Ter no mínimo dois problemas de cognição, sendo que um desses problemas tem
que ser relacionado com a memória. Os outros podem ser: dificuldade com organização,
planejamento e pensamento abstrato; dificuldade com a visão e noção espacial e dificuldade
de prestar atenção em conversas, se expressar, e coordenar movimentos. Além disso, cada
problema cognitivo diagnosticado na pessoa deve ter influência na vida da mesma, afetando
tanto a vida social quanto a profissional. Deve-se ter também cada sintoma se desenvolvendo
de forma lenta e gradativamente; são importantes também os diagnósticos médicos
29
informando que os problemas cognitivos não o causados por outras doenças ou transtornos.
Em outras palavras, as doenças que atinjam a parte emocional da pessoa, como por exemplo a
depressão, não podem justificar os sintomas anteriormente mencionados.
2.4 Regiões cerebrais
Nesta seção serão sucintamente descritas as principais regiões do cérebro que são
afetadas pela doença de Alzheimer, assim como as funções que estão relacionadas com as
mesmas.
2.4.1 O encéfalo
O encéfalo é formado por quatro partes, sendo o telencéfalo, o diencéfalo, o tronco
encefálico, e o cerebelo (CONNORS; BEAR; PARADISO, 2002) (MCCRONE, 2002).
2.4.1.1 O telencéfalo e diencéfalo
O telencéfalo, ou cérebro, é composto por muitas estruturas, sendo que cada uma
dessas estruturas tem uma função diferente para o corpo humano. Porém, para que todas as
funções estejam em perfeito funcionamento é necessário um trabalho conjunto das estruturas.
O tronco encefálico e o cerebelo trabalham juntos com o cérebro, e esse conjunto forma o
encéfalo, que é ilustrado na Figura 2.2.
O cérebro é dividido em duas metades, conforme ilustrado na Figura 2.2, que recebem
o nome de hemisférios. Entre esses hemisférios estão os ventrículos cerebrais, que o
compostos pelos ventrículos laterais e terceiro ventrículo. Existe também um quarto
ventrículo que fica localizado perto do tronco encefálico. A ligação entre os dois hemisférios
cerebrais é feita por uma estrutura cerebral denominada corpo caloso (MCCRONE, 2002)
(GREENFIELD, 2000).
Cada hemisfério tem suas funções, sendo que o hemisfério esquerdo controla o lado
direito do corpo humano, e o hemisfério direito controla o lado esquerdo. Essa “inversão” de
controle acontece devido a um cruzamento de nervos que ocorre no tronco encefálico. Na
maioria das pessoas, as áreas que controlam a fala estão localizadas no hemisfério esquerdo
30
enquanto que, no hemisfério direito, estão as áreas que comandam as percepções e habilidades
não verbais.
Figura 2.2– As principais partes do encéfalo e os hemisférios cerebrais.
(Adaptado de PETERSEN, 2006).
No telencéfalo fica o córtex ou substância cinzenta, que é a camada mais externa do
cérebro. É nesta camada que ocorrem a maior parte das operações intelectuais, como o
raciocínio, a organização, o planejamento, o pensamento, a criação e a tomada de decisões
(CONNORS; BEAR; PARADISO, 2002) (GREENFIELD, 2000).
Além da divisão do cérebro em dois hemisférios, também a divisão decorrente do
sulco central e lateral, que dividem cada hemisfério cerebral. Essas divisões recebem o nome
de lobos. A Figura 2.3, 2.4 e 2.5 que serão detalhadas a seguir, mostram as áreas do cérebro
onde estão inclusos os lobos e os sulcos, e ilustram a localização das principais funções
cerebrais (MCCRONE, 2002) (DEUTSCH; SPRINGER, 1998).
31
Figura 2.3 – Cérebro humano, com destaque para os lobos.
(Adaptado PETERSEN , 2006).
Os lobos, ilustrados na Figura 2.3, são as principais divisões físicas do córtex cerebral.
O lobo frontal comanda o pensamento abstrato, planejamento, programação de necessidades
individuais, controle motor, emoção, movimento treinado e a personalidade. O lobo parietal é
responsável pelas informações sensoriais como o tato, paladar, dor, visão; também está
relacionada com a temperatura, noção espacial, pressão e a lógica matemática. O lobo
temporal, por sua vez, é responsável pelo processamento da memória, emoção, a compreensão
da linguagem, percepção e pela audição, sendo que qualquer lesão nessa área pode provocar
surdez ou deficiência auditiva. Por último, o lobo occipital é responsável pelo processamento
da informação visual e qualquer lesão nessa área pode implicar em cegueira parcial ou total
(MCCRONE, 2002) (GREENFIELD, 2000).
32
Figura 2.4 – Cérebro humano, com destaque para os sulcos cerebrais.
(Adaptado de PEREZ, 2003).
Além das funções descritas anteriormente, o córtex também tem outras funções como:
interpretar sensações, cheiros do mundo externo e controlar movimentos voluntários
(ALZHEIMER’S ASSOCIATION, 2006). A Figura 2.5 apresenta de forma detalhada a
localização das principais funções cerebrais. Por meio dessa figura é possível observar, por
exemplo, a área relacionada à memória e à emoção que estão logo acima do corpo caloso.
33
Figura 2.5 – Localização das principais funções cerebrais.
(Adaptado de JUNIOR, 2005).
Como descrito anteriormente, entre os dois hemisférios estão localizados os
ventrículos laterais e o terceiro ventrículo. A Figura 2.6 ilustra a localização dessas estruturas
no cérebro. Esses, juntamente com o quarto ventrículo, também destacado na Figura 2.6,
produzem um líquido denominado quido cefaloraquidiano (LCR) ou “Cerebrospinal Fluid”
(CSF) (MCCRONE, 2002).
O LCR pode ser encontrado no cérebro e na medula espinhal, servindo para sustentá-
los e amortecê-los contra batidas. Esse líquido também tem a função de eliminar resíduos do
metabolismo e outras substâncias que se difundem no cérebro por meio do sangue; e também
serve para ajudar na defesa imunológica e de anticorpos (MCCRONE, 2002). Além de líquido
cefaloraquidiano, este fluído também recebe o nome de líquor ou fluído cérebro-espinhal. O
LCR é de cor clara e contém proteína, potássio, glicose e cloreto de sódio. Se o crânio for
subitamente deslocado, a densidade do LCR servirá para reduzir o impacto entre o encéfalo e
o crânio, diminuindo os danos que poderão ocorrer. Se o cérebro ou os vasos sanguíneos que
o irrigam aumentam de volume, o líquor é drenado e diminui a pressão intracraniana, para
manter o volume constante.
34
Figura 2.6 – Regiões cerebrais como o 1º, 2º, 3º e 4º ventrículos, hipotálamo, tálamo e cerebelo.
(Adaptado de PEREZ, 2003).
O LCR circula no cérebro e na medula espinhal através de cavidades especiais que
constituem o chamado sistema ventricular, que é composto por dois ventrículos laterais, o
terceiro ventrículo que se localiza no diencéfalo e o quarto ventrículo que se localiza próximo
ao tronco encefálico. A comunicação entre eles é feita dos ventrículos laterais para o terceiro
ventrículo e este se comunica com o quarto ventrículo, que produz o LCR. A maioria do LCR
é dirigida para os hemisférios cerebrais e pequenas quantidades passam ao redor da medula
espinhal. A Figura 2.7 apresenta uma outra vista lateral do cérebro, com especial destaque
para o terceiro e quarto ventrículos.
35
Figura 2.7 – Visão lateral do cérebro, destacando o 3º e 4º ventrículos.
(Adaptado de PEREZ, 2003).
Quando se estuda a doença de Alzheimer, deve-se mencionar também o sistema
límbico que é composto pelo hipocampo, hipotálamo, amígdala e o tálamo.Tais estruturas do
cérebro podem ser visualizadas na Figura 2.8 (PETERSEN, 2006).
O hipocampo, uma das principais regiões afetadas pela doea de Alzheimer, troca
sinais constantemente com todo córtex cerebral. O córtex está relacionado à memória a longo
prazo, e o hipocampo com a memória recente, e tem o papel de receber e enviar informações
para as regiões adequadas ao armazenamento (PETERSEN, 2006).
O hipocampo intacto possibilita a pessoa comparar condições atuais com experiências
similares, permitindo-lhe escolher qual a melhor opção a ser tomada. A amnésia é
conseqüência de lesão no hipocampo. Ela faz com que o indivíduo não consiga memorizar
informações baseadas em simbolismos verbais, como os nomes das pessoas que conhece, por
exemplo. Entretanto, é importante ressaltar que a memória passada permanece intacta.
Quando ambos os hipocampos (direito e esquerdo) se degeneram, nada mais é gravado na
memória, o que acarreta no rápido esquecimento da mensagem recém recebida.
36
Figura 2.8 – Estruturas cerebrais: Hipotálamo, lamo, Amígdala e Hipocampo.
(Adaptado de PETERSEN, 2006).
O hipotálamo, estrutura cerebral também afetada pela doença de Alzheimer, faz parte
do diencéfalo e está ilustrada na Figura 2.8 e destacado na Figura 2.9. Apesar de seu tamanho
relativamente pequeno, o hipotálamo controla uma série de funções vitais: faz a interligação
entre o sistema nervoso e o sistema endócrino, atuando na ativação de diversas glândulas
endócrinas; controla a temperatura corporal, regulariza o apetite e a água no corpo, coordena
o sono, a quantidade de hormônios e substâncias químicas no corpo; também está ligado à
emoção, ao comportamento sexual, e é responsável pela alteração da pressão arterial e da
freqüência cardíaca (PETERSEN, 2006).
37
A ligação que o hipotálamo tem com a emoção é mais ligada à expressão do que à
criação das emoções, sendo o intermediário do cérebro em traduzir as emoções em respostas
físicas. Quando sentimentos intensos são gerados na mente (por exemplo: raiva, prazer,
aversão, alegria descontrolada), o hipotálamo envia sinais para as mudanças fisiológicas por
meio do sistema nervoso e da liberação de hormônios. Sinais físicos de medo ou excitação,
como aumento dos batimentos cardíacos e respiração ofegante, também são gerados no
hipotálamo (MCCRONE, 2002) (GREENFIELD, 2000).
Figura 2.9 – As divisões do hipotálamo em: lateral, medial e periventricular.
Disponível em: <http://www.guia.heu.nom.br/hipotalomo.htm> Acesso em: 15 março 2007.
O hipotálamo é dividido em três partes: hipotálamo lateral, medial e periventricular. O
hipotálamo lateral está relacionado com a sede, a fome e a agressividade; o hipotálamo medial
está ligado à saciedade da fome, da sede e tranqüilidade; e o hipotálamo periventricular, por
sua vez, é responsável tanto pelo comportamento quanto pelo medo.
A amígdala, outra região afetada pela doença de Alzheimer, também coordena a
emoção, podendo estar relacionada a uma reação de medo e perigo, e é responsável pela
percepção semiconsciente (PETERSEN, 2006). Também serve para padronizar as respostas
comportamentais apropriadas para cada ocasião.
o tálamo, parte do diencéfalo, consiste de duas massas ovais interligadas, cada uma
localizada em um hemisfério. O tálamo transmite para o córtex cerebral informações
relacionadas à visão, audição, paladar, tato, dor, temperatura e pressão (MCCRONE, 2002).
38
2.4.1.2 O tronco encefálico
Além do telencéfalo e do diencéfalo, o tronco encefálico é uma outra área do encéfalo
e está localizado entre o tálamo e a medula espinhal. O tronco encefálico possui uma série de
estruturas como o mesencéfalo e a ponte, que podem ser visualizadas na Figura 2.10. O tronco
encefálico desempenha algumas funções motoras e sensitivas específicas, porém as principais
são: receber informações sensitivas de estruturas cranianas; controlar os músculos da cabeça;
transmitir informações da medula espinhal até outras regiões encefálicas e vice-versa; e
controlar a atenção (GREENFIELD, 2000).
Em particular, a ponte, uma das estruturas de composição do tronco encefálico
destacada na Figura 2.10, ajuda no controle da respiração, além de ser um centro de
transmissão de impulsos para o cerebelo. A ponte serve ainda de passagem para as fibras
nervosas que ligam o cérebro à medula (MCCRONE, 2002) (GREENFIELD, 2000).
Figura 2.10 – Divisão do Tronco encefálico.
Disponível em: <http://www.afh.bio.br/nervoso/nervoso3.asp> Acesso em: 09 set.2006.
2.4.1.3 O cerebelo
O cerebelo, outra região que compõem o encéfalo, e que é afetada pela doença de
Alzheimer, fica localizado ao lado do tronco encefálico e atrás do cérebro. A Figura 2.6,
ilustrada anteriormente, apresenta com detalhes a localização desta região no cérebro. O
39
cerebelo é considerado um centro para o controle dos movimentos iniciados pelo córtex
motor, sendo responsável pelos movimentos voluntários, equilíbrio e postura (MCCRONE,
2002). Assim como o cérebro, o cerebelo também se divide em dois hemisférios, porém o
lado esquerdo do cerebelo está ligado aos movimentos do lado esquerdo do corpo humano, e
o lado direito está ligado aos movimentos do lado direito (MCCRONE, 2002). Todas as
informações e estímulos que são enviados aos músculos, além das informações do córtex
motor e dos gânglios basais, são recebidas pelo cerebelo (MCCRONE, 2002).
2.4.2 Diferenças cerebrais causadas pela doença de Alzheimer
Sendo o cérebro responsável pelo desempenho de várias funções diferentes, nada mais
natural que afirmar que os neurônios também têm diferentes funções, fato que ajuda a formar
as “classes” de funções em cada hemisfério. A camada de substância branca está localizada
abaixo do córtex cerebral, e é nela que se localizam os corpos dos neurônios que têm o papel
de transmitir os impulsos nervosos no cérebro.
A comunicação entre as estruturas é feita por meio dos neurônios. Estes são
responsáveis por processar e propagar as informações para cada área correspondente. Os
neurônios geram impulsos elétricos, que transmitem as informações para as estruturas
cerebrais e para o corpo humano. Eles são formados pelo corpo celular (composto por um
núcleo), axônio e dendritos.
Geralmente os axônios se localizam em uma substância branca denominada bainha de
mielina; esta tem a função de aumentar a velocidade da transmissão feita pelos axônios, como
ilustra a Figura 2.11.
40
Figura 2.11 – Ilustração das estruturas do neurônio: Corpo celular, núcleo, axônio, dendrito e bainha de mielina.
(Adaptado de PETERSEN, 2006).
O axônio é uma ramificação do corpo celular e tem a função de transportar as
informações para outros neurônios. Essas ramificações geralmente são encontradas na
substância branca.
Os dendritos são prolongamentos que tem a função de receber as informações
enviadas por outros neurônios. Com o decorrer dos anos os neurônios começam a morrer e
não são regenerados, assim além do cérebro, o cerebelo e também o hipocampo começam a
ser afetados, causando déficits em algumas funções cerebrais, como a memória e o
movimento. É natural que com o envelhecimento, a pessoa passa a sentir algumas
dificuldades para executar determinadas tarefas. Todavia, quando o indivíduo torna-se
incapaz de cuidar dos afazeres diários, é possível afirmar que houve uma danificação das
funções mentais, constituindo um distúrbio neurodegenerativo que é uma degeneração dos
neurônios de uma forma mais abrangente do que ocorre no curso normal do envelhecimento
(PETERSEN, 2006).
No caso da doença de Alzheimer, a causa é ainda desconhecida, mas seu progresso se
por formação de proteínas defeituosas no cérebro. A doença de Alzheimer destrói um dos
principais componentes do cérebro, que são os neurônios. A morte dos neurônios começa pelo
hipocampo, que é a principal estrutura relacionada à memória. Com a evolução da doença, a
41
amígdala, o tálamo, o hipotálamo e os lobos parietal, frontal e temporal começam a ser
afetados também. Além dessas estruturas, a doença de Alzheimer afeta o núcleo basal de
Meynert, ilustrado na Figura 2.12, que é rica em um neurotransmissor denominado
acetilcolina. Com a morte desses neurotransmissores, as funções de formação e recuperação
de lembranças são afetadas. Além desse neurotransmissor, também há outros que são afetados
pela doença, como por exemplo: dopamina, glutamato, norepinefirna e serotonina, sendo estes
responsáveis pelas funções de movimentos físicos, aprendizado e memória de longo prazo,
resposta emocional, humor e ansiedade (BUSATTO FILHO, 2007) (PETERSEN, 2006).
Figura 2.12 – Núcleo basal de Meynert, local comumente afetado pela doença de Alzheimer.
(Adaptado de PETERSEN, 2006).
Além disso, um dos principais fatores que afeta o cérebro na doença de Alzheimer é a
anormalidade na proteína beta-amilóide. Essa anomalia acontece pela produção excessiva da
mesma, e quando estas não se desintegram no cérebro, acabam formando placas que são
encontradas no cérebro das pessoas com a doença de Alzheimer (PETERSEN, 2006).
2.4.2.1 Danos causados pela doença de Alzheimer
A proteína precursora do amilóide, também chamada de PPA, é produzida pelo
cromossoma 21 do DNA. Embora sua função ainda o esteja totalmente esclarecida pelos
42
médicos especialistas, sabe-se que a PPA está relacionada com a membrana celular, ajudando
no crescimento e sobrevivência dos neurônios.
Essa proteína recebe a ação de três enzimas, sendo elas a alfa-secretase, a beta-
secretase e a gama-secretase. Quando as enzimas alfa e gama-secretase reagem com a
proteína, esta tende a desfragmentar-se e dissolver-se no cérebro. Por outro lado, quando a
enzima beta e gama-secretase reagem com a proteína, elas dividem a mesma em dois
segmentos denominados beta-amilóide 42 e/ou beta-amilóide 40. O segmento beta-amilóide
42 não dissolve com facilidade e acaba se juntando com outros fragmentos formando as
placas encontradas nos pacientes com a doença de Alzheimer, denominada placa beta-
amilóide, ilustrada na Figura 2.13 (PETERSEN, 2006).
Figura 2.13 Placa amilóide, essas placas o encontradas nos cérebros dos pacientes portadores da doença de
Alzheimer.
(Adaptado de PETERSEN, 2006).
De acordo com Petersen (PETERSEN, 2006), as alterações no processamento do beta-
amilóide e a formação de placas têm grande influência no desenvolvimento da doença de
Alzheimer. Esta pode ser constatada, pois a agregação de beta-amilóide em placas acontece
no começo da doença, e com o desenvolvimento da mesma, o número de placas aumenta
consideravelmente. Além das placas formadas por beta-amilóide que surgem na primeira
etapa da doença, também ocorrem outras alterações no rebro, como por exemplo: o
aumento de emaranhados neurofibrilares, ilustrado na Figura 2.14, reações inflamatórias,
alterações no nível de cálcio e estresse oxidativo. Essas alterações levam as células nervosas à
morte e tem forte influência na doença de Alzheimer. Os emaranhados neurofibrilares
ocorrem por causa da proteína tau, que tem função de sustentação da estrutura do neurônio;
logo, quando a proteína tau morre, o neurônio também morre. Embora os emaranhados sejam
encontrados em pessoas saudáveis, o aparecimento dos mesmos no córtex cerebral está ligado
ao início da desordem cerebral. O aumento e a aglomeração dos emaranhados desta proteína
43
afetam a transmissão de impulsos elétricos entre elas, e o tráfego de nutrientes nas células,
interferindo diretamente na sobrevivência das mesmas.
Figura 2.14 – Emaranhados neurofibrilares, que são causados pela morte da proteína tau que sustenta o neurônio.
(Adaptado de PETERSEN, 2006).
As pessoas portadoras da doença de Alzheimer possuem grandes inflamações no
cérebro. Normalmente, inflamações são reações que o organismo cria contra uma infecção ou
lesão. Então, quando há o aparecimento das placas beta-amilóide, as células micróglia (células
imunes) tentam combater essas placas, formando a reação inflamatória. Acredita-se que o
conjunto da reação inflamatória e das placas beta-amilóide possa afetar as mitocôndrias, que
por sua vez enviam energia para as células, e quando alteradas tendem a produzir os radicais
livres em excesso, o que acarreta no estresse oxidativo. Esse processo é a deterioração de
células, causando morte dos tecidos. As placas de beta-amilóide podem colaborar com entrada
de cálcio nos neurônios de forma excessiva, entre outros danos. O cálcio tem a função de
ajudar na transmissão das informações entre as lulas, porém quando em excesso causa a
morte da célula (PETERSEN, 2006).
Neste capítulo foram descritas até aqui as características da doença de Alzheimer, o
diagnóstico dessa doença e funções cerebrais. Além dessas informações serem essenciais para
este trabalho, também é relevante a explicação da técnica que captura as imagens cerebrais.
Esta técnica é a imagem de ressonância magnética (IRM), a qual será descrita na próxima
seção.
44
2.5 Ressonância Magnética
A Ressonância Magnética (RM) ou “Magnetic Resonance” (MR) é um dos mais
significativos avanços doculo no que diz respeito a diagnósticos médicos por imagem. Esta
técnica permite que sejam geradas imagens em duas ou três dimensões, de qualquer parte do
corpo e não há radiação ionizante na ressonância magnética (AMARO, YAMASHITA, 2001).
O exame de RM não causa qualquer desconforto, sendo necessário apenas que o
paciente permaneça imóvel durante o procedimento médico. Porém, se a pessoa for portadora
de marca-passo, pinos ou placas de metal, o médico deve ser avisado, pois qualquer peça
metálica no corpo poderá causar desconforto e até mesmo uma lesão devido ao forte campo
magnético do equipamento. No momento do exame, o paciente não poderá utilizar jóias,
prótese metálica ou cartões magnéticos (AMARO, YAMASHITA, 2001).
A técnica de RM é trabalhada com base em três fases que são: alinhamento, excitação
e detecção de radiofreqüência. De acordo com Amaro e Yamashita (AMARO,
YAMASHITA, 2001), a primeira fase de alinhamento se refere à propriedade magnética de
núcleos de alguns átomos, os quais tendem a orientar-se paralelamente ao campo magnético.
Na segunda fase, a fase de excitação, cada núcleo de hidrogênio “vibra” numa determinada
freqüência de acordo com o campo magnético a que está submetido. Então, o aparelho emite
uma onda eletromagnética em uma freqüência adequada, que irá resultar em uma
transferência de energia da onda emitida pelo equipamento para os átomos de hidrogênio,
fenômeno conhecido como ressonância (AMARO, YAMASHITA, 2001). Na terceira fase, ou
seja, na fase de detecção de radiofreqüência, os núcleos de hidrogênio, após receberem
energia, retornam ao estado de equilíbrio e nesse processo é liberado ondas eletromagnéticas.
O equipamento detecta essas alterações e determina a posição no espaço e a intensidade de
energia liberada, ilustrada como “brilho” em intensidade de sinal na imagem final (AMARO,
YAMASHITA, 2001).
A imagem de RM trabalha com sinais proporcionados pelo núcleo de hidrogênio H
+
,
principalmente quando aplicada à Medicina. Como o hidrogênio é o átomo mais encontrado
no corpo humano, pois existe uma enorme concentração de água no nosso corpo, o sinal
magnético do núcleo do H
+
é bem superior ao de outros núcleos magnéticos. O H
+
possui o
menor núcleo que existe e tem somente um próton, que tem carga positiva, e de acordo com
movimentos giratórios do próton em torno do próprio eixo, gera um campo magnético, que
também é chamado de spin magnético (OTADUY, LEITE, 2004).
45
O corpo humano é composto de milhões de prótons, e se os prótons não estão sofrendo
influência de nenhum campo magnético externo, cada spin magnético aponta para uma
direção, de forma que a soma vetorial de todos seja igual a zero (OTADUY, LEITE, 2004).
O funcionamento de um equipamento de RM para aquisição de imagens se através
da aplicação de um forte campo magnético ao paciente, que pode variar de 0,2 a 3,0 Tesla,
dependendo do aparelho utilizado. Este campo magnético é gerado pela corrente elétrica que
circula em um supercondutor, e que precisa ser refrigerado constantemente até uma
temperatura de -269,5C (Celsius) por meio de hélio líquido (OTADUY, LEITE, 2004). O
paciente é então posicionado no meio de um túnel, que tem cerca de 1,5 a 2,5 metros de
comprimento, ilustrado na Figura 2.15, que é o centro do campo magnético. Quando se inicia
o exame, os spins magnéticos começam a sofrer efeitos do campo magnético externo e se
direcionam paralela ou perpendicularmente ao campo externo (OTADUY, LEITE, 2004)
(AMARO, YAMASHITA, 2001). Para que os spins consigam ficar na posição perpendicular
(posição desejada) ao campo externo, é necessário mais energia do que para conseguir colocá-
los em direções paralelas. Quando estão direcionados em paralelo, teremos um resultado de
soma vetorial diferente de zero, não sendo possível medir e adquirir as imagens desejadas.
Então é necessário deslocar a magnetização para um eixo perpendicular ao campo externo.
Para passar a magnetização do eixo paralelo para o eixo perpendicular é preciso emitir uma
onda eletromagnética de outra freqüência, chamada de onda de radiofreqüência com campo
magnético de maior amplitude. Sendo assim, o campo externo inicial é cancelado e o campo
com maior amplitude passa a influenciar os prótons, os quais passam a fazer movimentos no
eixo transversal (OTADUY, LEITE, 2004) (AMARO, YAMASHITA, 2001). Ao término
deste procedimento, a onda de radiofreqüência é desligada e inicia-se a medição da
magnetização no eixo transversal. O que é medido é uma voltagem induzida pelo movimento
da magnetização transversal em torno do campo externo, que oscila com uma certa freqüência
cuja amplitude vai diminuindo exponencialmente. Este sinal é chamado de “Free Induction
Decay” (FID) ou Decaimento de Indução Livre (DIL). A amplitude do DIL diminui com o
tempo por causa do processo de relaxamento, que é o mecanismo pelo qual a magnetização
vai voltar lentamente ao estado inicial de equilíbrio (OTADUY, LEITE, 2004).
46
Figura 2.15 – Tomógrafo de ressonância magnética.
Disponível em: <http://www.prontocormg.com.br/Ressonan.htm> Acesso em: 31 ago.2006.
A velocidade com que o conjunto de spins volta ao estado de equilíbrio depende do
tipo de tecido que eles pertencem. Há dois tipos de relaxamento: relaxamento longitudinal e
relaxamento transversal que são descritos por constantes de tempo T1 e T2, respectivamente.
Quanto mais longo o T1 e o T2 mais tempo demora o processo de relaxamento. T2 é sempre
menor ou igual a T1, isto é, a magnetização transversal é finalizada anteriormente à
magnetização longitudinal. Os valores de T1 e T2 dependem das propriedades moleculares de
cada tecido, e assim é possível diferenciar a gordura, a substância branca, a substância
cinzenta, o edema ou o liquor através de seus diferentes tempos de relaxamento (OTADUY,
LEITE, 2004).
Na hora de registrar o DIL, é possível escolher alguns parâmetros que determinam se o
contraste da imagem final vai ser com base em T1, T2 ou densidade de prótons (DP). Na
imagem de DP, o contraste T1 e T2 é minimizado de tal maneira que o contraste final da
imagem representa a densidade de prótons no tecido, por isso é utilizado em lugares onde
temos acúmulo de água (por exemplo, em edemas). O T1 é muito utilizado para encontrar
diferenças entre substâncias branca e cinzenta, enquanto o T2 é mais usado para verificar o
fluido cerebral (OTADUY, LEITE, 2004).
As imagens de RM têm maior capacidade de demonstrar diferenças estruturais no
cérebro e têm facilidade para mostrar pequenas alterações na maioria das doenças. As
alterações morfológicas o mais facilmente avaliadas na RM do que nos exames de
Tomografia Computadorizada (TC), por exemplo, bem como maior sensibilidade para
processos infiltrativos. Também é possível verificar estruturas de difícil avaliação em outras
47
modalidades de imagens como hipocampos, núcleos da base e cerebelo, os quais são de difícil
avaliação na TC, por exemplo (AMARO, YAMASHITA, 2001).
2.6 Conclusões e comentários adicionais
A doença de Alzheimer é a demência cerebral mais comum, ainda não se sabe a sua
causa principal e o se tem um exame de laboratório ou de imagem que possa fazer uma
previsão mais contundente que uma determinada pessoa possa desenvolver no futuro esta
doença. Também não existe ainda uma cura ou algo que reduza significantemente a
progressão desta doença. De uma forma geral, o que se tem são medicamentos que podem
atenuar os sintomas da doença, como, por exemplo, melhorar a memória e o comportamento
do paciente. No capítulo seguinte, serão descritos os métodos estatísticos utilizados para
encontrar diferenças cerebrais entre os dois grupos analisados, ou seja, o grupo de controles e
de pacientes diagnosticados com a desordem de Alzheimer.
48
3 MÉTODOS
Neste capítulo serão descritas as técnicas estatísticas que foram estudadas para a
realização desse trabalho. Essas técnicas se dividem basicamente em dois tipos de análise
estatística: univariada e multivariada.
3.1 Análise Univariada
A análise estatística univariada engloba diversas técnicas de análise, como o teste t, a
regressão, correlação linear, e outros (GRANER, 1966) (FRISTON et al., 1995).
Neste estudo foi investigado o software SPM2 (FRISTON et al., 1995) para estudar a
análise univariada. Este software é muito utilizado para análises cerebrais e permite a
utilização de algumas técnicas univariadas. A análise univariada verifica cada voxel
individualmente e compara a média do voxel de um grupo com a média de outro grupo de
imagens, possibilitando encontrar diferenças entre os grupos de estudo (FRISTON et al.,
1995).
As técnicas investigadas são baseadas em modelos lineares, então somente serão
encontradas as diferenças entre os grupos que forem linearmente separáveis. A seguir, serão
descritas brevemente o Modelo Linear Geral e o teste de significância t que compreende
conceitos como o nível de significância p e a hipótese nula, que foram as técnicas univariadas
utilizadas neste trabalho. Mais detalhes sobre essas técnicas podem ser encontrados em
(GRANER, 1966) (SIEGEL, 1981).
3.1.1 Modelo Linear Geral
O modelo linear geral trabalha somente com transformações e análise estatística
lineares. Um modelo linear pode ser testado de duas formas: na primeira, a análise é realizada
em pares de imagens, ou seja, a amostra 01 do grupo 1 é comparada com a amostra 01 do
grupo 2, a amostra 02 do grupo 1 é comparada com a amostra 02 do grupo 2 e assim
sucessivamente, levando em conta que os grupos necessitam ter a mesma quantidade de
amostras. a segunda forma de análise é feita comparando agrupamentos, não importando a
quantidade de amostras existentes em cada grupo, ou seja, é comparado um voxel do grupo 1
inteiro, com o mesmo voxel do grupo 2 inteiro, e não mais em pares de amostras.
49
Embora neste trabalho cada grupo (controles ou pacientes) seja formado por 14
amostras, será utilizada a segunda forma de análise, a qual não importa a quantidade de
amostras em cada grupo. O intuito da utilização do modelo linear é descobrir as diferenças em
cada voxel entre os dois grupos, então para isso utiliza-se os testes de significância que serão
descritos a seguir.
3.1.2 Testes de significância
Na análise univariada pode-se utilizar diversos testes de significância para comparar
duas classes distintas e encontrar as diferenças entre elas (FRISTON et al., 1995). Porém,
neste trabalho, utilizou-se o teste t. Esse teste verifica qual o nível de significância para o
estudo realizado de acordo com o respectivo grau de liberdade.
Por exemplo, sejam
1
k
x
e o
2
k
x
as médias das amostras do grupo 1 e grupo 2
respectivamente, e
1
k
σ
e
2
k
σ
os desvios padrões de cada grupo, onde
k
representa um
determinado voxel da imagem. O desvio padrão ponderado de todas as amostras pode ser
calculado pela seguinte equação (PETTEY; GEE, 2001) (GRANER, 1966):
( )
(
)
( )
(
)
2
11
21
2
2
2
2
1
1
-
--
nn
nn
kk
k
+
+
=
σσ
σ
,
(3.1)
onde
1
n e
2
n representam o número de amostras do grupo 1 e do grupo 2 respectivamente.
Pela quantidade de amostras subtraída do número de grupos existentes, obtém-se o grau de
liberdade (GRANER, 1966). Neste trabalho o grau de liberdade é 26, pois existem dois
grupos sendo analisados com 14 amostras cada.
Então com o teste t verifica-se a diferença existente entre as médias de cada grupo, ou
seja, retira-se primeiramente as médias de um determinado voxel das amostras do grupo 1 e
do grupo 2, então dividi-se a diferença entre essas médias pelo desvio padrão ponderado para
que sejam encontradas as diferenças existentes entre os grupos no determinado voxel
analisado; e realiza-se este procedimento para todos os voxels das imagens. Logo, pode-se
medir o quão diferente um determinado voxel é entre as duas classes analisadas, utilizando-se
a seguinte equação (PETTEY; GEE, 2001) (GRANER, 1966):
50
21
21
11
nn
xx
t
k
kk
k
+
=
σ
-
.
(3.2)
Além desse teste t, utiliza-se também o conceito de Hipótese Nula e de nível de
significância p para comparação do resultado obtido, e assim ser capaz de aceitar ou rejeitar o
resultado. Para que o resultado obtido seja válido, tem que ser provado que a hipótese nula
(H
o
) está errada e que a hipótese alternativa (H
1
) está correta. Essas duas hipóteses são
mostradas na Tabela 3.1, onde H
o
ocorre quando não existem diferenças entre as amostras dos
dois grupos analisados, e H
1
quando diferenças entre as amostras destes grupos. Porém no
teste de hipótese dois tipos de erro podem acontecer, sendo que o primeiro ocorre quando
aceita-se H
o
, sendo que H
o
é falso, e o segundo erro acontece quando rejeita-se H
o
, sendo este
verdadeiro. Então para medir a possibilidade dos erros ocorrerem, usa-se o nível de
significância p para teste das hipóteses.
Tabela 3.1 – Tabela com os conceitos de hipótese nula e hipótese alternativa.
H
o
: grupo 1 = grupo 2 ou H
o
: grupo 1 – grupo 2 = 0
H
1
: grupo 1 grupo 2 ou H
1
: grupo 1 – grupo 2 0
De acordo com Graner (GRANER,1966), quanto menor o valor de p, mais confiável
será o valor de t calculado na Equação 3.2. Embora não haja nenhuma regra para determinar o
valor ótimo de p, recomenda-se utilizar p 0,05 (GRANER,1966), pois alterações ocorridas
quando a probabilidade utilizada é 0,05 ou menor são difíceis de ocorrer, levando assim à
conclusão que essas alterações o causadas por alguma condição que deve ser levada em
conta em termos estatísticos (GRANER, 1966). Em outras palavras, quanto menor o valor de
p, maior será a certeza dos resultados, por exemplo: se o objetivo for conseguir noventa e
nove por cento de certeza que as diferenças encontradas não são devidas ao acaso ou ruído,
devemos escolher p = 0,01.
Com base nos valores de p e do grau de liberdade, verifica-se então se o valor de t (ou
equivalentemente a diferença entre as amostras) é estatisticamente relevante, por meio da
51
comparação deste valor para um dado nível de significância, com a tábua de valores da
distribuição t (SIEGEL, 1981) (JOHNSON; WICHERN, 1982) (GRANER, 1966).
Para ilustrar esse cálculo, descreve-se a seguir um exemplo simples com valores
hipotéticos. Deseja-se comparar o voxel 5 entre as imagens de dois grupos, sendo que cada
grupo é composto por 14 imagens. O nível de certeza esperado é de 99%, ou seja, p=0,01.
Assim, dado que
1
5
x = 0,8 ;
2
5
x = 0,4 ;
1
5
σ
= 0,25 ;
2
5
σ
= 0,2;
1
n
=14;
2
n
=14, tem-se para o
desvio padrão ponderado, descrito na Equação 3.1, o valor:
( )( ) ( )( )
226,0
26
3325,1
21414
2,01125,011
22
==
+
+
=
-
-4-4
k
σ
.
(3.3)
Calcula-se então, utilizando a Equação 3.2, quão diferente esse voxel 5 é entre os dois
grupos analisados, ou seja,
683,4
14
1
14
1
226,0
00
=
+
=
,4-,8
k
t .
(3.4)
Como neste caso tem-se grau de liberdade igual a 26, pois
1
n
+
2
n
-2 = 26, compara-
se o valor 4,683 com o valor existente na tábua de t para p=0,01, conforme ilustrado na Figura
3.1. Como o valor obtido é maior, então pode-se dizer que a diferença encontrada em relação
a média dos grupos no determinado voxel analisado é estatisticamente relevante, isto é, a
diferença deve ser levada em consideração para análise das amostras em questão.
52
Figura 3.1 – Valores da tábua do teste t.
(Adaptado de SIEGEL, 1981).
3.2 Análise Multivariada
A análise multivariada é investigada neste trabalho para comparar imagens inteiras
entre os grupos estudados, e essa é uma das principais diferenças em relação a análise
univariada que foi apresentada anteriormente.
Nos últimos anos, a utilização da análise multivariada em neuroimagens vem sendo
bastante estudada para análise de imagens médicas, assim como já acontecia e continua
acontecendo com a análise univariada.
53
Neste estudo foram utilizados dois métodos estatísticos multivariados denominados
Análise de Componentes Principais (ACP) e Análise de Discriminantes Lineares (ADL).
Ambos os métodos serão descritos a seguir, além do método estatístico multivariado adaptado
neste trabalho para a análise de imagens médicas.
3.2.1 Análise de Componentes Principais
A técnica de Análise de Componentes Principais (ACP) ou Principal Component
Analysis (PCA) (FUKUNAGA, 1990) (JOHNSON; WICHERN, 1982) foi descrita em 1901
por Karl Pearson, que tinha a intenção de resolver alguns problemas multivariados na área
biológica. Em 1933, Hotteling aprimorou essa técnica para cálculos com mais variáveis e a
análise de componentes principais também ficou conhecida como a transformada de
Hotteling. Porém, quando o problema envolvia inúmeras variáveis, os cálculos matemáticos
desta técnica eram inviáveis na prática. Com o passar do tempo e o avanço tecnológico dos
tempos atuais, essa técnica tornou-se computacionalmente viável, sendo aplicada em diversos
problemas de análise multivariada de dados.
Utiliza-se o PCA para transformar linearmente o grupo de amostras com o intuito de
encontrar uma base vetorial que represente a maior variância existente entre os dados
analisados. Essa transformação linear que o PCA executa pode ser descrita da seguinte forma.
um grupo com N amostras onde cada amostra tem n características. Então, pode-se dizer
que essas amostras são descritas originalmente pelos seguintes vetores ortogonais L
1
, L
2
,...,
L
n
. A idéia é aplicar uma transformação linear nessas amostras para descrever a mesma
quantidade de amostras N que em uma nova base vetorial, J
1
, J
2
,..., J
u
, onde un. Esta
base deve ser encontrada de tal modo que a variação entre as amostras seja maximizada, ou
seja, a variação existente na direção vetorial J
1
é máxima e maior do que na direção J
2
, de tal
forma que: Var(J
1
) Var(J
2
) ... Var(J
u
). Os vetores J
1
, J
2
,..., J
u
que maximizam a variância
das amostras recebem o nome de componentes principais (THOMAZ, 1999).
Como mencionado acima, o PCA encontra uma nova base vetorial que maximiza as
variâncias existentes entre amostras, ordenando-as. Porém, algumas variações são pequenas
ou quase nulas, permitindo que as transformações das amostras nessas direções sejam
ignoradas, levando-se em consideração somente as direções de maiores variações. Quando
isso ocorre, a dimensão da matriz de amostras é reduzida, passando de N amostras com n
variáveis para N amostras com u variáveis, onde u<n. E, frequentemente, a variabilidade
54
existente no grupo de amostras original com n variáveis é explicada por uma quantidade bem
menor de variáveis u, reduzindo significantemente a dimensionalidade original dos dados.
As variações existentes entre as amostras, comentadas acima, encontram-se por meio
do lculo da matriz de covariância
Σ
de todas as amostras, e a maximização dessas
variações pelo PCA, de acordo com a seguinte equação (FUKUNAGA, 1990):
WWW
T
W
pca
Σ= maxarg
,
(3.5)
onde W
pca
é a base vetorial que maximiza a matriz de covariância dos dados. De acordo com
Fukunaga (FUKUNAGA, 1990), a matriz W
pca
é composta pelos autovetores de
Σ
, ordenados
de forma decrescente pelos seus respectivos autovalores. Em outras palavras, representa-se a
direção de máxima variância dos dados pelo primeiro autovetor φ
1
, a segunda direção de
maior variância pelo segundo autovetor φ
2
, e assim por diante, onde
λ
1
λ
2
...
λ
u
, para
todos os pares de (autovetor, autovalor) (φ
1
,
λ
1
), (φ
2
,
λ
2
),..., (φ
u
,
λ
u
) calculados.
A Figura 3.2 ilustra uma nuvem de pontos onde visualiza-se dois autovetores, sendo
que o primeiro autovetor indica a direção de máxima variância dos dados, e o segundo
autovetor, ortogonal ao primeiro, a segunda direção de máxima variância correspondente.
Ainda, na Figura 3.2, observa-se uma elipse delimitando o espalhamento das amostras. Essa
dimensão de espalhamento é representada matematicamente pelos respectivos autovalores.
.
Figura 3.2 – Imagem de um espalhamento de amostras, com o 1º e o 2º autovetores.
(Adaptado de THOMAZ, 2004).
Y
X
1º autovetor
2º autovetor
55
Mais detalhes sobre o PCA podem ser encontrados em (FUKUNAGA, 1990)
(KITANI; THOMAZ, 2006a). A seguir, será apresentada a técnica LDA que é a base do
método MLDA investigado neste trabalho para separar as amostras nos grupos
correspondentes.
3.2.2 Análise de Discriminantes Lineares
Apresentou-se na seção anterior o método multivariado PCA, e verificou-se que a
principal função do mesmo é encontrar a base vetorial de máxima variância dos dados.
Porém, a base vetorial encontrada para a xima variância das amostras geralmente não
consegue separar as imagens nos grupos correspondentes. Então, a fim de suprir essa
limitação, foi proposto por Fisher (FISHER, 1936) um método estatístico para separar as
amostras de dados nos grupos correspondentes. Esta técnica tem o intuito de diminuir o
espalhamento dentro de cada classe e aumentar a separação entre as classes analisadas, sendo
chamada comumente de Linear Discriminant Analysis (LDA) ou Análise de Discriminantes
Lineares (ADL).
O método estatístico LDA é supervisionado, ou seja, antes dos dados serem
analisados, eles têm que estar separados em classes. O LDA trabalha com dois tipos de
entrada: sendo uma a matriz
b
S de espalhamento entre as classes (inter-classes), e a outra a
matriz
w
S
de espalhamento dentro de cada classe (intra-classes). Segundo Fisher (FISHER,
1936), a maneira de se calcular a separação das classes é por meio da razão dos determinantes
de
b
S e
w
S , de acordo com a equação abaixo:
w
b
w
b
S
S
S
S
R ==
)det(
)det(
.
(3.6)
56
Sendo:
( )( )
=
=
c
i
T
iiib
xxxxNS
1
,
(3.7)
( )( )
= =
=
c
i
N
j
T
ijiijiw
i
xxxxS
1 1
,,
,
(3.8)
onde
ji
x
,
é a amostra j da classe i,
i
N
é o número de amostras da classe i, c é a quantidade de
classes existentes,
i
x
a média da classe i, e
x
a média global que é dada pela seguinte
equação:
= = =
==
c
i
c
i
N
j
jiii
i
x
N
xN
N
x
1 1 1
,
11
.
(3.9)
Então, de acordo com a Equação 3.6, quanto maior o valor de
R
, melhor será a
separação das classes, ou seja, o LDA procura maximizar o espalhamento calculado por
b
S e
minimizar o espalhamento descrito por
w
S
. A maximização da equação do critério de Fisher
pode ser descrita como:
WSW
WSW
W
w
T
b
T
W
lda
maxarg=
,
(3.10)
onde W
lda
é uma projeção ortonormal, que corresponde à melhor separação linear entre os
grupos de amostras. Segundo Devijver e Kittler (DEVIJVER; KITTLER, 1982), essa nova
base W
lda
é dada pelos autovetores da matriz
bw
SS
1
.
57
Portanto, o LDA tem como proposta encontrar uma nova base vetorial que garanta o
maior valor de
R
, ou seja, o objetivo é encontrar uma base vetorial que melhor separe
linearmente os grupos. A Figura 3.3 ilustra exemplos de dois vetores e as separações
realizadas pelos mesmos. Observa-se na Figura 3.3(a) que o vetor destacado não consegue
obter uma separação linear dos dados dentro das duas classes existentes, e na Figura 3.3(b) o
vetor consegue obter uma melhor separação linear entre as duas classes.
(a)
(b)
Figura 3.3 – A figura (a) ilustra um hiper-plano onde o vetor tenta separar as imagens em dois grupos, e na figura
(b) o vetor consegue fazer a separação dos grupos com sucesso.
58
Na próxima seção, apresenta-se o todo estudado neste trabalho para analisar as
amostras de dois grupos distintos.
3.2.3 O Método PCA+MLDA
O método utilizado neste trabalho é uma combinação das técnicas de análise
multivariada PCA e LDA. Poderia-se investigar as diferenças entre grupos de imagens de
controles e pacientes utilizando-se somente o LDA, pois o mesmo tem a função de separar os
grupos de amostras, conforme descrito na sub-seção anterior. No entanto, as amostras
analisadas neste trabalho correspondem a imagens tri-dimensionais que contém um número de
variáveis muito maior do que o número de amostras. Por exemplo, neste trabalho investiga-se
28 imagens 3D de ressonância magnética que contém 902629 características. Tal fato impede
a aplicação do método LDA diretamente nas imagens devido à conhecida instabilidade na
determinação da inversa da matriz
w
S (THOMAZ, 2004). Esse problema recebe o nome de
Small Sample Size (SSS) ou Problema de Número Pequeno de Amostras (FUKUNAGA,
1990).
Existem algumas técnicas que resolvem o problema de SSS, como por exemplo, o
método CLDA que foi criado por Chen et al. (CHEN et. al, 2000), o DLDA criado por Yu e
Yang (YANG; YANG, 2001), o YLDA que teve como criadores Yang e Yang (YANG;
YANG, 2003) e o MLDA desenvolvido por Thomaz e Gillies (THOMAZ; GILLIES, 2005b).
Neste trabalho será investigado o método MLDA, pois esse método tem algumas vantagens
em relação aos outros como, por exemplo, o MLDA pode ser aplicado diretamente na matriz
original de dados, trabalha com todos autovetores expandindo o espalhamento dos dados e
tem menos custo computacional quando comparado aos métodos que trabalham somente com
uma transformação linear. De acordo com experimentos e comparações entre os métodos
realizados por Thomaz (THOMAZ, 2004) o MLDA e o YLDA foram os métodos que
obtiveram os melhores resultados, sendo que o MLDA trabalha somente com uma
transformação linear e o YLDA trabalha com duas transformações lineares, tendo este que
reduzir primeiro a dimensionalidade da matriz de dados para poder separar as amostras nos
grupos.
O método MLDA (Maximum uncertainty Linear Discriminant Analysis), proposto por
Thomaz e Gillies (THOMAZ; GILLIES, 2005b), corrige o problema de inversão da matriz S
w
e tem a função de separar as imagens nos grupos correspondentes. Embora o MLDA
59
proponha uma solução matemática para o problema de número pequeno de amostras (SSS)
em questão, a sua aplicação diretamente nas imagens médicas impõe a necessidade de se ter
recursos computacionais elevados, limitando a aplicação genérica do método. Assim, na
Figura 3.4, ilustra-se o arcabouço multivariado PCA+MLDA estudado. Pode-se verificar que
existe primeiramente a etapa de preparação das imagens na forma matricial, a qual será
explicada em detalhes no capítulo seguinte de experimentos. Logo após aplica-se a técnica
PCA para encontrar a base vetorial de maior variância e também para reduzir a dimensão da
matriz de imagens, e finalmente calcula-se o MLDA para encontrar a base vetorial que melhor
separe os grupos.
Figura 3.4 – Processo da Análise Multivariada.
(Adaptado de THOMAZ et. al., 2006).
60
No cálculo da matriz de autovetores PCA, teremos uma base vetorial com N-1 vetores
linearmente independentes, ou seja, existirá N-1 autovetores, pois a média é extraída de
cada imagem. Então, a base vetorial poderá ser formada por
1
N
autovetores
(FUKUNAGA, 1990). Como a quantidade de imagens é menor do que a quantidade de
características, pode-se dizer então que um autovetor consegue representar mais de uma
característica simultaneamente.
Após o cálculo dos autovetores e autovalores, projeta-se, conforme ilustrado na Figura
3.4, a matriz Z na base de autovetores construída pelo PCA, isto é,
pcapca
ZWZ
=
,
(3.11)
sendo Z
pca
a nova matriz de dados onde as imagens estarão representadas nos autovetores
contidos na matriz
pca
W . A redução do PCA ocorre nesse momento, onde a base vetorial
pca
W contém somente as informações mais expressivas de cada imagem em relação à matriz
Z
(SWETS; WENG, 1996).
Após a aplicação do PCA, calcula-se o MLDA para separar as imagens em dois
grupos distintos. O método MLDA (THOMAZ; GILLIES, 2005b) troca a matriz
w
S
por
outra matriz denominada
*
w
S , que mantém os maiores autovalores, substituindo aqueles cujos
valores são menores do que o autovalor médio de
w
S . Essa substituição dos autovalores
produz um aumento no espalhamento dos dados, mantendo as variações mais relevantes
existentes nas amostras. Pode-se reescrever a equação de S
w
da seguinte forma (THOMAZ;
GILLIES, 2005b):
( )
( )( )
= ==
==
c
i
N
j
T
ijiiji
c
i
iiw
i
xxxxSNS
1 1
,,
1
1
,
(3.12)
onde
ji
x
,
é a amostra j da classe i, S
i
a matriz de covariância da classe i ,
i
N é o número de
amostras da classe i e c é a quantidade de classes existentes. Então pode-se considerar a
61
matriz S
w
com uma matriz de covariância S
p
multiplicada pela média ponderada de todas as
amostras. A equação de S
p
é dada por (THOMAZ; GILLIES, 2005b):
( )
(
)
(
)
(
)
=
+
+
+
=
=
c
i
cg
iip
cN
SNSNSN
SN
cN
S
1
2211
111
1
1
K
,
(3.13)
Então a nova matriz que se deseja obter,
*
w
S
, é calculada conforme a equação a seguir
(THOMAZ; GILLIES, 2005b).
))(()(
***
cNcNSS
T
pw
ΦΦΛ== ,
(3.14)
sendo N o número total de amostras, c o número de classes utilizado no estudo,
os
autovetores da matriz S
p
e
*
Λ
a nova matriz de autovalores de S
p
, que forma-se de acordo com
os maiores autovalores de S
p
. O cálculo da nova matriz
*
Λ
é descrito na Equação 3.15, tendo
como função preservar os autovalores queo maiores que o autovetor médio
λ
, ou seja,
(
)
(
)
[
]
λλλλ
,max,...,max
,1
*
n
diag=Λ
,
(3.15)
sendo
n
λ
o valor dos autovalores de 1 até n, e
λ
o valor da média dos autovalores, que é
dado pela seguinte equação:
=
=
n
i
i
n
1
1
λλ
.
(3.16)
62
Segundo Thomaz e Gillies (THOMAZ; GILLIES, 2005b), com a matriz
*
w
S
calculada,
pode-se substituir
w
S da Equação 3.10 por
*
w
S e assim tem-se a equação a seguir que
maximiza o critério de Fisher:
WSW
WSW
W
w
T
b
T
mlda
*
maxarg= .
(3.17)
Após essa substituição, calcula-se o vetor que encontra a separação entre os grupos
(THOMAZ; GILLIES, 2005b), conforme descrito anteriormente na seção 3.2.2.
3.3 Comentários Adicionais
Neste capítulo foram descritos os métodos estudados neste trabalho, de análise
estatística univariada e multivariada. Na análise univariada foi apresentado o modelo linear
geral e os testes de significância que são a base teórica para a investigação univariada
realizada com as imagens médicas. Também descreveu-se o PCA, o LDA, e o MLDA, sendo
que este último resolve o problema enfrentado pelo LDA e torna possível calcular e separar as
imagens na alise multivariada. A utilização do PCA previamente ao MLDA ocorre por
causa do custo computacional, pois se fosse usado somente o MLDA a análise exigiria muito
mais processamento e memória para tal trabalho. Em outras palavras, o PCA é utilizado com
o intuito de reduzir a dimensão das imagens, facilitando o cálculo do MLDA com um custo
computacional menor (THOMAZ, 2004).
É bom salientar que os modelos descritos neste capítulo e utilizados para a análise de
imagens cerebrais, também são aplicáveis em outros tipos de análise como, por exemplo,
representação de imagens de face (KITANI; THOMAZ; GILIES, 2006b) (THOMAZ;
KITANI; GILLIES, 2005a). No próximo capítulo serão apresentados os experimentos
realizados neste trabalho.
63
4 EXPERIMENTOS
No presente capítulo será descrito como os experimentos realizados neste trabalho
foram executados. Nestes experimentos, o banco de imagens utilizado foi cedido pelo
Instituto de Psiquiatria da Faculdade de Medicina da USP. Este banco de imagens possui dois
grupos: pacientes (pessoas previamente diagnosticadas com a doença de Alzheimer) e
controles (pessoas que não apresentam características da desordem cerebral em questão).
Todas as imagens foram adquiridas por meio de exames de ressonância magnética realizados
no Hospital das Clínicas da USP e o pré-processamento das imagens foi implementado
utilizando-se a técnica Statistical Parametric Mapping (SPM) (FRISTON et al., 1995)
(WORSLEY, 1999).
4.1 Banco de imagens
O banco de imagens utilizado no experimento é composto por 28 imagens tri-
dimensionais de ressonância magnética, sendo 14 de controle e 14 de pacientes
diagnosticados previamente com a doença de Alzheimer. Todas as imagens foram adquiridas
usando o equipamento 1.5T Philips Gyroscan S15-ACS MRI scanner (Philips Medical
Systems, Eindhoven, The Netherlands), incluindo uma série contínua de 1.2mm de imagens
coronais do cérebro inteiro, usando seqüências rápidas de T1-weighted (TE = 9ms, TR =
30ms, ângulo 30
o
, campo de visão = 240mm, e uma matriz de 256 x 256). Todas as imagens
foram revisadas por um neuro-radiologista de RM. A permissão ética para este estudo foi
concedida pelo Comitê de Éticas do Hospital Clínico, Universidade de São Paulo, São Paulo,
Brasil.
4.2 Tipos de Experimentos
Foram realizados dois tipos de experimentos, sendo o primeiro relacionado à análise
estatística univariada e o segundo a análise multivariada. Para realizar ambos os experimentos
utilizou-se o software MatLab em conjunto com outros softwares. No experimento com a
análise univariada, além do MatLab, foi utilizado o pacote estatístico SPM2 (FRISTON et al.,
1995). E, nos experimentos da análise multivariada, foram utilizados os softwares MRIcro
64
(RORDEN; BRETT, 2000) e RView (RUECKERT et al., 1999). As seções a seguir
descrevem os procedimentos dos experimentos realizados com as duas análises.
4.2.1 Análise Univariada
O experimento realizado referente à análise univariada segue a técnica denominada
Morfometria Baseada em Voxel otimizada ou, simplesmente, MBV-otimizado (GOOD et al.,
2001) (AGUIAR et al., 2007). O MBV-otimizado apresenta algumas etapas que não estão
presentes no MBV comum. De forma sucinta, inicialmente o MBV-otimizado constrói as
imagens modelos com base em todas as imagens que compõem o estudo, garantindo assim
uma normalização mais eficaz. Além disso, no MBV-otimizado, para cada substância cerebral
segmentada, realiza-se novamente a normalização e a segmentação a fim de se obter uma
melhor separação das substâncias e conseguir melhores resultados na análise posterior. Após
essa segmentação faz-se também uso do método de modulação para corrigir as alterações
volumétricas dos voxels em questão. Na última etapa, antes da análise estatística, adiciona-se
uma etapa de suavização para eliminar eventuais ruídos ainda existentes na imagem (GOOD
et al., 2001) (AGUIAR et al., 2007).
Os experimentos para a análise univariada podem ser descritos, basicamente, por duas
etapas distintas de processamento de imagens. A primeira etapa tem como objetivo criar
imagens de referência ou padrão para o alinhamento de todas as imagens do estudo. Este
alinhamento, ou normalização espacial das imagens, serve para garantir que um determinado
voxel de uma imagem esteja idealmente na mesma posição (x, y, z) em todas as outras
imagens (ASHBURNE et. al., 2003) (ASHBURNE et. al., 2006). a segunda etapa dos
experimentos corresponde ao processamento e à análise estatística das imagens, utilizando as
imagens de referência criadas na fase anterior, para normalização e modulação das mesmas
(GOOD et al., 2001). Esta etapa de processamento de imagens permite estudar e identificar as
principais diferenças encontradas entre as amostras de pacientes e controles.
65
4.2.1.1 Criação das imagens de referência para alinhamento
O procedimento de criação das imagens de referência pode ser acompanhado na
Figura 4.1, onde as principais etapas deste procedimento estão ilustradas.
Inicialmente, realiza-se a normalização das imagens. Para isso, estima-se os
parâmetros de translação, rotação e escala com base em uma máscara padrão do cérebro
criada pelo estudo Talairach (TAILAIRACH; TORNOUX,1988) (MAZZIOTTA et al., 1995),
não havendo cortes, somente ajustes. A imagem padrão T1.img criada pelo estudo Tailarach
(TAILAIRACH; TORNOUX,1988) (MAZZIOTTA et al., 1995), disponível no software
SPM2, é utilizada mundialmente como uma imagem de referência para normalização de
imagens de ressonância magnética de desordens cerebrais. Depois, utilizando os parâmetros já
calculados, alteram-se as imagens de estudo para que o alinhamento com a imagem T1.img
seja feito sem que haja deformação em qualquer uma das imagens. A Figura 4.2 ilustra um
exemplo de normalização realizado neste trabalho. Esta normalização é executada no cérebro
inteiro e não separadamente para cada uma das substâncias branca, cinza e LCR.
Após a conclusão da normalização realiza-se então a segmentação das imagens. Nesse
passo, cada imagem é dividida em substância cinzenta, substância branca, LCR e tecidos extra
cerebrais. A segmentação emprega um modelo de análise de agrupamento (GOOD et al.,
2001) que verifica a intensidade de cada voxel para separar cada grupo de tecido combinado
com um conhecimento a priori da distribuição desses tecidos em um indivíduo normal. Na
segmentação, a separação dos tecidos em partes ajuda na eliminação dos tecidos extra
cerebrais como, por exemplo, a caixa craniana. Um exemplo da segmentação pode ser
visualizado na Figura 4.3.
66
Figura 4.1 – Etapa de criação das imagens de referência.
67
Imagem referência (T1.img) Imagem do estudo normalizada
Figura 4.2 – Normalização – imagem utilizada como modelo (T1.img) e imagem normalizada.
68
Cérebro Inteiro Massa Cinzenta Massa Branca LCR
Figura 4.3 – Segmentação cerebral em três novas imagens: substância cinza, branca e LCR.
O terceiro passo da etapa de criação das imagens de referência é a suavização. Neste
passo, utiliza-se um filtro Gaussiano isotrópico que varia de 4mm até 12mm. Essa variação do
69
valor a ser utilizado pelo filtro Gaussiano é referente à quantidade de voxels vizinhos que
serão considerados para análise, ou seja, a intensidade de cada voxel se dá pela média
ponderada dos valores dos voxels vizinhos. Este processo serve para suavizar as bordas
(GOOD et al., 2001).
A suavização aplica-se em quatro tipos de imagens diferentes. Neste estudo a
suavização foi realizada com um filtro Gaussiano isotrópico de 8mm, pois de acordo com
testes realizados previamente (BUSATTO FILHO et al., 2003), chegou-se a conclusão que,
para este experimento em questão, 8mm seria o filtro mais adequado. As quatro imagens
diferentes nas quais se aplica a suavização são as três partes de rebro que foram
segmentadas (substância cinzenta, branca e LCR) e a imagem do cérebro inteiro que foi
normalizada no passo anterior ao da segmentação.
Conforme ilustrado anteriormente na Figura 4.1, os respectivos resultados da etapa de
suavização são posteriormente utilizados para os cálculos da média de cada grupo analisado,
ou seja, substância cinzenta, substância branca, LCR e cérebro inteiro. O resultado da média
das imagens do cérebro inteiro resultará na primeira imagem de referência, denominada aqui
de IRef1.img. Após os cálculos das médias de cada segmentação, somam-se todas as médias e
então aplica-se uma nova suavização com o mesmo filtro utilizado na suavização anterior.
Após essa nova suavização teremos a segunda e última imagem de referência que
chamaremos de IRef2.img. Ambas imagens de referência serão utilizadas nos procedimentos
descritos a seguir.
4.2.1.2 Normalização, segmentação, modulação e suavização das imagens
Logo após a criação das imagens de referência, inicia-se um conjunto de pré-
processamentos das imagens originais para evidenciar as diferenças entre os grupos de
pacientes e controles. As principais etapas desses experimentos podem ser visualizadas na
Figura 4.4 ilustrada a seguir.
Inicialmente, realiza-se uma normalização das imagens originais seguida de uma
segmentação. Faz-se a normalização de forma global a fim de garantir idealmente que os
voxels estejam nas mesmas posições em todas as imagens, podendo assim obter um resultado
confiável para a segmentação que divide a imagem em três novas imagens (substância branca,
70
cinza e LCR). Para este alinhamento, no entanto, não utiliza-se mais a imagem padrão T1.img
(TAILAIRACH; TORNOUX,1988) (MAZZIOTTA et al., 1995), mas sim a primeira imagem
que fora construída na etapa anterior de criação das imagens de referências, isto é, a imagem
IRef1.img. A Figura 4.5 ilustra a imagem IRef1.img obtida neste trabalho. Pode-se observar
que a imagem se apresenta bem suavizada, sendo que determinados detalhes que são possíveis
visualizar nas imagens originais passam a não estar visíveis, deixando em destaque somente
as principais estruturas do cérebro para fins de alinhamento como, por exemplo, o ventrículo.
Após essa segmentação inicial, realiza-se uma nova normalização conforme destacado
anteriormente na Figura 4.4. Nesta etapa são calculados os parâmetros para que se possa fazer
uma normalização específica para cada substância cerebral segmentada, tomando como base a
imagem IRef2.img, construída nos experimentos anteriores. Utilizando os parâmetros de
normalização calculados para cada substância, as imagens originais que descrevem o cérebro
inteiro são pré-processadas novamente para gerar as análises estatísticas específicas para
substância cinzenta, branca e LCR. A Figura 4.9 ilustra as novas etapas de pré-processamento
das imagens antes da análise estatística. Neste novo pré-processamento das imagens, realiza-
se a normalização de cada segmentação com base nos parâmetros calculados. As Figuras 4.6,
4.7 e 4.8 ilustram essa nova normalização das imagens utilizando a imagem de referência
IRef2.img como modelo de alinhamento para um exemplo específico de substância cinzenta,
substância branca e LCR, respectivamente.
71
Figura 4.4 – Pré-Processamento de imagens.
72
Figura 4.5 – Imagem de referência IRef1.img.
73
Imagem referência (IRef2.img) Imagem do estudo normalizada
Figura 4.6 – Imagem de referência IRef2.img e um exemplo de imagem de massa cinzenta normalizada.
74
Imagem referência (IRef2.img) Imagem do estudo normalizada
Figura 4.7 – Imagem de referência IRef2.img e um exemplo de imagem de massa branca normalizada.
75
Imagem referência (IRef2.img) Imagem do estudo normalizada
Figura 4.8 – Imagem de referência IRef2.img e um exemplo de imagem do LCR normalizado.
76
Figura 4.9 – Pré-Processamento final.
Conforme ilustrado na Figura 4.9, após a normalização aplica-se uma nova
segmentação para que haja uma melhor separação das substâncias que serão analisadas. Neste
pré-processamento final, adiciona-se a etapa de modulação e uma nova suavização, conforme
demonstrado na Figura 4.9. A etapa de modulação tem a função de preservar e corrigir o
volume de cada voxel em relação à segunda imagem de referência IRef2.img anteriormente
77
calculada (GOOD et al., 2001). Um exemplo referente à modulação em uma das imagens
utilizadas no trabalho está ilustrado na Figura 4.10.
Corte Coronal Corte Sagital Corte Transaxial
Substância Cinzenta Substância Branca LCR
Figura 4.10 – Imagem cerebral modulada.
Conforme ilustrado na Figura 4.9, o último passo antes da análise estatística é a
suavização. Nesta etapa eliminam-se eventuais ruídos contidos nas imagens e suavizam-se as
bordas. Realizou-se a suavização com um filtro Gaussiano isotrópico de 12mm, pois de
acordo com testes realizados (MECHELLI et al., 2005) (BUSATTO FILHO et al., 2003) esta
especificação é a mais apropriada para uma posterior análise estatística das imagens do estudo
78
em questão. A Figura 4.11 mostra um exemplo de uma imagem do cérebro na qual foi
realizado o processo de suavização.
Corte Coronal Corte Sagital Corte Transaxial
Substância Cinzenta Substância Branca LCR
Figura 4.11 – Imagem cerebral suavizada.
Após o pré-processamento das imagens, realiza-se então a análise estatística
univariada, conforme descrito no capítulo 3, sub-seção 3.1.2. Esta análise utiliza o teste t para
encontrar diferenças entre os cérebros dos pacientes e controles analisados.
79
4.2.2 Análise Multivariada
Existem várias maneiras de se realizar o pré-processamento das imagens a fim de
investigá-las por uma análise multivariada. Porém, para comparar as duas análises estatísticas
(univariada e multivariada) por meio dos mesmos experimentos, esse pré-processamento foi
realizado em duas etapas.
A primeira etapa se refere à criação das imagens modelos, que foi apresentada na
seção 4.2.1.1 e ilustrada na Figura 4.1. Realizamos então o mesmo pré-processamento inicial
utilizado na preparação das imagens para a análise univariada. Assim, esse experimento
realizado na análise multivariada utiliza a mesma imagem de referência que foi usada no
experimento da análise univariada, ou seja, a imagem IRef1.img ilustrada anteriormente na
Figura 4.5.
Uma vez definida a imagem de referência, precisa-se então normalizar as imagens
originais com base na imagem IRef1.img. Este procedimento está ilustrado na Figura 4.12. A
normalização realizou-se com a utilização do software SPM2, com a finalidade de alinhar
globalmente todas as imagens em relação à imagem modelo criada na etapa anterior.
Exemplos de uma imagem do cérebro original e uma imagem normalizada podem ser
visualizados na Figuras 4.13 A e B.
Após a normalização, retirou-se o crânio de cada imagem utilizando o software
MRIcro (RORDEN; BRETT, 2000) com um limiar de operação igual a 0,40. Executa-se este
procedimento para que a imagem seja composta somente do que realmente é relevante para a
análise em questão, fazendo com que a quantidade de voxels das imagens diminua e também
seja reduzida a quantidade de ruído de cada imagem. A imagem ilustrada na Figura 4.13 C é a
mesma imagem cerebral ilustrada na Figura 4.13 A, só que após a retirada da caixa craniana.
80
Figura 4.12 – Processamento das imagens para a análise estatística multivariada.
Após a preparação das 28 imagens utilizadas no experimento, as mesmas foram
transformadas em vetores multi-dimensionais, formando uma matriz de dados. Ou seja, cada
imagem originalmente tem o tamanho de 256X144X256 voxels, e após o pré-processamento
das imagens, apresentado anteriormente, a dimensão de cada imagem foi reduzida para
91X109X91. Então concatena-se os 91X109X91 voxels para se formar um vetor linha de
902629 colunas. Logo teremos 28 linhas com 902629 colunas cada, sendo que cada linha
representa uma imagem cerebral e cada coluna representa um voxel dessa imagem.
81
A
B
C
Figura 4.13 – Imagem do cérebro, sendo que a imagem A ilustra o cérebro original, a imagem B o cérebro
normalizado e a C o cérebro após a retirada do crânio e tecidos extra-cerebrais.
82
A seguir será descrito o procedimento de manipulação matemática adotado, sendo que
a matriz H contém todas as imagens concatenadas, conforme mostra a equação a seguir:
90262928
902629,282,281,28
902629,22,21,2
902629,12,11,1
X
aaa
aaa
aaa
H
=
K
MMMM
K
K
(4.1)
Depois da concatenação das imagens em uma matriz de dados multidimensionais, cria-
se a matriz de transformação do PCA. A finalidade dessa matriz é a redução da
dimensionalidade de cada imagem, restando somente as componentes principais das imagens.
O cálculo dos componentes principais se resume, conforme descrito no capítulo 3, seção
3.2.1, em encontrar os autovetores e autovalores em relação à variação das imagens do estudo
em questão. A variação das imagens se por meio da matriz de covariância Σ. Para isto,
inicia-se com o cálculo da média global
h
, que é a média de todas as imagens cerebrais do
estudo, conforme calculado abaixo:
[
]
902629
321
aaaah = ,
(4.2)
onde
n
a
é o valor médio do voxel n, sendo que n varia de 1 até 902629. O
n
a
é calculado da
seguinte forma:
,
28
1
28
1
=
=
i
in
aa
para
n
=1,2,3,...,902629.
(4.3)
83
A imagem da média global de todas as imagens pode ser visualizada na Figura 4.14.
Figura 4.14 – Imagem da média global de todas as imagens cerebrais utilizadas neste trabalho.
Após o cálculo do vetor média
h
, subtraímos esse vetor do conjunto de imagens H,
formando assim a matriz
Z
abaixo:
90262928
902629
902629,28
2
2,28
1
1,28
902629
902629.2
2
2,2
1
1,2
902629
902629,1
2
2,1
1
1,1
X
aaaaaa
aaaaaa
aaaaaa
Z
=
K
MMMM
K
K
.
(4.4)
Essa matriz contém os dados que servirão de entrada para o lculo das componentes
principais. Em outras palavras, com o cálculo da média global foi obtido um único vetor com
todas as características semelhantes das 28 imagens e quando se subtrai a média global das
imagens originais, preserva-se somente as características individuais de cada imagem, ou seja,
somente as informações relevantes para analisar as variações entre elas.
Depois de calculado a matriz
Z
, calcula-se a matriz de covariância
Σ
, sendo que
Z
Z
T
=
Σ
(FUKUNAGA, 1990), e a dimensão da nova matriz é 902629X902629. Isso ocorre
pois a matriz
T
Z
tem a dimensão de 902629X28 e a matriz
Z
tem como dimensão
28X902629. Então, conforme descrito anteriormente na são 3.2.3 do capítulo 3, depara-se
com o problema de ter um número muito grande de variáveis (902629 voxels) acarretando
uma impossibilidade de memória para calcular a matriz
Σ
. No entanto, podemos calcular a
matriz de covariância da seguinte forma:
T
ZZ
=
Σ
, o que mudaria a dimensão para 28X28
84
que é extremamente menor do que a dimensão anterior e permitiria o cálculo computacional
correspondente (FUKUNAGA, 1990).
Então, tem-se a seguinte equação:
iii
T
ZZ
ϕλϕ
=
,
(4.5)
onde φ
i
são os autovetores e
i
λ
os autovalores correspondentes da matriz
T
ZZ
.
Multiplicando-se a Equação 4.5 por
T
Z
(FUKUNAGA, 1990), tem-se:
(
)
(
)
i
T
ii
TT
ZZZZ
ϕλϕ
=
.
(4.6)
Logo, pode-se dizer que
(
)
i
T
i
Z
ϕφ
=
é o autovetor de
Z
Z
T
=
Σ
com autovalor
i
λ
.
Com isso é formada a matriz W
pca
de transformação do PCA, a qual é composta por um
conjunto φ de autovetores, conforme descrito abaixo (FUKUNAGA, 1990):
[ ]
27902629
27,9026292,9026291,902629
27,22,21,2
27,12,11,1
271
X
pca
W
==
φφφ
φφφ
φφφ
φφ
K
MMMM
K
K
K
.
(4.7)
Conforme mencionado anteriormente, cada autovetor contém uma ou mais
características cerebrais das imagens analisadas, podendo também ser visualizados no espaço
original de imagens. Por meio da Tabela 4.1, pode-se verificar o autovalor correspondente de
cada autovetor e a porcentagem de características existente nos autovetores. Além disso, a
Figura 4.15 ilustra os três primeiros autovetores ou, de forma análoga aos trabalhos de
reconhecimento de faces (KITANI; THOMAZ; GILLIES, 2006b) (KITANI; THOMAZ,
2007), os três primeiros autocérebros. Sendo que o primeiro autocérebro contém 32,05 % de
todas as características dos dois grupos estudados, o segundo contém 4,98% e o terceiro
contém 4,57%.
85
Tabela 4.1 – Tabela com os valores de cada autovalor e seu respectivo autovetor.
Autovetor
Autovalor
Porcentagem
2,9008 32,05%
0,4509 4,98%
0,4134 4,57%
0,3284 3,63%
0,3174 3,51%
0,3087 3,41%
0,2909 3,21%
0,2744 3,03%
0,2591 2,86%
10º 0,2528 2,79%
11º 0,2431 2,69%
12º 0,2392 2,64%
13º 0,2343 2,59%
14º 0,227 2,51%
15º 0,2199 2,43%
16º 0,2121 2,34%
17º 0,2037 2,25%
18º 0,2015 2,23%
19º 0,1889 2,09%
20º 0,1848 2,04%
21º 0,1785 1,97%
22º 0,1724 1,90%
23º 0,1643 1,82%
24º 0,1602 1,77%
25º 0,1549 1,71%
26º 0,1472 1,63%
27º 0,122 1,35%
Total 9,0508 100,00%
86
Primeiro Autocérebro Segundo Autocérebro Terceiro Autocérebro
Figura 4.15 – Ilustração dos três primeiros autovetores.
Após o cálculo da matriz W
pca
, as imagens originais podem ser projetadas em um novo
espaço de dimensão menor. Esse novo espaço é formado pelas componentes principais.
Aplica-se então a transformação PCA em relação a matriz
Z
, ou seja,
87
pcapca
ZWZ =
.
(4.8)
Obtém-se, assim, uma matriz de dimensão 28X27, restando apenas as principais
componentes das amostras. De acordo com Fukunaga (FUKUNAGA, 1990), a quantidade de
autovetores nos casos em que o número de características é maior que o número de amostras é
igual, no máximo, a quantidade de amostras – 1, ou seja, neste caso a quantidade de
autovetores não nulos é 27.
Conforme descrito no capítulo 3, apesar da técnica PCA reduzir a dimensionalidade e
encontrar os autovetores onde existem as maiores variâncias, não é possível separar as
imagens em classes distintas. Então após a utilização do PCA, aplica-se a técnica MLDA
(THOMAZ; GILLIES, 2005b) para maximizar a separação entre os grupos existentes no
estudo. A equação abaixo descreve a aplicação do MLDA, sendo W
mlda
a matriz de
transformação correspondente:
mldapcamlda
WZZ =
(4.9)
Após a projeção das imagens no hiperplano MLDA, pode-se reconstruir as
informações mais discriminantes conforme mostrado pelo modelo estatístico PCA+MLDA,
que está ilustrado na Figura 3.4 na parte de Análise Visual. Na Figura 4.16 visualiza-se os
desvios padrões em torno das médias dos grupos de controles e pacientes, sendo que o ponto
destacado com o triângulo se refere à fronteira de decisão do método multivariado
considerando-se probabilidades a priori e custos de erros de classificação iguais para os dois
grupos. Os círculos são os desvios padrões referentes ao grupo de controles em relação à
média do próprio grupo (Mc), e os quadrados são os desvios referentes ao grupo de pacientes
em relação à média do próprio grupo (Mp). O eixo Y do primeiro gráfico da Figura 4.16
indica o índice das imagens de cada grupo, sendo somente um modo melhor de ilustrar o
espalhamento, pois todas as imagens estão projetadas em uma única base do eixo X, que seria
equivalente ao ponto 0 do eixo Y. no segundo gráfico da Figura 4.16 ilustra-se o
espalhamento dos dois grupos em forma de distribuições gaussianas.
88
Então teremos:
Índice das imagens
Figura 4.16 - Gráfico da classificação das imagens em dois grupos, controles e pacientes. O triângulo destaca a
fronteira de decisão, os círculos são os desvios do grupo de controle e os quadrados os do grupo de paciente.
De acordo com o processo de análise multivariada descrito na Figura 3.4 do capítulo
anterior, para a reconstrução destes pontos multidimensionais do espaço discriminante em
imagem no espaço original, deve-se multiplicar um ponto particular Y no espaço mais
discriminante pela matriz transposta do MLDA, ou seja,
T
mldaA
YWZ = ,
(4.10)
o ponto Y é referente a um ponto existente na base vetorial encontrada no Z
mlda
, conforme
ilustrado anteriormente na Figura 3.4.
Base vetorial
PCA+MLDA
89
Com isso, obtém-se Z
A
, que é o vetor que contém as informações mais expressivas do
ponto escolhido para ser reconstruído. Após isso, multiplica-se Z
A
pela matriz transposta do
PCA, conforme a equação abaixo:
T
pcaAB
WZZ = .
(4.11)
O vetor Z
B
é formado pelas características mais discriminantes da imagem que está
sendo reconstruída. Então, para finalizar, soma-se a média global das imagens para
reconstrução da imagem. A Equação 4.12 ilustra este processo,
hZZ
BC
+=
,
(4.12)
onde Z
C
é a imagem reconstruída. Este foi o procedimento adotado para reconstruir as
imagens cerebrais utilizadas neste trabalho. É importante mencionar que foram reconstruídas
13 imagens no total, sendo uma para cada ponto destacado no primeiro gráfico da Figura 4.16.
4.3 Comentários Adicionais
Por meio dos procedimentos descritos neste capítulo, verificou-se que nos
experimentos da análise univariada existem os procedimentos de segmentação, suavização e
modulação. Estes procedimentos não são empregados nos experimentos da análise
multivariada que, por sua vez, realiza além da normalização, somente a retirada do crânio de
todas as imagens. Essa diferença de pré-processamento das imagens acontece inicialmente
porque a análise univariada analisa cada substância e voxel separadamente, e por causa dessa
divisão faz-se necessária a suavização das bordas para melhorar a análise que compara a
intensidade de cada voxel para encontrar as diferenças entre os grupos. a análise
multivariada é realizada de forma global, então não existe a necessidade do pré-
processamento para tratar cada substância cerebral separadamente para análise.
90
Com relação a questão computacional, a análise multivariada exige mais memória do
computador enquanto a análise univariada consome mais tempo de processamento. Essa
diferença computacional ocorre porque na análise univariada cada voxel é comparado
separadamente, exigindo mais tempo e menos memória, enquanto na análise multivariada
analisa-se o cérebro inteiro, ou seja, todos os voxels simultaneamente, exigindo mais
memória, porém menos tempo. A diferença destacada acima ilustra-se na Tabela 4.2, onde
verifica-se que na análise univariada o tempo de processamento foi de aproximadamente 7
horas e 58 minutos e 42 segundos, sendo que foram realizados nesse tempo a fase de criação
dos templates, o pré-processamento das imagens e a análise estatística. Na análise
multivariada o tempo total para a realização da análise com um pré-processamento
equivalente foi de aproximadamente 2 horas 46 minutos e 25 segundos, onde neste tempo
realizou-se a criação do template, a normalização, extração do crânio e a análise estatística.
Cabe salientar que ambas análises foram realizadas no mesmo computador, um Dell Precision
PWS 390 64 bits, com processador Intel Duo Core 1.86GHz, com 2 GB de memória Ram e
148 GB de Disco rígido; tendo como sistema operacional o Windows XP Professional com
Service Pack 2.
No próximo capítulo serão apresentados os resultados dos experimentos deste
trabalho, bem como a comparação entre os resultados obtidos pelas análises univariada e
multivariada.
91
Tabela 4.2 – Tabela com os tempos das análises univariada e multivariada, e a comparação dos mesmos.
Análise Univariada Análise Multivariada
Criação do Template Criação do Template
Normalização 19 min e 20 seg Normalização 19 min e 20 seg
Segmentação 1h 46 min e 30 seg Segmentação 1h 46 min e 30 seg
Suavização 11 min e 20 seg Suavização 11 min e 20 seg
Média 3 min Média 3 min
Somatório 1 min - -
Suavização 30 seg - -
Sub-TOTAL
2 h 21 min 40 seg
Sub-TOTAL
2 h 20 min 10 seg
Pré-Processamento Pré-Processamento
Normalização 19 min e 20 seg Normalização 19 min e 20 seg
Segmentação 1h 46 min e 30 seg Retirada do crânio 6 min
Cálculo dos Parâmetros 58 min - -
Normalização 18 min 30 seg - -
Segmentação 1h 35 min 42 seg - -
Modulação 16 min 12 seg - -
Suavização 2 min 48 seg - -
Sub-TOTAL
5 h 17 min 2 seg
Sub-TOTAL
25 min 20 seg
Análise Estatística Univariada Análise Estatística Multivariada
Análise Estatística 20 min Análise Estatística 55 seg
Sub-TOTAL
20 min
Sub-TOTAL
55 seg
TOTAL
7 h 58 min 42 seg
TOTAL
2h 46 min 25 seg
92
5 RESULTADOS
Neste capítulo serão apresentados e comparados os resultados obtidos nos
experimentos realizados com as análises univariada e multivariada. As imagens
tridimensionais que ilustram esses resultados são apresentadas nos três cortes cerebrais
padrões adotados nos capítulos anteriores, ou seja, cortes sagital, coronal e transaxial.
5.1 Análise Univariada
Após o pré-processamento das imagens originais descrito na seção anterior, foram
gerados os resultados estatísticos das diferenças entre os grupos para cada segmento. Obteve-
se esses resultados utilizando-se três diferentes níveis de significância: p=0,05; p=0,01 e
p=0,001. Assim, pode-se avaliar a diferença entre os níveis de significância e qual será o
valor de p mais apropriado para o estudo em questão.
Nos resultados que serão apresentados, referentes às substâncias cinzenta e branca,
serão visualizadas as diferenças em algumas regiões do cérebro nas quais houve redução no
paciente em relação ao controle, e na análise do LCR serão visualizados os locais onde os
sulcos que contém o LCR aumentaram nos pacientes em relação aos cérebros de controle.
Inicialmente, ilustra-se na Figura 5.1 os resultados obtidos das análises estatísticas
realizadas no segmento de substância cinzenta para os três valores distintos de p. Pode-se
visualizar que quanto menor o valor de p, menos diferenças são encontradas entre os grupos.
As principais diferenças estatísticas entre os grupos são apresentadas no giro fusiforme (lobo
temporal), indicado nas regiões 3 e 8; giro temporal superior, apontado na região 2; cerebelo
que é mostrado na região 3; amígdala, indicado na região 1, e giro para-hipocampal apontado
na região 4. Estas regiões são responsáveis pelas seguintes funções cerebrais humanas:
compreensão da linguagem, memória, emoção e equilíbrio.
De forma análoga, a Figura 5.2 ilustra os resultados obtidos nas análises estatísticas da
substância branca. Pode-se observar que, neste caso, as principais diferenças entre os grupos
se encontram nas regiões do giro para-hipocampal, mostrado nas regiões 9 e 10; corpo caloso
que é ilustrado na região 5; sulco central que está marcado pelo ponto 6, lobo frontal e
occipital que estão destacados na região 7. Essas áreas coordenam as seguintes funções
cerebrais: memória e emoção que se localizam acima do corpo caloso, visão e coordenação
motora. Nestes resultados percebe-se ainda que houve uma grande diminuição das áreas que
representam a memória e a emoção, principais funções sintomáticas da doença de Alzheimer.
93
Por fim, os resultados das análises feitas com o LCR entre os grupos de pacientes e
controles estão ilustrados na Figura 5.3. Assim como nas análises realizadas anteriormente,
verifica-se que o valor de p influencia os resultados de tal forma que quanto maior esse valor
mais regiões são identificadas com diferenças entre os grupos estudados, porém com um nível
de incerteza estatística maior. De acordo com a Figura 5.3, observa-se que as principais
diferenças se encontram nas regiões do giro do ngulo que é mostrado na região 11;
fasciculus longitudinalis inferior (lobos occipital e temporal, ventrículo lateral), indicado na
região 13 e giro fusiforme (lobo temporal), o qual é apontado na região 12. Tais regiões
respondem pelas funções de memória, emoção, visão e sincronização motora. Conforme
discutido no capítulo anterior, tais funções são consistentemente afetadas pela desordem
cerebral de Alzheimer.
94
Corte Sagital Corte Coronal Corte Transaxial
Substância Cinzenta com p = 0,05
Substância Cinzenta com p = 0,01
Substância Cinzenta com p = 0,001
Figura 5.1 – Análise da substância cinzenta.
Mais
Significante
Menos
Significante
1
1
2
2
1
1
1
1
2
2
3
3
3
3
3
3
4
4
4
4
4
4
8
8
8
8
95
Corte Sagital Corte Coronal Corte Transaxial
Substância Branca com p = 0,05
Substância Branca com p = 0,01
Substância Branca com p = 0,001
Figura 5.2 – Análises da substância branca.
Mais
Significante
Menos
Significante
5
5
6
6
6
6
6
7
7
7
7
7
9
9
10
7
7
10
96
Corte Sagital Corte Coronal Corte Transaxial
LCR com p = 0,05
LCR com p = 0,01
LCR com p = 0,001
Figura 5.3 – Análises do LCR.
Mais
Significante
Menos
Significante
11
11
11
12
12
13
13
13
11
11
11
13
13
13
13
13
13
11 11
11
97
5.2 Análise Multivariada
A análise multivariada vai além da detecção das diferenças cerebrais existentes entre
os cérebros dos grupos em questão. Esta análise também separa as imagens nos grupos
correspondentes. Neste trabalho essa separação é feita entre os grupos de controles e
pacientes.
Na Figura 5.4 pode-se visualizar novamente, conforme mostrado no capítulo anterior,
a separação realizada entre os grupos. Ilustra-se o grupo de controle pelos círculos e o grupo
de paciente pelas cruzes. Cada grupo é composto de 14 imagens cerebrais, as mesmas
utilizadas na análise univariada. A fronteira de decisão entre os grupos está delimitada pela
linha de separação caracterizada pelo ponto 0 no gráfico. Além disso, a Figura 5.4 apresenta a
estimativa da distribuição gaussiana de cada grupo.
Por meio dessa figura, verifica-se que imagens de controles e pacientes que estão
mais nas extremidades e outras próximas a linha divisória. Além da separação dos grupos,
esse gráfico pode auxiliar o procedimento de diagnóstico realizado por um especialista na área
médica. Por exemplo, a terceira imagem de controle é a que mais se aproxima (dentro do
grupo de controle) da linha divisória entre controles e pacientes. Assim, segundo este modelo
estatístico, o dico poderia conceder uma maior atenção a essa pessoa, e quem sabe até se
antecipar às manifestações de uma possível doença de Alzheimer.
As imagens que estão mais nas extremidades e as mais próximas da linha divisória
estão ilustradas nas Figuras 5.5 e 5.7 respectivamente. A Figura 5.5 ilustra as imagens que
estão nas extremidades, sendo uma do grupo de controle e outra do grupo de paciente, sendo
que a Figura 5.5A é a quinta imagem cerebral classificada no grupo controle, e a Figura 5.5B
ilustra a décima quarta imagem classificada no grupo paciente. Essas mesmas imagens
cerebrais podem ser visualizadas nos três cortes em uma comparação na Figura 5.6. Esta
figura mostra a comparação ilustrando o cérebro do controle na metade cerebral esquerda e o
cérebro do paciente na metade cerebral direita.
a Figura 5.7A ilustra a terceira imagem cerebral classificada no grupo controle, e a
Figura 5.7B ilustra a quarta imagem classificada no grupo paciente. Essas imagens são as
imagens que estão mais próximas do limiar que divide os grupos de acordo com o modelo
multivariado investigado. Nesta figura verifica-se que a imagem do paciente tem os
ventrículos pequenos, sendo menores do que os ventrículos da imagem do controle, isso
98
ocorre porque cada indivíduo tem uma estrutura cerebral diferente, e a análise busca
classificar e separar as imagens de acordo com as mudanças ocorridas por causa da doença, e
não por particularidades estruturais do cérebro de cada indivíduo. Também vale salientar que
por causa disso é importante realizar a análise estatística das imagens com um conjunto de
amostras, e não somente com uma amostra de cada grupo.
Figura 5.4 Gráfico da classificação das imagens em dois grupos, controles e pacientes, e a distribuição gaussiana
desta classificação ocorrida.
Autovetor
PCA+MLDA
99
Controle Paciente
A B
Figura 5.5 As ilustrações acima são as imagens de controle e paciente que estão nas extremidades. Sendo
que a imagem A é a quinta imagem do grupo de controles relacionada na Figura 5.4. a imagem B é a
décima quarta imagem do grupo de pacientes também ilustrada na Figura 5.4.
100
Figura 5.6 - Comparação entre o cérebro do controle e do paciente. O cérebro ilustrado está dividido ao meio,
sendo que a metade da esquerda ilustra o cérebro do controle e a metade da direita ilustra o cérebro do paciente.
101
Controle Paciente
A B
Figura 5.7 As figuras A e B são as imagens de controle e paciente que estão mais próximas da fronteira de
decisão, ou seja, que estão próximas a linha que separa os dois grupos. A figura de controle está representada
pela imagem A, a qual é a terceira imagem do grupo de controles ilustrado na Figura 5.4. A figura B ilustra
uma imagem do grupo de pacientes, e essa imagem é a quarta imagem do grupo, a qual foi ilustrada também
na Figura 5.4.
102
Os resultados da análise multivariada revelaram diferenças nos ventrículos,
hipotálamo, hipocampo entre outros. Essas diferenças serão discutidas com mais detalhes a
seguir. As imagens de controles ilustradas a seguir são referentes ao ponto de 3 desvios a
esquerda da média do grupo de controles, e as imagens de pacientes que serão ilustradas estão
localizadas três desvios a direita da média do grupo de pacientes. Ou seja, no gráfico ilustrado
na Figura 5.8, pode-se visualizar a marcação indicada pelos triângulos que se referem a média
de cada grupo. Os pontos de reprodução das imagens estão demarcados pelo círculo no grupo
de controles, e em relação ao grupo de pacientes pelo quadrado. Estas demarcações ilustram a
localização de três desvios em relação a média de cada grupo, e representam estatisticamente
as características mais discriminantes entre os grupos de controles e pacientes capturados pelo
modelo multivariado.
Figura 5.8 – Gráfico da classificação das imagens em dois grupos, controles e pacientes.
Por meio dos cortes coronal e transaxial verifica-se com mais clareza as alterações
sofridas no ventrículo. As ilustrações das Figuras 5.9 e 5.10, mostram pela marcação da letra
A, as diferenças ventriculares entre controles e pacientes, que foram encontradas pela análise
multivariada. Na Figura 5.10 foram utilizadas as linhas denominadas linhas de contorno, ou
também conhecidas como isolines
1
, para delimitar as áreas estudadas em questão, e com a
ajuda dessa delimitação é possível verificar o alargamento ventricular nos pacientes, indicado
pela letra A.
1
Isoline é a linha de contorno da imagem. Para que possa ser traçada, é utilizada a variação da
coloração de cinza.
Autovetor
PCA+MLDA
103
Ventrículo e Hipotálamo
Controle
Paciente
Figura 5.9 – Imagens do corte coronal, ilustram as diferenças encontradas na região do ventrículo e do
hipotálamo, entre as imagens que representam o grupo de controles e o grupo de pacientes. Sendo que o
ventrículo está destacado com a letra A, e o hipotálamo com a letra B.
Ventrículo e Hipotálamo
Controle
Paciente
Figura 5.10 Imagens do corte coronal, utilizando as linhas de contorno para ilustrar as diferenças encontradas na
região do ventrículo e do hipotálamo, entre as imagens que representam o grupo de controles e o grupo de pacientes.
Sendo que o ventrículo está destacado com a letra A, e o hipotálamo com a letra B.
A
A
B
B
A
A
B
B
A
A
B
B
A
A
B
B
104
As imagens das Figuras 5.9 e 5.10 também evidenciam as alterações ocorridas no
hipotálamo. Essas alterações estão demarcadas com a letra B. Essa região também é afetada
pela doença de Alzheimer, alterando o sono, o sistema endócrino, a emoção, etc.
Além do corte coronal ilustrado nas figuras anteriores, também é possível visualizar as
diferenças encontradas nos ventrículos por meio do corte transaxial, representados nas Figuras
5.11 e 5.12. Na Figura 5.11 verifica-se as diferenças entre os dois grupos estudados, com
relação ao ventrículo, onde no grupo de pacientes uma expansão do mesmo. na Figura
5.12 também ilustra-se uma expansão ventricular do paciente em relação ao controle, que
utilizando-se as linhas de contorno.
Outra região importante de se analisar para a doença em questão é o hipocampo. Esta
estrutura cerebral é uma das responsáveis pela memória e comumente atingida pela doença.
Para ilustrar as diferenças encontradas no hipocampo, foi analisado o corte coronal ilustrado
em dois conjuntos, sendo que o primeiro o contém linhas de contorno, e o segundo é
delimitado pelas mesmas. Na Figura 5.13 é possível verificar uma mudança de tonalidade de
cor, sendo que no grupo de paciente esta área fica mais escura, indicando uma deterioração da
mesma, e também apresenta uma redução do hipocampo. Essa diminuição do hipocampo nos
pacientes é melhor visualizada na Figura 5.14 com a utilização das linhas de contorno. O
hipocampo é uma das primeiras regiões a serem afetadas pela doença de Alzheimer, fazendo
com que as pessoas portadoras dessa doença passem a não reter as memórias recentes.
105
Ventrículo
Controle Paciente
Figura 5.11 Imagens do corte transaxial, ilustram as diferenças encontradas na região do ventrículo, entre as
imagens que representam o grupo de controles e o grupo de pacientes.
Ventrículo
Controle Paciente
Figura 5.12 Imagens do corte transaxial, utilizando as isolines para ilustrar as diferenças encontradas na região
do ventrículo, entre as imagens que representam o grupo de controles e o grupo de pacientes.
106
Hipocampo
Controle
Paciente
Figura 5.13 Imagens do corte coronal, ilustram as diferenças encontradas na região do hipocampo, entre as
imagens que representam o grupo de controles e o grupo de pacientes.
Hipocampo
Controle
Paciente
Figura 5.14 – Imagens do corte coronal, utilizando as isolines para ilustrar as diferenças encontradas na região do
hipocampo, entre as imagens que representam o grupo de controles e o grupo de pacientes.
107
Outra estrutura que foi identificada com diferenças entre os pacientes e os controles,
foi o corpo caloso. Para ilustrar essas diferenças foi utilizado o corte sagital sem e com as
linhas de contorno. A Figura 5.15 elucida a diminuição encontrada pela análise multivariada
na região do corpo caloso, as regiões marcadas com um círculo representam as alterações
mais significativas. na Figura 5.16, utilizou-se as linhas de contorno, onde ilustra-se o
estreitamento do corpo caloso nos pacientes, além da redução do mesmo. E, logo acima do
corpo caloso, está localizado o giro do cíngulo, que é ilustrado na Figura 5.17. Pode-se
visualizar por meio dessa imagem as diferenças de redução encontradas nesta região que está
relacionada à memória.
Outras características que pacientes portadores da doença de Alzheimer apresentam é a
diminuição do córtex e o alargamento dos sulcos. Nas imagens das Figuras 5.18 e 5.19 ilustra-
se a expansão de um dos sulcos existentes no cérebro humano, que é a fissura longitudinal.
Por meio das duas figuras consegue-se visualizar um alargamento na fissura da imagem
relacionada aos pacientes em comparação aos controles.
Além das diferenças apresentadas, também verificou-se a deterioração do córtex
cerebral no grupo de pacientes. As ilustrações das Figuras 5.20 e 5.21 apresentam essas
diferenças em dois tipos de cortes, coronal e transaxial. O corte coronal está representado na
Figura 5.20, e o transaxial na Figura 5.21. As áreas destacadas na Figura 5.20 estão mais
escuras nas imagens do grupo dos pacientes; isso ocorre pois existe a deterioração comentada
anteriormente. na Figura 5.21, temos três indicadores, sendo que o círculo indica a
deterioração do córtex cerebral, o quadrado indica o alargamento do ventrículo e o triângulo
mostra também o alargamento da fissura longitudinal na imagem do grupo dos pacientes.
108
Corpo Caloso
Controle
Paciente
Figura 5.15 Imagens do corte sagital, ilustram as diferenças encontradas na região do corpo caloso, entre as
imagens que representam o grupo de controles e o grupo de pacientes.
Corpo Caloso
Controle
Paciente
Figura 5.16 Imagens do corte sagital, utilizando as isolines para ilustrar as diferenças encontradas na região do
corpo caloso, entre as imagens que representam o grupo de controles e o grupo de pacientes.
109
Giro do cíngulo
Controle
Paciente
Figura 5.17 Imagens do corte sagital, utilizando as isolines para ilustrar as diferenças encontradas na região do
giro do cíngulo, entre as imagens que representam o grupo de controles e o grupo de pacientes.
110
Fissura
Controle
Paciente
Figura 5.18 Imagens do corte coronal, ilustram as diferenças encontradas na fissura longitudinal, entre as
imagens que representam o grupo de controles e o grupo de pacientes.
Fissura
Controle
Paciente
Figura 5.19 Imagens do corte coronal, utilizando as isolines para ilustrar as diferenças encontradas na fissura
longitudinal, entre as imagens que representam o grupo de controles e o grupo de pacientes.
111
Figura 5.20 Imagens do corte coronal, sendo duas delas sem a utilização das isolines, e duas com isolines.
Essas imagens ilustram as diferenças encontradas no córtex cerebral, entre as imagens que representam o grupo
de controles e o grupo de pacientes.
Córtex Cerebral
Controle Paciente
Figura 5.21 – Imagens do corte transaxial, utilizando as isolines para ilustrar as diferenças encontradas no córtex
cerebral, entre as imagens que representam o grupo de controles e o grupo de pacientes.
Córtex Cerebral
Controle Paciente
112
5.3 Comparações dos Resultados
Nesta seção serão discutidas as diferenças entre os resultados obtidos pelos dois tipos
de análises estatísticas investigadas.
Inicialmente, uma das principais diferenças entre as duas análises se refere ao tipo de
informação que se obtém como resultado. Em outras palavras, a utilização da análise
univariada indica diferenças locais encontradas entres os grupos analisados, e para visualizar
essas diferenças encontradas nas substâncias cinzentas, branca e LCR, precisa-se analisá-las
separadamente. Além disso, por meio do SPM é necessário verificar, de forma diferenciada,
se houve uma expansão ou redução cerebral entre os grupos. Por exemplo, deve-se realizar
duas análises estatísticas, ou seja, uma para visualizar as reduções que ocorrem nos cérebros
dos pacientes em relação aos controles, e outra para verificar as expansões existentes na
mesma relação.
a análise multivariada possibilita uma visão geral das mudanças do cérebro, onde
pode-se verificar – por meio da navegação no hiperplano controle-paciente – as mudanças que
ocorrem no cérebro inteiro ao mesmo tempo, não precisando analisar as substâncias
isoladamente. Também consegue-se verificar se ocorreu uma expansão ou redução no
cérebro, pois a análise demonstra as diferenças encontradas, independentemente se analisou-
se controles / pacientes ou pacientes / controles.
Outra diferença na utilização das análises é o custo computacional, pois com a análise
multivariada é necessário mais recursos de memória, pois são analisados todos os voxels da
imagem ao mesmo tempo. Porém, conforme mencionado no capítulo anterior, o tempo para a
análise estatística multivariada é menor. a análise univariada demanda um poder
computacional menor, que o tempo de processamento é superior ao da análise
multivariada. A variação do tempo se deve não somente ao equipamento utilizado, mas
também ao procedimento inerente a cada análise. Conforme ilustrado no capítulo 4,
apresenta-se novamente aqui para consolidação dos resultados, os gráficos ilustrados nas
Figuras 5.22, 5.23, 5.24 e 5.25, que comparam o tempo computacional requerido na fase de
criação das imagens de referência, no pré-processamento, e na análise estatística e o tempo
total respectivamente. Verifica-se então que quando comparamos as duas análises, tem-se que
o tempo gasto para a análise univariada é 74,20% do tempo total, enquanto a análise
113
multivariada equivale a 25,80% do tempo total. Pode-se dizer então, que a análise univariada
tem o tempo computacional aproximadamente 3 vezes maior que a análise multivariada.
Comparação do tempo computacional na criação das
imagens de referência entre os dois experimentos
realizados.
2h 21min
40seg
50,27%
2h 20min
10seg
49,73%
Análise Univariada Análise Multivariada
Figura 5.22 – Gráfico de comparação de tempo computacional da fase de criação das imagens de referência entre
os experimentos realizados.
Comparação do tempo computacional no pré-
processamento entre os dois experimentos
realizados.
25min 20seg
7,40%
5h 17min 02seg
92,60%
Análise Univariada Análise Multivariada
Figura 5.23 Gráfico de comparação de tempo computacional do pré-processamento das duas análises
estudadas.
114
Comparação do tempo computacional na análise
estatística realizada entre os dois métodos estudados.
55seg
4,38%
20min
95,62%
Análise Univariada Alise Multivariada
Figura 5.24 – Gráfico de comparação de tempo computacional da análise estatística univariada e multivariada.
Comparação de tempo computacional total entre
as alises estasticas.
2h 46min
25seg
25,80%
7h 58min
42seg
74,20%
Análise Univariada Análise Multivariada
Figura 5.25 Gráfico de comparação de tempo computacional total entre as análises estatísticas utilizadas neste
trabalho.
115
A análise multivariada também difere da univariada quanto à classificação. Com a
utilização da análise multivariada, além de se poder verificar as diferenças entre os grupos,
pode-se também obter a classificação das imagens nos grupos existentes, conforme
mencionado nos capítulos anteriores. Essa é uma característica que pode auxiliar o
procedimento de diagnóstico dos médicos.
Em relação às áreas que foram encontradas diferenças cerebrais entre os grupos de
controles e pacientes, a Tabela 5.1 apresenta, de forma resumida, algumas das áreas mais
relevantes onde foram detectadas diferenças cerebrais entre os grupos estudados. Essa tabela
também mostra uma comparação entre as análises univariadas e multivariadas, referente à
ocorrência de expansão ou redução nos cérebros dos pacientes. As análises univariadas usadas
nas comparações a seguir utilizam como referência um nível de significância p= 0,05, e as
diferenças que foram encontradas na análise multivariada foram através de análise visual por
meio de navegação dinâmica na base vetorial PCA+MLDA.
Tabela 5.1 – Tabela de comparações entre as análises estatísticas univariada e multivariada.
Local Análise Univariada Análise Multivariada
Amígdala Redução Redução
Hipotálamo - Redução
Hipocampo Redução Redução
Córtex cerebral Redução Redução
Corpo caloso Redução Redução
Ventrículos - Expansão
Giro temporal superior Redução -
Fissura Longitudinal Expansão Expansão
Expansão no LCR Giro do cíngulo
Redução
Redução
Expansão no LCR Giro fisuforme
Redução
-
As figuras a seguir ilustram alguns resultados das duas análises apresentadas na Tabela
5.1. Essas imagens possibilitam a verificação de algumas diferenças entre as duas análises.
Nos resultados da análise univariada, verifica-se que as diferenças cerebrais encontradas o
indicadas por colorações que estão relacionadas ao nível de certeza estatística, porém não é
116
possível visualizar o que acontece no rebro, ou seja, sabemos mediante informação que as
áreas marcadas pelo SPM são expansão ou redução, mas o é possível visualizar essas
alterações no cérebro. no resultado da análise multivariada, não se tem a marcação de qual
local houve alteração entre os grupos, mas é possível visualizar a expansão ou redução das
áreas que sofreram modificações com a doença de Alzheimer.
Por exemplo, nas imagens a seguir, tem-se os resultados indicando alterações nas
regiões do hipocampo, córtex cerebral, corpo caloso, fissura longitudinal e giro do cíngulo.
Mas, visualmente, o é possível saber se foi uma expansão ou redução quando é utilizada a
análise univariada, temos essa informação fornecida pela pessoa que realizou a análise.
Embora essas marcações o apareçam nos resultados da análise multivariada, pode-se
comparar uma imagem que a análise trata como modelo estatístico da controle com a de
paciente e verificar quais diferenças foram encontradas entre os grupos em questão, assim
podendo visualizar e identificar as expansões e reduções cerebrais.
Outra diferença é que na análise multivariada visualiza-se na mesma imagem as
ocorrências de expansão e redução em áreas cerebrais distintas, e na análise univariada tem
que ser realizado duas análises diferentes, uma para verificar expansão e outra para verificar
redução. Um exemplo dessa vantagem da análise multivariada está ilustrado na Figura 5.26,
onde verifica-se a redução do hipocampo, porém nos resultados da análise multivariada
também consegue-se visualizar a expansão do ventrículo na mesma imagem. As imagens a
seguir são as que foram utilizadas na ilustração dos resultados de cada análise, porém estão
sendo utilizadas novamente para comparações entre os resultados das duas análises. As
imagens das Figuras 5.27, 5.28, 5.29 e 5.30, ilustram os resultados encontrados entre as
análises univariadas e multivariadas nas seguintes áreas: córtex cerebral, corpo caloso, fissura
longitudinal e giro do ngulo, respectivamente. Nessas imagens podem ser visualizadas as
diferenças citadas acima entre as duas análises.
Conforme as comparações da Tabela 5.1, tem-se que o giro do cíngulo, ilustrado na
Figura 5.30, e o giro fusiforme tiveram expansão e redução encontradas pela análise
univariada. No caso do giro do cíngulo, verificou-se que houve somente uma redução quando
analisado pelo modelo multivariado. Essa diferença ocorreu pois o giro do cíngulo teve
alterações encontradas quando foi analisado a substância branca e o LCR pelo SPM, sendo
assim na substância branca verifica-se que houve uma redução da região, porém no LCR
sucedeu-se uma expansão do sulco cerebral na mesma área. Já na análise multivariada ocorreu
a redução da substância branca, sendo mais difícil a identificação da expansão do sulco em
determinados locais. Nas diferenças encontras no giro fusiforme pela análise univariada,
117
também obteve-se expano e redução, sendo que a explicação é similar a anterior, que a
redução acontece na substância cinza e a expansão no LCR, pois de acordo com o
funcionamento cerebral, quando uma redução de alguma substância, branca ou cinzenta, o
liquor se expande ocupando a área que houve redução.
Hipocampo
Univariada
Multivariada - Controle
Multivariada - Paciente
Figura 5.26 – Imagens dos resultados da análise univariada e multivariada, ilustrando a estrutura do hipocampo.
118
Córtex Cerebral
Univariada
Multivariada – Controle
Multivariada - Paciente
Figura 5.27 Imagens dos resultados da análise univariada e multivariada, ilustrando algumas alterações
encontradas no córtex cerebral.
119
Corpo Caloso
Univariada
Multivariada - Controle
Multivariada - Paciente
Figura 5.28 Imagens dos resultados da análise univariada e multivariada, ilustrando a estrutura do corpo
caloso.
120
Fissura Longitudinal
Univariada
Multivariada - Controle
Multivariada - Paciente
Figura 5.29 – Imagens dos resultados da análise univariada e multivariada, ilustrando a fissura longitudinal.
121
Giro do cíngulo
Univariada
Redução
Expansão
Multivariada - Controle
Multivariada - Paciente
Figura 5.30 – Imagens dos resultados da análise univariada e multivariada, ilustrando o giro do cíngulo.
122
5.4 Comentários Adicionais
Neste capítulo foram apresentados um conjunto de resultados utilizando-se o modelo
estatístico SPM (FRISTON et al., 1995) (WORSLEY, 1999) e o modelo PCA+MLDA para
identificar diferenças relevantes entre as imagens RM de pacientes com Alzheimer e
controles.
Os resultados apresentados evidenciam a potencialidade de ambos os métodos em
identificar as diferenças estatisticamente significantes e plausíveis com os sintomas
conhecidos da desordem cerebral em questão. No entanto, como as diferenças detectadas pelo
método SPM são caracterizadas por comparações voxel a voxel, as mesmas são localizadas
impedindo uma análise entre as regiões cerebrais que evidenciam diferenças globais das
amostras. a análise multivariada realizada pelo modelo PCA+MLDA possibilita a
verificação das modificações cerebrais de forma global, mostrando as alterações que ocorrem
nas estruturas correlacionadas e permitindo encontrar novas áreas de alterações cerebrais.
Além dos resultados, neste capítulo também foi discutido uma comparação entre as
duas análises, sendo possível verificar as vantagens e limitações de cada método estatístico
para o estudo em questão. Esta comparação também possibilitou verificar que um trabalho em
conjunto dessas duas análises pode trazer benefício ao diagnóstico, pois obteve-se alguns
resultados diferenciados, trazendo uma análise mais completa das possíveis diferenças
cerebrais entre os grupos estudados.
123
6 CONCLUSÕES E TRABALHOS FUTUROS
Neste trabalhou investigou-se duas técnicas de análise estatística, univariada e
multivariada. Analisou-se imagens cerebrais de dois grupos, pacientes com a doença de
Alzheimer e controles, extraindo por meio de cada análise estatística as diferenças cerebrais
existentes entre os dois grupos analisados. Então comparou-se os procedimentos e resultados
obtidos em ambas as análises estatísticas.
Na análise univariada estudou-se o pacote SPM2, que engloba o modelo linear geral e
os testes de significância, sendo que utilizou-se o teste t, com a hipótese nula e o nível de
significância p. Com isso, demonstrou-se que a análise univariada testa individualmente cada
voxel para encontrar as diferenças existentes entre as dias desse voxel nos dois grupos
analisados; então pode-se dizer que as diferenças encontradas são localizadas. Embora os
resultados obtidos com a análise univariada tenham sido muito bons, ou seja, foram
encontradas áreas cerebrais estatisticamente relevantes para o estudo em questão, este método
tem algumas limitações como, por exemplo: caso o especialista que analisou as imagens por
este método não indique se na região encontrada houve uma redução ou uma expansão
cerebral de um grupo em relação ao outro, o médico especialista não saberá o que exatamente
foi encontrado. A fim de ilustrar esse exemplo, na Figura 6.1 pode-se observar que existem
diferenças apontadas próximas ao corpo caloso. Caso essa fosse a única informação passada
ao leitor, não se saberia se houve uma redução ou expansão nessa região cerebral no grupo de
pacientes em relação aos controles. Nesse caso houve uma redução das regiões afetadas no
cérebro dos pacientes em relação aos rebros dos controles. Aproveitando essa imagem,
pode-se informar que embora se saiba o que ocorreu na região afetada, ainda não pode-se
saber se as regiões vizinhas também sofreram alterações ou não, isso acontece pois na análise
univariada as substâncias são analisadas separadamente.
124
Massa Branca / Corte Sagital
p = 0,05 p = 0,01
Figura 6.1 – Análises da substância branca.
Conforme mencionado, a outra análise estudada neste trabalho foi a análise estatística
multivariada, onde descreveu-se o PCA, o LDA e o MLDA. Observou-se que o PCA é uma
técnica que encontra o vetor de máxima variância, onde os autovalores o ordenados em
ordem decrescente. Além de encontrar a máxima variância, destaca-se que o PCA executa a
redução de dimensionalidade da matriz de imagens trabalhadas. Ainda na análise multivariada
verificou-se o método LDA, que foi desenvolvido para encontrar a melhor base vetorial que
separa as imagens entre os grupos analisados. Porém este método sofre de instabilidade
quando a quantidade de amostras analisadas é menor do que o número de características de
cada amostra. Então, para resolver este problema, trabalhou-se com o método MLDA, pois
este resolve com eficiência o problema de instabilidade enfrentado pelo LDA.
Por meio da utilização do MLDA, verificou-se que esta técnica não separa somente as
imagens entre os grupos estudados, mas também permite a extração de informação
discriminante entre os grupos de imagens. Com isso, pode-se obter importantes informações
sobre as mudanças cerebrais que ocorrem entre as amostras de controles e de pacientes.
Observou-se também que além de separar as imagens, foram reconstruídas 13 imagens que
serviram para navegar no hiperplano MLDA e visualizar as diferenças entre os grupos.
125
Lembrando que as 13 imagens reconstruídas não faziam parte das imagens utilizadas para
análise, então salienta-se aqui a importância de se poder reconstruir imagens que não faziam
parte do banco de imagens do estudo, com características estatísticas discriminantes de acordo
com o ponto escolhido no vetor de separação entre os grupos.
Destaca-se também que a abordagem multivariada estudada analisa o cérebro como
um todo, ou seja, todos os voxels simultaneamente, sendo esta a principal diferença em
relação a análise univariada. Outra diferença importante é que a análise multivariada resolve
as limitações vivenciadas nos experimentos realizados com a análise univariada, ou seja,
visualiza-se dinamicamente se ocorreu uma redução ou expansão em determinada área
cerebral entre os grupos analisados, não necessitando que essa informação seja dada pelo
especialista que realizou a análise. Assim como também pode-se visualizar se as áreas
vizinhas àquela afetada sofreram alterações ou não. Porém, a análise multivariada baseada nas
intensidades dos voxels também tem uma limitação, pois nesta não existe a marcação dos
pontos onde encontra-se diferenças como ocorre na análise univariada. Dessa maneira as
diferenças encontradas na análise multivariada foram mediantes a análise visual por meio da
navegação da base vetorial PCA+MLDA.
Verificou-se ainda uma outra diferença entre as análises estudadas neste trabalho, que
foi o tempo gasto e os recursos computacionais necessários para executar os experimentos e
gerar os resultados. Na questão recurso computacional, a análise univariada exige muito
menos recursos de memória do que a análise multivariada, e está por sua vez leva menos
tempo para realizar todo o processamento das imagens do que a análise univariada.
Então, conforme pode-se observar ambas as técnicas de análise têm limitações e
vantagens, portanto um trabalho em conjunto dessas análises seria a melhor maneira de extrair
o máximo de informações relevantes, pois as duas análises encontraram áreas em comum e
diferentes que foram extremamente relevantes, ou seja, áreas onde realmente ocorrem
alterações cerebrais causadas pela doença de Alzheimer. Essas áreas são o hipocampo,
ventrículo, hipotálamo, corpo caloso, córtex cerebral, giro do cíngulo e amígdala.
Como trabalhos futuros pretende-se investigar um modo de apresentar as mudanças
multivariadas de forma ordenada, ou seja, deseja-se saber quais alterações ocorrem
primeiramente no cérebro de um paciente com a doença de Alzheimer. Descobrindo um modo
de ordenar essas mudanças, também será possível começar a entender se uma região foi
afetada por causa da doença em questão ou se foi meramente uma reação a uma área vizinha
que sofreu alterações.
126
Ainda como trabalho futuro, deseja-se na análise multivariada estudar o modo de
indicar estatisticamente alterações cerebrais entre os grupos, por meio de diferenças
morfométricas das imagens ao invés de intensidade de voxel. E investigar outras formas de
alinhamento de imagens, sem a utilização do software SPM2.
127
REFERÊNCIAS BIBLIOGRÁFICAS
AGUIAR, N. A. O.; OLIVEIRA, S. H. A.; DURAN, F. L. S.; BUSATTO, G. F.; THOMAZ,
C. E.; Análise de imagens cerebrais utilizando o método MBV-Otimizado; Relatório Técnico
01/2007, Departamento de Engenharia Elétrica da FEI, São Bernardo do Campo, SP; 2007.
ALMEIDA, O. P.; CROCCO, E. I. Percepção dos déficits cognitivos e alterações do
comportamento em pacientes com doença de Alzheimer. Revista Brasileira de Psiquiatria,
v.58, p.292-299, 2000.
ALZHEIMER’S ASSOCIATION. Alzheimer’s disease: 2006. Disponível em:
http://www.alz.org/, acessado em 05/06/2006.
AMARO, E. Jr.; YAMASHITA, H. Aspectos básicos de tomografia computadorizada e
ressonância magnética. Revista Brasileira de Psiquiatria, v. 23, p. 2 – 3, 2001.
ASHBURNE, J.; FRISTON, K.; HOLMES, A.; POLINE, J. B.; WORSLEY, K.; BÜCHEL,
C.; PRICE, C.; TURNER, B.; HOWESMAN, A.; JOSEPHS, O.; TURNER, B. Human Brain
Function. ed. Disponível em http://www.fil.ion.ucl.ac.uk/spm/doc/books/hbf1/, acessado
em 20/08/2006.
ASHBURNE, J.; FRISTON, K.; PENNY, W.; KIEBEL, S.; HOLMES, A.; POLINE, J. B.;
KHERIF, F.; GLASER, D.; MECHELLI, A.; TURNER, R.; PRICE, C.; WORSLEY, K.;
BRETT, M.; NICHOLS, T.; HARRISON, L. Human Brain Function. ed. Dezembro de
2003.
BALLONE, G. J. Doença de Alzheimer In: PsiqWeb Psiquiatria Geral: 2002. Disponível em
http://www.psiqweb.med.br/geriat/alzh.html, acessado em 07/07/2006.
BUSATTO FILHO, G. Fisiopatologia dos Transtornos Psiquiátricos. SP: Atheneu, 2007.
128
BUSATTO FILHO, G.; GARRIDO, G. E. J.; ALMEIDA, O. P.; CASTRO, C. C.;
CAMARGO, C. H. P.; CID, C. G.; BUCHPIGUEL, C. A.; FURIE, S.; BOTTINO, C. M. A
voxel-based morphometry study of temporal lobe gray matter reductions in Alzheimer’s
disease. Neurobiology of Aging, 24, pp. 221 – 231, 2003.
CAOVILLA, V. P.; CANINEU, P. R. Você não está Sozinho. SP: ABRAZ, 2002.
CHEN, L.; LIAO, H.; KO, M.; LIN, J.; YU, G.; A new LDA-based face recognition system
which can solve the small sample size problem. Pattern Recognition, 33 (10), pp. 1713-
1726, 2000.
CONNORS, B. W.; BEAR, M. F. & PARADISO, M. A.; Desvendando o Sistema Nervoso.
2ª ed.: Artmed, 2002.
DAMASCENO, B. P. Envelhecimento Cerebral. Revista Brasileira de Psiquiatria, v.57,
p.78-83, 1999.
DEUTSCH, G.; SPRINGER, S. P. Cérebro Esquerdo, Cérebro Direito. 1ªed.: Summus.
1998.
DEVIJVER, P.A.; KITTLER, J.; Pattern Classification: A Statistical Approach. Prentice-
Hall, Englewood Cliffs, N. J., 1982.
FRISTON, K.; HOLMES, A. P.; WORSLEY, K.; POLINE, J. B.; FRITH, C. D.;
FRACKOWIAK, R. S. J. Statistical Parametric Maps in Functional Imaging: A General
Linear Approach. Hum Brain Mapp. V.2, p.189 – 210, 1995.
FUKUNAGA, K. Introduction to statistical pattern recognition. 2nd ed. Boston: Academic
Press, 1990.
GOOD, C. D.; JOHNSRUDE, I. S.; ASHBURNER, J.; HENSON, R. N. A.; FRISTON, K. J.;
FRACKWIAK, R. S. J. A Voxel-Based Morphometry Study of Ageing in 465 Normal Adult
Human Brains. Neuroimage.v. 14, p. 21 – 36, 2001.
129
GRANER, E. A.; Estatística. Ed. Companhia Melhoramentos de São Paulo. São Paulo, 1966.
GREENFIELD, S. A. Cérebro Humano. 1ª ed.: Rocco. 2000.
JOHNSON, R.A.; WICHERN, D.W. Applied Multivariate Statistical Analysis. ed. New
Jersey: Prentice Hall, 1982.
JUNIOR, R. M. A religião do cérebro. 2ªed. SP: Gente, 2005.
KAWAS C. H., M. D. Early Alzheimer’s Disease. The New England Journal of Medicine.
v. 349, n. 11, p. 1056-1063, September 2003.
KITANI, E. C.; THOMAZ, C. E. Um Tutorial sobre Análise de Componentes Principais para
o Reconhecimento Automático de Faces. Relatório Técnico 01/2006, Departamento de
Engenharia Elétrica da FEI, São Bernardo do Campo, SP; 23 f. 2006a.
KITANI, E. C.; THOMAZ, C. E.; GILLIES, D. F. A statistical discriminant model for face
interpretation and reconstruction. In: proceedings of SIBGRAPI' 06, IEEE CS Press,
Manaus, Amazonas, Brazil, October 2006b.
KITANI, E. C.; THOMAZ, C. E.; Análise de Discriminantes Lineares para Modelagem e
Reconstrução de Imagens de Face. ENIA, VI Encontro Nacional de Inteligência Artificial, p.
962-971, Rio de Janeiro Brasil, Julho 2007.
MAZZIOTTA, J. C.; TOGA, A. W.; EVANS, A.; FOX, P.; LANCASTER, J. A Probabilistic
Atlas of the Human Brain: Theory and Rationale for its Development. The International
Consortium for Brain Mapping (ICBM). Neuroimage, v. 2, p. 89 – 101, 1995.
MECHELLI, A.; PRICE, C. J.; FRISTON, K. J.; ASHBURNER, J. Voxel-Based
Morphometry of the Human Brain: Methods and Applications. Medical Imaging Reviews.
V. 1, n. 1, p. 1 – 9, 2005.
MCCRONE, JOHN; Como o Cérebro Funciona. 1ª ed.: Publifolha, 2002.
130
OLIVEIRA, M. F.; RIBEIRO, M.; BORGES, R.; LUGINGER, S. Doença de Alzheimer:
Perfil Neuropsicológico e Tratamento. 2005. Universidade Lusíada do Porto, Porto, Abril
de 2005.
OTADUY, M. G.; LEITE, C. C. Princípios físicos da Ressonância Magnética (RM).
Departamento de Radiologia da Faculdade de Medicina da USP, 2004, disponível
em_http://www.hcnet.usp.br/inrad/departamento/graduacao/aula/Fisica%20basica%20da%20r
essonancia%20magnetica.doc, acessado em 16/08/2006.
PETERSEN, R. C. Guia da Clínica Mayo sobre o Mal de Alzheimer. Tradução: Marcos
José Cunha, RJ: Anima, 2006.
PETTEY, D. J.; GEE, J. C. Sexual Dimorphism in the Corpus Callosum: A Characterization
of Local Size Variations and a Classification Driven Approach to Morphometry.
NeuroImage, v. 17, p. 1504 – 1511, August 2001.
PEREZ, V. Resumão: Cérebro. 2ª ed.: Barros, Fischer e Associados. 2003.
RORDEN, C., BRETT, M.; Stereotaxic display of brain lesions. Behavioural Neurology, v.
12, p. 191-200, 2000.
RUECKERT, D.; SONODA, L. I.; HAYES, C.; HILL, D. L. G.; LEACH, M. O.; HAWKES,
D. J.; Non-rigid registration using free-form deformations: Application to breast MR images.
IEEE Transactions on Medical Imaging, v. 18(8): pp. 712-721, 1999.
SIEGEL, S.; Estatística Não Paramétrica (Para a ciência do comportamento). Cap. 3.
Mcgraw-Hill do Brasil Ltda. 1981.
SWETS, D.; WENG, J. Using discriminant eigenfeatures for image retrieval. IEEE PAMI
v.18, n. 8, p. 831-836, August 1996.
TALAIRACH, J.; TORNOUX, P. Co-Planar Stereotaxic Atlas of the Human Brain. New
York: Thieme Medical Publishers Inc, 1998.
131
THOMAZ, C. E. Estudo de classificadores para o reconhecimento automático de faces.
1999. 101 f. Dissertação (Mestrado em Engenharia Elétrica) Departamento de Engenharia
Elétrica, Pontifícia Universidade Católica, Rio de Janeiro, 19 de Janeiro de 1999.
THOMAZ, C. E. Maximum entropy covariance estimate for statistical pattern
recognition. 2004. 152 f. These (Doctor of Philosophy Ph.D.) Department of Computing,
Imperial College London, University of London, London, 2004.
THOMAZ, C. E.; KITANI, E. C.; GILLIES, D. F. A Maximum uncertainty LDA-based
approach for limited sample size problems with application to face recognition. In:
Proceedings of SIBGRAPI’ 05, Journal of Brazilian Computer Society (JBCS) IEEE CS
Press, v. 12 n. 2, p. 89-96, June 2005a (in press).
THOMAZ, C. E.; GILLIES, D. F.; A Maximum uncertainty LDA-based approach for limited
sample size problems with application to face recognition. In Proceedings of SIBGRAPI’
05, IEEE CS Press, p. 89-96, 2005b.
THOMAZ, C. E.; AGUIAR, N. O.; OLIVEIRA, S. H. A.; DURAM, F. L. S; BUSATTO, G.
S.; DUNCAN, F. G.; RUECKERT D. Extraction discriminant information from medical
images: A multivariate linear approach. In: Proceedings of SIBGRAPI’ 06, IEEE CS Press,
to appear, 2006.
YANG, J.; YANG, J.; Optimal FLD algorithm for facial feature extraction. SPIE
Proceedings of the Intelligent Robots and Computer Vision XX: Algorithms,
Techniques, and Active Vision, vol. 4572, pp. 438-444, 2001.
YANG, J.; YANG, J.; Why can LDA be performed in PCA transformed space?. Pattern
Recognition, vol. 36, pp. 563-566, 2003.
WORSLEY, K.J. Statistics of Brain Mapping. Session of the International Statistical
Institute, Helsinki, Finland. 1999.
132
APÊNDICE AARTIGO DO SIBGRAPI 2006
Extracting Discriminative Information from Medical Images:
A Multivariate Linear Approach
Carlos E. Thomaz
1
, Nelson A.O. Aguiar
1
, Sergio H.A. Oliveira
1
, Fabio L.S. Duran
2
,
Geraldo F. Busatto
2
, Duncan F. Gillies
3
, and Daniel Rueckert
3
1
Department of Electrical Engineering, Centro Universitario da FEI, São Paulo, Brazil
2
Departments of Psychiatry and Radiology, Faculty of Medicine, University of São Paulo, Brazil
3
Department of Computing, Imperial College, London, UK
Abstract
Statistical discrimination methods are suitable not
only for classification but also for characterisation of
differences between a reference group of patterns and
the population under investigation. In the last years,
statistical methods have been proposed to classify and
analyse morphological and anatomical structures of
medical images. Most of these techniques work in
high-dimensional spaces of particular features such as
shapes or statistical parametric maps and have
overcome the difficulty of dealing with the inherent
high dimensionality of medical images by analysing
segmented structures individually or performing
hypothesis tests on each feature separately. In this
paper, we present a general multivariate linear
framework to identify and analyse the most
discriminating hyper-plane separating two
populations. The goal is to analyse all the intensity
features simultaneously rather than segmented
versions of the data separately or feature-by-feature.
The conceptual and mathematical simplicity of the
approach, which pivotal step is spatial normalisation,
involves the same operations irrespective of the
complexity of the experiment or nature of the data,
giving multivariate results that are easy to interpret.
To demonstrate its performance we present
experimental results on artificially generated data set
and real medical data.
1. Introduction
In the generic discrimination problem, where the
training sample consists of the class membership and
observations for
N
patterns, the outcome of interest
fall into
g
classes and we wish to build a rule for
predicting the class membership of an observation
based on
n
variables or features. However, statistical
discrimination methods are suitable not only for
classification but also for characterisation of
differences between a reference group of patterns and
the population under investigation. For example, in
clinical diagnosis we might want to understand
underlying causes of medical data by exploring the
discriminating hyper-plane found by a statistical
classifier using image samples of patients and controls.
In the last years, statistical pattern recognition
methods have been proposed to classify and analyse
morphological and anatomical structures of magnetic
resonance (MR) images [4, 6, 8]. Most of these
techniques work in high-dimensional spaces of
particular features such as shapes or statistical
parametric maps and have overcome the difficulty of
dealing with the inherent high dimensionality of
medical data by analysing segmented structures
individually or performing hypothesis tests on each
feature separately. Unfortunately, in such approaches
changes that are relatively more distributed and involve
simultaneously several structures of the pattern of
interest (i.e., ventricles and corpus callosum of the
brain) might be difficult to detect, despite the
possibility of some methods [6, 8] of extracting
statistically multivariate differences between image
samples of patients and controls.
In this work, we present a general multivariate
statistical framework to identify and analyse the most
discriminating hyper-plane separating two populations.
The goal is to analyse all the intensity features
simultaneously rather than segmented versions of the
data separately or feature-by-feature. We use a novel
method proposed recently [10], called Maximum
uncertainty Linear Discriminant Analysis (MLDA), to
overcome the well-known instability of the within-class
scatter matrix in limited sample size problems and to
increase the computational efficiency of the approach.
The approach is not restricted to any particular set of
features and describes a simple and straightforward
way of mapping multivariate classification results of
the whole images back into the original image domain
for further interpretation.
The remainder of this paper is divided as follows.
In section 2 we describe the main parts of the
multivariate linear framework and its design. This
section includes a brief review of Principal Component
Analysis (PCA) and the novel MLDA method used.
Section 3 presents experimental results of the approach
and demonstrates its effectiveness on a simple
artificially generated data set and on a real medical
data. In the last section, section 4, the paper concludes
with a short summary of functionalities that form the
basis for this methodology of discriminating and
analysing the patterns of interest.
2. A Multivariate Linear Approach
Our main concern here is to describe a multivariate
framework that highlights the most discriminating
differences between two populations when the number
of examples per class is much less than the dimension
of the original feature space. This problem is indeed
quite common nowadays, especially in medical image
analysis. For instance, patients and controls are classes
defined commonly by a small number of MR images
but the features used for recognition may be millions of
voxels or hundreds of pre-processed image attributes.
2.1. Principal Component Analysis (PCA)
There are a number of reasons for using PCA to
reduce the dimensionality of the original images. PCA
is a linear transformation that is not only simple to
compute and analytically tractable but also extracts a
set of features that is optimal with respect to
representing the data back into the original domain.
Moreover, using PCA as an intermediate step will
reduce dramatically the computational and storage
requirements for the subsequent LDA-based covariance
method. Since in our applications of interest the
number of training patterns N (or images) is much
smaller than the number of features
n
(or instance:
voxels), it is possible to transform data in a way that
patterns occupy as compact regions in a lower
dimensional feature space as possible with far fewer
degrees of freedom to estimate.
Although much of the sample variability can be
accounted for by a smaller number of principal
components, and consequently a further dimensionality
reduction can be accomplished by selecting the
principal components with the largest eigenvalues,
there is no guarantee that such additional
dimensionality reduction will not add artefacts on the
images when mapped back into the original image
space. Our aim is to map the classification results back
to the image domain for further visual interpretation.
For that reason, we must be certain that any
modification on the images, such as blurring or subtle
differences, is not related to an “incomplete” or
perhaps “misleading” feature extraction intermediate
procedure. For example, Figure 1 illustrates on the top
a reference image (shown on the left) reconstructed
using several principal components and on the bottom
the corresponding differences between these
reconstructions to the original image. The values in
parentheses represent the number of principal
components used and corresponding total variance
explained. We can see clearly that even when we use a
set of principal components that represents more than
90% of the total sample variance we still have subtle
differences between the reconstructed image and the
original one.
Therefore, in order to reproduce the total variability
of the samples we have composed the PCA
transformation matrix by selecting all principal
components with non-zero eigenvalues. To avoid the
high memory rank computation of the possibly large
total covariance matrix and because the MLDA
approach deal with the singularity of the within-class
scatter matrix, we have assumed that all the N training
patterns are linearly independent. In other words, we
have assumed that the rank of the total covariance
matrix is 1
N and the number of PCAs selected is
1
=
Nm .
Original (2, 80%) (10, 84%) (50, 92%) (all, 100%)
Fig. 1. Reconstruc
tion of a reference image (shown on the
top left) using several principal components. The row on the
bottom illustrates the corresponding differences between the
reconstructions to the reference image. The number of
components retained and the correspon
ding total sample
variance explained are shown in parentheses. We can see
modifications on the reconstructed images where all principal
components with non-zero eigenvalues are not selected.
2.2. Maximum Uncertainty LDA (MLDA)
The primary purpose of LDA is to separate samples
of distinct groups by maximising their between-class
separability while minimising their within-class
variability. LDA’s main objective is to find a
projection matrix
lda
P that maximizes the following
ratio (Fisher’s criterion):
PSP
PSP
P
w
T
b
T
P
lda
maxarg= ,
(1)
where
b
S is the between-class scatter matrix defined as
=
=
g
i
T
iiib
xxxxNS
1
))((
(2)
and
w
S is the within-class scatter matrix defined as
= =
=
g
i
T
iji
N
j
ijiw
xxxxS
i
1
,
1
,
)()(
.
(3)
The vector
ji
x
,
is the n-dimensional pattern
j
from
class
i
π
,
i
N is the number of training patterns from
class
i
π
, and
g
is the total number of classes or
groups. The vector
i
x
and matrix
i
S
are respectively
the unbiased sample mean and sample covariance
matrix of class
i
π
[5]. The grand mean vector x is
given by
= ==
==
g
i
N
j
ji
g
i
ii
i
x
N
xN
N
x
1 1
,
1
11
,
(4)
where N is the total number of samples, that is,
g
NNNN +++=
21
. The Fisher’s criterion
described in equation (1) is maximised when the
projection matrix
lda
P is composed of the eigenvectors
of
bw
SS
1
with at most
)1(
g
nonzero corresponding
eigenvalues. This is the standard LDA procedure.
It is well known, however, that the performance of
the standard LDA can be seriously degraded if there
are only a limited number of total training observations
N compared to the dimension of the feature space
m
.
Since the within-class scatter matrix
w
S is a function
of
)( gN
or less linearly independent vectors, where
g
is the number of groups, its rank is )( gN or less.
Therefore in recognition problems where the number of
training patterns is comparable to the number of
features,
w
S might be singular or mathematically
unstable and the standard LDA cannot be used to
perform the task of the classification stage.
In order to avoid both the singularity and instability
critical issues of the within-class scatter matrix
w
S
when LDA is used in limited sample and high
dimensional problems, we have used a maximum
uncertainty LDA-based approach (MLDA) based on a
straightforward covariance selection method for the
w
S
matrix. In an earlier study [10], Thomaz and Gillies
compared the performance of MLDA with other recent
LDA-based methods, such as Chen et al.’s LDA [2],
direct LDA [14], and Optimal Fisher Linear
Discriminant [13], with application to the face
recognition problem. Since the face recognition
problem involves small training sets, a large number of
features, and a large number of groups, it has become
the most used application to evaluate such limited
sample size approaches. The experimental results
carried out have shown that the MLDA method
improved the LDA classification performance with or
without an intermediate dimensionality reduction and
using less linear discriminant features.
The MLDA algorithm can be shortly described as
follows:
i.Find the
Φ
eigenvectors and
Λ
eigenvalues of
p
S
,
where ][ gNSS
wp
= ;
ii.Calculate the
p
S
average eigenvalue
λ
, that is,
n
Strace
n
p
n
j
j
)(
1
1
==
=
λλ
;
(5a)
iii.Form a new matrix of eigenvalues based on the
following largest dispersion values
)],max(),...,,[max(
1
*
λλλλ
n
diag=Λ
;
(5b)
iv.Form the modified within-class scatter matrix
))(()(
***
gNgNSS
T
pw
ΦΦΛ== .
(5c)
The maximum uncertainty LDA (MLDA) is
constructed by replacing
w
S with
*
w
S in the Fisher’s
criterion formula described in equation (1). As pointed
out by Thomaz and Gillies [TG05], it is based on a
maximum entropy covariance selection idea developed
to improve the performance of Bayesian classifiers on
limited sample size problems [11].
2.3. Framework Design
We can divide the design of the PCA+MLDA
multivariate framework into two main tasks:
classification (training and test stages) and visual
analysis.
In the classification task the principal components
and the maximum uncertainty linear discriminant
vector are generated. As illustrated in Figure 2, first a
training set is selected and the average image vector of
all the training images is calculated and subtracted
from each pre-processed image vector. Then the
training matrix composed of zero mean image vectors
is used as input to compute the PCA transformation
matrix. The columns of this
n
x
m
transformation
matrix are eigenvectors, not necessarily in eigenvalues
descending order. Recall, from section 2.1, that we
have retained all the PCA eigenvectors with non-zero
eigenvalues. The zero mean image vectors are
projected on the principal components and reduced to
m-dimensional vectors representing the most
expressive features of each one of the pre-processed n-
dimensional image vector. Afterwards, the N x
m
data matrix is used as input to calculate the MLDA
discriminant eigenvector. Since we are assuming only
two classes to separate, there is only one MLDA
C
LASSIFICATION
- T
RAINING STAGE
-
x
x
PCA
MLDA
Average image
Training images: each row is a
n-dimensional image vector
(N x n) data matrix
Training images with zero mean:
each row is a n-dimensional vector
(N x n)
m principal components: each
column is an eigenvector in
eigenvalue descending order
(n x m)
m most expressive features of each
one of the N vectors
(N x m)
The most discriminant
feature of each one of
the N vectors
Linear discriminant eigenvector
(m x 1)
(N x 1)
(1 x n)
-
x
x
Its most discriminant
feature
(1 x 1)
Its m
most expressive
features
(1 x m)
(1 x n)
Test image vector without the
average image calculated in the
training stage
A test vector on the image space:
n-dimensional image vector
(1 x n)
T
EST STAGE
+
x
x
A particular point on
the most discri
minant
feature space
(1 x 1)
Its m
most expressive
features
(1 x m)
(1 x n)
Its corresponding n-
dimensional
vector without the average mean
Its n-dimensional
image vector
(1 x n)
( )
T
( )
T
VISUAL ANALYSIS
Fig. 2. Design of the multivariate linear framework.
discriminant eigenvector. The most discriminant
feature of each one of the m-dimensional vectors is
obtained by multiplying the mN x most expressive
features matrix by the 1 x m MLDA linear discriminant
eigenvector. Thus, the initial pre-processed training set
consisting of N measurements on
n
variables, is
reduced to a data set consisting of N measurements on
only
1
most discriminant feature.
The other main task that can be implemented by this
two-stage multivariate statistical approach is to visually
analyse the most discriminant feature found by the
maximum uncertainty method. According to Figure 2,
more specifically from right to left in its Visual
Analysis frame, any point on the most discriminant
feature space can be converted to its corresponding n-
dimensional image vector by simply: (1) multiplying
that particular point by the transpose of the linear
discriminant vector previously computed; (2)
multiplying its m most expressive features by the
transpose of the principal components matrix; and (3)
adding the average image calculated in the training
stage to the n-dimensional image vector. Therefore,
assuming that the clouds of the classes follow a
multidimensional Gaussian distribution and applying
limits to the variance of each cloud, such as s3
±
,
where
s
is the standard deviation of each group, we
can move along this most discriminant feature and map
the result back into the image domain. This mapping
procedure provides an intuitive interpretation of the
classification experiments and, as we will show in the
experimental results of real medical data, biologically
plausible results that are often not detectable
simultaneously.
3. Experimental Results
To illustrate the performance of the multivariate
linear approach we present in this section experimental
results of the framework based on a simple artificially
generated data set and on a real medical data.
3.1. A Synthetic Data Example
We have chosen a very simple artificial data set
composed of 8 binary images of circles (ellipses) and 8
binary images of squares (rectangles). Figure 3 shows
both samples of images composed of 70 x 70 pixels.
As described in the previous section, we use such
training examples (without any spatial normalisation)
to construct the multivariate linear classifier for
labelling new examples and identifying the most
discriminating hyper-plane separating circles (or
ellipses) from squares (or rectangles). Since those
samples are very simple and easily separable, the
classifier achieved 100% of leave-one-out accuracy.
Figure 4 presents the PCA+MLDA most discriminant
feature of the synthetic database using all the 16
examples as training images. It displays the image
regions captured by the classifier that change when we
move from one side (squares or rectangles) of the
Fig. 3. A synthetic data set.
square
s3
square
x
square
s3+
boundary
circle
s3
circle
x
circle
s3+
Fig.4. Image display of the
regions captured by the classifier that change when we move from one side (squares or rectangles) of
the dividing PCA+MLDA hyper-plane to the other (circles or ellipes), following limits of 3± standard deviations for each sam
ple
group.
dividing hyper-plane to the other (circles or ellipes),
following limits to the variance ( s3
±
standard
deviations) of each sample group.
Despite the changes due to misalignments of the
images, Figure 4 shows clearly that the statistical
mapping effectively extracts the group differences. It
is important to note that these differences could be very
subtle on samples that are very close to the dividing
boundary and consequently difficult to characterise as
belonging to one of the groups.
3.2. A Real Data Example
In order to demonstrate the effectiveness of the
methodology on medical data, we have used an
Alzheimer MR brain data set that contains images of 14
patients and 14 healthy controls. All these images were
acquired using a 1.5T Philips Gyroscan S15-ACS MRI
scanner (Philips Medical Systems, Eindhoven, The
Netherlands), including a series of contiguous 1.2mm
thick coronal images across the entire brain, using a
T1-weighted fast field echo sequence (TE = 9ms, TR =
30ms, flip angle 30
o
, field of view = 240mm, 256 x 256
matrix). All images were reviewed by a MR neuro-
radiologist. Ethical permission for this study was
granted by the Ethics Committee of the Clinical
Hospital, University of Sao Paulo Medical School, Sao
Paulo, Brazil.
3.2.1. Mass-univariate Statistical Analysis
For comparison purpose, Statistical Parametric
Mapping (SPM, version SPM2) [4] analyses were
conducted using an optimised Voxel-based
Morphometry (VBM) protocol [7]. In contrast to the
multivariate approach, SPM has been designed to
enable voxel-by-voxel inferences about localised
differences between the groups and, consequently, does
not characterise interregional dependencies between
the structures of the brain [3].
A standard template set selected by the psychiatrists
was created specifically for this study, consisting of a
mean T1-weighted image, and a priori gray matter,
white matter and CSF templates based on the images of
all AD (Alzheimer Disease) and healthy control
subjects. Initially, images were spatially normalized to
the standard SPM T1-MRI template [9], using linear
12-parameter affine transformations. Spatially
normalized images were then segmented into gray
matter, white matter and cerebrospinal fluid (CSF)
compartments, using a modified mixture model cluster
analysis technique [7]. The segmentation method also
included: an automated brain extraction procedure to
remove non-brain tissue and an algorithm to correct for
image intensity non-uniformity. Finally, images were
smoothed with an isotropic Gaussian kernel (8mm
FWHM), and averaged to provide the gray, white
matter and CSF templates in stereotactic space.
To boost the signal-to-noise ratio, the image
processing of the original images from all AD patients
and controls was then carried out, beginning by image
segmentation. The segmented images were spatially
normalized to the customized templates previously
created by using 12-parameter linear as well as non-
linear (7 x 9 x 7 basis functions) transformations. The
parameters resulting from this spatial normalization
step were reapplied to
the original structural images.
These fully normalized images were re-sliced using tri-
linear interpolation to a final voxel size of 2 x 2 x 2
mm
3
, and segmented into
gray matter, white matter and
CSF partitions. Voxel values were modulated by the
Jacobian determinants derived from the spatial
normalisation, thus allowing brain structures that had
their volumes reduced after spatial normalisation to
have their total counts decreased by an amount
proportional to the degree of volume shrinkage [7].
Finally, images from AD patients and controls were
smoothed using a 12mm Gaussian kernel and compared
statistically between the two groups using unpaired
Student’s t-tests at
01.0
<
p
(level of significance).
Figure 5 illustrates the locations where significant
differences between the groups were detected. The
underlying image is the reference template used in the
Fig. 5.
Brain regions where significant differences in
Alzheimer patients relatively to controls were detected by
the SPM voxel-wise statistical tests at 01.0<p
. We can see
between-
group differences in the occipital, parietal and
frontal lobes, inter-hemispheric fissure, and corpus callosum.
spatial normalisation of all MR images. As can be
seen, there are some localised differences in the
Alzheimer patients relatively to controls in the
occipital, parietal and frontal lobes, in the inter-
hemispheric fissure, and corpus callosum. These
structures, especially where significant gray matter
changes were observed, are among the regions thought
to be the most prominently affected by atrophic
changes in Alzheimer disease [1].
3.2.2. Multivariate Statistical Analysis
Evaluating the classifier’s performance.
In order to
evaluate the PCA+MLDA classification’s rule, we have
used the Bhattacharyya bound to estimate the error
probability of the multivariate statistical framework.
For two-class problems, the upper bound of the
error probability
u
e is defined as [5]
)exp()(
2
1
21
dppe
u
= ,
(6)
where
1
p
and
2
p
are the prior probabilities of classes
1
π
and
2
π
respectively, and d is the Bhattacharyya
distance between the two classes defined as
21
21
21
1
21
21
2
ln
2
1
)(
2
)(
8
1
SS
SS
xx
SS
xxd
T
+
+
+
=
,
(7)
where the notation “|.|” denotes the determinant of a
matrix. As described previously, the vector
i
x and
matrix
i
S
are respectively the unbiased sample mean
and sample covariance matrix of class
i
π
( 2,1
=
i ).
Since the dataset under investigation comes with the
same proportion of patient images relatively to
controls, we have assumed that the prior probabilities
of both groups are equal. Thus, assuming
5.0
21
== pp
and calculating the Bhattacharyya
distance d using all the patient and control samples,
the multivariate statistical classifier achieves the value
of 1.56%. This result confirms the classifier’s ability
of discriminating the brains of controls from those of
patients with a successful classification rate of 98.44%,
using the closed-form method for the error probability.
Visual Analysis of discriminative information.
The
visual analysis of the linear discriminant feature found
by the multivariate approach is summarised in Figure 6.
As mentioned earlier, the one-dimensional vector found
by the PCA+MLDA approach corresponds to a hyper-
plane on the original image space which direction
describes statistically the most discriminant differences
between the control and patient images used for
training.
Figure 6 shows the differences between the control
(on the left column) and patient (on the right column)
images captured by the multivariate statistical classifier
using MR intensity features as inputs. These images
correspond to one-dimensional points on the
PCA+MLDA space projected back into the image
domain and located at 3 standard deviations of each
sample group. We can understand this mapping
procedure as a way of defining intensity changes that
come from “definitely control” and “definitely patient”
samples captured by the statistical classifier. We can
see the following brain differences in the Alzheimer
patients relatively to the controls: (1) enlargement of
the ventricular system, (2) atrophy of the hippocampus,
(3) cortical degeneration of the occipital, parietal, and
frontal lobes, (4) enlargement of the inter-hemispheric
1
1
3
3
3
3
3
3
3
3
4
4
2
3
5
2
Fig. 6.
Statistical differences between the control (on the
left) and Alzheimer patient (on the right) images captured by
the multivariate statistical classifier. We can see the
following brain differences in the Alzheimer patients
relatively to the controls: (
1) enlargement of the ventricular
system, (2) atrophy of the hippocampus, (3) cortical
degeneration of the occipital, parietal, and frontal lobes, (4)
enlargement of the inter-
hemispheric fissure, and (5) atrophy
of corpus callosum.
fissure, and (5) atrophy of the corpus callosum. These
multivariate results are consistent with the SPM
between-group differences presented previously and
with other common findings of patients who have
developed the pathology [12], such as the enlargement
of the ventricular system. Therefore, the use of the
multivariate approach has allowed not only the
simultaneous identification of localised between-group
differences but also distributed ones that are often
measured separately in the voxel-wise statistical
approaches.
4. Conclusion
We have presented a general PCA+MLDA
multivariate linear framework to identify and analyse
the most discriminating hyper-plane separating two
populations. The statistical analysis generates a
detailed description of the neuroanatomical changes
due to diseases and can facilitate the studies of the
brain disorders, such as Alzheimer, through
understanding of the captured anatomical changes.
The idea of using PCA plus an LDA-based
approach to discriminate patterns of interest is not new.
In this paper we have added to the functionality of this
approach the following important points for medical
image analysis. The use of full rank version of PCA
transformation matrix that allows valuable low
representation of high dimensional data, providing
optimal reconstruction of the most discriminant
intensity features without adding any artefacts on the
patterns when mapped back into the original image
space. By selecting a slightly biased within-class
scatter matrix composed of the most informative
dispersions we resolve not only the LDA singularity
problem but also we stabilise the maximisation of the
Fisher’s criterion on limited sample size problems.
The conceptual and mathematical simplicity of the
approach, which pivotal step is spatial normalisation,
involves the same operations irrespective of the
complexity of the experiment or nature of the data,
giving multivariate results that are easy to interpret.
Although the approach has been demonstrated in
two-class problems, it is extensible to several classes.
The only difference is the visual analysis of the
discriminant features, which might be performed pair-
wisely.
References
[1] G. F. Busatto, G. E. J. Garrido, O. P. Almeida, C. C.
Castro, C. H. P. Camargo, C. G. Cid, C. A. Buchpiguel, S.
Furuie, and C. M. Bottino, “A voxel-based morphometry
study of temporal lobe gray matter reductions in
Alzheimer’s disease”, Neurobiology of Aging, 24, pp.
221-231, 2003.
[2] L. Chen, H. Liao, M. Ko, J. Lin, and G. Yu, “A new
LDA-based face recognition system which can solve the
small sample size problem”, Pattern Recognition, 33 (10),
pp. 1713-1726, 2000.
[3] K. J. Friston and J. Ashburner, Generative and
recognition models for neuroanatomy”, NeuroImage, vol.
23, pp. 21–24, 2004.
[4] K. J. Friston, A. P. Holmes, K. J. Worsley, J. P. Poline,
C. D. Frith, and R. S. J. Frackowiak, “Statistical
Parametric Maps in Functional Imaging: A General Linear
Approach”, Human Brain Mapping 2, pp. 189–210, 1995.
[5] K. Fukunaga, Introduction to Statistical Pattern
Recognition, second edition. Boston: Academic Press,
1990.
[6] P. Golland, W. Grimson, M. Shenton, and R. Kikinis,
“Detection and Analysis of Statistical Differences in
Anatomical Shape”, Medical Image Analysis, vol. 9, pp.
69-86, 2005.
[7] C. D. Good, I. S. Johnsrued, J. Ashburner, R. N. Henson,
K. J. Friston, and R. S. Frackowiak, A voxel-based
morphometric study of ageing in 465 normal adult human
brains, NeuroImage, vol. 14, pp. 21-36, 2001.
[8] Z. Lao, D. Shen, Z. Xue, B. Karacali, S. Resnick, and C.
Davatzikos, “Morphological classification of brains via
high-dimensional shape transformations and machine
learning methods”, NeuroImage, vol. 21, pp. 46-57, 2004.
[9] J.C. Mazziotta, A.W. Toga, A. Evans, P. Fox, and J.
Lancaster, “A probabilistic atlas of the human brain:
Theory and rationale for its development”, NeuroImage,
vol. 2, pp. 89-101, 1995.
[10] C. E. Thomaz and D. F. Gillies, “A Maximum
Uncertainty LDA-based approach for Limited Sample
Size problems - with application to Face Recognition”, in
Proceedings of SIBGRAPI’05, IEEE CS Press, pp. 89-96,
2005.
[11] C. E. Thomaz, D. F. Gillies and R. Q. Feitosa, “A New
Covariance Estimate for Bayesian Classifiers in Biometric
Recognition”, IEEE Transactions on Circuits and
Systems for Video Technology, vol. 14, no. 2, pp. 214-
223, 2004.
[12] P. M. Thompson, J. Moussai, S. Zohoori, A. Goldkorn,
A. Khan, M.S. Mega, G. Small, J. Cummings, and A. W.
Toga, “Cortical variability and asymmetry in normal
aging and Alzheimer’s disease”, Cerebral Cortex, vol. 8,
pp. 492-509, 1998.
[13] J. Yang and J. Yang, “Why can LDA be performed in
PCA transformed space? ”, Pattern Recognition, vol. 36,
pp. 563-566, 2003.
[14] H. Yu and J. Yang, “A direct LDA algorithm for high
dimensional data with application to face recognition”,
Pattern Recognition, vol. 34, pp. 2067-2070, 2001.
141
APÊNDICE B – RELATÓRIO TÉCNICO – FEI – 2007
Análise de imagens cerebrais utilizando o método MBV-
Otimizado
Nelson A.O. Aguiar
1
, Sérgio H.A. Oliveira
1
, Fabio L.S. Duran
2
, Geraldo F.
Busatto
2
e Carlos E. Thomaz
1
Relatório Técnico 2007/01
1
Departamento de Engenharia Elétrica, FEI, São Bernardo do Campo, Brasil
2
Departamentos de Psiquiatria e Radiologia, USP, São Paulo, Brasil
Abstract. In the last years, Computer Vision methods have been investigated to
characterize neuroanatomical differences between magnetic resonance
images. This paper describes the implementation of the voxel-based-
morphometry (VBM) optimised using the software Statistical Parametric
Mapping (SPM2) for extracting discriminant information from magnetic
resonance images of subjects suffering from Alzheimer and Obsessive
Compulsive Disorder. We believe that such description might provide a better
understanding of the VBM-optimised method and might help clinicians not
familiarised with this approach to investigate it.
Resumo. Nos últimos anos, métodos de Visão Computacional vem sendo
investigados para caracterizar as diferenças neuroanatômicas “in vivo”
usando imagens de ressonância magnética estrutural. Este artigo detalha os
procedimentos de implementação do método otimizado de morfometria-
baseada-em-voxel (MBV) através do programa “Statistical Parametric
Mapping” (SPM2), para caracterização de diferenças em imagens cerebrais
de pacientes com a doença de Alzheimer e Transtorno Obsessivo Compulsivo.
Acredita-se que tal detalhadamento pode proporcionar um melhor
entendimento do método MBV-otimizado e ajudar especialistas não
familiarizados com esta abordagem.
1. Introdução
Atualmente, um grande número de métodos de Visão Computacional vem sendo
desenvolvido para caracterizar as diferenças neuroanatômicas “in vivo” usando imagens
de ressonância magnética estrutural (RM).
Um destes métodos é a morfometria-baseada-em-voxel (MBV) [7] que compara
voxel a voxel diferentes imagens de RM do cérebro. Sabe-se que a utilização do
método adequado depende obviamente do tipo de diferenças que se espera encontrar
entre as imagens. O método MBV é comumente utilizado para detecção de diferenças
localizadas nas imagens cerebrais segmentadas em regiões de substância cinzenta,
substância branca e líquido céfalo raquidiano (LCR).
O objetivo deste trabalho é detalhar os procedimentos de implementação da
metodologia MBV-otimizado [7] para caracterização das diferenças estatísticas entre
imagens de RM de controles e pacientes com dois tipos de transtornos psiquiátricos: a
doença de Alzheimer e o Transtorno Obssessivo Compulsivo. O programa “Statistical
Parametric Mapping” (SPM2, Wellcome Department of Imaging Neuroscience,
London, UK) [6, 16] aplicado em problemas deste tipo é utilizado para realizar as etapas
de normalização espacial das imagens e comparações estatísticas. Os experimentos
executados neste trabalho reproduzem os resultados gerados pelo método MBV
otimizado [3, 15] para identificar diferenças estatisticamente significantes e plausíveis
com os sintomas conhecidos da doença de Alzheimer e do Transtorno Obsessivo
Compulsivo.
Este artigo está divido em seis seções. Na seção seguinte, seção 2, apresenta-se uma
breve descrição dos transtornos psiquiátricos investigados neste estudo. Depois, na
seção 3, a metodologia de normalização espacial das imagens referente à abordagem
MBV otimizado [7], bem como os passos de processamento requeridos para a
caracterização das diferenças entre as amostras consideradas, são descritos em detalhes.
Na seção 4, explicita-se o cálculo estatístico utilizado para realizar as comparações entre
as amostras. Na seção 5, os experimentos e resultados executados neste trabalho são
discutidos e, finalmente, na seção 6, conclui-se este artigo apresentando-se
possibilidades de trabalho futuro.
2. A Doença de Alzheimer e o Transtorno Obsessivo Compulsivo
A doença de Alzheimer (DA) é considerada um dos transtornos psiquiátricos mais
comuns [5, 9] e o Transtorno Obsessivo Compulsivo (TOC) ocupa, segundo a
Organização Mundial de Saúde [11], o quarto lugar entre os transtornos mais comuns.
DA é uma doença cerebral progressiva que gradualmente destrói a memória e a
habilidade de aprender, raciocinar, fazer julgamentos, se comunicar e desempenhar
atividades do dia a dia [1, 9]. Infelizmente, a grande maioria das pessoas que possue
DA ainda não sabe desse fato, pois geralmente a doença é diagnosticada tardiamente,
principalmente em idosos. Essa doença atinge tanto homens quanto mulheres, de todas
as raças e classes sociais, sendo conhecida como uma doença de envelhecimento, pois é
mais comum em pessoas que atingem sessenta anos de vida ou mais [5].
O TOC, por sua vez, manifesta-se sobre a forma de alterações do comportamento
(rituais ou compulsões e repetições), dos pensamentos (obsessões como dúvidas e
preocupações excessivas) e das emoções (medo, desconforto, aflição, culpa e
depressão). O TOC tem como principal característica a presença de obsessão;
pensamentos, imagens ou impulsos que invadem a mente e que são acompanhados de
ansiedade ou desconforto, e das compulsões ou rituais: comportamentos ou atos mentais
voluntários e repetitivos realizados para reduzir a aflição que acompanha as obsessões.
3. Método MBV-Otimizado
O método MBV-otimizado é dividido em duas etapas; a primeira caracteriza-se pela
criação de moldes específicos (ou imagens de referência) utilizando as imagens de todos
os sujeitos do estudo e a segunda etapa, utilizando estes moldes criados, reprocessa
estes sujeitos.
3.1. Criação das Imagens de Referência
Para a criação das imagens de referência, procedimentos de normalização, segmentação,
suavização e cálculo de média, conforme ilustrado na Figura 1, são executados.
A normalização é um procedimento de alinhamento das imagens que serve para
garantir que um determinado voxel de uma imagem esteja idealmente na mesma posição
),,( zyx em todas as outras imagens. As imagens são normalizadas de acordo com uma
imagem de ressonância estrutural T1 (“template”), provida no programa SPM2, que é
baseada numa média de 152 sujeitos saudáveis do Montreal Neurological Institute [10]
e aproximadas anatomicamente ao espaço definido no atlas Talairach e Tornoux [14].
Após a conclusão da normalização é feita então a segmentação das imagens. Nesse
passo cada imagem é dividida em substância cinzenta, substância branca, LCR e tecidos
extra cerebrais. A segmentação emprega um modelo de análise de agrupamento [7] que
verifica a intensidade de cada voxel para separar cada grupo de tecido utilizando-se o
conhecimento a priori da distribuição desses tecidos em um indivíduo normal. Na
segmentação, a separação dos tecidos em partes ajuda a eliminar os tecidos extra
cerebrais, como por exemplo, a caixa craniana.
O terceiro passo da etapa de criação das imagens de referência é a suavização. Neste
passo, utiliza-se um filtro Gaussiano isotrópico que varia de 4mm até 12mm. Essa
variação do valor do filtro gaussiano a ser utilizado na suavização é referente à
quantidade de voxels vizinhos que serão considerados para análise, ou seja, a
intensidade de cada voxel se pela média ponderada dos valores dos voxels vizinhos.
Este processo serve fundamentalmente para eliminar ruídos na imagem [7].
A suavização é aplicada em quatro tipos de imagens diferentes. Neste trabalho, a
suavização nesta etapa foi realizada com um filtro Gaussiano isotrópico de 8mm. As
quatro imagens diferentes nas quais se aplica a suavização são as três partes de cérebro
que foram segmentadas (substância cinzenta, substância branca e LCR) e a imagem do
cérebro inteiro que foi normalizada no passo anterior ao da segmentação.
CÉREBRO
INTEIRO
IMAGENS ORIGINAIS
T1
NORMALIZAÇÃO
ESPACIAL
UTILIZANDO T1.IMG
CÉREBRO
INTEIRO –
NORMALIZADO
IMAGENS NORMALIZADAS
SUBSTÂNCIA
CINZENTA
SUBSTÂNCIA
BRANCA
CSF
IMAGENS SEGMENTADAS
SUBSTÂNCIA
CINZENTA
SUBSTÂNCIA
BRANCA
CSF
MÉDIA DE CADA SUBSTÂNCIA
CÉREBRO
INTEIRO
MÉDIA DAS IMAGENS COM O
CÉREBRO INTEIRO
MÉDIA DAS IMAGENS
ORIGINAIS NORMALIZADAS
Figura 1. Criação das imagens de referência: pré-processamento.
Os respectivos resultados da etapa de suavização são posteriormente utilizados para
os cálculos da média de cada grupo analisado, ou seja, substância cinzenta, substância
branca, LCR, e cérebro inteiro. O resultado da média das imagens do cérebro inteiro
resultará na primeira imagem de referência, denominada aqui de IRef1.img, conforme
ilustrado na Figura 2. Após os cálculos das médias de cada segmentação, serão
somadas todas as médias e será então aplicado uma nova suavização com o mesmo
filtro utilizado na suavizão anterior. Após essa nova suavização teremos a segunda e
última imagem de referência que chamaremos de IRef2.img, também ilustrada na
Figura 2. Ambas imagens de referência serão aplicadas nos procedimentos descritos a
seguir.
3.2. Reprocessamento das Imagens
Logo após a criação das imagens de referência, é iniciado um conjunto de
reprocessamentos das imagens originais para evidenciar as diferenças entre os grupos de
pacientes e controles.
Inicialmente, realiza-se uma normalização das imagens originais, seguida de uma
segmentação das imagens normalizadas. A normalização é feita de forma global a fim
de garantir idealmente que os voxels estejam nas mesmas posições em todas as imagens,
podendo assim obter um resultado confiável para a segmentação que divide a imagem
em três novas imagens (substância branca, cinza e LCR). Para este alinhamento, no
entanto, não utiliza-se mais a imagem padrão T1 [10, 14], mas sim a primeira imagem
que fora construída pelos procedimentos anteriores, isto é, a imagem IRef1.img
conforme destacado na Figura 3.
CÉREBRO
INTEIRO
IREF 1 .IMG
SUAVIZAÇÃO
MÉDIA DAS
IMAGENS COM
O CÉREBRO INTEIRO
IMAGEM MODELO
IREF 1.IMG
SUBSTÂNCIA
CINZENTA
SUBSTÂNCIA
BRANCA
CSF
SOMA DAS
IMAGENS
IREF 2.IMG
MÉDIA DE CADA SUBSTÂNCIA
SOMA
SUAVIZAÇÃO
IMAGEM MODELO
IREF 2.IMG
Figura 2. Criação das imagens de referência: processo final.
Após essa segmentação inicial utilizando uma imagem referência do cérebro inteiro
(IRef1.img) para alinhamento, é realizado uma nova normalização. Nesta fase são
calculados os parâmetros para que se possa fazer uma normalização específica para cada
substância cerebral segmentada, tomando como base a imagem IRef2.img, construída
nos procedimentos anteriores, conforme também ilustrado na Figura 3.
Utilizando os parâmetros de normalização calculados para cada substância, as
imagens originais que descrevem o cérebro inteiro são reprocessadas novamente para
serem segmentadas em substância cinzenta, branca e LCR. Esses procedimentos podem
ser visualizados nas Figuras 4 e 5 a seguir.
CÉREBRO
INTEIRO
SUBSTÂNCIA
CINZENTA
SUBSTÂNCIA
BRANCA
CSF
Parâmetros
Substância
Cinzenta
Parâmetros
Substância
Cinzenta
Parâmetros
CSF
IRef
1
IRef2
IMAGENS ORIGINAIS
NORMALIZAÇÃO E
SEGMENTAÇÃO
CÁLCULOS DOS
PARÂMETROS
IMAGENS
SEGMENTADAS
PARÂMETROS
CALCULADOS DE
CADA SEGMENÇÃO
Figura 3. As segmentações e os parâmetros calculados para a normalização
utilizam as imagens de referências criadas na etapa anterior.
Parâmetros
Substância
Cinzenta
Parâmetros
Substância
Branca
Parâmetros
CSF
PARÂMETROS CALCULADOS
DE CADA SEGMENÇÃO
CÉREBRO
INTEIRO
CÉREBRO
INTEIRO
CÉREBRO
INTEIRO
IMAGENS ORIGINAIS
+
+
+
NORMALIZAÇÃO
Imagens
Normalizadas
Imagens
Normalizadas
Imagens
Normalizada
s
IMAGENS ORIGINAIS
COM OS PARÂMETROS
RESPECTIVOS A
SUBSTÂNCIA.
Figura 4. Os parâmetros calculados são aplicados nas imagens originais para
normaliza-las.
Neste reprocessamento final, adiciona-se a etapa de modulação e uma nova
suavização, conforme esquematizado na Figura 5. A etapa de modulação tem a função
de preservar e corrigir o volume de cada voxel em relação à segunda imagem de
referência IRef2.img anteriormente calculada [7].
O último passo antes da análise estatística é a suavização. Nesta etapa elimina-se
eventuais ruídos contidos nas imagens e corrigi-se as bordas. A suavização foi realizada
com um filtro Gaussiano isotrópico de 12mm. Esta especificação é, de acordo com
testes realizados, a mais apropriada para a análise estatística das imagens do estudo em
questão.
4. Análise Estatística das Diferenças
Para realizar as comparações entre as imagens cerebrais de controles e de pacientes, foi
utilizada a análise estatística univariada disponível no programa SPM2 [6, 16]. Esta
análise trabalha com cada ponto da imagem isoladamente, ou seja, a análise é feita em
cada voxel separadamente.
Substância
Cinzenta
X
X
X
IMAGENS ORIGINAIS
COM OS PARÂMETROS
RESPECTIVOS A
SUBSTÂNCIA.
SEGMENTAÇÃO
MODULAÇÃO
SUAVIZAÇÃO
SUAVIZAÇÃO
MODULAÇÃO
MODULAÇÃO
SEGMENTAÇÃO
SEGMENTAÇÃO
X
IMAGENS SEGMENTADAS
Imagens
Normalizadas
Imagens
Normalizadas
Imagens
Normalizadas
CSF
CSF
Substância
Branca
Substância
Branca
Substância
Cinzenta
Análise
Estatística
Figura 5. Segmentação, modulação e suavização.
Uma das estatísticas univariadas que o SPM2 calcula é o “t de Student para
classificar as diferenças existentes entre os grupos avaliados, que neste caso são os
grupos de pacientes e controles de DA e TOC. Então, sejam
a
k
µ
e
c
k
µ
as médias dos
exemplos de pacientes e controles respectivamente, e
a
k
σ
e
c
k
σ
os desvios padrões de
cada grupo, onde k representa um determinado voxel da imagem. O desvio padrão
ponderado de todas as amostras pode ser calculado pela seguinte equação [12]:
( )
(
)
( )
(
)
2
11
22
+
+
=
ca
c
kc
a
ka
k
nn
nn
σσ
σ
,
onde
a
n e
c
n representam respectivamente o número de amostras de pacientes e de
controles. Pode-se medir quão diferente um determinado voxel é entre as duas amostras
de interesse, utilizando-se a seguinte equação [12]:
ac
k
c
k
a
k
k
nn
t
11
+
=
σ
µµ
.
Em outras palavras, se quisermos analisar o voxel k de todas as imagens, então é
verificado o valor do voxel em todas as imagens do grupo do paciente, calcula-se a
média e obtém-se o valor de
a
k
µ
, depois é feito o mesmo procedimento para o grupo de
controle para se obter
c
k
µ
. Depois, é verificado a diferença entre as médias e divide-se
essa diferença pelo desvio padrão para levar em conta toda a amostra que está sendo
trabalhada, podendo assim obter um valor de
t
mais preciso para cada voxel analisado.
Para verificar se o valor de
t
(ou a diferença entre as amostras) é estatisticamente
relevante, compara-se esse valor para um dado nível de significância com a tábua de
valores da distribuição “t de Student [8, 13]. O nível de significância
p
serve para
estimar o nível de certeza que o resultado de
t
oferece. Quanto menor o valor de
p
,
mais confiável será o valor de
t
, embora não haja nenhuma regra para determinar o
valor ótimo de
p
. Por exemplo, se quisermos noventa e nove por cento de certeza que
as diferenças encontradas não são devidas ao acaso ou ruído, deve-se escolher 01,0
=
p .
5. Experimentos e Resultados
Para a realização dos resultados experimentais deste trabalho, utilizou-se o banco de
imagens RM mantido pelo Instituto de Psiquiatria da Faculdade de Medicina da USP.
A base de dados de DA é composta por 28 imagens de RM, sendo 14 controles e 14
pacientes. No experimento relacionado ao TOC, o banco de imagens utilizado é
composto por 32 imagens de ressonância magnética sendo 14 controles e 18 pacientes
com diagnóstico de TOC. Todas as imagens foram adquiridas usando o equipamento
1.5T Philips Gyroscan S15-ACS (Philips Medical Systems, Eindhoven, The
Netherlands), incluindo uma série contínua de 1.2mm de imagens coronais do cérebro
inteiro, usando seqüências rápidas de T1-weighted (TE = 9ms, TR = 30ms, ângulo 30
o
,
campo de visão = 240mm, e uma matriz de 256 x 256). Todas as imagens foram
revisadas por um neuro-radiologista de RM. A permissão ética para este estudo foi
concedida pelo Comitê de Éticas do Hospital Clínico, Universidade de São Paulo, São
Paulo, Brasil.
A Figura 6 reproduz as principais diferenças encontradas nas substâncias cinzenta e
branca, e no LCR, entre as imagens dos pacientes com DA e TOC e os respectivos
grupos de controles.
Para a análise DA, pode-se observar pela Figura 6a que existem diferenças nas
regiões cerebrais do giro supramarginal (A), cerebelo (B), corpo caloso (D), giro do
cíngulo (C) e regiões próximas ao sulco central (E) e ao quarto ventrículo (F), conforme
reportado em estudo anterior [3] por especialistas. Essas regiões mencionadas acima
são responsáveis pelas seguintes funções cerebrais comumente afetadas em pacientes
que sofrem de DA [1, 2, 9]: compreensão visual, memória, nomeação de objetos,
emoção, funções sensitivas e coordenação motora.
Alzheimer e controles
TOC e controles
Substância
Cinza
Substância
Branca
LCR
(Liquor)
Substância
Cinza
Substância
Branca
LCR
(Liquor)
(a) (b)
Figura 6. Corte coronal, axial e sagittal de imagens de RM destacando as diferenças
estatísticas mais significativas (p = 0,001) entre: (a) pacientes com DA e controles; e
(b) pacientes com TOC e controles.
as diferenças encontradas entre os pacientes com TOC e controles foram mais
sutís e restritas às regiões do lobo parietal inferior e superior (G), e giros supra-marginal
e médio (H), conforme as ilustrações da Figura 6b. Tais regiões foram também
identificadas por especialistas como relevantes para caracterização do TOC utilizando-
se experimentos similares [15] e outra modalidade de imagem médica [4].
6. Conclusão
Este trabalho descreveu a implementação do método MBV-otimizado através do
programa SPM2 para caracterização de diferenças entre imagens de RM de pacientes
diagnosticados com DA e TOC e as respectivas amostras de controle. Descreveu-se,
também, os principais procedimentos de normalização espacial e reprocessamento de
imagens que compõem o método MBV-otimizado. Como a estatística calculada pelo
SPM2 analisa a imagem por comparações voxel a voxel, as diferenças encontradas por
essa análise são necessariamente localizadas. Pretende-se, como trabalho subsequente,
investigar a análise estatística multivariada para comparação de métodos. Acredita-se
A
B
C / D
E
F
G
H
que tal investigação possa evidenciar diferenças ainda não caracterizadas pelas
abordagens estatísticas univariadas usualmente utilizadas.
Referências
[1] O.P. Almeida and E.I. Crocco, “Percepção dos déficits cognitivos e alterações do comportamento em
pacientes com doença de Alzheimer”, Revista Brasileira de Psiquiatria, 2000, v.58, p. 292-299.
[2] G.J. Ballone, “Doença de Alzheimer” in. PsiqWeb Psiquiatria Geral, 2002, Disponível em
http://www.psiqweb.med.br/geriat/alzh.html, acessado em 07/07/2006.
[3] G.F. Busatto, G.E.J. Garrido, O.P. Almeida, C.C. Castro, C.H.P. Camargo, C.G. Cid, C.A.
Buchpiguel, S. Furuie, C.M. Bottino, “A voxel-based morphometry study of temporal lobe gray matter
reductions in Alzheimer’s disease”, NeuroBiology of Aging, v. 24, p. 221-231, 2003.
[4] G.F. Busatto, D.R. Zamignan, C.A. Buchpiguel, G.E. Garrido, M.F. Glabus and E.T. Rocha, “A voxel
based investigation of regional cerebral blood flow abnormalities in obsessive-compulsive disorder using
single photon emission computed tomography (SPECT)”, Psychiatry Res., v. 99, p. 15-27, 2000.
[5] V.P. Caovilla and P.R. Canineu, Você não está Sozinho, SP, ABRAZ, 2002.
[6] K. Friston, A.P. Holmes, K. Worsley, J.B. Poline, C.D. Frith and R.S.J. Frackowiak, “Statistical
Parametric Maps in Functional Imaging: A General Linear Approach”, Hum Brain Mapp, 1995, V.2,
p.189 – 210.
[7] C.D. Good, I.S. Johnsrude, J. Ashburner, R.N.A. Henson, K.J. Friston and R.S.J. Frackwiak, “A
Voxel-Based Morphometry Study of Ageing in 465 Normal Adult Human Brains”, Neuroimage, 2001,
v.14, p. 21 – 36.
[8] R.A. Johnson and D.W. Wichern, Applied Multivariate Statistical Analysis, 4ª ed. New Jersey,
Prentice Hall, 1982.
[9] C.H. Kawas, “Early Alzheimer’s Disease”, The New England Journal of Medicine, 2003, v. 349, n.
11, p. 1056-1063.
[10] J.C. Mazziotta, A.W. Toga, A. Evans, P. Fox and J. Lancaster, “A Probabilistic Atlas of the Human
Brain: Theory and Rationale for its Development”, The International Consortium for Brain Mapping
(ICBM). Neuroimage, 1995, v. 2, p. 89 – 101.
[11] Organização Mundial de Saúde, Classificação de Transtornos Mentais e de Comportamento da CID-
10, pp. 140-143, Editora Artes Médicas, Porto Alegre, 1993.
[12] D.J. Pettey and J.C. Gee, “Sexual Dimorphism in the Corpus Callosum: A Characterization of Local
Size Variations and a Classification Driven Approach to Morphometry”, NeuroImage, 2001, v. 17, p.
1504 – 1511.
[13] S. Siegel, Estatística Não Paramétrica (Para a ciência do comportamento), cap. 3. Mcgraw-Hill do
Brasil Ltda, 1981.
[14] J. Talairach and P. Tornoux, “Co-Planar Stereotaxic Atlas of the Human Brain”, New York: Thieme
Medical Publishers Inc, 1998.
[15] A.A. Valente Jr., E.C. Miguel, C.C. Castro, E. Amaro Jr., F.L.S. Duran, C.A. Buchpiguel, X. Chitnis,
P.K. McGuire, and G.F. Busatto, “Regional Gray Matter Abnormalities in Obsessive-Compulsive
Disorder: A Voxel-Based Morphometry Study”, Biol Psychiatry, v. 58, p. 479-487, 2005.
[16] K.J. Worsley, “Statistics of Brain Mapping”, Session of the International Statistical Institute, 1999
Helsinki, Finland.
Livros Grátis
( http://www.livrosgratis.com.br )
Milhares de Livros para Download:
Baixar livros de Administração
Baixar livros de Agronomia
Baixar livros de Arquitetura
Baixar livros de Artes
Baixar livros de Astronomia
Baixar livros de Biologia Geral
Baixar livros de Ciência da Computação
Baixar livros de Ciência da Informação
Baixar livros de Ciência Política
Baixar livros de Ciências da Saúde
Baixar livros de Comunicação
Baixar livros do Conselho Nacional de Educação - CNE
Baixar livros de Defesa civil
Baixar livros de Direito
Baixar livros de Direitos humanos
Baixar livros de Economia
Baixar livros de Economia Doméstica
Baixar livros de Educação
Baixar livros de Educação - Trânsito
Baixar livros de Educação Física
Baixar livros de Engenharia Aeroespacial
Baixar livros de Farmácia
Baixar livros de Filosofia
Baixar livros de Física
Baixar livros de Geociências
Baixar livros de Geografia
Baixar livros de História
Baixar livros de Línguas
Baixar livros de Literatura
Baixar livros de Literatura de Cordel
Baixar livros de Literatura Infantil
Baixar livros de Matemática
Baixar livros de Medicina
Baixar livros de Medicina Veterinária
Baixar livros de Meio Ambiente
Baixar livros de Meteorologia
Baixar Monografias e TCC
Baixar livros Multidisciplinar
Baixar livros de Música
Baixar livros de Psicologia
Baixar livros de Química
Baixar livros de Saúde Coletiva
Baixar livros de Serviço Social
Baixar livros de Sociologia
Baixar livros de Teologia
Baixar livros de Trabalho
Baixar livros de Turismo