Download PDF
ads:
Universidade Federal do Maranh
˜
ao
Centro de Ci
ˆ
encias Exatas e Tecnologia
Programa de P
´
os-Graduac¸
˜
ao em Engenharia de Eletricidade
L
´
UCIO FL
´
AVIO DE ALBUQUERQUE CAMPOS
Classifica¸ao de Les˜oes em Mamografias Digitais Utilizando
An´alise de Componentes Independentes e Perceptron
Multicamadas
S
˜
AO LU
´
IS - MA
2006
ads:
Livros Grátis
http://www.livrosgratis.com.br
Milhares de livros grátis para download.
L
´
UCIO FL
´
AVIO DE ALBUQUERQUE CAMPOS
Classifica¸ao de Les˜oes em Mamografias Digitais Utilizando
An´alise de Componentes Independentes e Perceptron
Multicamadas
Disserta¸ao apresentada ao Programa de os
Gradua¸ao em Engenharia de Eletricidade da
UFMA, como requisito para a obten¸ao do grau
de MESTRE em Engenharia de Eletricidade.
Orientador: Allan Kardec Duailibe Barros Filho
Universidade Federal do Maranh˜ao
S
˜
AO LU
´
IS - MA
2006
ads:
Campos, L´ucio Fl´avio de Albuquerque
Classifica¸ao de Les˜oes em Mamografias Digitais Utilizando
An´alise de Componentes Independentes e Perceptron Multicamadas
/ L´ucio Fl´avio de Albuquerque Campos. - ao Lu´ıs, 2006.
Disserta¸ao (Mestrado) - Programa de os-Gradua¸ao em
Engenharia de Eletricidade, Universidade Federal do Maranh˜ao.
1.Processamento de Imagens,2.Mamas-les˜oes-identifica¸ao
autom´atica, 3.Mamografia I. T´ıtulo.
CDU 004.932
L
´
UCIO FL
´
AVIO DE ALBUQUERQUE CAMPOS
Classifica¸ao de Les˜oes em Mamografias Digitais Utilizando
An´alise de Componentes Independentes e Perceptron
Multicamadas
Disserta¸ao apresentada ao Programa de os
Gradua¸ao em Engenharia de Eletricidade da
UFMA, como requisito para a obten¸ao parcial do
grau de MESTRE em Engenharia de Eletricidade.
Apresentado em 24 de mar¸co de 2006
BANCA EXAMINADORA
Allan Kardec Duailibe Barros Filho
Universidade Federal do Maranh˜ao
Arist´ofanes Corrˆea Silva
Universidade Federal do Maranh˜ao
Alexandre C´esar Muniz de Oliveira
Universidade Federal do Maranh˜ao
Dr´aulio Barros de Ara´ujo
Universidade de ao Paulo
Dedico este trabalho `a minha fam´ılia
Resumo
Neste trabalho, propomos um etodo para discrimina¸ao e classifica¸ao de
mamogramas, com diagn´ostico maligno, benigno e normal, usando an´alise de componentes
independentes e redes neurais. O etodo foi testado com mamogramas da MIAS database,
e com redes perceptron multicamadas. O etodo obteve uma taxa de sucesso m´edia de
97.83%, com 97.5% de especificidade, e 98% de sensibilidade.
Palavras-chaves:mamograma, ancer de mama, an´alise de componentes independentes,
diagn´ostico auxiliado por computador
Abstract
We propose a method for discrimination and classification of mammograms
with benign, malignant and normal tissues using independent comp onent analysis and
neural networks. The method was tested for a mammogram set from MIAS database,
and multilayer perceptron. The method obtained a success rate of 97.83% , with 97.5%
of specificity and 98% of sensitivity.
Keywords: Mammogram, breast cancer, independent component analysis, neural
networks, computer aided diagnosis.
Agradecimentos
`
A DEUS, por ter me dado perseveran¸ca e paciˆencia
`
A toda a minha fam´ılia, que sempre esteve presente, e teve infinita paciˆencia
comigo nestes ´ultimos dois anos.
Ao meu tesouro, Jayne R. Campos, que ao convive comigo, mais mora no
meu cora¸ao.
Ao meu orientador, o Prof. Allan Kardec Barros, por ter depositado confian¸ca
no meu trabalho e na minha capacidade.
Ao Prof. Arist´ofanes Corrˆea, por ter me apresentado o mundo do
Processamento de Imagens, por ter me co-orientado no meus artigos, e por ter tido uma
enorme paciˆencia na revis˜ao deste trabalho.
A todos os meu amigos do laborat´orio de Processamento da Informa¸ao
Biol´ogica PIB, Carlos Magno, Denner Guilhon, Deusdete Brito, Diego, Ewaldo
´
Eder,
Glenda Raposo, Ivan Jr., Ranielma Machado, Andr´e Borges.
Aos meus amigos Jaderson, Mauro e Rycardo, do Laborat´orio de
Instrumenta¸ao Eletrˆonica LIEA
`
A Cleidiane Gomes, que me acompanhou por mais de 4 anos da minha vida,
e esteve presente, me dando apoio em grande parte deste mestrado.
Aos meus amigos Ricardo Robson, Raniere Machado e Alex A. Paz, pelos
momentos de descontra¸ao e brincadeira nas sexta-feiras.
Ao meu amigo Alcides Neto, da secretaria da os-gradua¸ao.
Ao meu amigo Andr´e Borges, por ter paciˆencia em me ensinar conceitos asicos
que ao entravam na minha cab e¸ca, e por ter quebrado todos os fones que eu comprava.
`
A minha amigona do peito Jaciani Pereira, por ter emprestado os ouvidos nas
horas que mais precisava.
`
A minha vida, Ivana Souza, que re-apareceu do nada, e hoje se tornou
simplesmente tudo.
5
’Na realidade, as maiores ben¸aos nos
chegam por interm´edio da loucura,
quando ´e mandada como um presente
dos deuses.’
Plat˜ao
Sum´ario
Lista de Figuras 9
Lista de Tabelas 11
1 Introdu¸ao 12
1.1 A Mamografia e o ancer de Mama . . . . . . . . . . . . . . . . . . . . . . 14
1.2 Trabalhos Relacionados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
1.3 Organiza¸ao do Trabalho . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2 Diagn´ostico Auxiliado por Computador 23
2.1 Processamento Digital de Imagens . . . . . . . . . . . . . . . . . . . . . . . 24
2.2 An´alise de Textura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.3 An´alise de Componentes Independentes . . . . . . . . . . . . . . . . . . . . 25
2.3.1 Defini¸oes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.3.2 Defini¸ao de Independˆencia . . . . . . . . . . . . . . . . . . . . . . 28
2.3.3 T´ecnicas de Estima¸ao das Componentes Independentes . . . . . . 29
2.4 Sele¸ao de Caracter´ısticas mais Significantes . . . . . . . . . . . . . . . . . 32
2.5 Redes Neurais como Classificadores . . . . . . . . . . . . . . . . . . . . . . 33
2.5.1 Redes Neurais Perceptron Multicamadas . . . . . . . . . . . . . . . 35
3 O M´etodo Proposto 39
3.1 ICA aplicado em Processamento de Imagens . . . . . . . . . . . . . . . . . 39
4 Material 43
4.1 Base de dados MIAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
4.2 Softwares Utilizados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
5 Resultados e Discuss˜ao 46
5.1 Extra¸ao de Parˆametros Utilizando ICA . . . . . . . . . . . . . . . . . . . 46
5.2 Vari´aveis Selecionadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
5.3 Configura¸ao da Rede Neural MLP . . . . . . . . . . . . . . . . . . . . . . 50
5.4 Discuss˜ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
6 Conclus˜ao e trabalhos futuros 53
Referˆencias Bibliogr´aficas 55
Lista de Figuras
1.1 Incidˆencia m´edio-lateral das mamas [SANTOS, 2002]. . . . . . . . . . . . . 15
1.2 Incidˆencia crˆanio-caudal das mamas. [SANTOS, 2002] . . . . . . . . . . . . 15
1.3 Mamografia com les˜ao circunscrita. Banco de dados MIAS, identifica¸ao
Mdb005 fonte: MIAS [SUCKLING, 1994]. . . . . . . . . . . . . . . . . . . 17
1.4 Mamografia com uma les˜ao nodular de bordas espiculadas. Banco de dados
MIAS, identifica¸ao Mdb184 fonte: MIAS [SUCKLING, 1994]. . . . . . . . 17
1.5 odulo de alta densidade, lobulado, de contornos parcialmente definidos.
fonte: www.fleury.com.br, acessado em 22/02/2006 . . . . . . . . . . . . . 18
1.6 Mamografia com uma les˜ao nodular de caracter´ısticas benignas. Banco de
dados MIAS, identifica¸ao Mdb021 fonte: MIAS [SUCKLING, 1994]. . . . 18
1.7 Mamografia com presen¸ca de microcalcifica¸oes. Banco de dados MIAS,
identifica¸ao Mdb075 fonte: MIAS[SUCKLING, 1994]. . . . . . . . . . . . 19
2.1 Arquitetura de RNA com duas sa´ıdas. . . . . . . . . . . . . . . . . . . . . 34
2.2 Ilustra¸ao das dire¸oes de dois fluxos asicos de um sinal em uma rede
MLP: Propaga¸ao direta dos sinais e a retro-propaga¸ao dos sinais de erro. 38
3.1 Diagrama do m´etodo proposto. . . . . . . . . . . . . . . . . . . . . . . . . 39
3.2 Modelo de separa¸ao linear de imagens. . . . . . . . . . . . . . . . . . . . . 41
4.1 Sele¸ao das ROI’s de tecidos benignos, malignos e normais. . . . . . . . . . 44
5.1 Regi˜ao de interesse com uma combina¸ao linear de imagens bases m´utua e
estatisticamente independentes entre si. . . . . . . . . . . . . . . . . . . . . 46
5.2 Amostra de imagens bases obtidas de ROI’s de tecidos normais, benignos
e malignos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
5.3 Configura¸ao de rede neural MLP, com 45 neurˆonios de entrada, 21 na
camada intermedi´aria, e 3 neurˆonios na camada de sa´ıda. . . . . . . . . . . 50
Lista de Tabelas
4.1 Exemplo do diagn´ostico mostrado em algumas mamografias da base de
dados MIAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
5.1 Classifica¸ao das ROI de tecidos Benignos, Malignos e Normais . . . . . . 51
5.2 Classifica¸ao das ROI’s em normais e anormais . . . . . . . . . . . . . . . 51
12
1 Introdu¸ao
O ancer de mama permanece como o segundo tipo de ancer mais freq¨uente
no mundo e o primeiro entre as mulheres. De acordo com a organiza¸ao mundial de sa´ude,
mais de 1.2 milh˜oes de pessoas foram diagnosticadas com ancer de mama em 2005. No
Brasil a realidade ´e similar. Dos cerca de 467 mil novos casos de ancer esperados para
2006, 48.930 ao de ancer de mama, representando um risco estimado de 52 casos a cada
100 mil mulheres, segundo dados fornecidos pelo Instituto Nacional do ancer, situado no
Rio de Janeiro. No Estado do Maranh˜ao, dos 1740 casos estimados para 2006, 300 ao de
ancer de mama. Nas ´ultimas duas ecadas, observou-se um aumento consider´avel da taxa
de mortalidade por ancer de mama entre mulheres. Esse n´umero passou de 5,77/100.000
em 1979 a 9,74/100.000 em 2000, correspondendo a uma varia¸ao percentual relativa de
+80,3% [INCa,2005].
O ancer de mama, assim como os demais, ´e resultado de altera¸oes do
DNA, que levam a uma prolifera¸ao celular desordenada. Quando a uma falha do
mecanismo regulador que mant´em o equil´ıbrio entre o crescimento celular e o bem estar
do organismo, ocorre a forma¸ao de massas, denominadas tumores ou neoplasias, as quais
ao classificadas como malignas ou benignas. As neoplasias benignas em crescimento
organizado, em geral lento, e o tumor apresenta contorno bem n´ıtido. Na neoplasia
maligna, o crescimento ´e apido, desordenado e infiltrativo. Nos tumores malignos,
suas elulas tˆem capacidade de se desenvolver em outras partes do corpo, fenˆomeno este
denominado met´astase [BAUER,1980].
13
O ancer de mama se comporta menos previsivelmente do que outros anceres,
e embora algumas pacientes com doen¸ca ao tratada possam sobreviver por longos
per´ıodos, outras com ancer m´ınimo de mama podem chegar a ´obito muito rapidamente.
Os aspectos importantes na predi¸ao da gravidade do ancer de mama incluem a
magnitude da resposta do hospedeiro e as caracter´ısticas do tumor. A sobrevida das
pacientes ´e diretamente relacionada com o tamanho do tumor no diagn´ostico inicial.
Portanto, o diagn´ostico precoce ao apenas influencia o progn´ostico, mas propicia cirurgia
menos multilante e com sobrevida compar´aveis a interven¸oes cir´urgicas mais dram´aticas
e agressivas[BAUER,1980].
As causas para o aparecimento do ancer na mama ainda ao ao totalmente
conhecidas. Sabe-se que a combina¸ao de muta¸oes gen´eticas, estilo de vida e influˆencia
ambiental podem levar, sem uma raz˜ao espec´ıfica, a mudan¸cas no funcionamento dos
genes das elulas mam´arias. Pode-se passar a vida inteira com uma muta¸ao gen´etica
sem, necessariamente, desenvolver um tumor. O problema ´e quando ela ocorre em duas
categorias espec´ıficas de genes: nos oncogenes, que ao os causadores de ancer, ou nos
genes supressores de tumor, respons´aveis por prevenir qualquer altera¸ao no DNA e conter
o crescimento celular descontrolado.
Quanto mais precocemente for detectada a les˜ao, maiores as chances de cura da
paciente. A forma mais eficaz para detec¸ao precoce do ancer de mama ´e a mamografia,
ou radiografia da mama, que ´e capaz de mostrar les˜oes em fase inicial, muito pequenas
(de mil´ımetros).
´
E realizada em um aparelho de raio X apropriado, chamado mam´ografo.
Nele, a mama ´e comprimida de forma a fornecer melhores imagens, e, portanto, melhor
capacidade de diagn´ostico.
A mamografia ´e um exame simples, barato, e de acil acessibilidade, por´em
14
a grande desvantagem da mamografia ´e seu erro de diagn´ostico, que ´e considerado
muito elevado, e est´a compreendido entre 12 a 54% [INCa,2005], erro esse que contribui
consideravelmnete para o aumento de n´umero de diagn´osticos falso-positivos, que podem
levar a paciente a uma biopsia desnecess´aria, e o aumento de diagn´osticos falso-negativos,
que podem atrasar a descoberta de um ancer, que a maioria das vezes quando ´e
descoberto, a ´e tardio.
As causas mais importantes de mamogramas de diagn´ostico falso ao os
seguintes: o tamanho e a localiza¸ao da les˜ao, a densidade do tecido mam´ario, a qualidade
dos recursos t´ecnicos e a habilidade de interpreta¸ao do radiologista [INCa,2005].
1.1 A Mamografia e o ancer de Mama
A mamografia constitui uma forma particular de radiografia, que trabalha com
n´ıveis de tens˜oes e correntes em intervalos espec´ıficos, destinada a registrar imagens da
mama a fim de diagnosticar a presen¸ca ou ausˆencia de estruturas que possam indicar
patologias. Segundo o INCA [INCa,2005], em uma mamografia, duas incidˆencias de cada
mama ao indisp ens´aveis: uma vis˜ao lateral ou obl´ıqua, como mostra a Figura 1.1 e uma
crˆanio-caudal, conforme a Figura 1.2.
No entanto, a incidˆencia m´edio-lateral-obl´ıqua (MLO) ´e a mais eficaz, pois
mostra uma quantidade maior de tecido mam´ario e inclui estruturas mais profundas do
quadrante s´upero-externo e do prolongamento axilar.
A incidˆencia crˆanio-caudal (CC) tem como objetivo incluir todo o material
ostero-medial, complementando a edio-lateral-obl´ıqua, que com freq¨uˆencia ao est´a
totalmente demonstrado na incidˆencia MLO. Permite tamb´em mais compress˜ao da mama,
15
Figura 1.1: Incidˆencia edio-lateral das mamas [SANTOS, 2002].
Figura 1.2: Incidˆencia crˆanio-caudal das mamas. [SANTOS, 2002]
uma vez que ao inclui a axila, resultando em uma defini¸ao superior da arquitetura
mam´aria e de les˜oes. Os radiologistas estudam as incidˆencias crˆanio-caudais e as edio-
laterais aos pares de modo a p ermitir a compara¸ao de regi˜oes sim´etricas, pois qualquer
assimetria pode ser ind´ıcio de patologia.
A mamografia ´e um exame de alta sensibilidade, apesar de a maioria dos
estudos evidenciarem perdas entre 10 a 15% [INCa,2005] dos casos de ancer com tumor
detect´avel ao exame cl´ınico. Esta sensibilidade, no entanto, est´a diretamente relacionada
16
`a idade da mulher, sendo muito menor nas mulheres jovens, que apresentam uma alta
densidade de tecido mam´ario, devido `a predominˆancia de tecidos fibroglandulares na sua
composi¸ao.
O reconhecimento de estruturas que possam indicar a presen¸ca de ancer ocorre
atrav´es da constata¸ao de uma diferen¸ca de contraste entre os diversos tecidos envolvidos.
A gordura, por exemplo, absorve uma menor quantidade de raios-X, aparecendo mais
escura no mamograma, enquanto tecidos fibroglandulares apresentam densidade ´optica
maior e aparecem mais claros [BOYD,1995]. Geralmente microcalcifica¸oes e massas
aparecem em tonalidades mais claras na imagem obtida ap´os a revela¸ao do filme
mamogr´afico, mas essa diferencia¸ao fica prejudicada em imagens de mamas densas. Por
esse motivo, muitas vezes a descoberta do ancer de mama em mulheres com menos de 40
anos de idade acontece quando o tumor a apresenta um desenvolvimento avan¸cado, o que
dificulta o tratamento da doen¸ca. O diagn´ostico de carcinomas ao-palp´aveis o ´e poss´ıvel
atrav´es da realiza¸ao de mamografias minuciosas, em que cada detalhe ´e de extrema
importˆancia para evitar os diagn´osticos falso-positivos e falso-negativos [BLAND,2000].
Em uma mamografia, o ancer mam´ario pode aparecer de muitas formas, tal
a variedade de padr˜oes com que se pode apresentar. Os padr˜oes de les˜ao mais t´ıpicos ao
[SANTOS, 2002]:
- Opacidade circunscrita: Corresponde ao odulo, sendo o achado
mamogr´afico encontrado em 39% dos casos de ancer ao palp´aveis. Os odulos devem ser
analisados de acordo com o tamanho, densidade, contorno, como ´e observado na Figura
1.3.
- Contorno espiculado ou estrelado: corresponde ao chamado carcinoma
cirroso. odulo de alta densidade com bordas espiculadas, geralmente ´e diagnosticado
17
Figura 1.3: Mamografia com les˜ao circunscrita. Banco de dados MIAS, identifica¸ao Mdb005 fonte:
MIAS [SUCKLING, 1994].
como carcinoma, como mostrado na Figura 1.4.
Figura 1.4: Mamografia com uma les˜ao nodular de bordas espiculadas. Banco de dados MIAS,
identifica¸ao Mdb184 fonte: MIAS [SUCKLING, 1994].
- Contorno lobulado: O aspecto lobulado representa um crescimento
tumoral e essa caracter´ıstica autoriza uma suspei¸ao de malignidade, sobretudo se parte
do contorno ´e mal definida ou atenuada, como mostrado na Figura 1.5.
18
Figura 1.5: odulo de alta densidade, lobulado, de contornos parcialmente definidos. fonte:
www.fleury.com.br, acessado em 22/02/2006
- Contorno bem definido: Caracter´ıstica de benignidade. Contudo, algumas
les˜oes (medular, col´oide e mucinoso) podem apresentar contorno bem definido, mas
diferem em outras caracter´ısticas, tais como textura, por exemplo, como visto na Figura
1.6.
Figura 1.6: Mamografia com uma les˜ao nodular de caracter´ısticas benignas. Banco de dados MIAS,
identifica¸ao Mdb021 fonte: MIAS [SUCKLING, 1994].
19
Al´em das estruturas citadas acima, ainda existem as calcifica¸oes, que ao
dep´ositos de sais de alcio nos tecidos mam´arios que podem ter se desenvolvido devido a
processos inflamat´orios, altera¸oes degenerativas c´ıclicas, processos oxicos metab´olicos,
traumatismos ou mesmo como resultados de processos secretores ativos de c´elulas tumorais
[AZEVEDO,1994], conforme a Figura 1.7.
Figura 1.7: Mamografia com presen¸ca de microcalcifica¸oes. Banco de dados MIAS, identifica¸ao Mdb075
fonte: MIAS[SUCKLING, 1994].
O objetivo deste trabalho ´e propor um etodo para classificar as regi˜oes de
interesse (ROI) de mamografias como normal, benigno e maligno, usando An´alise de
Componentes Independentes (ICA), para extrair caracter´ısticas de textura. Em seguida,
estas caracter´ısticas ao utilizadas como parˆametros de entrada para uma rede neural
Perceptron Multicamadas, para efetuar a classifica¸ao final.
20
1.2 Trabalhos Relacionados
Nos ´ultimos anos, arios pesquisadores no mundo em desenvolvido trabalhos
de Diagn´ostico Auxiliado por Computador CAD.
Nicholas Petrick [PETRICK E BERKMAN, 2002 ] desenvolveu um trabalho
baseado em Density-Weighted Contrast Enhancement (DWCE). Nesse trabalho, o filtro
DWCE foi utilizado para acentuar estruturas da mamografia antes da detec¸ao de b ordas,
por reconhecimento adaptativo local. Ap´os a aplica¸ao do filtro DWCE, a detec¸ao de
bordas, utilizando o algoritmo k-means, foi realizada para reconhecer as estruturas que
indicam o aparecimento de uma les˜ao. O sistema obteve uma taxa de sucesso de 82.33%
na classifica¸ao de mamogramas malignos e benignos.
No trabalho de Campanini et al [CAMPANINI et al, 2002], mamogramas
foram classificados em malignos e benignos atrav´es de Support Vector Machines (SVM).
Nesse trabalho, os autores fizeram um reescalonamento bilinear em cada imagem original,
em seguida aplicaram a transformada de wavelet a partir das caracter´ısticas extra´ıdas de
cada mamograma, atrav´es das suas wavelets, foi utilizado SVM para a classifica¸ao final.
O sistema obteve uma sensibilidade de 84%.
Christoyianni et al [CHRISTOYIANNI et al, 2002] compararam trˆes m´etodos:
Gray Level Histogram Moments (GLHM), que utiliza medidas estat´ısticas, como m´edia,
desvio padr˜ao, variˆancia, assimetria, curtose, etc. Esssa medidas estat´ısticas servem como
parˆametros de entrada para um classificador baseado em redes neurais. Spacial Gray
Level Dependence Matrix (SGLD), que ´e constru´ıda a partir da contagem do n´umero
pares de pixels iguais em uma dada janela. A matriz SLGD ´e constru´ıda atrav´es da
probabilidade conjunta de n´ıveis de cinza, e a que distˆancia os pares de pixels ocorrem,
21
e An´alise de Componentes Independentes (ICA), em que o autor utiliza previamente
An´alise de Componentes Principais (PCA), para reduzir os umero de componentes, e
logo ap´os utiliza ICA, para extrair caracter´ısticas significativas de cada imagem, para
posteriormente classific´a-las, com uma rede neural artificial. De acordo com os autores,
ICA obteve a melhor performance, com 88% de sucesso, discriminando os mamogramas
entre normais e anormais, e 79.31% discriminando entre normal, benigno e maligno.
Leite [LEITE et al, 2004] usou (ICA) para classificar mamogramas entre
normais e anormais. Nesse trabalho, os autores utilizaram ICA para extrair caracter´ısticas
de cada imagem, e em seguida, utilizaram PCA para reduzir o vetor de caracter´ısticas,
que serviu de entrada para uma rede neural artificial. O m´etodo conseguiu um percentual
de acerto de 82%, clasificando as mamografias em normais e anormais.
Verma e Zhang [VERMA e ZANGH, 2006], desenvolveram um etodo
baseado em um algoritmo neural-g´en´etico para encontrar as caracter´ısticas mais
significantes em mamografias digitais. Cada popula¸ao indivudual representou uma
solu¸ao candidata para solucionar o problema da sele¸ao do subconjunto mais significante.
Segundo os autores, com a melhor combina¸ao de caracter´ısticas, o etodo obteve 85%
de acerto.
Mousa et al [MOUSA et al, 2005] desenvolveram um sistema baseado em
wavelets e redes neuro-fuzzy. Nesse trabalho, trˆes t´ecnicas ao utilizadas para real¸car
as imagens: Image pruning, equaliza¸ao de histograma thresholding em n´ıveis de cinza.
Em seguida, as caracter´ısticas de cada imagem ao extra´ıdas atrav´es de suas wavelets, e
essas caracter´ısticas servem de entrada para uma rede neuro-fuzzy. Segundo os autores, o
sistema desenvolvido apresentou uma taxa de acerto de 77%, classificando mamogramas
entre normais e anormais.
22
An´alise de Componentes Independentes ´e uma ecnica amplamente utilizada
em processamento de sinais de audio, eletrocardiograma, eletromagnetoencefalograma,
etc. Neste trabalho, ICA ´e aplicado para a extra¸ao de caracter´ısticas de textura em
mamografias digitais, utilizando o algoritmo FastICA. O etodo obteve um desempenho
superior, se comparado aos m´edodos de CAD desenvolvidos at´e o momento.
1.3 Organiza¸c˜ao do Trabalho
Neste trabalho, ´e apresentado o desenvolvimento de um etodo para classificar
les˜oes ou regi˜oes suspeitas de les˜oes em mamogramas. Este trabalho est´a organizado como
segue:
No Cap´ıtulo 2, ao descritos os conceitos de Diagn´ostico Auxiliado por
Computador, as t´ecnicas que ser˜ao utilizadas nesse trabalho, tais como: Processamento de
imagens, an´alise de textura, An´alise de Componentes Independentes (ICA), o algoritmo de
sele¸ao de caracter´ısticas Forward-Selection , e uma breve introdu¸ao sobre redes neurais
Perceptron Multicamadas.
O m´etodo proposto, seu diagrama de blocos e a aplica¸ao de an´alise de
Componentes independentes em processamento de imagens ser´a descrito no Cap´ıtulo
3
No Cap´ıtulo 4 ser´a descrito os materias utilizados, a base de dados e os
softwares utilizados
A aplica¸ao das t´ecnicas descritas e os resultados e discuss˜ao ser˜ao descritos
no Cap´ıtulo 5, e finalmente no Cap´ıtulo 6 ser´a mostrado a conclus˜ao e a proposta de
trabalhos futuros.
23
2 Diagn´ostico Auxiliado por Computador
A comunidade cient´ıfica vˆem reunindo esfor¸cos, no sentido de desenvolver
sistemas de diagn´ostico auxiliado por computador, baseado em t´ecnicas computacionais,
que possam ser utilizadas em conjunto com o exame da mamografia, para que esse erro,
que ´e considerado elevado, possa ser diminu´ıdo.
Diagn´ostico Auxiliado por Computador (CAD) ao sistemas que podem ajudar
o radiologista, fornecendo uma sugest˜ao de diagn´ostico, que pode ser usado nos est´agios
inicias do tratamento. Os CADs contornam problemas que surgem da subjetividade
de um laudo humano, tais como expectativas, pr´e-conceitos e cansa¸co que interferem
negativamente no diagn´ostico do radiologista. Os CADs buscam, assim, baixar as taxas
de falsos positivos, e tamb´em baixar a taxa de falsos negativos.
arios estudos revelam que algoritmos autom´aticos de detec¸ao ao capazes
de proporcionar um aumento de mais de 20% no total de acertos do radiologista e, com
isso, consegue-se evitar bi´opsias desnecess´arias [ZHANG, 2002].
Para que isto ocorra, ´e importante desenvolver ecnicas para detectar e
reconhecer les˜oes e regi˜oes suspeitas e discrimin´a-las. arios m´etodos de diagn´osticos
de les˜oes em mamogramas tem sido desenvolvidos com t´ecnicas variadas e apresentaram
resultados satisfat´orios. Algumas t´ecnicas tem como objetivo maior encontrar um
conjunto de caracter´ısticas que possam diferenciar tecidos de classes diferentes, a chamada
extra¸ao de parˆametros. Posteriormente, esse conjunto de parˆametros que diferenciam
tecidos saud´aveis de tecidos com les˜ao, por exemplo, servir˜ao como entrada para um
24
classificador (uma rede neural, por exemplo), para que se possa fazer a classifica¸ao final.
a outras ecnicas em como objetivo identificar tecidos com caracter´ısticas
suspeitas de les˜ao, atrav´es de algoritmos de agrupamento. Nos par´agrafos seguintes, ser´a
descrita sucintamente cada t´ecnica utilizada no nosso trabalho.
2.1 Processamento Digital de Imagens
O processamento digital de imagens pode ser definido como o conjunto de
t´ecnicas computacionais que transformam uma imagem digital de entrada em uma sa´ıda
desejada que na maioria das vezes tamb´em ´e uma imagem digital. Dessa maneira, ´e
poss´ıvel melhorar o aspecto visual de certas fei¸oes estruturais para o observador humano
e fornecer outros elementos para a interpreta¸ao visual da imagem, podendo inclusive gerar
outros produtos que possam ser posteriormente submetidos a outros processamentos.
Ao longo das duas ´ultimas ecadas, a ´area de processamento de imagens
digitais apresentou um apido crescimento. A evolu¸ao da tecnologia de computa¸ao
digital, bem como o desenvolvimento de novos algoritmos para lidar com sinais
bidimensionais est˜ao permitindo uma gama de aplica¸oes cada vez maior. Na medicina,
por exemplo, o processamento de imagens digitais permite a colora¸ao ou a intensifica¸ao
de contraste para facilitar a interpreta¸ao de radiografias e outras imagens biom´edicas
[GONZALES e WOODS, 1992].
25
2.2 An´alise de Textura
A caracter´ıstica da textura em imagens ´e uma fonte importante de informa¸oes
para o processo de an´alise e interpreta¸ao. arios m´etodos de classifica¸ao de imagens
baseados em an´alise texturais em sido amplamente utilizados, possuindo aplica¸oes na
medicina, microscopia, sensoriamento remoto, controle de qualidade, etc.
A textura ´e definida como uniformidade, densidade, aspereza, regularidade,
intensidade, entre outras caracter´ısticas da imagem. A textura ´e uma das caracter´ısticas
mais importantes para classificar e reconhecer objetos e cenas, e pode ser caracterizada
por varia¸oes locais em valores de pixels que se repetem de maneira regular ou aleat´oria
ao longo do objeto ou imagem [GONZALES e WOODS, 1992].
Neste trabalho, a textura ´e utilizada atrav´es de abordagem estat´ıstica, ou
seja, ´e definida por um conjunto de medidas locais extra´ıdas de um padr˜ao. Medidas
estat´ısticas comuns incluem contraste, energia, entropia, correla¸ao, homogeneidade,
momento, variˆancia, dentre outras. A an´alise de imagens e extra¸ao de suas caracter´ısticas
atrav´es da abordagem estat´ıstica propicia uma descri¸ao da mesma, atrav´es de regras
estat´ısticas que definem a distribui¸ao e a rela¸ao entre seus n´ıveis de cinza. A distribui¸ao
dos n´ıveis de cinza dos pixels pode ser descrita por estat´ısticas de primeira, segunda ou
alta ordem.
2.3 An´alise de Componentes Independentes
A An´alise de Componentes Independentes (Independent Component Analysis-
ICA) ´e um etodo que ´e visto como uma extens˜ao da An´alise de Componentes Principais
26
(Principal Component Analysis-PCA). A ICA foi desenvolvida no contexto de separa¸ao
cega de fontes (Blind Source Separation-BSS), em que o problema ´e definido na estima¸ao
da sa´ıda de uma fonte conhecida, quando esta fonte recebe arios sinais misturados e
desconhecidos. ICA tem sido aplicada em diversas ´areas, como por exemplo: ´audio,
radar, instrumenta¸ao medica, comunica¸ao ovel, engenharia biom´edica, e outras.
ICA ´e utilizado em BSS porque consegue recuperar as fontes ”n˜ao-
observ´aveis”de uma mistura de diversas fontes. O termo blind refere-se ao fato de
que existem fontes ao observ´aveis no sinal e nada ou pouca informa¸ao se tem sobre
a mesma. Uma aplica¸ao interessantede BSS ´e o problema cocktail party, em que separa-
se as fontes originais de um sinal misturado, sem o conhecimento pr´evio dos coeficientes
de mistura, nem a proavel distribui¸ao do sinal, usando apenas independˆencia estat´ıstica
como crit´erio de separa¸ao de fontes [GIROLAMI e FYFE, 1997].
Jutten e erault [JUTTEN e HERAULT, 1991] desenvolveram o primeiro
algoritmo de aprendizado para BSS. Bell e Sejnowski [BELL e SEJNOWSKI, 1995]
desenvolveram uma rede neural capaz de aprender regras que minimizam a informa¸ao
m´utua dos os de sa´ıda. Karhunen e Joutsensalo [KARHUNEN e JOUTSENSALO, 1997]
propuseram algumas varia¸oes ao-linares de PCA, e demonstraram a utilidade destes
algoritmos para estima¸ao de frequˆencia sinusoidais.
Blind Source Separation representa um grande problema na engenharia, pois
a ecnica mais utilizada anteriormente era PCA, que utiliza apenas estat´ıstica de segunda
ordem, o suficiente apenas para descorrelacionar um conjunto de dados, mas ao
necess´ario para independˆencia, que requer estatistica de alta ordem. Por esta raz˜ao, a ICA
´e vista como um etodo mais ”robusto”que PCA, pois se PCA consegue descorrelacionar
as fontes ao observ´aveis, ICA consegue deix´a-los m´utua e estatisticamente independentes
27
entre s´ı.
2.3.1 Defini¸oes
Considere que sejam observadas n misturas lineares x
1
, . . . , x
n
de n
componentes independentes
x
j
= a
j1
s
1
+ a
j2
s
2
+ · · · + a
jn
s
n
j = 1, . . . , n (2.1)
e que cada mistura x
j
, assim como cada comp onente independente s
k
seja uma vari´avel
aleat´oria, e o aj os coeficientes (pesos) da mistura linear.
Sem perda de generalidade, assume-se que tanto as vari´aveis da mistura quanto
aquelas das componentes independentes tˆem m´edia zero. Por conveniˆencia, ser´a usada a
nota¸ao vetorial em vez de somas, como aquelas vistas na Equa¸ao (2.1), utilizando letras
min´usculas e mai´usculas, para representar, respectivamente, vetores e matrizes. Dessa
maneira, podemos reescrever a Equa¸ao (2.1) da seguinte forma:
x = As (2.2)
O objetivo da t´ecnica ´e recuperar as fontes s, atrav´es de x, sem nenhuma
informa¸ao sobre as propriedades de A.
O modelo estat´ıstico definido na Equa¸ao (2.2) ´e chamado de modelo de An´alise
de Componentes Independentes. Esse modelo descreve os dados observados pelo processo
de mistura das componentes independentes s
i
, que ao podem ser observadas diretamente.
´
E preciso estimar tanto s quanto a matriz de mistura A, que tamb´em ´e desconhecida,
pois tudo o que se observa ´e o vetor aleat´orio x.
O problema do modelo de dados de ICA ´e estimar a matriz A usando ap enas a
28
informa¸ao contida na matriz x . Para tanto, ´e preciso fazer suposi¸oes ao gerais quanto
poss´ıvel [HYV
¨
ARINEN, 2001]. Portanto, sup˜oe-se que:
a) As componentes s
i
ao estatisticamente independentes;
b) As componentes em distribui¸oes ao-gaussianas;
c) Por motivos de simplicidade, a matriz A seja quadrada.
2.3.2 Defini¸c˜ao de Independˆencia
Sejam y
1
e y
2
duas vari´aveis aleat´orias. Tais vari´aveis ao ditas independentes
se a ocorrˆencia ou ao ocorrˆencia de y
1
ao influenciar na ocorrˆencia ou ao ocorrˆencia
de y
2
, e vice-versa. Independˆencia estatistica ´e definida em termos de densidade de
probabilidade. Seja p(y
1
, y
2
) a fun¸ao densidade de probabilidade (pdf) conjunta de y
1
e
y
2
. Ent˜ao, p
1
(y
1
) denota a pdf de y
1
:
p
1
(y
1
) =
p(y
1
, y
2
)d
y2
(2.3)
e similarmente para y
2
. Duas vari´aveis aleat´orias ao estat´ıticamente independentes se e
somente se a pdf conjunta for:
p(y
1
, y
2
) = p
1
(y
1
)p
2
(y
2
) (2.4)
Podemos definir descorrela¸ao de duas vari´aveis aleat´orias y
1
e y
2
, com
covariˆancia zero, como:
E(y
1
, y
2
) = E(y
1
)E(y
2
) = 0 (2.5)
29
Se duas vari´aveis ao independentes, tamb´em ao descorrelacionadas, mas o
contr´ario ao ´e verdadeiro.
2.3.3 T´ecnicas de Estima¸c˜ao das Componentes Independentes
Dadas n misturas lineares x
1
, . . . , x
n
de n componentes independentes. Para
estimar as componentes deve-se encontrar a inversa da matriz A, que ´e chamada de W.
A solu¸ao para a estima¸ao das componentes independentes pode ser descrita da forma:
y = Wx = WAs DPs (2.6)
Sendo D uma matriz diagonal ao-singular, e P uma matriz de permuta¸ao
qualquer. Observa-se imediatamente que y
i
´e uma combina¸ao linear de s
i
. Baseado
no teorema do limite central, y
i
´e mais gaussiano do que qualquer s
i
e torna-se menos
gaussiano, quando de fato ´e igual a uma componente de s.
Para finalmente estimar as componentes independentes, deve-se encontrar a
matriz W que minimiza a ao gaussianidade de Wx.
A ao-gaussianidade ´e um elemento chave para a estima¸ao do modelo de ICA,
pois a matrix A ao ´e identic´avel quando as componentes independentes em distribui¸ao
gaussiana. Consideremos que o vetor x ´e distribu´ıdo de acordo com o modelo de ICA na
Equa¸ao 2.1, e que todas as componentes independentes em distribui¸oes iguais. Para
estimar as componentes independentes, basta encontrar as combina¸oes lineares corretas
das vari´aveis da mistura x
i
, de modo a
s = A
1
x (2.7)
30
Assim, pode-se expressar uma combina¸ao linear de x
i
por
y = b
T
x (2.8a)
=
i
b
i
x
i
(2.8b)
= b
T
As (2.8c)
em que b deve ser determinado. A partir da Equa¸ao (2.8c) pode-se observar que y ´e uma
combina¸ao linear de s
i
, com coeficientes dados por q = b
T
A. Logo obtˆem-se
y = q
T
s (2.9a)
=
i
q
i
s
i
(2.9b)
Se b corresponder a uma das linhas da inversa de A, enao y ser´a uma das
componentes independentes e, nesse caso, apenas um dos elementos de q ser´a igual a 1,
enquanto todos os outros ser˜ao iguais a zero. ao ´e poss´ıvel determinar b exatamente,
mas podemos estimar seu valor com boa aproxima¸ao.
Uma forma de determinar b ´e variar os coeficientes em q e ent˜ao verificar
como a distribui¸ao de y = q
T
s muda. a que, conforme o Teorema do Limite Central
[PAPOULIS, 2002], a soma de duas vari´aveis aleat´orias independentes ´e mais gaussiana
que as vari´aveis originais, y = q
T
s normalmente ´e mais gaussiana que qualquer uma das
s
i
e menos gaussiana quando se iguala a uma das s
i
. Nesse caso, apenas um dos elementos
q
i
de q ´e diferente de zero [HYV
¨
ARINEN, 2001].
Como, na pr´atica, os valores de q ao desconhecidos e sabe-se que, atrav´es das
Equa¸oes (2.8a) e (2.9a), que:
b
T
x = q
T
s (2.10)
podemos variar b e observar a distribui¸ao de b
T
x. Portanto, pode-se tomar, como b, um
vetor que maximiza a ao-gaussianidade de b
T
x, sendo que esse vetor necessariamente
31
corresponde a q = A
T
s, vetor esse que possui apenas uma de suas componentes
diferente de zero. Isso significa que y na Equa¸ao (2.8a) ´e igual a uma das componentes
independentes. Logo, a maximiza¸ao da ao-gaussianidade de b
T
x permite encontrar
uma das componentes.
Negentropia como Medida de ao-Gaussianidade
Uma medida importante de ao-gaussianidade ´e a negentropia, que ´e baseada
na entropia. Tomando um vetor aleat´orio y cuja fun¸ao densidade de probabilidade ´e
f(y), tem-se a entropia diferencial dada por
H(y) =
f(y) log f(y) (2.11)
Como um dos resultados fundamentais da Teoria da Informa¸ao, sabe-se que
uma vari´avel gaussiana tem a maior entropia entre todas as vari´aveis aleat´orias de
igual variˆancia [HYV
¨
ARINEN, 2001, PAPOULIS, 2002]. Isso quer dizer que uma vers˜ao
modificada da entropia diferencial pode ser usada como medida de ao-gaussianidade.
Essa medida ´e chamada negentropia, definida por
J(y) = H(y
gauss
) H(y) (2.12)
em que y
gauss
´e uma vari´avel aleat´oria de mesma matriz de covariˆancia que y. A
negentropia ´e sempre ao-negativa, tem valor igual a zero, se e somente se y tem
distribui¸ao gaussiana e ´e invariante para transforma¸oes lineares invers´ıveis.
Em contraste `as suas qualidades como medida de ao-gaussianidade, a
negentropia ´e de dif´ıcil estima¸ao. Por isso, ´e necess´aria a utiliza¸ao de aproxima¸oes
usando, por exemplo, momentos de alta ordem. Logo:
J(y)
1
12
E
y
3
2
+
1
48
kurt(y)
2
(2.13)
32
sendo kurt(y), a curtose de y, ´e definida como o momento de quarta ordem da vari´avel
aleat´oria y, expresso por
kurt(y) = E
y
4
3(E
y
2
)
2
(2.14)
no entanto, essa aproxima¸ao usa a curtose, que ´e uma medida de ao-gaussinidade.
Dessa forma, ´e mais conveniente utilizar outras abordagens, que inclusive substituem os
momentos polinomiais y
3
e y
4
por outra fun¸ao G. O etodo prop˜oe a aproxima¸ao da
negentropia baseado em expectˆancias E . [HYV
¨
ARINEN, 2001]
J(y) k
1
(E{G
1
(y)})
2
+ k
2
(E{G
2
(y)} E{G
2
(v)})
2
(2.15)
sendo k
1
e k
2
constantes positivas, v uma vari´avel gaussiana de m´edia zero, e G
1
{y} = y
3
e G
2
{y} = y
4
2.4 Sele¸c˜ao de Caracter´ısticas mais Significantes
Foward-Selection ´e um etodo para encontrar a melhor combina¸ao de
caracter´ısticas (vari´aveis) iniciando com uma ´unica caracter´ıstica, e incrementando mais
caracter´ısticas, passo a passo [ORR, 1999]. Dessa forma, cada caracter´ıstica ´e adicionada
no modelo de cada vez. A cada passo, cada caracter´ıstica que ainda ao pertence ao
modelo ´e testada para ser incluida. As caracter´ısticas mais significativas, ou seja, que
mostram um maior decr´escimo na fun¸ao de erro descrita acima ao adicionados ao
modelo, at´e que se consiga um subconjunto p, menor que o conjunto P selecionado.
Na t´ecnica Forward-Selection, cada etapa envolve o crescimento da rede pela
adi¸ao de uma fun¸ao base (ou seja, uma caracter´ıstica). Adicionar uma fun¸ao base nova
33
´e uma das opera¸oes incrementais. A equa¸ao fundamental da t´ecnica ´e:
P
m+1
= P
m
P
m
.f
j
.f
T
j
P
m
f
T
j
.P
m
f
j
(2.16)
que expressa a rela¸ao entre P
m
, a matriz de proje¸ao de m camadas escondidas do
subconjunto corrente e P
m+1
, a proje¸ao sucedente do j-´esimo membro do ´ultimo conjunto
de caracter´ısticas adicionado. Os vetores {f
j
}
M
J=1
ao colunas de um conjunto selecionado
de fun¸oes-bases
F = [f
1
, f
2
, f
M
] (2.17)
sendo M m
A escolha das fun¸oes bases ´e baseada em encontrar erro-m´edio-quadr´atico.
Das regras de atualiza¸ao para a matriz de proje¸ao e da equa¸ao para o erro
T
m
T
m+1
=
(y
T
.P
m
.f
j
)
2
f
T
j
.P
m
.f
j
(2.18)
sendo T
m
o conjunto anterior e T
m+1
o conjunto atual.
2.5 Redes Neurais como Classificadores
As Redes Neurais Artificiais (RNA’s) foram desenvolvidas, originalmente, na
d´ecada de 40, pelo neurofisiologista Warren McCulloch e pelo matem´atico Walter Pitts,
que dentro do esp´ırito cibern´etico, fizeram uma analogia entre c´elulas nervosas vivas e
o processo eletrˆonico num trabalho publicado sobre ”neurˆonios formais”. O trabalho
consistia num modelo de resistores vari´aveis e amplificadores representando conex˜oes
34
sin´apticas de um neurˆonio biol´ogico.
Desde enao, mais enfaticamente a partir da d´ecada 80, diversos modelos
de redes neurais artificiais tˆem surgido com o prop´osito de aperfei¸coar e aplicar esta
tecnologia. A Figura 2.1 apresenta a arquitetura de uma RNA.
Figura 2.1: Arquitetura de RNA com duas sa´ıdas.
As variantes de uma rede neural ao muitas, e combinando-as, pode-se mudar
a arquitetura conforme a necessidade da aplica¸ao. Basicamente, os itens que comp˜oem
uma rede neural e, portanto, sujeito a modifica¸oes, ao os seguintes:
- Conex˜oes entre camadas;
- Camadas intermedi´arias;
- Quantidade de neurˆonios;
- Fun¸ao de transferˆencia;
- Algoritmo de aprendizado;
Todas as RNA’s possuem alguma regra de treinamento, em que os pesos de
suas conex˜oes ao ajustados de acordo com os padr˜oes apresentados, de tal forma que
pode-se dizer que uma importante propriedade ´e a capacidade do aprendizado. Isso ´e
feito atrav´es de um processo iterativo de ajustes aplicados aos pesos das conex˜oes ao
35
qual denomina-se treinamento. O aprendizado ocorre quando a RNA atinge uma solu¸ao
generalizada para uma classe de problemas.
Um conjunto de regras bem definidas para que a RNA possa aprender a
solu¸ao de um problema ´e chamado de algoritmo de aprendizado. Existem muitos
algoritmos de aprendizado espec´ıficos para determinados modelos de redes neurais, estes
algoritmos diferem entre si principalmente pelo modo como os pesos ao modificados.
Outro p onto importante ´e a categoriza¸ao das situa¸oes de aprendizado das RNA’s.
Neste contexto pode-se citar as seguintes classes de aprendizado [BRAGA, 2000],
[KROSE e SMAGT, 1996]:
- Aprendizado Supervisionado, quando ´e utilizado um agente externo que
indica `a rede a resposta desejada para o padr˜ao de entrada;
- Aprendizado ao Supervisionado, quando ao existe um agente externo
indicando a resposta desejada para os padr˜oes de entrada.
2.5.1 Redes Neurais Perceptron Multicamadas
As Redes Neurais Perceptron Multicamadas (MLP) ao as redes neurais
mais frequentemente usadas em reconhecimento de padr˜oes [DUDA e HART, 1973],
[BISHOP, 1999]. Uma RNA do tipo MLP ´e constitu´ıda por um conjunto de os fonte, os
quais formam a camada da entrada da rede (input layer), uma ou mais camadas escondidas
(hidden layers), e uma camada de sa´ıda (output layer), que extraem informa¸oes durante
o aprendizado, e atribuindo coeficientes (pesos) `as camadas de entrada.
O n´umero de os fonte na entrada da rede ´e determinado pela dimensionalidade
do espa¸co de observao, que ´e respons´avel pela gera¸ao dos sinais de entrada. O n´umero
36
de neurˆonios na camada de sa´ıda ´e determinado pela dimensionalidade requerida na
resposta desejada. Assim, o projeto de uma rede MLP requer a considera¸ao de trˆes
aspectos:
I) A determina¸ao do n´umero de camadas escondidas;
II) A determina¸ao do n´umero de neurˆonios em cada uma das camadas
escondidas;
III) A especifica¸ao dos pesos sin´apticos que interconectam os neurˆonios nas
diferentes camadas da rede.
Os aspectos I e I I determinam a complexidade do modelo da RNA escolhida,
e infelizmente, ao a regras determinadas para tal especifica¸ao. A fun¸ao das camadas
escondidas em uma RNA ´e a de influir na rela¸ao entrada-sa´ıda da rede de uma forma
ampla. Uma RNA com uma ou mais camadas escondidas ´e apta a extrair as caracter´ısticas
de ordem superior de algum desconhecido processo aleat´orio subjacente, respons´avel pelo
comportamento dos dados de entrada, processo sobre o qual a rede est´a tentando adquirir
conhecimento. A RNA adquire uma perspectiva global do processo aleat´orio, apesar
de sua conectividade local, em virtude do conjunto adicional de pesos sin´apticos e da
dimens˜ao adicional de intera¸oes neurais proporcionada pelas camadas escondidas.
O aspecto III envolve a utiliza¸ao de algoritmos de treinamento supervisionado.
As RNA’s MLP’s tˆem sido aplicadas na solu¸ao de diversos e dif´ıceis problemas atrav´es
da utiliza¸ao de tais algoritmos [?]. O algoritmo de treino geralmente utilizado ´e
o algoritmo de retropropaga¸ao, popularmente conhecido como backpropagation. O
algoritmo backpropagation baseia-se na heur´ıstica do aprendizado por corre¸ao de erro.
Este algoritmo pode ser visto como uma generaliza¸ao do algoritmo LMS (Least Mean
37
Square), desenvolvido por Bernard Widrow [WIDROW, 1985]. Basicamente, o algoritmo
backpropagation consiste de dois passos atrav´es das diferentes camadas do MLP: um passo
direto e um passo reverso.
- No passo direto, um padr˜ao de atividade do processo a ser aprendido (ou
vetor de entrada) ´e aplicado ao os de entrada do MLP e o seu efeito se propaga atrav´es
da rede, camada por camada, produzindo na camada de sa´ıda a resposta do MLP a
excita¸ao aplicada (vetor de sa´ıda). Durante o passo direto os pesos sin´apticos ao todos
fixos.
- No passo reverso, os pesos sin´apticos ao todos ajustados de acordo com
a regra de aprendizado por corre¸ao de erro. Especificamente, a resposta do MLP `a
excita¸ao ´e subtra´ıda de um padr˜ao de resposta desejado para aquela excita¸ao aplicada,
de forma a produzir um sinal de erro, de forma semelhante ao algoritmo LMS, como mostra
a Figura 2.2. Este sinal de erro ´e, enao, propagado de volta aos mesmos neurˆonios
utilizados no passo direto, mas no caminho contr´ario do fluxo de sinal nas conex˜oes
sin´apticas- da´ı o nome Backpropagation. Os p esos sin´apticos ao, ent˜ao, ajustados de
forma que a resposta obtida da MLP aproxime-se mais do padr˜ao de resposta desejado,
de tal forma que
e
j
(n) = d
j
(n) y
j
(n) (2.19)
em que e
j
´e o sinal de erro, d
j
o sinal desejado e y
j
o sinal direto
O modelo de cada neurˆonio MLP inclui uma fun¸ao de ativao ao-linear.
´
E
importante salientar que esta ao linearidade ´e suave, ao contr´ario da fun¸ao utilizada
no modelo Perceptron de Rosemblat (fun¸ao Sigm´oide). Uma forma comumente utilizada
38
Figura 2.2: Ilustra¸ao das dire¸oes de dois fluxos asicos de um sinal em uma rede MLP: Propaga¸ao
direta dos sinais e a retro-propaga¸ao dos sinais de erro.
de ao linearidade que satisfaz este requisito ´e a ao linearidade sigmodal definida pela
fun¸ao log´ıstica:
y
j
=
1
1 + exp(v
j
)
(2.20)
sendo v
j
o potencial de ativao (isto ´e, a soma ponderada de todas as entradas sin´apticas
mais a polariza¸ao), do neurˆonio e y
j
´e a sa´ıda do neurˆonio.
Durante o treinamento, As MLP’s controem um espa¸co multi-dimensional
definido pela ativao dos os das camadas escondidas, de mo dos que as classes sejam
mais separ´aveis poss´ıvel. A superf´ıcie de separa¸ao se adapta aos dados.
39
3 O etodo Proposto
Todas as ecnicas descritas anteriormente foram aplicadas no etodo
desenvolvido. A partir das mamografias utilizadas no trabalho, foram selecionadas as
regi˜oes de interesse (ROI). O diagrama do m´etodo proposto ´e mostrado na Figura 3.1,
que consiste na sele¸ao das regi˜oes de interesse, na extra¸ao das caracter´ısticas estatisticas
da imagem usando ICA, a sele¸ao de caracter´ısticas mais significantes, usando a t´ecnica
Forward-Selection e a decis˜ao final do diagn´ostico, usando redes neurais Multilayer
Perceptron.
Figura 3.1: Diagrama do m´etodo proposto.
3.1 ICA aplicado em Processamento de Imagens
Generalizando para processamento de imagens, ICA ´e capaz de encontrar
imagens-bases que originaram uma determinada mistura, a partir de uma imagem
observada, supondo independˆencia estat´ıstica entre elas, ou seja, tendo observado um
conjunto de dados, e supondo que eles tenham sido gerados a partir de uma mistura de
40
outros dados. A t´ecnica ´e capaz de estimar imagens-bases que originaram a mistura, e os
pesos de cada fonte na mistura, a partir da an´alise estat´ıstica da imagem observada.
Hubel e Wiesel [HUBEL e WIESEL, 1968] realizaram experimentos cl´assicos
em neurˆonios do ortex visual e chegaram a conclus˜ao que o ortex visual funciona com
um detector de caracter´ısticas. Barlow [BARLOW, 1989] conduziu assim a proposta que
nosso ortex visual, detector de caracter´ısticas, pode trabalhar com processos de redu¸ao
de redundˆancia [BARLOW, 1989], em que a ativao de cada detector de caracter´ısticas,
´e estatisticamente independente dos outros detectores o quanto poss´ıvel. Tal codifica¸ao
envolve a dependˆencia estatistica de todas as ordens, mas a grande maioria dos estudos
usam estat´ısticas de segunda ordem, PCA por exemplo, em que a estat´ıtica de segunda
ordem ´e suficiente apenas para descorrelacionar um conjunto de sa´ıdas de um detector de
caracter´ısticas, e ao remover a independˆencia estat´ıstica entre os detectores. Por essa
raz˜ao, PCA ao ´e suficiente para predizer a forma¸ao de detectores de caracter´ısticas.
O sistema perceptual ´e exposto para uma s´erie de pequenas janelas, como mostra a
Figura 3.2, extra´ıdas de uma ou mais imagens maiores. Considere que sejam observadas
n janelas aleat´orias x
1
, x
2
, .., x
n
de uma imagem, modelada por uma combina¸ao linear de
n fun¸oes-bases:
x
n
= a
1
.s
j1
+ a
2
.s
j2
+ a
3
.s
j3
+ .. + a
n
.s
jn
(3.1)
em que cada janela x
n
, assim como cada componente independente s
n
, que no nosso
caso chama-se de imagem-base, seja uma vari´avel aleat´oria. Sem perda de generalidade,
pode-se reescrever a equa¸ao acima da mesma da Equa¸ao 2.2
41
x = A.s (3.2)
´
E preciso estimar tanto a matriz de imagens-bases s, quanto a matriz de
componentes independentes A, que tamb´em ´e desconhecida, pois temos apenas o conjunto
de janelas X.
Figura 3.2: Modelo de separa¸ao linear de imagens.
Cada componente deste vetor tem sua pr´opria fun¸ao base associada, e
representa uma fonte ao-observada da imagem (imagem-bases).
O objetivo do sistema perceptual ´e transformar as janelas x, linearmente, com
a matriz de filtros W , resultando enao em um vetor:
u = W.x (3.3)
recuperando assim as imagens-bases ao-observadas s, possivelmente de ordem diferente.
Representando por P , uma matriz de permuta¸ao arbitr´aria, e por S, uma
matriz de escalonamento arbitraria, tal sistema converge para:
42
u = WAs = PSs (3.4)
O escalonamento e a permuta¸ao das fontes s ´e arbitr´ario. Assim, considera-se
as fontes a serem definidas, tal que P.S = I (sendo I a matriz identidade). As fun¸oes
bases (colunas de A) e os filtros que recuperam as fontes (linhas de W ), tem a seguinte
rela¸ao:
W = A
1
(3.5)
Tudo que falta agora ´e definir um algoritmo de aprendizado para encontrar W
(e tamb´em A), para enfim estimarmos as fontes s, o que foi visto na se¸ao 2.3.3.
43
4 Material
Neste cap´ıtulo ser´a descrita a base de dados e os softwares utilizados.
4.1 Base de dados MIAS
A base de dados utilizada neste trabalho foi cedida pelo Mammographic
Institute Analisys Society [SUCKLING, 1994]. Esta base de dados ´e composta por 322
mamogramas de mamas esquerda e direita, de 161 pacientes, sendo 53 mamogramas
com diagn´ostico maligno, 69 com diagn´ostico benigno, e 206 de diagn´ostico normal. As
mamografias em um tamanho de 1024x1024 pixels, e resolu¸ao de 200 micron. As
anormalidades ao classificadas de acordo com a classe encontrada (calcifica¸ao, massa
circusncrita, distor¸oes arquiteturais, assimetrias, e outras massas, sem formas definidas).
Esta base de dados cont´em tamb´em um arquivo, explicando detalhadamente
cada mamografia, como por exemplo, a classe da anormalidade, as coordenadas xy do
centro da anormalidade, e o raio aproximado da anormalidade, em pixels. A Tabela 4.1
mostra detalhes de algumas mamografias utilizadas.
Desta base de dados, selecionamos 50 mamografias com diagn´ostico benigno,
50 com diagn´ostico maligno, e 200 com diagn´ostico normal, somando no total 300
mamografias. De cada mamograma, as regi˜oes de interesse (ROI) foram selecionadas
manualmente, contendo a les˜ao, no caso de mamografias com diagn´ostico maligno e
benigno. as ROIs foram selecionadas atrav´es das coordenadas xy da imagem, do centro
44
Tabela 4.1: Exemplo do diagn´ostico mostrado em algumas mamografias da base de dados MIAS
N´umero Classe Anormalidade Diagn´ostico Coordenadas Raio (pixels)
mdb001 G CIRC B 535 , 425 197
mdb002 G CIRC B 522 , 280 69
mdb003 D N
mdb004 D N
mdb005 F CIRC B 477 , 133 30
mdb005 F CIRC B 500 , 168 26
mdb006 F N
mdb007 G N
da anormalidade, informa¸ao essa obtida da pr´opria base de dados. Para mamogramas
normais, foi selecionada aleatoriamente uma ROI. Somente o m´usculo p eitoral ao foi
considerado ROI, mas tecido granular e tecido gorduroso foi considerado. Cada ROI tinha
tamanhos diferentes, ent˜ao foi preciso reescalonar cada ROI. Sendo assim, cada regi˜ao de
interesse ficou com um tamanho de 24x24 pixels. A Figura 4.1 exemplifica a sele¸ao das
ROI’s de mamogramas de diagn´ostico benigno, maligno e normal, respectivamente.
Figura 4.1: Sele¸ao das ROI’s de tecidos benignos, malignos e normais.
45
4.2 Softwares Utilizados
Ap´os a sele¸ao das regi˜oes de interesse (ROI) de cada mamograma, utilizamos
o software MatLab, para gerar a matriz de coeficientes A, atrav´es do algoritmo FastIca.
Logo ap´os, foi necess´ario fazer uma sele¸ao de caracter´ısticas encontradas de cada ROI, a
que o vetor de entradas para rede neural ficaria muito grande, o que poderia comprometer
o desempenho da rede. A sele¸ao de caracter´ısticas foi realizada atraes do algoritmo
Foward-Selection. Depois de escolhidas as caracter´ısticas mais significantes de cada
ROI, tais caracter´ısticas serviram de entrada para a rede neural artificial Perceptron
Multicamadas, para que fosse dada a decis˜ao final de diagn´ostico. Tanto a sele¸ao de
caracter´ısticas, como a classifica¸ao atrav´es da rede neural foram realizadas pelo programa
Trajan Neural Networks.
46
5 Resultados e Discuss˜ao
Neste cap´ıtulo, ser´a descrito a aplica¸ao das t´ecnicas utilizadas no m´etodo
proposto, os resultados encontrados e a discuss˜ao do resultados.
5.1 Extra¸c˜ao de Parˆametros Utilizando ICA
Considera-se que uma imagem ´e formada pela soma de imagens bases
s
1
,.., s
n
, estatisticamente independentes entre s
1
. A imagem enao ´e formada
por uma combina¸ao linear das imagens s, n imagens-bases modeladas por uma
combina¸ao linear de n vari´aveis a
1
, a
n
, como observado na Figura 5.1:
[CHRISTOYIANNI et al, 2002],[HYV
¨
ARINEN, 2001].
x
i
= a
i1
.s
1
+ a
i2
.s
2
+ ... + a
in
.s
n
(5.1)
Figura 5.1: Regi˜ao de interesse com uma combina¸ao linear de imagens bases m´utua e estatisticamente
independentes entre si.
No modelo acima, apenas as vari´aveis x
i
ao conhecidas, e a partir delas ser˜ao
estimados os coeficientes da mistura a
i
j e as componentes independentes s
j
, ou seja:
x = A.s (5.2)
47
Sendo x a matriz de mistura, A as fun¸oes-bases e s as fontes que comp˜oem a
imagem.
Na equa¸ao, x foi representada usando as ROI’s escolhidas de cada mamografia.
As imagens com as ROI’s foram reescalonadas para um tamanho de 24x24 pixels, e
transformadas em um vetor unidimensional, de tamanho:
P = P
x
.P
y
(5.3)
sendo Px as linhas, e Py as colunas de P, e P tendo um tamanho de 1x 576.
Cada amostra representa uma linha da matriz de mistura. A matriz
x ´e representada por amostras na dimens˜ao de P, ou seja, 1x576. Ent˜ao, cada
linha da matriz A corresponde a uma ROI, e cada coluna corresponde a um peso
atribu´ıdo para a imagem base, ou seja, um parˆametro de entrada para a rede neural
[CHRISTOYIANNI et al, 2002].
O algoritmo ultilizado pra fazer a extra¸ao de parˆametros atrav´es de ICA foi o
FastICA, que ´e um algoritmo comumente utilizado para resolver problemas de separa¸ao
cega de fontes (BSS), onde queremos estimar as fun¸oes bases a partir da matriz de
mistura X.
Este algoritmo ´e baseado em itera¸oes de ponto fixo [HYV
¨
ARINEN e OJA, 1997],
[HYV
¨
ARINEN, 1997], [HYV
¨
ARINEN, 1999]. Em Hyvarinen [HYV
¨
ARINEN e OJA, 1997],
o algoritmo de ponto fixo foi introduzido usando curtose, e em [HYV
¨
ARINEN, 1997],
[HYV
¨
ARINEN, 1999], o algoritmo FastIca foi generalizado para outras fun¸oes. Para
dados pr´e-processados por branqueamento (whitening), o algoritmo FastIca tem a seguinte
forma:
48
w(k) = E{x.g(w(k 1)
T
x)} E{g
(w(k 1)
T
x)}w(k 1) (5.4)
em que o vetor de pesos w ´e enao normalizado para a norma unit´aria ap´os cada itera¸ao,
e
w
1
= A (5.5)
A fun¸ao g ´e derivada da fun¸ao G usada nas fun¸oes de custo em geral,ou seja:
J
G(y)
= |E
y
{G(v)}|
p
(5.6)
sendo v uma vari´avel aleat´oria, y normalizado para variˆancia unit´aria, e o expoente p=1,2.
Uma forma asica do algoritmo FastICa ´e dado como segue:
1. Escolha um vetor inicial aleat´orio w;
2. Fca w
+
= E{xg(w
T
x)} E{g
(w
T
x)}w;
3. Fca w =
w
+
w
+
;
4. Se ao convergir, volta ao passo 2.
As esperan¸cas ao estimadas, na pr´atica, usando a m´edia das amostras sobre
uma quantidade suficiente grande dos dados de entrada.
Dentre as vantagens do algoritmo FastIca, podemos citar a apida
convergˆencia, a simplicidade do algoritmo, e seu processamento paralelo, distribu´ıdo,
computacionalmente simples, que requer pouco espa¸co de mem´oria.
49
Usando o algoritmo FastICA e a matriz x, obtemos a matriz de fun¸oes bases
A , que cont´em as caracter´ısticas de cada amostra.
A Figura 5.2 exemplifica as imagens bases encontradas usando as fun¸oes bases
das ROI’s malignas, benignas e normais, respectivamente. Podemos observar claramente
a diferen¸ca entre as imagens bases de cada classe. Ent˜ao, pode-se observar que as fun¸oes
bases dos tecidos benignos ao diferentes das fun¸oes bases dos tecidos malignos.
Figura 5.2: Amostra de imagens bases obtidas de ROI’s de tecidos normais, benignos e malignos.
5.2 Vari´aveis Selecionadas
As 300 amostras da base de dados foram divididas em 150 para treino da rede,
e 150 para teste. Sendo assim, dividiu-se a matriz X, de dimens˜ao 300x576, em x
treino
,
e em x
teste
, ambas de dimens˜ao 150x576. Como o algoritmo FastIca gera a matriz de
caracter´ısticas A quadrada , enao cada ROI era composta de um vetor de caracter´ısticas
de dimens˜ao 1x150 . Das 150 caracter´ısticas de cada ROI, o algoritmo Forward-Selection
selecionou apenas 45, sendo as mais significantes do conjunto.
50
5.3 Configura¸c˜ao da Rede Neural MLP
O programa Trajan Neural Networks selecionou as cinco melhores
configura¸oes de redes neurais MLP. O n´umero de neurˆonios na camada escondida foi
incrementado at´e 50, por´em a rede com 21 neurˆonios apresentou melhor desempenho. O
erro encontrado no treinamento foi de 0,008, que, segundo o programa utilizado, indicou
que a rede neural escolhida a estava especializada. Sendo assim, a melhor rede neural
MLP encontrada ficou com a seguinte configura¸ao: 45 neurˆonios na camada de entrada,
21 na camada escondida e 3 na camada de sa´ıda, conforme mostra a Figura 5.3:
Figura 5.3: Configura¸ao de rede neural MLP, com 45 neurˆonios de entrada, 21 na camada intermedi´aria,
e 3 neurˆonios na camada de sa´ıda.
A Tabela 5.1 mostra o desempenho da aplica¸ao da ecnica de ICA com redes
neurais MLP para a classifica¸ao de cada ROI em malignas, benignas e normais.
5.4 Discuss˜ao
Baseado na Tabela 5.1, o etodo obteve uma taxa de sucesso edia de 97,83%,
discriminando ROI de tecidos malignos, benignos e normais.
Considerando que toda mamografia onde foi encontrada algum tipo de les˜ao,
51
Tabela 5.1: Classifica¸ao das ROI de tecidos Benignos, Malignos e Normais
Benigno Maligno Normal
Benigno 48 0 5
Maligno 0 50 0
Normal 2 0 195
Sucesso (%) 96 100 97,5
seja benigna ou maligna, foi considerado anormal, e que todo mamograma sadio foi
considerado normal, a Tabela 5.2 mostra a classsifica¸ao das ROI’s em normais e anormais.
Tabela 5.2: Classifica¸ao das ROI’s em normais e anormais
Normal Anormal
Normal 195 2
Anormal 5 98
Sucesso (%) 97.5 98
Sensibilidade e especificidade ao as medidas mais utilizadas para descrever um
sistema de diagn´ostico. Sensibilidade (S) ´e a propor¸ao de verdadeiros positivos que ao
corretamente identificados pelo teste, e ´e definida por S = VP/(VP+FN). Especificidade
(E) ´e propor¸ao de verdadeiros negativos que ao corretamente identificados no teste, e ´e
dada por E= VN/(VN+FP). Sendo FN Falso Negativo, FP Falso Positivo, VN Verdadeiro
Negativo e VP Verdadeiro Positivo.
Baseado na Tabela 5.2, a Especificidade encontrada foi de 97,5% e a
sensibilidade de 98,00%. O m´etodo obteve 98 diagn´osticos verdadeiro-positivos, 195
verdadeiro-negativos, 5 falso-positivos e 2 falso negativos.
O erro encontrado, levando em considera¸ao as trˆes classes (normal, benigna e
52
maligna), foi de apenas 2,17%, que al´em de pequeno pode ser justificado. Na sele¸ao das
ROI’s, as mesmas foram capturadas como um quadrado de dimens˜ao XY, mas todas as
les˜oes tinham formas diferente de um quadrado. Assim, al´em de capturar a les˜ao, no caso
de mamografias com diagn´ostico anormal, tamb´em foi capturado tecido sadio da mama.
O programa Trajan Neural Networks indicou que, com o erro de 0,008, a rede
a estava especializada, por´em ao indicou se todas as 150 amostras que foram reservadas
para o teste foram utilizadas, ou seja, ao se soube se para chegar a especializa¸ao da
rede foram necess´arias todas as 150 amostras.
53
6 Conclus˜ao e trabalhos futuros
Este trabalho prop˜oe um m´etodo de classifica¸ao de mamogramas digitais
utilizando An´alise de Componentes (ICA) e Redes Neurais Perceptron Multicamadas. O
m´etodo proposto utilizou o algoritmo FastICA para extrair um conjunto de caracter´ısticas
em conjunto com a t´ecnica Foward Selection, para selecionar as caracter´ısticas mais
significantes para que cada ROI pudesse ser melhor representada. O conjunto destas
t´ecnicas permitiu que o resultado encontrado fosse melhor que em m´etodos que utilizam-
se de outras t´ecnicas.
O presente resultado demonstrou que a ecnicas utilizadas neste trabalho
conseguiram classificar tecidos normais, tecidos de les˜oes benignas e malignas. Observou-
se tamb´em, que a rede neural MLP obteve uma taxa de sucesso edia de 97.83%, com um
erro de apenas 2,7%. Com um erro menor, pode-se obter um menor umero de bi´opsias
desnecess´arias, e tamem um menor n´umero de casos de ancer descobertos tardiamente.
Relacionando com trabalhos anteriores, o etodo proposto utilizou o algoritmo
FastIca em conjunto com algoritmo de sele¸ao de caracter´ısticas Foward-Selection,
ao passo que no m´etodo descrito em [CHRISTOYIANNI et al, 2002], que obteve
com resutado 79.31% discriminando mamogramas de diagn´ostico normais, malignos e
benignos, utilizou o algoritmo Infomax, em conjunto com redes neurais com Fun¸ao de
Ativao de Base Radial.
A partir do proposto no presente trabalho, futuramente, pretende-se:
- Testar a efic´acia do m´etodo com uma base de dados regional, ainda em fase
54
de constru¸ao.
- Elaborar um programa, que seja de baixo custo computacional e simples de
ser manuseado, para ser utilizado por m´edicos e radiologistas.
- Adaptar o m´etodo para classifica¸ao de outras estruturas, que utilizem como
entrada raio-x, por exemplo: odulo pulmonar.
Este trabalho deu origem aos seguintes artigos:
- L´ucio F. A. Campos, Arist´ofanes C. Silva, Allan Kardec Barros:
”Independent Component Analysis and Neural Networks Applied for Classification of
Malignant, Benign and Normal Tissue in Digital Mammography”, V International
Workshop on Biosignal Interpretation, Japan, May 2005
- L´ucio F. A. Campos, Arist´ofanes C. Silva, Allan Kardec Barros: ”Diagnosis
on Breast Cancer Using Independent Component Analysis and Neural Networks ”, X
CIARP - LNCS 3773 - Springer- Verlag Ed.
- L´ucio F. A. Campos, Arist´ofanes C. Silva, Allan Kardec Barros:
”Independent Component Analysis and Neural Networks Applied for Classification of
Malignant, Benign and Normal Tissue in Digital Mammography”, Escolhido como Special
Issue do ”V International Workshop on Biosignal Interpretation, Japan”a ser publicado
no Journal of Methods of Information in Medicine, no final de 2006.
Referˆencias
[AZEVEDO,1994] AZEVEDO, C. M. , Radiologia da Mama. Rio de Janeiro, INCa, 1994.
[BAUER,1980] BAUER, W.; IGOT, J.P.; LE, G.Y.: Chronologic du cancer mammaire
Utilisant un Modele de Croissance de Gompertz. Ann Anat Pathol 25:39-56, 1980
[BOYD,1995] BOYD, N.F.; BYNG, J.W.; JONG, R.A.; FISHELL, E.K.; LITTLE,
L.E.; MILLER, A.B.; LOCKWOOD, G.A.; TRITCHLER, D.L.; YAFFE, M.J.
Quantitative classification of mammographic densities and breast cancer risk: results
from the canadian national breast screening study. Journal of the National Cancer
Institute, v. 87, p. 670-675, 1995.
[BLAND,2000] BLAND, K.I.; COPELAND, E.M.: A Mama: Tratamento Compreensivo
das Doen¸cas Benignas e Malignas, Ed., Manole Ltda
[BARLOW, 1989] BARLOW H.B.1989. Unsupervised learning . Neural Computation 1.
295-311.
[BELL e SEJNOWSKI, 1995] BELL A. J. , SEJNOWSKI T. J, 1995. An information
maximization approach to blind separation and blind deconvolution. Neural
Computation, 7, 1129,1159.
[BRAGA, 2000] BRAGA, A.P . Redes neurais Artificiais, teoria e aplica¸oes, LTC. 2000.
[BISHOP, 1999] BISHOP, C.M.: Neural Networks for Pattern Recognition. Oxford
University Press, New York (1999)
[CAVALCANTE, 2006] CAVALCANTE, Andr´e B.; MANDIC, Danilo P.; RUTKOWSKI,
Tomasz; BARROS, Allan K. Speech Enhancement Based on the Response Features of
Facilitated EI Neurons. Proceedings of 6th International Conference on Independent
Component Analysis and Blind Source Separation, Mar¸co 2006, Charleston, South
Carolina, USA.
[CAMPANINI et al, 2002] CAMPANINI Renato, BAZZANI Armando, et al. A novel
approach to mass detection in digital mammography based on Support Vector
Machines (SVM). In proceedings of th the 6 International workshop in digital
Mammography (IWDM), pages 399-401, Bremem, Germany, 2002, Springer Verlag.
[CASTRO] CASTRO, F.C., CASTRO, M.C.: Multilayer Perceptron. Notas de aula do
Mestrado en Engenharia El´etrica da PUCRS.2004
[CHRISTOYIANNI et al, 2002] CHRISTOYIANNI I., KOUTRAS A., KOKKINAKIS
G., ”Computer aided diagnosis of breast cancer in digitized mammograms”, Comp.
Med. Imag. e Graph., 26:309-319, 2002.
56
[COMON, 1994] COMON P. 1994. Independent component analysis,a new concept?
Signal Processing, 36, 287-314.
[COVER e THOMAS, 1990] COVER T.M. , THOMAS J.A. Elements of information
theory . John Wiley.
[DUDA e HART, 1973] DUDA, R.O., HART, P.E.: Pattern Classification and Scene
Analysis. Wiley- Interscience Publication, New York (1973)
[GONZALES e WOODS, 1992] GONZALES, R.C.; WOODS, R. E. Digital image
processing. Addison Wesley, 1992.
[GIROLAMI e FYFE, 1997] GIROLAMI M., FYFE C.: An extended exploratory pursuit
network with linear and non-linear anti-hebbian lateral connections applied to the
cocktail party problem. Neural Networks, 10:1607-1678,1997
[HANCOCK e BADDELEY, 1992] HANCOCK P.J.B., BADDELEY R.J. , Smith
L.S.1992. The principal components of natural images. Network, 3, 61-72.
[HUBEL e WIESEL, 1968] HUBEL D.H., WIESEL T.N.. Receptive fields and functional
architecture of monkey striate cortex. Journal Physiology., 195:215 244.
[HYV
¨
ARINEN e OJA, 1997] HYV
¨
ARINEN and E. OJA. A fast fixed-point algorithm for
independent component analysis. Neural Computation, 9(7):1483-1492, 1997.
[HYV
¨
ARINEN, 1997] HYV
¨
ARINEN, Aapo. A family of fixed-point algorithms for
independent component analysis. In Proc. IEEE Int. Conf. on Acoustics, Speech
and Signal Processing (ICASSP’97), pages 3917-3920, Munich, Germany, 1997.
[HYV
¨
ARINEN, 1999] HYV
¨
ARINEN,Aapo . Fast and robust fixed-point algorithms for
independent component analysis. IEEE Trans. on Neural Networks, 1999.
[HYV
¨
ARINEN, 2000] HYV
¨
ARINEN A. OJA, E. Indep endent Component Analysis:
Algorithms and Applications. Neural Networks, 13(4-5):411-430, 2000.
[HYV
¨
ARINEN, 2001] HYV
¨
ARINEN A., KARHUNEN J., OJA E. Independent
Component Analysis. Nova York: John Wiley & Sons. 2001. 481p.
[INCa,2005] INCa, Instituto Nacional do ancer. Endere¸co na internet:
http://www.inca.gov.br/acessado em 04/05/2005.
[JUTTEN e HERAULT, 1991] JUTTEN C., HERAULT J. Blind separation of sources.
signal processing, 24:1-10,1991.
[KARHUNEN e JOUTSENSALO, 1997] KARHUNEN J., JOUTSENSALO J.
Representation and separation of signals using nonlinear PCA type learning.
Neural Networks, 8:486-504,1997.
[KROSE e SMAGT, 1996] KROSE B. ,SMAGT P. An Introduction to neural Networks.
University of Amsterd˜a. 1996
[LEITE et al, 2004] LEITE L. ,SILVA E. A. B. da , e PEREIRA W. C. A.(2004).An´alise
de Componentes Independentes Aplicada `a identifica¸ao de regi˜oes lesionadas em
mamogramas.In proceedings do III CLAEB, Jo˜ao Pessoa 2004.
57
[MARR e HILDRETH, 1968] MARR D. , HILDRETH E. Theory of edge detection
Procedins R. Society London. 207.188-217.1968
[MOUSA et al, 2005] MOUSA Rafayah , MUNIB Qutaishat, and MOUSSA Abdallah.
Breast cancer diagnosis system based on wavelet analysis and fuzzy-neural. Expert
Systems with Applications, Volume 28, Issue 4, May 2005, Pages 713-723
[PETRICK E BERKMAN, 2002 ] NICHOLAS Petrick, BERKMAN Sahiner,
HEANGPING Chan, MARK A. Helvie, SOPHIE aquerault, and LUBOMIR M.
Hadjiiski. Breast Cancer Detection: Evaluation of a mass-Detection Algorithm for
Computer-aided Diagnosis. Experience in 263 patients Radiology 224:217-224.2002
[ORR, 1999] ORR, Mark, Introduction to Radial Basis Function Networks dispon´ıvel
em:http://www.anc.ed.ac.uk/rbf/intro/node51. acessado em 23/02/2006
[PAPOULIS, 2002] PAPOULIS, Athanasios; PILLAI, S. Unnikrishna.Probability,
Random Variables and Stochastic Processes. 4 e.d. Nova York: McGraw-Hill. 2002.
852 p.
[SANTOS, 2002] SANTOS V. T.: Segmenta¸ao de Imagens Mamogr´aficas para Detec¸ao
de odulos de Mamas Densas. Disserta¸ao. ao Carlos, 2002.
[SUCKLING, 1994] SUCKLING J. et al (1994): The Mammographic Image Analysis
Society Digital Mammogram Database Exerpta Medica. International Congress
Series 1069 pp375-378.
[VERMA e ZANGH, 2006] VERMA Brijesh, ZANGH Ping. A novel neural-genetic
algorithm to find the most signific1ant combination of features in digital
mammograms. ARTICLE Applied Soft Computing, In Press, Corrected Proof,
Available online 24 February 2006. Science direct
[VON ZUBEN, 2001] VON ZUBEN F. J., CASTRO L. N. : Redes Neurais com Fun¸oes
de Ativao de Base Radial. DCA/FEEC/Unicamp. 2001
[WIDROW, 1985] B. Widrow and Samuel D. Stearns. ”Adaptive Signal Processing”.
Prentice-Hall signal processing series, 1985.
[ZHANG, 2002] ZHANG, L., SANKAR, R., QIAN, W., ”Advances in micro-calcification
clusters detection in mammography”, Comp. in Biology e Medicine, v. 32, pp. 515-
528, 2002.
Livros Grátis
( http://www.livrosgratis.com.br )
Milhares de Livros para Download:
Baixar livros de Administração
Baixar livros de Agronomia
Baixar livros de Arquitetura
Baixar livros de Artes
Baixar livros de Astronomia
Baixar livros de Biologia Geral
Baixar livros de Ciência da Computação
Baixar livros de Ciência da Informação
Baixar livros de Ciência Política
Baixar livros de Ciências da Saúde
Baixar livros de Comunicação
Baixar livros do Conselho Nacional de Educação - CNE
Baixar livros de Defesa civil
Baixar livros de Direito
Baixar livros de Direitos humanos
Baixar livros de Economia
Baixar livros de Economia Doméstica
Baixar livros de Educação
Baixar livros de Educação - Trânsito
Baixar livros de Educação Física
Baixar livros de Engenharia Aeroespacial
Baixar livros de Farmácia
Baixar livros de Filosofia
Baixar livros de Física
Baixar livros de Geociências
Baixar livros de Geografia
Baixar livros de História
Baixar livros de Línguas
Baixar livros de Literatura
Baixar livros de Literatura de Cordel
Baixar livros de Literatura Infantil
Baixar livros de Matemática
Baixar livros de Medicina
Baixar livros de Medicina Veterinária
Baixar livros de Meio Ambiente
Baixar livros de Meteorologia
Baixar Monografias e TCC
Baixar livros Multidisciplinar
Baixar livros de Música
Baixar livros de Psicologia
Baixar livros de Química
Baixar livros de Saúde Coletiva
Baixar livros de Serviço Social
Baixar livros de Sociologia
Baixar livros de Teologia
Baixar livros de Trabalho
Baixar livros de Turismo