Download PDF
ads:
UNIVERSIDADE FEDERAL DO MARANHÃO
CENTRO DE CIÊNCIAS EXATAS E TECNOLOGIA
DEPARTAMENTO DE ENGENHARIA DE ELETRICIDADE
CURSO DE PÓS-GRADUAÇÃO EM ENGENHARIA DE ELETRICIDADE
STELMO MAGALHÃES BARROS NETTO
SEGMENTAÇÃO AUTOMÁTICA DE NÓDULOS PULMONARES COM
GROWING NEURAL GAS E MÁQUINA DE VETORES DE SUPORTE
São Luís
2010
ads:
Livros Grátis
http://www.livrosgratis.com.br
Milhares de livros grátis para download.
STELMO MAGALHÃES BARROS NETTO
SEGMENTAÇÃO AUTOMÁTICA DE NÓDULOS PULMONARES COM
GROWING NEURAL GAS E MÁQUINA DE VETORES DE SUPORTE
Dissertação apresentada à Coordenação
do Programa de Pós-Graduação em
Engenharia de Eletricidade da
Universidade Federal do Maranhão como
parte dos requisitos para obtenção do
título de Mestre em Ciência da
Computação.
Orientador: Prof. Aristófanes Corrêa Silva
São Luís
2010
ads:
Barros Netto, Stelmo Magalhães.
Segmentação automática de nódulos pulmonares com growing
neural gás e máquina de vetores de suporte / Stelmo Magalhães
Barros Netto. – São Luís, 2010.
90 f.
Impresso por computador (fotocópia).
Orientador: Prof. Dr. Aristófanes Corrêa Silva.
Dissertação (Mestrado) – Universidade Federal do Maranhão,
Programa de Pós-Graduação em Engenharia e Eletricidade, 2010.
1. Nódulo pulmonar – Detecção auxiliada por computador
(CAD) 2. Growing Neural Gas (GNG) 3. Tomografia
computadorizada I. Título
CDU 004.896 : 616.24 - 006
À minha família.
AGRADECIMENTOS
À Deus, por me permitir ainda estar neste mundo.
Aos meus pais, Stelmo Magalhães Barros Júnior e Ocione Barreto Barros, que
além de me mostrarem que o estudo é de grande importância, proporcionaram-me
realizá-lo.
A toda minha família, pelo incentivo e apoio.
Ao meu orientador professor Aristófanes Corrêa Silva pela grande
responsabilidade confiada a mim, em diversos trabalhos e a esta dissertação.
Ao departamento de Pós-Graduação em Engenharia e Eletricidade pela
oportunidade de cursar o mestrado.
Ao CNPQ, pelo auxílio financeiro dado para a produção deste trabalho.
Aos meus colegas do Laboratório de Processamento e Análise de Imagem, que
me deram forças para continuar em todos os desafios e ao prazer da conversa deles.
Ao Dallyson, grande colega de mestrado.
À Katia, que me ofereceu completo amor e simpatia.
Ao Alcides que sempre se mostrou prestativo aos assuntos da coordenação.
Aos meus colegas e amigos da UFMA, que conviveram comigo neste mundo
acadêmico, inclusive os zeladores do CT.
A todos que, direta ou indiretamente, contribuíram para a realização desta
monografia.
Resumo
O câncer de pulmão ainda é um dos mais incidentes em todo mundo. Seu diagnóstico é
de difícil realização, devido as suas características morfológicas iniciais não estarem
bem definidas e também por causa da sua localização em relação ao pulmão. É
geralmente detectado tardiamente, que tem como conseqüência uma alta taxa de
letalidade. Diante destas dificuldades muitas pesquisas são realizadas, tanto em relação
a sua detecção, quanto a seu diagnóstico. O objetivo deste trabalho é propor uma
metodologia de detecção automática do nódulo pulmonar com o auxílio do computador.
O ganho com o desenvolvimento desta metodologia, é que sua implementação auxiliará
ao médico na detecção simultânea dos diversos nódulos presentes nas imagens de
tomografia computadorizada. A metodologia de detecção de nódulos pulmonares
desenvolvida envolve a utilização de um método da aprendizagem competitiva,
chamado de Growing Neural Gas (GNG). A metodologia ainda consiste na redução do
volume de interesse, através de técnicas amplamente utilizadas na extração do tórax,
extração do pulmão e reconstrução. A etapa seguinte é a aplicação do GNG no volume
de interesse resultante, que em conjunto com a separação do nódulo das diversas
estruturas presentes formam a etapa de segmentação, e por fim, é realizada a
classificação das estruturas em nódulo e não-nódulo, por meio das medidas de
geometria e textura. A metodologia garante que nódulos com tamanho razoável sejam
encontrados com sensibilidade de 86%, especificidade de 91%, que resulta em uma
acurácia de 91%, em média, para dez experimentos de treino e teste, em uma amostra de
48 nódulos ocorridos em 29 exames. A taxa de falsos positivos por exame foi de 0,138,
para os 29 exames analisados.
Palavras-chave: Detecção auxiliada por computador (CAD), Nódulo pulmonar,
Growing Neural Gas (GNG), Tomografia computadorizada.
Abstract
Lung cancer is still one of the most frequent types throughout the world. Its diagnosis is
very difficult because its initial morphological characteristics are not well defined, and
also because of its location in relation to the lung. It is usually detected late, fact that
causes a large lethality rate. Facing these difficulties, many researches are done,
concerning both detection and diagnosis. The objective of this work is to propose a
methodology for computer-aided automatic lung nodule detection. The return of the
development of such methodology is that its application will aid the doctor in the
simultaneous detection of several nodules present in computerized tomography images.
The methodology developed for automatic detection of lung nodules involves the use of
a method of competitive learning, called Growing Neural Gas (GNG). The methodology
still consists in the reduction of the volume of interest, by the use of techniques largely
used in thorax extraction, lung extraction and reconstruction. The next stage is the
application of the GNG in the resulting volume of interest, that together with the
separation of the nodules from the various structures present in the lung form the
segmentation stage, and, finally, through texture and geometry measurements, the
classification as either nodule or non-nodule is performed. The methodology guarantees
that nodules of reasonable size are found with sensibility of 86%, specificity of 91%,
what results in accuracy of 91%, in average, for ten training and test experiments, in a
sample of 48 nodules occurring in 29 exams. The false-positive per exam rate was of
0.138, for the 29 analyzed exams.
Keywords: Computer-aided detection (CAD), Lung nodule, Growing Neural Gas
(GNG), Computerized tomography.
LISTA DE FIGURAS
FIGURA 2-1. (A) GRANULOMA; (B) CARCINOMA PRIMÁRIO; (C) METÁSTASE; (D)
HAMARTOMAS. ........................................................................................................ 23
FIGURA 2-2. ESTRUTURAS DO PULMÃO ............................................................................ 24
FIGURA 2-3. PROCESSO DE VARREDURA DO CABEÇOTE E DETECTORES ........................... 27
FIGURA 2-4. PARTES DE UM TOMÓGRAFO COMPUTADORIZADO ....................................... 28
FIGURA 2-5. SEGMENTAÇÃO POR CRESCIMENTO DE REGIÃO 3D ...................................... 32
FIGURA 2-6. EXEMPLO DE UM ESTADO DA REDE GNG COM CINCO NÓS E O SIGNIFICADO DE
CADA NÓ
. ................................................................................................................. 33
FIGURA 2-7. EXEMPLO DE UM ESTADO DA REDE GNG ONDE CADA GRUPO DE NÓS
REPRESENTAM UM OBJETO
....................................................................................... 33
FIGURA 2-8. APLICAÇÃO DA TRANSFORMADA DA DISTÂNCIA A UMA IMAGEM 2D ........... 38
FIGURA 6-1. ILUSTRAÇÃO DA DENSIDADE ESFÉRICA DE TRÊS OBJETOS EM DUAS
DIMENSÕES
. .............................................................................................................. 40
FIGURA 2-9. SEPARAÇÃO DE DUAS CLASSES ATRAVÉS DE HIPERPLANOS ......................... 50
FIGURA 2-10. VETORES DE SUPORTE (DESTACADOS POR CÍRCULOS). .............................. 51
FIGURA 3-1. FLUXO DA METODOLOGIA PROPOSTA .......................................................... 56
FIGURA 3-2. EXEMPLO DE IMAGEM USADA NO CÁLCULO DO HISTOGRAMA AO LONGO DA
LINHA DIAGONAL EM AZUL
. ...................................................................................... 58
FIGURA 3-3. HISTOGRAMA DIAGONAL DE UMA FATIA DE EXAME DE TC.......................... 59
F
IGURA 3-4. PROGRESSO DO CRESCIMENTO DE REGIÃO PARA EXTRAÇÃO DO TORÁX ....... 59
F
IGURA 3-5. PULMÃO DIREITO EXTRAÍDO ........................................................................ 60
F
IGURA 3-6. FECHAMENTO DE UM BURACO ABERTO POR ROLLING BALL ......................... 61
F
IGURA 3-7. IMAGEM DE UM PARÊNQUIMA RECONSTRUÍDO ............................................ 61
FIGURA 3-8. IMAGEM RESULTANTE DA REDUÇÃO DO VOI ............................................... 62
F
IGURA 3-9 ASSOCIAÇÃO DOS DOIS VETORES DO GNG A CADA UM DOS TECIDOS DE
INTERESSE NA SEGMENTAÇÃO
. ................................................................................. 63
FIGURA 3-10. VOXEL DE COORDENADAS (X,Y,Z) E A SUA VIZINHANÇA. ........................... 64
FIGURA 3-11. DEMONSTRAÇÃO DO COMPORTAMENTO DA DISTORÇÃO AO LONGO DAS
ITERAÇÕES
. .............................................................................................................. 64
F
IGURA 3-12. IMAGEM DA SUPERFÍCIE DE DUAS ESTRUTURAS, O NÓDULO E O
BRONQUÍOLO
. ........................................................................................................... 66
FIGURA 3-13. ETAPAS DO PROCESSO DE ISOLAMENTO DO NÓDULO PULMONAR ............... 67
FIGURA 4-1. SEÇÃO DE UM EXAME DE TC COM O NÓDULO INDICADO PELA SETA EM
VERMELHO
. .............................................................................................................. 75
FIGURA 4-2. IMAGEM DO PULMÃO DA FIGURA 4-1 APÓS A REDUÇÃO DO VOI. ................ 76
FIGURA 4-3. IMAGEM DO PULMÃO DA FIGURA 4-2 APÓS A APLICAÇÃO DO GNG. ............ 76
FIGURA 4-4. IMAGEM DA SUPERFÍCIE 3D DO NÓDULO E DAS ESTRUTURAS QUE O
CONECTAM
. .............................................................................................................. 77
FIGURA 4-5. RESULTADO DA SEPARAÇÃO DAS ESTRUTURAS PELA TRANSFORMADA DA
DISTÂNCIA
................................................................................................................ 77
F
IGURA 4-6. SEÇÃO DE UM EXAME DE TC COM O NÓDULO EM VERMELHO. ..................... 78
F
IGURA 4-7. SUPERFÍCIES DOS NÓDULOS SEGMENTADOS PELA METODOLOGIA DE
DETECÇÃO DA
FIGURA 4.1. ....................................................................................... 78
FIGURA 4-8. SEÇÃO DE UM EXAME DE TC COM SEU ÚNICO NÓDULO INDICADO PELA SETA
EM VERMELHO
. ......................................................................................................... 79
FIGURA 4-9. SEÇÃO DE UM EXAME DE TC COM FALSO POSITIVO DESTACADO EM
VERMELHO
. .............................................................................................................. 79
FIGURA 4-10. SEÇÃO DE UM EXAME DE TC COM FALSO POSITIVO DESTACADO EM
VERMELHO
. .............................................................................................................. 80
FIGURA 4-11. SUPERFÍCIE 3D DAS ESTRUTURAS CLASSIFICADAS INCORRETAMENTE COMO
NÓDULO
. (A) ESTRUTURA SEGMENTADA NA FIGURA 4-9. (B) ESTRUTURA
SEGMENTADA NA
FIGURA 4-10. ............................................................................... 80
FIGURA 4-12. SEÇÃO DE UM EXAME DE TC COM O PRIMEIRO NÓDULO INDICADO PELA
SETA EM VERMELHO
. ................................................................................................ 81
F
IGURA 4-13. SEÇÃO DE UM EXAME DE TC COM O SEGUNDO NÓDULO INDICADO PELA
SETA EM VERMELHO
. ................................................................................................ 81
FIGURA 4-14. IMAGEM DA SUPERFÍCIE 3D DAS ESTRUTURAS SEGMENTADAS DO EXAME DA
IMAGEM DA
FIGURA 4-12. ........................................................................................ 82
LISTA DE SIGLAS
ACI – Análise de Componentes Independentes
ACRAmerican College of Radiology (Colégio Americano de Radiologia)
CADComputer-aided Detection (Detecção Auxiliada por Computador)
CADxComputer-aided Diagnosis (Diagnóstico Auxiliado por Computador)
DICOMDigital Imaging Communications in Medicine (Representação Digital para
Comunicação em Medicina)
FN – Falso Negativo
FOV - Field Of View (Campo de Visão)
FP – Falso Positivo
GNG Growing Neural Gas (Gás de neurônios crescente)
IOInformation Object (Objeto de Informação)
IOARC International Agency for Research on Cancer
INCA – Instituto Nacional de Câncer
LDCTLow-dose computer tomography (Tomografia Computadorizada de baixa
dosagem)
LIDCLung Image Database Consortium (Consórcio de Banco de Dados de Imagem
de Pulmão)
MVS – Máquina de Vetores de Suporte
NCINational Cancer Institute (Instituto Nacional de Câncer)
NEMANational Electrical Manufacturers Association
NP – Nódulo Pulmonar
OMS – Organização Mundial de Saúde
PACSPicture Archiving and Communications Systems (Sistemas de Comunicação e
Armazenamento de Imagens)
RP – Reconhecimento de Padrões
TC – Tomografia Computadorizada
UH – Unidade de Hounsfield
VOI – Volume de Interesse
VP – Verdadeiro Positivo
VPP – Valor Preditivo Positivo
VPN – Valor Preditivo Negativo
VN – Verdadeiro Negativo
XML – eXtensible Markup Language
Sumário
1.Introdução .......................................................................................................... 15
1.1.Trabalhos relacionados ............................................................................................. 19
1.2.Organização da dissertação ...................................................................................... 21
2.Fundamentação teórica ................................................................................................ 23
2.1.Nódulo pulmonar .................................................................................................... 23
2.1.1.Tomografia computadorizada ................................................................................ 26
2.1.2.Padrão DICOM ............................................................................................. 28
2.2.Segmentação .................................................................................................... 30
2.2.1.Crescimento de região 2D e 3D ............................................................................. 31
2.2.2.Growing Neural Gas ............................................................................................. 32
2.3.Transformada da distância em relação à borda ........................................................ 37
2.4.Métricas utilizadas na caracterização dos candidatos a nódulo pulmonar ............... 38
2.4.1.Medidas de Geometria ........................................................................................... 38
2.4.2.Medidas de textura ............................................................................................. 42
2.5.Reconhecimento de padrões ..................................................................................... 46
2.5.1.Máquina de Vetores de Suporte ............................................................................ 49
2.6.Validação de Resultados ........................................................................................... 52
3.Metodologia Proposta .................................................................................................. 55
3.1.Aquisição das Imagens de TC .................................................................................. 56
3.2.Redução do volume de interesse (VOI) .................................................................... 57
3.2.1.Extração do tórax ............................................................................................. 58
3.2.2.Extração dos pulmões ............................................................................................ 59
3.2.3.Reconstrução dos pulmões .................................................................................... 60
3.3.Segmentação .................................................................................................... 62
3.3.1.Aplicação do GNG ............................................................................................. 62
3.3.2.Separação das estruturas ........................................................................................ 65
3.4.Extração de características........................................................................................ 69
3.5.Classificação de candidatos ...................................................................................... 69
4.Resultados e Discussões .............................................................................................. 70
4.1.Base de imagens .................................................................................................... 70
4.2.Implementação e hardware utilizado ....................................................................... 70
4.3.Segmentação com GNG e detecção de nódulos pulmonares ................................... 71
4.4.Caso de estudo – Detecção correta ........................................................................... 75
4.5.Caso de estudo – Detecção incorreta ........................................................................ 78
5.Conclusão e trabalhos futuros ..................................................................................... 83
6.Referências bibliográficas ........................................................................................... 85
15
1. Introdução
A intensa mudança no ambiente provocada pelo homem desde a revolução
industrial tem provocado diversos males a sua saúde. Isto significa que existe uma
estreita relação do ambiente com o qual o homem ocupa, com as doenças crônico-
degenerativas, infecciosas e parasitárias que o acomete. Estes fatores ambientais
possuem uma relação mútua muito grande, isto é, um único fator de risco pode
ocasionar várias doenças e uma única doença pode ser causada por vários fatores
simultâneos. Isto explica porque 80% a 90% dos casos de câncer são provocados por
fatores ambientas (INCA, 1996).
Alguns destes fatores ambientais são bem conhecidos: o cigarro pode causar
câncer de pulmão, a exposição excessiva ao sol pode causar câncer de pele, e alguns
vírus podem causar leucemia. Tais fatores tornam-se mais agravantes em idosos, pois o
processo de envelhecimento celular faz suas células mais suscetíveis às transformações
malignas.
A hereditariedade também exerce um importante papel no processo
cancerígeno, mas não de forma exclusiva, pois o surgimento da doença raramente
possui influência puramente genética (INCA, 1996).
O câncer pode ser visto como uma multiplicação desordenada de células que
sofreram mutações em genes especiais, denominados proto-oncogenes, tornando-se
oncogenes, ou ainda, pela perda ou inativação de genes supressores de tumor. O nome
da doença causada depende dos tecidos em que ela se origina, chamado de carcinoma se
de origem epitelial e sarcoma se de tecido conjuntivo. Possuindo capacidade muito alta
de expansão e invasão (metástase) aos outros tecidos, formando acúmulos de células
cancerígenas (tumores) ou neoplasias malignas. Contudo, tal acúmulo, pode ser apenas
um tumor benigno, isto é, uma massa de células do mesmo tecido, o que raramente
constitui risco a saúde (INCA, 2009).
As estimativas de incidência de 2008 apontaram, segundo a IARC/OMS, que o
número de novos casos de câncer foi de 12,8 milhões e o número de óbitos por câncer
no mundo está em 7,6 milhões. O câncer de pulmão aparece como o mais incidente,
com 1,52 milhões de novos casos, seguido do câncer de mama (1,29 milhões) e com
mesma freqüência o de colo e reto (1,15 milhões) (INCA, 2010).
16
De todos os tumores malignos, excetuado o câncer de pele não-melanoma, o
câncer de pulmão é o segundo tipo mais comum em homens e um dos mais freqüentes
na mulher. A sua mais preocupante característica, no entanto, é que este tipo de câncer,
em países desenvolvidos, tem provocado mais mortes do que a soma dos óbitos por
câncer de próstata, mama e colo retal.
Pacientes com câncer de pulmão possuem sobrevida média acumulativa total
de cinco anos, variando entre 13 e 20% em países desenvolvidos e entre 7 e 12% nos
países em desenvolvimento. Somente em 2005, foram 1,3 milhões de mortes no mundo.
Nesse mesmo ano, foi registrado na estatística oficial do Instituto Nacional de Câncer
(INCA), que o câncer pulmonar provocou a morte de 14.715 pessoas. Estimativas deste
órgão especializado brasileiro apontam que o número de novos casos para o ano de
2010 será de 17.800 casos entre os homens e de 9.830 casos entre as mulheres. Tal
incidência, ainda é resultado do grande consumo de tabaco no passado, e não reflete o
cenário atual da diminuição do hábito tabágico pela população em resposta às ações
preventivas implementadas mais recentemente (INCA, 2009).
Uma das causas da pequena sobrevida do câncer de pulmão está relacionada à
dificuldade do seu diagnóstico precoce, devido à ausência de sintomas e ao pobre
prognóstico, quando estes são efetuados em estágios mais avançados da doença.
(JAMNIK et al, 2008). Por causa destas características, muitos são os esforços
empregados para o diagnóstico precoce do câncer pulmonar.
A detecção do câncer de pulmão em estágio inicial tem melhorado em função
de um maior uso de técnicas não-invasivas de imagem, como a radiografia e a
tomografia computadorizada (TC) do tórax. Contudo, técnicas invasivas são ainda
necessárias para a definição do diagnóstico, que se dá pelo estudo citológico ou
histopatológico de materiais obtidos por punção aspirativa ou biópsia.
Os avanços tecnológicos dado aos equipamentos utilizados na detecção e
diagnóstico do câncer têm crescido rapidamente, propiciando um diagnóstico precoce
de diversas enfermidades. Estes avanços se estendem também, aos produtos químicos
utilizados conjuntamente com o TC, que quando injetado ao corpo do paciente,
melhoram substancialmente a visualização dos tecidos, por contrastar anatomicamente
as regiões do corpo. Dentre os equipamentos que têm facilitado a detecção, encontramos
17
os aparelhos de ressonância magnética e a tomografia computadorizada (PAULINO et
al, 2008).
O câncer de pulmão é uma patologia com localização difícil e geralmente não
possui sintomas na sua fase inicial, correspondente a fase tratável do paciente. Isto
significa que os diversos sintomas que este produz podem ser confundidos com outras
doenças. A sua detecção nos diversos estágios da doença é realizada através do
tomógrafo computadorizado. Um tomógrafo é capaz de produzir imagens seccionais do
corpo humano com alta resolução dos diversos tecidos.
O médico, na análise do paciente como um todo, e na percepção de que os
sintomas não se tratam de uma doença comum, o encaminha a um especialista, que logo
começa uma sistematização do diagnóstico, objetivando a avaliação da lesão e a
pesquisa de metástase. Essa sistematização se inicia com um exame de TC que pode ser
auxiliada por algum marcador tumoral, e segue com uma análise cuidadosa das imagens
geradas (INCA, 1999).
A avaliação da lesão e de suas complicações loco-regionais podem ser
estudadas e auxiliadas hoje, através de sistemas de análise que promovem a Detecção
Assistida por Computador - Computer-Aided Detection (CAD) e o Diagnóstico
Assistido por Computador - Computer-Aided Diagnosis (CADx), que complementam o
diagnóstico, acelerando a análise de múltiplos exames de diversos pacientes
(WORMANNS, 2002).
A crescente informatização das diversas áreas de trabalho e principalmente da
área médica, seja como forma de redução do espaço físico gerado pelo grande volume
de informações dos pacientes, ou pela facilidade do compartilhamento dessas
informações, têm propiciado um desenvolvimento de ferramentas e técnicas, para
manipulação e diagnóstico das informações referidas aos exames, com a vantagem de
demonstrarem um ganho de velocidade e eficiência, para auxílio no processo de tomada
de decisão do especialista.
Uma etapa importante surge após a detecção do tumor na região do tórax, a
etapa de extração ou segmentação de estruturas nas diversas imagens do paciente, que
geralmente está disponível em sistemas CAD para a modalidade.
18
Uma vez realizado a segmentação do nódulo pulmonar, diversas análises
podem ser realizadas sobre sua superfície e volume, com o intuito de encontrar algum
sinal de malignidade ou benignidade.
A caracterização do nódulo pulmonar pode ser bastante prejudicada quando os
limites do nódulo (e não-nódulos) não estão bem delineados. Isto é, um nódulo
pulmonar pode ser caracterizado como não-nódulo, ou um não-nódulo pode ser
caracterizado como nódulo, se as características (medidas de textura e geometria)
encontradas de ambos forem obtidas das suas formas com limites incorretos.
Uma das fases da segmentação automática do nódulo pulmonar tem por
objetivo encontrar todas as estruturas candidatas a nódulo pulmonar, portanto, a
velocidade com a qual um sistema CAD com essa funcionalidade é capaz de realizá-la,
em exames que possuem um ou mais nódulos pulmonares, é crucial para o usuário
especialista, visto das suas restrições de tempo e ao grande número de imagens
analisadas. Significando em uma redução no tempo de busca e da própria separação do
nódulo pulmonar nas diversas imagens do exame pelo o especialista, quando realizada
de forma manual ou semi-automática.
O objetivo deste trabalho é evidenciar artefatos que tenham máxima
semelhança de um nódulo pulmonar, através do desenvolvimento de uma metodologia
de detecção de nódulos pulmonares, ao longo das imagens do pulmão geradas pelo TC,
de forma completamente automática, isto é, sem qualquer intervenção do especialista,
de modo a reduzir o tempo de busca e separação dos nódulos.
Outro importante objetivo deste trabalho é facilitar a análise de um grande
número de imagens geradas por um único paciente, que torna a análise de caracterização
e extração do nódulo pulmonar bastante difícil. Conseqüentemente, esta tarefa toma
muito tempo do médico especialista, quando existe um número muito grande de
pacientes a serem analisado em um único dia. Claramente percebemos a viabilidade do
uso de técnicas de segmentação que auxiliam a diminuir a subjetividade dos médicos,
quando da extração dos nódulos pulmonares, pois estes, em sua vizinhança, possuem
vasos e outras estruturas que dificultam a sua total separação e identificação.
Aumentar a taxa de acerto e diminuir o número de falsos positivos na fase de
detecção dos nódulos pulmonares também é um importante objetivo. Isto é obtido pela
19
pesquisa de novas medidas que facilitam a discriminação do nódulo pulmonar, das
diversas outras estruturas encontradas na segmentação (vasos, brônquios e etc).
1.1. Trabalhos relacionados
O uso de sistemas CAD e CADx para auxílio ao médico especialista vem
crescendo pouco a pouco (FIEBICH et al, 2009). O principal interesse em seu uso está
nas facilidades com que evidenciam artefatos suspeitos e na indicação dos possíveis
diagnósticos, em um tempo relativamente menor que o especialista. É especialmente
usado em programas de screening
1
, onde as tarefas de detecção e diagnóstico do nódulo
pulmonar são realizadas contínua e repetidamente pelo médico especialista.
Recentes pesquisas têm demonstrado as vantagens do uso de sistemas CAD e
CADx no auxílio ao médico especialista, na tarefa de detecção (SAHINER et al, 2009;
YUAN et al, 2005; MARTEN et al, 2006) e diagnóstico (LI, 2004) de nódulo pulmonar.
Em Sahiner et al (2009), tem mostrado através da curva FROC (free-response receiver
operating characteristics), que o especialista ou sistema CAD sozinho, apresenta menor
desempenho para detecção de nódulos pulmonares, do que quando o médico é auxiliado
pelo sistema CAD.
A segmentação automática de imagens de TC é uma tarefa de difícil realização,
pois são muitos os interferentes encontrados nas imagens, como: os ruídos gerados no
processo de aquisição, as características das imagens (A espessura das fatias, dimensões
dos pixels e etc.), a morfologia dos nódulos, sua localização e presença de estruturas
vizinhas, com densidades muito próximas, e diretamente conectadas.
A segmentação baseada em agrupamento foi utilizada na segmentação
automática de nódulos pulmonares em Antonelli (2005), com o fuzzy c-means, seguido
da análise morfológica das estruturas resultantes. A segmentação automática de imagens
de TC com baixa densidade (LDCT – low dose computer tomography) foi realizada por
El-baz (2006), em um framework desenvolvido para a tarefa. Este framework através de
informações de modelos probabilísticos criados para controlar a evolução de um modelo
deformável, foi capaz de segmentar os nódulos pulmonares com erro médio de 0,96% e

1
Screening são levantamentos expeditos que têm como função confirmar ou não a suspeita de
contaminação numa determinada área de interesse, através de técnicas que economizem tempo e
investimentos.
20
desvio padrão de 1,1%, com relação à forma descrita pelo especialista. O trabalho de
Özekes (2007), usando segmentação baseada em regras e template matching treinado
com algoritmo genético, teve resultados bastante significativos. Seu sistema achou
93,4% de sensibilidade e 0,594 falsos positivos por exame. Ainda através de template
matching, mas com a adição de uma rede neural celular genética e limiarização baseada
em regra fuzzy, Özekes (2008) conseguiu uma sensibilidade de 100% e uma taxa de
falsos positivos de 13,375 por caso. Sob a mesma perspectiva, Li (2008) obteve, através
de filtros de reforço seletivo e segmentação baseada em regras, uma sensibilidade de
86%, 81% e 75%, e com falsos positivos por exame de 6,6, 3,3 e 1,6, respectivamente,
em um esquema de quatro conjuntos para validação cruzada. Pu (2008) utiliza um
campo de distância sinalizado em todo o volume de imagens e detecta os máximos
encontrados como potenciais nódulos, que em seguida, são ranqueados conforme a
distância do eixo medial, obtido por meio do agrupamento e da aplicação do algoritmo
de cubos marchantes. Foram realizados testes em 52 exames sob uma base proprietária
que continha 184 nódulos pulmonares e cujos resultados obtidos foram de 95,1% de
sensibilidade e uma média de 1200 voxels suspeitos por exame. Usando também
imagens de baixa densidade e contornos ativos, combinado com um algoritmo de
múltilimiarização, iniciado em pontos que possuíam máxima semelhança a uma esfera e
obtidos através dos autovalores em cada voxel, Fiebich (2009) conseguiu detectar 58%
dos nódulos em sua base, com taxa de falso positivo de 1,38. Trabalhos como o de Ye
(2009) usam cinco características, contendo informações de intensidade, índice de
forma e localização espacial 3D. Seu trabalho mostra que a sobreposição média dos
nódulos segmentados pelo seu método está próxima de 0,81. Sousa (2009) desenvolveu
um completo sistema de segmentação automática em múltiplos estágios. Cada estágio
do sistema foi responsável por segmentar porções significativas do volume de imagens
de TC. No total, foram seis estágios que compreendem cada uma das etapas do
processo: extração do tórax, extração do pulmão, reconstrução pulmonar, extração de
estruturas, eliminação de estruturas tubulares e redução de falsos positivos. Os três
primeiros estágios deste sistema foram utilizados neste trabalho, para a redução do
volume de interesse. Os resultados obtidos por seu sistema mostram uma taxa de falsos
positivos de 0,42 e uma taxa de falsos negativos 0,15, com sensibilidade de 100%.
Muitos trabalhos utilizaram uma mesma base de imagens com o objetivo de
comparar os resultados obtidos pelos diferentes métodos propostos por cada. A base de
21
imagens utilizada por estes trabalhos foi a LIDC - Lung Image Database Consortium
(MCNITT et al, 2004). Em Lee (2008), um conjunto de classificadores denominado
floresta aleatória é usado em duas etapas. A primeira, na etapa de detecção dos nódulos
pulmonares, e a segunda, na redução dos falsos positivos. Os resultados obtidos por sua
metodologia foram de 100% para a taxa de verdadeiros positivos e uma taxa de falsos
positivos de 1,4 por imagem. Dolejsi (2009) desenvolveu um sistema de diagnóstico
auxiliado por computador com base em operações morfológicas e filtros, seguido da
classificação dos candidatos pelo classificador AdaBoost. A sensibilidade encontrada foi
de 89,62% com 12,03 falsos positivos por imagem. Campos (2009) apresentou um novo
algoritmo de segmentação automático por crescimento de região baseado em
múlticritério, com parâmetros treinados convenientemente para decidir a fusão ou não,
de múltiplos objetos. O método permite obter uma sensibilidade de 80,9% e uma taxa
de falsos positivos de 0,23 por exame.
Todos os trabalhos apresentam bons resultados do ponto de vista da
sensibilidade, entretanto, são poucos os trabalhos que resultam em uma baixa presença
de falsos positivos, tanto por exame quanto por imagem. O presente trabalho tenta
encontrar bons resultados quanto à sensibilidade, com o compromisso de diminuir o
número de falsos positivos por imagem e por exame. Este trabalho também explora a
questão da minimização do tempo de segmentação automática, apesar de fazê-lo de
forma vaga e sem formalismos.
Este trabalho utiliza o GNG, um algoritmo com capacidade adaptativa a cada
exame, o que implica, teoricamente, que os resultados obtidos da sua aplicação
independem da base; da transformada da distância para separar as estruturas do pulmão
e do uso da análise de componentes independentes como uma das métricas de textura
para a classificação do nódulo pulmonar.
1.2. Organização da dissertação
Este trabalho está organizado de forma a apresentar o conteúdo o mais
claramente possível e se divide em mais quatro capítulos, conforme os parágrafos
seguintes.
22
O Capítulo 2 apresenta uma breve descrição dos conceitos utilizados no
desenvolvimento da metodologia. Como é realizada a aquisição das imagens de TC e o
formato de armazenamento; São dados alguns conceitos utilizados na aprendizagem
competitiva, bem como funcionamento do Growing Neural Gas; É explicado como a
transformada da distância é utilizada nos algoritmos de esqueletonização; Algumas
medidas de textura e morfologia serão explanadas, para caracterização em nódulo e não-
nódulo; Como o classificador MVS realiza a tarefa de discriminação do nódulo das
outras estruturas e como é avaliado o seu desempenho nesta tarefa.
O Capítulo 3 descreve como as informações obtidas das técnicas
fundamentadas no Capítulo 2 são encadeadas e utilizadas no processo de segmentação
automática do nódulo pulmonar.
O Capítulo 4 apresenta os resultados obtidos com uma pequena discussão sobre
a aplicação do método proposto.
No Capítulo 5, têm-se as conclusões a cerca do trabalho apresentado e
sugestões para trabalhos futuros.
23
2. Fundamentação teórica
Neste capítulo é dada uma descrição sucinta do nódulo pulmonar, a forma de
aquisição das imagens em tomografia computadorizada, o método responsável pela sua
segmentação, seguido do tipo de característica extraída e como é realizado o
reconhecimento de padrões.
2.1. Nódulo pulmonar
O Nódulo Pulmonar (NP) é uma lesão única de forma esférica, menor que 3 cm
e não acompanhada de quaisquer lesões sugestiva de metástase ou invasão de estruturas
vizinhas. É geralmente encontrado de forma acidental em pessoas onde os sintomas
aparecem em regiões próximas ao seu surgimento.
Podemos citar algumas causas do seu aparecimento (SZARF; SOUZA, 2007):
Causas não-neoplásicas
o Granulomas
2
por infecção (tuberculose e histoplasmose), Figura 2-1 (a), ou
não infecciosos (sarcoidose, granulomatose de Wegener);
o Hamartomas
3
(Figura 2-1(d));
o Doenças parasitárias, más formações arteriovenosas entre outras;
Causas neoplásicas
o Tumores broncogênicos como o carcinoma e linfoma primário de pulmão
(Figura 2-1(b));
o Tumores metastáticos como o sarcoma de Kaposi e adenocarcinomas de
qualquer origem (Figura 2-1(c)).
Figura 2-1. (a) Granuloma; (b) Carcinoma primário; (c) Metástase; (d) Hamartomas.

2
Termoindefinidoaplicadoalesõesinflamatórias,nodulares,emgeralpequenas,granulares,firmesepersistentes.
3
Tumorresultantedenovocrescimentodetecidosnormais.
24
Na sistematização da avaliação do nódulo pulmonar, a tomografia
computadorizada (TC) é o método não-invasivo mais utilizado para caracterização do
nódulo e do mediastino, facilitando enormemente o estudo do procedimento mais
correto para biópsias ou cirurgias. Sua resolução vai muito além de uma simples
radiografia. A Figura 2-2 exemplifica algumas estruturas do pulmão numa imagem de
tomografia computadorizada correspondente a uma seção do pulmão. É importante
salientar que nódulos pulmonares com menos de 2 cm têm uma probabilidade de cerca
de 80% de serem benignos, entretanto, o pequeno tamanho desses achados não exclui a
possibilidade de malignidade, pois 15% dos nódulos malignos têm menos de 1 cm,
enquanto que 42% são menores do que 2 cm de diâmetro (SZARF; SOUZA, 2007).
Figura 2-2. Estruturas do pulmão
Nódulos pulmonares ainda podem ser classificados morfologicamente e
topologicamente. Quanto à morfologia, o nódulo pode ser liso, rugoso ou lobulado,
irregular ou espiculado. O aspecto liso do nódulo é um bom indicativo de benignidade,
contudo, 21% dos nódulos malignos também apresentam essa característica (SZARF;
SOUZA, 2007). A presença de gordura e algum padrão de calcificação também podem
oferecer algum indicativo de benignidade. A topologia relaciona-se com o nódulo pela
sua localização e seu efeito, em conjunto com a forma do nódulo e sua evolução,
podendo sugerir princípios para sua classificação. Portanto, os seguintes princípios
devem ser obedecidos com base nos dados acima e mais justificados abaixo segundo
Silva (2004 apud TARANTINO, 1997):
a) Modificação temporal-evolutiva;
25
O tempo de duplicação de uma lesão situa-se entre 30 e 450 dias, e seu
achado será sugestivo de malignidade. Para que um nódulo atinja 1 cm de
diâmetro, a partir de uma única célula neoplásica, o tempo exigido é de dois
anos e meio a 25 anos;
Uma lesão que se duplique em menos de sete dias sugere fortemente que sua
natureza seja benigna.
b) Presença e tipos de calcificação (ões);
A calcificação difusa, da subtotalidade da lesão, é um achado muito
sugestivo de benignidade.
Mais de 30% das lesões não calcificadas podem ser consideradas de
natureza benigna;
A calcificação em nódulos malignos é um achado pouco freqüente, mas não
raro, e pode ocorrer por alteração distrófica, ossificação do tumor ou
inclusão de granuloma calcificado previamente existente, que em geral é
excêntrico e discreto.
c) Tamanho absoluto da lesão;
Menos de 5% das lesões benignas têm mais de 3 cm;
Lesões menores de 1 cm, identificadas na tomografia computadorizada do
tórax, tanto podem ser de natureza maligna como benigna.
d) Interface nódulo-parênquima;
Configuração lobulada com limites espiculados são indícios fortes de
malignidade. O
Quadro 1 exemplifica alguns casos;
Contornos lisos e regulares (não lobulados), sem infiltração do parênquima
circunjacente são sugestivos, porém, não conclusivos de benignidade, e
ilustrado no
Quadro 1;
Configuração regular, com limites precisos (circunscritos, sem espículas),
em uma lesão que sofre de modificação da forma, com a mudança de
decúbito é muito sugestiva de lesão cística de conteúdo líquido, e em sua
grande maioria, benigna.
e) Variação de densidade após impregnação de contraste endovenoso.
26
Quadro 1. Diagnóstico do nódulo em relação à forma (SILVA,2004)
O diagnóstico definitivo de malignidade, contudo, é dado pelo exame
citopatológico e histopatológico do material obtido por procedimentos que estão se
tornando de menor morbidade, como a biópsia transbrônquica e transtorácica.
2.1.1. Tomografia computadorizada
A tomografia, derivada da palavra grega “Tomos”, que significa corte ou fatia,
e “grafos”, que significa desenhar uma imagem ou gráfico, emprega os mesmos
princípios da radiografia convencional cujo objetivo é criar uma representação
anatômica baseada na quantidade de atenuação sofrida pela radiação incidente.
A tomografia computadorizada (TC) surgiu em meados de 1969 através dos
trabalhos de Sir Godfrey Hounsfield (SOARES, 2006), que projetou um sistema
eletrônico de detecção do feixe de radiação e de um processo de formação das imagens,
e de Allan M. Cormack, que desenvolveu toda a matemática necessária para a
reconstrução das imagens tomográficas, revolucionando a forma de sua aquisição.
A Figura 2-3 ilustra o funcionamento do TC que é basicamente semelhante ao
do tomógrafo convencional, onde um feixe de raios X estreito gerado por um cabeçote é
registrado por um detector ligado diametralmente, recebendo a radiação atenuada,
dependendo da densidade e número atômico médio do tecido analisado e cuja
intensidade é dada em unidades de Hounsfield (HU - Hounsfield Unit). A construção da
27
imagem seccional em nível de cinza é obtida por um movimento rotação do conjunto
cabeçote-detector, que após um movimento completo de rotação, é iniciado um novo
processo de varredura, pelo deslocamento da mesa de alguns décimos de milímetro, até
passar por todo eixo axial do corpo do paciente.
Figura 2-3. Processo de varredura do cabeçote e detectores (SOARES, 2006)
O tomógrafo computadorizado pode ser dividido, conforme a visualização da
Figura 2-4, em três grandes partes:
O portal, que é composto pelo cabeçote contendo a ampola de raios X e o
detector das radiações atenuadas que está diametralmente oposto;
A eletrônica de controle e aquisição dos dados
, responsável pela monitoração
dos sensores e comandos aos dispositivos servo-mecânicos, e pela transdução
dos sinais capitados pelo detector que são enviados ao computador para a
reconstrução da imagem;
Console de comando e computador
, isto é, software encarregado de gerenciar
toda estrutura do tomógrafo computadorizado e da formação das imagens, e o
hardware no qual este programa é executado, respectivamente.
As características essenciais do aparelho de TC que o difere da radiografia
simples são a não sobreposição de estruturas, melhor contraste (menos radiação
espalhada), detectores otimizados e processamento das imagens. Permitindo uma
detecção mais precisa de nódulos inferiores a 1 cm.
28
Figura 2-4. Partes de um tomógrafo computadorizado (SOARES, 2006)
A matriz de imagem seccional formada no cálculo computacional pelo
software do aparelho está em nível de cinza com magnitude expressa em uma escala de
contraste de Hounsfield usando como referência diversas substâncias como a água
(entre 0 e ± 10), o osso cortical denso (entre 1000 a 3000) e o ar (com valor igual a -
1000). O campo de reconstrução das imagens é chamado de FOV (Field Of View) e é
dado pelo produto entre o tamanho da matriz da imagem e a dimensão do pixel,
definindo o tamanho do objeto em estudo.
2.1.2. Padrão DICOM
O padrão DICOM (Digital Imaging and Communications in Medicine), criado
pela ACR (American College of Radiology) e pelo NEMA (National Electrical
Manufactures Association), em um comitê em 1983, surgiu com o objetivo de
padronizar o formato das imagens e suas informações, usado entre os diferentes
fabricantes de tomografia computadorizada, de ressonância magnética nuclear, ultra-
som e etc., e assim facilitar a troca de informações entre médicos e especialistas que se
encontram em localidades distintas, principalmente com o uso de PACS (Picture
Archiving and Communications Systems), que propiciam a criação de bases de dados
(NEMA, 2009).
29
A terceira versão do padrão DICOM (NEMA, 2009) engloba um grande
número de características, entre as quais se destacam:
É aplicável a ambiente de redes;
Especifica como os equipamentos que usam o padrão DICOM devem reagir a
comando e dados utilizados;
Especifica níveis de conformidade para as aplicações;
Está estruturado em documentos de múltiplas partes de forma a facilitar a
evolução do protocolo;
Introduz o conceito de objetos da informação, não somente para imagens e
gráficos, mas para estudos e relatórios;
Utiliza uma técnica de identificação única dos objetos de informação.
O padrão DICOM (NEMA, 2009) facilita a comunicação de equipamentos por
especificar: o conjunto de protocolos a serem seguidos pelas aplicações e equipamentos,
a sintaxe e semântica dos comandos do protocolo e das informações associadas, e os
requisitos mínimos de conformidade. Contudo, não especifica: os detalhes de uma
implementação, não garante a interoperabilidade entre equipamentos, e não especifica
procedimentos para teste de validação.
As múltiplas partes em que o padrão se encontra dividido são:
Parte 1: Introdução e visão geral;
Parte 2: Conformidade;
Parte 3: Definição dos objetos da informação;
Parte 4: Especificação das classes de serviço;
Parte 5: Estrutura de dados e semântica;
Parte 6: Dicionário de dados;
Parte 7: Serviços de comunicação;
Partes 8 e 9: Protocolos de rede;
Parte 10: Armazenamento e formato de arquivo;
Parte 11: Perfis da aplicação;
Parte 12: Mídias.
Parte 13: Retirada;
Parte 14: Funções de transformação de escala de nível de cinza;
30
Parte 15: Perfis de segurança;
Parte 16: Recurso de mapeamento de conteúdo;
Parte 17: Informação explanatória;
Parte 18: Acesso Web para Objetos DICOM.
O padrão DICOM define um conjunto de objetos de informação (IO –
Information Object) que correspondem a objetos do mundo real (imagem de TC,
imagem de ressonância magnética, estudo e etc.) e serviços ou operações (aquisição,
impressão, armazenamento e etc.), realizados por uma entidade da aplicação
(equipamento ou software), formando um par serviço-objeto (aquisição, impressão,
armazenamento ou comunicação de uma imagem), gerados por uma modelagem de
todas as informações do mundo real, desde a consulta do paciente até o processo de
aquisição da imagem no TC.
2.2. Segmentação
Na segmentação de imagens, as características de regiões de pixels comuns são
de principal importância na identificação ou rotulação de tais regiões (PRATT, 2001).
Portanto, a separação do objeto de estudo da imagem, é uma das tarefas mais comuns
em processamento de imagem, entretanto, é uma das mais difíceis devido ao número e
escolha das características que uma imagem pode conter. Assim, a escolha do método
de segmentação geralmente é definida após a determinação das características dos
objetos que se deseja explorar na imagem.
Um dos atributos bastante explorados na segmentação é a mudança brusca da
amplitude da intensidade dos pixels em imagens monocromáticas e componentes de
cores para imagens coloridas, que permite fácil indicativo dos limites dos objetos na
imagem, contudo, a textura, também é um atributo muito explorado.
Segundo (PRATT, 2001), não há nenhuma teoria sobre segmentação de
imagem, o que sugere que não há um padrão para segmentação de imagens, nem mesmo
um meio para medir a sua eficiência. Contudo, segundo Pratt (2001 apud HARALICK
et al., 1985), estabelece-se alguns guias quantitativos para uma boa segmentação:
Regiões de segmentação de uma imagem seriam uniformes e homogêneas com respeito
a algumas características, tais como, nível de cinza e textura. Regiões interiores seriam
31
simples e sem muitos buracos pequenos. Regiões adjacentes da segmentação devem ter
valores significativamente diferentes com respeito às características sobre o qual são
uniformes. Contornos de cada segmento seriam simples, não rugoso, e devem ser
espacialmente acurados.
A segmentação tem um papel muito importante no reconhecimento de padrões,
pois, a partir dos objetos segmentados, podemos identificá-los, pela extração de
características mensuráveis das propriedades do objeto. O que reduz em muito o número
de informações desejáveis na imagem, tornando possível a tomada de decisões sobre o
objeto em uma futura classificação, seja com o uso de técnicas de estatística de decisão
ou com o uso de redes neurais artificiais (CASTLEMAN, 1995). A segmentação pode
ser abordada de três maneiras, manual, semi-automática e automática.
Na segmentação manual todo o processo de separação de um objeto de
interesse é conduzido por um especialista humano. Só se faz necessário para realização
desse processo, ferramentas que auxiliem o especialista de forma visual para a
separação da área de interesse. Quando o especialista passa informações sobre o que
buscar na imagem, ou onde buscar determinada característica na imagem e existe um
algoritmo capaz de processar esse conhecimento humano e em regiões identificadas
como suspeitas tem-se a segmentação semi-automática. Na segmentação automática,
não existe nenhum conhecimento a priori do que buscar na imagem. O método deverá
ter a habilidade de separar as várias regiões da imagem em conjuntos desconexos de
acordo com critérios de similaridade entre cada região (CASTLEMAN, 1995).
A segmentação de imagem é realizada sob três diferentes técnicas, das quais
podemos citar a segmentação por limiar, segmentação baseada em borda e baseada em
região. A segmentação utilizada neste trabalho foi o GNG e será descrita na Seção 2.2.2.
2.2.1. Crescimento de região 2D e 3D
A segmentação baseada em região é um método praticamente imune a ruídos,
pela razão de se usar um critério homogeneidade para a região de interesse. Este critério
de homogeneidade pode ser o nível de cinza, a cor ou textura, forma, algum modelo, etc
(SONKA; HLAVAC; BOYLE, 1998). A segmentação por crescimento de região é
desencadeado por uma semente colocada em uma região de interesse, ou seja, em um
objeto ao qual se deseja isolar, e cresce gradativamente à medida que encontra pixels
32
com características semelhantes, de acordo com o critério utilizado. Quando a
segmentação é tridimensional (SILVA, 2004 apud NIKOLAIDIS, 2001), um conjunto
de imagens define os objetos que se deseja segmentar. Portanto, um intervalo de
imagens precisa ser especificado para a atuação do método, como um mecanismo de
controle do processo. Tudo acontece como ilustrado pela Figura 2-5.
Figura 2-5. Segmentação por crescimento de região 3D (SILVA, 2004)
O algoritmo de crescimento de região 2D é utilizado na metodologia de
detecção na etapa de redução do volume, mais precisamente na extração do tórax e do
pulmão. Enquanto que o algoritmo crescimento de região 3D foi utilizado na agregação
de estruturas conexas e no processo de isolação do nódulo das outras estruturas.
2.2.2. Growing Neural Gas
O Growing Neural Gas (GNG) é um modelo da área da aprendizagem
competitiva leve não-supervisionada, cujo principal objetivo é distribuir um certo
número de vetores, em um possível espaço dimensional (FRITZKE, 1997). A
distribuição destes vetores reflete a distribuição de probabilidade dos sinais de entrada,
33
que em geral, não é dado explicitamente, mas sim, de forma amostrada. O termo leve se
refere à capacidade de adaptação do vencedor, mas também de algumas unidades
diretamente conectadas a ele. Este vencedor é, como veremos mais detalhadamente na
sua formulação matemática, a unidade mais próxima do sinal de entrada. A
característica não-supervisionada da rede é dada pelo desconhecimento das possíveis
classes (ou saídas) da rede, pois somente o sinal de entrada está disponível.
O GNG é um grafo ou rede, onde cada nó da rede tem uma posição no mesmo
espaço R
n
de entrada. Sua topologia inicia com um determinado número de nós, e à
medida que o algoritmo se processa, isto é, à medida que se amostra um ponto no
espaço de entrada, a rede expande este número de nós até um máximo. Na expansão,
cada nó é inserido na rede numa posição intermediária às duas unidades que possuem
maior erro acumulado (o nó inserido em azul entre o ganhador, em vermelho, e o
segundo ganhador, em amarelo). Um exemplo do GNG é dado na Figura 2-6, após um
número de iterações no espaço R
2
formado por dois objetos, onde existem 5 nós
distribuídos ao longo das duas formas. O ponto em vermelho informa o ganhador para o
ponto amostrado (menor ponto). No estado final do GNG (quando satisfez o critério de
parada, por exemplo, um número máximo de nós), cada um dos objetos da Figura 2-6
será representado por um conjunto de nós diferente, como exemplificado pela Figura
2-7. Entre as possíveis aplicações do GNG estão a redução da dimensionalidade, o
agrupamento e a estimação da densidade de probabilidade do sinal de entrada.
Figura 2-6. Exemplo de um estado da rede GNG com cinco nós e o significado de cada nó.
Figura 2-7. Exemplo de um estado da rede GNG onde cada grupo de nós representam um objeto
34
2.2.2.1. Modelo matemático
Par r n o N unidades, temos a seguinte notação: a uma ede conte d
,
,…,
(2.1)
Cada id c tem um vetor de referência (VF) associado: un ade

(2.2)
indicando a sua posição ou centro de campo receptivo no espaço de entrada.
Entre as unidades da rede existe um conjunto:

(2.3)
de conexões de vizinhança que são sem pesos e simétricas:
,

,

(2.4)
Para uma unidade c, nós denotamos com N
c
, o conjunto de vizinhos
topológ oic s diretos:

,
(2.5)
Os sinais de entrada n-dimensional são assumidos serem gerados de acordo a
uma função den robabilidade contínua sidade de p
,
(2.6)
ou de um s de treinamento conjunto finito de dado

,…,
,

(2.7)
Dado um sinal de entrada ε, o ganhador s(ε) entre as unidades de A é
definido como i tor ncia mais próximo a un dade com ve de refere
arg


(2.8)
O GNG foi utilizado na segmentação das estruturas internas ao parênquima.
2.2.2.2. Objetivos da Aprendizagem competitiva
A aprendizagem competitiva costuma ter alguns objetivos que podem ser
diferentes e mutuamente exclusivos, dos quais citaremos a seguir.
35
Minimização do erro ou erro de quantização esperado (distorção)
Para sinais contínuos de entrada com distribuição de probabilidade p(ε), a
minimização deste valor encontra os vetores de referência w
c
sob seguinte formulação:
,



(2.9)
Para sinais discretos o erro é dado por:
,
1/
|
|



 
(2.10)
A minimização do erro tem importante aplicação na quantização vetorial. A
quantização vetorial é muito utilizada em sistemas de comunicação, onde os canais de
comunicação possuem estreita largura de banda. A transmissão de dados por este canal
acontece pelo envio apenas do índice do vetor de referencia mais próximo. O conjunto
de vetores de referencia é chamado de codebook, e é assumido ser conhecido tanto pelo
remetente quanto pelo receptor. Uma boa taxa de compressão é atingida pela
quantização vetorial, usando as Equações 2.9 e 2.10, com pequena distorção relativa.
Maximização da entropia
A maximização da entropia acontece com a distribuição dos vetores de
referência, de forma que, cada vetor tenha a mesma chance de ser ganhador para um
sinal de entrada aleatório:

1
|
|
(2.11)
A maximização da entropia para a variável aleatória X é dado por:
log


log
1

(2.12)
Que para dados discretos visa encontrar um mesmo número de dados para cada
grupo:
36
|
|
|
|
1
|
|
(2.13)
Ambas as abordagens dadas acima são utilizadas como critérios de
performance para o objetivo secundário da rede GNG, seja este objetivo, o agrupamento
ou a estimação da densidade de probabilidade e etc.
2.2.2.3. Algoritmo do GNG
1. Inicializa o j t duas unidades aleatórias de acordo com p(ε). con un o A com
,
(2.14)
Inicialize as conexões C com vazio
2. Gere um sinal aleatório de entrada ε de acordo com p(ε)
3. Determ s
1
ine os ganhadores e s
2
Є A:
arg


e
arg


(2.15)
4. Se a co não existe, cria-o e ajuste a idade para zero: nexão entre s
1
e s
2

,
 e
Ages
,s
  0
(2.16)
5. Adicione o quadrado da distância entre o sinal de entrada e o ganhado para o
erro local:
∆

(2.17)
6. Adapte os vetores referência do ganhador e da sua vizinhança topológica
pelas fraçõe p ctivamente, da distância total à saída: s Є
b
e Є
n
, res e
∆

 
e
∆



(2.18)
7. Incremente todas as arestas emanando s
1
: Age(s
1
,i)++
8. Remover as arestas com idade acima da a
max
.
9. Insira uma nova unidade a cada múltiplo inteiro de um parâmetro λ:
Determine a unidade q com maior erro acumulado:
37
arg

(2.19)
Determine entre os vizinhos de q a unidade f com maior erro acumulado:
arg

(2.20)
Adicione uma nova unidade r a rede e interpole o seu VF com as
unidades q e f, e remova a aresta original entre q e f:
,

,

,
,, e
,

(2.21)
Decresça v err fração α: as ariáveis o de q e f pela
∆

e ∆

(2.22)
Interpole o erro de r de e q f:

2
(2.23)
10. Decresça o erro de todas as unidades:
∆

(2.24)
11. Se algum critério de parada é atingido, pare, senão vá para o passo 2.
O modelo GNG foi utilizado neste trabalho para agrupamento das regiões de
interesse utilizando como função objetivo ou critério, a minimização da distorção.
2.3. Transformada da distância em relação à borda
A transformada da distância relativa a um objeto ou conjunto é um algoritmo
que cria uma imagem, onde o valor de cada pixel é a distância deste pixel ao pixel mais
próximo de um dado objeto ou conjunto, e é gerado a partir de uma imagem binária.
Um exemplo da aplicação da transformada da distância em relação à borda é dado na
Figura 2-8.
38
Figura 2-8. Aplicação da transformada da distância a uma imagem 2D (SOUZA, 2007).
Os valores em cada pixel da Figura 2-8 são obtidos pela distância em relação a
borda do objeto. Portanto, a borda recebe o valor 1, indicando que está na borda, e os
pixels analisados mais afastados, recebem seus valores conforme a sua distância em
relação a borda.
Neste trabalho, faremos o uso da transformada da distância a objetos
volumétricos, com o intuito de descobrirmos os voxels que possuem os máximos valores
de distância no volume (máximos locais). Estes voxels são de extrema importância na
etapa de separação dos nódulos pulmonares das estruturas que a conectam, vistos que
são tomados como sementes, no processo de crescimento por região.
2.4. Métricas utilizadas na caracterização dos candidatos a nódulo
pulmonar
A caracterização de objetos a partir de suas propriedades mais perceptíveis é
algo que continuamente fazemos, e mesmo o computador, não é diferente. Entretanto,
nós temos o papel de selecionar as características que o computador utiliza, na execução
de algum método de aprendizagem de máquina. As propriedades mais utilizadas na
caracterização do nódulo pulmonar são baseadas na forma ou geometria e na textura.
2.4.1. Medidas de Geometria
A utilização das medidas geométricas sobre os objetos para a sua
caracterização visa explorar suas peculiaridades morfológicas, com o objetivo de
discriminá-los, assim como fazemos cotidianamente com os objetos a nossa volta.
Algumas medidas geométricas são utilizadas na caracterização do nódulo pulmonar das
outras estruturas que o rodeia, e as descreveremos nos parágrafos seguintes.
39
2.4.1.1. Desproporção Esférica
A morfologia é uma informação muito útil quando queremos distinguir objetos
com forma esférica, daqueles com forma alongada e compacta. Situação semelhante
encontramos, no caso da discriminação do nódulo pulmonar de outras estruturas, como
por exemplo, os vasos sanguíneos, e uma das medidas que nos dá esta informação é a
desproporção esférica.
A desproporção esférica é uma medida capaz de mensurar o quanto um
determinado objeto tem sua superfície irregular com relação a uma superfície totalmente
esférica, ou seja, é uma comparação entre a área que um objeto tem e uma possível área
que esse objeto teria, se fosse totalmente esférico.
A medida de desproporção esférica mede a regularidade das bordas de um
objeto. Esta medida é calculada através da Equação 2.25, na qual A é a área da
superfície do objeto, é o raio estimado da esfera com o mesmo volume do objeto. O
raio é obtido através da Equação 2.26, sendo o volume do objeto.

4
(2.25)

3
4
(2.26)
Desta forma, segundo Sousa (2007), a desproporção esférica assume valores
menores para objetos esféricos e valores maiores para objetos alongados ou irregulares.
2.4.1.2. Densidade Esférica
Nódulos pulmonares tem formato semelhante a esfera e outras estruturas como
vasos, veias etc, têm pouca semelhança com a mesma (SOUSA, 2007).
Medidas geométricas bastantes comuns consistem em comparar a área de um
objeto com sua bounding box (caixa mínima), isto é, o menor retângulo ou menor cubo,
para objetos 3D, capaz de envolver o objeto. Essas medidas, entretanto, enfrentam o
problema de calcular o melhor alinhamento da figura circunscrita, ou seja, o problema
de obter uma figura circunscrita com as menores dimensões possíveis através de um
posicionamento desta em torno do objeto inscrito de forma a reduzir as regiões entre a
40
borda objeto e o perímetro da figura. Alinhamento este que sofre com a situação em que
um mesmo objeto produz valores diferentes de alinhamentos devido a rotações no
objeto.
Sendo essas medidas rotacionalmente variantes, a densidade esférica, por outro
lado, utiliza uma esfera, que é uma figura rotacionalmente invariante, para estimar qual
a porcentagem da esfera que também corresponde ao objeto (SOUSA et al., 2007). A
densidade esférica é uma medida que mede quão compacto é um objeto comparando o
seu volume em relação ao volume de uma bounding box.
Utilizando uma esfera cujo volume seja o mesmo do objeto em análise e com
origem no centro de massa deste, a medida de densidade esférica consistirá na
porcentagem desta esfera que, de fato, também corresponda ao objeto. A Figura 2-9
ilustra, em duas dimensões, o conceito de densidade esférica para diferentes objetos.
Figura 2-9. Ilustração da densidade esférica de três objetos em duas dimensões. Fonte: Sousa (2007).
A densidade esférica é calculada pela Equação 2.27, na qual n é o número de
voxels V
,,
tais que
,,
0 e  

 
 
, é o
volume do objeto, é o raio estimado obtido pela Equação 2.26 e
,
e
são as
coordenadas do ce do objeto dada pela Equação 2.28. ntro de massa

 .
(2.27)
,
,
(2.28)
A densidade circular tende a assumir valores próximos a zero para objetos
muito alongados e valores próximos a 100 para objetos mais arredondados.
41
2.4.1.3. Esfericidade
A esfericidade mede quanto o formato do objeto aproxima-se de um formato
esférico. É calculada através da Equação 2.29, onde é o volume do objeto e é área
da sua superfície.

6
(2.29)
2.4.1.4. Distância radial ponderada (DRP)
Segundo Souza (2007), esta medida afere o grau de achatamento de um objeto
a partir de medidas locais dos voxels. Ela expressa a relação de distância entre os voxels
do volume e o eixo medial deste. Volumes muito alongados tendem a ter pequena
distância radial, enquanto que volumes em forma esférica, tendem a ter distância radiais
maiores.
Para desvincular as dimensões do volume da relação DRP, é feita uma
ponderação pelo raio, e sua obtenção é dada pela Equação 2.30.



,,
,,
,,
3
4
(2.30)

,,
0,5

,,
0,5

(2.31)
onde R é o raio estimado obtido pela Equação 2.26, c
x,y,z
é o coeficiente de ponderação
aplicado a cada voxel através da Equação 2.31 e r
x,y,z
é distância radial no voxel de
coordenada x,y,zs do volume.
,,
min 
,,
,|
(2.32)
onde q é um voxel qualquer e Ma é o conjunto dos voxels pertencentes ao eixo medial
do objeto.
A Distância Radial Ponderada tem a propriedade de assumir valores próximos
à unidade em volumes pouco alongados e valores maiores para volumes mais
alongados. Também é uma medida invariante para rotações, translações e escalas.
42
2.4.1.5. Elongação
A elongação mede o grau de alongamento ou assimetria de um objeto. É
calculado através da Equação 2.32 na qual Ar
min
é a medida da menor aresta da caixa
mínima, enquanto que A é aior aresta. r
max
a medida da m



(2.32)
2.4.1.6. Índice de forma radial de Boyce-Clark
Esta medida mede a regularidade da forma de um objeto. É obtida através da
Equação 2.33, onde n é o número de voxels de borda do volume e r
i
ou r
k
são as
distâncias de v l de borda específicos para o centro de massa do objeto. oxe s

100  


100

(2.33)
2.4.2. Medidas de textura
A textura é algo que intuitivamente se consegue observar, contudo, nenhum
conceito preciso foi dado a ela. Textura é um conjunto de elementos mutuamente
relacionados formando blocos de textura que são agrupados em primitivas chamadas de
texels (texture elements) e dependente da escala. Pode ser descrito pela sua tonalidade
ou estrutura espacial (SONKA et al., 1998).
A tonalidade está relacionada às propriedades do pixel, enquanto que a
estrutura descreve a espacialidade das primitivas. Quando a textura é fraca, podemos
descrevê-las através das freqüências dos tipos de primitivas que aparecem na
vizinhança. Já a textura forte, pode ser avaliada melhor por meio da avaliação da
freqüência dos pares de primitivas por possui definição exata (SONKA et al., 1998).
Uma melhor descrição das texturas pode ser dada pela estatística. A estatística
de descrição da textura tem como objetivo medir as propriedades lineares das
primitivas, usando o pixel para avaliar suas correlações, e “dizer”, se a mesma é uma
textura grossa com largas primitivas e baixas freqüências ou texturas finas de primitivas
menores e altas freqüências. Estas correlações são feitas por diversos cálculos, como o
43
coeficiente de autocorrelação, análise de Fourier e a matriz de co-ocorrência (SONKA
et al., 1998).
2.4.2.1. Análise de Componentes Independentes
A análise de componentes independentes - ACI (ICA, do inglês Independent
Component Analysis) é um método visto como uma extensão da análise de componentes
principais - ACP (PCA, do inglês Principal Component Analysis), já que para obter
independência, garantimos a descorrelação, que é um resultado da PCA (COSTA,
2008). A ACI foi desenvolvida no contexto de separação cega de fontes (BSS, blind
source separation), em que o problema é definido na estimação da saída de uma fonte
conhecida, quando esta fonte recebe vários sinais misturados e desconhecidos. ACI tem
sido aplicada em diversas áreas, como por exemplo: áudio, radar, instrumentação
médica, comunicação móvel, engenharia biomédica e outras.
A BSS representa um grande problema na engenharia, pois a técnica mais
utilizada anteriormente era a PCA, que utiliza apenas estatísticas de segunda ordem, o
suficiente apenas para descorrelacionar um conjunto de dados, mas não necessário para
independência, que requer estatística de alta ordem. Por esta razão a ICA é vista como
um método mais “robusto" que PCA, pois se PCA consegue descorrelacionar as fontes
não observáveis, ICA consegue deixá-las mutuamente estatisticamente independentes.
Considere que sejam observadas n misturas lineares x
1
, ..., x
n
, modeladas como
combinação linear de f e dn unçõ s e base






,1,…,
(2.34)
e que cada mistura x
i
, assim como cada componente independente s
1
, ..., s
n
seja uma
variável aleatória e a
ij
os coeficientes (pesos) da mistura linear.
Assume-se que tanto as variáveis da mistura quanto aquelas das componentes
independentes têm média zero. Por conveniência, será usada a notação vetorial em vez
de somas, como aquelas vistas na Equação 2.34, utilizando letras minúsculas e
maiúsculas, para representar, respectivamente, vetores e matrizes. Dessa maneira,
podemos reescrever a Equação 2.34 da seguinte forma:

(2.35)
44
O objetivo da técnica é recuperar as fontes s, através de x, sem nenhuma
informação sobre as propriedades de A.
O modelo estatístico definido na Equação 2.35 é chamado de modelo de
análise de componentes independentes. Esse modelo descreve os dados observados pelo
processo de mistura das componentes independentes s
j
, que não podem ser observadas
diretamente. É preciso estimar tanto s quanto a matriz de mistura A, que também é
desconhecida, pois tudo o que se observa é o vetor x.
2.4.2.2. Matriz de co-ocorrência
As medidas de textura foram calculadas sobre a matriz de co-ocorrência do
volume, que é dada pela Equação 2.36, onde v é a função que dá um dos 26 vizinhos
tridimensionais de um voxel de acordo com o índice α e x y z P , , é o valor do um voxel
de coordenadas x, y, z.

,

,,
,
,,
,|
,,
,
,,
,,
1,,26
(2.36)
2.4.2.2.1. Contraste
O contraste é a medida da quantidade de variação local de níveis de cinza em
uma imagem. É dado pela Equação 2.37, na qual G é a quantidade de níveis de cinza,
Co(i, j) é o elemen a ituado na linha i e coluna j. to d matriz de co-ocorrência s
 
,
.




(2.37)
2.4.2.2.2. Energia
A energia, dada pela Equação 2.38, é medida de não uniformidade de uma
imagem. Em uma imagem uniforme existem poucas transições de níveis de cinza. Nesse
caso, a matriz de co rrência possu as entradas de alta magnitude. -oco i baix
 
,




(2.38)
2.4.2.2.3. Entropia
A entropia ou grau de dispersão de níveis de cinza mede a quantidade de
variação local da imagem. A entropia é calculada pela Equação 2.39.
45
 
,
.log 
,




(2.39)
2.4.2.2.4. Homogeneidade
Quanto menor a variação dos valores dos pixels da imagem, maior é o valor da
homogeneidade, que é obtido através da Equação 2.40.

1
1   

,




(2.40)
2.4.2.2.5. Momento
O momento atinge seu val mo quando a concentração dos valores na
diagonal da matriz - á a. Ele é obtido com a Equação 2.41.
or máxi
de co ocorrência for m xim


,
1
|

|




(2.41)
2.4.2.3. Histograma
As medidas de histograma foram utilizadas tanto no histograma obtido
diretamente da imagem. Histograma é uma representação da quantidade de pixels com
determinado valor de amplitude. Em outras palavras, é a função de distribuição de
freqüência dos tons de uma imagem. O histograma é obtido através de, onde quant(P
x,y
)
é a função que retorna o número de ocorrências de um valor e P
x,y
, é o tom do pixel de
coordenadas x e y.
2.4.2.3.1. Média
A média é dada pela Equação 2.42, onde i h é o valor do histograma para um
determinado tom i e L é o valor máximo de tom do histograma.
.


(2.42)
2.4.2.3.2. Desvio Padrão
O desvio padrão é dado pela Equação 2.43, onde V é a variância do histograma,
obtida através da Equação 2.44.

(2.43)

.


(2.44)
46
2.4.2.3.3. Obliqüidade
A obliqüidade é obtida através da Equação 2.45, onde M
3
é o terceiro momento
angular, dado pela Equação 2.46.

(2.45)
 
.


(2.46)
2.4.2.3.4. Curtose
A curtose é dada pela Equação 2.47, onde M
4
é o quarto momento angular,
dado pela Equação 2.48.

(2.47)
 
.


(2.48)
2.4.2.3.5. Energia
A energia é dada pel 2.49. a Equação



(2.49)
2.4.2.3.6. Entropia
A Equação 2.50 perm r da entropia. ite obter o valo

.log


(2.50)
Estas medidas de textura e geometria foram utilizadas no processo de
classificação em nódulo e não-nódulo como vetor de características no MVS.
2.5. Reconhecimento de padrões
O Reconhecimento de Padrões (RP) é algo realizado em muitas circunstâncias
– navegações, migrações, identificação de predadores, etc. – com razoável eficiência. O
desenvolvimento de métodos capazes de emulação das mais variadas formas de
47
reconhecimento de padrões tem evoluído ao longo do tempo, com a necessidade de
construção de sistemas automatizados inteligentes, que estão se tornando a principal
tendência na indústria hoje e em outros campos de atividades semelhantes. Nestes
sistemas, os objetos são representados de modo adequado ao tipo de processamento no
qual estão sujeitos. Tais representações são chamadas de padrões, isto é, objetos e
padrões são intercambiáveis com similar significado (SÁ, 2001).
O RP é um conjunto de métodos responsáveis pela descrição e classificação de
objetos. Dessa forma, muitos são os métodos desenvolvidos, mas cuja pesquisa ainda
encontra-se fértil. Desde a análise em sinais, imagens, tabelas de valores e etc.
Uma noção muito útil no reconhecimento de padrões é o da similaridade.
Reconhece-se dois objetos pela similaridade de atributos comuns. A similaridade é
estabelecida, em termos de um conceito mais abstrato, pela associação entre um objeto e
um conceito alvo. Por exemplo, reconhece-se uma maçã pela sua imagem e pelo
conjunto de características idealizadas, formando um protótipo e através deste protótipo,
pode-se distingui-la de uma laranja (SÁ, 2001).
A avaliação da similaridade de padrões está fortemente relacionada à tarefa de
reconhecimento de padrões proposto. Logo, devemos extrair características dos objetos
que queremos reconhecer, com o objetivo de gerar protótipos que facilitem classificação
dos objetos em classes (variável categórica).
Em geral essa classificação não é perfeita e nós podemos esperar erros por
muitas causas:
As características usadas são inadequadas ou insuficientes;
Os padrões simples usados para projetar o classificador não são suficientemente
representativos;
O classificador não é eficientemente o bastante para separar as classes por
possuir inadequados protótipos;
Há uma intrínseca sobreposição das classes que nenhum classificador pode
resolver.
O RP objetiva o mapeamento do espaço de representação (vetor de
características) ao espaço de interpretação (vetor de protótipos ou classes) e é chamado
de hipótese (SÁ, 2001).
A hipótese pode ser:
48
Supervisionada, dirigida a conceito ou hipótese indutiva: Encontra no espaço de
representação uma hipótese correspondente à estrutura do espaço de
interpretação;
Não supervisionada, dirigida a dados ou hipótese dedutiva: Encontra uma
estrutura no espaço de interpretação correspondente à estrutura no espaço de
representação.
A hipótese é derivada do uso de métodos de aprendizagem que pode ser
estatístico, de aproximação (minimização do erro) ou de natureza estrutural.
A tarefa de reconhecimento requer um conjunto de etapas:
Aquisição do padrão, que pode ter muitas formas: aquisição de um sinal ou
imagem, coleção de dados;
Extração de características, na forma de medidas, extração de primitivas, etc.
Pré-processamento. Em alguns casos os valores não estão diretamente prontos
para o uso em alguns classificadores. Por exemplo, em algumas aplicações de
rede neurais é usual padronizar as características em algum modo (colocando os
dados no intervalo [0,1]);
A classificação propriamente dita pelo uso de um núcleo de classificação;
Pós-processamento. Algumas vezes a saída obtida do classificador não pode ser
diretamente usada.
A etapa de classificação começa com a avaliação do tipo de característica a ser
usado no problema de reconhecimento. Para este propósito, um conjunto inicial de
parâmetros é usualmente disponibilizado. Na hipótese supervisionada, este conjunto
inicial, representado por n vetores de características d-dimensional ou n ou strings
construídas com d primitivas, é usado para o desenvolvimento do núcleo, consistindo no
conjunto de treinamento.
O desempenho do sistema do RP é avaliado em termos da taxa de erros de
todas as classes e sobre todo o conjunto. Quando a avaliação é feita sobre os padrões do
conjunto de treinamento, em média, obtemos uma avaliação dita ótima. Com intuito de
obter melhores estimativas do sistema RP, é usado outro conjunto de características não
usado durante a etapa de treinamento, na formação do núcleo. Este novo conjunto é
chamado de conjunto de teste. Dando-nos uma idéia de quão bom o classificador é
capaz de generalizar sua capacidade de reconhecimento a novos padrões (SÁ, 2001).
49
A problemática do RP dispõe de diversos métodos de classificação, no qual os
mais empregados são os métodos supervisionados de análise discriminante de Fisher
(estatístico), perceptron de múltiplas camadas (rede neural) e a máquina de vetores de
suporte (aproximação) usado neste trabalho.
2.5.1. Máquina de Vetores de Suporte
A Máquina de Vetores de Suporte (MVS) introduzida por Vapnick (1998) é um
método de aprendizagem supervisionada usado para estimar uma função que classifique
dados de entrada em uma ou mais classes. A idéia básica por trás da MVS é construir
um hiperplano como superfície de decisão, de tal maneira que a margem de separação
entre as classes seja máxima. O objetivo do treinamento através de MVS é a obtenção
de hiperplanos que dividam as amostras de tal maneira que sejam otimizados os limites
de generalização.
As MVS são consideradas sistemas de aprendizagem que utilizam um espaço
de hipóteses de funções lineares em um espaço de muitas dimensões. Os algoritmos de
treinamento das MVS possuem forte influência da teoria de otimização e de
aprendizagem estatística. Em poucos anos, as MVS vêm demonstrando sua
superioridade frente a outros classificadores em uma grande variedade de aplicações
(CRISTIANINI e SHAWE, 2000).
Em casos em que o conjunto de amostras é composto por duas classes
separáveis, um classificador MVS é capaz de encontrar um hiperplano baseado em um
conjunto de pontos denominados “vetores de suporte”, o qual maximiza a margem de
separação entre as classes. Por hiperplano entende-se uma superfície de separação de
duas regiões em um espaço multidimensional, onde o número de dimensões possíveis
pode ser, até, infinito. Mesmo quando as duas classes não são separáveis, a MVS é
capaz de encontrar um hiperplano através do uso de conceitos pertencentes à teoria da
otimização. A Figura 2-10 mostra em duas dimensões para melhor visualização,
hiperplanos de separação entre duas classes linearmente separáveis. O hiperplano ótimo
(linha mais escura), não somente separa as duas classes, mas mantém a maior distância
possível com relação aos pontos da amostra.
50
Figura 2-10. Separação de duas classes através de hiperplanos
Seja o conjunto de amostras de treinamento (x
i
, y
i
), sendo x
i
n
o vetor de
entrada, y
i
, a classificação correta das amostras e i = 1,...n o índice de cada ponto
amostral. O objetivo da classificação é estimar a função f:
n
{±1}, que separe
corretamente os exemplos de teste em classes distintas.
A etapa de treinamento estima a função
bxwxf
+
=
).()(
, procurando por
valores de w e b tais que a seguinte relação seja satisfeita:
1)).((
+
bxwy
ii
(2.51)
Os valores ótimos de w e b serão encontrados ao minimizar a Equação 2.52, de
acordo com a restrição dada pela Equação 2.51 (CHAVES, 2006).
2
)(
2
w
w =Φ
(2.52)
MVS ainda possibilita encontrar um hiperplano que minimize a ocorrência de
erros de classificação nos casos em que uma perfeita separação entre as duas classes não
for possível. Isso graças a inclusão de variáveis de folga, que permitem que as restrições
presentes na Equação 2.51 sejam quebradas.
O problema de otimização passa a ser então a minimização da Equação 2.53,
de acordo com a restrição imposta pela Equação 2.51. C é um parâmetro de treinamento
que estabelece um equilíbrio entre a complexidade do modelo e o erro de treinamento e
deve ser selecionado pelo usuário.
51
=
+=Φ
N
i
i
C
w
w
1
2
2
),(
ξξ
(2.53)
1)).((
+
+
iii
bxwy
ξ
(2.54)
Através da teoria dos multiplicadores de Lagrange, chega-se à Equação 2.55. O
objetivo então passa a ser encontrar os multiplicadores de Lagrange α
i
ótimos que
satisfaçam a Equação 2.56 (CHAVES, 2006).
==
=
N
ji
jijiji
N
i
i
xxyyw
1,1
)(
2
1
)(
αααα
(2.55)
=
=
N
i
iii
Cy
1
0,0
αα
(2.56)
Apenas os pontos onde a restrição dada pela Equação 2.51 seja exatamente
igual à unidade têm correspondentes α
i
0. Esses pontos são chamados de vetores de
suporte, pois se localizam geometricamente sobre as margens. Tais pontos têm
fundamental importância na definição do hiperplano ótimo, pois os mesmos delimitam a
margem do conjunto de treinamento.
A Figura 2-11 destaca os pontos que representam os vetores de suporte. Os
pontos além da margem não influenciam decisivamente na determinação do hiperplano,
enquanto que os vetores de suporte, por terem pesos não nulos, são decisivos.
Figura 2-11. Vetores de suporte (destacados por círculos).
Para que a MVS possa classificar amostras que não são linearmente separáveis,
é necessário uma transformação não-linear que transforme o espaço entrada (dados)
para um novo espaço (espaço de características). Esse espaço deve apresentar dimensão
suficientemente grande, e através dele, a amostra pode ser linearmente separável. Dessa
52
maneira, o hiperplano de separação é definido como uma função linear de vetores
retirados do espaço de características ao invés do espaço de entrada original. Essa
construção depende do cálculo de uma função K de núcleo de um produto interno
(HAYKIN, 2001). A função K pode realizar o mapeamento das amostras para um
espaço de dimensão muito elevada sem aumentar a complexidade dos cálculos.
A Equação 2.57 mostra o resultado da Equação 2.52 com a utilização de um
núcleo.
==
=
N
ji
jijiji
N
i
i
xxKyyw
1,1
),(
2
1
)(
αααα
(2.57)
Uma importante família de funções de núcleo é a função de base radial, muito
utilizada em problemas de reconhecimento de padrões e também utilizada neste
trabalho. A função de base radial é definida por
2
(, ) exp( || ||)
ij i j
Kx x x x
γ
=−
(2.58)
2.6. Validação de Resultados
Fazer reconhecimento de padrão é um processo imperfeito que resulta mais em
probabilidade de se estar certo do que em certeza. Embora possam existir várias
medidas para verificar o desempenho de um classificador qualquer, a medida mais
importante é o desempenho do mesmo a partir da classificação de novos casos (conjunto
de testes). O desempenho do classificador, medido através do conjunto de teste, é uma
boa indicação de seu desempenho real.
Em problemas ligados a área de saúde, a estrutura básica dos testes de
classificação é para determinar quão bem um teste discrimina a presença ou ausência de
uma doença. Nesse tipo de problemas, existe a presença de uma variável preditora
(resultado do teste) e uma variável resultante (a presença ou ausência da doença)
(LUNA, 2007).
A variável preditora do teste é geralmente dividida em duas, definindo os
critérios de corte que confirmam ou não a presença da doença. A variável resultante do
teste diagnóstico é a presença ou ausência da doença, confirmada por um exame
considerado "padrão ouro".
53
Quando se avalia um teste diagnóstico quatro situações são possíveis:
1.
O teste é positivo e o paciente tem a doença - Verdadeiro Positivo (VP);
2.
O teste é positivo, mas o paciente não tem a doença - Falso Positivo (FP);
3.
O teste é negativo e o paciente tem a doença - Falso Negativo (FN) e
4.
O teste é negativo e o paciente não tem a doença - Verdadeiro Negativo (VN).
Geralmente utilizam-se algumas estatísticas descritivas para avaliar o
desempenho do classificador, como Sensibilidade (S), Especificidade (E), Valor
Preditivo Positivo (VPP) e Valor Preditivo Negativo (VPN).
A sensibilidade (S) de um teste é definida pela proporção de pessoas com a
doença de interesse que têm o resultado do teste positivo. Indica quão bom é o teste para
identificar os indivíduos doentes:



(2.59)
A especificidade (E) de um teste é a proporção de pessoas sem a doença que
tem o teste negativo. Indica quão bom é o teste para identificar os indivíduos não
doentes:


 
(2.60)
A taxa de classificação correta (A) é definida como a razão entre o número de
casos na amostra em estudo que foram classificados corretamente e o número total de
casos na amostra em estudo.
 

(2.61)
A taxa de falsos positivos por exame é dada por:
/


(2.62)
onde TFP é o número de falsos positivos somados em todos os exames e n
exames
é o
número de exames considerados no teste.
54
A taxa de falsos positivos por gem é dada por: ima
/


(2.63)
onde TFP é o número de falsos positivos somados em todos os exames e n
imagens
é o
número de imagens em todos os exames considerados no teste.
Após a decisão de realizar um teste, o dado mais importante para o clínico é
estimar se o resultado do mesmo é verdadeiro. Esta informação - o Valor Preditivo
Positivo e Negativo, é facilmente obtida através da sensibilidade e especificidade.
O Valor Preditivo Positivo (VPP) do teste diagnóstico é, portanto, a
probabilidade de uma pessoa com resultado positivo ter a doença, expressa por: um


 
(2.64)
O Valor Preditivo Negativo (VPN) do teste é a probabilidade de uma pessoa
com resultado negativo não ter a nça, expressa por: doe


 
(2.65)
A sensibilidade, especificidade, valor preditivo positivo e negativo, além do
acerto total do sistema é usado para avaliar o desempenho e adequação da metodologia
desenvolvida neste trabalho.
55
3. Metodologia Proposta
A metodologia de detecção de nódulos pulmonares desenvolvida envolve a
utilização de um método da aprendizagem competitiva, chamado de Growing Neural
Gas (GNG). Ela consiste na redução do volume de interesse, através de técnicas
amplamente utilizadas na extração do tórax, extração do pulmão e reconstrução.
Seguido da aplicação do GNG no volume de interesse resultante. A próxima etapa é a
de separação do nódulo das diversas estruturas presentes e por fim, é realizada a
classificação das estruturas em nódulo e não-nódulo, por meio das medidas de
geometria e textura.
O GNG foi utilizado nesta metodologia para separar, todas as estruturas
densas, interiores ao parênquima pulmonar, do próprio parênquima, em dois grupos
distintos. Uma vez descartado o parênquima para redução do volume de interesse e
acelerar a detecção dos possíveis nódulos pulmonares, várias estruturas interiores ao
pulmão estão parcialmente prontas para serem segmentadas. Contudo, estas estruturas
estão conectadas e arranjadas, de forma a compor a árvore brônquica do pulmão,
carecendo então, de uma solução, para segmentação das estruturas de interesse, em
especial, o nódulo pulmonar.
A separação do nódulo pulmonar de outras estruturas foi realizada através da
aplicação da transformada de distância por todas as estruturas encontradas pelo GNG.
Esta informação nos permitiu detectar todos os pontos de máxima aglomeração de
voxels e foram considerados prováveis centros dos nódulos pulmonares. A completa
separação do nódulo pulmonar dos vasos ligados a este, é simplesmente feita através do
uso do algoritmo de crescimento de região em três dimensões, usando este provável
centro de máxima aglomeração de voxels, como semente do algoritmo de crescimento
de região.
A
Figura 3-1 ilustra cada uma das etapas, bem como a ordem em que são
aplicadas, para o objetivo de segmentação automática do nódulo pulmonar.
56
Figura 3-1. Fluxo da metodologia proposta
3.1. Aquisição das Imagens de TC
A base de imagens utilizada neste trabalho foi criada e disponibilizada pelo
NCI – National Cancer Institute, através de um consórcio de instituições para
desenvolver um consenso e padronização das bases de imagens de nódulo pulmonar
obtidas através de tomografia computadorizada. O Lung Image Database Consortium -
LIDC (MCNITT et al, 2004) é um grupo que procura estabelecer um formato padrão e
processos de gerenciamento de imagens de pulmão, relatórios técnicos e dados clínicos
57
necessários para o desenvolvimento, treinamento, e evolução de algoritmos para
detectar e diagnosticar câncer de pulmão.
A base fornece um contorno para nódulos pulmonares maiores que 3 mm,
enquanto que para aqueles inferiores a 3 mm, apenas o centróide é fornecido. O
contorno do nódulo é definido ao longo das fatias, assim como a sua classificação, por
quatro especialistas e disponibilizado em um arquivo XML. Dessa forma, de 84 exames
disponíveis nesta base, apenas 50 exames possuem informação do contorno. Um
contorno é formado por pares de pontos de coordenadas (x,y) que delimitam, em cada
imagem do exame, a região onde o especialista identificou o nódulo.
Um nódulo é identificado como tal, a partir da análise de quatro especialistas
sobre o exame, sem que um saiba da existência do nódulo pulmonar indicado pelo
outro. Cada um classifica (em maligno ou benigno, onde cada classe possui uma escala
5 níveis, que vai de moderado a altamente suspeito) e identifica o contorno do nódulo
em cada exame. Sendo assim, é possível ter diferentes diagnósticos para um mesmo
nódulo, pois os mesmos são realizados por quatro diferentes especialistas. Portanto,
toda estrutura indicada por qualquer um dos quatro especialistas foram consideradas
como nódulo pulmonar, independente da sua classificação como maligno e benigno,
mas somente aqueles que tiveram o contorno definido foram utilizados em nosso
trabalho como padrão ouro, isto é, 48 nódulos pulmonares.
3.2. Redução do volume de interesse (VOI)
A etapa de redução do VOI visa diminuir o número de interferentes
encontrados na aquisição das imagens para a etapa seguinte, a da aplicação do GNG,
implicando apenas na segmentação das estruturas internas ao pulmão. Esta possui três
passos compreendendo a extração do tórax, a extração do parênquima pulmonar e da
reconstrução do pulmão.
A redução do VOI foi realizada por meio de um conjunto de bibliotecas
desenvolvidas para o mesmo objetivo de segmentação pulmonar automática e
implementadas por Sousa (2007). Uma pequena explanação da sua metodologia será
exposta a seguir.
58
3.2.1. Extração do tórax
O objetivo é eliminar alguns interferentes gerados no processo de aquisição das
imagens de TC, até restar apenas a estrutura 3 indicada na Figura 3-2, com as estruturas
internas que ela envolve. Alguns destes interferentes podem ser visualizados na Figura
3-2, e estão indicados pelos números 1 e 2.
A extração do tórax foi realizada através do algoritmo de crescimento de região
em 2D, com sementes localizadas em cada um dos quatro cantos da imagem e
exemplificada na Figura 3-4
(a). Os limiares para o algoritmo de crescimento foram
encontrados através do processo da limiarização do histograma calculado ao longo da
diagonal de uma única imagem, conforme visto na Figura 3-2, onde a linha de cor verde
mostra os pontos da diagonal da imagem usados na construção do histograma. Um
exemplo do histograma encontrado é dado na Figura 3-3, que mostra o histograma e o
limiar encontrado. Na Figura 3-3 aparece indicado cada um dos picos que são tomados
como base para o cálculo do limiar, onde o pico indicado pelo número um, refere-se aos
tecidos moles e ao ar, enquanto que o pico indicado pelo número dois, refere-se aos
músculos e ossos.
A seqüência de resultados na extração do tórax é visualizada na Figura 3-4, que
mostra em a) o inicio da segmentação pelas quatro sementes, em b) é visto um rápido
progresso do crescimento e em c) o resultado completo da extração do tórax.
Figura 3-2. Exemplo de imagem usada no cálculo do histograma ao longo da linha diagonal em azul.
59
Figura 3-3. Histograma diagonal de uma fatia de exame de TC
Figura 3-4. Progresso do crescimento de região para extração do toráx
3.2.2. Extração dos pulmões
A extração dos pulmões compreende a retirada das estruturas do mediastino e
da parede torácica a fim de isolar apenas o parênquima e as diversas estruturas internas
contidas nele.
O processo de extração dos pulmões também é resultado do crescimento de
região, com limiar retirado do mesmo histograma diagonal descrito na extração do
tórax. Contudo, a semente é inicializada em um ponto da diagonal que possui maior
densidade, isto é, que se encontra dentro da parede torácica. A Figura 3-5 mostra um
dos lados do pulmão após o crescimento de região.
60
Figura 3-5. Pulmão direito extraído
Um problema desse processo de extração é a existência de nódulos ligados à
parede torácica que são eliminados junto com a mesma. Em vista disso, a etapa seguinte
é a reconstrução dos pulmões, que restaura parte das estruturas do parênquima que
estavam ligadas à caixa torácica, e será explicada em seguida.
3.2.3. Reconstrução dos pulmões
A reconstrução do pulmão é um importante passo, que tem como função,
reincorporar nódulos pulmonares que estavam conectados à caixa torácica e que foram
excluídos de forma errada pelo passo de extração do pulmão.
Na reconstrução dos pulmões é utilizada uma técnica chamada de Rolling Ball
que utiliza operações morfológicas de fechamento com um elemento estruturante
circular, ao longo do contorno do pulmão, fazendo com que as concavidades onde este
elemento não consiga entrar, sejam reconstruídas. A Figura 3-6 exemplifica o uso da
técnica Rolling Ball em um buraco aberto. Quando a técnica é aplicada ao longo do
contorno do pulmão, o resultado obtido é dado pela Figura 3-7.
De maneira mais formal, a operação de fechamento entre uma imagem A e um
elemento estruturante B é dada por
· Θ, onde    é uma
operação de dilatação dada por

|,, e Θ é uma
operação de erosão dada por
Θ|   .
61
Figura 3-6. Fechamento de um buraco aberto por Rolling Ball
Figura 3-7. Imagem de um parênquima reconstruído
A redução do VOI também garante a diminuição do uso dos recursos da
máquina, como memória e tempo de processamento, pois as bibliotecas implementadas
para este fim, possuem como base, uma estrutura de dados semelhante a um grafo, e
construída através de uma estrutura de dados mais simples, uma lista duplamente
encadeada. As vantagens do uso desta estrutura de dados estão no modo como as várias
regiões excluídas em cada passo de redução do VOI são desalocadas da memória e, do
conseqüente aumento na velocidade do processamento do volume, pois somente os nós
ativos da estrutura de dados são processados. A Figura 3-8 de uma imagem do volume
exemplifica o resultado final da redução do volume, onde as áreas totalmente escuras
denotam as regiões excluídas no processo.
62
Figura 3-8. Imagem resultante da redução do VOI
3.3. Segmentação
A segmentação do nódulo pulmonar é composta por duas fases. A primeira fase
compreende o agrupamento das estruturas densas por meio da aplicação do GNG e da
segmentação das estruturas por meio do algoritmo de crescimento de região 3D. A
segunda é a fase de separação das estruturas conectadas ao nódulo e é realizada nas
diversas estruturas, resultando em estruturas menores, através da aplicação da
transformada de distância 3D. A seguir é dada uma sucinta explicação de como estes
métodos são aplicados para o objetivo de segmentação.
3.3.1. Aplicação do GNG
O GNG foi utilizado na segmentação das estruturas do parênquima utilizando-
se de sua capacidade adaptativa para encontrar valores de voxels com algum significado.
O que se pretende com a aplicação do GNG é encontrar os valores dos voxels que
representam tanto as estruturas internas (tecidos de alta densidade, como músculos e
ossos) ao parênquima quanto o parênquima (tecido de baixa densidade), de forma
individual e independente da base de imagens utilizada. A Figura 3-9 ilustra a
associação dos nós da rede GNG na representação dos tecidos com valores opostos na
escala de densidade em Hounsfield. Isto foi realizado com a adoção de um vetor de
características correspondente aos valores dos voxels dos 26 vizinhos de um
determinado voxel de coordenadas (x,y,z). Uma idéia de como seria estes 26 vizinhos de
um voxel é dada pela Figura 3-10. Estes vetores de características são encontrados para
63
cada voxel do volume reduzido e a amostragem do sinal não ocorre no espaço de
características, pois as características (voxels) estão em função das coordenadas de um
voxel qualquer. A vantagem de se realizar a amostragem no espaço de coordenadas está
na redução do conjunto amostral do sinal de entrada, pois o número de amostras seria
muito grande (26 elementos do vetor de características multiplicado pelo número de
voxels do volume). O tempo computacional também foi reduzido, visto que apenas três
variáveis eram amostradas (as coordenadas x,y,z), ao invés das 26 variáveis do vetor de
características. O conjunto de voxels de amostra forma o que se chama de conjunto de
“treinamento”, pois a rede GNG, ao longo de sua execução, tem de encontrar um estado,
onde seus nós estejam numa posição no espaço de características com algum
significado, e este significado para o nosso trabalho era encontrar tecidos de alta
densidade.
Figura 3-9 – Associação dos dois vetores do GNG a cada um dos tecidos de interesse na segmentação.
64
Figura 3-10. Voxel de coordenadas (x,y,z) e a sua vizinhança.
A avaliação da rede GNG é feita utilizando-se como função objetivo, a
minimização da distorção (Seção 2.2.2.2) e o estado da rede que se deseja encontrar, é o
estado em que a rede possui valor mínimo de distorção, dentre todos os estados da rede,
em certo número de interações. A Figura 3-11 mostra um exemplo do comportamento
da distorção ao longo da execução do GNG e nela também está indicado com uma seta
em vermelho o instante que é obtido o menor valor da distorção.
Figura 3-11. Demonstração do comportamento da distorção ao longo das iterações.
Para que a segmentação ocorra, é necessário o provimento dos seguintes
parâmetros:
65
Número máximo de nós;
Número de iterações para a inserção de uma nova unidade;
Taxa de decaimento do erro para a unidade e do seu vizinho com maior erro;
Taxa de decaimento do erro para as demais unidades;
Idade máxima de uma aresta;
Taxa de adaptação do ganhador;
Taxa de adaptação dos vizinhos do ganhador.
O número de nós da rede define o número de grupos que se deseja obter.
Mesmo o GNG não sendo uma rede neural supervisionada, apesar de a implementação
usada possuir uma variante supervisionada utilizando a função RBF, foi necessário
incluir a informação do grupo a que pertence cada nó da rede, pois não utilizamos a
variante supervisionada. O grupo classificado como parênquima era aquele que possuía
o maior número de voxels, isto porque o número de voxels do parênquima claramente
excede e muito o número de voxels de todas as estruturas contidas nela.
Os parâmetros utilizados na segmentação foram ajustados empiricamente para
que melhor resultassem na segmentação das estruturas do parênquima e foram tomados
como constantes para toda a base.
A segmentação propriamente dita é realizada percorrendo cada voxel ativo do
volume e verificando a que nó da rede GNG ele pertence.
3.3.2. Separação das estruturas
A separação do nódulo pulmonar das estruturas (vasos, brônquios e etc) que o
conectam é um pré-requisito essencial para a tarefa de detecção do nódulo. Para se
chegar a este estado, a aplicação da transformada de distância com o algoritmo de
segmentação por crescimento de região 3D foi de extrema importância.
Após a aplicação do GNG no volume reduzido, é feito um reagrupamento das
estruturas, através da aplicação do algoritmo de crescimento de região 3D, de forma a se
segmentar aquelas estruturas que estão conectadas entre si. Esta tarefa, portanto, não
requer qualquer limiar, apenas voxels conexos são necessários. As estruturas resultantes
ainda não estão em suas porções constituintes, isto é, não estão divididas em estruturas
elementares, como nódulos, brônquios, vasos e etc, o mesmo ocorrendo para outras
estruturas.
66
Em alguns volumes, os agrupamentos dos voxels pertencentes às estruturas
internas do parênquima pulmonar formam uma única estrutura formada pela árvore
brônquica e vascular. A árvore brônquica é composta de bronquíolos e brônquios.
Muitas destas estruturas podem até serem confundidas com o nódulo pulmonar, pela
densidade e forma. Por isso, a separação do nódulo destas estruturas é de difícil
realização quando realizada apenas por métodos baseados em densidade, como é o caso
do agrupamento. Logo, a geometria é a característica mais utilizada neste caso. O
simples fato dos vasos serem mais tubulares que o nódulo pulmonar, nos permite
encontrar alguma métrica baseada em geometria capaz de diferenciá-lo desta estrutura.
A Figura 3-12 demonstra bem essa diferença. Nela está um nódulo ligado ao
bronquíolo.
Figura 3-12. Imagem da superfície de duas estruturas, o nódulo e o bronquíolo.
A transformada da distância nos dá essa informação geométrica que tanto
procuramos. Ela mapeia, quando aplicada ao longo da estrutura resultante do
agrupamento com o GNG e crescimento de região 3D, cada voxel do volume com a
informação da distância em relação à borda.
3.3.2.1. Transformada de distância 3D
A transformada de distância é calculada em cada uma das estruturas
encontradas no passo anterior, começando com o valor um, em todos os voxels da borda
e é incrementado à medida que “entramos” na camada de voxels mais interna a borda,
até sobrar um ou mais voxels que estiverem à mesma distância da borda. Em outras
palavras, os voxels de uma mesma camada possuem o mesmo valor da transformada de
distância. O cálculo termina quando atingirmos a última camada.
67
Estruturas tubulares e alongadas possuem valores da transformada de distância
com pequenos intervalos e constante ao longo do seu maior comprimento. Um exemplo
desta afirmação é dado pela Figura 3-13, onde cada voxel de uma projeção 2D de uma
estrutura volumétrica tem um valor de transformada de distância. Também se pode
perceber, que estruturas com grande concentração de voxels, como nódulos, possuem
grande valor da transformada de distância. Este alto valor evidencia a natureza esférica
do nódulo pulmonar.
Figura 3-13. Etapas do processo de isolamento do nódulo pulmonar
Devido a transformada de distância ser calculada com relação à borda da
estrutura, os valores de máxima concentração de voxels estão nos centros das diversas
estruturas encontradas na árvore brônquica. Isto nos dá a idéia de que estes máximos
podem ser pontos com grandes chances de serem nódulos pulmonares. Portanto, os
máximos locais foram encontrados ao longo de todas as estruturas (da árvore brônquica
e vascular) e usados como sementes, no processo de segmentação por crescimento de
região 3D. A Figura 3-13 a) exibe dois voxels, em cor vermelha e azul, que são
representativos dos máximos locais encontrados na estrutura. Contudo, dependendo da
geometria das estruturas segmentadas, máximos locais podem aparecer em
conglomerados, e neste caso, serão tratados como um único máximo local, mas todos
sendo fontes do crescimento de região.
68
Os máximos locais são encontrados percorrendo todos os voxels da estrutura e
pesquisando na vizinhança de um voxel considerado e em uma determinada distância, se
existe algum valor da transformada de distância maior que o do voxel considerado. Caso
não exista, o voxel considerado é um máximo local.
A separação do nódulo pulmonar dos vasos é feita explorando a característica
citada anteriormente, em que vasos, em seu formato tubular alongado, possuem valor
constante ao longo do seu comprimento, e um simples crescimento de região 3D é capaz
de usar essa característica como forma de isolar o nódulo das estruturas que o conectam,
bastando apenas, encontrar um mecanismo para o controle de todo o processo.
O mecanismo de controle da segmentação por crescimento de região 3D está
na agregação de voxels que partem da semente (máximos locais da transformada de
distância), até os voxels de borda, com valores iguais a um, sem que haja repetição no
valor da transformada da distância, entre o valor da semente ao voxel que será agregado.
A agregação dos voxels partindo das sementes não acontece nas estruturas tubulares,
como os vasos, por possuírem longos segmentos de voxels com valor da transformada
de distância constante.
Cada semente também dará origem a uma estrutura em particular, resultando
então, em muitas estruturas, o que consiste em uma desvantagem. Pois, quanto mais
estruturas candidatas a nódulo pulmonar, maiores são as chances de existirem falsos
positivos, visto que elas podem possuir densidade e formas semelhantes aos nódulos
pulmonares.
A separação dos vasos do nódulo pulmonar até então é feita sem que haja o
conhecimento da classificação das estruturas (se a estrutura é nódulo ou não-nódulo),
pois este método não requer esta informação. A aplicação deste método simplesmente
“quebra” toda a árvore brônquica em porções que possuem alta concentração de voxels
separando-as das porções mais tubulares. Entretanto, após esta etapa, somente as
estruturas que possuíam máximo global superior a um determinado valor eram
identificadas e utilizadas para completar a análise de detecção do nódulo pulmonar.
69
3.4. Extração de características
A diferenciação do nódulo pulmonar das outras estruturas será realizada
através de características geométricas como a Desproporção Esférica, a Densidade
Esférica, a Distância Radial Ponderada, a Esfericidade, a Elongação e o Boyce-Clark
Radial Shape Index, todas utilizadas por Sousa (2007), e através das medidas de textura
obtidas da matriz de co-ocorrência e do histograma das estruturas, como o contraste,
energia, entropia, homogeneidade e momento; E ainda, da Análise de Componentes
Independentes (ACI).
A ACI foi calculada com base no centro da estrutura. Uma vez encontrado a
coordenada do centro da estrutura, eram buscados todos os vizinhos em um determinado
valor de raio R. Os vetores de amostra x eram formados pela vizinhança, em um raio
unitário, de cada um dos pontos vizinhos encontrados com raio R. A matriz A calculada
com o ACI foi utilizada como vetor de características para etapa de classificação. Como
o raio foi unitário, obteve-se 27 características do ACI.
Todas as medidas foram escaladas no intervalo de -1 a 1, com o objetivo de
que todas as medidas tenham a mesma importância na tarefa de classificação.
3.5. Classificação de candidatos
A classificação dos candidatos a nódulos por meio do MVS é realizada através
das medidas extraídas de geometria e textura. A função núcleo utilizada na metodologia
foi a função de base radial (RBF – Radial Basis Function) e esta possui dois parâmetros
a serem estimados, o C, e o γ, ambos descritos na seção de fundamentação teórica.
Um conjunto de treinamento foi utilizado para treino do MVS e os casos
restantes foram utilizados para teste, e conseqüente validação da metodologia. Do
conjunto de treinamento, é possível estimar os parâmetros C e gama da função RBF,
que são passados para o treinamento com o objetivo de gerar o modelo utilizado nas
classificações dos casos de teste.
A validação do resultado da classificação é dada pela sensibilidade,
especificidade e acurácia, e também pela taxa de falsos positivos por exame e por
imagem, apresentadas na fundamentação teórica.
70
4. Resultados e Discussões
A detecção do nódulo pulmonar envolve uma série de etapas descritas na
metodologia. Descreveremos os resultados das etapas mais interessantes na detecção do
nódulo pulmonar, com todas as informações quantitativas necessárias para que o mesmo
experimento seja realizado em qualquer lugar, sob as mesmas condições. Desde a
aquisição das imagens de TC, até a última etapa, a de classificação em nódulo pulmonar
e não- nódulo pulmonar através do MVS e das características que o classificador utiliza.
Após a separação das estruturas pela transformada de distância 3D, foi feito
dois experimentos diferentes, um sem e o outro com restrição, respectivamente. Esta
restrição foi imposta devido ao grande número de estruturas geradas pela transformada
de distância 3D. A restrição é efetuada no máximo local das estruturas, que após a sua
divisão em uma estrutura mais elementar, por exemplo, o nódulo, passa a ser o máximo
global (vide exemplo de máximo global na Figura 2-1, indicado pelo número 4).
Estruturas com máximo global inferior a 7 são descartadas na etapa de detecção do
nódulo pulmonar.
4.1. Base de imagens
A base de imagens de TC chamada de LIDC possui 50 exames com contorno
dos nódulos definidos por especialistas. Os exames possuem número de imagens
variando de 101 a 525. Se considerarmos o ponto de vista de cada um dos quatro
especialistas na detecção e caracterização do nódulo pulmonar, teremos um total de 109
nódulos pulmonares. Isto significa que existem exames com mais de um nódulo
pulmonar. As dimensões dos voxels estão no intervalo de 0,51 a 0,76 mm para os eixos
x e y, enquanto que a espessura varia de 1,25 a 3,00 mm. Como as imagens estão no
formato DICOM, todas as imagens possuem 16 bits de quantização.
4.2. Implementação e hardware utilizado
Toda a implementação foi realizada em C++. A parte da metodologia que
realiza a redução do VOI foi implementada por Souza (2007), assim como a
implementação do crescimento de região 2D e 3D, e a transformada da distância, pois
todos estes recursos foram utilizados em seu trabalho para a esqueletonização das
estruturas do pulmão. Foi apenas feito o reuso de suas implementações, de forma que
71
logicamente encadeadas e reorganizadas, pode-se chegar a resultados bem diferentes,
mas com número de estruturas candidatas em maior número, cerca do triplo, se for
considerado a restrição das estruturas com o valor da transformada, e até o quíntuplo
sem a restrição. A manipulação do conjunto de imagens DICOM que compõe o volume
foi realizada com o DCMTK
4
. O GNG também foi reutilizado. Sua implementação é
dada por OLMSTRÖM (2002). Contudo, ela está restrita a vetores de características bi-
dimensionais. Foi necessário expandi-la para suportar qualquer espaço dimensional no
vetor de características. A etapa de classificação dos nódulos é realizada com a
biblioteca LibSVM (CHANG; LIN, 2001), que é a única parte da metodologia escrita
estritamente em linguagem C.
O hardware utilizado nos testes foi um Core 2 Duo de 2.41 GHz, como 250
GB de HD e 4 GB de RAM.
4.3. Segmentação com GNG e detecção de nódulos pulmonares
A etapa seguinte após a redução do VOI é a etapa de segmentação com o GNG.
Esta etapa, apesar de simples, tem grande importância, visto que seu resultado é base
para etapas seguintes, como separação em estruturas conexas com o algoritmo de
crescimento de região 3D, seguido da separação destas estruturas em outras
elementares, e por fim a sua classificação.
O GNG foi utilizado para separar as estruturas internas ao pulmão do
parênquima pulmonar. Os parâmetros que configuram esse objetivo são dados abaixo:
Número máximo de nós: 2;
Número de iterações para inserir novo nó (λ): 600;
Taxa de decaimento do erro para as unidades de maior erro acumulado (α): 0,5;
Taxa de decaimento do erro para as unidades restantes (β): 0,0005
Idade máxima de uma conexão (a
max
): 88
Taxa de aprendizagem do ganhador (Є
b
): 0,5
Taxa de aprendizagem dos vizinhos conectados ao ganhador (Є
n
): 0,005
Estes parâmetros foram ajustados de forma empírica. Nenhuma estimação mais
apurada foi pesquisada para estes parâmetros, muitos destes valores são comumente

4
Maiores informações a respeito desta biblioteca de imagem DICOM encontradas em
http://dicom.offis.de/dcmtk.php.en.
72
utilizados em aplicações mais simples, como o ajuste de pontos no espaço n
dimensional.
O número de iterações utilizado na segmentação foi de 100000. Mas
geralmente o estado da rede que possuía a menor distorção, ocorria em um instante bem
inferior ao máximo número de iterações. Isto ocorre por causa do valor dado a taxa de
aprendizagem do vencedor, que o fazia mover na metade da distância entre o nó mais
próximo. Um grande número de iterações foi dado para garantir um mínimo global
satisfatório para o gráfico da distorção.
A aplicação da transformada de distância no experimento sem restrição do
valor da transformada da distância das estruturas gerou uma taxa média de candidatos a
nódulo de 54 por exame. O que resultou em um total de 9546 não-nódulos e apenas 80
nódulos, se considerarmos os 50 exames com a definição do contorno do nódulo
pulmonar. Contudo, no experimento com restrição, só houve a detecção em 29 exames.
O número de casos de não-nódulo então diminuiu para 2756, o que dificulta um pouco
menos a tarefa de classificação das estruturas candidatas a nódulo pulmonar. Os nódulos
perdidos nos 22 exames restantes, ou não tinham contraste suficiente com o
parênquima, a ponto de pertencer ao grupo das estruturas, ou ainda, possuíam valor da
transformada de distância menor que 7. O valor 7 foi escolhido de forma experimental,
visto que a maioria dos nódulos visualmente expressivos continham valores máximos
globais superiores a 7. Os 29 exames com nódulos detectados continham 48 nódulos
pulmonares.
O cálculo do ACI teve o raio da vizinhança ajustado para 6, apenas para análise
de uma pequena região central. O número de características extraídas foi de 27.
O número total de medidas utilizadas na fase de classificação das estruturas
segmentadas foram de 48 medidas, sendo 6 da matriz de co-ocorrência (soma, contraste,
energia, entropia, homogeneidade e momento), 7 do histograma (média, desvio padrão,
obliqüidade, curtose, energia e entropia), 27 do ACI (27 elementos da matriz de
mistura) e 8 da geometria (desproporção esférica, densidade esférica, distância radial
ponderada, esfericidade, elongação, volume, número de voxels da borda e Boyce-Clark
Radial Shape Index).Todas as medidas (textura e geometria) foram escaladas no
intervalo de -1 a 1, com o objetivo de que todas as medidas tenham a mesma
importância na tarefa de classificação.
O primeiro teste, sem restrição no valor da transformada de distância das
estruturas detectou 80 nódulos pulmonares, em 36 exames. Entretanto, o número de
73
casos não-nódulos foi de 9546. Esse grande desbalanceamento, aproximadamente 120
casos de não-nódulos para cada nódulo, dificultou enormemente a tarefa de separação
entre as referidas classes. Assim sendo, não se chegou a nenhuma combinação de
parâmetros do classificador MVS (o C e o γ do núcleo RBF), que resultasse em uma boa
classificação. Como o número de casos não-nódulos excedia e muito o de nódulos, a
acurácia (aproximadamente 99%) de classificação fica tendenciosa para especificidade,
que no caso, é perfeita, 100%, significando que o classificador aprendeu muito bem o
que era não-nódulo. Entretanto, a sensibilidade para o nódulo era nula, mesmo
ajustando-se os parâmetros de peso da configuração do modelo do classificador
LibSVM.
O segundo teste, com restrição no valor da transformada de distância das
estruturas, apesar de também desbalanceado, proporcionou menos dificuldade na
classificação. A validação com a sensibilidade, especificidade e acurácia foi realizada
10 vezes para cada um dos percentuais usados na separação de treino teste. Os
percentuais vão de 30% a 80%. A
Tabela 1 mostra estes parâmetros de validação da
classificação para a média de 10 execuções. Estes resultados só foram obtidos quando se
ajustava, de forma conveniente, um fator para a variável C que “pesa” o erro na
Equação 2.27, para obtenção de uma melhor sensibilidade para o nódulo, em conjunto
com a boa sensibilidade obtida. A proporção desse fator foi ajustada em 1 para os não-
nódulos e de 35 para os nódulos. Significando uma penalidade maior a variável de erro
para os nódulos, quando ocorre uma classificação errada dos mesmos. A variável de
peso do erro foi ajustada para 0,9, enquanto que o γ da função RBF foi ajustado para
0,0078125.
O tempo médio necessário para a detecção dos nódulos variou de 15 a 25
minutos. Comparado ao tempo levado pela detecção dos nódulos do trabalho de Sousa
(2007), 8 minutos, percebe-se que o tempo da detecção do trabalho proposto
aproximadamente duplicou ou triplicou, contudo, a base de imagens era diferente. O
número de imagens por exame da base utilizada neste trabalho é maior de 2 a 4 vezes
que as imagens da base utilizada por Sousa (2007), e os voxels possuíam dimensões
menos uniformes, o que explica o maior tempo, na metodologia proposta, tomado para
a mesma tarefa.
74
Tabela 1 - Validação da classificação em nódulo e não-nódulo
Porcentagem de
treino e teste (%)
Valor médio dos testes (%)
Sensibilidade Especificidade Acurácia
30/70
79,74 88,67 88,43
40/60
76,25 91,73 91,31
50/50
80,56 91,39 91,10
60/40
85,00 90,79 90,63
70/30
85,93 90,79 90,65
80/20
77,78 90,94 90,57
A
Tabela mostra os resultados obtidos por este trabalho (primeira linha) e por
outros pesquisadores para comparação. Em todos os trabalhos foi usado a mesma base
de imagens, entretanto, o número e os exames utilizados não são os mesmos. A
proporção de treino e teste exibida na Tabela 2 foi de 70/30 e corresponde ao caso da
Tabela
11, onde a sensibilidade foi a maior encontrada. Percebe-se também que a taxa
de falso positivos encontrado neste trabalho é a menor de todos os citados na
Tabela , o
que ressalta a boa especificidade encontrada.
Tabela 2 - Desempenho de trabalhos sobre detecção de nódulos utilizando o LIDC
Trabalho Banco de Imagens LIDC S(%) FP/imagem FP/exame
Método proposto 29 exames
4949 imagens
48 nódulos
85,93 0,00082 0,138
Özekes, 2007
12 pacientes
276 imagens
153 nódulos
93,4 0,59400
Lee et al. 2008
32 exames
5721 imagens
100,0 1,40000
Ozekes et al. 2008
16 casos/nódulos
425 imagens
100,0
13,400
FP/caso
Pu et al. 2008
52 exames 81,5 6,500
Dolejsi et al. 2009
38 exames
223,6 imagens/exame
89,6 12,03000
Campos, 2009
43 exames 80,9 0,23000 34,800
75
A seguir, daremos alguns exemplos de casos onde a detecção foi corretamente
obtida e de casos onde a detecção não foi correta.
4.4. Caso de estudo – Detecção correta
O caso de detecção correta é aquele em que todos os nódulos do exame são
encontrados na etapa de classificação. Para este caso, são demonstrados todos os passos
descritos na metodologia para detecção dos nódulos pulmonares.
O exame em que ocorreu a detecção correta continha um único nódulo
pulmonar, como podemos ver na Figura 4-1.
A primeira etapa da detecção do nódulo é a redução do VOI. A Figura 4-2
mostra o resultado da redução do VOI na mesma imagem em que é visto o nódulo da
Figura 4-1.
Figura 4-1. Seção de um exame de TC com o nódulo indicado pela seta em vermelho.
76
Figura 4-2. Imagem do pulmão da Figura 4-1 após a redução do VOI.
A próxima etapa é a de aplicação do GNG, de forma a segmentar somente as
estruturas internas ao parênquima. A Figura 4-3 ilustra o resultado da aplicação do
GNG. Como pode ser visto na mesma Figura 4-3, além do nódulo, outras estruturas com
similar densidade foram segmentadas.
Figura 4-3. Imagem do pulmão da Figura 4-2 após a aplicação do GNG.
77
A etapa seguinte é a etapa de separação do nódulo das estruturas que a
conectam. A Figura 4-4 mostra a superfície do nódulo da Figura
4-1 conectado aos
vasos e bronquíolos.
Figura 4-4. Imagem da superfície 3D do nódulo e das estruturas que o conectam.
O resultado da separação das estruturas da Figura 4-4 pode ser visto na Figura
4-5.
Figura 4-5. Resultado da separação das estruturas pela transformada da distância
78
O número de estruturas segmentadas foi de 52. Sendo uma estrutura, o nódulo,
e os 51 restantes não-nódulos, e todas as estruturas foram classificadas corretamente
com o MVS. A Figura 4-6 mostra o nódulo segmentado em vermelho em uma das
imagens do volume. Um exemplo da superfície do nódulo segmentado é dado na Figura
4-7. O resultado da separação do nódulo das estruturas é mostrado na Figura 4-7.
Figura 4-6. Seção de um exame de TC com o nódulo em vermelho.
Figura 4-7. Superfícies dos nódulos segmentados pela metodologia de detecção da Figura 4.1.
4.5. Caso de estudo – Detecção incorreta
Nesta seção serão mostrados dois casos de detecção incorreta pelo método
proposto. O primeiro caso de detecção incorreta ocorre quando a estrutura segmentada
não corresponde ao nódulo existente no exame. O exame continha um único nódulo e a
79
segmentação deu origem a 88 estruturas, sendo 87 não-nódulos. Duas das 88 estruturas
encontradas foram classificadas incorretamente como nódulo, e o nódulo verdadeiro,
apontado pela seta na Figura 4-8 não foi encontrado. As Figuras
Figura4 9 e Figura410
mostram as estruturas incorretamente classificadas como nódulo, e a Figura 4-11 mostra
as superfícies dos falsos positivos encontrados.
Figura 4-8. Seção de um exame de TC com seu único nódulo indicado pela seta em vermelho.
Figura 4-9. Seção de um exame de TC com falso positivo destacado em vermelho.
80
Figura 4-10. Seção de um exame de TC com falso positivo destacado em vermelho.
Figura 4-11. Superfície 3D das estruturas classificadas incorretamente como nódulo. (a) Estrutura
segmentada na Figura 4-9. (b) Estrutura segmentada na Figura 4-10.
No segundo caso de detecção incorreta mostra quando o nódulo não é
detectado na classificação. O exame continha dois nódulos pulmonares e eles podem ser
vistos nas Figura 4-12 eFigura
413 indicados por uma seta em vermelho.
81
Figura 4-12. Seção de um exame de TC com o primeiro nódulo indicado pela seta em vermelho.
Figura 4-13. Seção de um exame de TC com o segundo nódulo indicado pela seta em vermelho.
A Figura 4-14 exibe a superfície 3D das estruturas encontradas na
segmentação. Nela podemos visualizar uma variedade de estruturas de forma similar ao
nódulo pulmonar.
82
Figura 4-14. Imagem da superfície 3D das estruturas segmentadas do exame da imagem da Figura 4-12.
83
5. Conclusão e trabalhos futuros
Conclui-se que este trabalho tem bons resultados na maioria dos casos de
exame de TC utilizados. Duas técnicas amplamente utilizadas nesta tarefa foram
empregadas na obtenção dos resultados: o crescimento de região e a transformada de
distância, que em conjunto com o GNG, a principal contribuição da metodologia
proposta de detecção de nódulos pulmonares, foram capazes de encontrar o nódulo
pulmonar em um tempo razoável, que variou de 15 a 25 min.
A metodologia se apresentou sensível a densidade e às dimensões das
estruturas presentes no pulmão. Percebeu-se também que o grande número das
estruturas geradas na fase de segmentação e suas características semelhantes dificultam
a classificação.
A classificação foi um problema a ser contornado, pois o desbalanceamento
entre as classes nódulos e não-nódulos dificultava esta tarefa. Praticamente todas as
estruturas eram divididas em porções mais elementares, que confundiam o classificador
em sua tarefa.
A metodologia garante um pequeno número de falsos positivos (0,138
FP/exame).
A capacidade de adaptação do GNG a cada exame faz com que os resultados
obtidos não sejam reprodutíveis, de forma teórica, visto que em sua execução, os
valores que representam cada grupo (parênquima e estruturas) podem variar, entretanto,
as diferenças nos resultados são quase imperceptíveis.
Trabalhos futuros:
Redução do número de candidatos a nódulo pulmonar, sem que elimine
a presença de nódulos pulmonares, pela inserção de um mecanismo de
controle mais apurado durante a segmentação do nódulo com o
crescimento de região, e na aplicação da transformada da distância;
A metodologia de redução do VOI falha, em algumas situações, na
reconstrução do parênquima pulmonar, perdendo o nódulo pulmonar.
Portanto, espera-se diminuir o erro provocado pela redução do VOI;
84
Encontrar uma métrica mais discriminante entre o nódulo e as
estruturas (vasos, bronquíolos, brônquios e etc);
Utilizar uma segunda base para uma melhor avaliação da metodologia.
85
6. Referências bibliográficas
ANTONELLI, M; Frosini, G; Lazzerini, B; Marcelloni, F. Automated Detection of
Pulmonary Nodules in CT Scans. Proceedings of the 2005 International Conference
on Computational Intelligence for Modelling, Control and Automation, and
International Conference on Intelligent Agents, Web Technologies and Internet
Commerce. 2005.
CAMPOS, V. O; Feitosa, R. Q; Silva, A C.
Segmentação Multicritério para Detecção
de Nódulos Pulmonares em Imagens de Tomografia Computadorizada. Rio de
Janeiro, 2009, 110 p. Tese de Doutorado – Departamento de Engenharia Elétrica,
Pontifícia Universidade Católica do Rio de Janeiro.
CASTLEMAN, K.R.
Images and Digital Processing. Prentice-Hall, 2 ed.1995. ISBN
0132114674.
CHAVES, A. C. F.
Extração de regras fuzzy para Máquinas de vetor de Suporte
(SVM) para classificação em múltiplas classes. Tese de Doutrado. Pontifícia
Universidade Católica do Rio de Janeiro, 2006.
CHANG, Chih-Chung; Lin, Chih-Jen.
LIBSVM : a library for support vector
machines. 2001. Disponível em: <http://www.csie.ntu.edu.tw/~cjlin/libsvm>. Acesso
em: 05 set. 2007.
COSTA, D. D.
Classificação de Lesões em Mamografias por Análise de
Componentes Independentes, Análise Discriminante Linear e Máquinas de Vetor
de Suporte. Dissertação (Mestrado em Engenharia de Eletricidade) - Centro de
Ciências Exatas e Tecnologia, Universidade Federal do Maranhão. São Luís. 2008.
CRISTIANINI, N.; SHAWE, J.
An Introduction to Support Vector Machines and
Other Kernel-Based Learning Methods. Press Syndicate of the University of
86
Cambridge, 2000.
DOLEJSI, M.; KYBIC, J.; POLOVINCAK, M.; TUMA, S.;
The Lung TIME:
annotated lung nodule dataset and nodule detection framework. Medical Imaging
2009: Computer-Aided Diagnosis. Proceedings of the SPIE, Volume 7260, pp. 72601U-
72601U-8 (2009). DOI: 10.1117/12.811645.
EL-BAZ, A; Farag, A; Gimel’farb, G; Falk, R; El-Ghar, Mohamed A; Eldiasty, Tarek.
A Framework for Automatic Segmentation of Lung Nodules from Low Dose Chest
CT Scans. The 18th International Conference on Pattern Recognition. 2006.
FIEBICH, M; Schneider, C; Amjadi, A; Richter, A.
Automated lung nodule detection
and segmentation. Institute of Medical Physics and Radiation Protection. University of
Applied Sciences Giessen-Friedberg. 2009.
FRITZKE, Bernd. Some Competitive Learning Methods. Disponível em:
<ftp://ftp.neuroinformatik.ruhr-uni-bochum.de/pub/software/NN/DemoGNG/sclm.ps.gz>.
Acesso em: 17. abr. 2008.
HARALICK, R. M.; Shapiro, L. G. Image Segmentation Techniques. Computer
Vision,Graphics, and lmage Processing. 29, 1, January 1985. 100–132.
HAYKIN S.
Redes Neurais: Princípios e prática. 2ed. Porto Alegre: Bookman, 2001.
HOLMSTRÖM, Jim.
Growing Neural Gas - Experiments with GNG, GNG with
Utility and Supervised GNG. Tese em Ciência da Computação – Universidade de
Uppsala. 2002. Disponível em:
<http://www.booru.net/download/MasterThesisProj.pdf
>. Acesso em: 10. abr. 2008.
Instituto Nacional de Câncer – INCA; Ministério da Saúde; Coordenação Nacional de
Controle de Tabagismo – CONTAPP.
Falando Sobre Câncer e Seus Fatores de
87
Risco. Rio de Janeiro. 1996. Disponível em:
<http://www.inca.gov.br/conteudo_view.asp?id=81
>. Acesso em: 01 set. 2007.
Instituto Nacional de Câncer – INCA.
Controle do Câncer: uma proposta de
integração ensino-serviço. 3 ed. Rio de Janeiro. 1999. Disponível em:
<http://www.inca.gov.br/conteudo_view.asp?ID=36
http://www.inca.gov.br/rbc/n_47/v0
1/editorial.html>. Acesso em: 01 set. 2007.
Instituto Nacional de Câncer – INCA.
Estimativa 2010: Incidência de câncer no
Brasil. Rio de Janeiro. 2010. Disponível em:
<http://www.inca.gov.br/estimativa/2008/
>. Acesso em: 01 dez. 2009.
JAMNIK, S. I; Santoro, L; Uehara, C.
Estudo comparativo dos fatores prognósticos
entre os pacientes com maior e menor sobrevida em portadores de carcinoma
broncogênico. Pneumologia. 2008.
LEE, S.L.A.; KOUZANI, A.Z.; HU, E.J.,
Automated identification of lung nodules.
Multimedia Signal Processing, 2008 IEEE
10th Workshop on , vol., no., pp.497-502, 8-
10 Oct. 2008.
LI, F; Aoyama, M; Shiraishi, J; Abe, H; Li, Q; Suzuki, K; Engelmann, R; Sone, S;
MacMahon, H; Doi, K.
Radiologists’ Performance for Differentiating Benign from
Malignant Lung Nodules on High- Resolution CT Using Computer- Estimated
Likelihood of Malignancy.
A century of medical imaging. 2004.
LI, Q; Li, F; Doi, K.
Computerized Detection of Lung Nodules in Thin-Section CT
Images by use of Selective Enhancement Filters and an Automated Rule-Based
Classifier. Academic Radiology. 2008.
88
LUNA, Bráulio Filho. Utilização Racional dos Testes Diagnósticos em Cardiologia.
casa da cardiopatia hipertensiva. Disponível em:
<http://www.unifesp.br/dmed/cardio/ch/utiliza.htm
>. Acesso em: 02 dez. 2007.
MARTEN, K; Engelke, C.
Computer-aided detection and automated CT volumetry
of pulmonary nodules. European radiology. 2006.
MCNITT-GRAY, M. F.; Armato 3rd, S. G.; Mclennan, G.; Meyer, C. R.; Yankelevitz,
D.; Aberle, D. R.; Henschke, C. I.; Hoffman, E. A.; Kazerooni, E. A.; Macmahon, H.;
Reeves, A. P.; Croft, B. Y.; Clarke, L. P.
Lung image database consortium research
group. Lung image database consortium: developing a resource for the medical
imaging research community. Radiology. v. 232, nº 3, p. 739 – 48, set. 2004.
National Electrical Manufacturers Association - NEMA.
Digital Imaging and
Communications in Medicine (DICOM) PS 3-1, 3, 5, 6 e 10. Estados Unidos. 2009.
NIKOLAIDIS, N.; PITAS, I.. 3-D Image Processing Algorithms. John Wiley, New
York, 2001.
ÖZEKES, Serhat.
Rule-based lung region segmentation and Nodule detection via
genetic algorithm Trained template matching.
İstanbul Ticaret Üniversitesi Fen
Bilimleri Dergisi Yıl. 2007.
OZEKES, S.; OSMAN, O.; UCAN, O. N.;
Nodule Detection in a Lung Region that's
Segmented with Using Genetic Cellular Neural Networks and 3D Template
Matching with Fuzzy Rule Based Thresholding. Korean J Radiol. 2008 Jan–Feb;
9(1): 1–9. Published online 2008 February 20. doi: 10.3348/kjr.2008.9.1.1.
PAULINO, Arnold C; Teh, Bin S.
PET-CT in radiotherapy treatment planning.
ed. Saunders elsevier. 2008. ISBN 978-1-4160-3224-3.
89
PRATT, K. W. Digital image processing. 3. ed. Los Altos, Califórnia: John Wiley &
Sons, 2001. ISBN 0471857661
PU, J.; ZHENG, B.; LEADER, K.; WANG, X.-H.; GUR, D.;
An Automated CT
Based Lung Nodule Detection Scheme Using Geometric Analysis of Signed
Distance Field. Med Phys. 2008 August; 35(8): 3453–3461. DOI: 10.1118/1.2948349.
SAHINER, B; Chan, H; Hadjiiski, L. M; Cascade, P. N; Kazerooni, E. A; Chughtai, A.
R; Poopat, Chad; Song T; Frank, L; Stojanovska, J; Attili, A.
Effect of CAD on
Radiologists' Detection of Lung Nodules on Thoracic CT Scans: Analysis of na
Observer Performance Study by Nodule Size. Academic radiology. 2009.
SÁ, J. P. M. de.
Pattern recognition: concepts, methods and applications. 1° ed.
Springer. 2001. ISBN 3540422978.
SOUSA, J. R. F. S; Silva, A. C; Paiva, A. C; Nunes, R. A.
Methodology for automatic
detection of lung nodules in computerized tomography images. computer methods
and programs in biomedicine. 2009.
SZARF, G. SOUZA, R. de. Nódulo pulmonar. Disponível em:
<http://www.lincx.com.br/lincx/saude_a_z/conheca_exames/nodulo_pulmonar.asp
>.
Acesso em: 10 fev. 2007.
SILVA, A. C.
Algoritmos para Diagnóstico Assistido de Nódulos Pulmonares
Solitários em Imagens de Tomografia Computadorizada.
Rio de Janeiro. 2004. 141f.
Tese (Doutorado em Informática)-Pontifica Católica do Rio de Janeiro, Universidade
Federal do Maranhão, 2004.
SOUSA, J. R. F. S.; Metodologia para detecção automática de nódulos pulmonares.
Dissertação de Mestrado, Universidade Federal do Maranhão – Brasil, 2007.
SOARES, F. A. P.
Produção de raios x em ampolas radiográficas: Estudo do
tomógrafo computadorizado do Hospital regional de São José/SC. Florianópolis.
90
2006. Tese (Doutorado em Física Experimental)-Universidade Federal de Santa
Catarina.
SONKA, M. HLAVAC, V. BOYLE, R.
Image processing, analysis, and machine
vision. Thomson-Engineering. 2 ed. 1998. Disponível em:
<http://www.icaen.uiowa.edu/~dip/LECTURE/lecture.html
>. Acesso em: 12 out. 2007.
TARANTINO, A. B..
Nódulo Solitário Do Pulmão. Guanabara Koogan, Rio de
Janeiro, 4 ed., 1997.
VAPNICK, V.
Statistical Learning Theory. J.Wiley and Sons Inc. Nova York, 1998.
WORMANNS, D; Fiebich, M; Saidi, M; Diederich, S; Heindel, W.
Automatic
detection of pulmonary nodules at spiral CT: clinical application of a computer-
aided diagnosis system. European Radiology. 2002. Disponível em:
<http://www.ncbi.nlm.nih.gov/pubmed/11976846>. Acesso em: 07 dez. 2009.
YUAN, Ren; Vos, P. M; Cooperberg, P. L.
Computer-Aided Detection in Screening
CT or Pulmonary Nodules. A century of medical imaging. 2005.
YE, X; Beddoe, G; Slabaugh, G
. Graph Cut-based Automatic Segmentation of Lung
Nodules using Shape, Intensity, and Spatial Features.
Second International
Workshop on Pulmonary Image Processing. 2009.
Livros Grátis
( http://www.livrosgratis.com.br )
Milhares de Livros para Download:
Baixar livros de Administração
Baixar livros de Agronomia
Baixar livros de Arquitetura
Baixar livros de Artes
Baixar livros de Astronomia
Baixar livros de Biologia Geral
Baixar livros de Ciência da Computação
Baixar livros de Ciência da Informação
Baixar livros de Ciência Política
Baixar livros de Ciências da Saúde
Baixar livros de Comunicação
Baixar livros do Conselho Nacional de Educação - CNE
Baixar livros de Defesa civil
Baixar livros de Direito
Baixar livros de Direitos humanos
Baixar livros de Economia
Baixar livros de Economia Doméstica
Baixar livros de Educação
Baixar livros de Educação - Trânsito
Baixar livros de Educação Física
Baixar livros de Engenharia Aeroespacial
Baixar livros de Farmácia
Baixar livros de Filosofia
Baixar livros de Física
Baixar livros de Geociências
Baixar livros de Geografia
Baixar livros de História
Baixar livros de Línguas
Baixar livros de Literatura
Baixar livros de Literatura de Cordel
Baixar livros de Literatura Infantil
Baixar livros de Matemática
Baixar livros de Medicina
Baixar livros de Medicina Veterinária
Baixar livros de Meio Ambiente
Baixar livros de Meteorologia
Baixar Monografias e TCC
Baixar livros Multidisciplinar
Baixar livros de Música
Baixar livros de Psicologia
Baixar livros de Química
Baixar livros de Saúde Coletiva
Baixar livros de Serviço Social
Baixar livros de Sociologia
Baixar livros de Teologia
Baixar livros de Trabalho
Baixar livros de Turismo