Download PDF
ads:
UNIVERSIDADE ESTADUAL PAULISTA
FACULDADE DE CIÊNCIAS E TECNOLOGIA
Pós-Graduação em Ciências Cartográficas
Presidente Prudente
2007
EDINÉIA APARECIDA DOS SANTOS GALVANIN
EXTRAÇÃO AUTOMÁTICA DE
CONTORNOS DE TELHADOS DE
EDIFÍCIOS EM UM MODELO DIGITAL DE
ELEVAÇÃO, UTILIZANDO INFERÊNCIA
BAYESIANA E CAMPOS ALEATÓRIOS DE
MARKOV
ads:
Livros Grátis
http://www.livrosgratis.com.br
Milhares de livros grátis para download.
UNIVERSIDADE ESTADUAL PAULISTA
FACULDADE DE CIÊNCIAS E TECNOLOGIA
Pós-Graduação em Ciências Cartográficas
Presidente Prudente
2007
EDINÉIA APARECIDA DOS SANTOS GALVANIN
EXTRAÇÃO AUTOMÁTICA DE
CONTORNOS DE TELHADOS DE EDIFÍCIOS
EM UM MODELO DIGITAL DE ELEVAÇÃO,
UTILIZANDO INFERÊNCIA BAYESIANA E
CAMPOS ALEATÓRIOS DE MARKOV
Tese apresentada ao Programa de Pós-Graduação em Ciências
Cartográficas da Faculdade de Ciências e Tecnologia da Universidade
Estadual Paulista, para obtenção do título de Doutor em Ciências
Cartográficas (Área de Concentração: Aquisição, Análise e
Representação de Informações Espaciais).
Orientador: Prof. Dr. Aluir Porfírio Dal Poz
Co-orientadora: Prof. Dra. Aparecida Doniseti Pires de Souza.
ads:
Galvanin, Edinéia Aparecida dos Santos.
Extração automática de contornos de telhados de edifícios em um modelo digital de
elevação, utilizando inferência bayesiana e campos aleatórios de Markov / Edinéia
Aparecida dos Santos Galvanin. – Presidente Prudente: [s.n.], 2007
165 f. : il.
Tese (doutorado) - Universidade Estadual Paulista, Faculdade de Ciências e
Tecnologia
Orientador: Aluir Porfírio Dal Poz
CO-Orientador: Aparecida Doniseti Pires de Souza
1. Automação. 2. Varredura a laser. 3. Markov Random Field. 4. Modelo Digital de
Elevação. 5. Inferência Bayesiana. 6. Extração de contornos de telhados. I. Galvanin,
Edinéia Aparecida dos Santos. II. Dal Poz, Aluir Porfírio. III. Souza, Aparecida Doniseti
Pires de. IV. Título.
CDD (18.ed.) 623.71
Ficha catalográfica elaborada pelo Serviço Técnico de Biblioteca e Documentação
UNESP – FCT – Campus de Presidente Prudente
Ao meu esposo Rober.
Eterno companheiro e grande incentivador deste projeto de vida.
Aos meus pais, José e Oneide.
Razão de minha existência.
À minha família.
Uma dádiva de Deus.
AGRADECIMENTOS
À Fundação Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (Capes), pelo
apoio financeiro em forma de bolsa de doutorado.
Ao instituto LACTEC pelo fornecimento dos dados de varredura a laser.
Aos meus orientadores, Prof. Dr. Aluir Porfírio Dal Poz e Aparecida Doniseti Pires de Souza
pelas discussões e contribuições no projeto de pesquisa. Ao Prof. Dr. Aluir pelo conhecimento
transmitido durante os quatro anos de trabalho.
Aos professores do programa de Pós-Graduação em Ciências Cartográficas e do departamento
de Cartografia.
Às amigas Daniele e Eniuce, pelas discussões que direta ou indiretamente colaboraram no
desenvolvimento deste trabalho.
Aos amigos Juliano Fazan, Marcelo, Luiz e Victor pela colaboração e apoio. A todos os
colegas do Programa de Pós Graduação que fazem parte desta conquista.
Aos funcionários do Departamento de Cartografia e do PPGCC
.
"A educação é a arma mais poderosa que você
pode usar para mudar o mundo."
(Nelson Mandela)
RESUMO
As Metodologias para a extração automática de telhados desempenham um papel importante
no contexto de aquisição de informação espacial para Sistemas de Informação Geográficas
(SIG). Neste sentido, este trabalho propõe uma metodologia para extração automática de
contornos de telhado de edifícios utilizando dados de varredura a laser. A metodologia baseia-
se em duas etapas principais: 1) Extração de regiões altas (edifícios, árvores etc.) de um
Modelo Digital de Elevação (MDE) gerado a partir dos dados laser; 2) Extração das regiões
altas que correspondem a contornos de telhados. Na primeira etapa são utilizadas as técnicas
de divisão recursiva, via estrutura quadtree e de fusão Bayesiana de regiões considerando
Markov Random Field (MRF). Inicialmente a técnica de divisão recursiva é usada para
particionar o MDE em regiões homogêneas. No entanto, devido a ligeiras diferenças de altura
no MDE, nesta etapa a fragmentação das regiões pode ser relativamente alta. Para minimizar
essa fragmentação, a técnica de fusão Bayesiana de regiões é aplicada nos dados
segmentados. Utiliza-se para tanto um modelo hierárquico, cujas alturas médias das regiões
dependem de uma média geral e de um efeito aleatório, que incorpora a relação de vizinhança
entre elas. A distribuição a priori para o efeito aleatório é especificada como um modelo
condicional auto-regressivo (CAR). As distribuições a posteriori para os parâmetros de
interesse foram obtidas utilizando o Amostrador de Gibbs. Na segunda etapa os contornos de
telhados são identificados entre todos os objetos altos extraídos na etapa anterior. Levando em
conta algumas propriedades de telhados e as medidas de alguns atributos (por exemplo, área,
retangularidade, ângulos entre eixos principais de objetos) é construída uma função de energia
a partir do modelo MRF. O problema de extração automática de contornos de telhados é
formulado a partir de uma estimativa de Maximum a posteriori (MAP), via algoritmo
Simulated Annealing (SA). A metodologia proposta foi testada em cinco áreas teste com
diferentes complexidades de configurações de objetos presentes na cena. Os experimentos
realizados com dados regulares obtidos por varredura a laser mostraram que a metodologia é
apropriada para aplicações envolvendo a extração automática de contornos de telhados, visto
que possibilitou a extração destes contornos com aproximadamente 90% de completeza de
área e 100% para a razão de extração de telhados.
Palavras-chave: Automação. Varredura a laser. MDE. Inferência Bayesiana. MRF. Extração
de contornos de telhados.
ABSTRACT
Methodologies for automatic building roof extraction are important in the context of spatial
information acquisition for geographical information systems (GIS). Thus, this work proposes
a methodology for automatic extraction of building roof contour from laser scanning data.
The methodology is based on two stages: 1) Extraction of high regions (buildings, trees etc.)
from a Digital Elevation Model (DEM) derived from laser scanning data; 2) Building roof
contour extraction. In the first stage is applied the recursive splitting technique using the
quadtree structure followed by a Bayesian merging technique considering Markov Random
Field (MRF) model. The recursive splitting technique subdivides the DEM into homogeneous
regions. However, due to slight height differences in the DEM, in this stage the region
fragmentation can be relatively high. In order to minimize the fragmentation, a region
merging technique based on the Bayesian framework is applied to the previously segmented
data. Thus, a hierarchical model is proposed, whose height values in the data depend on a
general mean plus a random effect. The prior distribution for the random effects is specified
by the Conditional Autoregressive (CAR) model. The posterior probability distributions are
obtained by the Gibbs sampler. In the second stage the building roof contours are identified
among all high objects extracted previously. Taking into account some roof properties and
some feature measurements (e. g., area, rectangularity, and angles between principal axes of
objects), an energy function is developed based on the MRF model. The problem of building
roof contour automatic extraction is formulated as the Maximum a Posteriori (MAP)
estimation by Simulated Annealing (SA) algorithm. The proposed methodology was tested in
five test areas with different object configuration complexities. Experiments carried out with
laser scanning data's DEM showed that the methodology is appropriated for applications
involving the roof contour extraction with approximately 90% shape accuracy and 100%
building detection rate.
Key words: Automation. Laser Scanning. DEM. Bayesian Inference. MRF. Roof Contour
Extraction.
ÍNDICE DE FIGURAS
Figura 1 - Aeronave e principais componentes do sistema de varredura a laser......................31
Figura 2 – Sistema de varredura a laser....................................................................................31
Figura 3 – Diâmetro do pulso...................................................................................................32
Figura 4 – Diâmetro do pulso para terrenos inclinados............................................................33
Figura 5 – Largura da faixa ......................................................................................................34
Figura 6 – Configuração da varredura em relação ao tipo de espelho .....................................35
Figura 7 – Imagem de intensidade obtida a partir da informação do retorno do primeiro pulso
laser...........................................................................................................................................39
Figura 8 – Fluxograma do processamento dos dados provenientes das medidas de varredura a
laser...........................................................................................................................................41
Figura 9 – Exemplo de perfilagem irregular obtida por varredura a laser. ..............................43
Figura 10 – Exemplo da malha regular após interpolação pelo algoritmo do vizinho mais
próximo.....................................................................................................................................44
Figura 11 – Grafo
()
E,VG = ...................................................................................................47
Figura 12 – 1-grafo não orientado............................................................................................48
Figura 13 – 1-grafo orientado...................................................................................................49
Figura 14 – (a) Grafo completo não orientado, (b) grafo completo orientado. ........................50
Figura 15 – Exemplos de cliques..............................................................................................50
Figura 16 – Divisão recursiva usando a estrutura quadtree......................................................54
Figura 17 – Esquema básico de análise de imagens ................................................................61
Figura 18 – Vizinhança de primeira ordem da clique ..............................................................79
Figura 19 – Vizinhança de segunda ordem da clique...............................................................80
Figura 20 – (a) Imagem segmentada; e (b) RAG .....................................................................81
Figura 21 – Fluxograma do algoritmo SA................................................................................88
Figura 22 – Fluxograma referente à primeira etapa da metodologia de extração de feições. ..91
Figura 23 – (a) Exemplo de dados irregulares fornecidos pela varredura a laser; (b) detalhe
ampliado dos dados irregulares. ...............................................................................................92
Figura 24 – Exemplo de uma malha regular sobreposta à imagem de intensidade..................92
Figura 25 – Visualização tridimensional..................................................................................93
Figura 26 – Imagem altimétrica das grades geradas pelos métodos de interpolação...............94
Figura 27 – Divisão recursiva usando a estrutura quadtree. ....................................................95
Figura 28 – Trajetória das Cadeias geradas para parâmetro .
μ
..............................................99
Figura 29 – Trajetória das Cadeias Geradas para o efeito aleatório
1
S .................................100
Figura 30 – Ilustração da altura média a posteriori (em metros) de cada região da cena.......101
Figura 31 – Imagem binária com as regiões altas. .................................................................102
Figura 32 - Imagem de bordas obtida pelo detector de bordas de Canny. .............................103
Figura 33 – Fluxograma simplificado do processo de extração automática de contornos de
telhados...................................................................................................................................105
Figura 34 – Exemplo de vizinhança. ......................................................................................106
Figura 35 – Divisão setorial do circulo trigonométrico..........................................................108
Figura 36 – Histograma de freqüência. ..................................................................................109
Figura 37 – Representação da solução da Equação de energia. .............................................112
Figura 38 – Parte de um Arquivo de coordenadas..................................................................115
Figura 39 – Imagem de intensidade de retorno do pulso laser...............................................116
Figura 40 – Dados brutos (representados na cor branca) correspondentes a uma faixa de vôo,
sobrepostos à imagem de intensidade.....................................................................................117
Figura 41 – Área teste 1..........................................................................................................119
Figura 42 – Visualização tridimensional do MDE referente à área teste 1............................120
Figura 43 – Área teste 2..........................................................................................................121
Figura 44 – Visualização tridimensional do MDE referente à área teste 2............................121
Figura 45 – Área teste 3..........................................................................................................122
Figura 46 – Visualização tridimensional do MDE referente à área teste 3............................122
Figura 47 – Área teste 4..........................................................................................................123
Figura 48 – Visualização tridimensional do MDE referente à área teste 4............................123
Figura 49 – Área teste 5..........................................................................................................124
Figura 50 – Visualização tridimensional do MDE referente à área teste 5............................125
Figura 51 – Imagens resultantes do método de extração de contornos de telhados aplicado à
área teste 1 ..............................................................................................................................126
Figura 52 – Visualização do contorno extraído e do contorno de referência.........................127
Figura 53 – Imagens resultantes do método de extração de contornos de telhados aplicado à
área teste 2 ..............................................................................................................................129
Figura 54 – Visualização do contorno extraído e do contorno de referência.........................130
Figura 55 – Imagens resultantes do método de extração de contornos de telhados aplicado à
área teste 3 ..............................................................................................................................132
Figura 56 – Visualização dos contornos extraído e de referência..........................................133
Figura 57 – Imagens resultantes do método de extração de contornos de telhados aplicado à
área teste 4 ..............................................................................................................................135
Figura 58 – Visualização dos contornos extraído e de referência e respectiva identificação
para a análise numérica...........................................................................................................136
Figura 59 – Imagens resultantes do método de extração de contornos de telhados aplicado à
área teste 5 ..............................................................................................................................138
Figura 60 – Visualização do contorno extraído e do contorno de referência.........................140
Figura 61 – Identificação dos contornos de telhados. ............................................................141
ÍNDICE DE QUADROS
Quadro 1 – Determinação da densidade de pontos por metro quadrado, no terreno, a partir da
combinação de parâmetros. ......................................................................................................36
Quadro 2 – Cliques para os nós R
1
e R
5
do RAG.....................................................................83
ÍNDICE DE TABELAS
Tabela 1 – Percentual de reflexão de alguns materiais.............................................................38
Tabela 2 – Análise numérica dos resultados obtidos com o método de extração automática de
contornos de telhados. ............................................................................................................128
Tabela 3 – Análise numérica dos resultados obtidos com o método de extração automática de
contornos de telhados .............................................................................................................131
Tabela 4 – Análise numérica dos resultados obtidos com o método de extração automática de
contornos de telhados .............................................................................................................133
Tabela 5 – Análise numérica dos resultados obtidos com o método de extração automática de
contornos de telhados .............................................................................................................137
Tabela 6 – Análise numérica dos resultados obtidos com o indicador CA para cada contorno
de telhado extraído..................................................................................................................137
Tabela 7 – Análise numérica dos resultados obtidos com o método de extração automática de
contornos de telhados. ............................................................................................................140
Tabela 8 – Análise numérica dos resultados obtidos com o indicador CA para cada contorno
de ............................................................................................................................................141
LISTA DE ABREVIATURAS E SIGLAS
SIG = Sistema de Informação Geográfica
LASER = Light Amplification by Stimulated Emission of Radiance
GPS = Global Positioning System
IMU = Inertial Measurement Unit
MDE = Modelos Digitais de Elevação
MDT = Modelo Digital do Terreno
MDS = Modelo Digital de Superfície
MRF = Markov Random Field
NDVI = Normalized Difference Vegetation Indices
ISPRS = International Society for Photogrammetry and Remote Sensing
SA = Simulated Annealing
CCD = Charge Coupled Device
DGPS = Differential Global Positioning System
Nd: YAG = Neodimium: Yttrium Aluminum Garnet
TIM = Time Interval Meter
APD = Avalanche PhotoDiodes
WGS 84 = World Geodetic System 84
TIN = Triangulated Irregular Network
SNR = Signal-to-Noise Ratio
RAG = Region Adjacency Graph
MAP = Maximum a Posteriori
CAR = Modelo Auto-regressivo Condicional
BUGS = Bayesian Inference Using Gibbs Sampler
MCMC = Monte Carlo via Cadeia de Markov
REE = Razão de Extração de Edifícios
CA = Completeza de Área
LACTEC = Instituto de Tecnologia para o Desenvolvimento
SUMÁRIO
1 INTRODUÇÃO .........................................................................................................17
1.1 Trabalhos relacionados................................................................................................19
1.2 Objetivos .....................................................................................................................25
1.3 Justificativas ................................................................................................................26
1.4 Estrutura do trabalho ...................................................................................................27
2 FUNDAMENTAÇÃO TEÓRICA............................................................................28
2.1 Varredura a Laser ........................................................................................................28
2.1.1 Sistemas de varredura a laser.......................................................................................29
2.1.2 Princípio de funcionamento do sistema de varredura a laser aerotransportado ..........30
2.1.3 Características do sistema de varredura a laser ...........................................................32
2.1.4 Posição e orientação do sistema ..................................................................................37
2.1.5 Imagem de intensidade................................................................................................37
2.1.6 Qualidade dos dados de varredura a laser ...................................................................39
2.1.7 Processamento de dados..............................................................................................41
2.1.7.1 Amostragem dos dados ..............................................................................................42
2.1.7.2 Malha regular .............................................................................................................43
2.1.7.3 Métodos de interpolação ............................................................................................45
2.2 Grafos .....................................................................................................................46
2.2.1 Noções básicas.............................................................................................................47
2.2.2 Grafo não orientado.....................................................................................................48
2.2.3 Grafo orientado ou dígrafo ..........................................................................................48
2.2.4 Grafo completo............................................................................................................49
2.2.5 Subgrafo e o conceito de clique...................................................................................50
2.3 Segmentação................................................................................................................51
2.3.1 Divisão e fusão de regiões...........................................................................................52
2.3.2 Detecção de bordas......................................................................................................54
2.4 Vetorização e poligonização de contornos..................................................................57
2.4.1 Vetorização de mapas de bordas detectadas................................................................58
2.4.2 Representações para contorno .....................................................................................59
2.5 Abordagem bayesiana aplicada à análise de imagens .................................................60
2.5.1 Abordagem Bayesiana.................................................................................................62
2.5.1.1 Métodos numéricos ....................................................................................................66
2.5.1.2 Método de Monte Carlo via Cadeia de Markov (MCMC).........................................67
2.5.1.3 Software WinBUGS...................................................................................................71
2.5.1.4 Inferência Bayesiana para modelos Auto-regressivos Condicionais .........................72
2.5.2 Markov Random Field.................................................................................................76
2.5.2.1 MRF e distribuição de Gibbs .....................................................................................77
2.5.2.2 MRF para análise de imagens por regiões .................................................................80
2.5.2.3 MRF em estrutura de grafo ........................................................................................81
2.5.2.4 Rotulação de imagem usando MRF ...........................................................................83
2.5.2.5 Solução MAP .............................................................................................................85
3 METODOLOGIA PARA A EXTRAÇÃO AUTOMÁTICA DE
CONTORNOS DE TELHADOS DE EDIFICIOS EM UM MDE, UTILIZANDO
INFERÊNCIA BAYESIANA E MRF .................................................................................90
3.1 Metodologia para a extração automática de regiões altas em um MDE utilizando
Inferência Bayesiana e MRF ...................................................................................................90
3.1.1 Geração da malha regular de dados.............................................................................91
3.1.2 Segmentação via divisão recursiva..............................................................................95
3.1.3 Fusão de regiões usando uma Abordagem Bayesiana.................................................96
3.1.4 Extração dos contornos das regiões altas ..................................................................101
3.2 Extração automática de contornos de telhados de edifícios ......................................104
3.2.1 Caracterização do conhecimento sobre contornos de telhados .................................105
3.2.2 Definição da função de energia .................................................................................110
4 RESULTADOS E ANÁLISES ...............................................................................113
4.1 Considerações iniciais ...............................................................................................113
4.1.1 Recursos computacionais ..........................................................................................114
4.1.2 Dados utilizados no trabalho .....................................................................................115
4.2 Aspectos computacionais ..........................................................................................117
4.3 Experimentos e discussões ........................................................................................119
4.3.1 Primeiro experimento ................................................................................................125
4.3.2 Segundo experimento ................................................................................................128
4.3.3 Terceiro experimento.................................................................................................131
4.3.4 Quarto experimento...................................................................................................134
4.3.5 Quinto experimento...................................................................................................137
5 CONCLUSÕES E RECOMENDAÇÕES .............................................................142
5.1 Recomendações .........................................................................................................145
REFERÊNCIAS ..................................................................................................................147
BIBLIOGRAFIA.................................................................................................................156
ANEXOS ...............................................................................................................................159
17
1 INTRODUÇÃO
No âmbito da Cartografia, a aquisição, o gerenciamento, a análise e a
visualização de dados espaciais são de suma importância para as propostas de planejamento,
administração e monitoramento socioeconômico de cidades. Essas informações quando
disponibilizadas num Sistema de Informação Geográfica (SIG) auxiliam na tomada de
decisões e podem fornecer, por exemplo, dados sobre expansão territorial, cadastro de
imóveis urbanos, atualização de mapas entre outras. Segundo Dal Poz e Silva (2002) os SIG’s
existentes são alimentados por dados espaciais coletados frequentemente em mapas
analógicos preexistentes ou através de métodos fotogramétricos automáticos ou semi-
automáticos. Em se tratando dos mapas analógicos, a desvantagem ocorre na digitalização
onde são adicionados erros aos dados, tornando-os menos acurados que os dados originais dos
mapas. O método fotogramétrico é muito importante para a coleta e a atualização dos dados
espaciais, no entanto depende ainda da habilidade do operador humano. A grande vantagem
desse método é a possibilidade de se coletar dados espaciais com grande acurácia e
confiabilidade. Entretanto, as estratégias envolvidas geralmente demandam muito tempo. Isto
faz com que a tarefa de coleta de dados torne-se muito dispendiosa, fazendo com que uma
freqüência maior de revisão dessas informações seja, às vezes, economicamente inviável.
No intuito de chegar a soluções viáveis para a realização da tarefa de coleta
de dados, com alguma ou total automação, muito esforço tem sido feito por pesquisadores das
áreas de Fotogrametria e Visão Computacional, nos últimos 30 anos. O desenvolvimento de
métodos semi-automáticos e automáticos para coletar eficientemente dados espaciais a partir
de imagens digitais (aéreas e de satélite) e de outras fontes de dados, como os de varredura a
laser, são atualmente um dos principais focos de pesquisa em Fotogrametria (DAL POZ,
2002).
Nesse contexto, a extração de feições tem recebido, nos últimos anos,
considerável atenção. Por exemplo, a extração da malha viária é um tópico amplamente
pesquisado quando se trata da malha viária rural, mas, em se tratando da extração da malha
viária em áreas urbanas densas, a extração torna-se muito difícil e, consequentemente, ainda
são poucos os trabalhos relacionados. A alta complexidade deste problema se deve
principalmente a heterogeneidade dos objetos presentes na cena e o contexto, ou seja, as
relações existentes entre rodovias (ruas) e outros objetos (prédios, árvores, carros etc.). Esta
complexidade é também inerente à extração de outras feições urbanas, como os contornos de
18
telhados. Esses argumentos mostraram que desconsiderar o contexto na extração de objetos
urbanos pode levar a obstáculos difíceis de serem ultrapassados. Particularmente a extração de
edifícios já possui um histórico de quase 30 anos (VOSSELMAN, 2002). Até meados da
década de 1990 as imagens aéreas eram as fontes usuais de dados. No final dessa mesma
década outras fontes de dados (por exemplo, as imagens de satélites de alta-resolução e os
dados de varredura a laser) passaram a ser utilizadas.
O uso de dados laser em problemas de extração se tornou comum nos
últimos anos, fato decorrente principalmente do amadurecimento do sistema que integra o
sensor laser com o Global Positioning System (GPS) e a Inertial Measurement Unit (IMU).
Este sistema permite a aquisição rápida e eficaz de Modelos Digitais de Elevação (MDE
1
),
com alta precisão e exatidão altimétrica. As metodologias que utilizam os dados de varredura
a laser vêm sendo empregadas nas mais variadas áreas, mas no mapeamento em especial, são
bastante atrativas as aplicações que envolvem a reconstrução de superfície e a extração de
objetos. Isso implica na solução de problemas específicos envolvendo, por exemplo,
segmentação e filtragem de objetos (edifícios, vegetação etc.) (HAALA e BRENNER, 1999),
geração de Modelo Digital do Terreno (MDT
2
) e Modelo Digital de Superfície (MDS)
(MATIKAINEN, HYYPPÄ e HYYPPÄ, 2005).
Neste trabalho o problema de extração automática de contorno de telhados é
formulado com base na análise de dados laser, tendo por fundamento as abordagens
Bayesiana e de Markov Random Field (MRF) (JACKSON e LANDGREBE, 2002;
MODESTINO e ZHANG, 1992; KOPPARAPU e DESAI, 2001; DENG e CLAUSI, 2004;
BERTHOD et al., 1996; KRISHNAMACHARI e CHELLAPPA, 1996). O reconhecimento de
padrão é parte integrante dos problemas de análise de alto-nível, o qual se baseia no processo
de entendimento do significado de uma imagem através da identificação de objetos
semelhantes e análise do relacionamento espacial. Neste escopo está a modelagem baseada
em MRF.
A grande vantagem das abordagens usando o modelo MRF está em
possibilitar a interação entre as variáveis aleatórias relacionadas espacialmente. O MRF é
então um modelo poderoso para caracterizar a informação contextual.
1
Segundo El-Sheimy (1999) o termo "elevação" refere-se às medidas de altura acima de uma superfície de
referência (datum) e altitudes ou elevações de pontos sobre um modelo. MDE é um termo muito utilizado nos
EUA, e geralmente se refere a criação de uma malha regular de elevações, geralmente quadrada ou com padrão
hexagonal em relação ao terreno.
2
Kasser e Egels (2002) definem o MDT como uma representação das elevações de pontos sobre o terreno ou na
superfície da água.
19
Este trabalho propõe o desenvolvimento de uma metodologia para a extração
de contornos de telhados de edifícios usando MDE, Inferência Bayesiana e MRF. Esta opção
metodológica tem por motivação principal a exploração da informação contextual de
contornos de telhados, o que não tem sido comum na literatura produzida sobre o assunto.
1.1 Trabalhos relacionados
A extração de telhados é um assunto que vem ganhando impulso nos últimos
anos, fato evidenciado pela recente e ampla literatura produzida sobre o tema. Os métodos de
extração de telhados diferem quanto ao tipo de fonte de dados utilizado (imagens aéreas e de
satélite e dados de varredura a laser) e o tipo de reconstrução (a reconstrução poliédrica ou
tridimensional do edifício ou a reconstrução do contorno do telhado ou a simples segmentação
para detectar telhados).
Em se tratando da reconstrução poliédrica de edifícios, destaca-se a seguir
vários trabalhos relacionados. Essas pesquisas envolvem a utilização de dados irregulares de
varredura a laser. Nardinocchi e Forlani (2001) apresentam uma estratégia para reconstrução
de edifícios isolados usando dados de varredura a laser. Neste trabalho os telhados são
modelados como faces planas, conectados pelas cumeeiras e limitados pelas paredes dos
edifícios. Na primeira etapa desta abordagem os autores identificam e agrupam os pontos
pertencentes a cada plano de telhado, usando a técnica de crescimento de regiões. Somente
pontos com altura compatíveis a de um telhado são agrupados. Em seguida são extraídas as
bordas do telhado. No segundo estágio a informação geométrica obtida fornece a descrição
topológica sobre as faces planas do telhado e as paredes da edificação. Ao final da
metodologia as faces planas adjacentes são unidas formando o telhado da edificação. A
reconstrução final é obtida através da junção entre as faces do telhado e as paredes da
edificação.
Vosselman e Dijkman (2001) descrevem uma metodologia para a extração de
telhados e geração de modelos tridimensionais de edifícios. Para a extração das faces planas é
utilizada uma versão tridimensional da transformada de Hough. Para realizar a reconstrução
de edifícios são descritas duas estratégias. A primeira estratégia detecta as intersecções das
20
faces planas e a segunda assume que todas as faces planas detectadas modelam alguma parte
do edifício.
Rottensteiner e Briese (2002) apresentam um método para a geração
automática de modelos tridimensionais de edifícios. Usando um processo de interpolação
hierárquica, os pontos irregularmente distribuídos são classificados em pontos pertencentes ao
terreno, pontos pertencentes a edifícios e outras classes de objetos. O processo de interpolação
hierárquica segue algumas etapas: 1) é gerada uma pirâmide de dados, onde na base da
pirâmide se têm os pontos mais baixos do conjunto de dados. 2) é aplicado o algoritmo de
interpolação para gerar o MDT e 3) compara-se o MDT com os dados do próximo nível da
pirâmide, onde se têm pontos mais altos, e aceita os pontos que estão dentro de um limiar pré-
estabelecido. Após o processo de interpolação é gerada uma classificação inicial dos edifícios,
mas essa classificação ainda contém objetos que não foram corretamente separados. Um
filtro de abertura morfológico é aplicado para eliminar objetos alongados. Restam ainda nesta
etapa objetos pequenos que são eliminados usando o atributo de área mínima (por exemplo,
40m
2
). As regiões existentes nas bordas do MDS também são descartadas.
Alharthy e Bethel (2004) utilizam também dados irregulares de varredura a
laser para realizar a reconstrução tridimensional de edifícios. Neste trabalho os autores
mostram que a densidade de pontos fornecida pela varredura a laser é suficiente para
reconstruir detalhadamente as feições urbanas, tais como edifícios. A metodologia
desenvolvida neste trabalho utiliza um método baseado numa janela móvel. Este método é
utilizado para ajustar planos no conjunto irregular de dados. O método tem como princípio
sobrepor uma janela à malha irregular de dados e movê-la através da malha. A utilização de
diferentes tipos de janelas juntamente com a informação (por exemplo, altura) sobre os pontos
da malha é a chave para determinar os planos de telhado. Após a obtenção da orientação e
localização aproximada dos planos de telhado, as bordas dos telhados são extraídas e unidas.
O resultado final da metodologia mostrou somente a reconstrução de edifícios isolados.
Wang e Tseng (2004) utilizaram um algoritmo para divisão e fusão de dados
de varredura a laser baseado na estrutura octree. Após o processamento pelo algoritmo de
divisão recursiva, o conjunto de dados é segmentado em agrupamentos planos tridimensionais
e classificado utilizando atributos obtidos a partir desses planos, tais como área, gradiente,
intensidade etc..
A ênfase agora é dada aos métodos de reconstrução que utilizam os dados
regulares de varredura a laser. Haithcoat, Song e Hipple (2001) descrevem uma abordagem
automática de extração e reconstrução de edifícios utilizando os dados fornecidos por
21
varredura a laser. Inicialmente é gerado um MDS a partir dos dados laser onde os objetos
altos são automaticamente detectados. Baseado em características geométricas sobre edifícios
(tais como: tamanho, altura e forma), estes são separados de outros objetos. Os contornos dos
edifícios após a extração são simplificados usando um algoritmo de geometrização para obter
uma melhor qualidade cartográfica. O algoritmo de geometrização reduz os detalhes contidos
no contorno, mantendo a forma e o tamanho aproximado dos edifícios. É realizada após esta
etapa uma análise utilizando o operador Watershed para extrair as cumeeiras dos telhados. As
cumeeiras, assim como as inclinações, servem para classificar os tipos de edifícios. Os
edifícios são reconstruídos usando modelos paramétricos de telhados (por exemplo: plano,
triangular e de quatro águas).
Zhou et al. (2004) apresentam um método que utiliza os dados de varredura a
laser para geração do MDT e modelo tridimensional de cidade. O modelo tridimensional de
cidade é uma estrutura de dados orientada a objeto, no qual cada edifício é considerado como
um objeto, isto é, uma entidade da classe edifício. Os atributos de cada edifício incluem: tipos
de telhados, polígonos dos contornos das superfícies dos telhados, altura, parâmetros
descrevendo a superfície dos telhados e dados de perfilamento a laser contendo a superfície
dos telhados.
Os trabalhos citados anteriormente utilizavam apenas os dados de varredura a
laser para realizar a extração e reconstrução tridimensional de edifícios. Esses dados são úteis
para a reconstrução de edifícios, no entanto, o principal problema na utilização de tal recurso
é que a discriminação entre edifícios e outros objetos, como árvores, torna-se difícil quando é
usada somente a informação de altura (MAAS e VOSSELMAN, 1999; HAALA, 1994). Uma
solução para contornar esse problema é descrita em Brunn e Weidner (1997). Nesta pesquisa
esses autores propõem uma abordagem baseada na análise da textura das regiões selecionadas,
a partir dos dados de varredura a laser, assumindo que a vegetação e telhados possuem
texturas diferentes. A busca por outras soluções que contornem o problema destacado, tem
impulsionado nos últimos anos o interesse pelas pesquisas que utilizam vários recursos de
dados na reconstrução tridimensional de feições, especificamente as relacionadas com
edifícios.
Haala e Brenner (1999) abordam a integração de dois métodos de coleta de
dados em ambientes urbanos para a reconstrução tridimensional de edifícios. O primeiro
método combina imagens multiespectrais e dados de varredura a laser em uma classificação
integrada para a extração de edifícios, árvores e áreas cobertas por gramíneas. A segunda
22
abordagem usa dados de varredura a laser e a planta baixa do edifício para realizar a
reconstrução tridimensional dos edifícios.
Em Vosselman (2002), é apresentada uma estratégia para a reconstrução de
edifícios usando dados de varredura a laser, plantas baixas de edifícios e imagens aéreas de
alta-resolução. Nessa estratégia, as plantas baixas dos edifícios são obtidas a partir dos dados
georreferenciados e utilizadas como referência para a construção de superfícies poliédricas
representando os edifícios. As bordas dos telhados são refinadas com base nas imagens
aéreas. O autor ressalta que a vantagem em usar mais de um recurso de dados para a
reconstrução de edifícios é que a modelagem não fica restrita a poucas primitivas, por
exemplo, forma. No entanto, o autor cita que há desvantagem na robustez da reconstrução se
for utilizado vários recursos de dados, pois as faces de telhado obtidas por cada recurso de
dados precisam ser detectadas e reconstruídas separadamente.
Outro método para extrair edifícios em estruturas complexas de telhados a
partir de dados de varredura a laser e plantas baixas é proposto por Park et al. (2006). Esta
extração inclui dois estágios, isto é, a extração de primitivas e a modelagem do edifício, que
são baseados na segmentação de regiões planas do conjunto de pontos fornecidos pela
varredura a laser. Esses segmentos planos são usados como primitivas primárias para obter as
primitivas secundárias, tais como cumeeiras e fronteiras de beiral, e assim refinar a estrutura
dos telhados.
O trabalho de Sohn e Dowman (2003) descreve um método automático para
extração de edifícios a partir da combinação entre dados multiespectrais do satélite Ikonos e
dados regulares de varredura a laser. Nesta abordagem, os edifícios individuais são
localizados como polígonos retangulares através de uma segmentação aplicada aos dados
laser. Logo após, são extraídas feições retas na imagem Ikonos utilizando o algoritmo de
Burns (BURNS, HANSON e RISEMAN, 1986). Essas feições são filtradas através de um
critério de comprimento onde permanecem somente as feições abaixo de um comprimento
pré-determinado. As feições extraídas são agora sobrepostas e analisadas no espaço dos dados
laser. Ao final o edifício é reconstruído usando apenas os polígonos que compreendem partes
significativas dos edifícios.
Matikainen, Hyyppä e Hyyppä (2005) utilizam a informação altimétrica do
sistema laser para a geração de modelos digitais da superfície e posteriormente integram esta
informação com a imagem aérea, auxiliando na eliminação de feições irrelevantes (árvores,
sombras etc.) no processo de detecção. Schenk e Csatho (2002) utilizam uma combinação de
dados laser e imagens aéreas para a obtenção de contornos de telhados de edifícios. As
23
superfícies planas representando telhados são obtidas a partir da segmentação por crescimento
de regiões nos dados laser. As cumeeiras dos telhados são obtidas através da intersecção dos
planos obtidos anteriormente. Estas mesmas intersecções são extraídas na imagem aérea
usando o detector de Canny. As informações de intersecção de telhados obtidas por ambas as
metodologias são combinadas para eliminar falsos positivos.
Dentre as pesquisas envolvendo a detecção ou extração de contornos de
telhados, pode-se destacar o trabalho de Rottensteiner et al. (2005) que descrevem um método
para delinear faces planas de telhado usando dados regulares de varredura a laser. As faces
planas são inicialmente detectadas utilizando o algoritmo de crescimento de regiões. Esse
método inicia com a detecção de regiões sementes e o plano se expande a partir da região
semente, adicionando pontos pertencentes ao MDS que são adjacentes a essas regiões. Em
seguida é realizado o agrupamento e o delineamento dos planos de telhado. Nesta etapa, os
planos de telhado são unidos baseando-se na análise de vizinhança. No final é realizada a
detecção das bordas dos planos, a partir das quais são obtidos os polígonos descrevendo os
contornos dos telhados.
Arefi e Hahn (2005) utilizam operações morfológicas para extrair contornos
de edifícios e vegetação. Para esse propósito é realizada uma segmentação hierárquica
utilizando operações morfológicas. A segmentação hierárquica é um processo iterativo que
inicia com elementos estruturantes pequenos e segue aumentando o tamanho desses
elementos. Nesse trabalho foram utilizados os dados provenientes do primeiro e último pulso,
possibilitando a geração de imagens de intensidade obtidas por normalização do MDE, nas
quais a metodologia foi aplicada.
Tarsha-Kurdi et al. (2006) desenvolveram um método automático de
segmentação a partir da nuvem de pontos (malha irregular de pontos) obtida por varredura a
laser usando somente a informação do primeiro pulso laser. O resultado da metodologia é a
discriminação automática de contornos de edifícios e terrenos, excluindo áreas de vegetação.
Lohmann (2002) e Voegtle e Steinle (2003) também realizam a segmentação na nuvem de
pontos e não sobre uma malha regularizada.
Tóvári e Pfeifer (2005) descrevem uma técnica que combina duas
abordagens. A primeira trabalha diretamente na nuvem de pontos usando critérios
geométricos (baseado em alturas, inclinações e diferença de curvatura) para decidir se um
ponto está sobre o terreno ou sobre um objeto. Na segunda abordagem, inicialmente os dados
são segmentados utilizando o algoritmo de crescimento de regiões e em seguida é realizada
uma filtragem dos dados baseada em critérios de similaridade e distância entre pontos.
24
Sohn (2004) ressalta que a extração de contornos de edifícios é um problema
difícil no âmbito do reconhecimento de objetos, o que está relacionado com a complexidade e
a variabilidade da cena. Para minimizar esse problema o autor sugere a fusão de várias fontes
de dados. Este trabalho inicialmente realiza, a partir de uma nuvem de pontos, a distinção
entre pontos do terreno e pontos não pertencentes ao terreno. A classificação dos pontos é
feita assumindo que o espaço laser é uma superfície localmente plana, assim os dados são
recursivamente fragmentados em pequenas regiões até que não haja mais diferenças de altura
nos dados da região analisada. A seguir é gerado um MDS com os pontos que não pertencem
ao terreno. As árvores são identificadas na imagem Ikonos usando o Normalized Difference
Vegetation Indices
(NDVI). Ao final do trabalho os pontos pertencentes ao terreno e às
árvores são eliminados, permanecendo os polígonos referentes aos telhados identificados.
Bretar e Roux (2005) apresentam uma metodologia de segmentação
combinando dados laser e imagens aéreas. Inicialmente, os dados laser são processados para
extrair primitivas dos edifícios. Essas primitivas são então introduzidas no processo de
segmentação baseado em fusão de regiões.
Machado e Mitishita (2006) desenvolveram uma metodologia automática
para detectar contornos de edificações integrando informações provenientes da imagem
digital e dos pontos obtidos pelo sistema de varredura a laser. Inicialmente a imagem é
segmentada usando o espaço de cores, via algoritmo de deslocamento pela média (mean shift).
A seguir, aplica-se o algoritmo de perseguição de contornos, para a geração dos contornos das
regiões segmentadas. Para eliminar regiões não pertencentes às edificações os autores efetuam
uma filtragem dos segmentos gerados, utilizando três filtros sucessivamente. Filtro para o
padrão verde (removendo vegetação), filtro altimétrico (preservando regiões altas), e filtro
Douglas-Peucker (detecção de feições lineares). Os contornos resultantes após a aplicação dos
filtros apresentados são avaliados quanto à possibilidade de fusão entre regiões vizinhas,
estabelecendo-se os contornos definitivos (em nível de pixel) do que se acredita serem
edificações. Os resultados apresentados são contornos de edificações isoladas.
As metodologias existentes para a extração de telhados exploram diversos
processos para alcançar o objetivo desejado. Uma teoria que vem ganhando espaço no campo
da extração de feições é o MRF. No entanto, ainda há uma escassez na quantidade de
trabalhos que exploram o uso do modelo MRF na análise de dados de varredura a laser,
especialmente no contexto de extração de edifícios ou contornos de telhados. A principal
vantagem de se utilizar a segmentação baseada em MRF é a possibilidade de integração ao
processo das relações espaciais entre regiões vizinhas presentes na cena analisada (DUBES e
25
JAIN, 1989). Os poucos trabalhos existentes que utilizam o modelo MRF para extração de
contornos de telhados se baseiam em dados de imagem. Por exemplo, Krishnamachari e
Chellappa (1996) desenvolveram uma metodologia de extração de contornos de telhados que
envolve a extração de feições retas em uma imagem aérea. O modelo MRF é usado para
agrupar essas feições retas para delinear os edifícios na imagem aérea. Katartzis et al. (2001)
propõem um método automático para detecção de telhados em imagens aéreas utilizando um
modelo baseado em MRF. Os telhados são extraídos usando agrupamento hierárquico e
princípios de organização perceptual.
Neste trabalho é proposta e avaliada uma metodologia para extração de
contornos de telhados de edifícios, onde a principal meta é o aproveitamento do potencial do
modelo MRF para a modelagem de relações espaciais. Esta metodologia possui duas etapas
básicas. Na primeira etapa os objetos altos são extraídos no referencial do MDE. E na
segunda, os contornos de telhados são separados entre os contornos extraídos na primeira
etapa. As duas etapas são desenvolvidas utilizando métodos que envolvem a Inferência
Bayesiana e modelos MRF.
1.2 Objetivos
O objetivo geral deste trabalho é a extração automática de contornos de
telhados de edifícios em um MDE gerado a partir de dados de varredura a laser usando
modelo MRF e Inferência Bayesiana.
Visando atingir o objetivo geral, extração automática de contornos de
telhados de edifícios, os seguintes objetivos específicos são propostos:
1- A fim de reduzir a complexidade das informações geométricas do MDE, será
desenvolvida uma metodologia para a extração de objetos altos em geral, no MDE,
valendo-se de duas etapas: 1 – segmentação por regiões do MDE, usando uma
estratégia recursiva via estrutura quadtree; 2 – redução da fragmentação das regiões
detectadas na primeira etapa usando uma estratégia de fusão de regiões semelhantes.
2- Separação, entre os objetos altos previamente extraídos, das regiões altas
correspondentes aos contornos de telhados;
3- Implementar computacionalmente as metodologias propostas nos objetivos específicos
1 e 2;
26
4- Avaliar experimentalmente as metodologias propostas usando dados reais.
1.3 Justificativas
A relevância científica e tecnológica deste trabalho é evidenciada pela
importância dada ao tema pela International Society for Photogrammetry and Remote Sensing
(ISPRS), onde um dos termos de referência é o uso de MRF e redes Bayesiana. O Grupo de
Trabalho WG III/3 (Processing of Point Clouds from Laser Scanners and other Sensors) da
Comissão III (Photogrammetric Computer Vision and Image Analysis) possui como um dos
termos de referência à segmentação, filtragem e extração automática e semi-automática de
objetos utilizando diversas fontes de dados.
A extração automática de feições cartográficas, quando se trata
principalmente da extração em áreas urbanas, é de grande importância tecnológica, pois ainda
hoje, a extração de feições é realizada manualmente, implicando na morosidade e no alto
custo do processo de captura de dados. Em conseqüência, fica limitada a densidade e a
resolução dos dados a serem coletados, impactando também negativamente o ciclo de revisão
desses dados. A metodologia proposta neste trabalho se insere no contexto de
desenvolvimento de novas metodologias para a captura eficiente de informações espaciais a
partir de dados gerados por diversos sensores. Embora o aumento do nível de automação seja
o aspecto que normalmente vem em primeiro plano, a confiabilidade e a acurácia dos
procedimentos convencionais devem ser igualmente valorizados.
O ineditismo do trabalho se dá pelo fato de se desconhecer na literatura
relacionada metodologias de extração de contornos de telhados que utilize estratégia
semelhante à descrita neste trabalho. O aspecto mais relevante deste trabalho é a exploração
das possibilidades oferecidas pelo modelo MRF para a modelagem de relações espaciais entre
objetos. A exploração eficiente do contexto nos sistemas de extração automática de feições
pode ser determinante para a melhoria de desempenho destes sistemas, tornando-se mais
compatíveis com a qualidade do sistema de visão humana.
27
1.4 Estrutura do trabalho
Este trabalho está organizado em 5 capítulos principais. O primeiro capítulo
descreve a introdução e a motivação ao problema de extração automática de contornos de
telhados, apresentando alguns trabalhos relacionados com extração de telhados utilizando
dados de varredura a laser e outras fontes de dados e, finalizando, são apresentados os
objetivos geral e específico, bem como suas principais justificativas.
No segundo capítulo são apresentados vários conceitos, técnicas e modelos
fundamentais para o desenvolvimento da metodologia a ser apresentada no capítulo 3, quais
sejam: algumas características do sistema de varredura a laser, princípio de funcionamento do
sistema, posição e orientação do sistema, um relato da qualidade dos dados de varredura a
laser e uma visão geral sobre o processamento dos dados obtidos por varredura a laser;
conceitos da teoria de grafos; segmentação utilizando divisão e fusão de regiões; os princípios
de vetorização de bordas; abordagem bayesiana aplicada à análise de imagem; MRF;
distribuição de Gibbs; distribuição a posteriori; MRF no contexto de análise de imagem;
algoritmo Simulated Annealing (SA); modelo condicional auto-regressivo (CAR); amostrador
de Gibbs; software WinBUGS.
O terceiro capítulo trata da metodologia para a extração automática de
contornos de telhados em áreas urbanas em um MDE utilizando Inferência Bayesiana e
modelo MRF. A metodologia proposta é descrita conforme as suas duas etapas principais, isto
é, a extração de contornos de objetos altos em geral, seguida da separação dos objetos de
interesse (contornos de telhados).
No quarto capítulo são apresentados e discutidos os resultados obtidos com
a metodologia de extração de contornos de telhados.
No quinto capítulo são apresentadas as principais conclusões e algumas
recomendações futuras.
28
2 FUNDAMENTAÇÃO TEÓRICA
Este capítulo apresenta a revisão bibliográfica sobre conceitos, modelos e
técnicas utilizados para o desenvolvimento da metodologia de extração automática de
contorno de telhados a partir de um MDE. Apresenta-se a seguir os tópicos relacionados com
varredura a laser, teoria dos grafos, segmentação, vetorização e poligonização, abordagem
bayesiana aplicada à análise de imagem e MRF.
2.1 Varredura a Laser
Com o avanço da tecnologia, as metodologias para a realização do
levantamento tridimensional de pontos no terreno estão se aperfeiçoando. Aliadas ao
desenvolvimento tecnológico, surgem as técnicas para a representação direta da superfície
terrestre por meio da representação digital do relevo, bem como das elevações associadas com
objetos (árvores, edificações etc.) sobre a superfície terrestre.
Para representar de forma continua o terreno (superfície física da Terra) e as
elevações nele presentes em meio digital seriam necessários um número infinito de pontos, no
entanto essa quantidade de informação requer um armazenamento infinito de dados. Diante da
impossibilidade computacional de armazenamento de tal quantidade de dados, uma forma
alternativa de representação é a utilização de uma quantidade finita de pontos que represente o
terreno. Para sanar essa demanda, ultimamente estão sendo usados a amostragem de dados o
MDT e o MDE.
Uma das formas para se obter um MDE é através de processos
fotogramétricos. Também é possível obter um MDE por meio de levantamento GPS em
campo. Esses métodos consistem basicamente na coleta de uma malha de pontos com
coordenadas de terreno que permitem produzir a modelagem desejada. Todos são métodos
válidos e contribuíram historicamente para a produção dos documentos cartográficos
existentes. No entanto, esses métodos são dispendiosos, pois envolvem equipes de campo ou
fotogrametristas especializados, além de implicarem em um maior custo efetivo. Uma opção
que tem se viabilizado atualmente se baseia na coleta de dados através de sistemas de
varredura a laser.
29
Nos últimos anos, o uso da tecnologia de varredura a laser tem se tornado
foco de pesquisas. A necessidade de aquisição rápida e eficaz de dados digitais de elevação do
terreno (MDE) tem motivado o uso desta tecnologia. Uma grande atenção vem sendo dada ao
tema, sendo criado pela Commission III da International Society for Photogrammetry and
Remote Sensing
(ISPRS) um grupo de trabalho (Working Group III/3 "Tridimensional
Reconstruction from Airborne Laser Scanner and InSAR Data") com objetivo de pesquisar de
forma mais ampla a acurácia e o uso de dados fornecidos por essa tecnologia.
A geração automática de MDE é ainda um problema quando se trata da
modelagem dos objetos sobre a superfície do terreno. Efeitos de perspectiva causados pela
geometria das fotografias, estabelecimento da correspondência, problema de sombras, entre
outros, não permitem a modelagem correta dos objetos. Com o intuito de sanar esses
problemas, a varredura a laser surge como uma tecnologia emergente aumentando, nos
últimos anos, o interesse da comunidade cartográfica em relação ao conhecimento e ao uso
mais intenso desse sistema.
2.1.1 Sistemas de varredura a laser
Existem dois tipos de sistemas de varredura a laser, os sistemas estáticos e
os dinâmicos. Nos sistemas estáticos existem basicamente dois princípios diferentes de
medida a laser: o princípio que se baseia no intervalo de tempo decorrido desde o instante da
emissão do pulso até o instante do retorno do mesmo (distância) ao sistema e o princípio
baseado na triangulação (BOEHLER, HEINZG e MARBS, 2001).
Para medir distâncias maiores, há o sistema que trabalha com o tempo de
retorno do sinal. Segundo Tommaselli (2003) esse sistema mede a distância através do tempo
de retorno do pulso laser. Neste sistema de varredura, o instrumento emite milhares de pulsos
laser por segundo, normalmente de radiação infravermelha. O instrumento mede as distâncias,
a intensidade da energia refletida pelo objeto e os parâmetros de atitude do feixe (azimute e
elevação), que são as coordenadas polares do ponto, em relação ao referencial do laser. A
partir destes dados é possível calcular as coordenadas cartesianas tridimensionais dos pontos
medidos e sua resposta espectral, que pode ser usada para criar uma imagem semelhante à
visível.
30
Os sistemas baseados no princípio da triangulação possuem uma fonte laser
e, no mínimo, um sensor Charge Coupled Device (CCD). Neste sistema um pulso de laser é
emitido para o objeto e seu retorno é registrado por um ou mais sensores CCD’s. O ângulo de
varredura dos pulsos é registrado no sistema a cada pulso emitido. Conhecendo-se a base fixa
entre o sensor laser e a câmara, por meio de um processo de calibração, determina-se a
posição dos pontos refletidos pelo objeto (BOEHLER, HEINZG e MARBS, 2001).
Já o sistema dinâmico, no qual está baseado o sistema de varredura a laser
aerotransportado, utiliza um feixe óptico de alta potência e bem direcionado, com coerência
no espaço e no tempo, para garantir a qualidade da medição da distância. Para determinar a
posição dos pontos no terreno, o sensor conta com apoio de um sistema de posicionamento
global com precisão compatível. A posição do sensor na hora da medição de cada ponto é
determinada mediante um sistema de GPS diferencial (DGPS) obtendo-se as posições
,,
GPS GPS GPS
YZ. Um segundo sistema de apoio, uma IMU, é encarregada de calcular a
inclinação (,,)
ω
ϕκ
do sensor em torno dos eixos (DALMOLIN e SANTOS, 2004).
2.1.2 Princípio de funcionamento do sistema de varredura a laser aerotransportado
O sistema de varredura a laser composto pelo GPS, a IMU e o laser (Figura
1), tem como função principal, através da emissão e recepção de pulsos de laser, medir a
distância entre o sensor e a superfície do objeto. Com a integração GPS/IMU, o sistema
fornece uma nuvem de pontos adquirida através das medidas de distância.
O princípio básico do sistema de varredura a laser consiste na utilização de
um feixe de laser que é emitido, com o auxílio de um espelho de varredura, em direção aos
objetos. Este feixe é refletido ao atingir a superfície dos objetos, retornando um eco ao
sistema. Este sistema é então encarregado de registrar o tempo decorrido entre a emissão e a
captação do eco, permitindo a obtenção da distância entre o sensor e o objeto iluminado.
Um sistema de varredura a laser é composto de alguns componentes
essenciais como o gerador de pulsos laser, conjunto óptico de transmissão e recepção do
pulso, detector de sinais, unidade de controle e armazenamento e outros componentes
eletrônicos.
31
Figura 1 - Aeronave e principais componentes do sistema de varredura a laser. (Fonte:
http://www.lidar.com.br/tecnologia.htm).
O gerador de pulsos, mostrado na Figura 2, é o componente principal do
sensor laser. É responsável pelo estímulo do cristal, realizado através de um diodo
semicondutor que provê a energia necessária para a emissão de um raio laser de alta energia.
Um tipo de cristal comumente utilizado é o chamado
Neodimium: Yttrium Aluminum Garnet
(Nd: YAG) (WEHR E LOHR, 1999).
Controlador de
ruído
Conversor
analógico/digital
Medidor de
intervalo de
tempo
Unidade de
controle e
armazenamento
Gerador de
pulso LASER
Pulso
emitido
Receptor
GPS
IMU
Largura da
faixa
Direção de
vôo
Direção de
varredura
Pulso
recebido
Figura 2 – Sistema de varredura a laser (Fonte: Adaptado de DALMOLIN e SANTOS, 2004).
Varredura a
laser
IMU
GPS
32
Após o pulso ser gerado, ele é dirigido para a chamada cavidade óptica até
um espelho móvel na parte final do sensor. O conjunto óptico de lentes e espelhos orienta os
pulsos laser emitindo-os para os objetos. O sinal de retorno é dirigido à parte eletrônica de
recepção do sensor, que recebe um sinal analógico de retorno e por meio de um conversor
A/D transforma o sinal analógico em digital. O sinal digital da radiação refletida passa por um
filtro de interferência (controlador de ruído) que verifica se o sinal recebido possui a mesma
intensidade do sinal emitido.
O Medidor de Intervalo de Tempo (
Time Interval Meter - TIM) é o módulo
responsável pela medida do tempo transcorrido entre a emissão do pulso laser e o seu retorno
ao sistema. Essencialmente, ele é um contador que inicia quando o pulso laser é disparado e
para quando o último pulso correspondente retorna.
2.1.3 Características do sistema de varredura a laser
A divergência do pulso é uma característica física do pulso laser de divergir
à medida que se propaga no meio. Essa divergência é relativamente baixa, resultando numa
área do alvo de diâmetro muito pequeno. Um pulso emitido pelo sistema gera no alvo uma
área circular de diâmetro (A), relacionada com a altura de vôo (H) e a divergência angular do
pulso (
γ
) (Figura 3).
D
H
γ
/2
A
γ
H
A
xx
(a) (b)
Figura 3 – Diâmetro do pulso. (a) considerando uma abertura D; (b) considerando uma abertura D
muito pequena (Fonte: Adaptado de BALTSAVIAS, 1999).
O diâmetro do círculo projetado no alvo, para uma abertura (D) ilustrada na
Figura 3(a), pode ser determinado através da relação de semelhança de triângulos,
33
() ()
/2 /2
x
tg x H tg
H
γγ
=⇒=
. (1)
Para uma abertura (D) muito pequena (Figura 3(b)), a Equação 1 é dada por
(
)
22/2,Ax AHtg
γ
=⇒=
(2)
onde:
A é o diâmetro do círculo projetado no alvo;
D a abertura do laser;
γ é a divergência angular do pulso laser em radianos;
H é a altura de vôo em metros.
No caso de terrenos inclinados, a Equação 2 é generalizada levando em
consideração a Figura 4.
H
A
i
θ
γ
i < 0
Figura 4 – Diâmetro do pulso para terrenos inclinados (Fonte: BALTSAVIAS, 1999).
=
2
cos
2
2
γ
θ
γ
senHa
A
+++++=
2
)()()(cos
γ
θθθ
itgisenia (3)
onde,
θ
é o ângulo de varredura do sistema;
i é o ângulo de inclinação do terreno.
34
Dependendo da situação, o ângulo de divergência pode ser ajustado através
de elementos ópticos apropriados. Em alguns casos há a necessidade de uma divergência
menor como, por exemplo, em levantamentos de detecção de cabos de linhas de transmissão e
para maior penetração na vegetação.
A varredura é feita no sentido transversal à direção de vôo com uma
abertura especificada pelo operador. O ângulo de varredura permite a determinação da largura
de faixa abrangida pela varredura a laser, enquanto o movimento da aeronave permite a
cobertura na direção de vôo. As pulsações ópticas refletidas no solo são coletadas pelo
receptor e são convertidas de sinal óptico para digital. A largura da faixa abrangida pela
varredura (Figura 5) pode ser determinada utilizando a Equação 4,
2(/2),
f
LHtg
θ
=
(4)
onde:
f
L representa a largura da faixa varrida pelo sensor em metros;
H representa a altura de vôo em metros;
θ é o ângulo de varredura do sistema.
L
f
H
θ
Figura 5 – Largura da faixa (Fonte: Adaptado de BALTSAVIAS, 1999).
O sistema de varredura a laser utiliza espelhos de varredura óptico-
mecânico, sendo que a varredura pode ser unidirecional ou bidirecional, existindo diferentes
opções para se efetuar o redirecionamento do feixe do laser (WEHR e LOHR, 1999). Os
espelhos de varredura existentes são classificados em: espelho de varredura Palmer (produz
modelos elípticos), polígono de rotação (produz linhas paralelas) e o espelho oscilador
(produz linhas em “zig-zag”) como mostra a Figura 6.
35
(a) (b) (c)
vôo
o
o
n-ésima varredura
primeira
varredura
Figura 6 – Configuração da varredura em relação ao tipo de espelho. (a) espelho de varredura Palmer;
(b) polígono de rotação; (c) espelho oscilador. (Fonte: Adaptado de DALMOLIN e SANTOS, 2004).
A Figura 6 mostra a configuração da varredura para três tipos de espelhos. O
espelho de varredura Palmer é ilustrado na Figura 6(a), o espelho polígono de rotação (Figura
6(b)) possui varredura unidirecional, e o espelho oscilante possui uma varredura bidirecional
(Figura 6(c)). Os pontos ao longo de uma linha são varridos em incrementos de ângulos iguais
(WEHR e LOHR, 1999).
O deslocamento da aeronave combinado com movimentos laterais do
conjunto óptico móvel produz uma seqüência de varredura que, dependendo do tipo de
espelho utilizado, forma um padrão de varredura. O padrão de varredura é definido pela
oscilação do conjunto óptico em torno do eixo (freqüência de varredura) em conjunto com o
movimento da aeronave. Desta forma, a freqüência de varredura determina a densidade dos
perfis, ou seja, se a freqüência de varredura é alta, são obtidos perfis transversais à linha de
vôo, densos. Neste caso, o diâmetro do pulso projetado é superior ao espaçamento em
questão, mostrando a necessidade de aumentar a freqüência de varredura para uma melhor
distribuição dos pontos por metro quadrado.
O quadro 1 ilustra uma combinação de freqüências de varredura com
algumas alturas de vôo, tendo como resultante a densidade de pontos por metro quadrado.
Neste quadro, estabeleceu-se a velocidade da aeronave em 230 km/h, equipamento com
freqüência operacional de 33 kHz e ângulo de varredura de 40°.
36
Quadro
1 – Determinação da densidade de pontos por metro quadrado, no terreno, a partir da
combinação de parâmetros.
Altura de vôo
500m 1000m 2000m
Freqüência de varredura 29Hz 27Hz 19Hz
Largura da faixa 360m 720m 1440m
Espaçamento dos pontos –
eixo X
1,11 1,19 1,69
Espaçamento dos pontos –
eixo Y
0,63 1,18 1,66
Pontos/m
2
1,40 0,70 0,40
Fonte: Adaptado de Brandalize, 2002.
O quadro 1 ilustra a determinação da densidade de pontos em relação a
freqüência de repetição dos pulsos, altura de vôo e ângulo de varredura. Pode-se verificar que
a densidade e a distribuição dos pontos que são medidos na superfície do terreno estão
intrinsecamente relacionadas a esses parâmetros.
Para medir a distância entre o sensor e o alvo é necessário determinar as
condições atmosféricas e a velocidade de propagação do pulso laser e o tempo transcorrido
entre o pulso transmitido e recebido. Esse tempo é detectado pela óptica do sistema e
registrado pelo TIM. Dessa forma, a distância pode ser calculada pela Equação 5,
L
tcR
2
1
=
, (5)
onde:
R é a distância entre o sensor e o alvo;
c a velocidade da luz;
t
L
é o tempo transcorrido entre o pulso emitido e recebido.
Os sistemas de varredura a laser operam em qualquer horário, diurno ou
noturno. No entanto, existem algumas interrupções como as provocadas por chuva ou nuvens
muito densas entre o local varrido e a aeronave. Esses sistemas dependem basicamente da
detecção da resposta de uma superfície natural ou artificial. Assim, esta reflexão depende
basicamente das características desta superfície.
37
Uma faixa estreita do espectro é utilizada, operando na faixa do
infravermelho próximo e médio, ou seja, entre 800 e 1600
ηm. A faixa do espectro a ser
utilizada é limitada por questões de segurança. A escolha da melhor faixa do espectro a ser
trabalhada depende das propriedades de reflexão dos alvos, tendo em vista os objetivos do
estudo. Por exemplo, uma faixa de 1535
ηm não é adequada para a neve que reflete pouco
neste comprimento de onda, sendo que uma melhor escolha, neste caso, seria de 810
ηm
(Brandalize, 2002).
2.1.4 Posição e orientação do sistema
Em um sistema de varredura a laser, o receptor GPS integrado ao sistema,
registra a posição da aeronave em intervalos fixos. Outro receptor localizado no solo fornece a
correção diferencial em tempo real para uma determinação de posição mais precisa. O DGPS
é um método de refinamento dos dados posicionais derivados do rastreio realizado pelo GPS
por meio da correção de erros inerentes ao processo. O segundo sistema de apoio, isto é, uma
IMU, fornece os ângulos de atitude da aeronave durante o levantamento.
A configuração dos sistemas na aeronave é feita posicionando a antena GPS
aerotransportada na carenagem externa da aeronave. O sensor laser e a IMU são instalados no
interior da aeronave.
A integração GPS/IMU é uma ferramenta poderosa. A IMU pode
complementar o GPS fornecendo a posição inicial e a informação de velocidade angular após
a perda de sinal do receptor. Mesmo quando a visibilidade dos satélites é insuficiente, a IMU
pode fornecer informações contínuas de trajetória (CRAMER e STALLMANN, 2001).
2.1.5 Imagem de intensidade
Alguns sistemas de perfilamento a laser possuem uma característica
marcante que está relacionada com a capacidade de refletância de determinados objetos. Neste
caso são disponibilizados dados de intensidade de retorno dos pulsos ao sistema, que variam
38
de acordo com a superfície perfilada, isto é, a superfície pode absorver ou refletir pulsos de
forma diferente.
A superfície do material perfilado determina a porcentagem de pulsos que
retorna ao sensor. A reflexão do pulso depende basicamente das propriedades da superfície
perfilada. A detecção de luz refletida em uma superfície é feita por um componente receptor
chamado fotodiodo ou
Avalanche PhotoDiodes (APD) e sua sensibilidade é de grande
importância para a captação do sinal refletido.
Segundo Wever e Lindenberger (1999), a reflexão é geralmente difusa, isto
é, não orientada. A refletividade de terrenos arenosos é da ordem de 10% a 20%, entre 30% e
50% no caso de vegetação e de 50% a 80% no caso de gelo e neve. Em relação à água, pode-
se obter refletividade suficiente com um ângulo de varredura menor que 10 graus.
A Tabela 1 apresenta percentuais de reflexão para um comprimento de onda
de 900
μm.
Tabela 1
– Percentual de reflexão de alguns materiais.
Material Reflexão (%)
Madeira clara, seca e limpa 94
Neve 80-90
Pedras claras 85
Calcário, argila Até 75
Vegetação mista 60
Coníferas 30
Asfalto 17
Fonte: Adaptado de Wehr e Lohr (1999).
A porcentagem de reflexão dos materiais presentes na superfície tem
influência sobre a quantidade de pulsos que retornam ao sistema. Neste caso, a reflexão dos
materiais depende basicamente da sensibilidade a determinados comprimentos de onda e das
características desta superfície.
A imagem mostrada na Figura 7 é um exemplo de uma imagem de
intensidade obtida usando a informação de retorno do primeiro pulso do sistema de varredura
a laser.
39
Figura 7 – Imagem de intensidade obtida a partir da informação do retorno do primeiro pulso laser
(Fonte: Instituto de Tecnologia para o Desenvolvimento (LACTEC)).
É possível verificar na Figura 7 que as ruas são facilmente identificadas,
fato que é justificado pela Tabela 1, onde se pode notar que o asfalto tem baixa capacidade de
reflexão (17%). Em relação à resolução espacial e radiométrica, Axelsson (1998), afirma que
as imagens de intensidade são limitadas se comparadas às fotografias aéreas obtidas por
técnicas fotogramétricas convencionais.
2.1.6 Qualidade dos dados de varredura a laser
Nos últimos anos, a qualidade planimétrica e altimétrica dos dados
provenientes do sistema de varredura a laser vem sendo extensivamente estudada
(BALTSAVIAS, 1999; WEHR e LOHR, 1999; GORDON, LICHTI e STEWART, 2001;
AHOCAS, KAARTINEN e HYYPPÄ, 2003; BRETAR e ROUX, 2003). Essas pesquisas
mostram que a qualidade e a acurácia dos dados são afetadas por alguns fatores, tais como a
superfície do material, altura de vôo, integração GPS/IMU, ângulo de observação, tipo de
sensor utilizado, entre outros. Outro fator que influencia na qualidade dos dados é a altura de
vôo. A variação na altura de vôo implica em uma maior ou menor densidade de pontos na
superfície do terreno, o que influencia diretamente na descrição do relevo. Vale ressaltar que a
largura da faixa varrida pelo sistema de varredura a laser é dada em função da altura de vôo e
do ângulo de varredura do sistema (Equação 4).
40
Um exemplo de trabalho nesta linha de pesquisa é encontrado em Ahocas,
Kaartinen e Hyyppä (2003), onde é realizada uma avaliação da densidade dos dados obtidos a
partir da varredura a laser, utilizando diferentes tipos de superfície (floresta, cascalho, asfalto
e capim), com dois diferentes sensores e diferentes alturas de vôo. Neste caso, os autores
verificam que, como esperado, quanto maior a altura de vôo, menor é a densidade dos pontos.
Outro fator que interfere na qualidade planimétrica dos dados gerados pela
varredura a laser é a divergência do pulso. Segundo Brandalize (2002), a complexa interação
entre a transmissão e a reflexão no objeto perfilado é um fator que está relacionado com a
divergência do pulso laser. O sinal retornado será função da dispersão da energia do pulso
laser dentro da área formada pela interceptação do pulso no alvo. Dessa forma, para alvos não
uniformes com diferenças de reflexão e inclinação, o erro de divergência será
proporcionalmente maior e conseqüentemente haverá incertezas em relação à posição
planimétrica e altimétrica do alvo.
A acurácia da posição do pulso depende principalmente da qualidade do
pós-processamento do DGPS, do GPS, do número e configuração de satélites visíveis durante
o vôo, da distância entre as estações de referência e aerotransportadas, da qualidade da
integração e calibração do GPS, IMU e sistema de varredura a laser e da acurácia da direção
do pulso (acurácia da varredura). Geralmente, com DGPS e pós-processamento pode-se
alcançar uma acurácia de 5-15cm (BALTSAVIAS, 1999). A precisão de medida da IMU
depende do fabricante, mas geralmente se encontram na ordem de 1/100º, que a 1.000 m de
altura correspondem a uma qualidade decimétrica semelhante à do GPS (MOSTAFA e
HUTTON, 2001).
No entanto, esses erros podem ser corrigidos através da utilização de
métodos de calibração do sistema GPS, IMU e laser. A calibração, todavia, tem como
objetivo confirmar se o sistema está operando de acordo com as suas especificações e
tolerâncias de precisão, além de permitir a obtenção de parâmetros de correção de possíveis
desvios.
Assim, a precisão dos dados consiste de uma parte variável que é
dependente dos parâmetros como: altura de vôo, ângulo de varredura, topografia do terreno,
cobertura do solo (referindo a geometria do objeto e refletividade do alvo) e uma parte
constante que é independente de parâmetros prévios, como por exemplo: acurácia da detecção
do pulso, acurácia do GPS etc..
41
2.1.7 Processamento de dados
O sistema de varredura a laser gera um conjunto de dados brutos que devem
ser processados para produzir ou modelar da superfície do terreno tridimensionalmente. Esses
dados são fornecidos após a realização do vôo. Sendo eles: a posição planimétrica, dos pontos
no terreno, que é obtida com apoio de um sistema de posicionamento (GPS), a orientação, ou
seja a unidade de medição encarregada de calcular a inclinação do sensor (IMU), os intervalos
de tempo (medidas de distância do laser) e os ângulos de varredura.
Os pontos do terreno no referencial
World Geodetic System 84 (WGS84)
podem ser calculados com o auxilio de três conjuntos de dados: dados de calibração do
sistema, medidas de distância do laser com seus respectivos ângulos de varredura e dados do
GPS e IMU. A Figura 8 ilustra um fluxograma contendo os passos do processamento dos
dados provenientes das medidas laser (HUG
3
apud WEHR E LOHR, 1999).
Dados
(GPS/IMU)
Distâncias e ângulos
de varredura
Parâmetros de
calibração do sistema
Pontos de terreno (X, Y,
Z) em WGS84
Sistema local
Classificação
Filtragem
Redução dos dados
Figura 8 – Fluxograma do processamento dos dados provenientes das medidas de varredura a laser
(Fonte: Adaptado de WEHR e LOHR, 1999).
3
HUG, CH., WEHR, A. Detecting and identifying topographic objects in imaging laser altimeter data. In:
IAPRS, v. 32, Part 3–4W2, p. 19–26, 1997.
42
De acordo com a Figura 8, a partir da aquisição dos dados, o primeiro passo
é transformar os pontos para o sistema WGS84 e, na seqüência, transformar os dados da
varredura a laser em WGS84 para um sistema de coordenadas local. O resultado é uma nuvem
de pontos irregularmente distribuídos em posição e elevação. Salienta-se que a distribuição
dos pontos depende do tipo de espelho de varredura utilizado pelo sistema.
Na etapa de classificação, pode-se citar uma metodologia apresentada por
Nardinocchi, Forlani e Zingaretti (2003) onde se utiliza duas estratégias conjuntas para
classificação e filtragem de dados de varredura a laser, para geração do MDT. Essa estratégia
é dividida em dois estágios. No primeiro estágio, os dados “brutos” são interpolados em uma
grade regular. Logo após é realizada a segmentação baseada em diferenças de altura e os
dados são classificados em três classes (terreno, edifício e vegetação). No segundo estágio
retorna-se para os dados “brutos” e realiza-se a filtragem dos pontos em cada célula da grade
de acordo com a classificação prévia.
Após a etapa de classificação, pontos no terreno devem ser separados de
edificações e vegetação. Para realizar esta tarefa, diferentes algoritmos de filtragem são
aplicados. Essa filtragem é feita usando pontos irregularmente espaçados ou uma grade
regular interpolada. No caso da grade regular existem algumas desvantagens, como por
exemplo, a redundância de dados em áreas onde o terreno é uniforme e incapacidade de se
adaptar áreas de relevo complexo sem alterar o tamanho da malha.
A redução dos dados é necessária após a etapa de filtragem e interpolação,
pois a quantidade de dados envolvidos é muito grande, tornando seu processamento muito
lento. O tempo de processamento para calcular um MDT, a partir de dados de varredura a
laser, é geralmente três vezes maior que o tempo gasto na de aquisição dos dados (WEHR e
LOHR, 1999).
2.1.7.1 Amostragem dos dados
A obtenção de dados proveniente a superfície real para fins de modelagem
matemática de superfícies, consiste em levantar, por uma técnica de amostragem, um certo
número de pontos com coordenadas espaciais (X,Y,Z). O processo de amostragem não pode
ser conduzido de forma casual. A escolha de pontos deve ser realizada de maneira que seu
43
conteúdo informativo represente o comportamento estrutural da superfície real (EL-SHEIMY,
1999).
A perfilagem dos dados é uma das técnicas mais empregadas para a
obtenção de informações espaciais para fins de modelagem matemática de superfícies. Neste
caso, o processo consiste em obter pontos representativos de relevo na região de estudo.
Os dados da varredura a laser consistem de uma perfilagem irregular onde
não se tem o exato espaçamento de pontos no perfil ou entre perfis, conforme mostra a Figura
9.
Figura 9 – Exemplo de perfilagem irregular obtida por varredura a laser.
Existem vários processos para a elaboração de modelos de superfície. De
forma geral, os pontos amostrados são interligados formando triângulos e estes formando um
poliedro. Desta maneira, a superfície é aproximada por um modelo que é um poliedro cujos
vértices são os pontos amostrados (WOLF e DEWITT, 2000). Os métodos mais usados para
representar superfícies em meio digital são o
Triangulated Irregular Network (TIN) e a grade
regular.
2.1.7.2 Malha regular
A malha regular é um modelo digital que aproxima a superfície real através
de partes, que em geral, são retangulares. Os vértices dos retângulos podem ser os próprios
44
pontos amostrados por perfilagem regular ou obtidos por um processo de interpolação, caso se
tenha pontos amostrados de modo não regular
(KASSER e EGELS, 2002).
Uma das considerações importantes a respeito da grade regular é o
espaçamento a ser estabelecido entre os seus elementos. Um valor excessivamente pequeno
proporciona um aumento na fidelidade da modelagem em regiões de comportamento
irregular, mas nada oferece em regiões regulares, acarretando o aumento significativo de
tempo de processamento. Por outro lado, um valor grande, diminui o tempo de
processamento, mas perde fidelidade em regiões de comportamento irregular (WOLF e
DEWITT, 2000).
Figura 10 – Exemplo da malha regular após interpolação pelo algoritmo do vizinho mais próximo.
Em certas aplicações a malha regular apresenta vantagens, quando
comparada com a malha triangular, mas em outras a malha triangular é superior. Para atender
diversas tarefas, fica a critério do usuário a opção da escolha do método, que se dá,
geralmente, em função do tipo do trabalho a ser realizado (MITISHITA, 1997).
Um dos procedimentos mais empregados em várias aplicações de
modelagem é a obtenção da malha regular a partir da malha triangular. Isto ocorre devido às
dificuldades de amostragem de uma malha regular. De qualquer forma, tanto nas malhas
regulares quanto nas irregulares, se for necessário realizar uma densificação dos pontos
ocorrerá uma interpolação entre os pontos preexistentes.
45
2.1.7.3 Métodos de interpolação
A modelagem de uma superfície não consiste somente na construção de um
modelo digital poliédrico. O sistema deverá possuir algoritmos de interpolação de valores de
"alturas", em posições não correspondentes aos pontos amostrados. Os algoritmos devem
conter certas condições de contorno, baseadas no princípio de que o comportamento de uma
superfície contínua possa ser obtida do comportamento conhecido de posições próximas
(PETTINATI
4
apud MITISHITA, 1997). Os processos de interpolação empregados são,
geralmente, os locais, quando se considera uma vizinhança limitada, ou globais, quando a
vizinhança sendo considerada é ilimitada.
A escolha da função de interpolação é decisiva para se obter uma boa
precisão do modelo. Os requisitos desejáveis para uma função interpoladora são que esta
reproduza uma superfície contínua, o tempo computacional não seja proibitivo e tenha
propriedades matemáticas de interesse para a aplicação.
Morgan e Habib (2002) discutem os problemas inerentes às técnicas de
interpolação que geralmente fazem a predição de pontos através da análise de vizinhança e
ajustam esses pontos ao modelo. A função de interpolação, segundo os autores, não deverá ser
contínua devido à existência de descontinuidades na superfície. Erros estão sempre presentes
nos dados. No entanto, deveriam usar mais dados do que o modelo requer e tentar filtrar os
erros grosseiros.
Dentre os métodos de interpolação, pode-se citar os métodos baseados em
vizinhança global e local. O método baseado em vizinhança global é facilmente
compreendido, pois o interpolante é dependente de todos os pontos amostrados na superfície.
A inclusão, retirada ou alteração das coordenadas de qualquer ponto propaga-se por toda a
região de interesse. A influência de cada ponto no algoritmo é ponderada pela distância que o
mesmo se encontra do ponto a ser interpolado (MITISHITA, 1997). Dentre as principais
funções de interpolação conhecidas, tem-se as funções que interpolam a partir de superfícies
matemáticas e as funções que interpolam a partir de pontos discretos. Já os métodos locais
trabalham com um número de pontos que definem uma pequena área de ação do algoritmo de
4
PETTINATI, F. Modelamento Digital e Representação Gráfica de Superfícies. 1983. Dissertação
(Mestrado em Engenharia) - Escola Politécnica da Universidade de São Paulo - U.S.P, São Paulo.
46
interpolação. Qualquer alteração nos pontos modifica somente a vizinhança desta área. A
dificuldade neste método está em definir adequadamente os limites desta vizinhança.
Um dos algoritmos mais empregados para a interpolação nos procedimentos
locais é o que utiliza técnicas de elementos finitos. Conhecido como método de interpolação
de Akima (MITISHITA, 1997), consiste em aproximar as células de um modelo digital
triangular por um polinômio bivariado de quinto grau.
Na literatura relacionada existe uma variedade de métodos de interpolação
que podem ser utilizados para a densificação do MDT. Entre eles se destacam as
splines,
elementos finitos, mínimos quadrados, krigagem e vizinho mais próximo (EL-SHEIMY,
1999). Dentre esses, o mais comum é a interpolação pelo vizinho mais próximo. Este método
é relativamente simples, exigindo menor tempo computacional. No entanto, quando se utiliza
o método de interpolação do vizinho mais próximo em edificações que apresentam telhados
com duas águas, o resultado final apresenta um efeito de serrilhamento nas bordas.
2.2 Grafos
Várias situações do mundo real podem ser descritas através de diagramas
que consistem de uma representação gráfica por meio de figuras geométricas (pontos, linhas,
áreas etc.). Por exemplo, pontos podem representar cidades, com linhas unindo cidades
vizinhas; ou objetos em uma cena urbana, com linhas representando objetos adjacentes. Nesse
diagrama a forma como os pontos estão unidos é irrelevante o que importa são as relações.
Uma abstração matemática de situações desse tipo leva ao conceito de grafo.
No intuito de explorar os conceitos básicos da teoria de grafos, esta seção
apresenta alguns conceitos teóricos necessários para a compreensão de grafos e ainda a noção
geral de clique. Ressalta-se que posteriormente a teoria de grafos será utilizada no
desenvolvimento da metodologia proposta.
47
2.2.1 Noções básicas
Um grafo
()
E,VG = é definido pelo par V e E , onde V é um conjunto
finito não-vazio de elementos chamados vértices e
E é um conjunto finito de pares não
ordenados. Cada elemento de
E terá a forma {x
i
,x
j
} onde x
i
e
x
j
são dois elementos distintos
de
V, denominado arestas (BOAVENTURA NETTO, 1979). Grafos são assim denominados
porque eles podem ser representados graficamente, e sua representação gráfica auxilia no
entendimento de suas propriedades. Cada vértice é indicado por um ponto, e cada aresta por
uma linha que une pares de pontos. Em um grafo simples, dois vértices são vizinhos ou
adjacentes se há uma aresta em
.G O número de vértices V de um grafo G determina a
ordem desse grafo. Seja, por exemplo, o grafo
(
)
E,VG
=
, ilustrado na Figura 11, dado por:
1234
{, , , }Vxxxx= e
12 31 32 24
{(,),(,),(,),(,)}E xxxxxxxx= . Este é um exemplo de grafo de
quarta ordem.
x
4
x
2
x
3
x
1
Figura
11 – Grafo
(
)
E,VG
=
.
Em um caso mais geral, pode haver mais de uma relação envolvendo os
mesmos elementos de
V , caso em que E é uma família
5
; pode-se ter, ainda, apenas uma
relação envolvendo um dado subconjunto
V , caso em que E é um conjunto.
5
Usa-se a palavra família, neste caso, para designar uma coleção de relações, alguns dos quais podem ocorrer
várias vezes; por exemplo,
{,,}abc é um conjunto, mas {, ,,,,}aaabcc é uma família.
48
2.2.2 Grafo não orientado
Seja
U uma família de partes de V a dois elementos, o par
(
)
U,VG = é
denominado p-grafo não orientado, sendo p o maior número de vezes que uma aresta pode ser
repetida (BOAVENTURA NETTO, 1979).
Em um grafo não orientado, as arestas são representadas por linhas unindo
os pares de vértices que as definem. Por exemplo, se 1
p
=
, U é um conjunto de partes de V
a dois elementos e trata-se de um 1-grafo ou simplesmente grafo (não orientado).
As arestas, neste caso, são denotadas como
(, )
ij
x
x e convém salientar que,
cada aresta corresponde a uma parte de
V , não pode haver aresta de forma ( , )
ii
x
x ; uma
aresta deste tipo só poderia existir em uma definição mais geral.
Um grafo não orientado do tipo 1-grafo é ilustrado na Figura 12.
x
4
x
2
x
3
x
1
Figura 12 – 1-grafo não orientado (Fonte: Adaptado de BOAVENTURA NETTO, 1979).
No grafo da Figura 12, pode-se verificar que as ligações entre pares de
vértices não possuem orientação.
2.2.3 Grafo orientado ou dígrafo
Seja
U uma família de partes de V. O par
(
)
U,VG
=
é denominado p-grafo
orientado, onde p representa o maior número de vezes que uma aresta pode ser repetida. Os
49
elementos de
U são chamados arcos
6
e sua notação é a mesma dos pares ordenados, ou seja
(, )
ij
x
x (BOAVENTURA NETTO, 1979). Cada arco é representado por uma seta cujo sentido
corresponde à orientação do par ordenado.
Figura 13 – 1-grafo orientado (Fonte: Adaptado de BOAVENTURA NETTO, 1979).
Se 1
p
= , U será um conjunto de elementos de V e G será um 1-grafo ou
simplesmente grafo (orientado). Em um grafo orientado, um arco de forma ( , )
ii
x
x é
admissível e se chama laço. Não é possível, no entanto, definir um sentido deste arco e,
portanto, um mesmo vértice não pode possuir dois laços de sentidos opostos.
2.2.4 Grafo completo
Um grafo
(
)
U,VG =
é completo se,
,:(,) (,),
ij ij ji
x
xVxx U xx U
∈∉
ou seja, entre dois vértices quaisquer, no caso do grafo orientado, haverá ao menos um arco
(Figura 14 (b)) e no caso do grafo não orientado (Figura 14 (a)) , : ( , ) ,
ij ji
x
xVxx U
∈∈
haverá uma aresta entre cada par de vértices
i
x
e
j
x
.
6
Cada arco está associado a um par ordenado de vértices, sendo o primeiro a extremidade inicial do arco e o
outro a sua extremidade final.
x
1
x
4 x
3
x
2
50
x
1
x
2
x
1
x
2
(a) (b)
Figura 14 – (a) Grafo completo não orientado, (b) grafo completo orientado.
Os grafos da Figura 14 (a) e (b) são exemplos de grafos de grau
7
3.
2.2.5 Subgrafo e o conceito de clique
Um grafo
(
)
'U,'V'G = é um subgrafo do grafo
()
U,VG = se 'VV e
'
UU . Segundo Boaventura Netto (1979) os subgrafos completos não orientados são
chamados cliques. Só existe uma clique para cada ordem n e por isso ela será designada por k
n
(Figura 15).
k
4
k
3
k
5
Figura 15 – Exemplos de cliques.
7
Define-se grau de um vértice vV , denotado por grau ()v , como sendo o número de vértices adjacentes a
.v
X
3
X
4
X
3
X
4
51
2.3 Segmentação
Segundo Ballard e Brown (1982) a idéia de segmentação tem suas origens
nos psicólogos do grupo Gestalt, que estudavam as preferências exibidas por seres humanos
no agrupamento ou organização de um conjunto de formas dispostas no campo visual. Ainda
segundo estes autores, a segmentação de imagens é o termo usado em visão computacional
para o agrupamento de partes de uma imagem genérica em unidades que são homogêneas
com respeito a uma ou várias características (ou atributos), que resulta em uma imagem
segmentada.
Existem duas maneiras básicas de realizar a segmentação de uma imagem.
A análise realizada a partir da detecção de descontinuidades significantes nos níveis de cinza
da imagem e no particionamento de uma imagem (divisão em regiões) em seus objetos
constituintes. Neste caso, o nível de subdivisão é realizado de acordo com o problema a ser
resolvido e o critério de término segue o princípio do isolamento dos objetos de interesse.
Os algoritmos de segmentação de imagens são baseados geralmente nas
propriedades de descontinuidade e similaridade. Na primeira categoria, a abordagem consiste
em particionar a imagem baseada em mudanças bruscas nos valores de níveis de cinza. As
principais feições de interesse nessa categoria são os pontos isolados, as linhas e as bordas. As
principais abordagens da segunda categoria baseiam-se em limiarização, crescimento de
regiões e divisão e fusão de regiões (GONZALEZ e WOODS, 2000).
A segmentação orientada a regiões é utilizada para separar os objetos de
interesse. Neste caso a imagem é particionada em diferentes regiões, onde cada região
compartilha propriedades especificas. Além disso, cada região é composta por um conjunto de
pixels conectados. Assim, a partir do particionamento da imagem em regiões, podem ser
realizadas medidas sobre cada região e as relações entre as regiões adjacentes podem ser
estabelecidas.
A segmentação de imagens no âmbito de classificação de objetos é um
passo preliminar e essencial que pode auxiliar diretamente na construção das regiões que
posteriormente serão interpretadas usando, por exemplo, a abordagem Bayesiana. Nesta seção
é dada ênfase à segmentação orientada a regiões, cujo objetivo é particionar a imagem em
regiões. Na etapa de segmentação os dados de entrada podem ser imagens em níveis de cinza,
dados de MDE obtidos por varredura a laser ou ainda é possível a utilização de uma imagem
gerada a partir da intensidade do pulso, característica inerente a determinados equipamentos
52
de varredura a laser. Para realizar a separação do objeto de interesse pode-se fazer uso da
característica de reflexão de certos objetos e ainda da característica de altura.
2.3.1 Divisão e fusão de regiões
A segmentação por crescimento de regiões faz a agregação de pixels a partir
de um conjunto de sementes. Uma alternativa, a essa abordagem, é subdividir a imagem em
um conjunto de regiões arbitrárias e disjuntas, e então realizar a divisão e/ou a fusão das
regiões na tentativa de satisfazer as seguintes condições. Segundo Gonzalez e Woods (2000) a
segmentação de uma região
R
pode ser vista como um processo de particionamento de
R
em
n regiões
12
, ,...,
n
R
RR tal que,
1)
1
,
n
i
i
R
R
=
=
U
isto é a segmentação deve ser completa;
2)
i
R
é uma região conexa, 1,2,..., ;in=
3)
ij
RR∩= para todo e , ,ijij
significando que as regiões devem ser disjuntas;
4)
()
i
RP VERDADEIRO para 1,2,..., ,in
=
se todos os pixels em
i
R
possuírem a mesma
propriedade P e
5)
(
)
ji
RRP FALSO para ,ij se as regiões
i
R
e
j
R
são diferentes no sentido da
propriedade P .
A propriedade P é utilizada como um atributo sobre os pontos do conjunto
i
R
. A inclusão de um pixel ou, em se tratando de um MDE, de uma altura ou intensidade
pontual do alvo, depende da propriedade P , a qual pode ser construída de acordo com algum
conhecimento a priori sobre o objeto de interesse.
Um exemplo de algoritmo iterativo de divisão e fusão é apresentado em
Gonzalez e Woods (2000). Neste exemplo, considera-se
R
a imagem completa e P uma
propriedade. No caso de uma imagem quadrada, uma abordagem para a segmentação de
R
é
subdividi-la sucessivamente em quadrantes cada vez menores de maneira que, para qualquer
região
i
R
,
()
i
RP VERDADEIRO. Ou seja, se
(
)
i
RP FALSO, então divide-se esta região em
quadrantes. Se P for falso para qualquer quadrante, subdivide-se em subquadrantes, e assim
53
sucessivamente. Essa técnica, em particular, possui uma representação conveniente
denominada quadtree (uma árvore em que cada nó possui exatamente quatro descendentes).
Nesta discussão, se apenas a divisão (subdivisão) fosse usada, a partição
final provavelmente conteria regiões adjacentes com propriedades idênticas. No entanto, esse
problema pode ser contornado realizando a fusão da mesma maneira que a divisão. A fusão
deve ser realizada em regiões adjacentes cujos pixels combinados satisfaçam a propriedade
P ; ou seja, duas regiões adjacentes
j
R
e
k
R
são fundidas apenas se
(
)
kj
RRP
VERDADEIRO. Essa abordagem pode ser sumariada através dos seguintes passos:
1) Divide-se em quatro quadrantes distintos qualquer região
i
R
em que ( )
i
PR = FALSO;
2) Funde-se quaisquer regiões adjacentes
j
R
e
k
R
tais que ( )
jk
PR R∪= VERDADEIRO e
3) A parada ocorre quando nenhuma divisão e nenhuma fusão for mais possível.
Segundo Gonzalez e Woods (2000), diferentes variações dessa abordagem
básica são possíveis. Uma possibilidade é dividir inicialmente a imagem em blocos quadrados
ou retangulares. Divisões adicionais são realizadas como descrito anteriormente, mas as
fusões são inicialmente limitadas a grupos de quatro blocos que sejam descendentes na
representação quadtree e que satisfaçam a propriedade P . Quando as fusões deste tipo não
forem mais possíveis, o procedimento é terminado por uma fusão final das regiões que
satisfaçam o passo 2. Nesse ponto as regiões fundidas podem ser de diferentes tamanhos. A
principal vantagem desta abordagem está em usar a mesma quadtree para a divisão e para a
fusão até a fusão final. A Figura 16 apresenta um exemplo ilustrativo desta técnica, sendo que
mais detalhes podem ser encontrados em Jain, Kasturi e Schunck (1995).
54
1
2
3
4
1
2
3
4
(a)
(b)
(c)
(d)
Figura 16 – Divisão recursiva usando a estrutura quadtree. (a) Imagem original. (b) Imagem dividida
em quatro sub-regiões e o quadtree correspondente. (c) Subdivisão das regiões 1 e 4 em quatro sub-
regiões respectivamente e o quadtree correspondente. (d) Subdivisão da sub-região 2 (pertencente à
região 1) em quatro sub-regiões e o quadtree correspondente (Fonte: Adaptado de
JAIN, KASTURI,
e SCHUNCK
, 1995).
Entretanto, existem algumas limitações no emprego desta técnica. Uma
delas é que, uma vez que a segmentação é feita a partir da produção de divisões quadradas da
imagem original, a segmentação final tende a ter regiões com formas quadradas. Outro
aspecto é que as regiões produzidas são dependentes do ponto de partida e regiões
homogêneas podem ser segmentadas dependendo da sua posição espacial com respeito a
matriz quadrada definida. Finalmente, esta abordagem tende a perder pequenas regiões dentro
de grandes áreas uniformes.
2.3.2 Detecção de bordas
A detecção de bordas consiste no agregamento de pixels que compõem os
contornos das regiões. Existe uma gama variada de métodos que delineiam os contornos dos
55
objetos. Um método bastante utilizado para esse fim é a detecção de bordas seguida pela
obtenção de cadeias ordenadas de pixels que representam as regiões.
A detecção de bordas é um processo no qual se obtém características de
interesse de um objeto na imagem. Estas propriedades incluem descontinuidades de
características fotométricas, geométricas e físicas dos objetos. Este processo geralmente
baseia-se na aplicação de operações de detecção de variações de brilho na imagem, ou seja, o
gradiente local (ZIOU e TABBONE, 1998).
Em sua maioria, os processos de detecção de bordas baseiam-se no fato da
ocorrência de uma mudança abrupta do nível de cinza em torno do pixel em estudo ou em
uma descontinuidade próxima ao mesmo. Para detectar estas descontinuidades pode-se usar
métodos de diferenciação de primeira ordem, que enfatizam pontos de mudança na função e
que apresentam resposta nula onde não há variações. Uma mudança na intensidade pode ser
detectada diferenciando pixels vizinhos. Alguns operadores utilizados para detecção de bordas
são: Roberts, Sobel e Prewitt. Várias máscaras de convolução podem ser construídas para se
obter uma aproximação da primeira derivada nestes operadores. Esta operação é denominada
diferenciação da imagem.
Assim, pode-se dizer que os esquemas mais comuns para detectar bordas
incluem três operações básicas, que são a diferenciação, a suavização e a rotulação (ZIOU e
TABBONE, 1998). A diferenciação consiste no cálculo da derivada de cada ponto da
imagem. A suavização consiste na redução do nível de ruído da imagem e na regularização da
diferenciação numérica. A última operação é a rotulação da borda na imagem que, envolve a
supressão de bordas falsas, que são resultados do uso de certos modelos de borda que não
representam corretamente a realidade.
É importante ressaltar que a ordem de execução dos procedimentos de
diferenciação e suavização depende da linearidade do operador de diferenciação. Quando se
utiliza operadores lineares, a ordem destas operações são irrelevantes, pois estes são
comutativos e associativos para a convolução. Entretanto, quando se emprega operadores não
lineares, estes não são nem associativos nem comutativos para a convolução, o que implica na
realização da operação de suavização antes da diferenciação.
Até recentemente, os primeiros detectores propostos eram baseados nos
operadores de gradiente e laplaciano. Esses detectores são limitados às operações de
diferenciação. Entretanto, esses detectores podem ser melhorados com a introdução da
operação de suavização da imagem (ZIOU e TABBONE, 1998).
56
O processo de detecção de bordas desenvolvido por Canny (1986) baseia-se
em dois critérios básicos de desempenho, isto é, os critérios de detecção e localização. Estes
critérios estão sujeitos ainda a um terceiro, conhecido como injunção de resposta múltipla,
que força o processo a detectar uma única borda onde existe somente uma borda verdadeira.
O objetivo principal do trabalho de Canny é o desenvolvimento de um detector ótimo para o
tipo de borda mais comum em imagens digitais, ou seja, o tipo degrau. Este tipo de borda
resulta de vários fenômenos e ocorre geralmente entre duas regiões homogêneas, que diferem
entre os níveis de cinza (VALE e DAL POZ, 2002).
Uma das principais constatações de Canny é que o operador ótimo
encontrado é muito semelhante à função gaussiana. Canny também propôs um processo de
afinamento de bordas conhecido como supressão não máxima a fim de obter bordas com
espessura de um pixel, e outro processo conhecido como histerese, cuja função é eliminar a
fragmentação de bordas causada pelo ruído da imagem, melhorando a conectividade da borda.
Canny (1986) definiu um conjunto de objetivos para um detector de bordas
e descreveu uma metodologia de otimização para alcançá-los. Canny (1986) especificou os
três critérios que devem ser atendidos para se obter um filtro ótimo:
- Taxa de Erro ou Detecção (SNR): o detector de bordas deverá responder somente às bordas
verdadeiras. Tal critério consiste na maximização da razão sinal/ruído (SNR), pois quanto
maior for o SNR maior será a probabilidade de se detectar uma borda física na imagem.
- Localização (L): a distância entre os pontos de borda encontrados pelo detector e a borda
real deverá ser a menor possível. Tal critério é definido como sendo o inverso da distância
entre um ponto detectado e a respectiva posição verdadeira. Logo quanto maior for L, mais
próximos das posições verdadeiras estarão os pontos detectados pelo filtro.
- Resposta múltipla: o detector de bordas não deverá identificar múltiplos pixels de bordas
onde somente existe uma borda, ou seja, deve haver um único pixel de borda onde existe uma
única borda verdadeira.
Segundo Vale e Dal Poz (2002), a proposta de Canny era encontrar o filtro f
que maximizasse o produto SNR x Localização sujeito a limitação de resposta múltiplas,
entretanto o resultado era muito complexo para ser resolvido analiticamente. Assim o filtro
ótimo pode ser aproximado pela primeira derivada da função gaussiana. Estudos
desenvolvidos por Vale e Dal Poz (2002) demonstram que as respostas de impulsos de ambos
os filtros são bastante semelhantes, o que intuitivamente sugere um desempenho similar e
satisfatório. Vale e Dal Poz (2002a) também apresentaram uma descrição detalhada do
algoritmo de Canny, que pode ser brevemente sumariado segundo os seguintes passos:
57
1) Ler a imagem I a ser processada;
2) Criar uma máscara Gaussiana bidimensional G para convoluir com I, dando origem a I
s
. O
desvio-padrão desta Gaussiana é um parâmetro do detector de bordas;
3) Criar duas máscaras unidimensionais para a diferenciação da imagem suavizada, nas
direções x (linha) e y (coluna), denominando-as de G
x
e G
y
;
4) Convoluir a imagem I
s
com G
x
ao longo das linhas, gerando a imagem I
x
e, analogamente,
ao longo das colunas para gerar I
y
;
5) A magnitude é calculada em cada pixel (x,y) na forma que segue:
22
xy
M(x,y) = I (x,y) +I (x,y)
(6)
Para completar o algoritmo desenvolvido por Canny, pode-se acrescentar ainda dois
passos fundamentais:
6) Supressão não Máxima, que é o anulamento dos pixels cujos valores não sejam máximos
locais na direção perpendicular à borda, sendo que este processo produz um afinamento
das bordas, atendendo assim o terceiro critério de desempenho de Canny.
7) Limiarização adaptativa (histerese), consiste em uma limiarização baseada em dois
limiares
12
e
τ
τ
, onde
1212
2 ou 3
τ
ττ τ
≅≅. Aplicando a limiarização duas vezes, uma
para
1
τ
e outra para
2
τ
, o algoritmo efetua um processo de complementação das
descontinuidades da primeira limiarização aproveitando o resultado da segunda.
O resultado do processo de detecção de bordas de Canny é uma imagem
binária com bordas afinadas (com espessura de 1 pixel), onde os pixels de borda recebem
valor 0 (zero) e o fundo o valor 1 (um).
2.4 Vetorização e poligonização de contornos
O resultado de um processo completo de detecção de bordas, como o de
Canny, é um mapa ou imagem de borda afinada. Como os processos de análise de imagem
geralmente têm por objetivo explicitar os contornos dos objetos, que, aliás, é o objetivo da
58
metodologia proposta neste trabalho, é necessário construir representações eficientes para as
bordas detectadas. Isto pode ser feito através de técnicas de vetorização e poligonização do
mapa de bordas.
2.4.1 Vetorização de mapas de bordas detectadas
O processo de vetorização de mapa de bordas detectadas consiste em formar
uma lista ordenada de pixels de borda, a partir de uma lista não ordenada de pixels
proveniente de algum processo de detecção e afinamento de bordas (JAIN, KASTURI, e
SCHUNCK, 1995). Outro processo existente para realizar tal atividade é conhecido como
delineador de bordas. Entretanto este processo apresenta aspectos fundamentais diferentes,
pois sua operação se dá sobre a imagem original. Mesmo assim este processo apresenta
resultados semelhantes. Além disso, a detecção de cadeias de pixels baseia-se em informações
locais, enquanto que o delineador de borda pode usar informações globais (JAIN, KASTURI,
e SCHUNCK, 1995).
O processo de detecção de borda de Canny pode ser considerado completo,
visto que este processo gera uma imagem binária com bordas afinadas. Embora os pixels da
imagem de borda se conectem para formar cadeias lineares de pixels, a ligação entre os pixels
adjacentes nestas cadeias lineares não é conhecida. A ligação entre os pixels de uma mesma
cadeia deve ser realizada por um processo de vetorização. Assim, as listas estruturadas e
ordenadas de pixels presentes no mapa de bordas são substituídas na imagem por
representações matemáticas adequadas aos processos posteriores de reconhecimento e
delineamento de feições cartográficas.
Segundo Dal Poz (2002) a vetorização consiste em varrer todos os pixels da
imagem de borda. Quando um determinado pixel de borda for detectado, uma busca é iniciada
para encontrar toda a seqüência de pixels da borda detectada. Como geralmente o pixel de
borda encontrado inicialmente localiza-se no meio da borda, isto é, não no início ou fim da
lista, a busca é realizada em um sentido e depois no outro e, após isto, as duas listas são
conectadas. A busca pelos pixels adjacentes de borda é realizada seqüencialmente através de
pequenos segmentos de três pixels. Quando a conexão de todos os pixels de uma borda for
finalizada, a varredura ao longo das linhas é retomada a partir do primeiro pixel detectado da
borda ordenada, garantindo que todos os pixels da imagem sejam conectados para formarem
59
bordas ou eliminados no caso de estarem isolados ou pertencerem à bordas muito pequenas
(por exemplo, bordas isoladas com dois ou três pixels).
2.4.2 Representações para contorno
Posteriormente à obtenção das cadeias de pixels, ou seja, para a obtenção de
listas de pixels de bordas que representam os limites de regiões presentes em uma imagem, é
necessário utilizar a representação mais eficiente dos limites destas regiões. As formas
utilizadas para a representação destes limites são denominadas de contornos. Um contorno é
considerado fechado quando representa uma região e aberto quando representa apenas parte
de uma região.
As formas de representação utilizadas no estabelecimento dos contornos
baseiam-se em listas ordenadas de pixels de borda e em funções descrevendo os pixels de
borda. Para a primeira forma de representação pode-se considerar como exemplo a cadeia de
pixels, que pode ser gerada pela técnica referida na seção 2.4.1. Já um exemplo para a
segunda forma de representação é a que emprega splines.
Segundo Jain, Kasturi e Schunck (1995), existem três critérios básicos para
o estabelecimento de um bom contorno:
- Eficiência: o contorno deve ser uma representação simples e compacta;
- Acurácia: o contorno deve representar com acurácia as feições presentes na imagem; e
- Efetividade: o contorno deve adequar-se para os estágios subseqüentes de análise de imagem
associados com a aplicação em questão.
A acurácia do contorno é determinada pela curva utilizada na modelagem e
pela acurácia dos pontos de borda previamente determinados pelo algoritmo de detecção
utilizado. A forma de contorno mais simples é a cadeia de pixels que é tão acurada quanto os
pontos de borda que representa. Entretanto, apresenta a desvantagem de ser pouco compacta e
pode não ser efetiva para as etapas subseqüentes do processo de análise de imagem. O
contorno obtido usando uma curva adequada permite a obtenção de qualidade compatível com
a acurácia dos pontos de borda usados na modelagem, além de aumentar a eficiência e
eficácia por ser uma representação mais apropriada e compacta para as etapas posteriores.
60
Dada sua eficiência e simplicidade, a poligonização é uma técnica
comumente utilizada para a obtenção de representação do contorno. O resultado é um
polígono (para contorno de telhado) ou uma linha poligonal (para contornos abertos).
2.5 Abordagem bayesiana aplicada à análise de imagens
A análise de imagem através de Inferência Bayesiana tem sido
tradicionalmente realizada usando imagens digitais, que consistem de uma malha regular de
pixels (HURN, HUSBY e RUE, 2003; ANDERSEN, REUTEBUCH e SCHREUDER, 2002).
Em geral, o objetivo é reconstruir uma imagem corrompida por ruídos.
Mais recentemente, pesquisas em análise de imagem têm sido estendidas
para tratar do problema de reconhecimento de objeto (VAN LIESHOUT
8
apud ANDERSEN,
REUTEBUCH e SCHREUDER, 2002). O objetivo desse tipo de análise é o de localizar e de
caracterizar vários objetos de interesse no espaço envolvido, como, por exemplo, o espaço
bidimensional de uma imagem digital ou o espaço tridimensional de um MDE. Cabe ainda
ressaltar que o conceito de imagem (y) tem um significado generalizado. Isto é, pode ser uma
imagem convencional bidimensional obtida por um sensor, passivo ou ativo, como uma
câmera aérea digital, o sensor HRV-SPOT, o RADAR etc.; ou uma representação
tridimensional, a exemplo do espaço tridimensional de varredura a laser. Apesar da
considerável quantidade de trabalhos na área de análise de imagem apresentados na literatura,
esforços ainda estão sendo realizados para alcançar a completa automação nos variados
processos. A análise automática da cena requer a construção de pelo menos uma descrição
parcial do ambiente original.
Para uma análise de alto nível é necessária uma descrição simbólica dos
objetos presentes na imagem. Esta descrição inclui desde a caracterização individual dos
objetos presentes na imagem, até a caracterização contextual dos mesmos. A análise de
8
VAN LIESHOUT, M. Stochastic geometry models in image analysis and spatial statistics. CWI, Amsterdam, The
Netherlands, 1995.
61
imagem, envolve a segmentação em um passo preliminar e, posteriormente, quando é
orientada à regiões, a análise dessas regiões é realizada a fim de atribuir significado a elas.
Dependendo da abordagem, é suficiente utilizar operações de análise de
baixo nível (contraste, realce, segmentação etc.), enquanto em outras abordagens, é necessário
utilizar também tarefas de análise de alto nível, como o entendimento da cena através de uma
descrição semântica apropriada. Um típico esquema de análise de imagem é mostrado na
Figura 17.
A Figura 17(a) consiste de dois blocos, um bloco de visão de baixo nível
(segmentação), o qual segmenta a imagem de entrada bidimensional e calcula vários atributos
para cada região. Esses atributos podem basear-se no nível de cinza da região (por exemplo, a
média dos níveis de cinza, a textura etc.). O próximo bloco (análise) é o que fornece a
descrição semântica, isto é, a análise para cada região da imagem. Este bloco tem como
entrada, o conhecimento específico dos objetos de interesse e vários atributos obtidos no
bloco de segmentação. Mais recentemente, a tendência é considerar o problema de análise de
imagem como o esquema ilustrado na Figura 17(b), onde, além dos blocos de segmentação e
análise, tem-se também o bloco de aquisição de conhecimento, o qual atualiza o
conhecimento específico, previamente adquirido, sobre os objetos de interesse.
(a) Esquema de dois blocos
(b) Esquema de três blocos
Figura 17 – Esquema básico de análise de imagens (Fonte: Adaptado de KOPPARAPU e DESAI,
2001).
Obtenção do
conhecimento
Dados
Dados
Segmentação Análise
Conhecimento
Imagem
Segmentação Análise
Conhecimento
Imagem
62
A Inferência Bayesiana aplicada a análise de imagem possibilita a
introdução do conhecimento a priori no processo. Este conhecimento é representado na forma
de distribuição ou modelo prévio do fenômeno em estudo na imagem. A distribuição a priori é
atualizada a partir de observações representadas na função de verossimilhança, resultando na
distribuição a posteriori. Os fundamentos básicos sobre Inferência Bayesiana são descritos na
seção 2.5.1 (MIGON e GAMERMAN, 1999).
2.5.1 Abordagem Bayesiana
A Inferência Bayesiana consiste na atualização do conhecimento a priori,
sobre o fenômeno em estudo, através do teorema de Bayes. Para enunciar o teorema de Bayes,
que fornece uma regra de atualização de probabilidades, deve-se supor uma quantidade de
interesse desconhecida θ, com valores possíveis em um conjunto Θ, onde θ pode ser um
vetor, um escalar ou uma matriz, e a informação inicial H (história) sobre esta quantidade.
Esta informação pode ser incluída na análise através da distribuição de probabilidade
condicional
9
, com densidade ou função de probabilidade )|( Hp
θ
.
Se H for informativo o suficiente a descrição a respeito de θ está completa.
No entanto, se H não for informativo o bastante, torna-se necessário buscar mais informações.
Essas informações podem ser obtidas através da observação de uma quantidade aleatória X
que esteja relacionada a θ.
Antes de observar X tem-se a distribuição amostral de X dada por
),|( HXp
θ
. Após observar X, a quantidade de informação sobre θ aumenta e a informação
sobre θ está sumariada em ),|( Hxp
θ
.
9
Considere os eventos A e B associados a um experimento. Segundo DeGroot e Schervish (2002) a
probabilidade do evento
A condicionado à ocorrência do evento
B
é denotada por Pr( | )AB. Por
conveniência essa notação é dita simplesmente probabilidade condicional de
A dado
B
. A probabilidade
condicional
Pr( | )AB é definida como a proporção dada pela probabilidade Pr( )AB sobre a probabilidade
total
Pr( )
B
. Essas considerações conduzem a seguinte definição: Se A e
B
são dois eventos quaisquer
associados a um experimento, com
Pr( ) 0B >
, então
Pr( )
Pr( | )
Pr( )
A
B
AB
B
=
.
63
Utilizando o teorema do produto e conhecendo-se as probabilidades
condicionais, denotando-se por ),|( Hxp
θ
e )|( Hp
θ
as densidades de ),|( HX
θ
e
)|( H
θ
respectivamente, tem-se
)|(
)|(),|(
)|(
)|,(
),|(
Hxp
HpHxp
Hxp
Hxp
Hxp
θ
θ
θ
θ
== , (7)
onde
(| ) (, | ) (|, )(| )pxH px Hd px Hp Hd
θ
θ
θθθθ
Θ
==
∫∫
.
A função )|( Hxp no denominador da Equação (7) não depende de θ,
representando apenas uma constante na determinação da quantidade de interesse ),|( Hxp
θ
.
Por esta razão e pela dependência em
H
ser comum a todos os termos, por facilidade
notacional, tem-se a forma usual para o teorema de Bayes
(|) (|)(),pxpxp
θ
θθ
(8)
onde:
)(
θ
p
representa a distribuição a priori do parâmetro desconhecido
θ
, representando a
informação disponível antes da obtenção dos dados;
)|(
θ
xp
representa a distribuição dos dados;
o símbolo
denota proporcionalidade;
)|( xp
θ
representa a distribuição a posteriori de
θ
, representando a informação
sobre
θ
, após a obtenção de
x
.
Cabe ressaltar que a forma simplificada do teorema de Bayes será útil em
problemas particulares que envolvam a obtenção de distribuições a posteriori para os
parâmetros, pois neste caso o denominador é apenas uma constante normalizadora. Em outras
situações este termo desempenha um papel fundamental e precisa ser recuperado. Para isto,
basta reescrever a Equação (8) como
).()|()|(
θ
θ
θ
pxpkxp
=
(9)
64
A constante k é determinada de forma que
()
(
)
(
)
[
]
Θ
Ε== ,|xpdp|xpk
θθθθ
θ
1
caso contínuo
ou
()
(
)
(
)
[
]
,|xpp|xpk
θθθ
θ
Ε==
Θ
1
caso discreto (10)
A função
()
xp recebe o nome de distribuição preditiva (ou marginal) de X,
pois é a distribuição que se espera que X tenha, sendo de certa forma uma predição. Assim,
antes de se observar X ela é útil para checar a adequação a priori do modelo, através das
predições que ela fornece. Após se observar X, a distribuição preditiva serve para testar o
modelo como um todo, pois se o valor de X observado recebia pouca probabilidade preditiva
então as previsões que o modelo faz não são boas e ele deve ser questionado.
Depois da obtenção dos dados,
(
)
θ
|p x pode ser vista como uma função de
θ para dados valores de X
1
, ...,X
n
. Esta função é denominada função de verossimilhança, e é
denotada por
(
)
()( )
θθθ
|p;l
R:.;l
xx
x
Θ
+
(11)
Seja X
1
,...,X
n
uma amostra aleatória
10
de uma família de distribuição
(
p
x| )
θ
, Θ
θ
. A função densidade de probabilidade conjunta é dada por
(p x
=
==
n
i
in
xpxpxpxp
1
21
)|()|()...|()|()|
θθθθθ
. (12)
Fixado o ponto amostral (
n
xx ,...,
1
) a função
|(
θ
l
x) , considerada como
função de
θ
, é denominada função de verossimilhança da amostra, e será dada por
10
As variáveis aleatórias
1
,...,
n
X
X representam uma amostra aleatória de uma variável aleatória
X
se as
i
X
's são identicamente distribuídas e independentes duas a duas.
65
|(
θ
l
x)=
=
n
i
i
xp
1
)|(
θ
. (13)
A verossimilhança é interpretada como função do vetor de parâmetros, para
um conjunto de dados fixo, e serve para medir o quanto aqueles dados suportam uma hipótese
sobre
θ
.
Ao fixar um valor de
x
e variar os valores de
θ
, observa-se a plausibilidade
de cada um dos valores de
θ
. Uma vez definida a função de verossimilhança, a Equação (8)
pode ser reescrita como
(|
p
θ
x) ( |l
θ
x) ( )
p
θ
ou
(x| )p( ) ( ;x)p( )
(|x)= .
(x)
( ; x)p( )d
pl
p
p
l
θ
θθθ
θ
θ
θθ
=
(14)
A função de verossimilhança tem um papel extremamente importante na
atualização do conhecimento a priori sobre
θ
, pois a distribuição a posteriori é obtida
combinando a priori e a verossimilhança. Note que:
a)
()
=
R
dx|xp 1
θ
mas, em geral,
(
)
Θ
1
θθ
dx|l ,
b) a função de verossimilhança conecta a priori à posteriori, usando para isto os dados do
experimento.
O teorema de Bayes em (8) fornece uma formulação matemática de como o
conhecimento prévio pode ser combinado com novos conhecimentos. Dessa forma o teorema
fornece uma atualização das informações a respeito do parâmetro
θ
.
Quando
()
x;l
θ
e
(
)
θ
p apresentam um núcleo comum, de modo que
(
)
θ
p e
()
x;p
θ
pertencem a mesma família de distribuições, diz-se que a família da distribuição a
priori é conjugada a família de distribuição dos dados.
Em Inferência Bayesiana quando há conjugação entre a distribuição a priori
e a verossimilhança e as variâncias são conhecidas a distribuição a posteriori é obtida
diretamente. No entanto, na prática, necessita-se trabalhar com modelos complexos que não
66
permitem uma análise conjugada direta. Mesmo que a verossimilhança e a priori sejam
bastante simples, a combinação delas pode produzir uma distribuição a posteriori
matematicamente complicada. Surge então a necessidade de se trabalhar com métodos de
integração numérica para encontrar uma aproximação para a integral no denominador da
equação 14. Em outras palavras, encontrar a constante de integração para a distribuição a
posteriori em 14.
2.5.1.1 Métodos numéricos
Como dito anteriormente, em geral se faz necessário a utilização de métodos
numéricos para resolver a integral existente no denominador da Equação 14. Esses métodos
podem ser subdivididos em métodos numéricos analíticos e baseados em amostragem. Dentre
os métodos numéricos analíticos podem ser citados os de quadratura e os envolvendo
aproximação pela normal. Esses métodos possuem a característica de fornecer aproximações
mais precisas, no entanto, à medida que aumenta a dimensão do espaço paramétrico torna-se
inviável sua aplicação.
Os métodos numéricos baseados em amostragem compreendem os métodos
de Monte Carlo simples, Monte Carlo por importância e o método Monte Carlo via Cadeia de
Markov (MCMC). Esses métodos podem ser aplicados mesmo em modelos com estrutura
complexa e, em alguns casos, são os únicos possíveis de serem aplicados.
O método de Monte Carlo Simples ou mesmo o método de Monte Carlo por
importância são utilizados para aproximar a integral no denominador da equação 14. A
amostra para
θ
é gerada da distribuição a priori, o que pode levar a valores com baixa
verossimilhança, causando instabilidade na estimativa. Por outro lado, os métodos de Monte
Carlo via Cadeias de Markov consistem na geração de amostras através de distribuições
condicionais completas, obtidas a partir da posteriori conjunta e por esta razão são preferíveis
em relação aos primeiros. Quando não se pode gerar diretamente das condicionais completas,
pode-se gerar de outra com mesmo núcleo ou formas semelhantes e aceitar os valores gerados
a partir de uma dada probabilidade. Como o processo é iterativo pode-se mostrar que as
cadeias geradas formam processos markovianos e a convergência para a distribuição de
equilíbrio pode ser verificada a partir de propriedades das Cadeias de Markov.
67
2.5.1.2 Método de Monte Carlo via Cadeia de Markov (MCMC)
Como citado anteriormente, a complexidade dos modelos implica na
utilização de métodos numéricos baseados em amostragem. Atualmente, existem muitos
problemas que exigem a utilização destes métodos baseados na sua resolução. Nessa
categoria, estão, por exemplo, os modelos dinâmicos, modelos multiníveis e modelos para
dados espaciais.
Dentre os métodos de MCMC os mais utilizados são o amostrador de Gibbs
e o algoritmo Metropolis-Hastings.
O amostrador de Gibbs é essencialmente um esquema iterativo de
amostragem de uma cadeia de Markov cujo núcleo de transição é formado pelas distribuições
condicionais completas (SOUZA, 1999).
Uma cadeia de Markov é um tipo especial de processo estocástico, que lida
com a caracterização de seqüências de variáveis aleatórias. Interesse especial é dado ao
procedimento dinâmico e ao limite do processo. Um processo estocástico pode ser definido
como uma coleção de quantidades aleatórias }:{
)(
Tt
t
θ
para algum conjunto
T
(GAMERMAN e LOPES, 2006). A cadeia de Markov é um processo estocástico onde dado o
estado presente, o estado passado e futuro são independentes.
Para mostrar o desenvolvimento do amostrador de Gibbs assume-se
inicialmente que a distribuição de interesse é
(
)
x|
θ
p , onde
x
representa os dados e
θ
o
vetor de parâmetros, ),...,(
1 k
θ
θ
θ
= . Assume-se também que as distribuições condicionais
completas estão disponíveis e são dadas por
.k,...,i),,...,,,...,,|(P
kiii
1x
111
=
+
θ
θ
θ
θ
θ
(15)
Segundo Gamerman e Lopes (2006), o amostrador de Gibbs fornece um
esquema iterativo de geração baseado em sucessivas gerações das distribuições condicionais
completas. O amostrador de Gibbs pode ser descrito da seguinte forma:
1) Inicializar o contador de iteração da cadeia, 1
=
j , e escolher valores iniciais
),...,(
)0()0(
1
)0(
k
θθθ
= ;
68
2) Obter novos valores para ),...,(
)()(
1
)( j
k
jj
θθθ
= através de sucessivas gerações de
valores
()
j
1
θ
(
)
)j(
k
)j(
,...,,|p
11
21
x
θθθ
,
()
j
2
θ
(
)
)j(
k
)j()j(
,...,,,|p
11
312
x
θθθθ
,
.
.
.
)( j
k
θ
),...,,,|(p
)j(
k
)j()j(
k
121
x
θθθθ
;
3) Mudar o contador
j
para mj ,...,2,1
=
e repetir o passo 2 até a convergência.
Quando a convergência é alcançada o valor resultante
)( j
θ
é um valor da
distribuição
()
x|p
θ
. A distribuição da cadeia gerada pelo amostrador de Gibbs, na iteração
m , converge para a distribuição de equilíbrio da cadeia.
Sob condições gerais de regularidade, quando
m →∞,
() ()
11
( ,..., ) ( ,..., )
mm
kk
p
θ
θθθ
e então
()
()
m
ii
p
θ
θ
(GEMAN e GEMAN
11
apud SOUZA,
1999). Ou seja, a distribuição da cadeia gerada pelo amostrador de Gibbs, na iteração
m ,
converge para a distribuição de equilíbrio, na norma da variação total, a uma taxa geométrica
em m. Essa propriedade é também conhecida como ergodicidade e uma conseqüência
importante deste resultado é que as médias ergódicas
()
()
=
=
m
j
j
m
f
m
f
1
1
θ
(16)
convergem quase certamente para E
[
(
)
θ
f ], quando m → ∞ , se a esperança existir.
Logo, assume-se que a convergência é atingida em uma iteração cuja
distribuição de equilíbrio esteja próxima de
(
)
x|p
θ
e não no sentido do número de iterações
tendendo a infinito. Se a indicação de convergência é atingida na iteração m, M iterações após
11
GEMAN, S.; GEMAN, D. Stochastic relaxation, Gibbs distribution, and Bayesian restoration of images. In:
IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE, v.6, 1984.
Proceedings… 1984, p.721-741.
69
as m iniciais representam uma amostra da cadeia em equilíbrio e, assim, uma amostra
aleatória de tamanho M de
()
x|p
θ
. Apesar deste resultado ser muito útil é bom ressaltar que,
em alguns casos, o amostrador de Gibbs pode apresentar um ritmo de convergência
extremamente lento. Uma solução para melhorar o tempo de convergência pode ser a
reparametrização dos parâmetros, conforme Gamerman e Lopes (2006).
O esquema acima define uma cadeia de Markov, pois os acontecimentos na
iteração j dependem da história do processo apenas através dos valores na iteração j-1. Mais
que isso, a cadeia é homogênea, pois o núcleo de transição não varia com j. Ele é dado por
()
(
)
(
)
(
)
(
)
),,...,,,...,,|(P
j
k
j
i
j
i
jj
i
11
111
x
+
θθθθθ
(17)
que só depende da iteração j através dos valores nos quais se está condicionado.
2.5.1.2.1 Diagnósticos de convergência
Na implementação dos métodos de Monte Carlo aplicados a Cadeias de
Markov questões importantes como a escolha do amostrador, o número de replicações
independentes, a escolha de valores iniciais e problemas referentes a estimação e eficiência
devem ser considerados (Souza, 1999).
Em geral, utiliza-se médias ergódicas sobre as realizações de uma cadeia de
Markov, para se estimar funções de interesse. As iterações, dentro de uma fase inicial
transiente, devem ser descartadas para reduzir a possibilidade de tendências causadas pelo
efeito de valores iniciais. Um dos problemas mais difíceis de implementação é a determinação
deste período, porque as taxas de convergência variam para diferentes distribuições.
Na ausência de técnicas gerais para se determinar o comprimento da corrida,
a priori, análises estatísticas devem ser realizadas, a posteriori, para assegurar a convergência
da cadeia. Esses procedimentos são chamados diagnósticos de convergência.
Como ilustrado na seção 2.5.1.2, o amostrador de Gibbs gera cadeias de
Markov, de variáveis aleatórias, que convergem em distribuição, para a distribuição de
interesse. Diferentes abordagens para extrair informações das seqüências geradas exploram
esta propriedade para determinar o comprimento da fase inicial transiente.
70
Em Gamerman e Lopes (2006) são descritas algumas técnicas de
identificação e monitoração informal e de verificação formal da convergência. No contexto
informal estão a análise do comportamento da trajetória de uma cadeia ao longo das iterações,
a monitoração dos gráficos das densidades a posteriori, estimadas ao longo das iterações
(GELFAND e SMITH
12
, 1990 apud SOUZA, 1999; GELFAND
13
et al., 1990 apud SOUZA,
1999), e gráficos das médias ergódicas ao invés de valores gerados. Estas técnicas, para
monitoração da convergência, devem ser utilizadas com cautela e acompanhadas de algum
fundamento teórico.
A verificação formal da convergência é baseada em propriedades
estatísticas das cadeias simuladas. Segundo Souza (1999) são discutidos na literatura alguns
métodos de diagnósticos de convergência, com particular ênfase sobre implementação. Dentre
esses métodos está o método de Gelman e Rubin (1992) o qual é baseado em duas ou mais
cadeias paralelas, inicializadas em diferentes pontos dispersos em relação à verdadeira
distribuição a posteriori.
Este método é baseado em uma comparação, para cada uma das variáveis,
entre a variância amostral dentro das cadeias e entre as cadeias. Esta comparação é utilizada
para se estimar o fator para o qual o parâmetro de escala da distribuição marginal a posteriori,
pode ser reduzido à medida que o tamanho da amostra cresça. O método de Gelman e Rubin
consiste, essencialmente, em uma análise clássica de variância. Melhores resultados são
obtidos para parâmetros cujas densidades são aproximadamente normais.
Neste trabalho a verificação de indicação de convergência é feita através da
análise do comportamento da cadeia ao longo das iterações, e utilizando o diagnostico de
Gelman e Rubin implementado no software WinBUGS. Alguns resultados deste diagnóstico
são ilustrados no capítulo 3.
12
GELFAND, A. E.; SMITH, A. M. Sampling-based approaches to calculating marginal densities. Journal of
the American statistical association, v. 85, n. 410, pp. 398-409. 1990.
13
GELFAND, A. E.; HILLS, S. E.; RACINE- POON; SMITH, A. F. M. Ilustration of Bayesian inference in
normal data model using Gibbs sampling. Journal of the American statistical association, v. 85, n. 412, pp.
972-985. 1990.
71
2.5.1.3 Software WinBUGS
Segundo Gamerman e Lopes (2006), uma das maiores dificuldades a
impedir o desenvolvimento da Inferência Bayesiana sempre foi a sua implementação em
problemas práticos, que em parte era decorrente da dificuldade de sumariar a distribuição a
posteriori. O amostrador de Gibbs possibilita a análise de modelos bastante complexos através
de sucessivas decomposições em distribuições condicionais completas. Logo, um sistema
dotado da capacidade de compreensão de várias possibilidades de distribuição a priori e capaz
de amostrar das distribuições condicionais completas resolve boa parte dos problemas que
sempre dificultaram o uso dos métodos Bayesianos. Um sistema é o WinBUGS (Bayesian
Inference Using Gibbs Sampler para Windows) (SPIEGELHALTER et al., 2002).
O software WinBUGS é um programa direcionado para a aplicação da
Inferência Bayesiana, em problemas estatísticos, usando o amostrador de Gibbs. Este
programa possui um conjunto de funções que permite a especificação do modelo e das
distribuições de probabilidade para todos os seus componentes aleatórios (observações e
parâmetros). Entre os modelos já analisados através do WinBUGS e descritos em seu manual
encontram-se: modelos lineares generalizados com efeitos aleatórios, análise de regressão em
dados de sobrevivência, modelos com estrutura de dependência espacial e modelos de
suavização não-paramétrica.
Para cada conjunto de dados e modelo utilizado, o WinBUGS fornece os
valores amostrados de cada parâmetro monitorado a cada n iterações a partir de uma
determinada iteração m. Ambos os valores de n e m, bem como os parâmetros a serem
monitorados, são especificados pelo usuário. O BUGS fornece automaticamente para esses
parâmetros alguns resumos decorrentes da amostra obtida, como média e intervalos de
confiança, gráficos para análise das trajetórias das cadeias geradas, densidades e
autocorrelações, medida para diagnóstico de convergência e medida para avaliação do ajuste.
Recentemente, foi incorporado ao WinBUGS o módulo GeoBUGS. Esse módulo é
direcionado à análise espacial, que fornece uma interface para a produção de mapas da média
ou outros resumos estatísticos da distribuição a posteriori de uma variável estocástica. Esse
módulo propicia a criação e manipulação de matriz de adjacências as quais são necessárias
para a implementação do modelo CAR direcionado para análise de modelos com dados
georreferenciados.
72
A linguagem do sistema quanto a entrada e a saída de dados obedece a
mesma sintaxe da linguagem de programação S-Plus ou da linguagem R de domínio público.
2.5.1.4 Inferência Bayesiana para modelos Auto-regressivos Condicionais
Supondo que a área de interesse pode ser dividida em n sub-regiões, sejam
elas regulares ou não, pode-se usar a idéia de modelos auto-regressivos temporais e supor que
a resposta para cada área
()
,n,...,ii 1
=
representada por
i
Z , é uma auto-regressão de
primeira ordem na média da resposta dos seus vizinhos, isto é,
ii
i
Nj
j
i
,
N
Z
Z
i
εερ
+
=
iid
(
)
2
0
σ
,N , (18)
onde N
i
é o conjunto dos vizinhos da área i e |N
i
| é o número de vizinhos a área i. Em geral,
pode-se assumir que existe uma tendência μ no processo e neste caso, o modelo em notação
matricial pode ser representado por,
(
)
ε
ε
μ
ρ
μ
,ZWZ
+
= iid
(
)
nn
I,N
2
0
σ
, (19)
onde W é uma matriz de pesos representando a estrutura de vizinhança e I
n
representa a
matriz identidade de ordem n. A matriz W pode ser especificada apenas através das
localizações adjacentes, isto é 1
=
ij
w se as áreas i e j são adjacentes e ,w
ij
0= caso contrário.
Também se pode especificar uma matriz W que tenha pesos diferentes de zero, informando
que a resposta na sub-região
i não depende apenas daquelas localizações adjacentes. O
modelo apresentado na Equação 19 é conhecido na literatura como modelo espacial auto-
regressivo (BESAG, YORK e MOLLIÉ , 1991).
Assim, como no caso de séries temporais, pode-se especificar dois tipos de
modelos espaciais auto-regressivos:
1. Modelo Auto-regressivo Simultâneo (SAR)
73
()
()
2
0
σεεμμ
,N~,ZSZ
iijj
j
ijii
+=
(20)
onde i = 1,...,n, e
{
}
ij
SS é tal que SI
n
é não-singular. Na forma matricial podemos
escrever,
(
)
(
)
n
I,N~,ZSZ
2
0
σεεμμ
+= (21)
2. Modelo Auto-regressivo Condicional (CAR)
Neste caso, especifica-se a distribuição condicional do processo na área
i
dados os vizinhos, isto é:
() ()
+
j
jjijiji
,ZCN~ij,Z|Z
2
σμμ
, (22)
onde
{
}
ij
CC é tal que CI
n
é simétrica e positiva definida. Equivalentemente,
()
,ZCZ
ijj
n
j
ijii
υμμ
+=
=1
(23)
onde
i
υ
(
)
2
0
i
,N
τ
, para .n,...,i 1=
Entretanto, em contraste com a abordagem para séries temporais, as duas
especificações fornecem dois diferentes modelos, isto é, mesmo se fizermos
ijij
SC
=
o
modelo CAR fornece uma distribuição conjunta que é diferente daquela do SAR.
Seguindo as especificações acima, a distribuição dos dados é dada por:
Z
()
(
)
(
)
-11
S'-IS - I Λ
,N
μ
, para o modelo SAR e
Z
(
)
(
)
MC - I
1
,N
μ
, para o modelo CAR (24)
74
onde
(
)
22
diag
σσ
...,,=Λ e
(
)
22
1
diag M
n
...,,
ττ
= . Se em particular, ,n...,,,i, 21
22
i
==
ττ
o log
da função de verossimilhança associada ao processo vindo do modelo CAR é dado por:
()
()()
,ZB'ZBlog
n
μμ
σ
πσ
+
2
2
2
1
2
1
2
2
(25)
onde
()()
SISIB
= para o modelo SAR e
CIB = para o modelo CAR.
Comparando algumas propriedades dos modelos CAR e SAR pode-se
decidir por qual modelo utilizar. O modelo CAR é preferido por apresentar a propriedade de
que sua especificação fornece diretamente as distribuições condicionais completas dos
parâmetros do modelo, fator determinante para o uso do amostrador de Gibbs em MCMC.
Segundo Schmidt, Nobre e Ferreira (2003), no contexto Bayesiano
geralmente o modelo CAR é usado como informação a priori de um parâmetro do modelo
para o processo de interesse. O modelo genérico descrito a seguir, com enfoque direcionado
às áreas em estudo, é usado para exemplificar a modelagem Bayesiana de um processo
condicionalmente auto-regressivo. A subseção 3.1.3 apresenta um exemplo específico deste
tipo de abordagem.
Nesse exemplo específico assume-se que a área de interesse pode ser
dividida em n sub-regiões, sejam regulares ou não. A quantidade de interesse observada em
cada sub-região
()
,n,...,ii 1= é representada por
i
Z . Um possível modelo para
i
Z é
apresentado a seguir.
=
++=
q
k
iikki
SXZ
1
βμ
, (26)
onde:
μ
representa um fator comum a toda região em estudo;
(
)
qiii
X,...,XX
1
= representa um vetor de possíveis covariáveis para a i-ésima área, que
podem explicar o processo;
k
β
representa o efeito da k-ésima covariável na resposta Z;
75
()
n
S,...,SS
1
= são os efeitos aleatórios que podem ser vistos como variáveis latentes que
capturam efeitos desconhecidos ou não medidos pelas covariáveis.
Sob o enfoque Bayesiano, a Equação 26 representa o primeiro nível da
hierarquia do modelo. No segundo nível deve-se especificar a distribuição a priori do vetor
paramétrico
=
θ
( ,,...,,
q
β
β
μ
1
S). Geralmente assume-se a priori que esses parâmetros são
independentes e que
q
,...,,
β
β
μ
1
seguem uma distribuição normal centrada em 0 (zero) com
baixa precisão. Dessa forma, deixa-se que os dados dêem maiores informações sobre tais
parâmetros.
Assume-se para o efeito aleatório
i
S uma priori auto-regressiva condicional
intrínseca (BESAG, YORK e MOLLIÉ, 1991). A estrutura dessa priori é dada por:
(
)
(
)
i
υ
,mN~ij,sS|S
ijji
=
, (27)
onde,
==
ii
i
j
ij
*
j
ij
j
jij
i
ww
Sw
m
δδ
δ
υ
υ
i
e
,
onde
i
δ
representa o conjunto de áreas adjacentes a i e
*
υ um termo comum de variância.
Essa especificação resulta na seguinte distribuição a priori conjunta para o vetor de erros
aleatórios
S ,
()
()
∑∑
=<
n
ij
jiij
*
/n
*
*
SSwexp|S
11
2
2
2
11
υυ
υ
. (28)
que é uma distribuição imprópria já que é baseada nas diferenças pareadas entre os s'S
i
, ou
seja essa priori é invariante à locação. Como prioris impróprias podem resultar em posterioris
impróprias, na prática impõe-se uma restrição para que esses efeitos somem 0 (zero). A
especificação se completa ao se determinar a matriz de vizinhança W
=
[
]
ij
w e a distribuição
76
a priori para a variância
*
υ
. Neste caso, assume-se que 1
=
ij
w se i é adjacente a j e 0
=
ij
w
caso contrário, resultando em
i
*
i
j
j
i
NN
S
m
i
υ
υ
δ
==
i
e , (29)
com
i
N representando o número de vizinhos da i-ésima região e para
*
υ
assume-se uma
distribuição a priori gama invertida. A média condicional de
i
S ,
i
m , é dada pela média
aritmética dos efeitos aleatórios dos seus vizinhos, e a variância condicional
i
υ
é proporcional
ao número de vizinhos, donde vem a denominação CAR intrínseco. Essa especificação é
especialmente relevante quando a região é dividida em sub-regiões irregulares. Outras
estruturas de vizinhanças podem ser adotadas, por exemplo, alguma baseada na distância
entre os centróides das sub-regiões (SCHMIDT, NOBRE e FERREIRA, 2003).
2.5.2 Markov Random Field
O MRF, ou Campo Aleatório de Markov, é um modelo que tem atraído
muita atenção nos últimos anos. Os modelos MRF têm sido utilizados em aplicações de
processamento de imagem de baixo nível, tais como segmentação e restauração de imagem
(GEMAN e GEMAN, 1984; SZIRÁNYI et al., 2000). No entanto, recentemente vem sendo
utilizado em tarefas de análise de imagem de alto nível (KIM e YANG, 1995; MODESTINO
e ZHANG, 1992; KOPPARAPU e DESAI, 2001; ANDERSEN et al., 2002).
A análise de imagem usando MRF é formulada como um problema de
estimação do maximum a posteriori (MAP). Este processo corresponde à resolução de um
problema de minimização de energia. Em geral, a função de energia associada com problemas
de visão é não-convexo, podendo então ter vários mínimos locais. Assim, a solução pode não
corresponder a um mínimo global.
Segundo Kinderman e Snell (1980), o MRF pode, também, ser definido,
sobre grafos e aplicado para o problema de análise de imagem.
77
2.5.2.1 MRF e distribuição de Gibbs
Seja X a característica associada aos pixels da imagem ( )NM× definida na
grade regular {( , ) :1 ,1 }Sij iNjM=≤, representada por,
1,1
.
.
.
1,
2,1
.
1,1 1, 2 1,
.
.
2,1 2,2 2,
2,
.
.
.
,1
,1 , 2 ,
.
.
.
,
...
...
....
,
....
....
...
M
M
M
M
N
NN NM
NM
X
X
X
XX X
XX X
X
X
X
XX X
X
⎡⎤
⎢⎥
⎢⎥
⎢⎥
=→
⎢⎥
⎢⎥
⎢⎥
⎢⎥
⎢⎥
⎣⎦
(30)
onde, o segundo membro da expressão 30 representa a ordenação lexicográfica para a imagem
X.
Logo, pode-se assumir que cada pixel
,ij
X
toma valores em um conjunto
finito de P níveis. Esses P níveis podem ser tons de cinza (por exemplo, 256 níveis para
imagens de oito bits). Assim, o número de possíveis configurações para X é finito, isto é
NM
P
×
, o que é extremamente grande.
Segundo Kopparapu e Desai (2001) a dependência local de
,ij
X
é a idéia
básica associada com o processo de Markov. De fato, entre outras propriedades, é esta que
torna a modelagem via MRF atrativa para problemas em visão. Neste caso, tem-se que X é um
MRF, se e somente se,
,,,,
,,,, ,
[|,(,)(,)]
[|,para(,)],
ij ij kl kl
ij ij kl kl ij
PX x X x kl ij
PX x X x kl
η
==
== =
(31)
onde
[|]P ⋅⋅
é a probabilidade condicional e
,ij
η
é a vizinhança da posição ( , )ij.
78
Assumindo que
X
tenha uma configuração finita sobre S e que
[]0PX x=>, então, pelo teorema de Hammersley-Clifford,
X
é um MRF com relação a
vizinhança
η
se e somente se
X
tem distribuição de Gibbs,
()
1
[] 0,
Ux
PX x e
Z
=
=>
(32)
onde
x
é uma realização de
X
e
Z
é uma constante de normalização comumente
mencionada como a função de partição, dada por,
()
.
,
Ux
toda conf x
Ze
=
(33)
()Ux refere-se à função de energia e é definida por,
() ().
c
cC
Ux V x
=
(34)
onde ( )
c
Vx é a função potencial definida sobre as cliques .C
A forma geral da função de energia ( )Ux é dada por,
(, )
,, ,
(, ) (1,1)
(, 1) (, )
,,,;, , ,
(, ) (1,1) ( ,) (, 1)
(, 2) (, 1) (, )
(,)(1,1) (,)(, 1) (,)(, 1)
1,1 ,1 , 1,1;...; ,
() ( )
(, )
...
,..., ,...,
NM
ij ij ij
ij
NM NM
ij kl ijkl ij kl
ij kl ij
NM NM NM
ij kl ij rs kl
NNMN
Ux xG x
xxG x x
xx xG
=
==+
−−
==+=+
=
+
++
+
∑∑
∑∑
1;...; , 1,1 ,1 ,
( ,..., ,..., ),
NM N NM
xx x
(35)
onde
,;, , ,
(, )0
ijnm ij nm
Gxx= se
,ij
x
e
,nm
x
não pertencem a mesma clique (KOPPARAPU e
DESAI, 2001).
79
A definição de clique é melhor entendida, no contexto de análise de
imagem, considerando dois exemplos. Para uma vizinhança de primeira ordem (vizinhança 4),
correspondente à posição ( , ),ij o conjunto de cliques é,
j)}}.1,(ij),j)}{(i,1,(ij),{(i,1)},j(i,j),{(i,
1)},j(i,j),{(i,j)},{{(i,C
+
+
=
Essa definição de clique de primeira ordem mostra que a vizinhança é
definida para o elemento base ( , )ij isoladamente, e para cada par envolvendo este elemento e
os demais. Na Figura 18, a primeira ilustração a esquerda mostra a vizinhança considerada e
as demais ilustrações mostram as 5 componentes da clique C.
Figura 18 – Vizinhança de primeira ordem da clique (Fonte: KOPPARAPU e DESAI, 2001).
Para uma vizinhança de segunda ordem (vizinhança 8), correspondendo à
posição ( , ),ij o conjunto de cliques é dado por,
{{( , )},{( , ),( , 1)},{( , ),( , 1)},{( , ),( 1, )},
{( , ),( 1, )},{( , ),( 1, 1)},{( , ),( 1, 1)},
{( , ),( 1, 1)},{( , ),( 1, 1)},{( , ),( 1, ),
{( , 1)},{( , ),( 1, ),( , 1)},{( ,
C ij ijij ijij iji j
ij i j ij i j ij i j
ij i j ij i j ij i j
ij ij i j ij i
=
+−+
−−++
+− −+
−−+),( 1, ),( , 1)},
{( , ),( 1, ),( , 1)},{( , ),( 1, ),( , 1),
( 1, 1)},{( , ),( 1, ),( , 1),( 1, 1)},
{( , ),( 1, ),( , 1),( 1, 1)},
{( , ),( 1, ),( , 1),( 1, 1)},
{( , ),( , 1),( 1,
ji jij
ij i j ij ij i j ij
i j ij i j ij i j
ijijij ij
ijijij ij
ij ij i
++
+− −−
−− + −+
++++
+−+
−− 1)},{( , ),( , 1),( 1, 1)},
{( , ),( , 1),( 1, 1)},{( , ),( , 1),( 1, 1)}}
jijijij
ij ij i j ij ij i j
−++
−+ +++
80
A definição de clique para uma vizinhança de segunda ordem é composta de
um único elemento (isto é, o elemento base ( , )ij), além de duplas, triplas e quádruplas
envolvendo o elemento base e demais vizinhos. A primeira ilustração a esquerda da Figura 19
mostra a estrutura de vizinhança de segunda ordem, sendo a posição central ( , )ij o elemento
base. As outras ilustrações mostram as 22 componentes da clique C.
Figura 19 – Vizinhança de segunda ordem da clique (Fonte: KOPPARAPU e DESAI, 2001).
Analisando-se novamente as Figuras 18 e 19, pode-se notar que o número
de componentes das cliques aumenta rapidamente com o aumento da ordem da vizinhança.
Assim, na maioria das aplicações consideram-se sistemas de primeira ou segunda ordem.
Entretanto, quando se considera um sistema de vizinhança de ordem superior, concentra-se a
atenção para as componentes com duas posições (KOPPARAPU e DESAI, 2001).
2.5.2.2 MRF para análise de imagens por regiões
A formulação de um MRF para problemas de análise de imagem pode ser
realizada segundo alguns preceitos, ou seja, parte-se de uma imagem segmentada e constrói-
se um grafo de regiões adjacentes (Region Adjacency Graph (RAG)). Cada nó do RAG
corresponde a uma região da imagem e dois nós tem conectividade entre eles se as duas
regiões correspondentes compartilham de uma mesma fronteira. Em seguida, assume-se que a
interpretação do nó, dado o conhecimento especifico dos objetos de interesse, e os atributos
obtidos da imagem observada, dá se de acordo com um MRF. Assim, o problema de análise
81
R
1
R
2
R
3
R
4
R
5
R
1
R
2
R
3
R
4
R
5
(a) (b)
de imagem é então resolvido como um problema de estimativa MAP. Uma das grandes
vantagens desta abordagem é a possibilidade de modelar o conhecimento contextual, isto é, as
relações entre o objeto de interesse e os demais presentes na cena.
2.5.2.3 MRF em estrutura de grafo
Segundo Kopparapu e Desai (2001), a formulação de um MRF em estrutura
de grafos inicia com uma imagem segmentada com
n regiões
12
{ , ,..., }
n
R
RR e o RAG
correspondente. Um exemplo de imagem segmentada e RAG podem ser visualizados na
Figura 20. Este RAG mostra que a região
1
R
está relacionada com as regiões
234
,,
R
RR.
Mostra também que
4
R
tem relação com
5321
ReR,R,R .
Figura 20 – (a) Imagem segmentada; e (b) RAG (Fonte: KOPPARAPU e DESAI, 2001).
Seja { , }GRE= um RAG, onde
12
{ , ,..., }
n
R
RR R
=
representa o conjunto de
nós , 1,2,...,
i
R
in= e E denota o conjunto de arestas. Existirá uma aresta entre os nós
i
R
e
j
R
se as regiões correspondentes compartilharem, pelo menos parcialmente, de uma mesma
fronteira.
O sistema de vizinhança em
G será representado por
12
{ ( ), ( ),..., ( )}
n
R
RR
η
ηη η
=
(36)
82
onde
(),
i
R
η
i = 1,...,n é o conjunto de todos os nós em
R
vizinhos de .
i
R
Nota-se que
()
ij
R
R
η
se ( )
j
i
R
R
η
.
Seja
12
{ , ,..., }
n
X
XX X= a família de variáveis aleatórias definida sobre
R
,
onde cada
i
X
corresponde a .
i
R
Além disso, assume-se que
i
X
toma valores em um espaço
amostral finito. Segundo Kopparapu e Desai (2001),
X
é denominado um MRF sobre G
com relação ao sistema de vizinhança
η
se e somente se:
1) 0][ >= xXP para todas as realizações de
X
;
2) )].(||[]|[
ijjjiijjii
RRjxXxXPijxXxXP
η
=
=
=
==
Uma das vantagens do modelo de MRF é que geralmente sua função
distribuição de probabilidade é dada pela distribuição de Gibbs conforme estabelece o
teorema de Hammersley-Clifford.
Uma clique c, neste contexto, é um subconjunto de nós de
G (isto é,
R
) tal
que cada par de diferentes nós em c são vizinhos. A coleção de todas as cliques de
G com
relação ao sistema de vizinhança
η
é representado como ( , )CG
η
.
De acordo com Kopparapu e Desai (2001), assumindo que
X
tem um
número finito de configurações em relação ao espaço amostral
S , e que [ ] 0PX x=>, então
X
é um MRF, com respeito ao sistema de vizinhança
η
, se e somente se
X
tem distribuição
de Gibbs, isto é,
()
1
[]
Ux
PX x e
Z
=
=
(37)
onde,
x
é uma realização de
X
e
Z
é a constante de normalização dada por,
()
.
,
Ux
toda conf x
Ze
=
(38)
e ( )Ux conhecida como a função de energia de Gibbs, dada por,
(,)
() ( ),
c
c
cCG
Ux V x
η
=
(39)
83
na qual, ( )
c
c
Vx é a função potencial da clique, sendo
c
x
o valor das variáveis associadas com
os nós pertencentes à clique ( , )cCG
η
.
Para elucidar melhor o conceito de clique, considere o RAG da Figura 20. O
quadro 2 mostra as cliques para dois nós deste RAG.
Quadro 2 – Cliques para os nós R
1
e R
5
do RAG.
Nós Cliques de
primeira ordem
Cliques de
segunda ordem
Cliques de
terceira ordem
R
1
{R
1
} {R
1
, R
2
}
{R
1
, R
4
}
{R
1
, R
3
}
{R
1
, R
2
, R
4
}
{R
1
, R
3
, R
4
}
R
5
{R
5
} {R
5
, R
4
} -
Fonte: Kopparapu e Desai, 2001.
Notar que
1234
{, , , }
R
RRR não pode ser uma clique porque
23
e
R
R não são
vizinhos. A função potencial da clique
i
c
V envolve somente nós de
i
c . Assim, cada função
desse tipo expressa a forma e o grau de interação (primeira ordem, segunda ordem etc.) que
cada nó
i
R
tem com seus vizinhos.
Segundo Modestino e Zhang (1992), devido à estrutura na qual as
propriedades locais e globais são relacionadas através de cliques, a abordagem baseada no
modelo de MRF para análise de imagem fornece vantagens em relação à representação do
conhecimento, aprendizado e otimização.
2.5.2.4 Rotulação de imagem usando MRF
Quando o problema de análise de imagem é restrito à rotulação de regiões a
partir de uma imagem segmentada, atribui-se um nó R para cada região. O conjunto de arestas
E é tal que o nó R
i
está conectado a R
j
somente se as regiões correspondentes são
84
espacialmente adjacentes. Então, a imagem segmentada da Figura 20(a) toma a forma do
grafo de adjacência mostrado na Figura 20(b).
Cada nó R
i
tem um rótulo possível do conjunto
12
{ , ,..., }.
M
I
II I
=
Então, o
espaço amostral para cada
i
X
(isto é, a variável aleatória para o nó R
i
) será
12
{ , ,..., }.
M
I
II I=
Logo,
i
X
tomaria um valor do conjunto
12
{ , ,..., }
M
I
II. Um exemplo de conjunto de rotulação
poderia ser {I
1
= pastagem, I
2
= rodovia, I
3
= céu, I
4
= edifícios, I
5
= carro}. Então,
i
X
tomaria
um dos M valores de
I
.
O conhecimento específico a priori é denotado por
κ
, o qual está
relacionado com os objetos constituintes da cena e que se pretende identificar. A
caracterização de
κ
implica em calcular valores para todos os atributos que são considerados
importantes para o processo de rotulação. Esses atributos podem ser níveis de cinza ou
características geométricas (perímetro, área etc.) numa clique de primeira ordem, contraste ou
comprimento da fronteira entre dois objetos para cliques de segunda ordem. Atributos mais
complexos podem ser definidos para cliques de ordem superior.
A caracterização e representação do conhecimento a priori para rotulação de
objetos presentes na cena não é um problema bem resolvido. O procedimento geral é a criação
de um conjunto de atributos e sua validação através de estudos empíricos (MODESTINO e
ZHANG, 1992).
Os atributos úteis para a análise de imagem podem ser classificados em:
atributos primários, ou seja, aqueles atributos obtidos da cena através de medidas diretas;
atributos secundários, os quais são obtidos a partir dos atributos primários e por esta razão não
são diretamente obtidos da cena.
Dentre os atributos primários pode-se citar a área, o perímetro, a variância e
o nível médio de cinza. Os atributos secundários são combinações de atributos primários.
Alguns desses atributos são: a compacidade, o comprimento da fronteira entre dois objetos e o
contraste. E ainda, pode-se considerar o contexto, que se constitui numa das grandes
vantagens desta abordagem. Neste caso, é possível modelar o conhecimento contextual, isto é,
as relações entre o objeto de interesse e os demais presentes na cena.
O conjunto de atributos obtidos a partir da imagem de entrada pode ser dado
por,
{| (,)}
c
FF cCG
η
=∀ , (40)
onde
85
1
{ ,..., }
ccc
q
FFF= ,
é o conjunto de q atributos medidos sobre a clique
.c Esses q atributos seriam os mesmos
usados na caracterização do conhecimento a priori
κ
.
Assume-se agora que a distribuição de probabilidade do vetor aleatório
X
definido sobre o RAG
G , dado o conhecimento a priori
κ
e o conjunto de atributos F , é um
MRF, isto é,
(| , )
1
[|,}exp
Uxf
PX x F f
Z
κ
κ
== = (41)
(,)
(| ,) ( | ,)
cc
c
cCG
Ux f Vx f
η
κ
κ
=
. (42)
Agora o problema de análise de imagem é resolvido como um problema de
estimação do MAP, isto é
*
arg max [ | , ]
x
x
PX xF f
κ
=
==, (43)
ou, de forma equivalente,
*
arg min ( | , ]
x
x
Ux f
κ
=
. (44)
Para uma determinada imagem, uma análise ótima corresponde à
minimização de uma função de energia. No entanto, essa análise ótima depende de como a
função de energia é definida.
2.5.2.5 Solução MAP
86
Como foi discutido na seção 2.5.2, o processo em questão, de análise de
imagem, é formulado como um problema de estimativa MAP. Em geral, quando se tem um
problema baseado num modelo MRF, a solução procurada geralmente envolve uma
estimativa MAP, que é equivalente a um problema de minimização da função de energia dada
por,
1
*
um no clique multiplos no s clique
argmin (| ,) (| ,).
cc mcc
cc
x
cc
xVxfVxf
κκ
′′
∀= ∀=
⎡⎤
=+
⎢⎥
⎣⎦
∑∑
(45)
Em geral, a expressão dentro do colchete na Equação 45 possui vários
mínimos locais. Assim, é necessária a aplicação de um algoritmo de minimização que possa
fornecer um mínimo global. Entretanto, a utilização de um método simples de otimização
envolve uma busca combinatorial exaustiva, resultando em uma complexidade exponencial da
ordem de
N
L , onde L é o número de rótulos e N o número de nós do grafo de adjacência
(MODESTINO e ZHANG, 1992).
Todavia, com o intuito de resolver o problema da busca combinatorial,
alguns autores têm proposto esquemas de relaxação para encontrar a solução local ótima para
o problema da estimativa MAP (ROSENFELD et al., 1976; HUMMEL e ZUCKER, 1983).
Outra solução, descrita na literatura, para reduzir a complexidade exponencial é a utilização
do algoritmo SA. Este algoritmo é um procedimento de otimização, que encontra o máximo
global da distribuição a posteriori do MRF ou o mínimo da função de energia sem cálculos
excessivos (GEMAN e GEMAN, 1984).
No algoritmo SA, a distribuição de probabilidade condicional é modelada
para depender do parâmetro de controle (temperatura) ,T
[]
()
(
)
,
TZ
xXP
T
xU
== e
1
(46)
onde,
(
)
.Z
T
xU
=
xconf. toda
e (47)
Um aspecto importante do SA é a escolha da temperatura inicial
0
T , pois a
eficácia do algoritmo depende de uma escolha adequada para
0
T . Segundo Modestino e
87
Zhang (1992), no algoritmo SA o processo primeiramente “liquefaz” o sistema em uma
temperatura alta e, então, gradualmente diminui a temperatura até que o sistema se resfrie e
atinja uma configuração ótima. É oportuno registrar que a técnica de otimização mencionada
já foi utilizada recentemente para a extração de feições cartográficas. De fato, Trinder, Maulik
e Bandyopadhyay (2000) o apresenta como uma alternativa vantajosa ao princípio de
minimização de energia usado para a solução do problema de contorno ativo (snakes), cuja
desvantagem está associada à sensibilidade do processo de otimização ao estado inicial. Esses
autores ressaltam, ainda, que a literatura não fornece informação sobre a escolha da
temperatura inicial, ao contrário, essa escolha envolve tentativa e erro.
O algoritmo SA tem sido muito utilizado em aplicações envolvendo
otimização combinatorial. Um trabalho utilizando esse algoritmo é descrito por Modestino e
Zhang (1992). Estes autores salientam que este algoritmo, com algumas modificações reduz a
complexidade computacional e fornece resultados similares aos obtidos pelo amostrador de
Gibbs.
O algoritmo SA é um método proposto por Geman e Geman (1984) para
maximizar a probabilidade a posteriori utilizando o resfriamento simulado que se baseia no
algoritmo proposto em Metropolis et al. (1953). O objetivo desse método é maximizar
iterativamente a probabilidade a posteriori ou equivalentemente minimizar a função de
energia por meio de trocas locais nas variáveis aleatórias. Este algoritmo possibilita a
obtenção de estados que apresentam maior quantidade de energia, evitando assim a
permanência em regiões de mínimos locais. O fluxograma ilustrado na Figura 21 mostra o
princípio de funcionamento do algoritmo.
88
[]
TUU
ji
ep
/
=
i = j e U
i
= U
j
Sim
p > rand
Não
Nova temperatura?
Sim
0
TT =
α
Temperatura de
congelamento?
Fim
Sim
Não
Não
Sim
Inicialização:
Temperatura inicial T
0
;
Solução inicial
Valor da função de energia U
i
Definição da nova solução j
Calculo da função de energia U
j
Não
U
j
< U
i
Figura 21 – Fluxograma do algoritmo SA.
O algoritmo SA começa a busca pela melhor solução a partir de uma
solução inicial qualquer. Através da solução incial obtém-se a energia U
i
. O procedimento
principal consiste em analisar a cada iteração, um único vizinho j da solução corrente i. A
cada geração de um novo vizinho j de i, é testada a redução de energia U
j
< U
i
, a qual implica
que a nova solução é melhor que a anterior. O método aceita a solução e j passa a ser a nova
solução corrente. Caso contrário, se U
j
> U
i
, houve um aumento do estado de energia. A
aceitação desse tipo de solução é mais provável a altas temperaturas e bastante improvável a
temperaturas reduzidas. Para reproduzir essas características, geralmente usa-se, para calcular
89
a probabilidade de se aceitar a nova solução, uma função conhecida por fator de Boltzmann,
que é dada por
[
]
T/UU
ji
e
, onde T é um parâmetro do método, chamado de temperatura e
que regula a probabilidade de soluções com pior custo.
A temperatura T
0
assume inicialmente um valor elevado, logo é aceita
qualquer tipo de configuração. Conforme a temperatura decresce, as configurações que
possuem maior energia têm diminuída sua probabilidade de aceitação. Assim o processo tem
como objetivo reduzir a quantidade de energia e com isso o valor da probabilidade a posteriori
aumenta. Em relação à temperatura (T) do sistema, esta deve ser realizada lentamente
(KIRKPATRICK, GELATT e VECCHI, 1983). Algumas equações são propostas para o
decréscimo da temperatura (GEMAN E GEMAN, 1984; MANJUNATH, SIMCHONY E
CHELLAPPA,1990; BLAKE, 1989), entre elas a Equação
0
TT
α
=
, onde
α
assume valores
no intervalo
()
10; , até alcançar a configuração ótima. Ainda no fluxograma (Figura 23) “rand”
é um número aleatório uniformemente distribuído entre 0 e 1.
O procedimento é finalizado quando a temperatura chega a um valor
próximo de zero e nenhuma solução que piore o valor da melhor solução seja mais aceita, ou
seja, quando o sistema estiver estável. A solução obtida quando o sistema encontra-se nesta
situação evidencia o encontro de um mínimo local
90
3 METODOLOGIA PARA A EXTRAÇÃO AUTOMÁTICA DE CONTORNOS DE
TELHADOS DE EDIFICIOS EM UM MDE, UTILIZANDO INFERÊNCIA
BAYESIANA E MRF
Este capítulo apresenta a metodologia proposta para a extração automática
de contornos de telhados de edifícios em um MDE obtido através da varredura a laser
utilizando Inferência Bayesiana e modelo MRF. A metodologia consiste inicialmente na
extração de contornos dos objetos altos existentes na cena para, na etapa seguinte, utilizar
esses objetos para a extração apenas dos contornos de telhados de edifícios. A seção 3.1
apresenta a metodologia para a extração automática de feições relacionadas com objetos altos
em um MDE, utilizando Inferência Bayesiana e modelo MRF. A seção 3.2 apresenta a
metodologia desenvolvida para separar os contornos de telhados de edifícios, via MRF, dentre
todos os objetos altos detectados na primeira etapa.
3.1 Metodologia para a extração automática de regiões altas em um MDE utilizando
Inferência Bayesiana e MRF
O fluxograma apresentado na Figura 22 mostra as etapas que envolvem a
primeira parte da metodologia desenvolvida.
91
Nuvem de pontos laser
Geração d
e
u
m
a malha
regular
Segmentação via divisão recursiva
Fusão de regiões usando MRF
Polígonos representando as
regiões altas
Figura 22 – Fluxograma referente à primeira etapa da metodologia de extração de feições.
O sistema de varredura a laser gera um conjunto de dados brutos (nuvem de
pontos) que são inicialmente interpolados para gerar um MDE. A partir dessa etapa, é
realizada a divisão recursiva usando a estrutura quadtree.
Após a etapa de divisão recursiva é
aplicada a técnica proposta de fusão
Bayesiana de regiões para reduzir a fragmentação da segmentação inicial, retendo apenas as
regiões correspondentes aos objetos altos. Após esta etapa, as regiões podem ser extraídas ou
explicitadas através de seus contornos. Para a extração das regiões foi utilizada uma técnica
de detecção de bordas das regiões altas seguida pelas técnicas de vetorização e poligonização.
3.1.1 Geração da malha regular de dados
Os dados provenientes da varredura a laser são pontos representados pelas
coordenadas ( , , )ENh. Neste caso, ( , )EN correspondem às coordenadas planimétricas de
um ponto no conjunto de dados brutos e
h é a altitude ortométrica do ponto de coordenadas
(, )EN. A Figura 23 ilustra os pontos fornecidos pela varredura a laser resultante do retorno
do primeiro pulso laser. Esses pontos consistem inicialmente de uma perfilagem irregular
onde não se tem o exato espaçamento de pontos na grade gerada.
92
(a) (b)
Figura 23 – (a) Exemplo de dados irregulares fornecidos pela varredura a laser; (b) detalhe ampliado
dos dados irregulares.
Os métodos de interpolação têm por função atribuir valores a novos pontos
inseridos num campo de valores já existente. O produto da interpolação é uma malha de
pontos regular, com valores interpolados nas novas posições criadas pela malha (Surfer,
1999). A Figura 24 mostra um exemplo de uma malha regular gerada pelo software Surfer 8.0
(utilizando o método do vizinho mais próximo com espaçamento de 70cm entre pontos na
malha) e sobreposta na imagem de intensidade utilizando o software MicroStation V8.
Figura 24 – Exemplo de uma malha regular sobreposta à imagem de intensidade.
93
Na literatura relacionada existe uma variedade de métodos de interpolação
que podem ser utilizados. Entre eles se destacam as splines cúbicas, elementos finitos,
mínimos quadrados, krigagem, vizinho mais próximo, linear, bilinear, inverso da distância
etc. (YANG et al., 2004). Um exemplo da representação tridimensional, gerada a partir da
interpolação (pelo método do vizinho mais próximo) dos dados de varredura a laser resultante
do retorno do primeiro pulso laser, é mostrado na Figura 25.
Figura 25 – Visualização tridimensional (Representação gerada no software Surfer 8.0).
Neste trabalho o método de interpolação utilizado foi o vizinho mais
próximo. O algoritmo do vizinho mais próximo é um método bastante simples e
computacionalmente atrativo. Tem como principal característica assegurar que o valor
interpolado seja um dos valores originais, ou seja, não gera novos valores. No entanto, o
produto final deste interpolador é caracterizado por um efeito de serrilhamento nas bordas dos
objetos (FRANKE, 1982).
Yang et al. (2004) realizaram um estudo com doze métodos de interpolação
utilizando o software Surfer 8.0. Nesse trabalho os métodos de interpolação foram
comparados e a acurácia dos resultados foram analisadas. O vizinho mais próximo foi um dos
métodos analisados e os resultados obtidos ficaram dentro dos padrões aceitáveis. Para cada
método, os autores analisaram a aplicabilidade, o algoritmo, a eficiência e as vantagens dos
94
métodos. Eles concluíram que não existe o melhor método, mas a melhor escolha diante de
determinadas circunstâncias. Logo, para a escolha correta do método de interpolação é
necessário conhecer as características de cada método bem como os dados que serão
utilizados.
A Figura 26 mostra os resultados obtidos usando vários métodos de
interpolação. A Figura 26(f) mostra que o interpolador do vizinho mais próximo possibilitou a
obtenção de uma maior nitidez das bordas do objeto, mas também um maior serrilhamento
das bordas. Além disso, os valores dos atributos Z (alturas) não são alterados, ocorrendo o
mesmo com as incertezas destas alturas. O bom contraste dos dados originais e a manutenção
dos valores observados são desejáveis para a primeira etapa da metodologia, principalmente
no que se refere à fusão bayesiana. Já o serrilhamento pode ser prejudicial para o cálculo de
alguns atributos utilizados na segunda etapa da metodologia. Entretanto, se necessário, este
efeito pode ser eliminado via algoritmo de simplificação de contornos, como o de
poligonização. Por estes motivos, o algoritmo de interpolação utilizado é o do vizinho mais
próximo.
(c) (d)
(e) (f)
(a) (b)
Figura 26 – Imagem altimétrica das grades geradas pelos métodos de interpolação. (a) Polinomial
local; (b) Krigagem; (c) Inverso da distância; (d) Curvatura mínima; (e) vizinho natural e (f) vizinho
mais próximo (Imagens geradas pelo Software Surfer 8).
95
3.1.2 Segmentação via divisão recursiva
Uma região em um MDE é um agrupamento de pontos conexos com
propriedades similares. Ao subdividir o MDE em regiões, várias decisões devem ser tomadas.
No entanto, o problema está em decidir qual propriedade utilizar na subdivisão. Nessa
aplicação, a variância dos valores de altura é usada como medida de dispersão desses valores
em uma determinada região. A técnica utilizada neste trabalho para subdividir regiões é a
divisão recursiva de regiões, utilizando a estrutura quadtree.
Na divisão recursiva usando a estrutura quadtree, uma dada região é
subdividida em outras quatro sub-regiões de tamanhos idênticos se a variação dos valores de
altura desta região em análise for maior que o limiar especificado. O processo de divisão
segue recursivamente até que nenhuma região possa ser subdividida. O resultado é um MDE
organizado de acordo com a estrutura quadtree, onde todas as regiões homogêneas são
explicitamente representadas. A Figura 27 apresenta um exemplo ilustrativo desta técnica.
Figura 27 – Divisão recursiva usando a estrutura
quadtree.
A Figura 27 mostra o resultado obtido pela divisão recursiva em uma cena
urbana e, em destaque, para um único edifício. Neste caso pode-se observar claramente o
efeito da fragmentação resultante do processo de divisão recursiva. Visualmente as diferenças
entre as tonalidades das regiões parecem pequenas, mas, no entanto, várias são as regiões para
um mesmo objeto que, no caso, consiste de um telhado.
96
Neste trabalho, considerou-se
R
o MDE,
i
R cada quadrante do MDE e
P
uma propriedade (a variância das alturas dos pontos). Esta divisão é baseada em um teste de
hipóteses do tipo
λσ
=
2
00
)(:
i
RPH (onde
λ
é um valor pré-estabelecido de acordo com os
valores de altura dos objetos presentes na cena) contra a hipótese
)(:
1 i
RPH >
2
0
σ
. Se
)(:
1 i
RPH >
2
0
σ
, rejeita-se
0
H em favor de
1
H
. A segmentação de
R
é realizada a partir de
sucessivas subdivisões. Assim, se a hipótese
1
H for verificada, então o MDE é subdividido
em quadrantes cada vez menores. Essa técnica gera uma estrutura de dados denominada
quadtree, isto é, uma árvore em que cada nó possui exatamente quatro descendentes.
Essa abordagem pode ser sumariada nas seguintes etapas:
1) Dividi-se o MDE em quatro quadrantes distintos;
2) Para cada quadrante, calcula-se a variância dos valores de altura;
3) Se
2
0
)(
σ
>
i
RP
, subdivide-se o referido quadrante em quatro outros quadrantes.
A segunda e a terceira etapa devem ser aplicadas recursivamente a todos os
quadrantes do MDE, enquanto a hipótese
1
H for verificada. O processo é finalizado quando a
hipótese
0
H for verificada para todas as regiões. Isso significa que a estratégia descrita deve
ser aplicada recursivamente até que não haja mais quadrantes para serem subdivididos.
Assim, o algoritmo é finalizado e uma estrutura é gerada. Essa estrutura corresponde a um
MDE segmentado, onde cada
i
R é rotulado com o nível médio de altura da região
correspondente.
3.1.3 Fusão de regiões usando uma Abordagem Bayesiana
As informações fornecidas pelo método de divisão recursiva são utilizadas
para a fusão de regiões com certo grau de similaridade. As regiões adjacentes são conectadas
usando a propriedade de alturas na forma do conhecimento de que os telhados são mais altos
que as regiões adjacentes. Logo é possível, na etapa de segmentação, separar os objetos altos
(como por exemplo, edifícios, árvores, caixas d’água etc.) dos objetos baixos (quintais, pátios,
corredores, canteiros, carros, barracas, ruas, terrenos etc.). No entanto, alguns objetos
indesejáveis ainda farão parte do conjunto de objetos altos (por exemplo, árvores, caixas
d’água etc.).
97
Neste trabalho optou-se por utilizar o modelo CAR, definido na subseção
2.5.1.4, visto que este permite obter diretamente as distribuições condicionais completas dos
parâmetros do modelo, fator determinante para o uso do MCMC, neste caso o amostrador de
Gibbs. Neste trabalho a idéia é usar modelos que especifiquem que o processo de interesse é
influenciado, de alguma forma, pela resposta do mesmo em localizações vizinhas.
Para realizar a fusão considerou-se, como na seção 2.5.1.4, a área de
interesse dividida em n sub-regiões, onde
i
Z
representa a quantidade de interesse (altura
média) que é observada em cada sub-região i,
.n,...,i 1
=
Neste caso, assume-se que cada
i
Z
tem distribuição normal com média
i
μ
e variância
2
σ
, dada por,
(
)
2
σμ
,N~Z
ii
(48)
onde a média
i
μ
é modelada em função de um fator (
μ
) comum a todas as regiões em estudo
e de um efeito aleatório não observável
i
S , representando características específicas,
.S
ii
+
=
μ
μ
(49)
Cabe ressaltar que não foram inseridas covariáveis no modelo pelo fato
destas não contribuiem significativamente com os resultados esperados. Uma covariável
possível seria o nível de cinza de cada região, no entanto essa informação depende do tipo de
resposta de cada material existente na cena, o que não auxilia na discriminação dos objetos
existentes na área analisada.
Para a especificação completa do modelo é necessário assumir distribuições
a priori para os parâmetros representados pelo espaço paramétrico
(
)
22
S
,,S,
σσμ
=Θ . (50)
Assim, são assumidas para
μ
~
(
)
b,aU , para
i
S ~
(
)
2
S
CAR
σ
,
2
S
σ
~
(
)
22
SS
b,aIG
σσ
e para
2
σ
~
(
)
22
σσ
b,aIG
, todas as distribuições com hiperparâmetros
previamente especificados, onde
(
)
b,aU significa uniforme no intervalo
()
b,a e
(
)
b,aIG
inversa gama com parâmetros a e b. A priori CAR para
i
S implica em
98
(
)
(
)
2
SSji
,N~ji,S|S
i
σμ
,
i
S
i
n
j
j
S
NN
S
i
i
2
2
S
i
e
σ
σμ
δ
==
,
onde
i
N e
i
S representam o número e o conjunto de vizinhos da i-ésima área.
A densidade conjunta é dada por
()
()
()
.SZe
Ze,,|Zp
n
i
ii
/n
n
i
iii
=
=
=
=
1
2
2
2
2
1
2
2
2
2
2
1
2
1
2
1
2
1
S
μ
σπσ
μ
σ
πσ
σμ
(51)
E, consequentemente, a verossimilhança para o modelo definido em ( 48 ) e
( 49 ) é dada por
()
()
.SZe;,,L
n
i
ii
/n
=
=1
2
2
2
2
2
2
1
2
1
ZS
μ
σπσ
σμ
(52)
Desta forma, a distribuição de probabilidade conjunta a posteriori é dada por
(
)
(
)
(
)
(
)
(
)
(
)
222222
|SS,,|ZZS
SSS
ppppp|,,,p
σσμσσμσσμ
. (53)
Para o procedimento de inferência são necessárias as condicionais
completas para parâmetros de
(
)
22
Sμ
S
,,,
σσ
=Θ dadas por:
i)
()
(
)
(
)
2
S,μ,|ZZ
σμμ
μ
pp,|p Θ
()
=
n
i
ii
SZe
1
2
2
2
1
μ
σ
ii)
(
)
(
)
(
)
22
S,μ,|ZZ
σσ
p|Sp,|Sp
Si
S
i
i
Θ
()
()
+
=
n
i
iiSi
S
SZSe
i
1
2
2
2
2
11
2
1
μ
σ
μ
σ
99
iii)
(
)
(
)
(
)
222
S,μ,|ZZ
2
σσσ
σ
pp,|p Θ
()
()
()
()
=
+
n
i
ii
/na
SZe
b
e
1
2
2
2
2
2
1
2
2
1
2
2
μ
σ
σ
σ
σ
σ
σ
()
()
()
()
+
=
++
n
i
ii
/na
SZbe
b
e
1
2
22
12
2
2
2
2
1
μ
σσ
σ
σ
σ
σ
iv)
()
() ( )
=
Θ
n
i
SSS
pp,|p
S
1
2
it
22
,SZ
2
σσσ
σ
() ()
()
∑∑
===
+
n
i
n
i
Si
S
T
j
/n
S
S
a
S
i
S
S
Se
b
e
11
2
2
1
2
2
2
1
2
2
1
2
2
μ
σ
σ
σ
σ
σ
σ
()
()
+
=
++
n
i
Si
S
i
SS
/na
S
i
S
S
S
S
n
be
b
e
1
2
222
12
2
2
1
2
2
2
μ
σσσ
σ
σ
σ
σ
Para a implementação do modelo foi utilizado o software WinBUGS, o
código utilizado bem como alguns exemplos de resultados para as cadeias geradas são
apresentados nos apêndices A, B, C e D. Utilizou-se uma cadeia de 32000 iterações onde as
22000 primeiras foram descartadas. A análise de convergência foi realizada através do
diagnóstico de Gelman e Rubin e das trajetórias das cadeias geradas. Isto é necessário, pois
caso não se tenha indicação de convergência o modelo deve ser revisto antes de adotado para
a aplicação a que se destina. Para mostrar um exemplo de convergência é apresentada nas
Figuras 28 e 29 a trajetória das cadeias geradas para os parâmetros
μ
e
1
S , respectivamente.
Ao longo das iterações, os valores gerados mostram aleatoriedade e as diferentes cadeias se
sobrepõem evidenciando a convergência.
Figura 28 – Trajetória das Cadeias geradas para parâmetro .
μ
100
Figura 29 – Trajetória das Cadeias Geradas para o efeito aleatório
1
S .
A Figura 30 apresenta os resultados de altura média a posteriori (em metros)
de cada região, com o algoritmo amostrador de Gibbs. Nessa Figura é possível visualizar a
discriminação dos objetos existentes na quadra urbana, como por exemplo, telhados, árvores
etc. As regiões com tonalidade preta representam os objetos mais altos na cena e as de
tonalidades mais claras estão associadas às regiões baixas.
O processo de fusão bayesiana visa encontrar similaridades probabilísticas
entre sub-regiões pré-detectadas, resultando em regiões com alta compatibilidade com os
objetos físicos. A Figura 30 mostra uma melhoria significativa no nível de fragmentação.
Pode-se notar visualmente que agora os quadrantes correspondentes ao objeto possuem
característica similar, isto é, mesma altura.
101
Figura 30 – Ilustração da altura média a posteriori (em metros) de cada região da cena.
3.1.4 Extração dos contornos das regiões altas
As duas últimas seções apresentaram os métodos utilizados para a detecção
das regiões altas. Esta seção mostra os procedimentos utilizados para obter os contornos
destas regiões. A fim de possibilitar o uso de técnicas conhecidas (como o detector de Canny
e métodos de vetorização e poligonização), para as quais se dispõe inclusive de
implementações computacionais, optou-se por processar o resultado obtido anteriormente a
fim de se obter uma imagem binária. Para gerar esta imagem, inicialmente é necessário
conhecer a resolução espacial e as dimensões da imagem (altura e largura), ou seja, o número
de linhas (L) e colunas (C). A próxima etapa consiste no estabelecimento de uma relação
matemática entre a posição de um pixel na imagem C)(L, e sua respectiva posição no MDE
segmentado, representada pelas coordenadas N)(E, . Esse procedimento é feito refletindo-se o
eixo N e transladando o MDE de tal forma que o canto superior esquerdo do retângulo que o
delimita corresponda ao ponto de coordenadas (0,0) na imagem. Além disso, deve-se aplicar
102
o fator de escala estabelecido pela resolução espacial da imagem. As formas analíticas das
equações utilizadas são:
emax
rN)(NL
=
, (54)
emin
r)E(EC
=
, (55)
onde:
(L,C): são as coordenadas de um pixel na imagem binária;
N)(E, as coordenadas planimétricas de um ponto no MDE segmentado;
)N,(E
maxmin
coordenadas do canto superior esquerdo do retângulo envolvendo o
MDE segmentado;
e
r a resolução espacial da imagem.
Vale notar que se r
e
for tomado como igual ao espaçamento da grade do
MDE segmentado, os valores obtidos para L e C serão inteiros. Essa opção é desejável porque
permite posteriormente transformar, mediante as equações 54 e 55, cada pixel da imagem
binária no correspondente ponto da grade do MDE, sem qualquer perda de precisão. A
geração da imagem binária é realizada através da varredura da grade da imagem binária,
atribuindo-se 0 (zero) para os pixels correspondentes às regiões altas e 1 (um) para os demais
pixels. A Figura 31 ilustra uma imagem binária gerada a partir dos resultados obtidos na etapa
de fusão Bayesiana de regiões.
Figura 31 – Imagem binária com as regiões altas.
103
Como as bordas dos objetos altos (tais como, edifícios, árvores etc.) na
imagem binária são degraus perfeitos, qualquer detector de bordas possibilitaria a detecção
dos pixels de contorno com alta qualidade. Em outras palavras, um algoritmo para
perseguição de contornos poderia ser diretamente aplicado aos dados acima. As limitações se
referem à própria complexidade das formas dos objetos detectados. Por exemplo, os objetos
contíguos são, às vezes, extraídos com um único contorno. O detector utilizado foi o de
Canny, uma vez que se dispunha de rotina computacional para este detector.
O resultado do processo de detecção de bordas utilizando o operador de
Canny é também uma imagem binária com bordas afinadas (com espessura de 1 pixel), onde
os pixels de borda recebem valor 0 (zero) e o fundo o valor 1 (um) (Figura 32).
Figura 32 - Imagem de bordas obtida pelo detector de bordas de Canny.
Após a detecção das bordas correspondentes aos contornos de regiões
existentes na imagem, é necessário organizar logicamente as respectivas cadeias de bordas.
Portanto, a imagem de bordas previamente obtida deve passar por processamentos posteriores
a fim de se obter representações adequadas para os contornos das regiões. A representação
dos contornos de telhados em polígonos é vantajosa em dois aspectos: a compacidade e a
simplicidade. Entretanto, para organizar o mapa de bordas dessa forma, são necessárias as
etapas de vetorização e poligonização. Estas técnicas foram brevemente descritas no Capítulo
2.
104
3.2 Extração automática de contornos de telhados de edifícios
A segunda etapa da metodologia consiste na separação dos telhados entre os
objetos altos extraídos na primeira etapa da metodologia. As regiões altas são agora
estruturadas segundo um RAG, onde cada nó do RAG corresponde a uma região alta. Nesta
etapa é utilizada uma abordagem baseada em MRF. Essa modelagem deve propiciar a
obtenção apenas dos contornos correspondentes aos telhados. Vale ressaltar que, como é
necessário o cálculo de vários atributos com base no MDE, é necessário que os contornos
obtidos na primeira etapa, representados no referencial de uma imagem binária, devem ser
transformados para o referencial do MDE, via inversa das Equações 54 e 55. Nesse
referencial, apenas são retidos os contornos (E, N) referentes aos objetos altos, juntamente
com as informações de altura média de cada região. O restante das informações do referencial
do MDE é considerado como fundo.
A análise de cada região, dadas as medidas de alguns atributos realizadas
nas regiões do MDE, por hipótese obedece a um MRF. Assim, a construção do MRF envolve
a definição de funções apropriadas e o problema de análise é resolvido a partir da estimativa
MAP. A partir do conhecimento a priori do objeto de interesse é possível realizar a extração
automática de contornos de telhados. A fim de ilustrar esse processo é apresentado a seguir
(Figura 33) um fluxograma das etapas necessárias para resolver o problema de extração de
telhados.
105
Objetos altos
Caracterização do conhecimento
sobre contornos de edifícios
Definição da função de energia
Estabilidade
Sim
Contornos de telhados
extraídos
Minimização da função de
energia
Não
Figura 33 – Fluxograma simplificado do processo de extração automática de contornos de telhados.
3.2.1 Caracterização do conhecimento sobre contornos de telhados
Em uma quadra urbana existe um conjunto de objetos variados, onde a
heterogeneidade geralmente é elevada. Isto implica que mais detalhes sobre o objeto de
interesse devem ser explorados para auxiliar no seu reconhecimento. Os telhados possuem
algumas propriedades de interesse, sendo elas, geométricas, ou seja, as que estão relacionadas
com a área, o perímetro, a retangularidade, direção angular etc., e as relações contextuais nas
quais o objeto telhado se relaciona com outros objetos presentes na cena (por exemplo,
ângulos entre eixos de objetos).
Para definir a clique, inicialmente assumiu-se que os objetos altos
()
n,...,i,R
i
1=
, imersos num fundo F, são modelados como MRF. A vizinhança
i
R
η
, isto é,
das regiões
j
R
vizinhas de
i
R
()
ji
, é definida na forma,
106
(
)
{
}
rR,Rdist|R
ijjr,R
i
=
η
, (56)
onde a função dist é dada pela distância euclidiana entre os centros de massa de dois objetos
analisados
(
)
ji
R,R
e r é a distância máxima permitida entre
i
R
e
j
R
. A Figura 34 mostra um
exemplo de vizinhança (
r,R
i
η
), onde todas as regiões dentro do raio máximo são consideradas
vizinhas da região i. Na Figura 34, os pontos representam o centro de massa dos objetos altos.
. . . .
. . . .
. . . . .
. . .
. . .
. . . .
R
i
r
r,i
η
Figura 34 – Exemplo de vizinhança.
Uma vez estabelecido o critério de vizinhança
(
)
(
)
rR,Rdist
ij
, define-se
uma vizinhança individual e, a partir desta definição, tem-se o sistema de vizinhança
() ()
[]
n
R,...,R
η
η
η
1
=
. Os conceitos de clique individual C e de coleção de cliques
(
)
(
)
η
,GC
seguem o formalismo apresentado no Capítulo 2.
A construção da função de energia ( | , )UI F
κ
depende substancialmente do
conhecimento a priori sobre as propriedades do objeto telhado. O conhecimento a priori a
respeito do objeto de interesse denotado por
κ
é muito importante na análise de imagem, pois
impõe uma forte suposição sobre o que se espera da cena antes de aplicar o algoritmo para
realizar a análise. A caracterização de
κ
implica em estabelecer valores nominais para os
atributos que são considerados importantes para decisão em uma análise. Por exemplo, a área
mínima de um edifício pode ser estabelecida como sendo 30m
2
. Já os valores nominais para o
conjunto (F) de atributos podem ser medidos no polígono envolvente que contém cada objeto
individual e entre polígonos caracterizando a relação contextual entre os objetos. Para tanto é
necessário estabelecer um conjunto (F
c
) de atributos sobre a clique. O conjunto (F) de
atributos é expresso por,
107
{| (,)}
c
FF cCG
η
=∀ ,
onde
1
{ ,..., }
ccc
q
FFF= ,
é o conjunto de q atributos medidos sobre a clique individual
.c Cabe ressaltar que esses q
atributos seriam os mesmos usados na caracterização do conhecimento a priori
κ
, só que
nesse caso eles assumem valores que caracterizam os objetos de interesse.
Os atributos para a clique de primeira ordem utilizados neste trabalho foram
a área e a retangularidade. Esses atributos podem ser expressos matematicamente segundo as
propriedades geométricas do objeto. O primeiro atributo baseia-se na área (A) do polígono
envolvendo o objeto individual e é definido matematicamente pela fórmula de Gauss dada
por:
2
1
0
1
0
11
∑∑
=
=
++
=
n
i
n
i
iiii
NENE
A , (57)
onde ( , )EN correspondem às coordenadas planimétricas de um ponto no referencial do
MDE.
Este atributo permite, por exemplo, que objetos pequenos como caixas
d’água, cuja área é relativamente menor em relação aos telhados, possam ser eliminados da
análise. Para que isso seja possível, a Equação de energia (Seção 3.2.2) deve penalizar
pequenas áreas.
O segundo atributo, retangularidade (R), é obtido através do ângulo formado
pela direção principal e secundária do objeto. Para obter o eixo principal de um objeto são
calculadas todas as direções dos segmentos de reta de um polígono representando o objeto.
Para obter a direção mais freqüente que é correspondente à direção do eixo principal, faz-se
uma divisão setorial, particionando o círculo trigonométrico em 24 setores de 15 graus
(Figura 35). Cada setor é representado pelo seu valor angular central (por exemplo, o setor de
amplitude [345º; 360º] é representado pelo ângulo 372,5º).
108
Figura 35 – Divisão setorial do circulo trigonométrico.
A direção do eixo principal e secundário de um objeto é calculada na forma
que segue:
1 – calcular a direção e comprimento de cada segmento de reta do polígono que representa o
objeto;
2 – inicializar cada setor com valor nulo;
3 – para uma dada direção de um dado segmento de reta, verificar qual setor que a contém,
adicionando a este setor o valor inteiro do comprimento do respectivo segmento de reta;
4 – repetir o passo 3 para todos os segmentos de reta do polígono;
5 – identificar as direções dos eixos principal e secundário como sendo a primeira e a segunda
direção mais freqüente, respectivamente.
O resultado do algoritmo acima poderia ser representado na forma do
histograma da Figura 36. Nesse caso, o resultado obtido para a direção do eixo principal foi
7,5º e a direção do eixo secundário foi de 247,5º. Este resultado foi obtido a partir de um
contorno de um objeto real, que no caso é um telhado.
109
0
5
10
15
20
25
30
35
40
45
50
15
30
45
60
75
90
105
120
135
150
165
180
195
210
225
240
255
270
285
300
315
330
345
Setores
Frequência
Figura 36 – Histograma de freqüência.
A retangularidade é expressa matematicamente por,
θ
senR =
(58)
onde,
θ
é o ângulo entre os eixos principal e secundário.
O atributo R beneficia os objetos com formas geométricas regulares, onde
prevalecem os ângulos retos nos vértices do contorno. O valor ótimo para R é 1 (um), sendo
este um dos valores a ser incluído no conhecimento
κ
. O valor de R é 1 (um) em situações
ideais, quando
o
90=
θ
ou
o
270=
θ
.
O terceiro atributo baseia-se em cliques de segunda ordem. Sendo
ij
θ
o
ângulo entre as direções principais de dois objetos
(
)
ji
R,R , define-se o seguinte atributo de
relacionamento espacial,
)2(),(
ijji
senRR
θ
=
Φ
. (59)
110
Esse atributo possibilita a verificação do paralelismo ou perpendicularismo
entre objetos, pois se
o
0=
j,i
θ
(objetos com eixos principais paralelos) ou se
o
90=
j,i
θ
(objetos com eixos principais perpendiculares),
0=Φ )R,R(
ji
. Portanto, no conhecimento
κ
deve ser assumido que o valor ótimo para este parâmetro é 0 (zero)
Em relação às cliques, foram utilizadas neste trabalho as de primeira e
segunda ordem. A clique de primeira ordem consiste de uma lista de objetos altos com
atributos (área e retangularidade) caracterizando os objetos individualmente. Já a clique de
segunda ordem é composta de uma lista de objetos, relacionando-se aos pares, caracterizadas
por atributos relacionais (no caso o atributo dado pela Equação 59).
3.2.2 Definição da função de energia
A análise de objetos usando a abordagem MRF tem como princípio a
minimização da função de energia. Para o problema em questão, espera-se que para um
determinado MDE a solução seja ótima, isto é, que seja obtida uma configuração de contornos
de telhados, correspondente ao valor mínimo da função de energia. Entretanto, essa análise
ótima depende de como a função de energia é definida. Para a definição da função de energia
é necessário definir a função potencial. Definições de função potencial de primeira e segunda
ordem, assumida na metodologia desenvolvida, foram descritas na Seção 3.2.1. A forma geral
da função potencial de segunda ordem
(
)
κ
,f|xV
cc
c
2
é dada por,
()
()
()
κακακ
η
η
,f|xS,f|xB),f|x(V
cc
q
r
t
r,GCc
rccr
c
cc
c
mm
ji
ji
∑∑
==
+=
11
21
2
, (60)
onde
c representa uma clique individual de primeira e segunda ordem,
m
q é o número de
atributos para cliques de primeira ordem, t
m
é a quantidade de atributos para cliques de
segunda ordem,
21
e
α
α
são pesos,
r
c
B
representa a função base correspondente a clique de
primeira ordem e ao atributo r,
,ij
η
é a vizinhança da posição ( , )ij e
r
ji
S
η
aparece no
segundo termo e é responsável pela modelagem de contexto para a clique de segunda ordem .
111
A função de energia utilizada neste trabalho teve como inspiração o trabalho
desenvolvido por Krishnamachari e Chellappa (1996). Eles propuseram a Equação de energia
E dada por,
E=-
=
n
i
i
i
d
)p(
1
1
α
-
'
1
|sen(2 )|
l
j
n
ij ij
ijN
pp
β
θ
=∈
∑∑
+
∑∑
=∈
n
iNj
ijji
i
l
Dpp
1
ω
()()
[]
()
6111
1
iiii
n
i
plnpplnp +
=
γ
onde:
α
,
'
β
,
ω
e
γ
são pesos que dão a importância relativa para cada termo de energia; d
i
é
o comprimento da feição reta l
i
; p
i
é uma medida que dá o grau de compatibilidade de l
i
com
uma aresta de um telhado;
ij
θ
é o ângulo entre as feições retas l
i
e l
j
; D
ij
é a distância entre os
extremos mais próximos das feições retas l
i
e l
j
.
Neste trabalho, Krishnamachari e Chellappa (1996) obtêm ao final do
processo de minimização, isto é, com E mínimo, uma configuração ótima das feições retas na
forma de telhados de edifícios na imagem aérea. A Equação de energia de Krishnamachari-
Chellapa (Equação 60) foi modificada para possibilitar a extração de contornos de telhados, a
partir de contornos de objetos altos previamente extraídos, ficando,
()()
[]
∑∑
==∈==
+++
+=
n
i
iiii
n
i),G(j
ijji
n
i
i
i
n
i
i
plnpplnp)(senpp
A
)p(
)r(U
1111
112
1
1
γθωβα
η
(62)
onde:
α
,
β
,
ω
e
γ
são pesos que dão a importância relativa para cada termo das funções de
energia; r
i
é a medida de retangularidade do objeto R
i
; A
i
é a área do objeto R
i
; p
i
(ou p
j
) é
uma medida individual de compatibilidade de R
i
(ou R
j
) com um contorno de telhado;
ij
θ
é o
ângulo entre as direções dominantes dos objetos R
i
e R
j.
Minimizar a função de energia U (Equação 62) implica em minimizar
simultaneamente os quatro termos de energia de U. Notar que o primeiro termo favorece
feições retangulares, pois feições com essas características têm a retangularidade próxima de
1. O segundo termo de energia favorece feições com áreas maiores, pois é inversamente
proporcional à área A
i.
O terceiro termo de energia favorece o agrupamento de telhados, isto
porque os eixos principais dos telhados são paralelos ou perpendiculares, isto é, sen(2 x 0
o
) =
sen(2 x 90
o
) = 0. O último termo da função de energia é a Equação de entropia, que força as
variáveis p
i
a assumir no final do processo de minimização valores nulos ou unitários. O
112
primeiro, segundo e quarto termo da função de energia são definidos com base em cliques de
primeira ordem. Já o terceiro termo refere-se a cliques de segunda ordem. No final do
processo de minimização, isto é, quando U for mínimo, obtém-se uma configuração ótima dos
contornos que são telhados de edifícios. O valor final de p
i
para contornos de telhados é um,
enquanto que para as outras feições é zero. Isso significa que a solução final da Equação de
energia via algoritmo SA pode ser representada como na Figura 37.
p
1
p
2
p
3
p
n-1
p
n
Trajetória realizada
1
0
Figura 37 – Representação da solução da Equação de energia.
113
4 RESULTADOS E ANÁLISES
4.1 Considerações iniciais
Este capítulo tem por finalidade apresentar os resultados obtidos com a
metodologia de extração automática de contornos de telhados, bem como os materiais e
equipamentos utilizados para o desenvolvimento desse trabalho.
Conforme descrito no Capítulo 3, os dados de varredura a laser utilizados
neste trabalho são as coordenadas de pontos regularmente distribuídos, isto é, um MDE obtido
após o processo de interpolação. É importante ressaltar que na etapa de segmentação foram
realizados testes com a imagem de intensidade, mas devido à variabilidade de reflexão de
cada objeto, foi praticamente impossível obter bons resultados com esse tipo de informação.
Os resultados obtidos com a metodologia proposta foram contornos locais
representando telhados. A análise foi realizada visual e numericamente, tendo por base
comparações entre os resultados obtidos com o método de extração e os correspondentes
resultados obtidos manualmente. Estes últimos foram obtidos através de digitalização manual
dos contornos de telhados nas imagens de intensidade fornecidas por varredura a laser da
região teste e foram utilizados como dados de referência para a avaliação da metodologia
proposta. Esses dados encontram-se no mesmo referencial, logo a análise visual foi realizada
a partir da comparação entre os grupos de contorno (extraído e manual), simultaneamente,
sobre as imagens de intensidade. Ambos os grupos de contornos foram comparados
numericamente, consistindo em obter as porcentagens de falsos positivos (extração errada),
falsos negativos (não extração) e a razão de extração de edifícios (REE), proposta por Ruther,
Martine e Mtalo (2002) e dada pela seguinte formulação
100×
+
=
EEEC
EC
REE , (63)
onde
EC é o número de estruturas identificadas corretamente pelo método de extração e
EE é o número de estruturas identificadas erroneamente pelo método de extração.
114
Outro indicador de qualidade, proposto por Ruther, Martine e Mtalo (2002),
foi adaptado e utilizado neste trabalho. Trata-se da completeza de área do contorno de
telhado, obtida em função das áreas dos contornos extraídos e dos respectivos contornos de
referência obtidos por um operador,
1001 ×
=
A
BA
CA , (64)
onde
CA é o indicador de completeza de área do contorno de edifício;
A é a área do contorno de telhado extraída pelo operador;
B é a área do contorno de telhado obtida pelo método de extração.
McKeown et al. (2000) sugere que uma sobreposição de 50% é adequada
para assumir que o telhado foi detectado. Cabe ainda ressaltar que as porcentagens de falsos
positivos (extração errada) e a REE são complementares (a soma de ambos é 100%), e,
portanto, neste caso optou-se apenas pela utilização da REE.
4.1.1 Recursos computacionais
A metodologia de extração automática de contornos de telhados foi
implementada em linguagem C++ utilizando o compilador Borland C++ Builder 4 e o
software WinBUGS 1.4 no sistema operacional Windows XP. O computador utilizado no
trabalho foi um AMD Dual Core 4600, com 3GB de memória RAM e 1 disco rígido com
capacidade total de 200GB. Outros softwares contribuíram no desenvolvimento do trabalho,
entre eles se destaca o Surfer 8 (versão DEMO) e o MicroStation V8.
115
4.1.2 Dados utilizados no trabalho
Foram utilizados neste trabalho os dados brutos cedidos pelo LACTEC.
Esses dados estão em formato de arquivo texto, divididos por faixa de vôo e retorno de pulso
laser, ou seja, primeiro e último pulso. O arquivo de coordenadas (exemplificado na Figura
38) se refere às coordenadas E (primeira coluna de dados), N (segunda coluna de dados), h
(terceira coluna de dados) e I (quarta coluna de dados).
Figura 38 – Parte de um Arquivo de coordenadas.
Além dos conjuntos de dados no referencial SAD69, foram cedidos pelo
LACTEC a imagem de intensidade gerada a partir da resposta de intensidade dos alvos,
correspondente à área teste. Os testes foram realizados usando recortes de dados,
considerando as áreas de interesse para a avaliação da metodologia desenvolvida.
116
A imagem de intensidade (Figura 39) foi utilizada na escolha das áreas teste
e na avaliação dos resultados obtidos através do método de extração automática de contornos
de telhados. Essa imagem é georreferenciada e foi obtida com o a informação do retorno do
primeiro pulso laser. Esta imagem possui 8239 linhas e 9751 colunas.
Figura 39 – Imagem de intensidade de retorno do pulso laser.
A Figura 40 mostra a sobreposição de um conjunto de dados,
correspondente a uma faixa de vôo, na imagem de intensidade. Essa visualização dos dados
sobre a imagem foi de suma importância na escolha das áreas teste, pois possibilitou a seleção
de áreas com graus de complexidade diferentes para o processo de extração.
117
Figura 40 – Dados brutos (representados na cor branca) correspondentes a uma faixa de vôo,
sobrepostos à imagem de intensidade.
O arquivo de dados correspondente à imagem mostrada na Figura 40 possui
3.874.395 milhões de valores correspondentes ao retorno do primeiro pulso referentes a
primeira faixa de vôo.
4.2 Aspectos computacionais
Para a realização da metodologia de extração automática de contornos de
telhados foram desenvolvidos programas computacionais que são utilizados desde a etapa de
preparação dos dados até a etapa final de extração de contornos de telhados. Foram utilizados
118
programas pré-existentes, como por exemplo, o detector de bordas de Canny (JAIN,
KASTURI, e SCHUNCK, 1995) e outro de vetorização e poligonização (DAL POZ, 2002).
A seqüência mostrada a seguir apresenta todo o procedimento utilizado para
a realização da metodologia de extração automática de contornos de telhados, dando ênfase
aos aspectos computacionais envolvidos em cada etapa.
1 - Escolha da área teste: este procedimento é realizado no software MicroStation V8, onde
são sobrepostos os dados brutos sobre a imagem de intensidade e realizada a escolha da área
desejada, bem como a definição dos limites da área teste.
2 – Seleção das coordenadas referentes a área teste: a seleção é feita utilizando um programa
desenvolvido em linguagem C++, tendo por base os limites pré-definidos da área de interesse.
3 – Interpolação dos dados: Os dados brutos da área teste são interpolados no software Surfer,
gerando uma malha regular. O método de interpolação utilizado foi o vizinho mais próximo.
4 – Realização da segmentação via algoritmo quadtree: segmentação inicial dos dados
utilizando a estrutura quadtree desenvolvida em linguagem C++. Nesta etapa são obtidos os
dados de entrada para o software WinBUGS.
5 – Fusão Bayesiana de regiões: o software WinBUGS é utilizado para fornecer os resultados
referentes aos objetos altos existentes na área teste.
6 – Transformação de coordenadas: Nesta etapa foi utilizada uma rotina implementada em
linguagem C++, que realiza a transformação de coordenadas do referencial do MDE para o
referencial da imagem binária.
7 – Detecção de bordas: foi utilizada uma rotina computacional em C++ do algoritmo de
Canny.
8 – Vetorização e Poligonização: foram utilizados programas pré-existentes de vetorização e
poligonização desenvolvidos em linguagem C++.
9 – Extração de contornos de telhados: foi utilizado um programa desenvolvido em linguagem
C++ para realizar a extração de contornos de telhados.
10 – Visualização dos resultados: o resultado final pode ser visualizado no referencial da
imagem binária ou no referencial do MDE. Neste último caso é utilizado o software
MicroStation V8.
119
4.3 Experimentos e discussões
Para verificar a viabilidade da metodologia desenvolvida foram realizados
cinco experimentos com áreas testes distintas. A primeira área teste compreende uma região
onde se tem apenas uma edificação mas, no entanto, se trata de uma edificação de grande
porte, possuindo nas adjacências áreas verdes, estacionamentos, ruas, calçadas etc. (Figura
41). Alguns aspectos, como a presença de uma única edificação, favorecem a extração. Por
outro lado, o entorno dificulta o processo de extração, pois existem árvores que podem ser
extraídas na primeira etapa da metodologia e que na segunda etapa devem ser eliminadas do
processo de extração. Outra dificuldade desta cena é o formato irregular da edificação.
Figura 41 – Área teste 1.
120
Figura 42 – Visualização tridimensional do MDE referente à área teste 1.
A visualização tridimensional do MDE (Figura 42) é um recurso útil, pois
permite visualizar melhor os objetos existentes na cena. Neste caso, pode-se ter uma visão
mais realística do entorno dos edifícios, como por exemplo, os estacionamentos, que na
imagem de intensidade (Figura 41) possui tons de cinza semelhantes aos da edificação.
Quando se utiliza o recurso de visualização tridimensional do MDE, torna-se possível
distinguir visualmente os objetos existentes na área teste.
A segunda área teste é ilustrada a partir da imagem de intensidade (Figura
43) e da visualização tridimensional do MDE (Figura 44). Essa área teste possui
características semelhantes à da primeira área teste, visto que se trata de um edifício isolado,
rodeado de área verde, estacionamentos etc.. Os aspectos favoráveis e desfavoráveis ao
processo de extração são semelhantes aos da área teste 1.
121
Figura 43 – Área teste 2.
Figura 44 – Visualização tridimensional do MDE referente à área teste 2.
Novamente a visualização tridimensional ilustrada na (Figura 44) permite
uma discriminação visual dos objetos existentes na cena.
122
Para ilustrar a área teste 3, novamente são utilizadas a imagem de
intensidade (Figura 45) e a visualização tridimensional do MDE (Figura 46). Esta cena
favorece a extração de edifícios já que o mesmo se encontra isolado de outras edificações.
Figura 45 – Área teste 3.
Figura 46 – Visualização tridimensional do MDE referente à área teste 3.
123
A Figura 47 mostra a área teste 4 e a Figura 48 sua visualização
tridimensional. Esta área teste apresenta alta complexidade para o processo de extração. Nessa
área existem edifícios de maior porte e também telhados de casas. Há também a presença de
árvores e outros objetos, fatores que desfavorecem o processo de extração.
Figura 47 – Área teste 4.
Figura 48 – Visualização tridimensional do MDE referente à área teste 4.
124
A Figura 48 permite uma visualização mais detalhada das regiões referentes
aos objetos altos. As regiões pertencentes a estacionamentos, pátios e quintais que possuem
tons de cinza semelhante aos das edificações, apresentam-se com boa discriminação visual.
A área teste 5, representada pela imagem de intensidade (Figura 49) e pela
visualização tridimensional do MDE (Figura 50), é um exemplo de uma área urbana com alta
complexidade. Esta área apresenta prédios, estacionamentos e outros objetos que dificultam o
processo de extração, pois ainda na primeira fase da metodologia torna-se difícil segmentar
regiões relacionadas com os objetos existentes na cena. A visualização tridimensional
proporciona uma boa verificação visual dos objetos existentes na área, fato que auxilia na
análise visual do método de extração automática de contorno de telhados.
Figura 49 – Área teste 5.
125
Figura 50 – Visualização tridimensional do MDE referente à área teste 5.
4.3.1 Primeiro experimento
Na área teste 1 a cena envolvida não é de grande complexidade, visto que
somente um telhado está presente. No entanto, a forma irregular do edifício pode acarretar em
algumas dificuldades, principalmente se a etapa inicial de segmentação não fornecer um
resultado satisfatório. Os resultados obtidos com a metodologia de extração automática de
contornos de telhados de edifícios são mostrados na Figura 51.
126
(a) (b)
(c) (d)
(e)
Figura 51 – Imagens resultantes do método de extração de contornos de telhados aplicado à área teste
1. (a) área teste escolhida para a aplicação do método de extração; (b) resultado obtido após a fusão
Bayesiana de regiões; (c) imagem binária das feições detectadas; (d) detecção das bordas da imagem
binária; (e) resultado da extração de contornos de telhados no referencial da imagem binária.
127
A Figura 51(d) mostra o resultado obtido com a extração de contornos de
feições altas. Pode-se verificar nesta Figura que a fusão bayesiana extraiu um único contorno
de telhado. No entanto, verifica-se a dificuldade de estabelecer visualmente (Figura 51(a)) a
presença de 1 (um) ou 2 (dois) edifícios na cena.
Para uma análise visual mais consistente, a Figura 52 mostra os contornos
extraídos com a metodologia proposta (em vermelho) e os contornos de referência (em azul)
sobrepostos na imagem de intensidade. Pode-se verificar visualmente que esse contorno
corresponde ao telhado existente na área teste.
Figura 52 – Visualização do contorno extraído e do contorno de referência.
Para comparar numericamente os resultados obtidos, considerou-se a
existência de apenas um telhado na área teste, resultando na extração manual de apenas um
contorno (em azul) na Figura 52. A Tabela 2 mostra os resultados numéricos obtidos com o
método de extração.
128
Tabela 2
– Análise numérica dos resultados obtidos com o método de extração automática de
contornos de telhados.
Falsos Negativos REE CA
Porcentagem 0% 100% 94%
Convém salientar que o parâmetro numérico de falso positivo e a REE são
complementares (isto é, falsos positivos + REE = 100%), logo optou por utilizar apenas a
REE neste trabalho. Neste experimento não houve falsos positivos, logo a REE foi máxima,
fato que credencia o método de extração neste experimento. A Tabela 2 mostra também que
não ocorreu nenhum falso negativo. Outro indicativo importante foi a inexistência de falsos
negativos e a alta CA, visto que, a região de contorno extraída tem uma sobreposição de 94%
em relação à região de contorno de referência.
O deslocamento dos contornos extraídos foi um problema comum a todos os
experimentos. Como este deslocamento é sistemático, ele pode estar relacionado com o
fenômeno de sombra (ausência de dados resultante do primeiro retorno do pulso laser)
combinado com a interpolação dos dados realizada com o método do vizinho mais próximo.
Outro problema comum a todos os experimentos foi a dificuldade em medir os contornos de
referência na imagem de intensidade. Visualmente esta imagem é muito confusa e dificulta
até mesmo para o operador humano a identificação correta dos contornos de telhados.
4.3.2 Segundo experimento
A área teste escolhida para a realização deste experimento, tem como
característica uma menor complexidade em relação à área teste usada no experimento
anterior. A Figura 53 mostra os resultados obtidos com a metodologia de extração automática
de contornos de telhados.
129
(a) (b)
(c) (d)
(e)
Figura 53 – Imagens resultantes do método de extração de contornos de telhados aplicado à área teste
2. (a) área teste escolhida para a aplicação do método de extração; (b) resultado obtido após a fusão
Bayesiana de regiões; (c) imagem binária das feições detectadas; (d) detecção das bordas da imagem
binária; (e) resultado da extração de contornos de telhados no referencial da imagem binária.
130
Na Figura 53 pode-se verificar que a fusão bayesiana extraiu inúmeros
objetos altos, incluindo os dois contornos de telhados de edifícios. Para uma análise visual
mais consistente os contornos extraídos (em vermelho) e os de referência (em azul) foram
sobrepostos a imagem de intensidade (Figura 54).
Figura 54 – Visualização do contorno extraído e do contorno de referência.
A Figura 54 mostra que o telhado 2 foi extraído mesmo possuindo um porte
bem menor que o telhado 1, dada a forma que a Equação de energia foi definida (Equação 62)
objetos de área relativamente menor podem ser descartados. Entretanto, fica evidente que a
situação é bem favorável para os atributos de relacionamento espacial e de retangularidade,
beneficiando a extração dos dois telhados existentes na cena. Pode-se perceber que ambos os
contornos extraídos também estão sistematicamente deslocados em algumas partes em relação
aos correspondentes contornos de referência. Apesar disso, pode-se considerar que os
resultados foram satisfatórios.
Numericamente, como poderá ser verificado a seguir, as análises visuais são
confirmadas tendo por base os contornos extraídos e os contornos de referência. Os
parâmetros numéricos de qualidade para ambos os telhados foram calculados e apresentados
na Tabela 3.
Telhado 1
Telhado 2
131
Tabela 3
– Análise numérica dos resultados obtidos com o método de extração automática de
contornos de telhados.
Falsos Negativos REE CA (telhado 1) CA (telhado 2)
Porcentagem 0% 100% 91% 97%
O parâmetro de REE atingiu, como no experimento anterior, o valor ótimo,
isto é, 100%. Em outras palavras, o método não extraiu nenhum falso positivo. Um indicativo
importante para credenciar a utilização do método é o parâmetro CA que neste caso se
manteve alta para os dois telhados extraídos. O telhado 1 possui uma região extraída com uma
sobreposição em relação a respectiva área de referência de 91%, sendo que o telhado 2 possui
para o mesmo indicador o valor de 97%. Entretanto, sabe-se que as diferenças de áreas em
relação aos valores ótimos (100%) são devidas à qualidade aproximada dos contornos
extraídos.
4.3.3 Terceiro experimento
Na terceira área teste o edifício apresenta-se de forma isolada, o que é
altamente favorável para a metodologia. A Figura 55 mostra os resultados obtidos com a
metodologia desenvolvida.
132
(a) (b)
(b) (d)
(e)
Figura 55 – Imagens resultantes do método de extração de contornos de telhados aplicado à área teste
3. (a) área teste escolhida para a aplicação do método de extração; (b) resultado obtido após a fusão
Bayesiana de regiões; (c) imagem binária das feições detectadas; (d) detecção das bordas da imagem
binária; (e) resultado da extração de contornos de telhados no referencial da imagem binária.
133
Verifica-se na Figura 55(d) a presença de um falso contorno (destacado por
flechas) correspondente aos limites dos dados. Esses contornos causam falsos positivos de
freqüência no método do círculo trigonométrico setorizado. A utilização de tais informações
poderia ocasionar a extração de um falso positivo, visto que os eixos principais e secundários
ficariam bem definidos e o atributo de retangularidade indicaria o objeto como sendo um
telhado. No entanto, os falsos contornos são facilmente identificados e assim não são
utilizados no cálculo dos atributos, evitando que os mesmos interfiram nos resultados.
Novamente, a fusão bayesiana separou vários objetos altos, inclusive o objeto com contorno
do limite dos dados.
A Figura 56 mostra o contorno extraído (em vermelho) e o contorno de
referência (em azul) que foram utilizados para o cálculo dos parâmetros de qualidade.
Figura 56 – Visualização dos contornos extraído e de referência.
Na Figura 56 nota-se a presença de apenas um objeto e este foi extraído
corretamente. O resultado dos indicadores de qualidade é mostrado na Tabela 4.
Tabela 4
– Análise numérica dos resultados obtidos com o método de extração automática de
contornos de telhados.
Falsos Negativos REE CA
Porcentagem 0% 100% 95%
134
Neste experimento os indicadores de qualidade credenciam a utilização da
metodologia para a extração de contornos de telhados isolados. Não houve falsos negativos e
a REE obteve o valor ótimo. Desta forma, também não ocorreram falsos positivos. Já o
parâmetro CA, novamente se manteve muito bom. Este último indicador mostrou que a região
de telhado extraído tem 95% de sobreposição em relação à região de referência.
4.3.4 Quarto experimento
Neste experimento foi utilizada uma área teste que apresenta maior
quantidade de telhados, ou seja, 6 (seis) edifícios isolados, sendo que 3 (três) deles estão
alinhados e praticamente ligados, 2 (dois) outros estão isolados e o último é um edifício
menor rodeado de vegetação. Cabe ressaltar que, diferente deste experimento, os
experimentos realizados até aqui apresentavam edifícios isolados. Na Figura 57 é mostrada a
área teste selecionada e as imagens resultantes de cada etapa desenvolvida no processo,
ressaltando que o resultado final é um arquivo de coordenadas no referencial do MDE
sobreposto a imagem de intensidade.
135
(a) (b)
(c) (d)
(e)
Figura 57 – Imagens resultantes do método de extração de contornos de telhados aplicado à área teste
4. (a) área teste escolhida para a aplicação do método de extração; (b) resultado obtido após a fusão
Bayesiana de regiões; (c) imagem binária das feições detectadas; (d) detecção das bordas da imagem
binária; (e) resultado da extração de contornos de telhados no referencial da imagem binária.
136
Realizando uma análise visual nos resultados apresentados na Figura 57,
verifica-se que o maior telhado existente na área teste (três edifícios alinhados) foi fundido
ainda na etapa de fusão bayesiana (Figura 57(b)), resultando em um único contorno de
telhado. Isso provavelmente se deve ao fato da sombra (ausência de dados do primeiro pulso
laser) nas fendas entre essas edificações, fazendo com que o método de interpolação pelo
vizinho mais próximo preencha essas fendas estreitas com alturas dos telhados. A Figura
57(b) mostra (em destaque) um edifício de porte bem menor misturado com a vegetação
adjacente, sendo que neste caso não foi possível ainda na primeira etapa da metodologia
separar essa edificação. Isso mostra que outras estratégias são necessárias para filtrar a
vegetação antes de se realizar a segunda etapa da metodologia. Nota-se também que a fusão
bayesiana conseguiu separar eficientemente os dois telhados isolados. Embora o método de
fusão bayesiana tenha unido os três telhados alinhados, o resultado obtido neste experimento é
consistente no que se refere à extração de telhados. A Figura 58 mostra os contornos extraídos
(em vermelho) e os de referência (em azul) sobrepostos a imagem de intensidade.
Telhado 2 Telhado 1
Telhado 3
Figura 58 – Visualização dos contornos extraído e de referência e respectiva identificação para a
análise numérica.
Na Figura 58 pode-se analisar visualmente o resultado do método de
extração. Nesta área foram extraídos três contornos de telhados (em vermelho) e um telhado
(em verde) não foi extraído. A Tabela 5 mostra os parâmetros numéricos de qualidade de
137
falsos negativos e REE para a área teste 4. Notar que esta Tabela não mostra o resultado do
parâmetro CA. Como existem vários telhados na cena, optou-se por apresentar o parâmetro
CA separadamente para cada telhado (Tabela 6).
Tabela 5
– Análise numérica dos resultados obtidos com o método de extração automática de
contornos de telhados.
Falsos Negativos REE
Porcentagem 25% 100%
Na Tabela 5 é possível verificar o bom desempenho do método de extração,
visto que houve apenas um falso negativo. Já o parâmetro REE atingiu o valor ótimo, fato
decorrente da não ocorrência de falsos positivos.
A Tabela 6 mostra os resultados obtidos em relação ao indicador CA para
cada contorno de telhado extraído na área teste. Os três contornos de telhados extraídos são
identificados na Figura 58.
Tabela 6
– Análise numérica dos resultados obtidos com o indicador CA para cada contorno de
telhados extraído.
Telhados 1 2 3
Porcentagem 91,6% 87,9% 61,5%
Os parâmetros CA, de um modo geral, indicam a boa performance do
algoritmo de extração de contornos de telhados, podendo-se ressaltar que a CA para o telhado
1 foi de 91,6%, valor considerado muito bom. Para o telhado 2 esse valor foi de 87,9% e
apenas para o telhado 3 esse parâmetro ficou abaixo da média obtida até então (61,5%). No
entanto, ainda este valor está dentro dos padrões aceitáveis (50%) para que o edifício 3 seja
considerado extraído (MCKEOWN et al., 2000).
4.3.5 Quinto experimento
A área teste 5 (Figura 59) foi escolhida com o intuito de aumentar a
complexidade do problema, visto que vários objetos altos estão presentes na cena. Os
138
resultados obtidos com a metodologia automática de extração de contornos de telhados são
mostrados na Figura 59.
(a) (b)
(c) (d)
(e)
Figura 59 – Imagens resultantes do método de extração de contornos de telhados aplicado à área teste
5. (a) área teste escolhida para a aplicação do método de extração; (b) resultado obtido após a fusão
Bayesiana de regiões; (c) imagem binária das feições detectadas; (d) detecção das bordas da imagem
binária; (e) resultado da extração de contornos de telhados no referencial da imagem binária.
Analisando-se a Figura 59, verifica-se que há na cena 14 (quatorze) edifícios
139
e 1 (um) objeto qualquer com forma irregular. Alguns desses edifícios apresentam certa
irregularidade local nos contornos, mas possuem forma geral relativamente regular. Diante
dessas características, existe a necessidade de usar, no atributo de direção, setores com
amplitudes de aproximadamente 15º para calcular as direções principais dos objetos. Este
procedimento permite geralmente determinar as duas direções predominantes (principais) dos
objetos mesmo quando as formas não são bem regulares. Uma maior dificuldade pode surgir
no cálculo da direção secundária, especialmente no caso de objetos alongados e com
arredondamento nos lados menores. Existe nesta área teste dois edifícios com esta
característica. De fato, verificou-se na Figura 59(e) a extração de dois telhados com formas
mais alongadas, esta extração foi possível graças a injunção espacial, visto que este atributo
depende somente da direção principal. Os resultados satisfatórios obtidos neste experimente
se devem em boa parte, à fusão bayesiana, que separou 15 (quinze) objetos altos (Figura
59(b)), dos quais 12 (doze) foram extraídos pela segunda etapa do método. Os falsos
negativos totalizaram 2 (dois) edifícios e não foram extraídos justamente pela forma muito
irregular resultante da primeira etapa da metodologia.
A sobreposição dos contornos extraídos (em vermelho) e dos contornos de
referência (em azul) na imagem de intensidade foi realizada para mostrar a qualidade da
extração dos contornos de telhado extraídos (Figura 60). Os objetos representados na cor azul
clara são telhados que não foram extraídos, ou seja, são os falsos negativos.
140
Figura 60 – Visualização do contorno extraído e do contorno de referência.
Pode-se visualmente perceber que, a exemplo dos experimentos anteriores,
os contornos extraídos são aproximados em relação aos respectivos contornos de referência.
Provavelmente o fenômeno de sombra ocasionou, a exemplo dos experimentos anteriores, o
deslocamento dos contornos extraídos. Mais adiante o parâmetro CA é utilizado para avaliar
numericamente os afastamentos entre ambos os contornos (de referência e extraído). Os
parâmetros numéricos de avaliação obtidos com o resultado deste experimento são mostrados
na Tabela 7.
Tabela 7
– Análise numérica dos resultados obtidos com o método de extração automática de
contornos de telhados.
Falsos Negativos REE
Porcentagem 14,3% 100%
Os parâmetros de qualidade apresentados na Tabela 7 mostram que o
método de extração foi eficiente neste experimento, visto que o parâmetro REE obteve o valor
ótimo, isto é 100%. Este resultado implica na ocorrência de nenhum falso positivo. Houve
ainda a presença de dois falsos negativos (14,3%). Este bom resultado se deve, em parte, à
eficiência da primeira etapa da metodologia em fornecer contornos relacionados com objetos
141
altos. Na segunda etapa, a extração de telhados com certa irregularidade foi possível graças a
robustez do método do círculo trigonométrico setorizado em calcular as direções principais
dos telhados. Em dois casos, ficou claro que apenas a direção principal poderia ser calculada
com confiabilidade, a qual é fundamental para o estabelecimento das injunções de relação
espacial de paralelismo e perpendicularismo. A Figura 61 mostra a identificação de cada
contorno para a obtenção do parâmetro CA.
Figura 61 – Identificação dos contornos de telhados.
A Tabela 8 mostra os resultados obtidos com o indicador CA para os doze
contornos extraídos.
Tabela 8
– Análise numérica dos resultados obtidos com o indicador CA para cada contorno de
telhado extraído.
Telhados 1 2 3 4 5 6 7 8 9 10 11 12
% 81,4 98,5 93,9 91,7 95,0 94,3 97,6 98,2 98,5 98,2 83,8 79,8
Considerando que o método de extração é automático, os resultados
numéricos obtidos são bastante satisfatórios. Na Tabela 8 verifica-se que o telhado 2 obteve
CA de 98,5%, valor bem próximo do valor ótimo (100%). Já os telhados 1, 11 e 12 tiveram
um CA abaixo de 90%.
1
2
3
4
5
6
7
9
8
10
11
12
142
5 CONCLUSÕES E RECOMENDAÇÕES
Neste trabalho foi apresentada uma metodologia automática de extração de
contornos de telhados de edifícios em um MDE obtido a partir de dados de varredura a laser,
bem como os resultados obtidos com a metodologia proposta. Esta metodologia baseia-se em
duas etapas principais. Na primeira etapa é realizada a extração de regiões altas (edifícios,
árvores etc.) do MDE. Na segunda etapa são extraídas as regiões altas que correspondem aos
contornos de telhados.
Foram realizados cinco experimentos com dados reais, os quais forneceram
subsídios para a análise do desempenho da metodologia proposta. A escolha das áreas teste
levou em conta a complexidade das configurações de objetos presentes na cena. Desta forma,
foram selecionadas desde áreas teste com telhados isolados até com agrupamentos de
telhados. Essa escolha teve como principal objetivo verificar a robustez da metodologia em
diferentes tipos de cena.
Diante das discussões dos resultados apresentados no Capítulo 4, as
principais considerações e conclusões são:
No primeiro experimento, verificou-se a dificuldade em estabelecer a presença de um
ou dois telhados na cena. Pelo fato da fusão bayesiana ter extraído apenas um contorno
de telhado, considerou-se para a análise visual e numérica um único contorno de
telhado. Analisando visualmente os contornos extraídos e sobrepostos na imagem de
intensidade, verificou-se um deslocamento sistemático deste contorno. Isto ocorreu em
todos os experimentos, o que pode ter sido ocasionado pela sombra do primeiro pulso,
combinada com a interpolação pelo método do vizinho mais próximo que atribui
pontos com alturas das edificações às regiões de sombra. Ainda na análise visual é
possível perceber as irregularidades nas bordas dos objetos fornecidos pela primeira
etapa da metodologia. No entanto, os bons resultados obtidos fornecem evidência de
que essas irregularidades não interferiram significativamente nos cálculos dos
atributos utilizados na etapa de extração de contornos de telhados. Na avaliação
numérica, o parâmetro CA foi de 94% e, como não houve falsos positivos, a REE foi
de 100%.
O segundo experimento foi realizado em uma cena de baixa complexidade onde havia
dois edifícios, sendo um de grande porte e o outro de pequeno porte. Neste
experimento pode-se verificar que a fusão bayesiana separou alguns objetos altos,
143
incluindo os dois edifícios existentes na área teste. Neste caso, o edifício de menor
porte não foi penalizado pelo critério de área, pois os atributos de retangularidade e de
injunção espacial são bastante favoráveis a esse telhado. Da análise visual, pode-se
afirmar que a metodologia proposta apresentou bons resultados, mesmo fornecendo
contornos aproximados em relação aos contornos de referência. Um parâmetro que
confirma essa afirmação é o CA, cujo valor obtido para o telhado 1 foi de 91% e para
o telhado 2 foi de 97%, valores considerados muito bons. Como não houve nenhum
falso positivo a REE foi de 100%.
No terceiro experimento foi utilizada uma área teste com um edifício isolado e o
entorno composto por uma área de vegetação densa. A etapa de fusão Bayesiana de
regiões separou inúmeros objetos, inclusive um de grande porte, com contornos dos
limites dos dados utilizados. Cabe ressaltar que esse tipo de contorno não foi
considerado no cálculo dos atributos, eliminando um problema evidente na etapa de
extração, visto que os atributos de retangularidade e área credenciariam este tipo de
objeto como sendo telhado. Na análise numérica, o parâmetro CA apresentou o valor
de 95% e a REE de 100%. Este teste mostrou o bom desempenho do método em áreas
com telhados isolados, pois além dos deslocamentos dos contornos e da extração de
contornos compreendendo grandes áreas de vegetação, apenas o contorno do telhado
foi extraído ao final da metodologia.
A área teste escolhida para a realização do quarto experimento teve como objetivo a
verificação do método de extração em áreas com maior quantidade de telhados. Na
primeira etapa do método, a fusão bayesiana separou com bom desempenho os
edifícios isolados. No entanto, um edifício de menor porte rodeado por vegetação não
foi separado nesta etapa. Houve ainda na primeira etapa a fusão de três edifícios
alinhados, fato ocorrido ainda na etapa de interpolação dos dados. Apesar dos
problemas ocorridos verificou-se visualmente que os contornos extraídos estão
próximos aos de referência. A análise numérica confirma o bom desempenho do
método, visto que o parâmetro CA foi realizado para os quatro telhados extraídos e
apenas em um contorno de telhado este parâmetro ficou abaixo da média obtida até
então (61,5%). Nos outros contornos o resultado se manteve acima de 87%. Não
houve neste experimento a presença de falsos positivos, logo a REE foi de 100%.
Entretanto, houve um falso negativo referente à edificação de pequeno porte não
separada na primeira etapa da metodologia.
144
No quinto experimento, a área teste utilizada possui uma configuração de objetos com
maior complexidade. Neste caso, o intuito foi verificar a potencialidade do método em
cenas com maior quantidade de objetos, principalmente edifícios altos em cenas
urbanas densas. Visualmente é possível perceber o bom desempenho da fusão
bayesiana que separou quinze objetos altos, dos quais doze foram extraídos. Neste
experimento, as injunções espaciais contribuíram com a robustez do método. Um dos
objetos altos extraídos na primeira etapa não era telhado, o que contribuiu para a não
extração deste objeto na segunda etapa da metodologia. Ainda na análise visual
verifica-se que os contornos obtidos são novamente aproximados e os problemas
ocorridos devem estar associados aos deslocamentos dos contornos em áreas de
ocorrência de sombra do primeiro pulso. Analisando os resultados numéricos verifica-
se novamente os bons resultados obtidos com o parâmetro CA. Neste experimento
somente dois contornos tiveram CA abaixo de 90% e novamente não houve nenhum
falso positivo, logo a REE foi de 100%. O algoritmo não extraiu dois telhados
existentes na área teste, o que ocorreu devido às irregularidades e alongamento desses
objetos, fato que influenciou no cálculo dos atributos de retangularidade e de injunção
espacial. Cabe ressaltar que outros dois contornos de telhado com forma alongada e
lados menores arredondados foram extraídos devido ao atributo de injunção espacial,
que depende apenas da direção do eixo principal.
Considerando as conclusões apresentadas acima, algumas considerações
mais gerais podem ser ressaltadas:
O deslocamento dos contornos, verificado em todos os experimentos foi causado pela
sombra do primeiro pulso laser combinado com um efeito indesejado do método de
interpolação pelo vizinho mais próximo. Este deslocamento pode influenciar no
resultado dos atributos utilizados, especialmente no atributo de retangularidade e de
relacionamento espacial. Entretanto, esse deslocamento afetou apenas a forma dos
contornos extraídos, mas não afetou significativamente a extração dos contornos de
telhados, visto que os resultados obtidos foram satisfatórios.
Pode-se ressaltar a eficiência da fusão bayesiana na tarefa de separar os objetos altos
dos baixos. Esta etapa proporcionou uma grande redução da complexidade da cena,
embora a fusão bayesiana pode não separar edifícios e árvores de porte parecidos,
conforme se verificou no experimento 4.
145
Em nenhum dos experimentos se verificou a presença de falsos positivos e poucos
falsos negativos foram obtidos, sendo estes bons indicativos de robustez da
metodologia proposta.
O modelo MRF permite utilizar injunções espaciais, as quais possibilitaram modelar
melhor a cena. Isto ficou evidente no experimento 5, principalmente pela presença de
dois telhados alongados e com lados menores arredondados. Nesse caso, apenas a
direção do eixo principal dos objetos pôde ser calculada com boa qualidade, o que
prejudicou o cálculo do atributo de retangularidade, mas não o de relacionamento
espacial. Em outras palavras, as injunções espaciais podem auxiliar na discriminação
dos objetos de interesse em várias situações, mesmo que o atributo de retangularidade
não seja bom.
O método do círculo trigonométrico setorizado demonstrou robustez no cálculo das
direções principais dos contornos. Estes contornos são relativamente irregulares e
muitos detalhes são perdidos (por exemplo, entrâncias regulares de edifícios). Mesmo
com estas irregularidades, sempre fica estabelecida a tendência das direções dos lados
dos telhados, as quais são eficientemente capturadas pelo método do círculo
trigonométrico setorizado. Isso garante robustez no cálculo dos atributos de
retangularidade e de relacionamento espacial.
Conclui-se então de forma geral que a metodologia desenvolvida
possibilitou a extração de contornos de telhados de forma satisfatória, mas com a limitação
principal de que os polígonos extraídos são aproximações para os respectivos telhados. A
contribuição principal deste trabalho está relacionada com a exploração de relações espaciais
entre os edifícios na cena, o que foi viabilizado pelo modelo MRF. Cabe ressaltar que essa
modelagem não tem sido comum na extração de contornos de telhados em dados de varredura
a laser.
5.1 Recomendações
Algumas recomendações relacionadas com as dificuldades encontradas no
desenvolvimento do trabalho podem melhorar o desempenho da metodologia proposta, bem
como facilitar a tarefa de extração. Entre elas pode-se citar:
146
Estudar outros métodos de interpolação que evitem o problema de deslocamento de
contornos. Outra possibilidade é modificar o método para usar diretamente os dados
irregulares.
Melhorar a fusão bayesiana a fim de possibilitar a separação de edifícios e árvores.
Aperfeiçoar o método do círculo trigonométrico setorizado através da sobreposição de
um outro círculo, com um deslocamento de 50% de arco de um setor, visando evitar o
possível problema de direções que caiam no limite de setores. Isso possibilitaria
melhorar a robustez do cálculo dos parâmetros de retangularidade e relacionamento
espacial.
Dentre outras recomendações, destacam-se:
Seguir a tendência atual de utilizar várias fontes de dados (laser, imagens aéreas e de
satélites de alta resolução). Nesse caso, poder-se-ia combinar a facilidade de detecção
dos objetos oferecida pelos dados geométricos tridimensionais com a alta definição
dos contornos nas imagens.
Estender a noção de clique para a quadra inteira, possibilitando uma modelagem
integrada de configurações de edifícios e ruas. Vale ressaltar que a extração de ruas
em imagens de intensidade laser pode ser uma opção atraente, visto que as vias
urbanas aparecem nestas imagens com excelente contraste.
Outras possibilidades poderiam ser citadas, tais como: aperfeiçoamento das funções de
energia, desenvolvimento de novos atributos descritores, avaliação de outros métodos
de resolução da Equação de energia etc..
147
REFERÊNCIAS
AHOKAS, E.; KAARTINEN, H.; HYYPPÄ, J. A quality assessment of airbone laser scanner
data. In: WORKSHOP 3-D RECONSTRUCTION FROM AIRBORNE LASERSCANNER
AND INSAR DATA, 2003, Dresden.
Proceedings… 2003.
ALHARTHY, A.; BETHEL, J. Detailed building reconstruction from airborne laser data
using a moving surface method. In: XXth ISPRS CONGRESS, v. XXXV, 2004, Istanbul.
Proceedings do IAPRS 2004.
ANDERSEN, H.; REUTEBUCH, S.; SCHREUDER, G. Bayesian object recognition for the
analysis of complex forest scenes. In: SYMPOSIUM PHOTOGRAMMETRIC COMPUTER
VISION, 2002, Austria.
Proceedings… 2002.
AREFI, H.; HAHN, M. A hierarchical procedure for segmentation and classification of
airborne LIDAR images. In: GEOSCIENCE AND REMOTE SENSING SYMPOSIUM, 7,
2005.
Proceedings… 2005. p. 4950 - 4953.
AXELSSON, P. Integrated sensors for improved 3D interpretation
. In: SYMPOSIUM GIS -
BETWEEN VISIONS AND APPLICATIONS, v. 32, 1998, Stuttgart.
Proceedings... 1998. p.
27-34.
BALLARD, D. H.; BROWN, C. M.
Computer vision. Englewood Cliffs, Prentice-Hall,
1982.
BALTSAVIAS, E. P. Airborne Laser Scanning: basic relation and formulas.
ISPRS Journal
of Photogrammetry & Remote Sensing, Zurich, v. 54, p.199–214, abr. 1999.
BERTHOD, M.; KATO, Z.; YU, S.; ZERUBIA, J. Bayesian image classification using
Markov random fields.
Image and Vision Computing, v. 14, n. 4, p. 285-295, 1996.
BESAG, J. Spatial interaction and the analysis of lattice systems.
Journal of the Royal
Statistical Association, Series B 36, p. 192-236, 1974.
BESAG, J.; YORK, J.; MOLLIÉ, A. Bayesian Image Restoration, with two applications on
Spatial Statistics.
Annals of the Institute of Statistical Mathematics, v. 43, p. 1–59, 1991.
148
BLAKE, A. Comparison of the Efficiency of Deterministic and Stochastic Algorithms for
Visual Reconstruction.
IEEE Transactions on Pattern Analysis and Machine Intelligence,
v. 11, n. 1, p. 2–12, 1989.
BOAVENTURA NETTO, P. O.
Teoria e modelos de grafos. E. Blücher, São Paulo, 249p,
1979.
BOEHLER, W.; HEINZG, G.; MARBS, A. The potential of non-contact close range Laser
Scanner for cultural heritage recording. In: CIPA INTERNATIONAL SYMPOSIUM,
2001, University of Potsdam.
Proceedings… 2001.
BOX, G. E. P; TIAO, G.C. Bayesian Inference in Statistical Analysis. 1973.
BRANDALIZE, A. A. Varredura a Laser: Comparação com métodos fotogramétricos. In: I
SIMPÓSIO BRASILEIRO DE GEOMÁTICA, 2002, Presidente Prudente.
Anais... 2002.
BRETAR, F.; ROUX, M. Hybrid image segmentation using LiDAR 3D planar primitives. In:
ISPRS WORKSHOP LASER SCANNING, 2005, Enschede, the Netherlands.
Proceedings…
2005.
BRETAR, F.; PIERROT-DESEILLIGNY, M.; ROUX, M. Estimating intrinsic accuracy of
airborne laser data with local tridimensional-offsets. In: WORKSHOP 3-D
RECONSTRUCTION FROM AIRBORNE LASERSCANNER AND INSAR DATA, 2003,
Dresden, Germany.
Proceedings… 2003.
BRUNN, A.; WEIDNER, U. Extracting buildings from digital surface models. In: IAPRS.
v.32, 1997. Stuttgart.
Proceedings… 1997. p. 27-34.
BURNS, J.B.; HANSON, A.R.; RISEMAN, E.M. Extracting straight lines.
IEEE Pattern
Analysis and Machine Intelligence, v. 8, n. 4, p. 425-455, 1986.
CANNY, J. A Computational approach to edge detection.
IEEE Pattern Analysis and machine
Intelligence, v. 8, n. 6, p. 679 – 698, 1986.
CRAMER, M.; STALLMANN, D. On the use of GPS/INS exterior orientation parameters in
airborne photogrammetry. In: OEEPE WORKSHOP ON “INTEGRATED SENSOR
ORIENTATION”, Hannover, Germany.
Proceedings… 2001. p.32-44.
149
DALMOLIN, Q.; SANTOS, D. R.
Sistema laserSCANNING: Conceitos e princípios de
funcionamento. UFPR, Curitiba. 2004.
DAL POZ, A. P. Modelos e estratégias para a extração da malha viária em imagens digitais.
Relatório FAPESP, Universidade Estadual Paulista (UNESP), 2002.
DAL POZ, A. P., SILVA, M. A. O. Active Testing and Edge Analysis for Road Centreline
Extraction. In: ISPRS SYMPOSIUM PHOTOGRAMMETRIC COMPUTER VISION,
Austria.
Proceedings… 2002.
DEGROOT, M. H.; SCHERVISH, M. J. Probability and statistics. 3
rd
ed. 2002. Addison
Wesley, London, 816p.
DENG, H. AND CLAUSI, D.A. Unsupervised image segmentation using a simple MRF
model with a new implementation scheme.
Pattern Recognition, v. 37, n. 12, p. 2323-2335.
2004.
DUBES, R. C. E JAIN, A. K. Random Field Models in Image Analysis.
Journal of applied
Statistics, v. 16, n. 2, p. 131–164. 1989.
FERREIRA, M. A. R.
Modelos dinâmicos hierárquicos bayesianos: estimação de matrizes
de covariância das equações estruturais e não-normalidade. 1994. Dissertação de
mestrado, IM/UFRJ.
EL-SHEIMY, N.
Digital terrain modelling. Calgary, 1999.
FRANKE, R. Scattered Data Interpolation: Test of Some Methods,
Mathematics of
Computations
, v. 33, n. 157, p. 181-200. 1982.
GAMERMAN, D.; LOPES, H. F.
Markov Chain Monte Carlo: Stochastic Simulation for
Bayesian Inference. 2
nd
. ed. Chapman & Hall CRC, Londres, 336p., 2006.
GEMAN, S.; GEMAN, D. Stochastic relaxation, Gibbs distribution, and Bayesian restoration
of images. In: IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE
INTELLIGENCE, v.6, 1984.
Proceedings… 1984, p.721-741.
GELFAND, A. E.; SMITH, A. M. Sampling-based approaches to calculating marginal
densities.
Journal of the American statistical association, v. 85, n. 410, pp. 398-409. 1990
150
GELFAND, A. E.; HILLS, S. E.; RACINE- POON; SMITH, A. F. M. Ilustration of Bayesian
inference in normal data model using Gibbs sampling.
Journal of the American statistical
association, v. 85, n. 412, pp. 972-985. 1990.
GELMAN, A.; RUBIN, D. Inference from iterative simulation using multiple sequences.
Statistical science 7, pp. 457-472. 1992.
GONZALES, R. C.; WOODS, R. E.
Digital Image Processing, Addison-Weslly publiching
company, 716p., 2000.
GORDON, S.; LICHTI, D.; STEWART, M. Application of a high-resolution, ground-based
laser scanner for deformation measurements. In: 10TH FIG INTERNATIONAL
SYMPOSIUM ON DEFORMATION MEASUREMENTS, California, USA, 2001.
Proceedings… 2001, p. 23-32.
HAALA, N. Detection of building by fusion of range and image data. In: INTERNATIONAL
ARCHIVES OF PHOTOGRAMMETRY AND REMOTE SENSING, 1994.
Proceedings…
1994, p.341-346.
HAALA, N.; BRENNER, C. Extraction of buildings and trees in urban environments.
ISPRS
Journal of Photogrammetry e Remote Sensing, v.54, p.130-137, 1999b.
HAITHCOAT, T.; SONG, W.; HIPPLE, J. Automated Building Extraction and
Reconstruction from LIDAR Data. Building Extraction – LIDAR R&D Program for
NASA/ICREST Studies, 2001.
HUMMEL, R. A.; ZUCKER, S. W. On the foundation of relaxation labeling process. In:
IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE, v.
PAMI-5, 1983.
Proceedings… 1983, p.267-287.
HURN, M.; HUSBY, O.; RUE, H. Advances in Bayesian image analysis.
Highly Structured
Stochastic Systems, Oxford Statistical Science Series, Oxford University Press, v. 27, p.
302-322, 2003.
JACKSON, Q.; LANDGREBE, D.A. Adaptative Bayesian contextual classification based on
Markov random fields.
IEEE Transactions on Geoscience and Remote Sensing, v. 40, n.
11, p. 2454-2463, 2002.
151
JAIN, R.; KASTURI, R; SCHUNCK, B. G.
Machine vision. MIT Press and McGraw-Hill,
Inc New York, 1995.
KASSER, M.; EGELS, Y.
Digital photogrammetry. Éditeur London, New York: Taylor &
Francis, Collation XV, 2002. 351p.
KATARZIS, A.; SAHLI, H.; NYSSEN, E.; CORNELIS, J
. Detection of buildings from a
single airborne image using a Markov Random Field model. In: IEEE INTERNATIONAL
GEOSCIENCE AND REMOTE SENSING SYMPOSIUM. Austrália, 2001.
Proceedings
2001, 3p.
A. Katartzis, H. Sahli, E . Nyssen , J. Cornelis
KIM, I. Y.; YANG, H. S. An integrated approach for scene understanding based on Markov
Random Field. Pattern Recognition, p. 1887-1897, 1995.
KINDERMAN, R.; SNELL, J. L.
Markov Random Fields and their applications.
Providence, R.I: American Mathematical Society, 1980.
KIRKPATRICK, S.; GELATT, C. D.; VECCHI, M. P. Optimization by Simulated Annealing,
Science, p. 671–680, 1983.
KOPPARAPU, S. K.; DESAI, U. B.
Bayesian approach to image interpretation. 127p.,
2001.
KRISHNAMACHARI, S.; CHELLAPPA, R. Delineating buildings by grouping lines with
MRFs. In: IEEE TRANS. ON IMAGE PROCESSING. v. 5, 1996.
Proceedings…1996,
p.164-168.
LIDAR – Light Detection and Ranging. Disponível em:
http://www.lidar.com.br/tecnologia.htm . acessado em 20 de dezembro de 2006.
LOHMANN, P. Segmentation and Filtering of Laser Scanner Digital Surface Models, In: II
SYMPOSIUM ON INTEGRATED SYSTEMS FOR SPATIAL DATA PRODUCTION,
CUSTODIAN AND DECISION SUPPORT, IAPRS. Xi'an, v. XXXIV, Part 2, 2002.
Proceedings… 2002, p. 311-315.
MAAS, H. G.; VOSSELMAN, G. Two algorithms or extracting building models from raw
laser altimetry data. In: ISPRS JOURNAL OF PHOTOGRAMMETRY AND REMOTE
SENSING, 1999.
Proceedings… 1999, p.153-163.
152
MACHADO, A. M. L.; MITISHITA, E. A. Detecção automática de contornos de edificações
utilizando imagem gerada por câmara digital de pequeno formato e dados lidar.
Boletim de
Ciências Geodésicas, v. 12, n. 2, p. 215-233, 2006.
MANJUNATH, B. S., SIMCHONY, T. E CHELLAPPA, R. Stochastic and Deterministic
Networks for Texture Segmentation.
IEEE Transactions on Acoustics, Speech, and Signal
Processing, v. 38, n. 6, p.1039–1049, 1990.
MATIKAINEN, L.; HYYPPÄ J.; HYYPPÄ H. Automatic detection of buildings from laser
scanner data for map updating. In
: ISPRS WORKSHOP LASER SCANNING, 2005.
Proceedings… 2005.
MCKEOWN, D. M.; BULWINKLE, T. M.; COCHRAN, S.; HARVEY, W.; MCGLONE, C.;
SHUFELT, J. A. Performance evaluation for automatic feature extraction.
International
Archives of Photogrammetry and Remote Sensing, v. 33, part B2, p. 379– 394, 2000.
METROPOLIS, N.; ROSENBLUTH, M. N; ROSENBLUTH, A. H.; Teller, A. H.; Teller, E.
Equations of state calculations by fast computation machines.
Journal Chemical Physics, v.
21, p.1087-1091, 1953.
MIGON, H. S.; GAMERMAN, D.
Statistical Inference: an Integrated Approach. 1. ed.
Londres: Arnold, 1999. v.1, 262 p.
MITISHITA, E. A.
Monorestituição digital de aerofotos, associada com sistema de
computação gráfica C.A.D., para fins de mapeamento na área florestal
. 1997. 253 f. Tese
(Doutorado em Ciências Florestais) – Universidade Federal do Paraná, Curitiba.
MODESTINO, J. A; ZHANG, J. A Markov Random Field model based approach to image
interpretation.
IEEE Transactions on Pattern Analysis and Machine Intelligence, v. 6,
p.606-615, 1992.
MORGAN, M.; HABIB, A. Interpolation of Lidar Data for Automatic Building Extraction.
In: ASPRS/ACSM CONFERENCE, Washington, D.C., 2002.
Proceedings… 2002.
MOSTAFA, M. M. J.; HUTTON, J. Direct positioning and orientation systems – How do
they work? What is the attainable accuracy?. In: ASPRS, St. Louis – Missouri, 2001.
Proceedings … 2001.
153
NARDINOCCHI, C.; FORLANI, G.; ZINGARETTI, P. Classification and filtering of laser
data. In: ISPRS WORKING GROUP III/3 WORKSHOP. Dresden, Germany, 2003.
Proceedings… 2003.
NARDINOCCHI, C.; FORLANI, G. Detection and Segmentation of Building Roofs from
Lidar Data. In: ISPRS WORKSHOP ON 3D DIGITAL IMAGING AND MODELLING
APPLICATIONS OF: HERITAGE, INDUSTRIES, MEDICINE & COMMERCIAL LAND,
Padova, 2001.
Proceedings… 2001.
PARK, J.; LEE, I.; CHOI, Y.; LEE, Y. J. Automatic Extraction of Large Complex Buildings
Using Lidar Data and Digital Maps. In: SYMPOSIUM OF ISPRS COMMISSION III
PHOTOGRAMMETRIC COMPUTER VISION, Bonn, Germany.
Proceedings… 2006.
ROSENFELD, A.; HUMMEL, R. A.; ZUCKER, S. W. Scene labeling by relaxation
operations.
IEEE Trans. Syst. Man Cybern. v. SMC-6, p.420-433, 1976.
ROTTENSTEINER, F.; BRIESE, C. A New Method for Building Extraction in Urban Areas
from High-Resolution Lidar Data. In: IAPRSIS, v. XXXIV/3A, Graz, Áustria, 2002.
Proceedings… 2002, p. 295 – 301.
ROTTENSTEINER, F.; TRINDER, J.; CLODE, S.; KUBIK, K. Automated delineation of
roof planes from LIDAR data. In: INTERNATIONAL ARCHIVES OF THE
PHOTOGRAMMETRY, REMOTE SENSING AND SPATIAL INFORMATION
SCIENCES, Enschede, Netherlands, v. 35, 2005.
Proceedings… 2005.
RÜTHER, H.; MARTINE, H. M.; MTALO, E. G. Application of snakes and dynamic
programming optimization technique in modeling of buildings in informal settlement areas.
ISPRS
Journal of Photogrammetry and Remote Sensing, v. 56, p. 269-282, 2002.
SCHENK, T.; CSATHÓ, B. Fusion of lidar data and aerial imagery for a more complete
surface description. In: INTERNATIONAL ARCHIVES OF PHOTOGRAMMETRY AND
REMOTE SENSING, v. 34, 2002.
Proceedings… 2002, p. 310–317.
SCHMIDT, A. M.; NOBRE, A. A.; FERREIRA, G. S. Alguns Aspectos da Modelagem de
Dados Espacialmente Referenciados.
Revista brasileira de estatística, Brasil, v. 63, n. 220,
p. 59-88, 2003.
SOHN, G.; DOWMAN, I. J. Building extraction using Lidar DEMs and Ikonos images
. In:
ISPRS, v. XXXIV, p. 3/W13. Dresden, Germany.
Proceedings… 2003.
154
SOHN, G. Extraction of buildings from high-resolution satellite data and lidar. In: XX ISPRS
CONGRESS, Istanbul, Turkey, 2004.
Proceedings... 2004, 7p.
SOUZA, A. D. P.
Métodos aproximados em modelos hierárquicos dinâmicos Bayesianos.
1999. 142f. Tese (Doutorado em Ciências em Engenharia de Produção) – Universidade
Federal do Rio de Janeiro – COPPE, Rio de Janeiro.
SPIEGELHATER, D.J.; THOMAS, A.; BEST, N.; GILKS, W. WinBUGS (Bayesian
Inference Using Gibbs Sampling). Version 1.4,
MRC Biostatistics Unit, Cambridge, UK,
2002.
SURFER.
USER’S GUIDE. Golden Software Inc. USA. 1999.
SZIRÁNYI, T.; ZERUBIA, J.; CZÚNI, L.; GELDREICH, D.; KATO, Z. Image segmentation
using Markov Random Field model in fully parallel cellular network architectures.
Real-
Time Imaging. v.6, p. 195-211, 2000.
TARSHA-KURDI, F.; LANDES, T.; GRUSSENMEYER, P.; SMIGIEL, E. New Approach
for Automatic Detection of Buildings in Airborne Laser Scanner Data Using first Echo only.
In: SYMPOSIUM OF ISPRS COMMISSION III PHOTOGRAMMETRIC COMPUTER
VISION, Bonn, Germany.
Proceedings… 2006.
TOMMASELLI, A. M. G. Um Estudo sobre as Técnicas de Varredura a Laser e
Fotogrametria para Levantamentos 3D a curta Distância.
GEODÉSIA online. 2003.
TÓVÁRI, D.; PFEIFER, N. Segmentation based robust interpolation – A new approach to
laser data filtering. In: ISPRS WORKSHOP "LASER SCANNING”, Enschede, the
Netherlands.
Proceedings… 2005.
TRINDER, J. C.; MAULIK, U.; BANDYOPADHYAY, S. Semi-automated feature extraction
using simulated annealing. In
: INTERNATIONAL ARCHIVES FOR
PHOTOGRAMMETRY AND REMOTE SENSING. v.33, part B3.
Proceedings... 2000, p.
905-911.
VALE, G. M.; DAL POZ, A. P. O Processo de Detecção de Bordas de Canny: Fundamentos,
Algoritmos e Avaliação Experimental. In: SIMPÓSIO BRASILEIRO DE GEOMÁTICA,
Presidente Prudente.
Anais do Simpósio Brasileiro de Geomática - Anais em CDROM,
2002. p. 292-303.
155
VALE, G. M.; DAL POZ, A. P. Processo de detecção de bordas de Canny.
Boletim de
Ciências Geodésicas, Curitiba, v.8, n.2, p. 67-78. 2002a.
VÖGTLE, T.; STEINLE, E. On the Quality of Object Classification and Automated Building
Modelling Based on Laserscanning Data. In: IAPRS, v. XXXIV, part. 3, Dresden, Germany.
Proceedings… 2003.
VOSSELMAN, G.; DIJKMAN, S. 3D building model reconstruction from point clouds and
ground plans. In: IAPRS, v. XXXIV – 3/W4, Annapolis.
Proceedings… 2001.
VOSSELMAN, G. Fusion of Laser Scanning Data, Maps, and Aerial Photographs for
Building Reconstruction. In: INTERNATIONAL GEOSCIENCE AND REMOTE SENSING
SYMPOSIUM, Toronto, Canada.
Proceedings… 2002.
WANG, M.; TSENG, Y. Lidar data segmentation and classification based on octree structure.
In: XX ISPRS CONGRESS, Istanbul, Turkey, 2004. Proceedings... 2004.
WEVER, C.; LINDENBERGER, J. Experience of 10 years of laser Scanning.
Schriftenreihe
des Institute für Photogrammetrie. der Universität Stuttgart, pp. 125-132 1999.
WEHR, A.; LOHR, U. Airborne laserscanning-an introduction and overview. In: ISPRS
JOURNAL OF PHOTOGRAMMETRY AND REMOTE SENSING. v. (54) 2-3.
Proceedings... 1999. p.68-82.
WOLF, P.; DEWITT, B. Elements of photogrammetry – with applications in GIS. 3. ed.
United States of America: Mc Graw Hill, 2000.
YANG, C.; KAO, S.; LEE, F.; HUNG, P. Twelve different interpolation methods: a case
study of surfer 8.0. In: XX ISPRS CONGRESS, Istanbul, Turkey, 2004.
Proceedings... 2004.
ZHOU, G.; SONG, C.; SIMMERS, J.; CHENG, P. Urban 3D GIS from LiDAR and digital
aerial images.
Computers and Geosciences. v. 30, p. 345-353, 2004.
ZIOU, D.; TABBONE, S. Edge detection techniques – An overview.
International Journal
of Pattern Recognition and Image Analysis. v. 8, n. 4, p. 537-559, 1998.
156
BIBLIOGRAFIA
BAUMGARTNER, A.; STEGER, C.; MAYER, H.; ECKSTEIN, W.; EBNER, H. Automatic
road extraction based on multi-scale, grouping, and context. In: PHOTOGRAMMETRIC
ENGINEERING AND REMOTE SENSING, v. 66, n. 7, 1999, Ohio.
Proceedings… 1999.
p.777-785.
CENTENO, J. A. S.; MIQUELES, M. A.; Extraction of buildings in brasilian urban
environments using high resolution remote sensing imagery and laser scanner data
. In: XXTH
ISPRS CONGRESS, 2004, Istanbul.
Proceedings… 2004.
DURUPT, M.; TAILLANDIER, F. Automatic Building Reconstruction from a Digital
Elevation Model and Cadastral Data: An Operational Approach. In: SYMPOSIUM OF ISPRS
COMMISSION III PHOTOGRAMMETRIC COMPUTER VISION, Bonn, Germany.
Proceedings… 2006.
HABIB, A.; GHANMA, M.; MITISHITA, E. A. Co-registration of Photogrammetric and
LIDAR data: Methodology and case study.
Revista Brasileira de Cartografia, v. 56, n. 1, p.
1-13, 2004.
HINZ, S.; BAUMGARTNER, A. Road extraction in urban areas supported by context
objects. In: INTERNATIONAL ARCHIVES OF PHOTOGRAMMETRY AND REMOTE
SENSING, v.33, part B.
Proceedings… 2000.
HINZ, S. Using context as guide for automatic object extraction in urban areas. In: REMOTE
SENSING OF URBAN AREAS, Regensburger Geographische Schriften.
Proceedings
2001.
HINZ, S.; BAUMGARTNER, A.; MAYER, H.; WIEDEMANN, C.; EBNER, H. Road
extraction focusing on urban areas.
Automatic extraction of man-made objects from aerial
and space images (III). Balkema Publishers, 2001.
HINZ, S.; BAUMGARTNER, A. Urban road net extraction integrating internal evaluation
models. In: ISPRS SYMPOSIUM PHOTOGRAMMETRIC COMPUTER VISION, Austria.
Proceedings… 2002.
HINZ, S. Automatic road extraction in urban scenes and beyond. In: XXth ISPRS Congress,
Instanbul, Turquia.
Proceedings… 2004. 6p.
157
HORIGUCHI, S.; OZAWA, S.; NAGAI, S.; SUGIYAMA, K. Reconstructing road and block
from DEM in urban area. In: ISPRS SYMPOSIUM PHOTOGRAMMETRIC COMPUTER
VISION, Austria.
Proceedings… 2000.
KIM, T.; MULLER, J. P. Development of a graph-based approach for building detection.
I
mage and Vision Computing. v.17, 1999. p.3-14.
KASSER, M.; EGELS, Y.
Digital photogrammetry. Éditeur London, New York: Taylor &
Francis, Collation XV, 2002. 351p.
KUMAR, K. S.; DESAI, U. B. Joint segmentation and image interpretation.
Tech. Rep.
SPANN, Indian Institute of Techonology
, Bombay. 1996.
LAPTEV, I.; MAYER, H.; LINDEBERG, T.; ECKSTEIN, W.; STEGER, C.;
BAUMGARTNER, A. Automatic extraction of roads from aerial images based on scale space
and snakes. In:
MACHINE VISION AND APPLICATIONS. V. 12, n. 1. Proceedings
2000. p.22-31.
LIN, C.; NEVATIA, R. Building detection and description from a single intensity image.
Computer Vision and Image Understanding, v. 72, 1998. p.101-121.
MARSHALL, A. D.; MARTIN, R. R.
Computer vision, models and inspection. World
Scientific Series in robotics and automated systems, 1992, v.4.
PRÉTEUX, F.,
Mathematical Morphology in image processing. E. Dougerthy, Rochester
Institute of Technology, New York, 1993.
PRICE, K. Urban street grid description and verification. In: IEEE Workshop AN
APPLICATIONS OF COMPUTER VISION. Palm Springs. Proceedings… 2000, p.148-154.
ROTTENSTEINER, F.; BRIESE, C. Automatic generation of building models from lidar data
and the integration of aerial images. In: INTERNATIONAL ARCHIVES OF
PHOTOGRAMMETRY AND REMOTE SENSING, Dresden, Germany, v. 34, n. 3W13.
Proceedings… 2003, p. 174–180.
RUE, H. A loss function model for the restoration of grey level images.
Scand. Journal
STATIST
. v. 24, p. 103 – 114, 1997.
158
RUTZINGER, M.; HÖFLE, B.; GEIST, T.; STÖTTER, J. Object-based building detection
based on airborne laser scanning with GRASS GIS environment. In: UDMS 2006: URBAN
DATA MANAGEMENT SYMPOSIUM, Aalborg, Dinamarca, 2006.
Proceedings… 2006.
SOILLE, P.; VINCENT, L. Watersheds in digital spaces: An efficient algorithm based on
immersion simulations. In: IEEE TRANSACTIONS ON PATTERN ANALYSIS AND
MACHINE INTELLIGENCE. v. 13, n. 6.
Proceedings… 1991. p.583-597.
SOILLE, P.
Morphological image analysis – Principles and applications. Springer-Verlag.
Berlin Heidelberg, 1999. 316p.
SCHUTTE, K.
Knowledge based recognition of man-made objects. 1994. Tese, University
of Twente.
TEH, C.; CHIN, R. On image analysis by the method of moments. In: IEEE
TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE.
Proceedings…1998. p. 496-513.
WILSON, R. J.
Introduction to graph theory, Oliver and Boyd, Edinburgh, 1972, 168p.
159
ANEXO A - Dados formato Splus de uma área teste da cidade de Curitiba - PR -
WINBUGS 1.4
map: 1702
1 area1
2 area2
3 area3
4 area4
5 area5
6 area6
7 area7
8 area8
9 area9
10 area10
11 area11
12 area12
.
.
.
1698 area1698
1699 area1699
1700 area1700
1701 area1701
1702 area1702
area1 676582 7185050
area1 676584 7185050
area1 676584 7185053
area1 676582 7185053
NA NA NA
area2 676582 7185053
area2 676584 7185053
area2 676584 7185055
area2 676582 7185055
NA NA NA
area3 676584 7185053
area3 676585 7185053
area3 676585 7185054
area3 676584 7185054
NA NA NA
area4 676584 7185054
area4 676585 7185054
area4 676585 7185055
area4 676584 7185055
NA NA NA
160
.
.
.
NA NA NA
area1701 676639 7185053
area1701 676641 7185053
area1701 676641 7185055
area1701 676639 7185055
NA NA NA
area1702 676639 7185050
area1702 676641 7185050
area1702 676641 7185053
area1702 676639 7185053
NA NA NA
END
161
ANEXO B – Código e Dados utilizados - WinBUGS 1.4
model
{
# Likelihood
for (i in 1 : N)
{
d[i] ~ dnorm(mu[i], tau1)
mu[i] <- alpha0 + b[i]
}
# CAR prior distribution for random effects:
b[1:N] ~ car.normal(adj[], weights[], num[], tau)
for(k in 1:sumNumNeigh)
{
weights[k] <- 1
}
# Other priors:
alpha0 ~ dflat()
tau ~ dgamma(0.5, 0.0005)
tau1 ~ dgamma(0.001, 0.001) # prior on precision
sigma <- sqrt(1 / tau) # standard deviation
}
Data list(N = 11011,
d = c(908.099,907.949,912.668,910.425,915.047,914.870,908.185,911.030,914.352,915.540,
910.610,914.705,913.743,910.527,913.803,916.045,916.780,910.515,911.217,914.910,
.
.
.
931.558,930.747,933.345,933.452,932.585,930.813,931.773,930.497,930.450,932.657,
932.707,930.650,930.600,929.160,929.890,932.260,925.840,924.773,924.767,923.148,
921.985,921.985),
list(num = c(4, 7, 7, 7, 8, 8, 4, 7, 8, 5,
4, 5, 8, 7, 5, 4, 7, 8, 8, 8,
8, 8, 8, 8, 8, 8, 8, 8, 8, 8,.
.
.
8, 8, 8, 8, 8, 8, 8, 8, 8, 5,
5, 8, 8, 5, 5, 5, 8, 8, 5, 8,
8, 8, 8, 8, 8, 5, 5, 5, 8, 5,
3
),
adj = c(
8, 7, 3, 2,
23, 14, 11, 8, 4, 3, 1,
9, 8, 6, 5, 4, 2, 1,
26, 23, 14, 6, 5, 3, 2,
162
48, 47, 27, 26, 23, 6, 4, 3,
48, 47, 44, 9, 8, 5, 4, 3,
.
.
.
11011, 11010, 11008, 11007, 11004, 11003, 10999, 10998,
11011, 11009, 11008, 11007, 11004,
11010, 11009, 11008
),
sumNumNeigh = 83452))
Inits list(tau = 1, tau1 = 0.1, alpha0 = 0,
b=c(0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,
.
.
.
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,
0,0,0,0,0,0,0,0,0,0,0,0,0,0))
163
ANEXO C – Gráficos de Saída do software WinBUGS 1.4 - Diagnóstico de Gelman
e Rubin e Trajetória das Cadeias Geradas para a área teste 3.
Efeito aleatório (b) incorporando vizinhança
Diagnóstico de Gelman e Rubin
alpha0 chains 1:2
iteration
22001 25000 30000
0.0
0.5
1.0
b[1] chains 1:2
iteration
22001 25000 30000
0.0
0.5
1.0
b[1000] chains 1:2
iteration
22001 25000 30000
0.0
0.5
1.0
b[6000] chains 1:2
iteration
22001 25000 30000
0.0
0.5
1.0
1.5
b[10000] chains 1:2
iteration
22001 25000 30000
0.0
0.5
1.0
b[11000] chains 1:2
iteration
22001 25000 30000
0.0
0.5
1.0
1.5
Trajetória das Cadeias Geradas
alpha0 chains 1:2
iteration
22001 25000 27500 30000
924.63
924.635
924.64
924.645
164
b[1] chains 1:2
iteration
22001 25000 27500 30000
-17.5
-17.0
-16.5
-16.0
b[1000] chains 1:2
iteration
22001 25000 27500 30000
-13.5
-13.0
-12.5
-12.0
b[10000] chains 1:2
iteration
22001 25000 27500 30000
54.5
55.0
55.5
56.0
56.5
b[11000] chains 1:2
iteration
22001 25000 27500 30000
7.0
7.5
8.0
8.5
9.0
165
ANEXO D – Resultados Estatísticos - WinBUGS 1.4
Efeito aleatório (b) incorporando vizinhança
Node mean sd MC error 2.5% median 97.5% start sample
alpha0 924.6 0.001067 8.44E-6 924.6 924.6 924.6 22001 20000
node mean sd MC error 2.5% median 97.5% start sample
b[1] -16.54 0.1112 7.905E-4 -16.77 -16.54 -16.31 22001 20000
b[2] -16.69 0.1106 8.139E-4 -16.92 -16.69 -16.46 22001 20000
b[3] -11.97 0.1109 8.048E-4 -12.2 -11.97 -11.74 22001 20000
b[4] -14.21 0.111 8.061E-4 -14.44 -14.21 -13.99 22001 20000
b[5] -9.594 0.1099 8.099E-4 -9.82 -9.593 -9.371 22001 20000
b[6] -9.768 0.1096 8.266E-4 -9.996 -9.769 -9.544 22001 20000
b[7] -16.45 0.1097 7.321E-4 -16.68 -16.45 -16.23 22001 20000
b[8] -13.61 0.1102 7.359E-4 -13.84 -13.61 -13.38 22001 20000
b[9] -10.29 0.1106 8.474E-4 -10.52 -10.28 -10.06 22001 20000
b[10] -9.098 0.1108 7.627E-4 -9.327 -9.097 -8.873 22001 20000
b[11] -14.03 0.1106 8.952E-4 -14.26 -14.03 -13.8 22001 20000
b[12] -9.933 0.1096 7.196E-4 -10.16 -9.933 -9.707 22001 20000
b[13] -10.9 0.1107 7.62E-4 -11.12 -10.9 -10.67 22001 20000
b[14] -14.11 0.1101 7.369E-4 -14.34 -14.11 -13.88 22001 20000
b[15] -10.84 0.1107 7.359E-4 -11.06 -10.83 -10.61 22001 20000
b[16] -8.593 0.1109 7.573E-4 -8.823 -8.593 -8.365 22001 20000
b[17] -7.859 0.11 7.177E-4 -8.083 -7.858 -7.632 22001 20000
b[18] -14.12 0.1106 8.744E-4 -14.35 -14.12 -13.89 22001 20000
b[19] -13.42 0.1108 7.481E-4 -13.64 -13.42 -13.19 22001 20000
b[20] -9.729 0.1098 8.53E-4 -9.955 -9.729 -9.503 22001 20000
b[21] -10.34 0.1115 8.289E-4 -10.57 -10.34 -10.11 22001 20000
b[22] -11.06 0.1111 8.036E-4 -11.29 -11.06 -10.83 22001 20000
b[23] -11.77 0.1105 8.326E-4 -11.99 -11.77 -11.54 22001 20000
b[24] -11.67 0.1095 7.67E-4 -11.9 -11.67 -11.45 22001 20000
b[25] -10.59 0.111 8.336E-4 -10.82 -10.59 -10.36 22001 20000
b[26] -10.59 0.1112 8.301E-4 -10.82 -10.59 -10.36 22001 20000
b[27] -10.61 0.1097 8.1E-4 -10.83 -10.61 -10.38 22001 20000
b[28] -10.74 0.1114 8.181E-4 -10.97 -10.74 -10.51 22001 20000
b[29] -11.41 0.1106 8.614E-4 -11.63 -11.41 -11.18 22001 20000
b[30] -11.17 0.11 7.913E-4 -11.4 -11.17 -10.95 22001 20000
b[31] -12.13 0.1102 7.092E-4 -12.35 -12.13 -11.9 22001 20000
b[32] -12.69 0.1111 7.829E-4 -12.93 -12.69 -12.46 22001 20000
b[33] -14.68 0.1107 7.401E-4 -14.91 -14.68 -14.45 22001 20000
b[34] -12.38 0.1112 7.802E-4 -12.61 -12.38 -12.15 22001 20000
.
.
.
b[10997] 7.136 0.111 6.538E-4 6.905 7.136 7.363 22001 20000
b[10998] 5.857 0.1109 7.317E-4 5.628 5.858 6.086 22001 20000
b[10999] 5.811 0.1108 7.542E-4 5.585 5.811 6.041 22001 20000
b[11000] 8.018 0.11 7.853E-4 7.791 8.018 8.243 22001 20000
b[11001] 8.07 0.1099 7.338E-4 7.842 8.07 8.297 22001 20000
b[11002] 6.013 0.1102 7.657E-4 5.785 6.012 6.242 22001 20000
b[11003] 5.962 0.1108 6.128E-4 5.733 5.962 6.191 22001 20000
b[11004] 4.523 0.1097 7.663E-4 4.296 4.522 4.754 22001 20000
b[11005] 5.254 0.1107 7.79E-4 5.026 5.253 5.48 22001 20000
b[11006] 7.622 0.1101 8.355E-4 7.392 7.621 7.848 22001 20000
b[11007] 1.203 0.1112 7.284E-4 0.977 1.202 1.431 22001 20000
b[11008] 0.1352 0.1104 7.745E-4 -0.0962 0.1351 0.3654 22001 20000
b[11009] 0.1295 0.1112 7.512E-4 -0.09971 0.1302 0.3559 22001 20000
b[11010] -1.49 0.1105 7.841E-4 -1.718 -1.49 -1.26 22001 20000
b[11011] -2.654 0.1117 8.292E-4 -2.883 -2.654 -2.423 22001 20000
Livros Grátis
( http://www.livrosgratis.com.br )
Milhares de Livros para Download:
Baixar livros de Administração
Baixar livros de Agronomia
Baixar livros de Arquitetura
Baixar livros de Artes
Baixar livros de Astronomia
Baixar livros de Biologia Geral
Baixar livros de Ciência da Computação
Baixar livros de Ciência da Informação
Baixar livros de Ciência Política
Baixar livros de Ciências da Saúde
Baixar livros de Comunicação
Baixar livros do Conselho Nacional de Educação - CNE
Baixar livros de Defesa civil
Baixar livros de Direito
Baixar livros de Direitos humanos
Baixar livros de Economia
Baixar livros de Economia Doméstica
Baixar livros de Educação
Baixar livros de Educação - Trânsito
Baixar livros de Educação Física
Baixar livros de Engenharia Aeroespacial
Baixar livros de Farmácia
Baixar livros de Filosofia
Baixar livros de Física
Baixar livros de Geociências
Baixar livros de Geografia
Baixar livros de História
Baixar livros de Línguas
Baixar livros de Literatura
Baixar livros de Literatura de Cordel
Baixar livros de Literatura Infantil
Baixar livros de Matemática
Baixar livros de Medicina
Baixar livros de Medicina Veterinária
Baixar livros de Meio Ambiente
Baixar livros de Meteorologia
Baixar Monografias e TCC
Baixar livros Multidisciplinar
Baixar livros de Música
Baixar livros de Psicologia
Baixar livros de Química
Baixar livros de Saúde Coletiva
Baixar livros de Serviço Social
Baixar livros de Sociologia
Baixar livros de Teologia
Baixar livros de Trabalho
Baixar livros de Turismo