( PDF ) Extração automática de contornos de telhados de edifícios de um modelo digital de elevação, utilizando inferência bayesiana e campos aleatórios de Markov

Download PDF

ads:

UNIVERSIDADE ESTADUAL PAULISTA

FACULDADE DE CIÊNCIAS E TECNOLOGIA

Pós-Graduação em Ciências Cartográficas

Presidente Prudente

2007

EDINÉIA APARECIDA DOS SANTOS GALVANIN

EXTRAÇÃO AUTOMÁTICA DE

CONTORNOS DE TELHADOS DE

EDIFÍCIOS EM UM MODELO DIGITAL DE

ELEVAÇÃO, UTILIZANDO INFERÊNCIA

BAYESIANA E CAMPOS ALEATÓRIOS DE

MARKOV

ads:

Livros Grátis

http://www.livrosgratis.com.br

Milhares de livros grátis para download.

UNIVERSIDADE ESTADUAL PAULISTA

FACULDADE DE CIÊNCIAS E TECNOLOGIA

Pós-Graduação em Ciências Cartográficas

Presidente Prudente

2007

EDINÉIA APARECIDA DOS SANTOS GALVANIN

EXTRAÇÃO AUTOMÁTICA DE

CONTORNOS DE TELHADOS DE EDIFÍCIOS

EM UM MODELO DIGITAL DE ELEVAÇÃO,

UTILIZANDO INFERÊNCIA BAYESIANA E

CAMPOS ALEATÓRIOS DE MARKOV

Tese apresentada ao Programa de Pós-Graduação em Ciências

Cartográficas da Faculdade de Ciências e Tecnologia da Universidade

Estadual Paulista, para obtenção do título de Doutor em Ciências

Cartográficas (Área de Concentração: Aquisição, Análise e

Representação de Informações Espaciais).

Orientador: Prof. Dr. Aluir Porfírio Dal Poz

Co-orientadora: Prof. Dra. Aparecida Doniseti Pires de Souza.

ads:

Galvanin, Edinéia Aparecida dos Santos.

Extração automática de contornos de telhados de edifícios em um modelo digital de

elevação, utilizando inferência bayesiana e campos aleatórios de Markov / Edinéia

Aparecida dos Santos Galvanin. – Presidente Prudente: [s.n.], 2007

165 f. : il.

Tese (doutorado) - Universidade Estadual Paulista, Faculdade de Ciências e

Tecnologia

Orientador: Aluir Porfírio Dal Poz

CO-Orientador: Aparecida Doniseti Pires de Souza

1. Automação. 2. Varredura a laser. 3. Markov Random Field. 4. Modelo Digital de

Elevação. 5. Inferência Bayesiana. 6. Extração de contornos de telhados. I. Galvanin,

Edinéia Aparecida dos Santos. II. Dal Poz, Aluir Porfírio. III. Souza, Aparecida Doniseti

Pires de. IV. Título.

CDD (18.ed.) 623.71

Ficha catalográfica elaborada pelo Serviço Técnico de Biblioteca e Documentação

UNESP – FCT – Campus de Presidente Prudente

Ao meu esposo Rober.

Eterno companheiro e grande incentivador deste projeto de vida.

Aos meus pais, José e Oneide.

Razão de minha existência.

À minha família.

Uma dádiva de Deus.

AGRADECIMENTOS

À Fundação Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (Capes), pelo

apoio financeiro em forma de bolsa de doutorado.

Ao instituto LACTEC pelo fornecimento dos dados de varredura a laser.

Aos meus orientadores, Prof. Dr. Aluir Porfírio Dal Poz e Aparecida Doniseti Pires de Souza

pelas discussões e contribuições no projeto de pesquisa. Ao Prof. Dr. Aluir pelo conhecimento

transmitido durante os quatro anos de trabalho.

Aos professores do programa de Pós-Graduação em Ciências Cartográficas e do departamento

de Cartografia.

Às amigas Daniele e Eniuce, pelas discussões que direta ou indiretamente colaboraram no

desenvolvimento deste trabalho.

Aos amigos Juliano Fazan, Marcelo, Luiz e Victor pela colaboração e apoio. A todos os

colegas do Programa de Pós Graduação que fazem parte desta conquista.

Aos funcionários do Departamento de Cartografia e do PPGCC

"A educação é a arma mais poderosa que você

pode usar para mudar o mundo."

(Nelson Mandela)

RESUMO

As Metodologias para a extração automática de telhados desempenham um papel importante

no contexto de aquisição de informação espacial para Sistemas de Informação Geográficas

(SIG). Neste sentido, este trabalho propõe uma metodologia para extração automática de

contornos de telhado de edifícios utilizando dados de varredura a laser. A metodologia baseia-

se em duas etapas principais: 1) Extração de regiões altas (edifícios, árvores etc.) de um

Modelo Digital de Elevação (MDE) gerado a partir dos dados laser; 2) Extração das regiões

altas que correspondem a contornos de telhados. Na primeira etapa são utilizadas as técnicas

de divisão recursiva, via estrutura quadtree e de fusão Bayesiana de regiões considerando

Markov Random Field (MRF). Inicialmente a técnica de divisão recursiva é usada para

particionar o MDE em regiões homogêneas. No entanto, devido a ligeiras diferenças de altura

no MDE, nesta etapa a fragmentação das regiões pode ser relativamente alta. Para minimizar

essa fragmentação, a técnica de fusão Bayesiana de regiões é aplicada nos dados

segmentados. Utiliza-se para tanto um modelo hierárquico, cujas alturas médias das regiões

dependem de uma média geral e de um efeito aleatório, que incorpora a relação de vizinhança

entre elas. A distribuição a priori para o efeito aleatório é especificada como um modelo

condicional auto-regressivo (CAR). As distribuições a posteriori para os parâmetros de

interesse foram obtidas utilizando o Amostrador de Gibbs. Na segunda etapa os contornos de

telhados são identificados entre todos os objetos altos extraídos na etapa anterior. Levando em

conta algumas propriedades de telhados e as medidas de alguns atributos (por exemplo, área,

retangularidade, ângulos entre eixos principais de objetos) é construída uma função de energia

a partir do modelo MRF. O problema de extração automática de contornos de telhados é

formulado a partir de uma estimativa de Maximum a posteriori (MAP), via algoritmo

Simulated Annealing (SA). A metodologia proposta foi testada em cinco áreas teste com

diferentes complexidades de configurações de objetos presentes na cena. Os experimentos

realizados com dados regulares obtidos por varredura a laser mostraram que a metodologia é

apropriada para aplicações envolvendo a extração automática de contornos de telhados, visto

que possibilitou a extração destes contornos com aproximadamente 90% de completeza de

área e 100% para a razão de extração de telhados.

Palavras-chave: Automação. Varredura a laser. MDE. Inferência Bayesiana. MRF. Extração

de contornos de telhados.

ABSTRACT

Methodologies for automatic building roof extraction are important in the context of spatial

information acquisition for geographical information systems (GIS). Thus, this work proposes

a methodology for automatic extraction of building roof contour from laser scanning data.

The methodology is based on two stages: 1) Extraction of high regions (buildings, trees etc.)

from a Digital Elevation Model (DEM) derived from laser scanning data; 2) Building roof

contour extraction. In the first stage is applied the recursive splitting technique using the

quadtree structure followed by a Bayesian merging technique considering Markov Random

Field (MRF) model. The recursive splitting technique subdivides the DEM into homogeneous

regions. However, due to slight height differences in the DEM, in this stage the region

fragmentation can be relatively high. In order to minimize the fragmentation, a region

merging technique based on the Bayesian framework is applied to the previously segmented

data. Thus, a hierarchical model is proposed, whose height values in the data depend on a

general mean plus a random effect. The prior distribution for the random effects is specified

by the Conditional Autoregressive (CAR) model. The posterior probability distributions are

obtained by the Gibbs sampler. In the second stage the building roof contours are identified

among all high objects extracted previously. Taking into account some roof properties and

some feature measurements (e. g., area, rectangularity, and angles between principal axes of

objects), an energy function is developed based on the MRF model. The problem of building

roof contour automatic extraction is formulated as the Maximum a Posteriori (MAP)

estimation by Simulated Annealing (SA) algorithm. The proposed methodology was tested in

five test areas with different object configuration complexities. Experiments carried out with

laser scanning data's DEM showed that the methodology is appropriated for applications

involving the roof contour extraction with approximately 90% shape accuracy and 100%

building detection rate.

Key words: Automation. Laser Scanning. DEM. Bayesian Inference. MRF. Roof Contour

Extraction.

ÍNDICE DE FIGURAS

Figura 1 - Aeronave e principais componentes do sistema de varredura a laser......................31

Figura 2 – Sistema de varredura a laser....................................................................................31

Figura 3 – Diâmetro do pulso...................................................................................................32

Figura 4 – Diâmetro do pulso para terrenos inclinados............................................................33

Figura 5 – Largura da faixa ......................................................................................................34

Figura 6 – Configuração da varredura em relação ao tipo de espelho .....................................35

Figura 7 – Imagem de intensidade obtida a partir da informação do retorno do primeiro pulso

laser...........................................................................................................................................39

Figura 8 – Fluxograma do processamento dos dados provenientes das medidas de varredura a

laser...........................................................................................................................................41

Figura 9 – Exemplo de perfilagem irregular obtida por varredura a laser. ..............................43

Figura 10 – Exemplo da malha regular após interpolação pelo algoritmo do vizinho mais

próximo.....................................................................................................................................44

Figura 11 – Grafo

()

E,VG = ...................................................................................................47

Figura 12 – 1-grafo não orientado............................................................................................48

Figura 13 – 1-grafo orientado...................................................................................................49

Figura 14 – (a) Grafo completo não orientado, (b) grafo completo orientado. ........................50

Figura 15 – Exemplos de cliques..............................................................................................50

Figura 16 – Divisão recursiva usando a estrutura quadtree......................................................54

Figura 17 – Esquema básico de análise de imagens ................................................................61

Figura 18 – Vizinhança de primeira ordem da clique ..............................................................79

Figura 19 – Vizinhança de segunda ordem da clique...............................................................80

Figura 20 – (a) Imagem segmentada; e (b) RAG .....................................................................81

Figura 21 – Fluxograma do algoritmo SA................................................................................88

Figura 22 – Fluxograma referente à primeira etapa da metodologia de extração de feições. ..91

Figura 23 – (a) Exemplo de dados irregulares fornecidos pela varredura a laser; (b) detalhe

ampliado dos dados irregulares. ...............................................................................................92

Figura 24 – Exemplo de uma malha regular sobreposta à imagem de intensidade..................92

Figura 25 – Visualização tridimensional..................................................................................93

Figura 26 – Imagem altimétrica das grades geradas pelos métodos de interpolação...............94

Figura 27 – Divisão recursiva usando a estrutura quadtree. ....................................................95

Figura 28 – Trajetória das Cadeias geradas para parâmetro .

..............................................99

Figura 29 – Trajetória das Cadeias Geradas para o efeito aleatório

S .................................100

Figura 30 – Ilustração da altura média a posteriori (em metros) de cada região da cena.......101

Figura 31 – Imagem binária com as regiões altas. .................................................................102

Figura 32 - Imagem de bordas obtida pelo detector de bordas de Canny. .............................103

Figura 33 – Fluxograma simplificado do processo de extração automática de contornos de

telhados...................................................................................................................................105

Figura 34 – Exemplo de vizinhança. ......................................................................................106

Figura 35 – Divisão setorial do circulo trigonométrico..........................................................108

Figura 36 – Histograma de freqüência. ..................................................................................109

Figura 37 – Representação da solução da Equação de energia. .............................................112

Figura 38 – Parte de um Arquivo de coordenadas..................................................................115

Figura 39 – Imagem de intensidade de retorno do pulso laser...............................................116

Figura 40 – Dados brutos (representados na cor branca) correspondentes a uma faixa de vôo,

sobrepostos à imagem de intensidade.....................................................................................117

Figura 41 – Área teste 1..........................................................................................................119

Figura 42 – Visualização tridimensional do MDE referente à área teste 1............................120

Figura 43 – Área teste 2..........................................................................................................121

Figura 44 – Visualização tridimensional do MDE referente à área teste 2............................121

Figura 45 – Área teste 3..........................................................................................................122

Figura 46 – Visualização tridimensional do MDE referente à área teste 3............................122

Figura 47 – Área teste 4..........................................................................................................123

Figura 48 – Visualização tridimensional do MDE referente à área teste 4............................123

Figura 49 – Área teste 5..........................................................................................................124

Figura 50 – Visualização tridimensional do MDE referente à área teste 5............................125

Figura 51 – Imagens resultantes do método de extração de contornos de telhados aplicado à

área teste 1 ..............................................................................................................................126

Figura 52 – Visualização do contorno extraído e do contorno de referência.........................127

Figura 53 – Imagens resultantes do método de extração de contornos de telhados aplicado à

área teste 2 ..............................................................................................................................129

Figura 54 – Visualização do contorno extraído e do contorno de referência.........................130

Figura 55 – Imagens resultantes do método de extração de contornos de telhados aplicado à

área teste 3 ..............................................................................................................................132

Figura 56 – Visualização dos contornos extraído e de referência..........................................133

Figura 57 – Imagens resultantes do método de extração de contornos de telhados aplicado à

área teste 4 ..............................................................................................................................135

Figura 58 – Visualização dos contornos extraído e de referência e respectiva identificação

para a análise numérica...........................................................................................................136

Figura 59 – Imagens resultantes do método de extração de contornos de telhados aplicado à

área teste 5 ..............................................................................................................................138

Figura 60 – Visualização do contorno extraído e do contorno de referência.........................140

Figura 61 – Identificação dos contornos de telhados. ............................................................141

ÍNDICE DE QUADROS

Quadro 1 – Determinação da densidade de pontos por metro quadrado, no terreno, a partir da

combinação de parâmetros. ......................................................................................................36

Quadro 2 – Cliques para os nós R

e R

do RAG.....................................................................83

ÍNDICE DE TABELAS

Tabela 1 – Percentual de reflexão de alguns materiais.............................................................38

Tabela 2 – Análise numérica dos resultados obtidos com o método de extração automática de

contornos de telhados. ............................................................................................................128

Tabela 3 – Análise numérica dos resultados obtidos com o método de extração automática de

contornos de telhados .............................................................................................................131

Tabela 4 – Análise numérica dos resultados obtidos com o método de extração automática de

contornos de telhados .............................................................................................................133

Tabela 5 – Análise numérica dos resultados obtidos com o método de extração automática de

contornos de telhados .............................................................................................................137

Tabela 6 – Análise numérica dos resultados obtidos com o indicador CA para cada contorno

de telhado extraído..................................................................................................................137

Tabela 7 – Análise numérica dos resultados obtidos com o método de extração automática de

contornos de telhados. ............................................................................................................140

Tabela 8 – Análise numérica dos resultados obtidos com o indicador CA para cada contorno

de ............................................................................................................................................141

LISTA DE ABREVIATURAS E SIGLAS

SIG = Sistema de Informação Geográfica

LASER = Light Amplification by Stimulated Emission of Radiance

GPS = Global Positioning System

IMU = Inertial Measurement Unit

MDE = Modelos Digitais de Elevação

MDT = Modelo Digital do Terreno

MDS = Modelo Digital de Superfície

MRF = Markov Random Field

NDVI = Normalized Difference Vegetation Indices

ISPRS = International Society for Photogrammetry and Remote Sensing

SA = Simulated Annealing

CCD = Charge Coupled Device

DGPS = Differential Global Positioning System

Nd: YAG = Neodimium: Yttrium Aluminum Garnet

TIM = Time Interval Meter

APD = Avalanche PhotoDiodes

WGS 84 = World Geodetic System 84

TIN = Triangulated Irregular Network

SNR = Signal-to-Noise Ratio

RAG = Region Adjacency Graph

MAP = Maximum a Posteriori

CAR = Modelo Auto-regressivo Condicional

BUGS = Bayesian Inference Using Gibbs Sampler

MCMC = Monte Carlo via Cadeia de Markov

REE = Razão de Extração de Edifícios

CA = Completeza de Área

LACTEC = Instituto de Tecnologia para o Desenvolvimento

SUMÁRIO

1 INTRODUÇÃO .........................................................................................................17

1.1 Trabalhos relacionados................................................................................................19

1.2 Objetivos .....................................................................................................................25

1.3 Justificativas ................................................................................................................26

1.4 Estrutura do trabalho ...................................................................................................27

2 FUNDAMENTAÇÃO TEÓRICA............................................................................28

2.1 Varredura a Laser ........................................................................................................28

2.1.1 Sistemas de varredura a laser.......................................................................................29

2.1.2 Princípio de funcionamento do sistema de varredura a laser aerotransportado ..........30

2.1.3 Características do sistema de varredura a laser ...........................................................32

2.1.4 Posição e orientação do sistema ..................................................................................37

2.1.5 Imagem de intensidade................................................................................................37

2.1.6 Qualidade dos dados de varredura a laser ...................................................................39

2.1.7 Processamento de dados..............................................................................................41

2.1.7.1 Amostragem dos dados ..............................................................................................42

2.1.7.2 Malha regular .............................................................................................................43

2.1.7.3 Métodos de interpolação ............................................................................................45

2.2 Grafos .....................................................................................................................46

2.2.1 Noções básicas.............................................................................................................47

2.2.2 Grafo não orientado.....................................................................................................48

2.2.3 Grafo orientado ou dígrafo ..........................................................................................48

2.2.4 Grafo completo............................................................................................................49

2.2.5 Subgrafo e o conceito de clique...................................................................................50

2.3 Segmentação................................................................................................................51

2.3.1 Divisão e fusão de regiões...........................................................................................52

2.3.2 Detecção de bordas......................................................................................................54

2.4 Vetorização e poligonização de contornos..................................................................57

2.4.1 Vetorização de mapas de bordas detectadas................................................................58

2.4.2 Representações para contorno .....................................................................................59

2.5 Abordagem bayesiana aplicada à análise de imagens .................................................60

2.5.1 Abordagem Bayesiana.................................................................................................62

2.5.1.1 Métodos numéricos ....................................................................................................66

2.5.1.2 Método de Monte Carlo via Cadeia de Markov (MCMC).........................................67

2.5.1.3 Software WinBUGS...................................................................................................71

2.5.1.4 Inferência Bayesiana para modelos Auto-regressivos Condicionais .........................72

2.5.2 Markov Random Field.................................................................................................76

2.5.2.1 MRF e distribuição de Gibbs .....................................................................................77

2.5.2.2 MRF para análise de imagens por regiões .................................................................80

2.5.2.3 MRF em estrutura de grafo ........................................................................................81

2.5.2.4 Rotulação de imagem usando MRF ...........................................................................83

2.5.2.5 Solução MAP .............................................................................................................85

3 METODOLOGIA PARA A EXTRAÇÃO AUTOMÁTICA DE

CONTORNOS DE TELHADOS DE EDIFICIOS EM UM MDE, UTILIZANDO

INFERÊNCIA BAYESIANA E MRF .................................................................................90

3.1 Metodologia para a extração automática de regiões altas em um MDE utilizando

Inferência Bayesiana e MRF ...................................................................................................90

3.1.1 Geração da malha regular de dados.............................................................................91

3.1.2 Segmentação via divisão recursiva..............................................................................95

3.1.3 Fusão de regiões usando uma Abordagem Bayesiana.................................................96

3.1.4 Extração dos contornos das regiões altas ..................................................................101

3.2 Extração automática de contornos de telhados de edifícios ......................................104

3.2.1 Caracterização do conhecimento sobre contornos de telhados .................................105

3.2.2 Definição da função de energia .................................................................................110

4 RESULTADOS E ANÁLISES ...............................................................................113

4.1 Considerações iniciais ...............................................................................................113

4.1.1 Recursos computacionais ..........................................................................................114

4.1.2 Dados utilizados no trabalho .....................................................................................115

4.2 Aspectos computacionais ..........................................................................................117

4.3 Experimentos e discussões ........................................................................................119

4.3.1 Primeiro experimento ................................................................................................125

4.3.2 Segundo experimento ................................................................................................128

4.3.3 Terceiro experimento.................................................................................................131

4.3.4 Quarto experimento...................................................................................................134

4.3.5 Quinto experimento...................................................................................................137

5 CONCLUSÕES E RECOMENDAÇÕES .............................................................142

5.1 Recomendações .........................................................................................................145

REFERÊNCIAS ..................................................................................................................147

BIBLIOGRAFIA.................................................................................................................156

ANEXOS ...............................................................................................................................159

1 INTRODUÇÃO

No âmbito da Cartografia, a aquisição, o gerenciamento, a análise e a

visualização de dados espaciais são de suma importância para as propostas de planejamento,

administração e monitoramento socioeconômico de cidades. Essas informações quando

disponibilizadas num Sistema de Informação Geográfica (SIG) auxiliam na tomada de

decisões e podem fornecer, por exemplo, dados sobre expansão territorial, cadastro de

imóveis urbanos, atualização de mapas entre outras. Segundo Dal Poz e Silva (2002) os SIG’s

existentes são alimentados por dados espaciais coletados frequentemente em mapas

analógicos preexistentes ou através de métodos fotogramétricos automáticos ou semi-

automáticos. Em se tratando dos mapas analógicos, a desvantagem ocorre na digitalização

onde são adicionados erros aos dados, tornando-os menos acurados que os dados originais dos

mapas. O método fotogramétrico é muito importante para a coleta e a atualização dos dados

espaciais, no entanto depende ainda da habilidade do operador humano. A grande vantagem

desse método é a possibilidade de se coletar dados espaciais com grande acurácia e

confiabilidade. Entretanto, as estratégias envolvidas geralmente demandam muito tempo. Isto

faz com que a tarefa de coleta de dados torne-se muito dispendiosa, fazendo com que uma

freqüência maior de revisão dessas informações seja, às vezes, economicamente inviável.

No intuito de chegar a soluções viáveis para a realização da tarefa de coleta

de dados, com alguma ou total automação, muito esforço tem sido feito por pesquisadores das

áreas de Fotogrametria e Visão Computacional, nos últimos 30 anos. O desenvolvimento de

métodos semi-automáticos e automáticos para coletar eficientemente dados espaciais a partir

de imagens digitais (aéreas e de satélite) e de outras fontes de dados, como os de varredura a

laser, são atualmente um dos principais focos de pesquisa em Fotogrametria (DAL POZ,

2002).

Nesse contexto, a extração de feições tem recebido, nos últimos anos,

considerável atenção. Por exemplo, a extração da malha viária é um tópico amplamente

pesquisado quando se trata da malha viária rural, mas, em se tratando da extração da malha

viária em áreas urbanas densas, a extração torna-se muito difícil e, consequentemente, ainda

são poucos os trabalhos relacionados. A alta complexidade deste problema se deve

principalmente a heterogeneidade dos objetos presentes na cena e o contexto, ou seja, as

relações existentes entre rodovias (ruas) e outros objetos (prédios, árvores, carros etc.). Esta

complexidade é também inerente à extração de outras feições urbanas, como os contornos de

telhados. Esses argumentos mostraram que desconsiderar o contexto na extração de objetos

urbanos pode levar a obstáculos difíceis de serem ultrapassados. Particularmente a extração de

edifícios já possui um histórico de quase 30 anos (VOSSELMAN, 2002). Até meados da

década de 1990 as imagens aéreas eram as fontes usuais de dados. No final dessa mesma

década outras fontes de dados (por exemplo, as imagens de satélites de alta-resolução e os

dados de varredura a laser) passaram a ser utilizadas.

O uso de dados laser em problemas de extração se tornou comum nos

últimos anos, fato decorrente principalmente do amadurecimento do sistema que integra o

sensor laser com o Global Positioning System (GPS) e a Inertial Measurement Unit (IMU).

Este sistema permite a aquisição rápida e eficaz de Modelos Digitais de Elevação (MDE

com alta precisão e exatidão altimétrica. As metodologias que utilizam os dados de varredura

a laser vêm sendo empregadas nas mais variadas áreas, mas no mapeamento em especial, são

bastante atrativas as aplicações que envolvem a reconstrução de superfície e a extração de

objetos. Isso implica na solução de problemas específicos envolvendo, por exemplo,

segmentação e filtragem de objetos (edifícios, vegetação etc.) (HAALA e BRENNER, 1999),

geração de Modelo Digital do Terreno (MDT

) e Modelo Digital de Superfície (MDS)

(MATIKAINEN, HYYPPÄ e HYYPPÄ, 2005).

Neste trabalho o problema de extração automática de contorno de telhados é

formulado com base na análise de dados laser, tendo por fundamento as abordagens

Bayesiana e de Markov Random Field (MRF) (JACKSON e LANDGREBE, 2002;

MODESTINO e ZHANG, 1992; KOPPARAPU e DESAI, 2001; DENG e CLAUSI, 2004;

BERTHOD et al., 1996; KRISHNAMACHARI e CHELLAPPA, 1996). O reconhecimento de

padrão é parte integrante dos problemas de análise de alto-nível, o qual se baseia no processo

de entendimento do significado de uma imagem através da identificação de objetos

semelhantes e análise do relacionamento espacial. Neste escopo está a modelagem baseada

em MRF.

A grande vantagem das abordagens usando o modelo MRF está em

possibilitar a interação entre as variáveis aleatórias relacionadas espacialmente. O MRF é

então um modelo poderoso para caracterizar a informação contextual.

Segundo El-Sheimy (1999) o termo "elevação" refere-se às medidas de altura acima de uma superfície de

referência (datum) e altitudes ou elevações de pontos sobre um modelo. MDE é um termo muito utilizado nos

EUA, e geralmente se refere a criação de uma malha regular de elevações, geralmente quadrada ou com padrão

hexagonal em relação ao terreno.

Kasser e Egels (2002) definem o MDT como uma representação das elevações de pontos sobre o terreno ou na

superfície da água.

Este trabalho propõe o desenvolvimento de uma metodologia para a extração

de contornos de telhados de edifícios usando MDE, Inferência Bayesiana e MRF. Esta opção

metodológica tem por motivação principal a exploração da informação contextual de

contornos de telhados, o que não tem sido comum na literatura produzida sobre o assunto.

1.1 Trabalhos relacionados

A extração de telhados é um assunto que vem ganhando impulso nos últimos

anos, fato evidenciado pela recente e ampla literatura produzida sobre o tema. Os métodos de

extração de telhados diferem quanto ao tipo de fonte de dados utilizado (imagens aéreas e de

satélite e dados de varredura a laser) e o tipo de reconstrução (a reconstrução poliédrica ou

tridimensional do edifício ou a reconstrução do contorno do telhado ou a simples segmentação

para detectar telhados).

Em se tratando da reconstrução poliédrica de edifícios, destaca-se a seguir

vários trabalhos relacionados. Essas pesquisas envolvem a utilização de dados irregulares de

varredura a laser. Nardinocchi e Forlani (2001) apresentam uma estratégia para reconstrução

de edifícios isolados usando dados de varredura a laser. Neste trabalho os telhados são

modelados como faces planas, conectados pelas cumeeiras e limitados pelas paredes dos

edifícios. Na primeira etapa desta abordagem os autores identificam e agrupam os pontos

pertencentes a cada plano de telhado, usando a técnica de crescimento de regiões. Somente

pontos com altura compatíveis a de um telhado são agrupados. Em seguida são extraídas as

bordas do telhado. No segundo estágio a informação geométrica obtida fornece a descrição

topológica sobre as faces planas do telhado e as paredes da edificação. Ao final da

metodologia as faces planas adjacentes são unidas formando o telhado da edificação. A

reconstrução final é obtida através da junção entre as faces do telhado e as paredes da

edificação.

Vosselman e Dijkman (2001) descrevem uma metodologia para a extração de

telhados e geração de modelos tridimensionais de edifícios. Para a extração das faces planas é

utilizada uma versão tridimensional da transformada de Hough. Para realizar a reconstrução

de edifícios são descritas duas estratégias. A primeira estratégia detecta as intersecções das

faces planas e a segunda assume que todas as faces planas detectadas modelam alguma parte

do edifício.

Rottensteiner e Briese (2002) apresentam um método para a geração

automática de modelos tridimensionais de edifícios. Usando um processo de interpolação

hierárquica, os pontos irregularmente distribuídos são classificados em pontos pertencentes ao

terreno, pontos pertencentes a edifícios e outras classes de objetos. O processo de interpolação

hierárquica segue algumas etapas: 1) é gerada uma pirâmide de dados, onde na base da

pirâmide se têm os pontos mais baixos do conjunto de dados. 2) é aplicado o algoritmo de

interpolação para gerar o MDT e 3) compara-se o MDT com os dados do próximo nível da

pirâmide, onde se têm pontos mais altos, e aceita os pontos que estão dentro de um limiar pré-

estabelecido. Após o processo de interpolação é gerada uma classificação inicial dos edifícios,

mas essa classificação ainda contém objetos que não foram corretamente separados. Um

filtro de abertura morfológico é aplicado para eliminar objetos alongados. Restam ainda nesta

etapa objetos pequenos que são eliminados usando o atributo de área mínima (por exemplo,

40m

). As regiões existentes nas bordas do MDS também são descartadas.

Alharthy e Bethel (2004) utilizam também dados irregulares de varredura a

laser para realizar a reconstrução tridimensional de edifícios. Neste trabalho os autores

mostram que a densidade de pontos fornecida pela varredura a laser é suficiente para

reconstruir detalhadamente as feições urbanas, tais como edifícios. A metodologia

desenvolvida neste trabalho utiliza um método baseado numa janela móvel. Este método é

utilizado para ajustar planos no conjunto irregular de dados. O método tem como princípio

sobrepor uma janela à malha irregular de dados e movê-la através da malha. A utilização de

diferentes tipos de janelas juntamente com a informação (por exemplo, altura) sobre os pontos

da malha é a chave para determinar os planos de telhado. Após a obtenção da orientação e

localização aproximada dos planos de telhado, as bordas dos telhados são extraídas e unidas.

O resultado final da metodologia mostrou somente a reconstrução de edifícios isolados.

Wang e Tseng (2004) utilizaram um algoritmo para divisão e fusão de dados

de varredura a laser baseado na estrutura octree. Após o processamento pelo algoritmo de

divisão recursiva, o conjunto de dados é segmentado em agrupamentos planos tridimensionais

e classificado utilizando atributos obtidos a partir desses planos, tais como área, gradiente,

intensidade etc..

A ênfase agora é dada aos métodos de reconstrução que utilizam os dados

regulares de varredura a laser. Haithcoat, Song e Hipple (2001) descrevem uma abordagem

automática de extração e reconstrução de edifícios utilizando os dados fornecidos por

varredura a laser. Inicialmente é gerado um MDS a partir dos dados laser onde os objetos

altos são automaticamente detectados. Baseado em características geométricas sobre edifícios

(tais como: tamanho, altura e forma), estes são separados de outros objetos. Os contornos dos

edifícios após a extração são simplificados usando um algoritmo de geometrização para obter

uma melhor qualidade cartográfica. O algoritmo de geometrização reduz os detalhes contidos

no contorno, mantendo a forma e o tamanho aproximado dos edifícios. É realizada após esta

etapa uma análise utilizando o operador Watershed para extrair as cumeeiras dos telhados. As

cumeeiras, assim como as inclinações, servem para classificar os tipos de edifícios. Os

edifícios são reconstruídos usando modelos paramétricos de telhados (por exemplo: plano,

triangular e de quatro águas).

Zhou et al. (2004) apresentam um método que utiliza os dados de varredura a

laser para geração do MDT e modelo tridimensional de cidade. O modelo tridimensional de

cidade é uma estrutura de dados orientada a objeto, no qual cada edifício é considerado como

um objeto, isto é, uma entidade da classe edifício. Os atributos de cada edifício incluem: tipos

de telhados, polígonos dos contornos das superfícies dos telhados, altura, parâmetros

descrevendo a superfície dos telhados e dados de perfilamento a laser contendo a superfície

dos telhados.

Os trabalhos citados anteriormente utilizavam apenas os dados de varredura a

laser para realizar a extração e reconstrução tridimensional de edifícios. Esses dados são úteis

para a reconstrução de edifícios, no entanto, o principal problema na utilização de tal recurso

é que a discriminação entre edifícios e outros objetos, como árvores, torna-se difícil quando é

usada somente a informação de altura (MAAS e VOSSELMAN, 1999; HAALA, 1994). Uma

solução para contornar esse problema é descrita em Brunn e Weidner (1997). Nesta pesquisa

esses autores propõem uma abordagem baseada na análise da textura das regiões selecionadas,

a partir dos dados de varredura a laser, assumindo que a vegetação e telhados possuem

texturas diferentes. A busca por outras soluções que contornem o problema destacado, tem

impulsionado nos últimos anos o interesse pelas pesquisas que utilizam vários recursos de

dados na reconstrução tridimensional de feições, especificamente as relacionadas com

edifícios.

Haala e Brenner (1999) abordam a integração de dois métodos de coleta de

dados em ambientes urbanos para a reconstrução tridimensional de edifícios. O primeiro

método combina imagens multiespectrais e dados de varredura a laser em uma classificação

integrada para a extração de edifícios, árvores e áreas cobertas por gramíneas. A segunda

abordagem usa dados de varredura a laser e a planta baixa do edifício para realizar a

reconstrução tridimensional dos edifícios.

Em Vosselman (2002), é apresentada uma estratégia para a reconstrução de

edifícios usando dados de varredura a laser, plantas baixas de edifícios e imagens aéreas de

alta-resolução. Nessa estratégia, as plantas baixas dos edifícios são obtidas a partir dos dados

georreferenciados e utilizadas como referência para a construção de superfícies poliédricas

representando os edifícios. As bordas dos telhados são refinadas com base nas imagens

aéreas. O autor ressalta que a vantagem em usar mais de um recurso de dados para a

reconstrução de edifícios é que a modelagem não fica restrita a poucas primitivas, por

exemplo, forma. No entanto, o autor cita que há desvantagem na robustez da reconstrução se

for utilizado vários recursos de dados, pois as faces de telhado obtidas por cada recurso de

dados precisam ser detectadas e reconstruídas separadamente.

Outro método para extrair edifícios em estruturas complexas de telhados a

partir de dados de varredura a laser e plantas baixas é proposto por Park et al. (2006). Esta

extração inclui dois estágios, isto é, a extração de primitivas e a modelagem do edifício, que

são baseados na segmentação de regiões planas do conjunto de pontos fornecidos pela

varredura a laser. Esses segmentos planos são usados como primitivas primárias para obter as

primitivas secundárias, tais como cumeeiras e fronteiras de beiral, e assim refinar a estrutura

dos telhados.

O trabalho de Sohn e Dowman (2003) descreve um método automático para

extração de edifícios a partir da combinação entre dados multiespectrais do satélite Ikonos e

dados regulares de varredura a laser. Nesta abordagem, os edifícios individuais são

localizados como polígonos retangulares através de uma segmentação aplicada aos dados

laser. Logo após, são extraídas feições retas na imagem Ikonos utilizando o algoritmo de

Burns (BURNS, HANSON e RISEMAN, 1986). Essas feições são filtradas através de um

critério de comprimento onde permanecem somente as feições abaixo de um comprimento

pré-determinado. As feições extraídas são agora sobrepostas e analisadas no espaço dos dados

laser. Ao final o edifício é reconstruído usando apenas os polígonos que compreendem partes

significativas dos edifícios.

Matikainen, Hyyppä e Hyyppä (2005) utilizam a informação altimétrica do

sistema laser para a geração de modelos digitais da superfície e posteriormente integram esta

informação com a imagem aérea, auxiliando na eliminação de feições irrelevantes (árvores,

sombras etc.) no processo de detecção. Schenk e Csatho (2002) utilizam uma combinação de

dados laser e imagens aéreas para a obtenção de contornos de telhados de edifícios. As

superfícies planas representando telhados são obtidas a partir da segmentação por crescimento

de regiões nos dados laser. As cumeeiras dos telhados são obtidas através da intersecção dos

planos obtidos anteriormente. Estas mesmas intersecções são extraídas na imagem aérea

usando o detector de Canny. As informações de intersecção de telhados obtidas por ambas as

metodologias são combinadas para eliminar falsos positivos.

Dentre as pesquisas envolvendo a detecção ou extração de contornos de

telhados, pode-se destacar o trabalho de Rottensteiner et al. (2005) que descrevem um método

para delinear faces planas de telhado usando dados regulares de varredura a laser. As faces

planas são inicialmente detectadas utilizando o algoritmo de crescimento de regiões. Esse

método inicia com a detecção de regiões sementes e o plano se expande a partir da região

semente, adicionando pontos pertencentes ao MDS que são adjacentes a essas regiões. Em

seguida é realizado o agrupamento e o delineamento dos planos de telhado. Nesta etapa, os

planos de telhado são unidos baseando-se na análise de vizinhança. No final é realizada a

detecção das bordas dos planos, a partir das quais são obtidos os polígonos descrevendo os

contornos dos telhados.

Arefi e Hahn (2005) utilizam operações morfológicas para extrair contornos

de edifícios e vegetação. Para esse propósito é realizada uma segmentação hierárquica

utilizando operações morfológicas. A segmentação hierárquica é um processo iterativo que

inicia com elementos estruturantes pequenos e segue aumentando o tamanho desses

elementos. Nesse trabalho foram utilizados os dados provenientes do primeiro e último pulso,

possibilitando a geração de imagens de intensidade obtidas por normalização do MDE, nas

quais a metodologia foi aplicada.

Tarsha-Kurdi et al. (2006) desenvolveram um método automático de

segmentação a partir da nuvem de pontos (malha irregular de pontos) obtida por varredura a

laser usando somente a informação do primeiro pulso laser. O resultado da metodologia é a

discriminação automática de contornos de edifícios e terrenos, excluindo áreas de vegetação.

Lohmann (2002) e Voegtle e Steinle (2003) também realizam a segmentação na nuvem de

pontos e não sobre uma malha regularizada.

Tóvári e Pfeifer (2005) descrevem uma técnica que combina duas

abordagens. A primeira trabalha diretamente na nuvem de pontos usando critérios

geométricos (baseado em alturas, inclinações e diferença de curvatura) para decidir se um

ponto está sobre o terreno ou sobre um objeto. Na segunda abordagem, inicialmente os dados

são segmentados utilizando o algoritmo de crescimento de regiões e em seguida é realizada

uma filtragem dos dados baseada em critérios de similaridade e distância entre pontos.

Sohn (2004) ressalta que a extração de contornos de edifícios é um problema

difícil no âmbito do reconhecimento de objetos, o que está relacionado com a complexidade e

a variabilidade da cena. Para minimizar esse problema o autor sugere a fusão de várias fontes

de dados. Este trabalho inicialmente realiza, a partir de uma nuvem de pontos, a distinção

entre pontos do terreno e pontos não pertencentes ao terreno. A classificação dos pontos é

feita assumindo que o espaço laser é uma superfície localmente plana, assim os dados são

recursivamente fragmentados em pequenas regiões até que não haja mais diferenças de altura

nos dados da região analisada. A seguir é gerado um MDS com os pontos que não pertencem

ao terreno. As árvores são identificadas na imagem Ikonos usando o Normalized Difference

Vegetation Indices

(NDVI). Ao final do trabalho os pontos pertencentes ao terreno e às

árvores são eliminados, permanecendo os polígonos referentes aos telhados identificados.

Bretar e Roux (2005) apresentam uma metodologia de segmentação

combinando dados laser e imagens aéreas. Inicialmente, os dados laser são processados para

extrair primitivas dos edifícios. Essas primitivas são então introduzidas no processo de

segmentação baseado em fusão de regiões.

Machado e Mitishita (2006) desenvolveram uma metodologia automática

para detectar contornos de edificações integrando informações provenientes da imagem

digital e dos pontos obtidos pelo sistema de varredura a laser. Inicialmente a imagem é

segmentada usando o espaço de cores, via algoritmo de deslocamento pela média (mean shift).

A seguir, aplica-se o algoritmo de perseguição de contornos, para a geração dos contornos das

regiões segmentadas. Para eliminar regiões não pertencentes às edificações os autores efetuam

uma filtragem dos segmentos gerados, utilizando três filtros sucessivamente. Filtro para o

padrão verde (removendo vegetação), filtro altimétrico (preservando regiões altas), e filtro

Douglas-Peucker (detecção de feições lineares). Os contornos resultantes após a aplicação dos

filtros apresentados são avaliados quanto à possibilidade de fusão entre regiões vizinhas,

estabelecendo-se os contornos definitivos (em nível de pixel) do que se acredita serem

edificações. Os resultados apresentados são contornos de edificações isoladas.

As metodologias existentes para a extração de telhados exploram diversos

processos para alcançar o objetivo desejado. Uma teoria que vem ganhando espaço no campo

da extração de feições é o MRF. No entanto, ainda há uma escassez na quantidade de

trabalhos que exploram o uso do modelo MRF na análise de dados de varredura a laser,

especialmente no contexto de extração de edifícios ou contornos de telhados. A principal

vantagem de se utilizar a segmentação baseada em MRF é a possibilidade de integração ao

processo das relações espaciais entre regiões vizinhas presentes na cena analisada (DUBES e

JAIN, 1989). Os poucos trabalhos existentes que utilizam o modelo MRF para extração de

contornos de telhados se baseiam em dados de imagem. Por exemplo, Krishnamachari e

Chellappa (1996) desenvolveram uma metodologia de extração de contornos de telhados que

envolve a extração de feições retas em uma imagem aérea. O modelo MRF é usado para

agrupar essas feições retas para delinear os edifícios na imagem aérea. Katartzis et al. (2001)

propõem um método automático para detecção de telhados em imagens aéreas utilizando um

modelo baseado em MRF. Os telhados são extraídos usando agrupamento hierárquico e

princípios de organização perceptual.

Neste trabalho é proposta e avaliada uma metodologia para extração de

contornos de telhados de edifícios, onde a principal meta é o aproveitamento do potencial do

modelo MRF para a modelagem de relações espaciais. Esta metodologia possui duas etapas

básicas. Na primeira etapa os objetos altos são extraídos no referencial do MDE. E na

segunda, os contornos de telhados são separados entre os contornos extraídos na primeira

etapa. As duas etapas são desenvolvidas utilizando métodos que envolvem a Inferência

Bayesiana e modelos MRF.

1.2 Objetivos

O objetivo geral deste trabalho é a extração automática de contornos de

telhados de edifícios em um MDE gerado a partir de dados de varredura a laser usando

modelo MRF e Inferência Bayesiana.

Visando atingir o objetivo geral, extração automática de contornos de

telhados de edifícios, os seguintes objetivos específicos são propostos:

1- A fim de reduzir a complexidade das informações geométricas do MDE, será

desenvolvida uma metodologia para a extração de objetos altos em geral, no MDE,

valendo-se de duas etapas: 1 – segmentação por regiões do MDE, usando uma

estratégia recursiva via estrutura quadtree; 2 – redução da fragmentação das regiões

detectadas na primeira etapa usando uma estratégia de fusão de regiões semelhantes.

2- Separação, entre os objetos altos previamente extraídos, das regiões altas

correspondentes aos contornos de telhados;

3- Implementar computacionalmente as metodologias propostas nos objetivos específicos

1 e 2;

4- Avaliar experimentalmente as metodologias propostas usando dados reais.

1.3 Justificativas

A relevância científica e tecnológica deste trabalho é evidenciada pela

importância dada ao tema pela International Society for Photogrammetry and Remote Sensing

(ISPRS), onde um dos termos de referência é o uso de MRF e redes Bayesiana. O Grupo de

Trabalho WG III/3 (Processing of Point Clouds from Laser Scanners and other Sensors) da

Comissão III (Photogrammetric Computer Vision and Image Analysis) possui como um dos

termos de referência à segmentação, filtragem e extração automática e semi-automática de

objetos utilizando diversas fontes de dados.

A extração automática de feições cartográficas, quando se trata

principalmente da extração em áreas urbanas, é de grande importância tecnológica, pois ainda

hoje, a extração de feições é realizada manualmente, implicando na morosidade e no alto

custo do processo de captura de dados. Em conseqüência, fica limitada a densidade e a

resolução dos dados a serem coletados, impactando também negativamente o ciclo de revisão

desses dados. A metodologia proposta neste trabalho se insere no contexto de

desenvolvimento de novas metodologias para a captura eficiente de informações espaciais a

partir de dados gerados por diversos sensores. Embora o aumento do nível de automação seja

o aspecto que normalmente vem em primeiro plano, a confiabilidade e a acurácia dos

procedimentos convencionais devem ser igualmente valorizados.

O ineditismo do trabalho se dá pelo fato de se desconhecer na literatura

relacionada metodologias de extração de contornos de telhados que utilize estratégia

semelhante à descrita neste trabalho. O aspecto mais relevante deste trabalho é a exploração

das possibilidades oferecidas pelo modelo MRF para a modelagem de relações espaciais entre

objetos. A exploração eficiente do contexto nos sistemas de extração automática de feições

pode ser determinante para a melhoria de desempenho destes sistemas, tornando-se mais

compatíveis com a qualidade do sistema de visão humana.

1.4 Estrutura do trabalho

Este trabalho está organizado em 5 capítulos principais. O primeiro capítulo

descreve a introdução e a motivação ao problema de extração automática de contornos de

telhados, apresentando alguns trabalhos relacionados com extração de telhados utilizando

dados de varredura a laser e outras fontes de dados e, finalizando, são apresentados os

objetivos geral e específico, bem como suas principais justificativas.

No segundo capítulo são apresentados vários conceitos, técnicas e modelos

fundamentais para o desenvolvimento da metodologia a ser apresentada no capítulo 3, quais

sejam: algumas características do sistema de varredura a laser, princípio de funcionamento do

sistema, posição e orientação do sistema, um relato da qualidade dos dados de varredura a

laser e uma visão geral sobre o processamento dos dados obtidos por varredura a laser;

conceitos da teoria de grafos; segmentação utilizando divisão e fusão de regiões; os princípios

de vetorização de bordas; abordagem bayesiana aplicada à análise de imagem; MRF;

distribuição de Gibbs; distribuição a posteriori; MRF no contexto de análise de imagem;

algoritmo Simulated Annealing (SA); modelo condicional auto-regressivo (CAR); amostrador

de Gibbs; software WinBUGS.

O terceiro capítulo trata da metodologia para a extração automática de

contornos de telhados em áreas urbanas em um MDE utilizando Inferência Bayesiana e

modelo MRF. A metodologia proposta é descrita conforme as suas duas etapas principais, isto

é, a extração de contornos de objetos altos em geral, seguida da separação dos objetos de

interesse (contornos de telhados).

No quarto capítulo são apresentados e discutidos os resultados obtidos com

a metodologia de extração de contornos de telhados.

No quinto capítulo são apresentadas as principais conclusões e algumas

recomendações futuras.

2 FUNDAMENTAÇÃO TEÓRICA

Este capítulo apresenta a revisão bibliográfica sobre conceitos, modelos e

técnicas utilizados para o desenvolvimento da metodologia de extração automática de

contorno de telhados a partir de um MDE. Apresenta-se a seguir os tópicos relacionados com

varredura a laser, teoria dos grafos, segmentação, vetorização e poligonização, abordagem

bayesiana aplicada à análise de imagem e MRF.

2.1 Varredura a Laser

Com o avanço da tecnologia, as metodologias para a realização do

levantamento tridimensional de pontos no terreno estão se aperfeiçoando. Aliadas ao

desenvolvimento tecnológico, surgem as técnicas para a representação direta da superfície

terrestre por meio da representação digital do relevo, bem como das elevações associadas com

objetos (árvores, edificações etc.) sobre a superfície terrestre.

Para representar de forma continua o terreno (superfície física da Terra) e as

elevações nele presentes em meio digital seriam necessários um número infinito de pontos, no

entanto essa quantidade de informação requer um armazenamento infinito de dados. Diante da

impossibilidade computacional de armazenamento de tal quantidade de dados, uma forma

alternativa de representação é a utilização de uma quantidade finita de pontos que represente o

terreno. Para sanar essa demanda, ultimamente estão sendo usados a amostragem de dados o

MDT e o MDE.

Uma das formas para se obter um MDE é através de processos

fotogramétricos. Também é possível obter um MDE por meio de levantamento GPS em

campo. Esses métodos consistem basicamente na coleta de uma malha de pontos com

coordenadas de terreno que permitem produzir a modelagem desejada. Todos são métodos

válidos e contribuíram historicamente para a produção dos documentos cartográficos

existentes. No entanto, esses métodos são dispendiosos, pois envolvem equipes de campo ou

fotogrametristas especializados, além de implicarem em um maior custo efetivo. Uma opção

que tem se viabilizado atualmente se baseia na coleta de dados através de sistemas de

varredura a laser.

Nos últimos anos, o uso da tecnologia de varredura a laser tem se tornado

foco de pesquisas. A necessidade de aquisição rápida e eficaz de dados digitais de elevação do

terreno (MDE) tem motivado o uso desta tecnologia. Uma grande atenção vem sendo dada ao

tema, sendo criado pela Commission III da International Society for Photogrammetry and

Remote Sensing

(ISPRS) um grupo de trabalho (Working Group III/3 "Tridimensional

Reconstruction from Airborne Laser Scanner and InSAR Data") com objetivo de pesquisar de

forma mais ampla a acurácia e o uso de dados fornecidos por essa tecnologia.

A geração automática de MDE é ainda um problema quando se trata da

modelagem dos objetos sobre a superfície do terreno. Efeitos de perspectiva causados pela

geometria das fotografias, estabelecimento da correspondência, problema de sombras, entre

outros, não permitem a modelagem correta dos objetos. Com o intuito de sanar esses

problemas, a varredura a laser surge como uma tecnologia emergente aumentando, nos

últimos anos, o interesse da comunidade cartográfica em relação ao conhecimento e ao uso

mais intenso desse sistema.

2.1.1 Sistemas de varredura a laser

Existem dois tipos de sistemas de varredura a laser, os sistemas estáticos e

os dinâmicos. Nos sistemas estáticos existem basicamente dois princípios diferentes de

medida a laser: o princípio que se baseia no intervalo de tempo decorrido desde o instante da

emissão do pulso até o instante do retorno do mesmo (distância) ao sistema e o princípio

baseado na triangulação (BOEHLER, HEINZG e MARBS, 2001).

Para medir distâncias maiores, há o sistema que trabalha com o tempo de

retorno do sinal. Segundo Tommaselli (2003) esse sistema mede a distância através do tempo

de retorno do pulso laser. Neste sistema de varredura, o instrumento emite milhares de pulsos

laser por segundo, normalmente de radiação infravermelha. O instrumento mede as distâncias,

a intensidade da energia refletida pelo objeto e os parâmetros de atitude do feixe (azimute e

elevação), que são as coordenadas polares do ponto, em relação ao referencial do laser. A

partir destes dados é possível calcular as coordenadas cartesianas tridimensionais dos pontos

medidos e sua resposta espectral, que pode ser usada para criar uma imagem semelhante à

visível.

Os sistemas baseados no princípio da triangulação possuem uma fonte laser

e, no mínimo, um sensor Charge Coupled Device (CCD). Neste sistema um pulso de laser é

emitido para o objeto e seu retorno é registrado por um ou mais sensores CCD’s. O ângulo de

varredura dos pulsos é registrado no sistema a cada pulso emitido. Conhecendo-se a base fixa

entre o sensor laser e a câmara, por meio de um processo de calibração, determina-se a

posição dos pontos refletidos pelo objeto (BOEHLER, HEINZG e MARBS, 2001).

Já o sistema dinâmico, no qual está baseado o sistema de varredura a laser

aerotransportado, utiliza um feixe óptico de alta potência e bem direcionado, com coerência

no espaço e no tempo, para garantir a qualidade da medição da distância. Para determinar a

posição dos pontos no terreno, o sensor conta com apoio de um sistema de posicionamento

global com precisão compatível. A posição do sensor na hora da medição de cada ponto é

determinada mediante um sistema de GPS diferencial (DGPS) obtendo-se as posições

GPS GPS GPS

YZ. Um segundo sistema de apoio, uma IMU, é encarregada de calcular a

inclinação (,,)

ϕκ

do sensor em torno dos eixos (DALMOLIN e SANTOS, 2004).

2.1.2 Princípio de funcionamento do sistema de varredura a laser aerotransportado

O sistema de varredura a laser composto pelo GPS, a IMU e o laser (Figura

1), tem como função principal, através da emissão e recepção de pulsos de laser, medir a

distância entre o sensor e a superfície do objeto. Com a integração GPS/IMU, o sistema

fornece uma nuvem de pontos adquirida através das medidas de distância.

O princípio básico do sistema de varredura a laser consiste na utilização de

um feixe de laser que é emitido, com o auxílio de um espelho de varredura, em direção aos

objetos. Este feixe é refletido ao atingir a superfície dos objetos, retornando um eco ao

sistema. Este sistema é então encarregado de registrar o tempo decorrido entre a emissão e a

captação do eco, permitindo a obtenção da distância entre o sensor e o objeto iluminado.

Um sistema de varredura a laser é composto de alguns componentes

essenciais como o gerador de pulsos laser, conjunto óptico de transmissão e recepção do

pulso, detector de sinais, unidade de controle e armazenamento e outros componentes

eletrônicos.

Figura 1 - Aeronave e principais componentes do sistema de varredura a laser. (Fonte:

http://www.lidar.com.br/tecnologia.htm).

O gerador de pulsos, mostrado na Figura 2, é o componente principal do

sensor laser. É responsável pelo estímulo do cristal, realizado através de um diodo

semicondutor que provê a energia necessária para a emissão de um raio laser de alta energia.

Um tipo de cristal comumente utilizado é o chamado

Neodimium: Yttrium Aluminum Garnet

(Nd: YAG) (WEHR E LOHR, 1999).

Controlador de

ruído

Conversor

analógico/digital

Medidor de

intervalo de

tempo

Unidade de

controle e

armazenamento

Gerador de

pulso LASER

Pulso

emitido

Receptor

GPS

IMU

Largura da

faixa

Direção de

vôo

Direção de

varredura

Pulso

recebido

Figura 2 – Sistema de varredura a laser (Fonte: Adaptado de DALMOLIN e SANTOS, 2004).

Varredura a

laser

IMU

GPS

Após o pulso ser gerado, ele é dirigido para a chamada cavidade óptica até

um espelho móvel na parte final do sensor. O conjunto óptico de lentes e espelhos orienta os

pulsos laser emitindo-os para os objetos. O sinal de retorno é dirigido à parte eletrônica de

recepção do sensor, que recebe um sinal analógico de retorno e por meio de um conversor

A/D transforma o sinal analógico em digital. O sinal digital da radiação refletida passa por um

filtro de interferência (controlador de ruído) que verifica se o sinal recebido possui a mesma

intensidade do sinal emitido.

O Medidor de Intervalo de Tempo (

Time Interval Meter - TIM) é o módulo

responsável pela medida do tempo transcorrido entre a emissão do pulso laser e o seu retorno

ao sistema. Essencialmente, ele é um contador que inicia quando o pulso laser é disparado e

para quando o último pulso correspondente retorna.

2.1.3 Características do sistema de varredura a laser

A divergência do pulso é uma característica física do pulso laser de divergir

à medida que se propaga no meio. Essa divergência é relativamente baixa, resultando numa

área do alvo de diâmetro muito pequeno. Um pulso emitido pelo sistema gera no alvo uma

área circular de diâmetro (A), relacionada com a altura de vôo (H) e a divergência angular do

pulso (

) (Figura 3).

(a) (b)

Figura 3 – Diâmetro do pulso. (a) considerando uma abertura D; (b) considerando uma abertura D

muito pequena (Fonte: Adaptado de BALTSAVIAS, 1999).

O diâmetro do círculo projetado no alvo, para uma abertura (D) ilustrada na

Figura 3(a), pode ser determinado através da relação de semelhança de triângulos,

() ()

/2 /2

tg x H tg

γγ

=⇒=

. (1)

Para uma abertura (D) muito pequena (Figura 3(b)), a Equação 1 é dada por

(

)

22/2,Ax AHtg

=⇒=

(2)

onde:

A é o diâmetro do círculo projetado no alvo;

D a abertura do laser;

γ é a divergência angular do pulso laser em radianos;

H é a altura de vôo em metros.

No caso de terrenos inclinados, a Equação 2 é generalizada levando em

consideração a Figura 4.

i < 0

Figura 4 – Diâmetro do pulso para terrenos inclinados (Fonte: BALTSAVIAS, 1999).

⎟

⎠

⎞

⎜

⎝

⎛

−

⎟

⎠

⎞

⎜

⎝

⎛

cos

senHa

⎥

⎦

⎤

⎢

⎣

⎡

⎟

⎠

⎞

⎜

⎝

⎛

+++++=

)()()(cos

θθθ

itgisenia (3)

onde,

é o ângulo de varredura do sistema;

i é o ângulo de inclinação do terreno.

Dependendo da situação, o ângulo de divergência pode ser ajustado através

de elementos ópticos apropriados. Em alguns casos há a necessidade de uma divergência

menor como, por exemplo, em levantamentos de detecção de cabos de linhas de transmissão e

para maior penetração na vegetação.

A varredura é feita no sentido transversal à direção de vôo com uma

abertura especificada pelo operador. O ângulo de varredura permite a determinação da largura

de faixa abrangida pela varredura a laser, enquanto o movimento da aeronave permite a

cobertura na direção de vôo. As pulsações ópticas refletidas no solo são coletadas pelo

receptor e são convertidas de sinal óptico para digital. A largura da faixa abrangida pela

varredura (Figura 5) pode ser determinada utilizando a Equação 4,

2(/2),

LHtg

(4)

onde:

L representa a largura da faixa varrida pelo sensor em metros;

H representa a altura de vôo em metros;

θ é o ângulo de varredura do sistema.

Figura 5 – Largura da faixa (Fonte: Adaptado de BALTSAVIAS, 1999).

O sistema de varredura a laser utiliza espelhos de varredura óptico-

mecânico, sendo que a varredura pode ser unidirecional ou bidirecional, existindo diferentes

opções para se efetuar o redirecionamento do feixe do laser (WEHR e LOHR, 1999). Os

espelhos de varredura existentes são classificados em: espelho de varredura Palmer (produz

modelos elípticos), polígono de rotação (produz linhas paralelas) e o espelho oscilador

(produz linhas em “zig-zag”) como mostra a Figura 6.

(a) (b) (c)

vôo

n-ésima varredura

primeira

varredura

Figura 6 – Configuração da varredura em relação ao tipo de espelho. (a) espelho de varredura Palmer;

(b) polígono de rotação; (c) espelho oscilador. (Fonte: Adaptado de DALMOLIN e SANTOS, 2004).

A Figura 6 mostra a configuração da varredura para três tipos de espelhos. O

espelho de varredura Palmer é ilustrado na Figura 6(a), o espelho polígono de rotação (Figura

6(b)) possui varredura unidirecional, e o espelho oscilante possui uma varredura bidirecional

(Figura 6(c)). Os pontos ao longo de uma linha são varridos em incrementos de ângulos iguais

(WEHR e LOHR, 1999).

O deslocamento da aeronave combinado com movimentos laterais do

conjunto óptico móvel produz uma seqüência de varredura que, dependendo do tipo de

espelho utilizado, forma um padrão de varredura. O padrão de varredura é definido pela

oscilação do conjunto óptico em torno do eixo (freqüência de varredura) em conjunto com o

movimento da aeronave. Desta forma, a freqüência de varredura determina a densidade dos

perfis, ou seja, se a freqüência de varredura é alta, são obtidos perfis transversais à linha de

vôo, densos. Neste caso, o diâmetro do pulso projetado é superior ao espaçamento em

questão, mostrando a necessidade de aumentar a freqüência de varredura para uma melhor

distribuição dos pontos por metro quadrado.

O quadro 1 ilustra uma combinação de freqüências de varredura com

algumas alturas de vôo, tendo como resultante a densidade de pontos por metro quadrado.

Neste quadro, estabeleceu-se a velocidade da aeronave em 230 km/h, equipamento com

freqüência operacional de 33 kHz e ângulo de varredura de 40°.

Quadro

1 – Determinação da densidade de pontos por metro quadrado, no terreno, a partir da

combinação de parâmetros.

Altura de vôo

500m 1000m 2000m

Freqüência de varredura 29Hz 27Hz 19Hz

Largura da faixa 360m 720m 1440m

Espaçamento dos pontos –

eixo X

1,11 1,19 1,69

Espaçamento dos pontos –

eixo Y

0,63 1,18 1,66

Pontos/m

1,40 0,70 0,40

Fonte: Adaptado de Brandalize, 2002.

O quadro 1 ilustra a determinação da densidade de pontos em relação a

freqüência de repetição dos pulsos, altura de vôo e ângulo de varredura. Pode-se verificar que

a densidade e a distribuição dos pontos que são medidos na superfície do terreno estão

intrinsecamente relacionadas a esses parâmetros.

Para medir a distância entre o sensor e o alvo é necessário determinar as

condições atmosféricas e a velocidade de propagação do pulso laser e o tempo transcorrido

entre o pulso transmitido e recebido. Esse tempo é detectado pela óptica do sistema e

registrado pelo TIM. Dessa forma, a distância pode ser calculada pela Equação 5,

tcR

, (5)

onde:

R é a distância entre o sensor e o alvo;

c a velocidade da luz;

é o tempo transcorrido entre o pulso emitido e recebido.

Os sistemas de varredura a laser operam em qualquer horário, diurno ou

noturno. No entanto, existem algumas interrupções como as provocadas por chuva ou nuvens

muito densas entre o local varrido e a aeronave. Esses sistemas dependem basicamente da

detecção da resposta de uma superfície natural ou artificial. Assim, esta reflexão depende

basicamente das características desta superfície.

Uma faixa estreita do espectro é utilizada, operando na faixa do

infravermelho próximo e médio, ou seja, entre 800 e 1600

ηm. A faixa do espectro a ser

utilizada é limitada por questões de segurança. A escolha da melhor faixa do espectro a ser

trabalhada depende das propriedades de reflexão dos alvos, tendo em vista os objetivos do

estudo. Por exemplo, uma faixa de 1535

ηm não é adequada para a neve que reflete pouco

neste comprimento de onda, sendo que uma melhor escolha, neste caso, seria de 810

ηm

(Brandalize, 2002).

2.1.4 Posição e orientação do sistema

Em um sistema de varredura a laser, o receptor GPS integrado ao sistema,

registra a posição da aeronave em intervalos fixos. Outro receptor localizado no solo fornece a

correção diferencial em tempo real para uma determinação de posição mais precisa. O DGPS

é um método de refinamento dos dados posicionais derivados do rastreio realizado pelo GPS

por meio da correção de erros inerentes ao processo. O segundo sistema de apoio, isto é, uma

IMU, fornece os ângulos de atitude da aeronave durante o levantamento.

A configuração dos sistemas na aeronave é feita posicionando a antena GPS

aerotransportada na carenagem externa da aeronave. O sensor laser e a IMU são instalados no

interior da aeronave.

A integração GPS/IMU é uma ferramenta poderosa. A IMU pode

complementar o GPS fornecendo a posição inicial e a informação de velocidade angular após

a perda de sinal do receptor. Mesmo quando a visibilidade dos satélites é insuficiente, a IMU

pode fornecer informações contínuas de trajetória (CRAMER e STALLMANN, 2001).

2.1.5 Imagem de intensidade

Alguns sistemas de perfilamento a laser possuem uma característica

marcante que está relacionada com a capacidade de refletância de determinados objetos. Neste

caso são disponibilizados dados de intensidade de retorno dos pulsos ao sistema, que variam

de acordo com a superfície perfilada, isto é, a superfície pode absorver ou refletir pulsos de

forma diferente.

A superfície do material perfilado determina a porcentagem de pulsos que

retorna ao sensor. A reflexão do pulso depende basicamente das propriedades da superfície

perfilada. A detecção de luz refletida em uma superfície é feita por um componente receptor

chamado fotodiodo ou

Avalanche PhotoDiodes (APD) e sua sensibilidade é de grande

importância para a captação do sinal refletido.

Segundo Wever e Lindenberger (1999), a reflexão é geralmente difusa, isto

é, não orientada. A refletividade de terrenos arenosos é da ordem de 10% a 20%, entre 30% e

50% no caso de vegetação e de 50% a 80% no caso de gelo e neve. Em relação à água, pode-

se obter refletividade suficiente com um ângulo de varredura menor que 10 graus.

A Tabela 1 apresenta percentuais de reflexão para um comprimento de onda

de 900

μm.

Tabela 1

– Percentual de reflexão de alguns materiais.

Material Reflexão (%)

Madeira clara, seca e limpa 94

Neve 80-90

Pedras claras 85

Calcário, argila Até 75

Vegetação mista 60

Coníferas 30

Asfalto 17

Fonte: Adaptado de Wehr e Lohr (1999).

A porcentagem de reflexão dos materiais presentes na superfície tem

influência sobre a quantidade de pulsos que retornam ao sistema. Neste caso, a reflexão dos

materiais depende basicamente da sensibilidade a determinados comprimentos de onda e das

características desta superfície.

A imagem mostrada na Figura 7 é um exemplo de uma imagem de

intensidade obtida usando a informação de retorno do primeiro pulso do sistema de varredura

a laser.

Figura 7 – Imagem de intensidade obtida a partir da informação do retorno do primeiro pulso laser

(Fonte: Instituto de Tecnologia para o Desenvolvimento (LACTEC)).

É possível verificar na Figura 7 que as ruas são facilmente identificadas,

fato que é justificado pela Tabela 1, onde se pode notar que o asfalto tem baixa capacidade de

reflexão (17%). Em relação à resolução espacial e radiométrica, Axelsson (1998), afirma que

as imagens de intensidade são limitadas se comparadas às fotografias aéreas obtidas por

técnicas fotogramétricas convencionais.

2.1.6 Qualidade dos dados de varredura a laser

Nos últimos anos, a qualidade planimétrica e altimétrica dos dados

provenientes do sistema de varredura a laser vem sendo extensivamente estudada

(BALTSAVIAS, 1999; WEHR e LOHR, 1999; GORDON, LICHTI e STEWART, 2001;

AHOCAS, KAARTINEN e HYYPPÄ, 2003; BRETAR e ROUX, 2003). Essas pesquisas

mostram que a qualidade e a acurácia dos dados são afetadas por alguns fatores, tais como a

superfície do material, altura de vôo, integração GPS/IMU, ângulo de observação, tipo de

sensor utilizado, entre outros. Outro fator que influencia na qualidade dos dados é a altura de

vôo. A variação na altura de vôo implica em uma maior ou menor densidade de pontos na

superfície do terreno, o que influencia diretamente na descrição do relevo. Vale ressaltar que a

largura da faixa varrida pelo sistema de varredura a laser é dada em função da altura de vôo e

do ângulo de varredura do sistema (Equação 4).

Um exemplo de trabalho nesta linha de pesquisa é encontrado em Ahocas,

Kaartinen e Hyyppä (2003), onde é realizada uma avaliação da densidade dos dados obtidos a

partir da varredura a laser, utilizando diferentes tipos de superfície (floresta, cascalho, asfalto

e capim), com dois diferentes sensores e diferentes alturas de vôo. Neste caso, os autores

verificam que, como esperado, quanto maior a altura de vôo, menor é a densidade dos pontos.

Outro fator que interfere na qualidade planimétrica dos dados gerados pela

varredura a laser é a divergência do pulso. Segundo Brandalize (2002), a complexa interação

entre a transmissão e a reflexão no objeto perfilado é um fator que está relacionado com a

divergência do pulso laser. O sinal retornado será função da dispersão da energia do pulso

laser dentro da área formada pela interceptação do pulso no alvo. Dessa forma, para alvos não

uniformes com diferenças de reflexão e inclinação, o erro de divergência será

proporcionalmente maior e conseqüentemente haverá incertezas em relação à posição

planimétrica e altimétrica do alvo.

A acurácia da posição do pulso depende principalmente da qualidade do

pós-processamento do DGPS, do GPS, do número e configuração de satélites visíveis durante

o vôo, da distância entre as estações de referência e aerotransportadas, da qualidade da

integração e calibração do GPS, IMU e sistema de varredura a laser e da acurácia da direção

do pulso (acurácia da varredura). Geralmente, com DGPS e pós-processamento pode-se

alcançar uma acurácia de 5-15cm (BALTSAVIAS, 1999). A precisão de medida da IMU

depende do fabricante, mas geralmente se encontram na ordem de 1/100º, que a 1.000 m de

altura correspondem a uma qualidade decimétrica semelhante à do GPS (MOSTAFA e

HUTTON, 2001).

No entanto, esses erros podem ser corrigidos através da utilização de

métodos de calibração do sistema GPS, IMU e laser. A calibração, todavia, tem como

objetivo confirmar se o sistema está operando de acordo com as suas especificações e

tolerâncias de precisão, além de permitir a obtenção de parâmetros de correção de possíveis

desvios.

Assim, a precisão dos dados consiste de uma parte variável que é

dependente dos parâmetros como: altura de vôo, ângulo de varredura, topografia do terreno,

cobertura do solo (referindo a geometria do objeto e refletividade do alvo) e uma parte

constante que é independente de parâmetros prévios, como por exemplo: acurácia da detecção

do pulso, acurácia do GPS etc..

2.1.7 Processamento de dados

O sistema de varredura a laser gera um conjunto de dados brutos que devem

ser processados para produzir ou modelar da superfície do terreno tridimensionalmente. Esses

dados são fornecidos após a realização do vôo. Sendo eles: a posição planimétrica, dos pontos

no terreno, que é obtida com apoio de um sistema de posicionamento (GPS), a orientação, ou

seja a unidade de medição encarregada de calcular a inclinação do sensor (IMU), os intervalos

de tempo (medidas de distância do laser) e os ângulos de varredura.

Os pontos do terreno no referencial

World Geodetic System 84 (WGS84)

podem ser calculados com o auxilio de três conjuntos de dados: dados de calibração do

sistema, medidas de distância do laser com seus respectivos ângulos de varredura e dados do

GPS e IMU. A Figura 8 ilustra um fluxograma contendo os passos do processamento dos

dados provenientes das medidas laser (HUG

apud WEHR E LOHR, 1999).

Dados

(GPS/IMU)

Distâncias e ângulos

de varredura

Parâmetros de

calibração do sistema

Pontos de terreno (X, Y,

Z) em WGS84

Sistema local

Classificação

Filtragem

Redução dos dados

Figura 8 – Fluxograma do processamento dos dados provenientes das medidas de varredura a laser

(Fonte: Adaptado de WEHR e LOHR, 1999).

HUG, CH., WEHR, A. Detecting and identifying topographic objects in imaging laser altimeter data. In:

IAPRS, v. 32, Part 3–4W2, p. 19–26, 1997.

De acordo com a Figura 8, a partir da aquisição dos dados, o primeiro passo

é transformar os pontos para o sistema WGS84 e, na seqüência, transformar os dados da

varredura a laser em WGS84 para um sistema de coordenadas local. O resultado é uma nuvem

de pontos irregularmente distribuídos em posição e elevação. Salienta-se que a distribuição

dos pontos depende do tipo de espelho de varredura utilizado pelo sistema.

Na etapa de classificação, pode-se citar uma metodologia apresentada por

Nardinocchi, Forlani e Zingaretti (2003) onde se utiliza duas estratégias conjuntas para

classificação e filtragem de dados de varredura a laser, para geração do MDT. Essa estratégia

é dividida em dois estágios. No primeiro estágio, os dados “brutos” são interpolados em uma

grade regular. Logo após é realizada a segmentação baseada em diferenças de altura e os

dados são classificados em três classes (terreno, edifício e vegetação). No segundo estágio

retorna-se para os dados “brutos” e realiza-se a filtragem dos pontos em cada célula da grade

de acordo com a classificação prévia.

Após a etapa de classificação, pontos no terreno devem ser separados de

edificações e vegetação. Para realizar esta tarefa, diferentes algoritmos de filtragem são

aplicados. Essa filtragem é feita usando pontos irregularmente espaçados ou uma grade

regular interpolada. No caso da grade regular existem algumas desvantagens, como por

exemplo, a redundância de dados em áreas onde o terreno é uniforme e incapacidade de se

adaptar áreas de relevo complexo sem alterar o tamanho da malha.

A redução dos dados é necessária após a etapa de filtragem e interpolação,

pois a quantidade de dados envolvidos é muito grande, tornando seu processamento muito

lento. O tempo de processamento para calcular um MDT, a partir de dados de varredura a

laser, é geralmente três vezes maior que o tempo gasto na de aquisição dos dados (WEHR e

LOHR, 1999).

2.1.7.1 Amostragem dos dados

A obtenção de dados proveniente a superfície real para fins de modelagem

matemática de superfícies, consiste em levantar, por uma técnica de amostragem, um certo

número de pontos com coordenadas espaciais (X,Y,Z). O processo de amostragem não pode

ser conduzido de forma casual. A escolha de pontos deve ser realizada de maneira que seu

conteúdo informativo represente o comportamento estrutural da superfície real (EL-SHEIMY,

1999).

A perfilagem dos dados é uma das técnicas mais empregadas para a

obtenção de informações espaciais para fins de modelagem matemática de superfícies. Neste

caso, o processo consiste em obter pontos representativos de relevo na região de estudo.

Os dados da varredura a laser consistem de uma perfilagem irregular onde

não se tem o exato espaçamento de pontos no perfil ou entre perfis, conforme mostra a Figura

Figura 9 – Exemplo de perfilagem irregular obtida por varredura a laser.

Existem vários processos para a elaboração de modelos de superfície. De

forma geral, os pontos amostrados são interligados formando triângulos e estes formando um

poliedro. Desta maneira, a superfície é aproximada por um modelo que é um poliedro cujos

vértices são os pontos amostrados (WOLF e DEWITT, 2000). Os métodos mais usados para

representar superfícies em meio digital são o

Triangulated Irregular Network (TIN) e a grade

regular.

2.1.7.2 Malha regular

A malha regular é um modelo digital que aproxima a superfície real através

de partes, que em geral, são retangulares. Os vértices dos retângulos podem ser os próprios

pontos amostrados por perfilagem regular ou obtidos por um processo de interpolação, caso se

tenha pontos amostrados de modo não regular

(KASSER e EGELS, 2002).

Uma das considerações importantes a respeito da grade regular é o

espaçamento a ser estabelecido entre os seus elementos. Um valor excessivamente pequeno

proporciona um aumento na fidelidade da modelagem em regiões de comportamento

irregular, mas nada oferece em regiões regulares, acarretando o aumento significativo de

tempo de processamento. Por outro lado, um valor grande, diminui o tempo de

processamento, mas perde fidelidade em regiões de comportamento irregular (WOLF e

DEWITT, 2000).

Figura 10 – Exemplo da malha regular após interpolação pelo algoritmo do vizinho mais próximo.

Em certas aplicações a malha regular apresenta vantagens, quando

comparada com a malha triangular, mas em outras a malha triangular é superior. Para atender

diversas tarefas, fica a critério do usuário a opção da escolha do método, que se dá,

geralmente, em função do tipo do trabalho a ser realizado (MITISHITA, 1997).

Um dos procedimentos mais empregados em várias aplicações de

modelagem é a obtenção da malha regular a partir da malha triangular. Isto ocorre devido às

dificuldades de amostragem de uma malha regular. De qualquer forma, tanto nas malhas

regulares quanto nas irregulares, se for necessário realizar uma densificação dos pontos

ocorrerá uma interpolação entre os pontos preexistentes.

2.1.7.3 Métodos de interpolação

A modelagem de uma superfície não consiste somente na construção de um

modelo digital poliédrico. O sistema deverá possuir algoritmos de interpolação de valores de

"alturas", em posições não correspondentes aos pontos amostrados. Os algoritmos devem

conter certas condições de contorno, baseadas no princípio de que o comportamento de uma

superfície contínua possa ser obtida do comportamento conhecido de posições próximas

(PETTINATI

apud MITISHITA, 1997). Os processos de interpolação empregados são,

geralmente, os locais, quando se considera uma vizinhança limitada, ou globais, quando a

vizinhança sendo considerada é ilimitada.

A escolha da função de interpolação é decisiva para se obter uma boa

precisão do modelo. Os requisitos desejáveis para uma função interpoladora são que esta

reproduza uma superfície contínua, o tempo computacional não seja proibitivo e tenha

propriedades matemáticas de interesse para a aplicação.

Morgan e Habib (2002) discutem os problemas inerentes às técnicas de

interpolação que geralmente fazem a predição de pontos através da análise de vizinhança e

ajustam esses pontos ao modelo. A função de interpolação, segundo os autores, não deverá ser

contínua devido à existência de descontinuidades na superfície. Erros estão sempre presentes

nos dados. No entanto, deveriam usar mais dados do que o modelo requer e tentar filtrar os

erros grosseiros.

Dentre os métodos de interpolação, pode-se citar os métodos baseados em

vizinhança global e local. O método baseado em vizinhança global é facilmente

compreendido, pois o interpolante é dependente de todos os pontos amostrados na superfície.

A inclusão, retirada ou alteração das coordenadas de qualquer ponto propaga-se por toda a

região de interesse. A influência de cada ponto no algoritmo é ponderada pela distância que o

mesmo se encontra do ponto a ser interpolado (MITISHITA, 1997). Dentre as principais

funções de interpolação conhecidas, tem-se as funções que interpolam a partir de superfícies

matemáticas e as funções que interpolam a partir de pontos discretos. Já os métodos locais

trabalham com um número de pontos que definem uma pequena área de ação do algoritmo de

PETTINATI, F. Modelamento Digital e Representação Gráfica de Superfícies. 1983. Dissertação

(Mestrado em Engenharia) - Escola Politécnica da Universidade de São Paulo - U.S.P, São Paulo.

interpolação. Qualquer alteração nos pontos modifica somente a vizinhança desta área. A

dificuldade neste método está em definir adequadamente os limites desta vizinhança.

Um dos algoritmos mais empregados para a interpolação nos procedimentos

locais é o que utiliza técnicas de elementos finitos. Conhecido como método de interpolação

de Akima (MITISHITA, 1997), consiste em aproximar as células de um modelo digital

triangular por um polinômio bivariado de quinto grau.

Na literatura relacionada existe uma variedade de métodos de interpolação

que podem ser utilizados para a densificação do MDT. Entre eles se destacam as

splines,

elementos finitos, mínimos quadrados, krigagem e vizinho mais próximo (EL-SHEIMY,

1999). Dentre esses, o mais comum é a interpolação pelo vizinho mais próximo. Este método

é relativamente simples, exigindo menor tempo computacional. No entanto, quando se utiliza

o método de interpolação do vizinho mais próximo em edificações que apresentam telhados

com duas águas, o resultado final apresenta um efeito de serrilhamento nas bordas.

2.2 Grafos

Várias situações do mundo real podem ser descritas através de diagramas

que consistem de uma representação gráfica por meio de figuras geométricas (pontos, linhas,

áreas etc.). Por exemplo, pontos podem representar cidades, com linhas unindo cidades

vizinhas; ou objetos em uma cena urbana, com linhas representando objetos adjacentes. Nesse

diagrama a forma como os pontos estão unidos é irrelevante o que importa são as relações.

Uma abstração matemática de situações desse tipo leva ao conceito de grafo.

No intuito de explorar os conceitos básicos da teoria de grafos, esta seção

apresenta alguns conceitos teóricos necessários para a compreensão de grafos e ainda a noção

geral de clique. Ressalta-se que posteriormente a teoria de grafos será utilizada no

desenvolvimento da metodologia proposta.

2.2.1 Noções básicas

Um grafo

()

E,VG = é definido pelo par V e E , onde V é um conjunto

finito não-vazio de elementos chamados vértices e

E é um conjunto finito de pares não

ordenados. Cada elemento de

E terá a forma {x

} onde x

são dois elementos distintos

V, denominado arestas (BOAVENTURA NETTO, 1979). Grafos são assim denominados

porque eles podem ser representados graficamente, e sua representação gráfica auxilia no

entendimento de suas propriedades. Cada vértice é indicado por um ponto, e cada aresta por

uma linha que une pares de pontos. Em um grafo simples, dois vértices são vizinhos ou

adjacentes se há uma aresta em

.G O número de vértices V de um grafo G determina a

ordem desse grafo. Seja, por exemplo, o grafo

(

)

E,VG

, ilustrado na Figura 11, dado por:

1234

{, , , }Vxxxx= e

12 31 32 24

{(,),(,),(,),(,)}E xxxxxxxx= . Este é um exemplo de grafo de

quarta ordem.

Figura

11 – Grafo

(

)

E,VG

Em um caso mais geral, pode haver mais de uma relação envolvendo os

mesmos elementos de

V , caso em que E é uma família

; pode-se ter, ainda, apenas uma

relação envolvendo um dado subconjunto

V , caso em que E é um conjunto.

Usa-se a palavra família, neste caso, para designar uma coleção de relações, alguns dos quais podem ocorrer

várias vezes; por exemplo,

{,,}abc é um conjunto, mas {, ,,,,}aaabcc é uma família.

2.2.2 Grafo não orientado

Seja

U uma família de partes de V a dois elementos, o par

(

)

U,VG = é

denominado p-grafo não orientado, sendo p o maior número de vezes que uma aresta pode ser

repetida (BOAVENTURA NETTO, 1979).

Em um grafo não orientado, as arestas são representadas por linhas unindo

os pares de vértices que as definem. Por exemplo, se 1

, U é um conjunto de partes de V

a dois elementos e trata-se de um 1-grafo ou simplesmente grafo (não orientado).

As arestas, neste caso, são denotadas como

(, )

x e convém salientar que,

cada aresta corresponde a uma parte de

V , não pode haver aresta de forma ( , )

x ; uma

aresta deste tipo só poderia existir em uma definição mais geral.

Um grafo não orientado do tipo 1-grafo é ilustrado na Figura 12.

Figura 12 – 1-grafo não orientado (Fonte: Adaptado de BOAVENTURA NETTO, 1979).

No grafo da Figura 12, pode-se verificar que as ligações entre pares de

vértices não possuem orientação.

2.2.3 Grafo orientado ou dígrafo

Seja

U uma família de partes de V. O par

(

)

U,VG

é denominado p-grafo

orientado, onde p representa o maior número de vezes que uma aresta pode ser repetida. Os

elementos de

U são chamados arcos

e sua notação é a mesma dos pares ordenados, ou seja

(, )

x (BOAVENTURA NETTO, 1979). Cada arco é representado por uma seta cujo sentido

corresponde à orientação do par ordenado.

Figura 13 – 1-grafo orientado (Fonte: Adaptado de BOAVENTURA NETTO, 1979).

Se 1

= , U será um conjunto de elementos de V e G será um 1-grafo ou

simplesmente grafo (orientado). Em um grafo orientado, um arco de forma ( , )

x é

admissível e se chama laço. Não é possível, no entanto, definir um sentido deste arco e,

portanto, um mesmo vértice não pode possuir dois laços de sentidos opostos.

2.2.4 Grafo completo

Um grafo

(

)

U,VG =

é completo se,

,:(,) (,),

ij ij ji

xVxx U xx U

∀

∈∉⇒∈

ou seja, entre dois vértices quaisquer, no caso do grafo orientado, haverá ao menos um arco

(Figura 14 (b)) e no caso do grafo não orientado (Figura 14 (a)) , : ( , ) ,

ij ji

xVxx U

∀

∈∈

haverá uma aresta entre cada par de vértices

Cada arco está associado a um par ordenado de vértices, sendo o primeiro a extremidade inicial do arco e o

outro a sua extremidade final.

4 x

(a) (b)

Figura 14 – (a) Grafo completo não orientado, (b) grafo completo orientado.

Os grafos da Figura 14 (a) e (b) são exemplos de grafos de grau

2.2.5 Subgrafo e o conceito de clique

Um grafo

(

)

'U,'V'G = é um subgrafo do grafo

()

U,VG = se 'VV⊆ e

UU⊆ . Segundo Boaventura Netto (1979) os subgrafos completos não orientados são

chamados cliques. Só existe uma clique para cada ordem n e por isso ela será designada por k

(Figura 15).

Figura 15 – Exemplos de cliques.

Define-se grau de um vértice vV∈ , denotado por grau ()v , como sendo o número de vértices adjacentes a

2.3 Segmentação

Segundo Ballard e Brown (1982) a idéia de segmentação tem suas origens

nos psicólogos do grupo Gestalt, que estudavam as preferências exibidas por seres humanos

no agrupamento ou organização de um conjunto de formas dispostas no campo visual. Ainda

segundo estes autores, a segmentação de imagens é o termo usado em visão computacional

para o agrupamento de partes de uma imagem genérica em unidades que são homogêneas

com respeito a uma ou várias características (ou atributos), que resulta em uma imagem

segmentada.

Existem duas maneiras básicas de realizar a segmentação de uma imagem.

A análise realizada a partir da detecção de descontinuidades significantes nos níveis de cinza

da imagem e no particionamento de uma imagem (divisão em regiões) em seus objetos

constituintes. Neste caso, o nível de subdivisão é realizado de acordo com o problema a ser

resolvido e o critério de término segue o princípio do isolamento dos objetos de interesse.

Os algoritmos de segmentação de imagens são baseados geralmente nas

propriedades de descontinuidade e similaridade. Na primeira categoria, a abordagem consiste

em particionar a imagem baseada em mudanças bruscas nos valores de níveis de cinza. As

principais feições de interesse nessa categoria são os pontos isolados, as linhas e as bordas. As

principais abordagens da segunda categoria baseiam-se em limiarização, crescimento de

regiões e divisão e fusão de regiões (GONZALEZ e WOODS, 2000).

A segmentação orientada a regiões é utilizada para separar os objetos de

interesse. Neste caso a imagem é particionada em diferentes regiões, onde cada região

compartilha propriedades especificas. Além disso, cada região é composta por um conjunto de

pixels conectados. Assim, a partir do particionamento da imagem em regiões, podem ser

realizadas medidas sobre cada região e as relações entre as regiões adjacentes podem ser

estabelecidas.

A segmentação de imagens no âmbito de classificação de objetos é um

passo preliminar e essencial que pode auxiliar diretamente na construção das regiões que

posteriormente serão interpretadas usando, por exemplo, a abordagem Bayesiana. Nesta seção

é dada ênfase à segmentação orientada a regiões, cujo objetivo é particionar a imagem em

regiões. Na etapa de segmentação os dados de entrada podem ser imagens em níveis de cinza,

dados de MDE obtidos por varredura a laser ou ainda é possível a utilização de uma imagem

gerada a partir da intensidade do pulso, característica inerente a determinados equipamentos

de varredura a laser. Para realizar a separação do objeto de interesse pode-se fazer uso da

característica de reflexão de certos objetos e ainda da característica de altura.

2.3.1 Divisão e fusão de regiões

A segmentação por crescimento de regiões faz a agregação de pixels a partir

de um conjunto de sementes. Uma alternativa, a essa abordagem, é subdividir a imagem em

um conjunto de regiões arbitrárias e disjuntas, e então realizar a divisão e/ou a fusão das

regiões na tentativa de satisfazer as seguintes condições. Segundo Gonzalez e Woods (2000) a

segmentação de uma região

pode ser vista como um processo de particionamento de

n regiões

, ,...,

RR tal que,

isto é a segmentação deve ser completa;

é uma região conexa, 1,2,..., ;in=

RR∩=∅ para todo e , ,ijij

≠

significando que as regiões devem ser disjuntas;

()

RP VERDADEIRO para 1,2,..., ,in

se todos os pixels em

possuírem a mesma

propriedade P e

(

)

RRP ∪ FALSO para ,ij≠ se as regiões

são diferentes no sentido da

propriedade P .

A propriedade P é utilizada como um atributo sobre os pontos do conjunto

. A inclusão de um pixel ou, em se tratando de um MDE, de uma altura ou intensidade

pontual do alvo, depende da propriedade P , a qual pode ser construída de acordo com algum

conhecimento a priori sobre o objeto de interesse.

Um exemplo de algoritmo iterativo de divisão e fusão é apresentado em

Gonzalez e Woods (2000). Neste exemplo, considera-se

a imagem completa e P uma

propriedade. No caso de uma imagem quadrada, uma abordagem para a segmentação de

subdividi-la sucessivamente em quadrantes cada vez menores de maneira que, para qualquer

região

()

RP VERDADEIRO. Ou seja, se

(

)

RP FALSO, então divide-se esta região em

quadrantes. Se P for falso para qualquer quadrante, subdivide-se em subquadrantes, e assim

sucessivamente. Essa técnica, em particular, possui uma representação conveniente

denominada quadtree (uma árvore em que cada nó possui exatamente quatro descendentes).

Nesta discussão, se apenas a divisão (subdivisão) fosse usada, a partição

final provavelmente conteria regiões adjacentes com propriedades idênticas. No entanto, esse

problema pode ser contornado realizando a fusão da mesma maneira que a divisão. A fusão

deve ser realizada em regiões adjacentes cujos pixels combinados satisfaçam a propriedade

P ; ou seja, duas regiões adjacentes

são fundidas apenas se

(

)

RRP ∪

VERDADEIRO. Essa abordagem pode ser sumariada através dos seguintes passos:

1) Divide-se em quatro quadrantes distintos qualquer região

em que ( )

PR = FALSO;

2) Funde-se quaisquer regiões adjacentes

tais que ( )

PR R∪= VERDADEIRO e

3) A parada ocorre quando nenhuma divisão e nenhuma fusão for mais possível.

Segundo Gonzalez e Woods (2000), diferentes variações dessa abordagem

básica são possíveis. Uma possibilidade é dividir inicialmente a imagem em blocos quadrados

ou retangulares. Divisões adicionais são realizadas como descrito anteriormente, mas as

fusões são inicialmente limitadas a grupos de quatro blocos que sejam descendentes na

representação quadtree e que satisfaçam a propriedade P . Quando as fusões deste tipo não

forem mais possíveis, o procedimento é terminado por uma fusão final das regiões que

satisfaçam o passo 2. Nesse ponto as regiões fundidas podem ser de diferentes tamanhos. A

principal vantagem desta abordagem está em usar a mesma quadtree para a divisão e para a

fusão até a fusão final. A Figura 16 apresenta um exemplo ilustrativo desta técnica, sendo que

mais detalhes podem ser encontrados em Jain, Kasturi e Schunck (1995).

(a)

(b)

(c)

(d)

Figura 16 – Divisão recursiva usando a estrutura quadtree. (a) Imagem original. (b) Imagem dividida

em quatro sub-regiões e o quadtree correspondente. (c) Subdivisão das regiões 1 e 4 em quatro sub-

regiões respectivamente e o quadtree correspondente. (d) Subdivisão da sub-região 2 (pertencente à

região 1) em quatro sub-regiões e o quadtree correspondente (Fonte: Adaptado de

JAIN, KASTURI,

e SCHUNCK

, 1995).

Entretanto, existem algumas limitações no emprego desta técnica. Uma

delas é que, uma vez que a segmentação é feita a partir da produção de divisões quadradas da

imagem original, a segmentação final tende a ter regiões com formas quadradas. Outro

aspecto é que as regiões produzidas são dependentes do ponto de partida e regiões

homogêneas podem ser segmentadas dependendo da sua posição espacial com respeito a

matriz quadrada definida. Finalmente, esta abordagem tende a perder pequenas regiões dentro

de grandes áreas uniformes.

2.3.2 Detecção de bordas

A detecção de bordas consiste no agregamento de pixels que compõem os

contornos das regiões. Existe uma gama variada de métodos que delineiam os contornos dos

objetos. Um método bastante utilizado para esse fim é a detecção de bordas seguida pela

obtenção de cadeias ordenadas de pixels que representam as regiões.

A detecção de bordas é um processo no qual se obtém características de

interesse de um objeto na imagem. Estas propriedades incluem descontinuidades de

características fotométricas, geométricas e físicas dos objetos. Este processo geralmente

baseia-se na aplicação de operações de detecção de variações de brilho na imagem, ou seja, o

gradiente local (ZIOU e TABBONE, 1998).

Em sua maioria, os processos de detecção de bordas baseiam-se no fato da

ocorrência de uma mudança abrupta do nível de cinza em torno do pixel em estudo ou em

uma descontinuidade próxima ao mesmo. Para detectar estas descontinuidades pode-se usar

métodos de diferenciação de primeira ordem, que enfatizam pontos de mudança na função e

que apresentam resposta nula onde não há variações. Uma mudança na intensidade pode ser

detectada diferenciando pixels vizinhos. Alguns operadores utilizados para detecção de bordas

são: Roberts, Sobel e Prewitt. Várias máscaras de convolução podem ser construídas para se

obter uma aproximação da primeira derivada nestes operadores. Esta operação é denominada

diferenciação da imagem.

Assim, pode-se dizer que os esquemas mais comuns para detectar bordas

incluem três operações básicas, que são a diferenciação, a suavização e a rotulação (ZIOU e

TABBONE, 1998). A diferenciação consiste no cálculo da derivada de cada ponto da

imagem. A suavização consiste na redução do nível de ruído da imagem e na regularização da

diferenciação numérica. A última operação é a rotulação da borda na imagem que, envolve a

supressão de bordas falsas, que são resultados do uso de certos modelos de borda que não

representam corretamente a realidade.

É importante ressaltar que a ordem de execução dos procedimentos de

diferenciação e suavização depende da linearidade do operador de diferenciação. Quando se

utiliza operadores lineares, a ordem destas operações são irrelevantes, pois estes são

comutativos e associativos para a convolução. Entretanto, quando se emprega operadores não

lineares, estes não são nem associativos nem comutativos para a convolução, o que implica na

realização da operação de suavização antes da diferenciação.

Até recentemente, os primeiros detectores propostos eram baseados nos

operadores de gradiente e laplaciano. Esses detectores são limitados às operações de

diferenciação. Entretanto, esses detectores podem ser melhorados com a introdução da

operação de suavização da imagem (ZIOU e TABBONE, 1998).

O processo de detecção de bordas desenvolvido por Canny (1986) baseia-se

em dois critérios básicos de desempenho, isto é, os critérios de detecção e localização. Estes

critérios estão sujeitos ainda a um terceiro, conhecido como injunção de resposta múltipla,

que força o processo a detectar uma única borda onde existe somente uma borda verdadeira.

O objetivo principal do trabalho de Canny é o desenvolvimento de um detector ótimo para o

tipo de borda mais comum em imagens digitais, ou seja, o tipo degrau. Este tipo de borda

resulta de vários fenômenos e ocorre geralmente entre duas regiões homogêneas, que diferem

entre os níveis de cinza (VALE e DAL POZ, 2002).

Uma das principais constatações de Canny é que o operador ótimo

encontrado é muito semelhante à função gaussiana. Canny também propôs um processo de

afinamento de bordas conhecido como supressão não máxima a fim de obter bordas com

espessura de um pixel, e outro processo conhecido como histerese, cuja função é eliminar a

fragmentação de bordas causada pelo ruído da imagem, melhorando a conectividade da borda.

Canny (1986) definiu um conjunto de objetivos para um detector de bordas

e descreveu uma metodologia de otimização para alcançá-los. Canny (1986) especificou os

três critérios que devem ser atendidos para se obter um filtro ótimo:

- Taxa de Erro ou Detecção (SNR): o detector de bordas deverá responder somente às bordas

verdadeiras. Tal critério consiste na maximização da razão sinal/ruído (SNR), pois quanto

maior for o SNR maior será a probabilidade de se detectar uma borda física na imagem.

- Localização (L): a distância entre os pontos de borda encontrados pelo detector e a borda

real deverá ser a menor possível. Tal critério é definido como sendo o inverso da distância

entre um ponto detectado e a respectiva posição verdadeira. Logo quanto maior for L, mais

próximos das posições verdadeiras estarão os pontos detectados pelo filtro.

- Resposta múltipla: o detector de bordas não deverá identificar múltiplos pixels de bordas

onde somente existe uma borda, ou seja, deve haver um único pixel de borda onde existe uma

única borda verdadeira.

Segundo Vale e Dal Poz (2002), a proposta de Canny era encontrar o filtro f

que maximizasse o produto SNR x Localização sujeito a limitação de resposta múltiplas,

entretanto o resultado era muito complexo para ser resolvido analiticamente. Assim o filtro

ótimo pode ser aproximado pela primeira derivada da função gaussiana. Estudos

desenvolvidos por Vale e Dal Poz (2002) demonstram que as respostas de impulsos de ambos

os filtros são bastante semelhantes, o que intuitivamente sugere um desempenho similar e

satisfatório. Vale e Dal Poz (2002a) também apresentaram uma descrição detalhada do

algoritmo de Canny, que pode ser brevemente sumariado segundo os seguintes passos:

1) Ler a imagem I a ser processada;

2) Criar uma máscara Gaussiana bidimensional G para convoluir com I, dando origem a I

. O

desvio-padrão desta Gaussiana é um parâmetro do detector de bordas;

3) Criar duas máscaras unidimensionais para a diferenciação da imagem suavizada, nas

direções x (linha) e y (coluna), denominando-as de G

e G

;

4) Convoluir a imagem I

com G

ao longo das linhas, gerando a imagem I

e, analogamente,

ao longo das colunas para gerar I

;

5) A magnitude é calculada em cada pixel (x,y) na forma que segue:

M(x,y) = I (x,y) +I (x,y)

(6)

Para completar o algoritmo desenvolvido por Canny, pode-se acrescentar ainda dois

passos fundamentais:

6) Supressão não Máxima, que é o anulamento dos pixels cujos valores não sejam máximos

locais na direção perpendicular à borda, sendo que este processo produz um afinamento

das bordas, atendendo assim o terceiro critério de desempenho de Canny.

7) Limiarização adaptativa (histerese), consiste em uma limiarização baseada em dois

limiares

, onde

1212

2 ou 3

ττ τ

≅≅. Aplicando a limiarização duas vezes, uma

para

e outra para

, o algoritmo efetua um processo de complementação das

descontinuidades da primeira limiarização aproveitando o resultado da segunda.

O resultado do processo de detecção de bordas de Canny é uma imagem

binária com bordas afinadas (com espessura de 1 pixel), onde os pixels de borda recebem

valor 0 (zero) e o fundo o valor 1 (um).

2.4 Vetorização e poligonização de contornos

O resultado de um processo completo de detecção de bordas, como o de

Canny, é um mapa ou imagem de borda afinada. Como os processos de análise de imagem

geralmente têm por objetivo explicitar os contornos dos objetos, que, aliás, é o objetivo da

metodologia proposta neste trabalho, é necessário construir representações eficientes para as

bordas detectadas. Isto pode ser feito através de técnicas de vetorização e poligonização do

mapa de bordas.

2.4.1 Vetorização de mapas de bordas detectadas

O processo de vetorização de mapa de bordas detectadas consiste em formar

uma lista ordenada de pixels de borda, a partir de uma lista não ordenada de pixels

proveniente de algum processo de detecção e afinamento de bordas (JAIN, KASTURI, e

SCHUNCK, 1995). Outro processo existente para realizar tal atividade é conhecido como

delineador de bordas. Entretanto este processo apresenta aspectos fundamentais diferentes,

pois sua operação se dá sobre a imagem original. Mesmo assim este processo apresenta

resultados semelhantes. Além disso, a detecção de cadeias de pixels baseia-se em informações

locais, enquanto que o delineador de borda pode usar informações globais (JAIN, KASTURI,

e SCHUNCK, 1995).

O processo de detecção de borda de Canny pode ser considerado completo,

visto que este processo gera uma imagem binária com bordas afinadas. Embora os pixels da

imagem de borda se conectem para formar cadeias lineares de pixels, a ligação entre os pixels

adjacentes nestas cadeias lineares não é conhecida. A ligação entre os pixels de uma mesma

cadeia deve ser realizada por um processo de vetorização. Assim, as listas estruturadas e

ordenadas de pixels presentes no mapa de bordas são substituídas na imagem por

representações matemáticas adequadas aos processos posteriores de reconhecimento e

delineamento de feições cartográficas.

Segundo Dal Poz (2002) a vetorização consiste em varrer todos os pixels da

imagem de borda. Quando um determinado pixel de borda for detectado, uma busca é iniciada

para encontrar toda a seqüência de pixels da borda detectada. Como geralmente o pixel de

borda encontrado inicialmente localiza-se no meio da borda, isto é, não no início ou fim da

lista, a busca é realizada em um sentido e depois no outro e, após isto, as duas listas são

conectadas. A busca pelos pixels adjacentes de borda é realizada seqüencialmente através de

pequenos segmentos de três pixels. Quando a conexão de todos os pixels de uma borda for

finalizada, a varredura ao longo das linhas é retomada a partir do primeiro pixel detectado da

borda ordenada, garantindo que todos os pixels da imagem sejam conectados para formarem

bordas ou eliminados no caso de estarem isolados ou pertencerem à bordas muito pequenas

(por exemplo, bordas isoladas com dois ou três pixels).

2.4.2 Representações para contorno

Posteriormente à obtenção das cadeias de pixels, ou seja, para a obtenção de

listas de pixels de bordas que representam os limites de regiões presentes em uma imagem, é

necessário utilizar a representação mais eficiente dos limites destas regiões. As formas

utilizadas para a representação destes limites são denominadas de contornos. Um contorno é

considerado fechado quando representa uma região e aberto quando representa apenas parte

de uma região.

As formas de representação utilizadas no estabelecimento dos contornos

baseiam-se em listas ordenadas de pixels de borda e em funções descrevendo os pixels de

borda. Para a primeira forma de representação pode-se considerar como exemplo a cadeia de

pixels, que pode ser gerada pela técnica referida na seção 2.4.1. Já um exemplo para a

segunda forma de representação é a que emprega splines.

Segundo Jain, Kasturi e Schunck (1995), existem três critérios básicos para

o estabelecimento de um bom contorno:

- Eficiência: o contorno deve ser uma representação simples e compacta;

- Acurácia: o contorno deve representar com acurácia as feições presentes na imagem; e

- Efetividade: o contorno deve adequar-se para os estágios subseqüentes de análise de imagem

associados com a aplicação em questão.

A acurácia do contorno é determinada pela curva utilizada na modelagem e

pela acurácia dos pontos de borda previamente determinados pelo algoritmo de detecção

utilizado. A forma de contorno mais simples é a cadeia de pixels que é tão acurada quanto os

pontos de borda que representa. Entretanto, apresenta a desvantagem de ser pouco compacta e

pode não ser efetiva para as etapas subseqüentes do processo de análise de imagem. O

contorno obtido usando uma curva adequada permite a obtenção de qualidade compatível com

a acurácia dos pontos de borda usados na modelagem, além de aumentar a eficiência e

eficácia por ser uma representação mais apropriada e compacta para as etapas posteriores.

Dada sua eficiência e simplicidade, a poligonização é uma técnica

comumente utilizada para a obtenção de representação do contorno. O resultado é um

polígono (para contorno de telhado) ou uma linha poligonal (para contornos abertos).

2.5 Abordagem bayesiana aplicada à análise de imagens

A análise de imagem através de Inferência Bayesiana tem sido

tradicionalmente realizada usando imagens digitais, que consistem de uma malha regular de

pixels (HURN, HUSBY e RUE, 2003; ANDERSEN, REUTEBUCH e SCHREUDER, 2002).

Em geral, o objetivo é reconstruir uma imagem corrompida por ruídos.

Mais recentemente, pesquisas em análise de imagem têm sido estendidas

para tratar do problema de reconhecimento de objeto (VAN LIESHOUT

apud ANDERSEN,

REUTEBUCH e SCHREUDER, 2002). O objetivo desse tipo de análise é o de localizar e de

caracterizar vários objetos de interesse no espaço envolvido, como, por exemplo, o espaço

bidimensional de uma imagem digital ou o espaço tridimensional de um MDE. Cabe ainda

ressaltar que o conceito de imagem (y) tem um significado generalizado. Isto é, pode ser uma

imagem convencional bidimensional obtida por um sensor, passivo ou ativo, como uma

câmera aérea digital, o sensor HRV-SPOT, o RADAR etc.; ou uma representação

tridimensional, a exemplo do espaço tridimensional de varredura a laser. Apesar da

considerável quantidade de trabalhos na área de análise de imagem apresentados na literatura,

esforços ainda estão sendo realizados para alcançar a completa automação nos variados

processos. A análise automática da cena requer a construção de pelo menos uma descrição

parcial do ambiente original.

Para uma análise de alto nível é necessária uma descrição simbólica dos

objetos presentes na imagem. Esta descrição inclui desde a caracterização individual dos

objetos presentes na imagem, até a caracterização contextual dos mesmos. A análise de

VAN LIESHOUT, M. Stochastic geometry models in image analysis and spatial statistics. CWI, Amsterdam, The

Netherlands, 1995.

imagem, envolve a segmentação em um passo preliminar e, posteriormente, quando é

orientada à regiões, a análise dessas regiões é realizada a fim de atribuir significado a elas.

Dependendo da abordagem, é suficiente utilizar operações de análise de

baixo nível (contraste, realce, segmentação etc.), enquanto em outras abordagens, é necessário

utilizar também tarefas de análise de alto nível, como o entendimento da cena através de uma

descrição semântica apropriada. Um típico esquema de análise de imagem é mostrado na

Figura 17.

A Figura 17(a) consiste de dois blocos, um bloco de visão de baixo nível

(segmentação), o qual segmenta a imagem de entrada bidimensional e calcula vários atributos

para cada região. Esses atributos podem basear-se no nível de cinza da região (por exemplo, a

média dos níveis de cinza, a textura etc.). O próximo bloco (análise) é o que fornece a

descrição semântica, isto é, a análise para cada região da imagem. Este bloco tem como

entrada, o conhecimento específico dos objetos de interesse e vários atributos obtidos no

bloco de segmentação. Mais recentemente, a tendência é considerar o problema de análise de

imagem como o esquema ilustrado na Figura 17(b), onde, além dos blocos de segmentação e

análise, tem-se também o bloco de aquisição de conhecimento, o qual atualiza o

conhecimento específico, previamente adquirido, sobre os objetos de interesse.

(a) Esquema de dois blocos

(b) Esquema de três blocos

Figura 17 – Esquema básico de análise de imagens (Fonte: Adaptado de KOPPARAPU e DESAI,

2001).

Obtenção do

conhecimento

Dados

Segmentação Análise

Conhecimento

Imagem

Segmentação Análise

Conhecimento

Imagem

A Inferência Bayesiana aplicada a análise de imagem possibilita a

introdução do conhecimento a priori no processo. Este conhecimento é representado na forma

de distribuição ou modelo prévio do fenômeno em estudo na imagem. A distribuição a priori é

atualizada a partir de observações representadas na função de verossimilhança, resultando na

distribuição a posteriori. Os fundamentos básicos sobre Inferência Bayesiana são descritos na

seção 2.5.1 (MIGON e GAMERMAN, 1999).

2.5.1 Abordagem Bayesiana

A Inferência Bayesiana consiste na atualização do conhecimento a priori,

sobre o fenômeno em estudo, através do teorema de Bayes. Para enunciar o teorema de Bayes,

que fornece uma regra de atualização de probabilidades, deve-se supor uma quantidade de

interesse desconhecida θ, com valores possíveis em um conjunto Θ, onde θ pode ser um

vetor, um escalar ou uma matriz, e a informação inicial H (história) sobre esta quantidade.

Esta informação pode ser incluída na análise através da distribuição de probabilidade

condicional

, com densidade ou função de probabilidade )|( Hp

Se H for informativo o suficiente a descrição a respeito de θ está completa.

No entanto, se H não for informativo o bastante, torna-se necessário buscar mais informações.

Essas informações podem ser obtidas através da observação de uma quantidade aleatória X

que esteja relacionada a θ.

Antes de observar X tem-se a distribuição amostral de X dada por

),|( HXp

. Após observar X, a quantidade de informação sobre θ aumenta e a informação

sobre θ está sumariada em ),|( Hxp

Considere os eventos A e B associados a um experimento. Segundo DeGroot e Schervish (2002) a

probabilidade do evento

A condicionado à ocorrência do evento

é denotada por Pr( | )AB. Por

conveniência essa notação é dita simplesmente probabilidade condicional de

A dado

. A probabilidade

condicional

Pr( | )AB é definida como a proporção dada pela probabilidade Pr( )AB sobre a probabilidade

total

Pr( )

. Essas considerações conduzem a seguinte definição: Se A e

são dois eventos quaisquer

associados a um experimento, com

Pr( ) 0B >

, então

Pr( )

Pr( | )

Pr( )

Utilizando o teorema do produto e conhecendo-se as probabilidades

condicionais, denotando-se por ),|( Hxp

e )|( Hp

as densidades de ),|( HX

)|( H

respectivamente, tem-se

)|(

)|(),|(

)|(

)|,(

),|(

Hxp

HpHxp

Hxp

== , (7)

onde

(| ) (, | ) (|, )(| )pxH px Hd px Hp Hd

θθθθ

∫∫

A função )|( Hxp no denominador da Equação (7) não depende de θ,

representando apenas uma constante na determinação da quantidade de interesse ),|( Hxp

Por esta razão e pela dependência em

ser comum a todos os termos, por facilidade

notacional, tem-se a forma usual para o teorema de Bayes

(|) (|)(),pxpxp

θθ

∝

(8)

onde:

)(

representa a distribuição a priori do parâmetro desconhecido

, representando a

informação disponível antes da obtenção dos dados;

)|(

representa a distribuição dos dados;

o símbolo

∝

denota proporcionalidade;

)|( xp

representa a distribuição a posteriori de

, representando a informação

sobre

, após a obtenção de

Cabe ressaltar que a forma simplificada do teorema de Bayes será útil em

problemas particulares que envolvam a obtenção de distribuições a posteriori para os

parâmetros, pois neste caso o denominador é apenas uma constante normalizadora. Em outras

situações este termo desempenha um papel fundamental e precisa ser recuperado. Para isto,

basta reescrever a Equação (8) como

).()|()|(

pxpkxp

(9)

A constante k é determinada de forma que

()

(

)

(

)

[

]

∫

−

Ε== ,|xpdp|xpk

θθθθ

caso contínuo

()

(

)

(

)

[

]

,|xpp|xpk

θθθ

Ε==

∑

−

caso discreto (10)

A função

()

xp recebe o nome de distribuição preditiva (ou marginal) de X,

pois é a distribuição que se espera que X tenha, sendo de certa forma uma predição. Assim,

antes de se observar X ela é útil para checar a adequação a priori do modelo, através das

predições que ela fornece. Após se observar X, a distribuição preditiva serve para testar o

modelo como um todo, pois se o valor de X observado recebia pouca probabilidade preditiva

então as previsões que o modelo faz não são boas e ele deve ser questionado.

Depois da obtenção dos dados,

(

)

|p x pode ser vista como uma função de

θ para dados valores de X

, ...,X

. Esta função é denominada função de verossimilhança, e é

denotada por

(

)

()( )

θθθ

|p;l

R:.;l

≡→

→Θ

(11)

Seja X

,...,X

uma amostra aleatória

de uma família de distribuição

(

x| )

, Θ∈

. A função densidade de probabilidade conjunta é dada por

(p x

∏

xpxpxpxp

)|()|()...|()|()|

θθθθθ

. (12)

Fixado o ponto amostral (

xx ,...,

) a função

x) , considerada como

função de

, é denominada função de verossimilhança da amostra, e será dada por

As variáveis aleatórias

,...,

X representam uma amostra aleatória de uma variável aleatória

se as

's são identicamente distribuídas e independentes duas a duas.

x)=

∏

)|(

. (13)

A verossimilhança é interpretada como função do vetor de parâmetros, para

um conjunto de dados fixo, e serve para medir o quanto aqueles dados suportam uma hipótese

sobre

Ao fixar um valor de

e variar os valores de

, observa-se a plausibilidade

de cada um dos valores de

. Uma vez definida a função de verossimilhança, a Equação (8)

pode ser reescrita como

x) ( |l

∝

x) ( )

(x| )p( ) ( ;x)p( )

(|x)= .

(x)

( ; x)p( )d

θθθ

θθ

∫

(14)

A função de verossimilhança tem um papel extremamente importante na

atualização do conhecimento a priori sobre

, pois a distribuição a posteriori é obtida

combinando a priori e a verossimilhança. Note que:

()

∫

dx|xp 1

mas, em geral,

(

)

∫

≠1

θθ

dx|l ,

b) a função de verossimilhança conecta a priori à posteriori, usando para isto os dados do

experimento.

O teorema de Bayes em (8) fornece uma formulação matemática de como o

conhecimento prévio pode ser combinado com novos conhecimentos. Dessa forma o teorema

fornece uma atualização das informações a respeito do parâmetro

Quando

()

x;l

(

)

p apresentam um núcleo comum, de modo que

(

)

p e

()

x;p

pertencem a mesma família de distribuições, diz-se que a família da distribuição a

priori é conjugada a família de distribuição dos dados.

Em Inferência Bayesiana quando há conjugação entre a distribuição a priori

e a verossimilhança e as variâncias são conhecidas a distribuição a posteriori é obtida

diretamente. No entanto, na prática, necessita-se trabalhar com modelos complexos que não

permitem uma análise conjugada direta. Mesmo que a verossimilhança e a priori sejam

bastante simples, a combinação delas pode produzir uma distribuição a posteriori

matematicamente complicada. Surge então a necessidade de se trabalhar com métodos de

integração numérica para encontrar uma aproximação para a integral no denominador da

equação 14. Em outras palavras, encontrar a constante de integração para a distribuição a

posteriori em 14.

2.5.1.1 Métodos numéricos

Como dito anteriormente, em geral se faz necessário a utilização de métodos

numéricos para resolver a integral existente no denominador da Equação 14. Esses métodos

podem ser subdivididos em métodos numéricos analíticos e baseados em amostragem. Dentre

os métodos numéricos analíticos podem ser citados os de quadratura e os envolvendo

aproximação pela normal. Esses métodos possuem a característica de fornecer aproximações

mais precisas, no entanto, à medida que aumenta a dimensão do espaço paramétrico torna-se

inviável sua aplicação.

Os métodos numéricos baseados em amostragem compreendem os métodos

de Monte Carlo simples, Monte Carlo por importância e o método Monte Carlo via Cadeia de

Markov (MCMC). Esses métodos podem ser aplicados mesmo em modelos com estrutura

complexa e, em alguns casos, são os únicos possíveis de serem aplicados.

O método de Monte Carlo Simples ou mesmo o método de Monte Carlo por

importância são utilizados para aproximar a integral no denominador da equação 14. A

amostra para

é gerada da distribuição a priori, o que pode levar a valores com baixa

verossimilhança, causando instabilidade na estimativa. Por outro lado, os métodos de Monte

Carlo via Cadeias de Markov consistem na geração de amostras através de distribuições

condicionais completas, obtidas a partir da posteriori conjunta e por esta razão são preferíveis

em relação aos primeiros. Quando não se pode gerar diretamente das condicionais completas,

pode-se gerar de outra com mesmo núcleo ou formas semelhantes e aceitar os valores gerados

a partir de uma dada probabilidade. Como o processo é iterativo pode-se mostrar que as

cadeias geradas formam processos markovianos e a convergência para a distribuição de

equilíbrio pode ser verificada a partir de propriedades das Cadeias de Markov.

2.5.1.2 Método de Monte Carlo via Cadeia de Markov (MCMC)

Como citado anteriormente, a complexidade dos modelos implica na

utilização de métodos numéricos baseados em amostragem. Atualmente, existem muitos

problemas que exigem a utilização destes métodos baseados na sua resolução. Nessa

categoria, estão, por exemplo, os modelos dinâmicos, modelos multiníveis e modelos para

dados espaciais.

Dentre os métodos de MCMC os mais utilizados são o amostrador de Gibbs

e o algoritmo Metropolis-Hastings.

O amostrador de Gibbs é essencialmente um esquema iterativo de

amostragem de uma cadeia de Markov cujo núcleo de transição é formado pelas distribuições

condicionais completas (SOUZA, 1999).

Uma cadeia de Markov é um tipo especial de processo estocástico, que lida

com a caracterização de seqüências de variáveis aleatórias. Interesse especial é dado ao

procedimento dinâmico e ao limite do processo. Um processo estocástico pode ser definido

como uma coleção de quantidades aleatórias }:{

)(

∈

para algum conjunto

(GAMERMAN e LOPES, 2006). A cadeia de Markov é um processo estocástico onde dado o

estado presente, o estado passado e futuro são independentes.

Para mostrar o desenvolvimento do amostrador de Gibbs assume-se

inicialmente que a distribuição de interesse é

(

)

p , onde

representa os dados e

vetor de parâmetros, ),...,(

1 k

= . Assume-se também que as distribuições condicionais

completas estão disponíveis e são dadas por

.k,...,i),,...,,,...,,|(P

kiii

111

+−

(15)

Segundo Gamerman e Lopes (2006), o amostrador de Gibbs fornece um

esquema iterativo de geração baseado em sucessivas gerações das distribuições condicionais

completas. O amostrador de Gibbs pode ser descrito da seguinte forma:

1) Inicializar o contador de iteração da cadeia, 1

j , e escolher valores iniciais

),...,(

)0()0(

)0(

θθθ

= ;

2) Obter novos valores para ),...,(

)()(

)( j

θθθ

= através de sucessivas gerações de

valores

()

∼

(

)

)j(

,...,,|p

−−

θθθ

()

∼

(

)

)j(

)j()j(

,...,,,|p

312

−−

θθθθ

)( j

∼ ),...,,,|(p

)j(

)j()j(

121

−

θθθθ

;

3) Mudar o contador

para mj ,...,2,1

e repetir o passo 2 até a convergência.

Quando a convergência é alcançada o valor resultante

)( j

é um valor da

distribuição

()

x|p

. A distribuição da cadeia gerada pelo amostrador de Gibbs, na iteração

m , converge para a distribuição de equilíbrio da cadeia.

Sob condições gerais de regularidade, quando

m →∞,

() ()

( ,..., ) ( ,..., )

θθθ

→ e então

()

→ (GEMAN e GEMAN

apud SOUZA,

1999). Ou seja, a distribuição da cadeia gerada pelo amostrador de Gibbs, na iteração

m ,

converge para a distribuição de equilíbrio, na norma da variação total, a uma taxa geométrica

em m. Essa propriedade é também conhecida como ergodicidade e uma conseqüência

importante deste resultado é que as médias ergódicas

()

∑

(16)

convergem quase certamente para E

[

(

)

f ], quando m → ∞ , se a esperança existir.

Logo, assume-se que a convergência é atingida em uma iteração cuja

distribuição de equilíbrio esteja próxima de

(

)

x|p

e não no sentido do número de iterações

tendendo a infinito. Se a indicação de convergência é atingida na iteração m, M iterações após

GEMAN, S.; GEMAN, D. Stochastic relaxation, Gibbs distribution, and Bayesian restoration of images. In:

IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE, v.6, 1984.

Proceedings… 1984, p.721-741.

as m iniciais representam uma amostra da cadeia em equilíbrio e, assim, uma amostra

aleatória de tamanho M de

()

x|p

. Apesar deste resultado ser muito útil é bom ressaltar que,

em alguns casos, o amostrador de Gibbs pode apresentar um ritmo de convergência

extremamente lento. Uma solução para melhorar o tempo de convergência pode ser a

reparametrização dos parâmetros, conforme Gamerman e Lopes (2006).

O esquema acima define uma cadeia de Markov, pois os acontecimentos na

iteração j dependem da história do processo apenas através dos valores na iteração j-1. Mais

que isso, a cadeia é homogênea, pois o núcleo de transição não varia com j. Ele é dado por

()

(

)

(

)

(

)

(

)

),,...,,,...,,|(P

111

−−

+−

θθθθθ

(17)

que só depende da iteração j através dos valores nos quais se está condicionado.

2.5.1.2.1 Diagnósticos de convergência

Na implementação dos métodos de Monte Carlo aplicados a Cadeias de

Markov questões importantes como a escolha do amostrador, o número de replicações

independentes, a escolha de valores iniciais e problemas referentes a estimação e eficiência

devem ser considerados (Souza, 1999).

Em geral, utiliza-se médias ergódicas sobre as realizações de uma cadeia de

Markov, para se estimar funções de interesse. As iterações, dentro de uma fase inicial

transiente, devem ser descartadas para reduzir a possibilidade de tendências causadas pelo

efeito de valores iniciais. Um dos problemas mais difíceis de implementação é a determinação

deste período, porque as taxas de convergência variam para diferentes distribuições.

Na ausência de técnicas gerais para se determinar o comprimento da corrida,

a priori, análises estatísticas devem ser realizadas, a posteriori, para assegurar a convergência

da cadeia. Esses procedimentos são chamados diagnósticos de convergência.

Como ilustrado na seção 2.5.1.2, o amostrador de Gibbs gera cadeias de

Markov, de variáveis aleatórias, que convergem em distribuição, para a distribuição de

interesse. Diferentes abordagens para extrair informações das seqüências geradas exploram

esta propriedade para determinar o comprimento da fase inicial transiente.

Em Gamerman e Lopes (2006) são descritas algumas técnicas de

identificação e monitoração informal e de verificação formal da convergência. No contexto

informal estão a análise do comportamento da trajetória de uma cadeia ao longo das iterações,

a monitoração dos gráficos das densidades a posteriori, estimadas ao longo das iterações

(GELFAND e SMITH

, 1990 apud SOUZA, 1999; GELFAND

et al., 1990 apud SOUZA,

1999), e gráficos das médias ergódicas ao invés de valores gerados. Estas técnicas, para

monitoração da convergência, devem ser utilizadas com cautela e acompanhadas de algum

fundamento teórico.

A verificação formal da convergência é baseada em propriedades

estatísticas das cadeias simuladas. Segundo Souza (1999) são discutidos na literatura alguns

métodos de diagnósticos de convergência, com particular ênfase sobre implementação. Dentre

esses métodos está o método de Gelman e Rubin (1992) o qual é baseado em duas ou mais

cadeias paralelas, inicializadas em diferentes pontos dispersos em relação à verdadeira

distribuição a posteriori.

Este método é baseado em uma comparação, para cada uma das variáveis,

entre a variância amostral dentro das cadeias e entre as cadeias. Esta comparação é utilizada

para se estimar o fator para o qual o parâmetro de escala da distribuição marginal a posteriori,

pode ser reduzido à medida que o tamanho da amostra cresça. O método de Gelman e Rubin

consiste, essencialmente, em uma análise clássica de variância. Melhores resultados são

obtidos para parâmetros cujas densidades são aproximadamente normais.

Neste trabalho a verificação de indicação de convergência é feita através da

análise do comportamento da cadeia ao longo das iterações, e utilizando o diagnostico de

Gelman e Rubin implementado no software WinBUGS. Alguns resultados deste diagnóstico

são ilustrados no capítulo 3.

GELFAND, A. E.; SMITH, A. M. Sampling-based approaches to calculating marginal densities. Journal of

the American statistical association, v. 85, n. 410, pp. 398-409. 1990.

GELFAND, A. E.; HILLS, S. E.; RACINE- POON; SMITH, A. F. M. Ilustration of Bayesian inference in

normal data model using Gibbs sampling. Journal of the American statistical association, v. 85, n. 412, pp.

972-985. 1990.

2.5.1.3 Software WinBUGS

Segundo Gamerman e Lopes (2006), uma das maiores dificuldades a

impedir o desenvolvimento da Inferência Bayesiana sempre foi a sua implementação em

problemas práticos, que em parte era decorrente da dificuldade de sumariar a distribuição a

posteriori. O amostrador de Gibbs possibilita a análise de modelos bastante complexos através

de sucessivas decomposições em distribuições condicionais completas. Logo, um sistema

dotado da capacidade de compreensão de várias possibilidades de distribuição a priori e capaz

de amostrar das distribuições condicionais completas resolve boa parte dos problemas que

sempre dificultaram o uso dos métodos Bayesianos. Um sistema é o WinBUGS (Bayesian

Inference Using Gibbs Sampler para Windows) (SPIEGELHALTER et al., 2002).

O software WinBUGS é um programa direcionado para a aplicação da

Inferência Bayesiana, em problemas estatísticos, usando o amostrador de Gibbs. Este

programa possui um conjunto de funções que permite a especificação do modelo e das

distribuições de probabilidade para todos os seus componentes aleatórios (observações e

parâmetros). Entre os modelos já analisados através do WinBUGS e descritos em seu manual

encontram-se: modelos lineares generalizados com efeitos aleatórios, análise de regressão em

dados de sobrevivência, modelos com estrutura de dependência espacial e modelos de

suavização não-paramétrica.

Para cada conjunto de dados e modelo utilizado, o WinBUGS fornece os

valores amostrados de cada parâmetro monitorado a cada n iterações a partir de uma

determinada iteração m. Ambos os valores de n e m, bem como os parâmetros a serem

monitorados, são especificados pelo usuário. O BUGS fornece automaticamente para esses

parâmetros alguns resumos decorrentes da amostra obtida, como média e intervalos de

confiança, gráficos para análise das trajetórias das cadeias geradas, densidades e

autocorrelações, medida para diagnóstico de convergência e medida para avaliação do ajuste.

Recentemente, foi incorporado ao WinBUGS o módulo GeoBUGS. Esse módulo é

direcionado à análise espacial, que fornece uma interface para a produção de mapas da média

ou outros resumos estatísticos da distribuição a posteriori de uma variável estocástica. Esse

módulo propicia a criação e manipulação de matriz de adjacências as quais são necessárias

para a implementação do modelo CAR direcionado para análise de modelos com dados

georreferenciados.

A linguagem do sistema quanto a entrada e a saída de dados obedece a

mesma sintaxe da linguagem de programação S-Plus ou da linguagem R de domínio público.

2.5.1.4 Inferência Bayesiana para modelos Auto-regressivos Condicionais

Supondo que a área de interesse pode ser dividida em n sub-regiões, sejam

elas regulares ou não, pode-se usar a idéia de modelos auto-regressivos temporais e supor que

a resposta para cada área

()

,n,...,ii 1

representada por

Z , é uma auto-regressão de

primeira ordem na média da resposta dos seus vizinhos, isto é,

εερ

⎟

⎠

⎞

⎜

⎝

⎛

∑

∈

∼ iid

(

)

,N , (18)

onde N

é o conjunto dos vizinhos da área i e |N

| é o número de vizinhos a área i. Em geral,

pode-se assumir que existe uma tendência μ no processo e neste caso, o modelo em notação

matricial pode ser representado por,

(

)

,ZWZ

−

=− ∼ iid

(

)

I,N

, (19)

onde W é uma matriz de pesos representando a estrutura de vizinhança e I

representa a

matriz identidade de ordem n. A matriz W pode ser especificada apenas através das

localizações adjacentes, isto é 1

w se as áreas i e j são adjacentes e ,w

0= caso contrário.

Também se pode especificar uma matriz W que tenha pesos diferentes de zero, informando

que a resposta na sub-região

i não depende apenas daquelas localizações adjacentes. O

modelo apresentado na Equação 19 é conhecido na literatura como modelo espacial auto-

regressivo (BESAG, YORK e MOLLIÉ , 1991).

Assim, como no caso de séries temporais, pode-se especificar dois tipos de

modelos espaciais auto-regressivos:

1. Modelo Auto-regressivo Simultâneo (SAR)

()

σεεμμ

,N~,ZSZ

iijj

ijii

+−=−

∑

(20)

onde i = 1,...,n, e

{

}

SS ≡ é tal que SI

−

é não-singular. Na forma matricial podemos

escrever,

(

)

(

)

I,N~,ZSZ

σεεμμ

+−=− (21)

2. Modelo Auto-regressivo Condicional (CAR)

Neste caso, especifica-se a distribuição condicional do processo na área

dados os vizinhos, isto é:

() ()

⎟

⎠

⎞

⎜

⎝

⎛

−+≠

∑

jjijiji

,ZCN~ij,Z|Z

σμμ

, (22)

onde

{

}

CC≡ é tal que CI

− é simétrica e positiva definida. Equivalentemente,

()

,ZCZ

ijj

ijii

υμμ

+−=−

∑

(23)

onde

∼

(

)

, para .n,...,i 1=

Entretanto, em contraste com a abordagem para séries temporais, as duas

especificações fornecem dois diferentes modelos, isto é, mesmo se fizermos

ijij

modelo CAR fornece uma distribuição conjunta que é diferente daquela do SAR.

Seguindo as especificações acima, a distribuição dos dados é dada por:

∼

()

(

)

(

)

-11

S'-IS - I Λ

−

, para o modelo SAR e

∼

(

)

(

)

MC - I

1−

, para o modelo CAR (24)

onde

(

)

diag

σσ

...,,=Λ e

(

)

diag M

...,,

ττ

= . Se em particular, ,n...,,,i, 21

=∀=

ττ

o log

da função de verossimilhança associada ao processo vindo do modelo CAR é dado por:

()

()()

,ZB'ZBlog

μμ

πσ

−−−+−

(25)

onde

()()

SISIB −

′

−= para o modelo SAR e

CIB −= para o modelo CAR.

Comparando algumas propriedades dos modelos CAR e SAR pode-se

decidir por qual modelo utilizar. O modelo CAR é preferido por apresentar a propriedade de

que sua especificação fornece diretamente as distribuições condicionais completas dos

parâmetros do modelo, fator determinante para o uso do amostrador de Gibbs em MCMC.

Segundo Schmidt, Nobre e Ferreira (2003), no contexto Bayesiano

geralmente o modelo CAR é usado como informação a priori de um parâmetro do modelo

para o processo de interesse. O modelo genérico descrito a seguir, com enfoque direcionado

às áreas em estudo, é usado para exemplificar a modelagem Bayesiana de um processo

condicionalmente auto-regressivo. A subseção 3.1.3 apresenta um exemplo específico deste

tipo de abordagem.

Nesse exemplo específico assume-se que a área de interesse pode ser

dividida em n sub-regiões, sejam regulares ou não. A quantidade de interesse observada em

cada sub-região

()

,n,...,ii 1= é representada por

Z . Um possível modelo para

Z é

apresentado a seguir.

∑

++=

iikki

SXZ

βμ

, (26)

onde:

representa um fator comum a toda região em estudo;

(

)

qiii

X,...,XX

= representa um vetor de possíveis covariáveis para a i-ésima área, que

podem explicar o processo;

representa o efeito da k-ésima covariável na resposta Z;

()

S,...,SS

= são os efeitos aleatórios que podem ser vistos como variáveis latentes que

capturam efeitos desconhecidos ou não medidos pelas covariáveis.

Sob o enfoque Bayesiano, a Equação 26 representa o primeiro nível da

hierarquia do modelo. No segundo nível deve-se especificar a distribuição a priori do vetor

paramétrico

( ,,...,,

S). Geralmente assume-se a priori que esses parâmetros são

independentes e que

,...,,

seguem uma distribuição normal centrada em 0 (zero) com

baixa precisão. Dessa forma, deixa-se que os dados dêem maiores informações sobre tais

parâmetros.

Assume-se para o efeito aleatório

S uma priori auto-regressiva condicional

intrínseca (BESAG, YORK e MOLLIÉ, 1991). A estrutura dessa priori é dada por:

(

)

(

)

,mN~ij,sS|S

ijji

≠

, (27)

onde,

∑∑

∑

∈∈

∈

jij

δδ

onde

representa o conjunto de áreas adjacentes a i e

υ um termo comum de variância.

Essa especificação resulta na seguinte distribuição a priori conjunta para o vetor de erros

aleatórios

S ,

()

⎭

⎬

⎫

⎩

⎨

⎧

−−∝

∑∑

jiij

SSwexp|S

υυ

. (28)

que é uma distribuição imprópria já que é baseada nas diferenças pareadas entre os s'S

, ou

seja essa priori é invariante à locação. Como prioris impróprias podem resultar em posterioris

impróprias, na prática impõe-se uma restrição para que esses efeitos somem 0 (zero). A

especificação se completa ao se determinar a matriz de vizinhança W

[

]

w e a distribuição

a priori para a variância

. Neste caso, assume-se que 1

w se i é adjacente a j e 0

caso contrário, resultando em

∑

∈

e , (29)

com

N representando o número de vizinhos da i-ésima região e para

assume-se uma

distribuição a priori gama invertida. A média condicional de

S ,

m , é dada pela média

aritmética dos efeitos aleatórios dos seus vizinhos, e a variância condicional

é proporcional

ao número de vizinhos, donde vem a denominação CAR intrínseco. Essa especificação é

especialmente relevante quando a região é dividida em sub-regiões irregulares. Outras

estruturas de vizinhanças podem ser adotadas, por exemplo, alguma baseada na distância

entre os centróides das sub-regiões (SCHMIDT, NOBRE e FERREIRA, 2003).

2.5.2 Markov Random Field

O MRF, ou Campo Aleatório de Markov, é um modelo que tem atraído

muita atenção nos últimos anos. Os modelos MRF têm sido utilizados em aplicações de

processamento de imagem de baixo nível, tais como segmentação e restauração de imagem

(GEMAN e GEMAN, 1984; SZIRÁNYI et al., 2000). No entanto, recentemente vem sendo

utilizado em tarefas de análise de imagem de alto nível (KIM e YANG, 1995; MODESTINO

e ZHANG, 1992; KOPPARAPU e DESAI, 2001; ANDERSEN et al., 2002).

A análise de imagem usando MRF é formulada como um problema de

estimação do maximum a posteriori (MAP). Este processo corresponde à resolução de um

problema de minimização de energia. Em geral, a função de energia associada com problemas

de visão é não-convexo, podendo então ter vários mínimos locais. Assim, a solução pode não

corresponder a um mínimo global.

Segundo Kinderman e Snell (1980), o MRF pode, também, ser definido,

sobre grafos e aplicado para o problema de análise de imagem.

2.5.2.1 MRF e distribuição de Gibbs

Seja X a característica associada aos pixels da imagem ( )NM× definida na

grade regular {( , ) :1 ,1 }Sij iNjM=≤≤≤≤, representada por,

1,1

2,1

1,1 1, 2 1,

2,1 2,2 2,

,1 , 2 ,

...

....

...

NN NM

XX X

⎡

⎤

⎢

⎥

⎢

⎥

⎢

⎥

⎢

⎥

⎢

⎥

⎢

⎥

⎢

⎥

⎡⎤

⎢

⎥

⎢⎥

⎢

⎥

⎢⎥

⎢

⎥

⎢⎥

⎢

⎥

=→

⎢⎥

⎢

⎥

⎢⎥

⎢

⎥

⎢⎥

⎢

⎥

⎢⎥

⎢

⎥

⎢⎥

⎣⎦

⎢

⎥

⎢

⎥

⎢

⎥

⎢

⎥

⎢

⎥

⎢

⎥

⎢

⎥

⎢

⎥

⎢

⎥

⎣

⎦

(30)

onde, o segundo membro da expressão 30 representa a ordenação lexicográfica para a imagem

Logo, pode-se assumir que cada pixel

,ij

toma valores em um conjunto

finito de P níveis. Esses P níveis podem ser tons de cinza (por exemplo, 256 níveis para

imagens de oito bits). Assim, o número de possíveis configurações para X é finito, isto é

, o que é extremamente grande.

Segundo Kopparapu e Desai (2001) a dependência local de

,ij

é a idéia

básica associada com o processo de Markov. De fato, entre outras propriedades, é esta que

torna a modelagem via MRF atrativa para problemas em visão. Neste caso, tem-se que X é um

MRF, se e somente se,

,,,,

,,,, ,

[|,(,)(,)]

[|,para(,)],

ij ij kl kl

ij ij kl kl ij

PX x X x kl ij

PX x X x kl

==∀≠

== = ∈

(31)

onde

[|]P ⋅⋅

é a probabilidade condicional e

,ij

é a vizinhança da posição ( , )ij.

Assumindo que

tenha uma configuração finita sobre S e que

[]0PX x=>, então, pelo teorema de Hammersley-Clifford,

é um MRF com relação a

vizinhança

se e somente se

tem distribuição de Gibbs,

()

[] 0,

PX x e

−

(32)

onde

é uma realização de

é uma constante de normalização comumente

mencionada como a função de partição, dada por,

()

toda conf x

−

∑

(33)

()Ux refere-se à função de energia e é definida por,

() ().

Ux V x

∈

∑

(34)

onde ( )

Vx é a função potencial definida sobre as cliques .C

A forma geral da função de energia ( )Ux é dada por,

(, )

,, ,

(, ) (1,1)

(, 1) (, )

,,,;, , ,

(, ) (1,1) ( ,) (, 1)

(, 2) (, 1) (, )

(,)(1,1) (,)(, 1) (,)(, 1)

1,1 ,1 , 1,1;...; ,

() ( )

(, )

...

,..., ,...,

ij ij ij

NM NM

ij kl ijkl ij kl

ij kl ij

NM NM NM

ij kl ij rs kl

NNMN

Ux xG x

xxG x x

xx xG

−

==+

−−

==+=+

∑

∑∑

∑∑ ∑

1;...; , 1,1 ,1 ,

( ,..., ,..., ),

NM N NM

xx x

(35)

onde

,;, , ,

(, )0

ijnm ij nm

Gxx= se

,ij

,nm

não pertencem a mesma clique (KOPPARAPU e

DESAI, 2001).

A definição de clique é melhor entendida, no contexto de análise de

imagem, considerando dois exemplos. Para uma vizinhança de primeira ordem (vizinhança 4),

correspondente à posição ( , ),ij o conjunto de cliques é,

j)}}.1,(ij),j)}{(i,1,(ij),{(i,1)},j(i,j),{(i,

1)},j(i,j),{(i,j)},{{(i,C

−+−

Essa definição de clique de primeira ordem mostra que a vizinhança é

definida para o elemento base ( , )ij isoladamente, e para cada par envolvendo este elemento e

os demais. Na Figura 18, a primeira ilustração a esquerda mostra a vizinhança considerada e

as demais ilustrações mostram as 5 componentes da clique C.

Figura 18 – Vizinhança de primeira ordem da clique (Fonte: KOPPARAPU e DESAI, 2001).

Para uma vizinhança de segunda ordem (vizinhança 8), correspondendo à

posição ( , ),ij o conjunto de cliques é dado por,

{{( , )},{( , ),( , 1)},{( , ),( , 1)},{( , ),( 1, )},

{( , ),( 1, )},{( , ),( 1, 1)},{( , ),( 1, 1)},

{( , ),( 1, 1)},{( , ),( 1, 1)},{( , ),( 1, ),

{( , 1)},{( , ),( 1, ),( , 1)},{( ,

C ij ijij ijij iji j

ij i j ij i j ij i j

ij ij i j ij i

+−+

−−−++

+− −+ −

−−+),( 1, ),( , 1)},

{( , ),( 1, ),( , 1)},{( , ),( 1, ),( , 1),

( 1, 1)},{( , ),( 1, ),( , 1),( 1, 1)},

{( , ),( 1, ),( , 1),( 1, 1)},

{( , ),( , 1),( 1,

ji jij

ij i j ij ij i j ij

i j ij i j ij i j

ijijij ij

ij ij i

+− −−

−− − + −+

++++

+−+−

−− 1)},{( , ),( , 1),( 1, 1)},

{( , ),( , 1),( 1, 1)},{( , ),( , 1),( 1, 1)}}

jijijij

ij ij i j ij ij i j

−+−+

−+− +++

A definição de clique para uma vizinhança de segunda ordem é composta de

um único elemento (isto é, o elemento base ( , )ij), além de duplas, triplas e quádruplas

envolvendo o elemento base e demais vizinhos. A primeira ilustração a esquerda da Figura 19

mostra a estrutura de vizinhança de segunda ordem, sendo a posição central ( , )ij o elemento

base. As outras ilustrações mostram as 22 componentes da clique C.

Figura 19 – Vizinhança de segunda ordem da clique (Fonte: KOPPARAPU e DESAI, 2001).

Analisando-se novamente as Figuras 18 e 19, pode-se notar que o número

de componentes das cliques aumenta rapidamente com o aumento da ordem da vizinhança.

Assim, na maioria das aplicações consideram-se sistemas de primeira ou segunda ordem.

Entretanto, quando se considera um sistema de vizinhança de ordem superior, concentra-se a

atenção para as componentes com duas posições (KOPPARAPU e DESAI, 2001).

2.5.2.2 MRF para análise de imagens por regiões

A formulação de um MRF para problemas de análise de imagem pode ser

realizada segundo alguns preceitos, ou seja, parte-se de uma imagem segmentada e constrói-

se um grafo de regiões adjacentes (Region Adjacency Graph (RAG)). Cada nó do RAG

corresponde a uma região da imagem e dois nós tem conectividade entre eles se as duas

regiões correspondentes compartilham de uma mesma fronteira. Em seguida, assume-se que a

interpretação do nó, dado o conhecimento especifico dos objetos de interesse, e os atributos

obtidos da imagem observada, dá se de acordo com um MRF. Assim, o problema de análise

(a) (b)

de imagem é então resolvido como um problema de estimativa MAP. Uma das grandes

vantagens desta abordagem é a possibilidade de modelar o conhecimento contextual, isto é, as

relações entre o objeto de interesse e os demais presentes na cena.

2.5.2.3 MRF em estrutura de grafo

Segundo Kopparapu e Desai (2001), a formulação de um MRF em estrutura

de grafos inicia com uma imagem segmentada com

n regiões

{ , ,..., }

RR e o RAG

correspondente. Um exemplo de imagem segmentada e RAG podem ser visualizados na

Figura 20. Este RAG mostra que a região

está relacionada com as regiões

234

RR.

Mostra também que

tem relação com

5321

ReR,R,R .

Figura 20 – (a) Imagem segmentada; e (b) RAG (Fonte: KOPPARAPU e DESAI, 2001).

Seja { , }GRE= um RAG, onde

{ , ,..., }

RR R

representa o conjunto de

nós , 1,2,...,

in= e E denota o conjunto de arestas. Existirá uma aresta entre os nós

se as regiões correspondentes compartilharem, pelo menos parcialmente, de uma mesma

fronteira.

O sistema de vizinhança em

G será representado por

{ ( ), ( ),..., ( )}

ηη η

(36)

onde

(),

i = 1,...,n é o conjunto de todos os nós em

vizinhos de .

Nota-se que

()

∈ se ( )

∈ .

Seja

{ , ,..., }

XX X= a família de variáveis aleatórias definida sobre

onde cada

corresponde a .

Além disso, assume-se que

toma valores em um espaço

amostral finito. Segundo Kopparapu e Desai (2001),

é denominado um MRF sobre G

com relação ao sistema de vizinhança

se e somente se:

1) 0][ >= xXP para todas as realizações de

;

2) )].(||[]|[

ijjjiijjii

RRjxXxXPijxXxXP

∈

∀

≠∀==

Uma das vantagens do modelo de MRF é que geralmente sua função

distribuição de probabilidade é dada pela distribuição de Gibbs conforme estabelece o

teorema de Hammersley-Clifford.

Uma clique c, neste contexto, é um subconjunto de nós de

G (isto é,

) tal

que cada par de diferentes nós em c são vizinhos. A coleção de todas as cliques de

G com

relação ao sistema de vizinhança

é representado como ( , )CG

De acordo com Kopparapu e Desai (2001), assumindo que

tem um

número finito de configurações em relação ao espaço amostral

S , e que [ ] 0PX x=>, então

é um MRF, com respeito ao sistema de vizinhança

, se e somente se

tem distribuição

de Gibbs, isto é,

()

[]

PX x e

−

(37)

onde,

é uma realização de

é a constante de normalização dada por,

()

toda conf x

−

∑

(38)

e ( )Ux conhecida como a função de energia de Gibbs, dada por,

(,)

() ( ),

cCG

Ux V x

∈

∑

(39)

na qual, ( )

Vx é a função potencial da clique, sendo

o valor das variáveis associadas com

os nós pertencentes à clique ( , )cCG

∈ .

Para elucidar melhor o conceito de clique, considere o RAG da Figura 20. O

quadro 2 mostra as cliques para dois nós deste RAG.

Quadro 2 – Cliques para os nós R

e R

do RAG.

Nós Cliques de

primeira ordem

Cliques de

segunda ordem

Cliques de

terceira ordem

} {R

, R

}

, R

}

, R

}

, R

}

, R

}

} {R

, R

} -

Fonte: Kopparapu e Desai, 2001.

Notar que

1234

{, , , }

RRR não pode ser uma clique porque

R não são

vizinhos. A função potencial da clique

V envolve somente nós de

c . Assim, cada função

desse tipo expressa a forma e o grau de interação (primeira ordem, segunda ordem etc.) que

cada nó

tem com seus vizinhos.

Segundo Modestino e Zhang (1992), devido à estrutura na qual as

propriedades locais e globais são relacionadas através de cliques, a abordagem baseada no

modelo de MRF para análise de imagem fornece vantagens em relação à representação do

conhecimento, aprendizado e otimização.

2.5.2.4 Rotulação de imagem usando MRF

Quando o problema de análise de imagem é restrito à rotulação de regiões a

partir de uma imagem segmentada, atribui-se um nó R para cada região. O conjunto de arestas

E é tal que o nó R

está conectado a R

somente se as regiões correspondentes são

espacialmente adjacentes. Então, a imagem segmentada da Figura 20(a) toma a forma do

grafo de adjacência mostrado na Figura 20(b).

Cada nó R

tem um rótulo possível do conjunto

{ , ,..., }.

II I

Então, o

espaço amostral para cada

(isto é, a variável aleatória para o nó R

) será

{ , ,..., }.

II I=

Logo,

tomaria um valor do conjunto

{ , ,..., }

II. Um exemplo de conjunto de rotulação

poderia ser {I

= pastagem, I

= rodovia, I

= céu, I

= edifícios, I

= carro}. Então,

tomaria

um dos M valores de

O conhecimento específico a priori é denotado por

, o qual está

relacionado com os objetos constituintes da cena e que se pretende identificar. A

caracterização de

implica em calcular valores para todos os atributos que são considerados

importantes para o processo de rotulação. Esses atributos podem ser níveis de cinza ou

características geométricas (perímetro, área etc.) numa clique de primeira ordem, contraste ou

comprimento da fronteira entre dois objetos para cliques de segunda ordem. Atributos mais

complexos podem ser definidos para cliques de ordem superior.

A caracterização e representação do conhecimento a priori para rotulação de

objetos presentes na cena não é um problema bem resolvido. O procedimento geral é a criação

de um conjunto de atributos e sua validação através de estudos empíricos (MODESTINO e

ZHANG, 1992).

Os atributos úteis para a análise de imagem podem ser classificados em:

atributos primários, ou seja, aqueles atributos obtidos da cena através de medidas diretas;

atributos secundários, os quais são obtidos a partir dos atributos primários e por esta razão não

são diretamente obtidos da cena.

Dentre os atributos primários pode-se citar a área, o perímetro, a variância e

o nível médio de cinza. Os atributos secundários são combinações de atributos primários.

Alguns desses atributos são: a compacidade, o comprimento da fronteira entre dois objetos e o

contraste. E ainda, pode-se considerar o contexto, que se constitui numa das grandes

vantagens desta abordagem. Neste caso, é possível modelar o conhecimento contextual, isto é,

as relações entre o objeto de interesse e os demais presentes na cena.

O conjunto de atributos obtidos a partir da imagem de entrada pode ser dado

por,

{| (,)}

FF cCG

=∀∈ , (40)

onde

{ ,..., }

ccc

FFF= ,

é o conjunto de q atributos medidos sobre a clique

.c Esses q atributos seriam os mesmos

usados na caracterização do conhecimento a priori

Assume-se agora que a distribuição de probabilidade do vetor aleatório

definido sobre o RAG

G , dado o conhecimento a priori

e o conjunto de atributos F , é um

MRF, isto é,

(| , )

[|,}exp

Uxf

PX x F f

−

== = (41)

(,)

(| ,) ( | ,)

cCG

Ux f Vx f

∈

∑

. (42)

Agora o problema de análise de imagem é resolvido como um problema de

estimação do MAP, isto é

arg max [ | , ]

PX xF f

==, (43)

ou, de forma equivalente,

arg min ( | , ]

Ux f

. (44)

Para uma determinada imagem, uma análise ótima corresponde à

minimização de uma função de energia. No entanto, essa análise ótima depende de como a

função de energia é definida.

2.5.2.5 Solução MAP

Como foi discutido na seção 2.5.2, o processo em questão, de análise de

imagem, é formulado como um problema de estimativa MAP. Em geral, quando se tem um

problema baseado num modelo MRF, a solução procurada geralmente envolve uma

estimativa MAP, que é equivalente a um problema de minimização da função de energia dada

por,

um no clique multiplos no s clique

argmin (| ,) (| ,).

cc mcc

xVxfVxf

κκ

′′

∀= ∀=

⎡⎤

⎢⎥

⎣⎦

∑∑

(45)

Em geral, a expressão dentro do colchete na Equação 45 possui vários

mínimos locais. Assim, é necessária a aplicação de um algoritmo de minimização que possa

fornecer um mínimo global. Entretanto, a utilização de um método simples de otimização

envolve uma busca combinatorial exaustiva, resultando em uma complexidade exponencial da

ordem de

L , onde L é o número de rótulos e N o número de nós do grafo de adjacência

(MODESTINO e ZHANG, 1992).

Todavia, com o intuito de resolver o problema da busca combinatorial,

alguns autores têm proposto esquemas de relaxação para encontrar a solução local ótima para

o problema da estimativa MAP (ROSENFELD et al., 1976; HUMMEL e ZUCKER, 1983).

Outra solução, descrita na literatura, para reduzir a complexidade exponencial é a utilização

do algoritmo SA. Este algoritmo é um procedimento de otimização, que encontra o máximo

global da distribuição a posteriori do MRF ou o mínimo da função de energia sem cálculos

excessivos (GEMAN e GEMAN, 1984).

No algoritmo SA, a distribuição de probabilidade condicional é modelada

para depender do parâmetro de controle (temperatura) ,T

[]

()

(

)

xXP

⎟

⎠

⎞

⎜

⎝

⎛

−

== e

(46)

onde,

(

)

∑

⎟

⎠

⎞

⎜

⎝

⎛

−

xconf. toda

e (47)

Um aspecto importante do SA é a escolha da temperatura inicial

T , pois a

eficácia do algoritmo depende de uma escolha adequada para

T . Segundo Modestino e

Zhang (1992), no algoritmo SA o processo primeiramente “liquefaz” o sistema em uma

temperatura alta e, então, gradualmente diminui a temperatura até que o sistema se resfrie e

atinja uma configuração ótima. É oportuno registrar que a técnica de otimização mencionada

já foi utilizada recentemente para a extração de feições cartográficas. De fato, Trinder, Maulik

e Bandyopadhyay (2000) o apresenta como uma alternativa vantajosa ao princípio de

minimização de energia usado para a solução do problema de contorno ativo (snakes), cuja

desvantagem está associada à sensibilidade do processo de otimização ao estado inicial. Esses

autores ressaltam, ainda, que a literatura não fornece informação sobre a escolha da

temperatura inicial, ao contrário, essa escolha envolve tentativa e erro.

O algoritmo SA tem sido muito utilizado em aplicações envolvendo

otimização combinatorial. Um trabalho utilizando esse algoritmo é descrito por Modestino e

Zhang (1992). Estes autores salientam que este algoritmo, com algumas modificações reduz a

complexidade computacional e fornece resultados similares aos obtidos pelo amostrador de

Gibbs.

O algoritmo SA é um método proposto por Geman e Geman (1984) para

maximizar a probabilidade a posteriori utilizando o resfriamento simulado que se baseia no

algoritmo proposto em Metropolis et al. (1953). O objetivo desse método é maximizar

iterativamente a probabilidade a posteriori ou equivalentemente minimizar a função de

energia por meio de trocas locais nas variáveis aleatórias. Este algoritmo possibilita a

obtenção de estados que apresentam maior quantidade de energia, evitando assim a

permanência em regiões de mínimos locais. O fluxograma ilustrado na Figura 21 mostra o

princípio de funcionamento do algoritmo.

[]

TUU

/−

i = j e U

= U

Sim

p > rand

Não

Nova temperatura?

Sim

TT ⋅=

Temperatura de

congelamento?

Fim

Sim

Não

Sim

Inicialização:

 Temperatura inicial T

;

 Solução inicial

 Valor da função de energia U

Definição da nova solução j

Calculo da função de energia U

Não

< U

Figura 21 – Fluxograma do algoritmo SA.

O algoritmo SA começa a busca pela melhor solução a partir de uma

solução inicial qualquer. Através da solução incial obtém-se a energia U

. O procedimento

principal consiste em analisar a cada iteração, um único vizinho j da solução corrente i. A

cada geração de um novo vizinho j de i, é testada a redução de energia U

< U

, a qual implica

que a nova solução é melhor que a anterior. O método aceita a solução e j passa a ser a nova

solução corrente. Caso contrário, se U

> U

, houve um aumento do estado de energia. A

aceitação desse tipo de solução é mais provável a altas temperaturas e bastante improvável a

temperaturas reduzidas. Para reproduzir essas características, geralmente usa-se, para calcular

a probabilidade de se aceitar a nova solução, uma função conhecida por fator de Boltzmann,

que é dada por

[

]

T/UU

−

, onde T é um parâmetro do método, chamado de temperatura e

que regula a probabilidade de soluções com pior custo.

A temperatura T

assume inicialmente um valor elevado, logo é aceita

qualquer tipo de configuração. Conforme a temperatura decresce, as configurações que

possuem maior energia têm diminuída sua probabilidade de aceitação. Assim o processo tem

como objetivo reduzir a quantidade de energia e com isso o valor da probabilidade a posteriori

aumenta. Em relação à temperatura (T) do sistema, esta deve ser realizada lentamente

(KIRKPATRICK, GELATT e VECCHI, 1983). Algumas equações são propostas para o

decréscimo da temperatura (GEMAN E GEMAN, 1984; MANJUNATH, SIMCHONY E

CHELLAPPA,1990; BLAKE, 1989), entre elas a Equação

, onde

assume valores

no intervalo

()

10; , até alcançar a configuração ótima. Ainda no fluxograma (Figura 23) “rand”

é um número aleatório uniformemente distribuído entre 0 e 1.

O procedimento é finalizado quando a temperatura chega a um valor

próximo de zero e nenhuma solução que piore o valor da melhor solução seja mais aceita, ou

seja, quando o sistema estiver estável. A solução obtida quando o sistema encontra-se nesta

situação evidencia o encontro de um mínimo local

3 METODOLOGIA PARA A EXTRAÇÃO AUTOMÁTICA DE CONTORNOS DE

TELHADOS DE EDIFICIOS EM UM MDE, UTILIZANDO INFERÊNCIA

BAYESIANA E MRF

Este capítulo apresenta a metodologia proposta para a extração automática

de contornos de telhados de edifícios em um MDE obtido através da varredura a laser

utilizando Inferência Bayesiana e modelo MRF. A metodologia consiste inicialmente na

extração de contornos dos objetos altos existentes na cena para, na etapa seguinte, utilizar

esses objetos para a extração apenas dos contornos de telhados de edifícios. A seção 3.1

apresenta a metodologia para a extração automática de feições relacionadas com objetos altos

em um MDE, utilizando Inferência Bayesiana e modelo MRF. A seção 3.2 apresenta a

metodologia desenvolvida para separar os contornos de telhados de edifícios, via MRF, dentre

todos os objetos altos detectados na primeira etapa.

3.1 Metodologia para a extração automática de regiões altas em um MDE utilizando

Inferência Bayesiana e MRF

O fluxograma apresentado na Figura 22 mostra as etapas que envolvem a

primeira parte da metodologia desenvolvida.

Nuvem de pontos laser

Geração d

a malha

regular

Segmentação via divisão recursiva

Fusão de regiões usando MRF

Polígonos representando as

regiões altas

Figura 22 – Fluxograma referente à primeira etapa da metodologia de extração de feições.

O sistema de varredura a laser gera um conjunto de dados brutos (nuvem de

pontos) que são inicialmente interpolados para gerar um MDE. A partir dessa etapa, é

realizada a divisão recursiva usando a estrutura quadtree.

Após a etapa de divisão recursiva é

aplicada a técnica proposta de fusão

Bayesiana de regiões para reduzir a fragmentação da segmentação inicial, retendo apenas as

regiões correspondentes aos objetos altos. Após esta etapa, as regiões podem ser extraídas ou

explicitadas através de seus contornos. Para a extração das regiões foi utilizada uma técnica

de detecção de bordas das regiões altas seguida pelas técnicas de vetorização e poligonização.

3.1.1 Geração da malha regular de dados

Os dados provenientes da varredura a laser são pontos representados pelas

coordenadas ( , , )ENh. Neste caso, ( , )EN correspondem às coordenadas planimétricas de

um ponto no conjunto de dados brutos e

h é a altitude ortométrica do ponto de coordenadas

(, )EN. A Figura 23 ilustra os pontos fornecidos pela varredura a laser resultante do retorno

do primeiro pulso laser. Esses pontos consistem inicialmente de uma perfilagem irregular

onde não se tem o exato espaçamento de pontos na grade gerada.

(a) (b)

Figura 23 – (a) Exemplo de dados irregulares fornecidos pela varredura a laser; (b) detalhe ampliado

dos dados irregulares.

Os métodos de interpolação têm por função atribuir valores a novos pontos

inseridos num campo de valores já existente. O produto da interpolação é uma malha de

pontos regular, com valores interpolados nas novas posições criadas pela malha (Surfer,

1999). A Figura 24 mostra um exemplo de uma malha regular gerada pelo software Surfer 8.0

(utilizando o método do vizinho mais próximo com espaçamento de 70cm entre pontos na

malha) e sobreposta na imagem de intensidade utilizando o software MicroStation V8.

Figura 24 – Exemplo de uma malha regular sobreposta à imagem de intensidade.

Na literatura relacionada existe uma variedade de métodos de interpolação

que podem ser utilizados. Entre eles se destacam as splines cúbicas, elementos finitos,

mínimos quadrados, krigagem, vizinho mais próximo, linear, bilinear, inverso da distância

etc. (YANG et al., 2004). Um exemplo da representação tridimensional, gerada a partir da

interpolação (pelo método do vizinho mais próximo) dos dados de varredura a laser resultante

do retorno do primeiro pulso laser, é mostrado na Figura 25.

Figura 25 – Visualização tridimensional (Representação gerada no software Surfer 8.0).

Neste trabalho o método de interpolação utilizado foi o vizinho mais

próximo. O algoritmo do vizinho mais próximo é um método bastante simples e

computacionalmente atrativo. Tem como principal característica assegurar que o valor

interpolado seja um dos valores originais, ou seja, não gera novos valores. No entanto, o

produto final deste interpolador é caracterizado por um efeito de serrilhamento nas bordas dos

objetos (FRANKE, 1982).

Yang et al. (2004) realizaram um estudo com doze métodos de interpolação

utilizando o software Surfer 8.0. Nesse trabalho os métodos de interpolação foram

comparados e a acurácia dos resultados foram analisadas. O vizinho mais próximo foi um dos

métodos analisados e os resultados obtidos ficaram dentro dos padrões aceitáveis. Para cada

método, os autores analisaram a aplicabilidade, o algoritmo, a eficiência e as vantagens dos

métodos. Eles concluíram que não existe o melhor método, mas a melhor escolha diante de

determinadas circunstâncias. Logo, para a escolha correta do método de interpolação é

necessário conhecer as características de cada método bem como os dados que serão

utilizados.

A Figura 26 mostra os resultados obtidos usando vários métodos de

interpolação. A Figura 26(f) mostra que o interpolador do vizinho mais próximo possibilitou a

obtenção de uma maior nitidez das bordas do objeto, mas também um maior serrilhamento

das bordas. Além disso, os valores dos atributos Z (alturas) não são alterados, ocorrendo o

mesmo com as incertezas destas alturas. O bom contraste dos dados originais e a manutenção

dos valores observados são desejáveis para a primeira etapa da metodologia, principalmente

no que se refere à fusão bayesiana. Já o serrilhamento pode ser prejudicial para o cálculo de

alguns atributos utilizados na segunda etapa da metodologia. Entretanto, se necessário, este

efeito pode ser eliminado via algoritmo de simplificação de contornos, como o de

poligonização. Por estes motivos, o algoritmo de interpolação utilizado é o do vizinho mais

próximo.

(e) (f)

(a) (b)

Figura 26 – Imagem altimétrica das grades geradas pelos métodos de interpolação. (a) Polinomial

local; (b) Krigagem; (c) Inverso da distância; (d) Curvatura mínima; (e) vizinho natural e (f) vizinho

mais próximo (Imagens geradas pelo Software Surfer 8).

3.1.2 Segmentação via divisão recursiva

Uma região em um MDE é um agrupamento de pontos conexos com

propriedades similares. Ao subdividir o MDE em regiões, várias decisões devem ser tomadas.

No entanto, o problema está em decidir qual propriedade utilizar na subdivisão. Nessa

aplicação, a variância dos valores de altura é usada como medida de dispersão desses valores

em uma determinada região. A técnica utilizada neste trabalho para subdividir regiões é a

divisão recursiva de regiões, utilizando a estrutura quadtree.

Na divisão recursiva usando a estrutura quadtree, uma dada região é

subdividida em outras quatro sub-regiões de tamanhos idênticos se a variação dos valores de

altura desta região em análise for maior que o limiar especificado. O processo de divisão

segue recursivamente até que nenhuma região possa ser subdividida. O resultado é um MDE

organizado de acordo com a estrutura quadtree, onde todas as regiões homogêneas são

explicitamente representadas. A Figura 27 apresenta um exemplo ilustrativo desta técnica.

Figura 27 – Divisão recursiva usando a estrutura

quadtree.

A Figura 27 mostra o resultado obtido pela divisão recursiva em uma cena

urbana e, em destaque, para um único edifício. Neste caso pode-se observar claramente o

efeito da fragmentação resultante do processo de divisão recursiva. Visualmente as diferenças

entre as tonalidades das regiões parecem pequenas, mas, no entanto, várias são as regiões para

um mesmo objeto que, no caso, consiste de um telhado.

Neste trabalho, considerou-se

o MDE,

R cada quadrante do MDE e

uma propriedade (a variância das alturas dos pontos). Esta divisão é baseada em um teste de

hipóteses do tipo

λσ

=≤

)(:

RPH (onde

é um valor pré-estabelecido de acordo com os

valores de altura dos objetos presentes na cena) contra a hipótese

)(:

1 i

RPH >

. Se

)(:

1 i

RPH >

, rejeita-se

H em favor de

. A segmentação de

é realizada a partir de

sucessivas subdivisões. Assim, se a hipótese

H for verificada, então o MDE é subdividido

em quadrantes cada vez menores. Essa técnica gera uma estrutura de dados denominada

quadtree, isto é, uma árvore em que cada nó possui exatamente quatro descendentes.

Essa abordagem pode ser sumariada nas seguintes etapas:

1) Dividi-se o MDE em quatro quadrantes distintos;

2) Para cada quadrante, calcula-se a variância dos valores de altura;

3) Se

)(

, subdivide-se o referido quadrante em quatro outros quadrantes.

A segunda e a terceira etapa devem ser aplicadas recursivamente a todos os

quadrantes do MDE, enquanto a hipótese

H for verificada. O processo é finalizado quando a

hipótese

H for verificada para todas as regiões. Isso significa que a estratégia descrita deve

ser aplicada recursivamente até que não haja mais quadrantes para serem subdivididos.

Assim, o algoritmo é finalizado e uma estrutura é gerada. Essa estrutura corresponde a um

MDE segmentado, onde cada

R é rotulado com o nível médio de altura da região

correspondente.

3.1.3 Fusão de regiões usando uma Abordagem Bayesiana

As informações fornecidas pelo método de divisão recursiva são utilizadas

para a fusão de regiões com certo grau de similaridade. As regiões adjacentes são conectadas

usando a propriedade de alturas na forma do conhecimento de que os telhados são mais altos

que as regiões adjacentes. Logo é possível, na etapa de segmentação, separar os objetos altos

(como por exemplo, edifícios, árvores, caixas d’água etc.) dos objetos baixos (quintais, pátios,

corredores, canteiros, carros, barracas, ruas, terrenos etc.). No entanto, alguns objetos

indesejáveis ainda farão parte do conjunto de objetos altos (por exemplo, árvores, caixas

d’água etc.).

Neste trabalho optou-se por utilizar o modelo CAR, definido na subseção

2.5.1.4, visto que este permite obter diretamente as distribuições condicionais completas dos

parâmetros do modelo, fator determinante para o uso do MCMC, neste caso o amostrador de

Gibbs. Neste trabalho a idéia é usar modelos que especifiquem que o processo de interesse é

influenciado, de alguma forma, pela resposta do mesmo em localizações vizinhas.

Para realizar a fusão considerou-se, como na seção 2.5.1.4, a área de

interesse dividida em n sub-regiões, onde

representa a quantidade de interesse (altura

média) que é observada em cada sub-região i,

.n,...,i 1

Neste caso, assume-se que cada

tem distribuição normal com média

e variância

, dada por,

(

)

σμ

,N~Z

(48)

onde a média

é modelada em função de um fator (

) comum a todas as regiões em estudo

e de um efeito aleatório não observável

S , representando características específicas,

(49)

Cabe ressaltar que não foram inseridas covariáveis no modelo pelo fato

destas não contribuiem significativamente com os resultados esperados. Uma covariável

possível seria o nível de cinza de cada região, no entanto essa informação depende do tipo de

resposta de cada material existente na cena, o que não auxilia na discriminação dos objetos

existentes na área analisada.

Para a especificação completa do modelo é necessário assumir distribuições

a priori para os parâmetros representados pelo espaço paramétrico

(

)

,,S,

σσμ

=Θ . (50)

Assim, são assumidas para

(

)

b,aU , para

S ~

(

)

CAR

(

)

b,aIG

σσ

e para

(

)

σσ

b,aIG

, todas as distribuições com hiperparâmetros

previamente especificados, onde

(

)

b,aU significa uniforme no intervalo

()

b,a e

(

)

b,aIG

inversa gama com parâmetros a e b. A priori CAR para

S implica em

(

)

(

)

SSji

,N~ji,S|S

σμ

≠ ,

σμ

∑

∈

onde

N e

S representam o número e o conjunto de vizinhos da i-ésima área.

A densidade conjunta é dada por

()

.SZe

Ze,,|Zp

iii

⎭

⎬

⎫

⎩

⎨

⎧

−−−

⎟

⎠

⎞

⎜

⎝

⎛

⎭

⎬

⎫

⎩

⎨

⎧

−−=

∑

∏

σπσ

πσ

σμ

(51)

E, consequentemente, a verossimilhança para o modelo definido em ( 48 ) e

( 49 ) é dada por

()

.SZe;,,L

⎭

⎬

⎫

⎩

⎨

⎧

−−−

⎟

⎠

⎞

⎜

⎝

⎛

∑

σπσ

σμ

(52)

Desta forma, a distribuição de probabilidade conjunta a posteriori é dada por

(

)

(

)

(

)

(

)

(

)

(

)

222222

|SS,,|ZZS

SSS

ppppp|,,,p

σσμσσμσσμ

∝ . (53)

Para o procedimento de inferência são necessárias as condicionais

completas para parâmetros de

(

)

Sμ

,,,

σσ

=Θ dadas por:

()

(

)

(

)

S,μ,|ZZ

σμμ

pp,|p ∝Θ

−

()

⎭

⎬

⎫

⎩

⎨

⎧

−−−∝

∑

SZe

ii)

(

)

(

)

(

)

S,μ,|ZZ

σσ

p|Sp,|Sp

∝Θ

−

()

⎪

⎭

⎪

⎬

⎫

⎪

⎩

⎪

⎨

⎧

⎥

⎦

⎤

⎢

⎣

⎡

−−+−−∝

∑

iiSi

SZSe

iii)

(

)

(

)

(

)

222

S,μ,|ZZ

σσσ

pp,|p ∝Θ

−

()

⎭

⎬

⎫

⎩

⎨

⎧

−−−

⎭

⎬

⎫

⎩

⎨

⎧

−∝

∑

−+−

/na

SZe

()

⎭

⎬

⎫

⎩

⎨

⎧

−−+−

⎭

⎬

⎫

⎩

⎨

⎧

−∝

∑

++−

/na

SZbe

σσ

iv)

()

() ( )

∏

−

∝Θ

SSS

pp,|p

,SZ

σσσ

() ()

()

⎭

⎬

⎫

⎩

⎨

⎧

−−

⎪

⎭

⎪

⎬

⎫

⎪

⎩

⎪

⎨

⎧

−∝

∑∑∑

===

−

⎟

⎠

⎞

⎜

⎝

⎛

+−

()

⎪

⎭

⎪

⎬

⎫

⎪

⎩

⎪

⎨

⎧

⎟

⎠

⎞

⎜

⎝

⎛

−+−

⎪

⎭

⎪

⎬

⎫

⎪

⎩

⎪

⎨

⎧

−∝

∑

⎟

⎠

⎞

⎜

⎝

⎛

++−

/na

222

σσσ

Para a implementação do modelo foi utilizado o software WinBUGS, o

código utilizado bem como alguns exemplos de resultados para as cadeias geradas são

apresentados nos apêndices A, B, C e D. Utilizou-se uma cadeia de 32000 iterações onde as

22000 primeiras foram descartadas. A análise de convergência foi realizada através do

diagnóstico de Gelman e Rubin e das trajetórias das cadeias geradas. Isto é necessário, pois

caso não se tenha indicação de convergência o modelo deve ser revisto antes de adotado para

a aplicação a que se destina. Para mostrar um exemplo de convergência é apresentada nas

Figuras 28 e 29 a trajetória das cadeias geradas para os parâmetros

S , respectivamente.

Ao longo das iterações, os valores gerados mostram aleatoriedade e as diferentes cadeias se

sobrepõem evidenciando a convergência.

Figura 28 – Trajetória das Cadeias geradas para parâmetro .

100

Figura 29 – Trajetória das Cadeias Geradas para o efeito aleatório

S .

A Figura 30 apresenta os resultados de altura média a posteriori (em metros)

de cada região, com o algoritmo amostrador de Gibbs. Nessa Figura é possível visualizar a

discriminação dos objetos existentes na quadra urbana, como por exemplo, telhados, árvores

etc. As regiões com tonalidade preta representam os objetos mais altos na cena e as de

tonalidades mais claras estão associadas às regiões baixas.

O processo de fusão bayesiana visa encontrar similaridades probabilísticas

entre sub-regiões pré-detectadas, resultando em regiões com alta compatibilidade com os

objetos físicos. A Figura 30 mostra uma melhoria significativa no nível de fragmentação.

Pode-se notar visualmente que agora os quadrantes correspondentes ao objeto possuem

característica similar, isto é, mesma altura.

101

Figura 30 – Ilustração da altura média a posteriori (em metros) de cada região da cena.

3.1.4 Extração dos contornos das regiões altas

As duas últimas seções apresentaram os métodos utilizados para a detecção

das regiões altas. Esta seção mostra os procedimentos utilizados para obter os contornos

destas regiões. A fim de possibilitar o uso de técnicas conhecidas (como o detector de Canny

e métodos de vetorização e poligonização), para as quais se dispõe inclusive de

implementações computacionais, optou-se por processar o resultado obtido anteriormente a

fim de se obter uma imagem binária. Para gerar esta imagem, inicialmente é necessário

conhecer a resolução espacial e as dimensões da imagem (altura e largura), ou seja, o número

de linhas (L) e colunas (C). A próxima etapa consiste no estabelecimento de uma relação

matemática entre a posição de um pixel na imagem C)(L, e sua respectiva posição no MDE

segmentado, representada pelas coordenadas N)(E, . Esse procedimento é feito refletindo-se o

eixo N e transladando o MDE de tal forma que o canto superior esquerdo do retângulo que o

delimita corresponda ao ponto de coordenadas (0,0) na imagem. Além disso, deve-se aplicar

102

o fator de escala estabelecido pela resolução espacial da imagem. As formas analíticas das

equações utilizadas são:

emax

rN)(NL

−

, (54)

emin

r)E(EC

−

, (55)

onde:

 (L,C): são as coordenadas de um pixel na imagem binária;

 N)(E, as coordenadas planimétricas de um ponto no MDE segmentado;

 )N,(E

maxmin

coordenadas do canto superior esquerdo do retângulo envolvendo o

MDE segmentado;



r a resolução espacial da imagem.

Vale notar que se r

for tomado como igual ao espaçamento da grade do

MDE segmentado, os valores obtidos para L e C serão inteiros. Essa opção é desejável porque

permite posteriormente transformar, mediante as equações 54 e 55, cada pixel da imagem

binária no correspondente ponto da grade do MDE, sem qualquer perda de precisão. A

geração da imagem binária é realizada através da varredura da grade da imagem binária,

atribuindo-se 0 (zero) para os pixels correspondentes às regiões altas e 1 (um) para os demais

pixels. A Figura 31 ilustra uma imagem binária gerada a partir dos resultados obtidos na etapa

de fusão Bayesiana de regiões.

Figura 31 – Imagem binária com as regiões altas.

103

Como as bordas dos objetos altos (tais como, edifícios, árvores etc.) na

imagem binária são degraus perfeitos, qualquer detector de bordas possibilitaria a detecção

dos pixels de contorno com alta qualidade. Em outras palavras, um algoritmo para

perseguição de contornos poderia ser diretamente aplicado aos dados acima. As limitações se

referem à própria complexidade das formas dos objetos detectados. Por exemplo, os objetos

contíguos são, às vezes, extraídos com um único contorno. O detector utilizado foi o de

Canny, uma vez que se dispunha de rotina computacional para este detector.

O resultado do processo de detecção de bordas utilizando o operador de

Canny é também uma imagem binária com bordas afinadas (com espessura de 1 pixel), onde

os pixels de borda recebem valor 0 (zero) e o fundo o valor 1 (um) (Figura 32).

Figura 32 - Imagem de bordas obtida pelo detector de bordas de Canny.

Após a detecção das bordas correspondentes aos contornos de regiões

existentes na imagem, é necessário organizar logicamente as respectivas cadeias de bordas.

Portanto, a imagem de bordas previamente obtida deve passar por processamentos posteriores

a fim de se obter representações adequadas para os contornos das regiões. A representação

dos contornos de telhados em polígonos é vantajosa em dois aspectos: a compacidade e a

simplicidade. Entretanto, para organizar o mapa de bordas dessa forma, são necessárias as

etapas de vetorização e poligonização. Estas técnicas foram brevemente descritas no Capítulo

104

3.2 Extração automática de contornos de telhados de edifícios

A segunda etapa da metodologia consiste na separação dos telhados entre os

objetos altos extraídos na primeira etapa da metodologia. As regiões altas são agora

estruturadas segundo um RAG, onde cada nó do RAG corresponde a uma região alta. Nesta

etapa é utilizada uma abordagem baseada em MRF. Essa modelagem deve propiciar a

obtenção apenas dos contornos correspondentes aos telhados. Vale ressaltar que, como é

necessário o cálculo de vários atributos com base no MDE, é necessário que os contornos

obtidos na primeira etapa, representados no referencial de uma imagem binária, devem ser

transformados para o referencial do MDE, via inversa das Equações 54 e 55. Nesse

referencial, apenas são retidos os contornos (E, N) referentes aos objetos altos, juntamente

com as informações de altura média de cada região. O restante das informações do referencial

do MDE é considerado como fundo.

A análise de cada região, dadas as medidas de alguns atributos realizadas

nas regiões do MDE, por hipótese obedece a um MRF. Assim, a construção do MRF envolve

a definição de funções apropriadas e o problema de análise é resolvido a partir da estimativa

MAP. A partir do conhecimento a priori do objeto de interesse é possível realizar a extração

automática de contornos de telhados. A fim de ilustrar esse processo é apresentado a seguir

(Figura 33) um fluxograma das etapas necessárias para resolver o problema de extração de

telhados.

105

Objetos altos

Caracterização do conhecimento

sobre contornos de edifícios

Definição da função de energia

Estabilidade

Sim

Contornos de telhados

extraídos

Minimização da função de

energia

Não

Figura 33 – Fluxograma simplificado do processo de extração automática de contornos de telhados.

3.2.1 Caracterização do conhecimento sobre contornos de telhados

Em uma quadra urbana existe um conjunto de objetos variados, onde a

heterogeneidade geralmente é elevada. Isto implica que mais detalhes sobre o objeto de

interesse devem ser explorados para auxiliar no seu reconhecimento. Os telhados possuem

algumas propriedades de interesse, sendo elas, geométricas, ou seja, as que estão relacionadas

com a área, o perímetro, a retangularidade, direção angular etc., e as relações contextuais nas

quais o objeto telhado se relaciona com outros objetos presentes na cena (por exemplo,

ângulos entre eixos de objetos).

Para definir a clique, inicialmente assumiu-se que os objetos altos

()

n,...,i,R

, imersos num fundo F, são modelados como MRF. A vizinhança

, isto é,

das regiões

vizinhas de

()

ji≠

, é definida na forma,

106

(

)

{

}

rR,Rdist|R

ijjr,R

≤=

, (56)

onde a função dist é dada pela distância euclidiana entre os centros de massa de dois objetos

analisados

(

)

R,R

e r é a distância máxima permitida entre

. A Figura 34 mostra um

exemplo de vizinhança (

r,R

), onde todas as regiões dentro do raio máximo são consideradas

vizinhas da região i. Na Figura 34, os pontos representam o centro de massa dos objetos altos.

. . . .

. . . . .

. . .

. . . .

r,i

Figura 34 – Exemplo de vizinhança.

Uma vez estabelecido o critério de vizinhança

(

)

(

)

rR,Rdist

≤ , define-se

uma vizinhança individual e, a partir desta definição, tem-se o sistema de vizinhança

() ()

[]

R,...,R

. Os conceitos de clique individual C e de coleção de cliques

(

)

(

)

,GC

seguem o formalismo apresentado no Capítulo 2.

A construção da função de energia ( | , )UI F

depende substancialmente do

conhecimento a priori sobre as propriedades do objeto telhado. O conhecimento a priori a

respeito do objeto de interesse denotado por

é muito importante na análise de imagem, pois

impõe uma forte suposição sobre o que se espera da cena antes de aplicar o algoritmo para

realizar a análise. A caracterização de

implica em estabelecer valores nominais para os

atributos que são considerados importantes para decisão em uma análise. Por exemplo, a área

mínima de um edifício pode ser estabelecida como sendo 30m

. Já os valores nominais para o

conjunto (F) de atributos podem ser medidos no polígono envolvente que contém cada objeto

individual e entre polígonos caracterizando a relação contextual entre os objetos. Para tanto é

necessário estabelecer um conjunto (F

) de atributos sobre a clique. O conjunto (F) de

atributos é expresso por,

107

{| (,)}

FF cCG

=∀∈ ,

onde

{ ,..., }

ccc

FFF= ,

é o conjunto de q atributos medidos sobre a clique individual

.c Cabe ressaltar que esses q

atributos seriam os mesmos usados na caracterização do conhecimento a priori

, só que

nesse caso eles assumem valores que caracterizam os objetos de interesse.

Os atributos para a clique de primeira ordem utilizados neste trabalho foram

a área e a retangularidade. Esses atributos podem ser expressos matematicamente segundo as

propriedades geométricas do objeto. O primeiro atributo baseia-se na área (A) do polígono

envolvendo o objeto individual e é definido matematicamente pela fórmula de Gauss dada

por:

∑∑

−

iiii

NENE

A , (57)

onde ( , )EN correspondem às coordenadas planimétricas de um ponto no referencial do

MDE.

Este atributo permite, por exemplo, que objetos pequenos como caixas

d’água, cuja área é relativamente menor em relação aos telhados, possam ser eliminados da

análise. Para que isso seja possível, a Equação de energia (Seção 3.2.2) deve penalizar

pequenas áreas.

O segundo atributo, retangularidade (R), é obtido através do ângulo formado

pela direção principal e secundária do objeto. Para obter o eixo principal de um objeto são

calculadas todas as direções dos segmentos de reta de um polígono representando o objeto.

Para obter a direção mais freqüente que é correspondente à direção do eixo principal, faz-se

uma divisão setorial, particionando o círculo trigonométrico em 24 setores de 15 graus

(Figura 35). Cada setor é representado pelo seu valor angular central (por exemplo, o setor de

amplitude [345º; 360º] é representado pelo ângulo 372,5º).

108

Figura 35 – Divisão setorial do circulo trigonométrico.

A direção do eixo principal e secundário de um objeto é calculada na forma

que segue:

1 – calcular a direção e comprimento de cada segmento de reta do polígono que representa o

objeto;

2 – inicializar cada setor com valor nulo;

3 – para uma dada direção de um dado segmento de reta, verificar qual setor que a contém,

adicionando a este setor o valor inteiro do comprimento do respectivo segmento de reta;

4 – repetir o passo 3 para todos os segmentos de reta do polígono;

5 – identificar as direções dos eixos principal e secundário como sendo a primeira e a segunda

direção mais freqüente, respectivamente.

O resultado do algoritmo acima poderia ser representado na forma do

histograma da Figura 36. Nesse caso, o resultado obtido para a direção do eixo principal foi

7,5º e a direção do eixo secundário foi de 247,5º. Este resultado foi obtido a partir de um

contorno de um objeto real, que no caso é um telhado.

109

105

120

135

150

165

180

195

210

225

240

255

270

285

300

315

330

345

Setores

Frequência

Figura 36 – Histograma de freqüência.

A retangularidade é expressa matematicamente por,

senR =

(58)

onde,

é o ângulo entre os eixos principal e secundário.

O atributo R beneficia os objetos com formas geométricas regulares, onde

prevalecem os ângulos retos nos vértices do contorno. O valor ótimo para R é 1 (um), sendo

este um dos valores a ser incluído no conhecimento

. O valor de R é 1 (um) em situações

ideais, quando

90=

270=

O terceiro atributo baseia-se em cliques de segunda ordem. Sendo

ângulo entre as direções principais de dois objetos

(

)

R,R , define-se o seguinte atributo de

relacionamento espacial,

)2(),(

ijji

senRR

. (59)

110

Esse atributo possibilita a verificação do paralelismo ou perpendicularismo

entre objetos, pois se

j,i

(objetos com eixos principais paralelos) ou se

90=

j,i

(objetos com eixos principais perpendiculares),

0=Φ )R,R(

. Portanto, no conhecimento

deve ser assumido que o valor ótimo para este parâmetro é 0 (zero)

Em relação às cliques, foram utilizadas neste trabalho as de primeira e

segunda ordem. A clique de primeira ordem consiste de uma lista de objetos altos com

atributos (área e retangularidade) caracterizando os objetos individualmente. Já a clique de

segunda ordem é composta de uma lista de objetos, relacionando-se aos pares, caracterizadas

por atributos relacionais (no caso o atributo dado pela Equação 59).

3.2.2 Definição da função de energia

A análise de objetos usando a abordagem MRF tem como princípio a

minimização da função de energia. Para o problema em questão, espera-se que para um

determinado MDE a solução seja ótima, isto é, que seja obtida uma configuração de contornos

de telhados, correspondente ao valor mínimo da função de energia. Entretanto, essa análise

ótima depende de como a função de energia é definida. Para a definição da função de energia

é necessário definir a função potencial. Definições de função potencial de primeira e segunda

ordem, assumida na metodologia desenvolvida, foram descritas na Seção 3.2.1. A forma geral

da função potencial de segunda ordem

(

)

,f|xV

é dada por,

()

κακακ

,f|xS,f|xB),f|x(V

r,GCc

rccr

∑∑∑

==∈

, (60)

onde

c representa uma clique individual de primeira e segunda ordem,

q é o número de

atributos para cliques de primeira ordem, t

é a quantidade de atributos para cliques de

segunda ordem,

são pesos,

representa a função base correspondente a clique de

primeira ordem e ao atributo r,

,ij

é a vizinhança da posição ( , )ij e

aparece no

segundo termo e é responsável pela modelagem de contexto para a clique de segunda ordem .

111

A função de energia utilizada neste trabalho teve como inspiração o trabalho

desenvolvido por Krishnamachari e Chellappa (1996). Eles propuseram a Equação de energia

E dada por,

E=-

∑

−

)p(

|sen(2 )|

ij ij

ijN

=∈

∑∑

=∈

−

iNj

ijji

Dpp

()()

[]

()

6111

iiii

plnpplnp −−+

∑

onde:

são pesos que dão a importância relativa para cada termo de energia; d

o comprimento da feição reta l

; p

é uma medida que dá o grau de compatibilidade de l

com

uma aresta de um telhado;

é o ângulo entre as feições retas l

e l

; D

é a distância entre os

extremos mais próximos das feições retas l

e l

Neste trabalho, Krishnamachari e Chellappa (1996) obtêm ao final do

processo de minimização, isto é, com E mínimo, uma configuração ótima das feições retas na

forma de telhados de edifícios na imagem aérea. A Equação de energia de Krishnamachari-

Chellapa (Equação 60) foi modificada para possibilitar a extração de contornos de telhados, a

partir de contornos de objetos altos previamente extraídos, ficando,

()()

[]

∑∑∑∑∑

==∈==

−−+++

−

+−=

iiii

i),G(j

ijji

plnpplnp)(senpp

)p(

)r(U

1111

112

γθωβα

(62)

onde:

são pesos que dão a importância relativa para cada termo das funções de

energia; r

é a medida de retangularidade do objeto R

; A

é a área do objeto R

; p

(ou p

) é

uma medida individual de compatibilidade de R

(ou R

) com um contorno de telhado;

é o

ângulo entre as direções dominantes dos objetos R

e R

Minimizar a função de energia U (Equação 62) implica em minimizar

simultaneamente os quatro termos de energia de U. Notar que o primeiro termo favorece

feições retangulares, pois feições com essas características têm a retangularidade próxima de

1. O segundo termo de energia favorece feições com áreas maiores, pois é inversamente

proporcional à área A

O terceiro termo de energia favorece o agrupamento de telhados, isto

porque os eixos principais dos telhados são paralelos ou perpendiculares, isto é, sen(2 x 0

) =

sen(2 x 90

) = 0. O último termo da função de energia é a Equação de entropia, que força as

variáveis p

a assumir no final do processo de minimização valores nulos ou unitários. O

112

primeiro, segundo e quarto termo da função de energia são definidos com base em cliques de

primeira ordem. Já o terceiro termo refere-se a cliques de segunda ordem. No final do

processo de minimização, isto é, quando U for mínimo, obtém-se uma configuração ótima dos

contornos que são telhados de edifícios. O valor final de p

para contornos de telhados é um,

enquanto que para as outras feições é zero. Isso significa que a solução final da Equação de

energia via algoritmo SA pode ser representada como na Figura 37.

n-1

Trajetória realizada

Figura 37 – Representação da solução da Equação de energia.

113

4 RESULTADOS E ANÁLISES

4.1 Considerações iniciais

Este capítulo tem por finalidade apresentar os resultados obtidos com a

metodologia de extração automática de contornos de telhados, bem como os materiais e

equipamentos utilizados para o desenvolvimento desse trabalho.

Conforme descrito no Capítulo 3, os dados de varredura a laser utilizados

neste trabalho são as coordenadas de pontos regularmente distribuídos, isto é, um MDE obtido

após o processo de interpolação. É importante ressaltar que na etapa de segmentação foram

realizados testes com a imagem de intensidade, mas devido à variabilidade de reflexão de

cada objeto, foi praticamente impossível obter bons resultados com esse tipo de informação.

Os resultados obtidos com a metodologia proposta foram contornos locais

representando telhados. A análise foi realizada visual e numericamente, tendo por base

comparações entre os resultados obtidos com o método de extração e os correspondentes

resultados obtidos manualmente. Estes últimos foram obtidos através de digitalização manual

dos contornos de telhados nas imagens de intensidade fornecidas por varredura a laser da

região teste e foram utilizados como dados de referência para a avaliação da metodologia

proposta. Esses dados encontram-se no mesmo referencial, logo a análise visual foi realizada

a partir da comparação entre os grupos de contorno (extraído e manual), simultaneamente,

sobre as imagens de intensidade. Ambos os grupos de contornos foram comparados

numericamente, consistindo em obter as porcentagens de falsos positivos (extração errada),

falsos negativos (não extração) e a razão de extração de edifícios (REE), proposta por Ruther,

Martine e Mtalo (2002) e dada pela seguinte formulação

100×

EEEC

REE , (63)

onde

EC é o número de estruturas identificadas corretamente pelo método de extração e

EE é o número de estruturas identificadas erroneamente pelo método de extração.

114

Outro indicador de qualidade, proposto por Ruther, Martine e Mtalo (2002),

foi adaptado e utilizado neste trabalho. Trata-se da completeza de área do contorno de

telhado, obtida em função das áreas dos contornos extraídos e dos respectivos contornos de

referência obtidos por um operador,

1001 ×

⎪

⎭

⎪

⎬

⎫

⎪

⎩

⎪

⎨

⎧

⎟

⎠

⎞

⎜

⎝

⎛

−

−=

CA , (64)

onde

CA é o indicador de completeza de área do contorno de edifício;

A é a área do contorno de telhado extraída pelo operador;

B é a área do contorno de telhado obtida pelo método de extração.

McKeown et al. (2000) sugere que uma sobreposição de 50% é adequada

para assumir que o telhado foi detectado. Cabe ainda ressaltar que as porcentagens de falsos

positivos (extração errada) e a REE são complementares (a soma de ambos é 100%), e,

portanto, neste caso optou-se apenas pela utilização da REE.

4.1.1 Recursos computacionais

A metodologia de extração automática de contornos de telhados foi

implementada em linguagem C++ utilizando o compilador Borland C++ Builder 4 e o

software WinBUGS 1.4 no sistema operacional Windows XP. O computador utilizado no

trabalho foi um AMD Dual Core 4600, com 3GB de memória RAM e 1 disco rígido com

capacidade total de 200GB. Outros softwares contribuíram no desenvolvimento do trabalho,

entre eles se destaca o Surfer 8 (versão DEMO) e o MicroStation V8.

115

4.1.2 Dados utilizados no trabalho

Foram utilizados neste trabalho os dados brutos cedidos pelo LACTEC.

Esses dados estão em formato de arquivo texto, divididos por faixa de vôo e retorno de pulso

laser, ou seja, primeiro e último pulso. O arquivo de coordenadas (exemplificado na Figura

38) se refere às coordenadas E (primeira coluna de dados), N (segunda coluna de dados), h

(terceira coluna de dados) e I (quarta coluna de dados).

Figura 38 – Parte de um Arquivo de coordenadas.

Além dos conjuntos de dados no referencial SAD69, foram cedidos pelo

LACTEC a imagem de intensidade gerada a partir da resposta de intensidade dos alvos,

correspondente à área teste. Os testes foram realizados usando recortes de dados,

considerando as áreas de interesse para a avaliação da metodologia desenvolvida.

116

A imagem de intensidade (Figura 39) foi utilizada na escolha das áreas teste

e na avaliação dos resultados obtidos através do método de extração automática de contornos

de telhados. Essa imagem é georreferenciada e foi obtida com o a informação do retorno do

primeiro pulso laser. Esta imagem possui 8239 linhas e 9751 colunas.

Figura 39 – Imagem de intensidade de retorno do pulso laser.

A Figura 40 mostra a sobreposição de um conjunto de dados,

correspondente a uma faixa de vôo, na imagem de intensidade. Essa visualização dos dados

sobre a imagem foi de suma importância na escolha das áreas teste, pois possibilitou a seleção

de áreas com graus de complexidade diferentes para o processo de extração.

117

Figura 40 – Dados brutos (representados na cor branca) correspondentes a uma faixa de vôo,

sobrepostos à imagem de intensidade.

O arquivo de dados correspondente à imagem mostrada na Figura 40 possui

3.874.395 milhões de valores correspondentes ao retorno do primeiro pulso referentes a

primeira faixa de vôo.

4.2 Aspectos computacionais

Para a realização da metodologia de extração automática de contornos de

telhados foram desenvolvidos programas computacionais que são utilizados desde a etapa de

preparação dos dados até a etapa final de extração de contornos de telhados. Foram utilizados

118

programas pré-existentes, como por exemplo, o detector de bordas de Canny (JAIN,

KASTURI, e SCHUNCK, 1995) e outro de vetorização e poligonização (DAL POZ, 2002).

A seqüência mostrada a seguir apresenta todo o procedimento utilizado para

a realização da metodologia de extração automática de contornos de telhados, dando ênfase

aos aspectos computacionais envolvidos em cada etapa.

1 - Escolha da área teste: este procedimento é realizado no software MicroStation V8, onde

são sobrepostos os dados brutos sobre a imagem de intensidade e realizada a escolha da área

desejada, bem como a definição dos limites da área teste.

2 – Seleção das coordenadas referentes a área teste: a seleção é feita utilizando um programa

desenvolvido em linguagem C++, tendo por base os limites pré-definidos da área de interesse.

3 – Interpolação dos dados: Os dados brutos da área teste são interpolados no software Surfer,

gerando uma malha regular. O método de interpolação utilizado foi o vizinho mais próximo.

4 – Realização da segmentação via algoritmo quadtree: segmentação inicial dos dados

utilizando a estrutura quadtree desenvolvida em linguagem C++. Nesta etapa são obtidos os

dados de entrada para o software WinBUGS.

5 – Fusão Bayesiana de regiões: o software WinBUGS é utilizado para fornecer os resultados

referentes aos objetos altos existentes na área teste.

6 – Transformação de coordenadas: Nesta etapa foi utilizada uma rotina implementada em

linguagem C++, que realiza a transformação de coordenadas do referencial do MDE para o

referencial da imagem binária.

7 – Detecção de bordas: foi utilizada uma rotina computacional em C++ do algoritmo de

Canny.

8 – Vetorização e Poligonização: foram utilizados programas pré-existentes de vetorização e

poligonização desenvolvidos em linguagem C++.

9 – Extração de contornos de telhados: foi utilizado um programa desenvolvido em linguagem

C++ para realizar a extração de contornos de telhados.

10 – Visualização dos resultados: o resultado final pode ser visualizado no referencial da

imagem binária ou no referencial do MDE. Neste último caso é utilizado o software

MicroStation V8.

119

4.3 Experimentos e discussões

Para verificar a viabilidade da metodologia desenvolvida foram realizados

cinco experimentos com áreas testes distintas. A primeira área teste compreende uma região

onde se tem apenas uma edificação mas, no entanto, se trata de uma edificação de grande

porte, possuindo nas adjacências áreas verdes, estacionamentos, ruas, calçadas etc. (Figura

41). Alguns aspectos, como a presença de uma única edificação, favorecem a extração. Por

outro lado, o entorno dificulta o processo de extração, pois existem árvores que podem ser

extraídas na primeira etapa da metodologia e que na segunda etapa devem ser eliminadas do

processo de extração. Outra dificuldade desta cena é o formato irregular da edificação.

Figura 41 – Área teste 1.

120

Figura 42 – Visualização tridimensional do MDE referente à área teste 1.

A visualização tridimensional do MDE (Figura 42) é um recurso útil, pois

permite visualizar melhor os objetos existentes na cena. Neste caso, pode-se ter uma visão

mais realística do entorno dos edifícios, como por exemplo, os estacionamentos, que na

imagem de intensidade (Figura 41) possui tons de cinza semelhantes aos da edificação.

Quando se utiliza o recurso de visualização tridimensional do MDE, torna-se possível

distinguir visualmente os objetos existentes na área teste.

A segunda área teste é ilustrada a partir da imagem de intensidade (Figura

43) e da visualização tridimensional do MDE (Figura 44). Essa área teste possui

características semelhantes à da primeira área teste, visto que se trata de um edifício isolado,

rodeado de área verde, estacionamentos etc.. Os aspectos favoráveis e desfavoráveis ao

processo de extração são semelhantes aos da área teste 1.

121

Figura 43 – Área teste 2.

Figura 44 – Visualização tridimensional do MDE referente à área teste 2.

Novamente a visualização tridimensional ilustrada na (Figura 44) permite

uma discriminação visual dos objetos existentes na cena.

122

Para ilustrar a área teste 3, novamente são utilizadas a imagem de

intensidade (Figura 45) e a visualização tridimensional do MDE (Figura 46). Esta cena

favorece a extração de edifícios já que o mesmo se encontra isolado de outras edificações.

Figura 45 – Área teste 3.

Figura 46 – Visualização tridimensional do MDE referente à área teste 3.

123

A Figura 47 mostra a área teste 4 e a Figura 48 sua visualização

tridimensional. Esta área teste apresenta alta complexidade para o processo de extração. Nessa

área existem edifícios de maior porte e também telhados de casas. Há também a presença de

árvores e outros objetos, fatores que desfavorecem o processo de extração.

Figura 47 – Área teste 4.

Figura 48 – Visualização tridimensional do MDE referente à área teste 4.

124

A Figura 48 permite uma visualização mais detalhada das regiões referentes

aos objetos altos. As regiões pertencentes a estacionamentos, pátios e quintais que possuem

tons de cinza semelhante aos das edificações, apresentam-se com boa discriminação visual.

A área teste 5, representada pela imagem de intensidade (Figura 49) e pela

visualização tridimensional do MDE (Figura 50), é um exemplo de uma área urbana com alta

complexidade. Esta área apresenta prédios, estacionamentos e outros objetos que dificultam o

processo de extração, pois ainda na primeira fase da metodologia torna-se difícil segmentar

regiões relacionadas com os objetos existentes na cena. A visualização tridimensional

proporciona uma boa verificação visual dos objetos existentes na área, fato que auxilia na

análise visual do método de extração automática de contorno de telhados.

Figura 49 – Área teste 5.

125

Figura 50 – Visualização tridimensional do MDE referente à área teste 5.

4.3.1 Primeiro experimento

Na área teste 1 a cena envolvida não é de grande complexidade, visto que

somente um telhado está presente. No entanto, a forma irregular do edifício pode acarretar em

algumas dificuldades, principalmente se a etapa inicial de segmentação não fornecer um

resultado satisfatório. Os resultados obtidos com a metodologia de extração automática de

contornos de telhados de edifícios são mostrados na Figura 51.

126

(a) (b)

(e)

Figura 51 – Imagens resultantes do método de extração de contornos de telhados aplicado à área teste

1. (a) área teste escolhida para a aplicação do método de extração; (b) resultado obtido após a fusão

Bayesiana de regiões; (c) imagem binária das feições detectadas; (d) detecção das bordas da imagem

binária; (e) resultado da extração de contornos de telhados no referencial da imagem binária.

127

A Figura 51(d) mostra o resultado obtido com a extração de contornos de

feições altas. Pode-se verificar nesta Figura que a fusão bayesiana extraiu um único contorno

de telhado. No entanto, verifica-se a dificuldade de estabelecer visualmente (Figura 51(a)) a

presença de 1 (um) ou 2 (dois) edifícios na cena.

Para uma análise visual mais consistente, a Figura 52 mostra os contornos

extraídos com a metodologia proposta (em vermelho) e os contornos de referência (em azul)

sobrepostos na imagem de intensidade. Pode-se verificar visualmente que esse contorno

corresponde ao telhado existente na área teste.

Figura 52 – Visualização do contorno extraído e do contorno de referência.

Para comparar numericamente os resultados obtidos, considerou-se a

existência de apenas um telhado na área teste, resultando na extração manual de apenas um

contorno (em azul) na Figura 52. A Tabela 2 mostra os resultados numéricos obtidos com o

método de extração.

128

Tabela 2

– Análise numérica dos resultados obtidos com o método de extração automática de

contornos de telhados.

Falsos Negativos REE CA

Porcentagem 0% 100% 94%

Convém salientar que o parâmetro numérico de falso positivo e a REE são

complementares (isto é, falsos positivos + REE = 100%), logo optou por utilizar apenas a

REE neste trabalho. Neste experimento não houve falsos positivos, logo a REE foi máxima,

fato que credencia o método de extração neste experimento. A Tabela 2 mostra também que

não ocorreu nenhum falso negativo. Outro indicativo importante foi a inexistência de falsos

negativos e a alta CA, visto que, a região de contorno extraída tem uma sobreposição de 94%

em relação à região de contorno de referência.

O deslocamento dos contornos extraídos foi um problema comum a todos os

experimentos. Como este deslocamento é sistemático, ele pode estar relacionado com o

fenômeno de sombra (ausência de dados resultante do primeiro retorno do pulso laser)

combinado com a interpolação dos dados realizada com o método do vizinho mais próximo.

Outro problema comum a todos os experimentos foi a dificuldade em medir os contornos de

referência na imagem de intensidade. Visualmente esta imagem é muito confusa e dificulta

até mesmo para o operador humano a identificação correta dos contornos de telhados.

4.3.2 Segundo experimento

A área teste escolhida para a realização deste experimento, tem como

característica uma menor complexidade em relação à área teste usada no experimento

anterior. A Figura 53 mostra os resultados obtidos com a metodologia de extração automática

de contornos de telhados.

129

(a) (b)

(e)

Figura 53 – Imagens resultantes do método de extração de contornos de telhados aplicado à área teste

2. (a) área teste escolhida para a aplicação do método de extração; (b) resultado obtido após a fusão

Bayesiana de regiões; (c) imagem binária das feições detectadas; (d) detecção das bordas da imagem

binária; (e) resultado da extração de contornos de telhados no referencial da imagem binária.

130

Na Figura 53 pode-se verificar que a fusão bayesiana extraiu inúmeros

objetos altos, incluindo os dois contornos de telhados de edifícios. Para uma análise visual

mais consistente os contornos extraídos (em vermelho) e os de referência (em azul) foram

sobrepostos a imagem de intensidade (Figura 54).

Figura 54 – Visualização do contorno extraído e do contorno de referência.

A Figura 54 mostra que o telhado 2 foi extraído mesmo possuindo um porte

bem menor que o telhado 1, dada a forma que a Equação de energia foi definida (Equação 62)

objetos de área relativamente menor podem ser descartados. Entretanto, fica evidente que a

situação é bem favorável para os atributos de relacionamento espacial e de retangularidade,

beneficiando a extração dos dois telhados existentes na cena. Pode-se perceber que ambos os

contornos extraídos também estão sistematicamente deslocados em algumas partes em relação

aos correspondentes contornos de referência. Apesar disso, pode-se considerar que os

resultados foram satisfatórios.

Numericamente, como poderá ser verificado a seguir, as análises visuais são

confirmadas tendo por base os contornos extraídos e os contornos de referência. Os

parâmetros numéricos de qualidade para ambos os telhados foram calculados e apresentados

na Tabela 3.

Telhado 1

Telhado 2

131

Tabela 3

– Análise numérica dos resultados obtidos com o método de extração automática de

contornos de telhados.

Falsos Negativos REE CA (telhado 1) CA (telhado 2)

Porcentagem 0% 100% 91% 97%

O parâmetro de REE atingiu, como no experimento anterior, o valor ótimo,

isto é, 100%. Em outras palavras, o método não extraiu nenhum falso positivo. Um indicativo

importante para credenciar a utilização do método é o parâmetro CA que neste caso se

manteve alta para os dois telhados extraídos. O telhado 1 possui uma região extraída com uma

sobreposição em relação a respectiva área de referência de 91%, sendo que o telhado 2 possui

para o mesmo indicador o valor de 97%. Entretanto, sabe-se que as diferenças de áreas em

relação aos valores ótimos (100%) são devidas à qualidade aproximada dos contornos

extraídos.

4.3.3 Terceiro experimento

Na terceira área teste o edifício apresenta-se de forma isolada, o que é

altamente favorável para a metodologia. A Figura 55 mostra os resultados obtidos com a

metodologia desenvolvida.

132

(a) (b)

(b) (d)

(e)

Figura 55 – Imagens resultantes do método de extração de contornos de telhados aplicado à área teste

3. (a) área teste escolhida para a aplicação do método de extração; (b) resultado obtido após a fusão

Bayesiana de regiões; (c) imagem binária das feições detectadas; (d) detecção das bordas da imagem

binária; (e) resultado da extração de contornos de telhados no referencial da imagem binária.

133

Verifica-se na Figura 55(d) a presença de um falso contorno (destacado por

flechas) correspondente aos limites dos dados. Esses contornos causam falsos positivos de

freqüência no método do círculo trigonométrico setorizado. A utilização de tais informações

poderia ocasionar a extração de um falso positivo, visto que os eixos principais e secundários

ficariam bem definidos e o atributo de retangularidade indicaria o objeto como sendo um

telhado. No entanto, os falsos contornos são facilmente identificados e assim não são

utilizados no cálculo dos atributos, evitando que os mesmos interfiram nos resultados.

Novamente, a fusão bayesiana separou vários objetos altos, inclusive o objeto com contorno

do limite dos dados.

A Figura 56 mostra o contorno extraído (em vermelho) e o contorno de

referência (em azul) que foram utilizados para o cálculo dos parâmetros de qualidade.

Figura 56 – Visualização dos contornos extraído e de referência.

Na Figura 56 nota-se a presença de apenas um objeto e este foi extraído

corretamente. O resultado dos indicadores de qualidade é mostrado na Tabela 4.

Tabela 4

– Análise numérica dos resultados obtidos com o método de extração automática de

contornos de telhados.

Falsos Negativos REE CA

Porcentagem 0% 100% 95%

134

Neste experimento os indicadores de qualidade credenciam a utilização da

metodologia para a extração de contornos de telhados isolados. Não houve falsos negativos e

a REE obteve o valor ótimo. Desta forma, também não ocorreram falsos positivos. Já o

parâmetro CA, novamente se manteve muito bom. Este último indicador mostrou que a região

de telhado extraído tem 95% de sobreposição em relação à região de referência.

4.3.4 Quarto experimento

Neste experimento foi utilizada uma área teste que apresenta maior

quantidade de telhados, ou seja, 6 (seis) edifícios isolados, sendo que 3 (três) deles estão

alinhados e praticamente ligados, 2 (dois) outros estão isolados e o último é um edifício

menor rodeado de vegetação. Cabe ressaltar que, diferente deste experimento, os

experimentos realizados até aqui apresentavam edifícios isolados. Na Figura 57 é mostrada a

área teste selecionada e as imagens resultantes de cada etapa desenvolvida no processo,

ressaltando que o resultado final é um arquivo de coordenadas no referencial do MDE

sobreposto a imagem de intensidade.

135

(a) (b)

(e)

Figura 57 – Imagens resultantes do método de extração de contornos de telhados aplicado à área teste

4. (a) área teste escolhida para a aplicação do método de extração; (b) resultado obtido após a fusão

Bayesiana de regiões; (c) imagem binária das feições detectadas; (d) detecção das bordas da imagem

binária; (e) resultado da extração de contornos de telhados no referencial da imagem binária.

136

Realizando uma análise visual nos resultados apresentados na Figura 57,

verifica-se que o maior telhado existente na área teste (três edifícios alinhados) foi fundido

ainda na etapa de fusão bayesiana (Figura 57(b)), resultando em um único contorno de

telhado. Isso provavelmente se deve ao fato da sombra (ausência de dados do primeiro pulso

laser) nas fendas entre essas edificações, fazendo com que o método de interpolação pelo

vizinho mais próximo preencha essas fendas estreitas com alturas dos telhados. A Figura

57(b) mostra (em destaque) um edifício de porte bem menor misturado com a vegetação

adjacente, sendo que neste caso não foi possível ainda na primeira etapa da metodologia

separar essa edificação. Isso mostra que outras estratégias são necessárias para filtrar a

vegetação antes de se realizar a segunda etapa da metodologia. Nota-se também que a fusão

bayesiana conseguiu separar eficientemente os dois telhados isolados. Embora o método de

fusão bayesiana tenha unido os três telhados alinhados, o resultado obtido neste experimento é

consistente no que se refere à extração de telhados. A Figura 58 mostra os contornos extraídos

(em vermelho) e os de referência (em azul) sobrepostos a imagem de intensidade.

Telhado 2 Telhado 1

Telhado 3

Figura 58 – Visualização dos contornos extraído e de referência e respectiva identificação para a

análise numérica.

Na Figura 58 pode-se analisar visualmente o resultado do método de

extração. Nesta área foram extraídos três contornos de telhados (em vermelho) e um telhado

(em verde) não foi extraído. A Tabela 5 mostra os parâmetros numéricos de qualidade de

137

falsos negativos e REE para a área teste 4. Notar que esta Tabela não mostra o resultado do

parâmetro CA. Como existem vários telhados na cena, optou-se por apresentar o parâmetro

CA separadamente para cada telhado (Tabela 6).

Tabela 5

– Análise numérica dos resultados obtidos com o método de extração automática de

contornos de telhados.

Falsos Negativos REE

Porcentagem 25% 100%

Na Tabela 5 é possível verificar o bom desempenho do método de extração,

visto que houve apenas um falso negativo. Já o parâmetro REE atingiu o valor ótimo, fato

decorrente da não ocorrência de falsos positivos.

A Tabela 6 mostra os resultados obtidos em relação ao indicador CA para

cada contorno de telhado extraído na área teste. Os três contornos de telhados extraídos são

identificados na Figura 58.

Tabela 6

– Análise numérica dos resultados obtidos com o indicador CA para cada contorno de

telhados extraído.

Telhados 1 2 3

Porcentagem 91,6% 87,9% 61,5%

Os parâmetros CA, de um modo geral, indicam a boa performance do

algoritmo de extração de contornos de telhados, podendo-se ressaltar que a CA para o telhado

1 foi de 91,6%, valor considerado muito bom. Para o telhado 2 esse valor foi de 87,9% e

apenas para o telhado 3 esse parâmetro ficou abaixo da média obtida até então (61,5%). No

entanto, ainda este valor está dentro dos padrões aceitáveis (50%) para que o edifício 3 seja

considerado extraído (MCKEOWN et al., 2000).

4.3.5 Quinto experimento

A área teste 5 (Figura 59) foi escolhida com o intuito de aumentar a

complexidade do problema, visto que vários objetos altos estão presentes na cena. Os

138

resultados obtidos com a metodologia automática de extração de contornos de telhados são

mostrados na Figura 59.

(a) (b)

(e)

Figura 59 – Imagens resultantes do método de extração de contornos de telhados aplicado à área teste

5. (a) área teste escolhida para a aplicação do método de extração; (b) resultado obtido após a fusão

Bayesiana de regiões; (c) imagem binária das feições detectadas; (d) detecção das bordas da imagem

binária; (e) resultado da extração de contornos de telhados no referencial da imagem binária.

Analisando-se a Figura 59, verifica-se que há na cena 14 (quatorze) edifícios

139

e 1 (um) objeto qualquer com forma irregular. Alguns desses edifícios apresentam certa

irregularidade local nos contornos, mas possuem forma geral relativamente regular. Diante

dessas características, existe a necessidade de usar, no atributo de direção, setores com

amplitudes de aproximadamente 15º para calcular as direções principais dos objetos. Este

procedimento permite geralmente determinar as duas direções predominantes (principais) dos

objetos mesmo quando as formas não são bem regulares. Uma maior dificuldade pode surgir

no cálculo da direção secundária, especialmente no caso de objetos alongados e com

arredondamento nos lados menores. Existe nesta área teste dois edifícios com esta

característica. De fato, verificou-se na Figura 59(e) a extração de dois telhados com formas

mais alongadas, esta extração foi possível graças a injunção espacial, visto que este atributo

depende somente da direção principal. Os resultados satisfatórios obtidos neste experimente

se devem em boa parte, à fusão bayesiana, que separou 15 (quinze) objetos altos (Figura

59(b)), dos quais 12 (doze) foram extraídos pela segunda etapa do método. Os falsos

negativos totalizaram 2 (dois) edifícios e não foram extraídos justamente pela forma muito

irregular resultante da primeira etapa da metodologia.

A sobreposição dos contornos extraídos (em vermelho) e dos contornos de

referência (em azul) na imagem de intensidade foi realizada para mostrar a qualidade da

extração dos contornos de telhado extraídos (Figura 60). Os objetos representados na cor azul

clara são telhados que não foram extraídos, ou seja, são os falsos negativos.

140

Figura 60 – Visualização do contorno extraído e do contorno de referência.

Pode-se visualmente perceber que, a exemplo dos experimentos anteriores,

os contornos extraídos são aproximados em relação aos respectivos contornos de referência.

Provavelmente o fenômeno de sombra ocasionou, a exemplo dos experimentos anteriores, o

deslocamento dos contornos extraídos. Mais adiante o parâmetro CA é utilizado para avaliar

numericamente os afastamentos entre ambos os contornos (de referência e extraído). Os

parâmetros numéricos de avaliação obtidos com o resultado deste experimento são mostrados

na Tabela 7.

Tabela 7

– Análise numérica dos resultados obtidos com o método de extração automática de

contornos de telhados.

Falsos Negativos REE

Porcentagem 14,3% 100%

Os parâmetros de qualidade apresentados na Tabela 7 mostram que o

método de extração foi eficiente neste experimento, visto que o parâmetro REE obteve o valor

ótimo, isto é 100%. Este resultado implica na ocorrência de nenhum falso positivo. Houve

ainda a presença de dois falsos negativos (14,3%). Este bom resultado se deve, em parte, à

eficiência da primeira etapa da metodologia em fornecer contornos relacionados com objetos

141

altos. Na segunda etapa, a extração de telhados com certa irregularidade foi possível graças a

robustez do método do círculo trigonométrico setorizado em calcular as direções principais

dos telhados. Em dois casos, ficou claro que apenas a direção principal poderia ser calculada

com confiabilidade, a qual é fundamental para o estabelecimento das injunções de relação

espacial de paralelismo e perpendicularismo. A Figura 61 mostra a identificação de cada

contorno para a obtenção do parâmetro CA.

Figura 61 – Identificação dos contornos de telhados.

A Tabela 8 mostra os resultados obtidos com o indicador CA para os doze

contornos extraídos.

Tabela 8

– Análise numérica dos resultados obtidos com o indicador CA para cada contorno de

telhado extraído.

Telhados 1 2 3 4 5 6 7 8 9 10 11 12

% 81,4 98,5 93,9 91,7 95,0 94,3 97,6 98,2 98,5 98,2 83,8 79,8

Considerando que o método de extração é automático, os resultados

numéricos obtidos são bastante satisfatórios. Na Tabela 8 verifica-se que o telhado 2 obteve

CA de 98,5%, valor bem próximo do valor ótimo (100%). Já os telhados 1, 11 e 12 tiveram

um CA abaixo de 90%.

142

5 CONCLUSÕES E RECOMENDAÇÕES

Neste trabalho foi apresentada uma metodologia automática de extração de

contornos de telhados de edifícios em um MDE obtido a partir de dados de varredura a laser,

bem como os resultados obtidos com a metodologia proposta. Esta metodologia baseia-se em

duas etapas principais. Na primeira etapa é realizada a extração de regiões altas (edifícios,

árvores etc.) do MDE. Na segunda etapa são extraídas as regiões altas que correspondem aos

contornos de telhados.

Foram realizados cinco experimentos com dados reais, os quais forneceram

subsídios para a análise do desempenho da metodologia proposta. A escolha das áreas teste

levou em conta a complexidade das configurações de objetos presentes na cena. Desta forma,

foram selecionadas desde áreas teste com telhados isolados até com agrupamentos de

telhados. Essa escolha teve como principal objetivo verificar a robustez da metodologia em

diferentes tipos de cena.

Diante das discussões dos resultados apresentados no Capítulo 4, as

principais considerações e conclusões são:

 No primeiro experimento, verificou-se a dificuldade em estabelecer a presença de um

ou dois telhados na cena. Pelo fato da fusão bayesiana ter extraído apenas um contorno

de telhado, considerou-se para a análise visual e numérica um único contorno de

telhado. Analisando visualmente os contornos extraídos e sobrepostos na imagem de

intensidade, verificou-se um deslocamento sistemático deste contorno. Isto ocorreu em

todos os experimentos, o que pode ter sido ocasionado pela sombra do primeiro pulso,

combinada com a interpolação pelo método do vizinho mais próximo que atribui

pontos com alturas das edificações às regiões de sombra. Ainda na análise visual é

possível perceber as irregularidades nas bordas dos objetos fornecidos pela primeira

etapa da metodologia. No entanto, os bons resultados obtidos fornecem evidência de

que essas irregularidades não interferiram significativamente nos cálculos dos

atributos utilizados na etapa de extração de contornos de telhados. Na avaliação

numérica, o parâmetro CA foi de 94% e, como não houve falsos positivos, a REE foi

de 100%.

 O segundo experimento foi realizado em uma cena de baixa complexidade onde havia

dois edifícios, sendo um de grande porte e o outro de pequeno porte. Neste

experimento pode-se verificar que a fusão bayesiana separou alguns objetos altos,

143

incluindo os dois edifícios existentes na área teste. Neste caso, o edifício de menor

porte não foi penalizado pelo critério de área, pois os atributos de retangularidade e de

injunção espacial são bastante favoráveis a esse telhado. Da análise visual, pode-se

afirmar que a metodologia proposta apresentou bons resultados, mesmo fornecendo

contornos aproximados em relação aos contornos de referência. Um parâmetro que

confirma essa afirmação é o CA, cujo valor obtido para o telhado 1 foi de 91% e para

o telhado 2 foi de 97%, valores considerados muito bons. Como não houve nenhum

falso positivo a REE foi de 100%.

 No terceiro experimento foi utilizada uma área teste com um edifício isolado e o

entorno composto por uma área de vegetação densa. A etapa de fusão Bayesiana de

regiões separou inúmeros objetos, inclusive um de grande porte, com contornos dos

limites dos dados utilizados. Cabe ressaltar que esse tipo de contorno não foi

considerado no cálculo dos atributos, eliminando um problema evidente na etapa de

extração, visto que os atributos de retangularidade e área credenciariam este tipo de

objeto como sendo telhado. Na análise numérica, o parâmetro CA apresentou o valor

de 95% e a REE de 100%. Este teste mostrou o bom desempenho do método em áreas

com telhados isolados, pois além dos deslocamentos dos contornos e da extração de

contornos compreendendo grandes áreas de vegetação, apenas o contorno do telhado

foi extraído ao final da metodologia.

 A área teste escolhida para a realização do quarto experimento teve como objetivo a

verificação do método de extração em áreas com maior quantidade de telhados. Na

primeira etapa do método, a fusão bayesiana separou com bom desempenho os

edifícios isolados. No entanto, um edifício de menor porte rodeado por vegetação não

foi separado nesta etapa. Houve ainda na primeira etapa a fusão de três edifícios

alinhados, fato ocorrido ainda na etapa de interpolação dos dados. Apesar dos

problemas ocorridos verificou-se visualmente que os contornos extraídos estão

próximos aos de referência. A análise numérica confirma o bom desempenho do

método, visto que o parâmetro CA foi realizado para os quatro telhados extraídos e

apenas em um contorno de telhado este parâmetro ficou abaixo da média obtida até

então (61,5%). Nos outros contornos o resultado se manteve acima de 87%. Não

houve neste experimento a presença de falsos positivos, logo a REE foi de 100%.

Entretanto, houve um falso negativo referente à edificação de pequeno porte não

separada na primeira etapa da metodologia.

144

 No quinto experimento, a área teste utilizada possui uma configuração de objetos com

maior complexidade. Neste caso, o intuito foi verificar a potencialidade do método em

cenas com maior quantidade de objetos, principalmente edifícios altos em cenas

urbanas densas. Visualmente é possível perceber o bom desempenho da fusão

bayesiana que separou quinze objetos altos, dos quais doze foram extraídos. Neste

experimento, as injunções espaciais contribuíram com a robustez do método. Um dos

objetos altos extraídos na primeira etapa não era telhado, o que contribuiu para a não

extração deste objeto na segunda etapa da metodologia. Ainda na análise visual

verifica-se que os contornos obtidos são novamente aproximados e os problemas

ocorridos devem estar associados aos deslocamentos dos contornos em áreas de

ocorrência de sombra do primeiro pulso. Analisando os resultados numéricos verifica-

se novamente os bons resultados obtidos com o parâmetro CA. Neste experimento

somente dois contornos tiveram CA abaixo de 90% e novamente não houve nenhum

falso positivo, logo a REE foi de 100%. O algoritmo não extraiu dois telhados

existentes na área teste, o que ocorreu devido às irregularidades e alongamento desses

objetos, fato que influenciou no cálculo dos atributos de retangularidade e de injunção

espacial. Cabe ressaltar que outros dois contornos de telhado com forma alongada e

lados menores arredondados foram extraídos devido ao atributo de injunção espacial,

que depende apenas da direção do eixo principal.

Considerando as conclusões apresentadas acima, algumas considerações

mais gerais podem ser ressaltadas:

 O deslocamento dos contornos, verificado em todos os experimentos foi causado pela

sombra do primeiro pulso laser combinado com um efeito indesejado do método de

interpolação pelo vizinho mais próximo. Este deslocamento pode influenciar no

resultado dos atributos utilizados, especialmente no atributo de retangularidade e de

relacionamento espacial. Entretanto, esse deslocamento afetou apenas a forma dos

contornos extraídos, mas não afetou significativamente a extração dos contornos de

telhados, visto que os resultados obtidos foram satisfatórios.

 Pode-se ressaltar a eficiência da fusão bayesiana na tarefa de separar os objetos altos

dos baixos. Esta etapa proporcionou uma grande redução da complexidade da cena,

embora a fusão bayesiana pode não separar edifícios e árvores de porte parecidos,

conforme se verificou no experimento 4.

145

 Em nenhum dos experimentos se verificou a presença de falsos positivos e poucos

falsos negativos foram obtidos, sendo estes bons indicativos de robustez da

metodologia proposta.

 O modelo MRF permite utilizar injunções espaciais, as quais possibilitaram modelar

melhor a cena. Isto ficou evidente no experimento 5, principalmente pela presença de

dois telhados alongados e com lados menores arredondados. Nesse caso, apenas a

direção do eixo principal dos objetos pôde ser calculada com boa qualidade, o que

prejudicou o cálculo do atributo de retangularidade, mas não o de relacionamento

espacial. Em outras palavras, as injunções espaciais podem auxiliar na discriminação

dos objetos de interesse em várias situações, mesmo que o atributo de retangularidade

não seja bom.

 O método do círculo trigonométrico setorizado demonstrou robustez no cálculo das

direções principais dos contornos. Estes contornos são relativamente irregulares e

muitos detalhes são perdidos (por exemplo, entrâncias regulares de edifícios). Mesmo

com estas irregularidades, sempre fica estabelecida a tendência das direções dos lados

dos telhados, as quais são eficientemente capturadas pelo método do círculo

trigonométrico setorizado. Isso garante robustez no cálculo dos atributos de

retangularidade e de relacionamento espacial.

Conclui-se então de forma geral que a metodologia desenvolvida

possibilitou a extração de contornos de telhados de forma satisfatória, mas com a limitação

principal de que os polígonos extraídos são aproximações para os respectivos telhados. A

contribuição principal deste trabalho está relacionada com a exploração de relações espaciais

entre os edifícios na cena, o que foi viabilizado pelo modelo MRF. Cabe ressaltar que essa

modelagem não tem sido comum na extração de contornos de telhados em dados de varredura

a laser.

5.1 Recomendações

Algumas recomendações relacionadas com as dificuldades encontradas no

desenvolvimento do trabalho podem melhorar o desempenho da metodologia proposta, bem

como facilitar a tarefa de extração. Entre elas pode-se citar:

146

 Estudar outros métodos de interpolação que evitem o problema de deslocamento de

contornos. Outra possibilidade é modificar o método para usar diretamente os dados

irregulares.

 Melhorar a fusão bayesiana a fim de possibilitar a separação de edifícios e árvores.

 Aperfeiçoar o método do círculo trigonométrico setorizado através da sobreposição de

um outro círculo, com um deslocamento de 50% de arco de um setor, visando evitar o

possível problema de direções que caiam no limite de setores. Isso possibilitaria

melhorar a robustez do cálculo dos parâmetros de retangularidade e relacionamento

espacial.

Dentre outras recomendações, destacam-se:

 Seguir a tendência atual de utilizar várias fontes de dados (laser, imagens aéreas e de

satélites de alta resolução). Nesse caso, poder-se-ia combinar a facilidade de detecção

dos objetos oferecida pelos dados geométricos tridimensionais com a alta definição

dos contornos nas imagens.

 Estender a noção de clique para a quadra inteira, possibilitando uma modelagem

integrada de configurações de edifícios e ruas. Vale ressaltar que a extração de ruas

em imagens de intensidade laser pode ser uma opção atraente, visto que as vias

urbanas aparecem nestas imagens com excelente contraste.

 Outras possibilidades poderiam ser citadas, tais como: aperfeiçoamento das funções de

energia, desenvolvimento de novos atributos descritores, avaliação de outros métodos

de resolução da Equação de energia etc..

147

REFERÊNCIAS

AHOKAS, E.; KAARTINEN, H.; HYYPPÄ, J. A quality assessment of airbone laser scanner

data. In: WORKSHOP 3-D RECONSTRUCTION FROM AIRBORNE LASERSCANNER

AND INSAR DATA, 2003, Dresden.

Proceedings… 2003.

ALHARTHY, A.; BETHEL, J. Detailed building reconstruction from airborne laser data

using a moving surface method. In: XXth ISPRS CONGRESS, v. XXXV, 2004, Istanbul.

Proceedings do IAPRS 2004.

ANDERSEN, H.; REUTEBUCH, S.; SCHREUDER, G. Bayesian object recognition for the

analysis of complex forest scenes. In: SYMPOSIUM PHOTOGRAMMETRIC COMPUTER

VISION, 2002, Austria.

Proceedings… 2002.

AREFI, H.; HAHN, M. A hierarchical procedure for segmentation and classification of

airborne LIDAR images. In: GEOSCIENCE AND REMOTE SENSING SYMPOSIUM, 7,

2005.

Proceedings… 2005. p. 4950 - 4953.

AXELSSON, P. Integrated sensors for improved 3D interpretation

. In: SYMPOSIUM GIS -

BETWEEN VISIONS AND APPLICATIONS, v. 32, 1998, Stuttgart.

Proceedings... 1998. p.

27-34.

BALLARD, D. H.; BROWN, C. M.

Computer vision. Englewood Cliffs, Prentice-Hall,

1982.

BALTSAVIAS, E. P. Airborne Laser Scanning: basic relation and formulas.

ISPRS Journal

of Photogrammetry & Remote Sensing, Zurich, v. 54, p.199–214, abr. 1999.

BERTHOD, M.; KATO, Z.; YU, S.; ZERUBIA, J. Bayesian image classification using

Markov random fields.

Image and Vision Computing, v. 14, n. 4, p. 285-295, 1996.

BESAG, J. Spatial interaction and the analysis of lattice systems.

Journal of the Royal

Statistical Association, Series B 36, p. 192-236, 1974.

BESAG, J.; YORK, J.; MOLLIÉ, A. Bayesian Image Restoration, with two applications on

Spatial Statistics.

Annals of the Institute of Statistical Mathematics, v. 43, p. 1–59, 1991.

148

BLAKE, A. Comparison of the Efficiency of Deterministic and Stochastic Algorithms for

Visual Reconstruction.

IEEE Transactions on Pattern Analysis and Machine Intelligence,

v. 11, n. 1, p. 2–12, 1989.

BOAVENTURA NETTO, P. O.

Teoria e modelos de grafos. E. Blücher, São Paulo, 249p,

1979.

BOEHLER, W.; HEINZG, G.; MARBS, A. The potential of non-contact close range Laser

Scanner for cultural heritage recording. In: CIPA INTERNATIONAL SYMPOSIUM,

2001, University of Potsdam.

Proceedings… 2001.

BOX, G. E. P; TIAO, G.C. Bayesian Inference in Statistical Analysis. 1973.

BRANDALIZE, A. A. Varredura a Laser: Comparação com métodos fotogramétricos. In: I

SIMPÓSIO BRASILEIRO DE GEOMÁTICA, 2002, Presidente Prudente.

Anais... 2002.

BRETAR, F.; ROUX, M. Hybrid image segmentation using LiDAR 3D planar primitives. In:

ISPRS WORKSHOP LASER SCANNING, 2005, Enschede, the Netherlands.

Proceedings…

2005.

BRETAR, F.; PIERROT-DESEILLIGNY, M.; ROUX, M. Estimating intrinsic accuracy of

airborne laser data with local tridimensional-offsets. In: WORKSHOP 3-D

RECONSTRUCTION FROM AIRBORNE LASERSCANNER AND INSAR DATA, 2003,

Dresden, Germany.

Proceedings… 2003.

BRUNN, A.; WEIDNER, U. Extracting buildings from digital surface models. In: IAPRS.

v.32, 1997. Stuttgart.

Proceedings… 1997. p. 27-34.

BURNS, J.B.; HANSON, A.R.; RISEMAN, E.M. Extracting straight lines.

IEEE Pattern

Analysis and Machine Intelligence, v. 8, n. 4, p. 425-455, 1986.

CANNY, J. A Computational approach to edge detection.

IEEE Pattern Analysis and machine

Intelligence, v. 8, n. 6, p. 679 – 698, 1986.

CRAMER, M.; STALLMANN, D. On the use of GPS/INS exterior orientation parameters in

airborne photogrammetry. In: OEEPE WORKSHOP ON “INTEGRATED SENSOR

ORIENTATION”, Hannover, Germany.

Proceedings… 2001. p.32-44.

149

DALMOLIN, Q.; SANTOS, D. R.

Sistema laserSCANNING: Conceitos e princípios de

funcionamento. UFPR, Curitiba. 2004.

DAL POZ, A. P. Modelos e estratégias para a extração da malha viária em imagens digitais.

Relatório FAPESP, Universidade Estadual Paulista (UNESP), 2002.

DAL POZ, A. P., SILVA, M. A. O. Active Testing and Edge Analysis for Road Centreline

Extraction. In: ISPRS SYMPOSIUM PHOTOGRAMMETRIC COMPUTER VISION,

Austria.

Proceedings… 2002.

DEGROOT, M. H.; SCHERVISH, M. J. Probability and statistics. 3

ed. 2002. Addison

Wesley, London, 816p.

DENG, H. AND CLAUSI, D.A. Unsupervised image segmentation using a simple MRF

model with a new implementation scheme.

Pattern Recognition, v. 37, n. 12, p. 2323-2335.

2004.

DUBES, R. C. E JAIN, A. K. Random Field Models in Image Analysis.

Journal of applied

Statistics, v. 16, n. 2, p. 131–164. 1989.

FERREIRA, M. A. R.

Modelos dinâmicos hierárquicos bayesianos: estimação de matrizes

de covariância das equações estruturais e não-normalidade. 1994. Dissertação de

mestrado, IM/UFRJ.

EL-SHEIMY, N.

Digital terrain modelling. Calgary, 1999.

FRANKE, R. Scattered Data Interpolation: Test of Some Methods,

Mathematics of

Computations

, v. 33, n. 157, p. 181-200. 1982.

GAMERMAN, D.; LOPES, H. F.

Markov Chain Monte Carlo: Stochastic Simulation for

Bayesian Inference. 2

. ed. Chapman & Hall CRC, Londres, 336p., 2006.

GEMAN, S.; GEMAN, D. Stochastic relaxation, Gibbs distribution, and Bayesian restoration

of images. In: IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE

INTELLIGENCE, v.6, 1984.

Proceedings… 1984, p.721-741.

GELFAND, A. E.; SMITH, A. M. Sampling-based approaches to calculating marginal

densities.

Journal of the American statistical association, v. 85, n. 410, pp. 398-409. 1990

150

GELFAND, A. E.; HILLS, S. E.; RACINE- POON; SMITH, A. F. M. Ilustration of Bayesian

inference in normal data model using Gibbs sampling.

Journal of the American statistical

association, v. 85, n. 412, pp. 972-985. 1990.

GELMAN, A.; RUBIN, D. Inference from iterative simulation using multiple sequences.

Statistical science 7, pp. 457-472. 1992.

GONZALES, R. C.; WOODS, R. E.

Digital Image Processing, Addison-Weslly publiching

company, 716p., 2000.

GORDON, S.; LICHTI, D.; STEWART, M. Application of a high-resolution, ground-based

laser scanner for deformation measurements. In: 10TH FIG INTERNATIONAL

SYMPOSIUM ON DEFORMATION MEASUREMENTS, California, USA, 2001.

Proceedings… 2001, p. 23-32.

HAALA, N. Detection of building by fusion of range and image data. In: INTERNATIONAL

ARCHIVES OF PHOTOGRAMMETRY AND REMOTE SENSING, 1994.

Proceedings…

1994, p.341-346.

HAALA, N.; BRENNER, C. Extraction of buildings and trees in urban environments.

ISPRS

Journal of Photogrammetry e Remote Sensing, v.54, p.130-137, 1999b.

HAITHCOAT, T.; SONG, W.; HIPPLE, J. Automated Building Extraction and

Reconstruction from LIDAR Data. Building Extraction – LIDAR R&D Program for

NASA/ICREST Studies, 2001.

HUMMEL, R. A.; ZUCKER, S. W. On the foundation of relaxation labeling process. In:

IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE, v.

PAMI-5, 1983.

Proceedings… 1983, p.267-287.

HURN, M.; HUSBY, O.; RUE, H. Advances in Bayesian image analysis.

Highly Structured

Stochastic Systems, Oxford Statistical Science Series, Oxford University Press, v. 27, p.

302-322, 2003.

JACKSON, Q.; LANDGREBE, D.A. Adaptative Bayesian contextual classification based on

Markov random fields.

IEEE Transactions on Geoscience and Remote Sensing, v. 40, n.

11, p. 2454-2463, 2002.

151

JAIN, R.; KASTURI, R; SCHUNCK, B. G.

Machine vision. MIT Press and McGraw-Hill,

Inc New York, 1995.

KASSER, M.; EGELS, Y.

Digital photogrammetry. Éditeur London, New York: Taylor &

Francis, Collation XV, 2002. 351p.

KATARZIS, A.; SAHLI, H.; NYSSEN, E.; CORNELIS, J

. Detection of buildings from a

single airborne image using a Markov Random Field model. In: IEEE INTERNATIONAL

GEOSCIENCE AND REMOTE SENSING SYMPOSIUM. Austrália, 2001.

Proceedings…

2001, 3p.

A. Katartzis, H. Sahli, E . Nyssen , J. Cornelis

KIM, I. Y.; YANG, H. S. An integrated approach for scene understanding based on Markov

Random Field. Pattern Recognition, p. 1887-1897, 1995.

KINDERMAN, R.; SNELL, J. L.

Markov Random Fields and their applications.

Providence, R.I: American Mathematical Society, 1980.

KIRKPATRICK, S.; GELATT, C. D.; VECCHI, M. P. Optimization by Simulated Annealing,

Science, p. 671–680, 1983.

KOPPARAPU, S. K.; DESAI, U. B.

Bayesian approach to image interpretation. 127p.,

2001.

KRISHNAMACHARI, S.; CHELLAPPA, R. Delineating buildings by grouping lines with

MRFs. In: IEEE TRANS. ON IMAGE PROCESSING. v. 5, 1996.

Proceedings…1996,

p.164-168.

LIDAR – Light Detection and Ranging. Disponível em:

http://www.lidar.com.br/tecnologia.htm . acessado em 20 de dezembro de 2006.

LOHMANN, P. Segmentation and Filtering of Laser Scanner Digital Surface Models, In: II

SYMPOSIUM ON INTEGRATED SYSTEMS FOR SPATIAL DATA PRODUCTION,

CUSTODIAN AND DECISION SUPPORT, IAPRS. Xi'an, v. XXXIV, Part 2, 2002.

Proceedings… 2002, p. 311-315.

MAAS, H. G.; VOSSELMAN, G. Two algorithms or extracting building models from raw

laser altimetry data. In: ISPRS JOURNAL OF PHOTOGRAMMETRY AND REMOTE

SENSING, 1999.

Proceedings… 1999, p.153-163.

152

MACHADO, A. M. L.; MITISHITA, E. A. Detecção automática de contornos de edificações

utilizando imagem gerada por câmara digital de pequeno formato e dados lidar.

Boletim de

Ciências Geodésicas, v. 12, n. 2, p. 215-233, 2006.

MANJUNATH, B. S., SIMCHONY, T. E CHELLAPPA, R. Stochastic and Deterministic

Networks for Texture Segmentation.

IEEE Transactions on Acoustics, Speech, and Signal

Processing, v. 38, n. 6, p.1039–1049, 1990.

MATIKAINEN, L.; HYYPPÄ J.; HYYPPÄ H. Automatic detection of buildings from laser

scanner data for map updating. In

: ISPRS WORKSHOP LASER SCANNING, 2005.

Proceedings… 2005.

MCKEOWN, D. M.; BULWINKLE, T. M.; COCHRAN, S.; HARVEY, W.; MCGLONE, C.;

SHUFELT, J. A. Performance evaluation for automatic feature extraction.

International

Archives of Photogrammetry and Remote Sensing, v. 33, part B2, p. 379– 394, 2000.

METROPOLIS, N.; ROSENBLUTH, M. N; ROSENBLUTH, A. H.; Teller, A. H.; Teller, E.

Equations of state calculations by fast computation machines.

Journal Chemical Physics, v.

21, p.1087-1091, 1953.

MIGON, H. S.; GAMERMAN, D.

Statistical Inference: an Integrated Approach. 1. ed.

Londres: Arnold, 1999. v.1, 262 p.

MITISHITA, E. A.

Monorestituição digital de aerofotos, associada com sistema de

computação gráfica C.A.D., para fins de mapeamento na área florestal

. 1997. 253 f. Tese

(Doutorado em Ciências Florestais) – Universidade Federal do Paraná, Curitiba.

MODESTINO, J. A; ZHANG, J. A Markov Random Field model based approach to image

interpretation.

IEEE Transactions on Pattern Analysis and Machine Intelligence, v. 6,

p.606-615, 1992.

MORGAN, M.; HABIB, A. Interpolation of Lidar Data for Automatic Building Extraction.

In: ASPRS/ACSM CONFERENCE, Washington, D.C., 2002.

Proceedings… 2002.

MOSTAFA, M. M. J.; HUTTON, J. Direct positioning and orientation systems – How do

they work? What is the attainable accuracy?. In: ASPRS, St. Louis – Missouri, 2001.

Proceedings … 2001.

153

NARDINOCCHI, C.; FORLANI, G.; ZINGARETTI, P. Classification and filtering of laser

data. In: ISPRS WORKING GROUP III/3 WORKSHOP. Dresden, Germany, 2003.

Proceedings… 2003.

NARDINOCCHI, C.; FORLANI, G. Detection and Segmentation of Building Roofs from

Lidar Data. In: ISPRS WORKSHOP ON 3D DIGITAL IMAGING AND MODELLING

APPLICATIONS OF: HERITAGE, INDUSTRIES, MEDICINE & COMMERCIAL LAND,

Padova, 2001.

Proceedings… 2001.

PARK, J.; LEE, I.; CHOI, Y.; LEE, Y. J. Automatic Extraction of Large Complex Buildings

Using Lidar Data and Digital Maps. In: SYMPOSIUM OF ISPRS COMMISSION III

PHOTOGRAMMETRIC COMPUTER VISION, Bonn, Germany.

Proceedings… 2006.

ROSENFELD, A.; HUMMEL, R. A.; ZUCKER, S. W. Scene labeling by relaxation

operations.

IEEE Trans. Syst. Man Cybern. v. SMC-6, p.420-433, 1976.

ROTTENSTEINER, F.; BRIESE, C. A New Method for Building Extraction in Urban Areas

from High-Resolution Lidar Data. In: IAPRSIS, v. XXXIV/3A, Graz, Áustria, 2002.

Proceedings… 2002, p. 295 – 301.

ROTTENSTEINER, F.; TRINDER, J.; CLODE, S.; KUBIK, K. Automated delineation of

roof planes from LIDAR data. In: INTERNATIONAL ARCHIVES OF THE

PHOTOGRAMMETRY, REMOTE SENSING AND SPATIAL INFORMATION

SCIENCES, Enschede, Netherlands, v. 35, 2005.

Proceedings… 2005.

RÜTHER, H.; MARTINE, H. M.; MTALO, E. G. Application of snakes and dynamic

programming optimization technique in modeling of buildings in informal settlement areas.

ISPRS

Journal of Photogrammetry and Remote Sensing, v. 56, p. 269-282, 2002.

SCHENK, T.; CSATHÓ, B. Fusion of lidar data and aerial imagery for a more complete

surface description. In: INTERNATIONAL ARCHIVES OF PHOTOGRAMMETRY AND

REMOTE SENSING, v. 34, 2002.

Proceedings… 2002, p. 310–317.

SCHMIDT, A. M.; NOBRE, A. A.; FERREIRA, G. S. Alguns Aspectos da Modelagem de

Dados Espacialmente Referenciados.

Revista brasileira de estatística, Brasil, v. 63, n. 220,

p. 59-88, 2003.

SOHN, G.; DOWMAN, I. J. Building extraction using Lidar DEMs and Ikonos images

. In:

ISPRS, v. XXXIV, p. 3/W13. Dresden, Germany.

Proceedings… 2003.

154

SOHN, G. Extraction of buildings from high-resolution satellite data and lidar. In: XX ISPRS

CONGRESS, Istanbul, Turkey, 2004.

Proceedings... 2004, 7p.

SOUZA, A. D. P.

Métodos aproximados em modelos hierárquicos dinâmicos Bayesianos.

1999. 142f. Tese (Doutorado em Ciências em Engenharia de Produção) – Universidade

Federal do Rio de Janeiro – COPPE, Rio de Janeiro.

SPIEGELHATER, D.J.; THOMAS, A.; BEST, N.; GILKS, W. WinBUGS (Bayesian

Inference Using Gibbs Sampling). Version 1.4,

MRC Biostatistics Unit, Cambridge, UK,

2002.

SURFER.

USER’S GUIDE. Golden Software Inc. USA. 1999.

SZIRÁNYI, T.; ZERUBIA, J.; CZÚNI, L.; GELDREICH, D.; KATO, Z. Image segmentation

using Markov Random Field model in fully parallel cellular network architectures.

Real-

Time Imaging. v.6, p. 195-211, 2000.

TARSHA-KURDI, F.; LANDES, T.; GRUSSENMEYER, P.; SMIGIEL, E. New Approach

for Automatic Detection of Buildings in Airborne Laser Scanner Data Using first Echo only.

In: SYMPOSIUM OF ISPRS COMMISSION III PHOTOGRAMMETRIC COMPUTER

VISION, Bonn, Germany.

Proceedings… 2006.

TOMMASELLI, A. M. G. Um Estudo sobre as Técnicas de Varredura a Laser e

Fotogrametria para Levantamentos 3D a curta Distância.

GEODÉSIA online. 2003.

TÓVÁRI, D.; PFEIFER, N. Segmentation based robust interpolation – A new approach to

laser data filtering. In: ISPRS WORKSHOP "LASER SCANNING”, Enschede, the

Netherlands.

Proceedings… 2005.

TRINDER, J. C.; MAULIK, U.; BANDYOPADHYAY, S. Semi-automated feature extraction

using simulated annealing. In

: INTERNATIONAL ARCHIVES FOR

PHOTOGRAMMETRY AND REMOTE SENSING. v.33, part B3.

Proceedings... 2000, p.

905-911.

VALE, G. M.; DAL POZ, A. P. O Processo de Detecção de Bordas de Canny: Fundamentos,

Algoritmos e Avaliação Experimental. In: SIMPÓSIO BRASILEIRO DE GEOMÁTICA,

Presidente Prudente.

Anais do Simpósio Brasileiro de Geomática - Anais em CDROM,

2002. p. 292-303.

155

VALE, G. M.; DAL POZ, A. P. Processo de detecção de bordas de Canny.

Boletim de

Ciências Geodésicas, Curitiba, v.8, n.2, p. 67-78. 2002a.

VÖGTLE, T.; STEINLE, E. On the Quality of Object Classification and Automated Building

Modelling Based on Laserscanning Data. In: IAPRS, v. XXXIV, part. 3, Dresden, Germany.

Proceedings… 2003.

VOSSELMAN, G.; DIJKMAN, S. 3D building model reconstruction from point clouds and

ground plans. In: IAPRS, v. XXXIV – 3/W4, Annapolis.

Proceedings… 2001.

VOSSELMAN, G. Fusion of Laser Scanning Data, Maps, and Aerial Photographs for

Building Reconstruction. In: INTERNATIONAL GEOSCIENCE AND REMOTE SENSING

SYMPOSIUM, Toronto, Canada.

Proceedings… 2002.

WANG, M.; TSENG, Y. Lidar data segmentation and classification based on octree structure.

In: XX ISPRS CONGRESS, Istanbul, Turkey, 2004. Proceedings... 2004.

WEVER, C.; LINDENBERGER, J. Experience of 10 years of laser Scanning.

Schriftenreihe

des Institute für Photogrammetrie. der Universität Stuttgart, pp. 125-132 1999.

WEHR, A.; LOHR, U. Airborne laserscanning-an introduction and overview. In: ISPRS

JOURNAL OF PHOTOGRAMMETRY AND REMOTE SENSING. v. (54) 2-3.

Proceedings... 1999. p.68-82.

WOLF, P.; DEWITT, B. Elements of photogrammetry – with applications in GIS. 3. ed.

United States of America: Mc Graw Hill, 2000.

YANG, C.; KAO, S.; LEE, F.; HUNG, P. Twelve different interpolation methods: a case

study of surfer 8.0. In: XX ISPRS CONGRESS, Istanbul, Turkey, 2004.

Proceedings... 2004.

ZHOU, G.; SONG, C.; SIMMERS, J.; CHENG, P. Urban 3D GIS from LiDAR and digital

aerial images.

Computers and Geosciences. v. 30, p. 345-353, 2004.

ZIOU, D.; TABBONE, S. Edge detection techniques – An overview.

International Journal

of Pattern Recognition and Image Analysis. v. 8, n. 4, p. 537-559, 1998.

156

BIBLIOGRAFIA

BAUMGARTNER, A.; STEGER, C.; MAYER, H.; ECKSTEIN, W.; EBNER, H. Automatic

road extraction based on multi-scale, grouping, and context. In: PHOTOGRAMMETRIC

ENGINEERING AND REMOTE SENSING, v. 66, n. 7, 1999, Ohio.

Proceedings… 1999.

p.777-785.

CENTENO, J. A. S.; MIQUELES, M. A.; Extraction of buildings in brasilian urban

environments using high resolution remote sensing imagery and laser scanner data

. In: XXTH

ISPRS CONGRESS, 2004, Istanbul.

Proceedings… 2004.

DURUPT, M.; TAILLANDIER, F. Automatic Building Reconstruction from a Digital

Elevation Model and Cadastral Data: An Operational Approach. In: SYMPOSIUM OF ISPRS

COMMISSION III PHOTOGRAMMETRIC COMPUTER VISION, Bonn, Germany.

Proceedings… 2006.

HABIB, A.; GHANMA, M.; MITISHITA, E. A. Co-registration of Photogrammetric and

LIDAR data: Methodology and case study.

Revista Brasileira de Cartografia, v. 56, n. 1, p.

1-13, 2004.

HINZ, S.; BAUMGARTNER, A. Road extraction in urban areas supported by context

objects. In: INTERNATIONAL ARCHIVES OF PHOTOGRAMMETRY AND REMOTE

SENSING, v.33, part B.

Proceedings… 2000.

HINZ, S. Using context as guide for automatic object extraction in urban areas. In: REMOTE

SENSING OF URBAN AREAS, Regensburger Geographische Schriften.

Proceedings…

2001.

HINZ, S.; BAUMGARTNER, A.; MAYER, H.; WIEDEMANN, C.; EBNER, H. Road

extraction focusing on urban areas.

Automatic extraction of man-made objects from aerial

and space images (III). Balkema Publishers, 2001.

HINZ, S.; BAUMGARTNER, A. Urban road net extraction integrating internal evaluation

models. In: ISPRS SYMPOSIUM PHOTOGRAMMETRIC COMPUTER VISION, Austria.

Proceedings… 2002.

HINZ, S. Automatic road extraction in urban scenes and beyond. In: XXth ISPRS Congress,

Instanbul, Turquia.

Proceedings… 2004. 6p.

157

HORIGUCHI, S.; OZAWA, S.; NAGAI, S.; SUGIYAMA, K. Reconstructing road and block

from DEM in urban area. In: ISPRS SYMPOSIUM PHOTOGRAMMETRIC COMPUTER

VISION, Austria.

Proceedings… 2000.

KIM, T.; MULLER, J. P. Development of a graph-based approach for building detection.

mage and Vision Computing. v.17, 1999. p.3-14.

KASSER, M.; EGELS, Y.

Digital photogrammetry. Éditeur London, New York: Taylor &

Francis, Collation XV, 2002. 351p.

KUMAR, K. S.; DESAI, U. B. Joint segmentation and image interpretation.

Tech. Rep.

SPANN, Indian Institute of Techonology

, Bombay. 1996.

LAPTEV, I.; MAYER, H.; LINDEBERG, T.; ECKSTEIN, W.; STEGER, C.;

BAUMGARTNER, A. Automatic extraction of roads from aerial images based on scale space

and snakes. In:

MACHINE VISION AND APPLICATIONS. V. 12, n. 1. Proceedings…

2000. p.22-31.

LIN, C.; NEVATIA, R. Building detection and description from a single intensity image.

Computer Vision and Image Understanding, v. 72, 1998. p.101-121.

MARSHALL, A. D.; MARTIN, R. R.

Computer vision, models and inspection. World

Scientific Series in robotics and automated systems, 1992, v.4.

PRÉTEUX, F.,

Mathematical Morphology in image processing. E. Dougerthy, Rochester

Institute of Technology, New York, 1993.

PRICE, K. Urban street grid description and verification. In: IEEE Workshop AN

APPLICATIONS OF COMPUTER VISION. Palm Springs. Proceedings… 2000, p.148-154.

ROTTENSTEINER, F.; BRIESE, C. Automatic generation of building models from lidar data

and the integration of aerial images. In: INTERNATIONAL ARCHIVES OF

PHOTOGRAMMETRY AND REMOTE SENSING, Dresden, Germany, v. 34, n. 3W13.

Proceedings… 2003, p. 174–180.

RUE, H. A loss function model for the restoration of grey level images.

Scand. Journal

STATIST

. v. 24, p. 103 – 114, 1997.

158

RUTZINGER, M.; HÖFLE, B.; GEIST, T.; STÖTTER, J. Object-based building detection

based on airborne laser scanning with GRASS GIS environment. In: UDMS 2006: URBAN

DATA MANAGEMENT SYMPOSIUM, Aalborg, Dinamarca, 2006.

Proceedings… 2006.

SOILLE, P.; VINCENT, L. Watersheds in digital spaces: An efficient algorithm based on

immersion simulations. In: IEEE TRANSACTIONS ON PATTERN ANALYSIS AND

MACHINE INTELLIGENCE. v. 13, n. 6.

Proceedings… 1991. p.583-597.

SOILLE, P.

Morphological image analysis – Principles and applications. Springer-Verlag.

Berlin Heidelberg, 1999. 316p.

SCHUTTE, K.

Knowledge based recognition of man-made objects. 1994. Tese, University

of Twente.

TEH, C.; CHIN, R. On image analysis by the method of moments. In: IEEE

TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE.

Proceedings…1998. p. 496-513.

WILSON, R. J.

Introduction to graph theory, Oliver and Boyd, Edinburgh, 1972, 168p.

159

ANEXO A - Dados formato Splus de uma área teste da cidade de Curitiba - PR -

WINBUGS 1.4

map: 1702

1 area1

2 area2

3 area3

4 area4

5 area5

6 area6

7 area7

8 area8

9 area9

10 area10

11 area11

12 area12

1698 area1698

1699 area1699

1700 area1700

1701 area1701

1702 area1702

area1 676582 7185050

area1 676584 7185050

area1 676584 7185053

area1 676582 7185053

NA NA NA

area2 676582 7185053

area2 676584 7185053

area2 676584 7185055

area2 676582 7185055

NA NA NA

area3 676584 7185053

area3 676585 7185053

area3 676585 7185054

area3 676584 7185054

NA NA NA

area4 676584 7185054

area4 676585 7185054

area4 676585 7185055

area4 676584 7185055

NA NA NA

160

NA NA NA

area1701 676639 7185053

area1701 676641 7185053

area1701 676641 7185055

area1701 676639 7185055

NA NA NA

area1702 676639 7185050

area1702 676641 7185050

area1702 676641 7185053

area1702 676639 7185053

NA NA NA

END

161

ANEXO B – Código e Dados utilizados - WinBUGS 1.4

model

{

# Likelihood

for (i in 1 : N)

{

d[i] ~ dnorm(mu[i], tau1)

mu[i] <- alpha0 + b[i]

}

# CAR prior distribution for random effects:

b[1:N] ~ car.normal(adj[], weights[], num[], tau)

for(k in 1:sumNumNeigh)

{

weights[k] <- 1

}

# Other priors:

alpha0 ~ dflat()

tau ~ dgamma(0.5, 0.0005)

tau1 ~ dgamma(0.001, 0.001) # prior on precision

sigma <- sqrt(1 / tau) # standard deviation

}

Data list(N = 11011,

d = c(908.099,907.949,912.668,910.425,915.047,914.870,908.185,911.030,914.352,915.540,

910.610,914.705,913.743,910.527,913.803,916.045,916.780,910.515,911.217,914.910,

931.558,930.747,933.345,933.452,932.585,930.813,931.773,930.497,930.450,932.657,

932.707,930.650,930.600,929.160,929.890,932.260,925.840,924.773,924.767,923.148,

921.985,921.985),

list(num = c(4, 7, 7, 7, 8, 8, 4, 7, 8, 5,

4, 5, 8, 7, 5, 4, 7, 8, 8, 8,

8, 8, 8, 8, 8, 8, 8, 8, 8, 8,.

8, 8, 8, 8, 8, 8, 8, 8, 8, 5,

5, 8, 8, 5, 5, 5, 8, 8, 5, 8,

8, 8, 8, 8, 8, 5, 5, 5, 8, 5,

adj = c(

8, 7, 3, 2,

23, 14, 11, 8, 4, 3, 1,

9, 8, 6, 5, 4, 2, 1,

26, 23, 14, 6, 5, 3, 2,

162

48, 47, 27, 26, 23, 6, 4, 3,

48, 47, 44, 9, 8, 5, 4, 3,

11011, 11010, 11008, 11007, 11004, 11003, 10999, 10998,

11011, 11009, 11008, 11007, 11004,

11010, 11009, 11008

sumNumNeigh = 83452))

Inits list(tau = 1, tau1 = 0.1, alpha0 = 0,

b=c(0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,

0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,

0,0,0,0,0,0,0,0,0,0,0,0,0,0))

163

ANEXO C – Gráficos de Saída do software WinBUGS 1.4 - Diagnóstico de Gelman

e Rubin e Trajetória das Cadeias Geradas para a área teste 3.

Efeito aleatório (b) incorporando vizinhança

Diagnóstico de Gelman e Rubin

alpha0 chains 1:2

iteration

22001 25000 30000

0.0

0.5

1.0

b[1] chains 1:2

iteration

22001 25000 30000

0.0

0.5

1.0

b[1000] chains 1:2

iteration

22001 25000 30000

0.0

0.5

1.0

b[6000] chains 1:2

iteration

22001 25000 30000

0.0

0.5

1.0

1.5

b[10000] chains 1:2

iteration

22001 25000 30000

0.0

0.5

1.0

b[11000] chains 1:2

iteration

22001 25000 30000

0.0

0.5

1.0

1.5

Trajetória das Cadeias Geradas

alpha0 chains 1:2

iteration

22001 25000 27500 30000

924.63

924.635

924.64

924.645

164

b[1] chains 1:2

iteration

22001 25000 27500 30000

-17.5

-17.0

-16.5

-16.0

b[1000] chains 1:2

iteration

22001 25000 27500 30000

-13.5

-13.0

-12.5

-12.0

b[10000] chains 1:2

iteration

22001 25000 27500 30000

54.5

55.0

55.5

56.0

56.5

b[11000] chains 1:2

iteration

22001 25000 27500 30000

7.0

7.5

8.0

8.5

9.0

165

ANEXO D – Resultados Estatísticos - WinBUGS 1.4

Efeito aleatório (b) incorporando vizinhança

Node mean sd MC error 2.5% median 97.5% start sample

alpha0 924.6 0.001067 8.44E-6 924.6 924.6 924.6 22001 20000

node mean sd MC error 2.5% median 97.5% start sample

b[1] -16.54 0.1112 7.905E-4 -16.77 -16.54 -16.31 22001 20000

b[2] -16.69 0.1106 8.139E-4 -16.92 -16.69 -16.46 22001 20000

b[3] -11.97 0.1109 8.048E-4 -12.2 -11.97 -11.74 22001 20000

b[4] -14.21 0.111 8.061E-4 -14.44 -14.21 -13.99 22001 20000

b[5] -9.594 0.1099 8.099E-4 -9.82 -9.593 -9.371 22001 20000

b[6] -9.768 0.1096 8.266E-4 -9.996 -9.769 -9.544 22001 20000

b[7] -16.45 0.1097 7.321E-4 -16.68 -16.45 -16.23 22001 20000

b[8] -13.61 0.1102 7.359E-4 -13.84 -13.61 -13.38 22001 20000

b[9] -10.29 0.1106 8.474E-4 -10.52 -10.28 -10.06 22001 20000

b[10] -9.098 0.1108 7.627E-4 -9.327 -9.097 -8.873 22001 20000

b[11] -14.03 0.1106 8.952E-4 -14.26 -14.03 -13.8 22001 20000

b[12] -9.933 0.1096 7.196E-4 -10.16 -9.933 -9.707 22001 20000

b[13] -10.9 0.1107 7.62E-4 -11.12 -10.9 -10.67 22001 20000

b[14] -14.11 0.1101 7.369E-4 -14.34 -14.11 -13.88 22001 20000

b[15] -10.84 0.1107 7.359E-4 -11.06 -10.83 -10.61 22001 20000

b[16] -8.593 0.1109 7.573E-4 -8.823 -8.593 -8.365 22001 20000

b[17] -7.859 0.11 7.177E-4 -8.083 -7.858 -7.632 22001 20000

b[18] -14.12 0.1106 8.744E-4 -14.35 -14.12 -13.89 22001 20000

b[19] -13.42 0.1108 7.481E-4 -13.64 -13.42 -13.19 22001 20000

b[20] -9.729 0.1098 8.53E-4 -9.955 -9.729 -9.503 22001 20000

b[21] -10.34 0.1115 8.289E-4 -10.57 -10.34 -10.11 22001 20000

b[22] -11.06 0.1111 8.036E-4 -11.29 -11.06 -10.83 22001 20000

b[23] -11.77 0.1105 8.326E-4 -11.99 -11.77 -11.54 22001 20000

b[24] -11.67 0.1095 7.67E-4 -11.9 -11.67 -11.45 22001 20000

b[25] -10.59 0.111 8.336E-4 -10.82 -10.59 -10.36 22001 20000

b[26] -10.59 0.1112 8.301E-4 -10.82 -10.59 -10.36 22001 20000

b[27] -10.61 0.1097 8.1E-4 -10.83 -10.61 -10.38 22001 20000

b[28] -10.74 0.1114 8.181E-4 -10.97 -10.74 -10.51 22001 20000

b[29] -11.41 0.1106 8.614E-4 -11.63 -11.41 -11.18 22001 20000

b[30] -11.17 0.11 7.913E-4 -11.4 -11.17 -10.95 22001 20000

b[31] -12.13 0.1102 7.092E-4 -12.35 -12.13 -11.9 22001 20000

b[32] -12.69 0.1111 7.829E-4 -12.93 -12.69 -12.46 22001 20000

b[33] -14.68 0.1107 7.401E-4 -14.91 -14.68 -14.45 22001 20000

b[34] -12.38 0.1112 7.802E-4 -12.61 -12.38 -12.15 22001 20000

b[10997] 7.136 0.111 6.538E-4 6.905 7.136 7.363 22001 20000

b[10998] 5.857 0.1109 7.317E-4 5.628 5.858 6.086 22001 20000

b[10999] 5.811 0.1108 7.542E-4 5.585 5.811 6.041 22001 20000

b[11000] 8.018 0.11 7.853E-4 7.791 8.018 8.243 22001 20000

b[11001] 8.07 0.1099 7.338E-4 7.842 8.07 8.297 22001 20000

b[11002] 6.013 0.1102 7.657E-4 5.785 6.012 6.242 22001 20000

b[11003] 5.962 0.1108 6.128E-4 5.733 5.962 6.191 22001 20000

b[11004] 4.523 0.1097 7.663E-4 4.296 4.522 4.754 22001 20000

b[11005] 5.254 0.1107 7.79E-4 5.026 5.253 5.48 22001 20000

b[11006] 7.622 0.1101 8.355E-4 7.392 7.621 7.848 22001 20000

b[11007] 1.203 0.1112 7.284E-4 0.977 1.202 1.431 22001 20000

b[11008] 0.1352 0.1104 7.745E-4 -0.0962 0.1351 0.3654 22001 20000

b[11009] 0.1295 0.1112 7.512E-4 -0.09971 0.1302 0.3559 22001 20000

b[11010] -1.49 0.1105 7.841E-4 -1.718 -1.49 -1.26 22001 20000

b[11011] -2.654 0.1117 8.292E-4 -2.883 -2.654 -2.423 22001 20000

Livros Grátis
( http://www.livrosgratis.com.br )
 
Milhares de Livros para Download:
 
Baixar livros de Administração
Baixar livros de Agronomia
Baixar livros de Arquitetura
Baixar livros de Artes
Baixar livros de Astronomia
Baixar livros de Biologia Geral
Baixar livros de Ciência da Computação
Baixar livros de Ciência da Informação
Baixar livros de Ciência Política
Baixar livros de Ciências da Saúde
Baixar livros de Comunicação
Baixar livros do Conselho Nacional de Educação - CNE
Baixar livros de Defesa civil
Baixar livros de Direito
Baixar livros de Direitos humanos
Baixar livros de Economia
Baixar livros de Economia Doméstica
Baixar livros de Educação
Baixar livros de Educação - Trânsito
Baixar livros de Educação Física
Baixar livros de Engenharia Aeroespacial
Baixar livros de Farmácia
Baixar livros de Filosofia
Baixar livros de Física
Baixar livros de Geociências
Baixar livros de Geografia
Baixar livros de História
Baixar livros de Línguas

Baixar livros de Literatura
Baixar livros de Literatura de Cordel
Baixar livros de Literatura Infantil
Baixar livros de Matemática
Baixar livros de Medicina
Baixar livros de Medicina Veterinária
Baixar livros de Meio Ambiente
Baixar livros de Meteorologia
Baixar Monografias e TCC
Baixar livros Multidisciplinar
Baixar livros de Música
Baixar livros de Psicologia
Baixar livros de Química
Baixar livros de Saúde Coletiva
Baixar livros de Serviço Social
Baixar livros de Sociologia
Baixar livros de Teologia
Baixar livros de Trabalho
Baixar livros de Turismo