Download PDF
ads:
RICARDO LUÍS BARBOSA
CAMINHAMENTO FOTOGRAMÉTRICO
UTILIZANDO O FLUXO ÓPTICO FILTRADO
Tese apresentada ao Programa de Pós-Graduação em Ciências Cartográficas da
Faculdade de Ciências e Tecnologia de Presidente Prudente da UNESP, para a obtenção
do título de Doutor em Ciências (Área de concentração: Aquisição, Análise e
Representação de Informações Espaciais).
ORIENTADOR: PROF. DR. JOÃO FERNANDO CUSTÓDIO DA SILVA
CO-ORIENTADOR: PROF. DR. MESSIAS MENEGUETTE JÚNIOR
PRESIDENTE PRUDENTE
2006
ads:
Livros Grátis
http://www.livrosgratis.com.br
Milhares de livros grátis para download.
RICARDO LUÍS BARBOSA
CAMINHAMENTO FOTOGRAMÉTRICO UTILIZANDO O
FLUXO ÓPTICO FILTRADO
COMISSÃO JULGADORA
TESE PARA OBTENÇÃO DO GRAU DE DOUTOR
Presidente e orientador: Prof. Dr. João Fernando Custódio da Silva
2
º
Examinador : Prof. Dr. Valentin Obac Roda
3
º
Examinador : Prof. Dr. Almir Olivette Artero
4
º
Examinador : Prof. Dr. Antonio Maria Garcia Tommaselli
5
º
Examinador : Prof. Dr. Aluir Porfírio Dal Poz
PRESIDENTE PRUDENTE, 24 DE MAIO DE 2006
ads:
Ficha catalográfica elaborada pelo Serviço Técnico de Biblioteca e Documentação – UNESP
– FCT – Campus de Presidente Prudente
B212c
Barbosa, Ricardo Luís.
Caminhamento fotogramétrico utilizando o fluxo óptico
filtrado / Ricardo Luís Barbosa. Presidente Prudente : [s.n.],
2006
118 f. : il.
Tese (doutorado) - Universidade Estadual Paulista,
Faculdade de Ciências e Tecnologia
Orientador: João Fernando Custódio da Silva
Co-Orientador: Messias Meneguette Júnior
1. Cartografia. 2. Mapeamento móvel. 3. Fluxo óptico 4.
Velocidade monocular. 5. Seqüência de imagens I. Silva, João
Fernando Custódio da. II. Meneguette Júnior, Messias. III.
Título. CDD (18.ed.)623.71
Aos meus pais, João e Inêz (in memoriam)
À minha esposa, Nara Garcia
AGRADECIMENTOS
Agradeço ao professor João Fernando Custódio da Silva, pela orientação, estímulo e
principalmente pela paciência. Os acertos deste trabalho devo a ele e os erros são de minha
exclusividade.
Ao professor Messias Meneguette Júnior pela co-orientação e estímulo.
Aos professores do programa de pós-graduação em Ciências Cartográficas, principalmente
aos professores Aluir Porfírio Dal Poz, Antonio Maria Garcia Tommaselli, Arlete Aparecida
Correia Meneguette, Julio Kiyoshi Hasegawa, Maurício Galo, Nilton Nobuhiro Imai e Vilma
Mayumi Tachibana.
Ao amigo Rodrigo Bezerra de Araújo Gallis, que contribuiu de maneira inestimável para a
conclusão deste trabalho.
Aos funcionários da seção de pós-graduação: Márcia Aparecida Iacia Silva, Erynat Fátima
Fernandes e Ivonete Gomes de Andrade e à assessora administrativa Dirce Correia de
Oliveira, pela atenção e gentileza no atendimento.
“Nada somos além daquilo que recordamos”
Iván Izquierdo
RESUMO
Em certas condições, os sensores de orientação e posicionamento (INS e GPS) de um Sistema
Móvel de Mapeamento Terrestre (SMMT) ficam indisponíveis por algum intervalo de tempo
ocasionando a perda da orientação e do posicionamento das imagens capturadas neste
intervalo. Neste trabalho, é proposta uma solução baseada apenas nas imagens sem a
utilização de sensores ou informações externas às mesmas, através do fluxo óptico. Um
sistema móvel com um par de vídeo maras, denominado Unidade Móvel de Mapeamento
Digital (UMMD), foi utilizado para testar a metodologia proposta em uma via plana. As
câmaras são fixadas em uma base com um afastamento entre as câmaras de 0,94m e paralelas
ao eixo de deslocamento (Y). A velocidade do veículo é estimada, inicialmente, com base no
fluxo óptico denso. Em seguida, a estimação da velocidade é melhorada após uma filtragem,
que consiste em: utilizar os vetores que apresentam comportamento radial na metade inferior
das imagens e que foram detectados pelo algoritmo de Canny, acrescida uma segunda etapa
na estimação da velocidade com eliminação de erros grosseiros. Com a velocidade estimada e
sabendo-se o tempo de amostragem do vídeo, o deslocamento de cada imagem é determinado
e esta informação é utilizada como aproximação inicial para o posicionamento das câmaras. A
orientação absoluta é feita com estimação dos parâmetros por meio de uma fototriangulação
com parâmetros adicionais para cada imagem. Pontos homólogos selecionados manualmente
no primeiro estéreopar fornecem as coordenadas no terreno por interseção fotogramétrica
(supondo uma aproximação inicial para esta primeira base). Em seguida, novas bases vão
sendo incluídas, uma por vez e a fototriangulação (a cada inclusão de base) realizada após a
determinação automática (correlação a vante baseada em área) das novas fotocoordenadas
(observações). Essa forma de orientação é aqui chamada de caminhamento fotogramétrico. Os
resultados mostraram que a velocidade estimada ficou próxima da velocidade verdadeira e a
qualidade do ajustamento se mostrou razoável, considerando-se a não utilização de sensores
externos e de pontos de apoio.
Palavras-chave: mapeamento móvel, fluxo óptico, velocidade monocular, seqüência de
imagens, orientação de imagens.
ABSTRACT
Under certain conditions the positioning and orientation sensors such as INS and GPS of a
land-based mobile mapping system may fail for a certain time interval. The consequence is
that the images captured during this time interval may be misoriented or even may have no
orientation. This thesis proposes a solution to orient the images based only on image
processing and a photogrammetric technique without any external sensors in order to
overcome the lack of external orientation. A land-based mobile mapping system with a pair of
video cameras and a GPS receiver was used to test the proposed methodology on an urban flat
road. The video cameras were mounted on the roof of the vehicle with both optical axes
parallel to the main road axis (Y). The methodology is based on the velocity estimation of the
vehicle, which is done in two steps. Initially, the dense optical flow is computed then the
velocity estimation is obtained through a filtering strategy that consists of using radial vectors
in the low parts of the images. These radial vectors are detected by the Canny algorithm. The
vehicle velocity is re-estimated after eliminating the optical flow outliers. With the re-
estimated velocity and with the video sampling time the spatial displacement of each image
(with respect to the previous one of the sequence) is determined. The displacement is used as
an approximation to the image position. Homologous points are manually selected in the first
stereopair. Assuming an arbitrary orientation for the first pair, the corresponding object point
coordinates are computed by photogrammetric intersection. The orientation is computed by
phototriangulation with additional parameters. Following, new bases are included, one by one,
and the phototriangulation is computed for every additional base. The photocoordinates are
determined by forward area correlation. This process has been called photogrammetric
bridging or traverse. The results show that the estimated velocity is pretty close to the true one
and the quality of the least square adjustment is quite acceptable, considering that no external
sensors were used.
Keywords: mobile mapping, optical flow, monocular velocity, image sequence, image
orientation.
LISTA DE FIGURAS
Figura 1 Ilustração esquemática da unidade móvel de mapeamento digital
(UMMD).........................................................................................................................
16
Figura 2 – Representação conceitual do caminhamento fotogramétrico........................
18
Figura 3 – Estéreopar......................................................................................................
21
Figura 4 – Exemplo de uma seqüência com seis imagens..............................................
22
Figura 5 – Exemplo de uma seqüência com quatro estéreopares...................................
23
Figura 6 Exemplo de uma imagem da seqüência de Yosemite e o fluxo óptico
correspondente................................................................................................................
24
Figura 7 – Movimento 3D projetado no plano da imagem.............................................
25
Figura 8 – Ilustração do campo de movimento...............................................................
26
Figura 9 – a) cilindro rotacionando b) campo de movimento c) fluxo óptico................
26
Figura 10 – Problema da abertura...................................................................................
35
Figura 11 – Bordas detectadas com o algoritmo de Canny............................................
39
Figura 12 – Derivada da função gaussiana.....................................................................
40
Figura 13 – Arranjo para obtenção da correspondência.................................................
42
Figura 14 – Estimação das derivadas parciais................................................................
46
Figura 15 – Regiões de interesse....................................................................................
49
Figura 16 – Padrão esperado para o fluxo óptico nas regiões........................................ 50
Figura 17 – Sistemas de fotocoordenadas e da imagem.................................................
52
Figura 18 – Geometria da condição de colinearidade para o caso terrestre................... 54
Figura 19 – Ilustração da correspondência a vante.........................................................
57
Figura 20 – Esquema da matriz A.................................................................................. 61
Figura 21 – Diagrama de blocos simplificado da metodologia......................................
64
Figura 22 – Fluxos dos experimentos da tabela 1...........................................................
69
Figura 23 – Gráfico dos resíduos x valores ajustados da velocidade.............................
73
Figura 24 – Gráfico da velocidade em duas etapas para seqüência s1e......................... 74
Figura 25 – Gráfico da velocidade em duas etapas para seqüência s2e......................... 75
Figura 26 – Gráfico da velocidade em duas etapas para seqüência s1d.........................
75
Figura 27 – Gráfico da velocidade em duas etapas para seqüência s2d.........................
76
Figura 28 – Ilustração da quantidade de vetores na primeira etapa e na segunda etapa.
77
Figura 29 – Fluxo computado com λ = 0,5.....................................................................
82
Figura 30 – Gráfico de lambda x velocidade, s1 e 1
a
. etapa...........................................
82
Figura 31 – Gráfico de lambda x velocidade, s1 e 2
a
. etapa...........................................
83
Figura 32 – Gráfico de lambda x velocidade, s2 e 1
a
. etapa...........................................
84
Figura 33 – Gráfico de lambda x velocidade, s2 e 2
a
. etapa...........................................
84
Figura 34 – Distribuição dos pontos utilizados na primeira base...................................
88
Figura 35 – Gráfico da qualidade do ajustamento..........................................................
94
LISTA DE TABELAS E QUADROS
Tabela 1 – Experimentos com a computação do fluxo óptico.......................................
66
Tabela 2 – Conjuntos de parâmetros para o algoritmo de Canny..................................
70
Tabela 3 – Experimentos com parâmetros de Canny: λ = 1 e seqüência s1..................
71
Tabela 4 – Experimentos com parâmetros de Canny: λ = 1 e seqüência s2..................
72
Tabela 5 – Velocidade e desvio-padrão na primeira e segunda etapa...........................
76
Tabela 6 – Quantidade de vetores e desvio-padrão na primeira e segunda etapa..........
76
Tabela 7 – Filtragem em duas etapas: λ = 0,5 e seqüência s1e.....................................
78
Tabela 8 – Filtragem em duas etapas: λ = 0,5 e seqüência s2e.....................................
79
Tabela 9 – Filtragem em duas etapas: λ = 0,5 e seqüência s1d.....................................
80
Tabela 10 – Filtragem em duas etapas: λ = 0,5 e seqüência s2d...................................
81
Tabela 11 – Velocidade estimada apenas nas regiões de interesse ...............................
85
Tabela 12 Velocidade estimada apenas nas regiões de interesse com o padrão
radial..............................................................................................................................
86
Tabela 13 – Velocidade estimada nas regiões de interesse e Canny.............................
86
Tabela 14 – Configurações comuns...............................................................................
87
Tabela 15 – Coordenadas dos pontos no terreno...........................................................
88
Quadro 1 – Orientação inicial e variâncias para os parâmetros em comum..................
89
Quadro 2 – Resumo do resultado da fototriangulação básica........................................
90
Quadro 3 – Resumo do resultado da fototriangulação com injunção de base.............. 91
Quadro 4 – Resumo do resultado da fototriangulação com injunção de base e
velocidade como parâmetro...........................................................................................
92
Quadro 5 – Resumo do resultado da fototriangulação com injunção de base e
injunção de velocidade..................................................................................................
93
Tabela 16 – Valores calculados e tabelados da distribuição qui-quadrado...................
95
Tabela 17 – Experimentos com parâmetros de Canny: λ = 10 e seqüência s1..............
109
Tabela 18 – Experimentos com parâmetros de Canny: λ = 10 e seqüência s2..............
110
Tabela 19 – Experimentos com parâmetros de Canny: λ = 20 e seqüência s1..............
111
Tabela 20 – Experimentos com parâmetros de Canny: λ = 20 e seqüência s2..............
112
Tabela 21 – Experimentos com parâmetros de Canny: λ = 30 e seqüência s1..............
113
Tabela 22 – Experimentos com parâmetros de Canny: λ = 30 e seqüência s2..............
114
Tabela 23 – Experimentos com parâmetros de Canny: λ = 40 e seqüência s1..............
115
Tabela 24 – Experimentos com parâmetros de Canny: λ = 40 e seqüência s2..............
116
Tabela 25 – Experimentos com parâmetros de Canny: λ = 50 e seqüência s1..............
117
Tabela 26 – Experimentos com parâmetros de Canny: λ = 50 e seqüência s2..............
118
SUMÁRIO
1 INTRODUÇÃO.........................................................................................................
14
1.1 Unidade de Mapeamento Móvel Digital..................................................................
15
1.2 Caminhamento fotogramétrico................................................................................
17
1.3 Proposição ou tese................................................................................................... 18
1.4 Objetivos..................................................................................................................
19
1.5 Estrutura da tese.......................................................................................................
20
2 FUNDAMENTAÇÃO TEÓRICA.............................................................................
21
2.1 Fluxo óptico……………………………………………………………….............
24
2.2 Métodos para a computação do fluxo óptico……………………………...............
28
2.3 Problema da abertura...............................................................................................
33
2.4 Computação da velocidade translacional.................................................................
37
2.5 Algoritmo de Canny................................................................................................ 39
2.6 Correspondência......................................................................................................
42
3 MATERIAIS E MÉTODOS......................................................................................
44
3.1 Método de Horn e Schunck..................................................................................... 45
3.2 Regiões de interesse.................................................................................................
49
3.3 Cálculo da velocidade translacional estimada em duas etapas................................
50
3.4 Equações de colinearidade para o caso terrestre......................................................
51
3.5 Correspondência a vante..........................................................................................
57
3.6 Autocalibração fotovariante.....................................................................................
58
3.7 Injunção da base e da velocidade.............................................................................
62
3.8 Diagrama de blocos simplificado da metodologia..................................................
63
4 EXPERIMENTOS, RESULTADOS E DISCUSSÕES............................................ 65
4.1 Computação do fluxo óptico....................................................................................
65
4.2 Estimação da velocidade..........................................................................................
70
4.3 Computação da velocidade com segunda etapa.......................................................
74
4.4 Redução do fator lambda.........................................................................................
78
4.5 Síntese dos resultados da estimação da velocidade.................................................
85
4.6 Resultados da autocalibração fotovariante.............................................................. 87
4.6.1 Resultados da fototriangulação básica..................................................................
90
4.6.2 Resultados da fototriangulação tendo a base como injunção............................... 91
4.6.3 Resultados da fototriangulação com injunção da base e velocidade como
parâmetro.......................................................................................................................
92
4.6.4 Resultados da fototriangulação utilizando a base e a velocidade como
injunções........................................................................................................................
93
5 CONCLUSÕES..........................................................................................................
96
REFERÊNCIAS BIBLIOGRÁFICAS.......................................................................... 99
APÊNDICES................................................................................................................. 102
1 INTRODUÇÃO
Em geral um Sistema Móvel de Mapeamento Terrestre (SMMT) consiste na
integração de sensores para se fazer a navegação e a coleta de dados. Esses sensores o
classificados em duas categorias (TAO; CHAPMAN; CHAPLIN, 2001): posicionamento e
mapeamento. Os sensores de posicionamento podem ser externos ou internos. Exemplo de
sensor de posicionamento externo é o GPS (Global Positioning System) e de sensor interno o
INS (Inertial Navigation System). Os sensores de mapeamento o classificados em passivos
ou ativos. Os passivos são câmaras de vídeo ou fotográficas e um sistema de varredura laser
(laser scanner) é exemplo de sensor de mapeamento ativo.
Os sensores de posicionamento fornecem de maneira sincronizada a
orientação exterior dos sensores de mapeamento, de tal forma que os elementos de orientação
exterior são conhecidos e a reconstrução tridimensional pode ser efetuada diretamente
utilizando pontos ou feições correspondentes.
São várias as aplicações de um SMMT, como por exemplo: utilização em
administrações municipais para localização, visualização e gerenciamento das informações
referentes a um arruamento, a um lote ou edificações; interesses de empresas e órgãos
públicos relacionados ao planejamento, construção, conservação e utilização de rodovias;
serviços de utilidade pública, como água, esgoto, energia elétrica, telefonia entre outros.
Quando um SMMT possui uma câmara de vídeo, a quantidade de imagens
disponíveis para fins de mapeamento é muito grande e o processamento das seqüências de
imagens adquiridas pode ser dividido em extração de informações e determinação da
trajetória baseada em imagens.
A extração de atributos em cada imagem de um estéreopar; o
estabelecimento de correspondência espacial e temporal (movimento) e a determinação dos
parâmetros de orientação das imagens subseqüentes é chamada de ponte entre imagens
(TAO; CHAPMAN; CHAPLIN, 2001).
O georreferenciamento destas imagens é o ponto de partida para o
processamento automático do mapeamento móvel de seqüências de imagens e é
essencialmente um problema de determinação da trajetória (HAFSKJOLD et al., 2000).
Em geral os sistemas móveis de mapeamento possuem, além do sensor GPS,
o sensor INS para auxiliar a navegação ou posicionamento e atitude de cada câmara, quando o
sinal GPS não está disponível por alguma razão, o que é muito comum no caso do
mapeamento móvel urbano. Mas o INS tem um ciclo de degradação muito pido, o que
obriga a um reposicionamento periódico do sensor (SILVA; CAMARGO; GALLIS, 2003).
Além disso, existem situações em que ambos os sinais não estão disponíveis, o que indica a
necessidade de se procurar soluções para esse problema utilizando as imagens que foram
capturadas durante o deslocamento do móvel. Alguns dos principais centros de pesquisas em
mapeamento móvel estão buscando soluções para resolver o problema da falta de
georreferenciamento das imagens (RONCELLA; REMONDINO; FORLANI, 2005; TAO;
CHAPMAN; CHAPLIN, 2001).
1.1 Unidade de Mapeamento Móvel Digital
No Laboratório de Mapeamento Móvel da Unesp - campus de Presidente
Prudente, existe um sistema de mapeamento móvel denominado Unidade Móvel de
Mapeamento Digital (UMMD) (SILVA; CAMARGO; GALLIS, 2003; SILVA et al., 2000)
constituído de um veículo, um par de câmaras de vídeo digital Sony DSR 200A, uma antena
GPS Ashtech Reliance, um computador portátil Fujitsu Lifebook e um conjunto de
equipamentos a bordo para sincronizar o sinal do GPS com as imagens de vídeo (figura 1).
Figura 1 - Ilustração esquemática da unidade móvel de mapeamento digital (UMMD)
Vários trabalhos foram desenvolvidos no laboratório para capacitar recursos
humanos e prover metodologias, principalmente em programas de computador, para dar
funcionalidade ao sistema de mapeamento vel. Em um dos principais trabalhos
(OLIVEIRA; SILVA, 2001; OLIVEIRA et al., 2003) foi implementado um Banco de Imagens
Georreferenciadas (BIG), que pressupõe a orientação de estéreopares de imagens para fins de
interseção fotogramétrica.
Nos levantamentos realizados com a UMMD as posições das câmaras são
amostradas a cada um segundo pelo GPS e como a taxa de captura das imagens pelas câmaras
para formar o vídeo é de 30 quadros por segundo, uma grande massa de informações
(imagens) o são utilizadas diretamente poiso estão parcialmente georreferenciadas.
Como o se dispõe de um sensor INS, além da dificuldade de orientar as imagens, ocorre
também uma outra dificuldade para georreferenciar as imagens quando o sinal GPS é perdido,
por conta da geometria dos satélites ou por obstrução de edificações ou vegetação, por
exemplo.
1.2 Caminhamento fotogramétrico
Neste trabalho, é apresentada uma metodologia brida para posicionar e
orientar uma seqüência de imagens quando não se têm sensores externos, ou quando da
existência destes, o sinal fica indisponível em algum trecho do levantamento. Esta
metodologia combina técnicas fotogramétricas e de visão computacional (fluxo óptico) para
posicionar e orientar uma seqüência de pares estereoscópicos de imagens tomadas em uma via
plana de transporte, sem a utilização de sensores externos. Essa metodologia visa contribuir
com a automação do caminhamento fotogramétrico (SILVA, 1997), que conceitualmente
consiste em responder a pergunta: "onde estou, de onde vim e para onde vou?".
De uma forma mais detalhada, o caminhamento fotogramétrico é um modo
especial de levantamento fotogramétrico baseado em sucessivos pares estereoscópicos de
imagens terrestres tomadas ao longo da trajetória, obtidas de tal modo que a base
estereoscópica (distância entre os centros perspectivos das maras) seja posicionada
aproximadamente perpendicular ao eixo (Y) do levantamento ou que os eixos ópticos sejam
aproximadamente paralelos ao referido eixo do levantamento (SILVA, 1997).
A figura 2 ilustra o conceito, onde os segmentos ED
i
representam as bases
estereoscópicas no instante i e as posições em que são efetuadas as tomadas das imagens.
Dessa forma, E
1
e D
1
representam os centros perspectivos das câmaras da esquerda e da
direita da base estereoscópica (estéreobase) no instante t
1
, e assim sucessivamente nos demais
instantes.
Figura 2 - Representação conceitual do caminhamento fotogramétrico
Fonte: adaptado de Silva (1997)
Um ponto P situado entre a terceira e quarta bases pode aparecer também nas
imagens tomadas nas bases 1 e 2. Sua posição espacial (X,Y,Z), com respeito a um referencial
no espaço objeto, pode ser calculada por simples interseção usando os dados do terceiro par,
ou dupla interseção com as fotos da segunda e terceira bases ou ainda por tripla interseção das
seis imagens que o registram (E
1
, D
1
, E
2
, D
2
, E
3
, D
3
). Generalizando este princípio chega-se
ao conceito de fototriangulação com a particularidade de que a escala varia acentuadamente
em cada imagem. Isso se deve ao fato de que o afastamento (Y
P
) do ponto objeto P à base
varia desde poucos metros até dezenas de metros à sua frente. Esta é uma das principais
causas que impedem uma automação com alta qualidade na fototriangulação de um SMMT.
1.3 Proposição ou tese
A metodologia proposta neste trabalho não exige sensores de
posicionamento, e uma tarefa fundamental é resolver este problema, usando uma estimativa
da velocidade do veículo baseada apenas em imagens, utilizando o fluxo óptico. Em visão
computacional, a estimação da velocidade é utilizada na navegação passiva (passive
navigation ou egomotion), que é a habilidade de um agente autônomo determinar seu
movimento em relação ao ambiente (BRANCA; STELLA; DISTANTE, 2000). Em geral, são
.P
E1 E2 E3 E4
D1 D2 D3 D4
.Q
utilizados dois parâmetros para a navegação passiva: a direção do movimento (heading
direction) e o tempo para colisão (time-to-collision). Aqui, a velocidade seutilizada para
fornecer uma estimativa da posição relativa das câmaras.
Com a estimação da velocidade das câmaras e conhecendo-se o tempo entre
cada base, que é dado pela freqüência de amostragem das imagens, o computadas
aproximações iniciais para a posição do centro perspectivo (CP) de cada imagem. Com tal
aproximação e pontos correspondentes medidos manualmente nas imagens da primeira base, é
realizada uma fototriangulação com autocalibração fotovariante para posicionar e orientar as
imagens subseqüentes, automatizando, a partir daí, o caminhamento fotogramétrico.
1.4 Objetivos
O objetivo geral deste trabalho é:
Contribuir com uma metodologia híbrida utilizando técnicas
fotogramétricas e de visão computacional, para determinar o
posicionamento relativo e a orientação exterior de pares
estereoscópicos de uma seqüência de imagens adquiridas por um par
de câmaras de vídeo digital.
Especificamente os objetivos são:
Fazer a automação do caminhamento fotogramétrico da UMMD,
sem a utilização de sensores externos, a partir de pontos extraídos
manualmente no estéreopar inicial da seqüência;
Fornecer imagens referenciadas para a base de dados do Banco de
Imagens Georreferenciadas (BIG).
1.5 Estrutura da tese
Neste trabalho no capítulo 2 é feita uma revisão da computação do fluxo
óptico, dando ênfase ao método diferencial; a estimação da velocidade translacional
(utilizando o fluxo óptico monocular); a detecção de bordas pelo algoritmo de Canny e a
correspondência baseada em área, que é utilizada juntamente com a interseção fotogramétrica
para fornecer as observações dos pares quando do caminhamento.
No capítulo 3 a metodologia é detalhada mostrando a computação do fluxo
óptico com o método de Horn e Schunck, a estimação da velocidade com o fluxo óptico
monocular filtrado e o modelo matemático da fototriangulação.
No capítulo 4 são mostrados os resultados dos experimentos realizados com
seqüências de imagens obtidas em um levantamento feito com a UMMD com as respectivas
análises e discussões.
Finalmente, no capítulo 5 são feitas as conclusões, as considerações finais e
os apontamentos para os trabalhos futuros.
2 FUNDAMENTAÇÃO TEÓRICA
Neste capítulo é apresentada a fundamentação matemática do fluxo óptico,
algumas definições básicas e apontamentos para diversas técnicas de computação do fluxo
óptico com ênfase nas técnicas diferenciais. Traz também, uma breve revisão sobre o
algoritmo de Canny para detecção de bordas (que será utilizado para a filtragem do fluxo
óptico) e do problema da correspondência, utilizada no caminhamento fotogramétrico.
Inicialmente algumas definições se fazem necessárias. Um par de imagens
significa um par estéreo ou estéreopar (figura 3), ou seja, a imagem da esquerda e da direita
tomadas no mesmo instante, com os eixos horizontais paralelos separados por uma distância
fixa (base estereoscópica ou simplesmente base) com sobreposição suficiente para medidas
fotogramétricas, sendo que os eixos horizontais são ortogonais à base.
Figura 3 - Estéreopar
A denominação seqüência de imagens é entendida como um conjunto de
imagens consecutivas referentes a uma câmara (esquerda ou direita). Na figura 4 aparece uma
seqüência com seis imagens tomadas com a câmara esquerda.
a) b)
c) d)
e) f)
Figura 4 - Exemplo de uma seqüência com seis imagens
Seqüência de pares de imagens é um conjunto de estéreopares (esquerda e
direita) consecutivos (figura 5).
a) b)
c) d)
e) f)
g) h)
Figura 5 – Exemplo de uma seqüência com quatro estéreopares
2.1 Fluxo óptico
Fluxo óptico é a distribuição 2D da velocidade aparente do movimento dos
padrões de intensidade no plano da imagem. Em outras palavras, o campo do fluxo óptico
consiste de um campo denso de velocidade onde cada pixel no plano da imagem está
associado com um único vetor de velocidade, amostrado em uma malha para fins de
visualização, chamada de diagrama de agulhas (needle map) (figura 6).
Figura 6 - Exemplo de uma imagem da seqüência de Yosemite e o fluxo óptico correspondente
Fonte: BARRON; FLEET; BEAUCHEMIN, 1994
Se for conhecido o intervalo de tempo entre duas imagens consecutivas, os
vetores de velocidade podem ser convertidos em vetores de deslocamento e vice-versa (SHI;
SUN, 2000).
O movimento 2D é aquele no plano da imagem causado pelo movimento no
cenário 3D, ou seja, é a projeção (em geral perspectiva) do movimento 3D da cena no plano
da imagem, conforme ilustrado na figura 7.
Figura 7 - Movimento 3D projetado no plano da imagem
Fonte: adaptado de Shi e Sun (2000)
Na figura 7 um ponto A no sistema de coordenadas do espaço objeto OXYZ
se move no sentido do ponto B, formando um vetor deslocamento
AB
. O ponto C é o centro
perspectivo (centro óptico) da câmara e f a distância focal. A correspondente projeção
perspectiva deste deslocamento é o vetor
ab
no sistema de coordenadas da imagem Oxyz.
A representação 2D de um movimento 3D é chamada de campo de
movimento, no qual cada ponto está associado a um vetor velocidade correspondendo à
direção, velocidade e distância a partir do observador em um sistema apropriado. A figura 8
ilustra o campo de movimento de dois objetos se movendo em uma seqüência de imagens.
Figura 8 - Ilustração do campo de movimento
Fonte: adaptado de Sonka; Hlavac e Boyle (1999)
Como o fluxo óptico é causado pelo movimento dos padrões de intensidade
no plano da imagem, o movimento 2D e o fluxo óptico podem ser diferentes. Para ilustrar
isso, a figura 9 mostra um cilindro com faixas paralelas e inclinadas, sendo rotacionado no
eixo Z (figura 9a). O campo do movimento é mostrado na figura 9b e o fluxo óptico na figura
9c.
a) b) c)
Figura 9 - a) Cilindro rotacionando b) campo de movimento c) fluxo óptico
Um outro exemplo é apresentado em Horn e Schunck (1981): uma esfera
com textura uniforme é rotacionada no espaço em torno do seu eixo, com velocidade
constante. Se não houver mudança na iluminação e todas as outras condições não mudarem,
não haverá mudança no brilho da imagem e conseqüentemente o fluxo óptico é nulo, mas o
movimento 2D não é.
Por outro lado, se uma cena onde os objetos estão parados tiver mudança na
iluminação, o campo de movimento 2D é nulo, porém o fluxo óptico será diferente de zero.
Em certas condições, o fluxo óptico e o movimento 2D podem ser equivalentes (SHI; SUN,
2000).
A computação do fluxo óptico ou velocidade da imagem é um problema
fundamental no processamento de seqüências de imagens (TEKALP, 1995) e pode auxiliar
em várias tarefas, tais como interpretação de cena, navegação exploratória, acompanhamento
de objetos, avaliação de tempo para colisão, segmentação de objetos, codificação de vídeo,
visão de robôs etc.
Em problemas como a simples detecção de movimento, usando apenas a
diferença entre duas imagens, é possível estabelecer se houve movimento ou não. Esse
esquema, em geral, é usado em equipamentos de segurança, cuja configuração básica possui
apenas uma câmara estática.
A detecção de objetos se movimentando na cena, ou a câmara se
movimentando e os objetos parados ou ainda a câmara e os objetos se movendo, o
problemas mais difíceis em comparação com a detecção do movimento. Outros problemas
mais complexos incluem a detecção do objeto (se movendo em ambiente com vários objetos),
a detecção da trajetória desses objetos e a predição das trajetórias.
A análise do movimento é chamada de análise dinâmica de imagens e é
baseada em um pequeno número de imagens em uma seqüência, algumas vezes duas ou três
imagens. Esse caso é similar a uma análise estática de imagens e o movimento é atualizado
através da correspondência entre pares de pontos de interesse ou feições/regiões nas imagens
subseqüentes (TEKALP, 1995).
Uma outra abordagem para a análise de movimentos utiliza o cálculo do
fluxo óptico onde uma pequena diferença de tempo entre as imagens é requerida e não devem
ocorrer mudanças significativas entre duas imagens consecutivas. A computação do fluxo
óptico resulta na direção e velocidade dos pontos na imagem. Um objetivo imediato da análise
de imagens baseada em fluxo óptico é determinar o campo de movimento. O fluxo óptico nem
sempre corresponde ao verdadeiro campo de movimento por causa das mudanças de
iluminação conforme visto anteriormente, mas representa uma aproximação dele (SHI; SUN,
2000).
2.2 Métodos para a computação do fluxo óptico
Os métodos para a computação do fluxo óptico podem ser classificados em
três grupos principais: técnicas diferenciais, técnicas de correlação e técnicas baseadas em
freqüência/energia. Em (BEAUCHEMIN; BARRON, 1995) é possível encontrar uma extensa
referência sobre estes três grupos principais.
As técnicas baseadas em freqüência utilizam filtros sensíveis à orientação no
domínio da transformada de Fourier, pois movimentos aleatórios ou um padrão difícil de ser
detectado com métodos baseados em feições ou correlação, podem ser extraídos de uma
maneira relativamente fácil (VERNON, 1999). Outros trabalhos utilizam a transformada
wavelet para estimar o fluxo óptico (CASTELLANO; BOYCE; SANDLER, 2000; LIU;
ROSENFELD; CHELLAPPA, 2002; WU et al., 1998).
A técnica para computação do fluxo óptico baseada em correlação
(
matching
) é utilizada quando a diferenciação numérica é impraticável por causa de um
pequeno suporte temporal (poucos quadros) ou uma pequena razão sinal/ruído, dificultando os
métodos baseados em freqüência (BEAUCHEMIN; BARRON, 1995).
A correlação pode ser feita baseada em área ou em feições. Um problema
com a correlação baseada em feições é que nem sempre elas estão disponíveis para
estabelecer a correspondência, o que pode causar resultados fracos ou até mesmo errados.
Outro fator de complicação é a oclusão, implicando em erros na correlação (GIACHETTI,
2000; SHI; SUN, 2000).
Nas técnicas diferenciais a hipótese inicial para a computação do fluxo
óptico é a de que a intensidade entre quadros diferentes em uma seqüência de imagens é
aproximadamente constante em um intervalo de tempo pequeno (como é o caso na UMMD
com as câmaras de vídeo), ou seja, em um pequeno intervalo de tempo o deslocamento será
mínimo (HORN, 1986).
A velocidade da imagem é computada a partir das derivadas espaço-
temporal da intensidade na imagem. A intensidade na imagem (domínio) é assumida como
contínua (ou diferenciável) no espaço e no tempo. Isso pode ser escrito usando a seguinte
expressão (HORN; SCHUNCK, 1981):
(
)
(
)
ttxxItxI
+
+
,;
(1)
onde
(
)
txI ;
é a função de intensidade da imagem,
(
)
yxx ,
=
é o vetor posição na imagem e
x
é o deslocamento de uma região da imagem em
(
)
tx
;
após o tempo
t
.
Expandindo o lado direito da equação (1) por série de Taylor:
(
)
2
.;
OtIxItxI
t
+++
(2)
onde,
(
)
yx
III ,
=
é o gradiente espacial da intensidade;
t
I
a derivada parcial de primeira
ordem em relação ao tempo de
(
)
txI
;
, e
2
O
os termos de segunda ordem em diante, que em
geral podem ser desprezados. Igualando as equações (1) e (2), subtraindo
(
)
txI ;
em ambos os
lados e dividindo por
t
, têm-se:
0.0. =+=+
tt
IvII
t
x
I
(3)
onde
( )
==
t
y
t
x
vuv ,,
é a velocidade na imagem. A equação (3) é chamada de equação
de restrição do fluxo óptico e define uma restrição local única sobre o movimento na imagem
(BARRON; FLEET; BEAUCHEMIN, 1994; HORN; SCHUNCK, 1981).
Essa restrição não é suficiente para determinar as componentes de
v
, pois a
equação (3) possui duas incógnitas e então esse problema tem infinitas soluções (mal posto).
Somente a componente do movimento na direção do gradiente local da imagem pode ser
estimada.
Esse problema é conhecido como problema da abertura e é um termo
derivado da óptica (SHI; SUN, 2000) e somente nas regiões da imagem onde existe variação
de intensidade suficiente o movimento pode ser completamente estimado com o uso da
equação de restrição do fluxo óptico (equação 3).
Um item importante no problema da abertura é o fluxo óptico normal, que é
a componente do fluxo óptico na direção apontada pelo gradiente da intensidade local e é o
único movimento no plano da imagem que pode ser determinado.
A velocidade normal na direção do gradiente espacial
I
é dada por:
I
II
v
t
=
(4)
então o cálculo da derivada espaço-temporal permite a recuperação da velocidade normal.
A acurácia das técnicas diferenciais depende principalmente da estimação
das derivadas parciais da função de intensidade da imagem. O método de diferenças finitas é
o mais utilizado por ser simples, porém ele não consegue fazer a distinção entre dados
verdadeiros e ruídos e para eliminar ou reduzir esses problemas é realizada uma suavização na
imagem com um filtro gaussiano, por exemplo.
Alguns autores (ZHANG; LI; LI, 2002) propuseram uma filtragem espaço-
temporal para melhorar a acurácia da estimação do fluxo óptico em algoritmos diferenciais,
melhorando significativamente o erro da computação do fluxo na seqüência de imagens do
vale de Yosemite. A aplicação em imagens naturais, também mostrou uma melhora
qualitativa através do diagrama de agulhas, mas não teve medida quantitativa, pois não se
conhecia o verdadeiro movimento da cena.
Um algoritmo chamado na literatura de algoritmo de Lucas e Kanade
(BARRON; FLEET; BEAUCHEMIN, 1994) assume que o fluxo é constante em uma pequena
vizinhança denotada por
e usa uma função objetivo:
[
]
++
),(
2
2
),(
yx
tyx
IvIuIyxw
onde
),(
yxw
é uma janela que um peso maior na região central de
e o segundo termo
elevado ao quadrado é a equação de restrição do fluxo óptico (equação 3). A determinação do
fluxo se dá por mínimos quadrados.
Uma solução para casos de oclusão devido ao movimento utiliza três
imagens, computando o módulo da equação (3) para a imagem no tempo t - 1 e no tempo t +
1. O gradiente a ser usado na imagem do tempo t é o menor gradiente escolhido entre aqueles
dois (SUN; HAYNOR; KIM, 2000). Segundo os autores os problemas de oclusão são
minimizados dessa maneira.
Um método que combina o algoritmo de Horn e Schunck com o algoritmo
de Lucas e Kanade produziu bons resultados, apesar do custo computacional elevado para
aplicações em tempo real (BRUHN et al., 2003). Neste método, técnicas numéricas modernas
para resolução de sistemas de equações são utilizadas, combinando a qualidade do fluxo
óptico do algoritmo de Horn e Schunck com o método de Lucas e Kanade, o qual é robusto a
ruídos.
Para redução do número de vetores utilizado na computação do fluxo óptico
Oliveira e Roda (2002) utilizam o método de Cabestaing, que consiste em fazer a diferença
entre as imagens no tempo t e t + 1 e aplicar o filtro de Sobel para detectar as bordas em
movimento. O fluxo óptico é calculado nas regiões onde aparecem as diferenças.
Na prática, a condição de que a intensidade varia pouco entre os quadros,
dificilmente acontece na imagem toda e deve-se assumir que essas condições são satisfeitas
apenas localmente no plano da imagem. O grau em que essas condições são satisfeitas
determina a acurácia com a qual o fluxo óptico aproxima o movimento da imagem.
Métodos locais e globais de primeira e segunda ordem baseados na equação
(3) podem ser usados para computar o fluxo óptico. Nos métodos globais, junto com a
equação (3), uma restrição global deve ser adicionada, usualmente um termo de suavização,
para computar o fluxo óptico sobre grandes regiões da imagem. Métodos locais usam
informação da velocidade normal em uma vizinhança, ajustando a velocidade por mínimos
quadrados. O tamanho da vizinhança determina se uma técnica é global ou local (SHI; SUN,
2000).
O processo de se determinar o movimento 2D é complexo, pois, além de
envolver o movimento do sensor, existe o movimento de objetos na cena, que causam
oclusões, dificultando a estimação do fluxo óptico. Outro aspecto importante em situações
reais é a vibração da câmara, causada por ondulações e buracos na superfície de deslocamento
do veículo; também não deve ser desprezada a mudança de iluminação do ambiente, onde
sombras e nuvens modificam a intensidade das imagens.
2.3 Problema da abertura
O problema da abertura é um aspecto importante na computação do fluxo
óptico. Aberturas são janelas de várias formas, como circular, semicircular ou retangular. De
uma forma simplificada, o problema da abertura na análise do movimento se refere ao
problema que ocorre quando o movimento é observado através de uma abertura. Marr (1982)
mostrou que quando uma aresta em movimento é observada através de uma pequena abertura,
somente a componente do movimento ortogonal à aresta pode ser medido.
Na figura 10a um retângulo ABCD é localizado no plano XOZ. Uma janela
retangular EFGH com uma abertura circular é perpendicular ao eixo Y. As figuras 10b e 10c
mostram o que é observado quando o retângulo ABCD se move ao longo do eixo X e Z com
velocidade uniforme. Uma vez que a abertura circular é pequena e a reta AB é grande,
nenhum movimento é observado (figura 10b). Na figura 10c o movimento para cima pode ser
observado. Na figura 10d o canto superior direito do retângulo ABCD aparece. Neste caso a
translação ao longo de qualquer direção no plano XOZ pode ser observada.
a)
b)
c)
d)
Figura 10 - Problema da abertura
Fonte: adaptado de Shi e Sun (2000)
Este fenômeno ilustra o fato de que algumas vezes é impossível estimar o
movimento de um pixel somente observando uma pequena vizinhança dele. O único
movimento que pode ser estimado em uma pequena vizinhança é o movimento ortogonal à
borda. Na figura 10b não existe movimento ortogonal ao contorno AB em movimento; o
movimento é alinhado com a borda AB, o qual o pode ser observado pela abertura. Na
figura 10c o retângulo está subindo, e é ortogonal ao movimento horizontal do contorno AB.
Na figura 10d, qualquer translação no plano XOZ pode ser decomposta na horizontal e
vertical. Uma destas duas componentes é ortogonal a um dos contornos em movimento AB ou
BC.
Em regiões com grande variação na intensidade, como em cantos ou
texturas não uniformes, o movimento verdadeiro pode ser estimado. Em (SINGH apud SHI;
SUN, 2000) uma discussão mais apropriada é colocada, na qual o problema da abertura deve
sempre ser considerado, em menor ou maior grau, ao invés de um problema dicotômico
(existe ou não existe).
A estimação do movimento em seqüência de imagens, incluindo a estimação
do fluxo óptico, pertence à categoria de problemas inversos: procura-se inferir o movimento a
partir de imagens 2D, o qual é uma projeção perspectiva do movimento 3D. Um problema
matemático é bem posto se ele possui uma das três características (SHI; SUN, 2000):
i)
Existência: a solução existe;
ii)
Unicidade: a solução é única;
iii)
Continuidade: quando o erro nos dados tende a zero, o erro na solução também
tende a zero.
Problemas inversos geralmente não têm solução. No caso da esfera
rotacionando com velocidade uniforme e iluminação fixa, a solução da estimação do
movimento não é possível uma vez que nenhum movimento pode ser obtido a partir das
imagens. O problema da abertura é um caso no qual a solução do movimento pode não ser
única. Na figura 10b o é possível dizer unicamente se o contorno AB está parado ou se
movimentando horizontalmente. Se o contorno está se movimentando horizontalmente, não se
pode conhecer a velocidade.
Na determinação do fluxo óptico, a computação é sensível ao ruído, isto é, um
pequeno erro nos dados pode produzir um grande erro na solução. A estimação do movimento
a partir de uma seqüência de imagens tem os três aspectos negativos: não existência de
solução, o unicidade e descontinuidade, também referida como instabilidade na solução
(SHI; SUN, 2000).
Mas uma redução dos erros nos dados pode implicar em uma melhora
significativa na solução. A busca para melhorar os resultados de problemas mal postos
resultou em uma teoria unificada: a teoria da regularização de problemas mal postos. Em
muitos métodos de computação do fluxo óptico, são propostas técnicas de regularização para
tornar o problema bem posto e melhorar a acurácia da determinação do fluxo (SHI; SUN,
2000).
O fluxo óptico pode ser exatamente extraído do movimento da imagem se as
seguintes condições estiverem satisfeitas: iluminação uniforme, reflectância Lambertiana
(brilho igual em todas as direções) e translação paralela ao plano da imagem (BARRON;
FLEET; BEAUCHEMIN, 1994).
Apesar da computação do fluxo óptico ser uma área bastante explorada, a
redução do erro na estimação do fluxo ainda permanece um problema difícil. A literatura
apresenta poucos casos com imagens tomadas em ambientes externos e o controlados, o
que dificulta em muito as condições para estimação do fluxo. Além disso, nas ciências
cartográficas, poucos trabalhos foram feitos integrando todos de fluxo óptico e
fotogrametria.
2.4 Computação da velocidade translacional
Para estimar a velocidade da base no sentido do eixo Y, o seguinte modelo
para a velocidade translacional do veículo paralela ao eixo óptico da câmara é utilizado
(GIACHETTI; CAMPANI; TORRE, 1998; PRAZDNY, 1980):
2
2
y
hf
V
xy
f
v
fxy
hf
V
x
f
u
+=
++=
ω
ω
ω
(5)
onde
),( vu
são as componentes do vetor do fluxo óptico,
f
é a distância focal da câmara,
h
é a
altura da câmara a partir do chão,
ω
é a velocidade angular,
V
é a velocidade translacional e
),(
yx
são as coordenadas no plano da imagem.
As equações (5) descrevem o movimento 2D quando o veículo percorre um
piso plano com o cenário fixo, ou seja, é considerado apenas o movimento da câmara fixada
no teto do veículo. Esse tipo de movimento é conhecido como navegação passiva
(GIACHETTI; CAMPANI; TORRE, 1998) e os autores afirmam que a velocidade estimada
pode ser até 200% diferente da verdadeira.
Tomando n vetores do fluxo óptico, as equações (5) podem ser escritas
assim:
=
+
+
+
n
n
nnn
nnn
v
u
v
u
v
u
V
hf
y
f
yx
hf
yx
f
x
f
hf
y
f
yx
hf
yx
f
x
f
hf
y
f
yx
hf
yx
f
x
f
...
...
...
...
...
.......
2
2
1
1
2
2
2
222
22
2
2
2
111
11
2
1
ω
(6)
e em forma matricial:
1x21x22x2 nn
vVA
(7)
cuja solução estimada dada por uma regressão linear múltipla é:
vAAAV
tt
1
)(
ˆ
=
(8)
2.5 Algoritmo de Canny
A detecção de bordas em imagens é importante para estimar a estrutura e as
propriedades de objetos na cena chamadas de feições. Uma borda é o limite entre duas regiões
com distintos níveis de cinza (GONZALEZ; WOODS, 1992) e em geral expressam a
ocorrência de uma feição de interesse, como um poste ou a faixa central de uma rua ou
rodovia, no caso do mapeamento móvel (figura 11).
Figura 11 - Bordas detectadas com o algoritmo de Canny
Uma forma de detectar uma mudança da intensidade na imagem é verificar a
mudança ocorrida na derivada de primeira ordem (gradiente) da função intensidade. O
gradiente aponta para a direção da máxima taxa de mudança (positiva ou negativa) e a
magnitude do gradiente é a taxa máxima de incremento na direção do gradiente. Dessa forma
é possível detectar uma borda; além disso, a segunda derivada ou o laplaciano pode ser
utilizado para verificar se a variação ocorre de uma região de maior intensidade para a de
menor intensidade ou ao contrário, e com isso localizar com mais acurácia as bordas
(GONZALEZ; WOODS, 1992; MARR, 1982).
Os principais passos para a detecção de bordas são: filtragem, realce e
limiarização. A filtragem é necessária para reduzir o ruído presente na imagem, pois um ruído
também irá apresentar mudança no gradiente e pode resultar em uma borda falsa, mas uma
redução do ruído pode reduzir ou até mesmo eliminar bordas. O realce é o cálculo da
magnitude do gradiente e a limiarização consiste em determinar quais bordas serão
consideradas, pois não é possível saber o valor máximo da magnitude do gradiente que
realmente é uma borda.
Canny (1986) estabeleceu que um bom algoritmo detector de bordas deve
atender três condições básicas: i) detecção: deve haver uma baixa probabilidade de falhar ao
detectar verdadeiros pontos de borda e uma baixa probabilidade de detectar falsas bordas; ii)
localização: os pontos marcados como
bordas devem estar o mais próximo possível do centro
da verdadeira borda; iii) resposta única: deve haver apenas um máximo como resposta em
uma borda. Canny (1986) modelou matematicamente estas três condições e desenvolveu um
detector considerado ideal, que minimiza os ruídos e otimiza a localização das bordas na
imagem. O filtro ótimo encontrado por Canny (1986) pode ser aproximado pela derivada da
função gaussiana )(
xG
:
2
2
2
3
2
)('
σ
πσ
x
e
x
xG
=
(9)
cujo gráfico, com desvio-padrão (
) igual a 1 pode ser visto na figura 12.
Figura 12 - Derivada da função gaussiana
Como esta função é separável, ela pode ser aplicada em uma imagem
primeiro nas linhas, e em seguida nas colunas. O grau de suavização a ser utilizado depende
do desvio-padrão da função. Quanto maior for o valor de
mais borrada é a imagem
resultante e mais espessa se torna a borda, dificultando assim a sua localização exata.
Após a suavização da imagem, é computado o gradiente e os pontos de
máximo do gradiente são considerados inicialmente como bordas. Esse processo deixa as
bordas espessas e Canny (1986) propôs a supressão não máxima para eliminar os pixels que
não são máximos locais na direção do gradiente, deixando a borda afinada.
Para resolver o problema da fragmentação nas bordas é utilizado um
algoritmo chamado de histerese (CANNY, 1986; VALE; DAL POZ, 2002), que utiliza dois
limiares aplicados à magnitude da imagem: um limar alto T
a
e um limiar baixo T
b
.
Inicialmente faz-se a limiarização a partir do limiar alto (entre 80% e 90%). Todos os pixels
que estiverem acima de T
a
são classificados como pixels de borda. O limiar baixo é utilizado
para eliminar todos os pontos que estiverem abaixo de T
b
. Geralmente, o valor utilizado para
T
b
é a metade ou um terço de T
a
(Canny, 1986).
Para os pixels que ficaram entre T
a
e T
b
é verificado se estão entre duas
extremidades dos pixels classificados como borda, se estiveram são também classificados
como borda e o efeito é a redução de bordas fragmentadas.
Vale e Dal Poz (2002) apresentam mais detalhes sobre o algoritmo e
mostram uma aplicação em uma imagem aérea onde os efeitos dos parâmetros podem ser
notados. Uma outra aplicação com imagens de um SMMT é dada em Silva et al. (2004).
2.6 Correspondência
Um ponto importante e de difícil automação é o estabelecimento de
correspondência entre pontos homólogos (
matching
), principalmente em imagens com alta
variação de escala devido à projeção perspectiva, como é o caso das imagens obtidas com a
UMMD, pois um pixel de diferença entre a verdadeira posição da correspondência e o obtido
por algum algoritmo automático, pode resultar em uma grande diferença no terreno.
Em Galo (2003) é dado um algoritmo automático de rotulação por relaxação
combinado com várias medidas de similaridade e compatibilidade para realizar a
correspondência entre pares de imagens, utilizado para a orientação relativa dos mesmos.
Também pode ser encontrada uma ampla revisão sobre o problema da correspondência.
Neste trabalho é utilizada a correspondência baseada em área para duas
imagens com superposição a vante, ou seja, consiste em buscar, na imagem a vante, a região
que tenha a melhor correspondência com uma dada região na imagem de referência (imagem
inicial da seqüência) (figura 13).
(a)
(b)
Figura 13 - Arranjo para obtenção da correspondência – a) imagem tomada no tempo t
i
, b) imagem tomada no
tempo t
i+1
y’
x’
referência
y’’
x’’
busca
A função de correspondência usada para medir a similaridade foi o erro
quadrático:
( ) ( )
[ ]
yx
rx
x
ry
y
rr
tysxgyxf
tseq
=
=
++
=
1
0
1
0
2
,,
),(
(10)
onde :
)
,
(
t
s
eq
: erro quadrático na posição
),(
ts
na imagem de busca
),(
yxf
: é a região na imagem de referência
)
,
(
t
y
s
x
g
+
+
: é a região de busca
yx
rr ,
: quantidade de pixels na horizontal e vertical, respectivamente, na janela de busca.
Com esta função, a posição
),(
ts
onde ocorrer o menor valor é a posição que
contém a melhor correspondência. Esta posição é transformada em fotocoordenadas e então é
tomada como sendo as observações da imagem a vante para a fototriangulação.
3 MATERIAIS E MÉTODOS
Neste trabalho a computação do fluxo óptico é feita utilizando o método de
Horn e Schunck aplicado em uma seqüência de imagens obtidas com a UMMD. Com o fluxo
óptico computado a estimação da velocidade do móvel é utilizada como aproximação inicial
para o processo de orientação dos pares de imagens. Com o primeiro estéreopar o
selecionados manualmente pontos homólogos, que por interseção fotogramétrica, fornecem as
coordenadas dos pontos no terreno. Em seguida, para orientar os estéreopares seguintes, é
feita uma correlação a vante para determinar as observações (fotocoordenadas) utilizadas na
fototriangulação.
Após o levantamento com a UMMD, as câmaras de vídeo (Sony DSR
200A) o ligadas a uma estação de processamento de vídeo digital (computador HP Server
tc2120, Pentium 2,66 GHZ com 1GB de memória RAM) e os vídeos são transferidos para o
disco rígido. Em seguida, o deo é processado e as imagens de interesse são recortadas e
transformadas em imagens estáticas (
still images
) no formato BMP de 24 bits. São nestas
imagens que o fluxo óptico, a detecção de bordas e a correlação a vante são calculados.
A técnica escolhida para implementação do fluxo óptico foi a diferencial,
usando-se o algoritmo de Horn e Schunck, pelos seguintes motivos: 1) é uma técnica clássica
e relativamente fácil de implementar; 2) a alta taxa de amostragem dos quadros nas maras
de vídeo e a baixa velocidade do veículo implicam em uma mudança diferencial entre os
quadros, o que naturalmente leva aos algoritmos diferenciais.
3.1 Método de Horn e Schunck
Horn e Schunck (1981) usaram uma forma de regularização aplicada à
equação (3), chamada de restrição de suavização, significando que o fluxo óptico varia de
uma imagem para outra de forma suave. Matematicamente a restrição de suavização é dada
pela minimização do quadrado da magnitude do gradiente dos vetores do fluxo óptico:
2222
yxyx
vvuu +++
(11)
A determinação do fluxo óptico pode ser convertida em um problema de
minimização. Tomando o quadrado do lado esquerdo da equação (3) como um tipo de erro e a
equação (11) como outro tipo de erro, o erro total a ser minimizado é:
(
)
(
)
(
)
2222
22
,
yxyxtyx
vvuuIvIuIyxE ++++++=
λ
(12)
onde
λ
é um peso entre os dois tipos de erro. Usando técnicas do cálculo variacional, o
seguinte sistema de equações pode ser escrito (SONKA; HLAVAC; BOYLE, 1999):
(
)
( )
tyxyx
txyxx
IIvvIuII
IIuvIIuI
=++
=++
222
222
λλ
λλ
(13)
onde
u
e
v
são os valores médios do fluxo na vizinhança de
),(
yx
. A solução para essas
equações é dada por:
D
P
Ivv
D
P
Iuu
y
x
=
=
(14)
onde
vIuIP
yx
+=
e
222
yx
IID ++=
λ
.
A estimação das derivadas é feita pelo método das diferenças finitas, por
ser simples e o custo computacional baixo, apesar de o distinguir o ruído e o sinal
(imagem). A estimação das derivadas parciais é feita considerando uma vizinhança espaço-
temporal (figura 14).
Figura 16: Estimação das derivadas parciais.
Fonte: Adaptado de Shi and Sun, 2000.
Figura 14 - Estimação das derivadas parciais
Fonte: adaptado de Shi e Sun (2000)
(x,y,t+1)
(x,y+1,t+1)
(x+1,y+1,t+1)
(x+1,y,t+1)
(x+1,y,t)
(x+1,y+1,t)
(x,y+1,t)
(x,y,t)
t
y
x
As derivadas parciais em x, y e t são dadas por (HORN; SCHUNCK, 1981):
[
]
[
]
[ ] [ ]
++++++++
++++++
=
)1,1,()1,1,1(),,(),1,1(
)1,,()1,,1(),,(),,1(
4
1
tyxItyxItyxItyxI
tyxItyxItyxItyxI
I
x
[
]
[
]
[ ] [ ]
+++++++++
+++++++
=
)1,,1()1,1,1()1,,()1,1,(
),,1()1,1,1(),,(),1,(
4
1
tyxItyxItyxItyxI
tyxItyxItyxItyxI
I
y
[
]
[
]
[ ] [ ]
++++++++
++++++
=
),,1()1,1,1(),1,()1,1,(
),,1()1,,1(),,()1,,(
4
1
tyxItyxItyxItyxI
tyxItyxItyxItyxI
I
t
(15)
e as médias das componentes
u
e
v
como segue (HORN; SCHUNCK, 1981):
[ ]
[ ]
)1,1()1,1()1,1()1,1(
12
1
),1(),1()1,()1,(
6
1
+++++++
++++++=
yxuyxuyxuyxu
yxuyxuyxuyxuu
[ ]
[ ]
)1,1()1,1()1,1()1,1(
12
1
),1(),1()1,()1,(
6
1
+++++++
++++++=
yxvyxvyxvyxv
yxvyxvyxvyxvv
(16)
O fluxo óptico é computado aplicando o método iterativo de Gauss-Seidel
em duas imagens consecutivas. Um algoritmo para computar o fluxo óptico é dado abaixo
(SONKA; HLAVAC; BOYLE, 1999):
1 Iniciar os vetores velocidade
(
)
0,
=
jiv
, para todo
(
)
ji
,
2. Computar os valores de
kk
vu , para todos os pixels
(
)
ji, :
( ) ( ) ( )
(
)
( )
( ) ( ) ( )
( )
( )
jiD
jiP
jiIjivjiv
jiD
jiP
jiIjiujiu
y
kk
x
kk
,
,
,,,
,
,
,,,
1
1
=
=
3. Parar se
(
)
ε
<
i j
jiE
2
,
onde ε é o erro máximo permitido; retornar ao passo 2 caso contrário.
Se mais do que duas imagens estão sendo processadas, a eficiência da
computação pode ser incrementada usando os resultados de uma iteração para iniciar a
seguinte em um algoritmo seqüencial:
1. Avaliar os valores iniciais do fluxo óptico
(
)
jiv , , para todo
(
)
ji,
2. Seja m o número da imagem na seqüência. Para todos os pixels da
próxima imagem calcular:
( ) ( ) ( )
(
)
( )
( ) ( ) ( )
( )
( )
jiD
jiP
jiIjivjiv
jiD
jiP
jiIjiujiu
y
mm
x
mm
,
,
,,,
,
,
,,,
1
1
=
=
+
+
3. Repita o passo 2 para todas as imagens da seqüência.
Determinar o erro máximo permitido o é uma tarefa fácil, e em geral,
utiliza-se um número máximo de iterações que também não é facilmente estipulado. Uma
análise qualitativa do fluxo óptico em um SMMT pode ser visto em Barbosa et al. (2005).
3.2 Regiões de interesse
No caso específico da UMMD o movimento é sempre a vante, com exceção
das curvas, que não são tratadas neste trabalho. Com esse movimento, o fluxo óptico é radial e
pode ser analisado em cada região, numeradas de 1 a 4 (em algarismo romano na figura 15) e
aqui chamadas de regiões de interesse.
Figura 15 - Regiões de interesse
A região o numerada é o horizonte e muito distante das câmaras. As
feições de interesse em geral, aparecem nas regiões I, II, III e IV que são áreas onde estão os
postes, a guia do arruamento, sinais de trânsito etc. Nas regiões II e III aparece o piso da rua
ou da rodovia. Em todas essas regiões, o fluxo óptico esperado é radial (figura 16).
Na região I e II a componente
u
é negativa e a componente
v
é positiva
(figura 16a); nas regiões III e IV, as componentes
u
e
v
são positivas (figura 16b).
a) b)
Figura 16 - Padrão esperado para o fluxo óptico nas regiões a) I e II , b) III e IV
Com uma seqüência de imagens preparada e antes da computação do fluxo
óptico, as mesmas são transformadas em tons de cinza usando-se a equação de luminância
(GONZALEZ; WOODS, 1992):
BGRL 114,0586,0299,0
+
+
=
(17)
onde R, G e B são os canais das cores vermelho (red), verde (green) e azul (blue)
respectivamente. Em seguida é feita a suavização gaussiana espacial em cada imagem para
redução de ruídos.
3.3 Cálculo da velocidade translacional estimada em duas etapas
A estimação da velocidade translacional (equação 6) utilizando o fluxo
denso não é viável, tanto do ponto de vista computacional como da qualidade do resultado,
pois o mesmo apresenta muito ruído que afeta a precisão do cálculo. Para reduzir a quantidade
de vetores utilizada na estimação da velocidade translacional, cada vetor é filtrado da seguinte
maneira:
deve estar nas regiões de interesse;
ter o comportamento radial esperado em cada região e
ser um ponto detectado pelo algoritmo de Canny.
Além desta filtragem outra estratégia é utilizada para reduzir as influências
de erros grosseiros (outliers) na estimação da velocidade translacional. Esta estratégia
consiste em realizar uma segunda etapa usando os vetores do fluxo óptico que apresentam um
resíduo dentro do intervalo:
(
)
urur
susu
+
, e
(
)
vrvr
svsv
+
, (18)
onde
n
uu
u
n
i
ii
r
=
=
1
)
ˆ
(
é a média dos resíduos para a componente
u
do fluxo óptico
(equações 3 e 4),
u
s é o desvio-padrão dos resíduos para a componente
u
,
n
vv
v
n
i
ii
r
=
=
1
)
ˆ
(
é a média dos resíduos para a componente
v
do fluxo óptico e
v
s é o desvio-padrão dos
resíduos para a componente
v
Na primeira etapa, a velocidade é estimada e os intervalos acima são
calculados. Na segunda etapa, todos os vetores do fluxo óptico que apresentam resíduos
dentro deste intervalo (para
u
e
v
) são usados para recalcular a velocidade.
3.4 Equações de colinearidade para o caso terrestre
Com um estéreopar inicial são coletadas fotocoordenadas de pontos em
feições de interesse nas imagens da esquerda e direita do primeiro estéreopar. Para isso, é
necessário fazer uma transformação geométrica linear do sistema de coordenadas da imagem
(dadas em pixels)
),(
pp
yx
para um sistema de fotocoordenadas
),(
ff
yx
de uma imagem
digital dado em milímetros (figura 17).
Figura 17 - Sistemas de fotocoordenadas e da imagem
O sistema de fotocoordenadas de uma imagem digital tem o eixo
f
x
paralelo ao eixo
p
x
e o eixo
f
y
refletido em relação ao eixo
p
y
, cuja transformação é:
=
5.0
5.0
10
01
0
0
cp
cp
py
px
f
f
yy
xx
t
t
y
x
onde
px
t
é o tamanho do pixel na horizontal e
py
t
é o tamanho do pixel na vertical,
c
x
e
c
y
o
centro da imagem em coordenadas pixel.
Para posicionar e orientar o segundo estéreopar de imagens é necessário
conhecer pontos no terreno. Os elementos de orientação interior das câmaras ),,,(
100
kfyx
são determinados por autocalibração fotovariante. A posição damara da esquerda é tomada
como o sistema de referência local para os pontos no espaço objeto. Como a base é conhecida
- por construção mede 0,94m - tem-se também a posição aproximada da mara da direita. O
x
p
y
f
x
f
y
p
fluxo óptico fornece a velocidade translacional e consequentemente a posição (dada pelo
deslocamento) do segundo par.
As equações de colinearidade usadas foram (WOLF, 1983) acrescidas do
ponto principal e de um elemento da distorção radial:
( )
( )
+=
+=
2
100
2
100
rkyy
D
N
fyy
rkxx
D
N
fxx
y
x
(19)
onde:
),( yx
: fotocoordenadas (mm)
(
)
00
, yx
: coordenadas do ponto principal em relação ao centro da imagem (mm)
f
: distância focal (mm)
1
k : distorção radial simétrica (mm
-2
)
( ) ( )
2
0
2
0
yyxxr
+=
: distância das fotocoordenadas ao ponto principal
(
)
(
)
(
)
( ) ( ) ( )
( ) ( ) ( )
ccc
cccy
cccx
YYrZZrXXrD
YYrZZrXXrN
YYrZZrXXrN
++=
++=
+
+
=
333231
232221
131211
),,( ZYX
: coordenadas de pontos no espaço objeto (m)
),,(
ccc
ZYX : coordenadas do centro perspectivo (m)
onde
ij
r
são os elementos da matriz de rotação
R
(equação 20):
==
333231
232221
131211
rrr
rrr
rrr
RRRR
κϕω
em relação aos ângulos eulerianos
ω
,
ϕ
e
κ
:
++
++
=
ϕωϕωϕ
κωκϕωκωκϕωκϕ
κωκϕωκωκϕωκϕ
coscoscos
coscoscoscoscos
coscoscoscoscoscos
sensen
sensensensensensensen
sensensensensensen
R
(20)
A geometria da condição de colinearidade no caso terrestre é mostrada na
figura 18.

y
z
x
ω
κ
φ
X
A
Z
A
Z
C
Y
A
Y
C
X
C
X
A
Z
C
X
Z
Y
c
Figura 18 - Geometria da condição de colinearidade para o caso terrestre
Fonte: adaptado de Wolf (1983)
Para calcular os pontos no terreno foram usadas as equações:
=
Y
Z
X
R
f
yy
xx
λ
0
0
(21)
onde
=
c
C
c
YY
ZZ
XX
Y
Z
X
(22)
aplicando a inversa da matriz de rotação aos dois lados da equação (21):
=
=
=
C
C
C
YY
ZZ
XX
f
yy
xx
rrr
rrr
rrr
Y
Z
X
RR
f
yy
xx
R
0
0
332313
322212
312111
1
0
0
1
1
λ
λ
multiplicando o lado esquerdo:
(
)
(
)
( ) ( )
( ) ( )
=
++
++
++
C
C
C
YY
ZZ
XX
fryyrxxr
fryyrxxr
fryyrxxr
33023013
32022012
31021011
1
λ
Dividindo as duas primeiras linhas pela última:
(
)
(
)
( ) ( )
( ) ( )
( ) ( )
=
++
++
++
++
C
C
C
C
YY
ZZ
YY
XX
fryyrxxr
fryyrxxr
fryyrxxr
fryyrxxr
33023013
32022012
33023013
31021011
(23)
de forma resumida para as fotocoordenadas e matriz de rotação da esquerda:
e
C
e
C
e
e
y
e
C
e
C
e
e
x
YY
ZZ
D
N
YY
XX
D
N
=
=
(24)
para as fotocoordenadas e matriz de rotação da direita:
d
C
d
C
d
d
y
d
C
d
C
d
d
x
YY
ZZ
D
N
YY
XX
D
N
=
=
(25)
Isolando X na equação (24)
( )
e
c
e
e
x
e
C
YY
D
N
XX +=
e substituindo na equação (25) para isolar Y, tem-se:
=
e
e
x
d
d
x
e
C
e
e
x
d
C
e
C
D
N
D
N
Y
D
N
XX
Y (26)
com Y calculado as coordenadas X e Z são calculadas:
( )
e
c
e
e
x
e
C
YY
D
N
XX
+=
1
( )
d
c
d
d
x
d
C
YY
D
N
XX +=
2
(27)
com
2
21
XX
X
+
= e
( )
e
c
e
e
y
e
C
YY
D
N
ZZ
+=
1
( )
d
c
d
d
x
d
C
YY
D
N
ZZ +=
2
(28)
com
2
21
ZZ
Z
+
=
3.5 Correspondência a vante
Com as equações (26-28) m-se as coordenadas no terreno calculadas para
as fotocoordenadas coletadas no primeiro estéreopar. Com esses pontos no terreno e com as
aproximações iniciais para as posições e orientações é feita inicialmente uma resseção
espacial dupla para a primeira base.
Em seguida é feita a correlação a vante entre as imagens no tempo t
i
e no
tempo t
i+1
, tanto para a seqüência da esquerda quanto para a seqüência da direita (figura 19).
Primeiramente, com a equação de colinearidade e o avanço da base estimada, é aberta uma
janela para se fazer a correlação por área entre fotocoordenadas na imagem t
i
(alvo) e
t
i+1
(busca), a posição na janela de busca onde ocorrer a melhor correspondência (equação 10)
é o ponto
p’’
correspondente ao ponto
p’
, dessa forma, se obtém as observações nas imagens
subseqüentes.
Figura 19 - Ilustração da correspondência a vante
Com o avançar da base é possível que os pontos no terreno o apareçam
em uma ou nas duas imagens do par seguinte e, portanto, são retirados das respectivas
imagens. Se necessário é enviado um aviso ao operador e mais fotocoordenadas devem ser
coletadas manualmente para que o caminhamento possa prosseguir.
De posse das fotocoordenadas do segundo estéreopar é realizada uma
fototriangulação com as duas bases (quatro imagens) para ajustar a posição e a orientação do
segundo par. A estratégia prossegue para as bases subseqüentes e consequentemente a
quantidade de bases no ajustamento vai crescendo, até chegar ao limite estabelecido de bases
que se dá ao final do intervalo de um segundo.
3.6 Autocalibração fotovariante
O modelo matemático funcional utiliza as equações de colinearidade
(equação 19) que relacionam as variáveis do problema: fotocoordenadas (observações de dois
ou mais estéreopares), parâmetros de orientação exterior (posição do CP e ângulos eulerianos)
das imagens, parâmetros de orientação interior ),,,(
100
kfyx de cada imagem e coordenadas
),,( ZYX
do espaço objeto (pontos no terreno).
O modelo de ajustamento de observações utilizado com o propósito de
estimar a solução única é o paramétrico com injunções aos parâmetros (GEMAEL, 1994;
UOTILA, 1986) e o modelo estocástico é dado pelas matrizes
P
e
X
P
, conforme as equações
29:
(
)
( )
==
==
12
0
12
0
,
,
X
LXaX
Lbaa
PXGL
PXFL
Σσ
Σσ
(29)
:
a
L
vetor das observações ajustadas
:
a
X
vetor dos parâmetros ajustados
P
: matriz (diagonal) com os pesos dos parâmetros
:
X
L
vetor do “erro de fechamento” do modelo injuncional
X
P : matriz (diagonal) com os pesos das injunções
1
Lb
Σ
: matriz variância covariância das observações
1
X
L
Σ
: matriz variância covariância das injunções
O modelo matemático funcional é não linear e portanto requer a linearização
por séries de Taylor e cuja forma final é (GEMAEL, 1994; UOTILA, 1986):
=+=
=+=
12
0
0
0
12
0
,
ˆ
,
ˆ
X
LXbX
Lb
PXXXV
PLXAV
Σσ
Σσ
(30)
onde
ba
LLL
=
V
: vetor dos resíduos das fotocoordenadas
X
V
: vetor dos resíduos das injunções
X
ˆ
: vetor das correções aos parâmetros
0
0
X
:
vetor das aproximações iniciais dos parâmetros
b
X
: vetor das pseudo-observações
b
L
: vetor das fotocoordenadas observadas
A
: matriz das derivadas parciais em relação aos parâmetros de orientação
exterior, interior e coordenadas dos pontos no terreno
A aplicação do método dos mínimos quadrados, com uso de pesos, resulta
na seguinte solução para a equação 30:
(
)
(
)
+=
++=
12
0
ˆ
1
)(
ˆ
ˆ
X
t
X
XX
t
X
t
PPAA
LPPLAPPAAX
σΣ
(31)
A solução da equação (31) requer iterações por causa da não linearidade do
modelo matemático funcional.
A variância a posteriori, que serve de medida para a qualidade global do
ajustamento é dada por:
unn
VPVPVV
X
XX
t
X
t
+
+
=
2
0
ˆ
σ
(32)
onde
n
é o número de equações de observações,
x
n o número de equações de injunções e
u
o total de parâmetros.
As derivadas parciais das equações de colinearidade em relação aos
parâmetros são apresentadas no Apêndice A e a matriz formada pelas derivadas do modelo
estocástico em relação às injunções é uma matriz identidade.
A configuração inicial para a matriz
A
apenas com as derivadas parciais em
relação aos parâmetros é mostrada na figura 20.
Figura 20 - Esquema da matriz A
Descrição das sub-matrizes de
A
:
- derivadas parciais das fotocoordenadas em relação aos parâmetros de orientação exterior
(posição e ângulo) da primeira foto esquerda (m
1
x 6)
- derivadas parciais das fotocoordenadas em relação aos parâmetros de orientação exterior
(posição e ângulo) da primeira foto direita (m
1
x 6)
- derivadas parciais das fotocoordenadas em relação aos parâmetros de orientação exterior
(posição e ângulo) da segunda foto esquerda (m
2
x 6)
- derivadas parciais das fotocoordenadas em relação aos parâmetros de orientação exterior
(posição e ângulo) da segunda foto direita (m
2
x 6)
- derivadas parciais das fotocoordenadas em relação aos parâmetros de orientação interior
primeira foto esquerda (m
1
x 4)
- derivadas parciais das fotocoordenadas em relação aos parâmetros de orientação interior
primeira foto direita (m
1
x 4)
- derivadas parciais das fotocoordenadas em relação aos parâmetros de orientação interior
segunda foto esquerda (m
2
x 4)
- derivadas parciais das fotocoordenadas em relação aos parâmetros de orientação interior
segunda foto direita (m
2
x 4)
- - derivadas parciais das fotocoordenadas em relação aos parâmetros do terreno primeira
foto esquerda (m
1
x 3)
- - derivadas parciais das fotocoordenadas em relação aos parâmetros do terreno primeira
foto direita (m
1
x 3)
- - derivadas parciais das fotocoordenadas em relação aos parâmetros do terreno segunda
foto esquerda (m
2
x 3)
- - derivadas parciais das fotocoordenadas em relação aos parâmetros do terreno segunda
foto direita (m
2
x 3)
Onde m
1
e m
2
são a quantidade de fotocoordenadas do primeiro par e do
segundo par respectivamente.
Sendo
t
n o número de pontos no terreno, o número total de equações de
observações é
t
nfotostotaln *_*4
=
, o número de injunções
tx
nn *3
=
e o número de
parâmetros
x
nfotostotalu
+
=
_*10 .
3.7 Injunção da base e da velocidade
Além das coordenadas dos pontos no terreno serem tomados como
injunções, foram utilizadas duas outras funções de injunções: da base e da velocidade.
A equação de injunção para a base é:
(
)
(
)
(
)
2
d
C
e
C
2
d
C
e
C
2
d
C
e
Ci
ZZYYXXB ++=
(33)
Quando a velocidade é tomada como parâmetro, as equações de
colinearidade podem ser reescritas para se determinar a velocidade do centro perspectivo
(GOSH, apud KOYAMA; HASEGAWA, 2002):
(
)
(
)
(
)
( ) ( ) ( )
( ) ( ) ( )
( ) ( ) ( )
YczcXc
YczcXc
YczcXc
YczcXc
tVYYrtVZZrtVXXr
tVYYrtVZZrtVXXr
fy
tVYYrtVZZrtVXXr
tVYYrtVZZrtVXXr
fx
++
++
=
++
+
+
=
333231
232221
333231
131211
(34)
onde
X
tV
,
Y
tV
e
Z
tV
é o deslocamento entre duas bases consecutivas do centro
perspectivo. A equação para a velocidade utiliza a distância percorrida (dada pelo
deslocamento da base) dividida pelo tempo. Foram calculadas velocidades para a câmara da
esquerda e da direita, nas três componentes (X, Y, Z):
t
XX
V
e
C
e
C
e
X
i1i
=
+
, velocidade na componente X entre a base i e i + 1
t
YY
V
e
C
e
C
e
Y
i1i
=
+
, velocidade na componente Y entre a base i e i + 1
t
ZZ
V
e
C
e
C
e
Z
i1i
=
+
, velocidade na componente Z entre a base i e i + 1
3.8 Diagrama de blocos simplificado da metodologia
Como a velocidade estimada pelo fluxo é a translacional (componente Y), as
observações para as componentes X e Z são nulas. A estimação da velocidade é feita
utilizando o módulo do vetor velocidade.
Foram implementados vários programas em ambiente Builder 5.0. O
primeiro deles tem como entrada as imagens em formato “bmp” que compõem uma seqüência
da esquerda e da direita e calcula o fluxo óptico denso em cada seqüência, gerando um
arquivo texto que será utilizado pelo programa que estima a velocidade translacional. Um
outro programa, detecta as bordas utilizando o algoritmo de Canny, gerando também um
arquivo texto com os pontos que foram detectados.
A estimação da velocidade é feita utilizando como dados de entrada o fluxo
óptico denso e os pontos detectados pelo algoritmo de Canny. O último programa,
implementa as quatro formas de autocalibração fotovariante e tem como dados de entrada as
fotocoordenadas medidas manualmente no primeiro par, o avanço da base e a velocidade de
cada base, dados pelo programa de estimação da velocidade. A figura 21 ilustra de forma
simplificada a metodologia proposta.
Figura 21 – Diagrama de blocos simplificado da metodologia
4. EXPERIMENTOS, RESULTADOS E DISCUSSÕES
Este capítulo está dividido em quatro partes: a primeira mostra os
experimentos e resultados obtidos com a computação do fluxo óptico em quatro seqüências,
variando-se o parâmetro de regularização lambda; a segunda parte contém a estimação da
velocidade monocular das seqüências com variação no conjunto de parâmetros do algoritmo
de Canny combinado com o parâmetro de regularização lambda; a terceira exemplifica a
filtragem com a eliminação dos vetores do fluxo óptico com resíduo padronizado acima de
um desvio-padrão. A quarta parte trata da orientação exterior das bases a partir de
fotocoordenadas coletadas manualmente no primeiro par com aproximação da posição das
bases subseqüentes dada pela estimação da velocidade.
4.1 Computação do fluxo óptico
Como as imagens são capturadas a uma taxa de 30 quadros por segundo,
isso naturalmente leva a escolha do método seqüencial para a computação do fluxo óptico
(BARBOSA et al., 2005), evitando a determinação da quantidade de iterações para tal
computação. Portanto, é necessário determinar o espaçamento do fluxo e o fator lambda.
Como a metodologia pressupõe o uso dos pontos que são detectados pelo algoritmo de Canny,
será computado o fluxo denso, restando a determinação do fator lambda.
Foi escolhida uma seqüência de estéreopares com dois segundos e 60
imagens cada. Essa seqüência de estéreopares foi dividida em seqüência s1e (primeiro
segundo da câmara esquerda), s1d (primeiro segundo da câmara direita), s2e (segundo
seguinte da câmara esquerda) e s2d (segundo seguinte da câmara direita). O par de seqüência
do primeiro segundo é identificado por s1 e o par de seqüência do segundo seguinte é
identificado por s2.
Os experimentos da tabela 1 foram planejados para uma análise qualitativa
da computação do fluxo óptico.
Tabela 1 - Experimentos com a computação do fluxo óptico
Exp.
Seqüência
λ
Exp.
Seqüência
λ
Exp.
Seqüência
λ
1 s1e 1
9
s1e 20
17 s1e 40
2 s1d 1
10
s1d 20
18 s1d 40
3 s2e 1
11
s2e 20
19 s2e 40
4 s2d 1
12
s2d 20
20 s2d 40
5 s1e 10
13
s1e 30
21 s1e 50
6 s1d 10
14
s1d 30
22 s1d 50
7 s2e 10
15
s2e 30
23 s2e 50
8 s2d 10
16
s2d 30
24 s2d 50
A figura 22 ilustra os resultados qualitativos obtidos com os experimentos
mostrados na tabela 1. O diagrama de agulhas está com espaçamento 5 x 5 pixels. Pode-se
observar pelas figuras, que o fluxo óptico apresenta, em geral, o comportamento radial
esperado para o tipo de deslocamento do veículo. Na medida em que o valor de lambda
aumenta a quantidade de vetores do fluxo se reduz, mantendo-se principalmente nas bordas
das feições de interesse nas imagens. Outra observação é o comportamento semelhante entre a
seqüência da esquerda e da direita.
Na seqüência s2 o fluxo apresenta um comportamento com mais ruído
(vetores fora do padrão radial), conforme evidenciado na figura 22c e 22d. Esse
comportamento pode ser creditado à mudança de iluminação existente nestas imagens.
A análise quantitativa do fluxo óptico será feita em conjunto com os
parâmetros do algoritmo de Canny na estimação da velocidade.
a) Fluxo experimento 1 b) Fluxo experimento 2
c) Fluxo experimento 3 d) Fluxo experimento 4
e) Fluxo experimento 5 f) Fluxo experimento 6
g) Fluxo experimento 7 h) Fluxo experimento 8
i) Fluxo experimento 9 j) Fluxo experimento 10
l) Fluxo experimento 11 m) Fluxo experimento 12
n) Fluxo experimento 13 o) Fluxo experimento 14
p) Fluxo experimento 15 q) Fluxo experimento 16
r) Fluxo experimento 17 s) Fluxo experimento 18
t) Fluxo experimento 19 u) Fluxo experimento 20
v) Fluxo experimento 21 x) Fluxo experimento 22
z) Fluxo experimento 23 w) Fluxo experimento 24
Figura 22 - Fluxos dos experimentos da tabela 1
4.2 Estimação da velocidade
A estimação da velocidade foi feita utilizando o fluxo óptico monocular
(equação 8) filtrando os vetores que apresentaram padrão radial nas regiões de interesse e que
foram detectados pelo algoritmo de Canny. A velocidade utilizada como “verdadeira” é
estimada pelo GPS com valor de 19,83 km/h para a seqüência s1
e 19,75 km/h para a
seqüência s2.
Os valores utilizados na equação 5 foram: altura da câmara
mh 2,2
=
e
distância focal (dada em pixels)
597,880
=
f
(equivalente a 5,9 mm). Embora o modelo trate
da rotação translacional, a mesma o é de interesse imediato e, portanto, os resultados não
são apresentados.
Como a metodologia proposta utiliza no cômputo da velocidade os pontos
que foram detectados pelo algoritmo de Canny, inicialmente é necessário estabelecer o
conjunto de parâmetros (sigma, limiar alto e baixo) que apresenta os melhores resultados para
a computação da velocidade. Estes três parâmetros são dependentes do conteúdo da imagem e
devem ser determinados de forma empírica, observadas algumas condições, como por
exemplo, a quantidade de pontos detectados.
Foram realizados experimentos combinando variações nestes parâmetros
(tabela 2), chamados de conjuntos. Os resultados de cada experimento se referem a média da
velocidade de cada seqüência com 30 imagens e 29 fluxos.
Tabela 2 - Conjuntos de parâmetros para o algoritmo de Canny
Conj.
σ
T
a
(%) T
b
(%) Conj.
σ
T
a
(%) T
b
(%) Conj.
σ
T
a
(%) T
b
(%)
1 2,0 95 80 10 1,5 95 80 19 1,0 95 80
2 2,0 95 70 11 1,5 95 70 20 1,0 95 70
3 2,0 95 60 12 1,5 95 60 21 1, 0 95 60
4 2,0 90 80 13 1,5 90 80 22 1, 0 90 80
5 2,0 90 70 14 1,5 90 70 23 1, 0 90 70
6 2,0 90 60 15 1,5 90 60 24 1, 0 90 60
7 2,0 85 80 16 1,5 85 80 25 1, 0 85 80
8 2,0 85 70 17 1,5 85 70 26 1, 0 85 70
9 2,0 85 60 18 1,5 85 60 27 1, 0 85 60
Como visto anteriormente, a comparação quantitativa da computação do
fluxo óptico será feita com a estimação da velocidade, dessa maneira, os fluxos das
seqüências foram computados usando o algoritmo seqüencial variando o parâmetro λ = 1, 10,
20, 30, 40 e 50 para cada conjunto de parâmetros da tabela 2.
Tabela 3 - Experimentos com parâmetros de Canny: λ = 1 e seqüência s1
Esquerda Direita
conj. vel dp vel vet dp vet vel dp vel vet dp vet
1
19,06 3,26 949,17 290,94 18,78 1,95 809,59 263,71
2
19,22 3,78 1.173,52 376,14 18,17 1,87 926,21 311,74
3
19,01 3,70 1.288,41 430,54 17,27 1,93 1.022,34 338,03
4
12,53 2,59 2.145,31 591,24 10,97 1,50 1.989,66 606,18
5
12,23 2,53 2.222,62 614,00 10,85 1,57 2.037,31 620,01
6
12,03 2,63 2.256,41 618,54 10,87 1,54 2.054,28 625,02
7
9,88 1,75 3.109,45 922,84 11,00 1,25 2.853,72 928,52
8
9,54 1,51 3.483,93 1.015,42 10,78 1,23 3.351,45 1.162,71
9
9,51 1,49 3.505,79 1.045,22 10,78 1,23 3.351,45 1.162,71
10
17,30 5,03 1.178,90 373,44 18,01 2,01 932,07 298,49
11
17,56 4,72 1.356,34 419,93 17,35 2,10 1.035,17 343,22
12
17,21 4,85 1.483,17 458,13 16,89 1,90 1.136,21 373,34
13
12,03 2,65 2.349,45 637,90 11,21 1,47 2.057,45 615,87
14
11,70 2,67 2.431,24 669,01 11,11 1,42 2.121,03 624,13
15
11,31 2,66 2.537,45 706,16 11,04 1,54 2.150,62 632,14
16
10,00 1,76 3.387,86 928,25 11,29 1,42 3.472,28 983,48
17
9,84 1,59 3.740,48 1.020,20 11,26 1,41 3.583,59 1.096,38
18
9,80 1,54 3.999,45 1.096,61 11,13 1,46 4.056,97 1.214,76
19
15,21 6,30 1.277,72 391,36 15,65 1,94 1.036,62 330,74
20
15,30 6,14 1.468,69 466,00 14,74 2,39 1.145,10 378,96
21
14,93 6,06 1.620,14 528,19 14,98 2,25 1.250,41 419,32
22
11,53 2,49 2.644,76 713,90 11,36 1,53 2.209,79 684,21
23
11,21 2,38 2.726,41 726,64 11,31 1,44 2.312,76 699,97
24
10,76 2,19 2.863,24 771,10 11,19 1,43 2.395,59 721,41
25
10,37 1,69 4.527,59 1.159,65 11,43 1,57 4.147,93 1.151,10
26
10,32 1,62 4.915,72 1.250,32 11,26 1,59 4.783,72 1.301,42
27
10,29 1,58 5.328,41 1.340,38 11,08 1,61 5.307,31 1.421,50
Na tabela 3 e nas seguintes, vel significa a velocidade em km/h, dp vel é o
desvio-padrão da velocidade, vet é a quantidade de vetores e dp vet o desvio-padrão da
quantidade de vetores. O conjunto 1 forneceu os maiores valores para a velocidade e a média
(esquerda e direita) foi de 18,92 km/h, a mais próxima da velocidade “verdadeira”. Percebe-se
também que a medida em que a quantidade de vetores aumenta, a estimativa da velocidade se
deteriora. Para um dado sigma, se o limiar alto (T
a
) vai diminuindo a velocidade também é
reduzida, pois existe um acréscimo no número de vetores.
Tabela 4 - Experimentos com parâmetros de Canny: λ = 1 e seqüência s2
Esquerda Direita
conj. vel dp vel vet dp vet vel dp vel vet dp vet
1
14,53 3,27 1.243,86 376,10 14,34 2,83 849,24 252,34
2
12,31 2,88 1.640,53 492,40 13,78 4,44 974,47 289,60
3
12,11 2,75 1.773,00 525,67 13,18 4,70 1.103,60 340,39
4
10,91 1,33 2.477,60 675,39 9,89 0,92 2.112,00 613,70
5
10,87 1,32 2.522,47 687,89 9,90 0,92 2.152,67 621,45
6
10,87 1,36 2.568,20 703,97 9,87 0,91 2.167,80 625,58
7
10,76 1,61 3.405,20 912,41 10,63 1,11 3.140,20 898,87
8
10,33 1,74 3.757,80 950,52 10,60 0,99 3.891,07 1.144,11
9
10,33 1,74 3.757,80 950,52 10,60 0,99 3.891,07 1.144,11
10
11,64 3,54 1.499,87 424,04 9,88 5,75 964,73 291,03
11
11,40 2,81 1.705,20 463,55 9,68 6,14 1.074,00 345,40
12
11,24 2,12 1.908,40 532,71 9,65 6,26 1.197,87 417,15
13
10,32 0,93 2.649,20 703,35 9,73 1,13 2.165,53 631,30
14
10,28 1,28 2.770,53 741,33 9,77 1,31 2.237,87 643,72
15
10,27 1,30 2.809,13 749,58 9,78 1,31 2.275,13 659,12
16
10,81 1,64 3.729,40 968,47 10,62 1,04 3.550,13 933,46
17
10,53 1,68 4.055,33 1.005,95 10,63 1,04 3.658,40 1.036,46
18
10,40 1,77 4.331,47 1.044,41 10,60 1,11 4.099,53 1.142,66
19
11,05 3,20 1.519,33 409,56 6,36 4,58 1.111,40 340,82
20
11,44 2,54 1.773,13 503,77 5,42 4,35 1.251,80 384,70
21
11,14 2,28 1.927,67 536,97 5,70 3,99 1.350,27 409,07
22
10,14 0,83 2.875,13 779,76 9,53 1,30 2.292,73 691,80
23
10,16 0,96 2.991,80 820,65 9,58 1,38 2.407,80 710,94
24
10,20 1,09 3.103,87 855,86 9,57 1,31 2.498,33 730,59
25
10,94 1,79 4.594,33 1.130,84 10,55 1,17 3.999,93 1.054,36
26
10,86 1,82 4.931,47 1.196,27 10,49 1,23 4.571,73 1.163,86
27
10,75 1,88 5.273,67 1.251,23 10,39 1,26 5.052,67 1.270,05
Como no resultado anterior, neste par de seqüências o comportamento foi o
mesmo, porém a estimativa da velocidade ficou muito abaixo da verdadeira para o conjunto 1
(14,44 km/h). Os outros resultados para λ = 10, 20, 30, 40 e 50 também repetem o mesmo
padrão e se encontram no Apêndice B.
Esse experimento com a variação nos parâmetros de Canny, mostrou que o
conjunto 1 sempre apresentou os maiores valores para a computação da velocidade e que
também mais se aproximaram da velocidade “verdadeira”, tanto para as seqüências s1 quanto
para as seqüências s2 e que a melhor estimativa para a velocidade com o conjunto 1 se deu no
fluxo computado com lambda igual a 1.
Para verificar se existe uma associação entre a velocidade e as variáveis
lambda, quantidade de vetores e o tempo (qual das duas seqüências) foi realizada uma
regressão linear múltipla com o programa Minitab v. 13.0. A variável resposta é a velocidade
estimada com o conjunto 1 de parâmetros de Canny (por ter sido o que apresentou os
melhores resultados) e as variáveis independentes foram a quantidade de vetores, o fator
lambda (λ = 1, 10, 20, 30, 40 e 50) e o tempo (t = 1 e 2).
Antes de fazer a regressão linear múltipla foi verificada a normalidade da
variável velocidade (teste de Anderson-Darling, p = 0,175). A equação da regressão linear
múltipla resultante foi:
tVetVel 08,3250,00145,08,34
=
λ
Todos os coeficientes tiveram significância estatística (p = 0,000). Pela
equação de regressão linear múltipla percebe-se que o aumento da quantidade de vetores, do
valor de lambda e do tempo contribui para a diminuição da velocidade (são coeficientes
negativos). Particularmente no que se refere à variável tempo, conforme observado nas
tabelas anteriores, a seqüência s2 forneceu uma estimativa mais baixa da velocidade. O
gráfico dos resíduos mostra que o modelo está adequado (figura 23).
Figura 23 - Gráfico dos resíduos x valores ajustados da velocidade
Uma análise de variância entre as seqüências dos lados esquerdo e direito
não mostrou diferença significativa (p = 0,166) na velocidade estimada em cada seqüência.
4.3 Computação da velocidade com segunda etapa
Para reduzir a presença de erros grosseiros na computação da velocidade e
melhorar o valor computado, foi utilizada uma outra estratégia de filtragem aqui chamada de
segunda etapa. Para retirar os erros grosseiros (equação 18), os resíduos padronizados que
ficarem acima ou abaixo de um desvio-padrão são retirados da computação da velocidade e a
mesma é recalculada.
O gráfico da figura 24 ilustra o resultado obtido, com o fluxo filtrado pelo
padrão radial, pelos pontos de Canny (conjunto 1) e λ = 1.
Velocidade seqüência esquerda 1s
0
5
10
15
20
25
1 5 9 13 17 21 25 29
Imagem
Velocidade (km/h)
Velocidade 1a etapa
Velocidade 2a. etapa
Figura 24 - Gráfico da velocidade em duas etapas para seqüência s1e
A computação da velocidade já estava bem próxima da “verdadeira”, porém
a filtragem melhora em 3% esta estimativa, passando de 19,06 km/h para 19,67 km/h.
Velocidade seqüência esquerda 2s
0
5
10
15
20
25
30 34 38 42 46 50 54 58
Imagem
Velocidade (km/h)
Velocidade 1a etapa
Velocidade 2a etapa
Figura 25 - Gráfico da velocidade em duas etapas para seqüência da esquerda s2e
Para a seqüência s2e (figura 25), a filtragem em segunda etapa melhorou a
estimativa em aproximadamente 9%, passando de 14,53 km/h para 15,88 km/h. Percebe-se
que a estimação da velocidade diminui na seqüência s2, devido talvez a um aumento de
vetores com muito ruído (existe no final da seqüência uma grande diferença de iluminação na
cena).
Para a seqüência s1d a média da primeira etapa é de 18,78 km/h e da
segunda etapa é de 19,91 km/h, uma melhora de 6,01% (figura 26).
Velocidade seqüência direita 1s
0
5
10
15
20
25
1 5 9 13 17 21 25 29
Imagem
Velocidade (km/h)
Velocidade 1a etapa
Velocidade 2a etapa
Figura 26: Gráfico da velocidade em duas etapas para seqüência s1d
Para a seqüência s2d (figura 27) a velocidade cai para 14,34 km/h e com a
filtragem ela aumenta para 16,51 km/h, uma melhora de 15,13%.
Velocidade seqüencial direita 2s
0
5
10
15
20
25
30 34 38 42 46 50 54 58
Imagem
Velocidade (km/h)
Velocidade 1a etapa
Velocidade 2a etapa
Figura 27 - Gráfico da velocidade em duas etapas para seqüência s2d
A tabela 5 resume as estatísticas da velocidade média (km/h) e do desvio-
padrão na primeira e segunda etapa.
Tabela 5 - Velocidade e desvio-padrão na primeira e segunda etapa
1ª.
Etapa 2ª.
Etapa
Seq. vel dp vel vel dp vel
s1e 19,06 3,26 19,67 2,96
s2e 14,53 3,27 15,88 3,96
s1d 18,78 1,95 19,90 1,96
s2d 14,34 2,83 16,51 1,68
A quantidade de vetores na segunda etapa é reduzida, conforme a tabela 6
que resume as estatísticas da quantidade média de vetores e do desvio-padrão na primeira e
segunda etapa.
Tabela 6 - Quantidade de vetores e desvio-padrão na primeira e segunda etapa
1ª.
Etapa 2ª.
Etapa
Seq. vet dp vet vet dp vet
s1e 949,17
290,94
510,83
153,35
s2e 1243,86
376,10
735,31
222,83
s1d 809,59
263,71
482,14
162,35
s2d 839,24
252,34
520,10
152,77
Aqui também se verifica que a redução da quantidade de vetores aumenta a
estimativa da velocidade. Para ilustrar o efeito da redução dos vetores usando a estratégia
proposta, foi tomada a imagem 29 da seqüência s1e.
a) Imagem original em cinza b) Fluxo óptico computado
c) Primeira etapa d) Segunda etapa
Figura 28 - Ilustração da quantidade de vetores na primeira etapa e na segunda etapa
A figura 28a mostra a imagem original em tons de cinza, a figura 28b
mostra o fluxo computado com λ = 1 e diagrama de agulhas espaçado de 5 x 5 pixels. A
figura 28c mostra os pontos dos vetores do fluxo que estão no padrão radial e nas regiões de
interesse que foram detectados pelo algoritmo de Canny com o conjunto 1 de parâmetros. A
figura 28d mostra os pontos da figura 28c que foram filtrados na segunda etapa. Percebe-se
que os vetores que contribuem com a estimação da velocidade estão na região com melhor
iluminação (lado esquerdo da imagem) e alto contraste (lado direito entre o muro e a calçada).
4.4 Redução do fator lambda
Para verificar o efeito da redução do lambda, no mesmo conjunto de
parâmetros e filtragem em duas etapas, foi realizado um teste com λ = 0,5 cujos resultados
estão descritos na tabela 7.
Tabela 7 – Filtragem em duas etapas: λ = 0,5 e seqüência s1e
1a.
etapa 2a.
etapa 1ª.
etapa 2ª.
etapa
Conj.
vel dp vel
vel dp vel
vet dp vetores
vet dp vet
1
19,95
3,21
20,33
2,66
926,83
277,77
529,79
155,84
2
20,34
4,07
20,52
3,50
1141,24
359,36
662,97
209,95
3
20,05
4,01
20,40
3,61
1243,59
403,71
724,69
238,18
4
13,08
2,39
13,43
2,71
2077,86
550,73
1236,14
316,92
5
12,76
2,35
13,11
2,74
2151,24
569,77
1286,14
327,59
6
12,58
2,44
12,97
2,82
2182,48
573,27
1307,93
325,75
7
10,61
1,73
11,58
2,39
2985,93
838,88
1952,83
602,15
8
10,25
1,50
11,19
2,23
3339,79
919,61
2158,28
653,91
9
10,22
1,48
11,17
2,22
3359,93
945,47
2169,17
670,89
10
18,09
5,22
18,96
4,50
1140,41
351,50
648,55
196,53
11
18,47
4,94
19,06
4,26
1311,66
396,43
757,31
229,96
12
18,19
5,19
18,92
4,46
1427,66
424,84
829,10
253,55
13
12,59
2,47
13,01
2,70
2269,79
585,68
1357,93
336,37
14
12,28
2,53
12,70
2,70
2348,69
613,97
1406,07
353,91
15
11,92
2,52
12,39
2,72
2447,38
645,69
1474,41
386,88
16
10,80
1,69
11,77
2,38
3253,31
840,75
2129,45
631,38
17
10,62
1,53
11,59
2,27
3588,69
922,54
2301,52
673,75
18
10,57
1,48
11,52
2,26
3836,90
991,70
2424,55
710,12
19
15,79
6,34
16,82
5,88
1229,93
365,41
703,31
202,51
20
15,94
6,34
16,85
5,45
1412,21
435,53
812,28
245,29
21
15,63
6,43
16,57
5,22
1557,52
493,46
905,31
284,41
22
12,18
2,31
12,60
2,85
2541,86
651,44
1554,07
392,64
23
11,89
2,19
12,33
2,76
2619,10
664,34
1618,83
407,56
24
11,45
2,03
12,00
2,51
2749,38
703,60
1700,00
441,28
25
11,32
1,53
12,40
2,47
4344,69
1045,27
2725,03
730,29
26
11,29
1,49
12,36
2,43
4715,38
1126,81
2931,79
769,83
27
11,28
1,48
12,35
2,43
5103,59
1204,87
3135,38
805,39
Os valores da velocidade estimados na primeira e na segunda etapa são
maiores do que quando o valor de lambda era maior ou igual a 1 para os mesmos conjuntos de
parâmetros do algoritmo de Canny. A quantidade de vetores com a diminuição do lambda
também diminui.
A seqüência s2e também apresentou o mesmo padrão, ou seja, velocidade
estimada maior e uma menor quantidade de vetores, porém a velocidade estimada ainda é
menor do que a “verdadeira”, conforme pode ser visto na tabela 8.
Tabela 8 – Filtragem em duas etapas: λ = 0,5 e seqüência s2e
1a.
etapa 2a.
etapa 1ª.
etapa 2ª.
etapa
Conj.
vel dp vel
vel dp vel
vet dp vetores
vet dp vet
1
15,98
3,66
16,91
3,86
1202,55
352,48
753,86
215,09
2
13,84
3,13
14,28
3,35
1568,48
461,07
962,83
271,54
3
13,66
3,08
13,99
3,14
1689,1
488,76
1035,45
282,83
4
11,91
1,47
12,15
1,92
2372,69
621,00
1459,59
373,09
5
11,84
1,33
12,15
1,91
2415,03
632,64
1490,90
387,72
6
11,82
1,36
12,13
1,97
2457,1
647,19
1514,34
397,30
7
11,57
1,49
11,86
2,03
3260,21
836,90
2108,76
566,17
8
11,29
1,71
11,51
2,21
3598,48
871,29
2337,38
579,35
9
11,29
1,71
11,51
2,21
3598,48
871,29
2337,38
579,35
10
13,21
3,72
13,19
3,85
1431,72
397,55
883,24
244,70
11
12,87
3,06
12,79
3,24
1625,86
428,50
991,10
253,88
12
12,56
2,27
12,59
2,43
1821,10
491,83
1107,590
287,61
13
11,32
0,96
11,47
1,39
2532,83
644,94
1566,21
389,95
14
11,25
1,24
11,32
1,58
2647,72
677,59
1643,59
408,66
15
11,22
1,26
11,29
1,59
2684,83
685,17
1673,72
415,22
16
11,66
1,50
11,82
1,93
3580,07
892,84
2353,52
591,85
17
11,41
1,55
11,63
1,92
3901,17
929,95
2552,83
620,40
18
11,33
1,62
11,57
1,95
4169,38
971,45
2718,07
644,47
19
12,60
3,35
12,56
3,78
1441,93
377,23
900,62
238,42
20
12,97
2,68
13,03
2,92
1686,14
466,70
1028,62
279,04
21
12,61
2,43
12,41
2,76
1836,21
496,41
1110,76
287,96
22
11,18
0,92
11,29
1,34
2741,52
710,05
1718,90
436,57
23
11,17
0,94
11,27
1,26
2854,97
748,65
1797,93
469,78
24
11,21
1,02
11,32
1,33
2961,72
782,18
1875,24
495,55
25
11,90
1,60
12,18
1,98
4429,59
1052,43
2886,55
692,79
26
11,82
1,66
12,15
2,02
4758,55
1114,29
3078,28
737,48
27
11,72
1,73
12,10
2,05
5090,90
1168,13
3262,00
767,86
A tabela 9 mostra os resultados com a seqüência da direita s1d. A
velocidade no conjunto 1 é a maior, como nos casos anteriores e maior do que no caso de
λ = 1. Também a quantidade de vetores é menor, conforme visto na seqüência s1e.
Tabela 9 – Filtragem em duas etapas: λ = 0,5 e seqüência s1d
1a.
etapa 2a.
etapa 1ª.
etapa 2ª.
etapa
Conj.
vel dp vel
vel dp vel
vet dp vetores
vet dp vet
1
19,21
2,03
20,24
1,86
791,17
254,89
496,34
162,90
2
18,88
2,02
19,87
1,72
902,90
299,97
570,00
195,65
3
18,17
2,20
19,37
1,88
992,07
323,78
625,24
209,84
4
11,64
1,48
11,66
2,15
1920,48
564,38
1189,10
338,18
5
11,56
1,51
11,46
2,38
1965,66
576,30
1225,86
343,68
6
11,59
1,48
11,48
2,35
1981,24
580,20
1243,17
351,15
7
12,06
1,12
12,04
1,76
2740,28
854,39
1898,00
606,84
8
11,96
1,11
12,10
1,67
3213,03
1072,04
2142,97
697,61
9
11,96
1,11
12,10
1,67
3213,03
1072,04
2142,97
697,61
10
18,32
2,10
20,11
2,03
903,72
284,14
574,07
186,98
11
17,85
2,20
19,67
2,01
1002,34
325,61
632,90
209,83
12
17,13
2,21
19,19
1,70
1093,17
348,86
691,66
234,04
13
11,95
1,44
11,99
2,21
1982,48
566,54
1224,97
343,92
14
11,89
1,34
11,86
2,11
2042,55
572,45
1279,93
342,23
15
11,84
1,45
11,84
2,14
2070,48
578,56
1299,17
343,56
16
12,62
1,20
12,76
1,78
3332,21
890,44
2218,34
631,05
17
12,61
1,23
12,79
1,80
3437,66
995,33
2272,14
680,51
18
12,58
1,30
12,92
1,85
3889,17
1097,58
2508,48
729,75
19
16,20
1,86
19,01
1,84
999,38
307,73
627,93
196,74
20
15,38
2,21
18,29
2,17
1099,38
348,31
676,41
214,57
21
15,45
2,17
18,41
2,07
1196,34
382,15
731,52
232,23
22
12,26
1,45
12,36
2,23
2118,90
622,90
1333,66
380,87
23
12,18
1,36
12,29
2,14
2216,28
635,79
1397,24
388,82
24
12,06
1,35
12,11
2,12
2294,90
653,79
1446,34
397,02
25
12,91
1,46
13,31
1,98
3972,76
1030,74
2563,66
713,53
26
12,83
1,49
13,44
2,03
4582,00
1162,62
2894,55
771,29
27
12,71
1,52
13,40
2,08
5077,86
1263,68
3169,31
818,36
A seqüência s2d manteve o padrão anterior e também estimou a velocidade
no melhor caso abaixo da “verdadeira”. A diminuição da quantidade de vetores também se
repete (tabela 10).
Tabela 10 – Filtragem em duas etapas: λ = 0,5 e seqüência s2d
1a.
etapa 2a.
etapa 1ª.
etapa 2ª.
etapa
Conj.
vel dp vel
vel dp vel
vet dp vetores
vet dp vet
1
14,56
2,61
16,65
1,74
817,72
244,46
531,86
154,006
2
14,85
4,09
16,34
2,94
938,97
277,86
609,1
180,377
3
14,26
4,23
15,57
3,77
1061,1
322,62
687,03
203,091
4
11,10
0,97
10,84
1,17
2021,45
564,56
1223,72
339,378
5
11,08
0,95
10,82
1,15
2061,31
572,34
1250,28
345,525
6
11,05
0,94
10,78
1,14
2076,14
576,57
1258,97
347,922
7
12,16
1,23
11,65
1,28
2990,69
816,17
2032,9
545,622
8
12,35
1,158
11,84
1,08
3692,28
1038,48
2455,86
682,742
9
12,35
1,15
11,84
1,08
3692,28
1038,48
2455,86
682,742
10
10,62
5,16
12,59
5,18
926,34
278,33
598,48
165,022
11
10,47
5,54
12,02
5,79
1021,93
321,10
655,79
189,774
12
10,26
5,55
11,80
6,11
1131,38
382,46
728,62
226,611
13
11,03
1,20
10,69
1,36
2065,86
578,55
1248,07
347,697
14
11,02
1,37
10,71
1,50
2136,28
590,87
1287,17
354,279
15
11,03
1,37
10,74
1,52
2171,93
604,91
1308,69
362,341
16
12,35
1,12
11,80
1,13
3379,03
852,47
2264,00
584,19
17
12,37
1,11
11,82
1,11
3483,86
949,42
2326,97
638,945
18
12,39
1,11
11,88
1,12
3900,21
1049,04
2555,31
700,26
19
7,35
4,14
9,73
4,88
1053,24
312,76
672,28
186,59
20
6,41
3,97
8,48
4,84
1179,86
351,15
742,41
206,751
21
6,67
3,76
8,46
4,72
1269,17
368,28
793,52
222,327
22
10,93
1,38
10,57
1,59
2178,48
629,69
1317,79
377,198
23
10,94
1,44
10,61
1,49
2289,17
646,09
1384,90
392,473
24
10,90
1,37
10,57
1,41
2374,48
662,31
1439,66
396,821
25
12,34
1,18
11,84
1,23
3799,24
950,77
2499,03
632,265
26
12,34
1,19
11,97
1,23
4341,03
1055,07
2805,31
693,277
27
12,27
1,18
11,98
1,21
4798,97
1151,80
3069,72
747,574
A figura 29 (a e b) ilustra o fluxo 29 e 59 da seqüência esquerda e a figura
29 (c e d) o fluxo 29 e 59 da seqüência da direita.
a) Fluxo 29 da esquerda b)Fluxo 59 da esquerda
a) Fluxo 29 da direita b) Fluxo 59 da direita
Figura 29 – Fluxo computado com
λ
= 0,5
A figura 30 ilustra o efeito do valor de lambda na computação da velocidade
na primeira etapa seqüência s1 com o conjunto 1 de parâmetros de Canny.
Seqüência 1s - 1a etapa
0,0
5,0
10,0
15,0
20,0
25,0
0,01 0,25 0,50 0,75 1 10 20 30 40 50
Lambda
Velocidade (km/h)
Velocidade estimada esquerda
Velocidade verdadeira
Velocidade estimada direita
Figura 30 - Gráfico de lambda x velocidade, s1 e 1ª etapa
Com valores de lambda menor do que 1 a velocidade estimada é maior do
que valores de lambda maiores ou igual a 1.
Seqüência 1s - 2a etapa
18,5
19,0
19,5
20,0
20,5
21,0
21,5
0,01 0,25 0,50 0,75 1
Lambda
Velocidade (km/h)
Velocidade estimada esquerda
Velocidade verdadeira
Velocidade estimada direita
Figura 31 - Gráfico de lambda x velocidade, s1 e 2ª etapa
Como anteriormente, antes da filtragem da segunda etapa, havia sido
estabelecido que o melhor valor para lambda era 1, não foram computadas as velocidades na
segunda etapa para valores maiores do que 1. O gráfico da figura 31 mostra que a velocidade
filtrada na segunda etapa também aumenta em relação à primeira etapa, ficando portanto
maior do que a velocidade verdadeira para valores de lambda menores do que 1.
Para a seqüência s2, as velocidades estimadas com lambda menores do que
1 também o maiores do que para valores maiores ou igual a 1, porém menores do que a
velocidade “verdadeira”.
Seqüência 2s - 1a etapa
0,0
5,0
10,0
15,0
20,0
25,0
0,01 0,25 0,50 0,75 1 10 20 30 40 50
Lambda
Velocidade (km/h)
Velocidade estimada esquerda
Velocidade verdadeira
Velocidade estimada direita
Figura 32 - Gráfico de lambda x velocidade, s2 e 1ª etapa
Assim como na seqüência s1, na seqüência s2 também a velocidade
estimada na segunda etapa é maior (figura 33).
Seqüência 2s - 2a etapa
0,0
5,0
10,0
15,0
20,0
25,0
0,01 0,25 0,50 0,75 1
Lambda
Velocidade (km/h)
Velocidade estimada esquerda
Velocidade verdadeira
Velocidade estimada direita
Figura 33 - Gráfico de lambda x velocidade, s2 e 2ª etapa
4.5 Síntese dos resultados da estimação da velocidade
Para verificar a proposição de que é uma boa estratégia utilizar duas etapas
de filtragem com os vetores que apresentam comportamento radial nas regiões de interesse e
que foram detectados pelo algoritmo de Canny, a velocidade foi estimada em duas etapas nas
regiões de interesse utilizando o fluxo denso, conforme mostra a tabela 11.
Tabela 11 - Velocidade estimada apenas nas regiões de interesse
seq. vel dp vel
vet dp vet etapa
s1e
1,57
0,54
230.186
0,00
1
s1d
2,15
0,37
230.186
0,00
1
s2e
1,83
0,76
230.186
0,00
1
s2d
2,07
0,82
230.186
0,00
1
s1e
12,48
7,83
489,59
145,15
2
s1d
9,13
5,19
411,17
129,68
2
s2e
8,02
2,35
697,03
202,56
2
s2d
9,65
3,84
443,72
130,18
2
O desvio-padrão da quantidade de vetores na primeira etapa é zero devido
ao fato de que todas as imagens de cada seqüência possuem a mesma quantidade de vetores
(fluxo denso). Mais uma vez, a velocidade estimada quando se realiza a segunda etapa
aumenta e a quantidade de vetores diminui, mas mesmo assim, a velocidade é muito baixa em
comparação com a “verdadeira”.
O resultado da tabela 12 foi obtido com a velocidade estimada nas regiões
de interesse utilizando todos os vetores que apresentaram o padrão radial nas regiões de
interesse.
Tabela 12 - Velocidade estimada apenas nas regiões de interesse com o padrão radial
seq.
vel dp vel vet dp vet etapa
s1e
3,34
0,59
110.367
25.972,80
1
s1d
4,07
0,36
107.169
22.780,10
1
s2e
3,54
0,57
113.889
27.590,10
1
s2d
3,81
0,82
107.726
24.595,40
1
s1e
12,39
7,46
485,66
142,82
2
s1d
9,29
5,04
412,90
129,78
2
s2e
8,13
2,18
705,38
210,07
2
s2d
9,91
3,85
447,17
128,70
2
Na primeira etapa a velocidade estimada usando as regiões de interesse e o
padrão radial aumenta a estimativa da velocidade em relação ao valor estimado com o fluxo
denso nas regiões de interesse. A velocidade estimada na segunda etapa é próxima da
verificada no experimento anterior e uma possível explicação para isso é que a segunda etapa
atua separando os vetores que apresentam o padrão radial.
A próxima combinação é de vetores detectados com o algoritmo de Canny
nas regiões de interesse, independentemente de apresentarem ou não o padrão radial.
Tabela 13 - Velocidade estimada nas regiões de interesse e Canny
seq.
vel dp vel vet dp vet etapa
s1e
17,72
4,77
1.190,55
120,12
1
s1d
16,10
3,20
1.093,66
77,72
1
s2e
12,87
3,64
1.694,07
195,19
1
s2d
13,08
3,31
1.260,41
55,55
1
s1e
18,19
4,67
511,52
154,67
2
s1d
17,83
3,65
480,07
161,78
2
s2e
13,67
4,42
735,52
221,31
2
s2d
15,00
3,02
524,62
152,01
2
Usando os vetores que foram detectados com Canny, o resultado melhora
muito em relação aos anteriores, tanto na primeira etapa quanto na segunda. Fazendo a dia
de s1e e s1d na segunda etapa, a velocidade estimada é de 18,01 km/h e a média de s2e e s2d
é de 14,34 km/h. Estes valores o menores do que os obtidos utilizando a estratégia proposta
neste trabalho (19,79 km/h e 16,20 km/h - tabela 5). Outra observação importante é a
quantidade de vetores que são aproximadamente iguais, indicando que a filtragem pelo padrão
radial contribui com uma melhor estimativa da velocidade.
Portanto, a estratégia de computar a velocidade em duas etapas com
filtragem dos vetores detectados pelo algoritmo de Canny no padrão radial apresentou os
melhores resultados na estimação da velocidade, que serão utilizados na fototriangulação para
orientar as imagens.
4.6 Resultados da autocalibração fotovariante
Foram implementadas quatro rotinas para a execução da autocalibração
fotovariante com o objetivo de orientar as imagens:
1)
Básica com 6 parâmetros de orientação exterior (ângulos e posição), 4
parâmetros de orientação interior e coordenadas dos pontos no terreno;
2)
Injunção da base, que incluiu além dos parâmetros acima, uma equação
de injunção para o comprimento da base;
3)
Injunção da base e inclusão da velocidade (três componentes) como
parâmetro;
4)
Injunção da base e injunção da velocidade, onde a velocidade passa a ser
uma equação de injunção ao invés de ser um parâmetro.
Os testes foram realizados com a mesma orientação inicial, mesma
configuração e o mesmo conjunto de observações (fotocoordenadas) (tabela 14).
Tabela 14 - Configurações comuns
Tamanho do pixel (mm) 0,0067 x 0,0075
Critério de convergência – terreno (m) 0,05
Variância da base (m
2
) 0,001
Variância pontos terreno (m
2
) 1,00
Avanço da base (m) 0,915
Tamanho da janela de referência (pixels) 9 x 9
Tamanho da janela de busca (pixels) 17 x 17
Número máximo de iterações 20
A distribuição dos pontos utilizados para os testes é mostrada na figura 34.
Figura 34 - Distribuição dos pontos utilizados na primeira base
Como os pontos iniciais foram coletados manualmente e a orientação inicial
arbitrada como zero para os ângulos, as coordenadas dos pontos no terreno foram calculadas
por interseção (equações 26-28) e mostrados na tabela 15.
Tabela 15 – Coordenadas dos pontos no terreno
No. X(m) Y(m) Z(m)
0 -5,39
21,81 -
0,62
1 -4,91
21,25 -
0,59
2 -5,00
20,73 -
0,86
3 -5,56
21,25 -
0,62
4 -4,67
22,40 -
0,63
5 -4,87
21,81 -
0,71
6 -2,19
17,63 -
0,93
7 -2,22
15,36 -
1,09
8 1,84
14,51 -
1,05
9 1,31
16,55 -
0,96
10
1,23
17,61 -
0,84
11
1,61
25,07 -
0,24
12
1,78
25,07 -
0,22
13
1,58
25,07
0,97
14
1,84
25,86
0,99
15
1,77
27,59
3,65
16
1,77
27,59
4,10
Pode-se perceber uma consistência geométrica com os valores calculados,
por exemplo, observando os pontos 11, 12, 13, 14, 15 e 16 que estão no poste e teoricamente
possuem a mesma coordenada Y. Na prática os pontos 11, 12 e 13 apresentam as mesmas
coordenadas Y, o mesmo ocorrendo com os pontos 15 e 16, apesar de uma diferença de 2,52
cm, porém os pontos 15 e 16 estão acima da região de interesse e a perspectiva dificulta a
interseção. O ponto 14 apresentou uma diferença de 0,79 cm com relação aos pontos 11, 12 e
13.
O avanço da base é determinado pela velocidade estimada e o tempo entre
cada base, dado pela taxa de amostragem do vídeo. Para se fazer o teste com o caminhamento
fotogramétrico, foram utilizadas 7 bases, totalizando um segundo. A cada 5/30s uma base é
incluída, a correlação a vante é realizada e a fototriangulação feita. As quatro estratégias de
fototriangulação utilizaram a mesma orientação inicial e o mesmo conjunto de variâncias para
os parâmetros em comum (quadro 1).
Orientação inicial
Foto
Omega(rad)
Phi(rad) Kappa(rad)
Xc(m) Yc(m) Zc(m)
0
0,004218
0,000007 -
0,000257
0,000003
-0,000006 -
0,000815
1 -
0,004219
-0,000007
0,000065
0,939997
0,000006
0,000815
Foto xo(mm) yo(mm) f(mm) k1(mm
-2
)
0 -
0,000002
0,00071
5,900010
0,000086
1
0,000002
-
0,000711
5,899996
-
0,000022
Variâncias
ÂNGULO(rad
2
): 0,005000
POSIÇÃO(m
2
): 0,005000
OI- (xo,yo,f) (mm
2
): 0,050000
OI- k1 (mm
-4
): 0,050000
FOTOC(mm
2
): 0,010000
Quadro 1 – Orientação inicial e variâncias para os parâmetros em comum
4.6.1 Resultados da fototriangulação básica
O quadro 2 mostra um resumo do resultado da fototriangulação básica após
a entrada da última base, sem injunção de peso e de velocidade, e tendo como parâmetros os
seis elementos de orientação exterior e quatro elementos de orientação interior de cada foto, e
as coordenadas dos pontos no terreno. As diferenças angular e CP são calculadas pela
subtração do parâmetro da esquerda pelo da direita.
Diferença angular Diferença CP
Omega
(rad)
Phi(rad) Kappa(rad)
Xc(m) Yc(m) Zc(m)
-
0,007195
-0,001724 0,026677
0,937552
0,000232
0,000860
-
0,006048
-0,000552 0,028593
0,940110
-
0,000218
0,001357
-0,00983
0,000477
0,022725
0,939964
-
0,000077
0,001382
-
0,009874
0,000367
0,021134
0,939645
-
0,000075
0,001280
-
0,009624
0,000033
0,016318
0,939666
-
0,000041
0,001374
-
0,009509
-0,000010 0,019590
0,939661
-
0,000006
0,001406
-
0,009523
0,000468
0,020267 0,93978
-
0,000007
0,001407
Contribuições ao sigma
Fotocoordenadas 35,938792
Orientação exterior
0,398041
Orientação interior 0,503752
Pontos terreno 0,210784
Sigma a posteriori 0,077839
Qui-quadrado(gl) 37,051370 476
Quadro 2 – Resumo do resultado da fototriangulação básica
A análise da qualidade do ajustamento será feita posteriormente
comparando as quatro estratégias de fototriangulação. Na diferença angular, o ângulo ϕ
mudou de sinal na terceira, quarta, quinta e sétima bases, os outros parâmetros permaneceram
praticamente constantes.
4.6.2 Resultados da fototriangulação tendo a base como injunção
O resumo do quadro 3 mostra os resultados da fototriangulação tendo a base
como injunção. No caso específico, ao final do processo, 7 equações de injunção de base
(equação 33) são incluídas após as equações de observações.
Variância para a base(m
2
)
0,001
Diferença angular Diferença CP
Omega
(rad)
Phi(rad) Kappa(rad)
Xc(m) Yc(m) Zc(m)
-
0,012282
0,000862
0,024188
0,939974
0,000379
0,000494
-
0,010458
0,000858
0,026341
0,939975
-
0,000248
0,000782
-
0,014229
0,003784
0,027084
0,940007
0,000138
-
0,000085
-
0,011142
0,000332
0,019479
0,939998
-
0,000068
0,001181
-
0,010794
0,0003
54
0,017310
0,939999
0,000083
0,001380
-
0,010861
0,000509
0,019228
0,940000
0,000051
0,001449
-
0,028807
-
0,027142
0,041921
0,940076
0,000381
0,002292
base 0 1 2 3 4 5 6
(m) 0,939974
0,939976
0,940007
0,939999
0,940000
0,940001
0,940079
Contribuições ao sigma
Fotocoordenadas
3714,243864
Orientação exterior
63,265712
Orientação interior
110,563037
Pontos terreno
11,313189
Bases
0,008261
Sigma a posteriori
8,140697
Qui-quadrado(gl)
3899,394062
479
Quadro 3 – Resumo do resultado da fototriangulação com injunção de base
Neste relatório estão incluídos os valores da base ajustada, que não mudam
significativamente. As diferenças angular e de CP também permanece quase constante.
4.6.3 Resultados da fototriangulação com injunção da base e velocidade como parâmetro
Nesta fototriangulação, além da injunção da base, foi incluída a velocidade
como parâmetro (equação 34). Na primeira base, a velocidade não é calculada, pois não existe
variação do espaço.
Variância para a base (m
2
)
0,001
Variância para a velocidade(m
2
/s
2
)
0,500
Diferença angular Diferença CP
Omega(rad)
Phi(rad) Kappa(rad)
Xc(m) Yc(m) Zc(m)
-
0,008167
-
0,000123
0,026313
0,940605
-
0,001210
0,001035
-
0,008016
0,000132
0,028415
0,939886
-
0,060957
0,005777
-
0,009940
0,000476
0,021586
0,943465
-
0,071375
0,018108
-
0,009770
0,000306
0,020567
0,952115
-
0,073312
0,021282
-
0,009643
0,000586
0,020155
0,929448
-
0,072583
0,028605
base 0 1 2 3 4
(m)
0,940607
0,9
41878
0,946334
0,9551771
0,932717
Contribuições ao sigma
Fotocoordenadas
21,881850
Orientação exterior
0,287339
Orientação interior
0,255324
Pontos terreno
0,091358
Bases
1007,627052
Sigma a posteriori
2,985922
Qui-quadrado(gl) 103
0,142922
345
Quadro 4 – Resumo do resultado da fototriangulação com injunção de base e velocidade como parâmetro
A partir da quinta base não se verifica convergência no ajustamento. Pode-
se perceber que na quarta base a contribuição ao valor do sigma a posteriori pelas bases é
muito grande, pois na terceira e quarta bases o resíduo é alto. Como o que mudou neste
ajustamento foi a inclusão da velocidade como parâmetro (em comparação com o resultado
anterior), para o mesmo conjunto de variâncias (pesos) a convergência não se verifica.
4.6.4 Resultados da fototriangulação utilizando a base e a velocidade como injunções
Quando a velocidade entra como injunção, o resultado que aparece no
quadro 5 é a média do módulo da velocidade (três componentes) calculada em função do
deslocamento do CP da esquerda e da direita de cada base.
Variância para a base (m
2
)
0,001
Variância para a velocidade(m
2
/s
2
)
0,500
Diferença angular Diferença CP
Omega(rad)
Phi(rad) Kappa(rad)
Xc(m) Yc(m) Zc(m)
-
0,007195
-
0,001788
0,026650
0,939995
0,000234
0,000866
-
0,006051
-
0,000523
0,028608
0,940001
-
0,000219
0,001357
-
0,009833
0,000479
0,022731
0,940000
-
0,000077
0,001382
-
0,009875
0,000365
0,021138
0,939998
-
0,000075
0,001281
-
0,009625
0,000032
0,016322
0,939998
-
0,000041
0,001374
-
0,009510
-
0,000012
0,019593
0,939997
-
0,000006
0,001407
-
0,009524
0,000467
0,020270
0,939999
-
0,000007
0,001407
base 0 1 2 3 4 5 6
(m)
0,939995
0,940002
0,940001
0,939999
0,
939999
0,939998
0,940000
velocidade
1 2 3 4 5 6
(m/s) 5,495058
5,486814
5,489636
5,490564
5,490099
5,490038
Contribuições ao sigma
Fotocoordenadas
35,969188
Orientação exterior 442,519057
Orientação interior
6,092623
Pontos terreno
0,210662
Bases
0,000039
Velocidades
0,033981
Sigma a posteriori
0,991463
Qui-quadrado(gl) 484,825550 489
Quadro 5 – Resumo do resultado da fototriangulação com injunção de base e injunção de velocidade
As diferenças angular e CP mostram que os parâmetros ficaram
praticamente constantes, incluindo as bases e as velocidades estimadas entre elas.
Para comparar a qualidade do ajustamento nas quatro estratégias de
fototriangulação foi feito um gráfico com o valor de
2
0
ˆ
obtido em cada etapa do ajustamento
(figura 35). As estratégias de fototriangulação foram numeradas no gráfico: 1
fototriangulação sica, 2 fototriangulação com injunção da base, 3 fototriangulação com
injunção da base e velocidade como parâmetro e 4 fototriangulação com injunção de base e
injunção de velocidade. O resultado da fototriangulação 3 na sexta e sétima bases não
aparecem pois o ajustamento não convergiu. Como até a quinta base o resultado estava
acompanhado o padrão das outras estratégias, é possível que as variâncias estejam causando a
divergência.
Qualidade do ajustamento
0
2
4
6
8
1 2 3 4 5 6 7
Número de bases
Sigma a posteriori
1
2
3
4
Figura 35 – Gráfico da qualidade do ajustamento
A fototriangulação utilizando a base e a velocidade como injunções
apresentou a melhor qualidade no ajustamento. A estratégia de fototriangulação básica
apresentou os menores valores e a fototriangulação utilizando somente a base como injunção
elevou significativamente o valor de
2
0
ˆ
após a inclusão da última base.
A tabela 16 mostra os limites dos valores da distribuição qui-quadrado para
um vel de significância de 5% e os respectivos valores calculados pela fototriangulação
utilizando as bases e as velocidades como injunções. Quando o valor calculado está no
intervalo entre os valores inferior e superior, considera-se que o ajuste é adequado.
Tabela 16 – Valores calculados e tabelados da distribuição qui-quadrado
Base gl calculado inferior superior
1
69
36,22
47,92
93,85
2
139
5,72
108,25
173,53
3
209
36,59
170,85
250,93
4
279
142,89
234,62
327,16
5
349
165,31
299,13
402,64
6
419
393,39
364,18
477,60
7
489
484,83
429,62
552,16
Até a entrada da base 5 a qualidade do ajuste não é adequada, porém com a
inclusão da sexta base, o ajustamento se torna adequado e na última base também a qualidade
do ajustamento é garantida pelo teste qui-quadrado.
5 CONCLUSÕES
Neste trabalho foi apresentada uma nova metodologia para posicionar e
orientar automaticamente uma seqüência de pares de imagens obtidas com um par de câmaras
de vídeo digital de um sistema móvel de mapeamento terrestre sem a utilização de sensores
externos e pontos de apoio, dado um conjunto de fotocoordenadas coletadas manualmente no
primeiro par.
Essa metodologia visa contribuir com a automação da UMMD e prover uma
alternativa semi-automática quando não existirem sensores externos de posicionamento ou
quando, na existência destes, o sinal ficar obstruído por alguma razão.
Para posicionar relativamente os pares seguintes (a partir do primeiro par),
foi estimada a velocidade monocular usando o fluxo óptico, com uma estratégia de filtragem
que consiste em reduzir a quantidade de vetores do fluxo óptico, que em situações reais,
apresentam uma grande quantidade de ruídos o que inviabiliza a estimação. Para tal filtragem
foram utilizados os vetores da metade inferior da imagem (onde estão as feições de interesse
em um levantamento desse tipo), que apresentam padrão radial (dado pelo deslocamento a
vante em uma via plana) e que foram detectados pelo algoritmo de Canny (variação
significativa da intensidade). Além disso, uma segunda etapa na estimação da velocidade foi
utilizada, reduzindo os erros grosseiros (vetores cujo resíduo padronizado estavam acima de
um desvio-padrão para cada uma das componentes).
Existe nesse processo uma grande quantidade de variáveis que precisam ser
determinadas de forma empírica e um planejamento de experimentos que envolva todas elas
se torna fatorial e fica praticamente inviável de ser realizado. Dessa forma, buscou-se
determinar alguns fatores considerados mais fundamentais, como o fator lambda na
computação do fluxo óptico e os parâmetros do algoritmo de Canny.
Os experimentos realizados mostraram que o fator λ = 1, combinado com os
valores para os parâmetros de Canny do conjunto 1 foram os mais adequados para a estimação
da velocidade monocular. Além disso, a estratégia de filtragem se mostrou eficaz, melhorando
a estimativa da velocidade que foi utilizada para fornecer uma aproximação inicial para a
posição relativa das bases seguintes, pois a taxa de amostragem das imagens é conhecida.
A computação da velocidade para a primeira seqüência foi de 19,78 km/h
que comparada com a velocidade verdadeira” de 19,83 km/h se mostrou muito precisa. Na
seqüência s2 a velocidade estimada foi de 16,20 km/h, cerca de 20% menor do que o valor
“verdadeiro” de 19,75 km/h. Esse fato pode ser creditado a uma mudança brusca na
iluminação da segunda seqüência. Uma alternativa para tentar amenizar essa mudança brusca
seria equalizar as imagens antes da computação do fluxo óptico.
Após a computação da velocidade e do posicionamento das bases, foram
utilizadas quatro estratégias de fototriangulação com autocalibração fotovariante para orientar
as imagens. A primeira usou apenas as equações de colinearidade e as fotocoordenadas como
observações. A segunda utilizou a base como injunção. A terceira estratégia modificou as
equações de colinearidade e incluiu a velocidade como parâmetro. Nesta estratégia, para um
dado conjunto de variâncias, a qualidade do ajustamento se deteriorou devido ao fato de que
uma pequena mudança na velocidade se propagava para o CP e conseqüentemente aumentava
o resíduo da base. Uma alternativa para esse problema seria reduzir o peso da velocidade.
Finalmente, a quarta estratégia de ajustamento se mostrou a mais adequada, pois além da
injunção da base, a velocidade foi incluída como injunção. Ao contrário do caso anterior,
como a velocidade era injunção, sua contribuição com a medida da base não influiu nos
resíduos da mesma.
Em geral a literatura existente sobre o fluxo óptico não comenta sobre o
parâmetro de regularização, que neste trabalho foi mostrada sua influência de forma empírica.
Além disso, em fotogrametria poucos trabalhos fizeram uso desta técnica como aqui
apresentada.
Alguns pontos podem ser apontados para uma automação maior em
trabalhos futuros, como por exemplo, uma coleta automática dos pontos homólogos no
primeiro par poderia ser feita levando-se em consideração os pontos que entraram na
computação da velocidade na forma aqui proposta.
Uma outra contribuição seria calcular a distância de pontos no terreno ao CP
usando o fluxo óptico binocular e comparar com a interseção fotogramétrica, para verificar
qual possui melhor acurácia e precisão. Porém uma das dificuldades com o fluxo óptico
binocular é o lculo da disparidade (paralaxe) entre os vetores da esquerda e da direita,
que verificou-se que os eixos ópticos não são paralelos entre si e não ortogonais à base, além
do fato da grande mudança de escala existente em imagens do tipo obtido com a UMMD.
REFERÊNCIAS BIBLIOGRÁFICAS
BARBOSA, R. L. et al. A computação do fluxo óptico em imagens obtidas por um sistema
móvel de mapeamento terrestre.
Revista Brasileira de Cartografia
, v. 57, n. 2, p. 72-78,
2005.
BARRON, J. L., FLEET, D. J., BEAUCHEMIN, S. S. Performance on optical flow
techniques.
International Journal of Computer Vision
, v.12, n.1, p.43-77, 1994.
BEAUCHEMIN, S. S., BARRON, J. L. The computation of optical flow.
ACM Computing
Surveys
, v. 27, n. 3, p. 433-467, 1995.
BRANCA, A., STELLA, E., DISTANTE, A. Passive navigation using egomotion estimates.
Image and vision computing
, v. 18, p. 833-841, 2000.
BRUHN, A., et al. Real-time optic flow computation with variational methods. In:
International Conference on Computer Analysis of Image and Patterns
(CAIP03), p.
222-229, 2003.
CANNY, J. A computational approach to edge detection.
Trans. on Pattern Analysis and
Machine Intelligence
, V. PAMI-8(6), p. 679-698,1986.
CASTELLANO, G., BOYCE, J.F., SANDLER, M.B. Regularized CDWT optical flow
applied to moving target detection in IR imagery.
Machine Vision and Applications
, v.11,
n.6, p.277 - 288, 2000.
GALO, M.
Automação dos processos de correspondência e orientação relativa em visão
estéreo
. 2003. 262f. Tese (Doutorado) - Faculdade de Engenharia Elétrica e de Computação,
Universidade de Campinas.
GEMAEL, C.
Introdução ao ajustamento de observações:
aplicações geodésicas. Curitiba:
UFPR, 1994. 319p.
GIACHETTI, A. Matching techniques to compute image motion.
Image and Vision
Computing
, v.18, n.3, p. 247-260, 2000.
GIACHETTI, A., CAMPANI, M., TORRE, V., The use of optical flow for road navigation.
IEEE Transactions on robotics and automation
, v. 14, n. 1, p. 34-48, 1998.
GONZALEZ, R. C., WOODS, R. E.
Digital image processing.
New York: Addison Wesley,
1992. 716p.
HAFSKJOLD, B. H. et al. Integrated camera-based navigation.
Journal of Navigation
, v. 53,
n. 2, p. 237-245, 2000.
HORN, B. K. P., SCHUNCK, B. G. Determining optical flow.
Artificial Intelligence
, v. 17,
p. 185-203, 1981.
HORN, B. K. P.
Robot Vision
. London: MIT, 1986. 509p.
KOYAMA, C. S., HASEGAWA, J. K. Radar fotogramétrico: lculo da velocidade de um
objeto a partir de uma seqüência de imagens digitais.
Revista Brasileira de Cartografia
, v.
54, n. 1, p.1-9,2002.
LIU, H., ROSENFELD, A., CHELLAPPA, R. Two-frame optical flow estimation using
wavelet decomposition. In:
International Conference on Acoustics, Speech and Signal
Processing
, v. 4, p. 3588-3591, 2002.
MARR, D.
Vision.
New York: Freeman, 1982. 397p.
OLIVEIRA, E. B. et al. Interseção Fotogramétrica em um Banco de Imagens
Georreferenciadas.
Revista Brasileira de Cartografia
, v.55, n.1, p.62 - 71, 2003.
OLIVEIRA, R. A., SILVA, J. F. C. Banco de imagens georreferenciadas no mapeamento
terrestre móvel.
Boletim de Ciências Geodésicas
, v. 7, n. 2, p. 63-77, 2001.
OLIVEIRA, I. N. S., RODA, V. O. Metodologia para detecção rápida do movimento em
seqüências de imagens. In:
V Simpósio Brasileiro de Automação Inteligente
, 2002,
Gramado.
PRAZDNY, K. Egomotion and relative depth map from optical flow.
Biological Cybernetics,
v. 36, n. 87, p. 87-102, 1980.
RONCELLA, R., REMONDINO, F., FORLANI, G. Photogrammetric bridging of GPS
outages in mobile mapping. In:
VIII Videometrics
, v. 5665, pp. 308-319, 2005.
SHI, Y. Q., SUN, H.
Image and video compression for multimedia engineering
:
fundamentals, algorithms and standards. Boca Raton: CRC Press, 2000. 480p.
SILVA, J. F. C.
Fototriangulação no caminhamento fotogramétrico
. 1997. 85f. Tese
(Livre docência em fotogrametria) Faculdade de Ciências e Tecnologia, Universidade
Estadual Paulista, Presidente Prudente.
SILVA, J. F. C. et al. A street map built by a mobile mapping system. In:
International
Congress of Photogrammetry and Remote Sensing
, 21., 2000, Amsterdam.
Proceedings
.
Amsterdam: International Society of Photogrammetry and Remote Sensing, 2000. v.
CDROM1. p. 506-513.
SILVA, J. F. C., CAMARGO, P. O., GALLIS, R. B. A. Development of a low-cost mobile
mapping system: a south american experience.
Photogrammetric Record
, v. 18, n. 101, p.5-
26, 2003.
SILVA, J. F. C. et al. Avaliação da qualidade da detecção de bordas em uma seqüência de
imagens de ruas e rodovias.
Revista Brasileira de Cartografia
, v. 56, n. 2, p. 96-103, 2004.
SONKA, M., HLAVAC, V., BOYLE, R.
Image processing, analysis and machine vision
.
Pacific Grove: PWS, 1999. 770p.
SUN,S., HAYNOR, D., KIM, Y. Motion estimation based on optical flow with adaptive
gradients. In:
International Conference on Image Processing
, v. 1, p. 852-855, 2000.
TAO, C., CHAPMAN, M. A., CHAPLIN, B. A. Automated processing of mobile mapping
image sequences.
Journal of Photogrammetry & Remote Sensing
, v. 55, p. 330–346, 2001.
TEKALP, A. M.
Digital video processing
. Upper Saddle River: Prentice Hall, 1995. 524p.
UOTILA, U.
Notes on adjustment computations
. Columbus: Ohio State University, 1986.
165p.
VALE, G. M., DAL POZ, A. P. Processo de detecção de bordas de Canny.
Boletim de
Ciências Geodésicas
, v. 8, n. 2, p. 67-78, 2002.
VERNON, D. Computation of instantaneous optical flow using the phase of Fourier
components,
Image and Vision Computing
, v. 17, p. 189-199, 1999.
WOLF, P. R.
Elements of photogrammetry, with air photo interpretation and remote
sensing
. New York: McGraw-Hill, 1983. 628p.
WU, Y. T., et al. Optical flow estimation using wavelet motion model. In:
Sixth
International Conference on Computer Vision
, p. 992-998, 1998.
ZHANG, Z., LI, J., LI, N. Investigation of improving accuracy of differential-based optical
flow algorithm by spatio-temporal filter. In:
Sixth International Conference on Signal
Processing
, p. 719-722, 2002.
APÊNDICE A
EQUAÇÕES DAS DERIVADAS PARCIAIS
As derivadas parciais das equações de colinearidade (equação 19) em relação aos
parâmetros são:
1. Derivadas parciais da fotocoordenada
x
:
( ) ( )
[ ]
( )
( )
( )
DYrZrXr
D
fx
NYsenZsensenX
DYZsenXsen
D
fx
NYrZrDYrZr
D
fx
x
x
κ
ϕωϕω
κϕωκϕωκϕ
ϕ
ω
232221
2
2
32331213
2
coscos
coscoscoscoscoscos
++
=
+
+
=
++
=
( )
( )
( )
x
c
x
c
x
c
NrDr
D
f
Z
x
NrDr
D
f
Y
x
NrDr
D
f
X
x
3212
2
3313
2
3111
2
+
=
+
=
+
=
( )
( )
( )
x
Z
x
Y
x
X
tNrtDr
D
f
V
x
tNrtDr
D
f
V
x
tNrtDr
D
f
V
x
C
C
C
+
=
+
=
+
=
3222
2
3313
2
3111
2
( )
( )
( )
x
x
x
NrDr
D
f
Z
x
NrDr
D
f
Y
x
NrDr
D
f
X
x
3212
2
3313
2
3111
2
=
=
=
22
0
1
001
0
2
01
2
1
0
)(
))((2
)(21
rxx
k
x
D
N
f
x
yyxxk
y
x
xxkrk
x
x
x
=
=
=
=
2. Derivadas parciais da fotocoordenada
y
:
( ) ( )
[
]
( )
( )
( )
DYrZrXr
D
fy
NYsenZsensenX
DYsenZsensenXsensen
D
fy
NYrZrDYrZr
D
fy
y
y
κ
ϕωϕωϕ
κϕωκϕωκϕ
ϕ
ω
131211
2
2
32332223
2
coscos
coscoscos
=
+
+
=
++
=
( )
( )
( )
y
c
y
c
y
c
NrDr
D
f
Z
y
NrDr
D
f
Y
y
NrDr
D
f
X
y
3222
2
3323
2
3121
2
+
=
+
=
+
=
( )
( )
( )
y
Z
y
Y
y
X
tNrtDr
D
f
V
y
tNrtDr
D
f
V
y
tNrtDr
D
f
V
y
C
C
C
+
=
+
=
+
=
3222
2
3323
2
3121
2
( )
( )
( )
y
y
y
NrDr
D
f
Z
y
NrDr
D
f
Y
y
NrDr
D
f
X
y
3222
2
3323
2
3121
2
=
=
=
2
0
1
2
01
2
1
0
01
0
)(
)(21
))((2
ryy
k
y
D
N
f
y
yykrk
y
y
yyxxk
x
y
Y
o
=
=
=
=
3. Derivadas parciais em relação à base:
A base é dada por
222
ZYXB ++=
onde
d
C
e
C
d
C
e
C
d
C
e
C
ZZZ
YYY
XXX
=
=
=
e as derivadas parciais em relação aos parâmetros
B
Z
Z
B
B
Y
Y
B
B
X
X
B
e
C
e
C
e
C
=
=
=
B
Z
Z
B
B
Y
Y
B
B
X
X
B
d
C
d
C
d
C
=
=
=
B
tZ
V
B
B
tY
V
B
B
tX
V
B
Z
Y
X
=
=
=
2
2
2
B
tZ
V
B
B
tY
V
B
B
tX
V
B
Z
Y
X
=
=
=
3
3
3
4. Derivadas parciais em relação à velocidade
)()()(
)()()(
333231
131211
YCZCXC
YCZCXC
tVYYrtVZZrtVXXr
tVYYrtVZZrtVXXr
fx
++
+
+
=
)()()(
)()()(
333231
232221
YCZCXC
YCZCXC
tVYYrtVZZrtVXXr
tVYYrtVZZrtVXXr
fy
++
+
+
=
)(
)(
)(
3212
2
3313
2
3111
2
x
Z
x
Y
x
X
tNrtDr
D
f
V
x
tNrtDr
D
f
V
x
tNrtDr
D
f
V
x
+=
+=
+=
)(
)(
)(
3222
2
3323
2
3121
2
x
Z
x
Y
x
X
tNrtDr
D
f
V
y
tNrtDr
D
f
V
y
tNrtDr
D
f
V
y
+=
+=
+=
APÊNDICE B
TABELAS COM OS RESULTADOS DA COMBINAÇÃO DOS CONJUNTOS DE
PARÂMETROS DO ALGORITMO DE CANNY COM O FATOR LAMBDA DO
FLUXO ÓPTICO
Tabela 17 - Experimentos com parâmetros de Canny: λ = 10 e seqüência s1
Esquerda Direita
conj. vel dp vel vet dp vet vel dp vel vet dp vet
1
14,68 2,91 1.021,93 289,57 16,95 1,64 906,83 280,76
2
12,51 2,51 1.266,41 384,78 14,75 2,19 1.048,21 344,52
3
12,38 2,45 1.418,97 473,07 12,95 2,16 1.173,45 374,61
4
5,11 1,79 2.272,00 641,28 4,59 0,87 2.220,14 708,50
5
4,88 1,73 2.356,14 665,37 4,49 0,93 2.272,34 727,30
6
4,77 1,76 2.390,83 670,34 4,46 0,92 2.291,66 734,61
7
3,32 1,19 3.286,48 1.012,18 4,04 0,73 3.196,90 1.096,83
8
3,09 1,10 3.680,90 1.114,49 3,84 0,71 3.743,66 1.341,87
9
3,07 1,08 3.705,52 1.153,39 3,84 0,71 3.743,66 1.341,87
10
12,88 3,80 1.306,21 398,02 16,51 1,85 1.087,10 332,46
11
11,76 3,34 1.501,66 445,54 14,98 1,89 1.211,79 382,88
12
10,79 3,17 1.654,76 505,36 14,32 1,70 1.350,07 429,41
13
4,80 1,80 2.497,45 692,54 4,57 0,91 2.344,62 745,61
14
4,57 1,75 2.577,03 725,36 4,48 0,95 2.408,62 767,24
15
4,35 1,70 2.687,93 763,55 4,45 0,98 2.442,97 781,61
16
3,43 1,22 3.586,90 1.037,33 3,90 0,84 3.907,66 1.230,49
17
3,29 1,13 3.940,41 1.147,09 3,86 0,81 4.026,83 1.350,68
18
3,24 1,11 4.205,24 1.219,65 3,71 0,80 4.534,48 1.493,26
19
11,46 4,58 1.437,17 423,28 13,72 2,66 1.229,86 383,73
20
10,00 4,08 1.648,76 505,57 12,21 3,45 1.369,38 447,92
21
8,84 3,60 1.813,59 576,58 12,00 3,32 1.505,59 505,70
22
4,54 1,71 2.826,62 784,39 4,54 0,91 2.560,69 844,66
23
4,35 1,62 2.906,55 802,24 4,48 0,93 2.675,17 875,60
24
4,03 1,47 3.046,00 855,20 4,41 0,93 2.767,45 910,61
25
3,47 1,16 4.785,17 1.305,05 3,84 0,83 4.710,55 1.490,90
26
3,39 1,11 5.190,14 1.405,07 3,69 0,81 5.405,38 1.675,14
27
3,33 1,06 5.624,28 1.512,95 3,55 0,80 5.994,34 1.824,54
Tabela 18 - Experimentos com parâmetros de Canny: λ = 10 e seqüência s2
Esquerda Direita
conj. vel dp vel vet dp vet vel dp vel vet dp vet
1
6,42 2,10 1.251,53 387,13 12,82 3,08 949,20 278,93
2
5,16 1,56 1.660,40 527,44 10,13 4,70 1.073,00 305,83
3
5,09 1,22 1.811,47 596,12 9,59 5,63 1.219,47 368,09
4
4,31 0,69 2.428,13 793,65 3,37 0,37 2.221,80 731,01
5
4,26 0,73 2.473,40 806,91 3,40 0,37 2.263,00 744,83
6
4,22 0,74 2.520,27 825,16 3,39 0,37 2.277,80 750,88
7
3,97 0,98 3.366,67 1.120,10 3,48 0,58 3.410,47 1.179,17
8
3,72 1,05 3.718,67 1.182,98 3,27 0,60 4.254,07 1.502,70
9
3,72 1,05 3.718,67 1.182,98 3,27 0,60 4.254,07 1.502,70
10
5,32 2,37 1.560,40 507,06 7,53 5,89 1.094,53 331,22
11
5,12 1,74 1.742,07 559,95 7,06 6,71 1.229,67 404,35
12
4,95 1,25 1.935,47 637,83 7,13 7,07 1.389,27 505,19
13
4,02 0,53 2.599,93 838,23 3,26 0,41 2.292,53 747,99
14
3,98 0,69 2.719,33 885,44 3,28 0,39 2.362,93 767,37
15
3,98 0,70 2.758,20 896,87 3,30 0,39 2.403,93 789,38
16
4,06 0,95 3.782,73 1.204,60 3,45 0,68 3.894,07 1.201,01
17
3,95 1,00 4.135,73 1.252,41 3,45 0,69 4.013,87 1.306,61
18
3,88 1,03 4.435,27 1.300,72 3,42 0,75 4.507,47 1.433,19
19
4,89 2,28 1.622,80 526,48 3,91 4,46 1.290,00 418,73
20
4,97 1,83 1.841,07 614,94 3,08 4,40 1.451,20 484,38
21
4,74 1,41 1.984,67 644,05 3,14 4,25 1.559,13 526,09
22
3,88 0,52 2.891,53 960,46 3,15 0,48 2.480,33 850,52
23
3,89 0,59 3.008,60 1.001,95 3,14 0,45 2.605,60 873,96
24
3,92 0,69 3.122,07 1.038,05 3,13 0,41 2.705,33 907,95
25
4,08 1,04 4.819,00 1.413,93 3,40 0,73 4.448,73 1.359,02
26
4,03 1,09 5.196,33 1.499,43 3,34 0,78 5.091,73 1.492,45
27
3,97 1,13 5.572,67 1.571,23 3,31 0,80 5.629,53 1.620,26
Tabela 19 - Experimentos com parâmetros de Canny: λ = 20 e seqüência s1
Esquerda Direita
conj. vel dp vel vet dp vet vel dp vel vet dp vet
1
10,65 3,13 1.014,97 285,36 14,98 2,39 914,90 275,24
2
8,82 2,50 1.252,90 379,07 12,66 2,53 1.058,62 340,83
3
8,77 2,51 1.401,59 469,93 11,27 2,38 1.186,00 372,21
4
2,80 1,09 2.201,24 636,55 2,62 0,54 2.151,24 685,60
5
2,63 1,04 2.279,93 657,86 2,55 0,56 2.199,86 700,87
6
2,57 1,04 2.310,14 661,20 2,53 0,56 2.217,38 707,07
7
1,73 0,68 3.121,59 971,51 2,26 0,44 3.097,31 1.046,53
8
1,58 0,62 3.490,07 1.060,61 2,15 0,42 3.631,86 1.281,96
9
1,57 0,61 3.514,07 1.103,34 2,15 0,42 3.631,86 1.281,96
10
9,37 3,39 1.292,55 394,49 14,54 2,26 1.097,52 329,61
11
8,36 3,01 1.482,69 439,22 13,29 2,08 1.224,34 379,82
12
7,54 2,75 1.631,59 501,95 12,56 2,23 1.361,79 427,48
13
2,62 1,11 2.398,97 669,84 2,62 0,58 2.277,31 720,35
14
2,48 1,06 2.470,14 699,78 2,54 0,59 2.338,83 740,71
15
2,32 1,01 2.571,59 735,92 2,51 0,60 2.372,34 754,64
16
1,80 0,70 3.419,03 997,79 2,19 0,52 3.798,41 1.165,38
17
1,70 0,64 3.747,38 1.096,01 2,17 0,50 3.913,59 1.281,47
18
1,66 0,63 4.001,24 1.158,55 2,09 0,49 4.415,79 1.421,03
19
8,31 3,69 1.416,34 417,64 12,21 2,18 1.241,24 380,37
20
6,93 3,25 1.624,83 500,57 11,06 2,54 1.374,34 437,08
21
5,87 2,79 1.787,03 574,03 10,57 2,62 1.507,24 492,41
22
2,47 1,05 2.705,52 764,06 2,63 0,56 2.491,38 804,70
23
2,36 0,99 2.778,62 781,83 2,55 0,59 2.600,07 832,00
24
2,14 0,88 2.906,55 832,47 2,49 0,59 2.688,41 863,18
25
1,84 0,67 4.573,24 1.243,38 2,18 0,53 4.606,69 1.419,86
26
1,79 0,64 4.959,72 1.331,32 2,09 0,52 5.295,31 1.600,08
27
1,76 0,62 5.375,52 1.427,75 2,02 0,51 5.878,21 1.744,30
Tabela 20 - Experimentos com parâmetros de Canny: λ = 20 e seqüência s2
Esquerda Direita
conj. vel dp vel vet dp vet vel dp vel vet dp vet
1
4,67 1,35 1.178,00 346,90 9,69 2,69 952,67 270,94
2
3,48 0,94 1.539,80 467,72 7,39 3,58 1.065,80 294,19
3
3,44 0,73 1.666,60 527,43 6,93 4,20 1.202,53 352,38
4
2,45 0,40 2.186,00 686,73 1,79 0,27 2.017,67 612,54
5
2,39 0,42 2.226,60 701,97 1,78 0,27 2.056,80 626,03
6
2,33 0,39 2.268,00 718,70 1,78 0,27 2.070,60 631,52
7
2,05 0,50 3.069,07 1.012,86 1,86 0,40 3.181,47 1.055,44
8
1,93 0,55 3.407,53 1.081,62 1,75 0,40 4.004,87 1.373,85
9
1,93 0,55 3.407,53 1.081,62 1,75 0,40 4.004,87 1.373,85
10
3,83 1,50 1.473,93 469,77 5,63 4,04 1.099,13 317,78
11
3,60 1,08 1.629,53 510,77 5,23 4,59 1.218,33 377,60
12
3,35 0,76 1.793,20 571,91 5,14 4,88 1.357,67 471,05
13
2,33 0,41 2.360,93 736,00 1,76 0,27 2.090,27 627,44
14
2,26 0,44 2.464,80 779,33 1,74 0,26 2.157,60 646,39
15
2,24 0,44 2.500,20 792,40 1,74 0,26 2.195,93 668,39
16
2,13 0,49 3.499,00 1.106,65 1,88 0,47 3.661,80 1.074,36
17
2,08 0,53 3.841,00 1.157,80 1,89 0,47 3.778,40 1.179,50
18
2,05 0,55 4.136,20 1.210,69 1,89 0,51 4.261,67 1.303,76
19
3,56 1,42 1.535,00 494,34 3,16 2,88 1.271,27 394,26
20
3,52 1,10 1.726,73 568,89 2,59 2,89 1.412,80 457,22
21
3,27 0,83 1.851,53 590,77 2,58 2,87 1.506,27 498,55
22
2,30 0,41 2.637,80 864,43 1,75 0,30 2.275,53 740,55
23
2,27 0,44 2.740,93 899,65 1,71 0,30 2.388,13 757,09
24
2,25 0,47 2.845,93 937,10 1,68 0,30 2.480,27 787,44
25
2,18 0,56 4.546,93 1.338,78 1,88 0,50 4.205,80 1.238,37
26
2,15 0,59 4.922,33 1.427,57 1,86 0,53 4.839,93 1.368,26
27
2,12 0,61 5.298,60 1.502,93 1,85 0,54 5.371,53 1.494,94
Tabela 21 - Experimentos com parâmetros de Canny: λ = 30 e seqüência s1
Esquerda Direita
conj.
vel dp vel vet dp vet vel dp vel vet dp vet
1
7,46 2,61 1.007,86 283,50 12,12 2,69 912,21 274,88
2
6,17 2,07 1.240,21 379,33 10,09 2,51 1.056,48 341,05
3
6,16 2,10 1.387,17 473,15 9,07 2,39 1.183,17 372,54
4
1,81 0,77 2.146,55 627,92 1,80 0,46 2.084,14 662,03
5
1,70 0,73 2.223,79 649,25 1,75 0,46 2.130,28 674,97
6
1,66 0,73 2.252,90 651,94 1,74 0,46 2.147,10 680,40
7
1,14 0,50 3.021,72 947,15 1,52 0,35 3.013,03 1.008,16
8
1,03 0,46 3.379,72 1.028,31 1,45 0,33 3.545,59 1.243,85
9
1,03 0,46 3.403,66 1.074,04 1,45 0,33 3.545,59 1.243,85
10
6,62 2,70 1.274,90 392,57 11,74 2,58 1.092,83 328,31
11
5,90 2,43 1.459,45 435,34 10,77 2,34 1.218,83 378,68
12
5,29 2,16 1.604,83 500,51 10,12 2,43 1.352,76 426,10
13
1,70 0,78 2.328,97 656,02 1,80 0,49 2.210,90 692,78
14
1,61 0,74 2.396,76 684,48 1,74 0,49 2.270,76 711,87
15
1,51 0,70 2.492,83 718,98 1,72 0,48 2.303,79 725,04
16
1,18 0,52 3.311,45 973,36 1,47 0,40 3.712,90 1.124,33
17
1,11 0,48 3.630,00 1.065,69 1,46 0,39 3.826,97 1.238,65
18
1,08 0,46 3.877,66 1.122,81 1,41 0,38 4.329,17 1.376,88
19
5,91 2,82 1.395,66 416,39 9,97 1,93 1.231,59 375,40
20
4,85 2,48 1.598,41 499,35 9,21 1,81 1.353,59 421,02
21
4,05 2,09 1.756,76 574,10 8,67 1,92 1.480,21 472,13
22
1,61 0,74 2.622,07 752,36 1,82 0,47 2.419,59 767,94
23
1,53 0,71 2.691,79 769,48 1,75 0,49 2.525,66 793,77
24
1,39 0,62 2.812,41 816,00 1,69 0,49 2.612,00 823,03
25
1,21 0,51 4.449,03 1.208,69 1,47 0,42 4.514,97 1.370,22
26
1,18 0,49 4.828,41 1.292,18 1,41 0,40 5.200,41 1.548,98
27
1,15 0,47 5.238,48 1.383,82 1,36 0,40 5.781,66 1.691,93
Tabela 22 - Experimentos com parâmetros de Canny: λ = 30 e seqüência s2
Esquerda Direita
conj. vel. dp vel vet dp vet vel dp vel vet dp vet
1
3,45 0,80 1.138,40 325,66 6,72 2,01 961,07 261,30
2
2,60 0,50 1.442,47 413,88 5,10 2,51 1.070,00 283,32
3
2,56 0,44 1.555,27 458,50 4,85 2,85 1.196,27 337,24
4
1,65 0,36 2.024,53 599,96 1,13 0,26 1.904,33 533,21
5
1,59 0,36 2.062,73 615,35 1,12 0,26 1.941,60 545,93
6
1,53 0,32 2.101,40 631,79 1,11 0,26 1.954,40 551,00
7
1,28 0,35 2.883,87 923,14 1,17 0,32 3.061,53 977,41
8
1,21 0,37 3.218,13 993,44 1,10 0,30 3.882,00 1.299,37
9
1,21 0,37 3.218,13 993,44 1,10 0,30 3.882,00 1.299,37
10
2,96 0,72 1.394,87 427,73 3,93 2,64 1.106,13 306,33
11
2,77 0,51 1.530,20 454,38 3,71 2,91 1.215,53 358,43
12
2,50 0,46 1.670,07 495,95 3,62 3,07 1.331,73 438,52
13
1,60 0,40 2.189,33 647,62 1,13 0,29 1.975,40 548,44
14
1,52 0,39 2.289,60 690,33 1,11 0,29 2.041,40 567,80
15
1,51 0,38 2.323,00 703,90 1,10 0,28 2.080,13 589,97
16
1,35 0,35 3.308,07 1.017,84 1,21 0,38 3.537,87 996,04
17
1,31 0,37 3.650,20 1.072,40 1,21 0,39 3.653,47 1.103,16
18
1,29 0,38 3.945,60 1.127,07 1,21 0,40 4.134,60 1.227,79
19
2,80 0,69 1.450,33 446,82 2,40 1,81 1.258,33 371,37
20
2,71 0,53 1.619,27 504,36 2,06 1,81 1.382,73 425,39
21
2,47 0,44 1.730,53 521,14 2,03 1,84 1.460,87 460,55
22
1,58 0,40 2.455,87 773,82 1,15 0,32 2.157,67 662,30
23
1,54 0,40 2.554,73 809,23 1,12 0,31 2.265,87 675,84
24
1,51 0,40 2.656,13 847,46 1,09 0,32 2.354,93 703,34
25
1,38 0,40 4.346,13 1.256,85 1,21 0,40 4.072,47 1.158,23
26
1,36 0,41 4.722,13 1.347,03 1,20 0,41 4.703,60 1.286,60
27
1,34 0,43 5.098,67 1.423,95 1,19 0,41 5.233,53 1.414,29
Tabela 23 - Experimentos com parâmetros de Canny: λ = 40 e seqüência s1
Esquerda Direita
conj. vel dp vel vet dp vet vel dp vel vet dp vet
1
5,32 2,03 1.004,83 282,92 9,38 2,50 906,76 274,99
2
4,40 1,61 1.233,72 379,26 7,73 2,24 1.051,45 340,80
3
4,40 1,64 1.379,03 473,92 6,98 2,16 1.177,45 372,87
4
1,25 0,56 2.116,97 620,08 1,30 0,38 2.051,38 654,79
5
1,17 0,53 2.192,62 641,11 1,26 0,38 2.096,34 666,90
6
1,14 0,53 2.221,59 643,90 1,24 0,37 2.113,31 672,20
7
0,78 0,37 2.976,76 938,71 1,08 0,28 2.972,21 995,46
8
0,70 0,34 3.331,10 1.016,18 1,02 0,27 3.503,31 1.231,03
9
0,70 0,33 3.354,69 1.062,78 1,02 0,27 3.503,31 1.231,03
10
4,75 2,06 1.265,93 390,72 9,06 2,43 1.085,66 326,51
11
4,22 1,86 1.446,97 432,98 8,32 2,21 1.210,76 376,95
12
3,78 1,63 1.589,72 498,26 7,79 2,24 1.341,66 424,68
13
1,17 0,57 2.292,07 646,09 1,29 0,40 2.176,83 683,63
14
1,10 0,54 2.358,62 674,38 1,25 0,40 2.236,55 702,49
15
1,03 0,50 2.451,86 708,86 1,23 0,39 2.268,69 716,39
16
0,81 0,38 3.259,24 962,00 1,05 0,32 3.669,86 1.110,36
17
0,77 0,36 3.574,00 1.051,53 1,04 0,31 3.783,03 1.224,14
18
0,75 0,35 3.819,52 1.106,60 1,00 0,30 4.285,31 1.362,66
19
4,25 2,12 1.383,86 415,75 7,72 1,72 1.221,31 373,84
20
3,46 1,85 1.582,14 498,00 7,17 1,53 1.338,62 417,23
21
2,86 1,54 1.737,45 572,33 6,68 1,59 1.462,41 467,98
22
1,11 0,54 2.578,34 743,08 1,31 0,39 2.381,86 756,22
23
1,05 0,51 2.646,14 759,25 1,25 0,40 2.486,28 781,86
24
0,96 0,46 2.763,31 803,51 1,21 0,39 2.570,83 810,53
25
0,84 0,38 4.386,55 1.190,35 1,05 0,32 4.463,79 1.351,60
26
0,82 0,37 4.762,90 1.272,21 1,00 0,31 5.147,93 1.528,98
27
0,80 0,36 5.170,97 1.363,14 0,97 0,31 5.728,83 1.671,53
Tabela 24 - Experimentos com parâmetros de Canny: λ = 40 e seqüência s2
Esquerda Direita
conj.
vel dp vel vet dp vet vel dp vel vet dp vet
1
2,53 0,54 1.111,20 314,67 4,65 1,45 963,47 257,28
2
1,91 0,34 1.387,13 388,19 3,57 1,77 1.069,47 278,24
3
1,87 0,33 1.487,47 422,84 3,42 2,00 1.186,93 327,80
4
1,13 0,27 1.934,53 557,94 0,76 0,20 1.848,80 494,74
5
1,09 0,26 1.971,40 574,15 0,75 0,20 1.885,27 507,03
6
1,05 0,24 2.009,27 591,07 0,75 0,20 1.897,67 511,67
7
0,85 0,24 2.786,00 882,09 0,79 0,24 3.005,80 944,96
8
0,80 0,25 3.121,33 954,26 0,74 0,22 3.826,33 1.270,67
9
0,80 0,25 3.121,33 954,26 0,74 0,22 3.826,33 1.270,67
10
2,21 0,42 1.346,87 407,39 2,76 1,81 1.106,40 302,23
11
2,05 0,33 1.470,47 428,32 2,60 1,96 1.211,33 353,65
12
1,82 0,33 1.593,20 458,35 2,55 2,05 1.315,60 424,05
13
1,11 0,31 2.096,00 607,24 0,77 0,23 1.919,27 509,36
14
1,04 0,29 2.194,93 651,05 0,75 0,23 1.986,07 529,81
15
1,03 0,29 2.227,33 663,92 0,74 0,22 2.025,27 552,74
16
0,89 0,24 3.206,27 976,40 0,82 0,28 3.479,87 960,09
17
0,86 0,25 3.550,00 1.033,96 0,82 0,29 3.595,13 1.067,93
18
0,85 0,26 3.845,33 1.089,50 0,81 0,29 4.075,47 1.192,45
19
2,08 0,42 1.399,00 427,09 1,75 1,27 1.248,73 362,57
20
2,00 0,33 1.555,20 478,46 1,54 1,27 1.365,20 411,89
21
1,80 0,29 1.658,27 491,54 1,51 1,28 1.436,07 443,03
22
1,09 0,30 2.356,33 731,12 0,79 0,25 2.102,13 627,89
23
1,06 0,30 2.453,00 766,35 0,76 0,25 2.209,07 640,76
24
1,03 0,30 2.552,73 804,98 0,74 0,25 2.295,00 666,79
25
0,92 0,27 4.238,87 1.217,20 0,82 0,29 4.008,80 1.121,56
26
0,90 0,28 4.615,87 1.308,19 0,81 0,30 4.639,27 1.248,23
27
0,88 0,29 4.992,60 1.386,37 0,80 0,30 5.167,27 1.376,13
Tabela 25 - Experimentos com parâmetros de Canny: λ = 50 e seqüência s1
Esquerda Direita
conj. vel dp vel vet dp vet vel dp vel vet dp vet
1
3,89
1,56
1.002,14
281,38
7,22
2,14
901,79 274,10
2
3,22
1,24
1.227,93
377,86
5,93
1,89
1.045,86 340,20
3
3,22
1,26
1.372,48
472,25
5,36
1,83
1.171,31 372,67
4
0,90
0,42
2.096,69
613,27
0,96
0,30
2.027,24 649,14
5
0,84
0,39
2.171,31
634,10
0,93
0,30
2.070,97 660,62
6
0,82
0,39
2.200,07
636,58
0,92
0,29
2.088,07 666,08
7
0,55
0,27
2.948,21
931,68
0,80
0,22
2.944,00 990,75
8
0,50
0,25
3.300,62
1.007,11
0,75
0,21
3.474,48 1.228,48
9
0,50
0,24
3.323,93
1.054,05
0,75
0,21
3.474,48 1.228,48
10
3,50
1,57
1.259,24
388,04
6,97
2,09
1.079,45 324,71
11
3,10
1,42
1.438,00
429,71
6,41
1,90
1.203,45 375,34
12
2,77
1,24
1.578,90
494,02
5,98
1,91
1.331,66 423,29
13
0,84
0,42
2.266,97
637,44
0,96
0,32
2.153,59 677,06
14
0,79
0,40
2.331,79
665,30
0,93
0,32
2.212,90 695,14
15
0,74
0,37
2.424,48
700,52
0,91
0,31
2.244,62 709,22
16
0,58
0,28
3.227,72
953,35
0,77
0,25
3.640,97 1.101,03
17
0,55
0,26
3.540,62
1.041,74
0,76
0,24
3.754,21 1.216,47
18
0,53
0,26
3.784,83
1.095,84
0,73
0,23
4.256,41 1.354,41
19
3,13
1,61
1.375,59
414,03
5,93
1,46
1.214,21 372,11
20
2,54
1,39
1.570,21
495,51
5,52
1,28
1.328,90 414,02
21
2,09
1,15
1.723,59
568,85
5,12
1,30
1.450,28 464,63
22
0,80
0,40
2.547,10
734,99
0,97
0,31
2.357,93 747,81
23
0,76
0,38
2.613,72
750,57
0,93
0,32
2.461,66 772,88
24
0,69
0,34
2.729,52
794,25
0,90
0,31
2.545,03 801,37
25
0,60
0,28
4.346,97
1.179,82
0,77
0,25
4.431,45 1.338,69
26
0,58
0,27
4.722,55
1.261,28
0,74
0,24
5.114,48 1.515,04
27
0,57
0,26
5.129,24
1.351,56
0,71
0,24
5.694,62 1.656,86
Tabela 26 - Experimentos com parâmetros de Canny: λ = 50 e seqüência s2
Esquerda Direita
conj. vel dp vel vet dp vet vel dp vel vet dp vet
1
1,88
0,38
1.097,67
311,41
3,34
1,05
961,53
253,57
2
1,43
0,27
1.357,93
377,10
2,58
1,28
1.065,47
274,46
3
1,39
0,27
1.449,27
404,26
2,47
1,44
1.178,13
321,26
4
0,81
0,20
1.883,80
534,87
0,54
0,16
1.813,67
470,08
5
0,78
0,20
1.920,00
551,26
0,53
0,16
1.849,80
482,44
6
0,74
0,18
1.956,53
567,38
0,52
0,15
1.862,13
487,00
7
0,60
0,17
2.726,47
856,19
0,56
0,18
2.977,27
926,66
8
0,56
0,18
3.061,73
928,66
0,52
0,16
3.798,40
1.255,74
9
0,56
0,18
3.061,73
928,66
0,52
0,16
3.798,40
1.255,74
10
1,66
0,28
1.317,13
395,65
1,98
1,31
1.102,00
299,20
11
1,55
0,25
1.432,87
413,61
1,88
1,40
1.203,53
349,34
12
1,36
0,27
1.547,13
436,95
1,84
1,46
1.300,33
413,64
13
0,80
0,24
2.040,20
583,33
0,54
0,18
1.885,00
487,59
14
0,75
0,22
2.134,13
623,56
0,53
0,18
1.952,60
508,81
15
0,74
0,22
2.165,80
636,19
0,52
0,17
1.992,07
532,13
16
0,63
0,17
3.137,40
946,21
0,58
0,21
3.447,07
940,74
17
0,61
0,18
3.481,80
1.004,28
0,58
0,21
3.562,33
1.049,21
18
0,60
0,18
3.777,73
1.060,52
0,58
0,21
4.042,20
1.173,91
19
1,56
0,28
1.364,27
412,32
1,28
0,92
1.239,53
357,32
20
1,50
0,24
1.513,07
460,00
1,14
0,93
1.351,67
404,22
21
1,34
0,22
1.611,33
471,76
1,12
0,94
1.417,67
431,65
22
0,79
0,23
2.287,80
701,82
0,57
0,19
2.071,93
611,85
23
0,76
0,23
2.382,33
736,51
0,54
0,19
2.177,53
624,67
24
0,74
0,23
2.480,33
774,85
0,53
0,19
2.262,53
650,30
25
0,65
0,19
4.160,53
1.187,42
0,58
0,22
3.975,00
1.105,45
26
0,63
0,20
4.537,00
1.278,48
0,57
0,22
4.605,33
1.230,46
27
0,62
0,20
4.914,80
1.357,27
0,57
0,22
5.133,27
1.359,59
Livros Grátis
( http://www.livrosgratis.com.br )
Milhares de Livros para Download:
Baixar livros de Administração
Baixar livros de Agronomia
Baixar livros de Arquitetura
Baixar livros de Artes
Baixar livros de Astronomia
Baixar livros de Biologia Geral
Baixar livros de Ciência da Computação
Baixar livros de Ciência da Informação
Baixar livros de Ciência Política
Baixar livros de Ciências da Saúde
Baixar livros de Comunicação
Baixar livros do Conselho Nacional de Educação - CNE
Baixar livros de Defesa civil
Baixar livros de Direito
Baixar livros de Direitos humanos
Baixar livros de Economia
Baixar livros de Economia Doméstica
Baixar livros de Educação
Baixar livros de Educação - Trânsito
Baixar livros de Educação Física
Baixar livros de Engenharia Aeroespacial
Baixar livros de Farmácia
Baixar livros de Filosofia
Baixar livros de Física
Baixar livros de Geociências
Baixar livros de Geografia
Baixar livros de História
Baixar livros de Línguas
Baixar livros de Literatura
Baixar livros de Literatura de Cordel
Baixar livros de Literatura Infantil
Baixar livros de Matemática
Baixar livros de Medicina
Baixar livros de Medicina Veterinária
Baixar livros de Meio Ambiente
Baixar livros de Meteorologia
Baixar Monografias e TCC
Baixar livros Multidisciplinar
Baixar livros de Música
Baixar livros de Psicologia
Baixar livros de Química
Baixar livros de Saúde Coletiva
Baixar livros de Serviço Social
Baixar livros de Sociologia
Baixar livros de Teologia
Baixar livros de Trabalho
Baixar livros de Turismo