Download PDF
ads:
SEGMENTAÇÃO E CLASSIFICAÇÃO DE IMAGENS SAR APLICADAS À
DETECÇÃO DE ALVOS ESCUROS EM ÁREAS OCEÂNICAS DE
EXPLORAÇÃO E PRODUÇÃO DE PETRÓLEO
Patrícia Carneiro Genovez
Tese de Doutorado apresentada ao Programa
de Pós-Graduação em Engenharia Civil,
COPPE, da Universidade Federal do Rio de
Janeiro, como parte dos requisitos necessários
à obtenção do título de Doutor em Engenharia
Civil.
Orientadores: Nelson Francisco Favilla Ebecken
Corina da Costa Freitas
Rio de Janeiro
Março de 2010
COPPE
ads:
Livros Grátis
http://www.livrosgratis.com.br
Milhares de livros grátis para download.
SEGMENTAÇÃO E CLASSIFICAÇÃO DE IMAGENS SAR APLICADAS À
DETECÇÃO DE ALVOS ESCUROS EM ÁREAS OCEÂNICAS DE
EXPLORAÇÃO E PRODUÇÃO DE PETRÓLEO
PATRÍCIA CARNEIRO GENOVEZ
TESE SUBMETIDA AO CORPO DOCENTE DO INSTITUTO ALBERTO LUIZ
COIMBRA DE PÓS-GRADUAÇÃO E PESQUISA DE ENGENHARIA (COPPE)
DA UNIVERSIDADE FEDERAL DO RIO DE JANEIRO COMO PARTE DOS
REQUISITOS NECESSÁRIOS PARA A OBTENÇÃO DO GRAU DE DOUTOR
EM CIÊNCIAS EM ENGENHARIA CIVIL.
EXAMINADA POR:
_______________________________________________
Prof. Nelson Francisco Favilla Ebecken, D.Sc.
_______________________________________________
Profª. Corina da Costa Freitas, Ph.D.
_______________________________________________
Profª. Cristina Maria Bentz, D.Sc.
_______________________________________________
Prof. Fernando Pellon de Miranda, D.Sc.
_______________________________________________
Prof. Luiz Landau, D.Sc.
RIO DE JANEIRO, RJ - BRASIL
MARÇO DE 2010
ads:
iii
Genovez, Patrícia Carneiro
Segmentação e Classificação de Imagens SAR
Aplicadas à Detecção de Alvos Escuros em Áreas
Oceânicas de Exploração e Produção de Petróleo/ Patrícia
Carneiro Genovez - Rio de Janeiro: UFRJ/COPPE, 2010.
XVIII, 235p.: il.; 29,7 cm.
Orientadores: Nelson Francisco Favilla Ebecken
Corina da Costa Freitas
Tese (doutorado) - UFRJ/ COPPE/ Programa de
Engenharia Civil, 2010.
Referências Bibliográficas: p. 179-195.
1. Detecção de Alvos Escuros. 2. Detecção de Óleo e
Ocorrências Ambientais. 3. Exploração e Produção de
Petróleo. 4. Imagens de Radares Orbitais. .5.
Segmentação e Clusterização Automática. 6. Sistema
Híbrido Inteligente. 7. Áreas Oceânicas. I. Ebecken,
Nelson Francisco Favilla et al.. II. Universidade Federal do
Rio de Janeiro, COPPE, Programa de Engenharia Civil. III.
Título.
iv
Dedico este trabalho aos meus pais
Wlademar Genovez e
Neuza Carneiro Genovez
AGRADECIMENTOS
Ao orientador Dr. Nelson Ebecken pela oportunidade concedida, pela orientação e incentivo
dedicados ao longo do desenvolvimento deste trabalho, sempre encorajando e propondo
soluções valiosas para a concretização da pesquisa.
À orientadora Dra Corina da Costa Freitas pela especial amizade e compreensão, destacando
a orientação dedicada mesclada de valiosas sugestões e questionamentos que foram
essenciais para lapidar a pesquisa realizada.
À Cristina Bentz pela amizade que construímos durante anos de trabalho, ao longo dos quais
foi possível idealizar o escopo desta pesquisa. Em especial agradeço pela sua orientação
informal repleta de diálogos extremamente enriquecedores, os quais despertaram meu
profundo interesse pelo tema estudado e, sem os quais, esta pesquisa não teria sido realizada.
Ao amigo Josemá Oliveira de Barros, que desde o início incentivou e acreditou neste trabalho,
fornecendo contribuições significativas para a pesquisa desenvolvida, através de sua ampla
experiência operacional.
À toda equipe do Controle de Contingência da PETROBRAS, pelo valioso aprendizado e pela
amizade que construímos ao longo de 6 anos de “monitoramento orbital” (2003-2009), através
dos quais pude iniciar minha trajetória ao longo deste amplo cenário que envolve a detecção
automática de óleo e ocorrências ambientais em imagens SAR.
À empresa Sampling pelo apoio e coleguismo presentes, sempre que necessário, no
desenvolvimento desta pesquisa, agradeço em especial aos colegas Antonio Francisco Corno,
Fábio Gomes de Azevedo e José Maria Ferreira de Oliveira Barroco.
À UFRJ/COPPE pela oportunidade concedida de cursar o doutorado vinculado ao programa de
Engenharia Civil: Áreas Interdisciplinares, representando um marco em minha formação
profissional e acadêmica.
À PETROBRAS por todo apoio concedido, fornecendo dados, softwares, infra-estrutura e,
principalmente o incentivo para o desenvolvimento desta pesquisa.
Aos queridos colegas do INPE meus agradecimentos pela sincera amizade e pelo pronto apoio
nos momentos de vidas e incertezas, em especial aos colegas: Luciano V. Dutra, Sidnei
João S. Sant`Anna, Graziela Scoefield, João A. Lorenzetti, Guaracy J. Erthal, Leonardo
Sant`Anna Bins, Camilo D. Rennó, Fábio Furlan, José C. Mura, Cláudia Almeida, António
vi
Miguel V. Monteiro, Valdete Duarte, Paulo Roberto Martini, Hellen Borges, Maurício A. Moreira,
Joaquim Filho e todos os que de alguma forma auxiliaram.
Aos colegas do Serviço Florestal Brasileiro que auxiliaram e apoiaram a finalização do trabalho
em especial: Ekena Pinagé, Igor Parreira, Ricardo Vilar, Anna Fanzeres, Ivã Dornellas,
Mauricio Vianna (Vulgo Maléfico), Dulce V. Amaral e Maria Alice C. Tocantins.
À querida amiga Neuza Ferreira, meus profundos e sinceros agradecimentos, por todos os
momentos especiais que vivemos juntas, sempre me encorajando nos momentos mais difíceis,
os quais não teria superado sem a sua amizade. Tudo o que aprendi e vivenciei ao seu lado
guardarei com muito zelo.
À minha querida irmã Sarita Carneiro Genovez e ao meu cunhado José Donizeti Costa Junior
pelo carinho e amizade, sempre acreditando em meu trabalho e em meus sonhos. Aos meus
irmãos Leonardo Carneiro Genovez e Walter Carneiro Genovez e as minhas cunhadas Mariana
Genovez e Simone Genovez, agradeço pelo apoio e incentivo, me encorajando a enfrentar os
desafios.
Ao Ramon Morais de Freitas minha especial gratidão pela sua dedicação e apoio, estando ao
meu lado nos momentos mais difíceis da tese, dialogando e sugerindo soluções. Em especial
agradeço pelo carinho e pelo amor cultivados, sem os quais seria difícil prosseguir.
vii
Resumo da Tese apresentada à COPPE/UFRJ como parte dos requisitos
necessários para a obtenção do grau de Doutor em Ciências (D.Sc.)
SEGMENTAÇÃO E CLASSIFICAÇÃO DE IMAGENS SAR APLICADAS À
DETECÇÃO DE ALVOS ESCUROS EM ÁREAS OCEÂNICAS DE
EXPLORAÇÃO E PRODUÇÃO DE PETRÓLEO
Patrícia Carneiro Genovez
Março/2010
Orientadores: Nelson Francisco Favilla Ebecken
Corina da Costa Freitas
Programa: Engenharia Civil
Sistemas para detecção automática de vazamentos de óleo têm sido
desenvolvidos para auxiliar a interpretação das imagens SAR, sendo compostos por 4
etapas: a) pré-processamento; b) detecção de alvos escuros; c) cálculo de atributos, e;
d) classificação dos alvos em óleo ou assemelhados. A detecção dos alvos escuros é
a principal etapa, sem a geometria dos alvos não como classificá-los em óleo ou
assemelhados. Neste contexto, o desenvolvimento de um procedimento automático
para a detecção de alvos escuros em imagens SAR, integrando técnicas de
segmentação de imagens e de reconhecimento de padrões constitui o objetivo
proposto. Os procedimentos envolveram as seguintes etapas: a) definição do
espaçamento de pixel e do filtro para o pré-processamento; c) partição das imagens
em regiões utilizando técnicas de segmentação por crescimento de regiões; d) cálculo,
análise exploratória e seleção de atributos; e) detecção de alvos escuros utilizando
clusterização de dados, e; f) validação do método proposto. Embora o método
proposto tenha detectado alvos escuros com diferentes níveis de complexidade em
diferentes recortes de cena, não obteve resultados satisfatórios em todos os exemplos
estudados. Como ainda não um consenso sobre a utilização operacional de
métodos plenamente automáticos, a elaboração de um sistema híbrido inteligente
capaz de indicar através de regras de decisão as imagens aptas para o
processamento automático ou semi-automático foi proposta. Os resultados
evidenciaram o potencial destas regras para auxiliar no processo de automatização,
sendo necessárias mais amostras para retornar regras mais robustas aplicáveis a toda
nova imagem SAR adquirida.
viii
Abstract of Thesis presented to COPPE/UFRJ as a partial fulfillment of the
requirements for the degree of Doctor of Science (D.Sc.)
SAR IMAGE CLASSIFICATION AND SEGMENTATION FOR DARK SPOT
DETECTION IN OCEANIC PETROLEUM EXPLORATION
AND PRODUCTION AREAS
Patrícia Carneiro Genovez
March/2010
Advisors: Nelson Francisco Favilla Ebecken
Corina da Costa Freitas
Department: Civil Engineering
Automatic oil detection systems have been developed to improve SAR image
interpretation, composed of four principal stages: a) image pre-processing; b) dark spot
detection; c) feature extraction, and; d) oil and look-alike classification. The dark spot
detection is considered the main step in the processing chain: without the geometry of
the spots, the oil and look-alikes classification is unfeasible. In this context, this work
aimed to develop an automatic classification procedure able to detect dark spots in
SAR images, by the integration of segmentation and pattern recognition techniques.
The proposed methodology were organized in six stages as follow: a) images subset
selection; b) pixel spacing and filter definition; c) image partition into proper regions
using region growing segmentation techniques; d) features extraction, exploratory
analyses and feature selection; e) dark spot detection using data clustering, and; f)
validation of the proposed method. In spite of the proposed method had been able to
detect dark spots with different complexity levels in different image subsets, it didn’t
achieve good results for all analyzed examples. Considering that in the scientific
community there isn’t a wide agreement about the operational use of fully automatic
methods, the development of an intelligent hybrid system, including decision rules able
to conduct the images for one automatic or semi-automatic processing, was an
interesting approach. The potential of these rules to improve the automation process
was indicated. Nevertheless, more samples to return more robust rules are
recommended in order to be widely applied to all SAR images acquired.
ix
SUMÁRIO
Pág.
RESUMO........................................................................................................................iv
ABSTRACT.....................................................................................................................v
ÍNDICE DE FIGURAS .................................................................................................. ix
ÍNDICE DE TABELAS ................................................................................................ xvi
CAPÍTULO 1 - INTRODUÇÃO .............................................................................. 1
1.1 Objetivos ........................................................................................................... 5
1.1.1 Objetivos Específicos .................................................................................. 5
1.2 - Principais Contribuições .................................................................................... 6
1.4 Organização da Tese ........................................................................................ 7
CAPÍTULO 2 IMAGEAMENTO SAR EM ÁREAS OCEÂNICAS ..................... 8
2.1 - Fatores de Influência na Detecção de Alvos Escuros em Imagens SAR ......... 11
2.1.1 - O Ruído Speckle ....................................................................................... 14
CAPÍTULO 3 DETECÇÃO AUTOMÁTICA DE ÓLEO E OCORRÊNCIAS
AMBIENTAIS EM IMAGENS SAR ....................................................................... 16
3.1 Detecção de Alvos Escuros em Imagens SAR ................................................ 17
3.1.1 Segmentação de Imagens SAR ............................................................... 30
3.1.1.1 MultiSeg: Informações Técnicas ......................................................... 30
3.1.1.2 SPRING: Informações Técnicas ......................................................... 32
3.2 Clusterização de Dados .................................................................................. 32
3.2.1 Clustan: Informações Técnicas ................................................................ 36
3.3 Avaliação dos Resultados obtidos para Detecção de Alvos Escuros em
Imagens SAR ............................................................................................................ 38
3.3.1 Métricas calculadas no Nível das Regiões ............................................... 40
3.3.1 Métricas Calculadas no Nível dos Pixels .................................................. 43
CAPÍTULO 4 METODOLOGIA E RECURSOS UTILIZADOS ....................... 46
4.1 Etapa 1: Conjunto de Dados Informações Técnicas e Seleção de Exemplos
.................................................................................................................................. 47
4.2 Etapa 2: Determinação do Espaçamento de Pixel .......................................... 51
4.3 Etapa 3: Determinação do Filtro/Janela .......................................................... 52
4.4 Etapa 4: Determinação do Procedimento de Segmentação ............................ 53
4.5 Etapa 5: Determinação do Procedimento de Clusterização............................. 55
4.6 Etapa 6: Validação do Método Proposto ......................................................... 56
CAPÍTULO 5 RESULTADOS E DISCUSSÕES ............................................... 58
5.1 Etapa 1: Determinação do Espaçamento de Pixel .......................................... 58
5.1.1 Determinação dos Parâmetros Adequados para o Software MultiSeg .... 58
5.1.2 Determinação do Espaçamento de Pixel .................................................. 66
5.2 Etapa 2: Determinação do Filtro/Janela .......................................................... 70
5.3 Etapa 3: Determinação do Segmentador ........................................................ 73
5.4 Etapa 4: Determinação do Método de Clusterização....................................... 89
5.4.1 Cálculo dos Atributos ............................................................................... 90
5.4.2 Análise Exploratória e Seleção de Atributos ............................................. 93
5.4.2.1 Análise de Matriz de Correlação ......................................................... 94
5.4.2.2 Análise de Componentes Principais ................................................. 101
5.4.2.4 Seleção de Atributos ........................................................................ 104
5.4.3 Reconhecimento de Padrões por Clusterização Automática .................. 112
5.4.4 Comparação entre os Métodos Automático e Semi-automático ............. 139
5.5 Regra de Decisão e Validação do Modelo Proposto ..................................... 157
CAPÍTULO 6 CONCLUSÕES E RECOMENDAÇÕES ................................. 167
xi
REFERÊNCIAS BIBLIOGRÁFICAS .................................................................. 179
APÊNDICE I .......................................................................................................... 192
APÊNDICE II ......................................................................................................... 193
APÊNDICE III ........................................................................................................ 194
APÊNDICE IV ........................................................................................................ 206
APÊNDICE V ......................................................................................................... 219
xii
ÍNDICE DE FIGURAS
Pág.
Figura 1.1 Etapas envolvidas nos algoritmos de detecção automática de óleo e
ocorrências ambientais. ............................................................................................... 3
Figura 1.1 Etapas envolvidas nos sistemas de detecção automática de óleo e
ocorrências ambientais. ............................................................................................... 3
Figura 2.2 Tipos de espalhamento produzidos pela interação do pulso emitido pelo
RADAR com os alvos presentes na superfície oceânica, juntamente com os alvos
escuros freqüentemente detectáveis nas imagens. ................................................... 11
Figura 2.3 Tamanho Relativo dos Comprimentos de Onda na Faixa de Microondas.
.................................................................................................................................. 12
Figura 2.4 - Geometria de imageamento do SAR e o efeito do ângulo de incidência no
near e no far range: Imagem RADARSAT-1. ............................................................. 13
Figura 2.5 Representação do ruído speckle. ........................................................... 15
Figura 3.1 - Diferentes tipos de processamento efetuados no nível do pixel e das
regiões encontrados na literatura. .............................................................................. 25
Figura 3.2 Comparação entre o agrupamento efetuado a partir de regiões e de
pixels. ........................................................................................................................ 28
Figura 3.3 Ilustração das definições referentes a terminologia adota ao longo da
tese. ........................................................................................................................... 39
Figura 3.4 - Esquema de como é efetuado o ajuste de regiões entre as duas imagens:
exemplo focado para no ajuste efetuado para os alvos escuros. ............................... 42
Figura 4.1 Etapas de processamento envolvidas no sistema de detecção automática
de óleo e ocorrências ambientais............................................................................... 46
Figura 4.2 Etapas integrantes da metodologia proposta na tese. ............................ 47
Figura 4.3 - Histogramas e box plots para uma mesma imagem no formato CEOS e
MrSid. ........................................................................................................................ 49
Figura 4.4 Recorte da cena RADARSAT-1 (03/04/2002) utilizada no estudo proposto
.................................................................................................................................. 51
Figura 4.5 Metodologia adotada para investigar o espaçamento de pixel adequado
para o processamento dos dados RADARSAT no sistema de detecção automático . 52
xiii
Figura 4.6 Metodologia adotada para investigar o filtro/janela adequado para o
processamento dos dados RADARSAT no sistema de detecção automático. ........... 53
Figura 4.7 - Fluxo de procedimentos metodológicos planejado para investigar a etapa
de segmentação em imagens de SAR. ...................................................................... 54
Figura 4.8 - Fluxo de procedimentos planejado para investigar o método de
clusterização mais adequado a ser utilizado após a segmentação das imagens
SAR. .......................................................................................................................... 56
Figura 5.1 - Resultados obtidos para segmentações realizadas nos modos/formato:
Cartoon/Amplitude, Cartoon/Intensidade e Texture/ Intensidade. .............................. 59
Figura 5.2 Exemplos de segmentações nos modos Cartoon/Amplitude, e
Cartoon/Intensidade................................................................................................... 60
Figura 5.3 - Resultados obtidos para segmentações realizadas com Nel 2, 3 e 4,
considerando todos os espaçamentos de pixel avaliados. ......................................... 62
Figura 5.4 Exemplo de box plot calculado para as regiões claras e escuras e método
proposto para o cálculo do Limiar de Similaridade em dB. ......................................... 64
Figura 5.5 Metodologia padrão proposta para calcular o Limiar de Similaridade. .... 65
5.6 Resultados obtidos para os diferentes espaçamentos de pixel avaliados. ........ 67
Figura 5.7 Resultados obtidos para a imagem sem filtro e com filtro Lee 3x3,
Mediana 3x3, Sigma 3x3 e Kuan 3x3. ........................................................................ 71
Figura 5.8 - Recortes de cena utilizados juntamente com os Phantons elaborados
manualmente indicando os alvos escuros de referência. ........................................... 73
Figura 5.9 - Gráficos comparando as métricas calculadas para os segmentadores
MultiSeg e SPRING com e sem a aplicação de filtro.................................................. 78
Figura 5.10 Efeito da aplicação do Filtro Lee (3X3) no Potencial de Detecção de
Alvos Escuros para os softwares utilizados. .............................................................. 82
Figura 5.11 Síntese dos resultados obtidos para o agrupamento das segmentações
realizadas nos softwares SPRING e MultiSeg. .......................................................... 84
Figura 5.12 Resultados do agrupamento das segmentações realizadas para os
diferentes recortes de cena com e sem filtragem para os softwares SPRING e
MultiSeg. .................................................................................................................... 85
Figura 5.13 Etapas integrantes da metodologia proposta nesta última etapa da
tese. ........................................................................................................................... 90
xiv
Figura 5.14 Método proposto para a definição do Atributo Classe do Phanton. ...... 92
Figura 5.15 Atributos e procedimentos utilizados na análise exploratória e seleção de
atributos. .................................................................................................................... 94
Figura 5.16 - Gráficos resultantes da ACP efetuadas para as 11 cenas analisadas. 103
Figura 5.17 - Espacialização dos 10 atributos mais indicados pelo ranking para as 11
cenas estudadas. ..................................................................................................... 108
Figura 5.18 - Metodologia utilizada para a validação do conjunto adequado de
atributos. .................................................................................................................. 113
Figura 5.19 Influência da utilização simultânea e individual dos atributos de Máximo
e Mínimo na clusterização. ...................................................................................... 114
Figura 5.20 Propriedades dos atributos de Máximo e Mínimo que influenciam na
clusterização. ........................................................................................................... 117
Figura 5.21 Gráfico e espacialização das clusterizações realizadas para a Cena
1. ............................................................................................................................. 119
Figura 5.22 Gráfico e espacialização das clusterizações realizadas para a Cena
2. ............................................................................................................................. 119
Figura 5.23 Gráfico e espacialização das clusterizações realizadas para a Cena
3. ............................................................................................................................. 120
Figura 5.24 Gráfico e espacialização das clusterizações realizadas para a Cena
4. ............................................................................................................................. 120
Figura 5.25 Gráfico e espacialização das clusterizações realizadas para a Cena
5. ............................................................................................................................. 121
Figura 5.26 Gráfico e espacialização das clusterizações realizadas para a Cena
6. ............................................................................................................................. 121
Figura 5.27 Gráfico e espacialização das clusterizações realizadas para a Cena
7. ............................................................................................................................. 122
Figura 5.28 Gráfico e espacialização das clusterizações realizadas para a Cena
8. ............................................................................................................................. 122
Figura 5.29 Gráfico e espacialização das clusterizações realizadas para a Cena
9. ............................................................................................................................. 123
Figura 5.30 Gráfico e espacialização das clusterizações realizadas para a Cena
10. ........................................................................................................................... 123
xv
Figura 5.31 Gráfico e espacialização das clusterizações realizadas para a Cena
11. ........................................................................................................................... 124
Figura 5.32 - Espacialização dos melhores resultados da clusterização considerando o
universo de 9 e 35 atributos ..................................................................................... 129
Figura 5.33 - Sobreposição dos Phantons com os resultados das clusterizações. ... 131
Figura 5.34 - Sobreposição dos Phantons com os resultados das clusterizações. ... 132
Figura 5.35 Exatidão, Omissão e Inclusão nos resultados obtidos pelas
clusterizações para as 5 cenas consideradas satisfatórias. ..................................... 134
Figura 5.36 - Diferenças encontradas entre os clusters utilizando 4 e 5 atributos para a
cena 11. ................................................................................................................... 137
Figura 5.37 Resultados obtidos pela utilização de técnicas automáticas e semi-
automáticas na detecção de alvos escuros em imagens SAR. ................................ 141
Figura 5.38 Resultados obtidos pela utilização de técnicas automáticas e semi-
automáticas na detecção de alvos escuros em imagens SAR. ................................ 145
Figura 5.39 Ampliação da malha de filamentos provenientes de óleos biogênicos
existentes nas cenas 1, 10 e 11 ............................................................................... 148
Figura 5.40 Gráfico com os Erros de Omissão, de Inclusão e as ExAE obtidas para
os métodos automático e semi-automáticos em cada recorte de cena. ................... 148
Figura 5.41 Detalhes da cena 4, ampliando os resultados das clusterizações para os
alvos escuros. .......................................................................................................... 150
Figura 5.42 Detalhes da cena 5, ampliando os resultados das clusterizações para os
alvos escuros relacionados a baixas intensidades de vento. ................................... 150
Figura 5.43 Detalhes da cena 5, ampliando os resultados das clusterizações para os
alvos escuros relacionados a óleo. .......................................................................... 151
Figura 5.44 Detalhes da cena 5, ampliando os resultados das clusterizações para os
alvos escuros relacionados a óleo. .......................................................................... 151
Figura 5.45 - Comparação entre o agrupamento realizado: a) pelo Clustan,
considerando as regiões da segmentação, e; b) pelo K-means tradicional aplicado
diretamente sobre os pixels. .................................................................................... 152
Figura 5.46 Comparação entre resultados obtidos por diferentes métodos
automáticos de detecção de alvos escuros disponíveis na literatura e os obtidos na
pesquisa desenvolvida. ............................................................................................ 153
xvi
Figura 5.47 Comparação entre resultados obtidos por diferentes métodos
automáticos de detecção de alvos escuros disponíveis na literatura e os obtidos na
pesquisa desenvolvida. ............................................................................................ 155
Figura 5.48 Método para criação e validação da regra de decisão para definir o
processamento como automático ou semi-automático. ............................................ 159
Figura 5.49 Regra de decisão obtida pela ACR para definir o processamento como
automático ou semi-automático. .............................................................................. 160
Figura 5.50 Recortes de Cena escolhidos para validação do método proposto para a
detecção automática de alvos escuros em imagens SAR. ....................................... 161
Figura 5.51 Resultados obtidos para validação do método de detecção automática
de alvos escuros proposto na tese. .......................................................................... 162
Figura 5.52 Dimensões do recorte de cena B, evidenciando o conjunto de pixels nas
regiões escuras delimitadas pela segmentação. ...................................................... 163
Figura 5.53 Validação da regra de decisão para definir o processamento como
automático ou semi-automático. .............................................................................. 165
ÍNDICE DE TABELAS
Pág.
Tabela 3.1 - Matriz de confusão para o agrupamento das regiões em alvos escuros e
oceano. ...................................................................................................................... 43
Tabela 4.1 - Configuração dos modos de imageamento do satélite RADARSAT-1
adequados ao monitoramento costeiro e oceânico .................................................... 47
Tabela 4.2 - Data das cenas e parâmetros de aquisição das imagens pelo sensor para
os recortes de cena selecionados. ............................................................................. 49
Tabela 4.3 Características associadas à seleção dos recortes de cena utilizados. . 50
Tabela 5.1 Métricas utilizadas para avaliação dos diferentes espaçamentos de
pixel ........................................................................................................................... 66
Tabela 5.2 Métricas utilizadas para avaliação dos diferentes filtros/janela testados.70
Tabela 5.3 Variáveis calculadas com a amostragem do buffer e LS calculados para
o SPRING e para o MultiSeg, considerando a diferença entre os quartis do box plot. 76
xvii
Tabela 5.4 Métricas utilizadas para avaliação dos diferentes segmentadores
aplicados nos recortes de cena com e sem filtragem. ................................................ 77
Tabela 5.5 - Síntese dos resultados obtidos para as métricas de avaliação por recorte
de cena estudado após a aplicação do filtro Lee/3X3. ............................................... 81
Tabela 5.6 - Teste de Wilcox efetuado para os resultados obtidos com o segmentador
MultiSeg com e sem filtragem. ................................................................................... 83
Tabela 5.7 - Teste de Wilcox efetuado para os resultados obtidos com o segmentador
SPRING com e sem filtragem. ................................................................................... 83
Tabela 5.8 - Teste de Wilcox efetuado para os resultados obtidos com o segmentador
MultiSeg e SPRING com filtragem. ............................................................................ 88
Tabela 5.9 Coeficientes de Correlação dos atributos estatísticos em relação ao
Phanton. .................................................................................................................... 95
Tabela 5.10 - Análise Síntese da Matriz de Correlação para as 11 Cenas: Atributos
Estatísticos. ............................................................................................................... 96
Tabela 5.11 Coeficientes de Correlação dos atributos Geométricos Genéricos e
Poligonais em relação ao Phanton. ............................................................................ 97
Tabela 5.12 - Análise síntese da Matriz de Correlação para as 11 Cenas: Atributos
Geométricos Genéricos e Poligonais ......................................................................... 98
Tabela 5.13 Coeficientes de Correlação dos atributos Geométricos Skeletons em
relação ao Phanton. ................................................................................................... 98
Tabela 5.14 - Análise síntese da Matriz de Correlação para as 11 Cenas: Atributos
Geométricos Skeletons. ............................................................................................. 99
Tabela 5.15 Coeficientes de Correlação dos atributos texturais em relação ao
Phanton. .................................................................................................................. 100
Tabela 5.16 - Análise síntese da Matriz de Correlação para as 11 Cenas: Atributos
Texturais. ................................................................................................................. 100
Tabela 5.17 - Síntese do número de componentes necessários em cada cena para
manter pelo menos 90% da representatividade dos dados. ..................................... 104
Tabela 5.18 Ranking dos 10 atributos mais importantes para cada cena .............. 105
Tabela 5.19 Ranking dos 10 atributos mais importantes indicados pelo chi-quadrado
do 1º ao 10º lugar. ................................................................................................... 107
xviii
Tabela 5.20 Exatidão dos Alvos Escuros (ExAE) obtida para as clusterizações
efetuadas, considerando os atributos de máximo e mínimo simultaneamente e
individualmente. ....................................................................................................... 118
Tabela 5.21 - ntese dos resultados obtidos considerando as clusterizações
efetuadas com os 9 e 35 atributos. .......................................................................... 128
Tabela 5.22 Índices de ExAE obtidos para as 11 cenas com 4 e 5 atributos. ....... 137
Tabela 5.23 - Métricas de avaliação calculadas para os resultados das clusterizações
efetuadas pelos métodos automático e semi-automático ......................................... 144
Tabela 5.24 Variável dependente e atributos preditores utilizados na ACR para as
11 cenas. ................................................................................................................. 158
Tabela 5.25 - Métricas de avaliação calculadas para os resultados das
clusterizações efetuadas nos 3 novos recortes de cena para validação do método
proposto na tese. ..................................................................................................... 161
Tabela 5.26 - Métricas de avaliação calculadas para os resultados das clusterizações
automáticas efetuadas nos 3 novos recortes de cena para validação do método
proposto. .................................................................................................................. 164
CAPÍTULO 1
INTRODUÇÃO
Sistemas de vigilância e monitoramento são considerados medidas essenciais
para o controle e a prevenção de áreas suscetíveis à poluição por óleo. Este tópico
compõe grande parte das deliberações constantes na IMO (International Maritime
Organization) regulamentada internacionalmente pela MARPOL (International
Convention for the Prevention of Pollution from Ships) e pela UNCLOS (United Nations
Convention on the Law of the Sea). Tendo como base estas regulamentações,
diversos países têm implantado sistemas de monitoramento costeiros e oceânicos
utilizando como instrumento imagens provenientes de sensores orbitais e/ou
aerotransportados (ENGELHARDT, 1999).
O sucesso de uma operação de contingenciamento está diretamente ligado à
rapidez com que uma mancha de óleo é detectada e monitorada (ASSILZADEH &
MANSOR, 2001). Nestas situações, o sensoriamento remoto é considerado
estratégico, sendo amplamente utilizado para o monitoramento de ocorrências
ambientais envolvendo derramamento de óleo no mar (ENGELHARDT, 1999).
Sensores remotos produzem informações consistentes sobre locais de difícil acesso,
fornecendo uma visão sinótica sob áreas dotadas de grande extensão como é o
caso das regiões costeiras e oceânicas. O potencial de recobrimento sistemático das
áreas de interesse, bem como a capacidade para disponibilizar, em tempo próximo do
real, informações sobre eventos imprevisíveis - como é o caso de acidentes
envolvendo derramamento de óleo (GADE et al., 2000; BENTZ et al., 2005; BENTZ et
al., 2007a; GENOVEZ et al., 2007) - constituem subsídios essenciais à tomada de
decisão durante emergências ambientais.
Sistemas sensores operando em diversas faixas do espectro eletromagnético
têm sido utilizados para detecção de óleo e ocorrências ambientais diversas no mar
(BENTZ et al., 2007a; BROWN & FINGAS, 2001; FINGAS et al., 2000a e 2000b). Em
especial, imagens provenientes de RADARes
1
de Abertura Sintética (SAR
2
) têm sido
amplamente utilizadas devido à possibilidade de fornecimento dos dados em tempo
próximo do real, bem como, à capacidade de cobrir extensas áreas adquirindo
imagens durante o dia ou à noite sem interferência de nuvens (STAPLES &
1
RADAR: é a sigla resultante de Radio Detection And Ranging, referente a sensores que
utilizam o intervalo do espectro eletromagnético entre as freqüências de 0,3 GHz a 300 GHz
(microondas), operando em plataformas orbitais ou aeronaves.
2
SAR: Synthetic Aperture RADAR
HODGINS, 1998; GADE et al., 2000; BENTZ & MIRANDA, 2001; MIRANDA et al.,
2004; FINGAS & BROWN, 2005; CHANG et al., 2005; BENTZ et al., 2005; GENOVEZ
et al., 2007). Nas imagens de RADAR adquiridas em áreas oceânicas, eventos
dotados de baixo retroespalhamento são visualmente identificados como alvos
escuros, os quais podem estar associados à presença de óleo.
Desde a década de noventa, sistemas operacionais para detecção de
vazamento de óleo no mar utilizam de maneira integrada imagens de RADAR orbital
e/ou aerotransportado e monitoramento aéreo das áreas alvo (BREKKE &
SOLBERG, 2005; BENTZ et al., 2007a). A freqüência de aquisição, o processamento
e o tempo de entrega das imagens, bem como a experiência dos interpretes na
detecção de óleo e ocorrências ambientais que se assemelham ao óleo nas imagens
de RADAR, são variáveis determinantes para a eficiência dos sistemas de
monitoramento. Geralmente, as imagens são interpretadas visualmente e as
coordenadas geográficas das manchas suspeitas de ser óleo direcionam as
verificações de campo e as ações de contingenciamento, quando necessário
(STAPLES & HODGINS, 1998; BENTZ & MIRANDA, 2001).
Em alguns casos, especialmente quando um grande número de cenas SAR
têm de ser interpretadas, o processamento das imagens e a distinção visual entre
manchas de óleo e ocorrências ambientais pode tornar-se uma tarefa difícil e com
significativa demanda de tempo (GADE et al., 1998; BREKKE & SOLBERG, 2005;
Mozilla Firefox.lnk
SOLBERG et al., 2005; KERAMITSOGLOU et al., 2006). Por outro
lado, mesmo que intérpretes devidamente treinados sejam capazes de detectar
visualmente vazamentos de óleo e diferenciá-los de ocorrências ambientais, a
experiência de cada intérprete confere subjetividade ao processo, influenciando
diretamente os resultados da interpretação (INDREGARD, 2004; SOLBERG et al.,
2005; SOLBERG, 2005; BENTZ et al., 2007a).
Sistemas para detecção automática de vazamentos de óleo têm sido
desenvolvidos para otimizar e auxiliar a interpretação das imagens SAR, buscando
reduzir a intervenção humana e, conseqüentemente, o grau de subjetividade
associado ao processo (KUBAT et al., 1998, ESPEDAL & WAHL, 1999; SOLBERG et
al., 1999, 2003 e 2005; SOLBERG, 2005; KERAMITSOGLOU et al., 2006). A cadeia
de processamentos considera prioritariamente as áreas oceânicas e tem como
objetivo a emissão de um alerta quando um alvo escuro for identificado como uma
possível mancha de óleo (KERAMITSOGLOU et al., 2006).
De maneira geral, os sistemas para detecção automática de óleo são
compostos por 4 etapas essenciais ao processo (Figura 1.1): a) pré-processamento
das imagens; b) detecção de alvos escuros; c) cálculo de atributos, e; d) classificação
dos alvos escuros em óleo e assemelhados (BJERDE et al., 1993; DEL FRATE et al.,
2000; SOLBER et al., 1996, 1997 e 2003; ZHENG et al., 2005; BREKKE & SOLBERG,
2005; ANGIULI et al., 2006; CHANG et al., 2005 e 2008; GENOVEZ et al., 2009). Na
literatura, há uma diversidade de métodos propostos, o que diferencia cada um é a
combinação de técnicas, atributos e algoritmos utilizada em cada uma das etapas
citadas. Pesquisas nesta área têm sido desenvolvidas por mais de uma década
(BREKKE & SOLBERG, 2005; TOPOUZELIS, 2008) e constituem uma extensa e
promissora área de desenvolvimento (SOLBERG et al., 1999; DEL FRATE et al., 2000;
GALLAND et al. 2004).
Figura 1.1 Etapas envolvidas nos sistemas de detecção automática de óleo e ocorrências
ambientais.
Dentre as etapas envolvidas, a detecção dos alvos escuros é a principal etapa
da cadeia de processamentos. Sem a detecção e individualização da geometria dos
alvos não como prosseguir na etapa de classificação dos eventos em óleo ou
assemelhados (KANAA et al., 2003; PELIZZARI & DIAS, 2003; SOLBERG & BREKKE,
2008; TOPOUZELIS et al., 2007a; TOPOUZELIS, 2008). Diversas abordagens para a
detecção de alvos escuros têm sido propostas combinando técnicas de segmentação
Assemelhados
Oceano
de imagens e agrupamento de regiões (BREKKE & SOLBERG, 2005;
KARATHANASSI et al., 2006; TOPOUZELIS, 2008; SOLBERG & BREKKE, 2008).
Analisando a literatura produzida nas últimas décadas sobre o tema, é
perceptível que ainda não um consenso sobre a utilização operacional de sistemas
automáticos para a detecção de óleo e ocorrências ambientais em imagens SAR
(SEASAR, 2010). Parte dos autores classifica sua metodologia como automática, mas
não operacional (LOPEZ et al., 2005; KARATHANASSI et al., 2006; TOPOUZELIS et
al. 2007). A utilização de métodos bridos, mesclando procedimentos automáticos e
semi-automáticos, foi sugerida em algumas abordagens (CALABRESI et al., 1999;
FISCELLA et al., 2000; PELIZARRI & DIAS, 2003; LOPEZ et al., 2005). Trabalhos que
indicam suas metodologias como automáticas e operacionais, enfatizam a
necessidade de aprofundar os testes, considerando mais imagens, com diferentes
tipos de alvos, em cenários com intensidade de vento variada (SOLBERG & BREKKE,
2008; TOPOUZELIS et al., 2009).
Neste contexto, a formulação de uma hipótese que busca investigar se a
definição de um método automático para detecção de alvos escuros em imagens SAR
é factível, constitui uma preocupação de relevante interesse no meio acadêmico, que
ainda não foi plenamente respondida.
Os trabalhos consultados utilizaram inúmeras técnicas de segmentação de
imagens para particionar a imagem em regiões. Entretanto, para agrupar estas regiões
em alvos escuros e oceano, a diversidade de técnicas utilizadas é restrita, sendo a
limiarização a mais comumente utilizada (TOPOUZELIS et al., 2007b; GALLAND et al.,
2003 e 2004).
Embora a utilização de regiões, ao invés de pixels, possibilite a associação de
múltiplos atributos aos segmentos, ampliando as possibilidades de investigação e de
resultados passíveis de serem obtidos (NAVULUR, 2006; BAATZ et al., 2003), na
bibliografia consultada o cálculo de atributos foi utilizado somente na etapa de
classificação dos alvos em óleo ou assemelhados e não na detecção de alvos escuros
(TOPOUZELIS, 2008; KERAMITSOGLOU et al., 2006; BREKKE & SOLBERG, 2005).
Considerando o pressuposto de que não existe um algoritmo de segmentação
que garanta desempenho plenamente satisfatório em todas as imagens
(BEAUCHEMIN & THOMSON, 1997; ESPINDOLA, 2006; BEAULIEU & TOUZI, 2002;
SOUSA, 2005), a proposta de uma nova abordagem, que utiliza o cálculo de atributos
e clusterização de dados na etapa de detecção de alvos escuros, foi considerada
promissora.
Com base nas evidências descritas, a tese considerou a hipótese de que um
método para a detecção automática de alvos escuros em imagens SAR, integrando
técnicas de segmentação de imagens e reconhecimento de padrões, pode ser
implementado com resultados satisfatórios.
No âmbito dos sistemas automáticos, foi considerada como premissa a
possibilidade de padronizar: a) os métodos de pré-processamento a serem aplicados
nas imagens; b) os parâmetros associados ao segmentador, tendo como foco a
detecção de alvos escuros em diferentes escalas, priorizando eventos associados a
óleo; c) um conjunto adequado de atributos, capaz de retornar clusters representativos
para detectar alvos escuros e oceano.
1.1 Objetivos
O principal objetivo foi propor um procedimento automático para a detecção de
alvos escuros em imagens SAR. Para tal, a influência dos métodos de pré-
processamento das imagens, o desempenho de diferentes segmentadores e a
utilização de atributos no processo de clusterização em alvos escuros e oceano foram
investigados.
Como resultado final, pretende-se disponibilizar um método com desempenho
satisfatório para detectar automaticamente a geometria dos alvos escuros nas
imagens SAR. Posteriormente, este procedimento será acoplado ao sistema de
classificação automática desenvolvido por BENTZ (2006) a fim de integrar toda a
cadeia de processamentos envolvida em um sistema de detecção automático de óleo.
1.1.1 Objetivos Específicos
Para alcançar os objetivos propostos pela pesquisa, têm-se como objetivos
específicos:
a) Com base em um banco de dados estudado e validado previamente
(BENTZ, 2006), selecionar imagens com níveis de complexidade de cena
diferenciados;
b) Determinar a configuração da resolução espacial, do filtro e da janela a ser
utilizada como padrão na etapa de pré-processamento das imagens SAR;
c) Verificar o desempenho integrado de técnicas de segmentação e
clusterização no processo de detecção de alvos escuros;
d) Avaliar a influência da utilização de diferentes atributos no processo de
agrupamento de regiões em alvos escuros e oceano, indicando um
conjunto padrão de atributos;
e) Avaliar qualitativamente e quantitativamente os resultados provenientes dos
diferentes procedimentos testados;
f) Definir o procedimento automático mais adequado para a detecção de
alvos escuros em imagens SAR, considerando os resultados obtidos nas
etapas de pré-processamento, segmentação, cálculo de atributos e
clusterização, e;
g) Validar o método proposto.
1.2 - Principais Contribuições
Como principal contribuição, espera-se que um esforço futuro para
implementar, de forma automática, o método proposto minimize: a) o tempo gasto na
interpretação visual das imagens, especialmente quando houver um grande volume de
dados; b) o grau de subjetividade associado à interpretação visual e à delimitação
manual da geometria dos alvos escuros, e; c) a quantidade de falsos alarmes,
otimizando as rotas efetuadas pelas inspeções aéreas.
Outras contribuições de relevante importância, decorrentes da rápida e
automática extração da geometria dos alvos identificados nas imagens, é a
possibilidade de criação e atualização constante de um banco de dados contendo: a) a
geometria dos alvos escuros; b) o registro da interpretação destes alvos realizada
pelos especialistas, e; c) os resultados provenientes das verificações de campo,
confirmando ou não estas interpretações. Este banco de dados pode permitir a
realização de análises estatísticas e espaciais que, ao longo do tempo, forneceriam
diagnósticos históricos sobre a variação da freqüência de ocorrência dos diversos
fenômenos identificados, permitindo avaliar e controlar a qualidade do sistema de
monitoramento.
Este banco de dados também pode viabilizar o teste e a validação de
diferentes algoritmos para detecção automática, bem como constituir um importante
repositório de dados, permitindo o armazenamento de todo conhecimento gerado pelo
sistema com base nos exemplos obtidos. Desta forma, o próprio sistema pode servir
como um guia, um tutorial para treinar intérpretes inexperientes, fornecendo uma
interpretação prévia das feições detectadas.
Finalmente, outra expectativa é de que o método proposto consiga retornar
geometrias com acurácia suficiente para alimentar o classificador desenvolvido por
BENTZ (2006) sem prejudicar a performance do mesmo.
1.4 Organização da Tese
A tese abordará os principais problemas envolvidos no desenvolvimento de
sistemas para detecção automática de óleo em imagens SAR, tendo como foco a
definição de uma metodologia para a detecção da geometria de alvos escuros capaz
de ser utilizada operacionalmente com o mínimo de intervenção humana possível.
Neste contexto, os capítulos subseqüentes abordam: a) uma revisão sobre o
imageamento SAR em áreas oceânicas, destacando os fatores que influenciam na
detecção de óleo (Capítulo 2); b) o estado da arte relacionado aos sistemas
desenvolvidos para detecção automática de óleo em imagens SAR (Capítulo 3); c) a
indicação dos procedimentos metodológicos utilizados ao longo da tese (Capítulo 4);
d) a apresentação dos resultados obtidos (Capítulo 5); e) conclusões (Capítulo 6).
CAPÍTULO 2
IMAGEAMENTO SAR EM ÁREAS OCEÂNICAS
A maioria dos sistemas de monitoramento voltados para detecção de poluição
por óleo no oceano utilizam RADARes de Abertura Sintética (SAR) instalados a bordo
de satélites e/ou aeronaves (FERRARO et al., 2007). Nas imagens de RADAR, o
oceano é representado pela intensidade do sinal de retorno que é retroespalhado pela
superfície do mar e detectado pelo sensor. A intensidade média do sinal de retorno
atribuída a cada pixel, ou célula de resolução, é proporcional à rugosidade da
superfície na escala de comprimento de onda emitida pelo RADAR (ELACHI, 1987;
BREKKE & SOLBERG, 2005; MONTALI et al., 2006).
Este mecanismo de espalhamento das microondas na superfície do mar pode
ser descrito pelo modelo de espalhamento Bragg (BREKKE & SOLBERG, 2005;
TOPOUZELIS, 2008) e ocorre devido à rugosidade causada pela presença de
pequenas ondas induzidas pelo vento (na escala de milímetros a centímetros)
denominadas ondas capilares de gravidade ou ondas Bragg (MERCIER & ARDHUIN,
2005a; ANGIULI et al., 2006). Sistemas SAR são particularmente sensíveis a estas
ondas, à medida que os pulsos de microondas emitidos pela antena entram em
ressonância com os comprimentos de onda na superfície do oceano dotados de
semelhante magnitude (BENTZ, 2006; MERCIER & ARDHUIN, 2005a;
MACCANDLESS & JACKSON, 2004; VALENZUELA, 1978).
De acordo com o modelo de espalhamento Bragg, o potencial de
retroespalhamento do sinal emitido pelo RADAR é proporcional à densidade de
energia espectral das ondas curtas oceânicas, as quais se propagam através ou ao
longo da direção de visada da antena. Estas ondas capilares de gravidade são
produzidas e propagadas pelo vento na superfície do mar com comprimentos de onda
B
) similares aos do RADAR
r
) e podem ser representados através da equação λ
B
=
λ
r
/2sen
θ
(HOLT, 2004; ALPERS & ESPEDAL, 2004), onde λ
B
corresponde ao
comprimento de onda proveniente das ondas oceânicas, λ
r
corresponde ao
comprimento de onda do pulso de RADAR e θ corresponde ao ângulo de incidência. A
Figura 2.1 ilustra o modelo de espalhamento Bragg na superfície do oceano,
relacionando λ
B
, λ
r
e θ.
Figura 2.1 - Modelo de espalhamento Bragg na superfície do oceano, relacionando λ
B
, λ
r
e θ.
FONTE: HOLT, 2004.
A presença de óleo na superfície do mar atenua as ondas capilares de
gravidade em função do grau de viscosidade e elasticidade presente nos
hidrocarbonetos (MARANGONI, 1872; ALPERS & HUHNERFUSS, 1988; ALPER et
al., 1988; ALPERS & HUHNERFUSS, 1989; ESPEDAL & WAHL, 1999; CALABRESI et
al., 1999; DEL FRATE et al., 2000; GASULL et al., 2002; MERCIER & ARDHUIN,
2005a e b;. ANGIULI et al., 2006; ALPERS et al., 1991; TOPOUZELIS et al., 2004;
MIGLIACCIO & TRANFAGLIA, 2004; BREKKE & SOLBERG, 2005; ZHENG et al.,
2005; MONTALI et al., 2006; BENTZ et al., 2006; FERRARO et al., 2007; SOLBERG &
BREKKE, 2008; TOPOUZELIS, 2008). WISMANN et al. (1998) evidenciaram que a
taxa de atenuação das ondas capilares aumenta com o aumento da viscosidade do
óleo e da espessura da camada de óleo.
Este mecanismo de atenuação ocorre de maneira eficiente porque o óleo sobre
a água reduz a interface de interação existente entre o ar e a água (MERCIER et al.,
2003), provocando uma resistência local à ação do vento, capaz de reduzir a formação
e a propagação das ondas capilares (MERCIER & ARDHUIN, 2005a e b). Portanto,
este aumento de estabilidade local na superfície do mar provocado pela presença de
óleo reduz a amplitude das cristas das ondas (ALMEIDA et al., 2005), diminuindo a
rugosidade na superfície do mar.
Superfícies menos rugosas reduzem o coeficiente de retroespalhamento,
refletindo a maior parte da energia incidente na direção oposta à antena do RADAR.
Este tipo de espalhamento, denominado especular, produz regiões escuras com baixo
retroespalhamento nas imagens, as quais podem ser associadas à presença de óleo
10
(GADE et al., 1998; MERCIER et al., 2003; TOPOUZELIS et al., 2004; BREKKE &
SOLBERG, 2005; ZHENG et al., 2005; MERCIER & ARDHUIN, 2005a; ANGIULI et al.,
2006; BENTZ, 2006).
O contraste existente entre uma menor rugosidade presente nas manchas de
óleo e uma maior rugosidade relacionada ao oceano possibilita a detecção de
manchas de óleo no RADAR (TOPOUZELIS et al., 2004; ZHENG et al., 2005;
BREKKE & SOLBERG, 2005; RAMALHO & MEDEIROS, 2007; AKKARTAL & SUNAR,
2008). Superfícies rugosas espalham a energia em várias direções, comportando-se
como refletores difusos, produzindo como resultado tons mais claros nas imagens
devido a um maior retroespalhamento do sinal emitido em direção à antena (LEWIS &
HENDERSON, 1998).
A detecção de óleo na superfície do mar é uma tarefa complexa devido à
presença de inúmeros fenômenos meteo-oceanográficos que, da mesma forma que o
óleo, atenuam as ondas capilares superficiais originando regiões escuras nas imagens
de RADAR (BJERDE et al., 1993; SLOGGETT & JORY, 1994; HOVLAND et al.1994;
ESPEDAL & WAHL, 1999; DEL FRATE et al., 2000; MERCIER et al., 2003;
SOLBERG, 2005b; BREKKE & SOLBERG, 2005; ZHENG et al., 2005; BENTZ et al.,
2005a; BENTZ et al., 2006; MONTALI et al., 2006).
Fenômenos como florescimento de algas, óleos biogênicos, zonas de
ressurgência, áreas com baixa intensidade de vento, sedimentos em suspensão,
células de chuva, dentre outros, constituem exemplos de feições passíveis de serem
interpretadas erroneamente como óleo (CALABRESI et al., 1999; GASULL et al.,
2002; ALPERS & ESPEDAL, 2004; TOPOUZELIS et al., 2004; BENTZ et. al, 2005a;
BENTZ et al. 2005b; BENTZ et al. 2006; ANGIULI et al., 2006). Estes fenômenos são
denominados assemelhados por serem facilmente confundidos com óleo nas imagens
de RADAR, resultando em falsos alarmes. Outros tipos de feições meteo-
oceanográficas detectáveis em imagens SAR, que podem auxiliar nas operações de
resposta em emergências ambientais, são: a) vórtices oceânicos; b) frentes de vento;
c) frentes oceânicas; d) ondas superficiais; e) ondas internas, e; f) ondas de gravidade
atmosférica.
A Figura 2.2 ilustra exemplos de alvos escuros freqüentemente detectáveis em
imagens de RADAR, juntamente com a representação esquemática do mecanismo de
imageamento do RADAR.
11
Figura 2.2 Tipos de espalhamento produzidos pela interação do pulso emitido pelo RADAR
com os alvos presentes na superfície oceânica, juntamente com os alvos escuros
freqüentemente detectáveis nas imagens. ADAPTAÇÃO: FONTE - BENTZ, 2006.
Além do óleo, é possível detectar alvos geométricos na superfície do mar em
imagens de RADAR, tais como embarcações e plataformas possibilitando, em
determinadas situações, identificar ou auxiliar na identificação de potenciais fontes
causadoras de vazamentos. Alvos geométricos podem formar ângulos retos voltados
para o RADAR produzindo espalhamento direto ou indireto através de refletores do
tipo diédrico ou triédrico, denominados refletores de canto (Figura 2.2). Estes
refletores provocam um intenso retorno do sinal retroespalhado para o sensor,
produzindo como resposta áreas brilhantes nas imagens de RADAR. A Figura 2.2
ilustra diferentes tipos de espalhamento produzidos pela interação do pulso emitido
pelo RADAR com os alvos presentes na superfície oceânica (BENTZ, 2006; LEWIS &
HENDERSON, 1998).
2.2 - Fatores de Influência na Detecção de Alvos Escuros em Imagens SAR
Apesar das imagens de RADAR serem amplamente utilizadas para o
monitoramento oceânico (CHANG et al., 2005; BREKKE & SOLBERG, 2005; ANGIULI
et al., 2006), a detectabilidade dos alvos escuros depende do seu contraste com o
oceano (GASULL et al., 2002). Este contraste é resultado da complexa interação
existente entre o pulso de energia eletromagnética emitida por um SAR e a superfície
Espalhamento
Difuso
Espalhamento
Especular
Espalhamento
de Canto
(Reflexão Dupla)
12
do oceano, sendo influenciado por diversos fatores como: a) propriedades elétricas da
superfície imageada e o comprimento de onda do sinal emitido pelo RADAR; b)
variação da intensidade do vento; c) geometria de imageamento; d) tipo de
polarização, e; e) o ruído speckle (SOLBERG & VOLDEN, 1997; MIGLIACCIO &
TRANFAGLIA, 2004; MACCANDLESS & JACKSON, 2004; HOLT, 2004; BREKKE &
SOLBERG, 2005; ZHENG et al., 2005; SOLBERG, 2005a; MONTALI et al., 2006;
BENTZ, 2006; http://southport. jpl.nasa.gov/, 2007).
Propriedades elétricas do alvo e comprimento de onda do RADAR: De
acordo com ESPEDAL (1998), LEWIS & HENDERSON (1998) e RANEY (1998)
RADARes são instrumentos eficientes para detecção de alvos escuros na superfície
do mar devido à alta constante dielétrica da água, que torna a penetração do pulso de
RADAR em áreas oceânicas desprezível. A maioria dos RADARes de sensoriamento
remoto opera numa faixa de comprimentos de onda que varia de 0,5 cm a 75 cm.
Estas freqüências são distribuídas em faixas específicas denominadas Bandas (Figura
2.3), que vão da Banda K, dotada de menor comprimento de onda até a P com maior
comprimento de onda, para o caso dos RADARes imageadores (DUTRA et al., 2003;
GlobSAR2/CD-ROM).
Figura 2.3 Tamanho Relativo dos Comprimentos de Onda na Faixa de Microondas. Fonte:
Material Educativo para Sensoriamento Remoto por Radar GlobeSAR2/CD-ROM.
Apesar da constante dielétrica da água tornar a penetração do pulso
eletromagnético desprezível, a Banda X é citada como a mais indicada para a
detecção de óleo devido ao seu menor poder de penetração, melhorando a detecção
de alvos na superfície do mar (BREKKE & SOLBERG, 2005). Entretanto, satélites
como o RADARSAT-1 e o ENVISAT/ASAR, ambos operando na Banda C, têm sido
amplamente utilizados com eficiência operacional satisfatória em sistemas de
monitoramento de óleo e ocorrências ambientais (BREKKE & SOLBERG, 2005).
Intensidade do Vento: Baixas intensidades de vento permitem a detecção de
assemelhados nas imagens de RADAR, aumentando a probabilidade de ocorrência de
falsos alarmes (SOLBERG & VOLDEN, 1997). Todavia, existe um limiar máximo e
MAIOR COMPRIMENTO
DE ONDA
MAIOR PODER
DE PENETRAÇÃO
13
mínimo a partir do qual o óleo e os assemelhados podem se tornar indetectáveis na
superfície do mar (TOPOUZELIS et al., 2004; ALPERS & ESPEDAL, 2004). Isto
ocorre porque a intensidade do vento influencia o nível de retroespalhamento e
conseqüentemente a visualização de feições no oceano (BREKKE & SOLBERG,
2005). Velocidades de vento abaixo de 2m/s ou 3m/s não produzem rugosidade
suficiente para a detecção de vazamentos de óleo no mar (WISMANN, 1993;
SLOGGETT & JORY, 1994; ESPEDAL, 1998; TOPOUZELIS et al., 2004; SOLBERG,
2005a; ZHENG et al., 2005; MONTALI et al., 2006; ANGIULI et al., 2006; FERRARO
et al., 2007). Altas velocidades de vento também dificultam significativamente a
detecção de óleo. De acordo com a literatura, ventos acima de 12m/s a 14m/s são
capazes de dispersar mecanicamente as manchas e aumentar significativamente a
rugosidade na superfície do oceano, criando espalhamento suficiente para bloquear a
detecção dos alvos escuros (SLOGGETT & JORY, 1994; TOPOUZELIS et al., 2004;
ZHENG et al., 2005; MERCIER & ARDHUIN, 2005a e b).
Geometria de Imageamento: O coeficiente de retroespalhamento do RADAR
também varia em função da geometria de imageamento utilizada, diminuindo com o
aumento do ângulo de incidência (MONTALI et al., 2006; BREKKE & SOLBERG,
2005; MIRANDA et al., 2004; SOLBERG, 2005a; BENTZ, 2006). Como conseqüência,
as imagens tendem a apresentar tons mais claros no alcance próximo (near range), do
que no alcance distante (far range). Quanto maior for o ângulo de incidência e a
largura da faixa imageada maior a dificuldade para detecção de alvos com baixo sinal
de retorno no alcance distante (DUTRA et al., 2003; BENTZ, 2006; http://
southport.jpl.nasa. gov/, 2007). A Figura 2.4 ilustra a geometria de imageamento do
SAR e o efeito do ângulo de incidência no near e no far range: Imagem RADARSAT-1.
Figura 2.4 - Geometria de imageamento do SAR e o efeito do ângulo de incidência no near e
no far range: Imagem RADARSAT-1.
14
Polarização da Antena: A definição do tipo de polarização a ser utilizada para
a emissão e para a recepção do pulso de microondas pela antena do RADAR também
influencia o retroespalhamento (ALPERS & ESPEDAL, 2004; MONTALI et al., 2006;
BENTZ, 2006; http:// southport.jpl.nasa. gov/, 2007). A polarização é definida como a
orientação segundo a qual o vetor campo elétrico da onda eletromagnética oscila no
tempo. Esta orientação pode determinar polarizações do tipo vertical (V) ou horizontal
(H) emitidas de maneira linear, circular ou elíptica. Usualmente, os sistemas de radar
utilizam polarizações lineares paralelas, HH
3
e VV, ou cruzadas, HV e VH (DUTRA et
al., 2003). Embora o tipo de polarização HH, utilizado no sistema RADARSAT-1, seja
eficiente para a detecção de alvos escuros (BENTZ & MIRANDA, 2001; BENTZ,
2006), a polarização VV é indicada na literatura como a mais adequada para a
detecção de variações na rugosidade da superfície do mar, tais como as provocadas
pela presença de óleo (GIRARD-ARDHUIN et al., 2003; BREKKE & SOLBERG, 2005;
BENTZ, 2006; SCHMULLIUS & EVASN, 1997). De acordo com ALPERS & ESPEDAL
(2004) isto ocorre porque a polarização VV provê um maior contraste entre a mancha
e o oceano.
Ruído Speckle: O principal fator de interferência associado à interpretação de
imagens de RADAR é a presença do ruído speckle (ARVELYNA et al., 2001; GASULL
et al., 2002; GALLAND et al, 2004; ZHENG et al., 2005; BREKKE & SOLBERG, 2005;
LOPEZ et al., 2005; TELLO et al., 2006; CHANG et al., 2008). Este ruído é inerente
ao sistema, sendo causado por interferências locais construtivas e destrutivas (Figura
2.5) no sinal de retorno retroespalhado pela superfície do mar (BENTZ, 2006;
GlobSAR2/CD-ROM). O speckle gera na imagem uma aparência granular, composta
por mudanças bruscas no nível de cinza em pixels espacialmente próximos (LEE &
HOLT, 1982; DUTRA et al., 2003; BENTZ, 2006). Desta forma, o speckle é uma forma
de ruído que degrada a qualidade das imagens, interferindo em todas as etapas de
detecção dos alvos escuros, sendo recomendado a utilização do processamento em
múltiplas visadas (multi-look) ou a aplicação de filtros para sua suavização
(ARVELYNA et al., 2001; GALLAND et al., 2004; AYED et al., 2006; CHANG et al.,
2005; BENTZ, 2006; CCRS, 2007; GlobSAR2/CD-ROM).
3
Na nomenclatura utilizada para definir o sistema de polarização de um sistema RADAR, a
primeira letra refere-se à polarização da radiação emitida pela antena, neste exemplo
Horizontal, e a segunda letra refere-se à polarização da radiação recebida pela antena, neste
exemplo também Horizontal.
15
Figura 2.5 Representação do ruído speckle. Fonte: Material Educativo para Sensoriamento
Remoto de Radar GlobeSAR2 - CD
Estes inúmeros fatores que influenciam, em maior ou menor escala, no
contraste existente entre os alvos escuros e o oceano nas imagens de RADAR fazem
com que a detecção dos alvos escuros não seja uma tarefa simples. Especificamente
para os casos de vazamento de óleo, o contraste em relação ao oceano também vai
variar de acordo com a quantidade e o tipo de óleo vazado, o intervalo de tempo entre
o vazamento e o momento da aquisição da imagem, o grau de intemperismo, dentre
outros (TOPOUZELIS, 2008; MONTALI et al., 2006; ESPEDAL & WAHL, 1999;
SOLBERG & VOLDEN, 1997).
Além destes fatores, imagens utilizadas em diferentes formatos e pré-
processadas com diferentes metodologias não retornarão os mesmos resultados para
a detecção alvos escuros, bem como para a classificação destes eventos em óleo e
assemelhados. De acordo com VACHON et al. (1999), até a calibração radiométrica
das imagens geradas em diferentes estações de recepção, utilizando diferentes
processadores, constitui um fator que interferência no desempenho dos sistemas
automáticos para detecção de óleo e assemelhados. Como existem múltiplos fatores
envolvidos, a padronização de todos os parâmetros necessários desde o pré-
processamento das imagens à etapa final de classificação é essencial para garantir o
uso operacional destes sistemas no monitoramento efetivo das regiões costeiras e
oceânicas.
16
CAPÍTULO 3
DETECÇÃO AUTOMÁTICA DE ÓLEO E OCORRÊNCIAS
AMBIENTAIS EM IMAGENS SAR
Inúmeros esforços têm sido direcionados para produzir um sistema
completamente automático, capaz de reconhecer uma provável mancha de óleo e/ou
assemelhados em imagens SAR (BJERDE et al., 1993; SLOGGETT & JORY, 1994;
HOVLAND et al., 1994; KUBAT et al., 1998; ESPEDAL & WAHL, 1999; SOLBERG et
al., 1999, 2003 e 2005; FISCELLA et al., 2000; GASULL et al., 2002; TOPOUZELIS et
al., 2003 e 2004; GALLAND et al., 2004; MIRANDA et al., 2004; BREKKE &
SOLBERG, 2005; MERCIER & ARDHUIN, 2005a e b; CHANG et al., 2005; SOLBERG,
2005; KARATHANASSI et al., 2006; ; AYED et al., 2006; KERAMITSOGLOU et al.,
2006; MONTALI et al., 2006; BENTZ, 2006; TOPOUZELIS, 2009; HANG et al., 2009,
SEASAR, 2010). Estes sistemas são configurados para processar imagens de
RADAR, considerando as áreas oceânicas, e emitir um alarme sempre que uma feição
for identificada como uma provável mancha de óleo (KERAMITSOGLOU et al., 2006).
Esta área do conhecimento reúne problemas complexos, evidenciando a necessidade
de considerável investimento em termos de desenvolvimento e pesquisa
(TOPOUZELIS et al., 2004; ANGIULI et al., 2006).
Dentre as 4 etapas integrantes dos sistemas para detecção automática de óleo
e assemelhados em imagens SAR (Capítulo 1: Figura 1.1), a etapa de detecção dos
alvos escuros é a principal etapa da cadeia de processamentos. Sem a detecção e
individualização da geometria dos alvos, não como prosseguir na etapa de
classificação dos eventos em óleo ou assemelhados (TOPOUZELIS et al., 2007a;
TOPOUZELIS, 2008). Diversas metodologias, combinando técnicas de segmentação e
agrupamento, m sido propostas na literatura, seguindo 2 tipos de abordagem: a) a
manual, onde operadores são treinados para interpretar imagens identificando
possíveis manchas de óleo, e; b) a semi-automática/automática, onde diferentes
técnicas são implementadas através de processamentos automatizados com ou sem a
intervenção humana (LUCCA, 1999; TOPOUZELIS, 2008).
As duas abordagens têm como foco detectar regiões dotadas de baixo
retroespalhamento nas imagens SAR, as quais podem estar associadas à presença de
óleo ou assemelhados (KARATHANASSI et al., 2006; AKKARTAL & SUNAR, 2008;
CHANG et al., 2008; TOPOUZELIS, 2008). Na etapa de detecção a preocupação é
delimitar, com o máximo de precisão possível, as diferentes geometrias associadas a
17
qualquer tipo de alvo escuro, sendo a discriminação em óleo ou assemelhado
realizada na etapa de classificação.
3.1 Detecção de Alvos Escuros em Imagens SAR
Alvos escuros são facilmente identificáveis nas imagens SAR. Entretanto, é
extremamente difícil, até mesmo para intérpretes experientes, definir os limites, ou
seja, as bordas que separam um alvo do oceano (GALLAND et al., 2004; ZHENG et
al., 2005). Para auxiliar neste processo, técnicas de segmentação voltadas para a
detecção de alvos escuros em imagens SAR têm sido amplamente utilizadas em
sistemas automáticos (TOPOUZELIS et al., 2003; PELIZZARI & DIAS, 2003).
A segmentação consiste no particionamento de uma imagem em regiões,
considerando critérios de homogeneidade e heterogeneidade (HARALICK &
SHAPIRO, 1984; BAATZ et al., 2003; NAVULUR, 2006; NEUBERT et al., 2006; AYED
et al., 2006). A partição, ou o agrupamento em regiões de interesse, tem como
referência propriedades intrínsecas à imagem como intensidade, contraste ou textura
(LE MOIGNE & TILTON, 1995; CAVES et al., 1998; LUCCA, 1999; SOUSA, 2005;
NAVULUR, 2006).
Existe uma variedade de métodos automáticos e semi-automáticos para gerar
objetos ou regiões em imagens (BAATZ et al., 2003). De maneira geral, os algoritmos
de segmentação de imagens podem ser discriminados em 3 categorias (KURZ &
BENTEFTIFA, 1997; LUCCA, 1999; PEKKARINEN, 2002; ESPINDOLA, 2006;
NAVULUR, 2006): a) ajuste de regiões (region fitting); b) detecção de bordas (edge-
based), e; c) crescimento de regiões (region-growing).
Os 3 tipos de algoritmos utilizam os pixels da imagem como unidade básica de
processamento, a diferença está na forma como os resultados da segmentação são
extraídos das imagens e espacializados em uma nova imagem.
Os algoritmos de ajuste de regiões, também denominados pixel-based,
segmentam os objetos de interesse particionando (spliting) e agrupando (merge) os
pixels com base em critérios de similaridade ajustados a partir do histograma das
imagens. Nos histogramas, altas (picos) e baixas intensidades (vales) dos níveis de
cinza (NC) são identificadas e utilizadas para definir agrupamentos nas imagens. A
técnica mais comumente utilizada é a limiarização (threshold) (NAVULUR, 2006), que
consiste no estabelecimento de um limiar (T) para separar os objetos ou regiões de
interesse na imagem. De forma simplificada, as operações envolvem testes
18
estatísticos considerando uma função T = T [x,y: p(x,y), f(x,y)] onde, f(x,y) está
relacionado ao NC no ponto (x,y) e p(x,y) representa alguma propriedade local
centrada neste ponto, como por exemplo a média dos NC da vizinhança. A imagem
limiarizada g(x,y) pode ser definida matematicamente como:
Desta forma, tendo como base o limiar ou uma função previamente
estabelecida com base no histograma das imagens, o processo de segmentação é
realizado pixel a pixel, retornado uma nova imagem onde cada pixel é rotulado como 0
ou 1, separando os alvos de interesse do fundo (background) (GONZALES & WINTZ,
1987).
Da mesma forma, os métodos de detecção de bordas operam no nível do pixel,
retornando uma nova imagem igualmente rotulada em 0 ou 1. Entretanto, a partição é
efetuada considerando critérios de dissimilaridade, com o objetivo de evidenciar
regiões onde ocorram mudanças abruptas nos NC das imagens, indicando limites ou
bordas entre regiões homogêneas com diferentes propriedades (LUCCA, 1999;
NAVULUR, 2006). Para efetuar este procedimento é necessário realçar as bordas dos
alvos de interesse utilizando filtros como, por exemplo, os de Canny, Robert e Sobel
(GONZALES & WINTZ, 1987; LUCCA, 1999; NAVULUR, 2006), aplicados com
máscaras de dimensões variadas 2x2, 3x3 e 5x5.
Ambos os métodos de segmentação, ajuste de regiões e detecção de bordas,
retornam resultados no nível do pixel, sendo um pós-processamento necessário com o
objetivo de gerar uma máscara que possibilite o cálculo de atributos a serem utilizados
na etapa de classificação em óleo e assemelhados.
De forma diferente dos demais métodos, o crescimento de regiões inicia o
processamento no nível dos pixels e finaliza retornando regiões resultantes do
agrupamento de pixels com propriedades similares. O processamento inicia com a
escolha de pixels de referência denominados seed points (BINS et al., 1996;
PEKKARINEN, 2002; BAATZ et al., 2003;), a partir dos quais novos pixels serão
agrupados ou não formando regiões de acordo com um limiar de similaridade e de
área mínima previamente estabelecidos. Este agrupamento é efetuado de forma
automática até que toda a imagem seja segmentada e não haja mais a possibilidade
de fusões em função dos parâmetros estabelecidos pelo usuário no início do processo
(BINS et al., 1996; LUCCA, 1999; BAATZ & SCHÄPE, 2000; PINHO, 2005; SOUSA,
19
2005; NAVULUR, 2006; BENTZ, 2006; ESPINDOLA, 2006).
Nas referências consultadas, voltadas especificamente para a detecção de
alvos escuros em imagens de RADAR, pôde-se constatar a utilização dos três tipos de
segmentação citados. As pesquisas desenvolvidas, visando à individualização destas
feições, abrangem desde a delimitação manual (CALABRESI et al., 1999; FISCELLA
et al., 2000) até técnicas automáticas, com ou sem a intervenção humana, com níveis
de complexidade diversos (BREKKE & SOLBERG, 2005; BENTZ, 2006; BENTZ et al.,
2007b; TOPOUZELIS, 2008).
Como alvos escuros em imagens SAR são caracterizados por baixo
retroespalhamento em relação ao oceano, a utilização de técnicas de limiarização
(Threshold) para a segmentação é comumente observada (BAATZ et al., 2003;
BREKKE & SOLBERG, 2005; GASULL et al., 2002). Na literatura são descritos 2 tipos
de limiarização: a global (Threshold) e a adaptativa (Adaptative Threshold). Na
abordagem global, o tamanho de uma janela é definido arbitrariamente para calcular
ao longo da imagem valores estatísticos que serão comparados a um limiar fixo,
previamente estabelecido para a imagem como um todo (KERAMITSOGLOU et al.,
2006). Entretanto, como o intervalo que compreende os NC referentes aos alvos
escuros não é constante, variando de cena para cena e, inclusive, em uma mesma
cena, em função das mudanças na intensidade do vento na superfície do mar, um
limiar único, estabelecido para toda a imagem, não é aconselhável (GASULL et al.,
2002).
Desta forma, a utilização da limiarização adaptativa (Adaptative Threshold)
constitui uma alternativa amplamente utilizada em diversos sistemas de detecção
automática (TOPOUZELIS, 2008; SOLBERG & BREKKE, 2008; BREKKE &
SOLBERG, 2005; SOLBERG et al., 1996). Nesta proposta, um limiar é configurado
localmente, tendo como base valores estatísticos calculados considerando uma janela
de dimensões pré-definidas, aplicada ao longo da imagem (GASULL et al., 2002).
Uma tentativa inicial foi publicada por SKØELV & WAHL (1993) utilizando um
algoritmo configurado com base em um histograma simples, bimodal, para uma janela
de N x N pixels (N = 25 pixels). Abordagens similares foram descritas por VACHON et
al. (1998) e MANORE et al. (1998). BJERDE et al. (1993) primeiramente aplicaram um
algoritmo de clusterização para verificar se a área considerada pela janela
apresentava características homogêneas, caso o comportamento do histograma fosse
bimodal um limiar era calculado e aplicado sobre os pixels localizados na janela.
20
Considerando a significativa influência da intensidade do vento para a
detecção de alvos escuros em imagens de RADAR, SOLBERG & VOLDEN (1997),
SOLBERG & SOLBERG (1996) e SOLBERG et al. (2003) utilizaram um limiar
adaptativo configurado como KdB resultante da estimativa de um sinal de retorno
médio para uma determinada janela. Neste método, o valor de K é determinado com
base nos dados de vento, os quais são configurados manualmente considerando 4
categorias de intensidade: baixo, baixo/médio, médio e alto. Finalmente, uma
clusterização foi aplicada sobre os pixels rotulados como alvos escuros e oceano para
melhorar as bordas e diminuir o ruído da segmentação.
Posteriormente, SOLBERG (2005a e 2005b) e SOLBERG et al. (2003)
aprimoraram este método de segmentação para ser utilizado quando não existem
dados de vento disponíveis. Para tal, um novo método para calcular o limiar utilizando
a homogeneidade local, denominado PMR-ratio (power-to-mean ratio), foi proposto
(SOLBERG et al., 2005; SOLBERG, 2005a; SOLBERG, 2005b). Uma abordagem
piramidal, em multi-escala foi utilizada, seguida de uma etapa de clusterização,
visando uma melhor separação entre os pixels rotulados como alvos escuros e o
oceano.
No âmbito da segmentação por ajuste de regiões, existem diversas formas de
calcular limiares automaticamente tendo como base o histograma das imagens.
FISCELLA et al. (2000) utilizou Normalized RADAR Cross-Section (NRCS) para
estabelecer um limiar a partir do qual os pixels considerados escuros na imagem
fossem discriminados. Este limiar determina que os pixels rotulados como escuros na
imagem devem ser menores que a metade do valor Médio obtido pelo NRCS em uma
determinada área da imagem. Neste método, pequenas áreas não foram detectadas
por serem consideradas irrelevantes e grandes áreas também, por terem a
probabilidade de estar associadas a baixas intensidades de vento.
A técnica de morfologia matemática para segmentação de alvos escuros foi
utilizada por GASULL et al. (2002). Nesta pesquisa foi testada a utilização combinada
de filtros morfológicos (top-hat) de erosão e dilatação com limiarização adaptativa,
alternando janelas de 11x11 para selecionar os alvos maiores e máscara menores de
3x3 para selecionar alvos menores.
A utilização de segmentação por detecção de bordas para extração dos alvos
escuros em sistemas de detecção automática de óleo foi primeiramente observada por
SLOGGETT & JORY (1994). ESPEDAL (1998) combinou a utilização do filtro Sobel
21
para detecção de bordas com fatiamento adaptativo, primeiramente utilizado por
WEINSTEIN et al. (1993) para a individualização das feições.
ARVELYNA et al. (2001) utilizaram a técnica de máxima entropia assumindo
dois momentos como parâmetro, óleo e mar. De acordo com o autor, o desempenho
foi melhor quando comparada com técnicas baseadas na matriz de co-ocorrência dos
níveis de cinza da Imagem (Grey Level Co-occurence Matrix - GLCM).
KANAA et al. (2003) utilizaram de forma integrada segmentação por detecção
de bordas e por ajuste de regiões. Primeiramente suavizaram o ruído das imagens
com um filtro Gaussiano, aplicando seqüencialmente o filtro de Canny para a detecção
de bordas. Posteriormente um limiar DHT (Directional Hysteresis Threshold) foi
aplicado, considerando um ângulo θ, com o objetivo de realçar as bordas do óleo na
mesma direção do vento. Uma operação de clusterização com abordagem
probabilística Bayesiana foi efetuada para melhorar os resultados formando
agrupamentos mais homogêneos para os pixels rotulados como escuros nas imagens.
Ainda no âmbito da detecção de bordas, TELLO et al. (2006) utilizaram
transformada Wavelet para realçar as bordas na imagem, seguida de uma limiarização
para separar as bordas dos alvos escuros encontrados do oceano.
BARNI et al. (1995) disponibilizaram o primeiro exemplo de utilização de lógica
fuzzy em um algoritmo para segmentação de alvos escuros em imagens SAR. ZHENG
et al. (2005) também utilizaram clusterização fuzzy para gerar a segmentação. Neste
método uma função é definida para mensurar a probabilidade de um determinado pixel
pertencer ou não a um determinado conjunto de dados, sendo ou não agrupado ao
mesmo. A dificuldade encontrada é que o número de clusters nem sempre pode ser
definido a priori. Uma vez que a clusterização fuzzy é obtida, designando cada pixel
para um grupo, um mapa dos agrupamentos encontrados é produzido pelo algoritmo.
Uma operação final envolve uma pós-filtragem do mapa para obter regiões mais
homogêneas.
Ainda no universo do pixel alguns autores investem no pré-processamento das
imagens, aplicando diferentes filtros ou combinação de imagens de textura, indo direto
para a etapa de classificação utilizando algoritmos diversos. MERCIER & ARDHUIN
(2005a) aplicaram decomposição Wavelet e utilizaram Máquinas de Suporte Vetorial
(SVM) supervisionadamente para classificar a imagem em alvos escuros e oceano.
TOPOUZELIS et al. (2007a) combinou filtro Lee com janela 3x3 e 5x5, normalizou os
NC da imagem e posteriormente aplicou uma classificação por Redes Neurais para
22
separar as regiões associadas aos alvos escuros do oceano. Estas regiões foram
vetorizadas, seqüencialmente 10 atributos foram calculados e uma nova classificação,
também por Redes Neurais, foi efetuada para classificar os alvos escuros em óleo e
assemelhados.
KERAMITSOGLOU et al. (2006) e CHANG et al. (2005 e 2008) utilizam
metodologias que transitam entre o nível do pixel e das regiões. Estes autores
primeiramente aplicam uma limiarização adaptativa para rotular os pixels em escuros
e claros (oceano) e, em uma segunda etapa, utilizam uma operação de interpolação
por vizinho mais próximo para gerar regiões relacionadas aos alvos escuros e oceano.
A diferença entre estes métodos é que KERAMITSOGLOU utilizou filtro Gaussiano e
não detalhou a técnica de limiarização utilizada e CHANG utilizou filtro de Mediana e
limiarização pela técnica de Moment Preserving Method (MPM). HANG et al. (2009),
propuseram algo semelhante, entretanto, com a utilização de fatiamento para separar
alvos escuros de oceano e, posteriormente, uma vetorização para gerar as regiões.
Posteriormente, todos estes autores calcularam atributos e efetuaram classificação em
óleo e assemelhados, utilizando técnicas diferenciadas.
MIRANDA et al. (2004) aplicaram o filtro de Mediana para a suavização do
ruído speckle, utilizaram o classificador textural por Semivariograma (STC) para
cálculo dos atributos e o algoritmo de clusterização ISODATA para classificar as
regiões em óleo e oceano.
Outras técnicas identificadas na literatura para gerar regiões em imagens SAR
foram Minimum Description Length (MDL) e Campos Markovianos. A utilização da
técnica de segmentação por Minimum Description Length (MDL), baseada em
partições deformáveis, foi proposta por GALLAND et al. (2003 e 2004) e consiste na
partição da imagem em regiões homogêneas e do agrupamento utilizando limiarização
automática MDL (Minimun Description Lenght). A segmentação inicial da imagem é
obtida por uma partição deformável, denominada grade ativa (active gride). Esta grade
contém um conjunto de nós localizados na junção entre os segmentos. O algoritmo
procura encontrar o número adequado de nós e regiões minimizando o critério global
de MDL. Como, geralmente, a segmentação resultante compõe os alvos com mais de
um polígono, uma nova limiarização é utilizada para formar um único polígono para
cada alvo escuro da cena.
PELIZARRI & DIAS (2003) desenvolveram um algoritmo supervisionado para
segmentação de imagens utilizando como base uma abordagem Bayesiana. A
23
intensidade dos sinais de retorno observados nas amostras de treinamento para cada
classe - alvos escuros e oceano é modelada através de uma distribuição Gamma
(finite Gamma mixture), a partir da qual são extraídos a média e a variância.
Seqüencialmente, a utilização de Markov Random Field (MRF) define uma grade 2d a
partir da qual obtém-se a segmentação. A utilização de MRF para segmentação de
imagens foi relatada também em LOPEZ et al. (2005). Neste trabalho MRF foi utilizado
para segmentar uma imagem resultante da fusão de uma imagem original com uma
imagem de textura (GLCM: Correlação), gerada a partir da matriz de co-ocorrência
dos níveis de cinza.
Um método de segmentação não supervisionado foi descrito por MERCIER et
al. (2003) utilizando uma extensão vetorial com base no modelo de Hidden Markov
Chain (HMC), onde a estimação dos parâmetros é efetuada através do método
General Iterative Conditional Estimation (ICE). ARDHUIN et al. (2003 e 2004) foram os
primeiros trabalhos encontrados na literatura que demonstram uma preocupação com
o problema das bordas que separam um alvo escuro do oceano. Nesta abordagem
ARDHUIN et al. compararam o desempenho da utilização de 2 métodos: a) filtro
Sobel; b) Cadeias Markov com modelo de distribuição Pearson, e; c) Cadeias Markov
com modelo de distribuição Gaussiana. Entretanto, para a detecção por Cadeias de
Markov utilizou ao invés de 2 classes, como é comumente considerado na literatura, 3
e 4 classes, com o objetivo de evidenciar que os resultados da segmentação podem
representar melhor a transição entre e o óleo (alvo escuro) e o oceano com um
número maior de classes.
No âmbito dos segmentadores por crescimento de regiões, DEL FRATE et al.
(2000) e MONTALI et al. (2006) mesclaram as técnicas de ajuste de regiões e
crescimento de regiões. Inicialmente os pixels da imagem foram rotulados como
escuros (alvos escuros) ou claros (oceano) através de um limiar calculado com base
no histograma da imagem. Numa segunda etapa, os pixels mais escuros foram
escolhidos como pixels sementes a partir dos quais o algoritmo de crescimento de
regiões iniciou o processo de segmentação. A classificação foi realizada utilizando
redes neurais tendo como base 11 atributos. MONTALI et al.(2006) utilizou a mesma
lógica de processamento, entretanto cálculo u o limiar utilizando NRC para selecionar
os pixels sementes e testou diversos classificadores, também com 11 atributos, sendo
o que retornou melhor resultado foi o de discriminante linear.
KARATHANASSI et al. (2006) desenvolveram uma metodologia para detectar
alvos escuros em imagens de RADAR com alta resolução espacial (10m), utilizando
24
segmentação por crescimento de regiões com uma abordagem em multiresolução. Na
primeira etapa, a imagem é segmentada com o objetivo de obter segmentos maiores.
Nesta abordagem, como o segmentador cresce as regiões a partir dos pixels dividindo
a imagem em segmentos teoricamente homogêneos, a probabilidade de incluir um
alvo escuro dentro de um segmento associado ao oceano é menor, quando
comparada às técnicas de limiarização adaptativa que utilizam janelas com dimensões
fixas. Nesta menor escala um limiar é calculado fornecendo informações sobre a
distribuição estatística de cada região individualizada. Na segunda etapa, uma nova
segmentação é efetuada tendo como base a primeira, com o objetivo de gerar regiões
menores. Para estas novas regiões um novo limiar é estimado, comparado com o
limiar do super-segmento ao qual pertence, e utilizado para separar os alvos escuros
do oceano. Finalmente, um conjunto de atributos foram calculados e utilizados como
dados de entrada em um classificador Fuzzy para discriminar óleo de assemelhados.
Embora os resultados tenham sido satisfatórios KARATHANASSI destaca que o
método não é operacional em função do tempo necessário para o processamento (2h).
O mesmo método foi utilizado por TOPOUZELIS et al. (2007b) e TOPOUZELIS et al.
(2009), sendo que nesta publicação os autores testaram redes neurais para a
classificação.
BENTZ (2006) também utilizou segmentação por crescimento de regiões
(BAATZ & SCHÄPE, 1999), entretanto optou por agrupar as regiões resultantes da
segmentação manualmente, ao invés de utilizar um limiar adaptativo. Esta escolha foi
efetuada com o objetivo de fornecer uma maior acurácia à geometria dos alvos
escuros resultantes da segmentação. Como o foco do seu estudo era desenvolver um
sistema automático para classificação de óleo e assemelhados, considerando suas
subclasses, uma maior acurácia associada à geometria dos alvos escuros foi
essencial, pois todos os atributos utilizados na classificação foram calculados com
base nestas geometrias. A investigação de um método automático para separar os
alvos escuros do oceano, a ser acoplado no sistema de classificação proposto por
BENTZ (2006), constitui o principal objetivo da tese.
Conforme evidenciado na bibliografia consultada, as combinações que podem
ser efetuadas utilizando diferentes algoritmos, em cada uma das 4 etapas indicadas,
são ilimitadas. A Figura 3.1 disponibiliza um fluxograma geral, sintetizando os
diferentes métodos manual, semi-automático/automático, efetuados no nível do pixel e
das regiões, encontrados na literatura.
25
Figura 3.1 - Diferentes tipos de processamento efetuados no nível do pixel e das regiões
encontrados na literatura.
Apesar da diversidade e relevância das técnicas de segmentação para a
melhoria da eficiência dos sistemas de detecção automática, é importante destacar
que não existe um algoritmo que apresente desempenho plenamente satisfatório para
todos os tipos de imagens, assim como nem todos os algoritmos disponíveis
apresentam o mesmo grau de eficiência para uma mesma imagem (BEAUCHEMIN &
THOMSON, 1997; BEAULIEU & TOUZI, 2002; SOUSA, 2005; NAVULUR, 2006;
ESPINDOLA, 2006).
Desta forma, as diferentes técnicas de segmentação utilizadas, ajuste de
regiões, detecção de bordas e crescimento de regiões, apresentam vantagens e
desvantagens associadas ao processo de detecção de alvos escuros.
Neste sentido, apesar do delineamento manual dos alvos escuros ser a técnica
mais popular e facilmente replicável, a dependência da experiência do intérprete
agrega subjetividade ao processo. A “segmentação” manual não é única e um mesmo
intérprete pode gerar resultados diferentes para uma mesma imagem (LUCCA, 1999;
TOPOUZELIS et al., 2008; TOPOUZELIS, 2009).
No caso da segmentação por ajuste de regiões, uma boa eficiência
computacional. Entretanto, a abordagem por limiarização é sensível à
26
heterogeneidade dos dados, não sendo plenamente satisfatória nas situações em que
o histograma não tem um comportamento tipicamente bimodal (CHANG et al., 2008).
Esta variação dos histogramas ocorre porque o comportamento estatístico dos NC nas
imagens não é linear e varia e função de fatores como o ruído speckle, o ângulo de
incidência, dentre outros descritos no Capitulo 2 (SOLBERG & SOLBERG, 1996;
ARVELYNA et al., 2001; TOPOUZELIS et al., 2007a). Como os resultados da
segmentação são diretamente influenciados pelo limiar estabelecido, um esforço é
necessário na tentativa de ajustar limiares satisfatórios (CHANG et al., 2008). Outra
desvantagem que os métodos limiarização adaptativa apresentam está relacionada ao
tamanho fixo da janela que percorre a imagem (KARATHANASSI et. al., 2006). É
possível que um alvo escuro esteja parcialmente contido em diferentes janelas, sendo
fragmentado com diferentes tamanhos. Neste caso, as estatísticas calculadas por
janela retornarão valores diferentes para caracterizar um mesmo alvo escuro
(KARATHANASSI et. al., 2006). Grandes janelas abrangendo regiões oceânicas com
homogeneidade nos NC podem deixar de detectar alvos escuros de pequena
dimensão (LUCCA. 1999). A detecção por limiar também falha quando o contraste
entre os alvos e o oceano é muito fraco (TOPOUZELIZ et al., 2007b). SOLBERG &
SOLBERG (1996) evidenciaram 3 situações em que a limiarização não foi efetiva para
detectar os alvos escuros: a) manchas de óleo finas e alongadas; b) baixo contraste
das manchas em relação ao oceano homogêneo, e; c) manchas de óleo localizadas
em oceanos com alta heterogeneidade espectral, dificultando a separação das bordas.
A desvantagem associada ao método de detecção de bordas é que nem
sempre é possível obter bordas ideais para imagens com moderada complexidade.
Bordas extraídas para imagens complexas, como é o caso das imagens SAR que
apresentam o ruído speckle, podem ser muito fragmentadas, contendo trechos
desconectados entre si, segmentos de borda ausentes, bem como falsas bordas,
fatores que complicam a interpretação da imagem. Outra desvantagem está associada
à necessidade de uma limiarização após a detecção das bordas para selecionar as
bordas referentes aos alvos de interesse. Nesse processo, quanto menor for o limiar,
mais bordas serão detectadas, sendo o resultado muito suscetível ao ruído,
selecionando feições irrelevantes. De forma contrária, valores de limiar muito altos
podem não detectar trechos de borda importantes para compor a geometria de um
determinado alvo escuro, não sendo fácil a tarefa de encontrar um equilíbrio entre
estas duas situações.
27
Considerando os algoritmos por crescimento de regiões, a fragilidade está
associada à definição do critério de limiar de similaridade e à seleção dos pixels
semente (seed points) que irão iniciar o processo de segmentação (LUCCA, 1999). A
agregação dos pixels às regiões ou segmentos ocorrerá de acordo com o limiar de
similaridade estabelecido. Se este for muito alto poderá ocorrer uma sub-segmentação
da imagem e alvos de interesse não serão detectados, de forma contrária, limiares
muito baixos super-segmentam a imagem. No caso das imagens de RADAR em que a
transição entre um alvo escuro e o oceano não é bem definida, sendo formada por
uma gradação de NC, a seleção de pixels semente nestas áreas da imagem pode não
retornar bons resultados. Desta forma, a tarefa de fixar parâmetros que possam ser
utilizados em diferentes imagens não é trivial.
Apesar das desvantagens associadas a cada método, inúmeros autores
ressaltam as vantagens de se trabalhar com regiões ao invés de pixels. Especialmente
no caso das imagens de RADAR, cujo ruído multiplicativo é uma característica
inerente deste sensor, o agrupamento dos pixels em regiões homogêneas utilizando
técnicas de segmentação é capaz de reduzir a interferência deste ruído no processo
de detecção de alvos escuros (GALLAND et al., 2003 e 2004; CHANG et al., 2005).
Além de melhorar a qualidade dos resultados, a utilização de segmentos, ou regiões,
como unidade base de processamento reduz significativamente o custo computacional
em relação aos processamentos efetuados pixel a pixel (BAATZ et al., 2003).
O método de crescimento de regiões é considerado mais eficiente devido à sua
capacidade de garantir a formação de segmentos fechados e homogêneos,
considerando a relação espacial existente entre os dados (ZUCKER, 1976; TILTON &
LAWRENCE, 2000; MEINEL & NEUBERT, 2004; SILVA et al., 2005; ESPINDOLA,
2006; SILVA, 2006). GALLAND et al. (2004) evidenciaram as diferenças obtidas na
detecção de alvos escuros em imagens SAR utilizando o agrupamento de regiões ao
invés de pixels previamente rotulados por limiarização. A Figura 3.2 disponibiliza os
resultados obtidos por GALLAND et al. (2004).
28
Figura 3.2 Comparação entre o agrupamento efetuado a partir de regiões e de pixels.
FONTE: GALLAND et al. (2004)
Com base nestas constatações, no âmbito da tese optou-se pela utilização de
algoritmos de segmentação, utilizando a abordagem de crescimento de regiões.
Apesar das vantagens de se trabalhar com regiões ao invés de pixels, imagens SAR
em áreas oceânicas são cenários imprevisíveis, dotados de complexidade variada,
onde diferentes tipos de alvos podem ocorrer em diferentes escalas, características
que dificultam a delimitação da geometria utilizando apenas a segmentação de
imagens. Mesmo concentrando o processamento em uma única mancha de óleo, a
segmentação pode particioná-la em mais de uma região de acordo com os padrões de
homogeneidade/heterogeneidade dos NC que a compõe (GALLAND et al., 2003 e
2004; ZHENG et al.,2005), sendo necessário um pós-processamento para agrupar
estas regiões em alvos escuros e oceano (GALLAND et. al, 2004).
Desta forma, embora a escolha de um método adequado de segmentação seja
uma tarefa de relevante importância, o foco da tese foi a investigação de técnicas
adequadas para agrupar estas regiões ou segmentos em alvos escuros
representativos.
Considerando o estado da arte referente aos métodos propostos para a
detecção de alvos escuros, o fluxograma do APÊNDICE I disponibilizou uma síntese
da diversidade de métodos e combinações de algoritmos citados na revisão
bibliográfica, considerando como referência as 4 etapas integrantes dos sistemas
29
automáticos para detecção de óleo e assemelhados em imagens SAR. Neste
fluxograma é possível comparar o método proposto na tese para a etapa de detecção
de alvos escuros, identificando as inovações propostas em relação aos demais
métodos.
Desta forma, conforme evidenciado nos fluxogramas da Figura 3.1 e do
APÊNDICE I, nos métodos testados até o momento a detecção de alvos escuros é
dividida em 2 etapas: a) segmentação das imagens, utilizando um dos 3 tipos de
técnicas citadas, e; b) agrupamento dos pixels ou das regiões para formar geometrias
mais representativas e compactas para os alvos de interesse. A proposta trabalhada
ao longo da tese está dividida em 4 etapas: a) segmentação das imagens, utilizando
algoritmos de crescimento de regiões; b) cálculo de diversos atributos para cada
região originada pela segmentação; c) seleção do conjunto adequado de atributos, e;
d) clusterização destes atributos em alvos escuros e oceano.
Comparando as diferentes estruturas propostas no fluxograma do APÊNDICE I,
é perceptível que o cálculo de atributos foi utilizado somente na etapa de classificação
das imagens em óleo e assemelhados. Neste ponto, a possibilidade de calcular
múltiplos atributos a partir das regiões (BAATZ et al., 2003) foi mais um fator que
fortaleceu a utilização do método de crescimento de regiões.
Outro fator de destaque foi a preocupação com a utilização de um método de
seleção de atributos para definir um conjunto adequado de atributos, capaz de auxiliar
o clusterizador no reconhecimento de padrões, retornando geometrias o mais
representativas possíveis para os alvos escuros. Em praticamente toda a bibliografia
consultada não foi verificada a preocupação com a utilização de um método de
seleção de atributos, os primeiros trabalhos que evidenciaram estudos para seleção
de atributos foram STATHAKIS et al. (2006), BENTZ (2006) e BENTZ et al. (2007b).
TOPOUZELIS (2009) propôs um método interativo, utilizando algoritmos genéticos
para selecionar os atributos a serem seqüencialmente processados em uma rede
neural para classificação em óleo e assemelhados.
Outra preocupação recorrente ao longo da tese refere-se à possibilidade de
padronizar os parâmetros envolvidos em todas as etapas da detecção, deste a
utilização dos segmentadores, ao cálculo dos atributos até a clusterização dos dados.
Com relação à padronização dos parâmetros, quesito necessário para automatização
de um sistema, praticamente nenhuma referência consultada abordou o tema com
profundidade.
30
3.1.1 Segmentação de Imagens SAR
Existe uma grande variedade de algoritmos de segmentação implementados
em diferentes softwares utilizando conceitos diferenciados. Estes algoritmos,
comercializados ou distribuídos gratuitamente, oferecem ampla possibilidade de
investigação (NEUBERT et al., 2006). Entretanto, pesquisas recentes indicaram que a
abordagem por crescimento de regiões é capaz de gerar segmentações de melhor
qualidade (ZUCHER, 1976; SILVA, 2006; MEINEL & NEUBERT, 2004; SILVA et al.,
2005).. Com base nestas constatações, foram utilizados softwares gratuitos, testados
e considerados eficientes, cujos algoritmos de segmentação utilizassem a abordagem
por crescimento de regiões (MEINEL & NEUBERT, 2004; NEUBERT et al., 2006). Os
segmentadores testados foram:
a) o segmentador MultiSeg desenvolvido pelo INPE e implementado no
software ENVI 4.0. Este algoritmo tem como principal objetivo a
segmentação multi-níveis de imagens de RADAR através da abordagem
de crescimento de regiões, sendo inicialmente denominado SegSAR
(SOUSA, 2005; SOUSA et al., 2005), e;
b) o segmentador por crescimento de regiões, também desenvolvido pelo
INPE (BINS et al., 1996) e implementado no software SPRING (CÂMARA
et al., 1996) disponibilizado gratuitamente na internet.
3.1.1.1 MultiSeg: Informações Técnicas
O MultiSeg é um segmentador híbrido que utiliza de forma integrada técnicas
de crescimento de regiões, agrupamento de regiões, ajuste de bordas e separação de
regiões não homogêneas (SOUSA, 2005; SOUZA et al., 2005; SCOFIELD et al.,
2007). Inicialmente o MultiSeg foi concebido para processar dados SAR em
intensidade, sendo um módulo voltado para imagens óticas desenvolvido
posteriormente.
As imagens podem ser segmentadas por dois modelos de representação, a
serem escolhidos: a) o modelo de manchas (Cartoon) o qual supõe homogeneidade
das regiões na imagem de RADAR, ou; b) o modelo de textura (Texture), que supõe a
presença de heterogeneidade nas regiões, caracterizada pela variação do
retroespalhamento. Os parâmetros que necessitam de definição para o
processamento dos dados SAR no MultiSeg são: a) o processamento das imagens em
amplitude ou intensidade; b) o modelo a ser utilizado (Cartoon ou Texture); c) o Limiar
31
de Similaridade (LS) e o nível de confiança utilizados nos testes de crescimento e
agrupamento de regiões, indicando os pixels que devem ou não ser agrupados em
uma região; d) a área mínima em pixels que as regiões podem na atingir no último
nível da segmentação; e) o número equivalente de looks (NEL); f) o número de
compressões desejado, e; g) coeficiente de variação utilizado no teste de
homogeneidade no modelo de textura.
A segmentação inicia com a compressão piramidal das imagens, onde a base
da pirâmide (Nível: C1) contém a imagem original sem compressão. Nos níveis
subseqüentes a imagem é comprimida por um fator de 4 em cada nível, formando um
único pixel a partir da média de 4 pixels componentes da imagem anterior sendo C =
{1,...,N}. O processo de crescimento de regiões começa no nível de maior compressão
da imagem, a partir do qual cada pixel selecionado aleatoriamente é considerado
como uma região. A partir destes pixels uma análise de similaridade é efetuada em
relação aos seus vizinhos para indicar quais pixels devem ou não ser agrupados
crescendo a região. A imagem segmentada é obtida ao final dos testes de
agrupamento no nível de maior compactação, considerando a resolução mais
degradada. O próximo passo é descompactar as regiões formadas na segmentação
sucessivamente, onde em cada nível de descompressão as imagens serão 4 vezes
maiores em relação ao nível acima. Efetuar a segmentação no último nível de
compressão diminui a interferência do ruído speckle nos resultados da segmentação,
à medida que a degradação da resolução da imagem nos diferentes níveis de
compressão funciona como um filtro. Entretanto, as bordas geradas pela segmentação
das imagens com menor resolução no maior nível de compressão (por exemplo, C5),
são consideradas grosseiras quando comparadas com a imagem em um nível anterior
de compressão (por exemplo, C4). Para suavizar este efeito é necessário efetuar um
ajuste de bordas. O processo termina quando as descompressões e ajustes de bordas
subseqüentes alcançam o nível C1 da imagem original, sendo efetuado o teste final
para verificar se foram produzidas regiões menores do que o limiar de área
previamente estabelecido.
Este software foi utilizado nas etapas de pré-processamento e determinação
dos métodos de filtragem por ser gratuito e específico para imagens de RADAR. Na
etapa de avaliação de segmentadores o MultiSeg foi comparado com o segmentador
implementado no SPRING.
32
3.1.1.2 SPRING: Informações Técnicas
O segmentador implementado no software SPRING considera uma abordagem
tradicional de crescimento de regiões, com algumas modificações implementadas para
amenizar a sensibilidade associada à ordem dos pixels escolhidos para iniciar os
processamentos (BINS et al., 1996).
O fluxo de processamento efetuado pelo software SPRING compreende as
seguintes etapas: a) seleção aleatória inicial de um conjunto de pixels {Ri, i = 1,..,n},
denominados sementes, a partir do quais se inicia o processo de crescimento de
regiões; b) inicialmente cada um destes pixels é considerado uma região, a partir da
qual seus pixels vizinhos serão avaliados sendo os mais similares agrupados,
crescendo a região; c) a média das regiões é recalculada a cada novo pixel agrupado;
d) os mesmos procedimentos são efetuados seqüencialmente até que todos os pixels
da imagem estejam agregados em uma região. Os parâmetros a serem definidos pelo
usuário são a área mínima e o limiar de similaridade que corresponde a diferença
entre as médias das regiões que se deseja separar.
Como o SPRING não é um segmentador programado especificamente para
imagens de RADAR, por este motivo a utilização do software MultiSeg foi priorizada
nas primeiras etapas da tese, sendo o desempenho do SPRING comparado com o do
MultiSeg somente na etapa de determinação do melhor segmentador.
3.2 Clusterização de Dados
Conforme indicado no Capitulo 3: Item 3.1, diversos métodos são utilizados
para a individualização da geometria dos alvos escuros em imagens SAR, sendo as
técnicas de segmentação de imagens comumente utilizadas para auxiliar nesta tarefa.
Após a divisão das imagens em regiões homogêneas, um pós-processamento para
agrupar estas regiões em alvos escuros e oceano é necessário. A limiarização
adaptativa é a técnica mais comumente utilizada para o agrupamento das regiões
resultantes do processo de segmentação (TOPOUZELIS et al., 2007b; GALLAND et
al., 2003 e 2004). CHANG et al. (2005) e KERAMITSOGLOU et al. (2006) utilizaram
interpolação por vizinho mais próximo para agrupar os pixels; MIRANDA et al. (2004)
utilizaram o ISODATA para separar em clusters os alvos escuros e o oceano. BJERDE
et al. (1993), GASULL et al (2002) e LOPEZ et al. (2005) utilizaram o termo
clusterização, mas não informaram qual método e qual(is) o(s) atributo(s) utilizado(s).
33
Considerando as desvantagens associadas ao método de limiarização
indicadas no item 3.1 e o objetivo de propor um método para a detecção de alvos
escuros que possa ser implementado operacionalmente de forma automática, o estudo
realizado investigou a utilização de clusterização de dados para agrupar as regiões
resultantes da segmentação de imagens. Esta proposta é interessante à medida que a
performance de diferentes atributos na separação dos clusters pode ser investigada.
O processo de agrupamento de objetos físicos ou abstratos em classes é
denominado clusterização ou classificação não supervisionada (CHEN et al., 1996).
Um cluster é um agrupamento de objetos que são similares entre si e dissimilares em
relação aos objetos contidos em outros clusters (HAN & KAMBER, 2001). O
agrupamento destes objetos é efetuado automaticamente a partir do reconhecimento
de padrões intrínsecos ao conjunto de dados utilizado. Neste contexto, a seleção de
atributos capazes de discriminar os diferentes clusters contidos em um conjunto de
dados é essencial para melhorar o desempenho da clusterizações no reconhecimento
de padrões (JAIN et al., 1999).
Técnicas voltadas para a análise de cluster são capazes de fornecer novos
significados, novas informações através da partição de um grande conjunto de dados
em componentes menores. A clusterização identifica regiões com alta concentração
de objetos dotados de propriedades semelhantes com base em alguma medida de
distância dentro de um conjunto de dados multidimensional. Esta técnica fornece
como resultado novos padrões de distribuição para o conjunto de dados (CHEN et al.,
1996) e interessantes correlações existentes entre os dados (HAN & KAMBER, 2001).
Técnicas de clusterização têm sido estudadas em diversas áreas com ênfases
diferentes, dentre elas: estatística, aprendizado de máquina, banco de dados espacial,
e mineração de dados. Na literatura existe um grande número de algoritmos de
clusterização disponíveis. A escolha do algoritmo a ser utilizado dependerá do objetivo
proposto e do tipo de dados a ser analisado. De maneira geral, os métodos de
clusterização podem ser classificados em 5 categorias (HAN & KAMBER, 2001): a)
métodos de partição; b) métodos hierárquicos; c) métodos baseados em densidade; d)
métodos baseados em malhas (grid-based), e; e) métodos baseados em modelo
(model-based).
Métodos de partição: Dado um banco de dados com n objetos, um método de
partição produz como resultado k partições, onde cada partição representa um cluster
sendo k n. As k partições devem atender requisitos como: (a) cada grupo deve
34
conter pelo menos 1 objeto, e; (b) cada objeto deve pertencer a um único grupo.
Dado k, número de partições a ser atingido, um método de partição cria uma
partição inicial a partir da qual, através de uma técnica de relocação interativa pode
melhorar o particionamento através da movimentação de objetos de um grupo para
outro. O critério geral a ser avaliado para uma boa partição do espaço de atributos é o
de que objetos constituintes de um mesmo cluster sejam semelhantes uns aos outros
e diferentes de objetos pertencentes a outros clusters. Neste contexto existem
diversos critérios para avaliar a qualidade das partições.
Dentre os métodos de partição, os mais conhecidos e comumente utilizados,
são “K-Means” e k-Medoids” (JAIN et al., 1999; ANDRADE, 2004). O método “K-
Means” é baseado no conceito estatístico do centróide, onde cada cluster é
representado pelo valor médio dos objetos que o compõe, esperando que a
semelhança entre os objetos dentro do mesmo grupo ou cluster seja alta e a
semelhança entre objetos de clusters diferentes seja baixa. Em contrapartida, o
método K-Medoids” busca diminuir a sensibilidade a objetos isolados, deixando de
levar em conta o centro do grupo como ponto de referência para utilizar o medóide,
que é o objeto localizado mais próximo ao centro do grupo. Assim, este método pode
abrandar a influência de objetos isolados, baseando-se no princípio de minimização da
diferença, ou baixa semelhança, entre os objetos de um grupo/cluster e o seu ponto
de referência (ANDRADE, 2004; HAN & KAMBER, 2001).
Métodos hierárquicos: Um método hierárquico funciona através da criação de
uma decomposição hierárquica para um dado conjunto de dados. Métodos
hierárquicos podem ser classificados como aglomerativos e divisivos dependendo de
como a decomposição é realizada. Métodos aglomerativos (bottom-up) inicialmente
consideram cada objeto separadamente, a partir do qual após fusões sucessivas com
objetos semelhantes formam grupos separados. Estas fusões são realizadas até que
um determinado critério de parada seja estabelecido. A abordagem divisiva (top-
down), ao contrário da aglomerativa, inicia considerando todos os objetos como
membros de um mesmo cluster e após interações sucessivas os clusters vão sendo
divididos em clusters menores até que os limiares estabelecidos sejam atingidos.
Métodos baseados em densidade: Devido à falta de habilidade que os
algoritmos baseados em métodos particionais têm em descobrir grupos com formas
arbitrárias, isto é, grupos que apresentam objetos dispersos em uma distribuição
espacial bastante irregular, foram desenvolvidos métodos de clusterização baseados
35
em densidade. Estes métodos consideram tipicamente os grupos como regiões
densas de objetos separados no espaço por regiões de baixa densidade que,
normalmente, representam algum tipo de ruído (ANDRADE, 2004).
Métodos baseados em malhas (grid-based): Estes métodos quantificam o
espaço de objetos em um número finito de células formando uma malha de dados com
estrutura em múltipla resolução, a partir da qual são efetuadas operações de
clusterização. Esta abordagem tem como ganho seu rápido processamento, pois não
depende diretamente do número de objetos a serem analisados e sim do número de
células em cada dimensão do espaço quantificado.
Métodos baseados em modelo (model-based): Os métodos baseados em
modelos criam um modelo hipotético para cada grupo desejado e procuram ajustar os
dados da melhor maneira ao modelo criado. Algoritmos baseados em modelos são
capazes de descobrir os clusters através de funções de densidade que refletem a
distribuição espacial dos dados. Este método também permite determinar
automaticamente o número de clusters baseados em padrões estatísticos,
considerando a presença de ruídos ou outliers - dados fora do padrão
proporcionando o desenvolvimento de algoritmos robustos.
Apesar da variedade de métodos e algoritmos, o processo de clusterização é
considerado subjetivo, uma vez que um mesmo conjunto de dados pode ser
particionado de forma diferente a partir da utilização de diferentes métodos (JAIN et
al., 1999). Em certos casos, um mesmo método aplicado a um mesmo conjunto de
dados pode convergir em diferentes soluções de agrupamento ao final das interações.
Esta subjetividade é o que torna o processo de clusterização uma tarefa difícil.
Especificamente para o caso da detecção automática de alvos escuros em
imagens SAR, os quais podem estar associados a derramamento de óleo, os
resultados do agrupamento das regiões resultantes da segmentação em alvos escuros
e oceano precisam ser estáveis. Não seria viável utilizar operacionalmente um
método de agrupamento que, a cada novo processamento, retornasse uma solução
diferente para os clusters.
Desta forma, a capacidade de garantir a integridade e a replicabilidade dos
resultados, retornando sempre os mesmos agrupamentos toda vez que um processo
de clusterização for efetuado a partir de um mesmo conjunto de dados, é essencial
para a automatização do sistema. No âmbito da tese, o método de clusterização
denominado Focal Point, implementado no software Clustan (WISHART, 2004) foi
36
utilizado por oferecer, de forma diferente dos demais métodos ou programas,
estabilidade e replicabilidade dos resultados. O item 3.2.1 disponibiliza os detalhes
técnicos sobre o software.
3.2.1 Clustan: Informações Técnicas
O algoritmo de clusterização denominado Focal Point (FP), implementado no
software Clustan, utiliza o método de partição k-means para efetuar o agrupamento
dos dados (WISHART, 2004). Além de ser considerado clássico na literatura, o
método Kmeans possui fácil implementação e baixo custo computacional, sendo
comumente utilizado em grandes conjuntos de dados, produzindo resultados
satisfatórios (MACQUEEN, 1967; JAIN et al., 1999). Os padrões de similaridade
utilizados para separar as regiões em diferentes clusters são obtidos a partir de
métricas de distância, sendo a Distância Euclidiana utilizada no software. O k-means
e outros diversos métodos de clusterização são sensíveis à partição inicial, ou seja, a
ordem das regiões escolhidas para iniciar o processo de clusterização (JAIN et al.,
1999), o que pode retornar diferentes resultados para um mesmo conjunto de dados a
cada nova interação. A garantia de retornar sempre um mesmo resultado através de
uma série de testes efetuados ao longo das interações constitui o diferencial do FP.
No estudo proposto os procedimentos de clusterização foram efetuados a partir
de diferentes atributos (j = {1,..., η}) calculados para cada região (i = {1,...,m})
resultante das segmentações, com o objetivo de agrupá-las em p clusters (p =
{1,...,q}), retornando como resultado uma imagem binária, separando os alvos escuros
do oceano.
Para avaliar a qualidade das clusterizações e garantir o retorno do melhor
resultado, a métrica utilizada pelo software equivale à média da soma dos quadrados
das distâncias euclidianas (ME) obtidas para cada cluster p (Ep). De acordo com
WISHART (2004), Ep equivale à soma dos quadrados das distâncias de todas as
regiões agrupadas no cluster p em relação à média deste cluster, sendo:
(1)
2
j
pij
pi j
x
Ep
A notação j se refere às variáveis utilizadas na clusterização, sendo x
ij
o valor
de uma variável j associado a uma região i. A média em um determinado cluster p é
representada por µ
pj
, e η corresponde ao número total de variáveis. Se os clusters
37
foram bem separados, as distâncias associadas a cada região estarão próximas à
média do cluster onde a região foi agrupada.
Portanto, a convergência do melhor resultado é garantida pela ME,
representada pela equação (2) ME = Σ
p
E
p
onde, uma determinada região (i) somente
será retirada de um cluster p e realocada em um cluster q quando (3) E
p-i
+ E
q+i
< E
p
+
E
q
. Desta forma, o FP inicia a clusterização pelo método k-means agrupando
interativamente cada região em um determinado cluster buscando minimizar o critério
ME considerando E
p
calculado para todos os clusters encontrados. Esse processo
termina quando qualquer alteração nos membros dos clusters não aumenta nem
diminui o valor obtido para ME, sendo este o teste de relocação efetuado pelo software
(WISHART, 2004).
Os processamentos efetuados pelo FP estão divididos em duas etapas: a) em
um primeiro estágio o software utiliza todas as variáveis e seleciona as regiões
randomicamente para iniciar as clusterizações, retornando ao final um ranking com as
melhores soluções encontradas considerando ME. Neste processo a reproducibilidade
das diferentes soluções encontradas também é considerada. Neste estágio o software
também identifica valores inexistentes e as substitui automaticamente pela média da
variável no referido cluster. Algumas regiões podem não ser agrupadas neste estágio
da clusterização por estarem se comportando como outliers, evitando a distorção dos
clusters. Estas regiões são identificadas se estiverem a uma distância (d
2
) do cluster
mais próximo, quando comparadas com a maior distância (d) obtida entre uma região
e a média do referido cluster. Regiões consideradas duvidosas por estarem
localizadas exatamente entre 2 clusters também podem não ser classificadas nesta
etapa; b) em um segundo estágio, as regiões não agrupadas em alvos escuros ou
oceano no primeiro estágio são agrupadas nos clusters encontrados, considerando as
mínimas distâncias em relação a media dos clusters definidos no primeiro estágio.
As características que tornam o método FP implementado no software Clustan
diferente dos demais programas de clusterização são (WISHART, 2004): a) a
realização do teste de relocação das regiões com base na ME, garantindo que a
clusterização convergiu para o melhor resultado passível de ser obtido a partir do
conjunto de dados considerado; b) este teste também avalia a sensibilidade do
clusterizador com a alteração randômica da ordem com que as regiões são
inicialmente consideradas na formação dos clusters, compilando ao final as melhores
soluções; c) a disponibilização de uma lista com os melhores resultados obtidos, onde
o usuário decide qual será o modelo escolhido; d) o cálculo da reproducibilidade de
38
cada solução encontrada para a clusterização, considerando a freqüência de
ocorrência dos clusters em relação ao número de tentativas efetuadas; e) a
identificação de variáveis e nulas e outliers.
3.3 Avaliação dos Resultados obtidos para Detecção de Alvos Escuros em
Imagens SAR
O uso operacional de Sistemas de Detecção Automática de Óleo com base em
imagens de RADAR exige uma rápida performance, bem como resultados dotados de
alta confiabilidade produzidos com o mínimo de intervenção humana possível
(BREKKE & SOLBERG, 2005). Como o grau de confiabilidade é diretamente
influenciado pela qualidade da geometria dos alvos escuros extraídos das imagens, os
métodos de segmentação, bem como de agrupamento das regiões, possuem
importância significativa por exercerem influência nas demais etapas de
processamento. Neste sentido, um método eficiente para avaliar qualitativa e
quantitativamente os resultados gerados por diferentes procedimentos de
segmentação possui importância estratégica para uma implementação eficiente destes
sistemas (MEINEL & NEUBERT, 2004; NEUBERT et al., 2006).
De acordo com LUCCA (1999), SOUSA (2005), NEUBERT et al. (2006) e
SCOFIELD et al., (2007) existe uma diversidade de métodos de avaliação propostos
para comparar o desempenho de algoritmos de segmentação em relação às regiões
(DELVES et al., 1992, QUEGAN et al., 1988; CAVES et al., 1998;) e em relação às
bordas (PRATT, 1991; ROMÁN-ROLDÁN et al., 2001). Grande parte destes métodos
adota abordagens quantitativas, basicamente métodos de discrepância empírica, os
quais analisam o número de pixels erroneamente classificados em relação a uma
segmentação de referência (NEUBERT et al., 2006).
Segundo ZHANG (1996), os algoritmos de segmentação podem ser avaliados
por métodos analíticos ou métodos empíricos. Os métodos analíticos examinam
diretamente o algoritmo de segmentação analisando seus princípios e suas
propriedades (ZHANG, 1996; LUCCA et al., 1998; LUCCA, 1999; SOUSA, 2005). Os
métodos empíricos - de qualidade e de discrepância - avaliam indiretamente o(s)
algoritmo(s) utilizado(s), sendo que: a) os métodos empíricos de qualidade são
fundamentados a partir de uma comparação visual entre os produtos de segmentação,
considerando a experiência do intérprete na avaliação e definição dos melhores
produtos, e; b) os métodos de discrepância analisam a qualidade do segmentador
comparando os resultados de segmentos gerados utilizando diversas métricas em
39
relação a uma segmentação de referência e indicam a precisão e eficiência do
algoritmo (ZHANG, 1996; LUCCA et al., 1998; LUCCA, 1999; SOUSA, 2005;
SCOFIELD et al., 2007).
Neste trabalho, os métodos de avaliação qualitativa (métodos empíricos de
qualidade) e quantitativa (métodos de discrepância) (DELVES et al., 1992) foram
utilizados para avaliar comparativamente imagens binárias contendo, não as regiões
resultantes da segmentação, mas os polígonos resultantes do agrupamento destas
regiões em alvos escuros e oceano. No âmbito da tese, o termo regiões foi a
nomenclatura adotada para indicar os polígonos resultantes do processo de
segmentação. Esta denominação foi escolhida em função do próprio método de
segmentação utilizado, o qual trabalha com crescimento de regiões, individualizando
áreas com NC homogêneos, caracterizados em regiões claras e escuras na imagem.
O termo alvo escuro refere-se ao agrupamento das regiões provenientes da
segmentação, individualizando a geometria peculiar dos diferentes tipos de alvos
escuros (Capítulo 2) passíveis de ocorrerem em imagens SAR adquiridas em áreas
oceânicas. A Figura 3.3 disponibiliza uma ilustração com as diferenças entre estas
duas definições utilizadas ao longo da tese.
Figura 3.3 Ilustração das definições referentes a terminologia adota ao longo da tese.
Para calcular as métricas de avaliação, imagens de referência binárias
(Phantons), considerando as categorias alvos escuros e oceano, foram elaboradas
manualmente com o máximo de detalhamento possível por um intérprete experiente.
Uma segmentação prévia das imagens para auxiliar na elaboração dos Phantons não
foi utilizada para evitar que os resultados fossem tendenciosos, uma vez que
diferentes segmentadores foram testados (Capítulo 5: item 5.3). Neste contexto,
mesmo com as imprecisões associadas à elaboração manual dos Phantons, a
experiência do intérprete foi valorizada. Importante destacar que esta imprecisão,
associada à delimitação das bordas que separam os alvos escuros do oceano,
Alvo
Escuro
Oceano
40
também ocorre nos processamentos automáticos, em função do ruído speckle e outros
fatores de interferência descritos no Capítulo 2 (item 2.2).
Foram utilizados 2 tipos de métricas; a) calculadas no nível de regiões,
considerando os polígonos resultantes do agrupamento dos segmentos/regiões
produzidas pelas segmentações, e; b) métricas calculadas no nível do pixel a partir da
matriz de confusão.
3.3.1 Métricas calculadas no Nível das Regiões
Conforme comentado anteriormente, o cálculo das métricas envolve duas
imagens: a) a imagem resultante do agrupamento das regiões em alvos escuros e
oceano, denominada g
a
, e; b) a imagem de referência (Phanton), contendo alvos
escuros e o oceano, denominada g
p
. As regiões, ou polígonos que representam os
alvos escuros e o oceano nas imagens g
a
e g
p
são respectivamente denominadas ra e
rp, sendo as funções de segmentação g
a
: S {ra
1
, ..., ra
n
} e g
p
: S {rp
1
, ... , rp
m
},
onde n e m são o total de polígonos nas imagens g
a
e g
p
, respectivamente. O símbolo
S refere-se à representação das imagens em uma matriz bidimensional (S) formada
por linhas (l) e colunas (c), sendo S = {1...l} x {1...c}, onde cada elemento constitui um
pixel, dotado de coordenadas (x, y) e de um Nível de Cinza (NC) associado.
De acordo com DELVES et al. (1992) e LUCCA (1999), considerando que o
número de regiões agrupadas em alvos escuros e oceano (n) freqüentemente difere
do número de regiões definidas no Phanton (m), é necessário: a) sobrepor estas
imagens (g
p
e g
a
); b) comparar os pares de polígonos (rp
j
, ra
i
) contidos nas duas
imagens, onde j = {1,..., m) e i = {1,...,n}; c) e efetuar uma associação entre estas
regiões. O processo de associação entre as regiões contidas em g
p
e g
a
é efetuado
através da construção de duas matrizes (Gf) e (Fit) ambas com dimensões m x n. A
notação utilizada foi:
j
Irp
,
i
Ira
para indicar a média dos NC no k-ésimo polígono,
e; N(k
j
), N(k
í
) para indicar o número de pixels contidos no k-ésimo polígono de g
p
e g
a
respectivamente. As matrizes Gf e Fit foram construídas através da seguintes
operações:
(1)
)(
)(
),(
i
ra
j
rpN
i
ra
j
rpN
ijGf
(2)
),(
)2/)((
),(
i
ra
j
rpGf
idpdydxd
ijFit
41
onde:
(3)
c
ra
x
rp
x
ijxd
ij
),(
(4)
l
ra
y
rp
y
ijyd
ij
),(
(5)
)()(
)()(
),(
i
raN
j
rpN
i
raN
j
rpN
ijpd
(6)
i
Ira
j
Irp
i
Ira
j
Irp
ijid ),(
Cada um dos componentes das matrizes Fit e Gf indicados nas equações (1 e
2) efetuam uma comparação entre um par de polígonos ou regiões (rp
j
, ra
i
),
fornecendo: medidas de posicionamento no plano xy (xd e yd), intensidade média (id)
e tamanho (pd). O componente xd (equação: 3) corresponde à diferença entre a média
da posição de pixels existentes no eixo x para rp
j
e ra
i
, dividida pela dimensão da
imagem no eixo das abcissas (n
o
de colunas c). A mesma operação é efetuada para o
componente yd (equação: 4), sendo este calculado em relação ao eixo das ordenadas
(n
o
de linhas l). Estas duas métricas fornecem informações sobre o erro de
posicionamento entre os centros geométricos (centróides) das duas regiões
comparadas. O componente pd (equação: 5) efetua uma relação entre os números de
pixels que compõe os dois polígonos ou regiões comparadas, fornecendo uma métrica
de tamanho relativo entre as mesmas. o componente id (equação: 6) analisa as
propriedades dos NC entre as regiões comparadas mensurando a diferença entre as
intensidades médias dos pixels componentes das regiões comparadas (rp
j
, ra
i
).
Como resultado final deste procedimento, quanto maior for o valor de Gf
(equação: 1) obtido após a sobreposição de duas regiões rp
j
e ra
i
, menor será o valor
de Fit (equação: 2) na posição correspondente (rp
j
,ra
i
). Desta forma, cada uma das
regiões rp {rp
1
, ..., rp
m
} no Phanton será associada a uma única região ra {ra
1
, ..., ra
n
},
considerando o menor valor de Fit obtido na matriz (DELVES et al., 1992). A Figura
3.4 disponibiliza um esquema de como é feito o ajuste de regiões entre as duas
imagens.
42
Figura 3.4 - Esquema de como é efetuado o ajuste de regiões entre as duas imagens: exemplo
focado para no ajuste efetuado para os alvos escuros.
Tendo como base o ajuste de regiões efetuado (rp
j
, ra
i
) é possível avaliar cada
região ou polígono da imagem agrupada g
a
individualmente em relação à imagem de
referência g
p
, calculando as 4 métricas indicadas a seguir (DELVES et al., 1992;
LUCCA, 1999; SCOFIELD et al., 2007):
(7)
2
1
ydxd
Fitxy
(8)
)()(
)()(
1
i
raN
j
rpN
i
raN
j
rpN
Fitn
(9)
i
Ira
j
Irp
i
Ira
j
Irp
Fiti 1
(10)
)(
)(
i
ra
j
rpN
i
ra
j
rpN
Gf
Todas as métricas descritas acima foram padronizadas em um intervalo [0, 1] ,
onde o valor 1 representa o melhor ajuste. Para cada polígono da imagem agrupada
ajustado em relação ao Phanton é obtido um valor referente às 4 métricas calculadas.
Para se obter uma avaliação global dos resultados do agrupamento são computadas
as médias para cada métrica, considerando o número de regiões/polígonos que
compõe o Phanton no recorte de cena avaliado. Posteriormente, a distância euclidiana
(d
£2
) entre a média das quatro métricas indicadas nas equações 7, 8, 9 e 10, pode ser
obtida para sintetizar os resultados, sendo expressa por:
(11) d
£2
=
2
)1(
2
)1(
2
)1(
2
)1( GformaFi tnFi tiFi txy
rp1
rp2
rp3
rp4
2
rp5
2
rp6
2
ra2
ra1
ra3
rap4
2
ra6
ra5
2
ra7
ra8
ra9
2
Ajuste
Nulo
Ajuste
Quase
Perfeit
o
(rp3,ra3)
(rp2,ra2)
43
A variação de d
£2
está entre 0 e 2, sendo o melhor resultado a menor distância
d
£2
obtida em relação aos objetos ou polígonos da imagem de referência g
p
(NEUBERT et al., 2006).
Outra métrica calculada no nível das regiões foi o número de alvos escuros
detectados em relação ao Phanton (IPol), calculado a partir da intersecção dos
polígonos entre a imagem agrupada (g
a
) e a imagem de referência (g
p
).
3.3.1 Métricas Calculadas no Nível dos Pixels
Como o objetivo da tese não foi avaliar diretamente os resultados dos
procedimentos de segmentação, mas sim o resultado do agrupamento das regiões
resultantes das segmentações, o cálculo de métricas a partir de uma matriz de
confusão também foi utilizado. Matrizes de confusão são comumente utilizadas para
avaliar a qualidade de uma classificação ou mapeamento. Considerando que o
interesse das análises efetuadas foi avaliar a separação dos alvos escuros do oceano,
o estudo realizado também remete a um típico problema de classificação no qual se
deseja obter duas classes. Neste sentido, a imagem contendo o agrupamento das
regiões em alvos escuros e oceano também pode ser interpretada como uma
classificação.
Para o cálculo da matriz de confusão foi utilizado o domínio do pixel,
comparando-se as duas imagens binárias, Phanton e imagem segmentada agrupada
nas classes Alvo Escuros (E) e Oceano (O). A Tabela 3.1 indica a matriz de confusão
aplicada no domínio do pixel, depois do agrupamento das regiões.
Tabela 3.1 - Matriz de confusão para o agrupamento das regiões em alvos escuros e oceano.
A nomenclatura adotada na matriz de confusão foi: a) NEE: número de pixels
escuros associados a alvos escuros corretamente agrupados como alvos escuros; b)
NOO: número de pixels claros associados ao oceano corretamente agrupados como
oceano; c) NEO: número de pixels escuros associados aos alvos escuros
erroneamente agrupados como oceano, e; d) NOE: mero de pixels claros
associados ao oceano erroneamente agrupados como alvos escuros. Tendo como
44
base a matriz de confusão as métricas foram computadas considerando somente os
acertos e os erros ao redor dos alvos escuros.
Esta escolha foi efetuada, considerando que as amostras de alvos escuros e
de oceano em imagens SAR não são balanceadas, proporcionalmente, muito mais
oceano do que alvos escuros. KUBAT et al. (1998) abordou o problema das amostras
não balanceadas, especificamente no âmbito dos sistemas automáticos para a
detecção de óleo no mar, destacando que, nestes casos, métricas de avaliação global
não podem ser utilizadas como medidas de desempenho. Por este motivo, ressalta-se
que no trabalho não foram utilizados a exatidão global e coeficientes de avaliação
como o Kappa. Testes foram efetuados para a utilização do Kappa, entretanto, os
coeficientes gerados eram sempre bons, uma vez que para o oceano os índices de
acerto são, proporcionalmente, muito maiores, mascarando as imprecisões
observadas na classificação dos alvos escuros.
Desta forma, as métricas utilizadas desconsideraram a porção NOO da matriz
de confusão, considerando somente NEE, NEO e NOE para a composição das
métricas denominadas Fração de Intersecção entre a Classificada e o Phanton,
Omissão, Inclusão e Exatidão dos Alvos Escuros, especificadas abaixo:
Fração de Intersecção entre a Classificada e o Phanton (FInt): indica a
proporção de pixels de alvos escuros detectados pela classificação em relação aos
pixels de alvo escuros do Phanton. Pode ser representada pelo número de pixels da
intersecção de alvos escuros do Phanton e da imagem classificada, dividido pelo
número de pixels escuros do Phanton, sendo:
(12)
NEONEE
NEE
FInt
Essa fração permite visualizar a proporção de alvos escuros do Phanton que
foram mapeados, porém não evidencia os erros de inclusão.
Omissão (Om): indica quanto a classificação errou associando pixels de alvos
escuros ao oceano, alterando o formato destes alvos em relação à imagem de
referência (g
p
), sendo:
(13)
NEONEE
NEO
Om
45
Inclusão (In): indica quanto a classificação errou associando pixels de oceano a
alvos escuros, alterando o formato destes alvos em relação à imagem de referência
(g
p
), sendo:
(14)
NEONEE
NOE
In
Exatidão dos Alvos Escuros (ExAE): esta métrica foi definida com o objetivo de
sintetizar em um único índice as métricas referentes à matriz de confusão relacionadas
unicamente aos alvos escuros. Neste sentido, de forma diferente da FInt, a
intersecção dos alvos escuros foi dividida pela união de todas áreas escuras (Phanton
ou imagem classificada). Quando esse índice se aproxima de 1 indica que o alvo
escuro na imagem classificada está mais próximo do Phanton considerando os dois
tipos de erro.
(15)
NOENEONEE
NEE
ExAE
Além destas métricas, o tempo de processamento, calculado numa mesma
plataforma computacional, juntamente com uma avaliação qualitativa, considerando a
opinião do intérprete sobre os resultados obtidos ao longo da tese, também foi
considerado.
46
CAPÍTULO 4
METODOLOGIA E RECURSOS UTILIZADOS
Considerando o estado da arte em técnicas de segmentação de imagens e
clusterização, a metodologia proposta tem por objetivo estabelecer um procedimento
automático para a detecção de polígonos representativos para os diversos tipos de
alvos escuros identificáveis em imagens SAR (Capitulo 2). A Figura 4.1 contém um
fluxograma das etapas vislumbradas para o funcionamento completo do sistema
destacando as etapas a serem desenvolvidas no estudo proposto.
Figura 4.1 Etapas de processamento envolvidas no sistema de detecção automática de óleo
e ocorrências ambientais.
Os procedimentos metodológicos propostos neste trabalho estão organizados
em 6 etapas distintas (Figura 4.2): a) definição do conjunto de dados: formato dos
dados e seleção dos recortes de cena; b) determinação do espaçamento de pixel mais
adequado para as imagens; c) determinação do filtro e da janela a serem utilizados no
pré-processamento das imagens; d) detecção de regiões escuras e claras através de
técnicas de segmentação de imagens de satélite, determinando o segmentador mais
adequado; e) determinação de um procedimento de clusterização não supervisionado
para a produção de polígonos representativos para alvos escuros detectáveis em
Etapas
Estudadas
Oceano
Algas
Sim
47
imagens SAR, e; f) validação do método proposto. Estas etapas estão detalhadas nas
seções 4.1, 4.2, 4.3, 4.4, 4.5 e 4.6.
Figura 4.2 Etapas integrantes da metodologia proposta na tese.
4.1 Etapa 1: Conjunto de Dados - Informações Técnicas e Seleção de Exemplos
Imagens provenientes do satélite RADARSAT-1, Banda C (freqüência de
5,3GHz e comprimento de onda de 5,6cm), polarização HH, nos modos de
imageamento ScanSAR Narrow e ScanSAR Wide foram cedidas pela PETROBRAS
para os estudos propostos. Como no momento da seleção dos exemplos o satélite
RADARSAT-2 ainda não estava operacional, imagens deste satélite não foram
utilizadas. A Tabela 4.1.apresenta a configuração dos modos de imageamento do
RADARSAT 1 utilizados na tese.
Tabela 4.1 - Configuração dos modos de imageamento do satélite RADARSAT-1 adequados ao
monitoramento costeiro e oceânico
48
Os produtos utilizados são formados a partir da junção de 2 ou mais modos
únicos denominados single look. Estas imagens são denominadas multi-look, sendo o
dado complexo disponível apenas para os modos single look. O modo ScanSAR
Narrow - com número de looks igual 4 - é formado a partir da junção de 2 ou 3 modos
single look, enquanto que os produtos ScanSAR Wide - com número de looks igual a 8
- são formados pela junção de 4 modos single look.
Embora as imagens possam ser fornecidas no formato bruto CEOS, para
garantir o caráter operacional da atividade os produtos são entregues em tempo
próximo do real no formato compactado MrSid (Multi-resolution Seamless Image
Database) com resolução radiométrica de 8 bits. A possibilidade de utilizar os dados
no formato CEOS foi avaliada, entretanto, o tempo médio gasto para o download
destes dados é alto (35min) quando comparado com o tempo gasto para o download
dos dados no formato MrSid (segundos). Complementarmente, os dados no formato
compactado, são entregues georreferenciados, filtrados e com correção do padrão de
antena, processamentos necessários para a utilização dos dados no formato CEOS.
As imagens RADARSAT utilizadas pela PETROBRAS são processadas em
três estações de recepção, duas localizadas no Canadá (Prince Albert e Gatineau) e
uma na Argentina (CONAE). Apesar dos dados serem processados em três locais
diferentes, um dos operadores da estação Gatineau garantiu que um padrão no
pré-processamento dos dados utilizado em todas as estações de recepção (GAMBLE,
2008). Esta informação é importante à medida que diferentes pré-processamentos
podem influenciar nos resultados obtidos para a detecção de óleo e assemelhados. De
acordo com GAMBLE (2008), as imagens são compactadas em 10 vezes (10: 1),
reduzindo o tamanho dos arquivos de 100-150 Mb para 10-15 Mb no formato MrSid
sem reduzir as dimensões da imagem. Embora a compactação seja imprescindível em
função do caráter operacional da atividade, é importante ressaltar que o processo de
compactação/descompactação altera as propriedades estatísticas das imagens SAR.
O teste de Kolmogorov-Smirnov
4
, comparando uma mesma imagem
RADARSAT no formato CEOS e descompactada a partir do formato MrSid, rejeita a
hipótese nula de que as distribuições estatísticas são iguais nos dois formatos com p-
value igual a zero. A rejeição da hipótese nula comprova que as propriedades
estatísticas das imagens são alteradas após a compressão dos dados no formato
4
O teste de Kolmogorov-Smirnov é utilizado para evidenciar se duas amostras independentes
possuem o mesmo tipo de distribuição estatística.
49
MrSid. A Figura 4.3 disponibiliza os histogramas e os box plots para uma mesma
imagem no formato CEOS e MrSid, juntamente com os atributos estatísticos de média,
mediana, mínimo, máximo e desvio padrão, evidenciando as diferenças.
Figura 4.3 - Histogramas e box plots para uma mesma imagem no formato CEOS e MrSid.
Apesar da compactação alterar as propriedades estatísticas das imagens, esse
formato foi utilizado considerando que a hipótese da tese foi desenvolver um método
para detecção automática de alvos escuros com potencial para ser utilizado
operacionalmente.
Para a tese foram selecionados 14 recortes de cena, 11 para efetuar as
análises e 3 para validar o método proposto ao final da tese. A Tabela 4.2 contém a
data das cenas e os parâmetros de aquisição das imagens pelo sensor para cada um
dos recortes de cena utilizados.
Tabela 4.2 - Data das cenas e parâmetros de aquisição das imagens pelo sensor para os
recortes de cena selecionados.
50
A seleção de exemplos constitui etapa essencial para o desenvolvimento de
qualquer metodologia que tenha por objetivo propor um sistema para a detecção
automática de alvos escuros em imagens SAR. Considerando os inúmeros fatores
peculiares às imagens SAR, os quais dificultam a detecção dos alvos escuros
(Capitulo 2), a escolha de recortes de cena individualizando alvos escuros com bom
contraste em relação ao oceano pode levar a conclusões precipitadas sobre a
possibilidade ou não de automatização do sistema.
Neste contexto, a seleção realizada buscou refletir ao máximo a realidade
encontrada nas imagens SAR, incluindo: a) recortes de cena considerados fáceis, nos
quais um único alvo escuro, com geometria simples e bom contraste em relação ao
oceano foram individualizados; b) recortes de cena considerados difíceis, contendo
mais de um tipo de alvo escuro, em diferentes escalas, com geometria variável; c)
alvos escuros ocorrendo simultaneamente com baixas intensidades de vento,
dificultando a detecção em função da variação do contraste entre estes alvos escuros
e o oceano, e; d) recortes de cena com falhas no processamento efetuado para gerar
as imagens, como a descontinuidade dos NC entre faixas de imageamento distintas. A
Tabela 4.3 apresenta uma descrição das características dos recortes de cena
RADARSAT selecionados, indicando: a) o tamanho dos recortes de cena em pixels; b)
o número de alvos escuros individualizados; c) a complexidade da geometria; d) a
existência de alvos escuros de diferentes tamanhos no mesmo recorte; e) se o
contraste entre os alvos escuros e o oceano era instável ao longo de todo recorte ou
apresentava variações; f) se a imagem apresentava falhas de processamento ou não,
e; g) se nos recortes havia apenas um tipo de alvo escuro óleo(s) ou assemelhado(s)
- ou os dois tipos de evento óleo(s) e assemelhado(s).
Tabela 4.3 Características associadas à seleção dos recortes de cena utilizados.
51
4.2 Etapa 2: Determinação do Espaçamento de Pixel
O estudo realizado utilizou um recorte de uma cena RADARSAT-1 (1671 linhas
X 922 colunas) adquirida em 03/04/2002 no modo ScanSAR Narrow com
espaçamento de pixel de 50m, largura de faixa de 300km, polarização HH, número de
looks igual a 4 entregue em 8 bits no formato compactado MrSid (Figura 4.4).
IMAGEM RADARSAT-1 (03/04/2002) MODO: SCANSAR NARROW - ASCENDENTE
Figura 4.4 Recorte da cena RADARSAT-1 (03/04/2002) utilizada no estudo proposto.
O recorte da cena RADARSAT-1 com 50m de espaçamento de pixel foi
reamostrado para 100m, 150m e 200m utilizando o método de reamostragem por
vizinho mais próximo no software ENVI, com o objetivo de não alterar as propriedades
radiométricas das imagens. Todas as imagens foram segmentadas no software
MultiSeg (SOUSA, 2005; SOUSA et al., 2005), escolhido por ser gratuito e
programado especificamente para imagens de RADAR. Estudos para identificar qual o
melhor modo de processamento e quais os parâmetros adequados para serem
utilizados no software MultiSeg foram realizados. Os segmentos, regiões claras e
escuras geradas para cada espaçamento de pixel, foram agrupados em 2 categorias,
alvos escuros e oceano, considerando como atributo a média dos níveis de cinza (NC)
para cada segmento ou região. A técnica de agrupamento utilizada foi limiarização por
Médias, sendo o limiar definido interativamente pelo intérprete, escolhendo o valor de
partição que retornou visualmente o melhor resultado. Finalmente, computando-se as
métricas de avaliação descritas na seção 3.3, as quais relacionam a imagem
resultante dos agrupamentos com a imagem de referência (Phanton), foi determinado
o espaçamento de pixel mais adequado. A Figura 4.5 ilustra a metodologia adotada
para investigar o espaçamento de pixel adequado para o processamento dos dados
RADARSAT para a metodologia proposta.
Escuro
52
Figura 4.5 Metodologia adotada para investigar o espaçamento de pixel adequado para o
processamento dos dados RADARSAT no sistema de detecção automático.
4.3 Etapa 3: Determinação do Filtro/Janela
Após a determinação do espaçamento de pixel mais adequado a ser utilizado
foram testados os filtros Frost, Frost Enhanced, Lee, Lee Enhanced, Kuan, Gamma,
Sigma e Mediana, todos aplicados considerando as dimensões das janelas de 3x3,
5x5 e 7x7. O mesmo recorte de cena da primeira etapa foi utilizado como dado de
entrada para investigação dos diferentes filtros (Figura 4.4). Os recortes de cena sem
filtro e filtrados, considerando os diferentes filtros e janelas, foram segmentados no
software Multiseg retornando regiões escuras e claras. Estas regiões foram agrupadas
por limiarização em alvos escuros e oceano e estes foram avaliados
comparativamente com a imagem de referência (Phanton), seguindo a mesma
metodologia descrita no item 4.2. No total foram produzidos 25 resultados a serem
comparados com o Phanton elaborado com o espaçamento de pixel definido como
mais adequado no item 4.2. Definir se a aplicação de um filtro na fase de pré-
processamento das imagens oferece melhoria significativa nos resultados da
segmentação e qual dos filtros/janela oferece melhor resultado foi o objetivo desta
etapa. A Figura 4.6 ilustra a metodologia utilizada para determinar o melhor
filtro/janela.
53
Figura 4.6 Metodologia adotada para investigar o filtro/janela adequado para o
processamento dos dados RADARSAT no sistema de detecção automático.
A aplicação de filtragem nas imagens pode alterar a eficiência da
segmentação e, conseqüentemente, do agrupamento das regiões escuras e claras
para os diferentes tipos de alvos escuros dotados de geometria e textura peculiares.
Para avaliar se a aplicação do filtro/janela escolhido contribui para a detecção de alvos
escuros, na etapa seguinte os diferentes recortes de cena foram processados sem
filtro e com o filtro/janela indicado como mais adequado nesta etapa. Este
procedimento foi realizado para validar, com maior consistência, a decisão sobre
utilizar ou não um filtro/janela padrão na fase de pré-processamento das imagens.
4.4 Etapa 4: Determinação do Procedimento de Segmentação
Para a determinação do segmentador, além do recorte de cena utilizado
nas etapas anteriores (Figura 4.4), foram selecionadas imagens SAR com diferentes
tipos de alvos escuros, passíveis de serem encontrados em áreas oceânicas. A
diversidade de alvos escuros foi considerada nesta etapa à medida que a eficiência
dos segmentadores é influenciada pela geometria e pela textura peculiar a cada tipo
de alvo (Capítulo 4: item 4.1). Nesta etapa da tese, 11 recortes de cena RADARSAT
sem filtragem e pré-processados com o espaçamento de pixel e o filtro/janela mais
adequados ambos determinados nas etapas anteriores - foram segmentados nos
softwares Multiseg e SPRING. As regiões escuras e claras resultantes das
segmentações foram agrupadas em alvos escuros e oceano. A técnica de
agrupamento de limiarização por Médias também foi utilizada, sendo o limiar definido
interativamente pelo intérprete, escolhendo o valor de partição que retornou
visualmente o melhor resultado. A escolha dos limiares interativamente foi utilizada
nesta etapa da tese para que uma avaliação justa dos segmentadores fosse realizada,
indicando sempre o melhor limiar para cada cena, uma vez que a utilização de um
limiar fixo não retornaria bons resultados para todas as cenas, com todos os
segmentadores.
54
Os alvos escuros e oceano, resultantes do agrupamento das regiões escuras
e claras produzidas nas segmentações, foram avaliados comparativamente com os
indicados como referência no Phanton, seguindo a mesma metodologia descrita no
item 4.2. A Figura 4.7 apresenta os procedimentos metodológicos para a determinação
do segmentador.
Figura 4.7 - Fluxo de procedimentos metodológicos planejado para investigar a etapa de
segmentação em imagens de SAR.
Os segmentadores testados utilizam diferentes parâmetros de entrada, os
quais influenciam no número de segmentos e no formato dos segmentos produzidos.
Como o foco da tese não esteve centrado na segmentação, mas no agrupamento das
regiões resultantes da segmentação, a preocupação foi balizar estes parâmetros de
maneira que a imagem não fosse subsegmentada a ponto de perder feições de
interesse e nem supersegmentada, exigindo um maior desempenho computacional
para o processamento dos resultados. Como o objetivo desta etapa foi identificar o
55
segmentador adequado para ser acoplado ao sistema de detecção automático foi
necessário pesquisar valores que se adequassem como padrão para os parâmetros
exigidos pelo segmentador. Para tal, como parte dos resultados gerados, pesquisas
foram realizadas a fim de investigar os parâmetros adequados para serem utilizados
nos softwares testados.
4.5 Etapa 5: Determinação do Procedimento de Clusterização
Uma vez determinados, através dos procedimentos descritos nas etapas
anteriores, o espaçamento de pixel, o filtro/janela e o segmentador mais adequados, o
procedimento metodológico para definir o método de clusterização foi composto pelas
seguintes etapas: a) segmentação das imagens; b) cálculo de diferentes atributos
estatísticos, geométricos e texturais, tendo como base as imagens e as regiões
escuras e claras resultantes das segmentações; c) análise exploratória e seleção de
atributos; d) agrupamento automático das regiões em alvos escuros e oceano,
considerando os diferentes atributos como dados de entrada no software Clustan; e)
avaliação do(s) atributo(s) mais adequados, comparando os resultados das
clusterizações efetuadas cumulativamente inserindo gradualmente cada atributo, com
os alvos de referência do Phanton; f) considerando o conjunto de atributos
selecionado, uma comparação do desempenho entre técnicas automáticas (não
supervisionada) e semi-automáticas (supervisionadas) para a detecção de alvos
escuros foi efetuada. Nesta última etapa foram comparados: a) os resultados
provenientes dos algoritmos supervisionados de Máxima Verossimilhança (Maxver) e
Máquinas de Suporte Vetorial (SVM); b) os resultados das operações de limiarização
efetuadas nos itens anteriores, e; c) os resultados obtidos pelo clusterizador Focal
Point implementado no software Clustan.
A Figura 4.8 apresenta os procedimentos metodológicos para a determinação
do procedimento de clusterização e do(s) atributo(s) a serem utilizados na detecção de
alvos escuros em imagens SAR.
56
Figura 4.8 - Fluxo de procedimentos planejado para investigar o método de clusterização mais
adequado a ser utilizado após a segmentação das imagens SAR.
Conforme comentado, as avaliações foram realizadas através da comparação
dos alvos escuros resultantes do agrupamento das regiões escuras e claras, com os
polígonos indicados como referência nos Phantons, considerando o índice de Exatidão
dos Alvos Escuros descrito no item 3.3.
4.6 Etapa 6: Validação do Método Proposto
A possibilidade de estabelecer uma regra de decisão para o processamento
automático das imagens foi considerada. Para tal, o método de Árvores de
Classificação e Regressão - ACR (Classification and Regression Trees - CART)
disponível no módulo Data Mining do Software Statistica, foi utilizado.
A partir da regra de decisão encontrada, a validação do método proposto foi
efetuada a partir do pré-processamento de 3 novas imagens SAR, utilizando o
espaçamento de pixel, o filtro/janela e o segmentador com os parâmetros definidos
nas etapas anteriores como os mais adequados para a detecção de alvos escuros. O
57
conjunto de atributos adequado, igualmente definido na etapa 4.5 da tese, foi
calculado para cada novo recorte de cena e as clusterizações foram efetuadas no
software Clustan. Phantons foram delineados manualmente e as métricas de
avaliação calculadas da mesma forma que nas etapas anteriores.
Posteriormente, os atributos chaves utilizados pela ACR para formular as
regras de decisão foram igualmente calculados e analisados para os 3 recortes de
cena, a fim de verificar se o comportamento encontrado refletiria a regra indicada pelo
algoritmo. Finalmente, com base em todos os resultados obtidos ao longo da tese, um
método para a detecção de alvos escuros em imagens SAR foi proposto, integrando
técnicas de segmentação de imagens e clusterização de dados.
58
CAPÍTULO 5
RESULTADOS E DISCUSSÕES
5.1 Etapa 1: Determinação do Espaçamento de Pixel
5.1.1 Determinação dos Parâmetros Adequados para o Software MultiSeg
Conforme comentado no Capítulo 3: Item 3.1.1.1, o software MultiSeg foi
inicialmente utilizado nas primeiras etapas, tendo sido necessário investigar quais os
modos e parâmetros adequados para a segmentação. Desta forma, com relação aos
modos de segmentação Cartoon e Texture disponíveis no software MultiSeg, análises
preliminares evidenciaram que o tempo de processamento necessário para segmentar
o mesmo recorte de imagem foi maior no modo Texture (60min) do que no Cartoon
(em média 3min), utilizando a mesma plataforma computacional. Comparando os
resultados com o Phanton (Figura 5.1), o modo Texture segmentou mais intensamente
as regiões escuras (alvos de interesse) em detrimento das regiões claras, resultado
que reduziria o custo computacional na etapa de agrupamento dos segmentos em
alvos escuros e oceano. A análise visual dos resultados indicou que, embora a
segmentação no modo Texture tenha priorizado a segmentação das regiões escuras,
a geometria dos alvos escuros obtida após o agrupamento das regiões não ficou bem
delineada. O maior número global de regiões (escuras e claras) produzidas no modo
Cartoon permitiu formar polígonos mais representativos para os alvos escuros com
maior acurácia em relação ao Phanton. Além da possibilidade do modo Texture
detectar com menor acurácia a geometria dos alvos escuros em relação ao modo
Cartoon, a diferença de custo computacional evidenciada entre estes modos
inviabilizaria o uso operacional do modo Texture, a medida que o sistema de detecção
automática processaria imagens inteiras e não somente recortes de cenas
5
.
Os modos de aquisição das imagens RADARSAT para o monitoramento
costeiro e oceânico (ScanSAR Narrow e ScanSAR Wide) são entregues em amplitude
em 8 bits (0~255). Para processá-los no modo Cartoon com melhor desempenho foi
necessário utilizá-los em intensidade 16 bits (0~65536), pois o tempo de
processamento foi menor neste formato. A Figura 5.1 ilustra os resultados obtidos para
5
O tamanho do recorte de cena utilizado no experimento é de 922 colunas X 1671 linhas,
totalizando 1540662 pixels, e o tamanho da imagem inteira é de 7873 colunas X 8413 linhas,
totalizando 66235549 pixels. O recorte de cena equivale a apenas 2% da área total da cena,
restando ainda 98% da área da cena a ser processada.
59
segmentações realizadas nos modos/formato Cartoon/Amplitude, Cartoon/Intensidade
e Texture/Intensidade, evidenciando o número de regiões produzidas e o tempo de
processamento. O software não conseguiu processar os dados no modo/formato
Texture/Amplitude.
Modo MultiSeg: CARTOON
Formato dos Dados: Amplitude
Modo MultiSeg: CARTOON
Formato dos Dados: Intensidade
Modo MultiSeg: TEXTURE
Formato dos Dados: Intensidade
AVALIAÇÃO DOS MODOS DE SEGMENTAÇÃO CARTOON E TEXTURE DO SOFTWARE MULTISEG:
#Número de Regiões: 292
#Tempo de Processamento:
2min 27seg = 147seg
#Número de Regiões: 779
#Tempo de Processamento:
3min 27seg = 207seg
#Número de Regiões: 272
#Tempo de Processamento:
1hora 26min e 38seg = 5198seg
Phanton:
Imagem de Referência
#Resolução Espacial: 50m
#Tamanho do Recorte da
Cena: 922 colunasX1671 linhas
Figura 5.1 - Resultados obtidos para segmentações realizadas nos modos/formato:
Cartoon/Amplitude, Cartoon/Intensidade e Texture/ Intensidade.
Conforme observado na Figura 5.1, a diferença no tempo de processamento
foi pequena comparando-se os dados em amplitude e em intensidade para o modo
Cartoon. Desta forma, optou-se pela utilização dos dados de entrada no padrão de
configuração do software em intensidade.
Esta escolha considerou também a constatação de que a utilização dos dados
em intensidade produziu um número maior de regiões (779) quando comparado com o
número de regiões produzidas para os dados em amplitude (292). Nas áreas costeiras
e oceânicas há diversos tipos de fenômenos que ocorrem em diferentes escalas sendo
detectáveis nas imagens de RADAR como alvos escuros em grande, média e pequena
dimensão espacial. A subsegmentação de uma imagem contendo diferentes alvos em
múltiplas escalas de representação espacial pode resultar na redução do potencial de
detecção dos alvos de pequena dimensão. Neste contexto, quanto maior o número de
regiões produzidas maior a chance de detecção de pequenos alvos. O maior número
de regiões com dimensões variadas, também pode resultar em um melhor
delineamento, ou seja, uma maior acurácia na delimitação das bordas dos polígonos
representativos para os alvos escuros que se deseja detectar na cena processada. A
Figura 5.2 compara a segmentação produzida para os dados de entrada em amplitude
60
e em intensidade no modo Cartoon, evidenciando exemplos de pequenos alvos
escuros que foram melhor detectados em função do maior número de regiões geradas
para os dados de entrada em intensidade. Considerando os resultados obtidos para o
teste dos modos de processamento existentes no software MultiSeg, optou-se por
utilizar - ao longo de toda a tese - o modo Cartoon com os dados de entrada em
intensidade (0~65535).
Figura 5.2 Exemplos de segmentações nos modos Cartoon/Amplitude, e
Cartoon/Intensidade.
Para determinar o espaçamento de pixel mais adequado, a ser adotado como
padrão para os dados de entrada em um sistema de detecção automática de óleo e
ocorrências ambientais, foram investigados os parâmetros de entrada exigidos pelo
MultiSeg. Nesta etapa, para analisar o efeito da variação do espaçamento de pixel
das imagens nos resultados das segmentações, foram definidos os valores que seriam
utilizados para os seguintes parâmetros de entrada: a) área mínima: definição do
número mínimo de pixels que o menor segmento gerado pode ter; b) número
equivalente de looks (Nel), e; c) limiar de similaridade (LS).
Área Mínima: De acordo com BENTZ (2006), durante dois anos de
monitoramento, a mínima área detectada como mancha de óleo em imagens de SAR
61
foi de 0,45km
2
. A experiência de campo obtida por inspetores ambientais
6
apontou
que, a mínima área de manchas de óleo identificável visualmente pode chegar a
0,25km
2
. Com base nesta experiência, buscando um critério mais rigoroso que
possibilitasse a máxima detecção de regiões escuras nas imagens, o parâmetro de
entrada para a área mínima foi definido como 0,25km
2
, permitindo a detecção de áreas
menores que 0,45km
2
, as quais podem estar associadas com prováveis vazamentos
de óleo no mar. O parâmetro de área mínima em pixels variou de acordo com o
espaçamento de pixel da imagem a ser segmentada para representar, de maneira
equivalente, a mesma área (0,25km
2
). Para os espaçamentos de 50m, 100m, 150m e
200m foram necessários, respectivamente, 100 pixels, 25 pixels, 11 pixels e 6 pixels
como área mínima para detectar uma área de 0,25km
2
.
Número Equivalente de Looks (Nel): O Nel é calculado em função da
distribuição estatística dos NC em uma imagem de RADAR (FRERY et al., 2007),
sendo sempre menor ou igual ao mero de Looks (Nl) da imagem. A compactação
da imagem no formato MrSid altera as propriedades estatísticas das imagens de
RADAR (item 4.1), produzindo valores incoerentes, muito maiores do que o Nl da
imagem. Como não foi possível calcular o Nel, e este parâmetro deve ser sempre
menor ou igual ao Nl da imagem, segmentações foram testadas com valores de Nel 2,
3 e 4, considerando que o Nl da cena estudada era 4. Conforme verificado nos
resultados apresentados na Figura 5.3, para um mesmo Nel observou-se que o
número de regiões produzidas diminuiu com o aumento do espaçamento de pixel nas
imagens. Todavia, para todos os espaçamentos estudados, quanto maior o Nel maior
o número de regiões produzidas e quanto maior o número de regiões maior a
possibilidade de detecção de alvos escuros de pequena dimensão em imagens SAR.
Como o importante para a aplicação em questão é não deixar de detectar uma
possível emergência ambiental, o Nel 4 foi considerado como parâmetro mais
adequado. Importante observar a diferença no tempo de processamento exigido para
um recorte de cena com espaçamento de 50m (cerca de 3min) em relação aos demais
espaçamentos de pixel (menos de 1min). A Figura 5.3 ilustra os resultados obtidos
para as segmentações realizadas no modo/formato Cartoon/Intensidade com Nel 2, 3
e 4, para os espaçamentos de pixel de 50m, 100m, 150m e 200m, evidenciando o
número de regiões produzidas e o tempo de processamento exigido em cada caso.
6
Informação obtida através de Relatórios Técnicos da PETROBRAS e comunicação pessoal
com os inspetores ambientais da PETROBRAS responsáveis pelo monitoramento e pelo
combate de manchas de óleo em alto mar ao longo de 6 anos de experiência.
62
AVALIAÇÃO DO NÚMERO EQUIVALENTE DE LOOKS (NEL = 2, 3 OU 4) PARA O SOFTWARE
MULTISEG: MODO/FORMATO CARTOON/INTENSIDADE
Nel: 2
# N
o
de Regiões: 398
# Δt: 2min = 120seg
#N
o
de Regiões: 756
#Δt: 3min 29seg = 209seg
#N
o
de Regiões: 873
#Δt: 3min e 31seg = 211seg
RADARSAT 50m
# N
o
de Regiões: 116
# Δt: 0,16min
#N
o
de Regiões: 146
#Δt: 0,17min
#N
o
de Regiões: 180
#Δt: 0,18min
RADARSAT 200m
# N
o
de Regiões: 196
# Δt: 0,39min
#N
o
de Regiões: 238
#Δt: 0,44min
#N
o
de Regiões: 289
#Δt: 0,46min
RADARSAT 100m
# N
o
de Regiões: 89
# Δt: 0,09min
#N
o
de Regiões: 103
#Δt: 0,10min
#N
o
de Regiões: 124
#Δt: 0,11min
Nel: 3Nel: 4
Nel: 2Nel: 3Nel: 4
Nel: 2Nel: 3Nel: 4
RADARSAT 150m
Nel: 2Nel: 3Nel: 4
Figura 5.3 - Resultados obtidos para segmentações realizadas com Nel 2, 3 e 4, considerando
todos os espaçamentos de pixel avaliados.
Limiar de Similaridade (LS): O LS é o parâmetro utilizado nos testes de
crescimento e agrupamento de regiões. Para o software MultiSeg duas regiões
distintas serão consideradas similares e serão agrupadas em uma única região
quando a metade da diferença entre a média dos NC for menor do que o LS
estabelecido (SOUZA, 2005). Desta forma, quanto menor for o LS maior será a
63
sensibilidade do segmentador para captar diferenças entre regiões distintas e
espacialmente próximas, conseqüentemente, maior será o número de regiões
produzidas pela segmentação, aumentando o potencial de detecção de alvos escuros
na imagem, incluindo os de pequena dimensão.
Com base nas considerações acima, foi proposto um método padrão para o
cálculo do LS que refletisse a menor distância entre a distribuição das regiões escuras
e claras, resultando em um menor valor do LS calculado com base nas propriedades
estatísticas e espaciais dos NC componentes da imagem.
Para calcular este parâmetro, considerando o recorte de cena utilizado nesta
etapa da tese, uma segmentação supervisionada no software ENVI
7
foi realizada onde
o intérprete definiu, interativamente, o melhor limiar de corte (NC
Amplitude
=28 ou
NC
Intensidade
=784) que permitiu ao segmentador detectar os polígonos mais
representativos para os alvos escuros identificados. O resultado desta segmentação
foi utilizado como uma máscara para gerar uma borda ao redor dos alvos escuros
contidos na imagem. Ao redor desta borda um buffer com raio de 5 pixels para dentro
dos alvos escuros e de 5 pixels para fora dos alvos escuros foi criado. Este buffer foi
utilizado como máscara para extrair as propriedades estatísticas das regiões limítrofes
claras e escuras presentes na imagem.
O cálculo proposto para o LS foi feito como base no box plot calculado para as
regiões claras e escuras amostradas através do buffer gerado ao redor da borda dos
alvos escuros. O critério adotado foi a subtração do valor obtido para o quarto quartil
do box plot (Q4
REscura
) calculado para as regiões escuras do valor obtido para o
primeiro quartil do box plot (Q1
RClara
) calculado para as regiões claras. A Figura 5.4 e
5.5 disponibilizam: a) o box plot calculado para as regiões escuras e claras
amostradas pelo buffer, e; b) o método proposto como padrão para calcular o LS em
dB.
7
O segmentador do ENVI utiliza técnicas de Threshold e filtragem aplicadas com base em um
limiar de corte definido supervisionadamente pelo intérprete.
64
BOX PLOT: BUFFER REGIÕES ESCURAS
MÉTODO PROPOSTO PARA O CÁLCULO DO LIMIAR DE SIMILARIDADE
EXEMPLO: 03/04/2002 (FLORESCIMENTO DE ALGAS)
BOX PLOT: BUFFER REGIÕES CLARAS
LS
Q4
Q1
MultiSeg:
LS = 10Log
10
Q1
RClara
- 10Log
10
Q4
REscura
(dB)
Menor distância entre as 2
distribuições
Figura 5.4 Exemplo de box plot calculado para as regiões claras e escuras e método proposto
para o cálculo do Limiar de Similaridade em dB.
Este método garante que, utilizando todos os quartis representantes das
regiões escuras, o risco de não detectar uma provável mancha de óleo é reduzido sem
deixar de considerar a maior parte dos dados referentes às regiões claras (75%). É
possível garantir que as regiões escuras estão sendo priorizadas porque o valor do Q4
para o box plot das regiões escuras corresponde ao limiar de corte definido
interativamente na segmentação do ENVI, o qual forneceu a melhor separação entre
os alvos escuros e o oceano.
O critério proposto para cálculo do LS privilegia a detecção de regiões escuras
em detrimento das regiões claras. Esta premissa considera que é preferível errar
detectando regiões claras como escuras do que o contrário, detectando regiões
escuras como claras, as quais podem estar associadas a um possível vazamento de
óleo e, conseqüentemente, a uma situação de emergência ambiental. A Figura 5.5
ilustra o método proposto para o cálculo do LS com base nas amostras dos buffers.
65
Figura 5.5 Metodologia padrão proposta para calcular o Limiar de Similaridade.
O LS calculado com base nas amostras obtidas ao redor das bordas dos alvos
escuros é mais efetivo do que amostras que consideram toda a área de alvos escuros
e oceano existente na imagem. Amostras que consideram a área total das regiões
escuras e claras possuem maior variância e não consideram a adjacência espacial das
áreas limítrofes entre as distribuições. O cálculo dos LS a partir de amostras ao redor
dos buffers considera somente as propriedades estatísticas peculiares às áreas de
transição que se deseja separar. Na região de fronteira a média para os pixels no
oceano será sempre menor do que a obtida a partir de amostras considerando toda a
área oceânica. De forma contrária, a média para os pixels localizados para dentro da
borda dos alvos escuros será sempre maior do que as obtidas a partir de amostras
selecionadas nos alvos escuros como um todo. Como conseqüência, a distância entre
as médias dos pixels claros e escuros diminui à medida que as amostras estão
limitadas a região de fronteira. O cálculo do LS, considerando amostras globais e
localizadas ao redor dos buffers para o recorte de cena utilizado evidenciou as
observações acima: a) o LS calculado com base em amostras abrangendo o total de
regiões escuras e claras da imagem, sendo a metade da diferença entre as médias, foi
3,16dB em intensidade e 10,34 em amplitude; b) o LS calculado a partir das amostras
efetuadas nos buffers, sendo a metade da diferença entre as médias foi 1,26dB e 4,35
em amplitude, e; c) o LS calculado a partir das amostras efetuadas nos buffers,
considerando os quadrantes do box plot, foi 1,16dB e 4 em amplitude. A comparação
entre estes 3 itens evidenciou que os menores valores obtidos para o LS, tanto em
intensidade quanto em amplitude, foram obtidos pelo método dos quartis.
Borda
Claro
Escuro
66
O todo proposto foi a solução encontrada para padronizar o cálculo do LS
caracterizado como a menor distância entre as distribuições a partir de um critério
único, evitando análises tendenciosas. Nas etapas seguintes da tese, onde foram
utilizados diferentes recortes de cena e segmentadores, esta padronização foi
importante para garantir uma comparação justa entre os resultados, à medida que os
parâmetros de entrada dos segmentadores foram calculados com base em um mesmo
critério.
5.1.2 Determinação do Espaçamento de Pixel
Os valores indicados no item acima (LS = 1,16dB e Nel = 4) foram utilizados
como parâmetros de entrada para as segmentações realizadas no MultiSeg,
considerando diferentes valores para o espaçamento de pixel 50m, 100m, 150m e
200m para o recorte de cena estudado. Conforme descrito no Capítulo 4, item 4.2, as
regiões resultantes da segmentações foram agrupadas considerando como atributo a
média dos NC, utilizando o limiar de corte definido interativamente na segmentação do
ENVI, abaixo do qual foram detectados os alvos escuros (NC
Intensidade
<=784) e acima
do qual foi detectado o oceano (NC
Intensidade
>=784). Os polígonos resultantes do
agrupamento das regiões foram avaliados comparativamente com os polígonos de
referência (Phantons) através das métricas de avaliação descritas no Capítulo 3, item
3.3.
A Tabela 5.1 contém as métricas de avaliação calculadas para os resultados
obtidos para os diferentes espaçamentos de pixel. A Figura 5.6 apresenta os
resultados obtidos para as segmentações, os agrupamentos efetuados por
limiarização, a de intersecção dos alvos escuros entre a imagem classificada e o
Phanton e os erros de omissão e de inclusão calculados em relação aos alvos
escuros.
Tabela 5.1 Métricas utilizadas para avaliação dos diferentes espaçamentos de pixel
67
Figura 5.6 Resultados obtidos para os diferentes espaçamentos de pixel avaliados.
As métricas calculadas (Tabela 5.1) evidenciaram que a diminuição gradativa
do espaçamento de pixel resultou em uma redução na capacidade de detecção de
68
pequenas feições, bem como modificações no contorno das feições. Esta afirmação
pôde ser constatada visualmente na Figura 5.6 e através da métrica de intersecção de
polígonos, onde foi observada uma redução acentuada do número de polígonos
detectados.
A distância euclidiana calculada a partir dos ajustes de forma, tamanho,
intensidade e posição aumentou significativamente com o aumento do espaçamento
de pixel. Este aumento foi causado pela redução gradativa de todos os ajustes, sendo
o Fitn a métrica que mais apresentou diferença em relação ao espaçamento de 50m.
Estes resultados indicaram que houve um leve deslocamento do centróide dos
polígonos (Fitxy), da intensidade média dos NC que compõe os polígonos (Fiti) e da
forma dos polígonos associados a alvos escuros e a oceano (Gforma). Entretanto, o
tamanho destes polígonos, representado pelo Fitn, foi significativamente alterado. A
análise visual dos resultados apresentados na Figura 5.6 confirmou esta métrica,
sendo possível verificar que: a) com o aumento gradativo do espaçamento de pixel
ocorreu uma perda da capacidade de detectar pequenas feições, o que gerou regiões
com ajuste nulo (item 3.3.1), indicando polígonos existentes no Phanton, mas que
deixaram de ser detectados na imagem classificada; b) o aumento da omissão de
regiões que no Phanton eram alvos escuros e na classificada viraram oceano, também
contribuiu para esta alteração no tamanho dos polígonos.
As métricas calculadas especificamente para os alvos escuros, a partir da
matriz de confusão (Tabela 5.1) reforçaram as observações acima indicando,
juntamente com o aumento do espaçamento de pixel: a) uma diminuição gradativa da
Exatidão dos Alvos Escuros e da Fração de Intersecção dos Alvos Escuros em relação
ao Phanton; b) um aumento gradativo da omissão de regiões escuras, agrupadas
erroneamente como parte do oceano. Com relação à taxa de inclusão errônea de
pixels de alvos escuros como oceano, praticamente não ocorreu variação.
Considerando que a máxima detecção de alvos escuros é essencial para
minimizar o risco de que uma possível mancha de óleo não seja detectada,
prejudicando as ações de contingenciamento o melhor espaçamento de pixel a ser
adotado seria 50m, por fornecer o maior potencial de detecção de alvos escuros.
Todavia, para que o sistema de detecção seja utilizado operacionalmente o tempo de
processamento deve ser minimizado. Os resultados obtidos indicaram que o tempo de
processamento para a imagem com 50m foi 6 vezes maior do que o tempo necessário
para processar a imagem de 100m (Tabela 5.1). Esta diferença dificultaria o uso
operacional das imagens com 50m de espaçamento de pixel uma vez que o tamanho
69
de uma cena RADARSAT completa (8413linhas x 7873colunas) é 42 vezes maior do
que o recorte de cena utilizado (1671linhas x 922colunas). Testes preliminares foram
efetuados tentando segmentar uma cena completa com 50m e o segmentador não
conseguiu concluir o processamento.
Neste contexto, a utilização do espaçamento de pixel de 100m como padrão
foi indicada por constituir uma alternativa para reduzir o tempo de processamento,
considerando a necessidade operacional da aplicação. Esta escolha também foi
influenciada pelas métricas disponíveis na Tabela 5.1, as quais indicaram que, dentre
os demais espaçamentos (150m e 200m), o de 100m foi o que conseguiu definir
melhor as bordas dos alvos escuros e detectar um maior número de pequenos alvos
quando comparado com o espaçamento de 50m. O espaçamento de 100m foi o que
ofereceu o melhor custo/benéfico, mesmo considerando que o numero de polígonos
detectados em relação ao Phanton diminuiu.
Outra evidência que reforçou a utilização do espaçamento de pixel de 100m foi
a aquisição de imagens RADARSAT também no modo ScanSAR Wide (100m), sendo
aconselhável padronizar o espaçamento de pixel de entrada das imagens.
A padronização do espaçamento de pixel em 100m também foi indicada por
diversos autores, como uma solução adequada para a detecção de óleo na superfície
do mar, por diminuir o custo computacional e funcionar como um filtro suavizando o
ruído inerente às imagens SAR (SLOGGETT & JORY, 1994; CALABRESI et al., 1999;
FISCELLA et al., 2000; DEL FRATE et al., 2000; GASULL et al., 2002; BREKKE &
SOLBERG, 2005; BENTZ, 2006; KERAMITSOGLOU et al., 2006; ). Importante
destacar que, apesar das indicações encontradas na literatura reforçarem a
padronização do espaçamento de 100m, nenhum dos trabalhos consultados mostrou
resultados comparando o ganho e a perda associado à utilização dos diferentes
espaçamentos.
70
5.2 Etapa 2: Determinação do Filtro/Janela
Para o mesmo recorte de cena utilizado na etapa anterior foram aplicados 8
filtros (Lee, Lee Enhanced, Frost, Frost Enhanced, Kuan, Gamma, Sigma e Mediana)
com 3 dimensões de janela (3x3, 5x5 e 7x7), totalizando 27
8
imagens filtradas com
diferentes janelas. Após a aplicação dos filtros no recorte RADARSAT-1 com 100m de
espaçamento de pixel - definido como mais adequado no item 5.1.2 os recortes de
cena filtrados foram: a) segmentados no software MultiSeg utilizando os mesmos
parâmetros definidos anteriormente; b) agrupados considerando a média dos NC por
limiarização, e; c) comparados através das métricas de avaliação definidas no Capítulo
3: item 3.3 em relação ao Phanton para 100m.
Após o agrupamento das regiões efetuado por limiarização, o número de alvos
escuros detectados em relação aos alvos escuros considerados como referência no
Phanton variou de 4 a 10 entre os 27 recortes de cena filtrados e 1 sem filtro.
Considerando que, para a aplicação em questão, o importante é não deixar de
detectar um possível vazamento de óleo, foram analisados os filtros que obtiveram a
máxima detecção, 10 alvos escuros (Tabela 5.2). A tabela contendo as métricas
obtidas para todas as filtragens realizadas está disponível para consulta no
APÊNDICE II.
Tabela 5.2 Métricas utilizadas para avaliação dos diferentes filtros/janela testados.
A Figura 5.7 apresenta os resultados para as segmentações, os agrupamentos
e os erros de omissão e de inclusão para o recorte de cena sem filtro e filtrado com os
filtros/janela Lee 3x3, Mediana 3x3, Sigma 3x3 e Kuan 3x3.
8
São 27 imagens porque para o filtro Gamma é necessário definir o número de Looks, no
experimento aplicamos o filtro Gamma com as 3 janelas e com 1 e 3 looks, aumentando em 3 o
número de imagens.
71
Figura 5.7 Resultados obtidos para a imagem sem filtro e com filtro Lee 3x3, Mediana 3x3,
Sigma 3x3 e Kuan 3x3.
Dentre as métricas consideradas (Tabela 5.2), o tempo de processamento não
apresentou variação significativa entre os recortes filtrados, sendo desconsiderado
como parâmetro para seleção do filtro/janela mais adequado à aplicação. As métricas
de Exatidão dos Alvos Escuros e de Fração de Intersecção de Alvos Escuros
aumentaram em relação ao recorte sem filtragem e permaneceram praticamente
estáveis para todos os filtros. O erro de omissão apresentou o mesmo comportamento,
diminuiu em relação ao recorte sem filtragem e foi praticamente o mesmo para todos
72
os resultados (0,06%). O erro de inclusão aumentou para os recortes filtrados,
permanecendo estável entre os filtros analisados (0,24%). Considerando aos ajustes
de forma (Gforma), tamanho (Fitn), intensidade (Fiti) e posição (Fitxy) é interessante
notar que a aplicação do filtro melhorou os ajustes de forma (Gforma) e de tamanho
(Fitn) em relação ao Phanton e piorou os ajustes de posição e de intensidade dos NC.
Como a melhoria dos ajustes prevaleceu, a Distância Euclidiana foi bem menor para
as imagens filtradas, indicando que a aplicação do filtro na etapa de pré-
processamento das imagens pode ser padronizada em sistema automático. Outro
resultado que reforça a utilização de filtragem é que, embora a diminuição do
espaçamento de pixel tenha reduzido o potencial de detecção dos alvos escuros
verificado no item 5.1.2, a aplicação de filtragem aumentou de 7 para 10 o número de
alvos escuros detectados em relação ao Phanton.
Embora as menores distâncias euclidianas (0,28) tenham sido verificadas para
os filtros Lee (3x3) e Mediana (3x3), as métricas variaram muito pouco entre os 4
melhores filtros indicados, sendo a determinação do melhor filtro a ser utilizado como
padrão no sistema automático injusta considerando somente as métricas indicadas.
Desta forma, considerando a extensa literatura consultada sobre sistemas de
detecção automática de óleo, foi constatado que o filtro mais comumente utilizado na
etapa de pré-processamento das imagens é o Lee (BJERDE et al., 1993;
KARATHANASSI et al., 2006; STATHAKIS et al., 2006; BENTZ, 2006; TOPOUZELIS
et al., 2007a e 2007b; HANG et al., 2009, TOPOUZELIS et al., 2009). O filtro de
Mediana foi utilizado em três das referências consultadas (MIRANDA et al., 2004;
CHANG et al., 2005; HANG et al., 2009), sendo que em uma delas o filtro de Mediana
foi combinado com o filtro Lee (HANG et al., 2009). O filtro Kuan foi utilizado em
ZHENG et al. (2005). No fluxograma disponível no APÊNDICE I é possível verificar a
diversidade de filtros utilizados pelos diferentes autores na etapa de pré-
processamento.
Esta avaliação da influência dos diferentes filtros no potencial de detecção de
alvos escuros nas imagens foi realizada apenas com um recorte de cena e pode ser
que outros tipos de alvos apresentem resultado diferenciado. A fim de embasar com
maior robustez uma decisão sobre a utilizão ou não de filtragem como um
procedimento padrão no pré-processamento das imagens, as análises efetuadas para
determinação do segmentador mais adequado consideraram diferentes alvos, todos
segmentados com e sem filtragem, sendo adotado o filtro Lee (3x3), indicado como o
mais adequado.
73
5.3 Etapa 3: Determinação do Segmentador
Para determinação do segmentador a ser utilizado como padrão no sistema de
detecção automática de alvos escuros foram selecionados 11 recortes de cena
RADARSAT contendo alvos escuros com dimensões, geometria e textura variados.
Estes recortes de cenas com espaçamento de pixel de 100m sem filtragem e pré-
processados com o filtro/janela Lee/3x3 parâmetros determinados nas etapas
anteriores - foram segmentados nos softwares MultiSeg e SPRING, resultando em 44
processamentos. Para cada um destes recortes foram elaborados manualmente os
Phantons, imagens de referência utilizadas para a avaliação comparativa dos
resultados produzidos. As regiões escuras e claras resultantes destas 44
segmentações foram agrupadas em alvos escuros e oceano, utilizando a técnica de
limiarização, onde para cada imagem um limiar de corte foi definido interativamente
pelo intérprete a fim de retornar o melhor resultado. Os alvos escuros resultantes do
agrupamento das regiões escuras produzidas na segmentação foram avaliados
comparativamente com os alvos escuros indicados como referência no Phanton,
considerando as mesmas métricas de avaliação utilizadas nos itens anteriores.
A Figura 5.8 apresenta: a) os recortes de cena RADARSAT utilizados; b) os
Phantons elaborados manualmente para cada recorte de cena; c) o histograma para
os alvos escuros; d) o tamanho de cada recorte de cena (linhas x colunas); e) o NC
indicado como limiar de corte utilizado no agrupamento definido interativamente,
considerando os recortes de cena com e sem filtragem, e; f) a média e o desvio
padrão dos alvos escuros.
Figura 5.8 - Recortes de cena utilizados juntamente com os Phantons elaborados manualmente
indicando os alvos escuros de referência.
74
Figura 5.8 (Continuação) - Recortes de cena utilizados juntamente com os Phantons
elaborados manualmente indicando os alvos escuros de referência.
75
Figura 5.8 (Continuação) - Recortes de cena utilizados juntamente com os Phantons
elaborados manualmente indicando os alvos escuros de referência.
Para realizar as segmentações o software MultiSeg exige como parâmetros de
entrada a Área Mínima (AM) em pixels, o Número Equivalente de Looks (Nel) e o
76
Limiar de Similaridade (LS). A AM está atrelada ao espaçamento de pixel da imagem e
foi definida nas etapas anteriores como 25 pixels para o espaçamento de 100m, o Nel
foi definido como 4 e o LS foi calculado em dB para cada recorte de cena com e sem
filtro de acordo com o método proposto no item 5.1.1. O software SPRING exige como
parâmetros de entrada a AM em pixels, a mesma utilizada para o MultiSeg e o LS,
calculado com o mesmo método em amplitude (0~255).
A Tabela 5.3 apresenta para todas as cenas estudadas com e sem filtro: a) a
média dos NC em amplitude para as regiões claras e escuras amostradas pelo buffer
ao redor da borda dos alvos escuros; b) os valores em amplitude para o quartil dos
alvos escuros e para o quartil do oceano extraídos do box plot calculado, e; c) o LS
calculado com base no box plot para o SPRING e para o MultiSeg.
Tabela 5.3 Variáveis calculadas com a amostragem do buffer e LS calculados para o
SPRING e para o MultiSeg, considerando a diferença entre os quartis do box plot.
A Tabela 5.4 apresenta os resultados obtidos para os 44 processamentos
realizados com e sem filtro para a determinação do segmentador mais adequado.
77
Tabela 5.4 Métricas utilizadas para avaliação dos diferentes segmentadores aplicados nos
recortes de cena com e sem filtragem.
A Figura 5.9 apresenta os gráficos comparando as métricas de ajuste entre
regiões e de matriz de confusão, ambas calculadas para os segmentadores MultiSeg e
SPRING com e sem a aplicação de filtro.
78
Figura 5.9 - Gráficos comparando as métricas calculadas para os segmentadores MultiSeg e
SPRING com e sem a aplicação de filtro.
Exatidão dos AEscuros considerando os Segmentadores
MultiSeg e SPRING sem Filtragem
0,57
0,80
0,31
0,87
0,64
0,49
0,28
0,43
0,53
0,26
0,80
0,60
0,47
0,26
0,78
0,62
0,50
0,79
0,46
0,50
0,00
0,25
0,50
0,75
1,00
Cena 1 Cena 2 Cena 3 Cena 4 Cena 5 Cena 6 Cena 7 Cena 8 Cena 9 Cena 10 Cena 11
Cenas
Percentual de Exatidão
Exatidão dos AEscuros MultiSeg Exatidão dos AEscuros SPRING
Exatidão dos AEscuros considerando os Segmentadores MultiSeg
e SPRING com Filtragem
0,62
0,75
0,50
0,51
0,61
0,27
0,86
0,67
0,32
0,57
0,75
0,30
0,68
0,80
0,30
0,58
0,52
0,46
0,78
0,61
0,00
0,25
0,50
0,75
1,00
Cena 1 Cena 2 Cena 3 Cena 4 Cena 5 Cena 6 Cena 7 Cena 8 Cena 9 Cena 10 Cena 11
Cenas
Percentual de Exatidão
Exatidão dos AEscuros MultiSeg Exatidão dos AEscuros SPRING
FIntersecção dos AEscuros considerando os Segmentadores
MultiSeg e SPRING sem Filtragem
0,73
0,66
0,92
0,68
0,59
0,35
0,26
0,27
0,51
0,63
0,83
0,44
0,54
0,82
0,88
0,32
0,63
0,55
0,48
0,84
0,70
0,00
0,25
0,50
0,75
1,00
Cena 1 Cena 2 Cena 3 Cena 4 Cena 5 Cena 6 Cena 7 Cena 8 Cena 9 Cena 10 Cena 11
Cenas
Percentual de Exatidão
FIntersecção dos AEscuros MultiSeg FIntersecção dos AEscuros SPRING
FIntersecção dos AEscuros considerando os Segmentadores
MultiSeg e SPRING com Filtragem
0,82
0,30
0,52
0,59
0,76
0,90
0,40
0,71
0,34
0,74
0,94
0,82
0,68
0,56
0,48
0,73
0,95
0,28
0,81
0,79
0,00
0,25
0,50
0,75
1,00
Cena 1 Cena 2 Cena 3 Cena 4 Cena 5 Cena 6 Cena 7 Cena 8 Cena 9 Cena 10 Cena 11
Cenas
Percentual de Exatidão
FIntersecção dos AEscuros MultiSeg FIntersecção dos AEscuros SPRING
Omissão considerando os Segmentadores MultiSeg e SPRING
sem Filtragem
0,27
0,56
0,46
0,74
0,18
0,37
0,49
0,73
0,12
0,17
0,34
0,30
0,16
0,52
0,45
0,37
0,68
0,08
0,32
0,41
0,65
0,00
0,25
0,50
0,75
1,00
Cena 1 Cena 2 Cena 3 Cena 4 Cena 5 Cena 6 Cena 7 Cena 8 Cena 9 Cena 10 Cena 11
Cenas
Percentual de Omissão
Omissão MultiSeg Omissão SPRING
Omissão considerando os Segmentadores MultiSeg e SPRING com
Filtragem
0,27
0,52
0,44
0,32
0,70
0,18
0,06
0,66
0,29
0,18
0,26
0,60
0,05
0,10
0,72
0,24
0,41
0,48
0,21
0,19
0,00
0,25
0,50
0,75
1,00
Cena 1 Cena 2 Cena 3 Cena 4 Cena 5 Cena 6 Cena 7 Cena 8 Cena 9 Cena 10 Cena 11
Cenas
Percentual de Omissão
Omissão MultiSeg Omissão SPRING
Incluo considerando os Segmentadores MultiSeg e SPRING
sem Filtragem
0,19
0,03
0,00
0,05
0,08
0,11
0,26
0,03
0,07
0,12
0,19
0,21
0,06
0,02
0,16
0,02
0,09
0,09
0,07
0,03
0,07
0,13
0,00
0,25
0,50
Cena 1 Cena 2 Cena 3 Cena 4 Cena 5 Cena 6 Cena 7 Cena 8 Cena 9 Cena 10 Cena 11
Cenas
Percentual de Inclusão
Inclusão MultiSeg Inclusão SPRING
Incluo considerando os Segmentadores MultiSeg e SPRING com
Filtragem
0,29
0,15
0,24
0,02
0,05
0,29
0,10
0,23
0,03
0,06
0,15
0,25
0,08
0,24
0,02
0,00
0,18
0,08
0,19
0,23
0,04
0,07
0,00
0,25
0,50
Cena 1 Cena 2 Cena 3 Cena 4 Cena 5 Cena 6 Cena 7 Cena 8 Cena 9 Cena 10 Cena 11
Cenas
Percentual de Inclusão
Inclusão MultiSeg Inclusão SPRING
79
Figura 5.9 (Continuação) Gráficos comparando as métricas calculadas para os
segmentadores MultiSeg e SPRING com e sem a aplicação de filtro.
Intersecção de Alvos Escuros Detectados considerando os
Segmentadores MultiSeg e SPRING sem Filtragem
0,57
0,36
0,53
0,36
1,00
0,67
0,50
0,25
0,32
0,21
0,41
0,67
0,61
0,93
1,00
0,57
0,50
1,00
0,78
0,67
0,00
0,25
0,50
0,75
1,00
Cena 1 Cena 2 Cena 3 Cena 4 Cena 5 Cena 6 Cena 7 Cena 8 Cena 9 Cena 10 Cena 11
Cenas
Detecção Polígonos
Detecção MultiSeg Detecção SPRING
Intersecção de Alvos Escuros Detectados considerando os
Segmentadores MultiSeg e SPRING com Filtragem
0,62
0,61
0,58
0,90
0,53
0,40
0,80
0,17
0,38
0,29
0,50
0,67
0,93
1,00
0,41
0,57
1,00
1,00
0,00
0,25
0,50
0,75
1,00
Cena 1 Cena 2 Cena 3 Cena 4 Cena 5 Cena 6 Cena 7 Cena 8 Cena 9 Cena 10 Cena 11
Cenas
Detecção Polígonos
Detecção MultiSeg Detecção SPRING
Gforma considerando os Segmentadores MultiSeg e SPRING sem
Filtragem
0,96
0,70
0,77
0,95
0,97
0,77
0,88
0,73
0,68
0,78
0,51
0,95
0,93
0,76
0,86
0,89
0,68
0,72
0,77
0,54
0,92
0,00
0,25
0,50
0,75
1,00
1,25
Cena 1 Cena 2 Cena 3 Cena 4 Cena 5 Cena 6 Cena 7 Cena 8 Cena 9 Cena 10 Cena 11
Cenas
Percentual de Exatidão
Gforma MultiSeg Gforma SPRING
Gforma dos AEscuros considerando os Segmentadores MultiSeg e
SPRING com Filtragem
0,96
0,92
0,78
0,69
0,89
0,92
0,71
0,94
0,97
0,66
0,50
0,78
0,82
0,95
0,92
0,66
0,68
0,76
0,71
0,54
0,93
0,00
0,25
0,50
0,75
1,00
1,25
Cena 1 Cena 2 Cena 3 Cena 4 Cena 5 Cena 6 Cena 7 Cena 8 Cena 9 Cena 10 Cena 11
Cenas
Percentual de Exatidão
Gforma MultiSeg Gforma SPRING
Fitxy considerando os Segmentadores MultiSeg e SPRING sem
Filtragem
0,92
0,88
0,88
0,81
0,76
0,85
0,87
0,93
0,85
0,90
0,87
0,81
0,94
0,82
0,95
0,83
0,92
0,84
0,00
0,25
0,50
0,75
1,00
Cena 1 Cena 2 Cena 3 Cena 4 Cena 5 Cena 6 Cena 7 Cena 8 Cena 9 Cena 10 Cena 11
Cenas
Percentual de Exatidão
Fitxy MultiSeg Fitxy SPRING
Fitxy dos AEscuros considerando os Segmentadores MultiSeg e
SPRING com Filtragem
0,94
0,85
0,88
0,81
0,82
0,90
0,86
0,77
0,88
0,82
0,95
0,88
0,82
0,88
0,92
0,81
0,90
0,82
0,85
0,92
0,00
0,25
0,50
0,75
1,00
Cena 1 Cena 2 Cena 3 Cena 4 Cena 5 Cena 6 Cena 7 Cena 8 Cena 9 Cena 10 Cena 11
Cenas
Percentual de Exatidão
Fitxy MultiSeg Fitxy SPRING
Fiti considerando os Segmentadores MultiSeg e SPRING sem
Filtragem
0,91
0,82
0,86
0,90
0,74
0,89
0,88
0,83
0,87
0,97
0,97
0,94
0,88
0,96
0,90
0,89
0,87
0,84
0,96
0,00
0,25
0,50
0,75
1,00
Cena 1 Cena 2 Cena 3 Cena 4 Cena 5 Cena 6 Cena 7 Cena 8 Cena 9 Cena 10 Cena 11
Cenas
Percentual de Exatidão
Fiti MultiSeg Fiti SPRING
Fiti dos AEscuros considerando os Segmentadores MultiSeg e
SPRING com Filtragem
0,94
0,85
0,73
0,91
0,97
0,69
0,87
0,93
0,87
0,81
0,52
0,81
0,92
0,87
0,84
0,88
0,88
0,91
0,90
0,96
0,97
0,89
0,00
0,25
0,50
0,75
1,00
Cena 1 Cena 2 Cena 3 Cena 4 Cena 5 Cena 6 Cena 7 Cena 8 Cena 9 Cena 10 Cena 11
Cenas
Percentual de Exatidão
Fiti MultiSeg Fiti SPRING
80
Figura 5.9 (Continuação) Gráficos comparando as tricas calculadas para os
segmentadores MultiSeg e SPRING com e sem a aplicação de filtro.
Com base nos resultados apresentados, primeiramente foi avaliado o efeito da
aplicação do filtro/janela Lee/3x3 no potencial de detecção de alvos escuros nas
imagens SAR e, posteriormente, foi avaliada a performance dos segmentadores
MultiSeg e SPRING. Considerando as métricas referentes à Exatidão dos Alvos
Escuros, à Fração de Intersecção de Alvos Escuros, Intersecção de Polígonos,
Gforma, Fitxy, Fiti e Fitn, quanto maior o valor obtido, sendo mais próximo de 1,
melhor o resultado. Para as métricas de Omissão, Inclusão e Distância Euclidiana
quanto menor o valor obtido melhor o resultado.
O critério para a avaliação do efeito da aplicação do filtro/janela Lee/3X3 nos
recortes de cena estudados considerou que a detecção de alvos escuros melhorou
com a aplicação do filtro nos casos em que: a) houve um aumento no número de alvos
escuros detectados após a aplicação do filtro, e; b) o número de alvos escuros
permaneceu o mesmo e pelo menos uma das demais métricas de avaliação melhorou.
A aplicação do filtro teve um efeito considerado nulo, ou neutro, nos casos em que o
número de alvos escuros detectados não foi alterado mesmo que as demais métricas
de avaliação tenham piorado. O critério considerou que a aplicação do filtro piorou os
Fitn considerando os Segmentadores MultiSeg e SPRING sem
Filtragem
0,63
0,41
0,19
0,33
0,15
0,12
0,36
0,37
0,29
0,09
0,07
0,10
0,17
0,31
0,24
0,14
0,40
0,38
0,36
0,29
0,61
0,00
0,25
0,50
0,75
1,00
Cena 1 Cena 2 Cena 3 Cena 4 Cena 5 Cena 6 Cena 7 Cena 8 Cena 9 Cena 10 Cena 11
Cenas
Percentual de Exatidão
Fitn MultiSeg Fitn SPRING
Fitn dos AEscuros considerando os Segmentadores MultiSeg e
SPRING com Filtragem
0,43
0,19
0,96
0,14
0,32
0,46
0,16
0,12
0,39
0,11
0,06
0,38
0,30
0,29
0,66
0,10
0,31
0,10
0,60
0,37
0,40
0,00
0,25
0,50
0,75
1,00
Cena 1 Cena 2 Cena 3 Cena 4 Cena 5 Cena 6 Cena 7 Cena 8 Cena 9 Cena 10 Cena 11
Cenas
Percentual de Exatidão
Fitn MultiSeg Fitn SPRING
Dist. Euclidiana considerando os Segmentadores MultiSeg e
SPRING sem Filtragem
0,93
0,71
0,71
0,71
0,80
0,98
0,93
0,76
0,72
0,87
0,62
0,69
0,79
0,61
0,88
0,92
0,85
0,74
0,92
0,69
0,69
0,78
0,00
0,25
0,50
0,75
1,00
Cena 1 Cena 2 Cena 3 Cena 4 Cena 5 Cena 6 Cena 7 Cena 8 Cena 9 Cena 10 Cena 11
Cenas
Percentual de Exatidão
Dist. Euclidiana MultiSeg Dist. Euclidiana SPRING
Dist. Euclidiana dos AEscuros considerando os Segmentadores
MultiSeg e SPRING com Filtragem
0,83
0,75
0,72
0,96
0,91
0,73
0,65
0,93
0,61
0,68
0,28
0,69
0,98
0,91
0,86
0,96
0,69
0,73
0,71
0,78
0,88
0,00
0,25
0,50
0,75
1,00
Cena 1 Cena 2 Cena 3 Cena 4 Cena 5 Cena 6 Cena 7 Cena 8 Cena 9 Cena 10 Cena 11
Cenas
Percentual de Exatidão
Dist. Euclidiana MultiSeg Dist. Euclidiana SPRING
81
resultados nos casos em que houve uma diminuição no número de alvos escuros
detectados, mesmo que as demais métricas de avaliação tenham melhorado. A
Tabela 5.5 apresenta a ntese dos resultados obtidos por recorte de cena estudado
após a aplicação do filtro.
Tabela 5.5 - Síntese dos resultados obtidos para as métricas de avaliação por recorte de cena
estudado após a aplicação do filtro Lee/3X3.
De acordo com os resultados apresentados a aplicação do filtro antes da
segmentação das imagens melhorou a detecção de alvos escuros nas imagens de
RADAR na maioria dos casos. Para o software MultiSeg, 7 dentre os 11 recortes de
cena processados tiveram a qualidade da detecção melhorada após a aplicação do
filtro, 2 tiveram efeito neutro e em 2 casos o efeito foi negativo. Para o software
SPRING, 7 dentre os 11 recortes de cena processados tiveram a qualidade da
detecção melhorada após a aplicação do filtro, 3 casos tiveram efeito negativo e em 1
caso a aplicação do filtro não influenciou nos resultados. A Figura 5.10 apresenta um
gráfico com a síntese dos resultados por software.
82
Figura 5.10 Efeito da aplicação do Filtro Lee (3X3) no Potencial de Detecção de Alvos
Escuros para os softwares utilizados.
Para validar os resultados obtidos o teste estatístico não paramétrico de
Wilcox foi efetuado para verificar se a diferença entre as métricas de avaliação para os
processamentos realizados para cada segmentador, com e sem filtragem, foi
estatisticamente significativa. Valores de p<0,05 indicam que as variáveis comparadas
são estatisticamente diferentes e, conseqüentemente, a aplicação ou não de filtragem
no pré-processamento das imagens SAR influenciou na detecção de alvos escuros. A
Tabela 5.6 disponibiliza o teste de Wilcox efetuado para os resultados obtidos com o
segmentador MultiSeg com e sem filtragem e a Tabela 5.7 disponibiliza os resultados
obtidos com o segmentador SPRING com e sem filtragem.
De acordo com os testes, dentre as 6 métricas de avaliação obtidas para o
segmentador MultiSeg e para o segmentador SPRING, 3 foram consideradas
estatisticamente diferentes comparando a aplicação ou não de filtragem na etapa de
pré-processamento. Desta forma, para as métricas de erros de inclusão, erros de
omissão e fração de intersecção dos alvos escuros, a aplicação do filtro faz diferença.
Como o resultado da análise das métricas indicou que tanto para o MultiSeg, quanto
para o SPRING a aplicação do filtro/janela Lee/3X3, na maioria dos recortes de cena
utilizados, melhorou ou não alterou a detecção dos alvos escuros, optou-se por
padronizar a aplicação do filtro Lee 3x3 na etapa de pré-processamento.
Efeito da Aplicação do Filtro Lee (3X3) no Potencial de
Detecção de Alvos Escuros
2
3
7
7
2
1
0
5
10
MultiSeg SPRING
Softwares Avaliados
Frequência
o Alterou Melhorou Piorou
23%
64%
14%
83
Tabela 5.6 - Teste de Wilcox efetuado para os resultados obtidos com o segmentador MultiSeg
com e sem filtragem.
Tabela 5.7 - Teste de Wilcox efetuado para os resultados obtidos com o segmentador SPRING
com e sem filtragem.
Numa segunda fase foi avaliado o segmentador mais adequado considerando
apenas os processamentos efetuados nos softwares MultiSeg e SPRING com
aplicação de filtragem, uma vez que este procedimento foi indicado como padrão para
o pré-processamento das imagens SAR.
O número de polígonos detectados foi o mesmo para os 2 softwares em 4
situações e em apenas em 1 caso o MultiSeg teve um desempenho melhor que o
SPRING. Para a Fração de Intersecção dos Alvos Escuros, em 6 casos o SPRING
forneceu as maiores taxas, em 3 situações os resultados foram iguais para os 2
softwares e em 2 o MultiSeg superou o SPRING (Figuras 5.10 e 5.11).
As menores taxas de Omissão foram obtidas pelo software SPRING em 6 das
11 situações analisadas. A Distância Euclidiana foi menor em 8 das 11 situações para
o software SPRING. Importante destacar que embora o SPRING tenha omitido menos
regiões escuras ele incluiu uma maior taxa de regiões claras erroneamente como
alvos escuros em relação ao MultiSeg. O MultiSeg obteve os menores índices de
inclusão errônea de regiões de oceano como alvos escuros, sendo melhor que o
SPRING em 9 das 11 situações analisadas, todavia omitiu mais regiões escuras do
que o SPRING.
84
Considerando as métricas por ajuste de regiões, os resultados do MultiSeg
apresentaram menor ajuste de posição (Fitxy), de tamanho (Fitn) e de intensidade
(Fiti). Entretanto o ajuste de forma (Gforma) foi melhor em relação ao SPRING,
provavelmente porque o MultiSeg incluiu erroneamente menos regiões de oceano, o
que melhorou seu ajuste de forma em relação ao Phanton.
Para a aplicação em questão o importante é não deixar de detectar um alvo
escuro, sendo as métricas de número de polígonos detectados e taxa de omissão
quesitos mais importantes do que a métrica de inclusão. Como o crítico é deixar de
identificar uma possível emergência ambiental os erros de inclusão foram
considerados toleráveis e os resultados obtidos indicaram o segmentador do software
SPRING como mais adequado por apresentar as maiores taxas de detecção de alvos
escuros e as menores taxas de omissão em relação ao MultiSeg. A Figura 5.11
sintetiza os resultados obtidos para o agrupamento das regiões resultantes das
segmentações realizadas nos softwares SPRING e MultiSeg.
Figura 5.11 Síntese dos resultados obtidos para o agrupamento das segmentações
realizadas nos softwares SPRING e MultiSeg.
A Figura 5.12 apresenta a visualização dos resultados do agrupamento das
regiões escuras e claras em alvos escuros e oceano após as segmentações
realizadas nos softwares SPRING e MultiSeg com e sem filtragem.
Métricas de Avaliaçao Calculadas para as
Segmentações realizadas no SPRING e no MultiSeg
4
1
6
4
4
3
6
3
2
0
5
10
MultiSeg = SPRING MultiSeg > SPRING SPRING >MultiSeg
Softwares Avaliados
Exatidão de AEscuros
FIntersecção de AEscuros
No de Regiões Escuras Detectadas
tricas de Avaliaçao Calculadas para as
Segmentações realizadas no SPRING e no MultiSeg
3
2
6
1
10
0
2
2
7
0
5
10
15
MultiSeg = SPRING MultiSeg < SPRING SPRING <MultiSeg
Softwares Avaliados
Omissão Inclusão Distância Euclidiana
85
Figura 5.12 Resultados do agrupamento das segmentações realizadas para os diferentes
recortes de cena com e sem filtragem para os softwares SPRING e MultiSeg.
86
Figura 5.12 (Continuação) Resultados do agrupamento das segmentações realizadas para os
diferentes recortes de cena com e sem filtragem para os softwares SPRING e MultiSeg.
87
Figura 5.12 (Continuação) Resultados do agrupamento das segmentações realizadas para os
diferentes recortes de cena com e sem filtragem para os softwares SPRING e MultiSeg.
A análise visual dos resultados obtidos para as cenas processadas com e sem
filtro, utilizando os 2 segmentadores, reforçou que a aplicação de filtragem nas
imagens melhora ou, praticamente não influencia na detecção de alvos escuros, para
a maioria dos casos. A diminuição do ruído após a passagem do filtro foi perceptível
visualmente no resultado final do agrupamento das segmentações para alguns
exemplos.
Comparando-se visualmente os resultados obtidos pelos processamentos com
filtragem realizados para os 2 segmentadores para cada recorte de cena estudado, foi
identificado que em 6 casos o SPRING forneceu a geometria dos alvos escuros com
maior semelhança em relação aos Phantons. O MultiSeg foi visualmente melhor em 5
casos. Desta forma, embora a análise das métricas de avaliação tenha indicado o
SPRING como o segmentador mais adequado, a análise visual indica que tanto o
SPRING como o MultiSeg foram eficazes na detecção dos alvos escuros em imagens
SAR. Esta percepção foi reforçada pelo teste de Wilcox (Tabela 5.8), o qual
evidenciou que não diferença estatisticamente significativa entre as métricas de
avaliação obtidas para os dois segmentadores.
Considerando o escopo da aplicação em questão para todos os casos, as
diferenças verificadas não afetariam as ações de resposta, pois, com maior ou menor
precisão, alvos escuros foram identificados e uma verificação de campo poderia ser
acionada mesmo que os pequenos alvos não tivessem sido detectados. Estas
evidências levariam a conclusão de que os segmentadores testados são equivalentes
e tanto faz escolher um ou outro como mais adequado. Todavia, a acurácia da
geometria obtida na etapa de detecção de alvos escuros influencia diretamente na
eficácia do processo de classificação em um sistema de detecção automática de óleo
e ocorrências ambientais. Neste contexto o SPRING forneceu as maiores taxas de
88
detecção de números de polígonos, ou seja, de alvos escuros, bem como, as menores
Distâncias Euclidianas para as métricas de ajuste em relação aos Phantons.
Tabela 5.8 - Teste de Wilcox efetuado para os resultados obtidos com o segmentador MultiSeg
e SPRING com filtragem.
Portanto, apesar da proximidade dos resultados obtidos para ambos os
segmentadores, o segmentador que detectou as regiões escuras nos recortes de
cenas processados com maior proximidade das referências elaboradas nos Phantons
foi o SPRING. Este resultado não era esperado, a medida que o SPRING é um
segmentador desenvolvido com foco em imagens ópticas e o MultiSeg possui um
módulo específico para imagens de RADAR. Provavelmente este fato ocorreu porque
os recortes de cena utilizados perderam as características típicas de uma imagem
RADAR devido a compressão realizada pelo formato MrSid, fato evidenciado no item
4.1. Embora os resultados apresentados sejam um primeiro indicativo, não são
conclusivos quanto à indicação do segmentador mais adequado para a detecção
automática de regiões escuras em imagens SAR. Para as demais etapas da tese o
segmentador SPRING será utilizado para testar os diferentes métodos de
clusterização, uma vez que apresentou resultados melhores em relação ao MultiSeg.
O tempo de processamento foi outra evidência que reforçou esta escolha, sendo
menor para o SPRING em 8 dos 11 recortes de cena processados.
Como seria inviável reprocessar todos os dados novamente nesta etapa da
tese, a perspectiva futura é testar o segmentador MultiSeg em seu modo para
imagens ópticas, comparando com os resultados do SPRING.
89
5.4 Etapa 4: Determinação do Método de Clusterização
Nesta etapa da tese o objetivo foi avaliar a performance de técnicas
automáticas de clusterização aplicadas à detecção de alvos escuros em imagens
SAR. Neste contexto, a utilização de regiões, ao invés de pixels, possibilitou o cálculo
e a associação de atributos diversos aos segmentos, ampliando significativamente as
possibilidades de investigação e de resultados passíveis de serem obtidos através da
clusterização (BAATZ et al., 2003). Esta abordagem difere das metodologias
disponíveis na literatura (APÊNDICE I), as quais utilizam o cálculo de diferentes
atributos somente na etapa de classificação dos alvos em óleo ou assemelhados e
não no agrupamento dos alvos escuros (TOPOUZELIS, 2008; KERAMITSOGLOU et
al., 2006; BREKKE & SOLBERG, 2005).
Conforme detalhado no Capítulo 3 (item 3.2), o processo de agrupamento ou
clusterização pode ser considerado como uma “classificação” não supervisionada de
padrões reconhecidos no conjunto de dados analisado. O reconhecimento destes
padrões, intrínsecos ao espaço n-dimensional de atributos, é efetuado
automaticamente pelo algoritmo sem o auxílio de amostras previamente classificadas
ou de informações sobre o conjunto de dados (CHEN et al., 1996; JAIN et al.,1999).
Desta forma, o processo de clusterização consiste numa metodologia capaz de
explorar automaticamente a inter-relação existente entre o conjunto de atributos,
reconhecendo padrões e agrupando-os, respectivamente, em diferentes grupos ou
clusters de acordo com um critério de similaridade previamente definido.
As etapas integrantes de uma análise de clusterização são (JAIN & DUBES,
1988; JAIN et al.,1999): a) o cálculo e a seleção de atributos; b) o reconhecimento de
padrões; c) a clusterização considerando os padrões reconhecidos; d) a abstração dos
resultados obtidos; e) a avaliação dos resultados e a validação do método indicado.
Tendo como base os itens componentes de uma típica análise de
clusterização, a metodologia proposta foi dividida em 4 etapas: (Etapa I) cálculo de
diferentes atributos, seguido da análise exploratória e da seleção dos atributos mais
indicados para a detecção de alvos escuros; (Etapa II) experimentos de clusterização
para extração de um conjunto de atributos padrão, o qual propicie a melhor predição
automática possível para delinear a geometria dos avos escuros; (Etapa III)
determinação do método padrão, definindo, o conjunto adequado de atributos, o
método de clusterização adequado e uma regra de decisão que possibilite a
automatização do sistema, e; (Etapa IV) validação dos resultados e do método
90
proposto com a utilizão de um novo conjunto de dados. A Figura 5.13 ilustra de
maneira sintética as etapas da metodologia proposta nesta última etapa da tese.
Figura 5.13 Etapas integrantes da metodologia proposta nesta última etapa da tese.
Como não um consenso entre os pesquisadores sobre qual abordagem,
manual, semi-automática ou automática, representa o melhor custo/benefício para
operacionalizar a detecção de óleo e assemelhados em imagens SAR (SOLBERG &
BREKKE, 2008; TOPOUZELIS, 2008; SEASAR, 2010), uma comparação entre estas
diferentes abordagens foi realizada para definir com maior rigor o procedimento mais
eficaz.
5.4.1 Cálculo dos Atributos
Dentre as etapas integrantes do processo de clusterização (item 5.4), o cálculo
juntamente com a seleção de atributos, é considerada a etapa mais importante (JAIL
et al., 1999). A qualidade dos resultados da clusterização é completamente
dependente da qualidade dos dados de entrada, o que confere importância estratégica
à definição do conjunto de atributos (TOPOUZELIS, 2008; SOLBERG & BREKKE,
2008; STATHAKIS et al., 2006; BENTZ, 2006).
O cálculo de atributos, denominado feature extraction” na literatura
especializada, consiste na conversão ou transformação dos dados de entrada em
novos atributos, inserindo novas dimensões no espaço de atributos. Esta maior
variabilidade dos dados de entrada confere ao clusterizador mais possibilidades de
investigação e de combinações para convergir e encontrar uma solução ótima para o
problema estudado.
Os atributos freqüentemente utilizados na etapa de classificação de óleo e
assemelhados são agrupados em 4 categorias (BENTZ et al., 2009; TOPOUZELIS,
2008; STATHAKIS et al., 2006; KARATHANASSI et al., 2006; MONTALI et al., 2006;
BENTZ, 2006; BREKKE & SOLBERG, 2005; MARGHANY, 2001; DEL FRATE et al.,
2000; FISCELLA et al., 2000; TOPOUZELIS et al., 2000; ESPEDAL, 1999; SOLBERG,
1999; SOLBERG & VOLDEN, 1997): a) Espectrais ou Estatísticos: extraídos a partir
dos NC das imagens de satélite; b) Geométricos: extraídos da própria geometria dos
91
polígonos delineados pela segmentação sendo divididos em genéricos/poligonais e
skeletons. Os geométricos genéricos/poligonais constituem métricas extraídas dos
polígonos como um todo como área, perímetro, dentre outras. Os skeletons são
métricas que indicam a estrutura interna dos polígonos, sendo calculadas a partir de
uma triangulação efetuada internamente a partir das bordas dos polígonos, utilizando
o método de Delaunay (BAATZ et al., 2003); c) Texturais: calculados a partir da matriz
de co-ocorrência dos níveis de cinza (HARALICK et al., 1979), indicando a correlação
espacial existente entre pixels vizinhos, e; d) Contextuais: relacionados com o cenário
existente no momento da aquisição da imagem (ex: proximidade dos alvos de
interesse de fontes poluidoras como plataformas, dutos e/ou embarcações, dentre
outros). Atributos contextuais e relacionados à heterogeneidade e ao contraste dos
alvos escuros em relação ao oceano não foram utilizados considerando que, nesta
etapa da tese, a localização e a dimensão dos alvos escuros não são conhecidas.
Desta forma, para cada região clara ou escura individualizada no processo de
segmentação, 36 atributos foram calculados tendo como base os 11 recortes de cena
pré-processados com o filtro Lee 3X3
9
. Dos 36 atributos, 16 foram calculados a partir
da sobreposição das regiões sobre os pixels da imagem, sendo 8 estatísticos e 8
texturais, e 20 foram calculados a partir das propriedades geométricas dos polígonos
resultantes das segmentações. Detalhamento técnico sobre a definição dos atributos
geométricos pode ser encontrado no manual do DEFINIENS (2006) e sobre os
atributos texturais em HARALICK et al. (1973, 1979).
Os atributos estatísticos - calculados no Matlab - e os texturais e geométricos -
calculados no Definiens - foram exportados no formato tabular e compatibilizados em
um mesmo arquivo através de identificadores únicos associados a cada região. Os
atributos foram normalizados, sendo cada valor obtido para um determinado atributo
em uma região, subtraído pelo mínimo valor obtido e dividido pela diferença entre o
máximo e o mínimo.
Para que os processamentos fossem controlados, a análise exploratória, a
seleção dos atributos e a avaliação dos resultados obtidos pelas clusterizações foram
efetuadas considerando a geometria dos Phantons como referência. A proposta
considerou que, avaliando os atributos em relação a uma verdade previamente
conhecida, seria possível identificar com maior eficácia o conjunto de dados mais
adequado para retornar clusters representativos e, conseqüentemente, mais similares
às imagens de referência (Phantons).
9
Detalhes sobre o formato dos dados utilizados estão disponíveis no Capítulo 4: item 4.1.
92
Para tal foi necessário criar um atributo categórico dependente denominado
Classe do Phanton. Este atributo foi calculado, com o objetivo de associar a cada
região resultante da segmentação, um código indicando a sua localização em relação
aos alvos escuros ou ao oceano definidos no Phanton. Entretanto, em imagens SAR, o
limiar que separa um alvo escuro do oceano não é exato (ZHENG et al., 2005), as
bordas não apresentam contornos bem definidos, conseqüentemente, a sobreposição
dos limites das regiões resultantes das segmentações não necessariamente coincide
com o limite das regiões definidas no Phanton. Desta forma, tanto o Phanton
elaborado manualmente com base na experiência do intérprete quanto as regiões
resultantes das segmentações apresentam imprecisão com relação à definição das
bordas que separam um alvo escuro do oceano.
Na pesquisa realizada foi valorizada a experiência do intérprete e o atributo
Classe do Phanton foi calculado sobrepondo o Phanton às regiões da segmentação. O
resultado numérico foi uma gradação de 0 a 1 que representa quanto uma
determinada região se encontra dentro ou fora de um alvo escuro definido no Phanton.
Para gerar o atributo categórico foi necessário mapear estes valores [0 a 1] em 4
classes, considerando os respectivos intervalos de sobreposição: a) região clara
(Código 1) sobreposição maior que 0 e menor ou igual a 0,25; b) região de transição
entre o claro e o escuro (Código 2) sobreposição maior que 0,25 e menor que 0,50;
c) região de transição entre o escuro e o claro (Código 3) sobreposição maior ou
igual a 0,50 e menor que 0,75, e; d) região escura (Código 4) - sobreposição maior ou
igual a 0,75 e menor ou igual a 1. A Figura 5.14 ilustra o todo proposto para a
definição do Atributo Classe do Phanton.
Figura 5.14 Método proposto para a definição do Atributo Classe do Phanton.
Embora os atributos estatísticos e texturais tenham maior chance de contribuir
para um bom resultado na clusterização, os atributos geométricos também foram
93
considerados. Os diferentes tipos de alvos escuros - associados a derramamento de
óleo ou a eventos meteo-oceanográficos - possuem particularidades relacionadas com
sua forma e tamanho capazes de discriminar estes diferentes tipos de eventos. Estas
propriedades descritas por BENTZ (2006) suscitaram a importância de pesquisar se
algum dos inúmeros atributos de forma, calculados pelo software Definiens, poderia
contribuir para melhorar os resultados da clusterização. Como o foco da tese foi
justamente a detecção da geometria de alvos escuros, uma investigação sobre a
influência dos atributos associados à forma no processo de clusterização não poderia
deixar de ser realizada.
5.4.2 Análise Exploratória e Seleção de Atributos
Não existe uma solução pronta capaz de indicar quais os melhores atributos
para serem utilizados em um processo de clusterização automática (JAIN et al., 1999).
De acordo com HUGHES (1968), a partir de certo número de atributos, a inserção de
novas variáveis ao modelo insere pouco ou nenhuma informação podendo, em casos
específicos, confundir e até mesmo piorar a performance do clusterizador. Por outro
lado, independente do número de atributos e da sua ordem de inserção no modelo, a
manutenção de atributo(s) estatisticamente não significativo(s) no conjunto de dados
também prejudica a performance do clusterizador. O número e os tipos de atributos
não são fixos e variam de acordo com a natureza dos dados e do problema estudado,
sendo a análise exploratória e a seleção de atributos procedimentos fundamentais
para auxiliar na definição destes parâmetros.
Apesar da diversidade de atributos utilizada na literatura consultada, pesquisas
sistemáticas comparando a eficiência de cada atributo para a detecção de óleo e
assemelhados são raras (TOPOUZELIS et al., 2009; BENTZ et al., 2007; RAMALHO &
MEDEIROS, 2007; STATHAKIS et al., 2006; KARATHANASSI et al., 2006; BENTZ,
2006). A seleção dos atributos é feita de modo arbitrário, com base em conhecimento
teórico sem utilizar um método para a seleção de atributos (TOPOUZELIS, 2008;
STATHAKIS et al., 2006; KUBAT et al., 1998). Desta forma, muitos dos atributos
utilizados pelos especialistas não contribuem efetivamente para otimizar os resultados
da classificação (KUBAT et al., 1998).
O conhecimento prévio do usuário sobre as propriedades do conjunto de dados
e a natureza do problema estudado também é fundamental para a seleção de um
conjunto adequado de atributos (JAIN & DUBES, 1988). Neste contexto, técnicas de
análise exploratória de dados e seleção de atributos foram utilizadas para reduzir o
94
espaço de atributos, com o objetivo de identificar os parâmetros mais adequados para
a detecção de alvos escuros em imagens SAR.
Para avaliar a significância estatística da relação existente entre os 36 atributos
e a variável dependente Classe do Phanton, as técnicas estatísticas mono e
multivariadas utilizadas foram: a) histograma, box plot e espacialização de atributos; b)
matriz de correlação, e; d) análise de principais componentes. O módulo Variable
Screening, implementado no software Statistica especificamente para a seleção de
atributos, foi utilizado para indicar a ordem de importância das variáveis a serem
utilizadas nas clusterizações. A Figura 5.15 detalha os atributos e procedimentos
estatísticos utilizados na análise exploratória e seleção de atributos.
Figura 5.15 Atributos e procedimentos utilizados na análise exploratória e seleção de
atributos.
5.4.2.1 Análise de Matriz de Correlação
O coeficiente de correlação de Spearman foi considerado mais adequado por
ser não-paramétrico e avaliar a relação entre duas variáveis sem assumir
95
comportamento linear e distribuição normal como no caso da correlação de Pearson
(SIEGEL, 1977). De forma diferente da correlação de Pearson, aplicável somente a
dados numéricos, a correlação de Spearman pode ser aplicada a conjuntos de dados
que apresentem também variáveis categóricas ordinais, como é o caso do atributo
Classe do Phanton.
A matriz de correlação foi processada para cada uma das 11 cenas estudadas,
considerando separadamente os diferentes tipos de atributos estatísticos, geométricos
(subdividos em gerais/poligonais e skeletons) e texturais em relação ao atributo
categórico Classe do Phanton. No total foram calculadas 44 matrizes de correlação,
com o objetivo de identificar quais os atributos mais correlacionados com o Phanton.
Este capítulo apresenta somente a síntese dos resultados obtidos, as matrizes de
correlação calculadas estão disponíveis para consulta no APÊNDICE III.
Atributos Estatísticos
A Tabela 5.9 contém: a) os coeficientes de correlação dos atributos estatísticos
em relação ao Phanton para as 11 cenas processadas; b) a máxima correlação obtida
por atributo dentre as 11 cenas; c) a média das correlações obtidas por atributo, e; d) a
frequência com que a correlações não foram significativas em relação ao Phanton.
Tabela 5.9 Coeficientes de Correlação dos atributos estatísticos em relação ao Phanton.
Dentre as 88 medidas de correlação obtidas em relação ao Phanton, nenhuma
atingiu (r) acima de 0,7, 39 (44%) apresentaram valores entre 0,5 e 0,7 e a maioria dos
casos (49: 56%) tiveram valores de (r) menores que 0,5. De maneira geral, estes
valores representam uma baixa relação dos atributos estatísticos com o Phanton.
96
Apesar destes baixos valores de (r), 78 casos (89%) foram considerados
estatisticamente significativos em relação ao Phanton, tendo sido possível identificar
quais os atributos que melhor se relacionaram com o Phanton.
A maior máxima correlação (em módulo) foi obtida pela Mediana em relação ao
Phanton, seguida dos atributos de Mínimo, Moda e Média. As maiores médias de
correlação foram obtidas pela Moda, Mediana, Média e Mínimo. Conseqüentemente,
estes atributos apresentaram os maiores valores de (r) observados em relação ao
Phanton, sendo estes estatisticamente não significativos em apenas duas cenas para
os atributos de Média e de Mínimo.
Os atributos de Assimetria e Curtose foram os menos correlacionados com o
Phanton com coeficientes médios de correlação de 0,12 e 0,15, respectivamente,
sendo a Assimetria o atributo que apresentou maior número de correlações não
significativas (5). A Tabela 5.10 sintetiza os resultados obtidos, indicando: a) a
freqüência acumulada com que cada um dos atributos foi correlacionado com o
Phanton do 1º (maiores coeficientes) ao 8º lugar (menores coeficientes), e; b) o
ranking final dos atributos mais indicados do 1º ao 8º lugar.
Tabela 5.10 - Análise Síntese da Matriz de Correlação para as 11 Cenas: Atributos Estatísticos.
Dentre os primeiros atributos indicados pelo ranking a Mediana, a Moda, a
Média e o Mínimo foram os que tiveram maior correlação com o Phanton com
coeficientes médios de correlação de Spearman (r) de 0,5, sendo, provavelmente, os
mais adequados para serem utilizados na etapa de clusterização.
Atributos Geométricos: Genéricos e Poligonais
A Tabela 5.11 contém: a) os coeficientes de correlação dos atributos
geométricos (genéricos/poligonais) em relação ao Phanton para as 11 cenas
processadas; b) a máxima correlação obtida por atributo dentre as 11 cenas; c) a
97
média das correlações obtida por atributo, e; d) a frequência com que a correlações
não foram significativas em relação ao Phanton.
Tabela 5.11 Coeficientes de Correlação dos atributos Geométricos Genéricos e Poligonais
em relação ao Phanton.
Os coeficientes obtidos indicaram que os atributos geométricos não
apresentaram bons coeficientes de correlação em relação ao Phanton, tendo sido a
média das máximas correlações 0,37 e a média global das correlações 0,16. Dentre as
143 correlações obtidas em relação ao Phanton, nenhuma apresentou valores de (r)
acima de 0,7, apenas 1 (1%) apresentou valor 0,5 e a maioria dos casos (142 99%)
tiveram valores de (r) menores que 0,5. Estes valores reforçam a baixa relação dos
atributos geométricos (genéricos e poligonais) com o Phanton. Apesar destes baixos
valores de (r), a maioria dos casos 109 (76%) apresentou correlação considerada
estatisticamente significativa em relação ao Phanton.
Os atributos de Ajuste Elíptico, Ajuste Retangular e Largura tiveram os piores
índices de correlação, sendo praticamente nulos. Coerentemente, estes atributos
estão entre os que tiveram os maiores números de correlações não significativas em
relação ao Phanton.
A Tabela 5.12 sintetiza dos resultados obtidos, indicando: a) a freqüência
acumulada com que cada um dos atributos foi correlacionado com o Phanton do
(maiores coeficientes) ao 13º lugar (menores coeficientes), e; b) o ranking final dos
atributos mais indicados do 1º ao 13º lugar.
98
Tabela 5.12 - Análise síntese da Matriz de Correlação para as 11 Cenas: Atributos Geométricos
Genéricos e Poligonais
A freqüência acumulada indicou que os atributos geométricos que mais se
relacionaram com o Phanton foram a Assimetria dos Polígonos, o Comprimento e a
Densidade, sendo estes os atributos com maiores valores médios de (r) observados
em relação ao Phanton.
Atributos Geométricos: Skeletons
A Tabela 5.13 contém: a) os coeficientes de correlação dos atributos
geométricos (skeletons) em relação ao Phanton para as 11 cenas processadas; b) a
máxima correlação obtida por atributo dentre as 11 cenas; c) a média das correlações
obtida por atributo, e; d) a frequência com que a correlações não foram significativas
em relação ao Phanton.
Tabela 5.13 Coeficientes de Correlação dos atributos Geométricos Skeletons em relação ao
Phanton.
99
Os coeficientes máximos e médios obtidos indicaram que os atributos de
geométricos (Skeletons), não foram bem relacionados com o Phanton, sendo todos os
(r) menores do que 0,5. Estes valores reforçam a baixa relação dos atributos
geométricos (Skeletons) com o Phanton. Em concordância com estes resultados, além
dos baixos valores de (r), 52 casos (72%) apresentaram correlação considerada
estatisticamente não significativa em relação ao Phanton.
A Tabela 5.14 sintetiza os resultados obtidos, indicando: a) a freqüência
acumulada com que cada um dos atributos foi correlacionado com o Phanton do
(maiores coeficientes) ao lugar (menores coeficientes), e; b) o ranking final dos
atributos mais indicados do 1º ao 7º lugar.
Tabela 5.14 - Análise síntese da Matriz de Correlação para as 11 Cenas: Atributos Geométricos
Skeletons.
O Desvio Padrão do Comprimento das Bordas foi o atributo com maiores
valores de (r), sendo o mais indicado em lugar, seguido do Comprimento da Linha
Principal I e II em e lugar, sendo estes os atributos que tiveram o maior número
de casos estatisticamente significativos em relação ao Phanton.
Atributos Texturais
A Tabela 5.15 contém: a) os coeficientes de correlação dos atributos texturais
em relação ao Phanton para as 11 cenas processadas; b) a máxima correlação obtida
por atributo dentre as 11 cenas; c) a média das correlações obtida por atributo, e; d) a
frequência com que a correlações não foram significativas em relação ao Phanton.
Dentre as 88 medidas de correlação obtidas em relação ao Phanton, nenhuma
apresentou valores de (r) acima de 0,7, apenas 8 (9%) apresentaram valores entre 0,5
e 0,7 e a maioria dos casos (80 91%) tiveram valores de (r) menores que 0,5. Estes
resultados reforçam a baixa relação dos atributos texturais com o Phanton. Apesar
100
destes baixos valores de (r), a maioria dos casos 72 (81%) apresentou correlação
considerada estatisticamente significativa em relação ao Phanton.
Tabela 5.15 Coeficientes de Correlação dos atributos texturais em relação ao Phanton.
A Tabela 5.16 sintetiza os resultados obtidos, indicando: a) a freqüência
acumulada com que cada um dos atributos foi correlacionado com o Phanton do
(maiores coeficientes) ao lugar (menores coeficientes), e; b) o ranking final dos
atributos mais indicados do 1º ao 8º lugar.
Tabela 5.16 - Análise síntese da Matriz de Correlação para as 11 Cenas: Atributos Texturais.
De acordo com o ranking do ao 8º lugar os 3 primeiros atributos mais
indicados foram o GLCM da Média, Correlação e Momento Angular. Estes
resultados mantêm coerência com os coeficientes de correlação que indicaram como
atributos mais relacionados ao Phanton o GLCM da Média, da Correlação e da
Entropia, sendo estes os atributos com maiores valores de (r) e maior número de
casos estatisticamente significativos em relação ao Phanton seguidos do GLCM do
Momento Angular.
101
5.4.2.2 Análise de Componentes Principais
Conforme diagnosticado pelas análises de correlação, no universo dos 36
atributos estudados alguns apresentaram baixa correlação com o Phanton. Estes
resultados forneceram indícios de que seria necessário reduzir a dimensionalidade dos
dados excluindo atributos fracamente correlacionados com o Phanton, os quais o
explicam o problema e podem prejudicar os resultados das clusterizações. Neste
contexto, a análise de componentes principais (ACP) foi utilizada para indicar o
conjunto mínimo de atributos, capazes de preservar a maior representatividade contida
no conjunto de dados original.
A ACP pode ser efetuada utilizando como base uma matriz de correlação ou de
variâncias-covariâncias. Como resultado, o espaço n-dimensional de atributos é
combinado linearmente resultando em n-componentes principais, denominados
autovetores, cada qual com um autovalor associado. Os autovalores correspondem à
variância total dos dados originais distribuída de forma decrescente entre cada um dos
autovetores (JOHNSON & WICHERN, 1992). A análise efetuada verificou quantos
autovetores eram necessários para atingir um percentual de representatividade de
pelo menos 90% em relação aos dados originais. No total foram processadas 11 ACP,
as tabelas resultantes com o valor dos autovalores, da variância total e cumulativa
para cada autovetor estão disponíveis para consulta no APÊNDICE IV. A Figura 5.16
disponibiliza os gráficos resultantes da ACP para cada recorte de cena, indicando o
número de autovetores responsáveis por pelo menos 90% da representatividade dos
dados.
O número de componentes, ou autovetores, são disponibilizados em ordem
decrescente de acordo com os autovalores obtidos, sendo o número de componentes
igual ao número de variáveis. Os gráficos da Figura 5.16 evidenciaram que a partir de
certo número de autovetores a variância acumulada estabiliza, aumentando muito
pouco em cada componente. O maior percentual da representatividade dos dados
ficou concentrado nas primeiras componentes.
No caso em estudo, o número de componentes necessários para atingir uma
representatividade de pelo menos 90% variou entre 4 e 10. Em média foram
necessários apenas 8 atributos em relação ao conjunto de dados inicial, 22% do total
de atributos (36). A Tabela 5.17 contém a ntese das ACP indicando o número de
componentes necessários para manter pelo menos 90% da representatividade dos
dados em cada cena.
102
Figura 5.16 - Gráficos resultantes da ACP efetuadas para as 11 cenas analisadas.
variância estabilizada
variância estabilizada
variância estabilizada
variância estabilizada
variância estabilizada
variância estabilizada
9 atributos representam
90% da variância
6 atributos representam
90% da variância
8 atributos representam
90% da variância
8 atributos representam
90% da variância
10 atributos representam
90% da variância
4 atributos representam
90% da variância
103
Figura 5.16 Continuação: Gráficos resultantes da ACP efetuadas para as 11 cenas
analisadas.
variância estabilizada
8 atributos representam
90% da variância
variância estabilizada
variância estabilizada
variância estabilizada
9
10
7
8
9
4
10
8
8
6
9
0
3
5
8
10
13
15
1 2 3 4 5 6 7 8 9 10 11
Recortes de Cena
N
o
de Atributos
No de Atributos para a
Representativ idade de 90%
variância estabilizada
7 atributos representam
90% da variância
10 atributos representam
90% da variância
9 atributos representam
90% da variância
8 atributos representam
90% da variância
104
Tabela 5.17 - Síntese do número de componentes necessários em cada cena para manter pelo
menos 90% da representatividade dos dados.
Como o número de atributos não é fixo e varia a cada nova cena estudada, as
análises subseqüentes são importantes para verificar se uma padronização do número
e dos tipos de atributos é viável para automatizar o sistema.
5.4.2.4 Seleção de Atributos
O processo de seleção de atributos tem como objetivo identificar um
subconjunto de atributos que melhor caracterize o conjunto original de dados (LIU &
SETIONO, 1995; LEHMANN, 2005; STATHAKIS et al., 2006) removendo variáveis
irrelevantes, redundantes ou ruidosas. A redução do número de atributos diminui o
custo computacional envolvido nos processamentos, melhora a qualidade do conjunto
de dados e, conseqüentemente, o potencial de predição das variáveis, tornando os
resultados mais precisos e fáceis de serem interpretados (DUDA & HARD, 1973; JAIN
et al., 1999; NISBET et al, 2009).
Conforme comentado no item 5.4.2 a seleção de atributos é um procedimento
essencial para melhorar o desempenho da clusterização. A seleção de um
subconjunto de atributos mais representativo para ser utilizado em análises
subseqüentes pode melhorar significativamente o reconhecimento de padrões e,
conseqüentemente, a representatividade dos clusters. Especialmente nos casos em
que se tem um grande volume de dados, avaliar a importância relativa de cada atributo
pode torna-se difícil e até mesmo inviável sem a utilização de um método automático
de seleção de atributos (NISBET et al, 2009).
Existe uma diversidade de algoritmos para seleção de atributos (LEHMANN,
2005), sendo os métodos mais comumente utilizados os heurísticos e os de busca
105
exaustiva (BLUM & LANGLEY, 1997; WU & FLACH, 2002). Considerando que o
número de combinações (C) possíveis em um conjunto de dados com M atributos
equivale a C=2
M
, uma busca exaustiva pelo melhor subconjunto de atributos pode ser
computacionalmente inviável dependendo da dimensão do espaço de atributos.
Nestes casos, os métodos de busca heurística são amplamente utilizados, sendo as
abordagens mais comuns: a) ganho de informação; b) índice de gini; c) medidas de
discrepância, e; c) teste chi-quadrado (WU & FLACH, 2002; LEHMANN, 2005).
No âmbito da tese, o método de seleção de atributos baseado no teste de chi-
quadrado foi considerado adequado por tratar amplos conjuntos de dados contendo
variáveis independentes numéricas e dependentes categóricas sem assumir que a
relação entre os preditores e a variável dependente é linear ou monovariada. O chi-
quadrado tem sido indicado na literatura como um método efetivo e confiável para
selecionar variáveis numéricas e ordinais, como é o caso do estudo proposto (LIU &
SETIONO, 1995). O algoritmo calcula um valor de chi-quadrado para cada atributo
independente (36 preditores) em relação a variável dependente (Classe do Phanton).
Como resultado final o algoritmo fornece uma tabela com o ranking dos atributos
ordenados de maneira decrescente, considerando a significância estatística (p valor)
calculada para cada valor de chi-quadrado (Statistica). As tabelas contendo os
resultados fornecidos pelo chi-quadrado para as 11 cenas estudadas estão disponíveis
para consulta no APÊNDICE V.
Como a ACP indicou que no máximo 10 atributos foram necessários para
manter 90% da representatividade do conjunto de dados original, a análise dos
resultados obtidos pela seleção de atributos considerou somente os 10 primeiros
atributos. A Tabela 5.18 disponibiliza o ranking dos 10 atributos mais importantes para
cada cena, de acordo com o chi-quadrado.
Tabela 5.18 Ranking dos 10 atributos mais importantes para cada cena
106
Embora haja uma recorrência de certos atributos nos 11 recortes de cena
estudados, o conjunto dos 10 melhores atributos indicados pelo método de seleção
variou de cena para cena. Este resultado é esperado uma vez que o conteúdo das
imagens, ou seja, os tipos de alvos, sua dimensão e geometria são diferentes em cada
cena. Os parâmetros relacionados ao modo de imageamento do sensor como ângulo
de incidência, largura da faixa e resolução espacial utilizados no momento da
aquisição também originam estas diferenças entre as cenas (KARATHANSSI et al.,
2006; BAATZ et al., 2003; GASULL et al., 2002). Mesmo imagens adquiridas por um
mesmo sensor em um mesmo modo de imageamento apresentarão diferenças, sendo
estas influenciadas predominantemente pelas condições meteo-oceanográficas
estabelecidas na superfície do mar no momento da aquisição dos dados (Capitulo 2,
item 2.2).
O desafio proposto foi encontrar um conjunto de atributos padrão, capaz de
retornar bons resultados na clusterização, sendo utilizado a cada nova cena
processada, fornecendo como resultado clusters representativos para os alvos
escuros contidos na cena. Para que esta análise fosse factível, o conjunto de cenas
teste selecionadas para a tese buscou abranger esta diversidade de tipos de alvos e
complexidade de cenários (Capitulo 4, item 4.1).
Esta heterogeneidade encontrada entre os 10 atributos mais importantes (chi-
quadrado) para cada recorte de cena é consequência desta seleção. Se as cenas
tivessem sido recortadas sempre individualizando um único alvo com um bom
contraste em relação ao oceano (priorizando eventos relacionados a óleo) - como
frequentemente observado na literatura disponível - seria possível ter obtido uma
maior homogeneidade entre os atributos selecionados. Esta maior recorrência dos
atributos selecionados facilitaria a padronização deste parâmetro (tipos e número de
atributos), entretanto, não refletiria a realidade das imagens SAR adquiridas nas áreas
oceânicas, provavelmente resultando em uma grande oscilação no desempenho da
clusterização.
Para indicar esse conjunto padrão de atributos, ao invés de se trabalhar
individualmente com a performance obtida utilizando os 10 melhores atributos
indicados para cada cena, a freqüência acumulada de indicação dos atributos foi
avaliada, originando um ranking com os 10 mais indicados (Tabela 5.19).
107
Tabela 5.19 Ranking dos 10 atributos mais importantes indicados pelo chi-quadrado do ao
10º lugar.
O método de seleção utilizado indicou os atributos estatísticos como os mais
relacionados com o Phanton, ocupando os 5 primeiros lugares no ranking,
respectivamente: Mediana, Média, Moda, Mínimo e Máximo. Embora a ordem de
importância dos atributos seja diferente da indicada pelos coeficientes de correlação
de Spearman, os atributos são praticamente os mesmos. Em concordância com os
resultados obtidos anteriormente, estes atributos foram os que tiveram os maiores
coeficientes ((r)0,5) e a menor freqüência de coeficientes estatisticamente não
significativos (p<0,05) em relação ao Phanton.
Conforme esperado, os atributos indicados nas análises anteriores como pouco
relacionados com o Phanton, os geométricos e os texturais foram os menos indicados
entre os 10 primeiros do ranking. Apesar dos baixos coeficientes, a Assimetria dos
Polígonos, a Densidade e o GLCM da Média estão entre os atributos geométricos e
textuais mais correlacionados significativamente com o Phanton.
A Figura 5.17 contém a espacialização dos 10 atributos normalizados indicados
pelo ranking, sendo visualmente perceptível que os atributos estatísticos apresentam
maior potencial para auxiliar na detecção dos alvos escuros. Os atributos estatísticos
ressaltaram com maior contraste, maior estabilidade e menor ruído as geometrias
referentes aos alvos escuros em todas as cenas, sendo os atributos de Mínimo e de
Máximo os menos estáveis.
108
Figura 5.17 - Espacialização dos 10 atributos mais indicados pelo ranking para as 11 cenas
estudadas.
109
Figura 5.17 Continuação: Espacialização dos 10 atributos mais indicados pelo ranking para
as 11 cenas estudadas.
110
Figura 5.17 Continuação: Espacialização dos 10 atributos mais indicados pelo ranking para
as 11 cenas estudadas.
111
Figura 5.17 Continuação: Espacialização dos 10 atributos mais indicados pelo ranking para
as 11 cenas estudadas.
Embora os atributos geométricos tenham apresentado um comportamento
instável e ruidoso para a maioria das cenas, de forma contrária, nas cenas 2, 3 e 6, em
que manchas de óleo com geometrias bem definidas e alongadas estavam presentes,
estes atributos contribuíram significativamente para aumentar o contraste com o
oceano. Visualmente, o atributo de Densidade parece ter contribuído também para
ressaltar assemelhados produzidos pela presença de óleos biológicos nas cenas 1 e
11, e de baixa intensidade de vento na cena 7. Com exceção da cena 2, o atributo
textural que aparentou ter o maior potencial para auxiliar no reconhecimento de
padrões foi o GLCM da Homogeneidade. Mesmo abrangendo um número menor de
cenas, o GLCM da Média visualmente contribuiu para destacar feições em relação ao
oceano nos recortes de cenas 3, 6, 7, 10 e 11.
Os trabalhos que utilizaram seleção de atributos na etapa de classificação
confirmaram a importância de alguns dos atributos indicados entre os 10 melhores
pelo método de seleção utilizado. Os atributos geométricos de Assimetria dos
Polígonos, Ajuste Retangular e Densidade e o atributo textural GLCM da Média,
também foram selecionados por TOPOUZELIS et al. (2009) e STATHAKIS et al.
(2006). KARATHANASSI et al. (2006) também indicou o GLCM da Média e BENTZ
(2006) a Assimetria dos Polígonos. O GLCM da Homogeneidade de HARALICK et al.
(1979) também foi um atributo indicado na literatura (AKKARTAL & SUNAR; 2008,
MARGHANY, 2001; ASSILZADEH & MANSOR, 2001) com potencial para auxiliar a
detecção automática de alvos escuros em imagens SAR, indicando as áreas com
máxima homogeneidade na cena. A indicação dos atributos estatísticos de primeira
ordem não foi explicitamente verificada na literatura porque os autores utilizam
métricas calculadas a partir da combinação destes atributos.
Portanto, para a detecção de alvos escuros, os atributos selecionados como
mais importantes pelo chi-quadrado foram, respectivamente: Mediana, Média, Moda,
Mínimo, Máximo, GLCM da Média, Ajuste Retangular, GLCM da Homogeneidade,
Assimetria dos Polígonos e Densidade. Importante destacar que os atributos
112
selecionados pelo chi-quadrado como mais importantes são multicorrelacionados entre
si, as matrizes de correlação estão disponíveis no APÊNDICE III. Entretanto, é notável
que estes atributos foram os que apresentaram as melhores correlações com o
Phanton, sendo os demais atributos muito pouco relacionados. Desta forma, a seleção
efetuada não é considerada definitiva, pois a contribuição efetiva de cada um destes
atributos para a detecção de alvos escuros também será avaliada através dos
resultados das clusterizações realizadas nas próximas etapas da tese.
5.4.3 Reconhecimento de Padrões por Clusterização Automática
Nesta etapa da tese o objetivo foi avaliar a performance de técnicas
automáticas de clusterização aplicadas à detecção de alvos escuros em imagens
SAR. Conforme definido (Capítulo 5.4), o processo de clusterização é capaz de
explorar automaticamente a inter-relação existente entre o conjunto de atributos,
reconhecendo padrões e agrupando-os em clusters, de acordo com um critério de
similaridade previamente estabelecido. O reconhecimento de padrões é considerado
essencial no processo de clusterização e está intrinsecamente ligado à qualidade dos
atributos selecionados (JAIL et al., 1999).
O padrão (X) é representado por um vetor multidimensional (X = X
1
....X
d
) onde
cada dimensão corresponde a um atributo, sendo a dimensionalidade do padrão igual
ao número total de atributos considerados (DUDA & HART, 1973). Espera-se que as
propriedades estatísticas do conjunto de atributos extraídos das imagens SAR e da
geometria dos polígonos apresentem comportamento diferenciado nas regiões
escuras e claras das imagens. Este comportamento, quando identificado através de
padrões discriminantes entre si, permitiria ao algoritmo detectar clusters
representativos separando, sem ou com reduzida confusão, os alvos escuros do
oceano.
Padronizar os parâmetros envolvidos nas etapas de processamento é
necessário para implementar um sistema automático, sendo a definição dos tipos e da
quantidade de atributos fundamental para a etapa de clusterização. Este quesito é
raramente abordado na literatura especializada em detecção automática de óleo. Cada
autor utiliza um número diferente de atributos (TOPOUZELIS et al., 2002; 2008, e;
2009; STATHAKIS et al., 2006; KARATHANASSI et al., 2006), sem apresentar
estudos evidenciando que a escolha representa a melhor performance para os
classificadores (APÊNDICE I).
113
As clusterizações foram efetuadas no software Clustan módulo Focal Point
(FP) inserindo os 10 melhores atributos um a um, na ordem de importância indicada
(Tabela 5.19), com o objetivo de verificar a parcela de contribuição de cada atributo
nos resultados da clusterização. A validação do melhor conjunto de atributos foi
efetuada comparando os alvos escuros resultantes das inúmeras clusterizações
efetuadas, com os alvos escuros definidos como referência nos Phantons elaborados
para cada cena. A metodologia utilizada para a validação do conjunto adequado de
atributos está detalhada no fluxograma da Figura 5.18.
Figura 5.18 - Metodologia utilizada para a validação do conjunto adequado de atributos.
A avaliação da qualidade dos alvos escuros produzidos pelas clusterizações
em relação aos Phantons não considerou todas as métricas de avaliação utilizadas
nas etapas anteriores da tese. Índices como a Fração de Intersecção de Alvos
Escuros (FInt), a Intersecção de Polígonos (IPol) e a taxa de Omissão (Om) tornaram-
se insensíveis para caracterizar as diferenças entre os resultados obtidos. Isto ocorreu
porque, dentre as inúmeras clusterizações efetuadas considerando diferentes
combinações de atributos, existem resultados bons e ruins para serem avaliados. Para
os resultados em que ocorreu a inclusão exagerada de regiões que seriam oceano
como alvos escuros, uma sobreposição com o Phanton indicaria que todos os alvos
escuros foram detectados, sem considerar a imprecisão da forma dos clusters. Neste
contexto, as métricas de avaliação FInt e IPol não poderiam ser consideradas para
avaliar todos os resultados obtidos, sendo indicado não utilizá-las a fim de evitar
interpretações errôneas. A mesma recomendação aplica-se para o índice de omissão
(Om), sendo praticamente nulo nos casos em que os erros de inclusão (In) foram
exagerados, tornando-se inexpressivo para a avaliação.
114
Como o cálculo dos atributos de ajuste Gf, Fiti, Fitn e Fitxy exige um alto custo
computacional e o volume de resultados produzidos foi muito grande (cerca de 550
imagens agrupadas), tornou-se inviável utilizá-los nesta etapa da tese.
O atributo indicado como mais coerente para ser utilizado na avaliação dos
resultados foi a Exatidão dos Alvos Escuros (ExAE), métrica que considera a
intersecção dos alvos escuros dividida pela união da intersecção, com os erros de
omissão e de inclusão (Capitulo 3: Item 3.3). Como esta métrica considera os erros de
Om e de In adquire sensibilidade para indicar situações em que o clusterizador falhou
incluindo ou omitindo regiões erroneamente nos alvos escuros, sendo o agrupamento
perfeito obtido quando ExAE for igual a 1.
Os resultados iniciais evidenciaram que, mesmo utilizando um método para a
seleção de atributos, o processamento simultâneo dos atributos selecionados pode
causar oscilações na performance do clusterizador, o que nem sempre retorna
resultados aceitáveis. Na maioria das cenas estudadas a utilização do atributo de
Mínimo isolado ou em conjunto com o Máximo piorou os resultados da clusterização e,
conseqüentemente, a detecção de alvos escuros. A capacidade de discriminação
associada a um determinado atributo muda se o mesmo estiver sendo analisado
isoladamente ou em conjunto (TOPOUZELIS et al., 2009). A Figura 5.19 disponibiliza
os clusters resultantes da utilização simultânea e individual dos atributos de máximo e
mínimo nos resultados da clusterização, juntamente com a ExAE obtida em cada caso.
Figura 5.19 Influência da utilização simultânea e individual dos atributos de Máximo e Mínimo
na clusterização.
115
Figura 5.19 Influência da utilização simultânea e individual dos atributos de máximo e mínimo
na clusterização.
116
Figura 5.19 Continuação: Influência da utilização simultânea e individual dos atributos de
máximo e mínimo na clusterização.
A espacialização dos clusters detectados, juntamente com a ExAE obtida para
cada recorte de cena em relação ao Phanton, confirmou que o atributo de nimo
produz um efeito negativo na grande maioria dos casos, prejudicando a performance
da clusterização. Para entender os motivos pelos quais este efeito ocorre a Figura
5.20 disponibiliza, para 3 exemplos: a) as imagens de RADAR filtradas com o Lee 3x3
sem nenhum contraste aplicado; b) a espacialização dos atributos de nimo e
Máximo, e; c) os box plots gerados com a distribuição dos atributos de Máximo e
117
Mínimo em relação às 4 classes do atributo categórico Classe do Phanton definidas na
Figura 5.14.
Figura 5.20 Propriedades dos atributos de Máximo e Mínimo que influenciam na
clusterização.
Separa bem
Separa bem
Menor
Confusão entre
as classes
Confusão entre
as classes
Confusão entre
as classes
Confusão entre
as classes
118
Nos box plots foi possível verificar que a distância entre as Regiões Claras
(RC) e Escuras (RE), e de Transição entre o Claro (RTC) e o Escuro (RTE) foi maior
para o atributo de Máximo. Quanto maior for a diferença existente entre as Regiões
(RC, RTC, RTE e RE) maior será o contraste dos alvos escuros em relação ao oceano
e, conseqüentemente, o potencial do clusterizador para identificar padrões que
possibilitem um melhor particionamento do conjunto de dados. Este melhor contraste
entre os alvos escuros e o oceano fornecido pelo Máximo é visível na espacialização
dos atributos na Figura 5.22. Desta forma, o atributo de nimo não constitui uma boa
métrica, sendo indicada a sua exclusão do conjunto de atributos selecionados pelo chi-
quadrado. Esta recomendação é reforçada com os dados disponíveis na Tabela 5.20,
que disponibiliza a ExAE obtida pelas clusterizações, considerando os atributos de
Máximo e Mínimo simultaneamente e individualmente.
Tabela 5.20 Exatidão dos Alvos Escuros (ExAE) obtida para as clusterizações efetuadas,
considerando os atributos de máximo e mínimo simultaneamente e individualmente.
O gráfico confirmou as análises indicando que na média a clusterização
considerando somente o atributo de Máximo teve um melhor desempenho
caracterizado pelas maiores ExAE. Para a grande maioria das cenas clusterizadas,
quando a ExAE não foi maior considerando somente o atributo de Máximo, foi igual à
ExAE obtida com a combinação do Máximo e do Mínimo.
Com base nos resultados apresentados, a série de Figuras 5.21 a 5.31
disponibiliza os resultados das clusterizações realizadas para as 11 cenas, inserindo
um a um os 9 melhores atributos indicados pela análise exploratória e pelo método de
seleção de atributos, desconsiderando o atributo de Mínimo. Os gráficos elaborados
disponibilizam conjuntamente a variação da ExAE e da Média da Soma dos
Quadrados da Distância Euclidiana (ME), obtidos para as clusterizações realizadas a
cada novo atributo considerado. A ME foi analisada por ser o critério utilizado pelo FP
Média
ExAE
ExAE
119
para convergir ao final das interações em uma solução considerada ótima para a
clusterização (WISHART, 2004).
Figura 5.21 Gráfico e espacialização das clusterizações realizadas para a Cena 1.
Figura 5.22 Gráfico e espacialização das clusterizações realizadas para a Cena 2.
0,80
0,80
0,80
0,80
0,80
0,80
0,80
0,80
0,000
0,000
0,001
0,001
0,005
0,005
0,009
0,009
0,0
0,3
0,5
0,8
1,0
2 3 4 5 6 7 8 9
No de Atributos
0,000
0,003
0,006
0,009
0,012
Exatidão Soma dos Quadradados da Distância Euclidiana
N
o
Atributos
0,328
0,329
0,392
0,377
0,377
0,377
0,388
0,351
0,011
0,012
0,007
0,007
0,006
0,003
0,004
0,004
0,0
0,1
0,2
0,3
0,4
0,5
2 3 4 5 6 7 8 9
No de Atributos
0,000
0,004
0,008
0,012
0,016
Exatidão Soma dos Quadradados da Distância Euclidiana
N
o
Atributos
120
Figura 5.23 Gráfico e espacialização das clusterizações realizadas para a Cena 3.
Figura 5.24 Gráfico e espacialização das clusterizações realizadas para a Cena 4.
0,081
0,081
0,151
0,169
0,169
0,170
0,203
0,215
0,0010
0,0010
0,0013
0,0024
0,0037
0,0049
0,0087
0,0083
0,0
0,1
0,1
0,2
0,2
0,3
0,3
2 3 4 5 6 7 8 9
No de Atributos
0,000
0,003
0,005
0,008
0,010
Exatidão Soma dos Quadradados da Distância Euclidiana
N
o
Atributos
0,348
0,348
0,348
0,315
0,315
0,349
0,349
0,349
0,0020
0,0028
0,0025
0,0047
0,0063
0,0056
0,0127
0,0119
0,0
0,1
0,2
0,3
0,4
0,5
2 3 4 5 6 7 8 9
No de Atributos
0,000
0,003
0,006
0,009
0,012
0,015
Exatidão Soma dos Quadradados da Distância Euclidiana
N
o
Atributos
121
Figura 5.25 Gráfico e espacialização das clusterizações realizadas para a Cena 5.
Figura 5.26 Gráfico e espacialização das clusterizações realizadas para a Cena 6.
0,507
0,507
0,507
0,314
0,314
0,314
0,335
0,335
0,0033
0,0037
0,0043
0,0059
0,0078
0,0085
0,0167
0,0154
0,0
0,1
0,2
0,3
0,4
0,5
0,6
2 3 4 5 6 7 8 9
No de Atributos
0,000
0,004
0,008
0,012
0,016
0,020
Exatidão Soma dos Quadradados da Distância Euclidiana
N
o
Atributos
0,119
0,119
0,242
0,246
0,246
0,248
0,248
0,248
0,0073
0,0075
0,0031
0,0031
0,0018
0,0007
0,0005
0,0006
0,0
0,1
0,2
0,3
0,4
2 3 4 5 6 7 8 9
No de Atributos
0,000
0,002
0,004
0,006
0,008
Exatidão Soma dos Quadradados da Distância Euclidiana
N
o
Atributos
122
Figura 5.27 Gráfico e espacialização das clusterizações realizadas para a Cena 7.
Figura 5.28 Gráfico e espacialização das clusterizações realizadas para a Cena 8.
0,775
0,775
0,435
0,444
0,440
0,440
0,440
0,440
0,0128
0,0133
0,0076
0,0084
0,0066
0,0026
0,0014
0,0011
0,0
0,2
0,4
0,6
0,8
2 3 4 5 6 7 8 9
No de Atributos
0,000
0,005
0,010
0,015
Exatidão Soma dos Quadradados da Distância Euclidiana
N
o
Atributos
0,422
0,433
0,612
0,565
0,566
0,562
0,562
0,562
0,0045
0,0050
0,0045
0,0072
0,0084
0,0092
0,0147
0,0140
0,0
0,2
0,4
0,6
2 3 4 5 6 7 8 9
No de Atributos
0,000
0,004
0,008
0,012
0,016
Exatidão Soma dos Quadradados da Distância Euclidiana
N
o
Atributos
123
Figura 5.29 Gráfico e espacialização das clusterizações realizadas para a Cena 9.
Figura 5.30 Gráfico e espacialização das clusterizações realizadas para a Cena 10.
0,150
0,174
0,188
0,186
0,186
0,186
0,167
0,168
0,0033
0,0046
0,0041
0,0070
0,0079
0,0077
0,0117
0,0111
0,0
0,1
0,2
0,3
2 3 4 5 6 7 8 9
No de Atributos
0,000
0,003
0,006
0,009
0,012
0,015
Exatidão Soma dos Quadradados da Distância Euclidiana
N
o
Atributos
0,282
0,282
0,253
0,240
0,240
0,240
0,240
0,240
0,0012
0,0017
0,0016
0,0030
0,0052
0,0068
0,0122
0,0117
0,0
0,1
0,2
0,3
0,4
2 3 4 5 6 7 8 9
No de Atributos
0,000
0,004
0,008
0,012
0,016
Exatidão Soma dos Quadradados da Distância Euclidiana
N
o
Atributos
124
Figura 5.31 Gráfico e espacialização das clusterizações realizadas para a Cena 11.
A ME tende a aumentar com o aumento do número de atributos, isto ocorre
porque a cada nova clusterização o algoritmo procura convergir a melhor solução
minimizando a ME, a inclusão de atributos tende a aumentar a ME devido ao aumento
gradativo da dispersão dos clusters.
O critério utilizado para definir se o resultado de uma clusterização foi
satisfatório, considerou uma ExAE maior ou igual a 0,5, equivalente a no mínimo 50%
de representatividade em relação ao Phanton. Este critério foi definido interativamente
pelo intérprete, a partir da comparação visual dos resultados obtidos pelo clusterizador
em relação ao Phanton. Este critério poderia ser mais rigoroso, todavia, a imprecisão
na definição exata dos limites de borda que separam um alvo escuro do oceano é
inerente às imagens SAR, devido a inúmeros fatores descritos no Capítulo 2.
Conforme comentado anteriormente, o próprio Phanton possui imprecisão associada
ao delineamento manual dos limites de borda.
A cena 1 (Figura 5.21) convergiu para a melhor ExAE com 4 atributos e a
menor ME. Neste caso, a utilização de um número menor de atributos (2 ou 3)
prejudicou a performance da clusterização, com diferenças identificáveis na
interpretação visual dos clusters produzidos. Quando comparados ao Phanton, os
0,081
0,081
0,102
0,328
0,328
0,103
0,331
0,331
0,0094
0,0096
0,0081
0,0102
0,0121
0,0123
0,0123
0,0155
0,0
0,1
0,2
0,3
0,4
2 3 4 5 6 7 8 9
No de Atributos
0,000
0,004
0,008
0,012
0,016
0,020
Exatidão Soma dos Quadradados da Distância Euclidiana
N
o
Atributos
125
resultados obtidos pela clusterização foram considerados não satisfatórios, sendo sua
representatividade menor do que 50%, com índices de ExAE entre 0,32 e 0,40.
A inserção dos 9 atributos um a um na cena 2 (Figura 5.22) não alterou o
índice de ExAE, e não provocou alterações visíveis na representatividade dos clusters
obtidos. Neste caso, com apenas 2 atributos e a menor ME o algoritmo convergiu para
a melhor ExAE. Os clusters obtidos pelo método automático foram considerados
satisfatórios quando comparados visualmente com o Phanton, alcançando ExAE de
0,80, indicando 80% de representatividade.
Na cena 3 (Figura 5.23), não foi observado ganho significativo nos índices de
ExAE com o aumento gradativo do número de atributos. Embora as maiores Exatidões
tenham sido observadas com a utilização de 7, 8 e 9 atributos (0,349), a diferença
entre estes e os índices obtidos com 2, 3 e 4 atributos (0,348) foi irrisória 0,001. Neste
caso, com apenas 2 atributos foi possível convergir para a melhor solução, sendo que
a inserção dos demais atributos não alterou os resultados obtidos. Nesta cena, a
clusterização foi considerada não satisfatória com representatividade máxima de 35%.
A cena 4 (Figura 5.24) convergiu para a melhor ExAE com 9 atributos e com
uma maior ME. Visualmente, os clusters resultantes não apresentaram mudanças
discrepantes com a utilização de mais de 4 atributos, entretanto, a utilização de 2 ou 3
atributos prejudicou os resultados. Quando comparados ao Phanton, os resultados
foram considerados não satisfatórios, sendo sua representatividade menor do que
50%, com índices de ExAE oscilando entre 0,08 e 0,215.
Na cena 5 (Figura 5.25) também é evidente que a utilização de 2 e 3 atributos
não favoreceu o clusterizador. A inserção gradativa de atributos não alterou a
representatividade visual dos clusters e, considerando a ExAE, os índices oscilaram
de minimamente entre 0,242 e 0,248, representando um ganho de 0,006. Neste caso,
o modelo mais simplificado seria utilizar 4 atributos com a menor ME. Os resultados
também foram considerados não satisfatórios quando comparados com o Phanton,
alcançando ExAE menores que 50%.
Na cena 6 (Figura 5.26) com apenas 2 atributos e a menor ME o algoritmo
convergiu para a melhor ExAE, sendo este índice mantido estável com a inserção de
até 4 atributos. De forma semelhante à cena 2, visualmente a diferença qualitativa
entre os clusters obtidos com a inserção de até 9 atributos foi muito pequena. Neste
caso, os clusters obtidos foram considerados satisfatórios quando comparados
visualmente com o Phanton, alcançando 50% (0,51) de representatividade.
126
Um comportamento diferenciado foi observado na cena 7 (Figura 5.27), onde
os melhores índices de ExAE foram obtidos com apenas 2 e 3 atributos, a partir dos
quais a inserção gradativa de atributos prejudicou a detecção dos alvos escuros.
Neste caso, seriam necessários pelo menos 2 atributos para atingir uma ExAE
máxima. A performance do clusterizador automático foi considerada satisfatória,
atingindo 77% (0,775) de representatividade em relação ao Phanton.
Para a cena 8 (Figura 5.28), a maior ExAE (0,612), juntamente com a menor
ME, foi obtida com 4 atributos. Da mesma forma que para as cenas 1, 4 e 5, a
utilização de 2 e 3 atributos prejudicou visualmente a performance do clusterizador na
separação dos clusters. Neste caso, a solução que convergiu para a maior ExAE foi
obtida com a utilização de 4 atributos. Os resultados obtidos pela clusterização
automática foram considerados satisfatórios, sendo sua representatividade em relação
ao Phanton maior do que 50%, com ExAE entre 0,56 (56%) e 0,61 (60%).
Na cena 9 (Figura 5.29) o maior índice de ExAE foi obtido com a inserção de 2
atributos, mantendo-se estável com até 3 atributos. Embora a ExAE tenha diminuído
com a inserção gradativa de mais de 3 atributos, visualmente os clusters resultantes
não apresentaram mudanças discrepantes. Neste caso, a padronização do número de
atributos de entrada acima de 2 não alteraria visualmente a representatividade dos
clusters. O desempenho do clusterizador foi considerado não satisfatória, atingindo
exatidão máxima de 28%, menos que 50% em relação ao Phanton.
A melhor convergência do clusterizador para a cena 10 (Figura 5.30) atingiu
ExAE máxima de 0,19 (19%) e foi obtida com a utilização de 4 atributos,
acompanhada da menor ME. Este índice de ExAE manteve-se estabilizado até a
inserção do 7º atributo, diminuindo cerca de 0,02 com a inserção do e do 9º
atributo. Embora a ExAE tenha diminuído, este comportamento não foi significativo em
termos de representatividade em relação ao Phanton, uma vez que, os resultados
foram considerados não satisfatórios, com representatividade menor que 50%, para
todos os testes efetuados, atingindo ExAE máxima de 19% (0,186).
Para a cena 11 (Figura 5.31) a melhor ExAE (0,33) foi obtida com 5 atributos,
mantendo-se estabilizada com a utilização de 6, 8 e 9 atributos. Visualmente, a
utilização de um número menor do que 5 atributos prejudicou a qualidade dos clusters
produzidos. Neste caso, os resultados obtidos pela clusterização automática também
foram considerados não satisfatórios, sendo sua representatividade em relação ao
Phanton menor do que 50%, com máximo percentual de ExAE de 33%.
127
Na maioria das cenas estudadas foi possível convergir para uma melhor
solução com um menor número de atributos, oscilando entre 2 e 4 e com menores
valores para a ME. No conjunto das 9 clusterizações realizadas para cada uma das 11
cenas, os maiores índices de ExAE foram obtidos com: a) apenas 2 atributos em 5
cenas; b) 4 atributos em 3 cenas; c) 5 atributos em 2 cenas, e; d) 9 atributos em 1
cena.
Nos casos em que a máxima ExAE foi obtida com um número maior ou igual a
4 atributos (6 cenas), a utilização de 2 a 3 atributos produziu clusters menos
representativos em 6 das 11 cenas estudadas, sendo identificável tanto nos índices de
ExAE, quanto visualmente. Estes resultados são interessantes porque reforçam que
um número pequeno de atributos pode não ser suficiente para o clusterizador
convergir clusters representativos, assim como um número exagerado de atributos
também pode prejudicar os resultados.
As clusterizações também foram realizadas inserindo, seqüencialmente, um a
um os 35 atributos (desconsiderando o atributo de Mínimo), considerando a ordem de
importância indicada pelo chi-quadrado para cada cena (APÊNDICE V) conforme
etapas indicadas no fluxograma metodológico da Figura 5.18. Este estudo foi
realizado, para verificar se haveria diferença significativa na performance do
clusterizador considerando o total de atributos e não apenas os 9 melhores do ranking.
Os resultados desta comparação são de extrema importância para validar se a
automatização do sistema é factível a partir de um conjunto padrão mínimo de
atributos, a ser utilizado a cada nova imagem SAR adquirida. A Tabela 5.21 apresenta
a síntese dos resultados obtidos para as clusterizações efetuadas com os 9 melhores
atributos do ranking e com os 35 atributos. Foram calculadas para cada cena a ExAE
obtida com a clusterização simultânea dos 9 e dos 35 atributos e a Máxima ExAE
obtida com a inserção gradual dos 9 e dos 35 atributos respeitando, respectivamente,
a ordem de importância indicada na Tabela 5.19 e indicada pelo chi-quadrado
(APÊNDICE V). O número de atributos necessário para retornar a máxima ExAE será
variável de cena para cena.
O teste não paramétrico de Wilcox foi realizado com o objetivo de verificar se
as Exatidões (ExAE) e Máximas Exatidões (MExAE) obtidas nas 4 situações indicadas
na Tabela 5.21 eram estatisticamente diferentes entre si.
128
Tabela 5.21 - Síntese dos resultados obtidos considerando as clusterizações efetuadas com os
9 e 35 atributos.
Na maioria das cenas, os valores de ExAE obtidos considerando a
clusterização simultânea dos 9 atributos foram maiores do que os obtidos para a
clusterização simultânea de 35 atributos. Conforme esperado, o teste de Wilcox
indicou que esta diferença nos valores de ExAE para 9 e 35 atributos foi
estatisticamente significativa, com p valor de 0,028. Este resultado validou a hipótese
de que, a partir de certo número de atributos, a inserção de novas variáveis ao modelo
insere pouca ou nenhuma informação podendo inclusive prejudicar o desempenho do
clusterizador (HUGHES, 1968). Desta forma, a seleção de um conjunto reduzido de
atributos considerados significativos, é melhor do que a utilização de um amplo
conjunto de dados que também inclui atributos não representativos, os quais podem
prejudicar a performance do clusterizador.
Os Máximos valores de exatidão MExAE obtidos considerando a inserção
gradativa dos 9 e dos 35 atributos, apresentaram comportamento semelhante quando
comparados cena a cena. O teste de Wilcox confirmou, com um p valor de 0,068, que
não diferença estatisticamente significativa entre os valores de Máxima MExAE
obtidos para a melhor combinação dentre os 9 ou dentre os 35 atributos. Esse
resultado é de grande importância por validar a possibilidade de automatização do
sistema a partir de um conjunto reduzido de atributos. A Figura 5.32 disponibiliza a
espacialização das máximas MExAE obtidas considerando o melhor conjunto de
dados para o universo de 9 e de 35 atributos, indicando o número necessário de
atributos para alcançar estes índices.
A espacialização do resultado das clusterizações evidenciou que praticamente
não diferença em utilizar a melhor combinação de atributos obtida entre os 9 ou
entre os 35 atributos, o que reforçou a possibilidade de automatização.
129
Figura 5.32 - Espacialização dos melhores resultados da clusterização considerando o universo
de 9 e 35 atributos
130
Figura 5.32 - Continuação: Espacialização dos melhores resultados da clusterização
considerando o universo de 9 e 35 atributos
131
Figura 5.32 - Continuação: Espacialização dos melhores resultados da clusterização
considerando o universo de 9 e 35 atributos
Apesar da automatização considerando um número reduzido de
atributos padrão ter sido indicada como factível, a análise global dos resultados
evidenciou que, dentre as 11 cenas estudadas, o clusterizador foi capaz de convergir
um conjunto de clusters considerados satisfatórios, com ExAE maiores ou iguais a 0,5,
em apenas 4 cenas. Estes polígonos poderiam ser utilizados como entrada em um
sistema de classificação, entretanto, os demais prejudicariam a performance do
classificador uma vez que os atributos seriam calculados como base nestas
geometrias.
Do ponto de vista operacional
10
, a detecção automática de um ou mais alvos
escuros na imagem, mesmo que imprecisa, seria suficiente para acionar uma possível
operação de contingenciamento, mesmo com ExAE inferiores a 0,5. As cenas 3, 9 e
11 enquadram-se nessa interpretação. A Figura 5.33 apresenta a sobreposição dos
alvos escuros delineados como referência nos Phantons em vermelho, com os alvos
escuros detectados automaticamente pelo clusterizador em branco.
Figura 5.33 - Sobreposição dos Phantons com os resultados das clusterizações.
10
No contexto da tese a expressão “do ponto de vista operacional” remete à experiência que
consolidei durante 6 anos de atuação junto à PETROBRAS na gerência de Controle de
Contingências, tendo sido responsável pela atividade de Monitoramento Aéreo/Orbital.
Óleo
Óleo
Óleo
Óleos Biológicos
132
A cena 11 constitui um exemplo interessante do ponto de vista operacional por
mesclar, em um mesmo recorte de cena, óleo e assemelhados. Neste caso, mesmo
que os resultados da classificação fossem duvidosos em função da imprecisão
associada à geometria dos polígonos, uma verificação de campo seria necessária,
pois não haveria garantia de que nenhum dos filetes detectados como alvos escuros
poderia ser óleo.
Os resultados das clusterizações para as cenas 4, 5 e 10, foram muito mais
ruidosos e não poderiam ser considerados satisfatórios. Para todos estes casos, as
manchas de óleo foram identificadas e, operacionalmente, uma investigação sobre os
eventos seria efetuada. Entretanto, como os resultados foram muito confusos, uma
intervenção humana seria indispensável para indicar os polígonos de interesse. A
Figura 5.34 apresenta a sobreposição dos Phantons em vermelho, com os alvos
escuros clusterizados em branco.
Figura 5.34 - Sobreposição dos Phantons com os resultados das clusterizações.
Portanto, mesmo com imprecisão, os alvos escuros detectados poderiam ser
úteis para o acionamento das inspeções de campo. Entretanto, as geometrias não
apresentaram acurácia suficiente em relação ao Phanton para serem utilizadas como
dado de entrada em um sistema de classificação automática. Na pior hipótese, ao final
da classificação, um resultado errôneo poderia ocasionar falhas no processo de
combate a uma possível emergência envolvendo derramamento de óleo no mar.
Também não seria aconselhável armazenar geometrias imprecisas em um Banco de
Dados que tem por objetivo - além de registrar o número e o tipo dos eventos
detectados - fornecer conhecimento pretérito para retroalimentar o sistema automático
de detecção de óleo e assemelhados. O registro cumulativo de geometrias imprecisas
e, conseqüentemente, de atributos imprecisos no Banco de Dados poderia levar à
Óleo
Óleo
Baixo
Vento
Óleo
Óleos
Biológicos
133
ineficácia do sistema, confundindo o classificador na distinção dos alvos escuros em
óleo ou assemelhados.
Com base nesta análise quantitativa e qualitativa dos resultados da
clusterização, 5 cenas poderiam ser consideradas como satisfatórias sob a ótica do
sistema automático, as cenas 2, 6, 7, 8 e 11, representando 45% dos recortes de
cena. A primeira avaliação seria de que a performance do clusterizador não foi
satisfatória, entretanto, é preciso salientar que, para se chegar a essa conclusão,
seriam necessárias mais amostras, sempre considerando níveis de complexidade
diferenciados. No âmbito da tese desenvolvida, seria impossível trabalhar com mais
exemplos, considerando, a abrangência dos testes efetuados que avaliaram
parâmetros envolvidos em todas as etapas, desde o pré-processamento das imagens.
É importante destacar que, especialmente quando os alvos escuros estavam
associados a óleos biológicos, eventos difíceis de serem representados manualmente
devido ao inúmero conjunto de estruturas filiformes, a imprecisão associada ao
Phanton aumentou. Nestes casos, situações em que o clusterizador não incluiu
exageradamente áreas oceânicas como alvos escuros, uma menor ExAE nos
resultados da clusterização foi considerada satisfatória, como no exemplo da cena 11.
Em contrapartida, exemplos como o da cena 10 não foram aceitos devido à inclusão
exagerada de áreas oceânicas como parte dos alvos escuros.
A Figura 5.35 apresenta a ExAE dos resultados obtidos pelas clusterizações
realizadas para as 5 cenas consideradas satisfatórias, destacando a espacialização: a)
da intersecção dos alvos escuros: áreas detectadas corretamente como alvos escuros
pela clusterização em relação ao Phanton (em branco); b) da Omissão: áreas de alvos
escuro erroneamente clusterizadas como oceano (em vermelho); c) da Inclusão: áreas
de oceano erroneamente clusterizadas como parte dos alvos escuro (em azul) , e; d)
áreas detectadas corretamente como oceano pela clusterização em relação ao
Phanton (em preto).
Considerando que a contribuição relativa de cada atributo foi avaliada através
de inúmeras clusterizações efetuadas no conjunto de 9 e de 35 atributos, os
resultados obtidos representam o melhor desempenho do clusterizador em cada cena.
A dificuldade associada à detecção automática de óleo em imagens SAR é destacada
por inúmeros autores (TOPOUZELIS, 2008; TOPOUZELIS et al., 2007a; CHANG et al.
2008, BREKKE & SOLBERG, 2005), sendo os fatores que influenciam na performance
da detecção automática muito diversos. No âmbito dos experimentos realizados, as
134
observações a seguir buscam fornecer subsídios para enriquecer a interpretação dos
resultados obtidos.
Figura 5.35 Exatidão, Omissão e Inclusão nos resultados obtidos pelas clusterizações para
as 5 cenas consideradas satisfatórias.
O maior ou menor potencial de detecção associado ao clusterizador esteve
diretamente relacionado ao contraste existente entre os alvos escuros e o oceano.
Entre as cenas escolhidas a intensidade deste contraste foi muito variada, sem um
padrão referente à distribuição dos NC que fosse capaz de garantir que os mesmos
atributos utilizados em cenas diferentes oferecessem um mesmo desempenho ao
clusterizador.
Esta variação do contraste entre alvos escuros e oceano, dificultando o
processo de clusterização, também esteve presente no contexto de uma mesma cena,
sendo influenciada pela variação das condições meteo-oceanográficas na superfície
do mar (cenas: 9, 10 e 11) e pela presença de falhas no imageamento (cena: 4). Os
inúmeros fatores que influenciam esta ampla variação do contraste entre as cenas e
nas cenas, os quais podem ocasionar o cálculo de atributos inexpressivos para o
agrupamento das regiões, estão detalhados no Capitulo 2 sendo os principais: ângulo
de incidência; presença do ruído speckle; parâmetros de largura da faixa, resolução
espacial, freqüência do sinal e polarização associados ao modo de imageamento do(s)
sensor(es); condições meteo-oceanográficas; quantidade e o tipo de óleo vazado;
intervalo de tempo entre o vazamento e o momento da aquisição da imagem; grau de
135
intemperismo das manchas, dentre outros. As características do imageamento SAR
em áreas oceânicas que dificultam a implementação de procedimentos automáticos
encontram-se detalhadas no Capitulo 2 - item 2.2.
Além dos fatores citados, a alteração das propriedades estatísticas ocasionada
pela compactação/descompactação das imagens no formato MrSid (Capitulo 4: item
4.1), também influenciou no desempenho das clusterizações, uma vez que as
propriedades dos atributos calculados diferem dos calculados a partir de imagens
originais. Para avaliar o quanto este formato de fato influenciou positivamente ou
negativamente nos resultados, seria necessário efetuar clusterizações com os
mesmos atributos calculados a partir de imagens no formato original. Entretanto, como
o objetivo da tese estava focado no desenvolvimento de um método passível de ser
implementado operacionalmente, imagens no formato original não foram utilizadas.
De certa forma, o que mais contribuiu para que os resultados da clusterização
não fossem melhores foi o rigor utilizado na escolha dos recortes de cena estudados.
Se as cenas tivessem sido recortadas sempre individualizando um único alvo com um
bom contraste em relação ao oceano (priorizando eventos relacionados a óleo) - como
frequentemente observado na literatura disponível um maior número de cenas teria
atingido o critério de Exatidão de Alvos Escuros (ExAE) necessário para que a
clusterização fosse considerada satisfatória.
Uma reflexão importante é que a escolha dos exemplos a serem testados para
validar um sistema automático pode tornar-se altamente tendenciosa. A importância
da escolha das cenas teste é tal que, a conclusão de que um sistema proposto é
automático e pode ser utilizado operacionalmente, pautada unicamente em exemplos
de fácil reconhecimento, pode representar uma falácia.
Os recortes de cena consideraram desde exemplos comumente encontrados
na literatura (cenas 2, 3 e 6), onde manchas de óleo com geometria bem definida e
bom contraste em relação ao oceano foram selecionadas, até exemplos de maior
complexidade em que ocorrências de óleo e assemelhados foram processadas
simultaneamente (cenas 5, 10 e 11). Nesta escolha, a habilidade, tanto dos
segmentadores como do clusterizador, em detectar alvos em diferentes escalas e com
diferentes geometrias também foi avaliada. Alvos com geometria complexa associados
a óleos biológicos e florescimento de algas também foram considerados isoladamente
em alguns exemplos (recortes de cenas 1 e 8).
136
Esta dificuldade foi imposta ao clusterizador propositalmente, para que os
resultados pudessem ser replicados e o método utilizado em outras imagens,
justamente por ter sido definido considerando exemplos com nível diferenciado de
dificuldade. Esta seleção buscou refletir ao máximo a realidade encontrada nas
imagens SAR, incluindo até problemas no imageamento que podem ocorrer durante a
aquisição das imagens pelo sensor ou no processamento das imagens, sendo visível a
descontinuidade existente entre as faixas de imageamento na cena 4. Para esta cena,
o clusterizador não conseguiu encontrar uma boa solução uma vez que não havia um
comportamento padrão para os intervalos de NC, capaz de diferenciar os alvos
escuros do oceano ao longo da mesma cena. Exemplo semelhante foi observado na
cena 10, onde filetes de óleos biogênicos ocorreram simultaneamente sobrepostos a
uma área com uma baixa intensidade de vento, reduzindo seu contraste na cena.
O aspecto negativo relacionado à escolha dos recortes de cena, foi que os
resultados atingidos pelo clusterizador não foram satisfatórios para a maioria das
cenas. O aspecto positivo foi o esforço realizado para interpretar os resultados,
entender as propriedades dos atributos utilizados, evidenciando a necessidade da
continuidade das pesquisas considerando estes exemplos que se aproximem da
realidade encontrada nas imagens SAR. A busca de novos métodos de pré-
processamento de imagens, que possam melhorar o contraste entre os alvos escuros
e o oceano aprimorando a qualidade dos atributos calculados e, conseqüentemente, a
performance do clusterizador, é uma linha de investigação interessante, considerando
os inúmeros fatores que prejudicam a detecção dos alvos escuros em imagens SAR.
Para dar continuidade à pesquisa proposta foi preciso avançar para o próximo
passo, verificar a possibilidade de fixar o número de atributos necessários para
automatizar o sistema. Retornando aos resultados da Tabela 5.21, a Média indicou 5
atributos e a Mediana 4 atributos como necessários para se atingir a Máxima Exatidão
MExAE, selecionando-os a partir do conjunto de 9 atributos indicados pela análise
efetuada na Tabela 5.19. Estas indicações reforçaram a seleção de atributos efetuada
pelo método de chi-quadrado, o qual também indicou que, de maneira geral,
considerando os 36 atributos, as maiores importâncias estavam concentradas entre os
4 e 5 primeiros atributos, sendo reduzidas abruptamente nos atributos subseqüentes.
Os gráficos com o ranking da importância obtida para os 36 atributos para cada cena,
durante a etapa de seleção dos atributos, estão disponíveis para consulta no
APÊNDICE V.
137
A fim de subsidiar a decisão sobre a utilização de 4 ou 5 atributos, o teste não
paramétrico de Wilcox foi efetuado para verificar se a diferença entre os índices de
ExAE obtidos para as 11 cenas com 4 e 5 atributos (Tabela 5.22) são estatisticamente
significativas.
Tabela 5.22 Índices de ExAE obtidos para as 11 cenas com 4 e 5 atributos.
Com um p-valor de 0,68, o teste evidenciou que não há diferença
estatisticamente significativa entre as ExAE obtidas com 4 ou 5 atributos, indicando
que a escolha entre 4 ou 5 atributos não faria diferença na implementação automática
de um sistema para detecção de alvos escuros em imagens SAR.
Apesar dos clusters obtidos considerando 4 ou 5 atributos serem visualmente
semelhantes para a maioria das cenas (Figuras 5.21 a 5.30), na cena 11 (Figura 5.31)
a utilização do atributo melhorou significativamente o resultado da clusterização.
Como não foram obtidos dados conclusivos, decidiu-se manter os 5 atributos para
compor o método de detecção de alvos escuros em imagens SAR, considerando que
para a cena 11 o atributo foi essencial para o bom desempenho do clusterizador.
Excluindo o atributo de Mínimo, o atributo corresponde a uma métrica de textura, o
GLCM da Média. Este atributo foi selecionado entre os 5 primeiros em 8 cenas e entre
os 6 primeiros em 3 cenas (Capitulo 5: item 5.4.2.4). A Figura 5.36 destaca as
diferenças encontradas entre os clusters utilizando 4 e 5 atributos para a cena 11.
Figura 5.36 - Diferenças encontradas entre os clusters utilizando 4 e 5 atributos para a cena 11.
Ter considerado a contribuição relativa de cada atributo selecionado para
detectar os diferentes tipos de alvos foi muito importante, pois forneceu subsídios para
entender quais são as propriedades dominantes nas imagens e na geometria das
138
regiões que retornam os melhores contrastes nas cenas. Entretanto, para investigar a
possibilidade de automatização do sistema, foi necessário utilizar os atributos mais
recorrentes na seleção, sendo estes considerados os mais estáveis para serem
utilizados como padrão. Neste contexto, os atributos estatísticos de primeira ordem
Mediana, Média, Moda e Máximo, juntamente com o atributo Textural GLCM da Média,
mostraram-se mais robustos por terem sido selecionados de forma recorrente em
todas as cenas estudadas e validados com os resultados das clusterizações.
Importante destacar que apesar de existir multicolinearidade entre estes
atributos (Item 5.4.2.4; APÊNDICE III), a sua utilização simultânea no FP foi o que
gerou os melhores resultados para as clusterizações, validando esta seleção.
Exemplos como o das cenas 4, 5, 8 e 11 evidenciaram que utilizando somente a
Mediana e a Média os resultados não ficaram bons, ao inserir a Moda os clusters
melhoraram significativamente (cenas 4, 5 e 8) e ao inserir o atributo de Máximo e
GLCM da Média os clusters também melhoraram para a cena 11.
Com o objetivo de verificar se a seleção efetuada pelo chi-quadrado foi
adequada, testes de seleção foram efetuados com mais 2 métodos implementados no
software Weka, utilizando o método de avaliação por subconjuntos e dois métodos de
busca, algoritmos genéticos (AG) e Greedy Stepwise
11
(GSTW). A busca efetuada
pelo AG retornou 12 atributos sendo que todos os atributos estatísticos de primeira
ordem multicorrelacionadas foram inclusos (Média, Mediana, Moda, Mínimo e Máximo)
e a clusterização efetuada teve um bom resultado. A busca efetuada pelo GSTW
retornou 6 atributos decorrelacionados, incluindo somente a Moda, a clusterização
efetuada teve um resultado não satisfatório. Importante destacar que estes testes
foram efetuados com a cena considerada mais fácil (cena 2), indicando que a exclusão
dos atributos estatísticos de primeira ordem prejudica o reconhecimento de padrões.
A validação do método proposto e do conjunto de atributos selecionado foi
realizada nos próximos dois itens nos quais os resultados obtidos automaticamente
pelo FP no software Clustan foram comparados: a) com os resultados obtidos por
métodos semi-automáticos aplicados às 11 cenas utilizadas ao longo da tese (item
5.4.4), e; b) com os resultados obtidos para os três novos recortes de cena escolhidos
para validar o método proposto, utilizando os parâmetros definidos em cada uma das
etapas da tese (item 5.5).
11
Greedy Stepwise: combina a abordagem forward e backward durante a regressão.
139
5.4.4 Comparação entre os Métodos Automático e Semi-automático
As classificações supervisionadas foram efetuadas com os algoritmos de
Máxima Verossimilhança (Maxver) e Máquina de Suporte Vetorial (Suporte Vector
Machine - SVM) para as 11 cenas, considerando os 5 melhores atributos. Os
resultados provenientes da utilização de limiarização, processados para cada cena no
Capitulo 5: item 5.3, também foram utilizados com o objetivo de proporcionar uma
maior comparação do método automático com diferentes métodos supervisionados.
A limiarização foi realizada com uma maior intervenção humana em relação
aos demais métodos supervisionados. A segmentação por crescimento de regiões foi
realizada automaticamente, entretanto, a definição do limiar ideal para o agrupamento
dos alvos escuros foi definido interativamente avaliando, através de interpretação
visual, qual foi o melhor valor de corte que retornou clusters mais próximos aos
indicados nos Phantons. Para os métodos Maxver e SVM, a intervenção humana
ocorreu na seleção das amostras.
Para realizar as classificações com os algoritmos Maxver e SVM, um arquivo
de imagem contendo 5 bandas foi gerado no software ENVI, onde cada banda
correspondia a espacialização de 1 dos 5 atributos padronizados nas regiões
resultantes das segmentações (Mediana, Média, Moda, Máximo e GLCM da Média).
Amostras de treinamento a serem utilizadas pelos classificadores testados foram
selecionadas para representar o comportamento estatístico dos alvos escuros e do
oceano. Como o objetivo deste item não era realizar uma análise aprofundada sobre
os métodos supervisionados para detecção de alvos escuros, mas apenas fornecer
exemplos para comparação com o método não supervisionado, não foram
investigados os melhores parâmetros a serem utilizados em cada algoritmo. O Maxver
e o SVM foram processados considerando as mesmas amostras de treinamento e os
mesmos parâmetros de entrada no software ENVI.
O Maxver foi escolhido por ser considerado um dos métodos mais comumente
utilizados em classificação supervisionada. Apesar deste classificador ser utilizado
para processamentos no nível do pixel, nos experimentos efetuados o algoritmo
considerou como unidade de processamento as regiões produzidas pelas
segmentações. O Maxver considera como referência os parâmetros estatísticos das
amostras de treinamento, fornece uma probabilidade de cada região pertencer a um
alvo escuro ou ao oceano e pondera as distâncias entre as médias dos atributos nas
regiões (ENVI). O único parâmetro exigido pelo software para o processamento é
140
denominado fator de escala, sendo definido em função da resolução radiométrica da
imagem. Como os dados utilizados estavam em 8 bits e o fator de escala é definido
como 2
n
-1, onde n representa o intervalo de NC correspondente aos bits da imagem, o
fator de escala utilizado foi 255.
A classificação com SVM foi escolhida por ser um procedimento considerado
eficiente para prover bons resultados a partir de dados complexos e ruidosos, como é
caso das imagens SAR (ENVI). Pesquisas realizadas por BENTZ (2006) indicaram o
SVM como método de classificação automática eficaz para a separação de óleo e
assemelhados. MERCIER & ARDHUIN (2005 a e b) também utilizaram SVM para a
detecção de óleo e assemelhados. A classificação por SVM está fundamentada na
teoria de aprendizagem estatística (VAPNICK, 1998), buscando otimizar a separação
do conjunto de dados em classes distintas a partir de uma superfície de decisão que
maximiza a distância existente entre as classes. Esta superfície é denominada
hiperplano e os dados próximos ao hiperplano são denominados vetores de suporte.
Mesmo que esta superfície apresente um comportamento não linear, os dados de
entrada são transformados, utilizando uma série de funções matemáticas (funções de
núcleo) para obter um novo conjunto de dados que possa ser linearmente separável
(BURGHES, 1998).
Os parâmetros a serem definidos no software para o SVM são: a) o tipo da
função Kernel: definida como a função de núcleo radial (RBF), indicada por geralmente
apresentar bons resultados e por ter oferecido a melhor performance para a separação
de óleo e assemelhados nos estudos realizados por BENTZ (2006); b) o critério de
penalização, que aceita níveis de imprecisão associados à classificação definidos com
o maior rigor como 100, não aceitando níveis de imprecisão, e; c) o parâmetro Gamma
a ser utilizado na função Kernel, definido como 0,2 por corresponder ao inverso no
número de bandas utilizadas (1/5). A Figura 5.37 disponibiliza os resultados das
classificações automáticas e semi-automáticas realizadas para cada recorte de cena.
141
Figura 5.37 Resultados obtidos pela utilização de técnicas automáticas e semi-automáticas
na detecção de alvos escuros em imagens SAR.
142
Figura 5.37 Continuação: Resultados obtidos pela utilização de técnicas automáticas e semi-
automáticas na detecção de alvos escuros em imagens SAR.
143
Figura 5.37 Continuação: Resultados obtidos pela utilização de técnicas automáticas e semi-
automáticas na detecção de alvos escuros em imagens SAR.
A interpretação visual dos resultados indicou que, de maneira geral, os
métodos semi-automáticos conseguiram retornar clusters mais representativos e,
conseqüentemente, geometrias mais precisas para os alvos escuros, delineando com
maior acurácia os limites que os separam do oceano. Este resultado era esperado à
medida que estes métodos contam com o auxílio das amostras de treinamento no
processo de reconhecimento de padrões.
Entretanto, é visualmente notável a boa performance automática do Clustan e
dos atributos utilizados na identificação dos alvos escuros existentes nas cenas 2 e 6,
sendo equivalente aos métodos supervisionados. Mesmo considerando uma menor
precisão nas bordas, nas cenas 8 e 11 a performance automática também pôde ser
considerada equivalente à dos métodos supervisionados, à medida que todos os
métodos erraram incluindo ou omitindo regiões. Nas cenas 3 e 9 os semi-automáticos
forneceram melhor resultado, entretanto, desconsiderando a confusão do clusterizador
automático no canto dos recortes, os alvos escuros também foram detectados.
Para as cenas 4, 5 e 10 o método automático teve uma performance
visualmente inferior aos semi-automáticos, detectou as manchas de óleo, mas
apresentou ruído na região oceânica e nas bordas dos assemelhados. Na cena 1,
todos os métodos apresentaram menor ruído no oceano, mas os alvos escuros foram
detectados melhor pelos supervisionados Limiarização e Maxver.
A fim de subsidiar a interpretação dos resultados obtidos com dados
quantitativos a Tabela 5.23 disponibiliza as métricas de avaliação calculadas para
cada método utilizado e a Figura 5.38 apresenta a espacialização destas métricas.
Com exceção das cenas 2 e 6, contendo alvos escuros considerados fáceis de
serem separados do oceano, todos os métodos - automático e supervisionados -
144
apresentaram erros de inclusão ou de omissão em maior ou menor escala. Estes erros
foram perceptíveis visualmente nos recortes de cena em que foram considerados
alvos muito filamentosos como os óleos biológicos (recortes 1, 10 e 11). Conforme
comentado anteriormente para esse tipo de alvo a própria confecção manual dos
Phantons possui uma maior imprecisão associada. Nestes casos, considerados
complexos de serem solucionados pelos clusterizadores, observa-se que os diferentes
métodos erraram incluindo ou omitindo regiões.
Tabela 5.23 - Métricas de avaliação calculadas para os resultados das clusterizações efetuadas
pelos métodos automático e semi-automático
145
Figura 5.38 Resultados obtidos pela utilização de técnicas automáticas e semi-automáticas
na detecção de alvos escuros em imagens SAR.
146
Figura 5.38 Continuação: Resultados obtidos pela utilização de técnicas automáticas e semi-
automáticas na detecção de alvos escuros em imagens SAR.
147
Figura 5.38 Continuação: Resultados obtidos pela utilização de técnicas automáticas e semi-
automáticas na detecção de alvos escuros em imagens SAR.
No caso do recorte de cena 1, apesar das melhores performances terem sido
obtidas pelos métodos de Limiarização e Maxver, estes foram os que mais omitiram
filamentos associados aos alvos escuros. O Clustan e o SVM erraram no sentido
contrário, incluindo áreas de oceano como parte dos alvos escuros. De maneira geral,
considerando a complexidade geométrica deste alvo o Maxver foi, visualmente
(Figuras 5.37 e 5.38), o método que melhor conseguiu representar a estrutura
filamentar.
No recorte de cena 10, as melhores ExAE foram obtidas pelos métodos de
Limiarização e SVM. Os supervisionados omitiram mais áreas em relação ao Phanton,
entretanto, o Clustan incluiu exageradamente regiões oceânicas como parte dos óleos
biológicos. A presença de uma superfície menos rugosa, influenciada por uma baixa
intensidade de vento ocorrendo simultaneamente no mesmo local dos óleos
biológicos, prejudicou a definição dos clusters. Visualmente (Figuras 5.37 e 5.38) os
melhores métodos foram a Limiarização e o SVM, com resultados similares.
De forma diferente das demais, a cena 11 pôde ser considerada bem
clusterizada pelos 4 métodos avaliados (Figuras 5.37 e 5.38). O Clustan retornou a
menor ExAE, por ter cometido mais erros de inclusão. Entretanto, todos os métodos
cometeram erros em função da estrutura filamentar de baixo contraste em relação ao
oceano, sendo que os supervisionados erraram mais omitindo regiões. A Figura 5.39
ilustra detalhes das cenas 1, 10 e 11, ampliando os trechos onde a densa malha de
filamentos provenientes dos óleos biogênicos dificultou os processamentos. Os
gráficos disponíveis na Figura 5.40 também auxiliam na interpretação quantitativa dos
resultados.
148
Figura 5.39 Ampliação da malha de filamentos provenientes de óleos biogênicos existentes
nas cenas 1, 10 e 11.
Erros exagerados de inclusão pelo software Clustan também foram observados
nas cenas 4 e 5. A tendência obtida para a ExAE foi semelhante nas 2 cenas
conforme indicado nos gráficos da Figura 5.40, sendo a Limiarizacão e o SVM os
métodos que retornaram os melhores índices. Na cena 4 a descontinuidade na
variação dos NC entre as faixas imageamento do RADAR prejudicou a separação
automática das manchas de óleo do oceano. A utilização de amostras de treinamento
possibilitou que os métodos supervisionados alcançassem melhor desempenho em
relação ao Clustan. A Figura 5.41 disponibiliza detalhes da cena, ampliando os
resultados das clusterizações na localização dos alvos escuros.
Figura 5.40 Gráfico com os Erros de Omissão, de Inclusão e as ExAE obtidas para os
métodos automático e semi-automáticos em cada recorte de cena.
CENA 1
0,02
0,03
0,21
0,34
0,08
0,17
0,29
0,33
0,51
0,60
0,38
0,61
0,00
0,20
0,40
0,60
0,80
1,00
Clustan Limiarização MaxVer SVM
0,00
0,20
0,40
0,60
0,80
1,00
Omissão Inlcusão Gforma
CENA 2
0,01
0,12
0,19
0,12
0,12
0,00
0,07
0,00
0,80
0,51
0,80
0,75
0,00
0,20
0,40
0,60
0,80
1,00
Clustan Limiarização MaxVer SVM
0,00
0,20
0,40
0,60
0,80
1,00
Omissão Inlcusão Gforma
CENA 3
0,00
0,00
0,48
0,51
0,46
0,00
0,04
0,94
0,52
0,47
0,31
0,50
0,00
0,20
0,40
0,60
0,80
1,00
Clustan Limiarização MaxVer SVM
0,00
0,20
0,40
0,60
0,80
1,00
Omissão Inlcusão Gforma
CENA 4
0,05
0,24
0,29
0,41
0,27
0,22
0,15
0,05
0,51
0,17
0,38
0,40
0,00
0,20
0,40
0,60
0,80
1,00
Clustan Limiarização MaxVer SVM
0,00
0,20
0,40
0,60
0,80
1,00
Omissão Inlcusão Gforma
149
Figura 5.40 Gráfico com os Erros de Omissão, de Inclusão e as ExAE obtidas para os
métodos automático e semi-automáticos em cada recorte de cena.
CENA 5
0,00
0,19
0,24
0,51
0,20
0,03
0,24
0,44
0,63
0,47
0,25
0,61
0,00
0,20
0,40
0,60
0,80
1,00
Clustan Limiarização MaxVer SVM
0,00
0,20
0,40
0,60
0,80
1,00
Omissão Inlcusão Gforma
CENA 6
0,01
0,39
0,39
0,72
0,39
0,01
0,02
0,00
0,27
0,31
0,44
0,54
0,00
0,20
0,40
0,60
0,80
1,00
Clustan Limiarização MaxVer SVM
0,00
0,20
0,40
0,60
0,80
1,00
Omissão Inlcusão Gforma
CENA 7
0,05
0,02
0,10
0,16
0,08
0,08
0,05
0,16
0,85
0,80
0,44
0,86
0,00
0,20
0,40
0,60
0,80
1,00
Clustan Limiarização MaxVer SVM
0,00
0,20
0,40
0,60
0,80
1,00
Omissão Inlcusão Gforma
CENA 8
0,01
0,02
0,05
0,30
0,21
0,02
0,29
0,19
0,74
0,68
0,56
0,73
0,00
0,20
0,40
0,60
0,80
1,00
Clustan Limiarização MaxVer SVM
0,00
0,20
0,40
0,60
0,80
1,00
Omissão Inlcusão Gforma
CENA 9
0,02
0,14
0,24
0,26
0,20
0,09
0,10
0,01
0,67
0,25
0,52
0,76
0,00
0,20
0,40
0,60
0,80
1,00
Clustan Limiarização MaxVer SVM
0,00
0,20
0,40
0,60
0,80
1,00
Omissão Inlcusão Gforma
CENA 10
0,06
0,03
0,29
0,28
0,29
0,03
0,23
0,58
0,57
0,46
0,18
0,57
0,00
0,20
0,40
0,60
0,80
1,00
Clustan Limiarização MaxVer SVM
0,00
0,20
0,40
0,60
0,80
1,00
Omissão Inlcusão Gforma
CENA 11
0,05
0,46
0,38
0,60
0,10
0,53
0,23
0,03
0,32
0,32
0,34
0,38
0,00
0,20
0,40
0,60
0,80
1,00
Clustan Limiarização MaxVer SVM
0,00
0,20
0,40
0,60
0,80
1,00
Omissão Inlcusão Gforma
VALORES MÉDIOS
0,03
0,13
0,32
0,32
0,24
0,04
0,16
0,32
0,61
0,52
0,36
0,58
0,00
0,20
0,40
0,60
0,80
1,00
Clustan Limiarização MaxVer SVM
0,00
0,20
0,40
0,60
0,80
1,00
Omissão Inlcusão Gforma
150
Figura 5.41 Detalhes da cena 4, ampliando os resultados das clusterizações para os alvos
escuros.
Na cena 5 foi perceptível a maior confusão e ruído nos resultados do Clustan
para os alvos escuros relacionados a baixas intensidades de vento localizadas em
pontos extremos do recorte de cena. A Figura 5.42 ilustra a clusterização destes alvos
em detalhes para os 4 métodos avaliados, evidenciando que a geometria resultante
varia muito entre eles. Esta diversidade de resultados reforça a dificuldade imposta
aos clusterizadores por eventos de baixas intensidades de vento, os quais possuem
bordas freqüentemente sem limites bem definidos em relação ao oceano.
As Figuras 5.43 e 5.44 ilustram detalhes da performance dos diferentes
métodos para a detecção manchas de eventos de óleo com tamanho e contraste
variados na cena 5. Foi perceptível que todos os métodos testados tiveram dificuldade
na detecção das manchas menores com contraste menos intenso em relação ao
oceano, errando incluindo (Clustan) ou excluindo regiões parcial ou completamente
(Limiarização, Maxver e SVM).
Figura 5.42 Detalhes da cena 5, ampliando os resultados das clusterizações para os alvos
escuros relacionados a baixas intensidades de vento.
Detalhe I
Detalhe II
Detalhe I
Detalhe II
151
Figura 5.43 Detalhes da cena 5, ampliando os resultados das clusterizações para os alvos
escuros relacionados a óleo.
Figura 5.44 Detalhes da cena 5, ampliando os resultados das clusterizações para os alvos
escuros relacionados a óleo.
Considerando que a ExAE diminui com o aumento dos erros de inclusão e/ou
de omissão, em 8 das 11 cenas estudadas, o Clustan teve um comportamento inverso
do observado para os métodos supervisionados, cometendo mais erros de inclusão do
que de omissão, conforme evidenciado no gráfico da Figura 5.40 (valores médios). Um
exemplo interessante é o do recorte de cena 8, em que as melhores ExAE foram
obtidas de forma semelhante para o Clustan e para o SVM, entretanto, os tipos de
erros cometidos foram opostos.
Como, no contexto das imagens SAR, todo alvo escuro tem uma probabilidade
de estar associado a óleo (KARATHANASSI et al., 2006), sendo preferível errar
aumentando as áreas estimadas como suspeita de óleo do que omitir um possível foco
de vazamento que pode tornar-se uma emergência ambiental. Entretanto, embora
estas geometrias imprecisas contribuam para o acionamento das inspeções de campo,
no sistema automático prejudicariam a classificação. Num estágio posterior, uma
auditoria no Banco de Dados seria necessária para indicar as geometrias que
Detalhe I
Detalhe II
Detalhe I
Detalhe II
152
precisariam ser refeitas a fim de evitar uma propagação de erros capaz de prejudicar a
performance automática de sistemas baseados em conhecimento.
A média dos resultados (Figura 5.40) evidenciou que a melhor performance foi
obtida pelo SVM seguida da Limiarização. A Limiarização foi comparada apenas para
evidenciar como uma intervenção humana pode melhorar a qualidade dos resultados.
Não seria viável automatizar este processo, pois os limiares foram definidos
arbitrariamente, de forma interativa para cada cena, sendo impossível replicar
operacionalmente a mesma eficácia dos resultados com novas aquisições. A técnica
de Limiarização é freqüentemente utilizada na literatura (Capitulo 3), mas com uma
abordagem automática, onde os limiares podem ser calculados de forma Global ou
Local (Adaptativamente). Entretanto, inúmeros autores (KARANTZALOS &
ARGIALAS, 2008; CHANG et al., 2008; TOPOUZELIS et al., 2007a; KARATHANASSI
et al., 2006; SOLBER & SOLBERG, 1996) destacam a fragilidade destes métodos
para agrupar pixels ou regiões (Capitulo: 3). A Figura 5.45 compara a performance do
agrupamento realizado pelo Clustan, considerando as regiões da segmentação, e pelo
K-means tradicional aplicado diretamente sobre os pixels, enfatizando o ganho
associado aos processamentos efetuados a partir de regiões ao invés de pixels.
Figura 5.45 - Comparação entre o agrupamento realizado: a) pelo Clustan, considerando as
regiões da segmentação, e; b) pelo K-means tradicional aplicado diretamente sobre os pixels.
153
Embora os resultados obtidos com a clusterização automática não tenham sido
100% eficazes, não seria justo afirmar que o procedimento não é passível de
automatização. Uma breve comparação com os diferentes métodos e respectivos
resultados disponíveis na literatura é interessante, buscando evidências do que os
diversos autores consideraram como um bom resultado e um procedimento
automático. Neste contexto, a Figura 5.46 disponibiliza as imagens originais e os
resultados obtidos para a detecção de alvos escuros a partir de métodos considerados
automáticos pelos referidos autores, comparando-os aos resultados obtidos na tese.
Na figura, para cada autor foram identificados: a) se o mesmo trabalhou no nível do
pixel ou das regiões; b) qual o tipo de segmentação ou classificação utilizada para
separar os alvos escuros do oceano, e; c) se algum tipo de pós-processamento foi
utilizado para agrupar os polígonos.
Figura 5.46 Comparação entre resultados obtidos por diferentes métodos automáticos de
detecção de alvos escuros disponíveis na literatura e os obtidos na pesquisa desenvolvida.
Óleo
Óleo
Óleo
Óleo
Assemelhados
Óleo
Óleo
Óleo
Óleo
Óleo
Óleo
154
De acordo com os exemplos selecionados, os resultados obtidos por MERCIER
& ARDHUIN (2005a) e TOPOUZELIS et al. (2007a) reforçaram as vantagens de se
trabalhar com regiões ao invés de pixels. Apesar dos alvos escuros terem sido
detectados o resultado é mais ruidoso na região oceânica (background), conforme
indicado nas imagens. De forma contrária, os resultados produzidos nos estudos
desenvolvidos na tese, por CHANG et al. (2005) e por KARATHANASSI et al. (2006),
evidenciaram que o ruído, referente à indicação de áreas oceânicas como alvos
escuros, é bem menor se os processamentos forem efetuados a partir de regiões e
não de pixels. Outros autores como TOPOUZELIS et al. (2009), KERAMITSOGLOU et
al. (2006) GALLAND et al. (2003 e 2004) também abordaram as vantagens de se
trabalhar com pixels ao invés de regiões para a detecção de alvos escuros.
A maioria dos trabalhos que declararam suas metodologias como plenamente
automáticas mostraram resultados considerando recortes de cena com alvos
individuais isolados e geralmente com bom contraste em relação ao entorno, conforme
exemplificado na Figura 5.46. A utilização de recortes de cena contendo mais de um
alvo escuro em diferentes escalas é escassa na literatura, e de recortes de cena com
ocorrências simultâneas de óleo e assemelhados mais escassos ainda. Isto é um
ponto essencial a ser tratado, considerando que um sistema plenamente automático
precisaria funcionar sem a intervenção humana, processando cenas inteiras lidando,
não apenas com a diversidade e a escalabilidade dos alvos escuros, mas também
com as variações dos NC que podem ocorrer em uma mesma cena.
Esta preocupação é recorrente na literatura onde, apesar de diversos autores
(CHANG et al., 2005 e 2008; TOPOUZELIS et al., 2007a e 2004; KARATHANASSI et
al., 2006; MERCIER & ARDHUIN, 2005a e b) terem considerado seus métodos
automáticos, indicaram a necessidade de efetuar mais testes com diferentes imagens,
contendo diferentes tipos de alvos escuros com geometrias e texturas diferenciadas
em diferentes condições meteo-oceanográficas. TOPOUZELIS et al. (2007a) ainda
destacaram como perspectiva futura a necessidade de processar simultaneamente
óleo e assemelhados em um mesmo recorte de cena.
Observando os exemplos disponíveis na Figura 5.46, considerados
automáticos pelos respectivos autores, o método proposto na tese também poderia ser
considerado automático. Entretanto, conforme comentado no item 5.4.3, esta
conclusão é muito subjetiva e dependente dos tipos de alvos e da complexidade dos
recortes de cena utilizados nos experimentos. A Figura 5.47 disponibiliza exemplos de
metodologias que utilizaram recortes de cena, com alvos escuros considerados difíceis
155
de serem detectados automaticamente. Na figura, para cada autor foram identificados:
a) se o mesmo trabalhou no nível do pixel ou das regiões; b) qual o tipo de
segmentação ou classificação utilizada para separar os alvos escuros do oceano, e; c)
se algum tipo de pós-processamento foi utilizado para agrupar os polígonos.
Figura 5.47 Comparação entre resultados obtidos por diferentes métodos automáticos de
detecção de alvos escuros disponíveis na literatura e os obtidos na pesquisa desenvolvida.
Os métodos propostos por KARATHANASSI et al. (2006) e por GASULL et al.
(2002) detectaram alvos de geometria complexa difíceis de serem separados do
oceano. Diferente dos demais autores KARATHANASSI analisou em uma mesma
cena óleo e assemelhado, conseguindo um bom resultado na separação das regiões
Óleos
Biológicos
Óleos
Biológicos
Óleo
Óleos
Biológicos
Baixa Intensidade
de Vento
Óleo
Óleos
Biológicos
Óleo
Floresc.
de Algas
156
com baixa intensidade de vento e com óleo do oceano. KARATHANASSI considerou
seu método automático, mas ainda não operacional em função do custo
computacional requerido, cerca de 2h. Uma fragilidade associada aos métodos
propostos por KARATHANASSI e por GASULL é a utilização de limiarização para
agrupar as regiões resultantes da segmentação em alvos escuros e oceano. Conforme
comentado anteriormente, a limiarização automática pode não retornar bons
resultados para todas as imagens, por ser sensível a variações nas condições meteo-
oceanográficas predominantes na superfície do mar no momento da aquisição das
imagens. De certa forma, todos os métodos sofrerão com a variabilidade dos
intervalos de NC associados aos alvos escuros de cena para cena, por ser uma
característica inerente aos dados SAR.
Os resultados obtidos automaticamente pelo Clustan nas cenas 8 e 11,
contendo alvos igualmente difíceis de serem separados do oceano, também foram
considerados satisfatórios. Na cena 11 foram detectados alvos escuros derivados da
presença de assemelhados e de óleo. Considerando estes resultados o método
proposto poderia ser considerado automático. Entretanto, conforme comentado
anteriormente, os resultados obtidos pelo Clustan não foram aceitáveis para todas as
complexidades de cenas e de tipos de alvos selecionados. Nestas circunstâncias,
considerar que o método é automático e poderia ser reutilizado em qualquer nova
imagem SAR, garantindo a mesma eficácia no reconhecimento de padrões associados
a alvos escuros e oceano, não seria aceitável.
Especialmente nesta etapa da cadeia de processamentos, considerada a mais
importante por definir a geometria dos alvos escuros que será utilizada em todas as
etapas posteriores, tanto para o cálculo de atributos quanto para a classificação destes
alvos em óleo e assemelhados, a acurácia é um fator a ser considerado. Uma
alternativa seria criar um sistema híbrido onde a etapa de detecção dos alvos escuros
seria feita com a intervenção humana, de forma supervisionada, para gerar geometrias
mais precisas para a etapa de classificação automática. Este sistema poderia utilizar
para a detecção de alvos escuros um classificador semi-automático como o SVM, a
qual apresentou potencial nos testes efetuados.
ANGIULI et al. (2006), MONTALI et al (2006) e PELIZZARI & DIAS (2003)
utilizaram métodos supervisionados para a detecção de alvos escuros em imagens
SAR. Nestes sistemas a intervenção humana pode ocorrer em várias etapas do
processo: a) indicando para o sistema quais são as áreas de interesse; b) definindo o
limiar para separação dos alvos escuros do oceano interativamente, caso o cálculo
157
automático não tenha retornado resultados satisfatórios, e/ou; c) selecionando
amostras de treinamento para a etapa de classificação em óleo e assemelhados.
Outra opção seria mesclar, na etapa de detecção de alvos escuros,
procedimentos automáticos e semi-automáticos, com o objetivo de aproveitar a
performance automática do método proposto nas situações em que os resultados
foram favoráveis. A sugestão seria criar uma regra de decisão a ser confrontada a
cada nova imagem, onde seriam indicadas as cenas a serem processadas
automaticamente e as cenas que necessitariam de supervisão. O item 5.5 buscou
verificar a possibilidade de se utilizar uma regra de decisão válida para indicar o
processamento automático ou semi-automático.
5.5 Regra de Decisão e Validação do Modelo Proposto
Conforme evidenciado nos exemplos discutidos anteriormente, apesar da
diversidade das pesquisas desenvolvidas e dos inúmeros métodos e algoritmos
utilizados para a detecção de alvos escuros e classificação de óleo e assemelhados
em imagens SAR (Capitulo 3 e APÊNDICE I), ainda não um consenso sobre a
utilização operacional de métodos plenamente automáticos. A proposta de elaboração
de um sistema híbrido inteligente capaz de indicar, através de regras de decisão
previamente estabelecidas, as imagens aptas para o processamento automático, seria
uma alternativa interessante.
O método de Árvores de Classificação e Regressão - ACR (Classification and
Regression Trees - CART), disponível no módulo Data Mining do Software Statistica,
foi utilizado com o objetivo de estabelecer regras simples e compactas, capazes de
indicar a aptidão das imagens para o processamento automático, considerando duas
categorias: satisfatórias (S) e não satisfatórias (NS). As árvores são formadas a partir
de uma coleção de regras estimadas com base no conjunto de variáveis preditoras.
Estas regras são selecionadas com o objetivo de encontrar o número de partições e
de valores para as variáveis preditoras, que melhor representem as classes indicadas
pela variável dependente. O termo Árvores de Classificação é utilizado quando a
variável dependente é categórica, sendo as Árvores de Regressão associadas à
utilização de variáveis dependentes numéricas. O método utilizado é denominado
Árvore de Classificação e Regressão por identificar automaticamente se as variáveis
são categóricas ou numéricas, sendo capaz de efetuar os dois tipos de processamento
(BREIMAN et al., 1984).
158
As árvores são o resultado de partições recursivas onde: a) cada
corresponde a uma das variáveis preditoras do conjunto de entrada; b) as ramificações
estabelecem o critério de partição, considerando intervalos numéricos estabelecidos
para os atributos de cada nó, e; c) as folhas contêm o número de indivíduos
selecionados pela regra indicada, associados às classes estabelecidas pela variável
dependente. Desta forma, as ACR constituem um conjunto de regras estabelecidas
que se propagam da raiz em direção aos nós e folhas.
No modelo proposto, a variável dependente Y é categórica e está associada à
performance do clusterizador, indicando se a mesma foi satisfatória (S) ou não (NS).
O vetor X é composto pelo conjunto de 5 atributos de entrada utilizados como
preditores, sendo X = {x
1
, ... , x
5
}. Para buscar as regras de decisão através da ACR, 5
novos atributos foram calculados, considerando a distância entre os clusters formados.
Estes atributos são resultantes da diferença entre as médias dos clusters referentes ao
oceano e aos alvos escuros para cada atributo, sendo estes: a) x
1
= µ
Mediana Oceano
-
µ
Mediana Alvos Escuros
; b) x
2
= µ
Média Oceano
- µ
Média Alvos Escuros
; c) x
3
= µ
Moda Oceano
- µ
Moda Alvos
Escuros
; d) x
4
= µ
Máximo Oceano
- µ
Máximo Alvos Escuros
, e; e) x
5
= µ
GLCM Média Oceano
- µ
GLCM Média Alvos
Escuros
. Os valores médios para cada atributo em cada cluster são calculados
automaticamente pelo software Clustan ao final de cada clusterização. A Tabela 5.24
contém os atributos preditores, juntamente com a variável dependente que se refere a
performance do clusterizador em cada recorte de cena.
Tabela 5.24 Variável dependente e atributos preditores utilizados na ACR para as 11 cenas.
Os 11 recortes de cena estudados ao longo da tese foram utilizados na ACR
para definir as regras. Com o objetivo de validar não apenas as regras formuladas pela
ACR, mas todos os parâmetros padronizados ao longo da tese, 3 novas imagens
foram escolhidas. A Figura 5.48 disponibiliza a metodologia utilizada para a criação e
validação da regra de decisão para definir o processamento como automático ou semi-
automático.
159
Figura 5.48 Método para criação e validação da regra de decisão para definir o
processamento como automático ou semi-automático.
A ACR retornou uma regra simples e compacta, considerando a diferença para
a Moda como atributo de partição inicial associado ao raiz. A partir do raiz uma
estrutura com 2 partições, resultando em 4 folhas e 3 nós terminais foi obtida. Na folha
raiz o tamanho do é igual ao número de componentes de entrada, sendo igual ao
número de cenas (11). A primeira regra de partição, baseada no atributo de Moda,
associou 6 componentes ao ramo esquerdo e 5 ao ramo direito, sendo classificados
respectivamente como NS e S. A segunda regra de partição, baseada no atributo de
Máximo, subdividiu os 5 componentes restantes em NS (1) e S (4).
A ACR retornou um conjunto de regras simples e compactas que refletiu os
resultados obtidos pelas clusterizações, indicando que apenas 4 cenas foram
satisfatórias. A Figura 5.49 disponibiliza um fluxograma de decisão com as regras
obtidas pela ACR a serem aplicadas às novas imagens com objetivo de indicar a
aptidão das mesmas ao processamento automático ou semi-automático.
160
Figura 5.49 Regra de decisão obtida pela ACR para definir o processamento como
automático ou semi-automático.
Para a validação do método proposto e da regra de decisão fornecida pela
ACR, 3 novas cenas RADARSAT foram recortadas contendo: a) recorte de cena A:
alvo escuro derivado de vazamento de óleo, com bordas bem definidas e com bom
contraste em relação ao oceano, e; b) recortes de cena B e C: alvos escuros em
diferentes escalas, derivados da presença de assemelhados, sem bordas bem
definidas e com maior heterogeneidade associada à variação dos NC no oceano,
ocasionando um menor contraste em relação ao oceano para alguns alvos. Quanto
mais evidente for o comportamento bimodal de um histograma, mais fácil será para o
algoritmo identificar padrões que sejam eficazes para separar os alvos escuros do
oceano. Nos recortes de cena definidos é perceptível a diminuição gradativa do
comportamento bimodal dos histogramas, esta escolha teve como objetivo submeter o
clusterizador a níveis crescentes de dificuldade. A Figura 5.50 ilustra os 3 novos
recortes de cena escolhidos para validar o método proposto e a regra de decisão
fornecida pela ACR, juntamente com seus respectivos histogramas.
Cada recorte de cena foi pré-processado com espaçamento de pixel de 100m,
filtro Lee com janela 3x3, segmentado no software SPRING com área nima de 25
pixels e limiar de similaridade 4, sendo este a média dos melhores limiares indicados
no item 5.3 para cada uma das 11 cenas estudadas. Tendo como base as regiões
claras e escuras resultantes da segmentação, o conjunto adequado de 5 atributos,
indicado pelo processo de seleção e validado pelas análises de clusterização, foi
calculado para os 3 novos recortes de cena. As clusterizações foram efetuadas
automaticamente no software Clustan e, seqüencialmente, as métricas de avaliação
foram calculadas tendo como referência os Phantons delineados manualmente para
161
os novos exemplos. A Tabela 5.25 disponibiliza as métricas de avaliação calculadas
para as clusterizações automáticas efetuadas nos 3 novos recortes de cena para
validação do método de detecção automática de alvos escuros proposto na tese, e a
Figura 5.51 apresenta a espacialização destas métricas.
Figura 5.50 Recortes de Cena escolhidos para validação do método proposto para a
detecção automática de alvos escuros em imagens SAR.
Tabela 5.25 - Métricas de avaliação calculadas para os resultados das clusterizações efetuadas
nos 3 novos recortes de cena para validação do método proposto na tese.
A performance automática obtida pelo clusterizador no recorte de cena A foi
considerada satisfatória, tendo evidenciado erros mínimos de omissão e de inclusão,
atingindo uma ExAE de 0,89, resultado esperado em função do comportamento
bimodal indicado no histograma da imagem. A clusterização para o recorte de cena B
foi mais ruidosa em função da heterogeneidade dos NC no oceano associada a
presença do ruído speckle e a redução localizada da intensidade do vento que ocorreu
simultaneamente com os assemelhados. Neste exemplo, os erros de inclusão foram
bem mais acentuados, e a ExAE foi de 0,46, performance considerada não
satisfatória.
162
Figura 5.51 Resultados obtidos para validação do método de detecção automática de alvos
escuros proposto na tese.
Embora esta aparência ruidosa presente na região oceânica do recorte de cena
B seja similar ao ruído produzido pelas clusterizações efetuadas no nível do pixel, esta
associação é apenas visual e ocorre em função dos diferentes tamanhos de cena e
140 Km
22 Km
100 Km
40 Km
63 Km
25 Km
163
escala dos alvos escuros. Em cenas muito ruidosas, dotadas de maior
heterogeneidade no oceano, a segmentação pode gerar regiões com o tamanho
mínimo de até 25 x 25 pixels, parâmetro de área mínima definido no item 5.3 para ser
utilizado nos segmentadores. A visualização da imagem em uma menor escala
evidencia que não se tratam de pixels, mas de regiões delimitadas pelo clusterizador,
uma clusterização efetuada no nível do pixel produziria resultados muito mais
ruidosos. A Figura 5.52 disponibiliza: a) um mapa com as dimensões do recorte de
cena 2; b) uma ampliação com área equivalente à do recorte de cena 1 para fins
comparativos (detalhe 1), e; c) ampliações sucessivas (detalhes 2 e 3) evidenciando
os pixels no interior das regiões escuras delimitadas pela segmentação.
Figura 5.52 Dimensões do recorte de cena B, evidenciando o conjunto de pixels nas regiões
escuras delimitadas pela segmentação.
No recorte de cena C, onde era esperado que o clusterizador tivesse mais
dificuldade para convergir clusters representativos, houve menos erro de inclusão no
oceano. Este erro ficou concentrado ao redor do alvo, comportamento esperado uma
vez que as bordas que separam o alvo do oceano não são bem definidas,
especialmente no caso das imagens SAR. A ExAE (0,49) atingiu quase 50% de
Detalhe 1
164
representatividade em relação ao Phanton o que indicou a performance do
clusterizador como satisfatória.
Para verificar se a regra de decisão formulada pela ACR seria válida para
indicar as imagens aptas a serem processadas automaticamente, os seguintes
atributos foram calculados: a) Média do atributo Moda para os clusters no oceano
menos a Média do atributo Moda para os clusters dos alvos escuros, e; b) Média do
atributo Máximo para os clusters no oceano menos a Média do atributo Máximo para
os clusters dos alvos escuros. A Tabela 5.26 disponibiliza a diferença entre as médias
dos clusters para os 5 atributos utilizados na clusterização, a ExAE e a classificação
da performance do clusterizador como satisfatória (S) ou não satisfatória (NS).
Tabela 5.26 - Métricas de avaliação calculadas para os resultados das clusterizações
automáticas efetuadas nos 3 novos recortes de cena para validação do método proposto.
A Figura 5.53 apresenta os processamentos efetuados com os 3 novos
recortes de cena, juntamente com os resultados da validação da regra de decisão
indicada pela ACR, para definir o processamento das imagens como automático ou
semi-automático. Ao final dos processamentos as geometrias produzidas com ou sem
a intervenção humana são utilizadas como referência para o cálculo dos atributos em
um sistema automático de classificação em óleo e assemelhados.
A regra de decisão (Figura 5.49) não foi validada com todos os exemplos
utilizados. De acordo com a regra o processamento semi-automático seria indicado
para os recortes de cena A e B. A regra foi válida para o recorte de cena B que obteve
a menor ExAE e o maior erro de Inclusão (Tabela 5.25 e Figura 5.51). Entretanto, de
forma contraditória, o procedimento supervisionado foi indicado para o recorte de cena
A que apresentou a melhor performance automática. A cena C foi coerentemente
indicada para o processamento automático, uma vez que os clusters obtidos foram
representativos com ExAE de 0,49.
Desta forma, somente os recortes de cena B e C validaram a regra de decisão
proposta pela ACR. Reprocessar supervisionadamente uma cena que teve resultados
satisfatórios no modo automático significaria um custo computacional desnecessário.
Entretanto, do ponto de vista operacional seria melhor do que indicar para o
165
processamento automático uma cena que não é favorável, produzindo resultados
dotados de reduzida acurácia geométrica.
Figura 5.53 Validação da regra de decisão para definir o processamento como automático ou
semi-automático.
166
As 3 novas cenas processadas com os parâmetros padronizados ao longo da
tese validaram as hipóteses relacionadas à possibilidade de automatização do método
a partir de um conjunto padrão com número reduzido de atributos.
A utilização de um limiar único para a segmentação também foi validada,
entretanto, neste quesito mais exemplos precisariam ser testados. Em recortes de
cena menores com apenas um alvo, o limiar indicado resolve bem a separação dos
alvos escuros do oceano. Nas cenas maiores, em que se têm alvos escuros de grande
e pequena dimensão, o LS indicado pode super-segmentar alvos escuros de maior de
dimensão, juntamente com o oceano (background), aumentando o erro de inclusão
nas áreas oceânicas (exemplo da cena de validação C: Figura 5.51).
Os resultados evidenciaram o potencial da utilização de regras de decisão para
auxiliar no processo de automatização, indicando situações em que a intervenção
humana é necessária para produzir geometrias representativas para os alvos escuros.
Entretanto, seria indicado aumentar o número de amostras para que a ACR possa
retornar uma regra mais robusta, a ser aplicada a toda nova imagem SAR adquirida.
167
CAPÍTULO 6
CONCLUSÕES E RECOMENDAÇÕES
6 - Premissas e Hipóteses Adotadas no Desenvolvimento da Tese:
Os resultados obtidos e as discussões abordadas ao longo da tese forneceram
contribuições significativas no âmbito dos sistemas automáticos para detecção de
alvos escuros em imagens SAR. Estes resultados foram obtidos considerando a
premissa de que o método proposto tivesse características que permitissem a sua
futura implementação de forma automática e operacional, sendo investigadas a
seguintes hipóteses:
i) utilizar o formato compactado MrSid permitiria um rápido download e um
processamento mais rápido por ser disponibilizado com os pré-
processamentos efetuados;
ii) utilizar um espaçamento de pixel maior do que 50m reduziria o custo
computacional;
iii) utilizar filtros no pré-processamento das imagens amenizaria a influência do
ruído speckle e, conseqüentemente, melhoraria a detecção de alvos escuros
compensando a redução do espaçamento de pixel;
iv) segmentar as imagens para efetuar os processamentos no nível das regiões
e não dos pixels, produziria resultados menos ruidosos com um menor custo
computacional;
v) associar inúmeros atributos às regiões ampliaria as chances de encontrar
uma combinação de atributos considerada adequada para agrupar as regiões
em alvos escuros e oceano;
vi) efetuar o agrupamento das regiões através de clusterização de dados,
considerando que a segmentação não fornece um resultado definitivo em
função da escalabilidade dos alvos, produziria geometrias mais
representativas para os alvos escuros;
vii) selecionar um subconjunto de atributos mais significativos melhoraria o
desempenho da clusterização produzindo resultados mais satisfatórios;
viii) efetuar uma seleção rigorosa dos recortes de cena a serem utilizados como
teste permitiria obter resultados mais realistas, indicando a possibilidade de
se automatizar ouo o sistema detecção de alvos escuros;
ix) utilizar imagens de referência, denominadas Phantons, permitiria uma justa
avaliação dos resultados indicando quais os melhores softwares e
parâmetros a serem utilizados no um sistema de detecção de alvos escuros;
x) a acurácia obtida para a geometria dos alvos escuros é essencial para
alimentar a etapa de classificação dos alvos nas diferentes classes de óleo e
assemelhados;
xi) reduzir a intervenção humana através da padronização dos parâmetros
envolvidos na detecção, bem como utilizar um método para o agrupamento
automático das regiões capaz de garantir a replicabilidade dos resultados,
permitiria uma futura implementação automática e operacional do sistema;
168
Considerando a premissa e as hipóteses formuladas os seguintes resultados
foram obtidos para as etapas investigadas ao longo da tese.
6.1 - Pré-processamento das imagens:
Espaçamento de Pixel:
- A avaliação da influência da utilização de diferentes espaçamentos de pixel (50,
100, 150 e 200m) no potencial de detecção de alvos escuros em imagens SAR,
confirmou a hipótese (ii), indicando que: (a) o espaçamento de 100m, apesar de
detectar um menor número de alvos escuros (7) quando comparado ao espaçamento
de 50m (14), reduziu em 7 vezes o tempo de processamento, o que viabilizaria o uso
operacional de cenas completas. (b) Esta escolha também foi influenciada pelas
métricas de avaliação, as quais indicaram que, dentre os espaçamentos (100, 150 e
200m), o de 100m foi o que conseguiu definir melhor as bordas dos alvos escuros e
detectar um maior número de pequenos alvos com um menor tempo de
processamento, quando comparado com o espaçamento de 50m. (c) Embora a
maioria dos autores utilize o espaçamento de 100m, não foram encontrados estudos
avaliando comparativamente o custo/benefício de cada espaçamento de pixel no
desempenho da detecção, o que torna interessante os resultados obtidos. (d) Outra
evidência que reforçou a utilização do espaçamento de pixel de 100m foi a aquisição
de imagens RADARSAT também no modo ScanSAR Wide (100m), sendo
aconselhável, no âmbito da automatização do sistema padronizar o espaçamento de
pixel das imagens de entrada.
Filtragem:
- A avaliação do potencial associado à detecção de alvos escuros foi realizada
considerando imagens filtradas com os filtros Lee, Lee Enhanced, Frost, Frost
Enhanced, Kuan, Gamma, Sigma e Mediana com 3 dimensões de janela (3x3, 5x5 e
7x7). Dentre os filtros avaliados o Lee, aplicado com janela 3x3, foi indicado como
mais adequado para o pré-processamento das imagens, sendo também o mais
utilizado na literatura. De acordo com as métricas de avaliação, apesar da aplicação
deste filtro ter reduzido a ExAE e aumentado os erros de inclusão em relação ao
recorte de cena sem filtragem (100m), aumentou o número de alvos escuros
detectados de 7 para 10, confirmando a hipótese (iii). Esta avaliação foi importante
para indicar a possibilidade de automatização, considerando a importância dos filtros
para a suavização do ruído speckle inerente às imagens SAR.
169
- Uma avaliação mais robusta sobre a padronização ou não do filtro Lee 3x3 na
etapa de pré-processamento foi realizada utilizando 11 cenas diferentes, segmentadas
no MultiSeg e no SPRING (22 processamentos). Foi comprovado estatisticamente
pelo teste de Wilcox que a aplicação de filtragem nas imagens interfere
significativamente na detecção dos alvos escuros, melhorando os resultados na
maioria das cenas (14). Com base nestas constatações, a utilização do filtro Lee
aplicado com janela de dimensões 3x3, foi padronizada na etapa pré-processamento
das imagens.
6.2 Segmentação em Imagens SAR:
- Os segmentadores MultiSeg e SPRING foram aplicados em 11 cenas
diferentes, com e sem filtragem, contendo diferentes tipos de alvos escuros em
diferentes escalas. O resultado esperado era que, a segmentação de alvos escuros
fosse melhor realizada pelo MultiSeg. Entretanto, embora o teste de Wilcox tenha
indicado que não diferença estaticamente significativa entre a qualidade dos
resultados produzidos pelo SPRING ou pelo MultiSeg, o SPRING detectou um maior
número de alvos escuros, tendo sido utilizado nas demais etapas da tese.
Provavelmente, a alteração das propriedades estatísticas das imagens ocasionada
pela compactação/descompactação dos dados a partir do formato MrSid, prejudicou o
desempenho do MultiSeg, uma vez que as imagens foram processadas no modo
específico para RADAR.
- A proposta de um método padrão para o cálculo do Limiar de Similaridade a
partir de um box plot contendo as propriedades estatísticas dos alvos escuros e do
oceano foi uma importante contribuição. Este método garantiu uma avaliação justa dos
resultados obtidos, indicando o procedimento mais eficaz, considerando o melhor
desempenho de cada um dos softwares testados. Outro aspecto interessante a ser
comentado, refere-se à utilização do conhecimento dos especialistas para definir
parâmetros coerentes para a automatização do método proposto, sendo o parâmetro
de área mínima em pixels um exemplo. Este parâmetro foi estabelecido conjuntamente
com os especialistas no combate à emergências ambientais por vazamento de óleo da
PETROBRAS, os quais indicaram a mínima área de óleo identificável em campo e nas
imagens de satélite.
- O método proposto para o cálculo do LS não sub-segmentou os recortes de
cena, permitindo a detecção dos alvos escuros dotados de menor dimensão. A
definição dos parâmetros de AM e LS adequados para serem aplicados em qualquer
170
imagem SAR adquirida, contribuíram para reduzir o nível de intervenção humana no
processo, tornando factível uma futura automatização do sistema. Operacionalmente,
a detecção de alvos escuros e oceano a partir de regiões e não de pixels, diminuiu a
influência do ruído speckle e o custo computacional, além de permitir a associação de
diferentes atributos às geometrias produzidas (hipóteses iv e v).
6.3 Detecção dos Alvos Escuros por Reconhecimento de Padrões:
- O método utilizado para o cálculo do LS permitiu a detecção de alvos de
pequena dimensão, entretanto, como os alvos de maior dimensão acabaram sendo
particionados em um maior número de segmentos, o processo de agrupamento das
regiões foi considerado indispensável para produzir geometrias mais representativas
para os alvos escuros (hipótese vi).
- Neste contexto, considerando o estado da arte em sistemas para detecção de
alvos escuros, os métodos propostos estão divididos em 2 etapas: a) segmentação
das imagens, e; b) agrupamento dos pixels ou das regiões em alvos escuros e
oceano. Pode-se considerar que o teor de inovação contido na tese esteve
concentrado nesta etapa, sendo o método proposto dividido em 4 partes: a)
segmentação das imagens; b) cálculo de diversos atributos para cada região originada
pela segmentação; c) seleção do conjunto adequado de atributos, e; d) clusterização
destes atributos em alvos escuros e oceano. Nos demais métodos o cálculo de
atributos foi utilizado somente na etapa de classificação das imagens em óleo e
assemelhados, bem como a utilização de técnicas para a seleção de atributos é
escassa na literatura específica de detecção de óleo.
Análise Exploratória e Seleção de Atributos:
- O potencial associado aos 36 atributos calculados (8 estatísticos, 20
geométricos e 8 texturais) foi avaliado através dos procedimentos de análise
exploratória e seleção de atributos efetuados sempre em relação ao atributo
categórico Classe do Phanton. A avaliação dos atributos em relação a uma verdade
previamente conhecida foi eficaz para identificar o conjunto de dados mais adequado
para a clusterização.
- Os coeficientes de correlação de Spearman foram calculados para os
atributos estatísticos, geométricos e texturais para cada uma das 11 cenas estudadas
e utilizados para identificar os atributos mais relacionados ao Phanton, sendo estes os
que teriam, provavelmente, o maior potencial para melhorar os resultados das
171
clusterizações. Os resultados evidenciaram que nenhuma das medidas de correlação
obtidas (396) atingiu (r) acima 0,7. Os atributos estatísticos foram os mais
relacionados com o Phanton, seguidos dos texturas e dos geométricos com média
global dos (r)s de 0,37 (estatísticos), 0,20 (texturais) e 0,14 (geométricos). Apesar dos
baixos valores de (r) obtidos para os três tipos de atributos, a maior parte das
correlações obtidas foram consideradas estatisticamente significativas em relação ao
Phanton, sendo 89% para os atributos estatísticos; 76% para os
geométricos/poligonais; 72% para os geométricos/skeletons, e; 81% para os atributos
texturais.
- A análise de componentes principais (ACP) indicou que conjunto nimo de
atributos necessário para manter 90% da representatividade do conjunto de dados
inicial variou entre 4 e 10, sendo em média necessários 8 componentes.
- O método de seleção de atributos baseado no teste de chi-quadrado auxiliou
no processo de redução da dimensionalidade do conjunto de dados, fornecendo um
ranking com a importância dos 36 atributos, considerando a significância estatística (p
valor) calculada para cada valor de chi-quadrado. Tendo como base os resultados da
ACP, foram considerados na análise de seleção somente os 10 primeiros atributos
mais importantes indicados pelo chi-quadrado em relação ao atributo Classe do
Phanton em cada cena.
- Considerando que, para atender a premissa de automatização do sistema, é
necessário padronizar os parâmetros envolvidos em cada etapa do fluxo de
processamentos (hipótese xi), um ranking considerando a freqüência de indicação
acumulada dos 10 primeiros atributos para cada cena foi efetuado como objetivo de
identificar os atributos recorrentes sendo estes, respectivamente: Mediana, Média,
Moda, Mínimo, Máximo, GLCM da Média, Ajuste Retangular, GLCM da
Homogeneidade, Assimetria dos Polígonos e Densidade. De forma coerente, os
atributos indicados como menos correlacionados em relação Phanton, os geométricos
e os texturais, foram os menos indicados entre os 10 primeiros do ranking.
- Com a espacialização dos 10 melhores atributos selecionados, foi
interessante notar que, embora os atributos geométricos não tenham sido indicados
como bons preditores em relação ao atributo Classe do Phanton, nas cenas em que
manchas de óleo com geometrias bem definidas e alongadas estavam presentes,
estes atributos realçaram estes alvos em relação ao oceano. Visualmente, o GLCM da
Homogeneidade contribuiu para realçar os alvos em quase todas a cenas e o GLCM
172
da Média apresentou um comportamento irregular, sendo confuso em algumas cenas.
Através da espacialização é notável que os atributos estatísticos de primeira ordem
são, efetivamente, os que apresentaram maior potencial para auxiliar na detecção dos
alvos escuros.
- Os atributos selecionados pelo chi-quadrado como mais importantes são
multicorrelacionados entre si, entretanto, é notável que estes atributos foram os que
apresentaram as melhores correlações com o Phanton, sendo os demais atributos
muito pouco relacionados.
- A redução de 26 atributos do conjunto inicial de dados também representou
uma contribuição para a operacionalização do sistema, reduzindo o custo
computacional envolvido. A seleção realizada não foi considerada definitiva e foi
utilizada para direcionar as inúmeras clusterizações efetuadas a partir da combinação
dos atributos indicados (hipótese vii).
Clusterização das Regiões em Alvos Escuros e Oceano:
- Com o objetivo de validar o método de seleção utilizado, as clusterizações
foram efetuadas inserindo os 10 melhores atributos um a um, na ordem indicada pela
análise de freqüência acumulada (Tabela 5.19).
- Os resultados evidenciaram que a utilização do atributo de Mínimo isolado ou
em conjunto com o atributo de Máximo piorou a detecção de alvos escuros, tendo sido
indicada a sua eliminação do conjunto selecionado pelo chi-quadrado.
- Excluindo o atributo de mínimo, as clusterizações foram efetuadas
considerando os 9 melhores atributos selecionados na ordem indicada na Tabela 5.27
e os 35 atributos na ordem indicada pelo chi-quadrado. Este estudo foi realizado, para
verificar se haveria diferença na performance do clusterizador considerando o total de
atributos e não apenas os 9 melhores do ranking. Para efetuar essa comparação
foram consideradas: a) ExAE obtidas pela clusterização simultânea dos 9 e dos 35, e;
b) a Máxima ExAE (MExAE) obtida considerando a inserção gradual dos 9 e dos 35
atributos.
- A média das ExAEs obtida com a clusterização simultânea de todos os
atributos foi maior considerando os 9 atributos (0,37) do que considerando os 35
atributos (0,19), sendo esta diferença indicada como estatisticamente significativa pelo
teste Wilcox com p valor de 0,028. Estes resultados validam a hipótese de que a
seleção de um conjunto reduzido de atributos considerados significativos, é melhor do
173
que a utilização de um amplo conjunto de dados que inclua atributos não
representativos.
- Os Máximos valores de exatidão MExAE obtidos considerando a inserção
gradativa dos 9 e dos 35 atributos, apresentaram comportamento semelhante quando
comparados cena a cena. A média das MExAE obtidas com a inserção gradativa de 9
atributos foi de 0,43, enquanto que a obtida com a inserção de 35 atributos foi de 0,44.
Com um p valor de 0,068 o teste de Wilcox indicou que não diferença
estatisticamente significativa entre os valores de MExAE obtidos com a melhor
combinação dentre os 9 ou dentre os 35 atributos.
- Considerando as hipóteses indicadas, esse resultado foi importante por
validar a possibilidade de automatização do sistema de forma operacional a partir de
um conjunto reduzido de atributos, minimizando também o custo computacional
associado.
- Nas situações em que foi possível convergir para uma melhor ExAE com um
menor número de atributos, oscilando entre 2 e 4, a inserção de mais atributos não
prejudicou os resultados da clusterização. Entretanto, nos casos em que a máxima
ExAE foi obtida com um número maior ou igual a 4 atributos, a redução do número de
atributos para 2 ou 3 prejudicou a detecção dos alvos. Estes resultados indicaram que
o conjunto de atributos a ser padronizado não poderia conter menos do que 4
atributos. O número de atributos a ser adotado poderia ser 4 ou 5, considerando que
as MExAE foram obtidas na Média com 4 atributos e na Mediana com 5 atributos,. O
teste Wilcox indicou que não há diferença estatisticamente significativa em se utilizar 4
ou 5 atributos. Neste contexto decidiu-se padronizar em 5 o número de atributos,
considerando que a retirada do atributo da cena 11 prejudicou significativamente os
resultados e nas demais cenas não provocou alterações significativas.
- Importante destacar que embora as 5 variáveis indicadas sejam
multicorrelacionadas, a sua utilização simultânea na clusterização foi o que gerou os
melhores resultados, validando esta seleção. Estes atributos foram considerados
robustos por terem sido selecionados de forma recorrente em todas as cenas. Testes
foram efetuados considerando outros métodos de seleção e o resultado foi o mesmo,
a clusterização foi satisfatória para o conjunto de dados que continha as variáveis
multicorrelacionadas.
- Apesar da automatização considerando um número reduzido de atributos
padrão ter sido indicada como factível, a análise global dos resultados evidenciou que,
174
dentre as 11 cenas, apenas 5 obtiveram uma clusterização considerada satisfatória,
sendo 4 com ExAE maiores ou iguais a 0,5 e 1 cena com ExAE menor do 0,5.
- Inúmeros fatores contribuíram para que os resultados não fossem
considerados satisfatórios em todas as cenas sendo estes, direta ou indiretamente
relacionados com o rigor adotado durante a seleção das cenas. A diversidade de
cenas considerando diferentes tipos de alvos, com diferentes geometrias em
diferentes escalas, ocorrendo isoladamente ou simultaneamente com outros eventos
foi um ponto importante da pesquisa, enriquecendo os resultados e mostrando a
dificuldade de se detectar alvos escuros automaticamente (hipótese viii). Um ponto a
ser investigado é a influência do formato MrSid nesses resultados, considerando a
alteração das propriedades estatísticas das imagens em função da compactação.
6.4 - Abordagem Automática e Semi-Automática:
- Considerando que ainda não um consenso entre os pesquisadores sobre
qual abordagem, manual, semi-automática ou automática, representa o melhor
custo/benefício para operacionalizar a detecção de óleo e assemelhados em imagens
SAR, uma comparação entre os métodos automático e semi-automático foi realizada
para definir com maior rigor o procedimento mais eficaz. Foram utilizados os
resultados do Clustan (considerado automático: não supervisionado) e os resultados
obtidos pela Limiarização e pela aplicação dos classificadores Maxver e SVM
(considerados semi-automáticos: supervisionados).
- A interpretação visual dos resultados indicou que os métodos semi-
automáticos conseguiram retornar clusters mais representativos e, conseqüentemente,
geometrias mais precisas para os alvos escuros, delineando com maior acurácia os
limites que os separam do oceano. A Média das métricas de ExAE e de erros de
Inclusão e de Omissão confirmou esta interpretação indicando que o melhor
desempenho foi obtido pelo classificador SVM, seguido da Limiarização. Enquanto os
métodos semi-automáticos erraram mais excluindo regiões que seriam alvos escuros,
o método automático errou mais incluindo regiões oceânicas como alvos escuros.
- Uma comparação entre os resultados obtidos pela tese com resultados
obtidos por diferentes autores que consideram seus métodos automáticos foi
realizada. A comparação dos resultados efetuada entre alvos considerados fáceis e
difíceis evidenciou que o método proposto também poderia ser considerado
automático por ter conseguido resultados semelhantes ao de diversos autores.
175
Entretanto, o método proposto não obteve resultados considerados satisfatórios para
todas as cenas estudadas.
- Do ponto de vista operacional, mesmo com imprecisão, os alvos escuros
detectados pelo método de clusterização seriam úteis para o acionamento das
inspeções de campo. Entretanto, geometrias com baixa exatidão não apresentariam
acurácia suficiente em relação ao Phanton para serem utilizadas como dado de
entrada em um sistema de classificação automática (hipótese x). Na pior hipótese, ao
final da classificação um resultado errôneo poderia ocasionar falhas no processo de
combate a uma possível emergência envolvendo derramamento de óleo no mar.
- Também não seria aconselhável armazenar geometrias imprecisas em um
Banco de Dados que tem por objetivo fornecer conhecimento pretérito para
retroalimentar o sistema automático de detecção de óleo e assemelhados. O registro
cumulativo de geometrias imprecisas e, conseqüentemente, de atributos imprecisos no
Banco de Dados poderia levar à ineficácia do sistema, confundindo o classificador na
distinção dos alvos escuros em óleo ou assemelhados.
- Neste contexto, a elaboração de um sistema híbrido inteligente capaz de
indicar através de regras de decisão as imagens aptas para o processamento
automático ou semi-automático foi proposta. Para tal, regras de decisão foram
estabelecidas e confrontadas a cada nova imagem SAR, indicando as cenas a serem
processadas automaticamente e as cenas que necessitariam de supervisão. Esta
proposta permitiu utilizar o processamento automático nas situações em que os
resultados foram favoráveis.
6.5 - Validação e Síntese da Metodologia Proposta:
- Atributos que consideraram a distância entre as médias dos 5 atributos
indicados como padrão, obtidas para os clusters dos alvos escuros e do oceano,
foram calculados para as 11 cenas e processados pelo método de ACR para
encontrar as regras de decisão. O método de ACR retornou uma regra compacta,
considerando como atributo de partição inicial a diferença entre a Moda e como
atributo de partição secundário a diferença entre o Máximo nos dois tipos de clusters.
- As 3 imagens de validação foram pré-processadas, segmentadas e
agrupadas com todos os parâmetros padronizados ao longo da tese: a) Espaçamento
de Pixel: 100m; b) Filtragem: Lee 3x3; c) Segmentação: SPRING com AM= 25 pixels e
LS = 4, e; d) Clusterização: Clustan, considerando 2 clusters. Os atributos de
176
Diferença entre a Média dos clusters para o atributo de Moda e de Máximo foram
calculados para serem confrontados com a regra de decisão encontrada.
- A regra não foi validada para todos os exemplos utilizados, onde 2 cenas
deveriam ter sido indicadas para o processamento automático e apenas uma para o
processamento semi-automático. A cena de validação A, que retornou o melhor índice
de ExAE, foi indicada para o processamento semi-automático. Reprocessar
supervisionadamente uma cena que teve resultados satisfatórios no modo automático
significaria um custo computacional desnecessário. Entretanto, do ponto de vista
operacional seria melhor do que indicar para o processamento automático uma cena
não favorável, produzindo resultados dotados de reduzida acurácia geométrica.
- Os resultados evidenciaram o potencial destas regras para auxiliar no
processo de automatização, sendo necessárias mais amostras para retornar regras
mais robustas aplicáveis a toda nova imagem SAR adquirida.
- Desta forma, considerando a premissa, as hipóteses consideradas e os
resultados obtidos ao longo da tese, o fluxograma da Figura 6.1 ilustra o método
proposto para a detecção de alvos escuros em imagens SAR, adotando uma
abordagem híbrida que integra métodos automáticos e semi-automáticos.
6.6 - Considerações Finais e Recomendações:
- Uma importante recomendação seria aumentar o número de exemplos
obtidos com o mesmo método de detecção a fim de aprimorar a regra de decisão
encontrada para que ela seja aplicável, com maior eficácia, a qualquer nova imagem
SAR.
- Outra perspectiva seria investigar novos métodos para o pré-processamento
das imagens com o objetivo de produzir novos atributos capazes de discriminar melhor
os alvos escuros e o oceano, melhorando os resultados da clusterização. A
possibilidade de utilizar diferentes técnicas de seleção de atributos e clusterização de
dados também pode ser verificada.
- Efetuar testes comparativos utilizando os dados no formato CEOS e MrSid,
seria interessante para verificar quantitativamente os benefícios e as perdas
associados a utilização do formato MrSid.
177
Figura 6.1 Método proposto para a detecção automática de alvos escuros e classificação em
óleo e assemelhados.
- Realizar experimentos utilizando o modo para segmentação de imagens
óticas disponível no software MultiSeg, seria recomendado para confirmar se este
produziria resultados melhores do que o SPRING.
- Verificar a possibilidade de utilizar dados contextuais referentes a intensidade
da velocidade do vento em cada cena para auxiliar na separação dos alvos escuros do
oceano, especialmente nas cenas em que alvos escuros referentes a óleo, algas,
dentre outros ocorrem simultaneamente com eventos de baixa intensidade de vento.
- Testar o método proposto com imagens SAR adquiridas por outros satélites
como o ENVISAT/ASAR, COSMO SKYMED, TERRASAR, dentro outros. Importante
destacar que, embora no contexto da tese tenham sido utilizadas imagens
provenientes do satélite RADARSAT-1, o método é replicável para as imagens do
RADARSAT-2. Isto é factível considerando que as configurações deste satélite são as
mesmas do RADARSAT-1, sendo a única diferença a possibilidade de aquisição de
imagens em outras polarizações que não somente a HH.
178
- Uma importante recomendação consiste em efetuar testes futuros acoplando
as geometrias resultantes do método elaborado ao sistema automático de
classificação proposto por BENTZ (2006). Este procedimento teria como objetivo
verificar se as geometrias possibilitarão o cálculo de atributos eficientes para a
classificação dos alvos escuros em óleo e assemelhados, considerando as diferentes
sub-classes utilizadas por BENTZ (2006).
- Finalmente, considerando as dificuldades encontradas na detecção de alvos
escuros em imagens SAR amplamente discutidas na literatura, seria essencial poder
comparar os resultados dos diferentes métodos propostos para encontrar uma
definição do que seria de fato um sistema automático e quais seriam os melhores
métodos. Para que isso fosse possível seria recomendado que um conjunto de dados
compilado, reunindo recortes de cena dotados de complexidade diferenciada, fosse
disponibilizada para ser amplamente utilizado pelos pesquisadores e organizações
interessados em desenvolver soluções para a detecção de óleo.
- O encontro SEASAR realizado em janeiro de 2010 na ESA, reunindo
especialistas da área, focados no desenvolvimento científico e na aplicação
operacional de sistemas para detecção de óleo obteve, como principal conclusão que:
“Sistemas completamente automáticos para a detecção de vazamento de óleo ainda
não constituem uma realidade a ser implementada operacionalmente. Entretanto,
considerando a relevância do tema e o potencial dos dados SAR para a detecção
destes eventos, a comunidade científica reforçou a necessidade da continuidade dos
estudos nesta área.”
- Os resultados obtidos ao longo da tese refletem o estado da arte referente ao
desenvolvimento de sistemas para a detecção automática de óleo e assemelhados.
Neste contexto, a proposta de um sistema híbrido constitui uma alternativa
interessante para as cenas dotadas de alvos mais difíceis de serem detectados, uma
vez que a utilização de um método automático plenamente eficaz para todas as cenas
ainda não foi encontrado.
179
REFERÊNCIAS BIBLIOGRÁFICAS
AKKARTAL A.; F. SUNAR. The usage of radar images in oil spill detection, The
International Archives of the Photogrammetry, Remote Sensing and Spatial
Information Sciences. Vol. XXXVII. Part B8. Beijing 2008, pp. 271-276, 2008.
ALMEIDA, R. F.; MIRANDA F.P.; LORENZETTI, J.A.; PEDROSO, E.C.; BEISL, C.H.;
LANDAU, L. RADARSAT-1 Images in Support of Petroleum Exploration: The
Offshore Amazon River Mouth Example. Canadian Journal of Remote Sensing,
Vol. 31, No 4, pp. 289-303, 2005.
AYED, I. B.; HENNANE, N.; MITICHE, A. Unsupervised variational image
segmentation/classification using a Weibull observations model. IEE Transections
on Image Processing, vol 15, no 11, November, 2006.
ALPERS, W.; HÜHNERFUSS, H. “Radar signatures of oil films floating on the sea
surface and the Marangoni effect”. Journal of Geophysics, Res., vol. 93(C4), pp.
36423648, 1988.
ALPERS, W.; HÜHNERFUSS, H. The damping of ocean waves by surface films: a new
look at on old problem. Journal of Geophysics, Res., vol. 94, no. C5, pp.
6251.6265, 1989.
ALPERS, W.; WISMANN, V.; THEIS, R.; HUHNERFUSS, H.; BARTSCH, N.;
MOREIRA, J.; Lyden, J. The damping of ocean surface waves by monomolecular
sea slicks measured by airborne multi-frequency radars during the saxon-fpn
experiment. Proceedings IGARSS'91, 1991.
ALPERS, W.; ESPEDAL, H. A. Oils and Surfactants. Chapter 11 in Synthetic Aperture
Radar Marine User`s Manual, Organized by Jackson C. R. & Apel J. R., National
Oceanic and Atmospheric Administration NOAA, 2004.
ARVELYNA, Y.; OSHIMA, M.; KRISTIJONO, A.; GUNAWAN, I. Auto Segmentation of
Oil Slick in RADARSAT SAR Image Data Around Rupat Island, Malaca Strait.
Proceedings 22
nd
Asian Conference on Remote Sensing, Singapore, 2001.
ANDRADE, L. P. Procedimento Interativo de Agrupamento de Dados [Rio de Janeiro],
VIII, 193 p., COPPE/UFRJ, Dissertação de Mestrado, Engenharia Civil, 2004.
180
ANGIULI, E.; FRATE, F.; SALVATORI, L. Neural Networks for oil spill detection using
ERS and ENVISAT imagery, 2006 [online] <http://earth.esa.int/workshops
/seasar2006/proceedings/papers/s5_4_ang.pdf>, acesso novembro 2006.
GIRARD-ARDHUIN, F.; G. MERCIER, R.; GARELLO. Oil slick detection by SAR
imagery: potential and limitation. Marine Technology and Ocean Science Conf.
(OCEANS'03), San Diego, USA, pp. 22-26 September ,2003.
ASSILZADEH, H.; MAGED, M.; MANSON, S.B.; MOHAMED, M.I. Application of
trajectory model, remote sensing and geographic information systems (GIS) for oil
spill emergency response in straits of Malacca. In: Proceedings of the 20th Asian
Conference on Remote Sensing, Hong Kong, pp. 331339, 1999.
BAATZ, M.; SCHÄPE, A., “Object-oriented and multi-scale image analysis in semantic
networks”. In: Proceedings of the 2nd International Symposium on
Operationalization of Remote Sensing, ITC, Enschede, Netherlands, Aug, 1999.
BAATZ, M.; SCHÄPE, A. Multiresolution segmentation An optimization approach for
high quality multi-scale image segmentation”. In: Angewandte Geographische In
formationsverarbeitung XI. Beiträge zum AGIT Symposium 1999, Kalsruhe
Herbert Wichmann Verlag, Salzburg, 2000.
BAATZ, M.; BENZ, U.; DEHGHANI, S.; HEYNEN, M.; HÖLTJE, A.; HOFMANN, P.;
LINGENFELDER, I.; MIMLER, M.; SOHLBACH, M.; WEBER, M.; WILLHAUCK, G.,
eCognition User Guide, 2 ed, Definiens Imaging, München, 2003.
BAATZ, M.; BENZ, U.; DEHGHANI, S.; HEYNEN, M.; HÖLTJE, A.; HOFMANN, P.;
LINGENFELDER, I.; MIMLER, M.; SOHLBACH, M.; WEBER, M.; WILLHAUCK, G.
e-Cognition Professional User Guide 4. München, Germany: Definiens Imaging
GmbH, 486 p, 2004.
BARNI, M.; BETTI, M.; MECOCCI, A. A fuzzy approach to oil spill detection on SAR
images. Proc. IGARSS ’95, vol. 1 (pp. 157– 159), 1995.
BENTZ C. M.; LORENZETTI J.A.; KAMPEL M.; POLITANO A.T.; GENOVEZ P.C.,
LUCCA A.V.D. Contribuição de dados ASTER, CBERS, R99/SIPAM e OrbiSAR-1
para o monitoramento oceânico Resultados do projeto FITOSAT Anais XIII
Simpósio Brasileiro de Sensoriamento Remoto, Florianópolis, Abril de 2007a.
181
BENTZ C. M.; EBECKEN N. F.F.; POLITANO A. T. Identificação automática de
eventos ambientais costeiros e oceânicos detectáveis em imagens de radares
orbitais. Anais XIII Simpósio Brasileiro de Sensoriamento Remoto, Florianópolis,
Abril de 2007b.
BENTZ, C. M. Reconhecimento Automático de Eventos Ambientais Costeiros e
Oceânicos em Imagens de Radares Orbitais [Rio de Janeiro], XIII, 115 p.,
COPPE/UFRJ, D.Sc., Engenharia Civil, 2006.
BENTZ, C.M.; POLITANO, A.T.; GENOVEZ, P.C; A.T. MIRANDA, R.S.P. “Offshore Oil
Spill Detection and Monitoring in E&P Areas An Operational Multi-Sensors
Approach”. Anais, Eighth International Conference On Health, Safety and
Environment, Abu Dhabi - UAE, Abril de 2006.
BENTZ, C.; POLITANO, A.; SPINDOLA, R.; GENOVEZ, P. A Multi-Sensor Approach
for Oil Spill and Sea Surface Monitoring in Southeastern Brazil, Halifax, Nova
Scotia Canada. Proceedings of the 8
th
International Conference on Remote
Sensing for Marine Environments, 2005a.
BENTZ, C.; POLITANO, A.; GENOVEZ, P, Monitoramento ambiental de áreas
costeiras e oceânicas com múltiplos sensores orbitais, Goiânia, Brasil. Anais XII
Simpósio Brasileiro de Sensoriamento Remoto, 2005b.
BENTZ, C. M. Visita à Tromsø Satellite Station (TSS) e ao Nansen Environment and
Remote Sensing Center (NERSC), Noruega. Relatório de Viagem Comunicação
Técnica PETROBRAS, 2003.
BENTZ, C.M.; MIRANDA, F.P. Application of Remote Sensing Data for Oil Spill
Monitoring in The Guanabara Bay, Rio De Janeiro, Brazil. Proceedings of the
Internationl Geoscience and Remote Sensing Symposium (IGARSS’2001), Sydney,
IEEE, Pisacataway, USA, 2001.
BEAULIEU, J. M.; TOUZI, R. Hierarchical segmentation of polarimetric SAR images.
In: International Geoscience and Remote Sensing Symposium (IGARSS’02) and
Canadian Symposium on Remote Sensing, 24. Proceedings Toronto, Canada:
IGARSS, 2002. p. 25902592, 2002.
182
BEAUCHEMIN, M.; THOMSON. The evaluation of segmentation results and the
overlapping area matrix. International Journal of Remote Sensing. v. 18, n. 18, p.
3895-3899, December, 1997.
BINS, L.; FONSECA, L.; ERTHAL, G. Satellite Imagery Segmentation: a region
growing approach. in VIII Brazilian Symposium on Remote Sensing. São José dos
Campos, BR: INPE, 1996.
BJERDE, K.W.; SOLBERG, A. H. S.; SOLBERG, R. Oil spill detection in SAR imagery.
Proc. IGARSS’93, vol. 3, pp. 943–945,1993.
BLUM, A.; LANGLEY, P. Selection of relevant features and examples in machine
learning. Artificial intelligence, 97, pp.245-271 , 1997.
BREIMAN, L.; FRIEDMAN, J. H.; OLSHEN, R. A.; STONE, C. J. Classification and
regression trees. Monterey, CA: Wadsworth & Brooks/Cole Advanced Books &
Software, 1984.
BREKKE, C.; SOLBERG, A. H. S. oil spill detection by satellite remote sensing
Review. Remote Sensing of Environment (95), pp 1-13, 2005.
BROWN C. E.; FINGAS M. F. New space-borne sensing for oil spill response,
International Oil Spill Conference, 2001.
BURGES, C. J. C. “A tutorial on support vector machines for pattern recognition”, Data
Mining and Knowledge Discovery, v. 2, n. 2, pp. 121167, 1998.
CALABRESI, G.; DEL FRATE, F.; LICHTENEGGER, J.; PETROCCHI, A.; TRIVERO,
P., “Neural networks for the oil spill detection using ERS-SAR data”. In:
Proceedings of the International Geoscience and Remote Sensing Symposium
(IGARSS’99), Hamburg, v. 1, IEEE, Pisacataway, USA, pp. 215 217, 1999.
CÂMARA, G., et al. SPRING: Integrating Remote Sensing and GIS with Object-
Oriented Data Modelling. Computers and Graphics, 15(6): p. 13-22, 1996.
CANADA CENTRE FOR REMOTE SENSING, Natural Resources Canada (2006 - last
updated 03 September). Tutorial: Fundamentals of Remote Sensing. from
http://ccrs.nrcan.gc.ca/resource/tutor/fundam/index_e.php. Retrieved on June 11,
2007.
183
CAVES, R.; QUEGAN, S.; WHITE, R.G. Quantitative comparison of the performance of
SAR segmentation algorithms. IEEE Transactions IP, 1996.
CAVES, R.; QUEGAN, S.; WHITE, R. G. Quantitative comparison of the performance
of SAR segmentation algorithms. IEEE Transactions on Image Processing, v. 7, n.
11, p. 15341546, Nov. 1998.
CHANG, L.; CHENG, C. M.; TANG, Z. S. An automatic detection of oil spills in SAR
images by using image segmentation approach. IEEE, 2005 [online]
<http://ieeexplore.ieee.org/ iel5/10226/32596/01525287.pdf?arnumber=1525287>,
acesso novembro 2006.
CHANG, Y.; LEE, M.; SHIMADA, A.T.; SAKAIDA, F.; KAWAMURA, H.; CHAN, J.; W.-
LU H. J. Wintertime high-resolution features of sea surface temperature and
chlorophyll-a fields associated with oceanic fronts in the southern East China Sea,
International Journal of Remote Sensing, v.29 n.21, p.6249-6261, November 2008 .
CHEN, M.; HAN, J.; YU, P. S. Data Mining: An Overview from a Database Perspective.
IEEE Transections on Knownledge and data Engineering, Vol 8, No 6, December,
1996.
DELVES, L. M.; WILKINSON, R.; OLIVER, C. J.; WHITE, R. G. Comparing the
performance of SAR segmentation algoritms. International Journal of Remote
Sensing, v. 13, n.11, p. 21221-21249, 1992.
DEL FRATE, F.; PETROCCHI, A.; LICHTENEGGER, J.; CALABRESI, G. Neural
Networks for oil spill detection using ERS-SAR data, IEEE Transc. on Geosc. and
Remote Sensing, 3 (5), 2282-2287, 2000.
DEFINIENS PROFESSIONAL 5. Reference Book. Published by Definiens Ag,
Trappentreus 1, München, Germany, 2006.
ENGELHARDT F. R. Remote Sensing for oil spill detection and response. Pure Appl,
vol.71 (1), pp103-111, 1999.
ELACHI, C. Introduction to the Physics and Techniques of Remote Sensing, New York
(NY) USA, John Wiley & Sons, 1987.
184
ESPEDAL, H.A.; WAHL, T. “Satellite SAR oil spill detection using wind history
information”, International Journal of Remote Sensing, 20 (1), 49-65, 1999.
ESPEDAL, H. A. Detection of oil spill and natural film in the marine environment by
spaceborne synthetic aperture radar. PhD thesis, Department of Physics University
of Bergen and Nansen Environment and Remote Sensing Center, Norway, 1998.
ESPINDOLA, G. M.; CÂMARA, G.; REIS, I. A.; BINS, L. S.; MONTEIRO, A. M. Spatial
Autocorrelation Indicators for Evaluation of Remote Sensing Image Segmentation
Algorithms. In: GIS and Spatial Analysis - 2005 Annual Conference of the
International Association for Mathematical Geology, Toronto - Canada, 2005.
ESPINDOLA G. M. Ajuste de parâmetros em algoritmos de segmentação de imagens
por crescimento de regiões. Dissertação de Mestrado em Sensoriamento Remoto,
INPE, 2006.
EVANGELOU, I. E.; HADJIMITSIS, D.G.; LAZAKIDOU, A.; CLAYTON, C. I. Data
mining and knowledge discovery in complex image data using artificial neural
networks. In: International Conference on Logic Programming, 17, Workshop on
Complex Reasoning on Geographical Data (ICLP´01), 2001.
ENVI 4.4 User’s guide: The Enviromment For Visualizing Images. Version 4.4, Tutorial
do software, consulta janeiro de 2010.
FERRARO, G.; BERNARDINI, A.; DAVID, M.; MEYER-ROUX S.; MUELLENHOFF, O.;
PERKOVIC M.; TARCHI, D.; TOPOUZELIS, K. Towards an operational use of
space imagery for oil pollution monitoring in the Mediterranean basin: A
demonstration in the Adriatic Sea. Marine Pollution Bulletin, 54 403422, 2007.
FINGAS, M.F.; BROWN, C.E. “Review of Oil Spill Remote Sensing”, in Proceedings of
the Sixth International Conference on Remote Sensing for Marine and Coastal
Environments, Veridian ERIM International, Ann Arbor, MI, pp. I211-218, 2000a.
FINGAS, M.F.; BROWN, C.E. “Review of Oil Spill Remote Sensing”, in Proceedings of
SPILLCON 2000, Australian Marine Safety Authority, Sydney, Australia,
www.meetingplanners.com.au/spillcon/, 2000b.
185
FINGAS, M.F.; BROWN, C.E. Review Of Oil Spill Remote Sensors. Presented at the
Seventh International Conference on Remote Sensing for M arine and Coastal
Environments, Miami, Florida, May, 2002.
FINGAS, M.F.; BROWN, C.E. Review Of Oil Spill Remote Sensing Presented at the
Eighth International Conference on Remote Sensing for Marine and Coastal
Environments, Halifax, Nova Scotia, May, 2005.
FISCELLA, B.; GIANCASPRO, A.; NIRCHIO, F.; PAVESE, P.; TRIVERO, P. Oil spill
detection using marine SAR images. International Journal of Remote Sensing Vol.
21, No 18, 35613566, 2000.
FRERY, A. C.; CORREIA, A. H.; FREITAS, C. C. Classifying Multifrequency Fully
Polarimetric Imagery with Multiple Sources of Statistical Evidence and Contextual
Information. IEEE Transactions on Geoscience and Remote Sensing, v. 45, p.
3098-3109, 2007.
GADE, M.; SCHOLZ, J.; VON VIEBAHN, C. On the detectability of marine oil pollution
in European marginal waters by means of ERS SAR imagery. Proc. IGARSS 2000,
vol. 6 (pp. 2510 2512), 2000.
GADE, M.; ALPERS, W.; HÜNERFUSS, H.; WISMANN, V. R.; LANGE, W.G. On the
reduction of radar backscatter by oceanic surface films: Scatterometer
measurements and their theoretical interpretation, Remote Sens. of Env. 66(1), 52-
70, 1998.
GALLAND, F.; GERMAIN O.; BERTAUX, N.; RÉFRÉGIER, P. Partitioning into
Homogeneous Regions Adapted to SAR Images, 2003 [online]
<http://www.fresnel.fr/perso/galland/ Galland04_ESA_EUSC_preprint.pdf>, acesso
novembro, 2006.
GALLAND, F.; BERTAUX, N.; RÉFRÉGIER, P. Minimum description Lenght Syntetic
Aperture RADAR. Image Segmentation. Image Processing, IEEE Transactions,
2003.
GALLAND, F.; RÉFRÉGIER, P.; GERMAIN, O. Syntetic Aperture Radar oil spill
segmentation by stochastic complexity minization. 2004, [online] <
http://ieeexplore.ieee.org/iel5/8859 /28004/101109LGRS2004835346.pdf>, acesso
novembro, 2006.
186
GAMBLE, L. Comunicação pessoal efetuada através de email com o operador da
estação de recepção de dados RADARSAT Gatineau. Contato efetuado em 2008.
GASULL, A.; FABREGAS, X.; JIMENEZ, J.; MARQUES, F.; MORENO, V.; HERRERO,
M. Oil spills detection in SAR images using mathematical morphology. Proc.
EUSIPCO’2002, Toulouse, France, vol. 1 (pp. 2528), 2002.
GENOVEZ, P. C.; POLITANO, A. T.; BENTZ, C. M. Utilização de Imagens ENVISAT
para a Detecção e Monitoramento de Acidentes Ambientais: Uma Abordagem
Operacional. Anais XIII Simpósio Brasileiro de Sensoriamento Remoto,
Florianópolis, Abril de 2007.
GENOVEZ, P.; FREITAS, C. C.; BENTZ, C. M.; FREITAS, R. M.; DUTRA, L. V.
Detecção de Óleo e Ocorrências Ambientais em Imagens SAR: Avaliação de
Diferentes Parâmetros de Pré-processamento e Diferentes Segmentadores. Anais
XIV Simpósio Brasileiro de Sensoriamento Remoto, Natal, Abril de 2009.
GENOVEZ, P.; PALMEIRA, F. L. B.; BENTZ, C. M. Detecção e Monitoramento de Óleo
através da Utilização Integrada de Imagens de Satélite, Verificações de Campo e
Modelagem de Deriva de Óleo: Uma Abordagem Operacional. Anais XIV Simpósio
Brasileiro de Sensoriamento Remoto, Natal, Abril de 2009.
GOODMAN, R. H.; BROWN, C. E. Oil Detection Limits For A Number Of Remote
Sensing Systems Presented at the Eighth International Conference on Remote
Sensing for Marine and Coastal Environments, Halifax, Nova Scotia, May 2005.
GOODMAN, R. H., “Overview and Future Trends in Oil Spill Remote Sensing”, Spill
Science and Technology Bulletin, Vol. 1, No. 1, pp. 11-21, 1994.
GONZALES, R.C.; WINTZ, P. Digital image processing. New York: Addison-Wesley,
1987.
HANG, L. M.; DINH, D. N., Oil Spill Detection and Classification by ALOS PALSAR at
Vietnam East Sea. 7
th
FIG Regional Conference Spatial Data Serving People: Land
Gib=vernance and the Environment Building the Capacity . Hanoi, Vietnan, 19-
22, October, 2009.
HAN, J.; KAMBER, M. Data Mining: Concepts and Techniques. Academic Press,
United States, 2001.
187
HARALICK, R.; SHANMUGAN, K.; DINSTEIN, I., “Textural features for image
classification”, IEEE Transactions on Systems, Man and Cybernetics, v. 3, n. 1, pp.
610-621, 1973.
HARALICK, R.M. “Statistical and structural approaches to texture”, Proceedings of the
IEEE , v. 67, n. 5, pp. 786-804, 1979.
HARALICK, R.M.; SHAPIRO, L.G. Image segmentation techniques. Machine Vision
International: Ann Arbor, 1984.
HOLT, B. SAR Imaging of Ocean Surface. Chapter 2 in Synthetic Aperture Radar
Marine User`s Manual, Organized by Jackson C. R. & Apel J. R., National Oceanic
and Atmospheric Administration NOAA, 2004.
HOVLAND, H.; JOHANNESSEN, J.A.; DIGRANES, G. Slick detection in SAR images.
Proceedings of the Internationl Geoscience and Remote Sensing Symposium
(IGARSS’94), IEEE, Pisacataway, USA, pp. 2038 - 2040, 1994.
HUGHES, G. On the Mean Accuracy of Statistical Pattern Recognizers. IEEE
TRANSACTIONS Oh- INFORMATION THEORY, january, 1968
INDREGARD, M.; SOLBERG, A.; CLAYTON, P. D2-report on benchmarking oil spill
recognition approaches and best practice. Tech. rep., Oceanides project, European
Commission, Archive No. 04-10225-A-Doc, Contract No: EVK2-CT-2003-00177,
2004.
JAIN, A. K.; MURTY, M. N.; FLYN, P. J. Data Clustering: A Review. ACCM Computing
Surveys, Vol 31, No 3, September, 1999.
JAIN, A.. K.; DUBES, R. C. Algorithms for clustering data. Prentice-Hall, advanced
reference series. Prentice-Hall Inc., Upper saddle River,NJ, 1988.
JOHNSON, R.A.; WICHERN, D.W. Applied multivariate statistical analysis. 3 ed. New
Jersey, Prentice Hall, 1992.
KANAA, T.F.N.; TONYE, E.; MERCIER, G.; ONANA, V.P.; NGONO, J.M.; FRISON,
P.L.; RUDANT, J.P.; GARELLO, R. Geoscience and Remote Sensing
SymposiumIGARSS’03, 4 (21), 2750 – 2752, 2003.
188
KARANTZALOS, K.; ARGIALAS, D. Automatic detection and tracking of oil spills in
SAR imagery with level set segmentation, International Journal of Remote Sensing,
v.29 n.21, p.6281-6296, November, 2008.
KARATHANASSI, V.; TOPOUZELIS, K.; PAVLAKIS, P.; ROKOS, D. An object-oriented
methodology to detect oil spills. Int. J. Remote Sens. 27, 5235-5251, 2006.
KERAMITSOGLOU, I.; CARTALIS, C.; KIRANOUDIS, C. Automatic Identification of oil
spills on satellite images. Environmenthal Modelling & Software (21), pp 640-652,
2006.
KOTOVA, L. A.; ESPEDAL, H. A.; JOHANNESSEN, O. M. Oil spill detection using
spaceborne SAR; a brief review. Proc. 27th ISRSE, Tromsb, Norway, 1998.
KUBAT, M.; HOLTE, C.; MATWIN, S. Machine learning for detection of oil spills in
satellite Radar images, Machine Learning, vol.30, no 2-3, 195-215, 1998.
KURZ, L.; BENTEFTIFA, H. Analysis of variance in statistical image processing.
Cambridge: Cambridge University Press, 1997.
LEHMANN, E.L.; JOSEPH, P.; ROMANO. Testing Statistical Hypotheses (3E ed.).
New York: Springer, 2005.
LEE-LUENG, F.; HOLT, B. SeaSat Views Oceans and Sea Ice with Synthetic-Aperture
Radar. National Aeronautics and Space Administration Jet Propulsion Laboratory
(NASA), Califórnia -USA , 1982.
LEWIS, A. J.; HENDERSON, F. M. Radar Fundamentals: The Geoscience
Perspective. Chapter 3 in Principles & Applications of Imaging RADAR Manual of
Remote Sensing, Volume 2 edited by Henderson F. M. & Lewis A. J. John Wiley
& Sons, 1998.
LE MOIGNE, J.; TILTON, J.C. Refining image segmentation by integration of edge and
region data. IEEE Transactions on Geocience and Remote Sensing, v. 33, n. 3, p.
605-615, May, 1995.
LIMA, J.A.M.; SCOFANNO, A.M., “New oceanographic challenges in the Brazilian
deepwater oil fields”. In: Offshore Technology Conference OTC, Huston, Texas,
May, 1999.
189
LIU, H.; SETIONO, R. "Chi2: Feature Selection and Discretization of Numeric
Attributes," Tools with Artificial Intelligence, IEEE International Conference on, pp.
388, Seventh International Conference on Tools with Artificial Intelligence, 1995.
LOPEZ, L.; MOCTEZUMA, M.; PARMIGGIANI, F. Oil Spill Detection Using GLCM and
MRF. IEEE, 2005, [online] <http://ieeexplore.ieee.org/iel5/10226/32597/
01526349.pdf arnumber=1526349>, acesso dezembro 2006.
LUCCA, E. V. D. Avaliação e comparação de algoritmos de segmentação de imagens
de radar abertura sintética. 207 p.Dissertação de Mestrado em Sensoriamento
Remoto) Instituto Nacional de Pesquisas Espaciais, São José dos Campos,
1998.
LUCCA, E. V. D.; FREITAS, C.; FRERY, A. C.; ANNA, S. J.S.S. Comparison of SAR
Segmentation Algorithms. Anais IX Simpósio Brasileiro de Sensoriamento Remoto,
Santos,1998.
MACCANDLESSS, S. W.; JACKSON, C. R. Principles of Synthetic Aperture Radar.
Chapter 2 in Synthetic Aperture Radar Marine User`s Manual. Organized by
Jackson C. R. & Apel J. R. National Oceanic and Atmospheric Administration
NOAA, 2004.
MANORE, M. J.; VACHON, P. W.; BJERKELUND, C.; EDEL, H. R.; RAMSAY, B.
Operational use of RADARSAT SAR in the coastal zone: The Canadian
experience. 27th International Symposium on Remote Sensing of the Environment,
Tromsø, Norway, June 812 (pp. 115 118), 1998.
MARANGONI, C. Sul principio della viscosi superficiale dei liquidi stabilito. Nuevo
Cimento, ser. 2 (5/6), pp. 239.273, 1872.
MARGHANY, M. RADARSAT automatic algorithms for detecting coastal oil spill
pollution, Intern. J. Appl. Earth Observation and Geoinformation, Vol. 3, N 2, pp.
191-196 , 2001.
MEINEL, G.; NEUBERT, M. A comparison of segmentation programs for high
resolution remote sensing data. In: Proceedings International Society for
Photogrammetry and Remote Sensing 29 Congress, XX, (ISPRS), Istanbul, Turkey
- July 2004.
190
MERCIER, G.; DERRODE, S.; PIECZYNSKI, W.; CAILLEC, J. -M. L.; GARELLO, R.
Multiscale oil slick segmentation with Markov Chain Model. Proc. IGARSS’03, vol. 6
(pp. 3501 3503), 2003.
MERCIER, G.; ARDHUIN, G. Oil Slick Detection by SAR Imagery Using Kernel
Expansion, 2005a, [online] <http://perso.enst-bretagne.fr/~mercierg/articles/
2005/oceansSVM.pdf >, acesso janeiro 2007.
MERCIER, G.; ARDHUIN, G. Unsupervised Oil Slick Detection by SAR Imagery Using
Support Vector Machines, 2005b, [online] <http://perso.enst-bretagne.fr/
~mercierg/articles/2005/mercier.igarss05.pdf >, acesso janeiro 2007.
MIGLIACCIO, M.; TRANFAGLIA, M. Oil Spill Observation by SAR: A Review, Proc.
US-Baltic International Symposium, Klaipeda (Latva), June 2004.
MIRANDA, F. P.; MENDOZA, A.; PEDROSO, E. C. ; BEISL, C. H. ; WELGAN, P. ;
MORALES, L. M.. Analysis of RADARSAT-1 data for offshore monitoring activities
in the Cantarell Complex, Gulf of Mexico, using the unsupervised semivariogram
textural classifier (USTC). Canadian Journal of Remote Sensing, Ottawa, Ontario,
Canada, v. 30, n. 3, p. 424-436, 2004.
MONTALI, A.; GIACINTO, G.; MIGLIACCIO, M.; GAMBARDELLA, A. Supervised
Pattern Classification Techniques for Oil Spill Classification in SAR Images:
Preliminary Results. Proceedings of SEASAR, Frascati, Italy, 2006.
NAVULUR, K. Multispectral image analysis using the object-oriented paradigm. CRC
Press Taylor & Francis Group 6000 Broken Sound Parkway, London - New York,
2007.
NEUBERT, M.; HEROLD, H.; MEINEL, G. Evaluation of Remote Sensing Image
Segmentation Quality- Further results and Concepts,2006 [online] <
http://www.commission4.isprs.org/obia06/Papers/10_Adaption%20and%20further%
20development%20II/OBIA2006_Neubert_Herold_Meinel.pdf >, acesso, março
2007.
NISBET, R. ; ELDER, J.; MINER, G. Handbook Of Statistical Analysis And Data Mining
Applications. Academic Press an imprint for Elsevier, USA, San Diego, California,
2009.
191
PEKKARINEN, A. A method for the segmentation of very high spatial resolution images
of forested landscapes. International Journal of Remote Sensing, v. 23, n. 14, p.
2817-2836, 2002.
PELIZZARI, S.; DIAS, J.M.B. Bayesian Adaptative Oil Spill Segmentation of SAR
Images Via Graph Cuts, 2003 [online] <http://earth.esa.int/workshops/seasar
2006/participants/ 256/paper_SoniaPelizzari_SEASAR2006_final.pdf >, acesso
março 2007.
PINHO, C. M. D. Análise Orientada a Objetos de Imagens de Satélite de Alta
Resolução Espacial Aplicada à Classificação de Cobertura do Solo no Espaço
Intra-Urbano: O Caso De São José Dos Campos SP. Dissertação de mestrado
defendida no INPE, São José dos Campos, 2006.
PRATT, W. Digital Image Processing. New York Wiley-Interscience, 1991.
QUEGAN, S.; RYE, A.J.; HENDRY A.; SKINGLEY J..; ODDY C..J. Automatic
interpretation strategies for synthetic aperture radar images. Philosophical
Transactions of the Royal Society of London. A 324, p. 409-421, 1988.
RAMALHO, G.L.B.; MEDEIROS, F.N.S. Improving Reliability of Oil Spill Detection
Systems Using Boosting for High-Level Feature Selection. M. Kamel and A.
Campilho (Eds.): ICIAR 2007, LNCS 4633, pp. 11721181, 2007.
RANEY, K. R. Radar Fundamentals: Technical Perspective. Chapter 2 in Principles &
Applications of Imaging RADAR Manual of Remote Sensing, Volume 2 edited
by Henderson F. M. & Lewis A. J. John Wiley & Sons, 1998.
ROMÁN-ROLDÁN, R.; GÓMEZ-LOPERA, J. F.; ATAE-ALLAH, C; MARTÍNEZ-AROZA,
J.; LUQUE-ESCAMILLA, P. L. A measure of quality for evaluating methods of
segmentation and edge detection. Pattern Recognation., v.34, p:969-980, 2001.
SEASAR. Workshop, SEASAR 2010, entitled "Advances in SAR Oceanography from
ENVISAT, ERS and ESA third party missions", which will be hosted at ESA ESRIN
in Frascati, Italy, from 25 to 29 January 2010.
SCOFIELD, G. B.; SANT´ANNA, S. J. S.; FREITAS, C. C.; DUTRA, L. V.. Avaliação
quantitativa do SegSar através de medidas de borda e regiões em imagens ópticas
192
sintéticas. Anais - XIII Simpósio Brasileiro de Sensoriamento Remoto,
Florianópolis, Abril, 2007.
SCHMULLIUS, C.C.; EVANS, D. L. “Synthetic Aperture Radar (SAR) frequency and
polarization requirements for applications in ecology, hydrology, and oceanography:
A tabular status quo after SIR-C/X-SAR”, International Journal Remote Sensing, v.
18, n. 13, pp. 2713-2722, 1997.
SIEGAL, S. Estatística não paramétrica para as ciências do comportamento. São
Paulo, Mc Grow -Hill; 350p., 1975.
SILVA, M. P. S. Mineração de padrões de mudanças em imagens de sensoriamento
remoto. 2006-02-03. 128 p. (INPE-14429-TDI/1130). Tese de Doutorado - Instituto
Nacional de Pesquisas Espaciais, São José dos Campos, 2006.
SILVA, M. P. S.; CÂMARA, G.; SOUZA, R. C. M.; VALERIANO, D. M. ; ESCADA, M. I.
S. Mining Patterns of Change in Remote Sensing Image Databases. In The Fifth
IEEE International Conference on Data Mining, Houston, 2005.
SKØELV, A. H. S.; WAHL, T. Oil spill detection using satellite based SAR, Phase 1B
competition report. Technical report, Norwegian Defense Research Establishment,
1993.
SLOGGETT, D.; JORY, I., “Automatic satellite based oil slick detection and monitoring
system”. In: First Workshop on ERS-1 Pilot Projects, Toledo Spain, 1994.
SOLBERG, A. H. S; SOLBERG, R. A large-scale evaluation of features for automatic
detection of oil spills in ERS SAR images, Proceedings of the International
Geoscience and Remote Sensing Symposium (IGARSS’97), Lincon, IEEE,
Pisacataway, USA, pp.157-159, 1996.
SOLBERG, A. H. S; VOLDEN, E. Incorporation a prior knowledge in automatic
classification of oil spills in ERS SAR images, Proceedings of the International
Geoscience and Remote Sensing Symposium (IGARSS’96), Lincon, IEEE,
Pisacataway, USA, pp.1484-1486, 1997.
SOLBERG, A. H. S.; STORVIK, G.; SOLBERG, R.; VOLDEN, E. Automatic detection
of oil spills in ERS SAR images, IEEE Trans. on Geosc. and Remote Sensing, 37
(4), July, 1999.
193
SOLBERG, A. H. S.; DOKKEN, S.T.; SOLBERG, R. Automatic detection of oil spills in
Envisat, Radarsat and ERS SAR images, Proceedings of the International
Geoscience and Remote Sensing Symposium (IGARSS’2003), Toulouse, France,
IEEE, Pisacataway, USA, 2003.
SOLBERG, A.; CLAYTON, P.; INDREGARD, M. D2 Report on benchmarking oil spill
recognition approaches and best practice. Kongsberg Satellite Services Norway
Archive No.: 04-10225-A-Doc, Issue/Revision : 2.1, 2005.
SOLBERG, A. Automatic Oil Apill Detection Based on ENVISAT, RADARSAT and ERS
Images. Proceedings of the ENVISAT & ERS Symposium, Salzburg, Austria, ESA
SP-572, 2005a.
SOLBERG, A. Automatic Detection and Estimating Confidence For Oil Spill Detection
in SAR Images. 2005b.
SOH, L.K.; TSATSOULIS, C. Segmentation of satellite imagery of natural scenes using
data mining. IEEE Transactions on Geoscience and Remote Sensing, v. 37, n. 2, p.
1086, 1999.
SOUSA Jr, M. A. Segmentação multi-níveis e multi-modelos para imagens de radar e
ópticas. Tese de Doutorado em Computação Aplicada. Instituto Nacional de
Pesquisas Espaciais, São José dos Campos, 2005.
SOUSA Jr, M. A.; DUTRA, L. V.; FREITAS, C.C. Segmentação de Imagens JERS e
TM/Landsat usando o Segmentador Icremental Multi-níveis SegSAR. Anais
XIISimpósio Brasileiro de Sensoriamento Remoto, Goiânia - Brasil, 2005.
STAPLES, G.C.; HODGINS, D.O. RADARSAT-1 emergency response for oil spill
monitoring. Proceedings of Fifth International Conference on Remote Sensing for
Marine and Coastal Environments, CA./USA, October, 1998.
STATHAKIS, D.; TOPOUZELIS, K.; KARATHANASSI, V. Large-scale feature selection
using evolved neural networks. In Proceedings of SPIE, Image and Signal
Processing for Remote Sensing XII, Bruzzone, Lorenzo Ed.; SPIE Bellingham
Wash. ETATS-UNIS: Stockholm, Sweden, September 13-14, p. 6365, 2006.
STATISTICA Data Analysis Software System, versão 8.0, Statsoft
Inc.<www.statsoft..com>, 2007.
194
TELO, M.; LÓPEZ, M. C.; MALLORQUI, J. J. A Novel Algorithm for Automatic Ship and
Oil Spill Detection Based on Time-Frequency Methods, 2006 [online] <
http://earth.esa.int/workshops/seasar2006/proceedings/papers/s5_16_tel.pdf>,
acesso abril, 2007.
TILTON, J.; LAWRENCE, W. Interactive analysis of hierarchical image segmentation.
In: International Geoscience and Remote Sensing Symposium IGARSS-2000, New
York. IEEE Press, 2000.
TOPOUZELIS, K.; KARATHANASSI, VC.; PAVLAKIS, P.; ROKOS, D. Oil Spill
Detection: SAR Multiscale Segmentation and Objects features Evaluation.
Proceedings of SPIE, Vol 4880, 2003.
TOPOUZELIS K.; KARATHANASSI, V.; PAVLAKIS, P.; ROKOS, D. Oil spill detection
using RBF Neural Networks and SAR data, XXth ISPRS Congress, Istanbul,
Turkey, July, 2004.
TOPOUZELIS K.; KARATHANASSI, V.; PAVLAKIS, P.; ROKOS, D. Detection and
discrimination between oil spills and look-alike phenomena through neural
networks, ISPRS J. Photogrammetry Rem. Sens., Vol. 62, N 9A, pp. 264-270,
2007a.
TOPOUZELIS K.; KARATHANASSI, V.; PAVLAKIS, P.; ROKOS, D. Oil Spill Detection
Using RBF Neural Networks and SAR Data. 2004, [online]
<http://www.isprs.org/istanbul2004 /comm7/papers/142.pdf>, acesso março,
2007b.
TOPOUZELIS, K.N.. Oil spill detection by SAR images: Dark formation detection,
feature extraction and classification algorithms, Sensors, Vol. 8, N 10, pp. 6642-
6659, DOI: 10.3390/s8106642 , 2008.
TOPOUZELIS, K.; STATHAKIS, D.; KARATHANASSI, V. Investigation of genetic
algorithms contribution to feature selection for oil spill detection, Intern. J. Rem.
Sens., Vol. 30, N 3, pp. 611-625, 2009.
VACHON, P. W., THOMAS, S. J., CRANTON, J. A., BJERKELUND, C., DOBSON, F.
W., OLSEN, R. B. Monitoring the coastal zone with the RADARSAT satellite.
Oceanology International 98, UK, March 1013, 10 pages, 1998.
195
VACHON, P. W.; WOLFE, J.; HAWKINS, R. K. The Impact of RADARSAT ScanSAR
Image Quality on Ocean Wind Retrieval. SAR Workshop: CEOS Committee on
Earth Observation Satellites; Working Group on Calibration and Validation,
Proceedings of a Conference held 26-29 October 1999, Toulouse, France. Edited
by Robert A. Harris and L. Ouwehand. Publisher: Paris: European Space Agency,
ESA-SP vol. 450, ISBN: 9290926414, p.519, 2000.
VALENZUELA, G.R. “Theories for the interaction of electromagnetic and ocean waves
A review”, Boundary Layer Meteorology., v. 13, pp. 61-85 , 1978.
VAPNIK, V. N., “An overview of statistical learning theory”, IEEE Transactions on
Neural Networks, v. 10, n. 5, pp. 988999, 1999.
WEISTEEN, K.; SOLBERG, A.; SOLBERG, R. “Detection of oil spills in SAR images
using a statistical classification scheme”. In: Proceedings of the International
Geoscience and Remote Sensing Symposium (IGARSS’93), Tokyo, IEEE,
Pisacataway, USA, pp. 943-945, 1993.
WISHART, D. Focal Point Clustering User Guide. Published by Clustan limited,
Edinburgh Road, Scotland, Second Edition, 2004.
WISMANN, V.; GADE, M.; ALPERS, W.; HÜHNERFUSS, W H. “Radar signatures of
marine mineral oil spills measured by an airborne multi-frequency radar”,
International Journal of Remote Sensing, v. 19, n. 18, pp. 3607-3623, 1998.
WU, S.; FLACH, P. A. Feature selection with labelled and unlabelled data.
ECML/PKDD'02 workshop on Integration and Collaboration Aspects of Data Mining,
Decision Support and Meta-Learning. M. Bohanec, B. Kasek, N. Lavrac, D.
Mladenic, (eds.), pp. 156167. August, 2002.
ZHANG, Y.J. A survey on evaluation methods for image segmentation. Pattern
Recognition, v. 29, n. 8, p. 1335-1346, 1996.
ZHENG, Y.; DONG, H.; JIANG, Q.; Li, J. A modified FCM-Based algorithm for oil spill
detection in SAR images. Environmental Informatics Archieves, Vol 3, pp 346-351,
2005.
ZUCKER, S. W. Region growing: childhood and adolescence. Computer Graphics and
Image Processing, 15, 382-399, 1976.
196
APÊNDICE I
Fluxograma: Métodos e Algoritmos utilizados para a Detecção de Óleo e
Assemelhados
197
APÊNDICE II
Tabela 1: Métricas calculadas para o teste efetuado com todos os filtros testados na
etapa de pré-processamento.
198
APÊNDICE III
Análise de Matriz de Correlação dos Atributos em Relação ao Phanton
(A): Atributos Espectrais - Estatísticos
Tabela 1 Matriz de Correlação dos Atributos Estatísticos em relação ao atributo da
Classe do Phanton: Recorte de Cena 1
Tabela 2 Matriz de Correlação dos Atributos Estatísticos em relação ao atributo da
Classe do Phanton: Recorte de Cena 2
Tabela 3 Matriz de Correlação dos Atributos Estatísticos em relação ao atributo da
Classe do Phanton: Recorte de Cena 3
199
Tabela 4 Matriz de Correlação dos Atributos Estatísticos em relação ao atributo da
Classe do Phanton: Recorte de Cena 4
Tabela 5 Matriz de Correlação dos Atributos Estatísticos em relação ao atributo da
Classe do Phanton: Recorte de Cena 5
Tabela 6 Matriz de Correlação dos Atributos Estatísticos em relação ao atributo da
Classe do Phanton: Recorte de Cena 6
200
Tabela 7 Matriz de Correlação dos Atributos Estatísticos em relação ao atributo da
Classe do Phanton: Recorte de Cena 7
Tabela 8 Matriz de Correlação dos Atributos Estatísticos em relação ao atributo da
Classe do Phanton: Recorte de Cena 8
Tabela 9 Matriz de Correlação dos Atributos Estatísticos em relação ao atributo da
Classe do Phanton: Recorte de Cena 9
201
Tabela 10 Matriz de Correlação dos Atributos Estatísticos em relação ao atributo da
Classe do Phanton: Recorte de Cena 10
Tabela 11 Matriz de Correlação dos Atributos Estatísticos em relação ao atributo da
Classe do Phanton: Recorte de Cena 11
(B): Atributos de Forma - Genéricos e Poligonais
Tabela 1 Matriz de Correlação dos Atributos de Forma (Genéricos e Poligonais) em
relação ao atributo da Classe do Phanton: Recorte de Cena 1
202
Tabela 2 Matriz de Correlação dos Atributos de Forma (Genéricos e Poligonais) em
relação ao atributo da Classe do Phanton: Recorte de Cena 2
Tabela 3 Matriz de Correlação dos Atributos de Forma (Genéricos e Poligonais) em
relação ao atributo da Classe do Phanton: Recorte de Cena 3
Tabela 4 Matriz de Correlação dos Atributos de Forma (Genéricos e Poligonais) em
relação ao atributo da Classe do Phanton: Recorte de Cena 4
203
Tabela 5 Matriz de Correlação dos Atributos de Forma (Genéricos e Poligonais) em
relação ao atributo da Classe do Phanton: Recorte de Cena 5
Tabela 6 Matriz de Correlação dos Atributos de Forma (Genéricos e Poligonais) em
relação ao atributo da Classe do Phanton: Recorte de Cena 6
Tabela 7 Matriz de Correlação dos Atributos de Forma (Genéricos e Poligonais) em
relação ao atributo da Classe do Phanton: Recorte de Cena 7
204
Tabela 8 Matriz de Correlação dos Atributos de Forma (Genéricos e Poligonais) em
relação ao atributo da Classe do Phanton: Recorte de Cena 8
Tabela 9 Matriz de Correlação dos Atributos de Forma (Genéricos e Poligonais) em
relação ao atributo da Classe do Phanton: Recorte de Cena 9
Tabela 10 Matriz de Correlação dos Atributos de Forma (Genéricos e Poligonais) em
relação ao atributo da Classe do Phanton: Recorte de Cena 10
205
Tabela 11 Matriz de Correlação dos Atributos de Forma (Genéricos e Poligonais) em
relação ao atributo da Classe do Phanton: Recorte de Cena 11
(C): Atributos Forma Skeletons
Tabela 1 Matriz de Correlação dos Atributos de Forma (Skeletons) em relação ao
atributo da Classe do Phanton: Recorte de Cena 1
Tabela 2 Matriz de Correlação dos Atributos de Forma (Skeletons) em relação ao
atributo da Classe do Phanton: Recorte de Cena 2
206
Tabela 3 Matriz de Correlação dos Atributos de Forma (Skeletons) em relação ao
atributo da Classe do Phanton: Recorte de Cena 3
Tabela 4 Matriz de Correlação dos Atributos de Forma (Skeletons) em relação ao
atributo da Classe do Phanton: Recorte de Cena 4
Tabela 5 Matriz de Correlação dos Atributos de Forma (Skeletons) em relação ao
atributo da Classe do Phanton: Recorte de Cena 5
Tabela 6 Matriz de Correlação dos Atributos de Forma (Skeletons) em relação ao
atributo da Classe do Phanton: Recorte de Cena 6
207
Tabela 7 Matriz de Correlação dos Atributos de Forma (Skeletons) em relação ao
atributo da Classe do Phanton: Recorte de Cena 7
Tabela 8 Matriz de Correlação dos Atributos de Forma (Skeletons) em relação ao
atributo da Classe do Phanton: Recorte de Cena 8
Tabela 9 Matriz de Correlação dos Atributos de Forma (Skeletons) em relação ao
atributo da Classe do Phanton: Recorte de Cena 9
Tabela 10 Matriz de Correlação dos Atributos de Forma (Skeletons) em relação ao
atributo da Classe do Phanton: Recorte de Cena 10
208
Tabela 11 Matriz de Correlação dos Atributos de Forma (Skeletons) em relação ao
atributo da Classe do Phanton: Recorte de Cena 11
(D): Atributos Texturais - Haralick
Tabela 1 Matriz de Correlação dos Atributos Texturais (Haralick) em relação ao
atributo da Classe do Phanton: Recorte de Cena 1
Tabela 2 Matriz de Correlação dos Atributos Texturais (Haralick) em relação ao
atributo da Classe do Phanton: Recorte de Cena 2
209
Tabela 3 Matriz de Correlação dos Atributos Texturais (Haralick) em relação ao
atributo da Classe do Phanton: Recorte de Cena 3
Tabela 4 Matriz de Correlação dos Atributos Texturais (Haralick) em relação ao
atributo da Classe do Phanton: Recorte de Cena 4
Tabela 5 Matriz de Correlação dos Atributos Texturais (Haralick) em relação ao
atributo da Classe do Phanton: Recorte de Cena 5
210
Tabela 6 Matriz de Correlação dos Atributos Texturais (Haralick) em relação ao
atributo da Classe do Phanton: Recorte de Cena 6
Tabela 7 Matriz de Correlação dos Atributos Texturais (Haralick) em relação ao
atributo da Classe do Phanton: Recorte de Cena 7
Tabela 8 Matriz de Correlação dos Atributos Texturais (Haralick) em relação ao
atributo da Classe do Phanton: Recorte de Cena 8
211
Tabela 9 Matriz de Correlação dos Atributos Texturais (Haralick) em relação ao
atributo da Classe do Phanton: Recorte de Cena 9
Tabela 10 Matriz de Correlação dos Atributos Texturais (Haralick) em relação ao
atributo da Classe do Phanton: Recorte de Cena 10
Tabela 11 Matriz de Correlação dos Atributos Texturais (Haralick) em relação ao
atributo da Classe do Phanton: Recorte de Cena 11
212
APÊNDICE IV:
Análise de Componentes Principais
Tabela 1 - Autovalores, Número de Autovalores, Variância Total e Acumulada em
Porcentagem, Autovalores Acumulados e o Percentual de Ganho referente a Inserção
das Variáveis no Modelo: Recorte de Cena 1
213
Tabela 2 - Autovalores, Número de Autovalores, Variância Total e Acumulada em
Porcentagem, Autovalores Acumulados e o Percentual de Ganho referente a Inserção
das Variáveis no Modelo: Recorte de Cena 2
214
Tabela 3 - Autovalores, Número de Autovalores, Variância Total e Acumulada em
Porcentagem, Autovalores Acumulados e o Percentual de Ganho referente a Inserção
das Variáveis no Modelo: Recorte de Cena 3
215
Tabela 4 - Autovalores, Número de Autovalores, Variância Total e Acumulada em
Porcentagem, Autovalores Acumulados e o Percentual de Ganho referente a Inserção
das Variáveis no Modelo: Recorte de Cena 4
216
Tabela 5 - Autovalores, Número de Autovalores, Variância Total e Acumulada em
Porcentagem, Autovalores Acumulados e o Percentual de Ganho referente a Inserção
das Variáveis no Modelo: Recorte de Cena 5
217
Tabela 6 - Autovalores, Número de Autovalores, Variância Total e Acumulada em
Porcentagem, Autovalores Acumulados e o Percentual de Ganho referente a Inserção
das Variáveis no Modelo: Recorte de Cena 6
218
Tabela 7 - Autovalores, Número de Autovalores, Variância Total e Acumulada em
Porcentagem, Autovalores Acumulados e o Percentual de Ganho referente a Inserção
das Variáveis no Modelo: Recorte de Cena 7
219
Tabela 8 - Autovalores, Número de Autovalores, Variância Total e Acumulada em
Porcentagem, Autovalores Acumulados e o Percentual de Ganho referente a Inserção
das Variáveis no Modelo: Recorte de Cena 8
220
Tabela 9 - Autovalores, Número de Autovalores, Variância Total e Acumulada em
Porcentagem, Autovalores Acumulados e o Percentual de Ganho referente a Inserção
das Variáveis no Modelo: Recorte de Cena 9
221
Tabela 10 - Autovalores, Número de Autovalores, Variância Total e Acumulada em
Porcentagem, Autovalores Acumulados e o Percentual de Ganho referente a Inserção
das Variáveis no Modelo: Recorte de Cena 10
222
Tabela 11 - Autovalores, Número de Autovalores, Variância Total e Acumulada em
Porcentagem, Autovalores Acumulados e o Percentual de Ganho referente a Inserção
das Variáveis no Modelo: Recorte de Cena 11
223
APÊNDICE V:
Seleção de Atributos pelo Método Chi-Quadrado
Tabela 1 Ranking dos atributos indicados pelo Chi-Quadrado como mais
representativos em relação à Classe do Phanton: Recorte de Cena 1
224
Tabela 2 Ranking dos atributos indicados pelo Chi-Quadrado como mais
representativos em relação à Classe do Phanton: Recorte de Cena 2
225
Tabela 3 Ranking dos atributos indicados pelo Chi-Quadrado como mais
representativos em relação à Classe do Phanton: Recorte de Cena 3
226
Tabela 4 Ranking dos atributos indicados pelo Chi-Quadrado como mais
representativos em relação à Classe do Phanton: Recorte de Cena 4
227
Tabela 5 Ranking dos atributos indicados pelo Chi-Quadrado como mais
representativos em relação à Classe do Phanton: Recorte de Cena 5
228
Tabela 6 Ranking dos atributos indicados pelo Chi-Quadrado como mais
representativos em relação à Classe do Phanton: Recorte de Cena 6
229
Tabela 7 Ranking dos atributos indicados pelo Chi-Quadrado como mais
representativos em relação à Classe do Phanton: Recorte de Cena 7
230
Tabela 8 Ranking dos atributos indicados pelo Chi-Quadrado como mais
representativos em relação à Classe do Phanton: Recorte de Cena 8
231
Tabela 9 Ranking dos atributos indicados pelo Chi-Quadrado como mais
representativos em relação à Classe do Phanton: Recorte de Cena 9
232
Tabela 10 Ranking dos atributos indicados pelo Chi-Quadrado como mais
representativos em relação à Classe do Phanton: Recorte de Cena 10
233
Tabela 11 Ranking dos atributos indicados pelo Chi-Quadrado como mais
representativos em relação à Classe do Phanton: Recorte de Cena 11
234
Figura 1; Ranking da importância indicado pelo Chi-Quadrado para os 36 atributos,
efetuado para as 11 cenas.
Queda gradativa da
importância
Queda acentuada
da importância
Queda acentuada
da importância
Queda acentuada
da importância
Queda acentuada
da importância
Maior importância
concentrada nos 5
primeiros indicados
Maior importância
concentrada nos 4
primeiros indicados
Maior importância
concentrada nos 6
primeiros indicados
Maior importância
concentrada nos 4
primeiros indicados
Maior importância
concentrada nos 5
primeiros indicados
235
0,00
0,25
0,50
0,75
1,00
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36
Atributos
% Acumulado
Cena 1 Cena 2 Cena 3 Cena 4 Cena 5 Cena 6
Cena 7 Cena 8 Cena 9 Cena 10 Cena 11
Queda acentuada
da importância
Maior importância
concentrada nos 2
primeiros indicados
Queda acentuada
da importância
Maior importância
concentrada nos 5
primeiros indicados
Queda acentuada
da importância
Maior importância
concentrada nos 5
primeiros indicados
Queda acentuada
da importância
Maior importância
concentrada nos 5
primeiros indicados
Queda acentuada
da importância
Maior importância
concentrada nos 5
primeiros indicados
Livros Grátis
( http://www.livrosgratis.com.br )
Milhares de Livros para Download:
Baixar livros de Administração
Baixar livros de Agronomia
Baixar livros de Arquitetura
Baixar livros de Artes
Baixar livros de Astronomia
Baixar livros de Biologia Geral
Baixar livros de Ciência da Computação
Baixar livros de Ciência da Informação
Baixar livros de Ciência Política
Baixar livros de Ciências da Saúde
Baixar livros de Comunicação
Baixar livros do Conselho Nacional de Educação - CNE
Baixar livros de Defesa civil
Baixar livros de Direito
Baixar livros de Direitos humanos
Baixar livros de Economia
Baixar livros de Economia Doméstica
Baixar livros de Educação
Baixar livros de Educação - Trânsito
Baixar livros de Educação Física
Baixar livros de Engenharia Aeroespacial
Baixar livros de Farmácia
Baixar livros de Filosofia
Baixar livros de Física
Baixar livros de Geociências
Baixar livros de Geografia
Baixar livros de História
Baixar livros de Línguas
Baixar livros de Literatura
Baixar livros de Literatura de Cordel
Baixar livros de Literatura Infantil
Baixar livros de Matemática
Baixar livros de Medicina
Baixar livros de Medicina Veterinária
Baixar livros de Meio Ambiente
Baixar livros de Meteorologia
Baixar Monografias e TCC
Baixar livros Multidisciplinar
Baixar livros de Música
Baixar livros de Psicologia
Baixar livros de Química
Baixar livros de Saúde Coletiva
Baixar livros de Serviço Social
Baixar livros de Sociologia
Baixar livros de Teologia
Baixar livros de Trabalho
Baixar livros de Turismo