Download PDF
ads:
UNIVERSIDADE TECNOL
´
OGICA FEDERAL DO PARAN
´
A
PROGRAMA DE P
´
OS-GRADUAC¸
˜
AO EM ENGENHARIA EL
´
ETRICA E
INFORM
´
ATICA INDUSTRIAL
DIOGO ROSA KUIASKI
SEGMENTAC¸
˜
AO DE PELE EM IMAGENS DIGITAIS PARA A
DETECC¸
˜
AO AUTOM
´
ATICA DE CONTE
´
UDO OFENSIVO
DISSERTAC¸
˜
AO DE MESTRADO
CURITIBA
2010
ads:
Livros Grátis
http://www.livrosgratis.com.br
Milhares de livros grátis para download.
DIOGO ROSA KUIASKI
SEGMENTAC¸
˜
AO DE PELE EM IMAGENS DIGITAIS PARA A
DETECC¸
˜
AO AUTOM
´
ATICA DE CONTE
´
UDO OFENSIVO
Dissertac¸
˜
ao apresentada ao Programa de P
´
os-
graduac¸
˜
ao em Engenharia El
´
etrica e Inform
´
atica
Industrial da Universidade Tecnol
´
ogica Federal do
Paran
´
a como requisito parcial para obtenc¸
˜
ao do grau
de “Mestre em Ci
ˆ
encias”
´
Area de Concentrac¸
˜
ao:
Inform
´
atica Industrial.
Orientador: Prof. Dr. Hugo Vieira Neto
CURITIBA
2010
ads:
Ficha catalográfíca elaborada pela Biblioteca
da
UTFPR
-
Campus Curitiba
K96s
Kuiaski,
Diogo
Rosa
Segmentação
de
pele
em
imagens
digitais
para
a
detecção
automática
de
conteúdo
ofensivo
/
Diogo
Rosa Kuiaski.
-
2010.
77
f.:
il.;
30 cm
Orientador: Hugo Vieira Neto
Dissertação (Mestrado)
-
Universidade Tecnológica Federal
do
Paraná.
Programa
de
Pós-Graduação
em
Engenharia
Elétrica
e
Informática
Industrial. Área
de
Concentração:
Informática
Industrial,
Curitiba,
2010
Bibliografia:
f.
75-7
1.
Processamento
de
imagens
-
Técnicas
digitais.
2.
Detecção
de
pele.
3.
Banco
de
dados
de
imagens.
4.
Pixel.
5.
Reconhecimento
de
padrões.
6.
Mineração
de
dados (Computação).
I.
Vieira Neto, Hugo, orient.
II.
Universidade Tecnológica Federal
do
Paraná. Programa
de
Pós-Graduação
em
Engenharia Elétrica
e
Informática Industrial. Área
de
Concentração
em
Informática
Industrial. III. Titulo.
CDD621.3
ii
U I
f"PR
UNIVERSIDADE
TECNOLÓGICA
FEDERAL
DO
PARANÁ
Campus
Curitiba
PROGRAMA
DE
PÓS-GRADUAÇÃO
EM
ENGENHARIA
ELÉTRÍCA
E
INFORMÁTICA
INDUSTRIAL
CAMPUS
CURITIBA
Programa
de
Pós-Graduação
em
Engenharia Elétrica
e
Informática
Industrial
Título
da
Dissertação
N°
517:
"Segmentação
de
Pele
em
Imagens Digitais para
a
Detecção Automática
de
Conteúdo Ofensivo"
por
Diogo Rosa Kuiaski
Esta dissertação
foi
apresentada,
às
09h30min
do dia 25 de
fevereiro
de
2010, como requisito parcial para
a
obtenção
do
grau
de
MESTRE
EM
CIÊNCIAS
-
Área
de
Concentração: Informática Industrial, pelo Programa
de
Pós-Graduação
em
Engenharia Elétrica
e
Informática Industrial
-
CPGEI
-, na
Universidade Tecnológica
Federal
do
Paraná
-
UTFPR.
O
trabalho
foi
aprovado pela Banca Examinadora,
composta pelos professores:
<—-Prôf.
Dr.
Hugo
Vieira
Nélo
(Orientador
-
UTFPR)
Prof.
Dr
José
Carlos Ferreira
da
Rocha
(UEPG)
Prof.
Dr.
Marcelo
Victor
Wust
Zibetti
/fUTFPR)
Visto
da
coordenação:
N
Prof.
Dr.
Humberto
Remígio Gambá
(Coordenador
do
CPGEI)
Av.
Sete
de
Setembro,
3165-
80230-901
-
Curitiba
- PR.
Tel.
+55
(41) 3310
4680/e-mail:
[email protected]/http://www.cpgei.ct.utfpr.edu.br
AGRADECIMENTOS
Agradec¸o a meus familiares pelo apoio, aos colegas de laborat
´
orio pela ajuda e incentivo, e
aos amigos pelo suporte nesta etapa de minha carreira.
Ainda, agradec¸o o apoio financeiro recebido da CAPES e UOL.
O projeto de pesquisa desta dissertac¸
˜
ao teve o apoio do programa UOL Bolsa Pesquisa -
processos 20080129153400 e 20090213081100.
(http://bolsapesquisa.uol.com.br)
Habe nun, ach! Philosophie,
Juristerei und Medizin,
Und leider auch Theologie
Durchaus studiert, mit heißem Bem
¨
uhn.
Da steh ich nun, ich armer Tor!
Und bin so klug als wie zuvor;
Faust - Goethe.
Ent
˜
ao, ah! Filosofia,
Direito e Medicina,
e, infelizmente, tamb
´
em a Teologia
Estudando calorosamente.
Estou eu aqui, pobre tolo!
T
˜
ao inteligente quanto antes;
Faust - Goethe.
RESUMO
KUIASKI, Diogo R.. Segmentac¸
˜
ao de Pele em Imagens Digitais para a Detecc¸
˜
ao Autom
´
atica
de Conte
´
udo Ofensivo. 79 f. Dissertac¸
˜
ao – Programa de P
´
os-graduac¸
˜
ao em Engenharia El
´
etrica
e Inform
´
atica Industrial, Universidade Tecnol
´
ogica Federal do Paran
´
a. Curitiba, 2010.
O presente trabalho tem como objetivo estudar meios de efetuar a detecc¸
˜
ao autom
´
atica de
conte
´
udo ofensivo (pornografia) em imagens digitais. Para tal estudou-se largamente segmenta-
c¸
˜
ao de pixels de pele, espac¸os de cor e descritores de conte
´
udo. Esse trabalho tem um foco
maior na segmentac¸
˜
ao de pele, pois
´
e a etapa primordial nos trabalhos envolvendo detecc¸
˜
ao
de conte
´
udo ofensivo. Testou-se quatro m
´
etodos de segmentac¸
˜
ao de pixels de pele e foi con-
stru
´
ıdo um banco de dados estruturado para o estudo de segmentac¸
˜
ao de pele, com meios de
anotac¸
˜
ao de imagens para auxiliar na estruturac¸
˜
ao e no controle das caracter
´
ısticas das imagens
do banco. Com o aux
´
ılio das metainformac¸
˜
oes do banco de imagens, foram conduzidos estudos
envolvendo as condic¸
˜
oes de iluminac¸
˜
ao e a segmentac¸
˜
ao de pele. Por fim, foi implementado um
algoritmo de extrac¸
˜
ao de caracter
´
ısticas em sistemas de classificac¸
˜
ao pelo conte
´
udo de imagens
(CBIR) para detecc¸
˜
ao de conte
´
udo ofensivo.
Palavras-chave: detecc¸
˜
ao de pele; segmentac¸
˜
ao de cor; anotac¸
˜
ao de imagens; banco de dados
de images; CBIR.
ABSTRACT
KUIASKI, Diogo R.. Skin Segmentation on Digital Images for Automatic Offensive-content
Detection. 79 f. Dissertac¸
˜
ao Programa de P
´
os-graduac¸
˜
ao em Engenharia El
´
etrica e In-
form
´
atica Industrial, Universidade Tecnol
´
ogica Federal do Paran
´
a. Curitiba, 2010.
This work presents a study of suitable approaches for automatic detection of offensive content
(pornography) in digital images. Extensive experiments were conducted for skin pixel segmen-
tation, colour spaces and content descriptors. This work focus its efforts on skin pixel seg-
mentation, since this segmentation is the pre-processing stage for almost every content-based
offensive image classification methods in the literature. Four skin skin segmentation methods
were tested in six colour spaces. Also, a structured image database was built to help improve
studies in skin segmentation, with the possibility of adding meta-information to the images in
the database, such as illumination conditions and camera standards. With the help of meta infor-
mation from the image database, experimets involving illumination conditions and skin colour
segmentation were also done. Finally, some feature extraction algorithms were implemented in
order to apply content-based image retrieval (CBIR) algorithms to classify offensive images.
Keywords: skin detection; color segmentation; image annotation; image databases; CBIR.
LISTA DE FIGURAS
FIGURA 1 ETAPAS DA DETECC¸
˜
AO DE CONTE
´
UDO. . . . . . . . . . . . . . . . . . . . . . . . . . 20
FIGURA 2 EXEMPLO DE SEGMENTAC¸
˜
AO DE PIXELS DE PELE. . . . . . . . . . . . . . 24
FIGURA 3 DIAGRAMA DOS VALORES DE TP, FN, TN, FP. . . . . . . . . . . . . . . . . . . . 25
FIGURA 4 CURVAS ROC PARA O CLASSIFICADOR JONES & REHG. . . . . . . . . . 40
FIGURA 5 CURVAS ROC PARA O CLASSIFICADOR NA
¨
IVE BAYES. . . . . . . . . . . 41
FIGURA 6 CURVAS ROC PARA O CLASSIFICADOR POR SIMPLES GAUSSIANA. 42
FIGURA 7 CURVAS ROC PARA O CLASSIFICADOR MOG. . . . . . . . . . . . . . . . . . . . 43
FIGURA 8 IMAGENS DO BANCO SKINDB. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
FIGURA 9 DIAGRAMA EM
´
ARVORE XML . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
FIGURA 10 CURVAS ROC PARA O CLASSIFICADOR JONES & REHG. . . . . . . . . . 51
FIGURA 11 CURVAS ROC PARA O CLASSIFICADOR NA
¨
IVE BAYES. . . . . . . . . . . 51
FIGURA 12 CURVAS ROC PARA O CLASSIFICADOR MOG. . . . . . . . . . . . . . . . . . . . 52
FIGURA 13 CURVAS ROC PARA O CLASSIFICADOR POR SIMPLES GAUSSIANA. 52
FIGURA 14 CURVAS ROC PARA O CLASSIFICADOR JONES & REHG UTILIZANDO
IMAGENS EM AMBIENTES ABERTOS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
FIGURA 15 CURVAS ROC PARA O CLASSIFICADOR JONES & REHG UTILIZANDO
IMAGENS EM AMBIENTES FECHADOS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
FIGURA 16 CURVAS ROC PARA O CLASSIFICADOR NA
¨
IVE BAYES UTILIZANDO
IMAGENS EM AMBIENTES ABERTOS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
FIGURA 17 CURVAS ROC PARA O CLASSIFICADOR NA
¨
IVE BAYES UTILIZANDO
IMAGENS EM AMBIENTES FECHADOS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
FIGURA 18 CURVAS ROC PARA O CLASSIFICADOR MOG UTILIZANDO IMA-
GENS EM AMBIENTES ABERTOS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
FIGURA 19 CURVAS ROC PARA O CLASSIFICADOR MOG UTILIZANDO IMA-
GENS EM AMBIENTES FECHADOS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
FIGURA 20 CURVAS ROC PARA O CLASSIFICADOR SIMPLES GAUSSIANA UTI-
LIZANDO IMAGENS EM AMBIENTES ABERTOS. . . . . . . . . . . . . . . . . . . . 59
FIGURA 21 CURVAS ROC PARA O CLASSIFICADOR SIMPLES GAUSSIANA UTI-
LIZANDO IMAGENS EM AMBIENTES FECHADOS. . . . . . . . . . . . . . . . . . 59
FIGURA 22 PROCEDIMENTO PARA DETECC¸
˜
AO DE CONTE
´
UDO OFENSIVO . 61
FIGURA 23 DIVIS
˜
AO DA IMAGEM PARA O EHD . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
FIGURA 24 MATRIZES DE SUPER-PIXELS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
FIGURA 25 DIVIS
˜
AO DA IMAGEM PARA O CD . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
FIGURA 26 PROJEC¸
˜
OES DE BLOCOS DE PELE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
LISTA DE TABELAS
TABELA 1 RESULTADOS PARA O CLASSIFICADOR JONES & REHG. . . . . . . 39
TABELA 2 RESULTADOS PARA O CLASSIFICADOR NA
¨
IVE BAYES. . . . . . . . . 41
TABELA 3 RESULTADOS PARA O CLASSIFICADOR POR SIMPLES GAUS-
SIANA. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
TABELA 4 RESULTADOS PARA O CLASSIFICADOR MOG. . . . . . . . . . . . . . . . . . 43
TABELA 5 CURVAS ROC PARA OS CLASSIFICADORES EDSR. . . . . . . . . . . . . . 44
TABELA 6 RESULTADOS PARA O CLASSIFICADOR JONES & REHG. . . . . . . 55
TABELA 7 RESULTADOS PARA O CLASSIFICADOR NA
¨
IVE BAYES . . . . . . . . . 57
TABELA 8 RESULTADO PARA O CLASSIFICADOR MOG. . . . . . . . . . . . . . . . . . . 58
TABELA 9 RESULTADOS PARA O C4.5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
TABELA 10 MATRIZ DE CONFUS
˜
AO C4.5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
TABELA 11 RESULTADOS PARA O ADABOOST . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
TABELA 12 MATRIZ DE CONFUS
˜
AO ADABOOST . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
TABELA 13 RESULTADOS PARA O BAGGING . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
TABELA 14 MATRIZ DE CONFUS
˜
AO BAGGING . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
LISTA DE SIGLAS
CBIR Content-based image retrieval - Busca de imagens com base no conte
´
udo
PNG Portable network graphics - Gr
´
aficos de rede portavel
KNN K-nearest neightboors - K vizinhos mais pr
´
oximos
VPP Valor de predic¸
˜
ao positiva
GT Ground-Truth - Padr
˜
ao-ouro
ROC Receiver Operating Characteristics - Caracter
´
ısticas operacionais do receptor
MoG Mixture of Gaussians - Mistura de Gaussianas
EM Expectation Maximization - Maximizac¸
˜
ao do valor esperado
EDSR Explicity Defined Skin Regions - Regi
˜
oes de pele explicitamente definidas
XML eXtensible Markup Languange - Linguagem de marcac¸
˜
ao extens
´
ıvel
URL Uniform resource locator - Localizador uniforme de recursos
ROI Region of interest - Regi
˜
ao de interesse
CSV Comma Separated Values - Valores separados por v
´
ırgulas
SCD Scalable Colour Descriptor - Descritor escal
´
avel de cor
EHD Edge Histogram Descriptor - Descritor histograma de bordas
CD Compactness Descriptor - Descritor de compactac¸
˜
ao
WEKA Waikato Environment for Knowledge Analysis - Ambiente de Waikato para a an
´
alise
de conhecimento
REPTree Regression Tree -
´
Arvore de regress
˜
ao
SUM
´
ARIO
1 INTRODUC¸
˜
AO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.1 DELIMITAC¸
˜
AO DO TEMA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.2 JUSTIFICATIVA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.3 ESTRUTURAC¸
˜
AO DO TRABALHO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2 REVIS
˜
AO DOS M
´
ETODOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.1 DETECC¸
˜
AO DE CONTE
´
UDO OFENSIVO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.1.1 Vetores de Caracter
´
ısticas e Principais M
´
etodos da Literatura . . . . . . . . . . . . . . . . . . . . 20
2.1.2 Avaliac¸
˜
ao dos Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.2 SEGMENTAC¸
˜
AO DE PELE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.2.1 Curvas ROC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
3 SEGMENTAC¸
˜
AO DE PELE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
3.1 ESPAC¸ OS DE COR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
3.1.1 Espac¸os de Cor Aditivos (RGB e RG normalizado) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
3.1.2 Espac¸os de Cor Perceptuais (HSI e HS) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
3.1.3 Espac¸os de Cor Ortogonais (YCbCr e CbCr) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
3.2 MODELOS PROBABIL
´
ISTICOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
3.2.1 Gaussianas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.2.2 Mistura de Gaussianas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.2.3 Algoritmo EM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3.2.4 Histogramas de Cor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
3.2.5 Histograma de Cor na
¨
ıve Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
3.3 CLASSIFICADORES DE PIXELS DE PELE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
3.3.1 Regra de Regi
˜
oes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
3.3.2 Regra de Jones & Rehg . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
3.3.3 Comparac¸
˜
ao Direta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
3.4 RESULTADOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
3.4.1 Classificador Jones & Rehg . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
3.4.2 Classificador na
¨
ıve Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
3.4.3 Classificador por Simples Gaussiana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
3.4.4 Classifcador MoG . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
3.4.5 Classificadores EDSR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
3.5 DISCUSS
˜
OES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
4 EFEITOS DA ILUMINAC¸
˜
AO AMBIENTE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
4.1 BANCO DE IMAGENS ESTRUTURADO - SKINDB . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
4.1.1 Anotac¸
˜
ao das Imagens . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
4.2 ILUMINAC¸
˜
AO AMBIENTE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
4.3 M
´
ETODOS UTILIZADOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
4.4 RESULTADOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
4.4.1 Classificador Jones & Rehg . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
4.4.2 Classificador na
¨
ıve Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
4.4.3 Classificador MoG . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
4.4.4 Classificador por Simples Gaussiana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
4.5 DISCUSS
˜
OES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
5 DETECC¸
˜
AO DE CONTE
´
UDO OFENSIVO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
5.1 CONJUNTO DE CARACTER
´
ISTICAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
5.1.1 Remoc¸
˜
ao do Plano de Fundo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
5.1.2 Descritor Escal
´
avel de Cor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
5.1.3 Descritor Histograma de Bordas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
5.1.4 Descritor de Compactac¸
˜
ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
5.1.5 Projec¸
˜
oes de Pele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
5.2 ALGORITMOS DE CLASSIFICAC¸
˜
AO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
5.2.1 C4.5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
5.2.2 AdaBoost . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
5.2.3 Bagging . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
5.3 RESULTADOS E DISCUSS
˜
OES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
5.4 DISCUSS
˜
OES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
6 CONCLUS
˜
OES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
6.1 SEGMENTAC¸
˜
AO DE PELE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
6.2 ILUMINAC¸
˜
AO AMBIENTE E BANCO DE DADOS CONTROLADO . . . . . . . . . . . 73
6.3 DETECC¸
˜
AO DE CONTE
´
UDO OFENSIVO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
6.4 TRABALHOS FUTUROS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
6.4.1 Segmentac¸
˜
ao de Pele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
6.4.2 Iluminac¸
˜
ao Ambiente e Banco de Dados Controlado . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
6.4.3 Detecc¸
˜
ao de Conte
´
udo Ofensivo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
REFER
ˆ
ENCIAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
15
1 INTRODUC¸
˜
AO
As informac¸
˜
oes contidas na rede mundial de computadores s
˜
ao de f
´
acil acesso, aparente-
mente sem restric¸
˜
oes. A detecc¸
˜
ao de conte
´
udo ofensivo representa um papel importante para
limitar o acesso a informac¸
˜
oes indesej
´
aveis a usu
´
arios da rede. Entretanto, o fator motivador
desta pesquisa
´
e prover uma ferramenta aos mantenedores de s
´
ıtios de uma rede. Essa fer-
ramenta mostraria se em alguma m
´
aquina, sob a supervis
˜
ao do mantenedor, est
´
a armazenado
algum tipo de conte
´
udo ofensivo, o qual
´
e especificamente a pornografia.
A detecc¸
˜
ao autom
´
atica de s
´
ıtios de conte
´
udo ofensivo
´
e uma tarefa relativamente f
´
acil
quando se tem acesso a todas as informac¸
˜
oes do s
´
ıtio. As informac¸
˜
oes contidas no s
´
ıtio s
˜
ao
na maioria textuais. Palavras-chave indicam se existe ou n
˜
ao conte
´
udo ofensivo em um s
´
ıtio da
rede. A proposta do presente trabalho
´
e encontrar imagens de conte
´
udo ofensivo, sem utilizar
outras informac¸
˜
oes al
´
em das contidas na pr
´
opria imagem.
Trabalhar com os elementos de uma imagem e a partir deles conseguir definir o contexto
de uma cena
´
e uma tarefa desafiadora. Escolher um m
´
etodo, implementar e testar com um
padr
˜
ao-ouro
´
e um trabalho que demanda muito tempo e poder computacional. Foram feitos
alguns testes para alguns modelos, mas ainda h
´
a muito o que ser feito para a detecc¸
˜
ao coerente
de conte
´
udo ofensivo em imagens digitais. Os desafios da pesquisa se encontram na diversi-
dades de m
´
etodos encontradas na literatura e na falta de padr
˜
oes para comparac¸
˜
ao do m
´
etodo
apresentado na presente pesquisa com os propostos por Jones e Rehg (1999); Fleck, Forsyth e
Bregler (1996); e Shih, Lee e Yang (2007); por exemplo.
A maior contribuic¸
˜
ao desse trabalho est
´
a na realizac¸
˜
ao de uma pesquisa relativa
`
a etapa
segmentac¸
˜
ao de pixels de pele. O presente trabalho investigou quest
˜
oes ainda pouco abordadas
pela literatura, relativas ao impacto que a variac¸
˜
ao da cor dos pixels de pele exerce no desem-
penho da segmentac¸
˜
ao. A cor de pele varia principalmente com o tipo de iluminac¸
˜
ao ambiente
e isso reflete nas taxas de acerto utilizadas na segmentac¸
˜
ao dos pixels de pele. Para investigar
essa influ
ˆ
encia, os m
´
etodos da literatura foram testados exaustivamente para v
´
arios modelos de
espac¸os de cor e iluminac¸
˜
oes ambiente.
16
1.1 DELIMITAC¸
˜
AO DO TEMA
Delimitou-se o tema na investigac¸
˜
ao de metodologias de detecc¸
˜
ao de conte
´
udo ofensivo
em imagens. As metodologias aqui estudadas s
˜
ao, em sua totalidade, algoritmos que utilizam
informac¸
˜
oes contidas em imagens digitais, sem que sejam utilizadas an
´
alises textuais ou outras
fontes de informac¸
˜
ao. Como resultado do estudo pretende-se testar e discutir o desempenho das
metodologias citadas por autores da
´
area.
O objetivo primordial nesta dissertac¸
˜
ao
´
e estudar metodologias de detecc¸
˜
ao de conte
´
udo
ofensivo, mas outros estudos se fazem necess
´
arios para realizar tal tarefa. Entre os passos
intermedi
´
arios da pesquisa est
˜
ao estudar a segmentac¸
˜
ao de pele, espac¸os de cor e t
´
ecnicas de
Content-based image retrieval - Busca de imagens com base no conte
´
udo (CBIR).
Ser
´
a dada uma atenc¸
˜
ao especial a m
´
etodos de segmentac¸
˜
ao autom
´
atica de pele humana.
O foco foi posto desta forma pois a segmentac¸
˜
ao de pele
´
e utilizada na maioria dos algorit-
mos de detecc¸
˜
ao de conte
´
udo ofensivo (SOLAR et al., 2005; JONES; REHG, 1999; FLECK;
FORSYTH; BREGLER, 1996). Durante a pesquisa sobre segmentac¸
˜
ao autom
´
atica de pele
foram realizados alguns estudos com o intuito de otimizar a segmentac¸
˜
ao na tentativa de melho-
rar taxas de acerto do classificador de conte
´
udo ofensivo. Esses estudos limitaram-se a espac¸os
de cor, bancos de imagens e efeitos da iluminac¸
˜
ao ambiente.
Na segmentac¸
˜
ao de pixels s
˜
ao utilizados modelos estat
´
ısticos para representar matemati-
camente a cor de pele. Os modelos, param
´
etricos ou n
˜
ao-param
´
etricos, foram a base para a
montagem de classificadores, sendo todos eles baseados em cor de pixel. Foram realizados
testes para seis espac¸os de cor e quatro classificadores. Os resultados dos classificadores s
˜
ao
comparados utilizando uma mesma base de dados a fim de se encontrar o classificador de mel-
hor resultado. Ap
´
os encontrado o melhor classificador, esse foi selecionado para a aplicac¸
˜
ao
nos classificadores de conte
´
udo ofensivo.
A literatura descreve que a iluminac¸
˜
ao ambiente tem forte influ
ˆ
encia sobre a segmentac¸
˜
ao
de pixels de pele (VEZHNEVETS V.; SAZONOV, 2003; JAYARAM et al., 2004; KAKU-
MANU; MAKROGIANNIS; BOURBAKIS, 2007). Para averiguar esse fato, foi proposto um
estudo no qual somente imagens sob um tipo conhecido de iluminac¸
˜
ao s
˜
ao apresentadas ao
classificador de pixels de pele. Os resultados desse estudo mostram que existe mesmo uma in-
flu
ˆ
encia da iluminac¸
˜
ao ambiente na segmentac¸
˜
ao de pele. No estudo dos efeitos da iluminac¸
˜
ao
ambiente foram testadas imagens de um banco de dados pr
´
oprio para os mesmos classificadores
de pixels de pele implementados nesse trabalho.
Para a detecc¸
˜
ao de conte
´
udo ofensivo foram testados alguns classificadores e vetores de
17
caracter
´
ısticas. Os objetivos foram: descobrir quais caracter
´
ısticas das imagens melhor repre-
sentam conte
´
udo ofensivo e encontrar um classificador
´
otimo para a mesma tarefa.
1.2 JUSTIFICATIVA
A tarefa principal em reconhecimento de conte
´
udo atrav
´
es de caracter
´
ısticas visuais est
´
a
em se retirar informac¸
˜
oes relevantes e concisas dos elementos que constituem uma imagem.
Em uma cena, quando um observador tenta identificar seres humanos, existem caracter
´
ısti-
cas marcantes que o levam a reconhecer uma pessoa (VEZHNEVETS V.; SAZONOV, 2003).
Essas caracter
´
ısticas s
˜
ao reconhecidas atrav
´
es da uni
˜
ao de um conhecimento pr
´
evio, ou conhec-
imento top-down, do observador, e de informac¸
˜
oes visuais trazidas pela imagem, ou conhec-
imento bottom-up (PALMER, 1999). Com o aux
´
ılio dessa estrutura, um observador humano
discrimina regi
˜
oes de interesse em imagens.
Entretanto, quando n
˜
ao se trata de um observador humano, mas de um computador,
´
e pre-
ciso utilizar t
´
ecnicas que permitam reproduzir esta estrutura de conhecimento. Caracter
´
ısticas
top-down ainda n
˜
ao s
˜
ao t
˜
ao bem representadas por modelos matem
´
aticos, deixando para as car-
acter
´
ısticas bottom-up os resultados de uma boa ou m
´
a classificac¸
˜
ao. Esse fato foi acompanhado
e gerou variac¸
˜
oes dr
´
asticas de resultados durante o decorrer do trabalho e ser
´
a melhor discutido
nos cap
´
ıtulos que seguem.
1.3 ESTRUTURAC¸
˜
AO DO TRABALHO
O trabalho est
´
a dividido em seis partes: a contextualizac¸
˜
ao do tema, a revis
˜
ao dos m
´
etodos,
a segmentac¸
˜
ao de pixels de pele, a anotac¸
˜
ao de imagens, o desenvolvimento do banco de dados
controlado e a classificac¸
˜
ao de conte
´
udo ofensivo. Nessa estrutura, ambos os conhecimen-
tos, top-down e bottom-up, est
˜
ao presentes tanto na segmentac¸
˜
ao de pixels de pele quanto na
classificac¸
˜
ao de imagens ofensivas. As demais partes apresentam estudos feitos para melhorar
os resultados das etapas de classificac¸
˜
ao e entender melhor o processo como um todo.
No cap
´
ıtulo 2
´
e feita a revis
˜
ao dos m
´
etodos mais utilizados nas
´
areas de reconhecimento
de conte
´
udo ofensivo, reconhecimento de padr
˜
oes e minerac¸
˜
ao de dados. Isso fundamentou
a adoc¸
˜
ao dos modelos e m
´
etodos utilizados no decorrer do trabalho. Ainda, o cap
´
ıtulo mostra
como todas as etapas do trabalho est
˜
ao conectadas, al
´
em de uma vis
˜
ao geral sobre os algoritmos
e m
´
etodos dessa pesquisa.
Como a segmentac¸
˜
ao de pixels de pele representa muito na detecc¸
˜
ao de conte
´
udo ofen-
18
sivo, o cap
´
ıtulo 3
´
e exclusivamente dedicado
`
a revis
˜
ao, resultados e conclus
˜
oes tiradas da
segmentac¸
˜
ao autom
´
atica de pixels de pele. Nesse cap
´
ıtulo s
˜
ao comparados m
´
etodos de segmenta-
c¸
˜
ao de pixels de pele. A an
´
alise dos resultados mostra qual classificador obteve os melhores
resultados.
Alguns experimentos feitos durante a etapa da segmentac¸
˜
ao de pixels de pele geraram resul-
tados significativos para a pesquisa, sendo esses os estudos dos efeitos da iluminac¸
˜
ao ambiente.
No cap
´
ıtulo 4
´
e explicado como a iluminac¸
˜
ao ambiente influencia na detecc¸
˜
ao de pixels de
pele e, ainda, como foi constru
´
ıdo o banco de dados de estudos de padr
˜
oes em pele humana
(SkinDB).
No cap
´
ıtulo 5 s
˜
ao descritos os m
´
etodos utilizados na detecc¸
˜
ao de conte
´
udo ofensivo, com
os resultados e as considerac¸
˜
oes acerca do que esperar de uma boa ou m
´
a classificac¸
˜
ao. E,
finalmente, no cap
´
ıtulo 6 s
˜
ao tiradas as conclus
˜
oes sobre todas as etapas da presente pesquisa.
19
2 REVIS
˜
AO DOS M
´
ETODOS
A seguir ser
˜
ao mostrados alguns dos m
´
etodos mais utilizados para a detecc¸
˜
ao de conte
´
udo
ofensivo, o que inclui etapas intermedi
´
arias como a segmentac¸
˜
ao de pele e problemas descritos
pelos autores, que s
˜
ao abordados nos cap
´
ıtulos que seguem.
2.1 DETECC¸
˜
AO DE CONTE
´
UDO OFENSIVO
As metodologias de detecc¸
˜
ao de conte
´
udo ofensivo encontrada na literatura s
˜
ao relativa-
mente semelhantes. O procedimento de classificac¸
˜
ao
´
e simples e em sua maioria realizado da
seguinte forma: Segmentac¸
˜
ao de pele, construc¸
˜
ao do vetor de caracter
´
ısticas e classificac¸
˜
ao. Os
classificadores mais comuns necessitam de um conhecimento pr
´
evio para serem constru
´
ıdos.
A estrutura adotada pela maioria dos trabalhos na literatura
´
e representada na figura 1, a qual
mostra ao lado esquerdo a construc¸
˜
ao do modelo atrav
´
es de imagens com conte
´
udo previamente
conhecido e ao lado direito a an
´
alise do modelo em imagens teste.
Tal estrutura pode ser vista nos trabalhos de Jones e Rehg (1999), Shih, Lee e Yang (2007),
entre outros. Mesmo tendo a mesma estrutura, os m
´
etodos propostos pelos autores se diferen-
ciam em como cada uma das etapas
´
e feita.
Para todas as etapas deste trabalho, utilizou-se o banco de imagens conhecido como Com-
paqDB (JONES; REHG, 1999), criado por Jones e Rehg (1999). O banco
´
e composto por
aproximadamente 5000 imagens contendo pixels de pele, e outras 8000 com imagens sem a
presenc¸a de pessoas. Das 5000 imagens em que aparecem pessoas na cena, aproximadamente
um terc¸o s
˜
ao imagens de conte
´
udo ofensivo.
Para facilitar o entendimento sobre quais imagens foram utilizadas para cada etapa do pre-
sente trabalho, foram criadas selec¸
˜
oes do banco CompaqDB. A primeira selec¸
˜
ao
´
e o Com-
paqDBpng, na qual todas as imagens foram convertidas para o formato Portable network
graphics - Gr
´
aficos de rede portavel (PNG) e separadas em dois grupos, imagens com pix-
els de pele e imagens sem pixels de pele. A partir da selec¸
˜
ao CompaqDBpng foi criada a
20
Imagens
de treino
Extração das
características
Extração das
características
Construção do
Modelo
- c4.5
- AdaBoost
- RBFNN
Aplicação do
Modelo
teste e avaliação
Imagens
de teste
Figura 1: Modelo gen
´
erico para a classificac¸
˜
ao de imagens quanto
`
a presenc¸a de conte
´
udo ofensivo.
CompaqDBeasy500, um conjunto de 500 imagens aleat
´
orias para cada um dos dois grupos do
CompaqDBpng. A selec¸
˜
ao CompaqDBContent foi criada separando o CompaqDBpng em dois
grupos iguais de 1349 imagens: um com conte
´
udo ofensivo e outro de conte
´
udo n
˜
ao ofensivo.
Na selec¸
˜
ao que n
˜
ao apresenta conte
´
udo ofensivo foram igualmente selecionadas imagens de
pessoas e outras imagens sem a presenc¸a de pessoas.
Com o objetivo de ter uma vis
˜
ao geral sobre os m
´
etodos, cada uma dessas etapas ser
´
a explo-
rada. Os m
´
etodos estudados e a discuss
˜
ao sobre a escolha para a implementac¸
˜
ao e simulac¸
˜
oes
est
˜
ao na subsec¸
˜
ao 2.1.1 e na sec¸
˜
ao 2.2.
2.1.1 Vetores de Caracter
´
ısticas e Principais M
´
etodos da Literatura
Os trabalhos de detecc¸
˜
ao de conte
´
udo ofensivo mais significativos t
ˆ
em como trabalho base
os estudos feitos por Fleck, Forsyth e Bregler (1996), nos quais foram utilizadas caracter
´
ısticas
geom
´
etricas, como a presenc¸a de rostos e a posic¸
˜
ao relativa entre partes do corpo. A classifica-
c¸
˜
ao foi feita pela presenc¸a ou aus
ˆ
encia das caracter
´
ısticas geom
´
etricas nas imagens.
Jones e Rehg (1999) utilizam caracter
´
ısticas geom
´
etricas de tamanho relativo de
´
areas de
pixels de pele, quantidade de pixels de pele conectados e n
´
umero de regi
˜
oes de pele conectadas.
A classificac¸
˜
ao
´
e feita atrav
´
es do algoritmo de construc¸
˜
ao de
´
arvores de decis
˜
ao C4.5 (QUIN-
LAN, 1996).
21
J
´
a nos trabalhos de Shih, Lee e Yang (2007), s
˜
ao utilizadas caracter
´
ısticas de cor, geometria
e textura para descrever o conte
´
udo. O m
´
etodo de classificac¸
˜
ao utilizado
´
e o algoritmo de
K-nearest neightboors - K vizinhos mais pr
´
oximos (KNN). Nesse m
´
etodo, o vetor de carac-
ter
´
ıstica
´
e comparado com vetores de caracter
´
ıstica de classe conhecida e a classe da maioria
absoluta dos K primeiros
´
e a classe a qual pertence o vetor em an
´
alise. A m
´
etrica utilizada foi
a diferenc¸a simples ou dist
ˆ
ancia L1, aplicada entre o vetor de caracter
´
ısticas da imagem que
se deseja avaliar e 100 vetores conhecidos gerados pela extrac¸
˜
ao de caracter
´
ısticas de imagens
previamente classificadas entre conte
´
udo ofensivo e conte
´
udo n
˜
ao-ofensivo.
Para os trabalhos de Solar et al. (2005) os descritores tamb
´
em s
˜
ao geom
´
etricos e aplicados
sobre os maiores blocos de pele encontrados na imagem. S
˜
ao descritores de excentricidade,
posic¸
˜
ao, elongac¸
˜
ao e
´
area do blocos de pele. Uma novidade trazida pelos autores
´
e fazer um
estudo de caso numa regi
˜
ao espec
´
ıfica da internet: somente s
´
ıtios chilenos.
A maioria dos m
´
etodos utiliza descritores geom
´
etricos. No presente trabalho, foi utilizado
o m
´
etodo de extrac¸
˜
ao de caracter
´
ısticas proposto por Shih, Lee e Yang (2007) e aplicado a
alguns modelos de CBIR. Foi proposta tal metodologia, pois as taxas de acerto dos trabalhos
de Shih, Lee e Yang (2007) foram as melhores encontradas na literatura, al
´
em da descric¸
˜
ao das
caracter
´
ısticas ser clara e coerente com o contexto das imagens de conte
´
udo ofensivo.
Dentre outros trabalhos da literatura pode-se citar os de Hammami, Chahir e Chen (2006),
Hu et al. (2007) e Lee e Luh (2008), os quais utilizam informac¸
˜
oes al
´
em das encontradas nos
pixels das imagens, como an
´
alise de textos, tags HTML entre outros. A maioria dos tra-
balhos encontrados na literatura apresenta uma taxa de acerto de aproximadamente 90% de
classificac¸
˜
ao para imagens de conte
´
udo ofensivo.
Entretanto, n
˜
ao existe nesses trabalhos um banco de dados padr
˜
ao que pudesse ser utilizado
para comparar os resultados obtidos neste trabalho com os outros da literatura. Os bancos de im-
agens encontrados na literatura s
˜
ao em sua maioria imagens capturadas diretamente da internet
sem passar pela aferic¸
˜
ao de observadores e n
˜
ao dispon
´
ıvel para testes de outros pesquisadores.
O m
´
etodo utilizado para a captura das imagens da internet utiliza um procedimento conhecido
como web crawling.
2.1.2 Avaliac¸
˜
ao dos Resultados
A an
´
alise de resultados para a detecc¸
˜
ao de conte
´
udo ofensivo
´
e feita atrav
´
es de valor
de predic¸
˜
ao positiva (precision) e sensibilidade (recall) (THEODORIDIS; KOUTROUMBAS,
2006). O Valor de predic¸
˜
ao positiva (VPP) representa quantas imagens s
˜
ao realmente imagens
22
de conte
´
udo ofensivo dentre todas as imagens classificadas como tal, ou seja, a soma das cor-
retamente e incorretamente classificadas. A sensibilidade representa a quantidade de imagens
corretamente classificadas dentre todas as imagens que realmente s
˜
ao imagens de conte
´
udo
ofensivo.
O melhor valor da classificac¸
˜
ao ocorre quando ambas as taxas s
˜
ao pr
´
oximas de 1, pois o
classificador acertou o maior n
´
umero de imagens ofensivas e n
˜
ao errou com imagens n
˜
ao ofen-
sivas. Tamb
´
em foi utilizada a matriz de confus
˜
ao, a qual mostra quantas imagens foram clas-
sificadas em quais classes e, ainda, se a classificac¸
˜
ao foi correta ou n
˜
ao. Foram utilizadas duas
classes para detecc¸
˜
ao de conte
´
udo ofensivo: imagens de conte
´
udo ofensivo (classe conte
´
udo
ofensivo) e imagens sem conte
´
udo ofensivo (classe conte
´
udo n
˜
ao-ofensivo). Utilizando 2 classes
a matriz de confus
˜
ao apresenta 2 colunas por 2 linhas. A matriz de confus
˜
ao pode ser vista na
figura 3 aplicada
`
a an
´
alise dos dados na sec¸
˜
ao 2.2.1
2.2 SEGMENTAC¸
˜
AO DE PELE
A cor de pele
´
e uma caracter
´
ıstica marcante (VEZHNEVETS V.; SAZONOV, 2003) e
por isso os m
´
etodos de segmentac¸
˜
ao de pele nesse trabalho realizam a classificac¸
˜
ao tendo
como base somente a informac¸
˜
ao de cor. Al
´
em do fato de se utilizar a cor, os m
´
etodos para
a segmentac¸
˜
ao de pele aqui descritos s
˜
ao feitos pixel a pixel, como sugerem a maioria dos
trabalhos na
´
area (JONES; REHG, 1999; PHUNG; CHAI; BOUZERDOUM, 2001; FLECK;
FORSYTH; BREGLER, 1996). Outra opc¸
˜
ao de segmentac¸
˜
ao de pele
´
e a utilizac¸
˜
ao de informac¸
˜
oes
de regi
˜
oes de pixels (KRUPPA; BAUER; SCHIELE, 2002; JEDYNAK; ZHENG; DAOUDI,
2003; YANG; AHUJA, 1998), mas foi verificado junto
`
a literatura que os m
´
etodos de classificac¸
˜
ao
pixel a pixel s
˜
ao mais robustos e r
´
apidos (VEZHNEVETS V.; SAZONOV, 2003; KAKU-
MANU; MAKROGIANNIS; BOURBAKIS, 2007), enquanto apresentam taxas de acerto e erro
parecidas com os m
´
etodos por regi
˜
oes.
Durante os estudos de segmentac¸
˜
ao de pele e para a construc¸
˜
ao dos modelos utilizou-se,
tamb
´
em, as selec¸
˜
oes CompaqDBpng e CompaqDBeasy500. Cada imagem do banco Com-
paqDB cont
´
em uma imagem bin
´
aria correspondente que indica atrav
´
es da cor quais s
˜
ao pixels
de pele (pixels brancos) e quais n
˜
ao s
˜
ao (pixels pretos). Essas imagens bin
´
arias s
˜
ao, tamb
´
em,
conhecidas como m
´
ascaras bin
´
arias e o conjunto de m
´
ascaras constitui o Ground-Truth - Padr
˜
ao-
ouro (GT).
Utilizou-se o CompaqDB como banco de imagens, pois os principais trabalhos encontrados
na literatura foram feitos sobre um banco de imagens pr
´
oprio, o qual na maioria dos casos n
˜
ao
23
´
e aberto ou de dif
´
ıcil acesso para outros pesquisadores, como por exemplo os bancos ECU e
M2VTS (KAKUMANU; MAKROGIANNIS; BOURBAKIS, 2007), dois bancos de imagens
utilizados para a detecc¸
˜
ao de faces sem o padr
˜
ao-ouro para pele. O fato de conciliar os m
´
etodos
de segmentac¸
˜
ao de pele com um
´
unico banco de imagens assegura que a comparac¸
˜
ao entre
eles seja mais justa. Para resolver o problema de um banco padr
˜
ao, foi iniciada a construc¸
˜
ao
de um banco de imagens espec
´
ıfico para estudos envolvendo a segmentac¸
˜
ao de pele. O banco
constru
´
ıdo neste trabalho
´
e chamando de skinDB e as formas de aquisic¸
˜
ao das imagens s
˜
ao
explicadas em maiores detalhes no cap
´
ıtulo 4.
A metodologia utilizada para a validac¸
˜
ao dos m
´
etodos de segmentac¸
˜
ao de pele foi construir
os modelos matem
´
aticos de cor de pele utilizando a selec¸
˜
ao CompaqDBeasy500 e testar os
modelos de segmentac¸
˜
ao de pele pixel a pixel encontrados na literatura no conjunto total de
imagens, o banco CompaqDBpng. Os modelos foram aplicados a uma s
´
erie de espac¸os de cor
buscando qual conjunto espac¸o-modelo seria
´
otimo para a segmentac¸
˜
ao de pixels de pele.
Os resultados s
˜
ao analisados de duas formas: na forma de curvas de Receiver Operating
Characteristics - Caracter
´
ısticas operacionais do receptor (ROC) (FAWCETT, 2004) e na forma
de mapas de pele. Mapas de pele s
˜
ao resultados prim
´
arios dos experimentos de classificac¸
˜
ao
de pixels. Tais mapas s
˜
ao imagens bin
´
arias de tamanho igual
`
a imagem a ser segmentada,
ou imagem de entrada, os quais cont
ˆ
em a predic¸
˜
ao sobre quais pixels foram ou n
˜
ao foram
considerados pele. A predic¸
˜
ao positiva (pixel de pele) gera no mapa de pele um pixel de cor
branca, caso contr
´
ario esse pixel ser
´
a de cor preta. A figura 2 apresenta um exemplo de uma
imagem da selec¸
˜
ao CompaqDBeasy500 juntamente com o padr
˜
ao-ouro e alguns mapas de pele
gerados atrav
´
es de diferentes modelos probabil
´
ısticos e espac¸os de cor.
2.2.1 Curvas ROC
Uma das formas de an
´
alise dos resultados da segmentac¸
˜
ao de pixels de pele
´
e feita atrav
´
es
de curvas ROC. Trata-se de uma an
´
alise comparativa e efetuada entre classificadores. Assim,
´
e poss
´
ıvel comparar o desempenho dos m
´
etodos utilizados. As curvas foram concebidas como
ferramenta de decis
˜
ao estat
´
ıstica (FAWCETT, 2004). Foram largamente aplicadas durante a 2
a
Guerra Mundial para an
´
alise de imagens de radar e atualmente s
˜
ao muito utilizadas no aux
´
ılio
a diagn
´
ostico m
´
edico e s
˜
ao tamb
´
em aplicadas para a avaliac¸
˜
ao de classificadores bin
´
arios (for-
mados somente por duas classes) como
´
e o caso neste trabalho.
Os eixos de uma curva ROC correspondem a taxas de acerto e erro. No eixo vertical est
˜
ao
as taxas de acerto ou de verdadeiros positivos (TPR - True Positive Rate) enquanto no eixo
horizontal est
˜
ao as taxas de erro, ou de falsos positivos (FPR - False Positive Rate). As taxas
24
(a)
(b)
(c)
(d) (e)
(f)
Figura 2: Exemplo de segmentac¸
˜
ao: (a) Imagem original; (b) Padr
˜
ao-ouro; (c) Resultado do classi-
ficador Jones & Rehg e espac¸o de cor CbCr; (d) Resultado do classificador Jones & Rehg e espac¸o
de cor RG normalizado; (e) Resultado do classificador na
¨
ıve Bayes e espac¸o de color CbCr; (f)
resultado do classificador na
¨
ıve Bayes e espac¸o de cor RG normalizado.
s
˜
ao adquiridas comparando cada pixel do padr
˜
ao-ouro com o resultado do classificador. A
comparac¸
˜
ao
´
e feita utilizando o operando l
´
ogico “e” (and), portanto surgem quatro valores
poss
´
ıveis:
1. Verdadeiros-positivos (TP), quando GT
´
e pele and resultado
´
e pele;
2. Falsos-negativos (FN), quando GT
´
e pele and resultado
´
e n
˜
ao-pele;
3. Falsos-positivos (FP), quando GT
´
e n
˜
ao-pele and resultado
´
e pele;
4. Verdadeiros-negativos (TN), quando GT
´
e pele-n
˜
ao and resultado
´
e n
˜
ao-pele;
As taxas TPR e FPR s
˜
ao obtidas atrav
´
es do n
´
umero de ocorr
ˆ
encias de TP, FP, TN e FN para
todos os dados analisados. As equac¸
˜
oes 1 e 2 mostram como s
˜
ao calculadas essas taxas.
T PR =
nT P
nT P + nFN
(1)
FPR =
nFP
nT N + nFP
(2)
25
onde nT P
´
e o n
´
umero de verdadeiros positivos, nFP o n
´
umero de falsos positivos, nFN o
n
´
umero de falsos negativos e nT N o n
´
umero de verdadeiros negativos.
A figura 3 mostra a tabela de conting
ˆ
encia (Matriz de confus
˜
ao).
Padrão-ouro (GT)
Resultado da
Classificação
p
n
p
n
Verdadeiro
Positivo
Verdadeiro
Negativo
Falso
Negativo
Falso
Positivo
Figura 3: Diagrama ilustrativo do que s
˜
ao os valores de TP, FN, FP, TN. Onde p s
˜
ao pixels de pele
e n pixels de n
˜
ao pele.
Para se levantar uma curva ROC s
˜
ao necess
´
arios v
´
arios pontos (FPR,TPR). Tais valores
s
˜
ao conseguidos atrav
´
es da variac¸
˜
ao de par
ˆ
ametros do classificador. Para a detecc¸
˜
ao de pele, o
par
ˆ
ametro utilizado para construc¸
˜
ao das curvas ROC
´
e um valor de limiar, dado pela regras de
decis
˜
ao do que se considera pele e do que se rejeita como sendo pele. Isso
´
e melhor explicado no
cap
´
ıtulo 3. O valor de limiar que apresenta melhor resultado
´
e o ponto (FPR,TPR) que cont
´
em
menor valor de FPR e, ao mesmo tempo, o maior TPR. O valor resultante corresponde ao ponto
conhecido como “joelho” da curva.
26
3 SEGMENTAC¸
˜
AO DE PELE
O trabalho de segmentac¸
˜
ao de pele consiste de estudar, implementar e testar as metodolo-
gias mais utilizadas da literatura, com o objetivo de escolher, dentre os m
´
etodos, qual apresenta
o melhor desempenho. Tal m
´
etodo de segmentac¸
˜
ao
´
e aplicado na detecc¸
˜
ao de conte
´
udo ofen-
sivo.
A segmentac¸
˜
ao foi feita utilizando informac¸
˜
oes de cor de cada pixel, que
´
e um ponto em
um espac¸o de cor n-dimensional, definido por um vetor c = [c
1
,c
2
,.. .,c
n
]. As componentes
do vetor c representam as informac¸
˜
oes de lumin
ˆ
ancia e de cromin
ˆ
ancia do pixel. Espac¸os
de cor s
˜
ao geralmente tridimensionais, c = [c
1
,c
2
,c
3
], como o RGB, HSI, YCbCr, YQQ, SCT,
cieLUV e cieLAB, entre outros. Entretanto, para este trabalho foram utilizados somente espac¸os
de cor com 2 e 3 dimens
˜
oes. No vetor est
˜
ao representadas as informac¸
˜
oes de lumin
ˆ
ancia
e cromin
ˆ
ancia, que s
˜
ao propriedades da luz incidente no sensor de uma c
ˆ
amera. Normal-
mente, a lumin
ˆ
ancia
´
e representada por uma das tr
ˆ
es dimens
˜
oes, deixando as outras duas para
a informac¸
˜
ao de cromin
ˆ
ancia. Nesta dissertac¸
˜
ao foram conduzidos experimentos de reduc¸
˜
ao
da dimensionalidade dos espac¸os de cor, ou seja, tr
ˆ
es dos seis espac¸os de cor investigados s
˜
ao
bidimensionais (somente cromin
ˆ
ancia) e os outros tr
ˆ
es s
˜
ao tridimensionais (cromin
ˆ
ancia e lu-
min
ˆ
ancia).
A representac¸
˜
ao do conjunto de cores de pixel que comp
˜
oe a pele humana
´
e feita atrav
´
es
de modelos matem
´
aticos. Para montar um modelo de cor da pele humana (ST
¨
ORRING, 2004)
exitem dois poss
´
ıveis caminhos: (a) Fixar uma regi
˜
ao no espac¸o de cor e assumir que todos
os pixels contidos dentro desse subespac¸o s
˜
ao pixels de pele; (b) Estabelecer modelos proba-
bil
´
ısticos, nos quais probabilidades de cor da pele indicam a chance do pixel ser de pele.
A classificac¸
˜
ao de pixels de pele
´
e feita aplicando ao modelo matem
´
atico uma regra de
decis
˜
ao. Uma regra de decis
˜
ao
´
e feita dividindo o espac¸o de cores em regi
˜
oes que s
˜
ao consid-
eradas pele e regi
˜
oes que s
˜
ao consideradas n
˜
ao-pele. Por exemplo, quando
´
e definida a regi
˜
ao
no espac¸o de cor essa regra
´
e: est
´
a dentro da regi
˜
ao
´
e pele sen
˜
ao n
˜
ao
´
e. Para os modelos prob-
abil
´
ısticos, os quais somente mostram as probabilidades de um determinado pixel ser um pixel
27
de pele,
´
e necess
´
ario estabelecer outras regras de decis
˜
ao.
No presente cap
´
ıtulo ser
˜
ao discutidas as metodologias implementadas para a segmentac¸
˜
ao
de pixels de pele e os resultados atingidos. Na sec¸
˜
ao 3.1 s
˜
ao mostrados os espac¸os de cor
utilizados ao decorrer do estudo. Os modelos matem
´
aticos para a cor de pele est
˜
ao detalhados
na sec¸
˜
ao 3.2, enquanto na sec¸
˜
ao 3.3 s
˜
ao mostrados alguns classificadores baseados nos modelos
de cor de pele. Por fim, resultados e discuss
˜
oes s
˜
ao mostrados nas sec¸
˜
oes 3.4 e 3.5.
3.1 ESPAC¸ OS DE COR
A maioria dos m
´
etodos de segmentac¸
˜
ao de pele, e por consequ
ˆ
encia os de detecc¸
˜
ao de
conte
´
udo ofensivo, trabalham sobre um espac¸o de cor espec
´
ıfico. Espac¸os de cor s
˜
ao formas
de se representar caracter
´
ısticas f
´
ısicas da luz. A luz refletida em objetos atinge as c
´
elulas que
comp
˜
oem a retina do ser humano, onde se encontram, dentre outras, dois tipos de c
´
elulas, os
cones e os bastonetes. Existem tr
ˆ
es tipos diferentes de cones e cada um deles responde ao
est
´
ımulo de uma determinada faixa de comprimento de onda da luz incidente. A composic¸
˜
ao
do est
´
ımulo desses tr
ˆ
es tipos de cores propicia a vis
˜
ao em cores (PALMER, 1999).
C
ˆ
ameras digitais utilizam um princ
´
ıpio parecido com o da retina para a aquisic¸
˜
ao e codifica-
c¸
˜
ao das propriedades da luz em arquivos de imagem. Existem duas das propriedades da luz que
interessam na presente pesquisa: lumin
ˆ
ancia e cromin
ˆ
ancia. A primeira, lumin
ˆ
ancia,
´
e o n
´
umero
de f
´
otons incidentes no sensor da c
ˆ
amera, ou seja, a energia da fonte de luz. A cromin
ˆ
ancia
´
e
composic¸
˜
ao espectral das ondas luminosas, ou seja, os comprimentos de onda que formam a
luz (ST
¨
ORRING, 2004).
As imagens utilizadas s
˜
ao digitais, logo, quantizadas e amostradas em espac¸os discretos
(pixels). Tal quantizac¸
˜
ao, aliada aos avanc¸os da computac¸
˜
ao gr
´
afica, compress
˜
ao de dados,
transmiss
˜
ao de sinal de v
´
ıdeo, fez surgir in
´
umeras formas de representar as propriedades da
cor, formas essas chamadas de espac¸os de cor (POYNTON, 1995), cada qual com certas pro-
priedades e peculiaridades. Dentre todos os espac¸os utilizados na literatura para a segmentac¸
˜
ao
de pele foram estudados seis espac¸os de cor: RGB, RG normalizado, HSI, HS, YCbCr e CbCr.
A escolha dos espac¸os de cor se deve principalmente ao fato de que os espac¸os s
˜
ao amplamente
utilizados na literatura e
´
e poss
´
ıvel trabalhar com 3 e 2 dimens
˜
oes par um mesmo espac¸o de cor.
Poucos trabalhos fogem a um dos espac¸os de cor citados e utilizam os espac¸os cieLUV, cieLAB
e YQQ.
28
3.1.1 Espac¸os de Cor Aditivos (RGB e RG normalizado)
O espac¸o de cor RGB tem como base os tr
ˆ
es tipos de foto-receptores (cones) que est
˜
ao
presentes na retina de um ser humano normal. A representac¸
˜
ao de cor desse modelo consiste
na combinac¸
˜
ao aditiva de tr
ˆ
es cores prim
´
arias: o vermelho (red-R), o verde (green-G) e o azul
(blue-B). Originalmente tal modelo foi concebido para monitores com tubo de raios cat
´
odicos,
mas ainda
´
e muito utilizado em algoritmos de processamento de imagens principalmente por
raz
˜
oes hist
´
oricas relacionadas
`
a codificac¸
˜
ao de arquivos de imagem (POYNTON, 1995).
Entretanto, a escolha do espac¸o RGB para a classificac¸
˜
ao de pixels de pele n
˜
ao parece
ser a melhor escolha, pois outros espac¸os de cor apresentam melhores valores de TPR (SHIN;
CHANG; TSAP, 2002). Esse espac¸o de cor
´
e conhecido por apresentar uma alta correlac¸
˜
ao
entre os tr
ˆ
es canais e n
˜
ao existe uma separac¸
˜
ao clara entre as informac¸
˜
oes de lumin
ˆ
ancia e
cromin
ˆ
ancia, ou seja, a lumin
ˆ
ancia encontra-se “dilu
´
ıda” entre os tr
ˆ
es canais de cor (VEZHN-
EVETS V.; SAZONOV, 2003). O modelo RGB tamb
´
em
´
e notoriamente vulner
´
avel a variac¸
˜
oes
de iluminac¸
˜
ao ambiente (KUIASKI et al., 2009; ST
¨
ORRING, 2004). Mas existem trabalhos,
como o de Albiol, Torres e Delp (2001), que mostraram resultados nos quais o espac¸o RGB
apresenta os mesmos valores de classificac¸
˜
ao de outros espac¸os de cor, como o HSI e o YCbCr.
Em uma tentativa de reduzir os efeitos da iluminac¸
˜
ao ambiente, removeu-se a informac¸
˜
ao
de lumin
ˆ
ancia (JONES; REHG, 1999). Esse experimento foi feito para todos os espac¸os de cor
contidos nesse trabalho. Particularmente para o RGB, que n
˜
ao apresenta claramente a separac¸
˜
ao
de lumin
ˆ
ancia e cromin
ˆ
ancia,
´
e feita uma transformac¸
˜
ao de espac¸o mostrada nas equac¸
˜
oes (3)
e (4) em uma tentativa de desacoplar a lumin
ˆ
ancia da cromin
ˆ
ancia (CAETANO; BARONE,
2001).
r =
R
R + G + B
, (3)
g =
G
R + G + B
, (4)
onde, R, G e B s
˜
ao os valores dos canais vermelho, verde e azul, respectivamente, e r e g s
˜
ao
valores conhecidos como R e G normalizados.
A componente azul normalizado (b) n
˜
ao precisa ser calculada, pois a informac¸
˜
ao de cor j
´
a se
encontra nas outras duas componentes r e g. Haja visto que a componente b
´
e uma combinac¸
˜
ao
linear de r e g, ou seja, r + g + b = 1.
29
3.1.2 Espac¸os de Cor Perceptuais (HSI e HS)
O espac¸o de cor HSI (Matiz - H, Saturac¸
˜
ao - S e Intensidade - I) tenta reproduzir as cores
numericamente como um ser humano o faria perceptualmente. Matiz representa a cor prim
´
aria
de um objeto (exemplo: verde, vermelho, azul, laranja), saturac¸
˜
ao representa qu
˜
ao pura
´
e a
cor (vermelho
´
e a cor pura, rosa
´
e vermelho com adic¸
˜
ao de uma certa quantidade de branco) e
intensidade representa a informac¸
˜
ao de lumin
ˆ
ancia. As componentes H e S representam juntas
a informac¸
˜
ao de cromin
ˆ
ancia. Para este estudo, como foi feito para o modelo RGB
´
e poss
´
ıvel
retirar a componente I em uma tentativa de reduzir efeitos da iluminac¸
˜
ao ambiente.
Todas as imagens utilizadas s
˜
ao codificadas em RGB e por tal motivo
´
e necess
´
ario re-
alizar a transformac¸
˜
ao para o espac¸o HSI. O transformac¸
˜
ao
´
e realizada de acordo com as
equac¸
˜
oes (5), (6) e (7).
I =
R + G + B
3
, (5)
S = 1
min(R,G,B)
I
, (6)
H = arctan
3(G B)
2R G B
, (7)
onde, R, G e B s
˜
ao os canais de cor do espac¸o RGB normalizados no intervalo [0,1], e H, S e I
s
˜
ao as componentes do espac¸o HSI respectivamente.
3.1.3 Espac¸os de Cor Ortogonais (YCbCr e CbCr)
O espac¸o de cor YCbCr
´
e largamente utilizado nos sistemas de televis
˜
ao europeus, e con-
siste em uma transformac¸
˜
ao linear do espac¸o de cor RGB (VEZHNEVETS V.; SAZONOV,
2003). Y representa luma ou lumin
ˆ
ancia, Cb representa o chroma azul e Cr o chroma ver-
melho. Por causa da descorrelac¸
˜
ao entre lumin
ˆ
ancia e cromin
ˆ
ancia, esse espac¸o de cor
´
e
chamado, tamb
´
em, de espac¸o de cor ortogonal (KAKUMANU; MAKROGIANNIS; BOUR-
BAKIS, 2007). Por tal motivo
´
e esperado que a remoc¸
˜
ao da componente de lumin
ˆ
ancia Y
resulte em bons resultados de segmentac¸
˜
ao de pixels de pele.
A transformac¸
˜
ao de RGB para YCbCr
´
e feita segundo as equac¸
˜
oes (8), (9) e (10).
30
Y = 0.299R + 0.587G + 0.114B, (8)
Cb = 0.168736R 0.331264G + 0.5B, (9)
Cr = 0.5R 0.418688G 0.081312B, (10)
onde K
´
e o valor do limiar que gera o valor de FPR desejado. onde, R, G e B s
˜
ao as componentes
do espac¸o RGB, e Y , Cb e Cr s
˜
ao as componentes do espac¸o YCbCr respectivamente.
3.2 MODELOS PROBABIL
´
ISTICOS
Modelos probabil
´
ısticos buscam, utilizando a teoria da probabilidade, quais das cores de um
espac¸o t
ˆ
em mais chance de representar um determinado objeto. Aqui, s
˜
ao apresentados m
´
etodos
probabil
´
ısticos de modelamento de cor da pele. Esses modelos podem ser param
´
etricos, os quais
apresentam func¸
˜
oes densidade de probabilidade anal
´
ıticas que usam par
ˆ
ametros (m
´
edia e desvio
padr
˜
ao, por exemplo) ou n
˜
ao-param
´
etricos, nos quais as func¸
˜
oes de probabilidade s
˜
ao con-
stru
´
ıdas por meio de in
´
umeras observac¸
˜
oes de pixels contendo cor de pele. Os m
´
etodos utiliza-
dos neste trabalho apenas considerada a informac¸
˜
ao da cor de um pixel sem utilizar informac¸
˜
oes
de pixels vizinhos.
Foram implementados quatro diferentes modelos probabil
´
ısticos: Simples Gaussiana,
Mixture of Gaussians - Mistura de Gaussianas (MoG), Histogramas de Cor e Histogramas
na
¨
ıve Bayes. Destes, os dois primeiros s
˜
ao m
´
etodos param
´
etricos e os outros dois s
˜
ao n
˜
ao-
param
´
etricos. A informac¸
˜
ao existente nos modelos
´
e a func¸
˜
ao densidade de probabilidade de
um pixel de cor c dado que este pertence
`
a classe pele ou
`
a classe n
˜
ao-pele, ou seja, p(c|pele) e
p(c|n
˜
ao-pele), respectivamente.
Modelos n
˜
ao-param
´
etricos parecem representar melhor a cor de pele. Entretanto tais m
´
eto-
dos dependem muito do banco de dados que gerou a func¸
˜
ao densidade de probabilidade. Uma
sa
´
ıda para generalizar a func¸
˜
ao densidade de probabilidade
´
e a utilizac¸
˜
ao de modelos param
´
etri-
cos conhecidos. Quer para o presente trabalho, quer para os de Caetano e Barone (2001) o
modelo param
´
etrico considerado
´
e uma distribuic¸
˜
ao Gaussiana multidimensional. Outro mod-
elo param
´
etrico mais robusto que busca uma distribuic¸
˜
ao gen
´
erica desconhecida
´
e o m
´
etodo da
Mistura de Gaussianas, que tem sido bem aceito na literatura (CAETANO; BARONE, 2001;
TERRILLON et al., 2000; JONES; REHG, 1999).
31
3.2.1 Gaussianas
A func¸
˜
ao densidade de probabilidade da cor de pele pode ser modelada como sendo uma
Gaussiana multidimensional, a qual segue a equac¸
˜
ao (11).
p(c|pele) =
1
2π
d/2
.|Σ|
1/2
e
1
2
(cµ)
T
Σ
1
(cµ)
(11)
onde d
´
e o n
´
umero de dimens
˜
oes do vetor c e os par
ˆ
ametros µ e Σ representam a m
´
edia e matriz
de covari
ˆ
ancia, respectivamente. Para estim
´
a-los foram utilizados todos os pixels de pele da
selec¸
˜
ao CompaqDBeasy500, aplicando as equac¸
˜
oes (12) e (13).
µ =
1
N
.
N
x=1
c
x
(12)
Σ =
1
N
.
N
x=1
(c
x
µ).(c
x
µ)
t
(13)
onde N
´
e o n
´
umero de pixels de pele do banco e c
x
´
e o x-
´
esimo pixel do banco.
3.2.2 Mistura de Gaussianas
Uma forma mais sofisticada de se modelar cor de pele
´
e a utilizac¸
˜
ao da soma ponderada de
distribuic¸
˜
oes Gaussianas. O modelo conhecido como mistura de Gaussianas, ou MoG (Mixture
of Gaussians) tem como objetivo compor a func¸
˜
ao densidade de probabilidade de pele atrav
´
es
dessa soma ponderada. A equac¸
˜
ao (14) mostra a soma ponderada por pesos ω
i
de k densidades
de probabilidades que foram geradas pelas Gaussianas representadas na equac¸
˜
ao (15).
p(c|pele) =
k
i=1
ω
i
.p
i
(c|pele) (14)
p
i
(c|pele) =
1
2π
d/2
.|Σ
i
|
1/2
e
1
2
(cµ
i
)
T
Σ
1
i
(cµ
i
)
(15)
onde ω
i
, µ
i
e Σ
i
s
˜
ao, respectivamente, o peso, a m
´
edia e a matriz de covari
ˆ
ancia para cada
Gaussiana i de um total de k que comp
˜
oem a func¸
˜
ao densidade de probabilidade total.
Supondo que os dados das observac¸
˜
oes s
˜
ao dados incompletos de probabilidade,
´
e necess
´
ario
estimar os valores de ω
i
, µ
i
e Σ
i
. Isso
´
e feito atrav
´
es do algoritmo iterativo de Expectation Maxi-
mization - Maximizac¸
˜
ao do valor esperado (EM) (THEODORIDIS; KOUTROUMBAS, 2006).
32
3.2.3 Algoritmo EM
O algoritmo EM
´
e um m
´
etodo que aproxima uma distribuic¸
˜
ao qualquer a outra param
´
etrica
atrav
´
es de sucessivas iterac¸
˜
oes. Seja uma vari
´
avel y Y onde Y
´
e um subconjunto multi-
dimensional dos n
´
umeros reais. Essa vari
´
avel representa um conjunto de dados com todas
as observac¸
˜
oes e uma func¸
˜
ao densidade de probabilidade p
y
(y;θ), onde θ
´
e um vetor de
par
ˆ
ametros desconhecidos. Entretanto, quando y n
˜
ao pode ser observado completamente, dev-
ido a necessidade de infinitas observac¸
˜
oes necess
´
arias para determinar a distribuic¸
˜
ao,
´
e poss
´
ıvel
observar outra vari
´
avel que
´
e func¸
˜
ao de y, como por exemplo x = g(y). Pode-se ent
˜
ao aplicar o
algoritmo EM para se encontrar uma aproximac¸
˜
ao dos par
ˆ
ametros de p
y
(y;θ).
Os c
´
alculos dos par
ˆ
ametros t
ˆ
em como ponto de partida a func¸
˜
ao densidade de probabilidade
p
x
(x;θ). Sendo o conjunto Y (x) um subconjunto de Y , utiliza-se esse m
´
etodo para estimar
p
y
(y;θ ) a partir do conjunto de dados observ
´
aveis x. O algoritmo
´
e iniciado com a definic¸
˜
ao de
uma func¸
˜
ao densidade da vari
´
avel incompleta x, p
x
(x;θ ), em func¸
˜
ao da desejada y. A definic¸
˜
ao
de p
x
(x;θ )
´
e dada pela equac¸
˜
ao (16).
p
x
(x;θ ) =
Y (x)
p
y
(y;θ )dy (16)
onde θ
´
e o vetor de par
ˆ
ametros da func¸
˜
ao densidade.
Para estimar os par
ˆ
ametros θ para y utiliza-se o algoritmo de m
´
axima verossimilhanc¸a
(maximum likelihood). A equac¸
˜
ao (17) mostra que os par
ˆ
ametros θ
ML
s
˜
ao os par
ˆ
ametros θ
quando se d
´
a a resoluc¸
˜
ao da igualdade. Entretanto, quando faltam os dados y, os par
ˆ
ametros
s
˜
ao estimados a partir dos dados incompletos x utilizando o algoritmo EM. O EM maximiza
iterativamente a expectativa da func¸
˜
ao de verosimilhanc¸a logar
´
ıtmica (log-likelihood), repre-
sentada na equac¸
˜
ao (17) como sendo a somat
´
oria das derivadas parciais do logaritmo de p
y
em
relac¸
˜
ao a θ .
θ
ML
:
n
j=1
ln(p
y
(y
j
;θ ))
θ
= 0 (17)
onde θ
ML
´
e o vetor de par
ˆ
ametros de m
´
axima verossimilhanc¸a estimado.
O EM apresenta dois passos: o de estimac¸
˜
ao (passo-E); e o de maximizac¸
˜
ao (passo-M).
PASSO-E: Para o c
´
alculo da (t + 1)-
´
esima iterac¸
˜
ao, dado que θ (t)
´
e conhecido,
´
e primeira-
mente calculado o valor esperado da func¸
˜
ao de verosimilhanc¸a logar
´
ıtmica, como mostra a
equac¸
˜
ao (18).
33
Q(θ; θ(t)) E
n
j=1
ln(p
y
(y
j
;θ |X; θ(t)))
(18)
onde Q(θ; θ(t))
´
e o valor esperado da func¸
˜
ao de m
´
axima verossimilhanc¸a para a iterac¸
˜
ao (t).
PASSO-M: Maximiza-se o valor esperado de Q(θ; θ(t)). Os valores m
´
aximos ser
˜
ao os
pr
´
oximos par
ˆ
ametros, θ(t + 1). A equac¸
˜
ao (19) mostra que a derivada parcial da func¸
˜
ao de
m
´
axima verossimilhanc¸a deve ser zero, denotando o valor de m
´
aximo da func¸
˜
ao.
θ(t + 1) :
Q(θ; θ (t))
θ
= 0 (19)
A aplicac¸
˜
ao do algoritmo necessita um estado inicial para os par
ˆ
ametros θ, θ(0), e uma
condic¸
˜
ao de converg
ˆ
encia, ||θ (t + 1) θ (t)|| < ε. No caso em estudo, o vetor θ
´
e composto
pelos valores de ω, µ e Σ. Especificou-se como valor de converg
ˆ
encia ε = 10
4
e para os
valores iniciais de ω, µ e Σ, dividiu-se o banco de imagens igualmente em k conjuntos e foram
calculados os par
ˆ
ametros segundo as equac¸
˜
oes (20), (21) e (22).
ω
0
i
=
1
k
(20)
µ
0
i
=
1
n
ab
b
a
c (21)
Σ
0
i
=
1
n
ab
b
a
(c µ
0
i
).(c µ
0
i
)
T
(22)
onde o intervalo [a,b], dependente de i, representa o k-
´
esimo conjunto de imagens dentro do
total de imagens do banco. E n
ab
´
e o n
´
umero pixels nas imagens entre a e b.
A resoluc¸
˜
ao alg
´
ebrica do algoritmo EM aplicado para o caso de mistura de distribuic¸
˜
oes
Gaussianas resulta nas equac¸
˜
oes (23), (24), (25) e (26) (THEODORIDIS; KOUTROUMBAS,
2006).
ω
t+1
i
=
1
n
n
j=1
P
t
(i|x
j
) (23)
µ
t+1
i
=
n
j=1
P
t
(i|x
j
).x
j
n
j=1
P
t
(i|x
j
)
(24)
34
Σ
t+1
i
=
n
j=1
P
t
(i|x
j
).||x
j
µ
t+1
||
2
n
j=1
P
t
(i|x
j
)
(25)
P
t
(i|x
j
) =
p
t
(x
j
|i).ω
t
i
p
t
(x
j
)
(26)
onde p
t
(x
j
|i) e p
t
(x
j
) s
˜
ao os resultados das equac¸
˜
oes (14) e (15), respectivamente, n
´
e o n
´
umero
total de pixels de pele, t
´
e a iterac¸
˜
ao atual e t + 1 a pr
´
oxima iterac¸
˜
ao.
3.2.4 Histogramas de Cor
O modelo histograma de cor tenta fazer uma aproximac¸
˜
ao da func¸
˜
ao densidade de proba-
bilidade p(c|pele). Como se desconhece a func¸
˜
ao densidade de probabilidade da cor de pele
humana, s
˜
ao feitas in
´
umeras observac¸
˜
oes para cada poss
´
ıvel valor de cor de pele. Esse processo
´
e feito para cada pixel de pele do banco CompaqDB e dividindo-se o resultado pelo n
´
umero
total de pixels, como mostra a equac¸
˜
ao (27),
´
e obtida uma aproximac¸
˜
ao da func¸
˜
ao densidade de
probabilidade p(c|pele).
p(c|pele) =
1
N
pele
.
N
j=1
c
pele
(27)
onde c
pele
´
e um pixel de cor de pele e N
pele
´
e o n
´
umero de pixels de pele do banco utilizado
para construir o modelo.
As vantagens do modelo histograma de cor est
˜
ao na facilidade de implementac¸
˜
ao e em con-
seguir representar melhor a distribuic¸
˜
ao densidade de probabilidades que os modelos param
´
etricos
estudados. Entretanto, desvantagens incluem a depend
ˆ
encia do banco de imagens utilizado
(falta de um modelo gen
´
erico) e a quantidade de mem
´
oria utilizada para o armazenamento de
dados de probabilidade esparsos.
Para os estudos realizados, foram constru
´
ıdos histogramas de cor quantizado em 256 posi-
c¸
˜
oes para todos os espac¸os de cor citados acima. Uma pr
´
atica encontrada na literatura para aux-
iliar na quantidade de mem
´
oria utilizada
´
e quantizar a as componentes de cor e criar histogra-
mas de 128, 64, ou 32 posic¸
˜
oes sem alterar as taxas de acerto ou erro. Uma comparac¸
˜
ao entre a
quantizac¸
˜
ao e espac¸os de cor foi feita por Shin, Chang e Tsap (2002), cujos estudos mostraram
que as taxas TPR e FPR variam para cada espac¸o de cor e para cada valor de quantizac¸
˜
ao, de
forma que nesta pesquisa utilizou-se somente histogramas de 256 posic¸
˜
oes.
Uma outra abordagem feita em histogramas de cor
´
e supor que a func¸
˜
ao densidade de
35
probabilidade p(c|pele) depende somente das componentes de cor c
i
e n
˜
ao de cada poss
´
ıvel
valor de c. Tal suposic¸
˜
ao foi testada para auxiliar no armazenamento dos dados esparsos e
verificar a independencia entre as componentes de cor. O modelos gerado por essa suposic¸
˜
ao
´
e
chamado no presente trabalho de Histograma de cor na
¨
ıve Bayes.
3.2.5 Histograma de Cor na
¨
ıve Bayes
O m
´
etodo consiste em tratar cada dimens
˜
ao do vetor de caracter
´
ısticas c como sendo uma
vari
´
avel independente, o que possibilita calcular histogramas separados para cada componente
de cor c
i
. Os histogramas obtidos separadamente representam a func¸
˜
ao densidade de proba-
bilidade de cada componente de cor dado que aquela componente
´
e uma componente de pele,
p(c
i
|pele). Para calcular a probabilidade de pele p(c|pele)
´
e utilizada a equac¸
˜
ao (28).
p(c|pele) =
d
i=1
p(c
i
|pele), (28)
onde i
´
e a componente de cor do vetor c e d
´
e o n
´
umero de dimens
˜
oes de c.
A utilizac¸
˜
ao do modelo histograma de cor na
¨
ıve Bayes implica uma reduc¸
˜
ao dr
´
astica de
utilizac¸
˜
ao de mem
´
oria. Ao inv
´
es de utilizar histogramas com 256
3
ou 256
2
posic¸
˜
oes s
˜
ao utiliza-
dos histogramas de 3 ×256 ou 2 ×256.
3.3 CLASSIFICADORES DE PIXELS DE PELE
Associando a um modelo de cor de pele uma regra de classificac¸
˜
ao obt
´
em-se um classifi-
cador de pixels de pele. Durante o presente trabalho foram implementados cinco classificadores
que atuam pixel-a-pixel. Cada pixel
´
e classificado em uma de duas categorias: pele ou n
˜
ao-pele.
A decis
˜
ao
´
e feita atrav
´
es de uma regra como exemplifica a equac¸
˜
ao (29).
classe(c) =
pele, se satisfaz a regra de decis
˜
ao
n
˜
ao-pele, caso contr
´
ario
(29)
onde c
´
e a cor de um pixel de entrada.
As subsec¸
˜
oes 3.3.1, 3.3.2 e 3.3.3 mostram as regras de decis
˜
ao aplicadas no presente tra-
balho. No total, unindo os modelos matem
´
aticos e regras de decis
˜
ao, foram implementados
cinco classificadores de pixels de pele. Os classificadores gerados foram: o classificador Jones
& Rehg (Histograma de cor / regra de Jones & Rehg), o classificador na
¨
ıve Bayes (Histograma
de cor na
¨
ıve Bayes / regra de Jones & Rehg), o classificador por mistura de Gaussianas (Mis-
36
tura de Gaussianas / comparac¸
˜
ao direta), o classificador por simples Gaussiana (Gaussiana /
comparac¸
˜
ao direta) e o classificador Explicity Defined Skin Regions - Regi
˜
oes de pele explici-
tamente definidas (EDSR).
3.3.1 Regra de Regi
˜
oes
Esse m
´
etodo consiste em fixar uma regi
˜
ao dentro de um espac¸o de cor. Isso normalmente
´
e feito atrav
´
es de regras l
´
ogicas comparando os valores do pixel estudado com valores pr
´
e-
definidos. Utilizou-se duas metodologias utilizando essa regra de decis
˜
ao para os espac¸os de
cor RGB e YCbCr, propostas por Kovac, Peer e Solina (2003) e Garcia e Tziritas (1999), re-
spectivamente. Para o classificador de Kovac, o qual utiliza o espac¸o de cor RGB, as regras que
definem se um pixel
´
e de pele s
˜
ao mostradas na equac¸
˜
ao (30).
classe(c) =
pele, caso
R > 95 and G > 40 and B > 20 and
max(R,G,B) min(R,G,B) > 15 and
| R G |> 15 and R > G and R > B
n
˜
ao-pele, caso contr
´
ario
(30)
onde R, G e B s
˜
ao os valores das componentes de cor do espac¸o RGB e and
´
e o operador l
´
ogico
“e”.
Para o classificador de Garcia, o qual utiliza o espac¸o YCbCr, as regras podem ser vistas na
equac¸
˜
ao (31).
classe(c) =
pele, caso
Cr max
2(Cb + 24);
(Cb + 17);
4(Cb + 32);
2,5(Cb + θ
1
);
θ
3
;
0,5(θ
4
Cb)
and
Cr min
(220 Cb)/6;
4(θ
2
Cb)/3
n
˜
ao-pele, caso contr
´
ario
(31)
onde θ
1
, θ
2
, θ
3
e θ
4
est
˜
ao representados na equac¸
˜
ao (32).
37
θ
1
=
2 + (256 Y )/16 , se Y > 128
6 , caso contr
´
ario
θ
2
=
20 (256 Y )/16 , se Y > 128
12 , caso contr
´
ario
θ
3
=
6 , se Y > 128
2 +Y /32 , caso contr
´
ario
e
θ
4
=
8 , se Y > 128
16 +Y /16 , caso contr
´
ario
(32)
As vantagens desse m
´
etodo s
˜
ao n
˜
ao demandar tempo para a criac¸
˜
ao do modelo e reduc¸
˜
ao
de recursos computacionais. Entretanto, as regras n
˜
ao s
˜
ao flex
´
ıveis, ou seja, n
˜
ao apresentam
par
ˆ
ametros que possam ser alterados. Essa aus
ˆ
encia de par
ˆ
ametros faz com que os classifi-
cadores gerem somente um ponto na an
´
alise ROC, de maneira que a comparac¸
˜
ao com os outros
m
´
etodos
´
e feita atrav
´
es desse
´
unico ponto com o melhor resultado dos outros m
´
etodos citados a
seguir.
3.3.2 Regra de Jones & Rehg
Essa regra de decis
˜
ao foi proposta por Jones e Rehg (1999) e
´
e feita aplicando-se um valor
de limiar sobre p(pele|c), como mostra a equac¸
˜
ao (33). A transformac¸
˜
ao do valor presente no
modelo p(c|pele) para o requerido pela regra de decis
˜
ao
´
e feita pela equac¸
˜
ao (34).
classe(c) =
pele, se p(pele|c) > Θ
n
˜
ao-pele, caso contr
´
ario
(33)
p(pele|c) =
p(c|pele)p(pele)
p(c)
(34)
A regra de decis
˜
ao aplicada sobre p(pele|c)
´
e invariante
`
as probabilidades a priori p(pele) e
p(n
˜
ao-pele), as quais afetam somente a escolha do valor de limiar Θ. Ent
˜
ao, a equac¸
˜
ao (34) pode
ser reescrita como uma relac¸
˜
ao entre p(c|pele) e p(c|n
˜
ao-pele) como mostra a equac¸
˜
ao (35). A
transformac¸
˜
ao para converter o valor de Θ utiliza a equac¸
˜
ao (36).
p(c|pele)
p(c|n
˜
ao-pele)
< Θ (35)
38
Θ = K
1 p(pele)
p(pele)
, (36)
onde K
´
e um par
ˆ
ametro no intervalo [0,1] que
´
e utilizado para normalizar Θ.
Aplicando-se a regra para cada um dos modelos probabil
´
ısticos descritos na sec¸
˜
ao 3.2, tem-
se dois classificadores: classificador Jones & Rehg (histograma completo n-dimensional) e o
classificador na
¨
ıve Bayes (n histogramas parciais unidimensionais).
3.3.3 Comparac¸
˜
ao Direta
Como fora feita a aproximac¸
˜
ao das distribuic¸
˜
oes de pele para Gaussianas tentando gener-
alizar a distribuic¸
˜
ao de cor de pixels de pele, para aplicar a regra de decis
˜
ao Jones & Rehg
necessita-se de uma generalizac¸
˜
ao das cores de n
˜
ao-pele. Uma generalizac¸
˜
ao plaus
´
ıvel para a
distribuic¸
˜
ao de todas as cores que n
˜
ao fossem pele seria uma distribuic¸
˜
ao uniforme.
Uma distribuic¸
˜
ao uniforme apresenta a mesma probabilidade para cada valor poss
´
ıvel do
conjunto. Logo, o valor da distribuic¸
˜
ao de pixels de pele
´
e a m
´
axima probabilidade 1 sobre o
n
´
umero total de poss
´
ıveis valores de cor, como para o presente trabalho as cores foram quanti-
zadas em 256 valores, a probabilidade de cada cor
´
e de 1/256
d
, onde d
´
e o n
´
umero de dimens
˜
oes
do espac¸o de cor.
Da mesma forma que para p(pele|c) o valor de p(c|n
˜
ao-pele) s
´
o afeta a escolha do valor
de limiar. Logo, foram reescritas as equac¸
˜
oes da regra Jones & Rehg utilizando como valor de
probabilidade p(c|n
˜
ao-pele) e p(n
˜
ao-pele) como sendo 1. Isso, gera uma comparac¸
˜
ao direta
entre os valores de p(c|pele) com valores de limiar variando de 0 a p(pele).
3.4 RESULTADOS
Os resultados prim
´
arios est
˜
ao na forma de mapas de pele, como j
´
a visto na figura 2 do
cap
´
ıtulo 2, onde s
˜
ao apresentadas algumas imagens do banco CompaqDB com os devidos
padr
˜
oes-ouro e alguns mapas de pele gerados por dois classificadores e dois espac¸os de cor.
Entretanto, os resultados mais significativos s
˜
ao mostrados na forma de curvas ROC.
Na an
´
alise dos dados do presente trabalho as curvas ROC s
˜
ao de grande valia, pois mostram
em valores num
´
ericos a efici
ˆ
encia do classificador para diversos valores de limiar. Al
´
em de
mostrar valores de desempenho, as curvas s
˜
ao utilizadas para selecionar o valor o limiar que
mais se ajusta
`
a aplicac¸
˜
ao utilizada. Por exemplo, caso a percentagem de erro seja um fator
cr
´
ıtico utiliza-se o menor valor de FPR mesmo que prejudicando o valor de TPR.
39
Para avaliar cada classificador foram geradas curvas ROC utilizando todas as imagens do
banco CompaqDB. Com uma grande quantidade de imagens de diversas fontes
´
e poss
´
ıvel anal-
isar o real comportamento do classificador, pois efeitos do acaso s
˜
ao minimizados, ou seja, isso
evita que a an
´
alise por curvas ROC seja tendenciosa e que imagens coletadas para a an
´
alise
acidentalmente apresentem resultados muito bons ou muito ruins.
As curvas ROC foram montadas utilizando 100 valores para cada um dos classificadores
utilizados. Cada ponto na curva representa um valor de limiar, Θ ou K. Os 100 valores de
limiar foram igualmente espac¸ados no intervalo [0,MAX LIMIAR], onde MAX LIMIAR
´
e o
maior valor de limiar aceito pelo classificador. Somente para os classificadores EDSR n
˜
ao foi
seguido tal procedimento. Isso pois, n
˜
ao existem par
ˆ
ametros que possam variar para o referido
m
´
etodo, haja visto, que existe somente uma regra fixa. Os valores desses classificadores s
˜
ao
apresentados na forma de tabela com um
´
unico valor de TPR e FPR.
Para se efetuar uma comparac¸
˜
ao entre os m
´
etodos, como feito nos trabalhos de Phung,
Chai e Bouzerdoum (2001), estabeleceu-se um valor de FPR e averiguou-se o valor de TPR
correspondente. Esse
´
e um valor emp
´
ırico de 15% ±0,2%. As sec¸
˜
oes a seguir apresentam os
resultados espec
´
ıficos de cada espac¸o de cor para cada classificador.
3.4.1 Classificador Jones & Rehg
Para o classificador Jones & Rehg as taxas de acerto s
˜
ao muito parecidas para todos os
espac¸os de cor utilizados no presente trabalho. Espac¸os de cor 2D obtiveram resultados piores
do que espac¸os 3D, com a excec¸
˜
ao do espac¸o CbCr, o qual em alguns pontos da curva apre-
sentou os melhores resultados. Para melhor visualizac¸
˜
ao foi feita a comparac¸
˜
ao entre as curvas
representadas na figura 4.
Comparando os espac¸os de cor com taxa FPR pr
´
oximas a 15% os espac¸os de cor CbCr e
HSI superam os demais. Os resultados utilizando a taxa FPR fixa s
˜
ao mostrados na tabela 1,
onde K
´
e o valor do limiar que gera o valor de FPR desejado.
Tabela 1: Valores de TPR e FPR para o classificador Jones & Rehg para os espac¸os de cor analisa-
dos.
Espac¸o de cor TPR FPR K
RG normalizado 0,686 0,149 0,29
HS 0,686 0,152 0,29
CbCr 0,801 0,149 0,23
RGB 0,786 0,149 0,15
HSI 0,801 0,152 0,15
YCbCr 0,799 0,150 0,16
40
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
FPR
TPR
cbcr
hs
hsi
rg
rgb
ycbcr
Figura 4: Curvas ROC para o classificador Jones & Rehg.
Dentre os espac¸os de cor utilizados o que obteve melhor resultado
´
e o CbCr, pois at
´
e mesmo
o espac¸o de cor HSI que apresenta o mesmo valor para TPR, apresenta um valor levemente mais
baixo de FPR (0,03%). Ainda, sem a componente de lumin
ˆ
ancia o CbCr obteve resultados
pr
´
oximos e at
´
e melhores a todos os espac¸os 3D, o que leva a dizer que o CbCr teve os melhores
resultados para o classificador Jones & Rehg.
Os valores conseguidos de taxa de acerto parecem baixos a uma primeira vista, quando
comparados fixando-se FPR em 15%. Apesar de se conseguir valores mais altos de TPR acei-
tando valores tamb
´
em maiores de FPR, a segmentac¸
˜
ao de pele deve ser conduzida de forma
conservadora, ou seja, prezando pelo acerto e n
˜
ao pelo erro, haja vista que como o objetivo
´
e reconhecer pessoas, n
˜
ao
´
e interessante deixar margem para outros objetos al
´
em de pessoas
aparecerem nas predic¸
˜
oes do classificador.
3.4.2 Classificador na
¨
ıve Bayes
Os espac¸os YCbCr e CbCr s
˜
ao os que apresentaram o melhor desempenho para o classi-
ficador na
¨
ıve Bayes. Quando comparado com o classificador Jones & Rehg, as curvas para
os espac¸os de cor YCbCr e CbCr permanecem, com um ligeiro incremento, praticamente as
mesmas, enquanto para os outros espac¸os a taxas de acerto caem. Isso
´
e devido
`
a suposic¸
˜
ao de
que as componentes de cor s
˜
ao independentes. Para os espac¸os de cor ortogonais isso
´
e v
´
alido,
41
mas para os outros espac¸os o mesmo n
˜
ao ocorre. Para melhor visualizar os resultados foram
trac¸adas as curvas contidas na figura 5, sobre as quais efetuou-se a comparac¸
˜
ao entre os espac¸os
de cor.
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7
0
0.2
0.4
0.6
0.8
1
FPR
TPR
cbcr
hs
hsi
rg
rgb
ycbcr
Figura 5: Curvas ROC para o classificador na
¨
ıve Bayes.
Comparando os espac¸os de cor com taxa FPR pr
´
oximas a 15% o espac¸o de cor YCbCr
supera os demais. Tais resultados s
˜
ao mostrados na tabela 2.
Tabela 2: Valores de TPR e FPR para o classificador na
¨
ıve Bayes para os espac¸os de cor analisados.
Espac¸o de cor TPR FPR K
RG normalizado 0,595 0,151 0,46
HS 0,630 0,150 0,36
CbCr 0,815 0,149 0,36
RGB 0,601 0,151 0,37
HSI 0,749 0,152 0,37
YCbCr 0,816 0,150 0,47
Como pode-se notar na tabela 2 e na figura 5, a remoc¸
˜
ao da componente Y n
˜
ao prejudica em
quase nada a classificac¸
˜
ao, indicando que as componentes de cromin
ˆ
ancia s
˜
ao as mais relevantes
para o processo.
42
3.4.3 Classificador por Simples Gaussiana
Na figura 6
´
e poss
´
ıvel ver que
`
a medida que se altera o valor de limiar, as curvas ROC n
˜
ao
apresentam a configurac¸
˜
ao esperada, ou seja, sem um crescimento constante das vari
´
aveis de
TPR e FPR para o aumento do valor de limiar. A falta de um crescimento constante nos valores
de TPR e FPR pode mostrar que talvez a distribuic¸
˜
ao de pixels de pele para os espac¸os HS e
HSI n
˜
ao se assemelha a uma distribuic¸
˜
ao Gaussiana. Entretanto, dependendo do valor de limiar
que
´
e utilizado, a aproximac¸
˜
ao
`
a distribuic¸
˜
ao Gaussiana
´
e v
´
alida.
0 0.05 0.1 0.15 0.2 0.25 0.3
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
FPR
TPR
cbcr
hs
hsi
rg
rgb
ycbcr
Figura 6: Curvas ROC para o classificador por simples Gaussiana.
Comparando os espac¸os de cor com taxa de FPR pr
´
oximas a 15% o espac¸o de cor CbCr
supera os demais. Tais resultados s
˜
ao mostrados na tabela 3.
Tabela 3: Valores de TPR e FPR para o classificador por simples Gaussiana para os espac¸os de cor
analisados.
Espac¸o de cor TPR FPR K
RG normalizado 0,612 0,149 0,95
HS 0,335 0,152 0,95
CbCr 0,664 0,150 0,94
RGB 0,710 0,150 0,82
HSI 0,545 0,149 0,87
YCbCr 0,722 0,151 0,83
43
3.4.4 Classifcador MoG
A figura 7 mostra os resultados encontrados para aplicac¸
˜
ao de um valor de limiar sobre a
aproximac¸
˜
ao de p(c|skin). O espac¸o de cor HSI obteve os melhores resultados que os outros
espac¸os de cor para todos os valores de limiar. Diferentemente do classificador por simples
Gaussiana, o classificador MoG sup
˜
oe que a func¸
˜
ao distribuic¸
˜
ao de probabilidade
´
e composta
pela soma de 7 Gaussianas ponderadas. O n
´
umero de Gaussianas foi arbitrado e utilizado para
todos os espac¸os de cor, provando-se satisfat
´
orio para o espac¸o HSI, enquanto para ou outros
espac¸os a representac¸
˜
ao por simples Gaussiana conseguiu melhores resultados.
0 0.05 0.1 0.15 0.2 0.25 0.3
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
FPR
TPR
cbcr
hs
hsi
rg
rgb
ycbcr
Figura 7: Curvas ROC para o classificador MoG.
Os valores de TPR para uma taxa de FPR pr
´
oxima de 15% est
˜
ao mostrados na tabela 4.
Entre os valores encontrados, o melhor foi obtido para o espac¸o de cor HSI, com 77% de taxa
acerto.
Tabela 4: Valores de TPR e FPR para o classificador MoG para os espac¸os de cor analisados.
Espac¸o de cor TPR FPR K
RG normalizado 0,589 0,150 0,91
HS 0,606 0,150 0,88
CbCr 0,596 0,151 0,92
RGB 0,627 0,150 0,67
HSI 0,769 0,151 0,77
YCbCr 0,653 0,150 0,70
44
Quando comparados os resultados encontrados para o classificador por Simples Gaussiana
com os encontrados pelo MoG,
´
e poss
´
ıvel notar que para os espac¸os HSI e HS s
˜
ao melhor rep-
resentado pelo MoG. A distribuic¸
˜
ao do HSI e do HS, mesmo n
˜
ao sendo uma
´
unica Gaussiana,
pode ser representada pela soma ponderada de Gaussianas. Apesar do n
´
umero suficiente de
gaussianas para modelar a distribuic¸
˜
ao de cor para cada espac¸o de cor n
˜
ao ser bem definido, s
˜
ao
necess
´
arias mais pesquisas sobre esse m
´
etodo para definir um n
´
umero que melhor se adapte a
distribuic¸
˜
ao dos espac¸os de cor.
3.4.5 Classificadores EDSR
Os classificadores EDSR, apesar de n
˜
ao apresentarem a melhor classificac¸
˜
ao, t
ˆ
em um de-
sempenho satisfat
´
orio e apresentam um uso muito reduzido de recursos de m
´
aquina. O classi-
ficador EDSR Kovac apresenta uma taxa de acerto baixa, mas
´
e similar as taxas dos classifi-
cadores probabil
´
ısticos para a mesma taxa de erro. Esse dado pode ser observado nas curvas
ROC. Classificadores EDSR prezam pela taxa de acerto, ou seja, s
˜
ao conservadores.
A tabela 5 mostra os resultados dos classificadores EDSR. O classificador proposto por Ko-
vac, Peer e Solina (2003) apresentou os melhores resultados utilizando o espac¸o RGB.
Tabela 5: Valores de TPR e FPR para os classificadores EDSR para os espac¸os de cor espec
´
ıficos.
Classificador EDSR TPR FPR
Kovac - RGB 0,465194 0,0269292
Garcia - YCbCr 0,325298 0,0727721
3.5 DISCUSS
˜
OES
A cor da pele
´
e uma caracter
´
ıstica visual muito atrativa para se trabalhar com detecc¸
˜
ao de
pele, pois a segmentac¸
˜
ao utilizando a cor tem um processamento r
´
apido e robusto.
Os classificadores que utilizam modelos de pele n
˜
ao-param
´
etricos obtiveram melhores taxas
de acerto e erro para os espac¸os de cor ortogonais (YCbCr e CbCr). Isso reforc¸a a hip
´
otese de
que eles sejam os espac¸os de cor
´
otimos para a segmentac¸
˜
ao de pele. A grande variedade de
etnias e condic¸
˜
oes de iluminac¸
˜
ao leva o compaqDB a ser um banco de dados
´
util para se tra-
balhar com a segmentac¸
˜
ao de pele, mesmo com as defici
ˆ
encias de informac¸
˜
ao sobre a condic¸
˜
ao
espec
´
ıfica de cada imagem.
A utilizac¸
˜
ao de espac¸os de cor 2D onde
´
e suprimida a componente de lumin
ˆ
ancia (direta ou
indiretamente) trouxe benef
´
ıcios no processamento e recursos de m
´
aquina. Al
´
em disso, quando
45
retirada a componente de lumin
ˆ
ancia as taxas de desempenho se mantiveram relativamente as
mesmas. Observou-se que existe certa independ
ˆ
encia entre canais de cor para espac¸os de cor
ortogonais, haja vista que quando comparados os resultados gerados pelo classificador Jones
& Rehg e na
¨
ıve Bayes, esses s
˜
ao semelhantes. Os resultados obtidos pelo classificador na
¨
ıve
Bayes mostraram que existe uma maior correlac¸
˜
ao entre as componentes de cor para os espac¸os
de cor n
˜
ao ortogonais, pois nesses casos as taxas de desempenho do classificador na
¨
ıve Baye
quando comparadas com o classificador Jones & Rehg foram mais baixas.
Os classificadores param
´
etricos obtiveram resultados que levaram a questionar a func¸
˜
ao
densidade de probabilidade da cor de pele. A partir de valores espec
´
ıficos de limiar as curvas
ROC comec¸am a n
˜
ao obedecer a tend
ˆ
encia esperada, como notado pelo comportamento irregu-
lar da curva ROC. Isso mostra que
´
areas de pele nos espac¸os de cor n
˜
ao fazem intersecc¸
˜
ao com
as supostas distribuic¸
˜
oes param
´
etricas: Gaussianas ou a mistura de 7 Gaussinas. Mais estudos
s
˜
ao necess
´
arios para averiguar se existe um n
´
umero de Gaussianas que seja
´
otimo para cada
espac¸o de cor. Ainda
´
e poss
´
ıvel tentar modelar as distribuic¸
˜
oes atrav
´
es de outras distribuic¸
˜
oes
param
´
etricas.
Apesar da cor ser considerada a melhor caracter
´
ıstica para ser utilizada para detectar pele,
somente com a informac¸
˜
ao contida na cor n
˜
ao se pode aumentar as taxas de acerto e erro, haja
vista que para o mesmo m
´
etodo probabil
´
ıstico, independente da transformac¸
˜
ao feita as taxas
variam pouco. Logo, existe a necessidade de se adicionar informac¸
˜
ao caso se queira aumentar
estas taxas. Outras sa
´
ıdas que podem ser utilizadas para a detecc¸
˜
ao de pixels de pele s
˜
ao a
informac¸
˜
ao de cor da vizinhanc¸a dos pixels, misturar informac¸
˜
oes entre espac¸os de cor, textura
de regi
˜
oes de pele e o conhecimento sobre as taxas de acerto e erro para cada um dos m
´
etodos
utilizados.
Como o objetivo maior desse trabalho
´
e detectar conte
´
udo ofensivo, a detecc¸
˜
ao de pixels de
pele n
˜
ao necessita ser a mais precisa. Entretanto, as informac¸
˜
oes que ser
˜
ao retiradas das regi
˜
oes
encontradas t
ˆ
em que apresentar informac¸
˜
oes suficientes para classificar o conte
´
udo como ofen-
sivo ou n
˜
ao.
Apesar da literatura ter apontado que a iluminac¸
˜
ao
´
e um fator de erro para os algoritmos de
classificac¸
˜
ao, n
˜
ao se pode confirmar essa afirmativa sem devidos estudos sobre a relac¸
˜
ao entre
a iluminac¸
˜
ao ambiente, espac¸os de cor e taxas de acerto e erro. A interfer
ˆ
encia da iluminac¸
˜
ao
ambiente nas taxas de classificac¸
˜
ao dos m
´
etodos utilizados na presente pesquisa s
˜
ao melhor
estudados no cap
´
ıtulo 4.
46
4 EFEITOS DA ILUMINAC¸
˜
AO AMBIENTE
A iluminac¸
˜
ao ambiente
´
e constantemente citada na literatura como sendo o maior problema
na segmentac¸
˜
ao de pixels de pele (ST
¨
ORRING, 2004). Por consequ
ˆ
encia foi proposto um
estudo relacionando a iluminac¸
˜
ao ambiente e a detecc¸
˜
ao de pixels de pele. O objetivo desse
estudo
´
e verificar se existe um espac¸o de cor que apresente melhores taxas de acerto e erro para
diferentes tipos de iluminac¸
˜
ao ambiente.
O estudo da iluminac¸
˜
ao foi realizado da seguinte forma: separac¸
˜
ao das imagens conforme
os tipos de iluminac¸
˜
ao, aplicac¸
˜
ao dos m
´
etodos e an
´
alise das taxas TPR e FPR por tipo de
iluminac¸
˜
ao. Para tal foram aplicados os m
´
etodos descritos no cap
´
ıtulo 3 aos seis espac¸os de cor
definidos e a quatro tipos de iluminac¸
˜
ao ambiente.
Devido ao fato do banco CompaqDB utilizado nas experi
ˆ
encias de segmentac¸
˜
ao de pixels de
pele n
˜
ao apresentar informac¸
˜
oes da iluminac¸
˜
ao ambiente para a realizac¸
˜
ao do estudo proposto
foi necess
´
aria a criac¸
˜
ao de um novo banco de imagens contendo as informac¸
˜
ao de iluminac¸
˜
ao
necess
´
arias a respeito de cada imagem adicionada ao banco. O banco de imagens criado foi
chamando de skinDB.
4.1 BANCO DE IMAGENS ESTRUTURADO - SKINDB
Com o intuito de se estudar melhor a segmentac¸
˜
ao de pele, foi criado um banco de dados
estruturado e contendo metadados. Chamado de skinDB, o banco de imagens gerou publicac¸
˜
oes
(KUIASKI et al., 2008, 2009) e
´
e composto atualmente por 120 imagens igualmente distribu
´
ıdas
entre quatro iluminac¸
˜
oes ambiente: sol, sombra, incandescente e fluorescente. As imagens
capturadas s
˜
ao de volunt
´
arios de diversas etnias e de partes espec
´
ıficas do corpo humano, como
de ante-brac¸os, costas e m
˜
aos. Assim como o compaqDB, o skinDB apresenta m
´
ascaras de pele
manualmente geradas para cada uma das 120 imagens do banco, formando, assim, o padr
˜
ao-
ouro de pele para o banco. Todas as imagens est
˜
ao codificadas no padr
˜
ao JPEG, fotos digitais,
e os par
ˆ
ametros das c
ˆ
ameras foram mantidos os mesmos. Exemplos de imagens do skinDB sob
diferentes iluminac¸
˜
oes podem ser vistas na figura 8.
47
(a)
(b)
(c) (d)
Figura 8: Imagens do banco skinDB: (a) Imagem na luz fluorescente ; (b) Imagem na luz incan-
descente; (c) Imagem na sombra; (d) Imagem na luz do sol.
O banco skinDB
´
e aberto e est
´
a dispon
´
ıvel juntamente com os respectivos metadados em:
http://www.labiem.cpgei.cefetpr.br/Members/diogo
Quando foi feita a proposta de disponibilizar publicamente o banco, a intenc¸
˜
ao era chamar
novos pesquisadores a utiliz
´
a-lo e atualiz
´
a-lo. Por atualizar o banco entende-se facilitar a in-
clus
˜
ao de novas imagens, deixar o banco mais estruturado e com isso incentivar as pesquisas
sobre segmentac¸
˜
ao de pixels de pele. Pensando nisso foram propostas formas de acrescen-
tar mais informac¸
˜
oes al
´
em da iluminac¸
˜
ao ambiente. At
´
e o presente momento, as informac¸
˜
oes
referem-se a dados do indiv
´
ıduo que est
´
a presente na imagem e algumas estat
´
ısticas sobre a cor
da regi
˜
ao de pele da imagem. A t
´
ecnica utilizada para armazenar informac¸
˜
oes a respeito das
imagens foi a anotac¸
˜
ao de imagens (KUIASKI et al., 2008).
4.1.1 Anotac¸
˜
ao das Imagens
Esse m
´
etodo prev
ˆ
e a adic¸
˜
ao de informac¸
˜
oes n
˜
ao pictoriais a imagens, como por exem-
plo a forma de algum objeto na imagem, o nome desse objeto, classe sem
ˆ
antica ou qualquer
informac¸
˜
ao que seja relevante ao estudo feito. A anotac¸
˜
ao de imagens pode ser tanto autom
´
atica
quanto manual. Para o skinDB, as informac¸
˜
oes foram manualmente inseridas, pois fazem parte
do padr
˜
ao-ouro.
As metainformac¸
˜
oes inseridas no skinDB foram armazenadas utilizando eXtensible Markup
Languange - Linguagem de marcac¸
˜
ao extens
´
ıvel (XML). Para facilitar a escrita e leitura das im-
48
agens do banco, desenvolveu-se um aplicativo chamado skinChooser. O aplicativo apresenta a
visualizac¸
˜
ao reduzida da imagem e uma s
´
erie de campos a serem preenchidos, os quais comt
´
em
as metainformac¸
˜
oes referentes a uma imagem.
As metainformac¸
˜
oes que s
˜
ao propostas no presente trabalho s
˜
ao listadas na figura 9, a qual
mostra que cada elemento image apresenta os atributos id, type e url, que s
˜
ao respectivamente
o n
´
umero de identificac¸
˜
ao no banco, a que classe pertence a imagem, e o Uniform resource
locator - Localizador uniforme de recursos (URL) da imagem. Dentro do elemento de imagem,
os elementos filename, dateIdCreation, width e height, n
˜
ao possuem filhos e representam, re-
spectivamente, o nome do arquivo, data de criac¸
˜
ao e dimens
˜
oes da imagem em pixels.
<filename>
<dateOfCreation>
<height>
<width>
<camera>
<environment>
<subject>
<features>
<bodyPart>
<skin>
<eyes>
<hair>
<gender>
<age>
<roi>
<MeanX0>
<StdX0>
<MeanXn>
<stdXn>
<mask>
<ambient>
<light>
<distance>
<model>
<brand>
<flash>
<image>
Root
Element
<db>
Attributes:
¨id¨, ¨type¨, ¨url¨
Attribute:
¨url¨
Attribute:
¨units¨
Figura 9: Diagrama em
´
arvore XML desenvolvido.
Fonte: (KUIASKI et al., 2008)
Outros elementos de mesmo n
´
ıvel hier
´
arquico que apresentam filhos s
˜
ao respons
´
aveis pelas
demais informac¸
˜
oes relevantes da imagem. Em camera
´
e poss
´
ıvel armazenar as informac¸
˜
oes de
dist
ˆ
ancia (distance), presenc¸a de flash (flash), modelo (model) e marca da c
ˆ
amera (brand). Den-
tro de environment
´
e onde se encontram as informac¸
˜
oes sobre a iluminac¸
˜
ao ambiente ambient
49
e light que s
˜
ao respectivamente o tipo de ambiente e a iluminac¸
˜
ao do mesmo. Para ambi-
ent sugere-se que contenham um dos seguintes valores: indoor (ambientes fechados) ou out-
door (ambientes abertos). O elemento light apresenta como valores um dos quatro tipos de
iluminac¸
˜
ao ambiente utilizados no presente estudo.
O elemento subject apresenta informac¸
˜
oes sobre o indiv
´
ıduo do qual a imagem fora cap-
turada. Dentre os campos ali presentes est
˜
ao bodyPart e skin, nos quais s
˜
ao armazenadas a parte
do corpo presente na foto e a cor de pele do indiv
´
ıduo. Neste
´
ultimo sugere-se a utilizac¸
˜
ao das
seguintes categorias: white, light brown, dark brown ou asiatic.
Por fim, no elemento feature podem ser anotadas caracter
´
ısticas de cor m
´
edia e o desvio
padr
˜
ao dos pixels de pele contidos em regi
˜
oes ora representadas por m
´
ascaras bin
´
arias ora por
uma Region of interest - Regi
˜
ao de interesse (ROI) retangular. Os elementos respons
´
aveis por
armazenar as informac¸
˜
oes de cor m
´
edia e desvio padr
˜
ao s
˜
ao respectivamente meanX e stdX,
onde X
´
e o espac¸o de cor representado. O elemento roi apresenta as coordenadas dessa regi
˜
ao
retangular, enquanto o elemento mask armazena a localizac¸
˜
ao e nome da imagem utilizada como
padr
˜
ao-ouro (GT). Ambos os elementos roi e mask n
˜
ao s
˜
ao mutuamente excludentes, entretanto
´
e altamente recomendado que pelo menos um seja completado.
4.2 ILUMINAC¸
˜
AO AMBIENTE
A escolha dos tipos de iluminac¸
˜
ao foi feita observando quais s
˜
ao os ambientes mais cor-
riqueiros que cont
´
em pessoas. A escolha das iluminac¸
˜
oes foi arbitr
´
aria e ainda est
´
a sujeita a
mudanc¸as. Entretanto, como o resultado do estudo mostra que h
´
a variac¸
˜
ao na cor de pele ocorre
para os ambientes escolhidos, estes servem bem ao prop
´
osito. A variac¸
˜
ao da cor de pele em
fotos tiradas sob as quatro condic¸
˜
oes de iluminac¸
˜
ao pode ser vista na figura 8, na qual todas as
imagens pertencem ao mesmo indiv
´
ıduo.
No presente trabalho foram utilizadas quatro formas de iluminac¸
˜
ao ambiente: sol (sun),
sombra (shadow), incandescente (incandescent) e fluorescente (fluorescent). As imagens per-
tencentes tanto sob a iluminac¸
˜
ao do sol quanto sob sombra foram retiradas em ambientes aber-
tos, ou ambientes outdoor, enquanto para as outras duas iluminac¸
˜
oes as fotos foram capturadas
em ambientes fechados, ou ambientes indoor.
A metodologia utilizada na captura das imagens realizada em ambientes abertos foi cap-
turar imagens em diversos hor
´
arios do dia sob a iluminac¸
˜
ao direta ou indireta da luz solar,
iluminac¸
˜
oes sob sol e sombra respectivamente. A captura das imagens para ambientes fechados
foi feita a partir do tipo de l
ˆ
ampada presente no ambiente, fluorescente ou incandescente.
50
4.3 M
´
ETODOS UTILIZADOS
Por quest
˜
ao de coer
ˆ
encia foram utilizados alguns dos classificadores apresentados no cap
´
ıtu-
lo 3. S
˜
ao eles o classificador na
¨
ıve Bayes, Jones & Rehg, MoG e por simples Gaussiana.
Os classificadores EDSR n
˜
ao foram utilizados no teste por n
˜
ao apresentarem flexibilidade de
variac¸
˜
ao nos par
ˆ
ametros que os comp
˜
oem, pois as comparac¸
˜
oes s
˜
ao feitas utilizando curvas
ROC e o
´
unico resultado compar
´
avel gerado pelos EDSR
´
e um
´
unico ponto no plano TPR×FPR.
A etapa de gerac¸
˜
ao dos modelos foi feita utilizando a selec¸
˜
ao CompaqDBeasy500, pois
o banco cont
´
em uma grande diversidade de imagens de diversas etnias e sob as mais diver-
sas iluminac¸
˜
oes ambiente. Manter o modelo de pele gerado pela CompaqDBeasy500, e n
˜
ao
reconstruir um novo a partir de parte do skinDB, tem como objetivo n
˜
ao utilizar um modelo
tendencioso de cor de pele.
4.4 RESULTADOS
Os resultados que s
˜
ao mostrados nesta sec¸
˜
ao s
˜
ao, exclusivamente, curvas ROC discrimi-
nadas por classificador e por iluminac¸
˜
ao. Entretanto, antes de entrar no m
´
erito da avaliac¸
˜
ao
dos efeitos da iluminac¸
˜
ao na classificac¸
˜
ao de pele,
´
e abordado o desempenho geral dos classifi-
cadores para o banco skinDB.
A avaliac¸
˜
ao foi feita utilizando todas as imagens do banco skinDB para os quatro classifi-
cadores (Jones & Rehg, na
¨
ıve Bayes, MoG e simples Gaussiana) e para todos os seis espac¸os
de cor (RGB, RG normalizado, HSI, HS, YCbCr e CbCr), apresentados anteriormente. As fig-
uras 10 e 11 mostram as curvas ROC obtidas para o classificador Jones & Rehg e as obtidas
para o classificador na
¨
ıve Bayes. As figuras 12 e 13 mostram as curvas ROC obtidas para o
classificador MoG e as obtidas para o classificador por simples Gaussiana.
As avaliac¸
˜
oes gerais dos classificadores mostradas nas figuras 10, 11, 12 e 13 indicam que,
na maioria dos casos, espac¸os de cor bidimensionais apresentam melhores resultados, ou seja,
que somente a informac¸
˜
ao de cromin
ˆ
ancia
´
e suficiente para classificar pixels de pele. Os mel-
hores resultados foram obtidos para os espac¸os de cor RG normalizado e HS para o classificador
Jones & Rehg, e HSI e HS para o na
¨
ıve Bayes. Os resultados ora apresentados quando com-
parados com os resultados obtidos por outros pesquisadores, como para Phung, Bouzerdoum e
Chai (2005) e Jones e Rehg (2002), parecem contradit
´
orios, pois para esses pesquisadores os
espac¸os de cor tridimensionais atingiram melhores resultados que os bidimensionais em todos
os pontos da curva ROC. Uma hip
´
otese para essas discrep
ˆ
ancias
´
e que o banco skinDB
´
e rel-
51
0 0.05 0.1 0.15 0.2 0.25 0.3
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
FPR
TPR
cbcr
hs
hsi
rg
rgb
ycbcr
Figura 10: Curvas ROC para o classificador Jones & Rehg para todos os espac¸os de cor citados.
0 0.05 0.1 0.15 0.2 0.25 0.3
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
FPR
TPR
cbcr
hs
hsi
rg
rgb
ycbcr
Figura 11: Curvas ROC para o classificador na
¨
ıve Bayes para todos os espac¸os de cor citados.
ativamente pequeno, especialmente feito com imagens adquiridas de forma controlada com o
prop
´
osito de estudar segmentac¸
˜
ao de pele.
Outro resultado importante, retirado a partir das curvas ROC do classificador Jones & Rehg,
52
0 0.2 0.4 0.6 0.8
0.75
0.8
0.85
0.9
0.95
1
FPR
TPR
cbcr
hs
hsi
rg
rgb
ycbcr
Figura 12: Curvas ROC para o classificador MoG para todos os espac¸os de cor citados.
0 0.2 0.4 0.6 0.8
0.55
0.6
0.65
0.7
0.75
0.8
0.85
0.9
0.95
1
FPR
TPR
cbcr
hs
hsi
rg
rgb
ycbcr
Figura 13: Curvas ROC para o classificador por simples Gaussiana para todos os espac¸os de cor
citados.
est
´
a no fato de que todos os espac¸os de cor tridimensionais obtiveram resultados similares
(figura 10). Isso indica que n
˜
ao h
´
a perda significativa de informac¸
˜
ao pela transformac¸
˜
ao do
espac¸o RGB para outro espac¸o tridimensional, como esperado.
53
Quando s
˜
ao analisadas as curvas do classificador na
¨
ıve Bayes, o
´
unico espac¸o de cor que
mantem resultados semelhantes aos encontrados para o classificador Jones & Rehg
´
e o HS
(figura 11), enquanto que para o HSI os resultados foram melhores. Tais resultados para os
espac¸os HS e HSI podem ser explicados pois esses espac¸os apresentam uma alta independ
ˆ
encia
entre as componentes de cor, ou seja, a probabilidade de um pixel corresponder
`
a classe pele
n
˜
ao depende da probabilidade total, mas somente das probabilidades independentes de cada
componente de cor. Entretanto, comparando os resultados do HS e HSI com os resultados
obtidos no cap
´
ıtulo 3, para os mesmos classificadores, pode-se afirmar que o banco skinDB
ainda n
˜
ao apresenta a mesma diversidade de cores de pele do compaqDB, haja visto que para o
compaqDB a independ
ˆ
encia entre canais n
˜
ao ocorreu para esses espac¸os de cor.
Algo semelhante ocorre com os espac¸os de cor YCbCr e CbCr. Os resultados s
˜
ao piores
do que os encontrados para o classificador Jones & Rehg, mas as curvas permanecem pr
´
oximas
uma da outra, o que nos leva a concluir que existe uma independ
ˆ
encia entre os canais do YCbCr
e que a componente Y n
˜
ao afeta significativamente o resultado. Finalmente, os resultados para
o espac¸o RGB mostram que esse apresenta uma alta correlac¸
˜
ao entre os canais de cor como
esperado dada a total dissimilaridade entre as curvas ROC, diferentemente do que foi observado
para o HSI e o YCbCr.
A avaliac¸
˜
ao dos classificadores param
´
etricos
´
e um pouco diferenciada. Sem muitas variac¸
˜
oes
entre os resultados para diferentes espac¸os de cor e para os mesmos valores de FPR tanto o clas-
sificador MoG (figura 12) como o por simples Gaussiana (figura 13) apresentam valores mais
elevados de TPR. Isto se deve muito ao banco skinDB, o qual n
˜
ao cont
´
em toda a variac¸
˜
ao de
cores de pele que est
´
a presente no banco CompaqDB. Com uma quantidade reduzida de cores
´
e poss
´
ıvel mais facilmente classific
´
a-las nos modelos mais complexos gerados pela CompaqD-
Beasy500. O classificador MoG nos espac¸o de cor HSI e HS obtiveram os piores resultados,
embora tenham obtido melhores resultados quando feita a an
´
alise de todo o banco CompaqDB.
A an
´
alise dos resultados foi dividida por classificador e por iluminac¸
˜
ao ambiente. Primeira-
mente, a influ
ˆ
encia da iluminac¸
˜
ao
´
e analisada para o classificador Jones & Rehg, cujos resulta-
dos est
˜
ao nas figuras 14 e 15. Ap
´
os,
´
e analisada a influ
ˆ
encia da iluminac¸
˜
ao para o classificador
na
¨
ıve Bayes, cujo os resultados est
˜
ao nas figuras 16 e 17. Igualmente, os resultados para o clas-
sificador MoG e por simples Gaussiana est
˜
ao nas figuras 18 e 19 e 20 e 21, respectivamente.
4.4.1 Classificador Jones & Rehg
Os resultados do classificador Jones & Rehg para diferentes iluminac¸
˜
oes evidencia que
espac¸os de cor tridimensionais atingem melhores taxas de classificac¸
˜
ao para uma faixa de val-
54
ores de FPR pr
´
oxima da origem. Para valores de FPR menores que 5% e sob as iluminac¸
˜
oes
sol e incandescente, espac¸os de cor tridimensionais apresentam melhores resultados do que
espac¸os de cor bidimensionais. Entretanto, se for admiss
´
ıvel uma FPR maior, espac¸os de cor
bidimensionais s
˜
ao uma melhor escolha. Sob a iluminac¸
˜
ao sombra o mesmo acontece, mas
para um valor menor de FPR (aproximadamente 2,5%). As curvas ROC dos espac¸os de cor
tridimensionais, independentemente da iluminac¸
˜
ao, continuam similares.
Para as imagens na luz do sol os resultados (figura 14 - esquerda) mostram que o espac¸o
de cor CbCr apresenta os melhores resultados para essa iluminac¸
˜
ao, 86% TPR para 10% FPR.
A iluminac¸
˜
ao da luz do sol apresentou os resultados mais divergentes, especialmente para o
espac¸o de cor RG normalizado e para o HS. Os resultados divergentes podem ser influ
ˆ
encia do
hor
´
ario do dia em que foram feitas as imagens, pois a composic¸
˜
ao de cores muda pelo efeito
de refrac¸
˜
ao da luz solar na atmosfera. Como por exemplo a ocorr
ˆ
encia de sombra nas imagens
devida ao
ˆ
angulo de incid
ˆ
encia da luz, o que pode ser visto na figura 8.
Os melhores resultados do trabalho foram obtidos para o classificador Jones & Rehg sob a
iluminac¸
˜
ao sombra (figura 14 - direita). Todos os espac¸os de cor utilizados atingiram valores
de TPR maiores de 95% para valores de FPR inferiores a 2,5%. Acredita-se que essas taxas
se devem
`
a pouca influ
ˆ
encia do controle de equil
´
ıbrio de branco (white balance) da c
ˆ
amera na
iluminac¸
˜
ao sombra, conservando a cor da pele.
0 0.05 0.1 0.15 0.2 0.25 0.3
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
FPR
TPR
cbcr
hs
hsi
rg
rgb
ycbcr
0 0.05 0.1 0.15 0.2 0.25 0.3
0.6
0.65
0.7
0.75
0.8
0.85
0.9
0.95
1
FPR
TPR
cbcr
hs
hsi
rg
rgb
ycbcr
Figura 14: Curvas ROC para o classificador Jones & Rehg utilizando imagens em ambientes aber-
tos: (esquerda) sol e (direita) sombra.
As imagens adquiridas na luz incandescente (figura 15 - direita) obtiveram resultados entre
os obtidos sob a sombra e os sob luz solar. A hip
´
otese de que o equil
´
ıbrio de branco autom
´
atico
da c
ˆ
amera altera significativamente as cores da imagem
´
e reforc¸ada, pois a luz incandescente
tem um espectro semelhante ao da luz solar, entretanto de menor intensidade e por esta raz
˜
ao
pode ser respons
´
avel pelas alterac¸
˜
oes nas taxas TPR e FPR.
55
Os melhores resultados de classificac¸
˜
ao, 92,5% TPR para 10% FPR, para a luz incandes-
cente foram conseguidos utilizando o espac¸o CbCr. Para o estudo da influ
ˆ
encia da iluminac¸
˜
ao
optou-se por fixar o valor de FPR em 10%, pois os resultados do skinDB s
˜
ao significativamente
melhores que os encontrados para o CompaqDB e reduzindo o valor de comparac¸
˜
ao a variac¸
˜
ao
de TPF
´
e maior.
0 0.05 0.1 0.15 0.2 0.25 0.3
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
FPR
TPR
cbcr
hs
hsi
rg
rgb
ycbcr
0 0.1 0.2 0.3 0.4 0.5
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
FPR
TPR
cbcr
hs
hsi
rg
rgb
ycbcr
Figura 15: Curvas ROC para o classificador Jones & Rehg utilizando imagens em ambientes fecha-
dos: (esquerda) fluorescente e (direita) incandescente.
A tabela 6 resume as taxas de classificac¸
˜
ao obtidas para o classificador Jones & Rehg para
todas as iluminac¸
˜
oes e espac¸os de cor. Nessa tabela foi fixado o valor de FPR em 10%.
Tabela 6: Valores de TPR em porcentagem do classificador Jones & Rehg para 10% de FPR
Sol Sombra Incandescente Fluorescente
RGB 76,3% 96,5% 86,3% 75,5%
RG 52,1% 99,6% 85,2% 92,1%
HSI 76,5% 96,5% 86,3% 75,5%
HS 54,7% 99,5% 84,7% 87,0%
YCbCr 75,5% 96,4% 85,6% 75,5%
CbCr 87,1% 99,0% 91,9% 77,3%
4.4.2 Classificador na
¨
ıve Bayes
O classificador sup
˜
oe que as componentes de cor s
˜
ao estatisticamente independentes umas
das outras. Apesar de se saber que, na maioria dos casos, a independ
ˆ
encia estat
´
ıstica n
˜
ao
se mant
´
em, o classificador foi utilizado para investigar qual espac¸o de cor apresenta uma
maior independ
ˆ
encia estat
´
ıstica entre as componentes. Isso economiza recursos computacionais
(mem
´
oria e processamento) e pode mostrar para qual espac¸o de cor pode-se retirar a compo-
nente de lumin
ˆ
ancia sem que sejam alteradas as taxas de detecc¸
˜
ao.
56
Como afirmado anteriormente, os canais do espac¸o RGB s
˜
ao os que apresentam a maior
depend
ˆ
encia entre as componentes de cor. Esse efeito pode ser visto no desempenho do classi-
ficador na
¨
ıve Bayes como mostram as figuras 16 - esquerda e 17 - esquerda, nas quais o espac¸o
de cor RGB obteve as menores taxas de acerto. Por raz
˜
oes ainda desconhecidas, sob luz fluo-
rescente o espac¸o de cor RGB apresenta resultados relativamente bons em relac¸
˜
ao aos demais
espac¸os de cor, como mostra a figura 17 - direita. Entretanto, no geral os resultados para luz
fluorescente s
˜
ao piores do que para outros tipos de iluminac¸
˜
ao.
0 0.05 0.1 0.15 0.2 0.25 0.3
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
FPR
TPR
cbcr
hs
hsi
rg
rgb
ycbcr
0 0.05 0.1 0.15 0.2 0.25 0.3
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
FPR
TPR
cbcr
hs
hsi
rg
rgb
ycbcr
Figura 16: Curvas ROC para o classificador na
¨
ıve Bayes utilizando imagens em ambientes abertos:
(esquerda) sol e (direita) sombra.
0 0.05 0.1 0.15 0.2 0.25 0.3
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
FPR
TPR
cbcr
hs
hsi
rg
rgb
ycbcr
0 0.05 0.1 0.15 0.2 0.25 0.3
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
FPR
TPR
cbcr
hs
hsi
rg
rgb
ycbcr
Figura 17: Curvas ROC para o classificador na
¨
ıve Bayes utilizando imagens em ambientes fecha-
dos: (esquerda) incandescente e (direita) fluorescente.
Para as imagens obtidas na luz solar (figura 16 - esquerda), os melhores resultados foram
atingidos pelos espac¸os de cor HSI, HS e RG normalizado, atingindo 90% TPR para 20% FPR.
Na sombra (figura 16 - direita), os resultados foram similares aos obtidos para o classifi-
cador Jones & Rehg, com a excec¸
˜
ao do espac¸o RGB., atingindo taxas de acerto maiores que
95% para taxas de erro inferiores a 5% para o classificador na
¨
ıve Bayes. Pde se dizer que
57
pelo fato do RGB apresentar resultados inferiores a todos os outros espac¸os de cor, este espac¸o
apresenta uma grande correlac¸
˜
ao estat
´
ıstica entre canais.
A tabela 7 resume os valores de TPR obtidos para FPR fixo em 10% para todos os espac¸os
de cor e condic¸
˜
oes de iluminac¸
˜
ao utilizados nesse trabalho para o classificador na
¨
ıve Bayes.
Tabela 7: Valores em porcentagem de TPR para o classificador na
¨
ıve Bayes para 10% de FPR
Sol Sombra Incandescente Fluorescente
RGB 23,3% 42,9% 45,5% 77,4%
RG 36,2% 95,2% 43,4% <20%
HSI 71,5% 99,5% 85,2% 42,9%
HS 54,5% 99,8% 74,2% 44,4%
YCbCr 42,4% 99,6% 88,9% 26,0%
CbCr 41,4% 99,5% 89,0% 75,3%
4.4.3 Classificador MoG
No caso do classificador MoG. as curvas para as iluminac¸
˜
oes sob a sombra e sob a luz
incandescente foram consistentes com os resultados encontrados para os outros classificadores
e pouca diferenc¸a foi encontrada entre os resultados para os diferentes espac¸os de cor. Os
resultados do classificador MoG para as diferentes iluminac¸
˜
oes pode ser visto nas figuras 18 e
19.
0 0.2 0.4 0.6 0.8 1
0.86
0.88
0.9
0.92
0.94
0.96
0.98
1
FPR
TPR
cbcr
hs
hsi
rg
rgb
ycbcr
0 0.1 0.2 0.3 0.4 0.5
0.4
0.5
0.6
0.7
0.8
0.9
1
FPR
TPR
cbcr
hs
hsi
rg
rgb
ycbcr
Figura 18: Curvas ROC para o classificador MoG utilizando imagens em ambientes abertos: (es-
querda) sol e (direita) sombra.
Nas curvas ROC que representam as iluminac¸
˜
oes fluorescente e sol fogem do padr
˜
ao encon-
trado para outros classificadores desse trabalho. Entretanto quando comparamos os resultados
encontrados para o skinDB com os do CompaqDB pode-se observar que a anomalia citada
no cap
´
ıtulo 3 para os espac¸os HSI e HS n
˜
ao se mant
´
em para o skinDB.
´
E poss
´
ıvel que as
58
0 0.2 0.4 0.6 0.8
0.7
0.75
0.8
0.85
0.9
0.95
1
FPR
TPR
cbcr
hs
hsi
rg
rgb
ycbcr
0 0.2 0.4 0.6 0.8 1
0.4
0.5
0.6
0.7
0.8
0.9
1
FPR
TPR
cbcr
hs
hsi
rg
rgb
ycbcr
Figura 19: Curvas ROC para o classificador MoG utilizando imagens em ambientes fechados:
(esquerda) incandescente e (direita) fluorescente.
distribuic¸
˜
oes densidade de probabilidade do skinDB sejam melhor representadas pelo modelo
criado pelo classificador MoG. Apesar as curvas irregulares, as curvas ROC para o classificador
MoG apresentam tanto taxas de acerto quanto taxas de erro muito elevadas quando compara-
das a dos classificadores Jones & Rehg, na
¨
ıve Bayes e com os pr
´
oprios classificadores quando
analisadas as imagens do banco CompaqDB.
Para as imagens adquiridas na luz solar (figura 18 - esquerda), os melhores resultados foram
atingidos pelos espac¸os de cor YCbCr, CbCr e RGB, atingindo mais de 95% TPR para 20%
FPR. Na sombra (figura 18 - direita), os resultados foram os melhores resultados de todos os
testes realizados, superando at
´
e mesmo os resultados do classificador Jones & Rehg.
A tabela 8 resume os valores de TPR (10% FPR) obtidos para todos os espac¸os de cor e
condic¸
˜
oes de iluminac¸
˜
ao utilizados nesse trabalho para o classificador MoG.
Tabela 8: Valores em porcentagem de TPR para o classificador MoG para 10% de FPR
Sol Sombra Incandescente Fluorescente
RGB 99,5% 99,5% 94,0% 97,0%
RG 88,0% 99,1% 94,0% 99,0%
HSI 92,0% 99,8% 90,0% 98,0%
HS 90,5% 99,2% 94,5% 96,0%
YCbCr 95,5% 99,4% 93,5% 95,5%
CbCr 91,0% 99,8% 93,0% 97,5%
4.4.4 Classificador por Simples Gaussiana
O classificador por simples Gaussiana n
˜
ao apresentou resultados semelhantes a nenhum dos
classificadores estudados. Apesar disso,
´
e poss
´
ıvel ver que a estranha anomalia na curva ROC
59
encontrada na an
´
alise dos resultados para todas as imagens do skinDB para esse classificador
´
e
reduzida sob a sombra (figura 20 - direita). Analisando as curvas pode-se notar que as curvas
do CbCr apresentam melhores resultados, o que leva a afirmar que a distribuic¸
˜
ao de pixels de
pele do o skinDB para o espac¸o CbCr seja a mais pr
´
oxima de uma Gaussiana.
0 0.2 0.4 0.6 0.8 1
0
0.2
0.4
0.6
0.8
1
FPR
TPR
cbcr
hs
hsi
rg
rgb
ycbcr
0 0.1 0.2 0.3 0.4 0.5
0.4
0.5
0.6
0.7
0.8
0.9
1
FPR
TPR
cbcr
hs
hsi
rg
rgb
ycbcr
Figura 20: Curvas ROC para o classificador simples Gaussiana utilizando imagens em ambientes
abertos: (esquerda) sol e (direita) sombra.
0 0.05 0.1 0.15 0.2 0.25 0.3
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
FPR
TPR
cbcr
hs
hsi
rg
rgb
ycbcr
0 0.2 0.4 0.6 0.8 1
0
0.2
0.4
0.6
0.8
1
FPR
TPR
cbcr
hs
hsi
rg
rgb
ycbcr
Figura 21: Curvas ROC para o classificador simples Gaussiana utilizando imagens em ambientes
fechados: (esquerda) incandescente e (direita) fluorescente.
4.5 DISCUSS
˜
OES
Apesar da cor de pele ser uma caracter
´
ıstica muito atrativa para a segmentac¸
˜
ao de pixels de
pele, os efeitos da iluminac¸
˜
ao apresentam forte influ
ˆ
encia sobre esses m
´
etodos de segmentac¸
˜
ao.
As condic¸
˜
oes de iluminac¸
˜
ao e o controle de equil
´
ıbrio de branco (white balance) da c
ˆ
amera
alteram a cor de pele adquirida pelo sensor da c
ˆ
amera, o que levou a se investigar qual espac¸o
de cor minimizaria os efeitos no desempenho da classificac¸
˜
ao. Um ponto importante sobre
60
o banco
´
e que para nenhuma imagem foi desabilitado o controle de equil
´
ıbrio de branco da
c
ˆ
amera. Acredita-se que tal fato possa ter gerado algumas variac¸
˜
oes nas taxas de classificac¸
˜
ao.
Os experimentos feitos mostram que espac¸os de cor bidimensionais (RG norma., HS e
CbCr) em geral apresentam melhores resultados descartando as informac¸
˜
oes de lumin
ˆ
ancia e
por consequ
ˆ
encia reduzindo efeitos da iluminac¸
˜
ao. Os resultados dos espac¸os bidimension-
ais mostram que a utilizac¸
˜
ao de somente informac¸
˜
ao de cromin
ˆ
ancia
´
e suficiente para uma
classificac¸
˜
ao de pixels de cor razoavelmente boa. No geral o melhor classificador
´
e o por sim-
ples Gaussiana, para o espac¸o de cor CbCr para o skinDB. O melhor resultado geral se mostrou
muito diferente dos encontrados para o CompaqDB, levando a concluir que o skinDB ainda n
˜
ao
cont
´
em toda a variedade de cores do CompaqDB.
Entretanto, mesmo ap
´
os analisar seis espac¸os de cor, n
˜
ao foi poss
´
ıvel identificar um que
tenha as melhores taxas de acerto para todas as iluminac¸
˜
oes. Outros espac¸os de cor devem
ser testados para que se comprove a exist
ˆ
encia de um espac¸o
´
otimo para a detecc¸
˜
ao de pixels
de pele. Aqueles resultados para os classificadores de modelos param
´
etricos que foram muito
bons devem ser olhados com desconfianc¸a. O banco skinDB, apesar de terem sido tomados
os devidos cuidados para manter a diversidade de imagens, ainda
´
e pequeno e provavelmente
tendencioso na escolha das imagens e na composic¸
˜
ao de cor de pele.
Pesquisas futuras s
˜
ao necess
´
arias para esclarecer resultados contradit
´
orios entre os experi-
mentos do presente trabalho e os de outros (PHUNG; BOUZERDOUM; CHAI, 2005; JONES;
REHG, 2002). Trabalhos futuros incluem melhorar o banco de imagens skinDB utilizando out-
ros par
ˆ
ametros de controle, como o controle de equil
´
ıbrio de branco da c
ˆ
amera, tipo de fundo
nas fotos, identificac¸
˜
ao an
ˆ
onima das pessoas fotografadas e dist
ˆ
ancia da c
ˆ
amera. Esse cen
´
ario
mais controlado pode contribuir para deixar mais marcante quais variac¸
˜
oes afetam mais a cor
de pele.
Algoritmos de const
ˆ
ancia de cores (FINLAYSON; SCHIELE; CROWLEY, 1998) tamb
´
em
devem ser pesquisados com o intuito de tentar aproximar as cores a um modelo pr
´
oximo do
observado na iluminac¸
˜
ao sombra, isso pois tal iluminac¸
˜
ao obteve os melhores resultados para
todos os modelos e espac¸os de cor.
61
5 DETECC¸
˜
AO DE CONTE
´
UDO OFENSIVO
O presente trabalho teve como proposta estudos sobre a detecc¸
˜
ao de conte
´
udo ofensivo e
consequente an
´
alise da viabilidade da criac¸
˜
ao de um aplicativo para tal. Dentre os estudos de
detecc¸
˜
ao de conte
´
udo, foram realizadas an
´
alises estat
´
ısticas de m
´
etodos de CBIR e de conjunto
de caracter
´
ısticas. A detecc¸
˜
ao de conte
´
udo ofensivo foi feita sobre as imagens do CompaqDB
separadas por conte
´
udo, a selec¸
˜
ao compaqDBContent. Foram extra
´
ıdas caracter
´
ısticas de cada
uma das imagens e o vetor de caracter
´
ısticas
´
e aplicado a um classificador. Os modelos de
conte
´
udo s
˜
ao montados com 20% do total de vetores de caracter
´
ısticas e sobre os outros 80%
s
˜
ao aplicados os classificadores e geradas as estat
´
ısticas de acerto e erro. O diagrama em blocos
desse procedimento pode ser visto na figura 22.
CompaqDBContent
Remoção do
plano de fundo
Remoção do
plano de fundo
Extração das
características
Extração das
características
20%
80%
Construção do
Modelo
- c4.5
- AdaBoost
- RBFNN
Aplicação do
Modelo
teste e avaliação
Figura 22: Diagrama do procedimento feito para o estudo da detecc¸
˜
ao de conte
´
udo ofensivo.
Antes da extrac¸
˜
ao de caracter
´
ısticas
´
e feita a remoc¸
˜
ao do plano de fundo sobre todas as
imagens da selec¸
˜
ao compaqDBContent. A remoc¸
˜
ao do plano de fundo
´
e uma t
´
ecnica que tem
como objetivo restringir a cena a ac¸
˜
ao exercida por pessoas. Feita a remoc¸
˜
ao do plano de fundo
´
e feita extrac¸
˜
ao do vetor de caracter
´
ısticas e armazenamento das informac¸
˜
oes em um arquivo
Comma Separated Values - Valores separados por v
´
ırgulas (CSV). Nesse arquivo cada vetor
62
de caracter
´
ısticas
´
e acompanhado pelo nome da classe a qual pertence, o conjunto de vetores
gera o padr
˜
ao-ouro para a detecc¸
˜
ao de conte
´
udo. Tanto a remoc¸
˜
ao do plano de fundo quanto a
extrac¸
˜
ao de algumas caracter
´
ısticas
´
e feita sobre um mapa de pele. Para gerar o mapa de pele, o
m
´
etodo de segmentac¸
˜
ao de pele utilizado para gerar mapas de pele foi o classificador Jones &
Rehg para o espac¸o RGB com limiar de 0,11.
5.1 CONJUNTO DE CARACTER
´
ISTICAS
O conjunto de caracter
´
ısticas foi escolhido durante os estudos do trabalho de Shih, Lee e
Yang (2007). Esses autores prop
˜
oem uma abordagem utilizando a remoc¸
˜
ao do plano de fundo e
descritores de cor, textura e forma. Os descritores usados pertencem
`
as normas MPEG-7 (MAN-
JUNATH, 2002). O descritor de cor utilizado foi o descritor escal
´
avel de cor, o de textura foi
o descritor histograma de bordas e o de forma foi descritor de compactac¸
˜
ao. Al
´
em dessas car-
acter
´
ısticas foram incorporadas as dimens
˜
oes da imagem e a projec¸
˜
ao das regi
˜
oes de pele na
horizontal e vertical. Maiores detalhes s
˜
ao apresentados nas subsec¸
˜
oes a seguir.
5.1.1 Remoc¸
˜
ao do Plano de Fundo
O objeto de interesse em imagens de conte
´
udo ofensivo s
˜
ao pessoas, raz
˜
ao pela qual
´
e feita a
remoc¸
˜
ao do plano de fundo. Esse m
´
etodo tenta abstrair o cen
´
ario e concentrar o reconhecimento
da cena nas pessoas da imagem e nas ac¸
˜
oes que elas estejam executando.
A remoc¸
˜
ao
´
e feita sobre o mapa de pele de uma imagem submetida a segmentac¸
˜
ao de pixels
de pele pelo classificador Jones & Regh. Sobre o mapa
´
e aplicado o operador morfol
´
ogico da
abertura, para agrupar os pixels de pele, ent
˜
ao o mapa
´
e dividido em blocos de 32 ×32 pixels.
Se a quantidade de pixels de pele de cada bloco for maior do que 50% do n
´
umero de pixels total
do bloco, esse
´
e considerado um bloco de pele. Feito isso, a maior regi
˜
ao conectada de blocos
de pele
´
e considerada como sendo a regi
˜
ao de interesse. A imagem resultante da remoc¸
˜
ao do
plano de fundo
´
e a formada pelo menor ret
ˆ
angulo capaz de englobar toda a regi
˜
ao de interesse.
Caso a imagem seja menor que 64 ×64 pixels, ou seja o dobro do tamanho do bloco, ou o
n
´
umero de regi
˜
oes de pele seja inferior a dois, n
˜
ao
´
e executada a remoc¸
˜
ao do plano de fundo. A
extrac¸
˜
ao das caracter
´
ısticas
´
e feita sobre a imagem inteira.
63
5.1.2 Descritor Escal
´
avel de Cor
O Scalable Colour Descriptor - Descritor escal
´
avel de cor (SCD)
´
e um histograma de cor
de dimens
˜
oes vari
´
aveis. Ou seja, cada componente de cor ser
´
a quantizada novamente em um
n
´
umero menor que 256 posic¸
˜
oes, ou 8 bits. O grande m
´
erito do m
´
etodo
´
e que as componentes
n
˜
ao precisam necessariamente apresentar a mesma quantizac¸
˜
ao, logo o tamanho do vetor do
descritor SCD
´
e vari
´
avel. Esse tipo de abordagem traz benef
´
ıcios para a detecc¸
˜
ao de conte
´
udo,
pois pode-se dar mais import
ˆ
ancia a uma determinada componente de cor, a qual mais se dis-
crimina no contexto da detecc¸
˜
ao.
No detector de conte
´
udo ofensivo s
˜
ao utilizados os espac¸os de cor RGB, HSI e YCbCr para
formar o SCD. O vetor resultante
´
e composto por 256 ou 512 posic¸
˜
oes em diferentes escalas.
As escalas utilizadas servem para a avaliac¸
˜
ao da influ
ˆ
encia do espac¸o de cor na detecc¸
˜
ao de
conte
´
udo e a proporc¸
˜
ao entre canais de cor para esse trabalho podem ser (4:4:4) e (16:4:4).
A distribuic¸
˜
ao entre cores foi colocada de forma que a cor mais discriminante em imagens de
conte
´
udo ofensivo fosse a cor de pele, a qual cont
´
em uma quantidade maior de vermelho na
composic¸
˜
ao. O histograma
´
e global e feito para a imagem ap
´
os a remoc¸
˜
ao do plano de fundo.
O vetor sdc resultante
´
e dado na seguinte forma:
sdc = [s[1],s[2],...,s[n]],
onde s[i], i [1,n]
´
e a probabilidade da componente de cor i e n o n
´
umero de posic¸
˜
oes do vetor.
5.1.3 Descritor Histograma de Bordas
As normas MPEG-7 descrevem o Edge Histogram Descriptor - Descritor histograma de
bordas (EHD) como sendo um descritor de textura. O histograma
´
e constru
´
ıdo dividindo as
bordas entre cinco categorias. As categorias dizem respeito a orientac¸
˜
ao da borda: vertical,
horizontal, 45 graus, 135 graus e demais bordas.
As bordas s
˜
ao detectadas sobre a imagem em tons de cinza gerada pela m
´
edia dos 3 canais
de cor e utilizando o algoritmo de Sobel (GONZALEZ; WOODS, 2006). Ap
´
os feita a detecc¸
˜
ao
de bordas sobre a imagem, essa
´
e igualmente dividida em 16 sub-imagens retangulares e n
˜
ao
sobrepostas. Cada uma das sub-imagens gera um histograma de cinco posic¸
˜
oes, para gerar um
histograma de uma sub-imagem
´
e necess
´
ario dividir novamente cada sub-imagem, cada nova
divis
˜
ao
´
e conhecida como blocos de imagem. O tamanho de cada bloco de imagem depende
do tamanho total da imagem em quest
˜
ao. As normas MPEG-7 recomendam que o n
´
umero de
blocos seja pr
´
oximo a 1100 para que se tenha um boa descric¸
˜
ao de textura. O algoritmo de
Sobel
´
e aplicado a imagem antes da divis
˜
ao, mas para facilitar a visualizac¸
˜
ao das divis
˜
oes em
64
sub-imagens e os blocos de imagem
´
e mostrado na figura 23 como foi realizado o processo
sobre o mapa de pele. Cada bloco de imagem
´
e tratado como sendo uma matriz 2 ×2 de super
pixels e a formac¸
˜
ao dos super pixels gera um valor no histograma de bordas. A figura 24 mostra
quais formac¸
˜
oes da matriz de super pixels pertencem a quais caracter
´
ısticas.
1
2 3 4
5
6 7 8
9
10 11 12
13 14 15 16
(a)
(b)
(c)
(d)
Figura 23: Imagem dividida em 16 sub-imagens, cada sub-imagem dividida em blocos e para cada
bloco feita a matriz de super pixels.
(a)
(b)
(c)
(d)
Figura 24: Matrizes de super-pixels: (a) borda horizontal; (b) borda vertical; (c) borda a 45 graus
e (d) borda a 135 graus.
Para facilitar a implementac¸
˜
ao, haja visto que as dimens
˜
oes de cada imagem s
˜
ao diferentes,
os super-pixels foram fixados no tamanho 4 ×4 pixels. Logo, o n
´
umero de blocos de imagem
´
e
vari
´
avel e em torno de 400 devido ao tamanho m
´
edio das imagens do banco CompaqDB.
O histograma para cada sub-imagem representa caracter
´
ısticas locais. Para melhor repre-
sentar a imagem foram adicionados ao final do vetor de caracter
´
ısticas mais cinco valores que
representam o histograma de bordas global da imagem. O vetor ehd resultante
´
e dados na
seguinte forma:
ehd = [g
1
[1],g
1
[2],.. .,g
1
[5],g
2
[1],g
2
[2],.. .,g
16
[5],ge[1],g
e
[2],.. .,ge[5]],
onde g
j
[i], j [1, 16] e i [1,5],
´
e a quantidade de bordas na posic¸
˜
ao i para sub-imagem j. O
descritor global
´
e ge[i].
65
5.1.4 Descritor de Compactac¸
˜
ao
O Compactness Descriptor - Descritor de compactac¸
˜
ao (CD) mede a distribuic¸
˜
ao espacial
de regi
˜
oes de interesse em uma imagem, nesse caso regi
˜
oes de pele. O objetivo desse descritor
´
e representar a forma com que as pessoas aparecem na cena. O descritor
´
e calculado sobre o
mapa de pele resultante da imagem sem o plano de fundo.
Os valores do descritor s
˜
ao calculados tomando o n
´
umero de pixels de pele de uma regi
˜
ao
da imagem e dividindo pelo n
´
umero total de pixels dessa regi
˜
ao. As regi
˜
oes s
˜
ao em n
´
umero de
21. A primeira regi
˜
ao consiste da imagem inteira, para as demais regi
˜
oes a imagem
´
e dividida
em quatro e 16 regi
˜
oes iguais e n
˜
ao sobrepostas, como mostra a figura 25. O vetor CD
´
e dado
por:
cd = [c[1],c[2],...,g[21]],
onde c[i], i [1,21],
´
e a
´
area relativa ao tamanho da regi
˜
ao i.
1
2 3
4
5
6
7
8 9
10 11
12
13
14
15 16 17
18
19
20
21
Figura 25: Imagem dividida para o calculo do descritor de Compactac¸
˜
ao.
5.1.5 Projec¸
˜
oes de Pele
Alguns autores da literatura utilizaram como caracter
´
ıstica o maior n
´
umero de pixels de pele
conectados. Foi proposta uma abordagem parecida para buscar essa caracter
´
ıstica, chamada de
projec¸
˜
oes de pele, que consiste de histogramas para linhas e colunas contendo o n
´
umero de
blocos de pele.
O mapa de pele, ap
´
os feita a remoc¸
˜
ao do plano de fundo,
´
e dividido em 100 sub-imagens
retangulares e n
˜
ao sobrepostas. Se o n
´
umero de pixels de pele de uma sub-imagem for maior
que 50% do total de pixels, a sub-imagem
´
e considerada como contendo pele. O descritor
´
e
calculado somando o n
´
umero de sub-imagens de pele contidos em cada linha e armazenando o
valor em um vetor h, como mostra a figura 26. O mesmo
´
e feito para cada coluna e o resultado
´
e armazenado no vetor v. Concatenando os dois vetores obt
´
em-se a projec¸
˜
ao de pele na forma
de um vetor proj:
66
proj = [h[1],h[2],. ..,h[10],v[1],v[2], ... ,v[10]],
onde h[i] e v[i], i [1, 10], s
˜
ao a quantidade de blocos de pele na i-
´
esima divis
˜
ao horizontal ou
vertical, respectivamente.
0
2
4
4
3
3
5
8
7
6
0 0 2 3 6 9 8 8 4 2
Figura 26: Imagem dividida para o calculo das projec¸
˜
oes de pele.
5.2 ALGORITMOS DE CLASSIFICAC¸
˜
AO
Foram aplicados tr
ˆ
es m
´
etodos de classificac¸
˜
ao para a detecc¸
˜
ao de conte
´
udo ofensivo. Para
tal, foi utilizado o software Waikato Environment for Knowledge Analysis - Ambiente de
Waikato para a an
´
alise de conhecimento (WEKA) que possui implementados os mais diver-
sos algoritmos de agrupamento (clustering) e classificac¸
˜
ao existentes na literatura. No presente
trabalho foram utilizados os algoritmos de classificac¸
˜
ao C4.5 (J48), AdaBoost (AdaBoost.M.1)
e Bagging.
5.2.1 C4.5
O C4.5
´
e um m
´
etodo de criac¸
˜
ao de
´
arvores de decis
˜
ao, que utiliza a m
´
axima entropia de
Shannon para separar cada valor dos vetores de caracter
´
ısticas entre as classes (QUINLAN,
1996). O referido algoritmo segue o mesmo princ
´
ıpio para a construc¸
˜
ao da
´
arvore de decis
˜
ao
que o ID3, desenvolvido por Quinlan (1996).
O modelo
´
e constru
´
ıdo para um banco de dados conhecido e previamente classificado (GT),
S = S
1
,S
2
,.. .,S
n
, onde S
i
´
e o i-
´
esimo vetor de caracter
´
ısticas e n
´
e o n
´
umero de vetores de
caracter
´
ısticas. Cada vetor S
´
e formado por m caracter
´
ısticas, S
i
= X
1
,X
2
,.. .,X
m
, onde X
j
´
e
uma caracter
´
ıstica representada por um n
´
umero real. A cada vetor S est
´
a associada uma classe,
que para esse trabalho s
˜
ao duas: conte
´
udo ofensivo e conte
´
udo n
˜
ao-ofensivo.
Para todos os atributos de todos os vetores de caracter
´
ısticas de uma classe
´
e calculada a
entropia de Shannon e para o atributo que apresenta o menor valor de entropia
´
e criado um n
´
o
67
na
´
arvore de decis
˜
ao. A implementac¸
˜
ao utilizada nesse trabalho para o classificador C4.5 foi a
J48 presente no WEKA.
5.2.2 AdaBoost
Abreviac¸
˜
ao de Adaptative Boosting (impuls
˜
ao adaptativa) o algoritmo AdaBoost utiliza
varias inst
ˆ
ancias ponderadas de um classificador fraco para gerar um classificador robusto
(FREUND; SCHAPIRE, 1997). O classificador fraco
´
e um classificador que sozinho n
˜
ao ex-
ecuta bem a separac¸
˜
ao entre as classes. Entretanto quando utilizado em conjunto com outros
classificadores ou repetidas vezes, classificador robusto, consegue melhorar os resultados de
classificac¸
˜
ao. Para construir o modelo AdaBoost o classificador fraco foi utilizado repetidas
vezes sobre o padr
˜
ao-ouro. Para cada vetor de caracter
´
ıstica do banco de dados utilizado na
construc¸
˜
ao do modelo
´
e aplicado o classificador em sendo o resultado uma falsa classificac¸
˜
ao,
o peso desse vetor de caracter
´
ısticas
´
e incrementado para forc¸ar uma classificac¸
˜
ao correta.
Repetidas vezes se aplica o classificador fraco no conjunto de dados, e a cada vez s
˜
ao
incrementados os valores dos pesos. Ao final da s
´
erie de aplicac¸
˜
oes do classificador fraco tem-
se uma func¸
˜
ao distribuic¸
˜
ao de probabilidade das quais as amostras do espac¸o de caracter
´
ısticas
s
˜
ao mais prov
´
aveis que sejam de outra classe daquela em que foram classificadas.
O classificador fraco utilizado
´
e o de Regression Tree -
´
Arvore de regress
˜
ao (REPTree)
(BREIMAN, 1996). Tamb
´
em presente no WEKA, a
´
arvore de regress
˜
ao
´
e um classificador em
forma de
´
arvore de decis
˜
ao semelhante ao C4.5 utilizando ao inv
´
es da entropia a vari
ˆ
ancia para
a separac¸
˜
ao dos n
´
os.
5.2.3 Bagging
Bagging, ou bootstrap agregating,
´
e uma t
´
ecnica para melhorar as taxas de acur
´
acia e es-
tabilidade de um classificador (BREIMAN, 1996). Da estat
´
ıstica bootstraping
´
e um m
´
etodo
utilizado para realizar infer
ˆ
encias estat
´
ısticas. A infer
ˆ
encia
´
e feita calculando par
ˆ
ametros, como
a vari
ˆ
ancia, para v
´
arios sub-conjuntos das observac¸
˜
oes. Cada sub-conjunto
´
e formado por re-
amostragens das observac¸
˜
oes, buscando padr
˜
oes de distribuic¸
˜
oes. Esse m
´
etodo pode se aplicado
para reconhecimento de padr
˜
oes, ent
˜
ao, surge o classificador Bagging.
T
´
ecnicas de Bagging s
˜
ao usualmente utilizadas com classificadores de
´
arvores de decis
˜
ao.
A partir do banco de dados utilizado s
˜
ao criados v
´
arios outros bancos contendo amostras do
banco original. Cada novo banco cont
´
em um n
´
umero diferente de amostras que podem se
repetir, para enfatizar as caracter
´
ısticas mais marcante ou menosprezar as menos marcantes.
68
Sobre cada novo banco
´
e constru
´
ıdo um classificador. Amostras a serem classificadas s
˜
ao
expostas a todos os classificadores fracos e a maioria absoluta dos resultados para todos os
classificadores
´
e a classe
`
a qual pertence o novo dado de entrada. O mesmo classificador fraco
utilizado pelo AdaBoost foi utilizado para o classificador Bagging.
5.3 RESULTADOS E DISCUSS
˜
OES
Foram feitos 14 testes para cada classificador, seis diferentes vetores SCD e quatro composi-
c¸
˜
oes do vetor de caracter
´
ısticas. Os vetores de caracter
´
ısticas utilizados foram criados concate-
nando os descritores citados na sec¸
˜
ao 5.1. As quatro composic¸
˜
oes s
˜
ao:
1. [ehd, cd, dimens
˜
oes da imagem];
2. [ehd, cd, dimens
˜
oes da imagem, projec¸
˜
oes de pele];
3. [ehd, scd, cd, dimens
˜
oes da imagem];
4. [ehd, scd, cd, dimens
˜
oes da imagem, projec¸
˜
oes de pele];
As diferentes variac¸
˜
oes do vetor de caracter
´
ısticas SCD foram feitas utilizando os espac¸os
de cor RGB, HSI e YCbCr, cada qual com duas escalas de cor: (8:8:8) e (16:4:4). Para o YCbCr
utilizou-se a escala (4:4:16), ao inv
´
es da (16:4:4), para reforc¸ar a cor vermelha, a qual representa
melhor a pele de pessoas em uma cena. Para a an
´
alise dos resultados
´
e feita a associac¸
˜
ao da
composic¸
˜
ao ao n
´
umero descrito acima. Por exemplo a composic¸
˜
ao 1
´
e a [ehd, cd, dimens
˜
oes da
imagem] e assim por diante at
´
e a composic¸
˜
ao 4.
Durante os estudos para a escolha dos classificadores foram realizados experimentos a re-
speito da segmentac¸
˜
ao de pele. Para esse estudo utilizou-se o classificador de pele Jones &
Rehg para alguns valores de limiar. A segmentac¸
˜
ao de pele tem influ
ˆ
encia sobre a detecc¸
˜
ao de
conte
´
udo ofensivo, mas ela podem ser minimizadas se as taxas de erro estiverem no intervalo
de 0,05 at
´
e 0,15.
Para o classificador C4.5 foram obtidos os piores resultados. A tabela 9 mostra os valores
de predic¸
˜
ao positiva (VPP) e sensibilidade (Sens.) para o classificador C4.5. Esses valores s
˜
ao
calculados para cada classe.
Entre as composic¸
˜
oes utilizadas para o classificador C4.5 o melhor resultado foi obtido para
a composic¸
˜
ao 1, a tabela 10 mostra quantas imagens utilizadas para teste (80% da selec¸
˜
ao Com-
paqDBContent) foram corretamente classificadas. Aparentemente a classificac¸
˜
ao de conte
´
udo
69
Tabela 9: Valores de predic¸
˜
ao positiva e sensibilidade para o classificador C4.5 utilizando todas as
composic¸
˜
oes do vetor de varacter
´
ısticas
Conte
´
udo Ofensivo Conte
´
udo n
˜
ao-Ofensivo
Composic¸
˜
ao Espac¸o de cor VPP Sens. VPP Sens.
1 sem o SCD 0,736 0,748 0,736 0,723
2 sem o SCD 0,721 0,755 0,734 0,698
3 RGB (8:8:8) 0,702 0,689 0,685 0,699
RGB (16:4:4) 0,692 0,681 0,676 0,687
HSI (8:8:8) 0,688 0,673 0,670 0,685
HSI (16:4:4) 0,696 0,654 0,664 0,705
YCbCr (8:8:8) 0,699 0,717 0,700 0,682
YCbCr (4:4:16) 0,727 0,699 0,701 0,729
4 RGB (8:8:8) 0,721 0,755 0,734 0,698
RGB (16:4:4) 0,721 0,755 0,734 0,698
HSI (8:8:8) 0,721 0,755 0,734 0,698
HSI (16:4:4) 0,721 0,755 0,734 0,698
YCbCr (8:8:8) 0,721 0,755 0,734 0,698
YCbCr (4:4:16) 0,721 0,755 0,734 0,698
ofensivo
´
e mais suscet
´
ıvel a descritores geom
´
etricos e de textura. Descritores de cor n
˜
ao apre-
sentam melhorias nos valores de VPP e sensibilidade.
Tabela 10: Matriz de confus
˜
ao para o melhor resultado do classificador C4.5, composic¸
˜
ao 1
Classificac¸
˜
ao
Conte
´
udo Ofensivo Conte
´
udo n
˜
ao-Ofensivo
Padr
˜
ao-ouro Conte
´
udo Ofensivo 820 276
Conte
´
udo n
˜
ao-Ofensivo 294 768
O classificador C4.5 na composic¸
˜
ao 1 atingiu um total de acerto de 73,6% das imagens e
26,4% de imagens incorretamente classificadas. Diferentemente dos valores relatados na liter-
atura, os resultados obtidos ficaram abaixo dos 90% de acerto. Pelos resultados pr
´
oximos em
termos de VPP e sensibilidade tanto para o C4.5, quanto para o AdaBoost leva a concluir que as
caracter
´
ısticas retirada das imagens n
˜
ao s
˜
ao condizentes com as imagens do banco CompaqDB.
Os resultados obtidos utilizando o AdaBoost foram melhores que os obtidos para o C4.5.
A tabela 11 mostra os valores VPP e sensibilidade para o classificador AdaBoost.
O melhor resultado encontrado para o classificador AdaBoost foi utilizando a composic¸
˜
ao
3 utilizando o espac¸o de cor RGB (8:8:8) para o SCD. A tabela 12 mostra o n
´
umero de imagens
classificadas corretamente e incorretamente para cada uma das classes. Para o classificador
AdaBoost utilizando a composic¸
˜
ao 3, RGB (8:8:8), o n
´
umero de imagens corretamente classifi-
cadas aumenta para 74,2%. Apesar do aumento, as taxas de classificac¸
˜
ao continuam parecidas
umas com as outras. Ent
˜
ao, o aumento na quantidade de imagens corretamente classificadas
70
deve-se ao classificador e n
˜
ao
`
as caracter
´
ısticas utilizadas.
Tabela 11: Valores de predic¸
˜
ao positiva e sensibilidade para o classificador AdaBoost utilizando
todas as composic¸
˜
oes do vetor de varacter
´
ısticas
Conte
´
udo Ofensivo Conte
´
udo n
˜
ao-Ofensivo
Composic¸
˜
ao Espac¸o de cor VPP Sens. VPP Sens.
1 sem o SCD 0,778 0,673 0,704 0,802
2 sem o SCD 0,752 0,728 0,728 0,752
3 RGB (8:8:8) 0,763 0,715 0,724 0,77
RGB (16:4:4) 0,756 0,725 0,728 0,758
HSI (8:8:8) 0,747 0,739 0,733 0,741
HSI (16:4:4) 0,759 0,749 0,745 0,755
YCbCr (8:8:8) 0,761 0,685 0,705 0,778
YCbCr (4:4:16) 0,761 0,716 0,724 0,767
4 RGB (8:8:8) 0,752 0,728 0,728 0,752
RGB (16:4:4) 0,752 0,728 0,728 0,752
HSI (8:8:8) 0,752 0,728 0,728 0,752
HSI (16:4:4) 0,752 0,728 0,728 0,752
YCbCr (8:8:8) 0,752 0,728 0,728 0,752
YCbCr (4:4:16) 0,752 0,728 0,728 0,752
Tabela 12: Matriz de confus
˜
ao para o melhor resultado do classificador AdaBoost, composic¸
˜
ao 3
utilizando o SCD RGB (8:8:8)
Classificac¸
˜
ao
Conte
´
udo Ofensivo Conte
´
udo n
˜
ao-Ofensivo
Padr
˜
ao-ouro Conte
´
udo Ofensivo 784 312
Conte
´
udo n
˜
ao-Ofensivo 244 818
Os melhores resultados foram obtidos para o classificador Bagging utilizando a composic¸
˜
ao
3, YCbCr (4:4:16). Para esse classificador o descritor de cor aumentou um pouco os valores de
VPP e sensibilidade, como pode-se observar na tabela 13.
O n
´
umero de imagens correta e incorretamente classificadas para o classificador Bagging
para o melhor caso, s
˜
ao mostradas na tabela 14. O n
´
umero de imagens corretamente classifi-
cadas correspondem a 77,16% das imagens do banco.
5.4 DISCUSS
˜
OES
Conforme os resultados obtidos, as caracter
´
ısticas mais marcantes em detecc¸
˜
ao de conte
´
udo
ofensivo parecem ser caracter
´
ısticas geom
´
etricas, pois os resultados para todos os classifi-
cadores utilizados no presente trabalho mostram que a cor auxilia pouco na detecc¸
˜
ao. As
projec¸
˜
oes de pele tamb
´
em auxiliam pouco e em certos casos, como para o classificador C4.5,
71
Tabela 13: Valores de predic¸
˜
ao positiva e sensibilidade para o classificador Bagging utilizando
todas as composic¸
˜
oes do vetor de varacter
´
ısticas
Conte
´
udo Ofensivo Conte
´
udo n
˜
ao-Ofensivo
Composic¸
˜
ao Espac¸o de cor VPP Sens. VPP Sens.
1 sem o SCD 0,762 0,769 0,760 0,752
2 sem o SCD 0,757 0,782 0,767 0,741
3 RGB (8:8:8) 0,768 0,756 0,752 0,764
RGB (16:4:4) 0,752 0,804 0,782 0,727
HSI (8:8:8) 0,744 0,768 0,752 0,727
HSI (16:4:4) 0,748 0,756 0,745 0,736
YCbCr (8:8:8) 0,760 0,784 0,769 0,745
YCbCr (4:4:16) 0,759 0,806 0,786 0,736
4 RGB (8:8:8) 0,757 0,782 0,767 0,741
RGB (16:4:4) 0,757 0,782 0,767 0,741
HSI (8:8:8) 0,757 0,782 0,767 0,741
HSI (16:4:4) 0,757 0,782 0,767 0,741
YCbCr (8:8:8) 0,757 0,782 0,767 0,741
YCbCr (4:4:16) 0,757 0,782 0,767 0,741
Tabela 14: Matriz de confus
˜
ao para o melhor resultado do classificador Bagging, composic¸
˜
ao 3
utilizando o SCD YCbCr (4:4:16)
Classificac¸
˜
ao
Conte
´
udo Ofensivo Conte
´
udo n
˜
ao-Ofensivo
Padr
˜
ao-ouro Conte
´
udo Ofensivo 883 213
Conte
´
udo n
˜
ao-Ofensivo 280 782
atrapalham a classificac¸
˜
ao. Mesmo assim, a informac¸
˜
ao contida nas projec¸
˜
oes de pele n
˜
ao rep-
resenta bem ac¸
˜
oes de pessoas nas imagens.
O melhor classificador foi o Bagging com a composic¸
˜
ao 3, ou seja, sem projec¸
˜
oes de pele e
com descritor de cor RGB (8:8:8). Dar prefer
ˆ
encia
`
a cor vermelha no descritor de cor n
˜
ao obteve
melhoria nos resultados. Apesar da cor n
˜
ao trazer melhorias significativas nos resultados, os
melhores foram encontrados para descritores de cor igualmente escalados e utilizando o espac¸o
de cor RGB.
Os resultados encontrados na presente pesquisa apresentam valores abaixo dos encontrados
na literatura. O melhor resultado de classificac¸
˜
ao foi de 72% para imagens de conte
´
udo ofensivo
e 77% para imagens sem conte
´
udo ofensivo. Na literatura os resultados de classificac¸
˜
ao para
conte
´
udo ofensivo e n
˜
ao-ofensivo s
˜
ao respectivamente de: 99,54% e 83,49% para Shih, Lee e
Yang (2007); 79,3% e 88,7% para Fleck, Forsyth e Bregler (1996); e 85,8% e 92,5% para Jones
e Rehg (1999). Especula-se que a diferenc¸a entre valores se deve principalmente ao vetor de
caracter
´
ısticas e ao banco de dados utilizados em cada um dos trabalhos citados. Um modelo
72
´
otimo de detecc¸
˜
ao de conte
´
udo ofensivo ainda n
˜
ao foi encontrado.
Como trabalho futuro, a presente pesquisa de detecc¸
˜
ao de conte
´
udo ofensivo deve se apro-
fundar no estudo de descritores geom
´
etricos e em descritores que indiquem as quantidades de
blocos de pele conectados. Descritores de cor podem ser
´
uteis em outras func¸
˜
oes na detecc¸
˜
ao
de conte
´
udo ofensivo, tais como avaliac¸
˜
ao do plano de fundo ou discriminac¸
˜
ao atrav
´
es de cores
incomuns nas cenas.
73
6 CONCLUS
˜
OES
6.1 SEGMENTAC¸
˜
AO DE PELE
A cor
´
e uma boa caracter
´
ıstica para a segmentac¸
˜
ao de pixels de pele. Sem a necessidade
de t
´
ecnicas complexas e muitos recursos computacionais, um simples vetor de dois ou tr
ˆ
es ele-
mentos pode segmentar pixels de pele. Para o classificador Jones & Rehg o espac¸o de cor CbCr
apresenta uma classificac¸
˜
ao equivalente
`
a obtida com espac¸os de tr
ˆ
es dimens
˜
oes. Para o mesmo
classificador, espac¸os de tr
ˆ
es dimens
˜
oes apresentaram resultados semelhantes, mostrando que
n
˜
ao h
´
a perda de informac¸
˜
ao nas transformac¸
˜
oes de espac¸os de cor.
A distribuic¸
˜
ao de probabilidade da cor de pele pode ser aproximada para uma Gaussiana
para os espac¸os YCbCr e CbCr, mas n
˜
ao para os demais. Entretanto, n
˜
ao se pode afirmar que
a distribuic¸
˜
ao densidade de probabilidade de cor de pele n
˜
ao seja param
´
etrica, pois o n
´
umero
de observac¸
˜
oes apesar de muito elevado n
˜
ao abrange todos os casos poss
´
ıveis, o que justificaria
descartar a ideia de uma distribuic¸
˜
ao param
´
etrica.
Para aumentar as taxas de classificac¸
˜
ao de pele
´
e necess
´
ario que seja agregada mais informa-
c¸
˜
ao
`
a cor de um pixel. Segundo os autores que defendem a segmentac¸
˜
ao de pele atrav
´
es de
regi
˜
oes e n
˜
ao apenas pixels (JEDYNAK; ZHENG; DAOUDI, 2003), a pele em imagens digitais
aparece conectada em grandes blocos. Isso foi verificado ao se estudar os trabalhos de detecc¸
˜
ao
de conte
´
udo ofensivo, onde a remoc¸
˜
ao do plano de fundo
´
e feita sobre os maiores blocos de pele
conectados. Uma abordagem para aumentar as taxas de classificac¸
˜
ao est
´
a em utilizar juntamente
com a cor do pixel outras informac¸
˜
oes, como cor dos pixels da vizinhanc¸a e textura de pele.
6.2 ILUMINAC¸
˜
AO AMBIENTE E BANCO DE DADOS CONTROLADO
A iluminac¸
˜
ao ambiente influencia, e muito, a segmentac¸
˜
ao de pixels de pele. O controle
de equil
´
ıbrio de branco do dispositivo de aquisic¸
˜
ao
´
e outro fator que tem influ
ˆ
encia na cor de
pele. Como os algoritmos no presente trabalho utilizam a classificac¸
˜
ao pixel-a-pixel, n
˜
ao h
´
a a
informac¸
˜
ao necess
´
aria para corrigir a cor antes da classificac¸
˜
ao.
74
O banco de dados controlado foi utilizado nos estudos sobre a iluminac¸
˜
ao ambiente e taxas
de classificac¸
˜
ao. Os resultados encontrados n
˜
ao poderiam ter sido encontrados sem as imagens
do banco skinDB, apesar do mesmo apresentar relativamente menos imagens que o CompaqDB
e de necessitar de mais vari
´
aveis a serem controladas.
6.3 DETECC¸
˜
AO DE CONTE
´
UDO OFENSIVO
Foram estudadas as mais populares metodologias para a detecc¸
˜
ao de conte
´
udo ofensivo. O
melhor conjunto de caracter
´
ısticas citado na literatura foi implementado e testado para alguns
algoritmos de classificac¸
˜
ao, mas os resultados n
˜
ao foram similares aos relatados para nenhum
algoritmo de classificac¸
˜
ao. Especula-se que tais diverg
ˆ
encias se devem, principalmente, ao
banco de dados que foi utilizado, indicando a possibilidade de que a detecc¸
˜
ao seja altamente
influenciada pelo banco que est
´
a sendo estudado.
Para comparar resultados de uma forma n
˜
ao polarizada
´
e necess
´
ario criar um padr
˜
ao de
conte
´
udo ofensivo. Esse padr
˜
ao pode ser um banco de imagens pr
´
oprio para que v
´
arios pesquisadores
possam usar de refer
ˆ
encia e com um padr
˜
ao-ouro que tenha sido aprovado por v
´
arios obser-
vadores. Dessa forma, seria minimizada a chance de obtenc¸
˜
ao de resultados polarizados inad-
vertidamente.
O fato dos tr
ˆ
es classificadores resultarem em desempenhos similares entre si leva a concluir
que as caracter
´
ısticas n
˜
ao s
˜
ao as melhores para descrever o conte
´
udo do banco compaqDB. Os
trabalhos encontrados na literatura apresentam, cada qual, diferentes vetores de caracter
´
ısticas,
m
´
etodos de classificac¸
˜
ao e banco de dados. Sem um banco de dados padr
˜
ao ou um estudo de
caso mais espec
´
ıfico, conclus
˜
oes sobre a detecc¸
˜
ao de conte
´
udo ofensivo devem ser feitas com
cautela sob pena de se fazer uma generalizac¸
˜
ao incorreta.
A comparac¸
˜
ao entre o m
´
etodo proposto no presente trabalho com o trabalho de Jones e
Rehg (1999) pode ser feita pois foi utilizado o mesmo banco de dados em ambos os casos. As
caracter
´
ısticas utilizadas por Jones e Rehg (1999) s
˜
ao melhores para demostrar o conte
´
udo ofen-
sivo no banco CompaqDB especificamente. Apesar do banco CompaqDB ser um padr
˜
ao para
detecc¸
˜
ao de conte
´
udo ofensivo, cont
´
em certas peculiaridades que s
˜
ao tendenciosas ao conjunto
de caracter
´
ısticas utilizado pelos autores Jones e Rehg (1999), tais proporc¸
˜
ao de blocos de pele
em relac¸
˜
ao ao tamanho da imagem e pessoas em primeiro plano.
75
6.4 TRABALHOS FUTUROS
6.4.1 Segmentac¸
˜
ao de Pele
Para a sequ
ˆ
encia do estudo de segmentac¸
˜
ao de pele prop
˜
oe-se a busca de um espac¸o de cor
pr
´
oprio para a segmentac¸
˜
ao de pele, haja vista que a cor de pele
´
e um subconjunto espec
´
ıfico
de cores. Ainda, deve-se buscar uma transformac¸
˜
ao que n
˜
ao seja dependente de um banco
de dados para treino e que apresente as mesmas taxas TPR e FPR para modelos diferentes.
Isso
´
e poss
´
ıvel se forem analisadas as propriedades f
´
ısicas da luz utilizada como iluminante e
quantizadas devidamente em um espac¸o de cor pr
´
oprio.
O efeito da iluminac¸
˜
ao pode ser reduzido obtendo informac¸
˜
oes sobre a distribuic¸
˜
ao de cores
da imagem e atrav
´
es dessa informac¸
˜
ao fazer a correc¸
˜
ao das cores para que seja mantido o
padr
˜
ao da cor de pele. Foram testados, preliminarmente, algoritmos de correc¸
˜
ao da const
ˆ
ancia
de cor (FINLAYSON; SCHIELE; CROWLEY, 1998) para o classificador Jones & Rehg, mas
ainda sem sucesso. Logo, mais pesquisas devem ser feitas para comprovar a efetividade da
correc¸
˜
ao de cor.
Prop
˜
oe-se buscar outras caracter
´
ısticas, al
´
em da cor para a segmentac¸
˜
ao de pele. A textura,
ap
´
os alguns estudos preliminares, mostrou-se capaz de detectar certas regi
˜
oes de pele em ima-
gens em tons de cinza. Um trabalho poss
´
ıvel de ser feito
´
e de unir a segmentac¸
˜
ao atrav
´
es de cor
com a segmentac¸
˜
ao por textura na tentativa de aumentar as taxas TPR, reduzindo as taxas FPR.
6.4.2 Iluminac¸
˜
ao Ambiente e Banco de Dados Controlado
O banco de dados controlado skinDB ainda apresenta poucas imagens e precisa ter mais
vari
´
aveis controladas. Entre as vari
´
aveis est
˜
ao: aumentar o n
´
umero de imagens, fazer controle
das cores do plano de fundo, fotografar utilizando iluminac¸
˜
oes de v
´
arias cores de composic¸
˜
ao
conhecida e conhecer a dist
ˆ
ancia da c
ˆ
amera para a foto, al
´
em de desabilitar controle autom
´
atico
do equil
´
ıbrio de branco do dispositivo de captura.
6.4.3 Detecc¸
˜
ao de Conte
´
udo Ofensivo
Para se realizar uma comparac¸
˜
ao mais apropriada, deve-se fazer uma pesquisa que compare
m
´
etodos da literatura utilizando o mesmo banco de dados. Com o mesmo banco de dados, difer-
entes classificadores e diferentes conjuntos de caracter
´
ısticas podem ser comparados atrav
´
es dos
valores de VPP e sensibilidade. Nesse cen
´
ario seria poss
´
ıvel indicar qual classificador e qual
conjunto de caracter
´
ısticas expressa melhor o conte
´
udo ofensivo.
76
Com o objetivo de aumentar as taxas de acerto e superar as encontradas na literatura, novas
caracter
´
ısticas devem ser pesquisadas. Realizar a detecc¸
˜
ao de faces e reconhecimento de feic¸
˜
oes
podem representar bem caracter
´
ısticas para a detecc¸
˜
ao de conte
´
udo ofensivo.
77
REFER
ˆ
ENCIAS
ALBIOL, A.; TORRES, L.; DELP, E. J. Optimum color spaces for skin detection. In: Interna-
tional Conference on Image Processing. [S.l.: s.n.], 2001. v. 1, p. 122–124.
BREIMAN, L. Bagging predictors. Machine Learning, Kluwer Academic Publishers, Hing-
ham, MA, USA, v. 24, p. 123–140, August 1996. ISSN 0885-6125.
CAETANO, T.; BARONE, D. A probabilistic model for the human skin color. In: Proceedings
of the 11th International Conference on Image Analysis and Processing. [S.l.: s.n.], 2001.
p. 279–283.
FAWCETT, T. ROC Graphs: Notes and Practical Considerations for Researchers. 2004.
Dispon
´
ıvel em: <http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.10.9777>. Acesso
em: 8 de maio de 2009.
FINLAYSON, G. D.; SCHIELE, B.; CROWLEY, J. L. Comprehensive colour image normal-
ization. In: ECCV ’98: Proceedings of the 5th European Conference on Computer Vision-
Volume I. London, UK: Springer-Verlag, 1998. p. 475–490. ISBN 3-540-64569-1.
FLECK, M.; FORSYTH, D.; BREGLER, C. Finding naked people. In: European Conference
on Computer Vision. [S.l.]: Springer-Verlag, 1996. v. 2, p. 592–602.
FREUND, Y.; SCHAPIRE, R. E. A decision-theoretic generalization of on-line learning and
an application to boosting. Journal of Computer and System Science, Academic Press, Inc.,
Orlando, FL, USA, v. 55, n. 1, p. 119–139, 1997. ISSN 0022-0000.
GARCIA, C.; TZIRITAS, G. Face detection using quantized skin color regions merging and
wavelet packet analysis. In: IEEE Transactions on Multimedia. [S.l.: s.n.], 1999. p. 264–277.
ISSN 1520-9210.
GONZALEZ, R. C.; WOODS, R. E. Digital Image Processing (3rd Edition). Upper Saddle
River, NJ, USA: Prentice-Hall, Inc., 2006. ISBN 013168728X.
HAMMAMI, M.; CHAHIR, Y.; CHEN, L. Webguard: A web filtering engine combining tex-
tual, structural, and visual content-based analysis. IEEE Transactions on Knowledge and
Data Engineering, IEEE Educational Activities Department, Piscataway, NJ, USA, v. 18, n. 2,
p. 272–284, 2006. ISSN 1041-4347.
HU, W. et al. Recognition of pornographic web pages by classifying texts and images. IEEE
Transactions on Pattern Analysis and Machine Intelligence, IEEE Computer Society, Wash-
ington, DC, USA, v. 29, p. 1019–1034, June 2007. ISSN 0162-8828.
JAYARAM, S. et al. Effect of colorspace transformation,the illuminance component and color
modeling on skin detection. In: . [S.l.: s.n.], 2004. p. II: 813–818.
78
JEDYNAK, B.; ZHENG, H.; DAOUDI, M. Maximum entropy models for skin detection. In:
Energy Minimization Methods in Computer Vision and Pattern Recognition. [S.l.: s.n.],
2003. p. 180–193.
JONES, M.; REHG, J. Statistical color models with application to skin detection. In: Proceed-
ings of the IEEE Computer Society Conference on Computer Vision and Pattern Recog-
nition. [S.l.: s.n.], 1999. v. 1, p. 274–280.
JONES, M.; REHG, J. Statistical color models with application to skin detection. International
Journal of Computer Vision, v. 46, n. 1, p. 81–96, January 2002.
KAKUMANU, P.; MAKROGIANNIS, S.; BOURBAKIS, N. A survey of skin-color modeling
and detection methods. Pattern Recognition, v. 40, n. 3, p. 1106–1122, March 2007.
KOVAC, J.; PEER, P.; SOLINA, F. Human skin color clustering for face detection. In: Pro-
ceedingd of the EUROCON 2003. [S.l.: s.n.], 2003. v. 2, p. 144–148 vol.2.
KRUPPA, H.; BAUER, M.; SCHIELE, B. Skin patch detection in real-world images. In: An-
nual Symposium for Pattern Recognition of the DAGM. [S.l.]: Springer, 2002. p. 109–117.
KUIASKI, D. et al. Estrutura para anotac¸
˜
ao de imagens para a avaliac¸
˜
ao de algoritmos de
detecc¸
˜
ao de pele humana. In: Anais do IV Congresso Brasileiro de Engenharia Biom
´
edica.
Salvador, Bahia, Brasil: [s.n.], 2008.
KUIASKI, D. et al. A study of the effect of illumination conditions and color spaces on skin
segmentation. In: Proceedings of the XXII Brazilian Symposium on Computer Graphics
and Image Processing. Rio de Janeiro, RJ, Brazil: [s.n.], 2009.
LEE, L.-H.; LUH, C.-J. Generation of pornographic blacklist and its incremental update using
an inverse chi-square based method. Information Processing and Management, Pergamon
Press, Inc., Tarrytown, NY, USA, v. 44, n. 5, p. 1698–1706, 2008. ISSN 0306-4573.
MANJUNATH, B. S. Introduction to MPEG-7, Multimedia Content Description Interface.
[S.l.]: John Wiley and Sons, Ltd., 2002.
PALMER, S. Vision Science: Photons to Phenomenology. [S.l.]: MIT Press, 1999.
PHUNG, S. L.; BOUZERDOUM, A.; CHAI, D. Skin segmentation using color pixel classifi-
cation: Analysis and comparison. IEEE Transactions on Pattern Analysis Machine Intelli-
gence, IEEE Computer Society, Washington, DC, USA, v. 27, n. 1, p. 148–154, January 2005.
ISSN 0162-8828.
PHUNG, S. L.; CHAI, D.; BOUZERDOUM, A. Skin colour based face detection. In: Pro-
ceedings Intelligent Information Systems Conference The Seventh Australian and New
Zealand 2001. [S.l.: s.n.], 2001. p. 171–176.
POYNTON, C. Frequently Asked Questions about Color. 1995. Dispon
´
ıvel em:
<http://www.poynton.com/ColorFAQ.html>. Acesso em: 23 de novembro de 2008.
QUINLAN, J. R. Improved use of continuous attributes in c4.5. Journal of Artificial Intelli-
gence Research, AI Access Foundation, v. 4, p. 77–90, March 1996. ISSN 1076-9757.
79
SHIH, J.-L.; LEE, C.-H.; YANG, C.-S. An adult image identification system employing image
retrieval technique. Pattern Recognition Letters, Elsevier Science Inc., New York, NY, USA,
v. 28, n. 16, p. 2367–2374, 2007. ISSN 0167-8655.
SHIN, M.; CHANG, K.; TSAP, L. Does colorspace transformation make any difference on skin
detection? In: IEEE Workshop on Applications of Computer Vision. [S.l.: s.n.], 2002. p.
275–279.
SOLAR, J. R. del et al. Characterizing objectionable image content (pornography and nude
images) of specific web segments: Chile as a case study. In: LA-WEB ’05: Proceedings of
the Third Latin American Web Congress. Washington, DC, USA: IEEE Computer Society,
2005. ISBN 0-7695-2471-0.
ST
¨
ORRING, M. Computer Vision and Human Skin Colour. Tese (Doutorado) — Faculty of
Engineering and Science, Aalborg University, Denmark, 2004.
TERRILLON, J.-C. et al. Comparative performance of different skin chrominance models and
chrominance spaces for the automatic detection of human faces in color images. In: Proceed-
ings of the Fourth IEEE International Conference on Automatic Face and Gesture Recog-
nition 2000. Washington, DC, USA: IEEE Computer Society, 2000. p. 54–. ISBN 0-7695-0580-
5.
THEODORIDIS, S.; KOUTROUMBAS, K. Pattern Recognition. [S.l.]: Elsevier, 2006.
VEZHNEVETS V.; SAZONOV, V. A. A. A survey on pixel-based skin color detection tech-
niques. In: Proceedings of GRAPHICON 2003. [S.l.]: GRAPHICON 2003, 2003. p. 85–92.
YANG, M.-H.; AHUJA, N. Detecting human faces in color images. In: Proceedings of the
International Conference on Image Processing ICIP 98. [S.l.: s.n.], 1998. v. 1, p. 127–130.
Esse documento foi gerado em L
A
T
E
X2e
Livros Grátis
( http://www.livrosgratis.com.br )
Milhares de Livros para Download:
Baixar livros de Administração
Baixar livros de Agronomia
Baixar livros de Arquitetura
Baixar livros de Artes
Baixar livros de Astronomia
Baixar livros de Biologia Geral
Baixar livros de Ciência da Computação
Baixar livros de Ciência da Informação
Baixar livros de Ciência Política
Baixar livros de Ciências da Saúde
Baixar livros de Comunicação
Baixar livros do Conselho Nacional de Educação - CNE
Baixar livros de Defesa civil
Baixar livros de Direito
Baixar livros de Direitos humanos
Baixar livros de Economia
Baixar livros de Economia Doméstica
Baixar livros de Educação
Baixar livros de Educação - Trânsito
Baixar livros de Educação Física
Baixar livros de Engenharia Aeroespacial
Baixar livros de Farmácia
Baixar livros de Filosofia
Baixar livros de Física
Baixar livros de Geociências
Baixar livros de Geografia
Baixar livros de História
Baixar livros de Línguas
Baixar livros de Literatura
Baixar livros de Literatura de Cordel
Baixar livros de Literatura Infantil
Baixar livros de Matemática
Baixar livros de Medicina
Baixar livros de Medicina Veterinária
Baixar livros de Meio Ambiente
Baixar livros de Meteorologia
Baixar Monografias e TCC
Baixar livros Multidisciplinar
Baixar livros de Música
Baixar livros de Psicologia
Baixar livros de Química
Baixar livros de Saúde Coletiva
Baixar livros de Serviço Social
Baixar livros de Sociologia
Baixar livros de Teologia
Baixar livros de Trabalho
Baixar livros de Turismo