( PDF ) Segmentação de pele em imagens digitais para a detecção automática de conteúdo ofensivo.

Download PDF

ads:

UNIVERSIDADE TECNOL

OGICA FEDERAL DO PARAN

PROGRAMA DE P

OS-GRADUAC¸

AO EM ENGENHARIA EL

ETRICA E

INFORM

ATICA INDUSTRIAL

DIOGO ROSA KUIASKI

SEGMENTAC¸

AO DE PELE EM IMAGENS DIGITAIS PARA A

DETECC¸

AO AUTOM

ATICA DE CONTE

UDO OFENSIVO

DISSERTAC¸

AO DE MESTRADO

CURITIBA

2010

ads:

Livros Grátis

http://www.livrosgratis.com.br

Milhares de livros grátis para download.

DIOGO ROSA KUIASKI

SEGMENTAC¸

AO DE PELE EM IMAGENS DIGITAIS PARA A

DETECC¸

AO AUTOM

ATICA DE CONTE

UDO OFENSIVO

Dissertac¸

ao apresentada ao Programa de P

os-

graduac¸

ao em Engenharia El

etrica e Inform

atica

Industrial da Universidade Tecnol

ogica Federal do

Paran

a como requisito parcial para obtenc¸

ao do grau

de “Mestre em Ci

encias” –

Area de Concentrac¸

ao:

Inform

atica Industrial.

Orientador: Prof. Dr. Hugo Vieira Neto

CURITIBA

2010

ads:

Ficha catalográfíca elaborada pela Biblioteca

UTFPR

Campus Curitiba

K96s

Kuiaski,

Diogo

Rosa

Segmentação

pele

imagens

digitais

para

detecção

automática

conteúdo

ofensivo

Diogo

Rosa Kuiaski.

2010.

f.:

il.;

30 cm

Orientador: Hugo Vieira Neto

Dissertação (Mestrado)

Universidade Tecnológica Federal

Paraná.

Programa

Pós-Graduação

Engenharia

Elétrica

Informática

Industrial. Área

Concentração:

Informática

Industrial,

Curitiba,

2010

Bibliografia:

75-7

Processamento

imagens

Técnicas

digitais.

Detecção

pele.

Banco

dados

imagens.

Pixel.

Reconhecimento

padrões.

Mineração

dados (Computação).

Vieira Neto, Hugo, orient.

II.

Universidade Tecnológica Federal

Paraná. Programa

Pós-Graduação

Engenharia Elétrica

Informática Industrial. Área

Concentração

Informática

Industrial. III. Titulo.

CDD621.3

U I

f"PR

UNIVERSIDADE

TECNOLÓGICA

FEDERAL

PARANÁ

Campus

Curitiba

PROGRAMA

PÓS-GRADUAÇÃO

ENGENHARIA

ELÉTRÍCA

INFORMÁTICA

INDUSTRIAL

CAMPUS

CURITIBA

Programa

Pós-Graduação

Engenharia Elétrica

Informática

Industrial

Título

Dissertação

N°

517:

"Segmentação

Pele

Imagens Digitais para

Detecção Automática

Conteúdo Ofensivo"

por

Diogo Rosa Kuiaski

Esta dissertação

foi

apresentada,

às

09h30min

do dia 25 de

fevereiro

2010, como requisito parcial para

obtenção

grau

MESTRE

CIÊNCIAS

Área

Concentração: Informática Industrial, pelo Programa

Pós-Graduação

Engenharia Elétrica

Informática Industrial

CPGEI

-, na

Universidade Tecnológica

Federal

Paraná

UTFPR.

trabalho

foi

aprovado pela Banca Examinadora,

composta pelos professores:

<—-Prôf.

Dr.

Hugo

Vieira

Nélo

(Orientador

UTFPR)

Prof.

José

Carlos Ferreira

Rocha

(UEPG)

Prof.

Dr.

Marcelo

Victor

Wust

Zibetti

/fUTFPR)

Visto

coordenação:

Prof.

Dr.

Humberto

Remígio Gambá

(Coordenador

CPGEI)

Av.

Sete

Setembro,

3165-

80230-901

Curitiba

- PR.

Tel.

+55

(41) 3310

4680/e-mail:

[email protected]/http://www.cpgei.ct.utfpr.edu.br

AGRADECIMENTOS

Agradec¸o a meus familiares pelo apoio, aos colegas de laborat

orio pela ajuda e incentivo, e

aos amigos pelo suporte nesta etapa de minha carreira.

Ainda, agradec¸o o apoio ﬁnanceiro recebido da CAPES e UOL.

O projeto de pesquisa desta dissertac¸

ao teve o apoio do programa UOL Bolsa Pesquisa -

processos 20080129153400 e 20090213081100.

(http://bolsapesquisa.uol.com.br)

Habe nun, ach! Philosophie,

Juristerei und Medizin,

Und leider auch Theologie

Durchaus studiert, mit heißem Bem

uhn.

Da steh ich nun, ich armer Tor!

Und bin so klug als wie zuvor;

Faust - Goethe.

Ent

ao, ah! Filosoﬁa,

Direito e Medicina,

e, infelizmente, tamb

em a Teologia

Estudando calorosamente.

Estou eu aqui, pobre tolo!

ao inteligente quanto antes;

Faust - Goethe.

RESUMO

KUIASKI, Diogo R.. Segmentac¸

ao de Pele em Imagens Digitais para a Detecc¸

ao Autom

atica

de Conte

udo Ofensivo. 79 f. Dissertac¸

ao – Programa de P

os-graduac¸

ao em Engenharia El

etrica

e Inform

atica Industrial, Universidade Tecnol

ogica Federal do Paran

a. Curitiba, 2010.

O presente trabalho tem como objetivo estudar meios de efetuar a detecc¸

ao autom

atica de

conte

udo ofensivo (pornograﬁa) em imagens digitais. Para tal estudou-se largamente segmenta-

c¸

ao de pixels de pele, espac¸os de cor e descritores de conte

udo. Esse trabalho tem um foco

maior na segmentac¸

ao de pele, pois

e a etapa primordial nos trabalhos envolvendo detecc¸

de conte

udo ofensivo. Testou-se quatro m

etodos de segmentac¸

ao de pixels de pele e foi con-

stru

ıdo um banco de dados estruturado para o estudo de segmentac¸

ao de pele, com meios de

anotac¸

ao de imagens para auxiliar na estruturac¸

ao e no controle das caracter

ısticas das imagens

do banco. Com o aux

ılio das metainformac¸

oes do banco de imagens, foram conduzidos estudos

envolvendo as condic¸

oes de iluminac¸

ao e a segmentac¸

ao de pele. Por ﬁm, foi implementado um

algoritmo de extrac¸

ao de caracter

ısticas em sistemas de classiﬁcac¸

ao pelo conte

udo de imagens

(CBIR) para detecc¸

ao de conte

udo ofensivo.

Palavras-chave: detecc¸

ao de pele; segmentac¸

ao de cor; anotac¸

ao de imagens; banco de dados

de images; CBIR.

ABSTRACT

KUIASKI, Diogo R.. Skin Segmentation on Digital Images for Automatic Offensive-content

Detection. 79 f. Dissertac¸

ao – Programa de P

os-graduac¸

ao em Engenharia El

etrica e In-

form

atica Industrial, Universidade Tecnol

ogica Federal do Paran

a. Curitiba, 2010.

This work presents a study of suitable approaches for automatic detection of offensive content

(pornography) in digital images. Extensive experiments were conducted for skin pixel segmen-

tation, colour spaces and content descriptors. This work focus its efforts on skin pixel seg-

mentation, since this segmentation is the pre-processing stage for almost every content-based

offensive image classiﬁcation methods in the literature. Four skin skin segmentation methods

were tested in six colour spaces. Also, a structured image database was built to help improve

studies in skin segmentation, with the possibility of adding meta-information to the images in

the database, such as illumination conditions and camera standards. With the help of meta infor-

mation from the image database, experimets involving illumination conditions and skin colour

segmentation were also done. Finally, some feature extraction algorithms were implemented in

order to apply content-based image retrieval (CBIR) algorithms to classify offensive images.

Keywords: skin detection; color segmentation; image annotation; image databases; CBIR.

LISTA DE FIGURAS

–FIGURA 1 ETAPAS DA DETECC¸

AO DE CONTE

UDO. . . . . . . . . . . . . . . . . . . . . . . . . . 20

–FIGURA 2 EXEMPLO DE SEGMENTAC¸

AO DE PIXELS DE PELE. . . . . . . . . . . . . . 24

–FIGURA 3 DIAGRAMA DOS VALORES DE TP, FN, TN, FP. . . . . . . . . . . . . . . . . . . . 25

–FIGURA 4 CURVAS ROC PARA O CLASSIFICADOR JONES & REHG. . . . . . . . . . 40

–FIGURA 5 CURVAS ROC PARA O CLASSIFICADOR NA

IVE BAYES. . . . . . . . . . . 41

–FIGURA 6 CURVAS ROC PARA O CLASSIFICADOR POR SIMPLES GAUSSIANA. 42

–FIGURA 7 CURVAS ROC PARA O CLASSIFICADOR MOG. . . . . . . . . . . . . . . . . . . . 43

–FIGURA 8 IMAGENS DO BANCO SKINDB. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

–FIGURA 9 DIAGRAMA EM

ARVORE XML . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

–FIGURA 10 CURVAS ROC PARA O CLASSIFICADOR JONES & REHG. . . . . . . . . . 51

–FIGURA 11 CURVAS ROC PARA O CLASSIFICADOR NA

IVE BAYES. . . . . . . . . . . 51

–FIGURA 12 CURVAS ROC PARA O CLASSIFICADOR MOG. . . . . . . . . . . . . . . . . . . . 52

–FIGURA 13 CURVAS ROC PARA O CLASSIFICADOR POR SIMPLES GAUSSIANA. 52

–FIGURA 14 CURVAS ROC PARA O CLASSIFICADOR JONES & REHG UTILIZANDO

IMAGENS EM AMBIENTES ABERTOS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

–FIGURA 15 CURVAS ROC PARA O CLASSIFICADOR JONES & REHG UTILIZANDO

IMAGENS EM AMBIENTES FECHADOS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

–FIGURA 16 CURVAS ROC PARA O CLASSIFICADOR NA

IVE BAYES UTILIZANDO

IMAGENS EM AMBIENTES ABERTOS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

–FIGURA 17 CURVAS ROC PARA O CLASSIFICADOR NA

IVE BAYES UTILIZANDO

IMAGENS EM AMBIENTES FECHADOS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

–FIGURA 18 CURVAS ROC PARA O CLASSIFICADOR MOG UTILIZANDO IMA-

GENS EM AMBIENTES ABERTOS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

–FIGURA 19 CURVAS ROC PARA O CLASSIFICADOR MOG UTILIZANDO IMA-

GENS EM AMBIENTES FECHADOS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

–FIGURA 20 CURVAS ROC PARA O CLASSIFICADOR SIMPLES GAUSSIANA UTI-

LIZANDO IMAGENS EM AMBIENTES ABERTOS. . . . . . . . . . . . . . . . . . . . 59

–FIGURA 21 CURVAS ROC PARA O CLASSIFICADOR SIMPLES GAUSSIANA UTI-

LIZANDO IMAGENS EM AMBIENTES FECHADOS. . . . . . . . . . . . . . . . . . 59

–FIGURA 22 PROCEDIMENTO PARA DETECC¸

AO DE CONTE

UDO OFENSIVO . 61

–FIGURA 23 DIVIS

AO DA IMAGEM PARA O EHD . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

–FIGURA 24 MATRIZES DE SUPER-PIXELS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

–FIGURA 25 DIVIS

AO DA IMAGEM PARA O CD . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

–FIGURA 26 PROJEC¸

OES DE BLOCOS DE PELE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

LISTA DE TABELAS

–TABELA 1 RESULTADOS PARA O CLASSIFICADOR JONES & REHG. . . . . . . 39

–TABELA 2 RESULTADOS PARA O CLASSIFICADOR NA

IVE BAYES. . . . . . . . . 41

–TABELA 3 RESULTADOS PARA O CLASSIFICADOR POR SIMPLES GAUS-

SIANA. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

–TABELA 4 RESULTADOS PARA O CLASSIFICADOR MOG. . . . . . . . . . . . . . . . . . 43

–TABELA 5 CURVAS ROC PARA OS CLASSIFICADORES EDSR. . . . . . . . . . . . . . 44

–TABELA 6 RESULTADOS PARA O CLASSIFICADOR JONES & REHG. . . . . . . 55

–TABELA 7 RESULTADOS PARA O CLASSIFICADOR NA

IVE BAYES . . . . . . . . . 57

–TABELA 8 RESULTADO PARA O CLASSIFICADOR MOG. . . . . . . . . . . . . . . . . . . 58

–TABELA 9 RESULTADOS PARA O C4.5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

–TABELA 10 MATRIZ DE CONFUS

AO C4.5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

–TABELA 11 RESULTADOS PARA O ADABOOST . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

–TABELA 12 MATRIZ DE CONFUS

AO ADABOOST . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

–TABELA 13 RESULTADOS PARA O BAGGING . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71

–TABELA 14 MATRIZ DE CONFUS

AO BAGGING . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71

LISTA DE SIGLAS

CBIR Content-based image retrieval - Busca de imagens com base no conte

udo

PNG Portable network graphics - Gr

aﬁcos de rede portavel

KNN K-nearest neightboors - K vizinhos mais pr

oximos

VPP Valor de predic¸

ao positiva

GT Ground-Truth - Padr

ao-ouro

ROC Receiver Operating Characteristics - Caracter

ısticas operacionais do receptor

MoG Mixture of Gaussians - Mistura de Gaussianas

EM Expectation Maximization - Maximizac¸

ao do valor esperado

EDSR Explicity Deﬁned Skin Regions - Regi

oes de pele explicitamente deﬁnidas

XML eXtensible Markup Languange - Linguagem de marcac¸

ao extens

ıvel

URL Uniform resource locator - Localizador uniforme de recursos

ROI Region of interest - Regi

ao de interesse

CSV Comma Separated Values - Valores separados por v

ırgulas

SCD Scalable Colour Descriptor - Descritor escal

avel de cor

EHD Edge Histogram Descriptor - Descritor histograma de bordas

CD Compactness Descriptor - Descritor de compactac¸

WEKA Waikato Environment for Knowledge Analysis - Ambiente de Waikato para a an

alise

de conhecimento

REPTree Regression Tree -

Arvore de regress

SUM

ARIO

1 INTRODUC¸

AO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

1.1 DELIMITAC¸

AO DO TEMA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

1.2 JUSTIFICATIVA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

1.3 ESTRUTURAC¸

AO DO TRABALHO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

2 REVIS

AO DOS M

ETODOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

2.1 DETECC¸

AO DE CONTE

UDO OFENSIVO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

2.1.1 Vetores de Caracter

ısticas e Principais M

etodos da Literatura . . . . . . . . . . . . . . . . . . . . 20

2.1.2 Avaliac¸

ao dos Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

2.2 SEGMENTAC¸

AO DE PELE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

2.2.1 Curvas ROC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

3 SEGMENTAC¸

AO DE PELE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

3.1 ESPAC¸ OS DE COR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

3.1.1 Espac¸os de Cor Aditivos (RGB e RG normalizado) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

3.1.2 Espac¸os de Cor Perceptuais (HSI e HS) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

3.1.3 Espac¸os de Cor Ortogonais (YCbCr e CbCr) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

3.2 MODELOS PROBABIL

ISTICOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

3.2.1 Gaussianas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

3.2.2 Mistura de Gaussianas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

3.2.3 Algoritmo EM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

3.2.4 Histogramas de Cor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

3.2.5 Histograma de Cor na

ıve Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

3.3 CLASSIFICADORES DE PIXELS DE PELE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

3.3.1 Regra de Regi

oes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

3.3.2 Regra de Jones & Rehg . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

3.3.3 Comparac¸

ao Direta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

3.4 RESULTADOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

3.4.1 Classiﬁcador Jones & Rehg . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

3.4.2 Classiﬁcador na

ıve Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

3.4.3 Classiﬁcador por Simples Gaussiana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

3.4.4 Classifcador MoG . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

3.4.5 Classiﬁcadores EDSR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

3.5 DISCUSS

OES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

4 EFEITOS DA ILUMINAC¸

AO AMBIENTE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46

4.1 BANCO DE IMAGENS ESTRUTURADO - SKINDB . . . . . . . . . . . . . . . . . . . . . . . . . . . 46

4.1.1 Anotac¸

ao das Imagens . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

4.2 ILUMINAC¸

AO AMBIENTE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

4.3 M

ETODOS UTILIZADOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

4.4 RESULTADOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

4.4.1 Classiﬁcador Jones & Rehg . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

4.4.2 Classiﬁcador na

ıve Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

4.4.3 Classiﬁcador MoG . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

4.4.4 Classiﬁcador por Simples Gaussiana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

4.5 DISCUSS

OES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

5 DETECC¸

AO DE CONTE

UDO OFENSIVO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61

5.1 CONJUNTO DE CARACTER

ISTICAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62

5.1.1 Remoc¸

ao do Plano de Fundo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62

5.1.2 Descritor Escal

avel de Cor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63

5.1.3 Descritor Histograma de Bordas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63

5.1.4 Descritor de Compactac¸

ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

5.1.5 Projec¸

oes de Pele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

5.2 ALGORITMOS DE CLASSIFICAC¸

AO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

5.2.1 C4.5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

5.2.2 AdaBoost . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

5.2.3 Bagging . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

5.3 RESULTADOS E DISCUSS

OES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

5.4 DISCUSS

OES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

6 CONCLUS

OES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

6.1 SEGMENTAC¸

AO DE PELE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

6.2 ILUMINAC¸

AO AMBIENTE E BANCO DE DADOS CONTROLADO . . . . . . . . . . . 73

6.3 DETECC¸

AO DE CONTE

UDO OFENSIVO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74

6.4 TRABALHOS FUTUROS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75

6.4.1 Segmentac¸

ao de Pele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75

6.4.2 Iluminac¸

ao Ambiente e Banco de Dados Controlado . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75

6.4.3 Detecc¸

ao de Conte

udo Ofensivo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75

REFER

ENCIAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

1 INTRODUC¸

As informac¸

oes contidas na rede mundial de computadores s

ao de f

acil acesso, aparente-

mente sem restric¸

oes. A detecc¸

ao de conte

udo ofensivo representa um papel importante para

limitar o acesso a informac¸

oes indesej

aveis a usu

arios da rede. Entretanto, o fator motivador

desta pesquisa

e prover uma ferramenta aos mantenedores de s

ıtios de uma rede. Essa fer-

ramenta mostraria se em alguma m

aquina, sob a supervis

ao do mantenedor, est

a armazenado

algum tipo de conte

udo ofensivo, o qual

e especiﬁcamente a pornograﬁa.

A detecc¸

ao autom

atica de s

ıtios de conte

udo ofensivo

e uma tarefa relativamente f

acil

quando se tem acesso a todas as informac¸

oes do s

ıtio. As informac¸

oes contidas no s

ıtio s

na maioria textuais. Palavras-chave indicam se existe ou n

ao conte

udo ofensivo em um s

ıtio da

rede. A proposta do presente trabalho

e encontrar imagens de conte

udo ofensivo, sem utilizar

outras informac¸

oes al

em das contidas na pr

opria imagem.

Trabalhar com os elementos de uma imagem e a partir deles conseguir deﬁnir o contexto

de uma cena

e uma tarefa desaﬁadora. Escolher um m

etodo, implementar e testar com um

padr

ao-ouro

e um trabalho que demanda muito tempo e poder computacional. Foram feitos

alguns testes para alguns modelos, mas ainda h

a muito o que ser feito para a detecc¸

ao coerente

de conte

udo ofensivo em imagens digitais. Os desaﬁos da pesquisa se encontram na diversi-

dades de m

etodos encontradas na literatura e na falta de padr

oes para comparac¸

ao do m

etodo

apresentado na presente pesquisa com os propostos por Jones e Rehg (1999); Fleck, Forsyth e

Bregler (1996); e Shih, Lee e Yang (2007); por exemplo.

A maior contribuic¸

ao desse trabalho est

a na realizac¸

ao de uma pesquisa relativa

a etapa

segmentac¸

ao de pixels de pele. O presente trabalho investigou quest

oes ainda pouco abordadas

pela literatura, relativas ao impacto que a variac¸

ao da cor dos pixels de pele exerce no desem-

penho da segmentac¸

ao. A cor de pele varia principalmente com o tipo de iluminac¸

ao ambiente

e isso reﬂete nas taxas de acerto utilizadas na segmentac¸

ao dos pixels de pele. Para investigar

essa inﬂu

encia, os m

etodos da literatura foram testados exaustivamente para v

arios modelos de

espac¸os de cor e iluminac¸

oes ambiente.

1.1 DELIMITAC¸

AO DO TEMA

Delimitou-se o tema na investigac¸

ao de metodologias de detecc¸

ao de conte

udo ofensivo

em imagens. As metodologias aqui estudadas s

ao, em sua totalidade, algoritmos que utilizam

informac¸

oes contidas em imagens digitais, sem que sejam utilizadas an

alises textuais ou outras

fontes de informac¸

ao. Como resultado do estudo pretende-se testar e discutir o desempenho das

metodologias citadas por autores da

area.

O objetivo primordial nesta dissertac¸

e estudar metodologias de detecc¸

ao de conte

udo

ofensivo, mas outros estudos se fazem necess

arios para realizar tal tarefa. Entre os passos

intermedi

arios da pesquisa est

ao estudar a segmentac¸

ao de pele, espac¸os de cor e t

ecnicas de

Content-based image retrieval - Busca de imagens com base no conte

udo (CBIR).

Ser

a dada uma atenc¸

ao especial a m

etodos de segmentac¸

ao autom

atica de pele humana.

O foco foi posto desta forma pois a segmentac¸

ao de pele

e utilizada na maioria dos algorit-

mos de detecc¸

ao de conte

udo ofensivo (SOLAR et al., 2005; JONES; REHG, 1999; FLECK;

FORSYTH; BREGLER, 1996). Durante a pesquisa sobre segmentac¸

ao autom

atica de pele

foram realizados alguns estudos com o intuito de otimizar a segmentac¸

ao na tentativa de melho-

rar taxas de acerto do classiﬁcador de conte

udo ofensivo. Esses estudos limitaram-se a espac¸os

de cor, bancos de imagens e efeitos da iluminac¸

ao ambiente.

Na segmentac¸

ao de pixels s

ao utilizados modelos estat

ısticos para representar matemati-

camente a cor de pele. Os modelos, param

etricos ou n

ao-param

etricos, foram a base para a

montagem de classiﬁcadores, sendo todos eles baseados em cor de pixel. Foram realizados

testes para seis espac¸os de cor e quatro classiﬁcadores. Os resultados dos classiﬁcadores s

comparados utilizando uma mesma base de dados a ﬁm de se encontrar o classiﬁcador de mel-

hor resultado. Ap

os encontrado o melhor classiﬁcador, esse foi selecionado para a aplicac¸

nos classiﬁcadores de conte

udo ofensivo.

A literatura descreve que a iluminac¸

ao ambiente tem forte inﬂu

encia sobre a segmentac¸

de pixels de pele (VEZHNEVETS V.; SAZONOV, 2003; JAYARAM et al., 2004; KAKU-

MANU; MAKROGIANNIS; BOURBAKIS, 2007). Para averiguar esse fato, foi proposto um

estudo no qual somente imagens sob um tipo conhecido de iluminac¸

ao s

ao apresentadas ao

classiﬁcador de pixels de pele. Os resultados desse estudo mostram que existe mesmo uma in-

ﬂu

encia da iluminac¸

ao ambiente na segmentac¸

ao de pele. No estudo dos efeitos da iluminac¸

ambiente foram testadas imagens de um banco de dados pr

oprio para os mesmos classiﬁcadores

de pixels de pele implementados nesse trabalho.

Para a detecc¸

ao de conte

udo ofensivo foram testados alguns classiﬁcadores e vetores de

caracter

ısticas. Os objetivos foram: descobrir quais caracter

ısticas das imagens melhor repre-

sentam conte

udo ofensivo e encontrar um classiﬁcador

otimo para a mesma tarefa.

1.2 JUSTIFICATIVA

A tarefa principal em reconhecimento de conte

udo atrav

es de caracter

ısticas visuais est

em se retirar informac¸

oes relevantes e concisas dos elementos que constituem uma imagem.

Em uma cena, quando um observador tenta identiﬁcar seres humanos, existem caracter

ısti-

cas marcantes que o levam a reconhecer uma pessoa (VEZHNEVETS V.; SAZONOV, 2003).

Essas caracter

ısticas s

ao reconhecidas atrav

es da uni

ao de um conhecimento pr

evio, ou conhec-

imento top-down, do observador, e de informac¸

oes visuais trazidas pela imagem, ou conhec-

imento bottom-up (PALMER, 1999). Com o aux

ılio dessa estrutura, um observador humano

discrimina regi

oes de interesse em imagens.

Entretanto, quando n

ao se trata de um observador humano, mas de um computador,

e pre-

ciso utilizar t

ecnicas que permitam reproduzir esta estrutura de conhecimento. Caracter

ısticas

top-down ainda n

ao s

ao t

ao bem representadas por modelos matem

aticos, deixando para as car-

acter

ısticas bottom-up os resultados de uma boa ou m

a classiﬁcac¸

ao. Esse fato foi acompanhado

e gerou variac¸

oes dr

asticas de resultados durante o decorrer do trabalho e ser

a melhor discutido

nos cap

ıtulos que seguem.

1.3 ESTRUTURAC¸

AO DO TRABALHO

O trabalho est

a dividido em seis partes: a contextualizac¸

ao do tema, a revis

ao dos m

etodos,

a segmentac¸

ao de pixels de pele, a anotac¸

ao de imagens, o desenvolvimento do banco de dados

controlado e a classiﬁcac¸

ao de conte

udo ofensivo. Nessa estrutura, ambos os conhecimen-

tos, top-down e bottom-up, est

ao presentes tanto na segmentac¸

ao de pixels de pele quanto na

classiﬁcac¸

ao de imagens ofensivas. As demais partes apresentam estudos feitos para melhorar

os resultados das etapas de classiﬁcac¸

ao e entender melhor o processo como um todo.

No cap

ıtulo 2

e feita a revis

ao dos m

etodos mais utilizados nas

areas de reconhecimento

de conte

udo ofensivo, reconhecimento de padr

oes e minerac¸

ao de dados. Isso fundamentou

a adoc¸

ao dos modelos e m

etodos utilizados no decorrer do trabalho. Ainda, o cap

ıtulo mostra

como todas as etapas do trabalho est

ao conectadas, al

em de uma vis

ao geral sobre os algoritmos

e m

etodos dessa pesquisa.

Como a segmentac¸

ao de pixels de pele representa muito na detecc¸

ao de conte

udo ofen-

sivo, o cap

ıtulo 3

e exclusivamente dedicado

a revis

ao, resultados e conclus

oes tiradas da

segmentac¸

ao autom

atica de pixels de pele. Nesse cap

ıtulo s

ao comparados m

etodos de segmenta-

c¸

ao de pixels de pele. A an

alise dos resultados mostra qual classiﬁcador obteve os melhores

resultados.

Alguns experimentos feitos durante a etapa da segmentac¸

ao de pixels de pele geraram resul-

tados signiﬁcativos para a pesquisa, sendo esses os estudos dos efeitos da iluminac¸

ao ambiente.

No cap

ıtulo 4

e explicado como a iluminac¸

ao ambiente inﬂuencia na detecc¸

ao de pixels de

pele e, ainda, como foi constru

ıdo o banco de dados de estudos de padr

oes em pele humana

(SkinDB).

No cap

ıtulo 5 s

ao descritos os m

etodos utilizados na detecc¸

ao de conte

udo ofensivo, com

os resultados e as considerac¸

oes acerca do que esperar de uma boa ou m

a classiﬁcac¸

ao. E,

ﬁnalmente, no cap

ıtulo 6 s

ao tiradas as conclus

oes sobre todas as etapas da presente pesquisa.

2 REVIS

AO DOS M

ETODOS

A seguir ser

ao mostrados alguns dos m

etodos mais utilizados para a detecc¸

ao de conte

udo

ofensivo, o que inclui etapas intermedi

arias como a segmentac¸

ao de pele e problemas descritos

pelos autores, que s

ao abordados nos cap

ıtulos que seguem.

2.1 DETECC¸

AO DE CONTE

UDO OFENSIVO

As metodologias de detecc¸

ao de conte

udo ofensivo encontrada na literatura s

ao relativa-

mente semelhantes. O procedimento de classiﬁcac¸

e simples e em sua maioria realizado da

seguinte forma: Segmentac¸

ao de pele, construc¸

ao do vetor de caracter

ısticas e classiﬁcac¸

ao. Os

classiﬁcadores mais comuns necessitam de um conhecimento pr

evio para serem constru

ıdos.

A estrutura adotada pela maioria dos trabalhos na literatura

e representada na ﬁgura 1, a qual

mostra ao lado esquerdo a construc¸

ao do modelo atrav

es de imagens com conte

udo previamente

conhecido e ao lado direito a an

alise do modelo em imagens teste.

Tal estrutura pode ser vista nos trabalhos de Jones e Rehg (1999), Shih, Lee e Yang (2007),

entre outros. Mesmo tendo a mesma estrutura, os m

etodos propostos pelos autores se diferen-

ciam em como cada uma das etapas

e feita.

Para todas as etapas deste trabalho, utilizou-se o banco de imagens conhecido como Com-

paqDB (JONES; REHG, 1999), criado por Jones e Rehg (1999). O banco

e composto por

aproximadamente 5000 imagens contendo pixels de pele, e outras 8000 com imagens sem a

presenc¸a de pessoas. Das 5000 imagens em que aparecem pessoas na cena, aproximadamente

um terc¸o s

ao imagens de conte

udo ofensivo.

Para facilitar o entendimento sobre quais imagens foram utilizadas para cada etapa do pre-

sente trabalho, foram criadas selec¸

oes do banco CompaqDB. A primeira selec¸

e o Com-

paqDBpng, na qual todas as imagens foram convertidas para o formato Portable network

graphics - Gr

aﬁcos de rede portavel (PNG) e separadas em dois grupos, imagens com pix-

els de pele e imagens sem pixels de pele. A partir da selec¸

ao CompaqDBpng foi criada a

Imagens

de treino

Extração das

características

Extração das

características

Construção do

Modelo

- c4.5

- AdaBoost

- RBFNN

Aplicação do

Modelo

teste e avaliação

Imagens

de teste

Figura 1: Modelo gen

erico para a classiﬁcac¸

ao de imagens quanto

a presenc¸a de conte

udo ofensivo.

CompaqDBeasy500, um conjunto de 500 imagens aleat

orias para cada um dos dois grupos do

CompaqDBpng. A selec¸

ao CompaqDBContent foi criada separando o CompaqDBpng em dois

grupos iguais de 1349 imagens: um com conte

udo ofensivo e outro de conte

udo n

ao ofensivo.

Na selec¸

ao que n

ao apresenta conte

udo ofensivo foram igualmente selecionadas imagens de

pessoas e outras imagens sem a presenc¸a de pessoas.

Com o objetivo de ter uma vis

ao geral sobre os m

etodos, cada uma dessas etapas ser

a explo-

rada. Os m

etodos estudados e a discuss

ao sobre a escolha para a implementac¸

ao e simulac¸

oes

est

ao na subsec¸

ao 2.1.1 e na sec¸

ao 2.2.

2.1.1 Vetores de Caracter

ısticas e Principais M

etodos da Literatura

Os trabalhos de detecc¸

ao de conte

udo ofensivo mais signiﬁcativos t

em como trabalho base

os estudos feitos por Fleck, Forsyth e Bregler (1996), nos quais foram utilizadas caracter

ısticas

geom

etricas, como a presenc¸a de rostos e a posic¸

ao relativa entre partes do corpo. A classiﬁca-

c¸

ao foi feita pela presenc¸a ou aus

encia das caracter

ısticas geom

etricas nas imagens.

Jones e Rehg (1999) utilizam caracter

ısticas geom

etricas de tamanho relativo de

areas de

pixels de pele, quantidade de pixels de pele conectados e n

umero de regi

oes de pele conectadas.

A classiﬁcac¸

e feita atrav

es do algoritmo de construc¸

ao de

arvores de decis

ao C4.5 (QUIN-

LAN, 1996).

a nos trabalhos de Shih, Lee e Yang (2007), s

ao utilizadas caracter

ısticas de cor, geometria

e textura para descrever o conte

udo. O m

etodo de classiﬁcac¸

ao utilizado

e o algoritmo de

K-nearest neightboors - K vizinhos mais pr

oximos (KNN). Nesse m

etodo, o vetor de carac-

ter

ıstica

e comparado com vetores de caracter

ıstica de classe conhecida e a classe da maioria

absoluta dos K primeiros

e a classe a qual pertence o vetor em an

alise. A m

etrica utilizada foi

a diferenc¸a simples ou dist

ancia L1, aplicada entre o vetor de caracter

ısticas da imagem que

se deseja avaliar e 100 vetores conhecidos gerados pela extrac¸

ao de caracter

ısticas de imagens

previamente classiﬁcadas entre conte

udo ofensivo e conte

udo n

ao-ofensivo.

Para os trabalhos de Solar et al. (2005) os descritores tamb

em s

ao geom

etricos e aplicados

sobre os maiores blocos de pele encontrados na imagem. S

ao descritores de excentricidade,

posic¸

ao, elongac¸

ao e

area do blocos de pele. Uma novidade trazida pelos autores

e fazer um

estudo de caso numa regi

ao espec

ıﬁca da internet: somente s

ıtios chilenos.

A maioria dos m

etodos utiliza descritores geom

etricos. No presente trabalho, foi utilizado

o m

etodo de extrac¸

ao de caracter

ısticas proposto por Shih, Lee e Yang (2007) e aplicado a

alguns modelos de CBIR. Foi proposta tal metodologia, pois as taxas de acerto dos trabalhos

de Shih, Lee e Yang (2007) foram as melhores encontradas na literatura, al

em da descric¸

ao das

caracter

ısticas ser clara e coerente com o contexto das imagens de conte

udo ofensivo.

Dentre outros trabalhos da literatura pode-se citar os de Hammami, Chahir e Chen (2006),

Hu et al. (2007) e Lee e Luh (2008), os quais utilizam informac¸

oes al

em das encontradas nos

pixels das imagens, como an

alise de textos, tags HTML entre outros. A maioria dos tra-

balhos encontrados na literatura apresenta uma taxa de acerto de aproximadamente 90% de

classiﬁcac¸

ao para imagens de conte

udo ofensivo.

Entretanto, n

ao existe nesses trabalhos um banco de dados padr

ao que pudesse ser utilizado

para comparar os resultados obtidos neste trabalho com os outros da literatura. Os bancos de im-

agens encontrados na literatura s

ao em sua maioria imagens capturadas diretamente da internet

sem passar pela aferic¸

ao de observadores e n

ao dispon

ıvel para testes de outros pesquisadores.

O m

etodo utilizado para a captura das imagens da internet utiliza um procedimento conhecido

como web crawling.

2.1.2 Avaliac¸

ao dos Resultados

A an

alise de resultados para a detecc¸

ao de conte

udo ofensivo

e feita atrav

es de valor

de predic¸

ao positiva (precision) e sensibilidade (recall) (THEODORIDIS; KOUTROUMBAS,

2006). O Valor de predic¸

ao positiva (VPP) representa quantas imagens s

ao realmente imagens

de conte

udo ofensivo dentre todas as imagens classiﬁcadas como tal, ou seja, a soma das cor-

retamente e incorretamente classiﬁcadas. A sensibilidade representa a quantidade de imagens

corretamente classiﬁcadas dentre todas as imagens que realmente s

ao imagens de conte

udo

ofensivo.

O melhor valor da classiﬁcac¸

ao ocorre quando ambas as taxas s

ao pr

oximas de 1, pois o

classiﬁcador acertou o maior n

umero de imagens ofensivas e n

ao errou com imagens n

ao ofen-

sivas. Tamb

em foi utilizada a matriz de confus

ao, a qual mostra quantas imagens foram clas-

siﬁcadas em quais classes e, ainda, se a classiﬁcac¸

ao foi correta ou n

ao. Foram utilizadas duas

classes para detecc¸

ao de conte

udo ofensivo: imagens de conte

udo ofensivo (classe conte

udo

ofensivo) e imagens sem conte

udo ofensivo (classe conte

udo n

ao-ofensivo). Utilizando 2 classes

a matriz de confus

ao apresenta 2 colunas por 2 linhas. A matriz de confus

ao pode ser vista na

ﬁgura 3 aplicada

a an

alise dos dados na sec¸

ao 2.2.1

2.2 SEGMENTAC¸

AO DE PELE

A cor de pele

e uma caracter

ıstica marcante (VEZHNEVETS V.; SAZONOV, 2003) e

por isso os m

etodos de segmentac¸

ao de pele nesse trabalho realizam a classiﬁcac¸

ao tendo

como base somente a informac¸

ao de cor. Al

em do fato de se utilizar a cor, os m

etodos para

a segmentac¸

ao de pele aqui descritos s

ao feitos pixel a pixel, como sugerem a maioria dos

trabalhos na

area (JONES; REHG, 1999; PHUNG; CHAI; BOUZERDOUM, 2001; FLECK;

FORSYTH; BREGLER, 1996). Outra opc¸

ao de segmentac¸

ao de pele

e a utilizac¸

ao de informac¸

oes

de regi

oes de pixels (KRUPPA; BAUER; SCHIELE, 2002; JEDYNAK; ZHENG; DAOUDI,

2003; YANG; AHUJA, 1998), mas foi veriﬁcado junto

a literatura que os m

etodos de classiﬁcac¸

pixel a pixel s

ao mais robustos e r

apidos (VEZHNEVETS V.; SAZONOV, 2003; KAKU-

MANU; MAKROGIANNIS; BOURBAKIS, 2007), enquanto apresentam taxas de acerto e erro

parecidas com os m

etodos por regi

oes.

Durante os estudos de segmentac¸

ao de pele e para a construc¸

ao dos modelos utilizou-se,

tamb

em, as selec¸

oes CompaqDBpng e CompaqDBeasy500. Cada imagem do banco Com-

paqDB cont

em uma imagem bin

aria correspondente que indica atrav

es da cor quais s

ao pixels

de pele (pixels brancos) e quais n

ao s

ao (pixels pretos). Essas imagens bin

arias s

ao, tamb

em,

conhecidas como m

ascaras bin

arias e o conjunto de m

ascaras constitui o Ground-Truth - Padr

ao-

ouro (GT).

Utilizou-se o CompaqDB como banco de imagens, pois os principais trabalhos encontrados

na literatura foram feitos sobre um banco de imagens pr

oprio, o qual na maioria dos casos n

e aberto ou de dif

ıcil acesso para outros pesquisadores, como por exemplo os bancos ECU e

M2VTS (KAKUMANU; MAKROGIANNIS; BOURBAKIS, 2007), dois bancos de imagens

utilizados para a detecc¸

ao de faces sem o padr

ao-ouro para pele. O fato de conciliar os m

etodos

de segmentac¸

ao de pele com um

unico banco de imagens assegura que a comparac¸

ao entre

eles seja mais justa. Para resolver o problema de um banco padr

ao, foi iniciada a construc¸

de um banco de imagens espec

ıﬁco para estudos envolvendo a segmentac¸

ao de pele. O banco

constru

ıdo neste trabalho

e chamando de skinDB e as formas de aquisic¸

ao das imagens s

explicadas em maiores detalhes no cap

ıtulo 4.

A metodologia utilizada para a validac¸

ao dos m

etodos de segmentac¸

ao de pele foi construir

os modelos matem

aticos de cor de pele utilizando a selec¸

ao CompaqDBeasy500 e testar os

modelos de segmentac¸

ao de pele pixel a pixel encontrados na literatura no conjunto total de

imagens, o banco CompaqDBpng. Os modelos foram aplicados a uma s

erie de espac¸os de cor

buscando qual conjunto espac¸o-modelo seria

otimo para a segmentac¸

ao de pixels de pele.

Os resultados s

ao analisados de duas formas: na forma de curvas de Receiver Operating

Characteristics - Caracter

ısticas operacionais do receptor (ROC) (FAWCETT, 2004) e na forma

de mapas de pele. Mapas de pele s

ao resultados prim

arios dos experimentos de classiﬁcac¸

de pixels. Tais mapas s

ao imagens bin

arias de tamanho igual

a imagem a ser segmentada,

ou imagem de entrada, os quais cont

em a predic¸

ao sobre quais pixels foram ou n

ao foram

considerados pele. A predic¸

ao positiva (pixel de pele) gera no mapa de pele um pixel de cor

branca, caso contr

ario esse pixel ser

a de cor preta. A ﬁgura 2 apresenta um exemplo de uma

imagem da selec¸

ao CompaqDBeasy500 juntamente com o padr

ao-ouro e alguns mapas de pele

gerados atrav

es de diferentes modelos probabil

ısticos e espac¸os de cor.

2.2.1 Curvas ROC

Uma das formas de an

alise dos resultados da segmentac¸

ao de pixels de pele

e feita atrav

de curvas ROC. Trata-se de uma an

alise comparativa e efetuada entre classiﬁcadores. Assim,

e poss

ıvel comparar o desempenho dos m

etodos utilizados. As curvas foram concebidas como

ferramenta de decis

ao estat

ıstica (FAWCETT, 2004). Foram largamente aplicadas durante a 2

Guerra Mundial para an

alise de imagens de radar e atualmente s

ao muito utilizadas no aux

ılio

a diagn

ostico m

edico e s

ao tamb

em aplicadas para a avaliac¸

ao de classiﬁcadores bin

arios (for-

mados somente por duas classes) como

e o caso neste trabalho.

Os eixos de uma curva ROC correspondem a taxas de acerto e erro. No eixo vertical est

as taxas de acerto ou de verdadeiros positivos (TPR - True Positive Rate) enquanto no eixo

horizontal est

ao as taxas de erro, ou de falsos positivos (FPR - False Positive Rate). As taxas

(a)

(b)

(c)

(d) (e)

(f)

Figura 2: Exemplo de segmentac¸

ao: (a) Imagem original; (b) Padr

ao-ouro; (c) Resultado do classi-

ﬁcador Jones & Rehg e espac¸o de cor CbCr; (d) Resultado do classiﬁcador Jones & Rehg e espac¸o

de cor RG normalizado; (e) Resultado do classiﬁcador na

ıve Bayes e espac¸o de color CbCr; (f)

resultado do classiﬁcador na

ıve Bayes e espac¸o de cor RG normalizado.

ao adquiridas comparando cada pixel do padr

ao-ouro com o resultado do classiﬁcador. A

comparac¸

e feita utilizando o operando l

ogico “e” (and), portanto surgem quatro valores

poss

ıveis:

1. Verdadeiros-positivos (TP), quando GT

e pele and resultado

e pele;

2. Falsos-negativos (FN), quando GT

e pele and resultado

e n

ao-pele;

3. Falsos-positivos (FP), quando GT

e n

ao-pele and resultado

e pele;

4. Verdadeiros-negativos (TN), quando GT

e pele-n

ao and resultado

e n

ao-pele;

As taxas TPR e FPR s

ao obtidas atrav

es do n

umero de ocorr

encias de TP, FP, TN e FN para

todos os dados analisados. As equac¸

oes 1 e 2 mostram como s

ao calculadas essas taxas.

T PR =

nT P

nT P + nFN

(1)

FPR =

nFP

nT N + nFP

(2)

onde nT P

e o n

umero de verdadeiros positivos, nFP o n

umero de falsos positivos, nFN o

umero de falsos negativos e nT N o n

umero de verdadeiros negativos.

A ﬁgura 3 mostra a tabela de conting

encia (Matriz de confus

ao).

Padrão-ouro (GT)

Resultado da

Classiﬁcação

Verdadeiro

Positivo

Verdadeiro

Negativo

Falso

Negativo

Falso

Positivo

Figura 3: Diagrama ilustrativo do que s

ao os valores de TP, FN, FP, TN. Onde p s

ao pixels de pele

e n pixels de n

ao pele.

Para se levantar uma curva ROC s

ao necess

arios v

arios pontos (FPR,TPR). Tais valores

ao conseguidos atrav

es da variac¸

ao de par

ametros do classiﬁcador. Para a detecc¸

ao de pele, o

par

ametro utilizado para construc¸

ao das curvas ROC

e um valor de limiar, dado pela regras de

decis

ao do que se considera pele e do que se rejeita como sendo pele. Isso

e melhor explicado no

cap

ıtulo 3. O valor de limiar que apresenta melhor resultado

e o ponto (FPR,TPR) que cont

menor valor de FPR e, ao mesmo tempo, o maior TPR. O valor resultante corresponde ao ponto

conhecido como “joelho” da curva.

3 SEGMENTAC¸

AO DE PELE

O trabalho de segmentac¸

ao de pele consiste de estudar, implementar e testar as metodolo-

gias mais utilizadas da literatura, com o objetivo de escolher, dentre os m

etodos, qual apresenta

o melhor desempenho. Tal m

etodo de segmentac¸

e aplicado na detecc¸

ao de conte

udo ofen-

sivo.

A segmentac¸

ao foi feita utilizando informac¸

oes de cor de cada pixel, que

e um ponto em

um espac¸o de cor n-dimensional, deﬁnido por um vetor c = [c

,.. .,c

]. As componentes

do vetor c representam as informac¸

oes de lumin

ancia e de cromin

ancia do pixel. Espac¸os

de cor s

ao geralmente tridimensionais, c = [c

], como o RGB, HSI, YCbCr, YQQ, SCT,

cieLUV e cieLAB, entre outros. Entretanto, para este trabalho foram utilizados somente espac¸os

de cor com 2 e 3 dimens

oes. No vetor est

ao representadas as informac¸

oes de lumin

ancia

e cromin

ancia, que s

ao propriedades da luz incidente no sensor de uma c

amera. Normal-

mente, a lumin

ancia

e representada por uma das tr

es dimens

oes, deixando as outras duas para

a informac¸

ao de cromin

ancia. Nesta dissertac¸

ao foram conduzidos experimentos de reduc¸

da dimensionalidade dos espac¸os de cor, ou seja, tr

es dos seis espac¸os de cor investigados s

bidimensionais (somente cromin

ancia) e os outros tr

es s

ao tridimensionais (cromin

ancia e lu-

min

ancia).

A representac¸

ao do conjunto de cores de pixel que comp

oe a pele humana

e feita atrav

de modelos matem

aticos. Para montar um modelo de cor da pele humana (ST

ORRING, 2004)

exitem dois poss

ıveis caminhos: (a) Fixar uma regi

ao no espac¸o de cor e assumir que todos

os pixels contidos dentro desse subespac¸o s

ao pixels de pele; (b) Estabelecer modelos proba-

bil

ısticos, nos quais probabilidades de cor da pele indicam a chance do pixel ser de pele.

A classiﬁcac¸

ao de pixels de pele

e feita aplicando ao modelo matem

atico uma regra de

decis

ao. Uma regra de decis

e feita dividindo o espac¸o de cores em regi

oes que s

ao consid-

eradas pele e regi

oes que s

ao consideradas n

ao-pele. Por exemplo, quando

e deﬁnida a regi

no espac¸o de cor essa regra

e: est

a dentro da regi

e pele sen

ao n

e. Para os modelos prob-

abil

ısticos, os quais somente mostram as probabilidades de um determinado pixel ser um pixel

de pele,

e necess

ario estabelecer outras regras de decis

ao.

No presente cap

ıtulo ser

ao discutidas as metodologias implementadas para a segmentac¸

de pixels de pele e os resultados atingidos. Na sec¸

ao 3.1 s

ao mostrados os espac¸os de cor

utilizados ao decorrer do estudo. Os modelos matem

aticos para a cor de pele est

ao detalhados

na sec¸

ao 3.2, enquanto na sec¸

ao 3.3 s

ao mostrados alguns classiﬁcadores baseados nos modelos

de cor de pele. Por ﬁm, resultados e discuss

oes s

ao mostrados nas sec¸

oes 3.4 e 3.5.

3.1 ESPAC¸ OS DE COR

A maioria dos m

etodos de segmentac¸

ao de pele, e por consequ

encia os de detecc¸

ao de

conte

udo ofensivo, trabalham sobre um espac¸o de cor espec

ıﬁco. Espac¸os de cor s

ao formas

de se representar caracter

ısticas f

ısicas da luz. A luz reﬂetida em objetos atinge as c

elulas que

comp

oem a retina do ser humano, onde se encontram, dentre outras, dois tipos de c

elulas, os

cones e os bastonetes. Existem tr

es tipos diferentes de cones e cada um deles responde ao

est

ımulo de uma determinada faixa de comprimento de onda da luz incidente. A composic¸

do est

ımulo desses tr

es tipos de cores propicia a vis

ao em cores (PALMER, 1999).

ameras digitais utilizam um princ

ıpio parecido com o da retina para a aquisic¸

ao e codiﬁca-

c¸

ao das propriedades da luz em arquivos de imagem. Existem duas das propriedades da luz que

interessam na presente pesquisa: lumin

ancia e cromin

ancia. A primeira, lumin

ancia,

e o n

umero

de f

otons incidentes no sensor da c

amera, ou seja, a energia da fonte de luz. A cromin

ancia

composic¸

ao espectral das ondas luminosas, ou seja, os comprimentos de onda que formam a

luz (ST

ORRING, 2004).

As imagens utilizadas s

ao digitais, logo, quantizadas e amostradas em espac¸os discretos

(pixels). Tal quantizac¸

ao, aliada aos avanc¸os da computac¸

ao gr

aﬁca, compress

ao de dados,

transmiss

ao de sinal de v

ıdeo, fez surgir in

umeras formas de representar as propriedades da

cor, formas essas chamadas de espac¸os de cor (POYNTON, 1995), cada qual com certas pro-

priedades e peculiaridades. Dentre todos os espac¸os utilizados na literatura para a segmentac¸

de pele foram estudados seis espac¸os de cor: RGB, RG normalizado, HSI, HS, YCbCr e CbCr.

A escolha dos espac¸os de cor se deve principalmente ao fato de que os espac¸os s

ao amplamente

utilizados na literatura e

e poss

ıvel trabalhar com 3 e 2 dimens

oes par um mesmo espac¸o de cor.

Poucos trabalhos fogem a um dos espac¸os de cor citados e utilizam os espac¸os cieLUV, cieLAB

e YQQ.

3.1.1 Espac¸os de Cor Aditivos (RGB e RG normalizado)

O espac¸o de cor RGB tem como base os tr

es tipos de foto-receptores (cones) que est

presentes na retina de um ser humano normal. A representac¸

ao de cor desse modelo consiste

na combinac¸

ao aditiva de tr

es cores prim

arias: o vermelho (red-R), o verde (green-G) e o azul

(blue-B). Originalmente tal modelo foi concebido para monitores com tubo de raios cat

odicos,

mas ainda

e muito utilizado em algoritmos de processamento de imagens principalmente por

raz

oes hist

oricas relacionadas

a codiﬁcac¸

ao de arquivos de imagem (POYNTON, 1995).

Entretanto, a escolha do espac¸o RGB para a classiﬁcac¸

ao de pixels de pele n

ao parece

ser a melhor escolha, pois outros espac¸os de cor apresentam melhores valores de TPR (SHIN;

CHANG; TSAP, 2002). Esse espac¸o de cor

e conhecido por apresentar uma alta correlac¸

entre os tr

es canais e n

ao existe uma separac¸

ao clara entre as informac¸

oes de lumin

ancia e

cromin

ancia, ou seja, a lumin

ancia encontra-se “dilu

ıda” entre os tr

es canais de cor (VEZHN-

EVETS V.; SAZONOV, 2003). O modelo RGB tamb

e notoriamente vulner

avel a variac¸

oes

de iluminac¸

ao ambiente (KUIASKI et al., 2009; ST

ORRING, 2004). Mas existem trabalhos,

como o de Albiol, Torres e Delp (2001), que mostraram resultados nos quais o espac¸o RGB

apresenta os mesmos valores de classiﬁcac¸

ao de outros espac¸os de cor, como o HSI e o YCbCr.

Em uma tentativa de reduzir os efeitos da iluminac¸

ao ambiente, removeu-se a informac¸

de lumin

ancia (JONES; REHG, 1999). Esse experimento foi feito para todos os espac¸os de cor

contidos nesse trabalho. Particularmente para o RGB, que n

ao apresenta claramente a separac¸

de lumin

ancia e cromin

ancia,

e feita uma transformac¸

ao de espac¸o mostrada nas equac¸

oes (3)

e (4) em uma tentativa de desacoplar a lumin

ancia da cromin

ancia (CAETANO; BARONE,

2001).

r =

R + G + B

, (3)

g =

R + G + B

, (4)

onde, R, G e B s

ao os valores dos canais vermelho, verde e azul, respectivamente, e r e g s

valores conhecidos como R e G normalizados.

A componente azul normalizado (b) n

ao precisa ser calculada, pois a informac¸

ao de cor j

a se

encontra nas outras duas componentes r e g. Haja visto que a componente b

e uma combinac¸

linear de r e g, ou seja, r + g + b = 1.

3.1.2 Espac¸os de Cor Perceptuais (HSI e HS)

O espac¸o de cor HSI (Matiz - H, Saturac¸

ao - S e Intensidade - I) tenta reproduzir as cores

numericamente como um ser humano o faria perceptualmente. Matiz representa a cor prim

aria

de um objeto (exemplo: verde, vermelho, azul, laranja), saturac¸

ao representa qu

ao pura

e a

cor (vermelho

e a cor pura, rosa

e vermelho com adic¸

ao de uma certa quantidade de branco) e

intensidade representa a informac¸

ao de lumin

ancia. As componentes H e S representam juntas

a informac¸

ao de cromin

ancia. Para este estudo, como foi feito para o modelo RGB

e poss

ıvel

retirar a componente I em uma tentativa de reduzir efeitos da iluminac¸

ao ambiente.

Todas as imagens utilizadas s

ao codiﬁcadas em RGB e por tal motivo

e necess

ario re-

alizar a transformac¸

ao para o espac¸o HSI. O transformac¸

e realizada de acordo com as

equac¸

oes (5), (6) e (7).

I =

R + G + B

, (5)

S = 1 −

min(R,G,B)

, (6)

H = arctan



√

3(G −B)

2R −G −B



, (7)

onde, R, G e B s

ao os canais de cor do espac¸o RGB normalizados no intervalo [0,1], e H, S e I

ao as componentes do espac¸o HSI respectivamente.

3.1.3 Espac¸os de Cor Ortogonais (YCbCr e CbCr)

O espac¸o de cor YCbCr

e largamente utilizado nos sistemas de televis

ao europeus, e con-

siste em uma transformac¸

ao linear do espac¸o de cor RGB (VEZHNEVETS V.; SAZONOV,

2003). Y representa luma ou lumin

ancia, Cb representa o chroma azul e Cr o chroma ver-

melho. Por causa da descorrelac¸

ao entre lumin

ancia e cromin

ancia, esse espac¸o de cor

chamado, tamb

em, de espac¸o de cor ortogonal (KAKUMANU; MAKROGIANNIS; BOUR-

BAKIS, 2007). Por tal motivo

e esperado que a remoc¸

ao da componente de lumin

ancia Y

resulte em bons resultados de segmentac¸

ao de pixels de pele.

A transformac¸

ao de RGB para YCbCr

e feita segundo as equac¸

oes (8), (9) e (10).

Y = 0.299R + 0.587G + 0.114B, (8)

Cb = −0.168736R −0.331264G + 0.5B, (9)

Cr = 0.5R −0.418688G −0.081312B, (10)

onde K

e o valor do limiar que gera o valor de FPR desejado. onde, R, G e B s

ao as componentes

do espac¸o RGB, e Y , Cb e Cr s

ao as componentes do espac¸o YCbCr respectivamente.

3.2 MODELOS PROBABIL

ISTICOS

Modelos probabil

ısticos buscam, utilizando a teoria da probabilidade, quais das cores de um

espac¸o t

em mais chance de representar um determinado objeto. Aqui, s

ao apresentados m

etodos

probabil

ısticos de modelamento de cor da pele. Esses modelos podem ser param

etricos, os quais

apresentam func¸

oes densidade de probabilidade anal

ıticas que usam par

ametros (m

edia e desvio

padr

ao, por exemplo) ou n

ao-param

etricos, nos quais as func¸

oes de probabilidade s

ao con-

stru

ıdas por meio de in

umeras observac¸

oes de pixels contendo cor de pele. Os m

etodos utiliza-

dos neste trabalho apenas considerada a informac¸

ao da cor de um pixel sem utilizar informac¸

oes

de pixels vizinhos.

Foram implementados quatro diferentes modelos probabil

ısticos: Simples Gaussiana,

Mixture of Gaussians - Mistura de Gaussianas (MoG), Histogramas de Cor e Histogramas

ıve Bayes. Destes, os dois primeiros s

ao m

etodos param

etricos e os outros dois s

ao n

ao-

param

etricos. A informac¸

ao existente nos modelos

e a func¸

ao densidade de probabilidade de

um pixel de cor c dado que este pertence

a classe pele ou

a classe n

ao-pele, ou seja, p(c|pele) e

p(c|n

ao-pele), respectivamente.

Modelos n

ao-param

etricos parecem representar melhor a cor de pele. Entretanto tais m

eto-

dos dependem muito do banco de dados que gerou a func¸

ao densidade de probabilidade. Uma

ıda para generalizar a func¸

ao densidade de probabilidade

e a utilizac¸

ao de modelos param

etri-

cos conhecidos. Quer para o presente trabalho, quer para os de Caetano e Barone (2001) o

modelo param

etrico considerado

e uma distribuic¸

ao Gaussiana multidimensional. Outro mod-

elo param

etrico mais robusto que busca uma distribuic¸

ao gen

erica desconhecida

e o m

etodo da

Mistura de Gaussianas, que tem sido bem aceito na literatura (CAETANO; BARONE, 2001;

TERRILLON et al., 2000; JONES; REHG, 1999).

3.2.1 Gaussianas

A func¸

ao densidade de probabilidade da cor de pele pode ser modelada como sendo uma

Gaussiana multidimensional, a qual segue a equac¸

ao (11).

p(c|pele) =

2π

d/2

.|Σ|

1/2

−

(c−µ)

−1

(c−µ)

(11)

onde d

e o n

umero de dimens

oes do vetor c e os par

ametros µ e Σ representam a m

edia e matriz

de covari

ancia, respectivamente. Para estim

a-los foram utilizados todos os pixels de pele da

selec¸

ao CompaqDBeasy500, aplicando as equac¸

oes (12) e (13).

µ =

∑

x=1

(12)

Σ =

∑

x=1

−µ).(c

−µ)

(13)

onde N

e o n

umero de pixels de pele do banco e c

e o x-

esimo pixel do banco.

3.2.2 Mistura de Gaussianas

Uma forma mais soﬁsticada de se modelar cor de pele

e a utilizac¸

ao da soma ponderada de

distribuic¸

oes Gaussianas. O modelo conhecido como mistura de Gaussianas, ou MoG (Mixture

of Gaussians) tem como objetivo compor a func¸

ao densidade de probabilidade de pele atrav

dessa soma ponderada. A equac¸

ao (14) mostra a soma ponderada por pesos ω

de k densidades

de probabilidades que foram geradas pelas Gaussianas representadas na equac¸

ao (15).

p(c|pele) =

∑

i=1

(c|pele) (14)

(c|pele) =

2π

d/2

.|Σ

1/2

−

(c−µ

)

−1

(c−µ

)

(15)

onde ω

, µ

e Σ

ao, respectivamente, o peso, a m

edia e a matriz de covari

ancia para cada

Gaussiana i de um total de k que comp

oem a func¸

ao densidade de probabilidade total.

Supondo que os dados das observac¸

oes s

ao dados incompletos de probabilidade,

e necess

ario

estimar os valores de ω

, µ

e Σ

. Isso

e feito atrav

es do algoritmo iterativo de Expectation Maxi-

mization - Maximizac¸

ao do valor esperado (EM) (THEODORIDIS; KOUTROUMBAS, 2006).

3.2.3 Algoritmo EM

O algoritmo EM

e um m

etodo que aproxima uma distribuic¸

ao qualquer a outra param

etrica

atrav

es de sucessivas iterac¸

oes. Seja uma vari

avel y ∈ Y onde Y

e um subconjunto multi-

dimensional dos n

umeros reais. Essa vari

avel representa um conjunto de dados com todas

as observac¸

oes e uma func¸

ao densidade de probabilidade p

(y;θ), onde θ

e um vetor de

par

ametros desconhecidos. Entretanto, quando y n

ao pode ser observado completamente, dev-

ido a necessidade de inﬁnitas observac¸

oes necess

arias para determinar a distribuic¸

ao,

e poss

ıvel

observar outra vari

avel que

e func¸

ao de y, como por exemplo x = g(y). Pode-se ent

ao aplicar o

algoritmo EM para se encontrar uma aproximac¸

ao dos par

ametros de p

(y;θ).

Os c

alculos dos par

ametros t

em como ponto de partida a func¸

ao densidade de probabilidade

(x;θ). Sendo o conjunto Y (x) um subconjunto de Y , utiliza-se esse m

etodo para estimar

(y;θ ) a partir do conjunto de dados observ

aveis x. O algoritmo

e iniciado com a deﬁnic¸

ao de

uma func¸

ao densidade da vari

avel incompleta x, p

(x;θ ), em func¸

ao da desejada y. A deﬁnic¸

de p

(x;θ )

e dada pela equac¸

ao (16).

(x;θ ) =



Y (x)

(y;θ )dy (16)

onde θ

e o vetor de par

ametros da func¸

ao densidade.

Para estimar os par

ametros θ para y utiliza-se o algoritmo de m

axima verossimilhanc¸a

(maximum likelihood). A equac¸

ao (17) mostra que os par

ametros θ

ao os par

ametros θ

quando se d

a a resoluc¸

ao da igualdade. Entretanto, quando faltam os dados y, os par

ametros

ao estimados a partir dos dados incompletos x utilizando o algoritmo EM. O EM maximiza

iterativamente a expectativa da func¸

ao de verosimilhanc¸a logar

ıtmica (log-likelihood), repre-

sentada na equac¸

ao (17) como sendo a somat

oria das derivadas parciais do logaritmo de p

relac¸

ao a θ .

∑

j=1

∂ ln(p

;θ ))

∂ θ

= 0 (17)

onde θ

e o vetor de par

ametros de m

axima verossimilhanc¸a estimado.

O EM apresenta dois passos: o de estimac¸

ao (passo-E); e o de maximizac¸

ao (passo-M).

PASSO-E: Para o c

alculo da (t + 1)-

esima iterac¸

ao, dado que θ (t)

e conhecido,

e primeira-

mente calculado o valor esperado da func¸

ao de verosimilhanc¸a logar

ıtmica, como mostra a

equac¸

ao (18).

Q(θ; θ(t)) ≡ E



∑

j=1

ln(p

;θ |X; θ(t)))



(18)

onde Q(θ; θ(t))

e o valor esperado da func¸

ao de m

axima verossimilhanc¸a para a iterac¸

ao (t).

PASSO-M: Maximiza-se o valor esperado de Q(θ; θ(t)). Os valores m

aximos ser

ao os

oximos par

ametros, θ(t + 1). A equac¸

ao (19) mostra que a derivada parcial da func¸

ao de

axima verossimilhanc¸a deve ser zero, denotando o valor de m

aximo da func¸

ao.

θ(t + 1) :

∂ Q(θ; θ (t))

∂ θ

= 0 (19)

A aplicac¸

ao do algoritmo necessita um estado inicial para os par

ametros θ, θ(0), e uma

condic¸

ao de converg

encia, ||θ (t + 1) −θ (t)|| < ε. No caso em estudo, o vetor θ

e composto

pelos valores de ω, µ e Σ. Especiﬁcou-se como valor de converg

encia ε = 10

−4

e para os

valores iniciais de ω, µ e Σ, dividiu-se o banco de imagens igualmente em k conjuntos e foram

calculados os par

ametros segundo as equac¸

oes (20), (21) e (22).

(20)

∑

c (21)

∑

(c −µ

).(c −µ

)

(22)

onde o intervalo [a,b], dependente de i, representa o k-

esimo conjunto de imagens dentro do

total de imagens do banco. E n

e o n

umero pixels nas imagens entre a e b.

A resoluc¸

ao alg

ebrica do algoritmo EM aplicado para o caso de mistura de distribuic¸

oes

Gaussianas resulta nas equac¸

oes (23), (24), (25) e (26) (THEODORIDIS; KOUTROUMBAS,

2006).

t+1

∑

j=1

(i|x

) (23)

t+1

∑

j=1

(i|x

).x

∑

j=1

(i|x

)

(24)

t+1

∑

j=1

(i|x

).||x

−µ

t+1

∑

j=1

(i|x

)

(25)

(i|x

) =

|i).ω

)

(26)

onde p

|i) e p

) s

ao os resultados das equac¸

oes (14) e (15), respectivamente, n

e o n

umero

total de pixels de pele, t

e a iterac¸

ao atual e t + 1 a pr

oxima iterac¸

ao.

3.2.4 Histogramas de Cor

O modelo histograma de cor tenta fazer uma aproximac¸

ao da func¸

ao densidade de proba-

bilidade p(c|pele). Como se desconhece a func¸

ao densidade de probabilidade da cor de pele

humana, s

ao feitas in

umeras observac¸

oes para cada poss

ıvel valor de cor de pele. Esse processo

e feito para cada pixel de pele do banco CompaqDB e dividindo-se o resultado pelo n

umero

total de pixels, como mostra a equac¸

ao (27),

e obtida uma aproximac¸

ao da func¸

ao densidade de

probabilidade p(c|pele).

p(c|pele) =

pele

∑

j=1

pele

(27)

onde c

pele

e um pixel de cor de pele e N

pele

e o n

umero de pixels de pele do banco utilizado

para construir o modelo.

As vantagens do modelo histograma de cor est

ao na facilidade de implementac¸

ao e em con-

seguir representar melhor a distribuic¸

ao densidade de probabilidades que os modelos param

etricos

estudados. Entretanto, desvantagens incluem a depend

encia do banco de imagens utilizado

(falta de um modelo gen

erico) e a quantidade de mem

oria utilizada para o armazenamento de

dados de probabilidade esparsos.

Para os estudos realizados, foram constru

ıdos histogramas de cor quantizado em 256 posi-

c¸

oes para todos os espac¸os de cor citados acima. Uma pr

atica encontrada na literatura para aux-

iliar na quantidade de mem

oria utilizada

e quantizar a as componentes de cor e criar histogra-

mas de 128, 64, ou 32 posic¸

oes sem alterar as taxas de acerto ou erro. Uma comparac¸

ao entre a

quantizac¸

ao e espac¸os de cor foi feita por Shin, Chang e Tsap (2002), cujos estudos mostraram

que as taxas TPR e FPR variam para cada espac¸o de cor e para cada valor de quantizac¸

ao, de

forma que nesta pesquisa utilizou-se somente histogramas de 256 posic¸

oes.

Uma outra abordagem feita em histogramas de cor

e supor que a func¸

ao densidade de

probabilidade p(c|pele) depende somente das componentes de cor c

e n

ao de cada poss

ıvel

valor de c. Tal suposic¸

ao foi testada para auxiliar no armazenamento dos dados esparsos e

veriﬁcar a independencia entre as componentes de cor. O modelos gerado por essa suposic¸

chamado no presente trabalho de Histograma de cor na

ıve Bayes.

3.2.5 Histograma de Cor na

ıve Bayes

O m

etodo consiste em tratar cada dimens

ao do vetor de caracter

ısticas c como sendo uma

vari

avel independente, o que possibilita calcular histogramas separados para cada componente

de cor c

. Os histogramas obtidos separadamente representam a func¸

ao densidade de proba-

bilidade de cada componente de cor dado que aquela componente

e uma componente de pele,

p(c

|pele). Para calcular a probabilidade de pele p(c|pele)

e utilizada a equac¸

ao (28).

p(c|pele) =

∏

i=1

p(c

|pele), (28)

onde i

e a componente de cor do vetor c e d

e o n

umero de dimens

oes de c.

A utilizac¸

ao do modelo histograma de cor na

ıve Bayes implica uma reduc¸

ao dr

astica de

utilizac¸

ao de mem

oria. Ao inv

es de utilizar histogramas com 256

ou 256

posic¸

oes s

ao utiliza-

dos histogramas de 3 ×256 ou 2 ×256.

3.3 CLASSIFICADORES DE PIXELS DE PELE

Associando a um modelo de cor de pele uma regra de classiﬁcac¸

ao obt

em-se um classiﬁ-

cador de pixels de pele. Durante o presente trabalho foram implementados cinco classiﬁcadores

que atuam pixel-a-pixel. Cada pixel

e classiﬁcado em uma de duas categorias: pele ou n

ao-pele.

A decis

e feita atrav

es de uma regra como exempliﬁca a equac¸

ao (29).

classe(c) =



pele, se satisfaz a regra de decis

ao-pele, caso contr

ario

(29)

onde c

e a cor de um pixel de entrada.

As subsec¸

oes 3.3.1, 3.3.2 e 3.3.3 mostram as regras de decis

ao aplicadas no presente tra-

balho. No total, unindo os modelos matem

aticos e regras de decis

ao, foram implementados

cinco classiﬁcadores de pixels de pele. Os classiﬁcadores gerados foram: o classiﬁcador Jones

& Rehg (Histograma de cor / regra de Jones & Rehg), o classiﬁcador na

ıve Bayes (Histograma

de cor na

ıve Bayes / regra de Jones & Rehg), o classiﬁcador por mistura de Gaussianas (Mis-

tura de Gaussianas / comparac¸

ao direta), o classiﬁcador por simples Gaussiana (Gaussiana /

comparac¸

ao direta) e o classiﬁcador Explicity Deﬁned Skin Regions - Regi

oes de pele explici-

tamente deﬁnidas (EDSR).

3.3.1 Regra de Regi

oes

Esse m

etodo consiste em ﬁxar uma regi

ao dentro de um espac¸o de cor. Isso normalmente

e feito atrav

es de regras l

ogicas comparando os valores do pixel estudado com valores pr

deﬁnidos. Utilizou-se duas metodologias utilizando essa regra de decis

ao para os espac¸os de

cor RGB e YCbCr, propostas por Kovac, Peer e Solina (2003) e Garcia e Tziritas (1999), re-

spectivamente. Para o classiﬁcador de Kovac, o qual utiliza o espac¸o de cor RGB, as regras que

deﬁnem se um pixel

e de pele s

ao mostradas na equac¸

ao (30).

classe(c) =











pele, caso











R > 95 and G > 40 and B > 20 and

max(R,G,B) −min(R,G,B) > 15 and

| R −G |> 15 and R > G and R > B

ao-pele, caso contr

ario

(30)

onde R, G e B s

ao os valores das componentes de cor do espac¸o RGB e and

e o operador l

ogico

“e”.

Para o classiﬁcador de Garcia, o qual utiliza o espac¸o YCbCr, as regras podem ser vistas na

equac¸

ao (31).

classe(c) =











pele, caso











Cr ≥max







−2(Cb + 24);

−(Cb + 17);

−4(Cb + 32);

2,5(Cb + θ

);

;

0,5(θ

−Cb)







and

Cr ≤min



(220 −Cb)/6;

4(θ

−Cb)/3



ao-pele, caso contr

ario

(31)

onde θ

, θ

e θ

est

ao representados na equac¸

ao (32).



−2 + (256 −Y )/16 , se Y > 128

6 , caso contr

ario



20 −(256 −Y )/16 , se Y > 128

12 , caso contr

ario



6 , se Y > 128

2 +Y /32 , caso contr

ario



−8 , se Y > 128

−16 +Y /16 , caso contr

ario

(32)

As vantagens desse m

etodo s

ao n

ao demandar tempo para a criac¸

ao do modelo e reduc¸

de recursos computacionais. Entretanto, as regras n

ao s

ao ﬂex

ıveis, ou seja, n

ao apresentam

par

ametros que possam ser alterados. Essa aus

encia de par

ametros faz com que os classiﬁ-

cadores gerem somente um ponto na an

alise ROC, de maneira que a comparac¸

ao com os outros

etodos

e feita atrav

es desse

unico ponto com o melhor resultado dos outros m

etodos citados a

seguir.

3.3.2 Regra de Jones & Rehg

Essa regra de decis

ao foi proposta por Jones e Rehg (1999) e

e feita aplicando-se um valor

de limiar sobre p(pele|c), como mostra a equac¸

ao (33). A transformac¸

ao do valor presente no

modelo p(c|pele) para o requerido pela regra de decis

e feita pela equac¸

ao (34).

classe(c) =



pele, se p(pele|c) > Θ

ao-pele, caso contr

ario

(33)

p(pele|c) =

p(c|pele)p(pele)

p(c)

(34)

A regra de decis

ao aplicada sobre p(pele|c)

e invariante

as probabilidades a priori p(pele) e

p(n

ao-pele), as quais afetam somente a escolha do valor de limiar Θ. Ent

ao, a equac¸

ao (34) pode

ser reescrita como uma relac¸

ao entre p(c|pele) e p(c|n

ao-pele) como mostra a equac¸

ao (35). A

transformac¸

ao para converter o valor de Θ utiliza a equac¸

ao (36).

p(c|pele)

p(c|n

ao-pele)

< Θ (35)

Θ = K

1 − p(pele)

p(pele)

, (36)

onde K

e um par

ametro no intervalo [0,1] que

e utilizado para normalizar Θ.

Aplicando-se a regra para cada um dos modelos probabil

ısticos descritos na sec¸

ao 3.2, tem-

se dois classiﬁcadores: classiﬁcador Jones & Rehg (histograma completo n-dimensional) e o

classiﬁcador na

ıve Bayes (n histogramas parciais unidimensionais).

3.3.3 Comparac¸

ao Direta

Como fora feita a aproximac¸

ao das distribuic¸

oes de pele para Gaussianas tentando gener-

alizar a distribuic¸

ao de cor de pixels de pele, para aplicar a regra de decis

ao Jones & Rehg

necessita-se de uma generalizac¸

ao das cores de n

ao-pele. Uma generalizac¸

ao plaus

ıvel para a

distribuic¸

ao de todas as cores que n

ao fossem pele seria uma distribuic¸

ao uniforme.

Uma distribuic¸

ao uniforme apresenta a mesma probabilidade para cada valor poss

ıvel do

conjunto. Logo, o valor da distribuic¸

ao de pixels de pele

e a m

axima probabilidade 1 sobre o

umero total de poss

ıveis valores de cor, como para o presente trabalho as cores foram quanti-

zadas em 256 valores, a probabilidade de cada cor

e de 1/256

, onde d

e o n

umero de dimens

oes

do espac¸o de cor.

Da mesma forma que para p(pele|c) o valor de p(c|n

ao-pele) s

o afeta a escolha do valor

de limiar. Logo, foram reescritas as equac¸

oes da regra Jones & Rehg utilizando como valor de

probabilidade p(c|n

ao-pele) e p(n

ao-pele) como sendo 1. Isso, gera uma comparac¸

ao direta

entre os valores de p(c|pele) com valores de limiar variando de 0 a p(pele).

3.4 RESULTADOS

Os resultados prim

arios est

ao na forma de mapas de pele, como j

a visto na ﬁgura 2 do

cap

ıtulo 2, onde s

ao apresentadas algumas imagens do banco CompaqDB com os devidos

padr

oes-ouro e alguns mapas de pele gerados por dois classiﬁcadores e dois espac¸os de cor.

Entretanto, os resultados mais signiﬁcativos s

ao mostrados na forma de curvas ROC.

Na an

alise dos dados do presente trabalho as curvas ROC s

ao de grande valia, pois mostram

em valores num

ericos a eﬁci

encia do classiﬁcador para diversos valores de limiar. Al

em de

mostrar valores de desempenho, as curvas s

ao utilizadas para selecionar o valor o limiar que

mais se ajusta

a aplicac¸

ao utilizada. Por exemplo, caso a percentagem de erro seja um fator

ıtico utiliza-se o menor valor de FPR mesmo que prejudicando o valor de TPR.

Para avaliar cada classiﬁcador foram geradas curvas ROC utilizando todas as imagens do

banco CompaqDB. Com uma grande quantidade de imagens de diversas fontes

e poss

ıvel anal-

isar o real comportamento do classiﬁcador, pois efeitos do acaso s

ao minimizados, ou seja, isso

evita que a an

alise por curvas ROC seja tendenciosa e que imagens coletadas para a an

alise

acidentalmente apresentem resultados muito bons ou muito ruins.

As curvas ROC foram montadas utilizando 100 valores para cada um dos classiﬁcadores

utilizados. Cada ponto na curva representa um valor de limiar, Θ ou K. Os 100 valores de

limiar foram igualmente espac¸ados no intervalo [0,MAX LIMIAR], onde MAX LIMIAR

e o

maior valor de limiar aceito pelo classiﬁcador. Somente para os classiﬁcadores EDSR n

ao foi

seguido tal procedimento. Isso pois, n

ao existem par

ametros que possam variar para o referido

etodo, haja visto, que existe somente uma regra ﬁxa. Os valores desses classiﬁcadores s

apresentados na forma de tabela com um

unico valor de TPR e FPR.

Para se efetuar uma comparac¸

ao entre os m

etodos, como feito nos trabalhos de Phung,

Chai e Bouzerdoum (2001), estabeleceu-se um valor de FPR e averiguou-se o valor de TPR

correspondente. Esse

e um valor emp

ırico de 15% ±0,2%. As sec¸

oes a seguir apresentam os

resultados espec

ıﬁcos de cada espac¸o de cor para cada classiﬁcador.

3.4.1 Classiﬁcador Jones & Rehg

Para o classiﬁcador Jones & Rehg as taxas de acerto s

ao muito parecidas para todos os

espac¸os de cor utilizados no presente trabalho. Espac¸os de cor 2D obtiveram resultados piores

do que espac¸os 3D, com a excec¸

ao do espac¸o CbCr, o qual em alguns pontos da curva apre-

sentou os melhores resultados. Para melhor visualizac¸

ao foi feita a comparac¸

ao entre as curvas

representadas na ﬁgura 4.

Comparando os espac¸os de cor com taxa FPR pr

oximas a 15% os espac¸os de cor CbCr e

HSI superam os demais. Os resultados utilizando a taxa FPR ﬁxa s

ao mostrados na tabela 1,

onde K

e o valor do limiar que gera o valor de FPR desejado.

Tabela 1: Valores de TPR e FPR para o classiﬁcador Jones & Rehg para os espac¸os de cor analisa-

dos.

Espac¸o de cor TPR FPR K

RG normalizado 0,686 0,149 0,29

HS 0,686 0,152 0,29

CbCr 0,801 0,149 0,23

RGB 0,786 0,149 0,15

HSI 0,801 0,152 0,15

YCbCr 0,799 0,150 0,16

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

FPR

TPR

cbcr

hsi

rgb

ycbcr

Figura 4: Curvas ROC para o classiﬁcador Jones & Rehg.

Dentre os espac¸os de cor utilizados o que obteve melhor resultado

e o CbCr, pois at

e mesmo

o espac¸o de cor HSI que apresenta o mesmo valor para TPR, apresenta um valor levemente mais

baixo de FPR (0,03%). Ainda, sem a componente de lumin

ancia o CbCr obteve resultados

oximos e at

e melhores a todos os espac¸os 3D, o que leva a dizer que o CbCr teve os melhores

resultados para o classiﬁcador Jones & Rehg.

Os valores conseguidos de taxa de acerto parecem baixos a uma primeira vista, quando

comparados ﬁxando-se FPR em 15%. Apesar de se conseguir valores mais altos de TPR acei-

tando valores tamb

em maiores de FPR, a segmentac¸

ao de pele deve ser conduzida de forma

conservadora, ou seja, prezando pelo acerto e n

ao pelo erro, haja vista que como o objetivo

e reconhecer pessoas, n

e interessante deixar margem para outros objetos al

em de pessoas

aparecerem nas predic¸

oes do classiﬁcador.

3.4.2 Classiﬁcador na

ıve Bayes

Os espac¸os YCbCr e CbCr s

ao os que apresentaram o melhor desempenho para o classi-

ﬁcador na

ıve Bayes. Quando comparado com o classiﬁcador Jones & Rehg, as curvas para

os espac¸os de cor YCbCr e CbCr permanecem, com um ligeiro incremento, praticamente as

mesmas, enquanto para os outros espac¸os a taxas de acerto caem. Isso

e devido

a suposic¸

ao de

que as componentes de cor s

ao independentes. Para os espac¸os de cor ortogonais isso

e v

alido,

mas para os outros espac¸os o mesmo n

ao ocorre. Para melhor visualizar os resultados foram

trac¸adas as curvas contidas na ﬁgura 5, sobre as quais efetuou-se a comparac¸

ao entre os espac¸os

de cor.

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7

0.2

0.4

0.6

0.8

FPR

TPR

cbcr

hsi

rgb

ycbcr

Figura 5: Curvas ROC para o classiﬁcador na

ıve Bayes.

Comparando os espac¸os de cor com taxa FPR pr

oximas a 15% o espac¸o de cor YCbCr

supera os demais. Tais resultados s

ao mostrados na tabela 2.

Tabela 2: Valores de TPR e FPR para o classiﬁcador na

ıve Bayes para os espac¸os de cor analisados.

Espac¸o de cor TPR FPR K

RG normalizado 0,595 0,151 0,46

HS 0,630 0,150 0,36

CbCr 0,815 0,149 0,36

RGB 0,601 0,151 0,37

HSI 0,749 0,152 0,37

YCbCr 0,816 0,150 0,47

Como pode-se notar na tabela 2 e na ﬁgura 5, a remoc¸

ao da componente Y n

ao prejudica em

quase nada a classiﬁcac¸

ao, indicando que as componentes de cromin

ancia s

ao as mais relevantes

para o processo.

3.4.3 Classiﬁcador por Simples Gaussiana

Na ﬁgura 6

e poss

ıvel ver que

a medida que se altera o valor de limiar, as curvas ROC n

apresentam a conﬁgurac¸

ao esperada, ou seja, sem um crescimento constante das vari

aveis de

TPR e FPR para o aumento do valor de limiar. A falta de um crescimento constante nos valores

de TPR e FPR pode mostrar que talvez a distribuic¸

ao de pixels de pele para os espac¸os HS e

HSI n

ao se assemelha a uma distribuic¸

ao Gaussiana. Entretanto, dependendo do valor de limiar

que

e utilizado, a aproximac¸

a distribuic¸

ao Gaussiana

e v

alida.

0 0.05 0.1 0.15 0.2 0.25 0.3

0.3

0.4

0.5

0.6

0.7

0.8

0.9

FPR

TPR

cbcr

hsi

rgb

ycbcr

Figura 6: Curvas ROC para o classiﬁcador por simples Gaussiana.

Comparando os espac¸os de cor com taxa de FPR pr

oximas a 15% o espac¸o de cor CbCr

supera os demais. Tais resultados s

ao mostrados na tabela 3.

Tabela 3: Valores de TPR e FPR para o classiﬁcador por simples Gaussiana para os espac¸os de cor

analisados.

Espac¸o de cor TPR FPR K

RG normalizado 0,612 0,149 0,95

HS 0,335 0,152 0,95

CbCr 0,664 0,150 0,94

RGB 0,710 0,150 0,82

HSI 0,545 0,149 0,87

YCbCr 0,722 0,151 0,83

3.4.4 Classifcador MoG

A ﬁgura 7 mostra os resultados encontrados para aplicac¸

ao de um valor de limiar sobre a

aproximac¸

ao de p(c|skin). O espac¸o de cor HSI obteve os melhores resultados que os outros

espac¸os de cor para todos os valores de limiar. Diferentemente do classiﬁcador por simples

Gaussiana, o classiﬁcador MoG sup

oe que a func¸

ao distribuic¸

ao de probabilidade

e composta

pela soma de 7 Gaussianas ponderadas. O n

umero de Gaussianas foi arbitrado e utilizado para

todos os espac¸os de cor, provando-se satisfat

orio para o espac¸o HSI, enquanto para ou outros

espac¸os a representac¸

ao por simples Gaussiana conseguiu melhores resultados.

0 0.05 0.1 0.15 0.2 0.25 0.3

0.3

0.4

0.5

0.6

0.7

0.8

0.9

FPR

TPR

cbcr

hsi

rgb

ycbcr

Figura 7: Curvas ROC para o classiﬁcador MoG.

Os valores de TPR para uma taxa de FPR pr

oxima de 15% est

ao mostrados na tabela 4.

Entre os valores encontrados, o melhor foi obtido para o espac¸o de cor HSI, com 77% de taxa

acerto.

Tabela 4: Valores de TPR e FPR para o classiﬁcador MoG para os espac¸os de cor analisados.

Espac¸o de cor TPR FPR K

RG normalizado 0,589 0,150 0,91

HS 0,606 0,150 0,88

CbCr 0,596 0,151 0,92

RGB 0,627 0,150 0,67

HSI 0,769 0,151 0,77

YCbCr 0,653 0,150 0,70

Quando comparados os resultados encontrados para o classiﬁcador por Simples Gaussiana

com os encontrados pelo MoG,

e poss

ıvel notar que para os espac¸os HSI e HS s

ao melhor rep-

resentado pelo MoG. A distribuic¸

ao do HSI e do HS, mesmo n

ao sendo uma

unica Gaussiana,

pode ser representada pela soma ponderada de Gaussianas. Apesar do n

umero suﬁciente de

gaussianas para modelar a distribuic¸

ao de cor para cada espac¸o de cor n

ao ser bem deﬁnido, s

necess

arias mais pesquisas sobre esse m

etodo para deﬁnir um n

umero que melhor se adapte a

distribuic¸

ao dos espac¸os de cor.

3.4.5 Classiﬁcadores EDSR

Os classiﬁcadores EDSR, apesar de n

ao apresentarem a melhor classiﬁcac¸

ao, t

em um de-

sempenho satisfat

orio e apresentam um uso muito reduzido de recursos de m

aquina. O classi-

ﬁcador EDSR Kovac apresenta uma taxa de acerto baixa, mas

e similar as taxas dos classiﬁ-

cadores probabil

ısticos para a mesma taxa de erro. Esse dado pode ser observado nas curvas

ROC. Classiﬁcadores EDSR prezam pela taxa de acerto, ou seja, s

ao conservadores.

A tabela 5 mostra os resultados dos classiﬁcadores EDSR. O classiﬁcador proposto por Ko-

vac, Peer e Solina (2003) apresentou os melhores resultados utilizando o espac¸o RGB.

Tabela 5: Valores de TPR e FPR para os classiﬁcadores EDSR para os espac¸os de cor espec

ıﬁcos.

Classiﬁcador EDSR TPR FPR

Kovac - RGB 0,465194 0,0269292

Garcia - YCbCr 0,325298 0,0727721

3.5 DISCUSS

OES

A cor da pele

e uma caracter

ıstica visual muito atrativa para se trabalhar com detecc¸

ao de

pele, pois a segmentac¸

ao utilizando a cor tem um processamento r

apido e robusto.

Os classiﬁcadores que utilizam modelos de pele n

ao-param

etricos obtiveram melhores taxas

de acerto e erro para os espac¸os de cor ortogonais (YCbCr e CbCr). Isso reforc¸a a hip

otese de

que eles sejam os espac¸os de cor

otimos para a segmentac¸

ao de pele. A grande variedade de

etnias e condic¸

oes de iluminac¸

ao leva o compaqDB a ser um banco de dados

util para se tra-

balhar com a segmentac¸

ao de pele, mesmo com as deﬁci

encias de informac¸

ao sobre a condic¸

espec

ıﬁca de cada imagem.

A utilizac¸

ao de espac¸os de cor 2D onde

e suprimida a componente de lumin

ancia (direta ou

indiretamente) trouxe benef

ıcios no processamento e recursos de m

aquina. Al

em disso, quando

retirada a componente de lumin

ancia as taxas de desempenho se mantiveram relativamente as

mesmas. Observou-se que existe certa independ

encia entre canais de cor para espac¸os de cor

ortogonais, haja vista que quando comparados os resultados gerados pelo classiﬁcador Jones

& Rehg e na

ıve Bayes, esses s

ao semelhantes. Os resultados obtidos pelo classiﬁcador na

ıve

Bayes mostraram que existe uma maior correlac¸

ao entre as componentes de cor para os espac¸os

de cor n

ao ortogonais, pois nesses casos as taxas de desempenho do classiﬁcador na

ıve Baye

quando comparadas com o classiﬁcador Jones & Rehg foram mais baixas.

Os classiﬁcadores param

etricos obtiveram resultados que levaram a questionar a func¸

densidade de probabilidade da cor de pele. A partir de valores espec

ıﬁcos de limiar as curvas

ROC comec¸am a n

ao obedecer a tend

encia esperada, como notado pelo comportamento irregu-

lar da curva ROC. Isso mostra que

areas de pele nos espac¸os de cor n

ao fazem intersecc¸

ao com

as supostas distribuic¸

oes param

etricas: Gaussianas ou a mistura de 7 Gaussinas. Mais estudos

ao necess

arios para averiguar se existe um n

umero de Gaussianas que seja

otimo para cada

espac¸o de cor. Ainda

e poss

ıvel tentar modelar as distribuic¸

oes atrav

es de outras distribuic¸

oes

param

etricas.

Apesar da cor ser considerada a melhor caracter

ıstica para ser utilizada para detectar pele,

somente com a informac¸

ao contida na cor n

ao se pode aumentar as taxas de acerto e erro, haja

vista que para o mesmo m

etodo probabil

ıstico, independente da transformac¸

ao feita as taxas

variam pouco. Logo, existe a necessidade de se adicionar informac¸

ao caso se queira aumentar

estas taxas. Outras sa

ıdas que podem ser utilizadas para a detecc¸

ao de pixels de pele s

ao a

informac¸

ao de cor da vizinhanc¸a dos pixels, misturar informac¸

oes entre espac¸os de cor, textura

de regi

oes de pele e o conhecimento sobre as taxas de acerto e erro para cada um dos m

etodos

utilizados.

Como o objetivo maior desse trabalho

e detectar conte

udo ofensivo, a detecc¸

ao de pixels de

pele n

ao necessita ser a mais precisa. Entretanto, as informac¸

oes que ser

ao retiradas das regi

oes

encontradas t

em que apresentar informac¸

oes suﬁcientes para classiﬁcar o conte

udo como ofen-

sivo ou n

ao.

Apesar da literatura ter apontado que a iluminac¸

e um fator de erro para os algoritmos de

classiﬁcac¸

ao, n

ao se pode conﬁrmar essa aﬁrmativa sem devidos estudos sobre a relac¸

ao entre

a iluminac¸

ao ambiente, espac¸os de cor e taxas de acerto e erro. A interfer

encia da iluminac¸

ambiente nas taxas de classiﬁcac¸

ao dos m

etodos utilizados na presente pesquisa s

ao melhor

estudados no cap

ıtulo 4.

4 EFEITOS DA ILUMINAC¸

AO AMBIENTE

A iluminac¸

ao ambiente

e constantemente citada na literatura como sendo o maior problema

na segmentac¸

ao de pixels de pele (ST

ORRING, 2004). Por consequ

encia foi proposto um

estudo relacionando a iluminac¸

ao ambiente e a detecc¸

ao de pixels de pele. O objetivo desse

estudo

e veriﬁcar se existe um espac¸o de cor que apresente melhores taxas de acerto e erro para

diferentes tipos de iluminac¸

ao ambiente.

O estudo da iluminac¸

ao foi realizado da seguinte forma: separac¸

ao das imagens conforme

os tipos de iluminac¸

ao, aplicac¸

ao dos m

etodos e an

alise das taxas TPR e FPR por tipo de

iluminac¸

ao. Para tal foram aplicados os m

etodos descritos no cap

ıtulo 3 aos seis espac¸os de cor

deﬁnidos e a quatro tipos de iluminac¸

ao ambiente.

Devido ao fato do banco CompaqDB utilizado nas experi

encias de segmentac¸

ao de pixels de

pele n

ao apresentar informac¸

oes da iluminac¸

ao ambiente para a realizac¸

ao do estudo proposto

foi necess

aria a criac¸

ao de um novo banco de imagens contendo as informac¸

ao de iluminac¸

necess

arias a respeito de cada imagem adicionada ao banco. O banco de imagens criado foi

chamando de skinDB.

4.1 BANCO DE IMAGENS ESTRUTURADO - SKINDB

Com o intuito de se estudar melhor a segmentac¸

ao de pele, foi criado um banco de dados

estruturado e contendo metadados. Chamado de skinDB, o banco de imagens gerou publicac¸

oes

(KUIASKI et al., 2008, 2009) e

e composto atualmente por 120 imagens igualmente distribu

ıdas

entre quatro iluminac¸

oes ambiente: sol, sombra, incandescente e ﬂuorescente. As imagens

capturadas s

ao de volunt

arios de diversas etnias e de partes espec

ıﬁcas do corpo humano, como

de ante-brac¸os, costas e m

aos. Assim como o compaqDB, o skinDB apresenta m

ascaras de pele

manualmente geradas para cada uma das 120 imagens do banco, formando, assim, o padr

ao-

ouro de pele para o banco. Todas as imagens est

ao codiﬁcadas no padr

ao JPEG, fotos digitais,

e os par

ametros das c

ameras foram mantidos os mesmos. Exemplos de imagens do skinDB sob

diferentes iluminac¸

oes podem ser vistas na ﬁgura 8.

(a)

(b)

Figura 8: Imagens do banco skinDB: (a) Imagem na luz ﬂuorescente ; (b) Imagem na luz incan-

descente; (c) Imagem na sombra; (d) Imagem na luz do sol.

O banco skinDB

e aberto e est

a dispon

ıvel juntamente com os respectivos metadados em:

http://www.labiem.cpgei.cefetpr.br/Members/diogo

Quando foi feita a proposta de disponibilizar publicamente o banco, a intenc¸

ao era chamar

novos pesquisadores a utiliz

a-lo e atualiz

a-lo. Por atualizar o banco entende-se facilitar a in-

clus

ao de novas imagens, deixar o banco mais estruturado e com isso incentivar as pesquisas

sobre segmentac¸

ao de pixels de pele. Pensando nisso foram propostas formas de acrescen-

tar mais informac¸

oes al

em da iluminac¸

ao ambiente. At

e o presente momento, as informac¸

oes

referem-se a dados do indiv

ıduo que est

a presente na imagem e algumas estat

ısticas sobre a cor

da regi

ao de pele da imagem. A t

ecnica utilizada para armazenar informac¸

oes a respeito das

imagens foi a anotac¸

ao de imagens (KUIASKI et al., 2008).

4.1.1 Anotac¸

ao das Imagens

Esse m

etodo prev

e a adic¸

ao de informac¸

oes n

ao pictoriais a imagens, como por exem-

plo a forma de algum objeto na imagem, o nome desse objeto, classe sem

antica ou qualquer

informac¸

ao que seja relevante ao estudo feito. A anotac¸

ao de imagens pode ser tanto autom

atica

quanto manual. Para o skinDB, as informac¸

oes foram manualmente inseridas, pois fazem parte

do padr

ao-ouro.

As metainformac¸

oes inseridas no skinDB foram armazenadas utilizando eXtensible Markup

Languange - Linguagem de marcac¸

ao extens

ıvel (XML). Para facilitar a escrita e leitura das im-

agens do banco, desenvolveu-se um aplicativo chamado skinChooser. O aplicativo apresenta a

visualizac¸

ao reduzida da imagem e uma s

erie de campos a serem preenchidos, os quais comt

as metainformac¸

oes referentes a uma imagem.

As metainformac¸

oes que s

ao propostas no presente trabalho s

ao listadas na ﬁgura 9, a qual

mostra que cada elemento image apresenta os atributos id, type e url, que s

ao respectivamente

o n

umero de identiﬁcac¸

ao no banco, a que classe pertence a imagem, e o Uniform resource

locator - Localizador uniforme de recursos (URL) da imagem. Dentro do elemento de imagem,

os elementos ﬁlename, dateIdCreation, width e height, n

ao possuem ﬁlhos e representam, re-

spectivamente, o nome do arquivo, data de criac¸

ao e dimens

oes da imagem em pixels.

<width>

<skin>

<eyes>

<hair>

<age>

<roi>

<StdX0>

<stdXn>

<mask>

<light>

<model>

<brand>

<flash>

<image>

Root

Element

<db>

Attributes:

¨id¨, ¨type¨, ¨url¨

Attribute:

¨url¨

Attribute:

¨units¨

Figura 9: Diagrama em

arvore XML desenvolvido.

Fonte: (KUIASKI et al., 2008)

Outros elementos de mesmo n

ıvel hier

arquico que apresentam ﬁlhos s

ao respons

aveis pelas

demais informac¸

oes relevantes da imagem. Em camera

e poss

ıvel armazenar as informac¸

oes de

dist

ancia (distance), presenc¸a de ﬂash (ﬂash), modelo (model) e marca da c

amera (brand). Den-

tro de environment

e onde se encontram as informac¸

oes sobre a iluminac¸

ao ambiente ambient

e light que s

ao respectivamente o tipo de ambiente e a iluminac¸

ao do mesmo. Para ambi-

ent sugere-se que contenham um dos seguintes valores: indoor (ambientes fechados) ou out-

door (ambientes abertos). O elemento light apresenta como valores um dos quatro tipos de

iluminac¸

ao ambiente utilizados no presente estudo.

O elemento subject apresenta informac¸

oes sobre o indiv

ıduo do qual a imagem fora cap-

turada. Dentre os campos ali presentes est

ao bodyPart e skin, nos quais s

ao armazenadas a parte

do corpo presente na foto e a cor de pele do indiv

ıduo. Neste

ultimo sugere-se a utilizac¸

ao das

seguintes categorias: white, light brown, dark brown ou asiatic.

Por ﬁm, no elemento feature podem ser anotadas caracter

ısticas de cor m

edia e o desvio

padr

ao dos pixels de pele contidos em regi

oes ora representadas por m

ascaras bin

arias ora por

uma Region of interest - Regi

ao de interesse (ROI) retangular. Os elementos respons

aveis por

armazenar as informac¸

oes de cor m

edia e desvio padr

ao s

ao respectivamente meanX e stdX,

onde X

e o espac¸o de cor representado. O elemento roi apresenta as coordenadas dessa regi

retangular, enquanto o elemento mask armazena a localizac¸

ao e nome da imagem utilizada como

padr

ao-ouro (GT). Ambos os elementos roi e mask n

ao s

ao mutuamente excludentes, entretanto

e altamente recomendado que pelo menos um seja completado.

4.2 ILUMINAC¸

AO AMBIENTE

A escolha dos tipos de iluminac¸

ao foi feita observando quais s

ao os ambientes mais cor-

riqueiros que cont

em pessoas. A escolha das iluminac¸

oes foi arbitr

aria e ainda est

a sujeita a

mudanc¸as. Entretanto, como o resultado do estudo mostra que h

a variac¸

ao na cor de pele ocorre

para os ambientes escolhidos, estes servem bem ao prop

osito. A variac¸

ao da cor de pele em

fotos tiradas sob as quatro condic¸

oes de iluminac¸

ao pode ser vista na ﬁgura 8, na qual todas as

imagens pertencem ao mesmo indiv

ıduo.

No presente trabalho foram utilizadas quatro formas de iluminac¸

ao ambiente: sol (sun),

sombra (shadow), incandescente (incandescent) e ﬂuorescente (ﬂuorescent). As imagens per-

tencentes tanto sob a iluminac¸

ao do sol quanto sob sombra foram retiradas em ambientes aber-

tos, ou ambientes outdoor, enquanto para as outras duas iluminac¸

oes as fotos foram capturadas

em ambientes fechados, ou ambientes indoor.

A metodologia utilizada na captura das imagens realizada em ambientes abertos foi cap-

turar imagens em diversos hor

arios do dia sob a iluminac¸

ao direta ou indireta da luz solar,

iluminac¸

oes sob sol e sombra respectivamente. A captura das imagens para ambientes fechados

foi feita a partir do tipo de l

ampada presente no ambiente, ﬂuorescente ou incandescente.

4.3 M

ETODOS UTILIZADOS

Por quest

ao de coer

encia foram utilizados alguns dos classiﬁcadores apresentados no cap

ıtu-

lo 3. S

ao eles o classiﬁcador na

ıve Bayes, Jones & Rehg, MoG e por simples Gaussiana.

Os classiﬁcadores EDSR n

ao foram utilizados no teste por n

ao apresentarem ﬂexibilidade de

variac¸

ao nos par

ametros que os comp

oem, pois as comparac¸

oes s

ao feitas utilizando curvas

ROC e o

unico resultado compar

avel gerado pelos EDSR

e um

unico ponto no plano TPR×FPR.

A etapa de gerac¸

ao dos modelos foi feita utilizando a selec¸

ao CompaqDBeasy500, pois

o banco cont

em uma grande diversidade de imagens de diversas etnias e sob as mais diver-

sas iluminac¸

oes ambiente. Manter o modelo de pele gerado pela CompaqDBeasy500, e n

reconstruir um novo a partir de parte do skinDB, tem como objetivo n

ao utilizar um modelo

tendencioso de cor de pele.

4.4 RESULTADOS

Os resultados que s

ao mostrados nesta sec¸

ao s

ao, exclusivamente, curvas ROC discrimi-

nadas por classiﬁcador e por iluminac¸

ao. Entretanto, antes de entrar no m

erito da avaliac¸

dos efeitos da iluminac¸

ao na classiﬁcac¸

ao de pele,

e abordado o desempenho geral dos classiﬁ-

cadores para o banco skinDB.

A avaliac¸

ao foi feita utilizando todas as imagens do banco skinDB para os quatro classiﬁ-

cadores (Jones & Rehg, na

ıve Bayes, MoG e simples Gaussiana) e para todos os seis espac¸os

de cor (RGB, RG normalizado, HSI, HS, YCbCr e CbCr), apresentados anteriormente. As ﬁg-

uras 10 e 11 mostram as curvas ROC obtidas para o classiﬁcador Jones & Rehg e as obtidas

para o classiﬁcador na

ıve Bayes. As ﬁguras 12 e 13 mostram as curvas ROC obtidas para o

classiﬁcador MoG e as obtidas para o classiﬁcador por simples Gaussiana.

As avaliac¸

oes gerais dos classiﬁcadores mostradas nas ﬁguras 10, 11, 12 e 13 indicam que,

na maioria dos casos, espac¸os de cor bidimensionais apresentam melhores resultados, ou seja,

que somente a informac¸

ao de cromin

ancia

e suﬁciente para classiﬁcar pixels de pele. Os mel-

hores resultados foram obtidos para os espac¸os de cor RG normalizado e HS para o classiﬁcador

Jones & Rehg, e HSI e HS para o na

ıve Bayes. Os resultados ora apresentados quando com-

parados com os resultados obtidos por outros pesquisadores, como para Phung, Bouzerdoum e

Chai (2005) e Jones e Rehg (2002), parecem contradit

orios, pois para esses pesquisadores os

espac¸os de cor tridimensionais atingiram melhores resultados que os bidimensionais em todos

os pontos da curva ROC. Uma hip

otese para essas discrep

ancias

e que o banco skinDB

e rel-

0 0.05 0.1 0.15 0.2 0.25 0.3

0.3

0.4

0.5

0.6

0.7

0.8

0.9

FPR

TPR

cbcr

hsi

rgb

ycbcr

Figura 10: Curvas ROC para o classiﬁcador Jones & Rehg para todos os espac¸os de cor citados.

0 0.05 0.1 0.15 0.2 0.25 0.3

0.3

0.4

0.5

0.6

0.7

0.8

0.9

FPR

TPR

cbcr

hsi

rgb

ycbcr

Figura 11: Curvas ROC para o classiﬁcador na

ıve Bayes para todos os espac¸os de cor citados.

ativamente pequeno, especialmente feito com imagens adquiridas de forma controlada com o

prop

osito de estudar segmentac¸

ao de pele.

Outro resultado importante, retirado a partir das curvas ROC do classiﬁcador Jones & Rehg,

0 0.2 0.4 0.6 0.8

0.75

0.8

0.85

0.9

0.95

FPR

TPR

cbcr

hsi

rgb

ycbcr

Figura 12: Curvas ROC para o classiﬁcador MoG para todos os espac¸os de cor citados.

0 0.2 0.4 0.6 0.8

0.55

0.6

0.65

0.7

0.75

0.8

0.85

0.9

0.95

FPR

TPR

cbcr

hsi

rgb

ycbcr

Figura 13: Curvas ROC para o classiﬁcador por simples Gaussiana para todos os espac¸os de cor

citados.

est

a no fato de que todos os espac¸os de cor tridimensionais obtiveram resultados similares

(ﬁgura 10). Isso indica que n

ao h

a perda signiﬁcativa de informac¸

ao pela transformac¸

ao do

espac¸o RGB para outro espac¸o tridimensional, como esperado.

Quando s

ao analisadas as curvas do classiﬁcador na

ıve Bayes, o

unico espac¸o de cor que

mantem resultados semelhantes aos encontrados para o classiﬁcador Jones & Rehg

e o HS

(ﬁgura 11), enquanto que para o HSI os resultados foram melhores. Tais resultados para os

espac¸os HS e HSI podem ser explicados pois esses espac¸os apresentam uma alta independ

encia

entre as componentes de cor, ou seja, a probabilidade de um pixel corresponder

a classe pele

ao depende da probabilidade total, mas somente das probabilidades independentes de cada

componente de cor. Entretanto, comparando os resultados do HS e HSI com os resultados

obtidos no cap

ıtulo 3, para os mesmos classiﬁcadores, pode-se aﬁrmar que o banco skinDB

ainda n

ao apresenta a mesma diversidade de cores de pele do compaqDB, haja visto que para o

compaqDB a independ

encia entre canais n

ao ocorreu para esses espac¸os de cor.

Algo semelhante ocorre com os espac¸os de cor YCbCr e CbCr. Os resultados s

ao piores

do que os encontrados para o classiﬁcador Jones & Rehg, mas as curvas permanecem pr

oximas

uma da outra, o que nos leva a concluir que existe uma independ

encia entre os canais do YCbCr

e que a componente Y n

ao afeta signiﬁcativamente o resultado. Finalmente, os resultados para

o espac¸o RGB mostram que esse apresenta uma alta correlac¸

ao entre os canais de cor como

esperado dada a total dissimilaridade entre as curvas ROC, diferentemente do que foi observado

para o HSI e o YCbCr.

A avaliac¸

ao dos classiﬁcadores param

etricos

e um pouco diferenciada. Sem muitas variac¸

oes

entre os resultados para diferentes espac¸os de cor e para os mesmos valores de FPR tanto o clas-

siﬁcador MoG (ﬁgura 12) como o por simples Gaussiana (ﬁgura 13) apresentam valores mais

elevados de TPR. Isto se deve muito ao banco skinDB, o qual n

ao cont

em toda a variac¸

ao de

cores de pele que est

a presente no banco CompaqDB. Com uma quantidade reduzida de cores

e poss

ıvel mais facilmente classiﬁc

a-las nos modelos mais complexos gerados pela CompaqD-

Beasy500. O classiﬁcador MoG nos espac¸o de cor HSI e HS obtiveram os piores resultados,

embora tenham obtido melhores resultados quando feita a an

alise de todo o banco CompaqDB.

A an

alise dos resultados foi dividida por classiﬁcador e por iluminac¸

ao ambiente. Primeira-

mente, a inﬂu

encia da iluminac¸

e analisada para o classiﬁcador Jones & Rehg, cujos resulta-

dos est

ao nas ﬁguras 14 e 15. Ap

os,

e analisada a inﬂu

encia da iluminac¸

ao para o classiﬁcador

ıve Bayes, cujo os resultados est

ao nas ﬁguras 16 e 17. Igualmente, os resultados para o clas-

siﬁcador MoG e por simples Gaussiana est

ao nas ﬁguras 18 e 19 e 20 e 21, respectivamente.

4.4.1 Classiﬁcador Jones & Rehg

Os resultados do classiﬁcador Jones & Rehg para diferentes iluminac¸

oes evidencia que

espac¸os de cor tridimensionais atingem melhores taxas de classiﬁcac¸

ao para uma faixa de val-

ores de FPR pr

oxima da origem. Para valores de FPR menores que 5% e sob as iluminac¸

oes

sol e incandescente, espac¸os de cor tridimensionais apresentam melhores resultados do que

espac¸os de cor bidimensionais. Entretanto, se for admiss

ıvel uma FPR maior, espac¸os de cor

bidimensionais s

ao uma melhor escolha. Sob a iluminac¸

ao sombra o mesmo acontece, mas

para um valor menor de FPR (aproximadamente 2,5%). As curvas ROC dos espac¸os de cor

tridimensionais, independentemente da iluminac¸

ao, continuam similares.

Para as imagens na luz do sol os resultados (ﬁgura 14 - esquerda) mostram que o espac¸o

de cor CbCr apresenta os melhores resultados para essa iluminac¸

ao, 86% TPR para 10% FPR.

A iluminac¸

ao da luz do sol apresentou os resultados mais divergentes, especialmente para o

espac¸o de cor RG normalizado e para o HS. Os resultados divergentes podem ser inﬂu

encia do

hor

ario do dia em que foram feitas as imagens, pois a composic¸

ao de cores muda pelo efeito

de refrac¸

ao da luz solar na atmosfera. Como por exemplo a ocorr

encia de sombra nas imagens

devida ao

angulo de incid

encia da luz, o que pode ser visto na ﬁgura 8.

Os melhores resultados do trabalho foram obtidos para o classiﬁcador Jones & Rehg sob a

iluminac¸

ao sombra (ﬁgura 14 - direita). Todos os espac¸os de cor utilizados atingiram valores

de TPR maiores de 95% para valores de FPR inferiores a 2,5%. Acredita-se que essas taxas

se devem

a pouca inﬂu

encia do controle de equil

ıbrio de branco (white balance) da c

amera na

iluminac¸

ao sombra, conservando a cor da pele.

0 0.05 0.1 0.15 0.2 0.25 0.3

0.3

0.4

0.5

0.6

0.7

0.8

0.9

FPR

TPR

cbcr

hsi

rgb

ycbcr

0 0.05 0.1 0.15 0.2 0.25 0.3

0.6

0.65

0.7

0.75

0.8

0.85

0.9

0.95

FPR

TPR

cbcr

hsi

rgb

ycbcr

Figura 14: Curvas ROC para o classiﬁcador Jones & Rehg utilizando imagens em ambientes aber-

tos: (esquerda) sol e (direita) sombra.

As imagens adquiridas na luz incandescente (ﬁgura 15 - direita) obtiveram resultados entre

os obtidos sob a sombra e os sob luz solar. A hip

otese de que o equil

ıbrio de branco autom

atico

da c

amera altera signiﬁcativamente as cores da imagem

e reforc¸ada, pois a luz incandescente

tem um espectro semelhante ao da luz solar, entretanto de menor intensidade e por esta raz

pode ser respons

avel pelas alterac¸

oes nas taxas TPR e FPR.

Os melhores resultados de classiﬁcac¸

ao, 92,5% TPR para 10% FPR, para a luz incandes-

cente foram conseguidos utilizando o espac¸o CbCr. Para o estudo da inﬂu

encia da iluminac¸

optou-se por ﬁxar o valor de FPR em 10%, pois os resultados do skinDB s

ao signiﬁcativamente

melhores que os encontrados para o CompaqDB e reduzindo o valor de comparac¸

ao a variac¸

de TPF

e maior.

0 0.05 0.1 0.15 0.2 0.25 0.3

0.3

0.4

0.5

0.6

0.7

0.8

0.9

FPR

TPR

cbcr

hsi

rgb

ycbcr

0 0.1 0.2 0.3 0.4 0.5

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

FPR

TPR

cbcr

hsi

rgb

ycbcr

Figura 15: Curvas ROC para o classiﬁcador Jones & Rehg utilizando imagens em ambientes fecha-

dos: (esquerda) ﬂuorescente e (direita) incandescente.

A tabela 6 resume as taxas de classiﬁcac¸

ao obtidas para o classiﬁcador Jones & Rehg para

todas as iluminac¸

oes e espac¸os de cor. Nessa tabela foi ﬁxado o valor de FPR em 10%.

Tabela 6: Valores de TPR em porcentagem do classiﬁcador Jones & Rehg para 10% de FPR

Sol Sombra Incandescente Fluorescente

RGB 76,3% 96,5% 86,3% 75,5%

RG 52,1% 99,6% 85,2% 92,1%

HSI 76,5% 96,5% 86,3% 75,5%

HS 54,7% 99,5% 84,7% 87,0%

YCbCr 75,5% 96,4% 85,6% 75,5%

CbCr 87,1% 99,0% 91,9% 77,3%

4.4.2 Classiﬁcador na

ıve Bayes

O classiﬁcador sup

oe que as componentes de cor s

ao estatisticamente independentes umas

das outras. Apesar de se saber que, na maioria dos casos, a independ

encia estat

ıstica n

se mant

em, o classiﬁcador foi utilizado para investigar qual espac¸o de cor apresenta uma

maior independ

encia estat

ıstica entre as componentes. Isso economiza recursos computacionais

(mem

oria e processamento) e pode mostrar para qual espac¸o de cor pode-se retirar a compo-

nente de lumin

ancia sem que sejam alteradas as taxas de detecc¸

ao.

Como aﬁrmado anteriormente, os canais do espac¸o RGB s

ao os que apresentam a maior

depend

encia entre as componentes de cor. Esse efeito pode ser visto no desempenho do classi-

ﬁcador na

ıve Bayes como mostram as ﬁguras 16 - esquerda e 17 - esquerda, nas quais o espac¸o

de cor RGB obteve as menores taxas de acerto. Por raz

oes ainda desconhecidas, sob luz ﬂuo-

rescente o espac¸o de cor RGB apresenta resultados relativamente bons em relac¸

ao aos demais

espac¸os de cor, como mostra a ﬁgura 17 - direita. Entretanto, no geral os resultados para luz

ﬂuorescente s

ao piores do que para outros tipos de iluminac¸

ao.

0 0.05 0.1 0.15 0.2 0.25 0.3

0.3

0.4

0.5

0.6

0.7

0.8

0.9

FPR

TPR

cbcr

hsi

rgb

ycbcr

0 0.05 0.1 0.15 0.2 0.25 0.3

0.3

0.4

0.5

0.6

0.7

0.8

0.9

FPR

TPR

cbcr

hsi

rgb

ycbcr

Figura 16: Curvas ROC para o classiﬁcador na

ıve Bayes utilizando imagens em ambientes abertos:

(esquerda) sol e (direita) sombra.

0 0.05 0.1 0.15 0.2 0.25 0.3

0.3

0.4

0.5

0.6

0.7

0.8

0.9

FPR

TPR

cbcr

hsi

rgb

ycbcr

0 0.05 0.1 0.15 0.2 0.25 0.3

0.3

0.4

0.5

0.6

0.7

0.8

0.9

FPR

TPR

cbcr

hsi

rgb

ycbcr

Figura 17: Curvas ROC para o classiﬁcador na

ıve Bayes utilizando imagens em ambientes fecha-

dos: (esquerda) incandescente e (direita) ﬂuorescente.

Para as imagens obtidas na luz solar (ﬁgura 16 - esquerda), os melhores resultados foram

atingidos pelos espac¸os de cor HSI, HS e RG normalizado, atingindo 90% TPR para 20% FPR.

Na sombra (ﬁgura 16 - direita), os resultados foram similares aos obtidos para o classiﬁ-

cador Jones & Rehg, com a excec¸

ao do espac¸o RGB., atingindo taxas de acerto maiores que

95% para taxas de erro inferiores a 5% para o classiﬁcador na

ıve Bayes. Pde se dizer que

pelo fato do RGB apresentar resultados inferiores a todos os outros espac¸os de cor, este espac¸o

apresenta uma grande correlac¸

ao estat

ıstica entre canais.

A tabela 7 resume os valores de TPR obtidos para FPR ﬁxo em 10% para todos os espac¸os

de cor e condic¸

oes de iluminac¸

ao utilizados nesse trabalho para o classiﬁcador na

ıve Bayes.

Tabela 7: Valores em porcentagem de TPR para o classiﬁcador na

ıve Bayes para 10% de FPR

Sol Sombra Incandescente Fluorescente

RGB 23,3% 42,9% 45,5% 77,4%

RG 36,2% 95,2% 43,4% <20%

HSI 71,5% 99,5% 85,2% 42,9%

HS 54,5% 99,8% 74,2% 44,4%

YCbCr 42,4% 99,6% 88,9% 26,0%

CbCr 41,4% 99,5% 89,0% 75,3%

4.4.3 Classiﬁcador MoG

No caso do classiﬁcador MoG. as curvas para as iluminac¸

oes sob a sombra e sob a luz

incandescente foram consistentes com os resultados encontrados para os outros classiﬁcadores

e pouca diferenc¸a foi encontrada entre os resultados para os diferentes espac¸os de cor. Os

resultados do classiﬁcador MoG para as diferentes iluminac¸

oes pode ser visto nas ﬁguras 18 e

19.

0 0.2 0.4 0.6 0.8 1

0.86

0.88

0.9

0.92

0.94

0.96

0.98

FPR

TPR

cbcr

hsi

rgb

ycbcr

0 0.1 0.2 0.3 0.4 0.5

0.4

0.5

0.6

0.7

0.8

0.9

FPR

TPR

cbcr

hsi

rgb

ycbcr

Figura 18: Curvas ROC para o classiﬁcador MoG utilizando imagens em ambientes abertos: (es-

querda) sol e (direita) sombra.

Nas curvas ROC que representam as iluminac¸

oes ﬂuorescente e sol fogem do padr

ao encon-

trado para outros classiﬁcadores desse trabalho. Entretanto quando comparamos os resultados

encontrados para o skinDB com os do CompaqDB pode-se observar que a anomalia citada

no cap

ıtulo 3 para os espac¸os HSI e HS n

ao se mant

em para o skinDB.

E poss

ıvel que as

0 0.2 0.4 0.6 0.8

0.7

0.75

0.8

0.85

0.9

0.95

FPR

TPR

cbcr

hsi

rgb

ycbcr

0 0.2 0.4 0.6 0.8 1

0.4

0.5

0.6

0.7

0.8

0.9

FPR

TPR

cbcr

hsi

rgb

ycbcr

Figura 19: Curvas ROC para o classiﬁcador MoG utilizando imagens em ambientes fechados:

(esquerda) incandescente e (direita) ﬂuorescente.

distribuic¸

oes densidade de probabilidade do skinDB sejam melhor representadas pelo modelo

criado pelo classiﬁcador MoG. Apesar as curvas irregulares, as curvas ROC para o classiﬁcador

MoG apresentam tanto taxas de acerto quanto taxas de erro muito elevadas quando compara-

das a dos classiﬁcadores Jones & Rehg, na

ıve Bayes e com os pr

oprios classiﬁcadores quando

analisadas as imagens do banco CompaqDB.

Para as imagens adquiridas na luz solar (ﬁgura 18 - esquerda), os melhores resultados foram

atingidos pelos espac¸os de cor YCbCr, CbCr e RGB, atingindo mais de 95% TPR para 20%

FPR. Na sombra (ﬁgura 18 - direita), os resultados foram os melhores resultados de todos os

testes realizados, superando at

e mesmo os resultados do classiﬁcador Jones & Rehg.

A tabela 8 resume os valores de TPR (10% FPR) obtidos para todos os espac¸os de cor e

condic¸

oes de iluminac¸

ao utilizados nesse trabalho para o classiﬁcador MoG.

Tabela 8: Valores em porcentagem de TPR para o classiﬁcador MoG para 10% de FPR

Sol Sombra Incandescente Fluorescente

RGB 99,5% 99,5% 94,0% 97,0%

RG 88,0% 99,1% 94,0% 99,0%

HSI 92,0% 99,8% 90,0% 98,0%

HS 90,5% 99,2% 94,5% 96,0%

YCbCr 95,5% 99,4% 93,5% 95,5%

CbCr 91,0% 99,8% 93,0% 97,5%

4.4.4 Classiﬁcador por Simples Gaussiana

O classiﬁcador por simples Gaussiana n

ao apresentou resultados semelhantes a nenhum dos

classiﬁcadores estudados. Apesar disso,

e poss

ıvel ver que a estranha anomalia na curva ROC

encontrada na an

alise dos resultados para todas as imagens do skinDB para esse classiﬁcador

reduzida sob a sombra (ﬁgura 20 - direita). Analisando as curvas pode-se notar que as curvas

do CbCr apresentam melhores resultados, o que leva a aﬁrmar que a distribuic¸

ao de pixels de

pele do o skinDB para o espac¸o CbCr seja a mais pr

oxima de uma Gaussiana.

0 0.2 0.4 0.6 0.8 1

0.2

0.4

0.6

0.8

FPR

TPR

cbcr

hsi

rgb

ycbcr

0 0.1 0.2 0.3 0.4 0.5

0.4

0.5

0.6

0.7

0.8

0.9

FPR

TPR

cbcr

hsi

rgb

ycbcr

Figura 20: Curvas ROC para o classiﬁcador simples Gaussiana utilizando imagens em ambientes

abertos: (esquerda) sol e (direita) sombra.

0 0.05 0.1 0.15 0.2 0.25 0.3

0.3

0.4

0.5

0.6

0.7

0.8

0.9

FPR

TPR

cbcr

hsi

rgb

ycbcr

0 0.2 0.4 0.6 0.8 1

0.2

0.4

0.6

0.8

FPR

TPR

cbcr

hsi

rgb

ycbcr

Figura 21: Curvas ROC para o classiﬁcador simples Gaussiana utilizando imagens em ambientes

fechados: (esquerda) incandescente e (direita) ﬂuorescente.

4.5 DISCUSS

OES

Apesar da cor de pele ser uma caracter

ıstica muito atrativa para a segmentac¸

ao de pixels de

pele, os efeitos da iluminac¸

ao apresentam forte inﬂu

encia sobre esses m

etodos de segmentac¸

ao.

As condic¸

oes de iluminac¸

ao e o controle de equil

ıbrio de branco (white balance) da c

amera

alteram a cor de pele adquirida pelo sensor da c

amera, o que levou a se investigar qual espac¸o

de cor minimizaria os efeitos no desempenho da classiﬁcac¸

ao. Um ponto importante sobre

o banco

e que para nenhuma imagem foi desabilitado o controle de equil

ıbrio de branco da

amera. Acredita-se que tal fato possa ter gerado algumas variac¸

oes nas taxas de classiﬁcac¸

ao.

Os experimentos feitos mostram que espac¸os de cor bidimensionais (RG norma., HS e

CbCr) em geral apresentam melhores resultados descartando as informac¸

oes de lumin

ancia e

por consequ

encia reduzindo efeitos da iluminac¸

ao. Os resultados dos espac¸os bidimension-

ais mostram que a utilizac¸

ao de somente informac¸

ao de cromin

ancia

e suﬁciente para uma

classiﬁcac¸

ao de pixels de cor razoavelmente boa. No geral o melhor classiﬁcador

e o por sim-

ples Gaussiana, para o espac¸o de cor CbCr para o skinDB. O melhor resultado geral se mostrou

muito diferente dos encontrados para o CompaqDB, levando a concluir que o skinDB ainda n

cont

em toda a variedade de cores do CompaqDB.

Entretanto, mesmo ap

os analisar seis espac¸os de cor, n

ao foi poss

ıvel identiﬁcar um que

tenha as melhores taxas de acerto para todas as iluminac¸

oes. Outros espac¸os de cor devem

ser testados para que se comprove a exist

encia de um espac¸o

otimo para a detecc¸

ao de pixels

de pele. Aqueles resultados para os classiﬁcadores de modelos param

etricos que foram muito

bons devem ser olhados com desconﬁanc¸a. O banco skinDB, apesar de terem sido tomados

os devidos cuidados para manter a diversidade de imagens, ainda

e pequeno e provavelmente

tendencioso na escolha das imagens e na composic¸

ao de cor de pele.

Pesquisas futuras s

ao necess

arias para esclarecer resultados contradit

orios entre os experi-

mentos do presente trabalho e os de outros (PHUNG; BOUZERDOUM; CHAI, 2005; JONES;

REHG, 2002). Trabalhos futuros incluem melhorar o banco de imagens skinDB utilizando out-

ros par

ametros de controle, como o controle de equil

ıbrio de branco da c

amera, tipo de fundo

nas fotos, identiﬁcac¸

ao an

onima das pessoas fotografadas e dist

ancia da c

amera. Esse cen

ario

mais controlado pode contribuir para deixar mais marcante quais variac¸

oes afetam mais a cor

de pele.

Algoritmos de const

ancia de cores (FINLAYSON; SCHIELE; CROWLEY, 1998) tamb

devem ser pesquisados com o intuito de tentar aproximar as cores a um modelo pr

oximo do

observado na iluminac¸

ao sombra, isso pois tal iluminac¸

ao obteve os melhores resultados para

todos os modelos e espac¸os de cor.

5 DETECC¸

AO DE CONTE

UDO OFENSIVO

O presente trabalho teve como proposta estudos sobre a detecc¸

ao de conte

udo ofensivo e

consequente an

alise da viabilidade da criac¸

ao de um aplicativo para tal. Dentre os estudos de

detecc¸

ao de conte

udo, foram realizadas an

alises estat

ısticas de m

etodos de CBIR e de conjunto

de caracter

ısticas. A detecc¸

ao de conte

udo ofensivo foi feita sobre as imagens do CompaqDB

separadas por conte

udo, a selec¸

ao compaqDBContent. Foram extra

ıdas caracter

ısticas de cada

uma das imagens e o vetor de caracter

ısticas

e aplicado a um classiﬁcador. Os modelos de

conte

udo s

ao montados com 20% do total de vetores de caracter

ısticas e sobre os outros 80%

ao aplicados os classiﬁcadores e geradas as estat

ısticas de acerto e erro. O diagrama em blocos

desse procedimento pode ser visto na ﬁgura 22.

CompaqDBContent

Remoção do

plano de fundo

Remoção do

plano de fundo

Extração das

características

Extração das

características

20%

80%

Construção do

Modelo

- c4.5

- AdaBoost

- RBFNN

Aplicação do

Modelo

teste e avaliação

Figura 22: Diagrama do procedimento feito para o estudo da detecc¸

ao de conte

udo ofensivo.

Antes da extrac¸

ao de caracter

ısticas

e feita a remoc¸

ao do plano de fundo sobre todas as

imagens da selec¸

ao compaqDBContent. A remoc¸

ao do plano de fundo

e uma t

ecnica que tem

como objetivo restringir a cena a ac¸

ao exercida por pessoas. Feita a remoc¸

ao do plano de fundo

e feita extrac¸

ao do vetor de caracter

ısticas e armazenamento das informac¸

oes em um arquivo

Comma Separated Values - Valores separados por v

ırgulas (CSV). Nesse arquivo cada vetor

de caracter

ısticas

e acompanhado pelo nome da classe a qual pertence, o conjunto de vetores

gera o padr

ao-ouro para a detecc¸

ao de conte

udo. Tanto a remoc¸

ao do plano de fundo quanto a

extrac¸

ao de algumas caracter

ısticas

e feita sobre um mapa de pele. Para gerar o mapa de pele, o

etodo de segmentac¸

ao de pele utilizado para gerar mapas de pele foi o classiﬁcador Jones &

Rehg para o espac¸o RGB com limiar de 0,11.

5.1 CONJUNTO DE CARACTER

ISTICAS

O conjunto de caracter

ısticas foi escolhido durante os estudos do trabalho de Shih, Lee e

Yang (2007). Esses autores prop

oem uma abordagem utilizando a remoc¸

ao do plano de fundo e

descritores de cor, textura e forma. Os descritores usados pertencem

as normas MPEG-7 (MAN-

JUNATH, 2002). O descritor de cor utilizado foi o descritor escal

avel de cor, o de textura foi

o descritor histograma de bordas e o de forma foi descritor de compactac¸

ao. Al

em dessas car-

acter

ısticas foram incorporadas as dimens

oes da imagem e a projec¸

ao das regi

oes de pele na

horizontal e vertical. Maiores detalhes s

ao apresentados nas subsec¸

oes a seguir.

5.1.1 Remoc¸

ao do Plano de Fundo

O objeto de interesse em imagens de conte

udo ofensivo s

ao pessoas, raz

ao pela qual

e feita a

remoc¸

ao do plano de fundo. Esse m

etodo tenta abstrair o cen

ario e concentrar o reconhecimento

da cena nas pessoas da imagem e nas ac¸

oes que elas estejam executando.

A remoc¸

e feita sobre o mapa de pele de uma imagem submetida a segmentac¸

ao de pixels

de pele pelo classiﬁcador Jones & Regh. Sobre o mapa

e aplicado o operador morfol

ogico da

abertura, para agrupar os pixels de pele, ent

ao o mapa

e dividido em blocos de 32 ×32 pixels.

Se a quantidade de pixels de pele de cada bloco for maior do que 50% do n

umero de pixels total

do bloco, esse

e considerado um bloco de pele. Feito isso, a maior regi

ao conectada de blocos

de pele

e considerada como sendo a regi

ao de interesse. A imagem resultante da remoc¸

ao do

plano de fundo

e a formada pelo menor ret

angulo capaz de englobar toda a regi

ao de interesse.

Caso a imagem seja menor que 64 ×64 pixels, ou seja o dobro do tamanho do bloco, ou o

umero de regi

oes de pele seja inferior a dois, n

e executada a remoc¸

ao do plano de fundo. A

extrac¸

ao das caracter

ısticas

e feita sobre a imagem inteira.

5.1.2 Descritor Escal

avel de Cor

O Scalable Colour Descriptor - Descritor escal

avel de cor (SCD)

e um histograma de cor

de dimens

oes vari

aveis. Ou seja, cada componente de cor ser

a quantizada novamente em um

umero menor que 256 posic¸

oes, ou 8 bits. O grande m

erito do m

etodo

e que as componentes

ao precisam necessariamente apresentar a mesma quantizac¸

ao, logo o tamanho do vetor do

descritor SCD

e vari

avel. Esse tipo de abordagem traz benef

ıcios para a detecc¸

ao de conte

udo,

pois pode-se dar mais import

ancia a uma determinada componente de cor, a qual mais se dis-

crimina no contexto da detecc¸

ao.

No detector de conte

udo ofensivo s

ao utilizados os espac¸os de cor RGB, HSI e YCbCr para

formar o SCD. O vetor resultante

e composto por 256 ou 512 posic¸

oes em diferentes escalas.

As escalas utilizadas servem para a avaliac¸

ao da inﬂu

encia do espac¸o de cor na detecc¸

ao de

conte

udo e a proporc¸

ao entre canais de cor para esse trabalho podem ser (4:4:4) e (16:4:4).

A distribuic¸

ao entre cores foi colocada de forma que a cor mais discriminante em imagens de

conte

udo ofensivo fosse a cor de pele, a qual cont

em uma quantidade maior de vermelho na

composic¸

ao. O histograma

e global e feito para a imagem ap

os a remoc¸

ao do plano de fundo.

O vetor sdc resultante

e dado na seguinte forma:

sdc = [s[1],s[2],...,s[n]],

onde s[i], i ∈[1,n]

e a probabilidade da componente de cor i e n o n

umero de posic¸

oes do vetor.

5.1.3 Descritor Histograma de Bordas

As normas MPEG-7 descrevem o Edge Histogram Descriptor - Descritor histograma de

bordas (EHD) como sendo um descritor de textura. O histograma

e constru

ıdo dividindo as

bordas entre cinco categorias. As categorias dizem respeito a orientac¸

ao da borda: vertical,

horizontal, 45 graus, 135 graus e demais bordas.

As bordas s

ao detectadas sobre a imagem em tons de cinza gerada pela m

edia dos 3 canais

de cor e utilizando o algoritmo de Sobel (GONZALEZ; WOODS, 2006). Ap

os feita a detecc¸

de bordas sobre a imagem, essa

e igualmente dividida em 16 sub-imagens retangulares e n

sobrepostas. Cada uma das sub-imagens gera um histograma de cinco posic¸

oes, para gerar um

histograma de uma sub-imagem

e necess

ario dividir novamente cada sub-imagem, cada nova

divis

e conhecida como blocos de imagem. O tamanho de cada bloco de imagem depende

do tamanho total da imagem em quest

ao. As normas MPEG-7 recomendam que o n

umero de

blocos seja pr

oximo a 1100 para que se tenha um boa descric¸

ao de textura. O algoritmo de

Sobel

e aplicado a imagem antes da divis

ao, mas para facilitar a visualizac¸

ao das divis

oes em

sub-imagens e os blocos de imagem

e mostrado na ﬁgura 23 como foi realizado o processo

sobre o mapa de pele. Cada bloco de imagem

e tratado como sendo uma matriz 2 ×2 de super

pixels e a formac¸

ao dos super pixels gera um valor no histograma de bordas. A ﬁgura 24 mostra

quais formac¸

oes da matriz de super pixels pertencem a quais caracter

ısticas.

2 3 4

6 7 8

10 11 12

13 14 15 16

(a)

(b)

(c)

(d)

Figura 23: Imagem dividida em 16 sub-imagens, cada sub-imagem dividida em blocos e para cada

bloco feita a matriz de super pixels.

(a)

(b)

(c)

(d)

Figura 24: Matrizes de super-pixels: (a) borda horizontal; (b) borda vertical; (c) borda a 45 graus

e (d) borda a 135 graus.

Para facilitar a implementac¸

ao, haja visto que as dimens

oes de cada imagem s

ao diferentes,

os super-pixels foram ﬁxados no tamanho 4 ×4 pixels. Logo, o n

umero de blocos de imagem

vari

avel e em torno de 400 devido ao tamanho m

edio das imagens do banco CompaqDB.

O histograma para cada sub-imagem representa caracter

ısticas locais. Para melhor repre-

sentar a imagem foram adicionados ao ﬁnal do vetor de caracter

ısticas mais cinco valores que

representam o histograma de bordas global da imagem. O vetor ehd resultante

e dados na

seguinte forma:

ehd = [g

[1],g

[2],.. .,g

[5],g

[1],g

[2],.. .,g

[5],ge[1],g

[2],.. .,ge[5]],

onde g

[i], j ∈ [1, 16] e i ∈ [1,5],

e a quantidade de bordas na posic¸

ao i para sub-imagem j. O

descritor global

e ge[i].

5.1.4 Descritor de Compactac¸

O Compactness Descriptor - Descritor de compactac¸

ao (CD) mede a distribuic¸

ao espacial

de regi

oes de interesse em uma imagem, nesse caso regi

oes de pele. O objetivo desse descritor

e representar a forma com que as pessoas aparecem na cena. O descritor

e calculado sobre o

mapa de pele resultante da imagem sem o plano de fundo.

Os valores do descritor s

ao calculados tomando o n

umero de pixels de pele de uma regi

da imagem e dividindo pelo n

umero total de pixels dessa regi

ao. As regi

oes s

ao em n

umero de

21. A primeira regi

ao consiste da imagem inteira, para as demais regi

oes a imagem

e dividida

em quatro e 16 regi

oes iguais e n

ao sobrepostas, como mostra a ﬁgura 25. O vetor CD

e dado

por:

cd = [c[1],c[2],...,g[21]],

onde c[i], i ∈ [1,21],

e a

area relativa ao tamanho da regi

ao i.

2 3

8 9

10 11

15 16 17

Figura 25: Imagem dividida para o calculo do descritor de Compactac¸

ao.

5.1.5 Projec¸

oes de Pele

Alguns autores da literatura utilizaram como caracter

ıstica o maior n

umero de pixels de pele

conectados. Foi proposta uma abordagem parecida para buscar essa caracter

ıstica, chamada de

projec¸

oes de pele, que consiste de histogramas para linhas e colunas contendo o n

umero de

blocos de pele.

O mapa de pele, ap

os feita a remoc¸

ao do plano de fundo,

e dividido em 100 sub-imagens

retangulares e n

ao sobrepostas. Se o n

umero de pixels de pele de uma sub-imagem for maior

que 50% do total de pixels, a sub-imagem

e considerada como contendo pele. O descritor

calculado somando o n

umero de sub-imagens de pele contidos em cada linha e armazenando o

valor em um vetor h, como mostra a ﬁgura 26. O mesmo

e feito para cada coluna e o resultado

e armazenado no vetor v. Concatenando os dois vetores obt

em-se a projec¸

ao de pele na forma

de um vetor proj:

proj = [h[1],h[2],. ..,h[10],v[1],v[2], ... ,v[10]],

onde h[i] e v[i], i ∈ [1, 10], s

ao a quantidade de blocos de pele na i-

esima divis

ao horizontal ou

vertical, respectivamente.

0 0 2 3 6 9 8 8 4 2

Figura 26: Imagem dividida para o calculo das projec¸

oes de pele.

5.2 ALGORITMOS DE CLASSIFICAC¸

Foram aplicados tr

es m

etodos de classiﬁcac¸

ao para a detecc¸

ao de conte

udo ofensivo. Para

tal, foi utilizado o software Waikato Environment for Knowledge Analysis - Ambiente de

Waikato para a an

alise de conhecimento (WEKA) que possui implementados os mais diver-

sos algoritmos de agrupamento (clustering) e classiﬁcac¸

ao existentes na literatura. No presente

trabalho foram utilizados os algoritmos de classiﬁcac¸

ao C4.5 (J48), AdaBoost (AdaBoost.M.1)

e Bagging.

5.2.1 C4.5

O C4.5

e um m

etodo de criac¸

ao de

arvores de decis

ao, que utiliza a m

axima entropia de

Shannon para separar cada valor dos vetores de caracter

ısticas entre as classes (QUINLAN,

1996). O referido algoritmo segue o mesmo princ

ıpio para a construc¸

ao da

arvore de decis

que o ID3, desenvolvido por Quinlan (1996).

O modelo

e constru

ıdo para um banco de dados conhecido e previamente classiﬁcado (GT),

S = S

,.. .,S

, onde S

e o i-

esimo vetor de caracter

ısticas e n

e o n

umero de vetores de

caracter

ısticas. Cada vetor S

e formado por m caracter

ısticas, S

= X

,.. .,X

, onde X

uma caracter

ıstica representada por um n

umero real. A cada vetor S est

a associada uma classe,

que para esse trabalho s

ao duas: conte

udo ofensivo e conte

udo n

ao-ofensivo.

Para todos os atributos de todos os vetores de caracter

ısticas de uma classe

e calculada a

entropia de Shannon e para o atributo que apresenta o menor valor de entropia

e criado um n

arvore de decis

ao. A implementac¸

ao utilizada nesse trabalho para o classiﬁcador C4.5 foi a

J48 presente no WEKA.

5.2.2 AdaBoost

Abreviac¸

ao de Adaptative Boosting (impuls

ao adaptativa) o algoritmo AdaBoost utiliza

varias inst

ancias ponderadas de um classiﬁcador fraco para gerar um classiﬁcador robusto

(FREUND; SCHAPIRE, 1997). O classiﬁcador fraco

e um classiﬁcador que sozinho n

ao ex-

ecuta bem a separac¸

ao entre as classes. Entretanto quando utilizado em conjunto com outros

classiﬁcadores ou repetidas vezes, classiﬁcador robusto, consegue melhorar os resultados de

classiﬁcac¸

ao. Para construir o modelo AdaBoost o classiﬁcador fraco foi utilizado repetidas

vezes sobre o padr

ao-ouro. Para cada vetor de caracter

ıstica do banco de dados utilizado na

construc¸

ao do modelo

e aplicado o classiﬁcador em sendo o resultado uma falsa classiﬁcac¸

ao,

o peso desse vetor de caracter

ısticas

e incrementado para forc¸ar uma classiﬁcac¸

ao correta.

Repetidas vezes se aplica o classiﬁcador fraco no conjunto de dados, e a cada vez s

incrementados os valores dos pesos. Ao ﬁnal da s

erie de aplicac¸

oes do classiﬁcador fraco tem-

se uma func¸

ao distribuic¸

ao de probabilidade das quais as amostras do espac¸o de caracter

ısticas

ao mais prov

aveis que sejam de outra classe daquela em que foram classiﬁcadas.

O classiﬁcador fraco utilizado

e o de Regression Tree -

Arvore de regress

ao (REPTree)

(BREIMAN, 1996). Tamb

em presente no WEKA, a

arvore de regress

e um classiﬁcador em

forma de

arvore de decis

ao semelhante ao C4.5 utilizando ao inv

es da entropia a vari

ancia para

a separac¸

ao dos n

os.

5.2.3 Bagging

Bagging, ou bootstrap agregating,

e uma t

ecnica para melhorar as taxas de acur

acia e es-

tabilidade de um classiﬁcador (BREIMAN, 1996). Da estat

ıstica bootstraping

e um m

etodo

utilizado para realizar infer

encias estat

ısticas. A infer

encia

e feita calculando par

ametros, como

a vari

ancia, para v

arios sub-conjuntos das observac¸

oes. Cada sub-conjunto

e formado por re-

amostragens das observac¸

oes, buscando padr

oes de distribuic¸

oes. Esse m

etodo pode se aplicado

para reconhecimento de padr

oes, ent

ao, surge o classiﬁcador Bagging.

ecnicas de Bagging s

ao usualmente utilizadas com classiﬁcadores de

arvores de decis

ao.

A partir do banco de dados utilizado s

ao criados v

arios outros bancos contendo amostras do

banco original. Cada novo banco cont

em um n

umero diferente de amostras que podem se

repetir, para enfatizar as caracter

ısticas mais marcante ou menosprezar as menos marcantes.

Sobre cada novo banco

e constru

ıdo um classiﬁcador. Amostras a serem classiﬁcadas s

expostas a todos os classiﬁcadores fracos e a maioria absoluta dos resultados para todos os

classiﬁcadores

e a classe

a qual pertence o novo dado de entrada. O mesmo classiﬁcador fraco

utilizado pelo AdaBoost foi utilizado para o classiﬁcador Bagging.

5.3 RESULTADOS E DISCUSS

OES

Foram feitos 14 testes para cada classiﬁcador, seis diferentes vetores SCD e quatro composi-

c¸

oes do vetor de caracter

ısticas. Os vetores de caracter

ısticas utilizados foram criados concate-

nando os descritores citados na sec¸

ao 5.1. As quatro composic¸

oes s

ao:

1. [ehd, cd, dimens

oes da imagem];

2. [ehd, cd, dimens

oes da imagem, projec¸

oes de pele];

3. [ehd, scd, cd, dimens

oes da imagem];

4. [ehd, scd, cd, dimens

oes da imagem, projec¸

oes de pele];

As diferentes variac¸

oes do vetor de caracter

ısticas SCD foram feitas utilizando os espac¸os

de cor RGB, HSI e YCbCr, cada qual com duas escalas de cor: (8:8:8) e (16:4:4). Para o YCbCr

utilizou-se a escala (4:4:16), ao inv

es da (16:4:4), para reforc¸ar a cor vermelha, a qual representa

melhor a pele de pessoas em uma cena. Para a an

alise dos resultados

e feita a associac¸

ao da

composic¸

ao ao n

umero descrito acima. Por exemplo a composic¸

ao 1

e a [ehd, cd, dimens

oes da

imagem] e assim por diante at

e a composic¸

ao 4.

Durante os estudos para a escolha dos classiﬁcadores foram realizados experimentos a re-

speito da segmentac¸

ao de pele. Para esse estudo utilizou-se o classiﬁcador de pele Jones &

Rehg para alguns valores de limiar. A segmentac¸

ao de pele tem inﬂu

encia sobre a detecc¸

ao de

conte

udo ofensivo, mas ela podem ser minimizadas se as taxas de erro estiverem no intervalo

de 0,05 at

e 0,15.

Para o classiﬁcador C4.5 foram obtidos os piores resultados. A tabela 9 mostra os valores

de predic¸

ao positiva (VPP) e sensibilidade (Sens.) para o classiﬁcador C4.5. Esses valores s

calculados para cada classe.

Entre as composic¸

oes utilizadas para o classiﬁcador C4.5 o melhor resultado foi obtido para

a composic¸

ao 1, a tabela 10 mostra quantas imagens utilizadas para teste (80% da selec¸

ao Com-

paqDBContent) foram corretamente classiﬁcadas. Aparentemente a classiﬁcac¸

ao de conte

udo

Tabela 9: Valores de predic¸

ao positiva e sensibilidade para o classiﬁcador C4.5 utilizando todas as

composic¸

oes do vetor de varacter

ısticas

Conte

udo Ofensivo Conte

udo n

ao-Ofensivo

Composic¸

ao Espac¸o de cor VPP Sens. VPP Sens.

1 sem o SCD 0,736 0,748 0,736 0,723

2 sem o SCD 0,721 0,755 0,734 0,698

3 RGB (8:8:8) 0,702 0,689 0,685 0,699

RGB (16:4:4) 0,692 0,681 0,676 0,687

HSI (8:8:8) 0,688 0,673 0,670 0,685

HSI (16:4:4) 0,696 0,654 0,664 0,705

YCbCr (8:8:8) 0,699 0,717 0,700 0,682

YCbCr (4:4:16) 0,727 0,699 0,701 0,729

4 RGB (8:8:8) 0,721 0,755 0,734 0,698

RGB (16:4:4) 0,721 0,755 0,734 0,698

HSI (8:8:8) 0,721 0,755 0,734 0,698

HSI (16:4:4) 0,721 0,755 0,734 0,698

YCbCr (8:8:8) 0,721 0,755 0,734 0,698

YCbCr (4:4:16) 0,721 0,755 0,734 0,698

ofensivo

e mais suscet

ıvel a descritores geom

etricos e de textura. Descritores de cor n

ao apre-

sentam melhorias nos valores de VPP e sensibilidade.

Tabela 10: Matriz de confus

ao para o melhor resultado do classiﬁcador C4.5, composic¸

ao 1

Classiﬁcac¸

Conte

udo Ofensivo Conte

udo n

ao-Ofensivo

Padr

ao-ouro Conte

udo Ofensivo 820 276

Conte

udo n

ao-Ofensivo 294 768

O classiﬁcador C4.5 na composic¸

ao 1 atingiu um total de acerto de 73,6% das imagens e

26,4% de imagens incorretamente classiﬁcadas. Diferentemente dos valores relatados na liter-

atura, os resultados obtidos ﬁcaram abaixo dos 90% de acerto. Pelos resultados pr

oximos em

termos de VPP e sensibilidade tanto para o C4.5, quanto para o AdaBoost leva a concluir que as

caracter

ısticas retirada das imagens n

ao s

ao condizentes com as imagens do banco CompaqDB.

Os resultados obtidos utilizando o AdaBoost foram melhores que os obtidos para o C4.5.

A tabela 11 mostra os valores VPP e sensibilidade para o classiﬁcador AdaBoost.

O melhor resultado encontrado para o classiﬁcador AdaBoost foi utilizando a composic¸

3 utilizando o espac¸o de cor RGB (8:8:8) para o SCD. A tabela 12 mostra o n

umero de imagens

classiﬁcadas corretamente e incorretamente para cada uma das classes. Para o classiﬁcador

AdaBoost utilizando a composic¸

ao 3, RGB (8:8:8), o n

umero de imagens corretamente classiﬁ-

cadas aumenta para 74,2%. Apesar do aumento, as taxas de classiﬁcac¸

ao continuam parecidas

umas com as outras. Ent

ao, o aumento na quantidade de imagens corretamente classiﬁcadas

deve-se ao classiﬁcador e n

as caracter

ısticas utilizadas.

Tabela 11: Valores de predic¸

ao positiva e sensibilidade para o classiﬁcador AdaBoost utilizando

todas as composic¸

oes do vetor de varacter

ısticas

Conte

udo Ofensivo Conte

udo n

ao-Ofensivo

Composic¸

ao Espac¸o de cor VPP Sens. VPP Sens.

1 sem o SCD 0,778 0,673 0,704 0,802

2 sem o SCD 0,752 0,728 0,728 0,752

3 RGB (8:8:8) 0,763 0,715 0,724 0,77

RGB (16:4:4) 0,756 0,725 0,728 0,758

HSI (8:8:8) 0,747 0,739 0,733 0,741

HSI (16:4:4) 0,759 0,749 0,745 0,755

YCbCr (8:8:8) 0,761 0,685 0,705 0,778

YCbCr (4:4:16) 0,761 0,716 0,724 0,767

4 RGB (8:8:8) 0,752 0,728 0,728 0,752

RGB (16:4:4) 0,752 0,728 0,728 0,752

HSI (8:8:8) 0,752 0,728 0,728 0,752

HSI (16:4:4) 0,752 0,728 0,728 0,752

YCbCr (8:8:8) 0,752 0,728 0,728 0,752

YCbCr (4:4:16) 0,752 0,728 0,728 0,752

Tabela 12: Matriz de confus

ao para o melhor resultado do classiﬁcador AdaBoost, composic¸

ao 3

utilizando o SCD RGB (8:8:8)

Classiﬁcac¸

Conte

udo Ofensivo Conte

udo n

ao-Ofensivo

Padr

ao-ouro Conte

udo Ofensivo 784 312

Conte

udo n

ao-Ofensivo 244 818

Os melhores resultados foram obtidos para o classiﬁcador Bagging utilizando a composic¸

3, YCbCr (4:4:16). Para esse classiﬁcador o descritor de cor aumentou um pouco os valores de

VPP e sensibilidade, como pode-se observar na tabela 13.

O n

umero de imagens correta e incorretamente classiﬁcadas para o classiﬁcador Bagging

para o melhor caso, s

ao mostradas na tabela 14. O n

umero de imagens corretamente classiﬁ-

cadas correspondem a 77,16% das imagens do banco.

5.4 DISCUSS

OES

Conforme os resultados obtidos, as caracter

ısticas mais marcantes em detecc¸

ao de conte

udo

ofensivo parecem ser caracter

ısticas geom

etricas, pois os resultados para todos os classiﬁ-

cadores utilizados no presente trabalho mostram que a cor auxilia pouco na detecc¸

ao. As

projec¸

oes de pele tamb

em auxiliam pouco e em certos casos, como para o classiﬁcador C4.5,

Tabela 13: Valores de predic¸

ao positiva e sensibilidade para o classiﬁcador Bagging utilizando

todas as composic¸

oes do vetor de varacter

ısticas

Conte

udo Ofensivo Conte

udo n

ao-Ofensivo

Composic¸

ao Espac¸o de cor VPP Sens. VPP Sens.

1 sem o SCD 0,762 0,769 0,760 0,752

2 sem o SCD 0,757 0,782 0,767 0,741

3 RGB (8:8:8) 0,768 0,756 0,752 0,764

RGB (16:4:4) 0,752 0,804 0,782 0,727

HSI (8:8:8) 0,744 0,768 0,752 0,727

HSI (16:4:4) 0,748 0,756 0,745 0,736

YCbCr (8:8:8) 0,760 0,784 0,769 0,745

YCbCr (4:4:16) 0,759 0,806 0,786 0,736

4 RGB (8:8:8) 0,757 0,782 0,767 0,741

RGB (16:4:4) 0,757 0,782 0,767 0,741

HSI (8:8:8) 0,757 0,782 0,767 0,741

HSI (16:4:4) 0,757 0,782 0,767 0,741

YCbCr (8:8:8) 0,757 0,782 0,767 0,741

YCbCr (4:4:16) 0,757 0,782 0,767 0,741

Tabela 14: Matriz de confus

ao para o melhor resultado do classiﬁcador Bagging, composic¸

ao 3

utilizando o SCD YCbCr (4:4:16)

Classiﬁcac¸

Conte

udo Ofensivo Conte

udo n

ao-Ofensivo

Padr

ao-ouro Conte

udo Ofensivo 883 213

Conte

udo n

ao-Ofensivo 280 782

atrapalham a classiﬁcac¸

ao. Mesmo assim, a informac¸

ao contida nas projec¸

oes de pele n

ao rep-

resenta bem ac¸

oes de pessoas nas imagens.

O melhor classiﬁcador foi o Bagging com a composic¸

ao 3, ou seja, sem projec¸

oes de pele e

com descritor de cor RGB (8:8:8). Dar prefer

encia

a cor vermelha no descritor de cor n

ao obteve

melhoria nos resultados. Apesar da cor n

ao trazer melhorias signiﬁcativas nos resultados, os

melhores foram encontrados para descritores de cor igualmente escalados e utilizando o espac¸o

de cor RGB.

Os resultados encontrados na presente pesquisa apresentam valores abaixo dos encontrados

na literatura. O melhor resultado de classiﬁcac¸

ao foi de 72% para imagens de conte

udo ofensivo

e 77% para imagens sem conte

udo ofensivo. Na literatura os resultados de classiﬁcac¸

ao para

conte

udo ofensivo e n

ao-ofensivo s

ao respectivamente de: 99,54% e 83,49% para Shih, Lee e

Yang (2007); 79,3% e 88,7% para Fleck, Forsyth e Bregler (1996); e 85,8% e 92,5% para Jones

e Rehg (1999). Especula-se que a diferenc¸a entre valores se deve principalmente ao vetor de

caracter

ısticas e ao banco de dados utilizados em cada um dos trabalhos citados. Um modelo

otimo de detecc¸

ao de conte

udo ofensivo ainda n

ao foi encontrado.

Como trabalho futuro, a presente pesquisa de detecc¸

ao de conte

udo ofensivo deve se apro-

fundar no estudo de descritores geom

etricos e em descritores que indiquem as quantidades de

blocos de pele conectados. Descritores de cor podem ser

uteis em outras func¸

oes na detecc¸

de conte

udo ofensivo, tais como avaliac¸

ao do plano de fundo ou discriminac¸

ao atrav

es de cores

incomuns nas cenas.

6 CONCLUS

OES

6.1 SEGMENTAC¸

AO DE PELE

A cor

e uma boa caracter

ıstica para a segmentac¸

ao de pixels de pele. Sem a necessidade

de t

ecnicas complexas e muitos recursos computacionais, um simples vetor de dois ou tr

es ele-

mentos pode segmentar pixels de pele. Para o classiﬁcador Jones & Rehg o espac¸o de cor CbCr

apresenta uma classiﬁcac¸

ao equivalente

a obtida com espac¸os de tr

es dimens

oes. Para o mesmo

classiﬁcador, espac¸os de tr

es dimens

oes apresentaram resultados semelhantes, mostrando que

ao h

a perda de informac¸

ao nas transformac¸

oes de espac¸os de cor.

A distribuic¸

ao de probabilidade da cor de pele pode ser aproximada para uma Gaussiana

para os espac¸os YCbCr e CbCr, mas n

ao para os demais. Entretanto, n

ao se pode aﬁrmar que

a distribuic¸

ao densidade de probabilidade de cor de pele n

ao seja param

etrica, pois o n

umero

de observac¸

oes apesar de muito elevado n

ao abrange todos os casos poss

ıveis, o que justiﬁcaria

descartar a ideia de uma distribuic¸

ao param

etrica.

Para aumentar as taxas de classiﬁcac¸

ao de pele

e necess

ario que seja agregada mais informa-

c¸

a cor de um pixel. Segundo os autores que defendem a segmentac¸

ao de pele atrav

es de

regi

oes e n

ao apenas pixels (JEDYNAK; ZHENG; DAOUDI, 2003), a pele em imagens digitais

aparece conectada em grandes blocos. Isso foi veriﬁcado ao se estudar os trabalhos de detecc¸

de conte

udo ofensivo, onde a remoc¸

ao do plano de fundo

e feita sobre os maiores blocos de pele

conectados. Uma abordagem para aumentar as taxas de classiﬁcac¸

ao est

a em utilizar juntamente

com a cor do pixel outras informac¸

oes, como cor dos pixels da vizinhanc¸a e textura de pele.

6.2 ILUMINAC¸

AO AMBIENTE E BANCO DE DADOS CONTROLADO

A iluminac¸

ao ambiente inﬂuencia, e muito, a segmentac¸

ao de pixels de pele. O controle

de equil

ıbrio de branco do dispositivo de aquisic¸

e outro fator que tem inﬂu

encia na cor de

pele. Como os algoritmos no presente trabalho utilizam a classiﬁcac¸

ao pixel-a-pixel, n

ao h

a a

informac¸

ao necess

aria para corrigir a cor antes da classiﬁcac¸

ao.

O banco de dados controlado foi utilizado nos estudos sobre a iluminac¸

ao ambiente e taxas

de classiﬁcac¸

ao. Os resultados encontrados n

ao poderiam ter sido encontrados sem as imagens

do banco skinDB, apesar do mesmo apresentar relativamente menos imagens que o CompaqDB

e de necessitar de mais vari

aveis a serem controladas.

6.3 DETECC¸

AO DE CONTE

UDO OFENSIVO

Foram estudadas as mais populares metodologias para a detecc¸

ao de conte

udo ofensivo. O

melhor conjunto de caracter

ısticas citado na literatura foi implementado e testado para alguns

algoritmos de classiﬁcac¸

ao, mas os resultados n

ao foram similares aos relatados para nenhum

algoritmo de classiﬁcac¸

ao. Especula-se que tais diverg

encias se devem, principalmente, ao

banco de dados que foi utilizado, indicando a possibilidade de que a detecc¸

ao seja altamente

inﬂuenciada pelo banco que est

a sendo estudado.

Para comparar resultados de uma forma n

ao polarizada

e necess

ario criar um padr

ao de

conte

udo ofensivo. Esse padr

ao pode ser um banco de imagens pr

oprio para que v

arios pesquisadores

possam usar de refer

encia e com um padr

ao-ouro que tenha sido aprovado por v

arios obser-

vadores. Dessa forma, seria minimizada a chance de obtenc¸

ao de resultados polarizados inad-

vertidamente.

O fato dos tr

es classiﬁcadores resultarem em desempenhos similares entre si leva a concluir

que as caracter

ısticas n

ao s

ao as melhores para descrever o conte

udo do banco compaqDB. Os

trabalhos encontrados na literatura apresentam, cada qual, diferentes vetores de caracter

ısticas,

etodos de classiﬁcac¸

ao e banco de dados. Sem um banco de dados padr

ao ou um estudo de

caso mais espec

ıﬁco, conclus

oes sobre a detecc¸

ao de conte

udo ofensivo devem ser feitas com

cautela sob pena de se fazer uma generalizac¸

ao incorreta.

A comparac¸

ao entre o m

etodo proposto no presente trabalho com o trabalho de Jones e

Rehg (1999) pode ser feita pois foi utilizado o mesmo banco de dados em ambos os casos. As

caracter

ısticas utilizadas por Jones e Rehg (1999) s

ao melhores para demostrar o conte

udo ofen-

sivo no banco CompaqDB especiﬁcamente. Apesar do banco CompaqDB ser um padr

ao para

detecc¸

ao de conte

udo ofensivo, cont

em certas peculiaridades que s

ao tendenciosas ao conjunto

de caracter

ısticas utilizado pelos autores Jones e Rehg (1999), tais proporc¸

ao de blocos de pele

em relac¸

ao ao tamanho da imagem e pessoas em primeiro plano.

6.4 TRABALHOS FUTUROS

6.4.1 Segmentac¸

ao de Pele

Para a sequ

encia do estudo de segmentac¸

ao de pele prop

oe-se a busca de um espac¸o de cor

oprio para a segmentac¸

ao de pele, haja vista que a cor de pele

e um subconjunto espec

ıﬁco

de cores. Ainda, deve-se buscar uma transformac¸

ao que n

ao seja dependente de um banco

de dados para treino e que apresente as mesmas taxas TPR e FPR para modelos diferentes.

Isso

e poss

ıvel se forem analisadas as propriedades f

ısicas da luz utilizada como iluminante e

quantizadas devidamente em um espac¸o de cor pr

oprio.

O efeito da iluminac¸

ao pode ser reduzido obtendo informac¸

oes sobre a distribuic¸

ao de cores

da imagem e atrav

es dessa informac¸

ao fazer a correc¸

ao das cores para que seja mantido o

padr

ao da cor de pele. Foram testados, preliminarmente, algoritmos de correc¸

ao da const

ancia

de cor (FINLAYSON; SCHIELE; CROWLEY, 1998) para o classiﬁcador Jones & Rehg, mas

ainda sem sucesso. Logo, mais pesquisas devem ser feitas para comprovar a efetividade da

correc¸

ao de cor.

Prop

oe-se buscar outras caracter

ısticas, al

em da cor para a segmentac¸

ao de pele. A textura,

os alguns estudos preliminares, mostrou-se capaz de detectar certas regi

oes de pele em ima-

gens em tons de cinza. Um trabalho poss

ıvel de ser feito

e de unir a segmentac¸

ao atrav

es de cor

com a segmentac¸

ao por textura na tentativa de aumentar as taxas TPR, reduzindo as taxas FPR.

6.4.2 Iluminac¸

ao Ambiente e Banco de Dados Controlado

O banco de dados controlado skinDB ainda apresenta poucas imagens e precisa ter mais

vari

aveis controladas. Entre as vari

aveis est

ao: aumentar o n

umero de imagens, fazer controle

das cores do plano de fundo, fotografar utilizando iluminac¸

oes de v

arias cores de composic¸

conhecida e conhecer a dist

ancia da c

amera para a foto, al

em de desabilitar controle autom

atico

do equil

ıbrio de branco do dispositivo de captura.

6.4.3 Detecc¸

ao de Conte

udo Ofensivo

Para se realizar uma comparac¸

ao mais apropriada, deve-se fazer uma pesquisa que compare

etodos da literatura utilizando o mesmo banco de dados. Com o mesmo banco de dados, difer-

entes classiﬁcadores e diferentes conjuntos de caracter

ısticas podem ser comparados atrav

es dos

valores de VPP e sensibilidade. Nesse cen

ario seria poss

ıvel indicar qual classiﬁcador e qual

conjunto de caracter

ısticas expressa melhor o conte

udo ofensivo.

Com o objetivo de aumentar as taxas de acerto e superar as encontradas na literatura, novas

caracter

ısticas devem ser pesquisadas. Realizar a detecc¸

ao de faces e reconhecimento de feic¸

oes

podem representar bem caracter

ısticas para a detecc¸

ao de conte

udo ofensivo.

REFER

ENCIAS

ALBIOL, A.; TORRES, L.; DELP, E. J. Optimum color spaces for skin detection. In: Interna-

tional Conference on Image Processing. [S.l.: s.n.], 2001. v. 1, p. 122–124.

BREIMAN, L. Bagging predictors. Machine Learning, Kluwer Academic Publishers, Hing-

ham, MA, USA, v. 24, p. 123–140, August 1996. ISSN 0885-6125.

CAETANO, T.; BARONE, D. A probabilistic model for the human skin color. In: Proceedings

of the 11th International Conference on Image Analysis and Processing. [S.l.: s.n.], 2001.

p. 279–283.

FAWCETT, T. ROC Graphs: Notes and Practical Considerations for Researchers. 2004.

Dispon

ıvel em: <http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.10.9777>. Acesso

em: 8 de maio de 2009.

FINLAYSON, G. D.; SCHIELE, B.; CROWLEY, J. L. Comprehensive colour image normal-

ization. In: ECCV ’98: Proceedings of the 5th European Conference on Computer Vision-

Volume I. London, UK: Springer-Verlag, 1998. p. 475–490. ISBN 3-540-64569-1.

FLECK, M.; FORSYTH, D.; BREGLER, C. Finding naked people. In: European Conference

on Computer Vision. [S.l.]: Springer-Verlag, 1996. v. 2, p. 592–602.

FREUND, Y.; SCHAPIRE, R. E. A decision-theoretic generalization of on-line learning and

an application to boosting. Journal of Computer and System Science, Academic Press, Inc.,

Orlando, FL, USA, v. 55, n. 1, p. 119–139, 1997. ISSN 0022-0000.

GARCIA, C.; TZIRITAS, G. Face detection using quantized skin color regions merging and

wavelet packet analysis. In: IEEE Transactions on Multimedia. [S.l.: s.n.], 1999. p. 264–277.

ISSN 1520-9210.

GONZALEZ, R. C.; WOODS, R. E. Digital Image Processing (3rd Edition). Upper Saddle

River, NJ, USA: Prentice-Hall, Inc., 2006. ISBN 013168728X.

HAMMAMI, M.; CHAHIR, Y.; CHEN, L. Webguard: A web ﬁltering engine combining tex-

tual, structural, and visual content-based analysis. IEEE Transactions on Knowledge and

Data Engineering, IEEE Educational Activities Department, Piscataway, NJ, USA, v. 18, n. 2,

p. 272–284, 2006. ISSN 1041-4347.

HU, W. et al. Recognition of pornographic web pages by classifying texts and images. IEEE

Transactions on Pattern Analysis and Machine Intelligence, IEEE Computer Society, Wash-

ington, DC, USA, v. 29, p. 1019–1034, June 2007. ISSN 0162-8828.

JAYARAM, S. et al. Effect of colorspace transformation,the illuminance component and color

modeling on skin detection. In: . [S.l.: s.n.], 2004. p. II: 813–818.

JEDYNAK, B.; ZHENG, H.; DAOUDI, M. Maximum entropy models for skin detection. In:

Energy Minimization Methods in Computer Vision and Pattern Recognition. [S.l.: s.n.],

2003. p. 180–193.

JONES, M.; REHG, J. Statistical color models with application to skin detection. In: Proceed-

ings of the IEEE Computer Society Conference on Computer Vision and Pattern Recog-

nition. [S.l.: s.n.], 1999. v. 1, p. 274–280.

JONES, M.; REHG, J. Statistical color models with application to skin detection. International

Journal of Computer Vision, v. 46, n. 1, p. 81–96, January 2002.

KAKUMANU, P.; MAKROGIANNIS, S.; BOURBAKIS, N. A survey of skin-color modeling

and detection methods. Pattern Recognition, v. 40, n. 3, p. 1106–1122, March 2007.

KOVAC, J.; PEER, P.; SOLINA, F. Human skin color clustering for face detection. In: Pro-

ceedingd of the EUROCON 2003. [S.l.: s.n.], 2003. v. 2, p. 144–148 vol.2.

KRUPPA, H.; BAUER, M.; SCHIELE, B. Skin patch detection in real-world images. In: An-

nual Symposium for Pattern Recognition of the DAGM. [S.l.]: Springer, 2002. p. 109–117.

KUIASKI, D. et al. Estrutura para anotac¸

ao de imagens para a avaliac¸

ao de algoritmos de

detecc¸

ao de pele humana. In: Anais do IV Congresso Brasileiro de Engenharia Biom

edica.

Salvador, Bahia, Brasil: [s.n.], 2008.

KUIASKI, D. et al. A study of the effect of illumination conditions and color spaces on skin

segmentation. In: Proceedings of the XXII Brazilian Symposium on Computer Graphics

and Image Processing. Rio de Janeiro, RJ, Brazil: [s.n.], 2009.

LEE, L.-H.; LUH, C.-J. Generation of pornographic blacklist and its incremental update using

an inverse chi-square based method. Information Processing and Management, Pergamon

Press, Inc., Tarrytown, NY, USA, v. 44, n. 5, p. 1698–1706, 2008. ISSN 0306-4573.

MANJUNATH, B. S. Introduction to MPEG-7, Multimedia Content Description Interface.

[S.l.]: John Wiley and Sons, Ltd., 2002.

PALMER, S. Vision Science: Photons to Phenomenology. [S.l.]: MIT Press, 1999.

PHUNG, S. L.; BOUZERDOUM, A.; CHAI, D. Skin segmentation using color pixel classiﬁ-

cation: Analysis and comparison. IEEE Transactions on Pattern Analysis Machine Intelli-

gence, IEEE Computer Society, Washington, DC, USA, v. 27, n. 1, p. 148–154, January 2005.

ISSN 0162-8828.

PHUNG, S. L.; CHAI, D.; BOUZERDOUM, A. Skin colour based face detection. In: Pro-

ceedings Intelligent Information Systems Conference The Seventh Australian and New

Zealand 2001. [S.l.: s.n.], 2001. p. 171–176.

POYNTON, C. Frequently Asked Questions about Color. 1995. Dispon

ıvel em:

<http://www.poynton.com/ColorFAQ.html>. Acesso em: 23 de novembro de 2008.

QUINLAN, J. R. Improved use of continuous attributes in c4.5. Journal of Artiﬁcial Intelli-

gence Research, AI Access Foundation, v. 4, p. 77–90, March 1996. ISSN 1076-9757.

SHIH, J.-L.; LEE, C.-H.; YANG, C.-S. An adult image identiﬁcation system employing image

retrieval technique. Pattern Recognition Letters, Elsevier Science Inc., New York, NY, USA,

v. 28, n. 16, p. 2367–2374, 2007. ISSN 0167-8655.

SHIN, M.; CHANG, K.; TSAP, L. Does colorspace transformation make any difference on skin

detection? In: IEEE Workshop on Applications of Computer Vision. [S.l.: s.n.], 2002. p.

275–279.

SOLAR, J. R. del et al. Characterizing objectionable image content (pornography and nude

images) of speciﬁc web segments: Chile as a case study. In: LA-WEB ’05: Proceedings of

the Third Latin American Web Congress. Washington, DC, USA: IEEE Computer Society,

2005. ISBN 0-7695-2471-0.

ORRING, M. Computer Vision and Human Skin Colour. Tese (Doutorado) — Faculty of

Engineering and Science, Aalborg University, Denmark, 2004.

TERRILLON, J.-C. et al. Comparative performance of different skin chrominance models and

chrominance spaces for the automatic detection of human faces in color images. In: Proceed-

ings of the Fourth IEEE International Conference on Automatic Face and Gesture Recog-

nition 2000. Washington, DC, USA: IEEE Computer Society, 2000. p. 54–. ISBN 0-7695-0580-

THEODORIDIS, S.; KOUTROUMBAS, K. Pattern Recognition. [S.l.]: Elsevier, 2006.

VEZHNEVETS V.; SAZONOV, V. A. A. A survey on pixel-based skin color detection tech-

niques. In: Proceedings of GRAPHICON 2003. [S.l.]: GRAPHICON 2003, 2003. p. 85–92.

YANG, M.-H.; AHUJA, N. Detecting human faces in color images. In: Proceedings of the

International Conference on Image Processing ICIP 98. [S.l.: s.n.], 1998. v. 1, p. 127–130.

Esse documento foi gerado em L

X2e

Livros Grátis
( http://www.livrosgratis.com.br )
 
Milhares de Livros para Download:
 
Baixar livros de Administração
Baixar livros de Agronomia
Baixar livros de Arquitetura
Baixar livros de Artes
Baixar livros de Astronomia
Baixar livros de Biologia Geral
Baixar livros de Ciência da Computação
Baixar livros de Ciência da Informação
Baixar livros de Ciência Política
Baixar livros de Ciências da Saúde
Baixar livros de Comunicação
Baixar livros do Conselho Nacional de Educação - CNE
Baixar livros de Defesa civil
Baixar livros de Direito
Baixar livros de Direitos humanos
Baixar livros de Economia
Baixar livros de Economia Doméstica
Baixar livros de Educação
Baixar livros de Educação - Trânsito
Baixar livros de Educação Física
Baixar livros de Engenharia Aeroespacial
Baixar livros de Farmácia
Baixar livros de Filosofia
Baixar livros de Física
Baixar livros de Geociências
Baixar livros de Geografia
Baixar livros de História
Baixar livros de Línguas

Baixar livros de Literatura
Baixar livros de Literatura de Cordel
Baixar livros de Literatura Infantil
Baixar livros de Matemática
Baixar livros de Medicina
Baixar livros de Medicina Veterinária
Baixar livros de Meio Ambiente
Baixar livros de Meteorologia
Baixar Monografias e TCC
Baixar livros Multidisciplinar
Baixar livros de Música
Baixar livros de Psicologia
Baixar livros de Química
Baixar livros de Saúde Coletiva
Baixar livros de Serviço Social
Baixar livros de Sociologia
Baixar livros de Teologia
Baixar livros de Trabalho
Baixar livros de Turismo