Download PDF
ads:
UNIVERSIDADE FEDERAL DO MARANH
˜
AO
CENTRO DE CI
ˆ
ENCIAS EXATAS E TECNOLOGIA
PROGRAMA DE P
´
OS-GRADUAC¸
˜
AO EM ENGENHARIA DE ELETRICIDADE
DENNER ROBERT RODRIGUES GUILHON
COMPRESS
˜
AO DE SINAIS DE ELETROCARDIOGRAMA
UTILIZANDO AN
´
ALISE DE COMPONENTES
INDEPENDENTES
S
˜
ao Lu
´
ıs - MA
2006
ads:
Livros Grátis
http://www.livrosgratis.com.br
Milhares de livros grátis para download.
DENNER ROBERT RODRIGUES GUILHON
COMPRESS
˜
AO DE SINAIS DE ELETROCARDIOGRAMA
UTILIZANDO AN
´
ALISE DE COMPONENTES
INDEPENDENTES
Dissertac¸
˜
ao apresentada ao Programa de P
´
os-
Graduac¸
˜
ao em Engenharia de Eletricidade da UFMA,
como requisito para a obtenc¸
˜
ao parcial do grau de
MESTRE em Engenharia de Eletricidade.
Orientador: Allan Kardec Duailibe Barros Filho
Universidade Federal do Maranh
˜
ao
S
˜
ao Lu
´
ıs - MA
2006
ads:
Guilhon, Denner Robert Rodrigues
Compress
˜
ao de sinais de eletrocardiograma utilizando an
´
alise de
componentes independentes / Denner Robert Rodrigues Guilhon. - S
˜
ao
Lu
´
ıs, 2006.
Dissertac¸
˜
ao (Mestrado) - Programa de P
´
os-Graduac¸
˜
ao em
Engenharia de Eletricidade, Universidade Federal do Maranh
˜
ao.
1.Eletrocardiograma-Algoritmo. 2. An
´
alise de componentes
independentes. 3.KLT. I. T
´
ıtulo.
CDU 004.421:616.12-073.97
DENNER ROBERT RODRIGUES GUILHON
COMPRESS
˜
AO DE SINAIS DE ELETROCARDIOGRAMA
UTILIZANDO AN
´
ALISE DE COMPONENTES
INDEPENDENTES
Dissertac¸
˜
ao apresentada ao Programa de P
´
os-
Graduac¸
˜
ao em Engenharia de Eletricidade da UFMA,
como requisito para a obtenc¸
˜
ao parcial do grau de
MESTRE em Engenharia de Eletricidade.
Aprovada em 24 de fevereiro de 2006
BANCA EXAMINADORA
Allan Kardec Duailibe Barros Filho
Universidade Federal do Maranh
˜
ao
Hani Camille Yehia
Universidade Federal de Minas Gerais
Jo
˜
ao Viana da Fonseca Neto
Universidade Federal do Maranh
˜
ao
Ao meu pai, que
`
a sua maneira sempre torceu
pelo sucesso de cada um de seus filhos.
`
A minha m
˜
ae e aos meus irm
˜
aos, pelo
companheirismo em todos os momentos.
`
A minha esposa, Eliz
ˆ
angela, pelo apoio
incondicional.
Resumo
A demanda cont
´
ınua de por sistemas de processamento de eletrocardiogramas de
alto desempenho e baixo custo tem exigido a elaborac¸
˜
ao de t
´
ecnicas de compress
˜
ao de ECG
cada vez mais eficientes e confi
´
aveis. O objetivo deste trabalho
´
e avaliar o desempenho de
um algoritmo baseado em an
´
alise de componentes independentes (ICA) para a compress
˜
ao de
eletrocardiogramas (ECGs). Para cada um dos sinais de ECG utilizados foram obtidos, atrav
´
es
de ICA, subespac¸os vetoriais constru
´
ıdos a partir de suas func¸
˜
oes base, pois o sinal pode ser
expresso como uma combinac¸
˜
ao linear destas.
O sinal de ECG foi subdividido em m janelas de comprimento fixo, e cada uma
delas foi projetada no subespac¸o, resultando em um vetor w de coeficientes para cada janela.
Um processo de quantizac¸
˜
ao simples foi executado para os m vetores w, segundo n
´
ıveis de
quantizac¸
˜
ao definidos, cada um gerando diferentes n
´
ıveis de erro de reconstruc¸
˜
ao.
Foi observado que o armazenamento dos coeficientes implica na utilizac¸
˜
ao de um
menor espac¸o em mem
´
oria em comparac¸
˜
ao
`
aquele utilizado pelas janelas correspondentes
do sinal de eletrocardiograma. A medida tradicionalmente utilizada de erro de reconstruc¸
˜
ao,
diferenc¸a m
´
edia quadr
´
atica percentual (PRD), foi empregada para a avaliac¸
˜
ao do algoritmo. Os
resultados foram comparados
`
aqueles obtidos utilizando a transformada de Karhunen Lo
´
eve
(KLT).
PALAVRAS-CHAVE: an
´
alise de componentes independentes, eletrocardiograma, compress
˜
ao,
KLT.
Abstract
The continuing demand for high performance and low cost electrocardiogram
processing systems have required the elaboration of even more efficient and reliable ECG
compression techniques. The objective of this work is to evaluate the performance of an
electrocardiogram (ECG) compression algorithm based on independent components analysis
(ICA). To each of the ECG signal we processed, using ICA, vectorial subspaces composed of
its basis functions were obtained, for the signal can be expressed as a linear combination of
them.
The ECG signal was subdivided into m fixed length windows, and each of them
was projected in the subspace, resulting in a vector w of coefficients for each window. A
simple quantization process was performed over the m vectors w, according to defined levels of
quantization, each one generating different levels of reconstruction error.
It was observed that the storage of the coefficients implies the use of less space in
memory in comparison to that one used by the corresponding windows of the electrocardiogram
signal. The reconstruction error measure traditionally used, the percent root mean-square
difference (PRD), was used into the evaluation of the algorithm. The results had been compared
with those obtained using the Karhunen Lo
´
eve transform (KLT).
KEYWORDS: independent component analysis, electrocardiogram, KLT.
Agradecimentos
Mais do que a todos os outros, agradec¸o a Deus por ter me permitido chegar ao fim
desta etapa da minha vida.
Agradec¸o tamb
´
em aos meus pais e irm
˜
aos por terem sempre e invariavelmente me
incentivado a perseverar nos estudos, ainda que algumas vezes eu tenha discordado.
Sou muito grato
`
a minha inabal
´
avel esposa, Eliz
ˆ
angela, que esteve sempre ao meu
lado, mesmo nas piores horas.
Expresso minha gratid
˜
ao aos colegas do Laborat
´
orio de Processamento da
Informac¸
˜
ao Biol
´
ogica - PIB e dos corredores: Ana B
´
arbara, Andr
´
e Cavalcante, Carla Borba,
Carlos Magno, Ewaldo Santana, Fausto Lucena, Glenda Salgado, Ivan J
´
unior, Jaciani Pereira,
L
´
ucio Campos, Raniere Machado, Renata Feques, Ricardo Robson, entre outros. Tamb
´
em
agradec¸o a todos os professores, em especial ao Prof. Eug
ˆ
enio Medeiros, por sua colaborac¸
˜
ao
paciente, e ao Prof. Allan Kardec Barros, por n
˜
ao desanimar diante da in
´
ercia dos alunos.
“O problema n
˜
ao
´
e como ter pensamentos
novos e inovadores, mas como tirar os
velhos da cabec¸a.
Dee Hock
vi
Sum
´
ario
Lista de Figuras viii
Lista de Tabelas x
Lista de Abreviac¸
˜
oes xi
1 Introduc¸
˜
ao 1
2 Aspectos B
´
asicos da Teoria da Informac¸
˜
ao 3
2.1 Fontes de Informac¸
˜
ao e Entropia . . . . . . . . . . . . . . . . . . . . . . . . . 3
2.2 Teoria da Codificac¸
˜
ao de Fontes . . . . . . . . . . . . . . . . . . . . . . . . . 5
3 An
´
alise de Componentes Independentes 8
3.1 Hist
´
orico e Motivac¸
˜
ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
3.2 Definic¸
˜
oes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
3.3 Estimac¸
˜
ao de Componentes Independentes . . . . . . . . . . . . . . . . . . . . 11
3.3.1 Estimac¸
˜
ao atrav
´
es de Maximizac¸
˜
ao de N
˜
ao-Gaussianidade . . . . . . . 11
3.3.2 Negentropia como Medida de N
˜
ao-Gaussianidade . . . . . . . . . . . . 13
4 Eletrocardiogramas 14
4.1 Definic¸
˜
oes e Forma de Aquisic¸
˜
ao . . . . . . . . . . . . . . . . . . . . . . . . . 14
4.2 Compress
˜
ao de Eletrocardiogramas . . . . . . . . . . . . . . . . . . . . . . . 17
4.2.1 Transformada de Karhunen-Lo
´
eve . . . . . . . . . . . . . . . . . . . . 19
5 Compress
˜
ao utilizando An
´
alise de Componentes Independentes 22
5.1 M
´
etodo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
vii
5.1.1 Prova . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
5.1.2 Estimac¸
˜
ao das Func¸
˜
oes Bases atrav
´
es de ICA . . . . . . . . . . . . . . 24
5.1.3 Estimac¸
˜
ao dos Coeficientes da Projec¸
˜
ao . . . . . . . . . . . . . . . . . 25
5.2 Material Utilizado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
5.3 Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
5.4 Discuss
˜
ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
6 Conclus
˜
oes 35
Refer
ˆ
encias 37
viii
Lista de Figuras
2.1 Diagrama de blocos de um sistema de comunicac¸
˜
oes. . . . . . . . . . . . . . . 3
3.1 Segmento de um sinal de eletrocardiograma como combinac¸
˜
ao linear de suas
caracter
´
ısticas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
3.2 Segmentosde sinal de eletrocardiograma dispostos como combinac¸
˜
ao linear das
func¸
˜
oes base do sinal. (a) Segmentos do ECG. (b) Componentes independentes.
(c) Func¸
˜
oes base. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
4.1 Tri
ˆ
angulo de Einthoven e as derivac¸
˜
oes DI, DII e DIII. . . . . . . . . . . . . . 14
4.2 Esquema do terminal central de Wilson. . . . . . . . . . . . . . . . . . . . . . 15
4.3 Esquema das derivac¸
˜
oes aumentadas de Goldberger. . . . . . . . . . . . . . . . 15
4.4 Esquema das derivac¸
˜
oes precordiais. . . . . . . . . . . . . . . . . . . . . . . . 16
4.5 Exemplos de registros das 12 derivac¸
˜
oes: (a) derivac¸
˜
oes bipolares e
aumentadas. (b) derivac¸
˜
oes precordiais. . . . . . . . . . . . . . . . . . . . . . 17
4.6 Estrutura do eletrocardiograma normal. . . . . . . . . . . . . . . . . . . . . . 17
5.1 Diagrama de blocos para o algoritmo de compress
˜
ao proposto: (a) fase de
treinamento: estimac¸
˜
ao das func¸
˜
oes base. (b) fase de estimac¸
˜
ao dos coeficientes. 22
5.2 Combinador linear de m
´
ultiplas entradas. . . . . . . . . . . . . . . . . . . . . 26
5.3 PRD ap
´
os a reconstruc¸
˜
ao de 15 registros do MIT-BIH NSRD, segundo taxas
de compress
˜
ao fixas, obtidas utilizando PCA (KLT) e ICA. Observar que os
trac¸ados de PCA e ICA t
ˆ
em a mesma cor (vermelho, azul, verde ou preto) para
taxas de compress
˜
ao iguais. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
ix
5.4 PRD ap
´
os a reconstruc¸
˜
ao de 15 registros do MIT-BIH SVDB, segundo taxas
de compress
˜
ao fixas, obtidas utilizando PCA (KLT) e ICA. Observar que os
trac¸ados de PCA e ICA t
ˆ
em a mesma cor (vermelho, azul, verde ou preto) para
taxas de compress
˜
ao iguais. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
5.5 PRD ap
´
os a reconstruc¸
˜
ao de 15 registros do MIT-BIH VFDB, segundo taxas
de compress
˜
ao fixas, obtidas utilizando PCA (KLT) e ICA. Observar que os
trac¸ados de PCA e ICA t
ˆ
em a mesma cor (vermelho, azul, verde ou preto) para
taxas de compress
˜
ao iguais. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
5.6 Resultados do algoritmo proposto para as 600 primeiras amostras para o registro
16265. (a) Sinal original. (b) Sinal obtido ap
´
os a reconstruc¸
˜
ao, com CR = 2.4:1
e PRD = 3.26%. (c) Erro de reconstruc¸
˜
ao. . . . . . . . . . . . . . . . . . . . . 33
5.7 Resultados do algoritmo proposto para as 600 primeiras amostras para o registro
SVDB 809. (a) Sinal original. (b) Sinal obtido ap
´
os a reconstruc¸
˜
ao, com CR =
2:1 e PRD = 4.85%. (c) Erro de reconstruc¸
˜
ao. . . . . . . . . . . . . . . . . . . 33
x
Lista de Tabelas
4.1 Comparac¸
˜
ao entre alguns esquemas de Compress
˜
ao de ECG . . . . . . . . . . 19
5.1 Relac¸
˜
ao de registros utilizados das base de dados. . . . . . . . . . . . . . . . . 28
5.2 Taxa de amostragem e resoluc¸
˜
ao das bases de dados. . . . . . . . . . . . . . . 28
xi
Lista de Abreviac¸
˜
oes
AZTEC amplitude zone-time epoch coding
BIH Beth Israel Hospital
CORTES coordinate reduction time encoding system
CR compression ratio
DPCM differential pulse code modulation
ECG eletrocardiograma
ICA independent component analysis
KLT Karhunen-Lo
´
eve transform
MIT Massachusetts Institute of Technology
MSE mean-square error
MOS mean opinion score
NSRD Normal Sinus Rhythm Database
PCA principal components analysis
PRD percent root mean-square difference
SAPA scan-along polygonal approximation
SVDB Supraventricular Arrhythmia Database
TP turning point
VFDB Malignant Ventricular Arrhythmia Database
WDD weighted diagnostic distortion
1
1 Introduc¸
˜
ao
O eletrocardiograma
´
e usado para determinar as condic¸
˜
oes do corac¸
˜
ao atrav
´
es de
medidas de sua atividade el
´
etrica. Os sinais eletrocardiogr
´
aficos dos pacientes podem ser
armazenados com os prop
´
ositos de diagn
´
ostico, comparac¸
˜
ao e avaliac¸
˜
ao futura. O conjunto
de in
´
umeros desses registros comp
˜
oem imensas bases de dados que, por motivos de efici
ˆ
encia
de armazenamento e transmiss
˜
ao, exigem m
´
etodos de compress
˜
ao de dados efetivos.
Em ci
ˆ
encia da computac¸
˜
ao e teoria da informac¸
˜
ao, a compress
˜
ao de dados
´
e o
processo de convers
˜
ao de uma mensagem em uma representac¸
˜
ao que consuma menos bits (ou
outra medida de informac¸
˜
ao) que a representac¸
˜
ao original. A compress
˜
ao
´
e poss
´
ıvel devido
`
a
presenc¸a de redund
ˆ
ancias estat
´
ısticas nos dados a serem comprimidos.
A compress
˜
ao de dados
´
e importante pois reduz o consumo de recursos, como
espac¸o em disco ou largura de banda da conex
˜
ao. Entretanto, requer capacidade de
processamento, o que pode se mostrar dispendioso. O projeto de esquemas de compress
˜
ao
inclui compromissos entre v
´
arios fatores como a capacidade de compress
˜
ao, quantidade de
distorc¸
˜
ao introduzida e recursos computacionais exigidos.
Os esquemas de compress
˜
ao de eletrocardiogramas s
˜
ao classificados essencialmente
em: compress
˜
ao direta de dados, m
´
etodos de transformac¸
˜
ao e t
´
ecnicas de extrac¸
˜
ao
de par
ˆ
ametros. Trabalhos recentes sobre compress
˜
ao de eletrocardiogramas utilizam
principalmente os m
´
etodos de transformac¸
˜
ao, tais como a transformac¸
˜
ao de Karhunen-Lo
´
eve
[OLMOS et al (1996)] e wavelets [BLANCO-VELASCO et al(2004), MIAOU & CHAO (2005) ,
RAJOUB (2002)].
Entretanto, tais trabalhos n
˜
ao exibem com clareza os resultados dos algoritmos
propostos, pois fazem uso de t
´
ecnicas adicionais de codificac¸
˜
ao (DPCM, Huffmanequantizac¸
˜
ao
vetorial, por exemplo) [JALALEDDINE et al (1990)]. Isso faz com que tanto a complexidade
dos sistemas necess
´
arios para reproduzir tais taxas de compress
˜
ao seja aumentada quanto nos
torna incapazes de definir a efici
ˆ
encia dos algoritmos propostos sem o uso dessa codificac¸
˜
ao
final.
2
Neste trabalho propomos um novo m
´
etodo de compress
˜
ao onde
´
e criado, para um
dado sinal de ECG, um subespac¸o vetorial atrav
´
es do qual podemos expressar completamente
o sinal. Para a estimac¸
˜
ao desse subespac¸o
´
e utilizada a an
´
alise de componentes independentes.
O sinal
´
e ent
˜
ao dividido em segmentos, para os quais s
˜
ao calculados coeficientes de tal forma
que todas esses segmentos sejam descritas como combinac¸
˜
oes lineares do subespac¸o vetorial
encontrado.
Com essa t
´
ecnica, obtemos uma representac¸
˜
ao menos redundante do sinal de ECG,
o que nos permite uma codificac¸
˜
ao mais eficiente. Diferentemente de outros trabalhos, optou-
se por mostrar os resultados do algoritmo sem o beneficiamento de t
´
ecnicas adicionais, sendo
utilizado apenas quantizac¸
˜
ao simples.
Este trabalho est
´
a organizado da seguinte forma. O Cap
´
ıtulo 2 apresenta os
elementos essenciais ao trabalho no que se refere
`
a Teoria da Informac¸
˜
ao, tais como fontes,
entropia e codificac¸
˜
ao. No Cap
´
ıtulo 3 s
˜
ao apresentadas as bases de an
´
alise de componentes
independentes, sua definic¸
˜
ao e forma de estimac¸
˜
ao de componentes. O Cap
´
ıtulo 4 trata da
definic¸
˜
ao de eletrocardiograma, sua forma de aquisic¸
˜
ao e uma breve discuss
˜
ao sobre compress
˜
ao
de ECGs. No Cap
´
ıtulo 5
´
e descrito o m
´
etodo proposto, assim como suafundamentac¸
˜
ao, material
utilizado para teste, apresentac¸
˜
ao e discuss
˜
ao dos resultados obtidos. Finalmente, o Cap
´
ıtulo 6
mostra as considerac¸
˜
oes finais sobre o trabalho, assim como propostas de trabalhos futuros.
3
2 Aspectos B
´
asicos da Teoria da Informac¸
˜
ao
A Teoria da Informac¸
˜
ao abrange a transmiss
˜
ao e o armazenamento de dados,
tratando da an
´
alise dos sistemas de comunicac¸
˜
ao [ASH (1990)], tradicionalmente representado
pelo diagrama de blocos mostrado na Figura 2.1. A transmiss
˜
ao de dados atrav
´
es de um canal
ruidoso
´
e um problema cl
´
assico da teoria da informac¸
˜
ao.
O principal resultado dessa teoria
´
e o fato de que a utilizac¸
˜
ao de estrat
´
egias
de codificac¸
˜
ao e decodificac¸
˜
ao apropriadas tornam poss
´
ıvel a comunicac¸
˜
ao em canais n
˜
ao-
confi
´
aveis a taxas menores que a (mas arbitrariamente pr
´
oximas da) capacidade do canal, com
pequenas probabilidades de erro [WIKIPEDIA (2005d)].
Figura 2.1: Diagrama de blocos de um sistema de comunicac¸
˜
oes.
No esquema da Figura 2.1, a fonte produz as informac¸
˜
oes a serem transmitidas,
enquanto o codificador associa a cada mensagem gerada pela fonte seq
¨
u
ˆ
encias bin
´
arias mais
adequadas para a transmiss
˜
ao atrav
´
es do canal. O decodificador, por sua vez, opera na sa
´
ıda
do canal, com o objetivo de extrair a mensagem original da mensagem codificada. Por
´
em, a
qualidade desta transmiss
˜
ao
´
e geralmente afetada pela presenc¸a de ru
´
ıdo.
2.1 Fontes de Informac¸
˜
ao e Entropia
Uma fonte de informac¸
˜
ao pode ser representada em termos de modelos
probabil
´
ısticos que emitem eventos ou vari
´
aveis aleat
´
orias [VITERBI & OMURA (1979)].
Uma fonte discreta sem mem
´
oria
´
e caracterizada por sua sa
´
ıda, a vari
´
avel aleat
´
oria S, que toma
4
elementos de um alfabeto finito de comprimento N
ϑ = (s
1
, s
2
, . . . , s
N
) , (2.1)
com probabilidades
P (S = s
k
) = p
k
k = 1 , 2, . . . , N. (2.2)
A fonte
´
e dita sem mem
´
oria, pois a cada unidade de tempo T
s
emite uma vari
´
avel
aleat
´
oria que
´
e independente de todas as sa
´
ıdas anteriores e posteriores da fonte. Portanto, se a
qualquer tempo a sa
´
ıda da fonte
´
e S = s
k
, ent
˜
ao a quantidade de informac¸
˜
ao, em bits, contida
na sa
´
ıda da fonte
´
e dada por
I(s
k
) = log
2
1
p
k
. (2.3)
A quantidade de s
´
ımbolos necess
´
arios, por unidade de tempo, para representar a
fonte totalmente e, em seguida, reconstruir a sua seq
¨
u
ˆ
encia de sa
´
ıda, ou seja, a quantidade
m
´
edia de informac¸
˜
ao por s
´
ımbolo da fonte,
´
e chamada entropia da fonte [HAYKIN (2001),
PAPOULIS & PILLAI (2002), VITERBI & OMURA (1979)], dada por
H(ϑ) =
N
k=1
P (s
k
)I(s
k
) (2.4a)
=
N
k=1
p
k
log
2
1
p
k
. (2.4b)
A entropia H(ϑ), de acordo com (2.4b), depende apenas das probabilidades dos
s
´
ımbolos do alfabeto ϑ da fonte. Quanto mais aleat
´
oria, ou seja, quanto mais imprevis
´
ıvel
e n
˜
ao estruturada for a vari
´
avel, maior a sua entropia. A entropia da fonte est
´
a limitada a
0 H(ϑ) log
2
N, onde H(ϑ) = 0 ocorre quando n
˜
ao existe incerteza sobre o s
´
ımbolo
emitido pela fonte, e H(ϑ) = log
2
N quando os s
´
ımbolos emitidos pela fonte s
˜
ao equiprov
´
aveis.
Na discuss
˜
ao de conceitos de teoria da informac¸
˜
ao,
´
e bastante
´
util considerar blocos
de s
´
ımbolos em vez de s
´
ımbolos individuais. Cada bloco consiste de n s
´
ımbolos sucessivos
emitidos pela fonte [HAYKIN (2001)]. O alfabeto da fonte estendida pode ser representado por
ϑ
N
. Devido s
´
ımbolos da fonte discreta sem mem
´
oria serem estatisticamente independentes, a
probabilidade da fonte de s
´
ımbolos ϑ
N
´
e igual ao produto das probabilidades das N fontes de
s
´
ımbolos ϑ que constituem ϑ
N
. Portanto, podemos escrever
H(ϑ
N
) = N H(ϑ). (2.5)
5
2.2 Teoria da Codificac¸
˜
ao de Fontes
A codificac¸
˜
ao de fontes
´
e uma aplicac¸
˜
ao direta da Teoria da Informac¸
˜
ao, pois um
dos problemas em comunicac¸
˜
oes
´
e a representac¸
˜
ao eficiente dos dados gerados por uma fonte
discreta. O processo atrav
´
es do qual essa representac¸
˜
ao
´
e obtida
´
e chamado codificac¸
˜
ao de
fonte. Um c
´
odigo
´
e o mapeamento da sa
´
ıda da fonte, cujas palavras pertencem ao alfabeto ϑ da
fonte, em palavras c
´
odigo, de um alfabeto ψ de c
´
odigo.
Quando a compress
˜
ao
´
e utilizada para aplicac¸
˜
oes de transmiss
˜
ao de dados, o
objetivo
´
e velocidade. Velocidade de transmiss
˜
ao depende do n
´
umero de bits enviados, do
tempo necess
´
ario para codificador gerar c
´
odigo e para o decodificador recuperar o sinal original.
Quando a aplicac¸
˜
ao
´
e de armazenamento de dados, a preocupac¸
˜
ao
´
e a quantidade de mem
´
oria
utilizada ap
´
os a compress
˜
ao.
As t
´
ecnicas de compress
˜
ao de dados t
ˆ
em sido utilizadas em v
´
arias
´
areas de
comunicac¸
˜
ao, tais como fal e imagem. Tais m
´
etodos s
˜
ao tradicionalmente classificados em
tr
ˆ
es categorias principais [JALALEDDINE et al (1990)]:
a) Compress
˜
ao direta de dados;
b) M
´
etodos de transformac¸
˜
ao;
c) T
´
ecnicas de extrac¸
˜
ao de par
ˆ
ametros.
Compress
˜
ao de dados atrav
´
es de transformac¸
˜
ao ou de m
´
etodos diretos cont
ˆ
em dados
transformados ou dados reais do sinal original, podendo ser reconstru
´
ıdos atrav
´
es de processo
inverso. A compress
˜
ao direta de dados baseia sua detecc¸
˜
ao de redund
ˆ
ancias na an
´
alise direta
das amostras sinal.
J
´
a os m
´
etodos de transformac¸
˜
ao utilizam principalmente a an
´
alise das distribuic¸
˜
oes
espectrais e de energia para a detecc¸
˜
ao de redund
ˆ
ancias. Por outro lado, a extrac¸
˜
ao de
par
ˆ
ametros
´
e um processo irrevers
´
ıvel com o qual uma caracter
´
ıstica ou par
ˆ
ametro particular
do sinal
´
e extra
´
ıdo. Os par
ˆ
ametros extra
´
ıdos (e.g. medidas da distribuic¸
˜
ao de probabilidade)
s
˜
ao ent
˜
ao utilizados para classificac¸
˜
ao baseada em conhecimento a priori das caracter
´
ısticas do
sinal.
A compress
˜
ao de dados pode ser tamb
´
em classificada em: sem perdas, onde os
dados podem ser exatamente reconstru
´
ıdos; com perdas, em que s
˜
ao calculados quantos bits
6
s
˜
ao necess
´
arios para reconstruir os dados dentro de um n
´
ıvel estabelecido de fidelidade. Entre
as t
´
ecnicas de compress
˜
ao sem perdas est
˜
ao a codificac¸
˜
ao de Huffman e a codificac¸
˜
ao aritm
´
etica.
As com perdas incluem JPEG, MP3, MPEG, etc.
O prop
´
osito do par codificador-decodificador de fonte na Figura 2.1
´
e reduzir a
sa
´
ıda da fonte
`
a representac¸
˜
ao m
´
ınima, ou seja, a codificac¸
˜
ao mais eficiente. Para se alcanc¸ar
essa representac¸
˜
ao,
´
e necess
´
ario conhecer a estat
´
ıstica da fonte, de forma a criar um c
´
odigo
unicamente decodific
´
avel [ASH (1990), HAYKIN (2001), VITERBI & OMURA (1979)]. Essa
representac¸
˜
ao ser
´
a
´
otima quando sua redund
ˆ
ancia for m
´
ınima.
Dada uma fonte discreta sem mem
´
oria, cujo alfabeto ϑ possua probabilidades p
k
,
onde k = 1,...,N. Considerando que para cada s
´
ımbolo s
k
gerado
´
e atribu
´
ıda uma palavra c
´
odigo
de comprimento l
k
bits, define-se o comprimento m
´
edio de palavra c
´
odigo como
L =
N
k=1
P (s
k
)l
k
(2.6a)
=
N
k=1
p
k
l
k
. (2.6b)
Fisicamente, L representa o n
´
umero m
´
edio de bits por s
´
ımbolo da fonte usado no
processo de codificac¸
˜
ao [HAYKIN (2001)]. Assim, a redund
ˆ
ancia de uma codificac¸
˜
ao pode ser
definida como [LELEWER & HIRSCHBERG (1987)]
R =
k
p
k
l
k
k
p
k
log
2
1
p
k
, (2.7)
o que, de acordo com (2.4b) e (2.6a), equivale a
R = L H(ϑ). (2.8)
Assim, a redund
ˆ
ancia mede a diferenc¸a entre o comprimento m
´
edio de palavra
c
´
odigo e a quantidade m
´
edia de informac¸
˜
ao. Se um c
´
odigo tem o m
´
ınimo comprimento m
´
edio
de palavra c
´
odigo L, para uma dada distribuic¸
˜
ao de probabilidades, ent
˜
ao esse c
´
odigo tem
redund
ˆ
ancia m
´
ınima. O menor valor poss
´
ıvel de L pode ser determinado atrav
´
es do primeiro
teorema de Shannon, o Teorema da Codificac¸
˜
ao de Fontes. Esse teorema afirma que, dada uma
fonte discreta sem mem
´
oria de entropia H(ϑ), o comprimento m
´
edio de palavra c
´
odigo L, para
qualquer esquema de codificac¸
˜
ao sem distorc¸
˜
ao,
´
e limitado por [SHANNON (1948)]
L H(ϑ). (2.9)
7
Logo, a entropia da fonte H(ϑ)
´
e a taxa m
´
ınima, ou ainda, o menor comprimento
de c
´
odigo pelo qual uma seq
¨
u
ˆ
encias de uma fonte digital estoc
´
astica pode ser transmitida
perfeitamente [PAPOULIS & PILLAI (2002), VITERBI & OMURA (1979)].
A quantidade de compress
˜
ao obtida por um esquema de codificac¸
˜
ao pode ser
medida pela a taxa de compress
˜
ao (do ingl
ˆ
es, compression ratio), definido por
CR =
M
L
(2.10)
sendo que M
´
e o comprimento m
´
edio da mensagem e L, conforme (2.6a),
´
e comprimento
m
´
edio de palavra c
´
odigo. Esse valor mostra a comprimento da mensagem original em relac¸
˜
ao
`
a mensagem codificada.
8
3 An
´
alise de Componentes Independentes
3.1 Hist
´
orico e Motivac¸
˜
ao
O problema de separac¸
˜
ao de fontes
´
e antigo na engenharia el
´
etrica. Existem muitos
algoritmos, dependendo da natureza da mistura dos sinais. O problema de separac¸
˜
ao cega de
fontes
´
e maior, pois sem o conhecimento dos sinais que foram misturados,
´
e imposs
´
ıvel propor
o pr
´
e-processamento apropriado que os separe de forma
´
otima. A estrutura geral de an
´
alise de
componentes independentes foi introduzida por Jean Herault e Christian Jutten em 1986, sendo
mais claramente proposta por Pierre Comon em 1994.
Em 1995 Tony Bell e Terry Sejnowski introduziram um algoritmo r
´
apido e eficiente
de ICA baseado no infomax, um princ
´
ıpio criado por Ralph Linsker em 1992. Em 1997,
Shun-ichi Amari melhorou este algoritmo usando o gradiente natural, o que foi descoberto
de forma independente por Jean Francois Cardoso. Entretanto, o algoritmo original, com n
˜
ao-
linearidades sigmoidais, era apenas apropriado para fontes super-Gaussianas. Te-Won Lee,
juntamente com Mark Girolami, desenvolveu uma vers
˜
ao ampliada eficiente do algoritmo de
ICA baseado no infomax, pr
´
opria para sinais n
˜
ao-Gaussianos em geral [WIKIPEDIA (2005c)].
Muitas abordagens diferentes foram utilizadas para a separac¸
˜
ao cega de fontes, o
que inclui m
´
axima verossimilhanc¸a, m
´
etodo Bussgang baseado em cumulantes e negentropia.
Todas elas s
˜
ao relacionadas
`
a estrutura do infomax. Por isso, um grande n
´
umero de
pesquisadores que se dedicaram ao estudo de ICA, vindos de v
´
arias
´
areas, convergiram para
um conjunto comum de princ
´
ıpios e de algoritmos. Para um hist
´
orico mais completo, ver
[COMON (1994)].
Considere, por exemplo, os registros el
´
etricos das atividades do c
´
erebro, dados por
um eletroencefalograma (EEG), consistindo dos potenciais el
´
etricos em diferentes pontos do
escalpo. Esses potenciais s
˜
ao supostamente gerados pela mistura de componentes impl
´
ıcitas da
atividade cerebral. Essa situac¸
˜
ao
´
e semelhante ao problema de cocktail party, pois desejamos
encontrar as componentes originais da atividade cerebral, mas podemos apenas observar as
9
misturas das componentes. ICA pode revelar informac¸
˜
oes interessantes sobre a atividade
cerebral a partir das suas componentes independentes
Outra aplicac¸
˜
ao importante de ICA
´
e a extrac¸
˜
ao de caracter
´
ısticas. Um problema
fundamental em processamento de sinais
´
e encontrar uma representac¸
˜
ao apropriada para
imagem,
´
audio e outros formatos de dados quando da compress
˜
ao e da remoc¸
˜
ao de ru
´
ıdos.
Representac¸
˜
ao de dados pode ser feita atrav
´
es de transformac¸
˜
oes lineares, logo
´
e bastante
´
util
estimar tal transformac¸
˜
ao dos pr
´
oprios dados, pois nesse caso a transformac¸
˜
ao seria adaptada
ao tipo de dado processado [HYV
¨
ARINEN & OJA (2000), HYV
¨
ARINEN et al (2001)].
3.2 Definic¸
˜
oes
Considere que sejam observados n segmentos aleat
´
orios x
1
, . . . , x
n
de um
eletrocardiograma, modeladas como combinac¸
˜
ao linear de n func¸
˜
oes base
x
n
= ϕ
1
s
j1
+ ϕ
2
s
j2
+ · · · + ϕ
n
s
jn
j = 1, . . . , n (3.1)
e que cada segmento x
n
, assim como cada componente independente s
n
seja uma vari
´
avel
aleat
´
oria. Em an
´
alise funcional e suas aplicac¸
˜
oes, um espac¸o de func¸
˜
oes pode ser visto como
um espac¸o vetorial de infinitas dimens
˜
oes cujos vetores bases s
˜
ao func¸
˜
oes e n
˜
ao vetores. Isso
significa que cada func¸
˜
ao no espac¸o de func¸
˜
oes pode ser representada como combinac¸
˜
ao linear
das func¸
˜
oes base [WIKIPEDIA (2005a)]. As Figuras 3.1 e 3.2 ilustram o proposto acima.
Figura 3.1: Segmento de um sinal de eletrocardiograma como combinac¸
˜
ao linear de suas caracter
´
ısticas.
Sem perda de generalidade, supomos que tanto as vari
´
aveis originadas dos
segmentos do ECG quanto aquelas das componentes independentes t
ˆ
em m
´
edia zero. Por
conveni
ˆ
encia, ser
´
a usada a notac¸
˜
ao vetorial em vez de somas, como aquelas vistas em (3.1),
10
Figura 3.2: Segmentos de sinal de eletrocardiograma dispostos como combinac¸
˜
ao linear das func¸
˜
oes base do sinal.
(a) Segmentos do ECG. (b) Componentes independentes. (c) Func¸
˜
oes base.
utilizando letras min
´
usculas e mai
´
usculas, ambas em negrito, para representar, respectivamente,
vetores coluna e matrizes. Dessa maneira, podemos reescrever (3.1) das seguintes formas
X = ΦS. (3.2)
O modelo estat
´
ıstico de (3.2)
´
e chamado de modelo de an
´
alise de componentes
independentes.
´
E preciso estimar tanto a matriz de componentes independentes S quanto a
matriz de func¸
˜
oes base Φ, que tamb
´
em
´
e desconhecida, pois tudo o que se observa s
˜
ao os
segmentos do eletrocardiograma, X.
Para tanto,
´
e preciso fazer suposic¸
˜
oes t
˜
ao gerais quanto poss
´
ıvel. Portanto, supomos
que [HYV
¨
ARINEN et al (2001)]:
a) As componentes s
n
s
˜
ao estatisticamente independentes;
11
b) Elas t
ˆ
em distribuic¸
˜
oes n
˜
ao-gaussianas;
c) Por motivos de simplicidade, a matriz Φ seja quadrada.
O modelo de ICA apresenta algumas ambig
¨
uidades em relac¸
˜
ao
`
as componentes
independentes. S
˜
ao elas:
1. N
˜
ao se pode determinar suas vari
ˆ
ancias (energias);
2. N
˜
ao se pode determinar a sua ordem.
Ambas derivam do fato de S e Φ serem desconhecidas. No item 1, existe
ambig
¨
uidade j
´
a que qualquer escalar α
n
multiplicando uma das fontes s
n
pode ser cancelado
dividindo-se a coluna ϕ
n
correspondente pelo mesmo escalar α
i
, ou seja
x
n
=
n
(
1
α
n
ϕ
n
)(s
jn
α
n
). (3.3)
Da
´
ı tamb
´
em ocorre a ambig
¨
uidade de sinal, pois
´
e poss
´
ıvel multiplicar uma
componente por 1. J
´
a no item 2, a ambig
¨
uidade ocorre devido
`
a possibilidade de se alterar
livremente a ordem dos termos em (3.1), denominando qualquer componente como a primeira.
3.3 Estimac¸
˜
ao de Componentes Independentes
3.3.1 Estimac¸
˜
ao atrav
´
es de Maximizac¸
˜
ao de N
˜
ao-Gaussianidade
A n
˜
ao-gaussianidade
´
e um elemento chave para a estimac¸
˜
ao do modelo de ICA,
pois a matriz Φ n
˜
ao
´
e identific
´
avel quando as componentes independentes t
ˆ
em distribuic¸
˜
ao
gaussiana. Assumimos que x seja um dos segmentos de ECG, conforme a Figura 3.2, distribu
´
ıdo
de acordo com o modelo de ICA em (3.2) e que todas as componentes independentes s
t
ˆ
em distribuic¸
˜
oes iguais. Para estimar as componentes independentes, basta encontrar as
combinac¸
˜
oes lineares corretas de x
i
, de modo que
s = Φ
1
x. (3.4)
12
Assim, podemos expressar uma combinac¸
˜
ao linear de x
i
por
y = b
T
x (3.5a)
=
i
b
i
x
i
(3.5b)
= b
T
Φs, (3.5c)
onde b deve ser determinado. A partir de (3.5c) podemos observar que y
´
e uma combinac¸
˜
ao
linear de s
i
, com coeficientes dados por q = b
T
Φ. Logo obtemos
y = q
T
s (3.6a)
=
i
q
i
s
i
. (3.6b)
Se b corresponder a uma das linhas da inversa de Φ, ent
˜
ao y ser
´
a uma das
componentes independentes e, nesse caso, apenas um dos elementos de q ser
´
a igual a 1,
enquanto todos os outros ser
˜
ao iguais a zero. N
˜
ao
´
e poss
´
ıvel determinar b exatamente, mas
podemos estimar seu valor com boa aproximac¸
˜
ao.
Uma forma de determinar b
´
e variar os coeficientes em q e ent
˜
ao verificar
como a distribuic¸
˜
ao de y = q
T
s muda. J
´
a que, conforme o Teorema do Limite Central
[PAPOULIS & PILLAI (2002)], a soma de duas vari
´
aveis aleat
´
orias independentes
´
e mais
gaussiana que as vari
´
aveis originais [PAPOULIS & PILLAI (2002)], y = q
T
s normalmente
´
e mais gaussiana que qualquer uma das s
i
e menos gaussiana quando se iguala a uma das s
i
.
Nesse caso, apenas um dos elementos q
i
de q
´
e diferente de zero [HYV
¨
ARINEN et al (2001)].
Como, na pr
´
atica, os valores de q s
˜
ao desconhecidos e sabemos, atrav
´
es de (3.5a) e
(3.6a), que
b
T
x = q
T
s, (3.7)
podemos variar b e observar a distribuic¸
˜
ao de b
T
x. Portanto, podemos tomar, como b, um vetor
que maximiza a n
˜
ao-gaussianidade de b
T
x, sendo que esse vetor necessariamente corresponde
a q = Φ
T
s, vetor esse que possui apenas uma de suas componentes diferente de zero. Isso
significa que y em (3.5a)
´
e igual a uma das componentes independentes. Logo, a maximizac¸
˜
ao
da n
˜
ao-gaussianidade de b
T
x permite encontrar uma das componentes.
13
3.3.2 Negentropia como Medida de N
˜
ao-Gaussianidade
Uma importante medida de n
˜
ao-gaussianidade
´
e a negentropia. A definic¸
˜
ao de
entropia em (2.4a) pode ser generalizada para vetores e vari
´
aveis aleat
´
orias cont
´
ınuas, vindo
a ser chamada entropia diferencial. Tomando um vetor aleat
´
orio y cuja func¸
˜
ao densidade de
probabilidade
´
e f(y), temos a entropia diferencial dada por
H(y) =
f(y) log f (y). (3.8)
Como um dos resultados fundamentais da Teoria da Informac¸
˜
ao, sabe-se que uma
vari
´
aveis gaussiana tem a maior entropia entre todas as vari
´
aveis aleat
´
orias de igual vari
ˆ
ancia
[HYV
¨
ARINEN et al (2001), PAPOULIS & PILLAI (2002)]. Isso quer dizer que uma vers
˜
ao
modificada da entropia diferencial pode ser usada como medida de n
˜
ao-gaussianidade. Essa
medida
´
e chamada negentropia, definida por
J(y) = H(y
gauss
) H(y), (3.9)
sendo y
gauss
uma vari
´
avel aleat
´
oria de mesma matriz de covari
ˆ
ancia que y. A negentropia
sempre
´
e n
˜
ao-negativa, tem valor igual a zero se e somente se y tem distribuic¸
˜
ao gaussiana
´
e
invariante para transformac¸
˜
oes lineares invers
´
ıveis.
Em contraste
`
as suas qualidades como medida de n
˜
ao-gaussianidade, a negentropia
´
e de dif
´
ıcil estimac¸
˜
ao. Por isso,
´
e necess
´
aria a utilizac¸
˜
ao de aproximac¸
˜
oes usando, por exemplo,
momentos de alta ordem. Logo
J(y)
1
12
E
y
3
2
+
1
48
kurt(y)
2
(3.10)
sendo kurt(y), ou seja, a kurtose de y, definida como o momento de quarta ordem da vari
´
avel
aleat
´
oria y, expresso por
kurt(y) = E
y
4
3(E
y
2
)
2
. (3.11)
A kurtose
´
e zero para vari
´
aveis gaussianas e maior que zero para a maioria das
vari
´
aveis aleat
´
orias n
˜
ao-gaussianas.
14
4 Eletrocardiogramas
4.1 Definic¸
˜
oes e Forma de Aquisic¸
˜
ao
O eletrocardiograma (ECG)
´
e um teste n
˜
ao-invasivo usado para determinar as
condic¸
˜
oes do corac¸
˜
ao atrav
´
es das medidas de sua atividade el
´
etrica [KULICK (2005)]. O ECG
´
e
constru
´
ıdo utilizando as medidas dos potenciais el
´
etricos presentes nos tecidos card
´
ıacos. Estas
medidas s
˜
ao obtidas por meio de derivac¸
˜
oes, circuitos formados por dois eletrodos ligados aos
p
´
olos positivo e negativo de um galvan
ˆ
ometro.
As derivac¸
˜
oes DI, DII e DIII (tamb
´
em chamadas de derivac¸
˜
oes bipolares) foram
introduzidas por Einthoven, que imaginou o corac¸
˜
ao no centro de um tri
ˆ
angulo eq
¨
uil
´
atero cujos
v
´
ertices estariam representados pelo brac¸o direito (R), brac¸o esquerdo (L) e perna esquerda (F)
[UNIFESP VIRTUAL (2003)], conforme mostrado na Figura 4.1. Essa orientac¸
˜
ao foi baseada
na Segunda Lei de Kirchoff que diz que num circuito fechado, a soma das diferenc¸as de
potencial
´
e igual a zero.
Figura 4.1: Tri
ˆ
angulo de Einthoven e as derivac¸
˜
oes DI, DII e DIII.
Wilson introduziu o chamado terminal central (T), cujo potencial
´
e considerado
15
nulo em relac¸
˜
ao a todas as regi
˜
oes do corac¸
˜
ao. Os potenciais dos pontos L, R e F s
˜
ao
medidos com refer
ˆ
encia ao terminal. O terminal de Wilson
´
e obtido unindo-se os v
´
ertices
do tri
ˆ
angulo de Einthoven a um terminal central atrav
´
es de resist
ˆ
encias iguais de 5k, como
ilustra a Figura 4.2. Tr
ˆ
es derivac¸
˜
oes adicionais s
˜
ao obtidas medindo-se o potencial entre o
eletrodo de cada membro e o terminal central de Wilson. Em 1942, Goldberger observou que
esses sinais poderiam ser aumentados omitindo-se a resist
ˆ
encia do terminal central de Wilson
[MALMIVUO & PLONSEY (1995)], que
´
e conectado ao eletrodo de medida. As derivac¸
˜
oes
assim obtidas s
˜
ao chamadas aVR, aVL e aVF, mostradas na Figura 4.3.
Figura 4.2: Esquema do terminal central de Wilson.
Figura 4.3: Esquema das derivac¸
˜
oes aumentadas de Goldberger.
Para medir os potenciais pr
´
oximos ao corac¸
˜
ao, Wilson introduziu as derivac¸
˜
oes
precordiais. Estas derivac¸
˜
oes s
˜
ao obtidas unindo-se o terminal de Wilson, onde o eletrodo
16
negativo
´
e colocado, e posicionando o eletrodo explorador, positivo, sucessivamente sobre seis
posic¸
˜
oes da superf
´
ıcie tor
´
acica, conforme a Figura 4.4: quarto espac¸o intercostal,
`
a direita do
esterno (V1); quarto espac¸o intercostal,
`
a esquerda do esterno (V2); a meio caminho entre os
pontos V2 e V4 (V3); quinto espac¸o intercostal esquerdo, na linha clavicular m
´
edia (V4); quinto
espac¸o intercostal esquerdo, na linha axilar anterior (V5); quinto espac¸o intercostal esquerdo,
na linha axilar m
´
edia (V6) [UNIFESP VIRTUAL (2003)].
Figura 4.4: Esquema das derivac¸
˜
oes precordiais.
Portanto, as doze derivac¸
˜
oes registram informac¸
˜
oes de regi
˜
oes particulares do
corac¸
˜
ao. As derivac¸
˜
oes inferiores (DII, DIII e aVF) registram a atividade el
´
etrica do topo do
ventr
´
ıculo esquerdo, enquanto as derivac¸
˜
oes laterais (DI, aVL, V5 e V6) registram a atividade
el
´
etrica da parede frontal do ventr
´
ıculo esquerdo. J
´
a as derivac¸
˜
oes anteriores (V1 a V6)
representam a parede anterior do corac¸
˜
ao, ou seja, a parede frontal do ventr
´
ıculo esquerdo.
A derivac¸
˜
ao aVR raramente
´
e usada para fins de diagn
´
ostico, mas indica se as derivac¸
˜
oes foram
dispostas corretamente no paciente.
A Figuras 4.5(a) e 4.5(b) mostra exemplos dos registros obtidos a partir de cada
uma das derivac¸
˜
oes, onde as diferenc¸as entre os registros mostram, a partir de cada derivac¸
˜
ao,
a seq
¨
u
ˆ
encia de polarizac¸
˜
ao e despolarizac¸
˜
ao dos
´
atrios e ventr
´
ıculos [KLABUNDE (2005)]. A
Figura 4.6 apresenta um registro eletrocardiogr
´
afico t
´
ıpico.
Atrav
´
es do ECG,
´
e poss
´
ıveldiagnosticar [THE BETTER HEALTH CHANNEL (2003)]:
aumento do corac¸
˜
ao; defeitos card
´
ıacos cong
ˆ
enitos; arritmias; posic¸
˜
ao anormal do corac¸
˜
ao;
inflamac¸
˜
oes (pericardite e miocardite), entre outras.
17
(a) (b)
Figura 4.5: Exemplos de registros das 12 derivac¸
˜
oes: (a) derivac¸
˜
oes bipolares e aumentadas. (b) derivac¸
˜
oes
precordiais.
Figura 4.6: Estrutura do eletrocardiograma normal.
4.2 Compress
˜
ao de Eletrocardiogramas
O uso cont
´
ınuo de sistemas computadorizados para o processamento de
eletrocardiogramas, assim como a necessidade de melhor desempenho e menor custo, t
ˆ
em
cada vez mais exigido t
´
ecnicas de compress
˜
ao de ECG confi
´
aveis, precisas e eficientes. A
import
ˆ
ancia pr
´
atica da compress
˜
ao de ECG evidencia-se diante:
1. Do aumento da capacidade de armazenamento de ECGs como base de dados para
verificac¸
˜
ao posterior;
2. Da possibilidade de transmitir ECG em tempo real, ou off-line para centros de
18
interpretac¸
˜
ao;
3. Da funcionalidade crescente dos monitores de ECG ambulatoriais.
O objetivo principal da compress
˜
ao de eletrocardiograma, assim como de qualquer
outra t
´
ecnica de compress
˜
ao,
´
e a m
´
axima reduc¸
˜
ao do volume dos dados, mantendo as
caracter
´
ısticas morfol
´
ogicas significativas do sinal ap
´
os da sua reconstruc¸
˜
ao. Essa compress
˜
ao
de dados, al
´
em da diminuic¸
˜
ao de custo, proporciona a diminuic¸
˜
ao do peso e tamanho do
equipamento
As t
´
ecnicas utilizadas na compress
˜
ao de eletrocardiograma podem ser classificadas,
conforme a sec¸
˜
ao 2.2, como: compress
˜
ao direta de dados (AZTEC, DPCM, TP, CORTES,
SAPA, FAN), m
´
etodos de transformac¸
˜
ao (Fourier, Walsh, KLT) e t
´
ecnicas de extrac¸
˜
ao de
par
ˆ
ametros [JALALEDDINE et al (1990)].
Os m
´
etodos diretos de compress
˜
ao de dados baseiam-se na utilizac¸
˜
ao de algoritmos
de predic¸
˜
ao e interpolac¸
˜
ao. Essas t
´
ecnicas tentam reduzir as redund
ˆ
ancias presentes nos
dados. As t
´
ecnicas de transformac¸
˜
ao, de forma geral, envolvem pr
´
e-processamento do sinal
de entrada por meio de transformac¸
˜
oes lineares ortogonais e a codificac¸
˜
ao apropriada do sinal
transformado. Para reconstruir o sinal,
´
e executado o processo inverso, o que resulta em um
determinado grau de erro. As t
´
ecnicas de extrac¸
˜
ao de par
ˆ
ametros s
˜
ao processos irrevers
´
ıveis
nos quais caracter
´
ısticas particulares do sinal s
˜
ao extra
´
ıdas para serem utilizadas em uma
classificac¸
˜
ao baseada no conhecimento a priori das caracter
´
ısticas do sinal.
As t
´
ecnicas compress
˜
ao direta de dados t
ˆ
em se mostrado mais eficientes em
seu desempenho quando comparadas
`
aquelas de transformac¸
˜
ao, tanto em relac¸
˜
ao ao
tempo de processamento quanto a taxa de compress
˜
ao. Alguns trabalhos, como por
exemplo [BLANCO-VELASCO et al(2004), MIAOU & CHAO (2005) , OLMOS et al (1996),
RAJOUB (2002)], com o intuito de melhorar seus resultados, fazem uso de m
´
etodos de
codificac¸
˜
ao adicionais, como DPCM e Huffman.
Os esquemas de compress
˜
ao de ECG que envolvem perdas normalmente reduzem
o volume de dados de forma significativa. Entretanto, tais esquemas envolvem a perda
de informac¸
˜
oes possivelmente
´
uteis para diagn
´
osticos. Assim, alguns trabalhos preferem
abordar a compress
˜
ao sem perdas, de forma a preservar fielmente as informac¸
˜
oes essenciais
ao diagn
´
ostico, ainda que dessa forma se tornem menos eficientes [MIAOU & CHAO (2005) ].
19
Al
´
em da comparac¸
˜
ao visual, a maioria esquemas de compress
˜
ao tem utilizado a
diferenc¸a m
´
edia quadr
´
atica percentual (PRD) como forma de avaliac¸
˜
ao do sinal reconstru
´
ıdo.
O PRD
´
e definido por
PRD =
n
i=1
[ecg
orig
(i) ecg
rec
(i)]
2
n
i=1
ecg
2
orig
(i)
100 (4.1)
onde ecg
orig
´
e o sinal de ECG original, enquanto ecg
rec
´
e o sinal recuperado ap
´
os a
descompress
˜
ao. A Tabela 4.1 mostra a comparac¸
˜
ao de alguns m
´
etodos de compress
˜
ao de ECG
em relac¸
˜
ao ao CR, definido em (2.10), e o PRD.
Tabela 4.1: Comparac¸
˜
ao entre alguns esquemas de Compress
˜
ao de ECG
M
´
etodo CR PRD (%)
AZTEC 10.0 28.0
CORTES 4.8 7.0
DPCM 2.5 -
FAN/SAPA 3.0 4.0
Fourier 7.4 7
KLT 3.0 -
TP 2.0 5.3
Entretanto, o PRD
´
e irrelevante do ponto de vista do diagn
´
ostico, pois n
˜
ao
revela se o algoritmo
´
e capaz ou n
˜
ao de preservar caracter
´
ısticas significativas do ECG
[JALALEDDINE et al (1990)]. Por esse motivo outras formas de avaliac¸
˜
ao foram utilizadas,
como o WDD (weighted diagnostic distortion) e o teste MOS (mean opinion score), conforme
[ZIGEL et al (2000)].
4.2.1 Transformada de Karhunen-Lo
´
eve
Em estat
´
ıstica, an
´
alise de componentes principais (PCA)
´
e uma t
´
ecnica que pode ser
utilizada para simplificar um conjunto de dados. Formalmente,
´
e uma transformac¸
˜
ao linear que
escolhe um novo sistema de coordenadas para os dados de tal forma que a maior vari
ˆ
ancia entre
as projec¸
˜
oes dos dados venha a recair sobre o primeiro eixo (chamado primeiro eixo principal),
a segunda maior vari
ˆ
ancia no segundo eixo e assim por diante.
20
O PCA tamb
´
em
´
e chamado de transformada de Karhunen-Lo
´
eve. Essa
transformada tem a distinc¸
˜
ao de ser a transformac¸
˜
ao linear
´
otima para manter o subespac¸o que
tem a maior vari
ˆ
ancia. Entretanto, o custo computacional dessa transformac¸
˜
ao
´
e muito grande.
Ao contr
´
ario de outras transformac¸
˜
oes lineares, KLT n
˜
ao tem um n
´
umero fixo de func¸
˜
oes base.
Considere a combinac¸
˜
ao linear dos elementos de x
y
1
=
n
k=1
w
k1
x
k
= w
T
1
x. (4.2)
Os termos w
11
, . . . , w
n1
s
˜
ao coeficientes escalares do vetor n-dimensional w
1
. O fator y
1
´
e
chamado de primeira componente principal de x, caso a vari
ˆ
ancia de y
1
seja a maior poss
´
ıvel.
J
´
a que a vari
ˆ
ancia depende tanto da norma quanto da orientac¸
˜
ao do vetor de coeficientes w
1
e
cresce sem limites
`
a medida que a norma cresce,
´
e imposta a restric¸
˜
ao de que a norma de w
1
seja igual a 1. Assim, procuramos o vetor de coeficientes w
1
que maximize o crit
´
erio
J
P CA
1
(w
1
) = E
y
2
1
= E
(w
T
x)
2
(4.3a)
= w
T
1
E
xx
T
w
1
(4.3b)
= w
T
1
C
x
w
1
, (4.3c)
sendo que w = 1 e definindo
C
x
= E
xx
T
. (4.4)
A soluc¸
˜
ao para o problema de PCA
´
e dada em termos dos autovetores v
1
, . . . , v
n
de
C
x
, ordenados de maneira que os autovalores d
1
, . . . , d
n
satisfac¸am d
1
d
2
· · · d
n
. Assim
a soluc¸
˜
ao de (4.3c)
´
e dada por
w
1
= v
1
. (4.5)
Assim, a primeira componente principal de x
´
e y
1
= v
T
1
x. O crit
´
erio definido em (4.3) pode ser
generalizado para m componentes, sendo m qualquer n
´
umero entre 1 e n. Igualmente, para a m-
´
esima componente principal y
m
= w
T
m
x, temos como soluc¸
˜
ao w
m
= v
m
e, portanto, y
m
= v
T
m
x.
Seja um conjunto de m func¸
˜
oes base ortonormais w
1
, . . . , w
m
tal que o erro m
´
edio
quadr
´
atico entre x e sua projec¸
˜
ao seja m
´
ınimo. Ent
˜
ao
J
P CA
MSE
= E
x
m
i=1
(w
T
i
x)w
i
2
. (4.6)
21
Devido
`
a ortogonalidade dos vetores w
i
, (4.6) pode ser reescrito como
J
P CA
MSE
= E
x
2
E
m
i=1
(w
T
i
x)
2
(4.7a)
= tr(C
x
)
m
i=1
w
T
j
C
x
w
j
(4.7b)
=
n
i=m+1
d
i
, (4.7c)
ou seja, o valor do MSE
´
e igual
`
a soma dos autovalores descartados v
m+1
, . . . , v
n
.
Uma importante aplicac¸
˜
ao de KLT
´
e a compress
˜
ao de dados, onde o vetor x
´
e o sinal
original que
´
e aproximado pela expans
˜
ao truncada
ˆ
x =
m
i=1
y
i
e
i
. (4.8)
A partir de (4.7c) sabemos que o erro diminui
`
a medida que mais termos s
˜
ao
inclu
´
ıdos (4.8), at
´
e que se torne nulo quando m = n ou todas as componentes principais s
˜
ao
inclu
´
ıdas. O problema consiste em escolher m de forma que haja um compromisso entre erro e
taxa de compress
˜
ao.
22
5 Compress
˜
ao utilizando An
´
alise de Componentes
Independentes
5.1 M
´
etodo
Suponha que um sinal de ECG e(t) possa ser dividido em m janelas de comprimento
fixo n. Suponha tamb
´
em que
´
e poss
´
ıvel encontrar, atrav
´
es de treinamento, um subespac¸o
vetorial Φ(t) = [ϕ
1
(t), . . . , ϕ
i
(t)], definindo as colunas ϕ
i
(t) como func¸
˜
oes base de e(t). Seja
a projec¸
˜
ao da m-
´
esima janela de e(t) em Φ(t) definida por [GUILHON (2005)]
e
m
(t) = w
T
m
Φ(t), (5.1)
sendo w
m
os vetores de coeficientes da projec¸
˜
ao. Por motivo de simplicidade, a vari
´
avel
independente t ser
´
a omitida daqui em diante. Assim, os coeficientes w
m
podem ser utilizados
para encontrar uma vers
˜
ao estimada de e
m
, ou seja,
ˆ
e
m
. Esses coeficientes devem ser calculados
de forma que [e
m
ˆ
e
m
]
2
, m, seja minimizado. Esses passos s
˜
ao ilustrados na Figura 5.1
Os coeficientes w
m
s
˜
ao, ent
˜
ao, quantizados usando tantos n
´
ıveisquantos necess
´
arios
para manter um n
´
ıvel desejado de precis
˜
ao. O sinal pode ser reconstru
´
ıdo, conforme (5.1), a
partir de Φ e w
m
.
ESTIMAÇÃO
DOS
COEFICIENTES
(t)
e
1 i
. . .
DIVISÃO EM
m
JANELAS
. . .
m
e
1
W
m
W
ESTIMAÇÃO
DAS
FUNÇÕES
BASES
(t)
e
1 i
. . .
(a) (b)
Figura 5.1: Diagrama de blocos para o algoritmo de compress
˜
ao proposto: (a) fase de treinamento: estimac¸
˜
ao das
func¸
˜
oes base. (b) fase de estimac¸
˜
ao dos coeficientes.
23
5.1.1 Prova
Seja a informac¸
˜
ao m
´
utua das vari
´
aveis aleat
´
orias e
1
, . . . , e
m
definida por
I(e
1
, . . . , e
m
) =
m
i=1
H(e
i
) H(e
1
, . . . , e
m
), (5.2)
sendo H(e
1
, . . . , e
m
) a entropia conjunta de e
1
, . . . , e
m
. A informac¸
˜
ao m
´
utua mede
a depend
ˆ
encia entre as vari
´
aveis. Sabendo que n
˜
ao
´
e poss
´
ıvel perder informac¸
˜
ao
[HAYKIN (2001)], podemos afirmar que
I(e
1
, . . . , e
m
) 0. (5.3)
Substituindo (5.3) em (5.2), obtemos
m
i=1
H(e
i
) H(e
1
, . . . , e
m
). (5.4)
Da mesma forma, seja a informac¸
˜
ao m
´
utua das vari
´
aveis aleat
´
orias w
1
, . . . , w
m
definida por
I(w
1
, . . . , w
m
) =
m
i=1
H(w
i
) H(w
1
, . . . , w
m
), (5.5)
sendo H(w
1
, . . . , w
m
) a entropia conjunta de w
1
, . . . , w
m
. Supondo que w
1
, . . . , w
m
sejam
independentes, podemos dizer que [HYV
¨
ARINEN et al (2001)]
I(w
1
, . . . , w
m
) = 0. (5.6)
Igualmente, substituindo (5.6) em (5.5), obtemos
m
i=1
H(w
i
) = H(w
1
, . . . , w
m
). (5.7)
Dada a transformac¸
˜
ao linear
e
m
= Φw
m
, (5.8)
tem-se que [PAPOULIS & PILLAI (2002)]
H(e
1
, . . . , e
m
) = H(w
1
, . . . , w
m
). (5.9)
Logo, a partir (5.4), (5.7) e (5.9), obtemos
m
i=1
H(e
i
) H(w
1
, . . . , w
m
) (5.10a)
=
m
i=1
H(e
i
)
m
i=1
H(w
i
). (5.10b)
24
Assim, a partir de (2.9) e (5.10b), podemos concluir que
m
i=1
L
min
(e
i
)
m
i=1
L
min
(w
i
), (5.11)
ou seja, o comprimento m
´
ınimo total de c
´
odigo necess
´
ario para representar as m janelas e
m
´
e maior que aquele necess
´
ario para representar os m coeficientes w
m
. Isso significa que, em
m
´
edia, os coeficientes da projec¸
˜
ao em (5.1) ocupam menos espac¸o em mem
´
oria que o sinal de
ECG e(t).
5.1.2 Estimac¸
˜
ao das Func¸
˜
oes Bases atrav
´
es de ICA
Supondo que temos k vari
´
aveis aleat
´
orias
1
, . . . ,
k
(segmentos aleat
´
orios, de
comprimento n, de um sinal de ECG), modelados como uma combinac¸
˜
ao linear de n vari
´
aveis
aleat
´
orias a
1
, . . . , a
n
, tais que
i
= ϕ
i1
a
1
+ ϕ
i2
a
2
+ · · · + ϕ
in
a
n
i = 1, . . . , k, (5.12)
sendo que ϕ
in
s
˜
ao coeficientes reais. Definimos E, Φ e A como
E = [
1
, . . . ,
k
] (5.13)
Φ =
ϕ
11
· · · ϕ
1n
.
.
.
.
.
.
ϕ
k1
· · · ϕ
kn
(5.14)
A = [a
1
, . . . , a
n
]. (5.15)
Usando (5.13)-(5.15), podemos reescrever (5.12) como
E = Φ
T
A. (5.16)
Atrav
´
es de an
´
alise de componentes independentes, podemos determinar Φ de forma
que os a
i
sejam mutuamente estatisticamente independentes. Para tanto, o algoritmo utilizado
foi o FastICA, descrito em [HYV
¨
ARINEN et al (2001)] pelos seguintes passos:
1. Centralizar os dados para tornar sua m
´
edia nula;
25
2. Branquear os dados, resultando em z;
3. Escolher p, o n
´
umero de componentes independentes a estimar;
4. Escolher os valores iniciais para b
i
, i = 1,...,p, cada um de norma unit
´
aria. Ortogonalizar
a matriz B como no passo 6 abaixo;
5. Para cada i = 1,...,p, seja
b
i
E
zg(b
T
i
z)
E
g
(b
T
i
z)
w,
sendo g definido;
6. Ortogonalizar simetricamente a matriz B = (b
1
, . . . , b
p
)
T
fazendo
B (BB
T
)
1/2
B.
7. Caso o algoritmo n
˜
ao convirja, repetir o passo 5.
Para o algoritmo proposto, foi utilizado p = n. Ap
´
os a estimac¸
˜
ao de B, podemos
facilmente obter Φ.
5.1.3 Estimac¸
˜
ao dos Coeficientes da Projec¸
˜
ao
Para a estimac¸
˜
ao dos coeficientes w
m
´
e utilizado um combinador linear, cuja
estrutura
´
e mostrada na Figura 5.2. Os termos ϕ
i
, e
m
,
ˆ
e
m
e w
m
correspondem, respectivamente,
ao vetor de entrada, ao sinal desejado, ao sinal estimado e aos coeficientes da estimac¸
˜
ao. O
sinal estimado
ˆ
e
m
pode ser expresso por
ˆ
e
m
=
n
j=0
w
jm
ϕ
ji
(5.17a)
= w
T
m
ϕ
i
(5.17b)
= ϕ
T
i
w
m
. (5.17c)
Definindo o erro de estimac¸
˜
ao como sendo a diferenc¸a entre o sinal desejado e o
sinal estimado, e considerando (5.17a)-(5.17c), obtemos
ε
i
= e
i
ˆ
e
i
(5.18a)
= e
i
ϕ
T
i
w (5.18b)
= e
i
w
T
ϕ
i
. (5.18c)
26
Figura 5.2: Combinador linear de m
´
ultiplas entradas.
Supondo ε
m
, e
m
e ϕ
i
como estatisticamente estacion
´
arios, tomamos o valor esperado de ε
2
m
,
ou seja
E
ε
2
m
= E
(e
m
ϕ
T
i
w
m
)
2
(5.19a)
= E
(e
2
m
w
T
m
ϕ
i
ϕ
T
i
w
m
2e
m
ϕ
T
i
w
m
)
2
(5.19b)
= E
e
2
m
w
T
m
E
ϕ
i
ϕ
T
i
w
m
2E
e
m
ϕ
T
i
w
m
. (5.19c)
Podemos definir
R = E
ϕ
i
ϕ
T
i
(5.20)
P = E [e
m
ϕ
i
] , (5.21)
sendo R a matriz de autocorrelac¸
˜
ao de entrada e P
´
e a matriz de correlac¸
˜
ao cruzada entre a
entrada e o sinal desejado. Assim, designando o erro m
´
edio quadr
´
atico em (5.19c) por ξ e
reescrevendo essa equac¸
˜
ao a partir de (5.20) e (5.21)
MSE ξ = E
ε
2
m
(5.22a)
= E
e
2
m
w
T
m
Rw 2P
T
w
m
. (5.22b)
Desejamos encontrar a matriz de coeficientes w
m
= [w
1
, . . . , w
n
]
T
que resulte em
um valor m
´
ınimo para o MSE. Uma forma de encontrar tais valores
´
e atrav
´
es dos m
´
etodos
gradientes. O gradiente do MSE, definido por (ξ) pode ser obtido pela diferenciac¸
˜
ao de
27
(5.22b) [HAYKIN (1996), PRINCIPE et al (2000), WIDROW & STEARNS (1985)], ou seja
(ξ)
ξ
w
m
=
ξ
w
1
ξ
w
2
· · ·
ξ
w
n
T
(5.23a)
= 2Rw
m
2P. (5.23b)
O erro m
´
edio quadr
´
atico m
´
ınimo
´
e obtido quando a matriz de coeficientes tem valor
´
otimo w
m
, onde o gradiente (ξ)
´
e igual zero:
(ξ) = 0 = 2Rw
m
2P (5.24a)
w
m
= R
1
P. (5.24b)
Para tanto, assumimos que R seja n
˜
ao-singular. A express
˜
ao (5.24b)
´
e chamada de
equac¸
˜
ao de Wiener-Hopf.
5.2 Material Utilizado
Foram utilizados os 15 primeiros registros das bases MIT-BIH Normal Sinus
Rhythm Database (NSRD), da MIT-BIH Malignant Ventricular Arrhythmia Database (VFDB) e
da MIT-BIH Supraventricular Arrhythmia Database (SVDB) [9], conforme mostrado na Tabela
5.1.
A primeira base de dados inclui registros de pacientes que n
˜
ao apresentaram
arritmia significativa, a segunda mostra exemplos de arritmias supraventriculares e a
´
ultima,
pacientes que tiveram epis
´
odios de taquicardia ventricular, flutter e fibrilac¸
˜
ao ventricular. Os
registros da NSRD, SVDB e VFDB foram digitalizados utilizando conforme a Tabela 5.2.
5.3 Resultados
O algoritmo proposto foi testado para todos os 45 registros mostrados na Tabela 5.1.
Para cada registro, os trinta minutos iniciais foram utilizados para a estimac¸
˜
ao das func¸
˜
oes base,
enquanto os dois minutos iniciais foram comprimidos usando o algoritmo [GUILHON (2005)].
Ent
˜
ao foram calculados os valores de PRD, conforme definidos em (4.1), para
valores fixos de CR, sendo este aqui redefinido como
CR =
N
O
S
O
N
R
S
R
(5.25)
28
Tabela 5.1: Relac¸
˜
ao de registros utilizados das base de dados.
Registro NSRD SVDB VFDB
1 16265 800 418
2 16272 801 419
3 16273 802 420
4 16420 803 421
5 16483 804 422
6 16539 805 423
7 16773 806 424
8 16786 807 425
9 16795 808 426
10 17052 809 427
11 17453 810 428
12 18177 811 429
13 18184 812 430
14 19088 820 602
15 19090 821 605
Tabela 5.2: Taxa de amostragem e resoluc¸
˜
ao das bases de dados.
NSRD SVDB VFDB
Amostragem (a/s) 128 128 250
Resoluc¸
˜
ao (bits) 12 10 12
onde N e S representam o n
´
umero de bits por amostra e a quantidade de amostras,
respectivamente. Os
´
ındices O e R, por sua vez, indicam o sinal original e o sinal reconstru
´
ıdo.
J
´
a que S
O
e S
R
t
ˆ
em o mesmo valor, pois n
˜
ao s
˜
ao suprimidas amostras, CR depende apenas dos
comprimentos das palavras c
´
odigo, ou seja
CR =
N
O
N
R
(5.26)
Os valores de PRD do m
´
etodo proposto s
˜
ao mostrados nas Figuras 5.3 - 5.3, onde
s
˜
ao comparados aos obtidos utilizando o m
´
etodo KLT [OLMOS et al (1996)]. Cada uma das
29
figuras exibe quatro pares de trac¸ado (em vermelho, azul, verde e preto), correspondentes a
quatro n
´
ıveis diferentes de compress
˜
ao, especificados nas legendas.
As Figuras 5.6 e 5.7 mostram os sinais originais, as suas reconstruc¸
˜
oes ap
´
os o
processo de compress
˜
ao e os respectivos erros de reconstruc¸
˜
ao, para os registros NSRD - 16265
e SVDB - 809.
5.4 Discuss
˜
ao
Os resultados encontrados se referem aos registros listados na Tabela 5.1. Foram
utilizados 30 minutos de cada registro para encontrar, atrav
´
es de ICA, um subespac¸o vetorial
que caracterize o sinal, e ent
˜
ao 2 minutos desse mesmo registro foram divididos em janelas de
igual comprimento. Essas janelas foram projetadas no subespac¸o gerado, resultando em um
conjunto de coeficientes dessas projec¸
˜
oes.
Esses coeficientes foram quantizados, armazenados e ent
˜
ao usados para reconstruir
o sinal. As Figuras 5.3 - 5.3 mostram a avaliac¸
˜
ao do erro de reconstruc¸
˜
ao do algoritmo para
n
´
ıveis de quantizac¸
˜
ao fixos. Observa-se que os valores de PRD tornaram-se menores
`
a medida
que a taxa de compress
˜
ao diminu
´
ıa. Isso evidencia a relac¸
˜
ao entre as perdas de quantizac¸
˜
ao e
o erro na reconstruc¸
˜
ao do sinal. Conseq
¨
uentemente, a obtenc¸
˜
ao de erros pequenos nos limita a
CRs menores, como reflexo de um maior n
´
umero de n
´
ıveis de quantizac¸
˜
ao.
O m
´
etodo proposto atua na da remoc¸
˜
ao de redund
ˆ
ancias. Quanto menos redundante
os dados se tornam, mais eficiente
´
e o c
´
odigo que o representa [HAYKIN (2001)]. O algoritmo
de an
´
alise de componentes independentes remove a informac¸
˜
ao m
´
utua do sinal de ECG de
forma a encontrar o subespac¸o vetorial onde as projec¸
˜
oes das componentes desse sinal sejam
mutuamente independentes.
Portanto, qualquer sinal projetado nesse subespac¸o tem componentes (coeficientes)
tamb
´
em independentes. Codificar tais sinais, dado que suas componentes s
˜
ao independentes,
como um todo ou a partir de suas componentes individuais resulta no mesmo comprimento de
c
´
odigo [HYV
¨
ARINEN et al (2001)].
Os resultados alcanc¸ados neste trabalho se referem apenas
`
a reduc¸
˜
ao do n
´
umero
de bits necess
´
arios para representar os dados, devido
`
a sua caracter
´
ıstica menos redundante.
30
2 4 6 8 10 12 14
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0.45
PCA 4:1
PCA 3:1
PCA 2.4:1
PCA 2:1
ICA 4:1
ICA 3:1
ICA 2.4:1
ICA 2:1
Figura 5.3: PRD ap
´
os a reconstruc¸
˜
ao de 15 registros do MIT-BIH NSRD, segundo taxas de compress
˜
ao fixas, obtidas
utilizando PCA (KLT) e ICA. Observar que os trac¸ados de PCA e ICA t
ˆ
em a mesma cor (vermelho, azul, verde ou
preto) para taxas de compress
˜
ao iguais.
31
2 4 6 8 10 12 14
0.1
0.15
0.2
0.25
0.3
0.35
0.4
PCA 3.33:1
PCA 2.5:1
PCA 2:1
PCA 1.67:1
ICA 3.33:1
ICA 2.5:1
ICA 2:1
ICA 1.67:1
Figura 5.4: PRD ap
´
os a reconstruc¸
˜
ao de 15 registros do MIT-BIH SVDB, segundo taxas de compress
˜
ao fixas, obtidas
utilizando PCA (KLT) e ICA. Observar que os trac¸ados de PCA e ICA t
ˆ
em a mesma cor (vermelho, azul, verde ou
preto) para taxas de compress
˜
ao iguais.
32
2 4 6 8 10 12 14
0.1
0.2
0.3
0.4
0.5
0.6
PCA 4:1
PCA 3:1
PCA 2.4:1
PCA 2:1
ICA 4:1
ICA 3:1
ICA 2.4:1
ICA 2:1
Figura 5.5: PRD ap
´
os a reconstruc¸
˜
ao de 15 registros do MIT-BIH VFDB, segundo taxas de compress
˜
ao fixas, obtidas
utilizando PCA (KLT) e ICA. Observar que os trac¸ados de PCA e ICA t
ˆ
em a mesma cor (vermelho, azul, verde ou
preto) para taxas de compress
˜
ao iguais.
33
Figura 5.6: Resultados do algoritmo proposto para as 600 primeiras amostras para o registro 16265. (a) Sinal
original. (b) Sinal obtido ap
´
os a reconstruc¸
˜
ao, com CR = 2.4:1 e PRD = 3.26%. (c) Erro de reconstruc¸
˜
ao.
Figura 5.7: Resultados do algoritmo proposto para as 600 primeiras amostras para o registro SVDB 809. (a) Sinal
original. (b) Sinal obtido ap
´
os a reconstruc¸
˜
ao, com CR = 2:1 e PRD = 4.85%. (c) Erro de reconstruc¸
˜
ao.
34
Nenhuma estrat
´
egia adicional foi empregada para melhorar os resultados [GUILHON (2005)],
ao contr
´
ario dos trabalhos anteriormente mencionados [BLANCO-VELASCO et al(2004),
MIAOU & CHAO (2005) , OLMOS et al (1996), RAJOUB (2002)], tendo sido usado apenas
um processo de quantizac¸
˜
ao simples. Assim, podemos avaliar a efici
ˆ
encia do algoritmo, o que
n
˜
ao pode ser feito facilmente nos referidos trabalhos, j
´
a que estes n
˜
ao explicitam os resultados
dos seus respectivos algoritmos sem o tratamento adicional.
Para efeito de comparac¸
˜
ao, o KLT [OLMOS et al (1996)] foi selecionado e
simulado, obtendo resultados menos eficientes que o m
´
etodo proposto sob condic¸
˜
oes similares.
Isso
´
e mostrado nas Figuras 5.3 - 5.3, de onde podemos observar que os erros obtidos usando a
estrat
´
egia baseada em ICA s
˜
ao at
´
e 20 vezes menores do que aqueles encontrados usando KLT.
35
6 Conclus
˜
oes
Este trabalho prop
˜
oe um m
´
etodo de compress
˜
ao de eletrocardiogramas usando
an
´
alise de componentes independentes. O m
´
etodo proposto gera uma nova representac¸
˜
ao
do sinal, menos redundante e, por isso, de c
´
odigo mais eficiente. Isso torna poss
´
ıvel a
diminuic¸
˜
ao do espac¸o exigido para o seu armazenamento. Foram mostrados inicialmente
os aspectos t
´
eoricos sobre os quais o trabalho se fundamenta, como teoria da informac¸
˜
ao,
codificac¸
˜
ao eficiente, compress
˜
ao, an
´
alise de componentes independentes e compress
˜
ao de
eletrocardiogramas.
Foram discutidos os resultados da compress
˜
ao de 2 minutos de eletrocardiograma
de 45 pacientes de tr
ˆ
es bases de dados diferentes (NSRD, SVDB e VFDB). Para 4 taxas
de compress
˜
ao fixas, foram calculados os PRDs de cada um dos 45 registros. Estes foram
comparados
`
aqueles PRDs obtidos quando da utilizac¸
˜
ao do KLT como forma de construir novas
representac¸
˜
oes dos sinais de ECG. Verificou-se que o m
´
etodo proposto gerou erros at
´
e vinte
vezes menores que o KLT. Isso se reflete no erro de reconstruc¸
˜
ao do sinal comprimido utilizando
ICA, n
˜
ao exibindo diferenc¸as visuais significativas entre este e o sinal original. Isto indica as
caracter
´
ısticas morfol
´
ogicas do eletrocardiograma foram preservadas.
A partir do que foi proposto no presente trabalho, maiores avanc¸os podem ser
vislumbrados no que se refere tanto
`
a compress
˜
ao de ECG quanto a de outras formas de dados.
O algoritmo aqui mostrado pode ser adaptado para diferentes usos. Pode-se, por exemplo:
- Utilizar ICA como pr
´
e-processamento para um m
´
etodo de compress
˜
ao cl
´
assico de ECG,
buscando assim maiores CRs;
- Criar um crit
´
erio de eliminac¸
˜
ao de componentes, com o intuito de reduzir o n
´
umero de
coeficientes a serem armazenados, melhorando a compress
˜
ao;
- Submeter os resultados do algoritmo
`
a an
´
alise de um cardiologista para avaliac¸
˜
ao MOS;
- Avaliar o desempenho do algoritmo para diferentes tipos de dados, como
´
audio, imagens,
v
´
ıdeos, etc;
36
- Adaptar partes do algoritmo para finalidades diversas, como reconhecimento de padr
˜
oes,
por exemplo.
Este trabalho deu origem ao artigo publicado nos anais do 2005 IEEE Signal
Processing Society Workshop, sob o t
´
ıtulo ECG Data Compression by Independent Component
Analysis, conforme [GUILHON (2005)].
Refer
ˆ
encias
[ASH (1990)] ASH, Robert B. Information Theory. Nova York: Dover Publications Inc.
1990. 352 p.
[BLANCO-VELASCO et al(2004)] BLANCO-VELASCO, M.; CRUZ-ROLD
´
AN, F;
GODINO-LLORENTE, J.I.; BARNER, K.E. ECG compression with retrieved quality
guaranteed. Electronics Letters. 11 Nov. 2004. vol. 40, n. 23, pp 1466 – 1467.
[CAVALCANTE et al (2006)] CAVALCANTE, Andr
´
e B.; MANDIC, Danilo P.;
RUTKOWSKI, Tomasz; BARROS, Allan K. Speech Enhancement Based on the
Response Features of Facilitated EI Neurons. Proceedings of 6th International
Conference on Independent Component Analysis and Blind Source Separation,
Marc¸o 2006, Charleston, South Carolina, USA.
[COMON (1994)] COMON, Pierre. Independent component analysis, a new concept? Signal
Processing. 36, 1994, 28-314.
[DECCACHE & CASTRO (1993)] DECCACHE, Waldemar; CASTRO, Maria do C.V.
Eletrocardiograma: Semi
´
otica e Cl
´
ınica. 1.ed. Rio de Janeiro: Revinter, 1993. 392 p.
[GOLDBERGER (2000)] GOLDBERGER, Ary L.; AMARAL, Lu
´
ıs A.N.; GLASS, Leon;
HAUSDORFF Jeffrey M.; IVANOV, Plamen Ch.; MARK Roger G.; MIETUS, Joseph
E.; MOODY George B.; PENG, Chung-Kang; STANLEY H.Eugene. PhysioBank,
PhysioToolkit, and PhysioNet: Components of a New Research Resource for Complex
Physiologic Signals. Circulation 101(23):e215-e220 [Circulation Electronic Pages;
http://circ.ahajournals.org/cgi/content/full/101/23/e215]; 2000 (June 13).
[GUILHON (2005)] GUILHON, Denner; BARROS, Allan K.; MEDEIROS, Eug
ˆ
enio. ECG
Data Compression By Independent Component Analysis. In: 2005 IEEE International
Workshop on Machine Learning For Signal Processing, 2005, Mystic, EUA. Proceedings
of the 2005 IEEE Signal Processing Society Workshop, 2005. pp. 189-193.
[HAYKIN (1996)] HAYKIN, Simon. Adaptive Filter Theory. 3.ed. Englewood Cliffs:
Prentice-Hall. 1996. 989 p.
[HAYKIN (2001)] HAYKIN, Simon. Communication Systems. 4.ed. Nova York: John Wiley
& Sons. 2001. 816 p.
[HYV
¨
ARINEN & OJA (2000)] HYV
¨
ARINEN, Aapo; OJA, Erkki. Independent Component
Analysis: Algorithms and Applications. Neural Networks, 13(4-5):411-430, 2000.
[HYV
¨
ARINEN et al (2001)] HYV
¨
ARINEN, Aapo; KARHUNEN, Juha; OJA, Erkki.
Independent Component Analysis. Nova York: John Wiley & Sons. 2001. 481p.
[JALALEDDINE et al (1990)] JALALEDDINE, Sateh M.S.; HUTCHENS, Chriswell G.;
STRATTAN, Robert D; COBERLY, WilliamA. ECG Data Compression Techniques - A
unified approach. IEEE Transactions on Biomedical Engineering. Abril 1990, vol. 37,
no. 4, pp. 329–343.
[KLABUNDE (2005)] KLABUNDE, Richard E. Cardiovascular Physiology Concepts.
Dispon
´
ıvel em <http://www.cvphysiology.com/Arrhythmias/A009.htm>. Acesso em: 29
de nov. de 2005.
[KULICK (2005)] KULICK, Daniel L. Electrocardiogram (ECG or EKG). Dispon
´
ıvel em:
<http://www.medicinenet.com/electrocardiogram ecg or ekg/article.html>. Acesso em:
12 de dez. de 2005.
38
[LELEWER & HIRSCHBERG (1987)] LELEWER, Debra A.; HIRSCHBERG, Daniel S.
Data compression. ACM Comput. Surv. Set 1987, 19, 3, pp 261-296.
[MALMIVUO & PLONSEY (1995)] MALMIVUO, Jaakko; PLONSEY, Robert.
Bioelectromagnetism: Principles and Applications of Bioelectric and
Biomagnetic Fields. New York: Oxford University Press. 1995. Dispon
´
ıvel em
<http://butler.cc.tut.fi/ malmivuo/bem/bembook/>. Acesso em: 14 de dez. de 2005.
[MIAOU & CHAO (2005) ] MIAOU, Shaou-Gang; CHAO, Shu-Nien. Wavelet-Based Lossy-
to-Lossless ECG Compression in a Unified Vector Quantization Framework. IEEE
Transactions on Biomedical Engineering. Marc¸o 2005. vol. 52, no. 3, pp. 539-543.
[OLMOS et al (1996)] OLMOS, Salvador; MILLAN, Mar; GARCIA, Jos
´
e; LAGUNA, Pablo.
ECG data compression with the Karhunen-Lo
´
eve transform. Computers in Cardiology.
8-11 Set. 1996. pp. 253–256.
[PAPOULIS & PILLAI (2002)] PAPOULIS, Athanasios; PILLAI, S. Unnikrishna.
Probability, Random Variables and Stochastic Processes. 4 e.d. Nova York:
McGraw-Hill. 2002. 852 p.
[PRINCIPE et al (2000)] PRINCIPE, Jos
´
e C.; EULIANO, Neil R.; LEFEBVRE, W. Curt.
Neural and Adaptive Systems. Nova York:John Wiley & Sons. 2000. 672 p.
[RAJOUB (2002)] RAJOUB, B.A. An efficient coding algorithm for the compression of ECG
signals using the wavelet transform. IEEE Transactions on Biomedical Engineering.
Abril 2002. vol. 49, n. 4, pp 355 – 362.
[SHANNON (1948)] SHANNON, Claude E. A Mathematical Theory of Communication. The
Bell System Technical Journal. 1948, Vol. 27, p. 379-423, 623-656, Julho e Outubro.
[THE BETTER HEALTH CHANNEL (2003)] THE BETTER HEALTH CHANNEL,
Electrocardiogram. Dispon
´
ıvel em <http://www.betterhealth.vic.gov.au
/bhcv2/bhcarticles.nsf/pages/Electrocardiogram?OpenDocument>. Acesso em: 22
de dez. de 2005.
[UNIFESP VIRTUAL (2003)] UNIFESP VIRTUAL. Eletrocardiograma:
M
´
odulo 3. Dispon
´
ıvel em: <http://www.virtual.epm.br/material/tis/curr-
bio/trab2003/g5/menu.html>. Acesso em: 11 de dez. de 2005.
[VITERBI & OMURA (1979)] VITERBI, Andrew J.; OMURA, Jim K. Principles of Digital
Communication and Coding. Tokyo:McGraw-Hiil. 1979. 560 p.
[WIDROW & STEARNS (1985)] WIDROW, Bernard; STEARNS, Samuel D. Adaptive
Signal Processing. Nova Jersey: Prentice-Hall. 1985. 528 p.
[WIKIPEDIA (2005a)] WIKIPEDIA. Basis Functions. Dispon
´
ıvel em
<http://en.wikipedia.org/wiki/Basis functions>. Acesso em: 15 de jan. de 2006.
[WIKIPEDIA (2005b)] WIKIPEDIA. Electrocardiogram - Wikipedia, The Free
Encyclopedia. Dispon
´
ıvel em <http://en.wikipedia.org/wiki/Electrocardiogram>.
Acesso em: 14 de dez. de 2005.
[WIKIPEDIA (2005c)] WIKIPEDIA. Independent component analysis. Dispon
´
ıvel em
<http://en.wikipedia.org/wiki/Independent component analysis>. Acesso em: 22 de dez.
de 2005.
[WIKIPEDIA (2005d)] WIKIPEDIA. Information theory. Dispon
´
ıvel em
<http://en.wikipedia.org /wiki/Information theory>. Acesso em: 02 de jan. de 2006.
[WIKIPEDIA (2005e)] WIKIPEDIA. Principal components analysis. Dispon
´
ıvel em
<http://en.wikipedia.org/wiki/Principal components analysis>. Acesso em: 03 de jan. de
2006.
[ZIGEL et al (2000)] ZIGEL, Yaniv; COHEN, Arnon; KATZ, Amos. The Weighted Diagnostic
Distortion (WDD) Measure for ECG Signal Compression. IEEE Transactions on
Biomedical Engineering. Nov. 2000. vol. 47, no. 11, pp. 1422-1430.
Livros Grátis
( http://www.livrosgratis.com.br )
Milhares de Livros para Download:
Baixar livros de Administração
Baixar livros de Agronomia
Baixar livros de Arquitetura
Baixar livros de Artes
Baixar livros de Astronomia
Baixar livros de Biologia Geral
Baixar livros de Ciência da Computação
Baixar livros de Ciência da Informação
Baixar livros de Ciência Política
Baixar livros de Ciências da Saúde
Baixar livros de Comunicação
Baixar livros do Conselho Nacional de Educação - CNE
Baixar livros de Defesa civil
Baixar livros de Direito
Baixar livros de Direitos humanos
Baixar livros de Economia
Baixar livros de Economia Doméstica
Baixar livros de Educação
Baixar livros de Educação - Trânsito
Baixar livros de Educação Física
Baixar livros de Engenharia Aeroespacial
Baixar livros de Farmácia
Baixar livros de Filosofia
Baixar livros de Física
Baixar livros de Geociências
Baixar livros de Geografia
Baixar livros de História
Baixar livros de Línguas
Baixar livros de Literatura
Baixar livros de Literatura de Cordel
Baixar livros de Literatura Infantil
Baixar livros de Matemática
Baixar livros de Medicina
Baixar livros de Medicina Veterinária
Baixar livros de Meio Ambiente
Baixar livros de Meteorologia
Baixar Monografias e TCC
Baixar livros Multidisciplinar
Baixar livros de Música
Baixar livros de Psicologia
Baixar livros de Química
Baixar livros de Saúde Coletiva
Baixar livros de Serviço Social
Baixar livros de Sociologia
Baixar livros de Teologia
Baixar livros de Trabalho
Baixar livros de Turismo