Вы находитесь на странице: 1из 47

TRABALHO DE GRADUAO III

1-1

Tcnicas de Separao Cega de Fontes em Matlab:


Mistura Instantnea e Convolutiva

Candidato: Mario Filiage Svetlic Filho

RA: 11026107

Orientadora: Profa Dra Aline de Oliveira Neves Panazio

Palavras-chave: Separao Cega de Fontes, Anlise por componentes independentes, misturas


convolutivas

2-4

1. INTRODUO
A necessidade de extrao ou restaurao da informao contida em um sinal a
partir de uma verso corrompida do mesmo uma necessidade recorrente em
processamento de sinais. Tanto o problema de equalizao como o de separao cega
de fontes se encaixam neste contexto.

2-1

2-3

A importncia de se aprofundar o estudo de em tcnicas de separao cega de


fontes, bem como algoritmos pertinentes que trabalham em cima dessa questo, foi
um dos assuntos abordados nesse trabalho. Foram estudadas as tcnicas clssicas
existentes para separao de fontes considerando uma mistura convolutiva, na qual
existe uma dependncia temporal. As tcnicas foram testadas no domnio do tempo
[1] e, no domnio da frequncia [6,7], com o intuito de compararmos suas eficcias.
Existem mltiplas aplicaes envolvendo separao cega em misturas convolutivas.
Em acstica, diferentes fontes de som so gravadas simultaneamente com vrios
microfones. Essas fontes podem ser de voz ou fontes de msica. Tambm temos os
sinais gravados de sonares ultramarinos. Nas comunicaes de rdio, matrizes de
antenas recebem misturas compostas por diferentes sinais. A separao de fontes
aplicada na rea de astronomia ou imagens de satlite. Por ltimo, os modelos
convolutivos tm sido utilizados para interpretar dados funcionais de imagens
cerebrais e voltagem de sinais biomdicos.
Para alcanar esse objetivo, faremos uso do Matlab em diferentes cenrios e
problemas, como no exemplo da separao de sinais de voz e udio.

2-2
2-5

2. FUNDAMENTAO TERICA

3-2
3-1

A leitura e compreenso do cenrio a ser exposto foram de suma importncia para


inteligibilidade do problema nos quais se aplicam as tcnicas de separao cega de
fontes.
A realizao bem sucedida do tema em uma etapa anterior de iniciao cientfica,
abordando naquela primeira fase somente misturas instantneas, foi primordial para
que houvesse continuidade nos estudos que envolvem o mote dessa pesquisa. Nesse
trabalho enfatizamos o carter de separao convolutiva e muitos dos conceitos j
vistos se aplicam plenamente para esse novo caso.
O sistema completo (transmisso, mistura e separao) foi implementado em
Matlab, incluindo uma interface grfica amigvel que torna a simulao mais simples e
o acesso mais fcil. Com tal simulador, foi possvel testar o desempenho dos diversos
algoritmos quando aplicados separao de diferentes misturas e os grficos sero
mostrados em janela apropriada a fim de compararmos os resultados obtidos.
Ser imprescindvel a compresso de alguns conceitos que envolvem as tcnicas de
separao que sero estudadas.

Esperana
A esperana de uma varivel aleatria por definio a mdia de sua distribuio de
probabilidades. Sendo definida pelo smbolo E(x). Caso x seja uma varivel aleatria
discreta assumindo valores {x1,x2,x3,...} com probabilidade {p1,p2,p3, ...},
respectivamente, ento sua esperana dada pela frmula:

E(x) = xi p( xi ) ()
i=1

3-3

3-4

Desde que o somatrio seja bem definido. Caso E(x) seja finita, diz que x integrvel.

Correlao Cruzada
3-5

A medida de correlao entre duas variveis aleatrias x e y pode ser definida, como
sendo o quo forte um par de variveis esto relacionadas. A correlao entre duas
variveis distintas pode ser definida como:

4-5

E[xy] = xy f(x, y)dx dy


4-2

()
4-1

onde f(x,y) definida como a funo densidade de probabilidade das variveis x e y.


4-3

O coeficiente de correlao, quando normalizado, varia no intervalo entre -1 e +1,


podendo tambm ser nulo. Quando E[xy] nulo, os sinais so ditos
descorrelacionados.
A autocorrelao mede a semelhana entre amostras de um mesmo sinal obtidas em
instantes de tempo diferentes. Ela permite que se analise o grau de irregularidade de
um sinal. Podemos dizer que a correlao cruzada de um sinal com ele prprio.
4-4

Em um dado instante qualquer entre t1 e t2, verifica-se se o sinal tem alguma


correlao. Pode ser um intervalo contnuo ou discreto.
A autocorrelao nula indica que as amostras do sinal so descorrelacionadas. A
autocorrelao informa o quanto o valor de uma realizao de uma varivel aleatria
capaz de influenciar seus vizinhos.
Para um processo estacionrio, a funo autocorrelao depende apenas da
diferena entre os instantes t1 e t2 . Assim, neste caso, definindo-se = t2 - t1 pode-se
reescrever a equao 2 como:

() = E[x(t) x(t + )]

()

2.1 DEFINIO DO MODELO:

Um dos problemas tpicos investigados por tcnicas de separao cega de fontes o


chamado cocktail party. Em uma festa ou reunio, vrios tipos de sinais (fontes) esto
presentes e perturbam a compreenso e identificao de uma determinada fonte em
especial. Graas grande capacidade de processamento do crebro humano, no
sentimos dificuldade em realizar tal tarefa e a fazemos facilmente no nosso dia-a-dia.
Entretanto, se utilizarmos sensores, necessrio um esforo considervel para extrair,
a partir de um sinal captado, a informao de uma fonte sem interferncia de outras e
sem conhecer, a priori, nenhuma das fontes.
A mistura empregada no sistema completo desconhecida, entretanto, leva-se em
considerao a hiptese de que os sinais das fontes so estatisticamente
independentes entre si. Essa hiptese tem um peso forte e conhecida como Anlise

5-2

por Componentes Independentes (ICA) e foi considerada no desenvolvimento de


tcnicas empregadas no contexto de separao cega de fontes.
Em muitas situaes, deseja-se recuperar todas as fontes de misturas gravadas ou,
ao menos, separar algumas delas. No entanto, pode ser til identificar o processo de
mistura por si s, j que esse pode revelar informaes sobre a natureza do sistema de
mistura em si.

2.2 Misturas instantneas

5-1

Imagine que voc est em uma sala onde duas pessoas esto falando
simultaneamente. Voc tem dois microfones fixados em dois locais distintos. Esse dois
microfones fornecem duas gravaes de sinais temporais, os quais podemos denotar
por X1(n) e X2(n) no instante n.
A figura 1 ilustra o problema citado para o caso de M misturas. Na figura 1 temos N
fontes independentes sendo tambm N o total de sinais recuperados. Denotamos a
matriz de mistura por A e a matriz de separao por W.

Figura 1: Modelagem de Separao Cega de Fontes

Cada uma das gravaes temporais fornecidas por cada microfone uma soma
ponderada dos sinais emitidos. Podemos expressar o vetor X(n) que contm as
observaes (amostras) de um total de M misturas (geralmente MN) pela equao:
X(n) = A . S(n) ()

6-1

Onde S(n) = [ S1(n), S2(n), S3(n), ... , SN(n) ] um conjunto com N fontes
independentes. De maneira geral, no caso de misturas instantneas, podemos
representar cada elemento do vetor de observaes X(n) como sendo :
X1 = A11S1 + A12S2 +...A1NSN
X2 = A21S1 + A22S2 +...A2NSN ()

.
.
.
XM = AM1S1 + AM2S2 +...AMNSN

onde Aij so constantes.


O objetivo ento estimarmos uma matriz W que seja a inversa da matriz A, sem
conhecer previamente as fontes originais e a matriz mistura A. Na prtica, ns no
sabemos como determinar W exatamente, pois no temos conhecimento da matriz A,
mas podemos encontrar uma estimativa que nos d uma boa aproximao.
Basicamente, para isso, consideramos a hiptese de que as fontes so independentes
e buscamos sinais Yi(n) com { i=1, ... ,N } tambm independentes. Dessa forma
precisaremos medir a independncia entre os sinais recuperados e comentaremos a
respeito logo a seguir.
Novamente considerando que a matriz de mistura inversvel, pode-se recuperar os
sinais das fontes atravs de uma matriz W tal que:
Y(n) = W . X(n) ()
Idealmente, se temos a equao W = A-1, relacionando ambas matrizes, podemos
concluir que teremos
W. A S = S

()

sabemos que A. A-1 = I e que qualquer matriz T multiplicada pela identidade I resulta
na prpria matriz, ou seja, T. I = T, ento realizando as substituies necessrias,
chegamos na equao 7.
A chave para a estimativa do modelo ICA a busca da independncia entre os sinais.
Visto que as fontes so independentes e, se os sinais Y(n) tambm forem
independentes, garantimos que estes sinais sero iguais a S a menos de um ganho e de
uma ambiguidade de ordem. As restries impostas para isso so:

O nmero de misturas observadas M deve ser maior ou igual ao nmero de


componentes independentes N, assim MN;
6

As fontes devem ser estatisticamente independentes entre si. Podemos definir


essa independncia estatstica de misturas em termos da probabilidade das
mesmas, ou seja, a densidade conjunta pode ser fatorada resultando no
produto das densidades marginais:

7-1

() = [ ()]
=1

As componentes independentes devem possuir distribuies de probabilidades


no-gaussianas. Na verdade, apenas uma componente gaussiana permitida,
uma vez que combinaes lineares de uma varivel gaussiana tambm
apresenta distribuio gaussiana.

7-2

Retomando a equao (6), temos que


Y=CS

7-3

()

onde
C = DP

()

sendo D uma matriz diagonal de ganho e P uma matriz de permutao. Assim, as


fontes originais sero recuperadas a menos de uma ambiguidade de ganho e ordem.
Em seguida, discutiremos os principais conceitos e critrios que permitem medir a
independncia entre sinais.

2.2.1 Informao Mtua


Informao mtua uma medida natural de dependncia entre variveis aleatrias.
Trata-se da quantidade de informao que uma varivel aleatria carrega sobre outra
varivel aleatria.
I (x, y) = H(x) H(xy) ()
Onde x e y so duas variveis aleatrias, H(x) a medida da entropia de x e H(x/y) a
entropia condicional, ou seja, a incerteza restante em uma distribuio aps se
conhecer a outra.
A informao mtua I(x,y) pode ser reduzida para:
7-4

I (x, y) = I(y, x) = p(x, y)log2

p (x, y)
()
[p(x)p(y)]
7

8-1

A informao mtua entre duas variveis ser baixa quando elas forem fracamente
correlacionadas e, alta, na situao contrria. Essa grandeza sempre no-negativa e
vale zero se e somente se vigora uma condio de independncia. Assim, I(x,y) = 0
somente se x e y forem independentes.
Assim, tal medida se torna interessante para ser usada como critrio para separao
de fontes. De fato, a minimizao da informao mtua equivalente a maximizao
da soma das no-gaussianidades das estimativas, quando as estimativas so foradas a
serem descorrelacionadas. A restrio de descorrelao no de fato necessria, mas
simplifica consideravelmente o mtodo computacional empregado.

8-2

8-3

Uma estratgia til de pr-processamento em ICA primeiro branquear as variveis


observadas. Isso quer dizer que antes da aplicao do algoritmo ICA, e depois da
centralizao; que trata-se essencialmente da subtrao de cada um dos valores de
X(n) de sua mdia temporal; transformamos linearmente o vetor X(n) observado para
obtermos um novo vetor Xb(n) que branco, i.e. suas componentes so
descorrelacionadas e suas varincias unitrias. Em outras palavras, a matriz de
covarincia de Xb (n) igual a matriz identidade:
E{ Xb(n). Xb (n)T} = I

8-5

()

O branqueamento sempre possvel. Um mtodo popular para branqueamento


usar a decomposio dos auto-valores (EVD do ingls Eigenvalue Decomposition) da
matriz de covarincia E{ Xb(n). Xb(n)T} = EDET , onde E a matriz ortogonal dos autovetores de E{ Xb(n). Xb (n)T} e D a matriz diagonal dos seus auto-valores, D =
diag(d1,...,dn) [11]. Note que E{ Xb(n). Xb(n)T} pode ser estimada na forma padro das
amostras disponveis Xj(n),...,XM(n), com j={1,...,M}. O branqueamento pode ser feito
por:
Xb(n)= ED- ETX

()

onde a matriz D- computada por uma simples componente de operao como D- =


diag (d1-,...dn-). Agora fcil de verificar que E{ Xb(n). Xb(n)T} = I
O branqueamento transforma a matriz mistura em uma nova matriz, . Conforme
abaixo:
Xb = ED- ETAS = S

()

A utilidade do branqueamento reside no fato de que a nova matriz de mistura


ortogonal. Isso pode ser visto dado que:
E{ Xb(n). Xb(n)T} = E{ S ST} T = T = I ()
8

8-4

Aqui podemos ver que o branqueamento reduz o nmero de parmetros a serem


estimados. Ao invs de ter n2 parmetros que so os elementos da matriz original A,
precisamos somente estimar a nova matriz ortogonal de mistura . Uma matriz
ortogonal contm n(n-1)/2 graus de liberdade. Por exemplo, em duas dimenses, uma
transformao ortogonal determinada por um parmetro angular nico. Em grandes
dimenses, uma matriz ortogonal contm somente cerca de metade do nmero de
parmetros de uma matriz arbitrria. Assim pode-se dizer que o branqueamento
resolve metade do problema de ICA [11]. Porque o branqueamento um
procedimento padro simples e muito mais simples que outros algoritmos em ICA,
uma excelente forma de reduzir a complexidade do problema.
Para facilitar a visualizao dessas etapas, a figura 2 ilustra duas fontes
independentes com distribuies uniformes no intervalo entre [-1,1]. Os sinais X,
obtidos da mistura destas duas fontes, pode ser visualizado na figura 3. Com a
operao de pr-branqueamento, obtemos a figura 4. possvel notar que, com esta
operao, conseguimos uma correo da escala, mas continua havendo uma rotao
que ser corrigida com a aplicao do algoritmo em questo.
1.5

0.5

Fonte 2

9-1

-0.5

-1
-1

-0.5

0.5

1.5

Fonte 1

Fig. 2 Distribuio conjunta das componentes independentes S1 e S2

-1

-2

-3

-4
-2.5

-2

-1.5

-1

-0.5

0.5

1.5

2.5

Dados misturados

Fig. 3 A distribuio conjunta das misturas X1 e X2

1.5

0.5

-0.5

-1

-1.5

-2
-2

-1.5

-1

-0.5

0.5

1.5

Branqueamento

Fig. 4 Branqueamento ou Descorrelao dos dados

10

2.2.2 Infomax
Um algoritmo bastante conhecido pela comunidade cientfica e estudado foi o
Infomax [16]. Ele baseado no conceito de maximizao da entropia dos sinais de
sada Y.
No houve necessidade de branqueamento do sinal de mistura observado, uma vez
que a convergncia ocorreu sem grandes esforos adicionais como veremos a seguir.

11-1

Para essa verso do Infomax, temos a atualizao da matriz W dada pela equao
abaixo:
W W + .{ [WT] -1 + E[(1 2Y ) XbT]} ()

onde corresponde ao passo de adaptao arbitrrio adotado no incio da simulao.

2.2.3 Infomax Estendido


Outro algoritmo de grande importncia foi proposto inicialmente por Te-Won Lee et
al. [12], que desenvolveram uma verso generalizada ou estendida do INFOMAX,
denominado Extendend-Infomax (ou tambm E-Infomax). O algoritmo proposto
estima os momentos das fontes originais e chaveia o algoritmo de acordo com o tipo
de fonte super ou sub-gaussiana.
Na sua forma original, o algoritmo Infomax considera uma no-linearidade fixa, de
maneira que os cenrios nos quais o algoritmo capaz de separar os sinais ficam
restritos a alguns tipos particulares de fontes. A influncia da escolha destas nolinearidades assunto de alguns artigos encontrados na literatura [13],[14]. No
entanto, argumenta-se que, em geral, possvel obter bons resultados selecionandose apenas algumas funes.
Esta idia foi ponto de partida para uma das modificaes do algoritmo Infomax,
apresentada em [12]. No trabalho, introduziu- se um parmetro adicional para
determinar qual o tipo de no-linearidade que deve ser utilizada. Empregando apenas
duas no-linearidades: g(y) = y - tanh(y), para fontes sub-gaussianas, e g(y) = y +
tanh(y), para fontes super-gaussianas, possvel obter o algoritmo denominado
Infomax Estendido, capaz de trabalhar em cenrios com fontes de diferentes classes.
Com isso a equao de atualizao da matriz W dada como:

11

W W + { I + E[ M tanh(Y)YT YYT] } ()
12-1

onde M = diag(m1, . . . ,mn) uma matriz diagonal tal que, idealmente, mi = 1 para
fontes super-gaussianas e mi = 1 para fontes sub-gaussianas. A adaptao dos
parmetros feita atravs da seguinte equao:

= sign(E{sech2(Yi)}E{Y2i } E{tanh(Yi)Yi}) ()

2.2.4 Gradiente Natural


Diferentemente dos outros algoritmos analisados, o Gradiente Natural no requer
inverso de matrizes, sendo esta uma grande vantagem com relao ao custo
computacional requerido e conseqentemente na velocidade de convergncia [15].
Tal como o Infomax, em suas duas verses analisadas anteriormente, o Gradiente
Natural necessita do conhecimento, a priori, da distribuio das fontes originais. O
algoritmo desenvolvido por Amari et al. [15] mede a dependncia entre as sadas
atravs da informao mtua e utiliza a tcnica de gradiente natural para minimiz-la.
Assim, a dependncia entre as componentes minimizada.
As funes g(.) , so funes no lineares escolhidas de acordo com os sinais de
sada; em geral utiliza-se para g(.) os seguintes valores:
tanh(y) componentes super-gaussianas
y componentes sub-gaussianas
Assim tem-se a equao de atualizao de W abaixo:
W = W + ( I + E[ g(Y)YT ]) W

2.2.5 No-Gaussianidade
Outra forma de separarmos sinais misturados explorando o Teorema Central do
Limite, um resultado clssico na teoria da probabilidade, que mostra como a
distribuio de uma soma de variveis aleatrias independentes, que no sejam
gaussianas, tende em direo a distribuio gaussiana, sob certas condies. Assim, a
soma de duas variveis independentes normalmente tem uma distribuio que se
12

12-2

aproxima mais de uma distribuio gaussiana do que as duas variveis aleatrias


originais.
Vamos assumir que um vetor de dados X(n) uma mistura de componentes
independentes, como mostrado na equao (4). Para estimar uma das componentes
independentes, ns consideramos uma combinaao linear de S . Se W fosse a inversa
de A, (6) nos daria uma das fontes originais. A questo agora : Como poderemos usar
o Teorema Central do Limite para determinar W sendo que no caso ideal, ele deveria
ser igual inversa de A?
Como quanto mais sinais misturamos, mais gaussiano ser o sinal de mistura,
precisamos encontrar sinais Y que sejam o mais no-gaussianos possveis. Portanto,
precisamos estimar W de forma a maximizar a no gaussianidade de WT X. Podemos,
ento, colocar a questo: Como medir a gaussianidade de um sinal? Algumas medidas
nos permitem chegar l. Como discutiremos na sequncia:

2.2.6 Curtose
definida como uma medida robusta de disperso que caracteriza o "achatamento"
da curva da funo de distribuio da varivel aleatria em relao a uma curva padro
ou curva normal. Pode ser positiva ou negativa. Variveis aleatrias que tem curtose
negativa so chamadas de sub-gaussianas, e aquelas com curtose positiva so
chamadas super-gaussianas.
A curtose de y classicamente definida como:
k(y) = E( 4 ) 3(E{ 2 })2 ()

Se x1 e x2 so duas variveis aleatrias independentes, teremos:

k(1 + 2 ) = k(1 ) + k(2 ) ()


e
k(1 ) = 4 k(1 )

()

onde um escalar.
Alm disso, um sinal gaussiano possui curtose nula. Sendo assim, podemos us-la
para medir a no gaussianidade de um sinal definindo o seguinte critrio:
13

mx | k(y)|

()

Uma outra medida possvel a chamada negentropia:

2.2.7 Negentropia
A negentropia se baseia no fato de que a entropia de uma varivel gaussiana maior
do que a entropia de todas as outras variveis aleatrias de mesma varincia. De fato,
isso mostra que a distribuio gaussiana a mais aleatria ou a menos estruturada
de todas as distribuies [11]. Entropia pequena para distribuies que so
claramente concentradas em certos valores. Assim, a negentropia pode ser definida
como:
J(y) = H(yGauss ) H(y) ()
Onde yGauss a varivel aleatria gaussiana de mesma matriz de covarincia que y.
Devido s propriedades salientadas, a negentropia sempre no negativa, e nula se e
somente se y for gaussiana. Visto que a estimao da entropia de uma varivel uma
tarefa computacionalmente difcil, necessrio se utilizar aproximaes de (23). Como
exemplo, uma aproximao possvel usar momentos de ordem superior:
J (y)

1
1
E(y 3 )2 + k(y)2 ()
12
48

Assim podemos definir, como busca da no-gaussianidade, um critrio baseado na


maximizao da negentropia de y.
Esse conceitos formam a base para o desenvolvimento de algoritmos de separao
cega de fontes, dentre eles o conhecido Fast-ICA.

2.2.8 Algoritmo Fast-ICA


O algoritmo FastICA um algoritmo de ponto fixo que busca justamente maximizar a
no-gaussianidade de Y, separando assim as fontes misturadas. um algoritmo de
convergncia bastante rpida e cuja implementao simples, o que faz dele um
algoritmo muito usado dentro do contexto de separao de fontes.

14

14-1

Considere uma matriz A quadrada e compatvel com (4), com coeficientes aleatrios
uniformemente distribudos. Considere tambm que X(n) foi previamente prbranqueado como discutido na seo 2.2.1.
Assim, a equao de adaptao do algoritmo Fast-ICA dada por [2]:
W E{ Xb.g(WT. Xb)} E{g(WT. Xb)}W ()
Denotamos por g e g a derivada de primeira e segunda ordem, respectivamente da
funo g no-linear usada na equao 25. Alguns exemplos de funes bastante
usadas so:
g1(u) = tanh(a1.u)
g2(u) = u.exp(-u2/2)
onde 1 a1 2 uma constante adequada, muitas vezes tomada como a1 = 1 [8].
Na seo 3 de simulaes que ser mostrada a seguir, foi adotado g'(u)=tanh(u) e
g"(u)=sech2(u).
Em seguida, veremos como as tcnicas apresentadas aqui podem ser estendidas e
usadas no contexto de misturas convolutivas.

2.3 Misturas Convolutivas


15-1

Agora vejamos o modelo de mistura linear convolutiva, que diferentemente daquele


associado a misturas instantneas, considera o efeito da propagao do sinal atravs
do meio.
Em um modelo simples, a mistura consiste em uma soma de fontes de sinais com
diferentes ponderaes. No entanto, em muitas aplicaes do mundo real, como no
exemplo de acstica, o processo de mistura um pouco mais complexo. Neste caso,
cada fonte contribui para a soma de mltiplos atrasos correspondentes aos mltiplos
trajetos pelo qual um sinal acstico se propaga at um microfone. Essa soma de
diferentes sinais o que chamamos de mistura convolutiva.
A funo de transferncia entre cada par fonte - sensor, pode ser escrita como:

() = [ ( ) ( )]

(26)

=1 =0

para j=1,...,M, de maneira que o sinal recebido uma composio de sinais filtrados.
Aji um filtro FIR com ordem P-1. Cada escalar Aji(l) determina o quanto da fonte i
15

(27)

est presente na mistura j. Denotando de outra forma, onde o smbolo * representa


convoluo:

() = ()
=1

onde denota a resposta ao impulso do filtro correspondente propagao entre


a fonte i e o sensor j e o smbolo * representa a operao de convoluo.
A matriz de mistura A em (27) definida de forma que cada elemento Aji = [Aji(0),

Aji(1), ... , Aji(P-1)] seja a resposta ao impulso de um filtro FIR (resposta ao impulso
finita) de comprimento P.
J a matriz separadora (ou matriz inversa) W similar a matriz A, porm contm
filtros Wij = [Wij(0), Wij(1), ... , Wij(Q-1)] separadores, de comprimento Q e tem
dimenso NxM. Depois de estimada a matriz, cada fonte recuperada Yi(n)
encontrada da seguinte forma:

() = [ () ( )]

(28)

=1 =0

A separao, neste caso, pode ser obtida atravs de um conjunto de filtros Wij de
maneira que a estimativa das fontes tambm resulta de um processo de filtragem.

Figura 4: Mistura convolutiva com 2 fontes e 2 sensores

16

Note pela figura 4 que o modelo de mistura, assim como o sistema separador, so
basicamente filtros com mltiplas entradas e mltiplas sadas (MIMO - Multiple Input
Multiple Output). Pode-se utilizar a notao matricial para representao do sistema,
assim como nas equaes 4 e 6, simplesmente alterando-se as matrizes A e W.
Existem vrios mtodos propostos na literatura que permitem estimar a matriz W
e/ou extrair as fontes conhecendo-se somente as misturas X(n) . Uma questo de
extrema relevncia diz respeito s condies sob as quais possvel inverter
perfeitamente o processo de mistura por meio de uma estrutura linear.
Matematicamente, queremos determinar sob quais condies possvel obter um
filtro W[z] tal que
W[z].A[z] = I

(29)

Esta condio conhecida no contexto de comunicaes como condio zeroforcing, e W[z] denominado equalizador zero-forcing [8].
No contexto de filtros MIMO, a condio de inversibilidade do sistema definida
atravs do posto da matriz A[z] [8].
Teorema 1: Seja A[z] uma matriz polinomial representada atravs da sua transformada
z A[z] = A(0) + A(0)z-1 + ... + A(P-1)z-P+1 . Existir uma matriz polinomial W[z] tal que
W[z]A[z] = I se somente se o posto de A[z] for completo, para qualquer valor de z na
circunferncia de raio unitrio, |z|=1.
O teorema assegura a existncia de uma matriz linear capaz de inverter a mistura. No
entanto, no garante que a estrutura possua resposta ao impulso finita, ou FIR,
tampouco que ser causal.
Em alguns casos possvel inverter um sistema MIMO-FIR com outra estrutura de
mesma natureza. De fato, isso ocorre para os casos enunciados no seguinte teorema,
que corresponde Identidade de Bezout [8].
Teorema 2: Seja A[z] uma matriz polinomial retangular, tal que o posto de A[z] seja
completo para qualquer z incluindo . Ento existe uma matriz polinomial

[] = ( )

(30)

=0

com Q finito, tal que W[z].A[z] = I.


Um fato observado em matrizes polinomiais com mais linhas do que colunas, o que
representaria uma mistura com mais sensores do que fontes, que, a menos de alguns
17

casos restritos, a condio expressa pelo teorema 2 quase sempre satisfeita [8]. O
mesmo, no entanto, no ocorre para o caso em que as matrizes so quadradas.
Neste trabalho, estudamos algumas tcnicas para separao de misturas
convolutivas no domnio temporal e tambm no domnio da frequncia. Tais mtodos
sero descritos a seguir.

2.3.1 Fast-ICA Convolutivo


O estudo foi iniciado pela implementao de tcnicas no domnio temporal. Assim
sendo, consideramos o artigo [1] no qual os autores estendem a tcnica do Fast-ICA, j
descrito para misturas instantneas em 2.2.8, para o caso das misturas convolutivas.
O Fast-ICA Convolutivo uma tcnica de Separao Cega de Fontes (em ingls, Blind
Source Separation ou BSS) uma vez que tem-se apenas disponveis os sinais dos
sensores ou misturas observadas (vetores observaes X(n)). Nada se sabe sobre as
fontes originais ou sobre o ambiente no qual elas esto inseridas.
O algoritmo aqui apresentado trabalha no domnio temporal, utilizando a nogaussianidade como base para definio do critrio que permitir recuperar as fontes
misturadas conforme discutido na seo 2.2.8. De fato, um algoritmo de ponto-fixo
que utiliza a curtose ou a negentropia para maximizar a no-gaussianidade dos sinais
observados.
O primeiro passo com o objetivo de estender o Fast-ICA para o caso de misturas
convolutivas abordar o processo de pr-branqueamento dos dados. Para isto, [1]
prope escrever o vetor de misturas da seguinte forma:

() = [X1 (n R), , X1 (n + R), , X M (n R), , X M (n + R)]T (31)

onde R um parmetro que definir o tamanho dos filtros da matriz W em um passo

() tem um tamanho que pode ser definido por V=(2R + 1)*M.


posterior. Note que
Assim, o vetor () = [ (n), , (n)]T pode ser definido como:

() = ()

(32)

uma matriz V x V escolhida tal que:


Onde
[ () ()] = ,, [1,...,V]

(33)

Com relao s etapas citadas acima, a operao (32) pode ser considerada como
branqueamento convencional, o que consiste da anlise de componentes principais e
18

normalizao. Agora, com respeito ao vetor observao original X(n), podemos


interpretar diferentemente. As equaes (31) e (32) mostram sem dvida que os sinais

() so misturas convolutivas de X(n) . J a equao (33) demonstra que os sinais


() so criados para terem varincias unitrias e para terem descorrelao mtua, o
que pode ser visto como um branqueamento espao temporal e normalizao das
observaes ().
O algoritmo Fast-ICA, ou algoritmo de ponto fixo, uma verso rpida, como o
prprio nome j diz, para se encontrar o gradiente da negentropia (ou curtose) e
busca-se maximizar o valor absoluto dessa ao realizar a derivao com respeito a
matriz W. Especificamente, [1] comea propondo uma extenso de [2], ou seja, do
algoritmo de ICA curttico convolutivo de ponto-fixo rpido baseado na matriz W. Ele
capaz de encontrar com maior eficincia o ponto de maximizao dos valores da
funo aplicada para a estimativa do algoritmo.
Assim, considerando primeiramente o critrio baseado na curtose, a equao de
adaptao do vetor W dada por:

1) W = E [ (W T ) ] 3W

19-1

(34)

2) W = ||W||

(35)

onde os filtros que compe os coeficientes da matriz W so iniciados aleatoriamente.


Em seguida, repete-se os passos 1) e 2) acima quantas vezes forem necessrias a fim
de atualizar os pesos at a convergncia. Em geral, poucas iteraes j so suficientes.
Outra funo contraste que tambm permite avaliar a no-gaussianidade a
negentropia foi discutida em 2.2.7. Tal funo tem mostrado render melhor robustez e
varincia mais baixa que a curtose aproximada [1]. Em particular, o critrio
negentrpico mais robusto para valores extremos do que o critrio curttico, o qual
envolve momentos de quarta ordem, cuja estimativa mais sensvel a discrepncias
(outliers).
A equao de adaptao que define o caso negentrpico :

W = E[ g(W T )] E[ g(W T )]W

(36)

A funo g, no-linear, empregada na etapa descrita e que rendeu melhor


desempenho foi g(u) = exp(-x/2) [1].

19

Tendo estimado W atravs de (34) e (35) ou (36) permite-se obter uma estimativa
de uma das fontes, a menos de um fator de escala e um fator de atraso. O vetor Yi(n)
extrado atravs da equao (37).

(n) = W () = ()
T

(37)

=1

onde W uma matriz composta por V entradas de coeficientes Wm que, juntos com
(32), resulta em uma combinao convolutiva Yi(n) das observaes.
Realizando tais procedimentos e considerando todas as suposies iniciais j
comentadas em tpicos anteriores desse trabalho, temos que rememorar que o
objetivo principal da tcnica BSS, no caso convolutivo, tipicamente estimar a
contribuio de todas as fontes em cada observao. Esse mtodo chamado de
Mtodo Baseado em Deflao, consiste em subtrair cada fonte recuperada das
misturas X(n) e rodar o algoritmo novamente, de forma a recuperar uma outra fonte,
diferente da primeira j identificada. Para isto, aps a recuperao da fonte,
precisamos identificar qual a contribuio do sinal Yj(n) em cada mistura Xi (n) . Os
filtros que permitem executar tal tarefa so chamados de filtros de colorao e
denotaremos por Cij(n) o filtro que representa a contribuio da i-sima fonte na jsima mistura.
A minimizao do erro mdio quadrtico resulta nos conhecidos filtros de Wiener
[10 ].

Cij = R1
j . rYj Xi

(38)

onde R j a matriz de autocorrelao do sinal E[Yj(n).Yj(n)] e, o vetor de


correlao cruzada entre E[Yj(n).Xi(n)].
Os filtros de colorao so obtidos buscando-se minimizar o erro mdio quadrtico
entre Xi(n) e Cij(n)*Yj(n). Esse filtro no-causal calculado atravs da equao 38
mostrada logo a seguir. A condio de no-causalidade empregada devido ao fato
que o sinal Y(n) pode estar atrasado com relao as fontes S(n) .

Ainda aplicando o mtodo de deflao, a prxima etapa consiste em subtrair os


valores obtidos das contribuies Cij(n)*Yj(n) de todas as M-simas observaes,
obtendo outra configurao de mistura com N-1 fontes.
20

Assim sendo, caso N 1, existir mais fontes a serem recuperadas, ento as etapas
descritas nas equaes de 31 35 devem ser repetidas. Para facilitar, podemos
enumerar os passos a serem seguidos:

1) Identificar os vetores Yi(n) de uma fonte Si(n) a partir das observaes X(n).
2) Identifica-se os M filtros de colorao e aplica-os ao vetor Yj(n) a fim de
recuperar as contribuies de Si(n) em cada observao, isto , Xj(n).
3) Subtrai-se as contribuies de todas as observaes.
4) Seleciona-se N N 1. Caso N 1, retorna-se para o passo 1) a fim de extrair
a outra fonte.

2.4 Domnio da frequncia


Em se tratando de mtodos para separao cega de fontes podemos tambm citar
a separao no domnio da frequncia.
Em um ambiente real, como j salientamos, os sinais de udio so convoludos com
a resposta ao impulso do filtro empregado, de tal forma que isso representa o caminho
entre a fonte e os microfones. Assim sendo, cada elemento da matriz de separao
compe um filtro FIR. Sabemos que uma operao de convoluo no domnio do
tempo representa uma multiplicao no domnio da frequncia, obtida atravs da
aplicao da Transformada de Fourier. Tendo uma simples multiplicao entre a matriz
de mistura e as fontes, possvel contornar o problema da mistura convolutiva no
domnio do tempo passando para uma mistura instantnea no domnio da frequncia.
Assim, a tcnica de separao de misturas instantneas baseada em ICA mostradas na
seo 2.2, podem ser aplicadas no domnio da frequncia, e posteriormente retorna-se
ao domnio do tempo atravs da operao da Transformada Inversa de Fourier. A
vantagem de tal procedimento a reduo considervel do custo computacional para
execuo do algoritmo.
Um ponto bastante importante a ser considerado o fato de que as ambiguidades
de permutao e escala inerentes soluo de BSS, no domnio da frequncia
precisam ser resolvidas para recuperao plena das fontes.
Cada frequncia gera componentes independentes a serem agrupadas para uma
mesma fonte antes de aplicarmos a Transformada Inversa de Fourier. Assim, de
extrema importncia corrigir a escala e garantir a ordem de recuperao das fontes,
sendo essencial para que o sinal seja obtido corretamente aps a operao da
Transformada Inversa.

21

Uma viso abrangente do algoritmo de separao de fontes do domnio da


frequncia pode ser vista conforme mostra a figura 5 abaixo.

Figura 5: Diagrama do domnio da frequncia BSS

O primeiro passo transformar cada um dos sinais Xj (n), j=1,...,M para o domnio
da frequncia Xj (,t), com = 0,..., -1 (onde w o ndice em frequncia e t o
ndice temporal de cada quadro), utilizando para tal a Transformada de Fourier de
Tempo-Curto (STFT em ingls).
O fluxo BSS no domnio da frequncia mostrado conforme denota a figura 5.
Usando a Transformada de Fourier de Tempo-Curto, os sinais observados no domnio
do tempo so transformados em sinais no domnio da frequncia atravs da operao
abaixo:
1

(, ) = ( + ) () /

(39)

=0

22-1

Onde w(k) denota uma funo janela.


Aps esse passo realizado o pr-processamento, o que efetivamente, consiste no
branqueamento dos sinais, gerando sinais branqueados Xbj (,t).
Uma desvantagem da utilizao da Transformada de Fourier, que na
transformao para o domnio da frequncia a informao do tempo perdida, exceto
no caso do sinal ser estacionrio (mesma componente em frequncia ao longo do
tempo). Pelo fato dos sinais possurem inmeras caractersticas transitrias, ainda
mais se tratando de sinais de udio por exemplo, a Transformada de Fourier de
Tempo-Curto foi adotada como forma de contornar essa situao. Desse modo, a STFT
utiliza uma pequena poro do sinal de cada vez. o que chamamos de janela
deslizante sobre o sinal. Essa tcnica trabalha com o sinal numa funo de duas
22

22-2

dimenses de base tempo e frequncia. No entanto, essa informao obtida somente


ter boa preciso caso o tamanho e tipo de janela escolhidas estiverem de acordo e a
janela deve ser fixa para todas as frequncias trabalhadas.
A separao no domnio da frequncia supe que os sinais so independentes para
cada frequncia empregada. As tcnicas de BSS no domnio da frequncia estimam a
matriz B() para cada componente em frequncia , e o vetor com as sadas
separadas
Y (,t) = [Y1 (,t),..., YN (,t)]T, ambos permutados e escalados.
A equao que define como o sinal estimado Y (,t) encontrado encontra-se a
seguir:
Y(,t) = B(). X(,t)

(40)

onde B a matriz de separao na frequncia e Yi (,t), i=1,...,N.


Aps a soluo do problema para todas as frequncias , so ento resolvidos os
problemas de permutao e escala.
Na ltima etapa, os sinais de tempo-frequncia so reconstrudos usando a
Transformada Inversa de Fourier no Tempo-Curto. Ela utilizada para converter os
sinais estimados das fontes do domnio da frequncia em sinais no domnio do tempo
novamente.
1

1
= (, ) /

(41)

=0

Visto que podemos aplicar vrios algoritmos utilizados inicialmente no contexto de


misturas instantneas (seo 2.2) no domnio da frequncia, descrevemos na
sequncia como se d a transio do contexto instantneo para o tratado aqui.

2.4.1 Fast-ICA revisitado


Para cada frequncia os sinais misturados em tempo-frequncia so separados
de forma independente, portanto, as premissas de anlises de componentes
independentes, ou ICA, so utilizados amplamente para esse problema. Assim sendo,
sabe-se sobretudo que o ICA explora o fato da independncia estatstica entre os sinais
das fontes originais, a fim de separ-los a partir dois sinais de misturas, tentando fazer
os sinais mais independentes possveis um do outro. Essa considerao j conhecida
para o nosso estudo de caso e, por isso mesmo, quanto mais as fontes de sinais forem
no-gaussianas e, mutualmente independentes, melhor dar-se- a separao.
23

A extenso do Fast-ICA para aplicao no contexto do domnio em frequncia


estudado aqui foi proposto em [1] e tem como principal diferena com relao ao
algoritmo apresentado em 2.2.8, o fato de agora temos que lidar com dados
complexos. A equao de adaptao segue abaixo:

24-1

i () = E{X(Bi ()X) g(|Bi ()X|2 )} E{g(|Bi ()X|2 )


B
+ |Bi ()X|2 g (|Bi ()X|2 )}Bi ()
()
B
Bi () = i
||Bi ()||

(42)

onde Bi() um vetor que compe a matriz de separao B(). A funo nolinear g(.) empregada pelo artigo foi g(u) = log(0.1+u) e g'(.) denota seu diferencial.
A fim de recuperar as fontes de forma satisfatria no domnio temporal, todas
indeterminaes, tanto de permutao quanto de escala, devem ser resolvidas antes
de aplicar a Transformada Inversa de Fourier em Tempo-Curto.
Mesmo realizando a operao de atualizao referente matriz de separao B()
(42), restar a ambiguidade.
A fim de sanar o problema de permutao, antes de mais nada deve-se considerar
alguns fatores. Quando aplica-se a Transformada de Fourier de Tempo-Curto, os
espectros do vetor de observao das fontes mudam ao longo da frequncia, o que
quer dizer que se as frequncias so muito estreitas, os espectros vizinhos dessas
frequncias tero alto grau de correlao. Alm disso, pode-se esperar que a matriz de
separao obtida pelo Fast-ICA nas frequncias adjacentes no sero muito diferentes
e portanto a ordem de recuperao tambm no.
Devido a isso, emprega-se para o clculo da matriz de separao para calcular a
frequncia atual. Inicia-se a matriz B() com valores aleatrios uniformemente
distribudos, comeando da frequncia mais baixa o e, para se calcular B(1),
inicializa-se a matriz com B(o), conforme ilustrado na figura 6 . Veja o resultado
obtida na frequncia anterior:

Figura 6: Fluxo de interao nas frequncias dadas


24

J para corrigir o problema de escala, considerando o nmero de fontes igual ao


nmero de sensores (N=M), para cada frequncia i , obtm-se a inversa de B(i).
C() = B-1()

11 ()

=[
1 ()

1 ()
]
()

Tomando-se a matriz R como sendo composta por elementos diagonais de C, temos:


R() = diag {C()} . Ento aplica-se: Y(,t) = R().B().X(,t) e com isso uma boa
reescala pode ser alcanada.[1]

2.4.2 Infomax revisitado


Em [6], os autores mantm o mesmo esquema mostrado na figura 6 mas ao invs de
utilizarem o Fast-ICA como tcnica de separao no domnio da frequncia, eles
utilizam o algoritmo Infomax e Infomax estendido j discutidos nas sees 2.2.2 e
2.2.3, respectivamente.
Mais uma vez necessrio se alterar a equao de adaptao da matriz de
separao, aqui tambm chamada de B(), uma vez que os dados so complexos.
Estendendo (16) para o caso tratado aqui chega-se seguinte relao:
B() [B()1 ]H 2 g(Y()) X()H

O mesmo vale para o Infomax estendido:


B() [ I g(Y()) Y()H ] B()

Um ponto importante a considerar a funo no-linear que concretiza a


convergncia para os valores complexos admitidos por B. A funo que mostrou-se
mais apropriada g(z) = tanh(Re{z}) + tanh(Im{z})i. [6]
Entretanto no podemos deixar de citar novamente o fato que, ao trabalhar-se no
domnio da frequncia invarincias de escalas e permutaes devem ser consideradas
para obteno da estimativa das fontes. O artigo prope remediar esse problema
atravs da seguinte equao:
25

B
= B

1/

onde e so respectivamente a matriz de separao normalizada e


original em uma dada frequncia . Isso ir manter o envelope espectral inalterado
enquanto preserva a separao solucionando o problema da invarincia de escala.
J a invarincia de permutao um pouco mais complexa e requer maior ateno.
Para uma dada matriz de mistura A com poucos elementos de atraso, no teremos
grandes problemas, entretanto, quando temos um cenrio com filtros mais complexos,
deveremos considerar uma soluo para a invarincia de permutao. O artigo prope
usar um fator de influncia k para atualizar a matriz de separao B, a cada
frequncia utilizada, assim:
a B = e B + k e B1

Onde a B+1 e e B+1 so respectivamente a matriz de separao B efetivamente


aplicada e a estimada para cada frequncia , estando o fator de influncia no
intervalo 0 < k < 1 .

3 Resultados de Simulao

Consideramos aqui o caso de misturas convolutivas obtidas a partir de duas fontes e


dois sensores. Consideramos dois casos: fontes aleatrias uniformemente distribudas
e independentes e fontes dadas por sinais de voz.

3.1

Fontes Uniformemente Distribudas

Selecionando como parmetros iniciais duas fontes uniformemente distribudas no


intervalor de -1 a +1 e, sendo elas independentes, simulamos o algoritmo para verificar
as estimativas de recuperao de ambas fontes.
Primeiramente utilizamos a matriz de mistura A2x2 :
A11=[ 1 3 ];
A12=[ 0 -2 4 ];
A21=[ 1 3 ];
A22=[ 1 2 ];
26

26-1

Considerando inicialmente o Fast-ICA Convolutivo, um parmetro no menos


importante e que deve ser considerado para a correta execuo do algoritmo o valor
de R que define o tamanho dos filtros da matriz de separao W. Para a referida
simulao escolheu-se R igual a 7, o que resultou em um primeiro filtro W de tamanho
igual a 30. Valores inferiores de R no levaram convergncia do algoritmo e, em
contrapartida, valores superiores apenas aumentavam o tempo computacional, sem
grandes melhorias na convergncia.
O sistema completo (transmisso, mistura e separao) foi implementado em
Matlab, incluindo uma interface grfica amigvel que tornou a simulao mais simples
e o acesso mais fcil. De posse do simulador, foi possvel testar o desempenho do FastICA Convolutivo aplicado separao de diferentes misturas, valores de R e tamanhos
de filtros. A figura 7 mostra a janela grfica de interao com o usurio.
Os valores dos parmetros necessrios so inseridos em seus devidos campos e,
aps isso ter sido realizado, deve-se clicar no boto Calcular para obtermos a
resposta grfica como resultado da execuo do algoritmo selecionado. A prxima
interface tambm permite escolher qual o algoritmo a ser simulado considerando-se
as tcnicas descritas nas sees 2.3 e 2.4.
Nas prximas simulaes mostraremos apenas o grfico obtido aps clicar-se em
Calcular, com intuito de focarmos no resultado de interesse e chegarmos s
concluses pertinentes.

Figura 7: Interface grfica elaborada em Matlab

27

A figura 8 mostra que a recuperao da primeira fonte ocorreu de forma satisfatria


exceto por um fator de amplitude e atraso.

Figura 8: Fonte original S2 e sua estimativa Y1

Fazer uma tabela com uma medida de erro.


Corrigindo o fator de atraso atravs da identificao de quantas amostras
encontram-se atrasadas da estimativa de fonte e, dividindo todas amostras pelo valor
mximo de amplitude para correo dos fatores de escala, pode-se fazer uma nova
plotagem da fonte S2 (cor vermelha) e sua estimativa Y1 (cor verde). Temos agora uma
boa visualizao de que, para os parmetros selecionados inicialmente, a recuperao
ocorre de maneira bastante satisfatria. Veja o resultado na figura 9 abaixo.

Figura 9: Fonte original S2 e sua estimativa Y1 (atraso e amplitude ajustados)

28

O mesmo podemos dizer com relao segunda fonte, especificamente a fonte S1 e


sua estimativa de recuperao. Realizando os ajustes de parmetros necessrios,
temos como resultado o que podemos observar na figura 10 a seguir:

Figura 10: Fonte original S1 e sua estimativa Y2 (atraso e amplitude ajustados)

Vejamos agora de que forma os fatores ajustveis para execuo do algoritmo


afetam a estimativa de recuperao das fontes desejadas. Mantivemos o mesmo valor
de R igual a 7 e, alteramos a matriz de mistura A para:
A11= [ 1 +0.5 +0.2 ];
A21=[ -0.7 0.3 0.2 0.2 ];
A12=[ 0.3 .01 0.2 0.1 ];
A22=[ 0.8 0.2 0.2 0.1 ];
Para facilitar a anlise do resultado obtido, calculamos a correlao cruzada entre as
fontes originais e a fonte de recuperao ao final do algoritmo.

29

Figura 11: Correlao cruzada entre a Fonte S1 e sua estimativa Y1

A figura 11 ilustra o resultado da correlao cruzada entre a fonte S1 e a fonte


recuperada Y1 . Isso denota que h um baixo grau de correlao entre ambas. Por
outro lado, se realizarmos tambm a correlao entre a fonte S2 e o mesmo vetor Y1 ,
observamos o resultado na figura 12.

Figura 12: Correlao cruzada entre a Fonte S2 e sua estimativa Y1

30

O que inferimos que o vetor Y1 a fonte recuperada de S2 , uma vez que a figura 12
deixa claro a existncia de uma forte correlao entre ambos.
Rodando o algoritmo mais uma vez para recuperar a segunda fonte, obtemos a figura
13 que mostra uma forte correlao entre S1 e, o prximo vetor Y2 , representado na
figura 13 pela denominao Y11.

Figura 13: Correlao cruzada entre a Fonte S1 e sua estimativa Y2

Por fim, foi feita a ltima correlao, entre S2 e Y2 , a fim de certificarmos que a
recuperao de S1 ocorreu de forma satisfatria. A figura 14 abaixo, de fato, exibe um
padro grfico que denota baixo grau de correlao entre ambos.

31

Figura 14: Correlao cruzada entre a Fonte S2 e sua estimativa Y2

Um fato importante a ser salientado para as simulaes desse algoritmo que


quando utilizamos fontes de udio, em nenhuma das simulaes foi possvel obter
uma convergncia satisfatria. Diversos tipos de fontes de udio, com padres de
amostragem e misturas distintos foram utilizados e todos os procedimentos de [1]
foram seguidos risca, ainda assim no foi possvel determinar que fator ou fatores
possivelmente estariam influenciado para que fosse possvel realizar a simulao e
obteno da recuperao das fontes em sua totalidade.
Na realidade apenas a primeira fonte era recuperada, ao passo que a prxima fonte
ainda mantinha-se misturada, o que possivelmente denota alguma inconsistncia no
processo de colorao.

3.2 SINAIS DE VOZ


Primeiramente, nessa etapa da simulao iremos utilizar duas fontes de udio,
uma voz masculina e outra feminina, com frequncia de amostragem de 8khz e, uma
mdia de 180.000 amostras para cada fonte. Aps a etapa de centralizao das fontes,
adota-se para matriz de mistura A os valores a seguir:
A11=[ 1 3 ];
A12=[ 0 -2 4 ];

(43)
32

A21=[ 1 3 ];
A22=[ 1 2 ];
Primeiramente, simulamos o Fast-ICA frequencial descrito na seo 2.4.1.
A aplicao da Transformada de Fourier de Tempo-Curto requer a escolha do
tamanho da janela deslizante a ser utilizada sobre o sinal. A janela aqui adotada foi do
tipo hanning de tamanho igual a 1024 com 50% de sobreposio. Isso nos fornece 512
frequncias e 350 amostras temporalmente diferentes. Em seguida, de posse das
matrizes com as informaes na base tempo-frequncia, branqueia-se os sinais de
mistura a fim de tornar os sinais descorrelacionados e obter covarincia nula.
A matriz de separao B() inicializada com valores distribudos uniformemente
e independentes, ao passo que a funo no-linear adotada para atualizao da matriz
foi g(u) = log( 0.1 + u).
O resultado grfico da simulao retratado pelas figuras 15 e 16 a seguir.
1
Estimativa Fonte 2
Fonte 2

0.8

Valores em amplitude

0.6

Zoom

0.4
0.2
0
-0.2
-0.4
-0.6

Medida de erro?

-0.8
-1

0.2

0.4

0.6

0.8
1
1.2
Num. amostras

1.4

1.6

1.8

2
5

x 10

Figura 15: Fonte de udio 2 (azul) e sua estimativa (preto)

Apesar de em ambos os grficos a fonte original (cor azul) no coincidir


exatamente em todos os pontos com a estimativa de sua respectiva fonte (cor
preta), houve uma boa recuperao pois, ao executarmos o comando sound para
analisar o resultado sonoro obtido da estimativa da fonte, foi perfeitamente
possvel distinguir uma nica fonte e notar que o algoritmo atuou de forma
satisfatria.

33

1
Estimativa Fonte 1
Fonte 1

Valores em amplitude

0.5

-0.5

-1

-1.5

0.2

0.4

0.6

0.8
1
1.2
Num. amostras

1.4

1.6

1.8

2
5

x 10

Figura 16: Fonte de udio 1 (azul) e sua estimativa (preto)

Como anlise da medida de desempenho a fim de mensurarmos e


compararmos os resultados obtidos, adotaremos a relao sinal interferncia (SIR)
que definida como:

[( ())2 ]
=
[( () ())2 ]

Para a simulao realizada retratada pelas figuras 15 e 16 tivemos como resultado


a SIR1 = 1.5708 e SIR2 = 1.6442, respectivamente, o que denota uma relao de taxa
sinal interferente relativamente maior para a fonte 2. Quanto menor for o valor
apresentado pela SIR, isso quer dizer que pior ser a estimativa que foi obtida da fonte
em questo.
Faremos as mesmas simulaes para o algoritmo Infomax frequencial, apresentado
na seo 2.4.2.
As fontes foram mantidas as mesmas, assim como a matriz de mistura A dada pela
equao 43. Os resultados obtidos so mostrados nas figuras 17 e 18.

34

A fonte 1 pde ser estimada de forma satisfatria ainda que a figura 17 abaixo
mostre que os dois sinais, original e recuperado, no se sobrepe perfeitamente. A
reproduo sonora da fonte permite observar que o sinal foi separado com sucesso.

1
Estimativa Fonte 1
Fonte 1

Valores em amplitude

0.5

-0.5

-1

-1.5

0.5

1
1.5
Num. amostras

2.5
5

x 10

Figura 17: Fonte de udio 1 (azul) e sua estimativa (preto)

Em seguida o mesmo procedimento foi aplicado para a fonte 2 e o resultado


obtido foi a voz masculina reproduzida de forma clara e audvel. A figura 18 demonstra
o resultado grfico obtido a partir da plotagem da fonte original 2 e sua estimativa.
Um ponto a se considerar para a simulao desse algoritmo que em uma
mdia de cinco simulaes idnticas realizadas consecutivamente, apenas trs delas,
ou seja, em 60% obtivemos sucesso no que diz respeito a uma boa estimativa das
fontes utilizadas. Nas outras duas simulaes no obtnhamos qualquer sucesso e o
resultado apresentado eram fontes ainda misturadas.

35

1
Estimativa Fonte 2
Fonte 2

Valores em amplitude

0.5

-0.5

-1

-1.5

0.5

1
1.5
Num. amostras

2.5
5

x 10

Figura 18: Fonte de udio 2 (azul) e sua estimativa (preto)

Agora com relao as medies de desempenho, tivemos respectivamente a


SIR = 0.6344 para a estimativa da fonte 1 e SIR = 0.5910 para a estimativa da fonte 2.
Se fizermos um comparativo com as simulaes do algoritmo anterior, esse resultado
apresentado ficou consideravelmente abaixo. Graficamente isso notrio pois
comparando-se as figuras 17 e 18 com as obtidas aplicando o Fast-ICA frequencial
mostrados em 15 e 16, tal diferena de desempenho tambm perceptvel na
reproduo sonora das estimativas. Embora tenha sido possvel distinguir as fontes
originais no sinal recuperado, o resultado obtido com o Infomax ficou com qualidade
inferior ao do obtido com o Fast-ICA.
Vejamos agora como a influncia da alterao da matriz de mistura afeta o
resultado final com relao estimativa desejada das fontes e valores de SIR para
ambos algoritmos em frequncia. Adotaremos dessa vez uma matriz A com maior
quantidade de elementos de atraso e com maiores pesos:
A11=[1 0.2 0.1];
A12=[0.6 0.4 0.1];
A21=[0.5 0.3 0.1];
A22=[0.9 0.3 0.1];

(44)

36

As figuras 19 e 20, 21 e 22 mostram os resultados obtidos com a aplicao do FastICA e Infomax frequenciais respectivamente.
1
Estimativa Fonte 1
Fonte 1

Valores em amplitude

0.5

-0.5

-1

-1.5

0.5

1
1.5
Num. amostras

2.5
5

x 10

Figura 19: Fonte de udio 1 (azul) e sua estimativa (preto)

Podemos salientar que, ao menos graficamente, no houve mudanas significativas


com relao simulao anteriormente realizada na qual a matriz A era mais simples.
Tampouco houveram mudanas quando o comando sound aplicado para
analisarmos a qualidade sonora das estimativas: ambas puderam ser ouvidas
claramente.
Com relao SIR, usando o Fast-ICA, para recuperao da fonte 1 o resultado foi
de SIR = 1.4079 e para a fonte 2 foi de SIR = 0.6351. J para o Infomax, para a fonte 1
obtivemos SIR = 1.3217 e, para a fonte 2 foi de SIR = 0.6588. A Tabela 1 resume os
resultados obtidos at aqui. Para o Fast-ICA, a recuperao da fonte 2 teve uma ligeira
queda de desempenho e a fonte 1 foi a que apresentou melhor resultado . J para o
Infomax, observamos uma queda no valor obtido apenas para a fonte 1. No entanto,
devemos frisar que o algoritmo nem sempre converge, o que levanta dvidas com
relao aos resultados obtidos. Na tabela 1 tambm possvel medir o percentual de
quanto aumentou ou diminuiu a SIR para cada uma das duas simulaes, com ambos
algoritmos.

37

1
Estimativa Fonte 2
Fonte 2

0.8

Valores em amplitude

0.6
0.4
0.2
0
-0.2
-0.4
-0.6
-0.8
-1

0.5

1
1.5
Num. amostras

2.5
5

x 10

Figura 20: Fonte de udio 2 (azul) e sua estimativa (preto)

1
Estimativa Fonte 2
Fonte 2

0.8

Valores em amplitude

0.6
0.4
0.2
0
-0.2
-0.4
-0.6
-0.8
-1

0.2

0.4

0.6

0.8
1
1.2
Num. amostras

1.4

1.6

1.8

2
5

x 10

Figura 21: Fonte de udio 2 (azul) e sua estimativa (preto)

38

1
Estimativa Fonte 1
Fonte 1

0.8

Valores em amplitude

0.6
0.4
0.2
0
-0.2
-0.4
-0.6
-0.8
-1

0.2

0.4

0.6

0.8
1
1.2
Num. amostras

1.4

1.6

1.8

2
5

x 10

Figura 22: Fonte de udio 1 (azul) e sua estimativa (preto)

Para finalizar essa etapa de simulaes utilizaremos uma matriz de mistura A com
um nmero ainda maior de elementos de atraso:

A11= [ 1 +0.5 +0.2 ];


A21=[ -0.7 0.3 0.2 0.2 ];
A12=[ 0.3 .01 0.2 0.1 ];
A22=[ 0.8 0.2 0.2 0.1 ];

(45)

O primeiro grfico retratado esquerda da figura 23 apresenta a estimativa da


fonte 1 para a simulao com o Fast-ICA utilizando a matriz de mistura (45).
Comparando-se ao seu correspondente ( direita da mesma figura 23), referente
simulao com o Infomax, no possvel notar significativos padres de mudanas .
Pode-se dizer que pequenas variaes so perceptveis a olho nu, ao passo que, se
levarmos em considerao a medio SIR, temos tambm diferena considervel. A SIR
para a simulao atual considerando apenas a recuperao da primeira fonte foi SIR =
0.5981 para o Fast-ICA e, para a simulao com o Infomax foi de SIR = 1.4214. Percebese que so valores muito dispares. Veja ainda na tabela 1 que o percentual de variao
foi de 138%.

39

Figura 23: Fonte de udio 1 (azul) e sua estimativa (preto)

O padro de observao anterior no repete-se quando compara-se a


estimativa da fonte 2 para o algoritmo Fast-ICA, retratada esquerda da figura 24. Ela
possui algumas diferenas com relao a estimativa da fonte 2 para a simulao com o
Infomax ( direita da figura 24). Isso perceptvel pois as nuances no grfico so
notoriamente distintas comparando ambas estimativas, muito embora haja uma boa
recuperao de ambas estimativas pois, na reproduo sonora foi perfeitamente
possvel distinguir a voz masculina, favorecendo uma melhor qualidade para a
estimativa feita pelo Infomax.

Figura 24: Fonte de udio 2 (azul) e sua estimativa (preto)

Analisando agora as medidas de desempenho SIRs, percebe-se uma proximidade dos


valores obtidos. A medio de desempenho SIR obtida para a estimativa da fonte 2 foi
de SIR = 1.1243 na situao com o Fast-ICA e, esse valor foi de SIR = 1.2129 para o
40

Infomax. Essa pequena diferena, ainda que sutil, foi mais acentuada do que as SIRs
para a estimativa de fonte 1. Vide tabela 1.
Com intuito de melhor mensurar os resultados obtidos com relao s SIRs obtidas
para o Fast-ICA e para o Infomax alm dos percentuais de variaes com relao a uma
mesma matriz de mistura, a tabela 1 foi construda.
Tabela 1: Valores correspondentes s SIRs dos algoritmos em frequncia

SIR1

SIR2

SIR1

SIR2

Fast-ICA
vs
Infomax

Fast-ICA
vs
Infomax

Equ. (43)

1.5708

1.6442

0.6344

0.5910

60%

64%

Equ. (44)

1.4079

0.6351

1.3217

0.6588

6,5%

4,5%

Equ. (45)

0.5981

1.1243

1.4214

1.2129

138%

7%

Com os valores dispostos na tabela 1 fica mais fcil visualizar que algoritmo
predomina em uma dada simulao. Na verdade, como variou-se apenas os padres
da matriz de mistura, teve-se ora melhor desempenho do Fast-ICA, ora melhor
desempenho do Infomax. Preponderantemente, se levarmos em conta as trs
simulaes realizadas, o Fast-ICA teve desempenho superior em 67% dos casos.
Considerando tambm a velocidade nas estimativas das fontes 1 e 2 aqui trabalhadas e
na qualidade sonora dessas estimativas, o Fast-ICA tambm sobressai com pequena
vantagem.

41

4. CONCLUSO
Neste trabalho, implementamos algumas tcnicas de separao de fontes para
misturas convolutivas tanto no domnio temporal como no domnio da frequncia,
aplicando-se a Transformada de Fourier de Tempo Curto.
No que tange o Fast-ICA , no domnio temporal, no foi possvel conseguir a
recuperao das duas fontes quando consideramos sinais de voz. Uma das fontes foi
recuperada corretamente, mas a segunda no. Acreditamos que ainda possa haver
algum problema na etapa de recolorao, o qual no foi possvel de se resolver no
perodo deste estudo. J considerando-se fontes aleatrias e independentes, o
desempenho do algoritmo foi bastante satisfatrio.
Com relao aos algoritmos no domnio da frequncia, Infomax e Fast-ICA
revisitados, tiveram melhor desempenho que o algoritmo testado no domnio
temporal. Como resultado das simulaes realizadas com sinais de voz, vimos que
difcil dizer qual dos dois possui um melhor desempenho, j que a situao se inverteu
dependendo da matriz de mistura utilizada. Por outro lado, importante observar que
o algoritmo Infomax no convergiu para todas as simulaes, conseguindo recuperar
as fontes corretamente em cerca de 60% das simulaes realizadas.

42

5. REFERNCIAS BIBLIOGRFICAS

[1] Johan Thomas, Yannick Deville, e Shahram Hosseini. Time-Domain Fast Fixed-Point
Algorithms for Convolutive ICA, IEEE SIGNAL PROCESSING LETTERS, VOL. 13, NO. 4,
APRIL 2006
[2] A. Hyvarinen and E. Oja, A fast fixed-point algorithm for independent component
analysis, Neural Comput., vol. 9, pp. 14831492, 1997.
[3] HYVARINEN, A. KARHUNEN, J. OJA, E. Independent component analysis. JohnWiley
& Sons, 2001.

Padronizar.

[4] HAYKIN, S. CHEN, Z. The cocktail party problem. Neural Computation, 17:18751902, 2005.
[5] DUARTE, L. T. Um estudo sobre separao cega de fontes e contribuies ao caso
de misturas no-lineares. Masters tesis, Universidade Estadual de Campinas
(UNICAMP), 2006.
[6] Smaragdis, Paris. Blind Separation of Convolved Mixtures in the Frequency
Domain. Machine Listening Group - MIT Media Laboratory - Cambridge, MA 02139,
USA.
[7] Xie, Peng and Grant, Steven L. A Fast and Efficient Frequency-Domain Method for
Convolutive Blind Source Separation. Dept. of Electrical and Computer Engineering Missouri University of Science and Technology - Rolla, MO 65409, USA.
[8] Suyama, Ricardo. Tese ( Doutorado) - Proposta de mtodos de separao cega de
fontes para misturas convolutivas e no-lineares. Departamento de Comunicaes
Universidade Estadual de Campinas SP 24 de agosto de 2007.
[9] A. Hyvarinen, Fast and robust fixed-point algorithms for independent component
analysis, IEEE Trans. Neural Netw., vol. 10, no. 3, pp. 626634, May 1999.
[10] S. V. Vaseghi, Advanced Digital Signal Processing and Noise Reduction. Chichester,
U.K.: Wiley, 2000.
[11] Oliveira da Silva, Alan Paulo. Tese ( Ps-graduao) - Uma implementao da
Anlise de Componentes Independentes em Plataforma de Hardware Reconfigurvel.
Departamento de Computao e Automao Universidade Federal do Rio Grande do
Norte RN junho de 2010.

Padronizar notao.
43

[12] Te-Won Lee, Mark Girolami, Terrence J. Sejnowski: Independent Component


Analysis Using an Extended Infomax Algorithm for Mixed Sub-Gaussian and SuperGaussian Sources. Neural Computation 11(2): 417-441 (1999).
[13] T.-P. Chen, and A. Cichocki. Stability analysis of adaptive blind source separation.
Neural Networks, 10(8):13451351, 1997.
[14] Jean-Franois Cardoso, Blind signal separation: statistical principles, Proceedings
of the IEEE, vol. 90, n. 8, pp. 2009-2026, Oct. 98
[15] Amauri, S. Natural gradiente Works efficiently in learning, Neural Computation,
vol. 10, pp. 251-276, 1998.
[16] A. J. Bell and T. J. Sejnowski. An information-maximization approach to blind
separation and blind deconvolution. Neural Computation, 7(6):11291159, 1995.

44

Notes
1-1

2-1

2-2

2-3

2-4

2-5

3-1

3-2

3-3

3-4

3-5

4-1

4-2

4-3

4-4

4-5

5-1

5-2

16/12/2014 07:44

Misturas
16/12/2014 07:44

Quais foram os outros assuntos?


16/12/2014 07:44

Arranjos
16/12/2014 07:44

Tenses
16/12/2014 07:44

Est mais para um resumo que para uma introduo.


16/12/2014 07:44

Explicar melhor.
16/12/2014 07:44

Dos
16/12/2014 07:44

Problemas
16/12/2014 07:44

O que voc quer dizer com isso?


16/12/2014 07:44

Mesmo se a v.a. for discreta?


16/12/2014 07:44

Esta definio no est boa.


16/12/2014 07:44

Conjunta
16/12/2014 07:44

No foi definido.
16/12/2014 07:44

De
16/12/2014 07:44

Esta frase est "solta" no texto.


16/12/2014 07:44

Por que voc usou v.a.s contnuas aqui e discretas na definio de esperana?
16/12/2014 07:44

A partir de agora voc sempre ir usar sinais de tempo discreto?


16/12/2014 07:44

Definir a sigla em ingls.

Report generated by GoodReader

Notes
6-1

7-1

7-2

7-3

7-4

8-1

8-2

8-3

8-4

8-5

9-1

11-1

12-1

12-2

14-1

15-1

19-1

22-1

ii

16/12/2014 07:44

Sem pargrafo.
16/12/2014 07:44

Plural
16/12/2014 07:44

Plural.
16/12/2014 07:44

Talvez fosse interessante mostrar, passo a passo, a derivao de (8) a partir de (6),
16/12/2014 10:10

Na verdade, esta a definio de informao mtua. A expresso acima no a definio, mas uma
forma alternativa de se escrever essa grandeza.
16/12/2014 10:10

Como se escreve a relao entre correlao e informao mtua?


16/12/2014 10:10

Mostrar isso ou, pelo menos, citar uma referncia.


16/12/2014 10:10

Por que?
16/12/2014 10:10

Mudar de letra para no confundir com o operador esperana.


16/12/2014 10:10

No seria melhor deixar em uma outra seo?


16/12/2014 10:10

N maisculo ou minsculo? N minsculo no ndice temporal?


16/12/2014 10:10

Referncias?
16/12/2014 10:10

Mas M no o nmero de misturas?


16/12/2014 10:10

Quais?
16/12/2014 10:10

???
16/12/2014 10:10

No foram definidas.
16/12/2014 10:10

Alterar notao.
16/12/2014 10:10

Notao!!!

Report generated by GoodReader

Notes
22-2

24-1

26-1

iii

16/12/2014 10:10

Definir.
16/12/2014 10:10

Negrito.
16/12/2014 10:10

Qual?

Report generated by GoodReader

Вам также может понравиться