Академический Документы
Профессиональный Документы
Культура Документы
INSTITUTO TECNOLGICO
DE MORELIA
MONOGRAFA
APLICACIONES DE LAS
REPRESENTACIONES TIEMPO
FRECUENCIA EN PROCESAMIENTO DE VOZ
PRESENTA:
JESS VLADIMIR ALVARADO MAGDALENO
ASESOR:
M.C. JULIO CSAR HERRERA GARCA
MORELIA, MICHOACN
AGRADECIMIENTOS
A ti pap, por haberme dado los consejos y el nimo necesario para ir viviendo
cada etapa de mi vida. Por tu enseanza de saber disfrutar y buscar las cosas
que verdaderamente son importantes en la vida.
A ti Eli, por ser la persona que ha vivido ms cercano el proceso de lograr este
proyecto, por los tiempos que se sacrificaron, por el apoyo y compresin que
siempre me has dado. Te amo.
A mis tas, Loren y Elena, que s que les hubiera encantado estar aqu, junto a
mi, pero que s que donde quiera que se encuentren estarn muy felices de
verme terminar este proceso
A toda mi familia, que siempre unida, se apoya los unos a los otros. A la familia
Alvarado Gonzlez, y la familia Magdaleno Martnez.
NDICE
RESUMEN
iv
OBJETIVOS
JUSTIFICACIN
vi
MOTIVACIN
vii
INTRODUCCIN
1.1 SEALES
1.1.1 Tipos de seales
1.1.2 Seales continuas y discretas
1.1.3 Sistemas discretos
2
3
4
6
6
7
8
10
12
13
19
20
26
26
31
33
36
39
42
47
49
51
53
ii
CAPTULO 3
57
57
60
64
64
71
77
77
86
93
93
97
CONCLUSIONES
102
LISTA DE FIGURAS
104
REFERENCIAS
106
iii
RESUMEN
iv
OBJETIVOS
JUSTIFICACIN
vi
MOTIVACIN
Se eligi este tema debido al gran inters de mi parte hacia todo lo nuevo que
nos presenta la tecnologa, en especial en el campo de lo acstico, incluyendo
voz y msica. Me interes porque es un tema actual, con aplicaciones en
diversos sistemas para diferentes fines, desde un telfono celular, hasta un
sistema de seguridad para casa o empresa. Un tema que da a da ir
evolucionando y que los interesados en l tendremos que actualizarnos
constantemente.
vii
INTRODUCCIN
Los procesos en los que el ser humano puede ser capaz de controlar
diferentes dispositivos mediante la voz han tomado un auge importante en los
ltimos aos, debido a que es muy extensa la lista de cosas que se pueden
hacer con tales desarrollos. Solo hay que observar con cuidado a nuestro
alrededor para saber que la industria del procesamiento de voz es cada vez
ms extensa, se pueden controlar los equipos de comunicacin mvil mediante
el uso de la voz, se le puede hacer dictados a las computadora para evitar
usar el teclado, se puede tener un sistema de seguridad en el hogar o en la
industria que se base en el reconocimiento de voz.
1.1
SEALES
Fig. 1.1 Circuito RC sencillo con voltaje en la fuente Vs y voltaje del capacitor Vc [4].
Fig. 1.2 Representacin grfica de una palabra en funcin del tiempo [2].
Analgicas
Digitales
Muestreadas
Cuantizadas
Causales
Anticausales
No causales
Continuas
Peridicas
Simetra Par
Simetra Impar
Asimtrica
Seales de Energa
Seales de Potencia
Ejemplos de seales
Escaln unidad
Rampa
Pulso
Triangular
Sinc
Impulso
Ec. 1.1
Ec. 1.2
Y ahora considerando
=
Ec. 1.3
, por
[22]. Se define a *
' .
& ' =
'
Ec. 1.4
conforme 0, la respuesta *
-, entonces
' = lim
'
Ec. 1.5
- , ' 1-
Ec. 1.6
' =0
' '
Ec. 1.9
Los sistemas LIT tiene varias propiedades que no poseen otros sistemas, en
esta seccin se explorarn algunas de las ms importantes y bsicas de estas
propiedades, las cuales se separan en discretas y continuas para poder
observar cada uno de los tipos de LIT por separado [11].
Propiedad Conmutativa
Una propiedad bsica de la convolucin tanto continua como discreta,
consiste en que es una operacin conmutativa.
10
Caso discreto:
Ec. 1.10
Caso continuo:
' =0 -
' - 1-
Ec. 1.11
Propiedad Distributiva
Otra propiedad bsica de la convolucin es la propiedad distributiva. La
convolucin se distribuye a travs de la adicin [21].
Caso Discreto:
2
+ 4
Ec. 1.12
Caso Continuo:
' 2 ' +
' 4 '
Ec. 1.13
11
Propiedad asociativa
Otra propiedad importante y til de la convolucin es la asociativa [22].
Caso Discreto:
2
' 2 '
4 '
Ec. 1.14
Caso Continuo:
' 2 ' 4 '
Ec. 1.15
armnicamente,
para
las
seales
aperidicas
estn
12
' =5
0,
Para esta forma, los coeficientes de la serie de Fourier ; para esta onda
cuadrada son
; =
2<=
>.
>?
Ec. 1.16
donde >. =
4@
A
; =
2<= B
B
CD
Ec. 1.17
/B
la envolvente de ; es
13
[11].
Este ejemplo muestra la idea bsica que permiti a Fourier el desarrollo de una
representacin para seales aperidicas. En forma especfica, se piensa en
una seal aperidica como el lmite de una seal peridica cuando el periodo
se hace excesivamente grande, y se examina el comportamiento limitante de la
representacin de la serie de Fourier para esta seal [23]. Ahora se considera
una seal x(t) con duracin finita, para un nmero de
2,
2,
14
Fig. 1.5 (a) Seal aperidica x(t) (b) Seal peridica & ' construida para que sea igual a x(t)
en un periodo [22].
& '
; =L
CD )
Ec.1.18
A
4
0& ' =
A
4
L CD )
1'
Ec. 1.19
donde B.
15
; =
A/4
A/4
' =
L CD )
1'
' =
L CD )
1'
Ec. 1.20
M NB = 0
' =
L CD )
1'
Ec. 1.21
; =
M N B.
Ec. 1.22
16
& ' =
M N B. = L
CD )
Ec. 1.23
& '
4@
A
1
2F
B. ,
M N B. = L
CD )
B.
Ec. 1.24
Cuando
17
CD )
' conforme
respectivamente [5].
' =
1
0 M NB = LC) 1B
2F
Ec. 1.25
M NB = 0
' =
LC)
1'
Ec. 1.26
'
diferentes frecuencias.
18
B B.
Ec. 1.27
' =
1
0 2F
2F
B B. = LC) 1B
Ec 1.28
19
M NB =
2F;
B B.
Ec. 1.29
' =
; =L
CD )
Ec. 1.30
se
Fourier ; [11].
20
y su transformada de Fourier M NB
1
0 M NB = LC) 1B
2F
Ec. 1.31
M NB = 0
' =
LC)
1'
Ec. 1.32
notacin de O
2 |M
NB |. Tambin se referir a
' con la
21
' M NB
Linealidad [22]
Si
P
' M NB
y
P
' R NB
entonces
P
; ' + S ' ;M NB + SR NB
Ec. 1.33
Si
P
' M NB
Entonces
P
' '. =
LC)D
M NB
Ec. 1.34
1
0 M NB = LC) 1B
2F
1
0 M NB = LC
2F
) )D
1B
22
1
0
2F
LC)D
M NB = LC) 1B
' '.
==
LC)D
' '. , se
M NB
Diferenciacin e integracin
Sea
'
Por tanto
23
1 ' P
NBM NB
1'
Ec. 1.35
Si
P
' M NB
Entonces
P
;'
1
NB
M
|;|
;
Ec. 1.36
OT ;' U = 0
;' =
LC)
1'
24
OT ;' U =
Y 1 0
W ;
X 1
W ; 0
V
- =
- =
C
LZ \,
[ 1-, ;
C
LZ \,
[ 1-, ;
>0
>0
viceversa.
Tambin, considerando que ; = 1, en la ecuacin 1.36 se tiene:
P
' M NB
Ec. 1.37
25
26
`4 . En la
figura (a) se muestra una seal de este tipo [23]. A partir de esta seal
aperidica podemos construir una secuencia peridica ]
para la cual ^ _
sea un periodo, como se ilustra en la figura (b). Cuando se hace que el periodo
sea ms grande, ]
conforme ` , ]
es idntica a
27
Fig. 1.7 (a) Seal x[n] de duracin finita. (b) seal peridica ]
; =
L Z
, se tiene:
4@
\b
a
Ec. 1.38
; =
1
`
L Z
4@
\b
a
Ec. 1.39
Puesto que
K `4 ,
1
`
ac
b
ad
L Z
4@
\b
a
1
`
L Z
4@
\b
a
28
donde en la segunda igualdad nos hemos valido del hecho de que x[n] es cero
fuera del intervalo `2
`4 . Definiendo la funcin
Me= LC f =
LCb
Ec. 1.41
de M = LC , es decir,
; =
1
M =L
`
CD
Ec. 1.42
1
M =L
`
CD
=L
CD b
Ec. 1.43
1
2F
M =L
CD
=L
CD b
B.
Ec. 1.44
29
CD
= LCD b y
1
0 M = LC = LCb 1B
2F 4@
APLICACIONES DE LAS REPRESENTACIONES TIEMPO FRECUENCIA EN PROCESAMIENTO DE VOZ
30
1
0 M = LC = LCb 1B
2F 4@
Ec. 1.45
Me= LC f =
LCb
Ec. 1.46
gC
4@
. Es por
31
B. 4F y as sucesivamente.
Me= LC f =
2F B B. 2Fj
Ec. 1.48
32
= = LCD b [22].
Justo como ocurre con la transformada continua de Fourier, existen una gran
variedad de propiedades de la transformada de Fourier de tiempo discreto, esto
proporciona un mayor conocimiento de la transformada, lo cual es muy til
conocer para reducir la complejidad de la evaluacin de las transformadas y las
transformadas inversas [23]. Es importante conocer que existe una estrecha
relacin entre la serie de Fourier y la transformada de Fourier, por lo cual
muchas propiedades de la transformada se derivan de las propiedades
correspondientes de la serie de Fourier de tiempo discreto.
Es conveniente utilizar una notacin especfica para indicar el par de una seal
y su transformada. Esto es,
Me= LC f
O
OT
2
lM = LC m
33
M = LC
Cn4@
f = M = LC
Ec. 1.49
Si
P
M2 = LC
M4 = LC
Y
P
Entonces
;
+S
;M2 e= LC f + SM4 = LC
Ec. 1.50
M = LC
Entonces
34
LCbD
Me= LC f
Ec. 1.51
Y
= LCD b
M =L
C CD
Ec. 1.52
C CD
35
36
tiempos, cada nota tiene una duracin finita y determinada altura (la frecuencia
del tono). Si la seal contiene una nota, por ejemplo LA, una representacin de
Fourier de la seal mostrar un pico en la frecuencia correspondiente, sin
ninguna indicacin de la duracin. La msica generalmente se representa en
una partitura. Y se sabe que la relacin tiempo frecuencia es precisamente la
informacin que est codificada en la notacin musical (Ver Fig. 2.1). Por ello,
se puede decir que la notacin musical es el prototipo de la representacin
tiempo frecuencia de las seales [30].
(a)
(b)
Fig. 2.2. Seal (a) y Espectro de Fourier (b) del arpegio [23].
37
Cuando la seal mostrada en la Fig. 2.1 es tocada con algn instrumento como
una flauta, es difcil de detectar su estructura matemtica De hecho, la
representacin grfica de la seal y su espectro de Fourier (Fig. 2.2) no son
capaces de revelar dicha estructura [7]. Por el contrario, el hecho de que es un
arpegio es mucho ms claro en una representacin tiempo frecuencia como
la representada en la Fig. 2.3, en la cual el tiempo y la frecuencia se
representan simultneamente. Se puede ver claramente que la representacin
tiempo frecuencia de la seal se localiza alrededor de cierto nmero de
puntos, y es posible asociar dichos puntos con las notas individuales (o sus
armnicos). Tambin se puede seguir la evolucin de la frecuencia
fundamental de la seal [23]. En la Fig. 2.3 se observa que la seal sigue una
curva que corresponde con la partitura de la Fig. 2.1.
38
39
Ec. 2.1
40
Fig 2.4. Seal de voz correspondiente a la palabra GABOR. Seal en el tiempo y su densidad
espectral de energa [6].
41
Los principales campos de aplicacin dentro del procesado de seales han sido
la identificacin de sistemas, estimacin espectral, deteccin de seales,
estimacin de parmetros y anlisis del habla [6].
42
oscilaciones
puras,
comportamiento
proporciona
se
mantiene
una
tambin
localizacin
a
ptima.
seales
que
El
son
buen
ciertas
"
Ec. 2.2.
+ $%
Ec. 2.3
Si denotamos:
Ec. 2.4
43
44
Fig. 2.6. Distribucin Wigner Ville de una seal chirp linear: casi una perfecta localizacin en
el plano tiempo frecuencia [6].
() =
Ec. 2.5
).
45
#
#
#
#
= |+
= |
"/
,,
#
#
#
#
0,
0,
#
#
, 4
,4
46
05 , 6 =
Ec. 2.6.
47
, 6 de dimensin
6.
1
2=
05 , '
>
'
Ec. 2.7.
>
cos '
y7
moduladas actan como filtros pasabanda, con definicin de fase. De tal modo
la Transformada de Gabor puede entenderse como un tratamiento localizado
de la seal mediante filtros pasabanda deslizantes, de ancho de banda
constante [18].
48
Fig. 2.7. Ventanas comunmente utilizadas en el anlisis de Gabor. La notacin del eje
horizontal debe dividirse entre 512 para coincidir con las frmulas matemticas dadas en la
monografa [23].
49
La razn principal para usar estas ventanas es el hecho de que tengan formas
simples y funcionales y que sus transformadas de Fourier estan concentradas
esencialmente alrededor del origen ' = 0, como se ven en la Fig. 2.8. Las
frmulas matemticas que definen a dichas ventanas son las siguientes[18]:
Rectangular
7
=H
1, 0 I I 1/2
0, 1/2 K K 0
Ec. 2.8
Triangular (Bartlett)
2 , 0 I I 1/2
L2 1
, 1/2 K I 1
0, 1 K K 0
Ec. 2.9
50
Hanning
=H
1
<0
Ec. 2.10
Blackman
1
<0
Ec. 2.11
= R ST
TXF
UE0T
Ec. 2.12
DY,
51
Fig. 2.9 (a) Seal de Voz How are you, (b) Transformada de Gabor con una ventana estrecha,
(c) Transformada de Gabor con una ventana ms amplia [23].
52
\|]|
^
]
Ec. 2.13
La funcin [
[`,a
\|]|
^
]
Ec. 2.14
est bien localizada en tiempo, de media nula y que la transformada [b ' sea
APLICACIONES DE LAS REPRESENTACIONES TIEMPO FRECUENCIA EN PROCESAMIENTO DE VOZ
53
un filtro continuo pasa banda, con rpido decaimiento hacia el infinito y hacia
' = 0.
c0
], ^ =
[`,a
Ec. 2.15
= dc
#
#
c0
], ^ [`,a
^ ]
]
Ec. 2.16
54
,,
en una banda biltera 0 'F |'| ' , de ancho > . Entonces, las
waveletes [`,a
+ ^, de
longitud ] en la banda biltera 0 'F /] |'| ' /], de ancho > /].
=0
Ec. 2.17
55
`,a
=]
c0
], ^ f es no significativa. En
56
CAPITULO 3.
En esta investigacin se advirti que casi todas las aplicaciones utilizan las
mismas bases para aplicar el procesamiento de voz en sus productos. La
relacin tiempo frecuencia. Esto para obtener los espectros de las seales de
audio y compararlos con una base de datos preestablecida para as poder
obtener un resultado deseado.
57
58
En las figuras 3.2 y 3.3 se presentan las grficas obtenidas para las
pronunciaciones de 2 vocales ms. Estas grficas muestran la forma de onda
de la voz (sonido) y su espectrograma.
onda,
presentarn
diferencias
en
su
espectro
de
frecuencias
59
3.1.2 MatLab
MatLab ofrece los medios necesarios para la implementacin de algoritmos
especializados en el procesamiento digital de seales. En esta etapa se
obtiene, con la misma calidad, los resultados que da Speech Viewer.
Adicionalmente se presentarn las bases para la programacin en Matlab,
como son:
60
61
62
Fig. 3.5 Comparacin entre el espectro original y el espectro Normalizado del fonema EME
[25].
5.5 10
63
3.2.1
Sistema
de
reconocimiento
de
voz
mediante
anlisis
de
espectrograma.
(Pat. US 2002/0128834 A1, 12/Sep/2002)
64
65
66
67
Fig. 3.9 Estructura de un segmento de voz continua dentro de una entrada de diccionario [33].
68
69
70
Despus de pasar por sta etapa, los datos del ltimo espectrograma son los
que van directamente hacia alguno de los diccionarios, para ah hacer la
comparacin con los datos que ya contienen dichos diccionarios, y as poder
saber o conocer que fonema, grupo de fonemas, palabra o frase est siendo
utilizada.
71
72
73
74
75
dos, ya que stos se compararn con los obtenidos en la figura 3.13. Se puede
notar que estn hechos para 3 diferentes usuarios, se notan las diferencias
entre cada uno de los espectrogramas, debido a que cada usuario, aunque
pronuncia la misma palabra y se toma la misma vocal, tiene una frecuencia y
un tiempo diferentes. Esto se utiliza para poder identificar a los usuarios
mediante su voz. As, con esta invencin queda demostrado que cada quien
tendr espectrogramas diferentes de su voz, no importando que se mencione la
misma palabra o la misma frase, incluso la misma letra.
76
77
78
79
debe ser de entre 5mS y 40mS. Para evitar los efectos secundarios en la
transformacin sucesiva se puede emplear una de las tres tcnicas siguientes:
80
(DWT).
( )(
2). Si el wavelet
81
Peridico / sonoro.
82
83
84
Fig. 3.18 Clasificacin del habla con ruido externo de 10dB [31].
85
para
un
sistema
de
reconocimiento
de
voz
automtico
86
Emplear todas las sub bandas obtenidas del rbol binario para generar
los parmetros correspondientes para representar las caractersticas
extradas de la seal de voz de muestra.
Fig. 3.19 Diagrama de Bloques del mtodo para la extraccin de caractersticas de voz [32].
87
48 ms). La
88
La figura 3.20 muestra varios niveles del rbol, desde el nivel 1 hasta el nivel 6.
Las diferentes resoluciones tiempo frecuencia (desde 384 muestras en el nivel
1, hasta 12 muestras en el nivel 6) se muestran entre parntesis. Las bandas
se vuelven ms cercanas y las muestras se vuelven ms escasas a medida
que se baja en los niveles del rbol. El filtrado se lleva a cabo mediante una
APLICACIONES DE LAS REPRESENTACIONES TIEMPO FRECUENCIA EN PROCESAMIENTO DE VOZ
89
90
Fig. 3.21 Relacin de frecuencias para cada uno de los niveles del rbol de anlisis [32].
91
) $
()%
Los siguientes bloques contienen una etapa de anlisis llamada PCA (Principal
Component Analysis) las cuales se llevan a cabo en el bloque 12, para sacar
las caractersticas principales despus de la reduccin de datos. En el bloque
14 se encuentra una red neuronal, la cual nos da como resultado la muestra C,
la cual contienen las principales caractersticas de la muestra S, las cuales nos
ayuda para hacer un reconocimiento de voz. Esta invencin fue hecha para
implementarse en los diferentes dispositivos que utilicen reconocimiento de
voz, ya que lo nico que hace este proyecto es sacar las caractersticas
principales de la muestra de voz.
92
93
Fig. 3.23 Anlisis de la Transformada de Fourier de Tiempo Corto sobre la forma de onda de la
figura 3.14 [35].
94
Fig. 3.24 Espectro tiempo frecuencia utilizando el anlisis de Gabor para la forma de onda de
la figura 3.16 [35].
El anlisis de Gabor funciona mejor que varios otros mtodos, sobre todo
cuando se tiene un fondo con demasiado ruido al ser grabadas las palabras. El
anlisis de Gabor no es todava tan usado en comparacin con la
APLICACIONES DE LAS REPRESENTACIONES TIEMPO FRECUENCIA EN PROCESAMIENTO DE VOZ
95
Fig. 3.25 Espectrogramas de la forma de onda de la figura 3.22 empleando (a) STFT y (b)
anlisis de Gabor [35].
96
97
56%789
:2
#DEF ,, > = . 2 G. B
2
2
0 + 3 0 3 : I 4 56%7J9 :2
2
2
5K
7L
P
M%NO
79
5K
P
M%N
R
4
5K
P
2
Q
= S . 4 M%NR . U;4 5%N L
T
79
,V+2
, V 2 :V 4 56
7J9
:2
98
Con sta distribucin Wigner Ville suavizada se puede hacer una mejor
lectura en los espectrogramas tiempo frecuencia, comparada con la
distribucin Wigner Ville normal. Los siguientes ejemplos muestras ms
claramente dicha comparacin.
Fig. 3.26 Forma de onda que combina dos seales de frecuencia [36].
99
100
101
CONCLUSIONES
Las seales, por diversa que sea la aplicacin a realizar, cuentan con
caractersticas bsicas que son comunes a todas ellas. Por ejemplo, se puede
afirmar que cualquier seal es funcin de una o ms variables independientes y
que cuentan con informacin del comportamiento o naturaleza de algn
fenmeno en particular. Las seales se clasifican en diversos modos, y se
pueden representar de distintas maneras, pero no se debe olvidar que lo ms
importante de todas las seales, es la informacin que contienen y que se
puede aprovechar para nuestros proyectos y aplicaciones.
Uno de los tipos de seales, que en nuestros das es cada vez ms comn
trabajarlas, son las seales de audio. Con la informacin contenida en dichas
seales, mediante diferentes funciones como la Transformada de Fourier se
pueden obtener los espectros de la seal. Dichos espectros nos dicen las
diferentes frecuencias y su intensidad existentes en el archivo de audio, cules
frecuencias son las dominantes y cules se pueden considerar como ruido,
debido a su poca o dbil seal.
102
103
LISTA DE FIGURAS
Captulo 1
Fig. 1.1 Circuito RC sencillo con voltaje en la fuente Vs y voltaje del capacitor Vc
Fig. 1.5 (a) Seal aperidica x(t) (b) Seal peridica ( ) construida
para que sea igual a x(t)en un periodo
15
17
Fig. 1.7 (a) Seal x[n] de duracin finita. (b) seal peridica [ ] construida
para que sea igualada a x[n] en un periodo
27
30
32
Captulo 2
37
37
38
41
42
45
49
Fig. 2.9 (a) Seal de Voz How are you, (b) Transformada de Gabor con una ventana
estrecha, (c) Transformada de Gabor con una ventana ms amplia
52
Captulo 3
58
59
59
61
Fig. 3.5 Comparacin entre el espectro original y el espectro del fonema EME
63
65
66
67
104
68
70
72
73
74
75
76
80
85
85
Fig. 3.19 Diagrama de Bloques del mtodo para la extraccin de caractersticas de voz 87
Fig. 3.20 Diagrama esquemtico que ilustra el rbol de filtrado
89
Fig. 3.21 Relacin de frecuencias para cada uno de los niveles del rbol de anlisis
91
93
94
95
96
99
99
100
100
100
101
105
REFERENCIAS
Pginas Web:
[4]http://exa.unne.edu.ar/depar/areas/fisica/electymagne/TEORIA/elecmagnet/induccio
n/anillo2/anillo2.htm Visitado el da 3 de marzo del 2010
Documentos PDF:
[5] Prez Iglesias Hctor. Seales y Sistemas discretos. Visitado el 1 de marzo del
2010. http://wahwah.des.udc.es/signals/senales.pdf
[9] Slaney Malcolm. Auditory Toolbox: A MatLab toolbox for Auditory Modeling Work.
Visitado en Febrero 2010. Disponible en http://cobweb.ecn.purdue.edu/~malcolm/
interval/1998-010/AuditoryToolboxTechReport.pdf
106
Visitado
en
Marzo
2010.
Disponible
en
http://redalyc.uaemex.mx/redalyc/pdf/944/94402206.pdf
[17] Dermody, Phillip. The use of wavelet transforms in phoneme recognition. The
University
of
Newcastle.
Visitado
en
Enero
2010.
Disponible
en
http://www.asel.udel.edu/icslp/cdrom/vol4/356/a356.pdf
107
General
San
Martn.
Visitado
en
Febrero
2010.
Disponible
en
http://www.cnea.edu.ar/cac/endye/glea/trabajos/serrano.pdf
[35] Madan V. K., Analysis of spoken words employing Gabor Transform. BARC,
Trombay, Mumbay. Visitado el 22 de abril 2010.
http://www.isca-speech.org/archive/wslp_03/wslp_067.pdf
[36] Marir, Farir. Time frequency analysis of speech signals Smoothed Pseudo WignerVille Distribution. Makkah College of Technology, KSA. Visitado en abril 2010.
Disponible en: http://stcex.gotevot.edu.sa/NR/rdonlyres/5264CDF4-841F-477D-8C032011469BE2F1/0/218.pdf
Libros:
[23] Carmona, Ren. et al. Practical Time Frequency Analysis. Wavelet and Gabor
Transforms. Editorial AP. 1 Edicin.
108
[26] Mallat, A Wavelet Tour of signal processing, Segunda Edicin. San Diego:
Academic Press, 1999.
Revistas:
Patentes:
[32] Method for extracting voice signal features and related voice recognition system.
Pat. US 2003/0191640 A1. Inventores: Roberto Gemello y Franco Mana. 9 de Octubre
del
2003.
Disponible
en
http://v3.espacenet.com/publicationDetails/originalDocument?FT=D&date=19981020&
DB=EPODOC&locale=en_EP&CC=US&NR=5826232A&KC=A
[33]
Speech
Recognition
System
Using
Spectrogram
Analysis.
Pat.
US
2002/0128834 A1. Inventores: Vitaliy Fain y Samuel Fain. 12 de Septiembre del 2002.
Disponible
en
109
http://v3.espacenet.com/publicationDetails/originalDocument?CC=US&NR=200212883
4A1&KC=A1&FT=D&date=20020912&DB=EPODOC&locale=en_EP
[34] Methods of identification using voice sound analysis. Pat. US 2009/0326942 A1.
Inventor:
Sean
Fulop.
31
de
Diciembre
del
2009.
Disponible
en
http://v3.espacenet.com/publicationDetails/originalDocument?CC=US&NR=200932694
2A1&KC=A1&FT=D&date=20091231&DB=EPODOC&locale=en_EP
110