Академический Документы
Профессиональный Документы
Культура Документы
DE VOZ
HERRAMIENTAS BSICAS DE ANLISIS DE VOZ
Y AUDIO
III. CUESTIONARIO PREVIO
a) Cul es la diferencia entre energa y energa localizada
que duracin temporal debe de poseer la ventana para
que se pueda utilizar en el tratamiento de las seales de
voz?
La energa de una seal se halla en todo el intervalo de tiempo
que dura, la energa localizada se halla en un solo marco de la
seal.
Idealmente la longitud de la ventana tiene que estar entre 20 y
30 ms.
b) Qu es la funcin de Autocorrelacin, que aplicaciones
tiene?
Est definida como la correlacin cruzada de una seal consigo
misma. La funcin de autocorrelacin resulta de gran utilidad
para encontrar patrones repetitivos dentro de una seal, como
por ejemplo, la periodicidad de una seal enmascarada bajo el
ruido o para identificar la frecuencia fundamental de una seal
que no contiene dicha componente, pero aparecen numerosas
frecuencias armnicas de esta.
c) Grafique y encuentre su representacin matemtica de
las siguientes ventanas: Bartlett (o triangular),
Blackman, Boxcar (o rectangular), Hamming, Hanning y
Kaiser?
V. ACTIVIDADES
Actividad 1: ENVENTANADO
Preguntas:
a. Cul es la ventana que introduce menor distorsin en
este dominio temporal?
La ventana con menor distorsin en el dominio temporal es la
ventana rectangular.
b. Cul es el inconveniente de la ventana rectangular en
este dominio?
El inconveniente de la ventana rectangular es que en el dominio
de la frecuencia su equivalente es una funcin Sinc que
contamina las bandas laterales de frecuencia al momento de
enventanar nuestra seal de voz
Adquisicin
de
muestras/segundo
audio.
Duracin: 2 segundos
Frecuencia
de
muestreo
8000
Preguntas:
a. Qu ocurre si la ventana es demasiado grande o demasiado
pequea?
Si la ventana tiene una longitud mayor en tiempo, entonces la
energa que visualizamos tiene una magnitud mucho mayor que
nuestra seal de voz en el dominio del tiempo.
Si la ventana tiene una longitud menor en tiempo, entonces la
energa que visualizamos tiene una magnitud casi igual a
nuestra seal de voz en dominio del tiempo.
b. Qu tipo de ventana utilizara si quisiera detectar cambios
bruscos y de corta duracin en la seal?
Es recomendable usar la ventana de Hamming de longitud
entre 20 y 30 ms porque ofrece una mejor apreciacin de la
energa en los sonidos sonoros y sordos.
Actividad
3. ESTIMACIN DE LA FRECUENCIA FUNDAMENTAL
Grabe
en
MATLAB
un
fichero
llamado
ejemplosonoro.wav que corresponder a una trama
sonora de la seal de voz.
Seal de ejemplosonoro.wav en el dominio del tiempo:
Preguntas:
a. Qu frecuencia posee el tono fundamental de su voz,
comprelo con el de su compaero?
Existen aproximadamente entre 10 y 12 muestras entre los
picos, lo cual representa el periodo de la frecuencia
fundamental.
Si tomo 10 muestras entonces el periodo sera 1.25x10^-3
segundos.
Si tomo 12 muestras entonces el periodo sera 1.5x10^-3
segundos.
Eso significa que la frecuencia fundamental de mi voz est
entre 666.7 Hz y 800 Hz.
Pregunta:
a. Qu efecto tiene el utilizar los diferentes tipos de
ventanas, a su parecer cual sera la ventana ms ptima,
compare los resultados de las diferentes ventanas?
Si el tamao de ventana es demasiado grande no podremos
analizar el espectro de un fonema en concreto. Si es demasiado
pequeo no tienes la suficiente informacin para determinar las
caractersticas del fonema. Con una ventana rectangular
tenemos una atenuacin menor en las frecuencias que no
forman parte de los formantes de la seal, lo que dificulta el
clculo de la frecuencia fundamental y de los propios
formantes. Es por ello que se recomienda usar la ventana de
Hamming con una longitud de entre 20 y 30 ms.
Actividad 5: EL ESPECTROGRAMA