Вы находитесь на странице: 1из 24

Tratamiento Digital de Voz

Prof. Luis A. Hernández Gómez

Dpto. Señales, Sistemas y


Radiocomunicaciones
Tratamiento Digital de Voz
Tema 1: Producción de sonidos y fonética
 Mecanismo de producción y tipos de sonidos
 Fonética (nociones)
 Modelos Prácticos
Tema 2: El oído y la percepción de voz
Tema 3: Técnicas de Análisis
 Temas 4 a 7 Aplicaciones de TDV
Codificación de Voz
Reconocimiento de Habla
Reconocimiento de Locutores
Conversión Texto - Habla
Sistemas Conversacionales
Mecanismo de Producción y Tipos de
Sonidos

Procesado eficiente explotar características de la voz

Características de la voz proceso de producción


Mecanismo de Producción
Mecanismo de Producción

Vibración

Flujo de aire
Tipos de Sonidos
Segmentos sonoros : vibración de las cuerdas vocales

Articulación de /o/ Articulación de /u/

Ejemplos: las vocales


Tipos de Sonidos
Segmentos fricativos : estrechamiento y turbulencia

Articulación de /s/ Articulación de /f/

Ejemplos: sonidos [s], [f]


Tipos de Sonidos
Segmentos oclusivos : cierre total, explosión

Articulación de /p/ Art. /b/ oclusiva

Ejemplos: sonidos [p], [b]


Fonética (nociones)

Estudios de Lingüística Española                 Volumen 4 (1999)

           ISSN: 1139-8736


               Depósito Legal: B-39200-99
LA TRANSCRIPCIÓN FONÉTICA AUTOMÁTICA DEL DICCIONARIO
ELECTRÓNICO DE FORMAS SIMPLES FLEXIVAS DEL ESPAÑOL:
ESTUDIO FONOLÓGICO EN EL LÉXICO

Antonio Ríos Mestre


http://elies.rediris.es/elies4/
Fonética articulatoria

Oclusión
No Total Parcial
Fricativas
Nasales
Aproximantes
Si Vocales
Vibrantes
Sonoridad

Oclusivas
Laterales
Oclusivas Fricativas
No
Africadas

Universidad Politécnica de Cataluña Universidad del País Vasco


Fonética articulatoria

 Puntos de articulación
 labios: [p], [b], [m]
 dientes: [t], [d]
 alvéolos: [n], [s]
 paladar: [J], [L]
 velo: [k], [g], [x]

Universidad Politécnica de Cataluña Universidad del País Vasco


Fonética articulatoria

 Puntos de articulación

 Alófono  cada uno de los


sonidos propios de
una lengua

Universidad Politécnica de Cataluña Universidad del País Vasco


Fonética articulatoria

 Puntos de articulación

 Alófono  conjunto de
alófonos con el
 Fonema mismo valor
fonológico en una
lengua

Universidad Politécnica de Cataluña Universidad del País Vasco


Fonética articulatoria

 Puntos de articulación

 Alófono  contexto
 Fonema  coarticulación
 prosodia
 Variabilidad  locutor
 factores individuales
 ... y sociolingüísticos

Universidad Politécnica de Cataluña Universidad del País Vasco


Fonética (nociones)
Problemas del repertorio de fonemas del Español
 Antonio Ríos Mestre (capítulo 4)

Referencia: http://liceu.uab.es/~joaquim/home.html
Joaquim Llisterri
Grup de Fonètica
Seminari de Filologia i Informàtica
Departament de Filologia Espanyola,
Universitat Autònoma de Barcelona
Modelo y Parametrización de la Voz
Contras Pros
Modelo
Modelo
• dificultad • control flexible/intuitivo
Físico
Físico
analisis/re-síntesis • expresividad
• medidas invasivas • CO-ARTICULACIÓN
fácil
Modelo
Modelo
Excitación
Excitación
-- Filtro
Filtro

• menos expresivo
Modelo
Modelo • análisis/re-síntesis fácil
• CO-ARTICULACIÓN
Espectral
Espectral
difícil
Modelo y Parametrización de la Voz
Salida
Cavidad
Sonido
Nasal
Nasal
Velo
Cuerdas Salida
vocales Cavidad Cavidad
faríngea Oral Sonido
lengua oral

Pulmones

Fuerza muscular
Periodo de apertura Periodo de
cierre
Fase Abierta Fase Cerrada
Modelo y Parametrización de la Voz
 Interacción tracto-fuente: La forma de onda glotal
depende, en general, de la configuración del tracto vocal

 Aproximación: Despreciar la interacción fuente-tracto


ya que la impedancia glotal es muy ata casi siempre.

Tracto Radiación
Fuente
Vocal
Glotal 1  z 1
(Filtro)

Ruido de
aspiración
Modelo y Parametrización de la Voz

Radiación Tracto
Fuente
Vocal
Glotal 1  z 1 (Filtro)

Ruido de aspiración

“Excitación glotal”
Señal de
Forma de Tracto Voz
Onda Vocal
Glotal (Filtro)
1
Ruido de aspiración (1  z )
Modelo del Tracto Vocal
 Se modela como un filtro de todo-polos (Filtro IIR)
 El tracto vocal se representa como una serie de tubos uniformes y
sin pérdidas concatenados.
 Se supone que el sonido se propaga como una onda plana a lo
largo del tracto vocal.

A1 A2 AN Alip 
Glotis
Terminación en
los labios
1-kN
Ug    Ulip

-1 -kN
  
Modelo del Tracto Vocal
1-km +
Um+ Um+1
Coeficiente k  Am  Am 1
Am -km km Am+1
De reflexión m Am  Am 1
Um- -
Um+1
1+km

 : tiempo de propagación de la onda sonora a través de un tubo.


N : número de tubo desde la glotis hasta los labios
• Si el periodo de muestreo es T = 2 , puede demostrarse que
la función de transferencia del tracto vocal es un filtro todo-polos
de orden N
• Los coeficientes autoregresivos del filtro que modela el tracto
vocal pueden convertirse en los km mediante el métodp de Durbin.
Modelo del Tracto Vocal

e(n) 1 s(n)
Señal de ---------------------- Señal de
excitación 1 -  aiz-i Voz
Análisis Visual de la Señal de Voz
Herramientas:
 Generales de Audio (tipo Cool Edit)
 Específicas de Voz

Herramientas Específicas de Libre Distribución:


 Snack & WaveSurfer (KTH)
http://www.speech.kth.se/software/
(Referencias Joaquim Llisterri)
 ESPS (HTK)
 SFS

Вам также может понравиться