Cuantificador Uniforme y No Uniforme en Vocoder

UNIVERSIDAD DE LAS FUERZAS ARMADAS - ESPE
DEPARTAMENTO DE ELÉCTRICA Y ELECTRÓNICA
CARRERA DE INGENIERÍA ELECTRÓNICA EN AUTOMATIZACIÓN Y CONTROL
TEMA:
“Cuantificador Uniforme y cuantificador No Uniforme”
Tarea N°2.1
REALIZADO POR:
ALBARACIN FRANCISCO
DOCENTE:
ING. GONZALO OLMEDO
SANGOLQUÍ, 14 DE JUNIO DEL 2018

Tema:
Cuantificador Uniforme y cuantificador No Uniforme.
Objetivos
General
 Digitalizar la señal de voz Utilizando el Cuantificación uniforme y cuantificación No
uniforme con ley μ ( μ =255) y con Ley A(a=87,6).
Específicos
 Implementar el código necesario en Matlab para poder digitalizar la señal de voz
grabada.
 Interpretar la gráfica de la cuantificación Uniforme.
 Comparar la cuantificación No uniforme de la Ley μ y de la Ley A.
Resumen Breve
A continuación se mostraran las gráficas de las señales de voz grabada digitalizada, en
cuantificar uniforme y cuantificador No uniforme, por los dos métodos que son, la Ley μ y la Ley
A, además de comparar las gráficas obtenidas tanto del uniforme como del No uniforme.
Marco teórico
Cuantificador Uniforme
La cuantificación uniforme es el proceso de una vez muestreada la señal pasa a la etapa del
cuantificación que es donde, se dividen en niveles para del unto más cerca al nivel este adopte
la posición del nivel, al tener la señal cuantificada se procede a codificar tal como se muestra en
la figura 1. A continuación.
Figura 1. Representación gráfica de los procesos que tiene la transmisión
Cuantificador No uniforme
Cuantificación no uniforme, divide los niveles de cuantificación de tal manera que las amplitudes
más pequeñas no sean perdidas. Se basa en un proceso compresión y expansión llamado
companding. Se aplica una compresión/expansión de las amplitudes y posteriormente una
cuantificación uniforme. Las amplitudes de la señal de audio pequeñas son expandidas y las
amplitudes más elevadas son comprimidas. La relación entre los niveles de entrada y salida
podemos observar en la Figura.
Figura 2. Cuantificación no uniforme
Procedimiento.
Cuantificación Uniforme
Para realizar la cuantificación se necesita una señal de voz para este caso se procedió a grabar
la señal de voz, con los siguientes comandos:
r=audiorecorder;
disp('Iniciando')
recordblocking(r,2);
disp('Fin')
play(r);
x=getaudiodata(r);
Una vez grabada la señal se procede a guardarlo en la variable “x”, para de este modo graficar
la señal y poder observar el comportamiento que tiene.
Figura 3. Representación gráfica de la señal grabada y 128 niveles para cuantificar.
Como se puede observar la gráfica está dividida en 128 partes, cabe recalcar que entre más
niveles más se acerca a la señal original. El código implementado para realizar los niveles es el
siguiente.
nivel=128;
diferencia= (max(x)-min(x))/(nivel-1);
niveles=[min(x):diferencia:max(x)];
y=kron(niveles',ones(1,length(x)));
for niv=1:nivel
plot(y(niv,:),'r');
end
y1=abs(y-repmat(x',nivel,1));
[distancia ymin]=min(y1);
ydec=ymin-1;
figure(2);
plot(ydec);
grid on
Una vez que se tiene la señal cuantificada se procede a reconstruir la señal transmitida es decir
los bits cambiar los a decimal para así poder observar la gráfica enviada.
Esto se logró con un programa que cambia de bits a decimal e inversamente. El archivo se
encuentra adjunto en la carpeta con los demás simuladores.
Al utilizar 128 niveles se logró obtener la gráfica casi idéntica a la original. Tal como se muestra
a continuación.
Figura 4. Representación gráfica de la señal reconstruida utilizando 128 niveles.

 Realice el mismo procedimiento anterior para diferentes niveles de cuantificación.
Muestre los resultados obtenidos y explique ¿qué ocurre en el mejor de los casos?
Como se puede observar la gráfica está dividida en 16 partes
Figura 5. Representación gráfica de la señal grabada y 16 niveles para cuantificar

Para el mejor de los casos se debe a la mayor numero de niveles que para este caso es el de
128 niveles ya que de esta manera el intervalo es más pequeño y esto produce que la señal de
salida sea similar a la señal original
 Implemente la “Codificación” en el ejemplo de cuantificador no uniforme para la ley

mu y la ley A, utilizando los códigos de los programas 3 y 4. (Ayúdese con el código
del programa 2)
 Ley u
u=255
x=[-1:0.001:1]
a=log(1+u*abs(x))
b=log(1+u)
fx=sign(x).*(a/b)
plot(x,fx)
Figura 8. Representación gráfica de Cuantificador Uniforme-Ley u
 Ley A
u=255
x=[-1:0.001:1]
a=log(1+u*abs(x))
b=log(1+u)
fx=sign(x).*(a/b)
plot(x,fx)
Figura 9. Representación gráfica de Cuantificador Uniforme-Ley A
Cuantificador No uniforme
 Ley u
Figura 10. Representación gráfica de la cuantificación no uniforme-Ley u
 Ley A
Figura 11. Representación gráfica de la cuantificación no uniforme-Ley A
Vocoders
Los vocoders intentan producir una señal que suene como la voz original, independientemente
de si la forma de onda se parece o no. En el transmisor se analiza la voz y se extraen los
parámetros del modelo y la excitación. Esta información se envía al receptor donde se sintetiza
la voz. El resultado es que se produce voz inteligible a muy bajo bit-rate, pero tiene el problema
de que no suena natural.
Es un analizador y sintetizador de voz. Fue desarrollado en la década de 1930 como un

codificador de voz para telecomunicaciones. Su primer uso fue la seguridad en
radiocomunicaciones, donde la voz tiene que ser digitalizada, cifrada y transmitida por un canal
de ancho de banda estrecho.
El vocoder se ha usado también como instrumento musical. Como instrumento, es usado con
guitarras y sintetizadores y produce un sonido de «guitarra parlante» o «teclado parlante»,
según el instrumento. Los vocoders son usados con frecuencia para crear el sonido de un robot
hablando, como en la canción Mr. Roboto de Styx.
El vocoder está relacionado con el algoritmo denominado phase vocoder, aunque esencialmente
es diferente de éste.
Funcionamiento
El funcionamiento de un vocoder se realiza a través de la voz humana que consiste en sonidos
generados por la apertura y cierre de la glotis (cuerdas vocales), lo que produce una onda
periódica con muchos sonidos armónicos. Este sonido básico es entonces filtrado por la nariz y
la garganta (un complicado sistema resonante conocido como el tracto vocal) de forma
controlada, creando la amplia variedad de timbres del habla. Hay otro conjunto de sonidos,
conocidos como sordos, que no son generados por la vibración de las cuerdas vocales.
El vocoder examina el habla encontrando su onda básica, que es la frecuencia fundamental, y

midiendo cómo cambian en el tiempo las características espectrales, es decir los formantes, que
son bandas de frecuencia donde se concentra la mayor parte de la energía sonora de un sonido,
grabando el habla. Esto da como resultado una serie de números representando esas
frecuencias modificadas en un tiempo particular a medida que el usuario habla. Al hacer esto,
el vocoder reduce en gran medida la cantidad de información necesaria para almacenar el habla.
Para recrear el habla, el vocoder simplemente revierte el proceso, creando la frecuencia
fundamental en un oscilador electrónico y pasando su resultado por una serie de filtros basado
en la secuencia original de símbolos.
Figura 12. Diagrama del funcionamiento de un vocoder
Cuantificación
La cuantificación es el proceso mediante el cual se asignan valores discretos, a las amplitudes de
las muestras obtenidas en el proceso de muestreo. Existen varias formas de cuantificar que
iremos detallando según su complejidad.
 Cuantificación Uniforme:
Hay que utilizar un número finito de valores discretos para representar en forma aproximada la
amplitud de las muestras. Para ello, toda la gama de amplitudes que pueden tomar las muestras
se divide en intervalos iguales y a todas las muestras cuya amplitud cae dentro de un intervalo,
se les da el mismo valor.
El proceso de cuantificación introduce necesariamente un error, ya que se sustituye la amplitud

real de la muestra, por un valor aproximado. A este error se le llama error de cuantificación.
El error de cuantificación se podría reducir aumentando el número de intervalos de
cuantificación, pero existen limitaciones de tipo práctico que obligan a que el número de
intervalos no sobrepase un determinado valor.
Una cuantificación de este tipo, en la que todos los intervalos tienen la misma amplitud, se llama
cuantificación uniforme.
En siguiente figura se muestra el efecto de la cuantificación para el caso de una señal analógica.
El número de intervalos de cuantificación se ha limitado a ocho.
La señal original es la de trazo continuo, las muestras reconstruidas en el terminal distante, se

representan por puntos y la señal reconstruida es la línea de trazos.
El error de cuantificación introducido en cada muestra, da lugar a una deformación o distorsión

de la señal reconstruida que se representa por línea de trazos y puntos.
Figura 13. Cuantificación Uniforme de un vocoder
 Cuantificación No Uniforme:
En una cuantificación uniforme la distorsión es la misma cualquiera que sea la amplitud de la

muestra. Por lo tanto cuanto menor es la amplitud de la señal de entrada mayor es la influencia
del error. La situación se hace ya inadmisible para señales cuya amplitud analógica está cerca de
la de un intervalo de cuantificación.
Para solucionar este problema existen dos soluciones:
- Aumentar los intervalos de cuantificación - si hay más intervalos habrá menos errores pero
necesitaremos más números binarios para cuantificar una muestra y por tanto acabaremos
necesitando mas ancho de banda para transmitirla.
- Mediante una cuantificación no uniforme, en la cual se toma un número determinado de

intervalos y se distribuyen de forma no uniforme aproximándolos en los niveles bajos de señal,
y separándolos en los niveles altos. De esta forma, para las señales débiles es como si se utilizase
un número muy elevado de niveles de cuantificación, con lo que se produce una disminución de
la distorsión. Sin embargo para las señales fuertes se tendrá una situación menos favorable que
la correspondiente a una cuantificación uniforme, pero todavía suficientemente buena.
Por lo tanto lo que podemos hacer es realizar una cuantificación no uniforme mediante un codec
(compresor-decompresor) y una cuantificación uniforme según se ve en la siguiente figura:
Figura 14. Cuantificación No Uniforme de un vocoder
Parámetros
Los códecs de audio se caracterizan por los siguientes parámetros:
 Frecuencia de muestreo:
Este parámetro determina la velocidad a la que se toman muestras de la señal analógica.

Determinado este parámetro, tenemos determinado el rango espectral que se va a codificar de
la señal, ya que por el teorema del muestreo de Nyquist-Shannon el ancho de banda de la señal
tendrá que ser como máximo la mitad de la frecuencia de muestreo, si queremos que la señal
pueda ser recuperada correctamente a través de sus muestras. Para una señal de audio que
abarque todo el rango de frecuencias audible por el ser humano una frecuencia de entre 40 y
44 Khz es suficiente, aunque para aplicaciones de mayor calidad de audio o audio profesional,
se usan frecuencias de muestreo mayores, típicamente de 48 o 96 KHz. Para señales que
exclusivamente contengan voz, cuyo espectro típicamente se encuentra en el rango de 300 a
3400 Hz, se suele utilizar una frecuencia de 8 KHz. En este caso el códec se denomina de banda
estrecha o narrowband. Aunque en el caso de señales vocales hay códecs que para ofrecer una
mayor calidad de audio utilizan una frecuencia superior, de 16 KHz. A estos códecs se les llama
de banda ancha wideband.
 Tasa binaria o bit rate:
Es el número de bits por segundo que salen del codificador en el proceso de codificación, y que
entran al codificador (generalmente) en el proceso de decodificación. Es un parámetro crítico,
ya que junto con la frecuencia de muestreo es uno de los parámetros que más determinan la
calidad de la señal codificada. Una tasa binaria muy elevada implica que el número de bits a
almacenar sea muy elevado (por ejemplo para un archivo de audio), o que el número de bits a
transmitir por el canal de comunicaciones sea demasiado elevado para el canal. Generalmente
en la codificación se persigue disminuir lo máximo la tasa binaria afectando lo mínimo posible a
la señal original. Para las señales de audio convencionales (para música, cine, televisión) las tasas
binarias suelen ser casi siempre superiores a los 32 kbps, mientras que para señales de voz, se
suelen usar tasas siempre menores que 64 Kbps, y la tendencia actual de los códecs de voz es
disminuir cada vez más la tasa binaria sin afectar a la calidad de la señal.
 Calidad de audio:
Aunque más bien esta es una medida subjetiva para cada individuo, existen escalas de valoración
de la calidad del audio, realizadas en base a experimentos con muchos individuos en condiciones
determinadas. Una escala ampliamente utilizada para medir la calidad del audio es la escala
MOS (Mean Opinión Score), que da una puntuación mínima de 1.0 (calidad pésima) y una
máxima de 5.0 (calidad excelente). También existen medidas objetivas de la calidad, pero en
este trabajo nos centraremos en calidad subjetiva para el usuario, y siempre que hablemos de
que un códec proporciona mayor calidad que otro, lo decimos siempre en base a las
puntucaciones del códec en la escala MOS.
 Número de canales codificados:
Número de canales diferentes que son codificados en una misma señal de audio. Si hay un solo
canal se denomina Mono, y si hay 2 Stereo. Este parámetro es muy habitual en los códecs de
música, televisión y cine, donde los códecs suelen aprovechar el parecido de los distintos canales
para reducir la tasa binaria. En los códecs para señales de voz, casi siempre hay un solo canal ,
ya que lo más importante para este caso es la inteligibilidad de la voz.
 Retardo:
Se define el retardo de un códec como el tiempo que transcurre entre la entrada de una muestra
de la señal de audio al codificador, hasta que la señal decodificada correspondiente a dicha
muestra sale por el decodificador, suponiendo que la salida del codificador y del decodificador
están conectadas directamente. Para códecs cuyas aplicaciones no sean en tiempo real este
parámetro no es crítico aunque es importante, porque por ejemplo determina si se tarda mucho
en codificar una señal para almacenarla. Para códecs cuyas aplicaciones si sean en tiempo real
(telefonía, videoconferencia, VoIP, streaming de audio), este parámetro es muy importante, ya
que un códec que introduzca mucho retardo hará que se haga muy difícil la comunicación en
tiempo real, ya que en el canal siempre hay un cierto retardo. Valores aceptables para el retardo
de un códec (usado en aplicaciones de tiempo real) son entre 5 y 50 ms.
Conclusiones y Recomendaciones
Conclusiones
 Para poder obtener la voz grabada se utilizó comandos antes mencionados la señal
grabada fue en un tiempo de 2s, con 16000 muestras y una taza de codificación de 112K
 Al obtener la gráfica de la señal grabada se procedió a dividirlo en niveles para este caso
se utilizó 128 niveles de donde se concluyó que al utilizar más niveles más se acerca a la
gráfica original, el problema es que entre más niveles mayor es el procesamiento y el
tiempo de ejecución,
Recomendaciones
 Se recomienda utilizar la cantidad justa de niveles no exceder ya que ocasiona
sobrecalentamiento, tampoco utilizar pocos niveles ya que la señal no se reconstruye
completamente y se pierden datos.
Bibliografía
 Procesamiento _voz.pdf Gonzalo Olmedo
 http://www2.ulpgc.es/hege/almacen/download/7053/7053986/tema_2_2007_2008_
c.pdf
 http://www.voipforo.com/codec/codec-g711--ley.php
 http://www.lpi.tel.uva.es/~nacho/docencia/ing_ond_1/trabajos_07_08/io5/public_ht
ml/Parametros.htm

Cuantificador Uniforme y No Uniforme en Vocoder

Загружено:

Сведения о документе

Исходное описание:

Оригинальное название

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

Cuantificador Uniforme y No Uniforme en Vocoder

Загружено:

Авторское право:

Доступные форматы

UNIVERSIDAD DE LAS FUERZAS ARMADAS - ESPE

DEPARTAMENTO DE ELÉCTRICA Y ELECTRÓNICA

CARRERA DE INGENIERÍA ELECTRÓNICA EN AUTOMATIZACIÓN Y CONTROL

SANGOLQUÍ, 14 DE JUNIO DEL 2018

Figura 1. Representación gráfica de los procesos que tiene la transmisión

Figura 2. Cuantificación no uniforme

Figura 4. Representación gráfica de la señal reconstruida utilizando 128 niveles.

Como se puede observar la gráfica está dividida en 16 partes

Figura 5. Representación gráfica de la señal grabada y 16 niveles para cuantificar

Como se puede observar la gráfica está dividida en 64 partes

Figura 6. Representación gráfica de la señal grabada y 64 niveles para cuantificar

Como se puede observar la gráfica está dividida en 128 partes

 Implemente la “Codificación” en el ejemplo de cuantificador no uniforme para la ley

Figura 8. Representación gráfica de Cuantificador Uniforme-Ley u

Es un analizador y sintetizador de voz. Fue desarrollado en la década de 1930 como un

El vocoder examina el habla encontrando su onda básica, que es la frecuencia fundamental, y

Figura 12. Diagrama del funcionamiento de un vocoder

El proceso de cuantificación introduce necesariamente un error, ya que se sustituye la amplitud

La señal original es la de trazo continuo, las muestras reconstruidas en el terminal distante, se

El error de cuantificación introducido en cada muestra, da lugar a una deformación o distorsión

Figura 13. Cuantificación Uniforme de un vocoder

En una cuantificación uniforme la distorsión es la misma cualquiera que sea la amplitud de la

Para solucionar este problema existen dos soluciones:

- Mediante una cuantificación no uniforme, en la cual se toma un número determinado de

Figura 14. Cuantificación No Uniforme de un vocoder

Este parámetro determina la velocidad a la que se toman muestras de la señal analógica.

 Tasa binaria o bit rate:

 Número de canales codificados:

Вам также может понравиться