Академический Документы
Профессиональный Документы
Культура Документы
TEMA:
“Cuantificador Uniforme y cuantificador No Uniforme”
Tarea N°2.1
REALIZADO POR:
ALBARACIN FRANCISCO
DOCENTE:
ING. GONZALO OLMEDO
Objetivos
General
Digitalizar la señal de voz Utilizando el Cuantificación uniforme y cuantificación No
uniforme con ley μ ( μ =255) y con Ley A(a=87,6).
Específicos
Implementar el código necesario en Matlab para poder digitalizar la señal de voz
grabada.
Interpretar la gráfica de la cuantificación Uniforme.
Comparar la cuantificación No uniforme de la Ley μ y de la Ley A.
Resumen Breve
A continuación se mostraran las gráficas de las señales de voz grabada digitalizada, en
cuantificar uniforme y cuantificador No uniforme, por los dos métodos que son, la Ley μ y la Ley
A, además de comparar las gráficas obtenidas tanto del uniforme como del No uniforme.
Marco teórico
Cuantificador Uniforme
La cuantificación uniforme es el proceso de una vez muestreada la señal pasa a la etapa del
cuantificación que es donde, se dividen en niveles para del unto más cerca al nivel este adopte
la posición del nivel, al tener la señal cuantificada se procede a codificar tal como se muestra en
la figura 1. A continuación.
Cuantificador No uniforme
Cuantificación no uniforme, divide los niveles de cuantificación de tal manera que las amplitudes
más pequeñas no sean perdidas. Se basa en un proceso compresión y expansión llamado
companding. Se aplica una compresión/expansión de las amplitudes y posteriormente una
cuantificación uniforme. Las amplitudes de la señal de audio pequeñas son expandidas y las
amplitudes más elevadas son comprimidas. La relación entre los niveles de entrada y salida
podemos observar en la Figura.
Procedimiento.
Cuantificación Uniforme
Para realizar la cuantificación se necesita una señal de voz para este caso se procedió a grabar
la señal de voz, con los siguientes comandos:
r=audiorecorder;
disp('Iniciando')
recordblocking(r,2);
disp('Fin')
play(r);
x=getaudiodata(r);
Una vez grabada la señal se procede a guardarlo en la variable “x”, para de este modo graficar
la señal y poder observar el comportamiento que tiene.
Figura 3. Representación gráfica de la señal grabada y 128 niveles para cuantificar.
Como se puede observar la gráfica está dividida en 128 partes, cabe recalcar que entre más
niveles más se acerca a la señal original. El código implementado para realizar los niveles es el
siguiente.
nivel=128;
diferencia= (max(x)-min(x))/(nivel-1);
niveles=[min(x):diferencia:max(x)];
y=kron(niveles',ones(1,length(x)));
for niv=1:nivel
plot(y(niv,:),'r');
end
y1=abs(y-repmat(x',nivel,1));
[distancia ymin]=min(y1);
ydec=ymin-1;
figure(2);
plot(ydec);
grid on
Una vez que se tiene la señal cuantificada se procede a reconstruir la señal transmitida es decir
los bits cambiar los a decimal para así poder observar la gráfica enviada.
Esto se logró con un programa que cambia de bits a decimal e inversamente. El archivo se
encuentra adjunto en la carpeta con los demás simuladores.
Al utilizar 128 niveles se logró obtener la gráfica casi idéntica a la original. Tal como se muestra
a continuación.
Para el mejor de los casos se debe a la mayor numero de niveles que para este caso es el de
128 niveles ya que de esta manera el intervalo es más pequeño y esto produce que la señal de
salida sea similar a la señal original
Ley u
u=255
x=[-1:0.001:1]
a=log(1+u*abs(x))
b=log(1+u)
fx=sign(x).*(a/b)
plot(x,fx)
Ley A
u=255
x=[-1:0.001:1]
a=log(1+u*abs(x))
b=log(1+u)
fx=sign(x).*(a/b)
plot(x,fx)
Figura 9. Representación gráfica de Cuantificador Uniforme-Ley A
Cuantificador No uniforme
Ley u
Figura 10. Representación gráfica de la cuantificación no uniforme-Ley u
Ley A
Figura 11. Representación gráfica de la cuantificación no uniforme-Ley A
Vocoders
Los vocoders intentan producir una señal que suene como la voz original, independientemente
de si la forma de onda se parece o no. En el transmisor se analiza la voz y se extraen los
parámetros del modelo y la excitación. Esta información se envía al receptor donde se sintetiza
la voz. El resultado es que se produce voz inteligible a muy bajo bit-rate, pero tiene el problema
de que no suena natural.
El vocoder se ha usado también como instrumento musical. Como instrumento, es usado con
guitarras y sintetizadores y produce un sonido de «guitarra parlante» o «teclado parlante»,
según el instrumento. Los vocoders son usados con frecuencia para crear el sonido de un robot
hablando, como en la canción Mr. Roboto de Styx.
El vocoder está relacionado con el algoritmo denominado phase vocoder, aunque esencialmente
es diferente de éste.
Funcionamiento
El funcionamiento de un vocoder se realiza a través de la voz humana que consiste en sonidos
generados por la apertura y cierre de la glotis (cuerdas vocales), lo que produce una onda
periódica con muchos sonidos armónicos. Este sonido básico es entonces filtrado por la nariz y
la garganta (un complicado sistema resonante conocido como el tracto vocal) de forma
controlada, creando la amplia variedad de timbres del habla. Hay otro conjunto de sonidos,
conocidos como sordos, que no son generados por la vibración de las cuerdas vocales.
Cuantificación
La cuantificación es el proceso mediante el cual se asignan valores discretos, a las amplitudes de
las muestras obtenidas en el proceso de muestreo. Existen varias formas de cuantificar que
iremos detallando según su complejidad.
Cuantificación Uniforme:
Hay que utilizar un número finito de valores discretos para representar en forma aproximada la
amplitud de las muestras. Para ello, toda la gama de amplitudes que pueden tomar las muestras
se divide en intervalos iguales y a todas las muestras cuya amplitud cae dentro de un intervalo,
se les da el mismo valor.
Una cuantificación de este tipo, en la que todos los intervalos tienen la misma amplitud, se llama
cuantificación uniforme.
En siguiente figura se muestra el efecto de la cuantificación para el caso de una señal analógica.
El número de intervalos de cuantificación se ha limitado a ocho.
Cuantificación No Uniforme:
- Aumentar los intervalos de cuantificación - si hay más intervalos habrá menos errores pero
necesitaremos más números binarios para cuantificar una muestra y por tanto acabaremos
necesitando mas ancho de banda para transmitirla.
Parámetros
Los códecs de audio se caracterizan por los siguientes parámetros:
Frecuencia de muestreo:
Es el número de bits por segundo que salen del codificador en el proceso de codificación, y que
entran al codificador (generalmente) en el proceso de decodificación. Es un parámetro crítico,
ya que junto con la frecuencia de muestreo es uno de los parámetros que más determinan la
calidad de la señal codificada. Una tasa binaria muy elevada implica que el número de bits a
almacenar sea muy elevado (por ejemplo para un archivo de audio), o que el número de bits a
transmitir por el canal de comunicaciones sea demasiado elevado para el canal. Generalmente
en la codificación se persigue disminuir lo máximo la tasa binaria afectando lo mínimo posible a
la señal original. Para las señales de audio convencionales (para música, cine, televisión) las tasas
binarias suelen ser casi siempre superiores a los 32 kbps, mientras que para señales de voz, se
suelen usar tasas siempre menores que 64 Kbps, y la tendencia actual de los códecs de voz es
disminuir cada vez más la tasa binaria sin afectar a la calidad de la señal.
Calidad de audio:
Aunque más bien esta es una medida subjetiva para cada individuo, existen escalas de valoración
de la calidad del audio, realizadas en base a experimentos con muchos individuos en condiciones
determinadas. Una escala ampliamente utilizada para medir la calidad del audio es la escala
MOS (Mean Opinión Score), que da una puntuación mínima de 1.0 (calidad pésima) y una
máxima de 5.0 (calidad excelente). También existen medidas objetivas de la calidad, pero en
este trabajo nos centraremos en calidad subjetiva para el usuario, y siempre que hablemos de
que un códec proporciona mayor calidad que otro, lo decimos siempre en base a las
puntucaciones del códec en la escala MOS.
Número de canales diferentes que son codificados en una misma señal de audio. Si hay un solo
canal se denomina Mono, y si hay 2 Stereo. Este parámetro es muy habitual en los códecs de
música, televisión y cine, donde los códecs suelen aprovechar el parecido de los distintos canales
para reducir la tasa binaria. En los códecs para señales de voz, casi siempre hay un solo canal ,
ya que lo más importante para este caso es la inteligibilidad de la voz.
Retardo:
Se define el retardo de un códec como el tiempo que transcurre entre la entrada de una muestra
de la señal de audio al codificador, hasta que la señal decodificada correspondiente a dicha
muestra sale por el decodificador, suponiendo que la salida del codificador y del decodificador
están conectadas directamente. Para códecs cuyas aplicaciones no sean en tiempo real este
parámetro no es crítico aunque es importante, porque por ejemplo determina si se tarda mucho
en codificar una señal para almacenarla. Para códecs cuyas aplicaciones si sean en tiempo real
(telefonía, videoconferencia, VoIP, streaming de audio), este parámetro es muy importante, ya
que un códec que introduzca mucho retardo hará que se haga muy difícil la comunicación en
tiempo real, ya que en el canal siempre hay un cierto retardo. Valores aceptables para el retardo
de un códec (usado en aplicaciones de tiempo real) son entre 5 y 50 ms.
Conclusiones y Recomendaciones
Conclusiones
Para poder obtener la voz grabada se utilizó comandos antes mencionados la señal
grabada fue en un tiempo de 2s, con 16000 muestras y una taza de codificación de 112K
Al obtener la gráfica de la señal grabada se procedió a dividirlo en niveles para este caso
se utilizó 128 niveles de donde se concluyó que al utilizar más niveles más se acerca a la
gráfica original, el problema es que entre más niveles mayor es el procesamiento y el
tiempo de ejecución,
Recomendaciones
Se recomienda utilizar la cantidad justa de niveles no exceder ya que ocasiona
sobrecalentamiento, tampoco utilizar pocos niveles ya que la señal no se reconstruye
completamente y se pierden datos.
Bibliografía
Procesamiento _voz.pdf Gonzalo Olmedo
http://www2.ulpgc.es/hege/almacen/download/7053/7053986/tema_2_2007_2008_
c.pdf
http://www.voipforo.com/codec/codec-g711--ley.php
http://www.lpi.tel.uva.es/~nacho/docencia/ing_ond_1/trabajos_07_08/io5/public_ht
ml/Parametros.htm