Вы находитесь на странице: 1из 6

Codificacin Aritmtica

La Codificacin Aritmtica es una forma de codificacin de entropa utilizada en la compresin de


datos sin prdidas. Normalmente, una cadena de caracteres, tales como la palabra "Hola" se
representa mediante un nmero fijo de bits por carcter, como en el cdigo ASCII. Pero cuando una
cadena se convierte a la codificacin aritmtica, los caracteres de uso frecuente se almacenan con
un menor nmero de bits, y los caracteres que aparezcan de forma menos frecuente se almacenan
con ms bits: todo ello da como resultado un menor nmero de bits en total para representar el
mismo fichero. La Codificacin Aritmtica se diferencia de otras formas de codificacin de la
entropa (como la Codificacin Huffman) en que, en lugar de separar la entrada en smbolos de
componentes y sustituir cada uno de ellos con un cdigo, la codificacin aritmtica codifica el
mensaje completo en un solo nmero.
Este mtodo de compresin trabaja de forma implcita con fuentes extendidas sin necesidad de
calcular todas las probabilidades para cada fuente extendida.
En la codificacin aritmtica no se asigna una palabra de cdigo a cada uno de los smbolos del
alfabeto fuente. El proceso de codificacin se basa en asignar a cada smbolo un intervalo entre 0 y
1, de forma que la amplitud de cada intervalo sea igual a la probabilidad de cada smbolo. La suma
de las amplitudes de los intervalos debe ser igual a la unidad.

Proceso de Codificacin:
Para realizar la codificacin de cada uno de los smbolos asociados a un mensaje entrante se siguen
los siguientes pasos:
Se selecciona el primer smbolo de la secuencia de entrada y localizar el intervalo asociado
a ese smbolo.
A continuacin se selecciona el siguiente smbolo y se localiza su intervalo. Se multiplican
los extremos de este intervalo por la longitud del intervalo asociado al smbolo anterior (es
decir, por la probabilidad del smbolo anterior) y los resultados se suman al extremo inferior
del intervalo asociado al smbolo anterior para obtener unos nuevos extremos inferior y
superior. Este paso lo seguiremos repitiendo hasta que terminemos de hallar todos los
subintervalos asociados a cada smbolo del mensaje.
Por ltimo se selecciona un valor dentro del intervalo del ltimo smbolo de la secuencia.
Este valor representar la secuencia que queremos enviar.
La segunda parte del proceso de codificacin consistir en asignar al subintervalo final hallado en
la anterior etapa, una secuencia binaria que lo represente. Para ello calculamos las representaciones
binarias de L y H asociados con el intervalo [L,H), hasta que uno de los dgitos de L y H se diferencien
(es decir, hasta que en L nos salga un 0 y en la misma iteracin nos salga en H un 1).

Una vez hecho esto miramos ahora el valor de H. Si es distinto de 1, entonces tomamos como
codificacin del mensaje a representacin binaria que se ha ido sacando el intervalo superior H,
pero en caso de que sea 1, seguiremos sacando la codificacin binaria del intervalo inferior L hasta
que encontremos un 0 o hasta que dicho intervalo sea 1 al multiplicarlo constantemente por 2 para
poder hallar su representacin binaria. En esta caso ltimo, la representacin binaria del mensaje
ser la proporcionada por L.
Ejemplo:
Sea la palabra a codificar Casa, entonces:
Probabilidad Rango Actual
C 0.25 [0.0 , 0.25 >
A 0.5 [0.25,0.75 >
S 0.25 [0.75, 1.0 >

A continuacin se forman los nuevos intervalos para cada palabra, teniendo presente:
[ , > = + [ , > ( )
Para:
C
= 0.0
= 1.0
= 0.0
= 0.25
[ , > = 0.0 + [0.0, 0.25 > (1.0 0.0) = [0.0, 0.25 >
A
= 0.0
= 0.25
= 0.25
= 0.75
[ , > = 0.0 + [0.25, 0.75 > (0.25 0.0) = [0.0625, 0.1875 >
S
= 0.0625
= 0.1875
= 0.75
= 1.0

[ , > = 0.0625 + [0.75, 1.0 > (0.1875 0.0625) = [0.15625, 0.1875 >
A
= 0.15625
= 0.1875
= 0.25
= 0.75

[ , > = 0.15625 + [0.25, 0.75 > (0.1875 0.15625)


= [0.1640625, 0.1796875 >
Obteniendo el subintervalo Final:
[0.1640625, 0.1796875 >
Convertir a binario y obtener resultado:
Compresin de Imgenes y Videos
Conceptos Previos
Tamao de imagen: Se define con las dimensiones en pxel de la matriz o cuadrcula. Si una
imagen est formada por una matriz de 800 columnas por 500 filas, tiene entonces un
tamao de 800 x 500 pxel.

Tamao de imgenes digitales sin comprensin:


Para calcular el nmero total de pxeles de una imagen usaremos la siguiente frmula:
N de filas x n de columnas = n total de pxeles de la imagen
Por ejemplo: una cmara de 5 Mpx puede tener 2560 x 1920 pxeles = 4.915.00 pxls =5 Mpxls. Aprox

La Resolucin: se mide en pxeles por pulgada y tiene especial inters en relacin al uso que se le
va a dar a la imagen. En ella se establece una relacin entre el espacio real (pulgada, unidad mtrica)
con los pxeles (puntos de la imagen). Cuantos ms pxeles por pulgada tenemos una resolucin ms
alta de la imagen.

Audio sin comprensin.


Formatos PCM Los formatos PCM contienen toda la informacin que sali del convertidor analgico
a digital, sin ninguna omisin y por eso, tienen la mejor calidad. Dentro de esta categora se
encuentran los formatos WAV, AIFF, SU, AU y RAW (crudo). La diferencia principal que tienen estos
formatos es el encabezado, alrededor de 1000 bytes al comienzo del archivo
WAV es el formato de audio digital sin comprimir. Fue el primer formato de audio que existi para
PC .Surge como resultado de pasar un archivo de CD-Audio al disco duro del ordenador. Para
transformar este archivo a mp3 es necesario un sistema o programa de compresin (encoders).
La diferencia fundamental con el mp3 es el tamao del fichero, ocupando el formato WAV 12 veces
ms que el mp3. Actualmente este formato de audio se usa nicamente como paso intermedio
entre el CD-Audio y el mp3.

Audio en telefona.
El sonido telefnico digital utiliza como ya hemos dicho ocho bits por muestra, lo cual nos da un
caudal de 8 KHz x 8 bits/muestra = 64 Kb/s. Este es precisamente el caudal que corresponde a un
canal B (Bearer) de RDSI. Esta forma de digitalizar el sonido telefnico, que es la ms habitual, est
estandarizada por la ITU-T en la norma conocida como G.711.

Disco compacto.
En el audio digital de disco compacto cada muestra tiene 16 bits (a fin de conseguir una relacin
seal/ruido mejor que en telefona). Dado que el sonido es normalmente estreo el caudal
resultante es de 44,1 KHz x 16 bits/muestra x 2 canales = 1,411 Mb/s. Este caudal (equivalente a
176 Kbytes/s) corresponde al de un lector de CD-ROM de simple velocidad y es el caudal de un
lector de CD de audio.
Los sistemas DVD-Audio emplean el mismo principio bsico que el CD o la telefona digital, pero la
mayor capacidad de almacenamiento del DVD permite llegar a frecuencias de muestreo de hasta
192 KHz recogiendo hasta 24 bits por muestra. Utilizando estos parmetros con dos canales el
caudal resultante es de 9,2 Mb/s, que se encuentra prximo al lmite del DVD-Audio (9,6 Mb/s).
Teleconferencia
Hay varios sistemas de teleconferencias que utilizamos en nuestro proceso de enseanza y
aprendizaje:
1) Teleconferencia audiogrfica: (audio + datos).
2) Teleconferencia por computador (Email, Web) se realizan en tiempo real o diferido.
3) Teleconferencia en multimedia (combinacin-integracin medios).
La teleconferencia ofrece hoy en da una solucin accesible a esta necesidad de comunicacin, con
sistemas que permiten el transmitir y recibir informacin visual y sonora entre puntos o zonas
diferentes evitando as los gastos y prdida de tiempo que implican el traslado fsico de la persona,
todo esto a costos cada vez ms bajos y con seales de mejor calidad.

Video sin compresin.


Es un video capturado que no ha sido alterado por ningn dispositivo o software de compresin de
datos. El video sin compresin toma mucho espacio de almacenamiento y ms ancho de banda en
su transmisin, pero provee la mejor calidad.
En vdeo digital el formato no comprimido ms utilizado es el CCIR-601 estandarizado por la ITU-R,
que corresponde a calidad de estudio y puede funcionar con el sistema americano (NTSC) o el
europeo (PAL) en formato 4:3 o 16:9. En CCIR-601 se digitaliza directamente cada una de las tres
componentes habitualmente utilizadas en televisin analgica, la luminancia (Y) y las dos
componentes de crominancia, que aqu se denominan Cr y Cb.
En PAL la imagen es de 720 x 576 pixels, con una frecuencia de 25 fotogramas por segundo. En
luminancia se digitalizan todos los pixels, pero para la crominancia se representa nicamente la
mitad en horizontal, dando una imagen de 360 x 576 pixels. Esto reduce a la mitad la informacin
generada por la crominancia aprovechado el hecho psicolgico de que el ojo humano es ms
sensible a la luminancia. A razn de ocho bits por pixel la luminancia genera 720 x 576 x 8 x 25 =
82,944 Mb/s y la crominancia 360 x 576 x (8+8) x 25 = 82,944 Mb/s, lo cual da un total de 165,888
Mb/s.
En Televisin de alta definicin el formato equivalente a CCIR-601 llegara a caudales de hasta 2
Gb/s. A la vista de estos valores se comprende fcilmente la necesidad de efectuar compresin del
vdeo cuando se almacena de forma digital o se transmite por redes telemticas.

Necesidad de la compresin.
La mayora de las aplicaciones multimedia requieren volmenes importantes de almacenamiento y
transmisin.
CD-ROM 640 Mb
Una pelcula de 90 min. 120 Gb
Un canal HDTV requiere 2 Gb/seg
Por esta razn se hace imprescindible el uso de tcnicas de compresin de las seales audiovisuales
que permitan reducir considerablemente el volumen de informacin necesario para representarlas.
La compresin es un proceso que intenta alcanzar una representacin ms compacta de la seal
digital, mediante la eliminacin de la redundancia existente en dicha seal.
El objetivo es minimizar el caudal de bits necesario para su transmisin o almacenamiento,
preservando la calidad de la seal.
Las seales de audio y vdeo son interesantes desde el punto de vista de la compresin, debido a
que contienen gran cantidad de informacin redundante que en gran parte puede eliminarse antes
de su transmisin o almacenamiento.

Algoritmos de compresin y efecto de la compresin en el tamao de


imgenes, audio y video
Tipos de algoritmos de compresin: simtricos y asimtricos; con prdidas y sin perdidas.
Clasificacin algoritmos de compresin

Por su velocidad relativa de compresin/descompresin:


Simtricos: necesitan aproximadamente la misma potencia de CPU para comprimir que para
descomprimir
Asimtricos: requieren bastante ms CPU para comprimir que para descomprimir.
En multimedia se suelen utilizar algoritmos lossy
Siempre se necesita ms CPU para comprimir que para descomprimir
Generalmente los algoritmos que consiguen mayor compresin gastan ms CPU.

Por su fidelidad:
Sin prdidas (lossless): usada para datos (ej.: norma V.42bis en mdems, ficheros .Zip)
Con prdidas (lossy): usada normalmente en audio y vdeo. Inaceptable para datos

La utilizacin de algoritmos de compresin con prdidas permite realizar una compresin


considerablemente mayor a cambio de que el flujo descomprimido no sea idntico. Adems algunos
algoritmos de compresin con prdidas aprovechan caractersticas psicolgicas del odo y del ojo
humano para eliminar informacin cuya ausencia no ser detectada. Cuando el factor limitante en
la calidad es el caudal generado (que es lo habitual) la mayor compresin de los algoritmos con
prdidas permite realizar la digitalizacin con mayor precisin (ms muestras por segundo o ms
bits por muestra) con lo que a la postre se obtiene una mayor calidad para un mismo caudal de bits
transmitidos.
Un ejemplo de compresin con prdidas lo tenemos en el algoritmo ADPCM utilizado en telefona.
Este algoritmo se basa en el hecho de que los valores de amplitud de muestras consecutivas suelen
ser muy similares entre s. Entonces en vez de representar en cada muestra la amplitud como una
magnitud absoluta se la representa como la diferencia de amplitud respecto de la muestra anterior.
Solo en la primera muestra se representa la amplitud como valor absoluto.

Estndares de compresin
JPEG (Joint Photographic Experts Group): JPEG es tambin el nombre que recibe el estndar de
compresin, que es el mtodo ms adecuado para fotografas e imgenes de tonos continuos
similares que contengan muchos colores. Permite obtener unos radios de compresin muy altos
manteniendo a su vez una calidad en la imagen muy elevada. Este estndar define tres sistemas de
codificacin diferentes
Sistema base con prdidas: utiliza la DCT y es adecuado para la mayora de las aplicaciones.
Requerido para ser compatible JPEG.
Sistema extendido: para mayor compresin y aplicaciones de reconstruccin progresiva.
Sistema independiente sin prdidas: para compresin reversible.
Algoritmo del sistema base JPEG:
1. Subdivisin de la imagen en bloques de 88, procesados a continuacin de izquierda a
derecha y de arriba hacia abajo.
2. Desplazamiento de nivel restando 2(n1), con n: nmero de bits de cada pxel
3. original. Ej: en 256 niveles de grises se resta 127 a cada pxel.
4. Clculo de la DCT.
5. Cuantizacin de coeficientes.
6. Reordenamiento de coeficientes.
7. Codificacin del coeficiente de brillo mediante DPCM con el brillo del
8. bloque anterior, y cdigo Huffman.
9. Codificacin del resto de coeficientes con cdigo Huffman.

LPC
(Linear Predictive Coder). Este algoritmo hace corresponder la seal audio con un modelo lineal
simple y obtiene los parmetros que mejor ajustan el modelo a la seal. La seal generada es poco
fiel a la original. Se utiliza en algunos servicios de voz.
Define un modelo analtico del aparato fonador
Reduce cada segmento de audio a los parmetros del modelo que ms se aproximan al
original.
El decodificador recoge estos parmetros y sintetiza la voz correspondiente.
LPC-10E puede bajar hasta 2.4 Kbps.

CELP
Es una versin mejorada del LPC.
Diferencia:
a) Utiliza un code-book con secuencias predefinidas para aplicarlas a cada frame de audio,
eligiendo aquella que ms se aproxima al original. Adems, calcula los errores cometidos.
b) Se envan los parmetros y la versin comprimida de los errores.
c) Tasa de bits de hasta 4.8 Kbps (calidad similar a ADPCM G.721 a 32 Kbps)
Variantes CELP:
GSM, VSELP, LD-CELP, ITU G.729, QCELP, MELT, et

Bibliografa
http://foro.gui.uva.es/t/jpeg-y-la-codificacion-aritmetica/585
Introduction to Arithmetic -theory and Practice -Amir Said-Imaging Systems Laboratory
http://arantxa.ii.uam.es/~jms/tdatos/2006-2007/p2/Guion_2_Codificacion_Aritmetica.pdf
https://sistemamultimedia.wordpress.com/ii-unidad/

Вам также может понравиться