Вы находитесь на странице: 1из 5

ALGORITMOS DE COMPRESIN DE DATOS

Contenidos

Pg.

ndice General.1
1. Cdigo Lempel-Ziv.2
1.1. 1.2. 1.3. 1.4. 1.5. 1.6. Definicin2 Historia2 Algoritmo De Lempel-Ziv.2 Ejemplo...2 Puntos a considerar de Lempel Ziv...3 Conclusin..3

2. Turbo cdigo.........3
2.1. 2.2. 2.3. 2.4. Definicin....3 La Turbo codificacin.....3 Caractersticas Fundamentales3 Aplicaciones.....3

3. Reed-Solomon.....4
3.1. 3.2. 3.3. 3.4. Definicin.....4 Codificacin Reed-Solomon.4 Caractersticas...4 Aplicaciones......4

4. LDPC....4
4.1. Definicin..4 4.2. Importancia...4 4.3. Aplicaciones..4

5. Referencias5

ALGORITMOS DE COMPRESIN DE DATOS


1. Cdigo Lempel-Ziv
1.1. Definicin: Es una tcnica que no requiere un conocimiento de la probabilidad de aparicin de cada
smbolo. Por ello sern tiles en aquellas aplicaciones donde no sea posible conocer las probabilidades de los smbolos. Estos cdigos se basan en que algunas cadenas de smbolos se repiten frecuentemente, y estas cadenas podran ser sustituidas por una palabra de un nuevo cdigo que ocupe menos espacio. Para ello, tanto el emisor como el receptor construirn tablas que contendrn toda la informacin necesaria para llevar a cabo la compresin y descompresin. Son cdigos eficientes cuando se utilizan en ficheros y mensajes grandes.

1.2. Historia: El algoritmo de comprensin LZ78 fue desarrollado por Abraham Lempel y Jacob Ziv el
cual fue mejorado al algoritmo LZW (Lempel-Ziv-Welch) por Terry Welch en 1984. La mayora de los mtodos de compresin se basan en un anlisis inicial del texto para identificar cadenas repetidas para armar un diccionario de equivalencias, asignando cdigos breves a estas cadenas. En una segunda etapa, se convierte el texto utilizando los cdigos equivalentes para las cadenas repetidas. Esto requiere dos etapas, una de anlisis y una segunda de conversin y tambin requiere que el diccionario se encuentre junto con el texto codificado, incrementando el tamao del archivo de salida[1].

1.3. Algoritmo De Lempel-Ziv


Cdigo universal - funciona sin conocimiento de estadsticas de fuente Analiza sintcticamente el archivo de entrada en frases unvocas Codifica frases empleando palabras cdigo de longitud fija (Codificacin de longitud variable a fija) Analizar el archivo de entrada en frases que an no han aparecido: -Entrar frases en un diccionario. -Numerar su ubicacin Observe que cada frase nueva debe ser una frase vieja seguida por un 0 o un 1. Puede codificar la nueva frase utilizando la ubicacin del diccionario de la frase anterior seguida por el 0 o el 1.

1.4. Ejemplo
Entrada: 0010110111000101011110 Frases analizadas: 0, 01, 011, 0111, 00, 010, 1, 01111 Secuencia enviada: 00000 00011 00101 00111 00010 00100 00001 01001

Figura 1. Ejemplo de un diccionario

1.5. Puntos a considerar de Lempel Ziv


El decodificador slo puede decodificar unvocamente la secuencia enviada. El algoritmo no es eficiente para secuencias cortas (datos de entrada). El rendimiento del cdigo se aproxima a la entropa de fuente para secuencias largas. El tamao del diccionario debe elegirse con antelacin para que se pueda establecer la longitud de la palabra cdigo. Lempel-Ziv se usa frecuentemente para codificar archivos de texto/binarios, comprimir/descomprimir.

1.6. Conclusin: Este algoritmo, bsicamente busca secuencias repetidas dentro de los datos, y cada vez que
encuentra una de ellas la reemplaza por un puntero a la zona en la que comienza la primera secuencia, ms la longitud que se debe tomar a partir de esa posicin. En caso de que no haya repeticiones, se emite la secuencia como un literal. Lo ms importante, y lo que conforma el ncleo de la idea, es identificar lo que Lempel-Ziv llaman extensin reproducible de una cadena dentro de otra y que difiere un tanto de lo que coloquialmente llamamos "repeticiones''.

2. Turbo cdigo 2.1. Definicin: Los turbo cdigos son una nueva clase de cdigos de correccin de errores (FEC), que se
introdujeron, junto con un algoritmo de decodificacin. La importancia de los turbo cdigos es que permiten una comunicacin fiable y su eficiencia energtica est muy cerca del lmite terico predicho por Shannon. Desde su introduccin, los turbo cdigos se han utilizado en aplicaciones de baja potencia, como las comunicaciones por satlite, as como para aplicaciones de interferencia limitada, como los servicios de tercera generacin (3G) de comunicaciones mviles.

2.2. La Turbo codificacin:


Las prestaciones de un codificador convolucional mejoran al aumentar la memoria, pero no se puede aumentar la memoria indiscriminadamente ya que la complejidad en el proceso de decodificacin crece exponencialmente. Los turbo cdigos son esquemas de codificacin que aumentan la memoria de codificacin de forma artificial. Se basa en concatenar esquemas de codificacin relativamente simples con el fin de obtener un cdigo equivalente a uno de prestaciones ms complejas.

2.3. Caractersticas Fundamentales:


Uso de codificacin paralela concatenada. Uso de codificadores Convolucionales Recursivos. Uso de un dispersor pseudo-aleatorio. Uso de decodificacin iterativa.

2.4. Aplicaciones: Los turbo cdigos se usan en los sistemas de telecomunicaciones, algunos ejemplos son:
En Comunicaciones satlite y espaciales. En la televisin Digital. En las Comunicaciones de fibra ptica. En Comunicaciones inalmbricas (wireless). En Sistemas de grabacin pticos.

3. Reed-Solomon 3.1. Definicin: Reed-Solomon es un cdigo cclico no binario. Los cdigos cclicos son una subclase de los
cdigos de bloque estndar de deteccin y correccin de errores que protege la informacin contra errores en los datos transmitidos sobre un canal de comunicaciones. Este tipo de cdigo pertenece a la categora FEC (Forward Error Correction), es decir, corrige los datos alterados en el receptor.

3.2. Codificacin Reed-Solomon: Este cdigo se forma en base a grupos de bits que se denominan
smbolos. El cdigo Reed-Solomon trabaja con los smbolos en vez de con los bits individuales. Un smbolo es una secuencia de "m" bits individuales que aparecen en serie. Un smbolo es errneo cuando al menos un bit del smbolo tiene error.

3.3. Caractersticas: El cdigo Reed-Solomon presenta las siguientes caractersticas:


Cada smbolo est constituido por "m" bits consecutivos agrupados. Cada palabra-cdigo consta de "k" smbolos de informacin (en lugar de bits), y "r" smbolos de paridad. La longitud de la palabra-cdigo es: n = k + r smbolos, (longitud=n m expresada en n de bit). Se establece la relacin: n = 2m 1 entre la longitud de la palabra cdigo (n) y el nmero de smbolos (2m).

3.4. Aplicaciones: Este cdigo encuentra actualmente aplicacin en reas como por ejemplo:
Los CDs. Telefona mvil. Sondas espaciales (la sonda Galileo a Jpiter en 1989, la sonda Magallanes a Venus ese mismo ao o la sonda Ulises al Sol en 1990). Las comunicaciones por satlite Digital Video Broadcasting (DVB).

4. LDPC 4.1. Definicin: LDPC (Low Density Parity Check) comprobacin de paridad de baja densidad son una clase
de cdigos de correccin de error lineal que permiten transmitir un mensaje por un canal de comunicaciones ruidoso (canal de transmisin con errores). Los cdigos LDPC son cdigos lineales cuya propiedad esencial es la de tener por lo menos una matriz de paridad de baja densidad, es decir con pocos elementos distintos de cero. Formalmente, decimos que una secuencia (n) de cdigos es LDPC si cada cdigo tiene por lo menos una matriz de paridad en la cual la cantidad de elementos distintos de cero es O(n).

4.2. Importancia: El gran inters por los sistemas de codificacin basados en cdigos LDPC se debe a que
permiten comunicar con eficiencia muy cercana al lmite establecido por Shannon, con confiabilidad arbitrariamente grande y con muy baja complejidad para una gran variedad de medios de comunicacin.

4.3. Aplicaciones: Los cdigos LDPC se estn implementando en aplicaciones donde la transferencia de
informacin a travs del ancho de banda o de canal de retorno est limitado por la presencia de ruido. Aunque la aplicacin de turbo cdigos se ha impuesto en Estados Unidos como cdigo para los transponedores de satlite, LDPC tiene una ventaja, la ausencia de patente. Algunas otras de las aplicaciones posibles de los cdigos LDPC son: Recuperacin de paquetes perdidos en la distribucin de datos masivos a varios clientes en forma simultnea a travs de Internet. Almacenamiento en medios magnticos. Almacenamiento distribuido de informacin. Correccin de errores en telefona comn o inalmbrica y en mdems.

5. Referencias:
[1] Introduccin a la compresin de datos: Lempel-Ziv, disponible en: http://www.programacion.com/articulo/introduccion_a_la_compresion_de_datos [2] Codificacin y algoritmos, disponible en: http://ovandos-blog.blogspot.com/2010/05/codificacion-o-algoritmos-de-lempel-ziv.html [3] Ingeniera de sistemas de comunicacin/Clase 5: Codificacin de la fuente/Eytan Modiano(PDF). [4] Reed-Solomon Deteccin y correccin de Errores en CD, disponible en: http://www.slideshare.net/bonnzai/reed-solomon-397239 [5] Sistemas de codificacin, disponible en: http://www2.ing.puc.cl/~iee3552/ldpc.pdf

Вам также может понравиться