Вы находитесь на странице: 1из 10

e

Materia: TEORIA DE INFORMACION Y CODIFICACION

ESCUELA NACIONAL POLITCNICA


FACULTAD DE INGENIERA ELECTRNICA Y TELECOMUNICACIONES

TRABAJO BIMESTRAL

Temas: 1. Codificacin LEMPEL_ZIV Realizado por: Granja Prez Mireya Daniela Prez Santiago Damacela Carlos Fecha de entrega: Lunes 19 de Marzo del 2012 Perodo: ENERO /2012MAYO/2012 QUITO-ECUADOR

13/02/2012 El primer problema que enfrentamos fue al ver que el documento que tenamos que analizar se encontraba en ingles. Por lo tanto para facilitar el desarrollo del anlisis del documento nos dividimos el nmero de hojas para los tres del grupo, as a medida que vayamos a reunirnos cada uno debe ser responsable de la traduccin de cada hoja. Por lo tanto as evitaremos problemas de entendimiento con ciertos trminos tcnicos, ya al momento de analizar entre los tres podremos darle significado dentro del prrafo que ocupe dicha palabra. 15/02/2012 Nos reunimos en la tarde para empezar a analizar la primera hoja. PROBLEMAS Y SOLUCIONES Primer problema: Tuvimos un problema de comprensin al momento que mencionaron los parmetros fundamentales de la fuente. No lo sabamos. Y en ese fue un problema ya que era importante para entender el prrafo. Segundo problema: Que es probabilidad apriori y no apriori? Solucin: En inferencia estadstica Bayesiana, una distribucin de probabilidad a-priori de una cantidad p desconocida, es la distribucin de probabilidad que expresa alguna incertidumbre acerca de p antes de tomar en cuenta los "datos". ORGANIGRAMAS DE IDEAS

Identificar las limitaciones de la fuente Para la comprensin de informacin de la fuente

FUENTE DISCRETA

Un plan de codificacin

El test estadstico es imposible o ireal

Existen problemas en la fuente

si

Conocimiento a priori est dentro de las caractersticas de la fuente


solucin

Un gran espacio de memoria de trabajo Plan Universal De Codificacin

Es necesario Desarrollo critico

Aplicado a cualquier fuente discreta

CODIGO LEMPEL-ZIV
Plan universal de codificacin

Susceptibilidad a problemas de error

17/02/2012 Realizamos un breve resumen de lo que entendimos de las pginas anteriores: Cuando est dada una fuente discreta de informacin, se presentan dos grandes problemas, el 1ero es identificar las limitaciones de la fuente y 2do inventar un plan de codificacin, el cual seguro desarrollara criterio para que sea la mejor compresin de la fuente dada. Una vez que los parmetros fundamentales de la fuente han sido identificados, el problema se reduce a una codificacin con menor redundancia.

problema

El proceso de codificacin esta interrelacionado con un proceso de aprendizaje de las variantes caractersticas de la fuente, debido a que si tenemos un test estadstico irreal o imposible el problema de la compresin de informacin llega a considerarse bastante complicado. En este paper se describe un plan universal de codificacin el cual puede ser aplicado a cualquier fuente discreta y su desarrollo es comparable con otros libros de optima correccin de cdigos diseados para especificas fuentes. El algoritmo de compresin El propuesto algoritmo de compresin consiste en una regla de analizar gramaticalmente una serie de smbolos de un alfabeto infinito A en subseries o palabras el cual su longitud no excedan el suscrito Ls. Lc est definido por la siguiente expresin:

21/02/2012 Nos reunimos a tratar de analizar la continuacin de las hojas.

PROBLEMAS Y SOLUCIONES Primer Problema: Nos demoramos bastante tratando de entender pero no fue posible, era inentendible. Hablaba de prefijos, de condiciones, frmulas que aparecan y confundan. Solucin: La nica solucin que pudimos encontrar en ese momento, ya que era ya noche fue es que tratemos de encontrar un momento libre y buscar al Ingeniero. A continuacin detallaremos los problemas que tuvimos:

L( longitud) de cada simbolo A no tenga Ls(long. Palabra superior) Algoritmo De comprensin Se debe analizar gramaticalmente el alfabeto infinito A

Una codificacin que limite los subcaracteres en palabras unicas decifrables (Lc)

Se podra decir que no estuvieron medias claras las condiciones para este algoritmo, pero de ah se derivo esta ecuacin:

Donde explicaban que era la longitud del buffer empleado en la condicin final. Segundo Problema Que es un buffer? Solucin: Como esta es una palabra tcnica no haba una traduccin exacta, y a medida que continubamos analizando el cdigo, esta palabra se segua repitiendo en muchas ocasiones, as que segn nuestro anlisis dentro de muchos contextos, concluimos que el escritor quera referirse a tipo como una memoria auxiliar la cual all se va a ir almacenando las palabras del diccionario. Despus, empez la confusin completa cuando el escrito habla de caracteres, subcaracteres, ordenas, etc. Esto es lo poco que pudimos entender lo cual no estbamos seguros de estar en lo correcto.

Existe un conjunto

A {0,1,, nA=

De ah se extrae una S=S1,S2,,Sk ordenada k-sima L(s)=k

Hasta ah medio entendido, pero luego empez a complicarse:

S=S1,S2,,Sk L(s)=k

Se derivan subcaracteres

L(Q)=k L(R)=m

Q=S(1,k) R=S(k+1,k+m)

Empez a dar muchas restricciones para i y j que eran sufijos de S. No entendimos. Y menos cuando se presento un ejercicio resuelto para aclarar el anlisis, pero estuvo imposible entender. 29/02/2012 Despus de haber solicitado la ayuda del Ingeniero, como que facilito bastante lo que antes no entendamos. Ahora por lo menos ya comprendimos cual era el objetivo de este cdigo, y cmo funcionaba bsicamente. Ejemplo: Si pero tanto, puntero y , entonces puesto que . De manera similar, es la extensin reproducible de

. Por lo en S con

Tomando en cuenta las condiciones que analizamos en el cdigo es necesario que:

Entonces, debemos ir analizando para que i que cumpla j. Es decir ir jugando con valores hasta encontrar el puntero. no cumple ni con subgrupo no se repite en ningn subgrupos de S. Coinciden, se repite 0101 , ya que este

Se analiza para que cumpla las condiciones: Por lo tanto, S con puntero si cumple ya que nuestro es la extensin reproducible de . en

Es decir, bsicamente este cdigo trata de simplificar palabras cdigo que se repiten en una cadena de informacin, y almacenarlos en un diccionario. 09/03/2012

Por problemas de falta de tiempo, no nos pudimos reunir hasta este da por lo que realizamos una revisin de lo entendido hasta este momento, es decir volvimos a revisar una parte que no qued bien entendida. Y continuamos con la revisin del paper: COMPRESION DE FUENTE FORZADAS En esta seccin se analiza el desarrollo del propuesto algoritmo de compresin con respecto a un modelo No probabilstico de fuentes de informacin forzada. Despues de definir el modelo de la fuente, se derivan los limites inferiores en la compresin del ndice posible del bloque a la variable y de la variable al bloque de cdigos sobre todo el conocimiento de la fuente y entonces se muestra que el ndice de compresin logrado por el cdigo universal aprovecha estos limites. A. Definicion del modelo de la fuente Dado Sea alfa smbolo del alfabeto dado y A* denota el grupo de todos los caracteres finitos sobre A. Tenemos la expresin S {m} que denota el grupo de todos los subcaracteres de dimensin m contenidos en S , y S(m) denota la cardinalidad de S{m}, entonces

Dado un subgrupo de A* entonces:

Se dice entonces que un subgrupo de A* es llamado una fuente si se cumplen las 3


propiedades: 1. SI A 2. S ---> SS 3. S ---> S{m} {m}

Y una propiedad adicional


4. h(m)=1/m log (m)

14/03/2012 En este da nos reunimos para analizar la continuacin del pdf

PROBLEMAS Y SOLUCIONES Primer Problema: Al inicio de la cuarta hoja menciona que se debemos grabar el resultado para un uso posterior en un lema, que no sabemos qu significa exactamente. Solucin: Lema significa: Todo cdigo instantneo ptimo verifica: si p(ai) > p(aj) entonces Li Lj entre todas las palabras-cdigo de longitud mxima existen, al menos, dos que difieren slo en el ltimo smbolo Segundo Problema: En esta hoja menciona varias veces la utilizacin de un libro de cdigos Solucin: Despues de analizar entre nosotros nos dimos cuenta que el libro de cdigos, al que se refiere es el diccionario en el que este algoritmo se basa para su codificacin y decodificacin, al investigar en internet tambin encontramos esta informacin: El diccionario contiene inicialmente 257 cdigos, 256 cdigos para los 256 caracteres simples posibles con 8 bits y un cdigo que representa el fin de archivo. Como parte ms importante de esta hoja es recalcar los dos lemas que se mencionan; en el resto de la hoja se menciona varias condiciones que deben cumplir las M palabras o las longitudes que deben cumplir estas. Tambin se suponen condiciones y se realiza una especie de pruebas para verificar el rendimiento del cdigo en las peores condiciones.

DONDE LEMMA 1 L SATISFACE LEMMA 2 DONDE Para tener una referencia ms tarde, se graba el resultado en el siguiente lema: Lema 1: Donde La relacin de compresin que est asociado con la i-sima palabra es: La relacin de compresin Bloque a la variable (VB) se define: Donde PRUEBA Se puede suponer, sin prdida de generalidad, que en todos los cdigos en estudio por lo tanto, para cada Dado que C es exhaustiva con respecto a , tenemos Donde l1 = l (X1), y puesto que C es nicamente descifrable tenemos

16/03/2012 Y continuamos: Dado que el valor de L en el contexto del lema 1 satisface la definicin de LM como se indica en el lema 2, se deduce que los lmites de los dos lemas son esencialmente los mismos. La segunda propiedad que define a una fuente, son los lmites de palabras derivadas por arriba se aplica a los mensajes largos indefinidamente. Un aumento en el tamao M del libro de cdigos empleada provoca una disminucin en el lmite inferior en la relacin de compresin alcanzable. EL RENDIMIENTO DEL ALGORITMO Para este fin, se considera el mensaje caso peor fuente de longitud n-LS, donde n es la longitud tampn perspectiva y L es la mxima longitud de palabra. El obtenido con destino a este caso, obviamente, se aplicar a todos los mensajes de longitud n-LS o superior. La propiedad no creciente de los h-parmetros, la forma de los lmites derivados confirma la expectativa intuitiva que un aumento en el tamao M del libro de cdigos.

Вам также может понравиться