Академический Документы
Профессиональный Документы
Культура Документы
GRUPO: 8cm1
BOLETA:2016300482
PRACTICA: ENTROPIA
OBJETIVO
El objetivo de la práctica, es que el alumna pueda comprobar prácticamente los conceptos vistos,
de teoría de la codificación, por ejemplo, probabilidad, cantidad de información, y entropía.
PROCEDIMIENTO
El programa inicial se nos fue proporcionado por el maestro, este programa fue desarrollado en
matlab.
Al seguir las indicaciones dadas por el maestro, el programa en matlab nos arrojó los siguientes
datos del texto del principito.
Aquí se muestran las gráficas que muestran la probabilidad y la cantidad de información de cada
palabra presenta en el texto del principito y en el texto en el idioma italiano de la divina comedia
Observaciones: Lo que se puede observar en las gráficas, es la probabilidad de que aparezca cada
letra en el texto, estos datos dependen del número de repeticiones de cada letra en los textos
analizados. Por ejemplo, el espaciado es el que tiene un mayor número de repeticiones en ambos
textos, esto se ve reflejado en la probabilidad, pues esta es muy alta en ambas gráficas.
Cantidad de información
Observaciones:
Lo que se puede observar en las siguientes gráficas es que, las letras que tuvieron poca
probabilidad, generaron mucha cantidad de información. Por ejemplo la letra “j” y “x” en
el texto en español fueron muy poco probables, esto ocasiono que en la gráfica de
cantidad de información “ j” y “x” tuvieran un valor muy elevado.
Conclusión de la entropía
Lo que se concluye de los valores de entropía es que, entre mayor es la probabilidad de
los caracteres generan menor incertidumbre, y esto hace que el valor de la entropía
disminuya. En la caso del texto en italiano como tuvo poca cantidad de información,
conllevó a que la entropía disminuyera mas que el texto español.
TABLA COMPARATIVA DE LOS LAS REPETICIONES POR PARES Y TERCIAS
Nota: tomar en cuenta que los espacios también se cuentan como carácter.
A continuación se muestran las gráficas, que muestran que palabras tienen más
repeticiones en los dos textos analizados.
Conclusiones.
Lo que se puede concluir de la comparación de las dos graficas es que, como el español y el
italiano tiene muchas similitudes en su escritura, esto provoca que en ambas graficas las palabras
con más repeticiones sean las vocales en pareja con el espaciado.
La palabra que tuvo más repeticiones fue la vocal “ e_ ”, incluso fue mayor en el texto en italiano.
También se puede concluir, que en el texto en español las repeticiones de los caracteres fueron
más equiprobables.
Las siguientes graficas muestran las tercias de caracteres, más repetidas en los textos.
Observaciones.
Se observa que las palabras más repetidas en el texto de español son las “de_ “ y “_de “.
En el idioma del italiano es la “_ch” y “di_” las más repetidas, esto se debe a que en italiano la
palabra “ CE” se escribe como “CHE”
Conclusiones.
Los datos de las tercias formados por los caracteres, fueron más equiprobables en ambos casos.
Pues en los pares de caracteres había una mayor diferencia entre las repeticiones de cada palabra.
FUENTES DE MARKOV CON MEMORIA
Conclusiones.Lo que se puede concluir de los valores obtenidos, es que la entropía es una fuente
que determina el nivel de compresión que podemos obtener como máximo para un conjunto de
datos. Además con la ayuda de las fuentes de MARKOV, que nos permiten reducir el valor de la
entropía por sus características de memoria, que se basa del pasado , para estimar futuros
patrones.