Вы находитесь на странице: 1из 56

MPEG 2

Motion Picture Expert Group


(UIT)

Cuando el siglo 19 entraba en su tercera edad, en Rusia apareci el primer


descubrimiento que ms tarde form parte de la televisin ideada por Mr.
John L. Baird, en Inglaterra en 1,925 - 26.
Dada la fecha en que hizo su aparicin la pantalla chica, la nica
tecnologa electrnica aplicable era la analgica.
Solo despus de la aparicin en pblico del transistor por all en 1,946,
comenz a desarrollarse la electrnica de una manera sorprendente.
En la dcada del 60 siglo XX se comercializ el computador de estado
slido y empez una nueva era para la humanidad.
En 1,972 los futurlogos franceses dijeron la actual es una sociedad de
consumo, la prxima, ser una sociedad INFORMTICA.
En 1,978 apareci en el escenario de la televisin el primer equipo digital:
el TBC o corrector de base de tiempos.
En la medida que la electrnica ha ido disminuyendo el tamao de las
componentes, y por ende, el volumen de los equipos, el computador ha
venido siendo ms y ms pequeo pero con ms y ms capacidad de
trabajo.
El ancho de banda requerido por la TV. analgica es de 6, 7 y 8 MHz. de
acuerdo a la norma: NTSC, PAL Australiano, y PAL europeo
respectivamente.

Cuando se digitaliz el NTSC, se requiri un ancho de banda de 144 MHz.


Para el PAL, se necesit 177 MHz. Naci el formato de seal digital CCIR
601 (componente digital), y el presupuesto aument: 270 MHz. El
calendario sealaba el final de los 80s.
Pero todava no se haba hecho la alta definicin, la cual requiere 1.5 GHz.
Cmo hacer caber en 6, 7 u 8 MHz. seales 24 y ms veces superiores en
tamao? La respuesta vino del dominio digital.
Como cualquier nmero puede ser manipulado matemticamente,
entonces fue visto que si la imagen o seal de televisin se converta en
un modelo matemtico, esta representacin poda ser sometida a
operaciones como la resta, y reducir su tamao. Aqu naci la compresin.
Cuando apareci la seal de televisin digital, diferentes agencias y
organismos procuraron que la nueva tecnologa tuviera normas
universales y fue as como la CCIR result involucrada.
La CCIR ms tarde se convirti en agencia de la ONU con el nombre de
International Telecommunications Union (ITU). Se trat de que solo
hubiera una norma universal, pero los deseos solo se han logrado en parte.
Por causa de lo anterior, solo en el estudio se tiene la misma norma en
todo el planeta. Para la transmisin existen varios formatos, como lo
veremos a continuacin.

La televisin naci en Inglaterra, en el dominio analgico en 1,926.


Naci monocromtica o Blanco y Negro.
Cuando el color crom la imagen de la TV., aparecieron, principalmente,
tres sistemas de color:
o NTSC en Estados Unidos,
o SECAM en Francia,
o PAL en Alemania.
Cuando en la dcada de los 90s se pens en tener una mejor resolucin,
la solucin surgi en el dominio digital.
En la pantalla aparecieron, tambin, tres sistemas:
o ATSC en los Estados Unidos.
o DVB en Europa (EBU).
o ISDB en el Japn y Brasil.

El reemplazo de la TV. analgica por la DTV es inaplazable. Calidad


de imagen y sonido, as como servicios de convergencia de bajo
costo estimulan este cambio.

Es en los servicios de convergencia donde se halla la mina de oro que la


televisin digital DTV tiene lista para su explotacin. Telefona VoIP,
televisin IP IPTV , telebanca, telecompras, informes meteorolgicos,
y muchsimos ms, estarn en el abanico de servicios agregados,
Para ofrecer algunos servicios de convergencia, deber generarse
sofwtware y producirse localmente los anuncios que contribuirn a la
economa.
La mayor definicin con que se puede desplegar la imagen en la
pantalla, as como una calidad y tipo de sonido similar al del teatro, son
elementos que hacen ms agradable el esparcimiento del televidente.

El contenido del dominio digital solo puede ser decodificado por


equipos que sepan hablar el idioma digital. Los televisores analgicos
no pueden decodificar seales digitales.
Los fabricantes han lanzado nuevos estilos de equipos en que la
pantalla puede no tener receptor incorporado, el cual deber ser
adquirido separadamente.
Este receptor, comnmente llamado Set Top Box (STB) puede venir con
diversas funciones de acuerdo a las necesidades y gustos del usuario.
Hay un sistema DTV que puede ser recibido en telfonos celulares.
Los sistemas de televisin mvil pueden ofrecer sus servicios a
sistemas de transporte masivo. Esta modalidad permite que los
anunciantes puedan ofrecer sus productos y servicios a una mayor
cantidad de potenciales compradores sin depender que el
teleespectador est en su casa sentado frente al televisor.

Durante un perodo
de transicin se
podr seguir
recibiendo seal
analgica. Al final,
si se tiene un
conversor, la seal
DTV podr ser vista,
con baja calidad, en
los actuales aparatos.

La vigencia de la TV. analgica est llegando a su final. Hace ms de


dos dcadas empez a nacer la DTV.
En ese tiempo la tecnologa ha venido mejorando en todos los aspectos
y vemos que cada nueva generacin de equipos electrnicos es mejor y
con un precio inferior a la anterior.
Este fenmeno de abaratamiento es muy visible en el mercado y vemos
que cada da los equipos (lase tecnologa) DTV. estn bajando a los
precios de la tecnologa analgica y aun, por debajo de llos.
Al separar el receptor de la pantalla, se ha logrado que la salida de las
STBs puedan entregar salida analgica que permita seguir utilizando
los televisores actuales por un perodo ms.
Durante el perodo de transicin, se han mantenido en el aire las dos
clases de seales, es decir, hay transmisin simultnea del mismo
programa tanto en sistema digital como en sistema analgico.

Las grabaciones se hacen


en medios digitales, no
lineales. Flash memory,
diversos tipos de discos
(hologrficos, DVD, etc.)

X
En la medida que los procesadores computacionales han ido
aumentando su velocidad de proceso, se han ido introduciendo ms y
ms en el diario devenir de todas las actividades del ser humano.
El camino recorrido por la DTV. desde su gestacin, por all a finales de
los 70s, ha sido largo con un incremento pasmoso del desarrollo de
todas las tecnologas que involucra este dominio de la televisin.
Antes de la era digital apareci la grabadora de video que, introdujo una
nueva era revolucionaria la cual cambi la manera de hacer la televisin.
Todava era la edad analgica y no se vislumbraba el futuro binario en
este campo.
Las cintas ya estn en proceso de extincin con la aparicin de los
discos CD, DVD, Blue Ray, y hologrficos. La memoria en estado slido
ya es una realidad.
En el dominio de la DTV. los nuevos medios tienen TERAS (un 1 seguido
de nueve ceros) de capacidad de almacenamiento, a unos precios tan
bajos que son la causa del fin de la era de la cinta.

Los nuevos equipos digitales son ms pequeos, de menor peso, de


ms alto rendimiento, controlados con microprocesadores que
automatizan la mayora de sus funciones, aumentando la calidad de la
produccin.
Lo anterior, no elimina la intervencin humana. Exige que el nuevo
operador tenga una mejor capacitacin para mejor aprovechamiento de
los avances tecnolgicos.
Las nuevas cmaras de televisin para captar imgenes en alta
definicin, ya llevan varios aos en los estudios y escenarios desde los
que se transmite y se produce la televisin.
Los precios de las nuevas cmaras, por ser digitales, son mejores y
menos costosas que las viejas cmaras, lo cual ha facilitado la
penetracin de este producto en el mercado mundial.
Uno de las causas que ms influyen en la lentitud del cambio alrededor
del mundo, es la oposicin natural del ser humano a introducir
modificaciones en su manera de actuar.

Recordemos que hoy en da la tecnologa cambia casi verticalmente,


en tanto que la mentalidad del ser humano contina asimilando los
cambios pausadamente y con cierta resistencia.

DTV es ms eficiente en el aprovechamiento del espectro


del canal asignado.
DTV es menos sensible a interferencias.
En DTV la imagen es buena o no es.
El sistema binario de DTV simplifica la manipulacin de las
magnitudes.
Para producir video en estudio, solo existe un formato
digital: ITU R 601 BT.
Con un 10% de la potencia requerida en analgica, DTV
cubre la misma zona.

Con la DTV es posible asignar una sola frecuencia a un operador con la


cual debe cubrir todo el territorio de su concesin. Esto, permite
reasignar frecuencias que quedan libres al dar al concesionario una sola
frecuencia para todo el territorio de un pas.
Aunque DTV se distribuye por medios analgicos que son afectados por
el ruido, interferencias, desvanecimientos, etc., el receptor solo necesita
poder identificar si la seal que llega en un instante dado es 1 0. Con
esta certeza, la imagen mostrada en la pantalla es similar a la que sali
del transmisor.
El intercambio de programas en el dominio digital es ms sencillo
porque el video banda base slo se produce en un formato; en cualquier
9

estudio del mundo. Los actuales sistemas analgicos tienen


muchsimas versiones para los tres sistemas existentes: NTSC, PAL y
SECAM.

DTV hoy en da tiene interactividad limitada. En el futuro iTV ser total.


El televidente ser un teleparticipante.
La convergencia requiere interactividad.

Cine en casa.
Informacin de datos
del programa ofrecido,
clase de programa,
edad sugerida del
espectador, idioma,
subtitulacin
disponible, y otras
caractersticas.
Puede inclur cine,
bolsa de valores,
estado del tiempo,
trfico, y muchos ms.

Por cable la iTV es ms sencilla de hacer. A la seal abierta del aire


es ms difcil de implementarle la interactividad, sobre todo si se trata
de una seal mvil.
DTV permite un uso gil del teletexto, facilitando la insercin de
informacin en las imgenes de la pantalla, lo cual simplifica el uso de
iTV

10

Con DTV aumenta el abanico de ofertas al teleparticipante, el cual puede


inclur VOD (Video en demanda). Puede ofrecer servicios de cine directo,
alquiler de pelculas y otras novedades por medio de IPTV, en la medida
que Internet se integre ms a DTV y pueda disponer de anchos de banda
superiores a 1 MBps.
No existe en el medio de las telecomunicaciones ningn prestador de
servicios cuyo trabajo normal use un ancho de banda que exceda
1MBps.

La variedad de
programas que DTV
puede ofrecer al
teleparticipante, no
puede ser igualada
por los servicios de
la TV. analgica.
Hasta la hora de
iniciar un programa
lo podr escoger el
usuario.

MEN CINE EN CASA.

En la pantalla el teleparticipante puede tener un extenso men con la


informacin pertinente de cada servicio, actualizada al momento de la
ocurrencia del evento o servicio seleccionado.
Las guas actuales de la televisin analgica se desactualizan cuando el
programador o prestador de servicio hace un cambio, porque el medio
utilizado es un folleto impreso, por lo general de publicacin mensual.

11

Adems, existen diferentes facilidades para el suministro de servicios,


como en el caso de cine, en el cual puede determinar la hora de
prestacin del servicio.

Resolucin que puede ser un 90% igual a cine


de 35 y 70 mm., a precios muy bajos.
Imagen libre de fantasma por supresin de
seales multitrayectoria.
Calidad del audio, similar a la del CD. La
norma exige resolucin no inferior a 20 bits.
Se puede tener hasta 16 canales de audio, lo
cual permite tener transmitir en varios idiomas
el mismo programa de video.

Recordemos, la historia de DTV. empieza en el Japn cuando fue


planteada la idea de tener en casa una calidad de televisin similar a
la del cine.
Los costos de producir un programa de televisin en alta definicin
(HDTV), son muy bajos si los comparamos con los costos del cine.

12

Para producir HDTV, el tiempo requerido es tambin una fraccin del


tiempo que se requiere en el cine, para una produccin del mismo
tamao.
El nuevo sistema de televisin DTV ofrece una calidad y sistema
de audio similar al que encontramos en una gran sala de cine. Es lo
que se conoce comercialmente como Home Theater.

4:3

16:9

13

Los televisores para recibir la televisin analgica tienen pantalla con


relacin 4:3. Cada una de las lneas de barrido horizontal se dividen en
720 puntos y se les llama PIXEL, palabra de origen en el ingls. Significa
PIcture ELement.
La televisin digital adopt la relacin 16:9 y aument el nmero de
pixeles a 960 para imagen sin alta definicin, de tal suerte que el pixel es
ms pequeo que en la imagen analgica, dando por resultado una
imagen un poco ms ntida.
Para alta definicin se estableci que los pixeles por lnea deban ser
1920, pero esta norma no se cumple a cabalidad, y existen formatos en
ATSC que con menos pixeles de los 1020 los denominan HDTV.
El cine digital o electrnico se produce en HDTV con un barrido
horizontal de 1080 lneas, cada una con 1920 pixeles.
Hace poco apareci el digital Ultra High Definition, el cual tiene ms de
4000 pixeles por lnea.

En un canal analgico solo se puede


transmitir una seal.

(ANALOGICO
)

6 MHz.

(ANALOGICO
)

14

DTV permite dividir este canal en sub-canales para


transmitir varios programas al mismo tiempo.

Actualmente (2006), se pueden enviar hasta ocho programas de baja


definicin (de TV. analgica) en un canal digital (DTV).
Se puede enviar varios programas de diferente resolucin en un canal
digital, pero la cantidad cambia. Por ejemplo, un canal HDTV y dos de
baja reolucin.

15

DTV puede ser difundida por cualquiera de los


medios utilizados por la seal analgica.
Tambin, por ser una seal digital, puede
hacer uso del protocolo de Internet (IP) para
viajar.
MMDS digital puede llevar hasta 125 canales
DTV por suscripcin, acompaada de Internet
e interactividad.
Por cable? Ofrece ventajas que no puede dar
el dominio analgico.

El cable, la fibra ptica, las ondas de radio, y otros medios analgicos


menos utilizados, pueden servir como medio de transporte de la DTV.
Hasta el Internet es un medio apropiado para la distribucin de DTV,
siempre y cuando el ancho de banda sea apropiado.
La modalidad MMDS Multipoint Microwave Distribution System es
una excelente tecnologa que facilitar el servicio universal DTV. con
servicios adicionales de Internet, telefona VoIP, y otros.
Por cable, igual que por MMDS, la televisin podr llevar, adems de
entretenimiento, servicios de educacin a distancia, tan importantes
para el desarrollo de los pases menos favorecidos.

16

El dominio digital es permeado por limitaciones del


dominio analgico, como:

Respuesta de frecuencia, cable coaxial y amplificadores.

Rango dinmico y linealidad de los amplificadores.

Inestabilidad del reloj de muestreo, causada por el ruido


en la transmisin y en el receptor.

Artefactos resultantes de procesamientos en el dominio


analgico y/o el digital.

Per se, la imagen digital no existe, es una realidad virtual, pues, solo se
tiene un modelo matemtico que no puede ser visto por los ojos. Estos
datos digitales binarios se procesan y se desplazan en un mundo del
dominio analgico.
El carcter analgico de la forma de onda digital pulsos y el sistema
de transmisin afectan a la seal recibida. Las limitaciones se refieren a:
Respuesta de frecuencia de cables coaxiales y amplificadores. La
mezcla de diferentes impedancias de cables y conectores en las
rutas de las seales desecualizan, destemporizan, producen
artefactos y otros efectos de ruido y distorsiones de los pulsos.
El ruido del receptor y la resultante inestabilidad o tremulacin (jitter).
El rango dinmico y linealidad de los amplificadores.
Los artefactos normalmente aparecen en los procesos de
transformacin por las leyes de termodinmica (entropa, ciclo de
Carnot, lmite de Shannon, etc.)

17

DTV
Compresor
de Video
MPEG 2

Transporte

Compresor
de Audio
Dolby AC3

Seis
canales
de audio

Tx. y
Antena
Modulador

ENTRADA
19.3 Mbit/seg.

SALIDA

El esquema muestra el sistema genrico de los pasos que sigue la seal


ITU.R 601 BT desde que entra al sistema de COMPRESIN MPEG, hasta
que la seal digital sale al aire, emitida por el transmisor.
La seal ITU.R 601 BT es norma aceptada y usada en todo el mundo, lo
cual facilita el intercambio de programas.
La seal analgica NTSC, por norma de la FCC, para ser transmitida
digitalmente debe descomponerse en sus partes Y, B-Y, R-Y, codificarse
como seal ITU.R 601 BT para ser entregada al compresor y seguir su
proceso hasta la entena del transmisor.
La seal emitida al aire constituye la transmisin digital terrestre, que
dentro del alcance del presente estudio, ser denominada de acuerdo a
su acrnimo en ingls: DTTB (Digital Terrestrial Television Broadcast).
En la transmisin DTV., slo el paso de compresin MPEG es comn a
cualquiera de los sistemas actuales de transmisin ATSC, ISDB, DVB
.
Como este paso es igual en todos los sistemas, lo estudiaremos antes
de tratar especficamente cada uno de los formatos DTV empleados para
DTTB.

18

MPEG es el equipo de trabajo Motion Picture


Expert Group designado por la ITU para el
desarrollo de herramientas de compresin para
Tx. y Rx. de DTV.
Aunque ATSC no se adhiri a las normas ITU
para DTTB, s se acogi al sistema de
compresin MPEG -1 y MPEG -2.

Como ya fue expuesto, el primer paso para transmitir una seal


digital a travs de redes terrestres, es entregar al excitador del
transmisor, la seal digital debidamente comprimida y multiplexada
para que quepa en el relativo pequeo ancho de banda asignado en
el espacio radio elctrico.
La compresin se hace segn las normas del Grupo de Trabajo
MPEG de la ITU, lo cual garantiza que por lo menos la seal ITU.R
601 BT se codifica en un sistema estndar para entrar al transmisor a
travs del excitador.
El proceso de codificacin del video digital para alimentar un
transmisor digital de transmisin terrestre, un sistema de cable, un
enlace satelital, o cualquier otra forma de transporte, es el mismo en
el sistema DVB.
Existen diferentes versiones del sistema MPEG: 1, 2, 4, 7 y 21. MPEG
1 no es apto para la teledifusin, por lo cual fue mejorado y
completado dando origen al MPEG 2, el cual es norma en la
actualidad, y lo ser por muchos aos ms, principalmente por
razones de costos, pues, el MPEG 4, aunque es mucho ms eficiente,
su costo supera en ms del doble a su predecesor.
Los MPEG 7 y 21 estn en desarrollo. El MPEG 3 desapareci cuando
el 4 hizo aparicin en la escena.

19

ISO/IEC Draft International Standard 13818-2; es un


criterio gua para video digital en movimiento.
13818-1. Systems.
13818-2. Video.
13818-3. Audio.
13818-4. Conformance.(Correlacin simbitica y
sinergtica de las normas aplicadas).

Como ya se dijo, MPEG es norma internacional, y por lo tanto se adhiere


a los delineamientos del International Standardization Organization
ISO .
Organizaciones como EBU (European Broadcasting Union), SMPTE
(Society of Motion Pictures and Television Engineers), ETSI (European
Technical Standards Institute), entre otras, procuran seguir las normas
de la ISO, y gracias a esta mentalidad se han logrado algunos avances
importantes en el logro de tener cierta uniformidad en las normas.
La normatizacin internacional trae beneficios como la economa de
disminucin en la cantidad de modelos de equipos, los esfuerzos, la
facilidad de comunicacin e intercambio de programas, la cual redunda
en el menor precio de los mismos, y muchos otros beneficios.

20

Es reducir la cantidad de datos para dar informacin.


Per se, la informacin no es aleatoria.
Por su esencia requiere menos datos para la codificacin.
Hay varias tecnologas de compresin muy dismiles entre
s, que se usan al mismo tiempo porque se complementan
entre llas.

La informacin es ordenada, y por lo tanto sus elementos estn


correlacionados. Esta caracterstica hace que se requieran menos datos
para codificar un mensaje que un ruido, ya que el nivel de entropa de
ste es muy alto.
Cada una de las tecnologas utilizadas para disminur la cantidad de
datos necesarios para transmitir informacin, es diferente a las otras.
Como son diferentes, todas estas tecnologas pueden ser utilizadas
dentro de un mismo sistema, cada una operando a su propio modo,
logrndose un conjunto de procesos que rinden un resultado final
eficiente.
La compresin de datos reduccin de datos no es reduccin de
informacin, es la eliminacin de datos innecesarios, redundantes, sin
que un mensaje se haga incomprensible o que pueda ser mal
interpretado.
La mayora de las tcnicas de compresin datan de ms de hace
cincuenta aos por razones econmicas de pago de patentes. Los ms
utilizados son Huffman, la transformada discreta del coseno (DCT),
series de Markov, diversas obras de Shannon, y otros. La Codificacin
Aritmtica es patente de la IBM, y no se utiliza.
El sistema DVB utiliza sistemas abiertos.

21

Bits/S. o bps es la medida del ancho de banda.


Un caracter se representa con 8 bits (Byte).
Un segundo de msica CD requiere + 1.5 Mbps.

Su transmisin por telfono toma unos 50


segundos.

Una pgina carta ocupa unos 20 Kb.

Cmo meter 1.5 Gbps de HDTV en 6 MHz.?

Un segundo de video alta calidad necesita unos


200 Mbps (25MBps).
BW = costos.

La nica manera de llevar ms de una seal en el ancho de banda


normal de 6 MHz. es haciendo uso de tecnologas digitales para que,
por medio de la manipulacin de modelos matemticos, se reduzca
la cantidad de datos no de informacin transmitidos.
Bit es el acrnimo, en ingls, de Bynary digIT, razn por lo cual
considero que no es correcto la denominacin bitio usada algunas
veces en castellano.
Byte es un octeto de bits y se denomina con B. Mb es Megabit, MB es
MegaByte
La tecnologa actual requiere que un bit sea transportado en un herz
(ciclo), lo cual significa que 1 Mbps Megabit por segundo requiere
un ancho de banda de 1 MHz.
Aplicando el teorema del lmite Shannon el sistema DVB-S ha
logrado cargar un 34.5% ms dentro de los enlaces satelitales, sin
aumentar el ancho de banda.

22

La informacin debe contener solamente los datos necesarios


para que haya mensaje.
Se debe eliminar y/o reducir el ruido, la informacin redundante y
pasos innecesarios.
Todo proceso, por ley de termodinmica, produce ruido:
Artefactos: producto de procesos.
Ruido de cuantizacin y de truncamiento.
Latencia de oscilacin (ringing) de filtros.
Dada su naturaleza entrpica, el ruido necesita muchos datos.

Por principio NO se deben transmitir datos que el receptor no utilice.


Esto significa que la compresin solo reduce aquellos datos que no
afecten la esencia del mensaje (imagen).
Todo proceso, necesariamente, agrega elementos aleatorios (entropa) a
la informacin original. Estos procesos son tanto del dominio analgico
como del dominio digital; normalmente ese tipo de ruidos se les
denomina artefactos (latn: arte y factum).
El ruido de cuantizacin se debe a la falta de resolucin entre dos
niveles de decisin, causado por la utilizacin de una cantidad
inapropiada de bits para el proceso de cuantizacin del valor de una
muestra digital.
El ruido de truncamiento se origina al reducir bits de un una muestra ya
digitalizada. Por ejemplo, al reducir de 10 8 bits una muestra ya
quantizada.
La latencia de oscilacin (ingls ringing) es un ruido o artefacto, pero
puede ser utilizado para enmascarar otros defectos de la imagen que
aparecen en procesos de compresin, digitalizacin, etc.
El ruido, o su perfil, tambin se usa como herramienta en la parte
analgica del transporte, transmisin o distribucin de la seal digital.

23

El exceso, la redundancia de datos, enmascaran la esencia de un


mensaje. De ah la expresin en accin psicolgica la publicidad
ms es menos y menos es ms.

Hay dos sistemas bsicos de compresin :

Sin prdidas.

Longitudinal o secuencialmente.

Con prdidas.
Cada uno de estos dos sistemas se pueden codificar
en dos formas:
Entrpicamente.
Debe existir una normatizacin de los procesos para
que exista interoperabilidad entre los usuarios de una
tecnologa.

En la compresin sin prdidas se elimina aquella informacin


redundante que en el momento de descomprimir la seal puede ser
reconstruda en su totalidad. La relacin de compresin es pequea.
Longitudinalmente expresa que la reduccin de los datos a ser
ejecutada, se aplica a informacin ubicada secuencialmente una a
continuacin de otra.
La codificacin entrpica es aplicada, generalmente, como el ltimo
paso de la compresin. A diferencia de la secuencial, que opera dentro
de un vecindario de datos, el proceso entrpico busca la ubicacin de
valores especficos dentro de una frecuencia. Su implementacin es
compleja, pero su principio es sencillo.
La falta de aceptacin de normas, las cuales van en direccin contraria
a las patentes, fue el aspecto ms crucial en el desarrollo armnico del
ATSC. Los intereses de los grandes productores de desarrollo y
tecnologa han retardado el avance. Es una lstima que grandes
24

empresas, con grandes sabios a su servicio, operen como ruedas


sueltas y no como la maquinaria ensamblada de un reloj donde hasta un
cuasi microscpico tornillo es tan importante como la caja en que se
halla armado el reloj. (Me refiero a un reloj mecnico).

Se remueve la informacin redundante la cual puede


ser reconstruda en el sitio de destino.
La relacin de compresin es pequea.
Aplicable para cualquier tipo de datos.
Normalmente no es utilizable como nico sistema de
compresin.
Muy comn en computacin: PKZIP.
Util

i d d t

i id

Informacin redundante es aquella cuya naturaleza permite ser


conocida con precisin, y su forma (shape) estar includa en la base de
datos del corresponsal para introducir la informacin suprimida en
forma exacta, sin prdida de informacin. Ejemplo, los sincronismos.
Como la relacin de compresin es pequea, es utilizada en procesos
especiales donde se presentan situaciones de redundancia o de
informacin conocida en el sitio de destino.
En la transmisin de escenas cuyo escenario (background) no cambia
mucho, como en el ambiente de un estudio de produccin, se puede
utilizar este tipo de compresin, pues, solamente se enva la
informacin o imgenes que cambian, pero no el escenario.
Ya se expuso que la compresin utiliza ms de un mtodo dentro del
proceso de comprimir toda la imagen que ser transmitida.

25

De amplio uso en el campo de las imgenes.


Es de naturaleza muy simple: si toda una lnea horizontal
es de color rojo, no se dice rojo, rojo, rojo, (1920
veces) sino 1920 .
Los datos iguales deben estar unos a continuacin de
otros.

Cuando los datos iguales no estn unos al lado de otros, se aplican


tcnicas estadsticas para reunirlos y as lograr su reduccin
linealmente.
Una de las primeras etapas o pasos que constituyen la compresin, es
el anlisis estadstico de la imagen para determinar los datos
redundantes, naturaleza y ubicacin dentro del cuadro.
Un mtodo muy comn es el uso del cdigo Huffman de longitud
variable, el cual ser tratado posteriormente.
Ya puede irse observando que la imagen, desde su captura analgica
por el bloque ptico de la cmara, su digitalizacin y proceso dentro de
la misma, y su complejo proceso de compresin, involucra una enorme
manipulacin de datos binarios, que si no se efectan a gran velocidad,
producirn retardos inadmisibles entre la produccin de la televisin en
el estudio y el despliegue de la informacin visual y auditiva en el
sistema de recepcin del teleparticipante.

26

Generalmente se usa en el primer proceso de la


compresin.

Busca y cuenta la frecuencia de valores especficos sin


importar dnde estn ubicados.

Los datos se representan con Bytes y cada octeto tiene


un valor entre 0 y 255 (28=256).

Cada uno de estos valores se representa con un


smbolo, de acuerdo al tipo de codificacin utilizado.

Entropa es la medida del desorden o de la impredecibilidad.


En video, normalmente la primera parte del proceso de compresin es
de naturaleza entrpica y el ltimo paso es una codificacin sin prdida.
En video, la parte de la imagen que no contiene ruido, es en s
informacin, y la regla es equiparar el desorden al ruido.
En este orden de ideas, se tiene como axioma que un mensaje
totalmente predecible, no tiene informacin, es decir, si sabemos
inequvocamente qu o cual es el siguiente cuadro o imagen que se va a
enviar a continuacin, la informacin almacenada en el receptor no ser
modificada. (La informacin mensaje sigue siendo la misma.)
Shannon, en 1948, defini la informacin contenida en un evento I(E),
medida en bits, como la probabilidad de tal evento p(E).

27

I(E)= log2

1
p(E)

La informacin contenida en un evento, es inversamente


proporcional a su probabilidad de ocurrencia.
En el proceso de codificacin un byte que siempre tiene 8 bits se
reemplaza por un smbolo de longitud variable, con lo cual se
economizan recursos de ancho de banda.

Griego entropio: vuelta, dar vuelta, cambio.


Clausius la define con la ecuacin:

S=

dQ
T

dQ es la cantidad de calor aplicada a un sistema


durante una transformacin infinitesimal reversible.
T, es la temperatura absoluta a la cual la cantidad de calor
ha sido aplicada.

En informtica, S, es la incertidumbre asociada a la ocurrencia de un


mensaje dentro de un conjunto de mensajes.

En 1865 Clausius* introdujo el concepto de entropa. La transformacin


es reversible, pero como la misma naturaleza de la entropa lo propone,
el tiempo en que dicho proceso se reverse no est determinado y por lo
tanto tiene un grado de impredecibilidad, esencia de la probabilidad.
Esta proposicin es mejor conocida como la segunda ley de la
termodinmica. Es decir, la entropa nunca puede decrecer en un
proceso fsico y solo puede permanecer constante en un proceso
reversible.
Esta probabilidad o impredecibilidad, en informtica, se utiliza como la
medida de la informacin contenida por un mensaje.
Repetimos, en nuestra aplicacin concreta la televisin el desorden
lo igualamos al ruido, de tal suerte que la parte de la seal que no es
ruido, es informacin.

28

La esencia del concepto es la predictibilidad: un mensaje que puede ser


perfectamente predicho, no contiene informacin que modifique nuestra
base de datos. Cuando el mensaje tiene cierto grado de
impredecibilidad, cuando llega a nuestro sistema, entonces adquirimos
conocimiento: sabemos un poco ms de lo que no sabamos.

* RUDOLF JULIUS EMMANUEL CLAUSIUS. Naci en Koslin Prusia el 2 de Enero de 1822, y


falleci en Bonn Alemania el 24 de Agosto de 1888. Su Teora calrica subiste hoy en da. Se
basa en dos axiomas: (1) El calor se conserva en el universo. (2) El calor en una substancia es
una funcin del estado de dicha substancia.

La entropa de un conjunto de mensajes coincide, numricamente,


con la informacin entregada por la ocurrencia de uno de llos.

DMS (Discrete Memoryless Source): generador de smbolos


hechos uno por uno, donde la entropa de la tabla es definida por
el promedio de informacin de cada smbolo generado.

Los smbolos se generan con base en una tabla conocida, como


por ejemplo un alfabeto.

Al observar la secuencia de eventos, la probabilidad de una secuencia


en particular, es el producto de las probabilidades individuales de los
eventos que constituyen o hacen la secuencia. Sin embargo, la
informacin contenida por la secuencia, es la suma de la informacin
contenida por cada elemento, de tal suerte que debemos tener una
funcin logartmica.
Los teorizantes acuaron el concepto del MDS y le fue dado dicho
nombre Generador Discreto Sin Memoria porque cada smbolo
generado, en ningn caso guarda relacin con otro que haya sido
generado con
anterioridad; se trata de un proceso estocstico
modificado. No se aplica ningn proceso estadstico. Adems, un MDS
genera y enva un smbolo a la vez.

29

Los smbolos son tomados de un conjunto conocido. Un MDS, por


ejemplo, puede utilizar los nmeros de 0 al 9 y entonces se dice que el
alfabeto utilizado son los dgitos del 0 al 9.
Es requisito en un DMS, que la probabilidad de cada uno de los
miembros del alfabeto sea diferente al resto.

La probabilidad de cada elemento de una tabla, determina su frecuencia.


La entropa de una fuente de informacin como un DMS es el promedio
de la cantidad de informacin de cada smbolo que saca la fuente.
Al reunir las anteriores proposiciones tenemos que: la informacin
promedio de cada smbolo es la suma de la informacin de cada miembro
del alfabeto, multiplicado por su probabilidad:

H(S)= p(s1)I(s1) + p(s2)I(s2) + .. + p(sn)I(sn)

En otras palabras; la entropa de la fuente es la sumatoria de los


factores (p)(I) de cada miembro del alfabeto.

Como la probabilidad de cada miembro del alfabeto determina su


frecuencia, el promedio de la informacin de un smbolo es la suma de
la informacin de cada miembro del alfabeto multiplicado por su
probabilidad.

30

En el caso de la frmula de la entropa de la fuente H(S) se tiene que


la fuente es un alfabeto de n smbolos comprendidos entre s1 y sn . La
probabilidad de cada de cada miembro es p(s1).
La entropa, entonces, es calculada como se expone en la grfica. Esta
frmula se puede abreviar como:
n

p(s ) I(s )

i=1

H(S)=

Todo Byte tiene 8 bits, pero los smbolos pueden tener longitud
variable que no exceda un Byte.

Usualmente los smbolos cortos representan valores repetitivos. Los


largos, valores menos frecuentes.

Como ya vimos anteriormente, la longitud del smbolo no


necesariamente es la misma del Byte que representa, y de acuerdo a la
aplicacin de determinada metodologa, la longitud puede variar en su
cantidad de bits.
El cdigo propuesto por Sam Morse es una tabla con distribucin de
puntos y rayas de acuerdo a la probabilidad de uso o frecuencia de cada
una de las letras en el idioma Ingls. En otros idiomas la frecuencia
distributiva de los smbolos vara. En ingls la z es poco comn, no

31

as en polaco. El cdigo Morse es muy eficiente en Ingls porque la


distribucin de los smbolos la hizo su inventor de acuerdo a la
frecuencia de uso de cada una de las letras, siendo la e la de mayor uso
(similar al castellano). La z, la y, la c, tienen menor frecuencia, y como
puede observarse, el tamao de los smbolos que las representan es
inverso a su frecuencia de uso en ingls. El cdigo Morse es menos
eficiente en idiomas que tengan mucho uso de la z, la y, la c, como el
polaco.
Shannon utiliz logaritmo de base dos con el fin de obtener el valor de
la Informacin en bits. Para convertir un log. de base x a base 2 se
puede aplicar la siguiente frmula, aunque existen muchas ms:

logn x / logn 2

p(E)

I(E)

0.7

0.515

0.1

3.322

= 0.7(0.515)+0.1(3.322)+ 0.1(3.322)+ 0.1(3.322)

0.1

3.322

= 1.357 bits/smbolo

0.1

3.322

H(S)= p(s1)I(s1)+p(s2)I(s2)+...+p(sn)I(sn)

Shannon, teorema de la fuente codificadora sin ruido:


Si se codifica una fuente con la ms alta eficiencia posible, y el
cdigo es decodificable inequvocamente, el nmero promedio
de bits usado por smbolo tiene que ser, por lo menos, igual a la
entropa de la fuente.

En la tabla tenemos un alfabeto de cuatro elementos: a, b, c, d.

32

p(E) es la probabilidad de frecuencia de cada elemento.


I(E) es el valor de la informacin asignada a cada elemento.
Al aplicar la frmula, tenemos que la entropa de la fuente es 1.357.
Al aplicar el teorema de Shannon tenemos que los bits necesarios para
representar cada smbolo es 1.357, pero como no existen las fracciones
de bit, tenemos, entonces, que utilizar 2 bits para representar cada
smbolo.

p(E)

I(E)

0.7

0.515

0.1

3.322

0.1

3.322

0.1

3 .322

Caso anterior, cada elemento


tiene p(E) e I(E) diferentes

1
I(E)= log2

P(E)

= log2 (4) =

H(S)= p(s1)I(s1)+p(s2)I(s2)+...+p(sn)I(sn)
= .25(2)+ .25(2)+ .25(2)+ .25(2)= 2

p(E)

I(E)

0.25

0.25

0.25

0.25

bits/smbolo

En este caso tenemos que tanto la probabilidad como el


valor de la informacin son iguales para cada elemento.

Acabamos de ver que si cada elemento tiene valores de probabilidad e


informacin diferentes, la entropa H(S) es inferior a 2.
Si los citados valores son iguales para cada elemento, la entropa es 2.
Ya se dijo en la proposicin anterior que para nuestro caso de un
alfabeto de cuatro smbolos, el tamao mnimo para cada smbolo debe
ser 2 bits.

33

Los cdigos seran 00, 01, 10, y 11. Al comparar con la entropa del
segundo caso en que la probabilidad es igual para cada smbolo, vemos
que H(S) exactamente igual a 2 bits/smbolo, y segn Shannon, no es
posible hallar un cdigo ms eficiente.
Es posible utilizar un cdigo de longitud variable y utilizar entre 1 y 3
bits para representar cada uno de los smbolos de este alfabeto de
cuatro letras, dando el cdigo ms corto a la letra de mayor probabilidad
de evento, que es la a con un 70%. Tendramos entonces:

SIMBOLO CODIGO
a

10

110

111

34

011011100010011100000001101000
Cdigo de prefijo condicionante.
Ningn cdigo es prefijo de otro cdigo.
SIMBOLO

CODIGO

10

110

111

0- 110 -111 -0-0-0 -10 -0 -111 -0-0-0-0-0-0-0 -110 -10 -0-0


a c d aaa b a d
c b aa
aaaaaaa

El cdigo de longitud variable es una forma de aumentar la eficiencia de


un mtodo de codificacin, y el cual permite utilizar, virtualmente,
fracciones de bit para reducir la cantidad de los mismos.
La anterior proposicin podra sonar contradictoria, pero si se examina
a la luz de la probabilidad de la ocurrencia real, se tiene que a est
presente el 70% de las veces siete veces el promedio de una de las
otras tres letras .
En un mensaje de 100 smbolos, si el cdigo es de 2 bits por smbolo, el
total de bits ser 200, pero si se usa un sistema de cdigo de longitud
variable, como el de esta grfica, el total de bits ser 150.
Otra mejora que se introduce en este ejemplo es que al smbolo a se le
asigna el 0 y no el 1 para identificar con mayor velocidad y menos
procesos, que se trata de a y no de b, c, o d.
Similar criterio se usa en la asignacin de los cdigos 10, 110 y 111.

35

La eficiencia del cdigo de longitud variable se basa


en la distribucin probabilstica de los smbolos.
Hay exigencia extrema de conocer con exactitud esta
distribucin:
Si no se conoce muy bien, ser muy difcil elaborar el
rbol del cdigo Huffman.
Si la distribucin cambia, la codificacin se hace
ineficiente.
La ponderacin permite hacer uso de fracciones de
bit.

VLC = Variable Length Code.


El uso de fracciones de bit es virtual. El valor real de cualquier bit sigue
siendo 1 0.

36

El cdigo fue desarrollado en la dcada de los 90s


con base en una investigacin con patente vigente
de la IBM
La entrada son smbolos y la salida un tren contnuo
de nmeros de punto decimal flotante entre 1 y 0.
La codificacin se realiza con base a una gran
cantidad de decisiones binarias.
Si se dispone de un buen procesador matemtico, el
mtodo es un buen reemplazo del sistema Huffman

Se basa en las series de Markov, y a diferencia del


generador DMS, requiere recuerdos del pasado.
La distribucin probabilstica de cada smbolo, vara
de acuerdo a la naturaleza del mensaje.
Una tabla donde la p de un smbolo depende de
valores p ya conocidos, se conoce como series de
Markov.
Cuando el valor de probabilidad de ocurrencia es
nico, se trata de una serie de primer orden.
Si la probabilidad es de dos eventos, es una serie de
segundo orden, y as sucesivamente.
Habamos visto que el generador MDS no tiene memoria en el sentido
que cada smbolo lo genera en forma independiente. En las series

37

Markov, tener conocimiento estadstico de los smbolos pasados, es


requisito sine qua non.
En ingls la probabilidad de que una palabra termine en letra q es baja,
pero en castellano, es absolutamente cero.
En ingls despus de una q se puede encontrar una consonante o una
vocal; en castellano solo, y solamente solo, una u. Esta es una serie
de primer orden.
En ingls despus de qu puede aparecer una consonante o una vocal
diferente de u; en castellano solamente e o i. Se trata de una serie
de segundo orden.
El uso de estas series permite escribir palabras incompletas, pero con
significado inequvoco. En las series de primer orden, es posible,
entonces, eliminar letras que resultan superfluas.

38

Los mejores sistemas de compresin se basan en


transformadas.
La piedra angular de estos sistemas es el teorema de
Fourier: cualquier funcin peridica se puede
representar por la suma de amplitudes y fases de las
ondas seno de una frecuencia y los mltiplos enteros
de dicha frecuencia.

La transformada de Fourier convierte una funcin infinita, pero


repetitiva del tiempo, en un conjunto ordenado de coeficientes que
expresan la fase y la amplitud de cada una de las sinusoides necesarias
para sintetizar la forma de onda original.
En rojo la onda original. Como ejemplo sencillsimo se muestran solo
cuatro sinusoides que componen la onda original, pero el resultado
verdadero es mucho ms complejo.
Los coeficientes de Fourier en una onda compleja pueden ser muchos,
pero se limitan al ancho de banda (BW) de la seal. El ancho de banda, y
la complejidad de la forma de onda determinan el volumen del conjunto
de datos del coeficiente.

39

Fourier asumi que el dominio del tiempo de la


seal es infinito en extensin.
Asumi funciones de tipo contnuo en el tiempo.
Las funciones hasta ahora analizadas se toman en
una dimensin, pero las imgenes requieren
anlisis 2D.
Los coeficientes generados entregan dos cifras
(amplitud y fase) o son nmeros complejos (reales
e imaginarios).
Las matemticas actuales han superado estas
limitaciones y ofrecen buenas herramientas como
la DCT.

Por la forma de explorar y escribir la imagen, la operacin se hace en


forma lineal y contnua por lneas, desplegando la imagen pixel por pixel
uno a continuacin de otro.
Para comprimir una imagen se debe analizar mnimo en 2D por los
requerimientos de estudio estadstico y ubicacin de la informacin
redundante. En ciertas aplicaciones, como en los estudios de
produccin virtuales, el eje Z (profundidad) debe ser tenido en cuenta
para una buena realidad de los fondos electrnicos cuando la imagen
real se desplaza, o se efectan paneos de cmara, o se cambia de
cmara, etc., etc.

40

Una imagen 2D puede ser analizada en dos


direcciones ortogonales.
Una imagen 2D contiene variaciones de
intensidad en cualquier direccin.
Para el muestreo de estas intensidades se
deben tener en cuenta las frecuencias
espaciales en la imagen bajo anlisis.
El muestreo espacial se rige por las mismas
reglas del muestreo en el tiempo. El lmite de
Nyquist es aplicable.

El anlisis de las dos dimensiones ortogonales son el ancho horizontal


y su altura en el espacio vertical.
Para que realmente haya imagen, los pixeles deben tener diferente
intensidad en color y en luminancia. De no ser as, tan solo se tendr
una pared pintada de un solo color, plana, monocromtica y montona.
Para hacer el anlisis de una imagen (en funcin de digitalizacin y
compresin) es indispensable hacer la ubicacin espacial y determinar
la frecuencia en el espacio de las intensidades de los pixeles.
La metodologa de Fourier tambin es vlida, pero no se usan funciones
de tiempo y frecuencia sino de distancia (espacio) frecuencia espacial.

41

Recordemos que la informacin se debe


representar con suficiente precisin, pero no se
debe enviar informacin innecesaria.
Los procesos que hemos estudiado no reducen
los datos; ms bien los aumentan.
Algunas herramientas transforman los datos y
permiten el uso de otros procesos ms tiles,
como la cuantizacin.
Veamos la cuantizacin como una herramienta
de compresin.

Enviar solo la informacin que el Rx. pueda manejar. Recordemos que


las muestras del video, se cuantizan con una cantidad de bits (10 bits
por norma ITU) que permitan tener una buena precisin de la
informacin de la imagen, pero no tanta que comience a codificar ruido
de imagen.
Por lo general las transformadas generan ms datos, los predictores
hacen otro tanto, la DCT genera tres bits adicionales por smbolo. Pues
bien, la generalidad de los procesos vistos, aunque aumenten un poco
los datos de los smbolos, organizan la informacin en una forma tal
que permiten el uso de otras herramientas para manipular la
informacin con mayor eficiencia, como el VLC (Variable Length Code) y
la cuantizacin.
Las herramientas hasta ahora estudiadas no causan prdida ni
distorsin porque como la DCT y las transformadas de Fourier, son
procesos totalmente reversibles que dan buena precisin aritmtica.

42

La cuantizacin es un proceso irreversible un verdadero BRR y el


mal llamado descuantizador no restituye nunca la precisin perdida al
reversar la operacin.

Son de dos tipos: escalares y vectoriales.

El vectorial aproxima dos o ms valores a un


solo valor.

El cuantizador vectorial puede ser un compresor


de seal muy poderoso.

El cuantizador escalar se asemeja a un proceso


por peldaos donde no hay valores intermedios.

El escalar manipula la precisin de la


informacin de un solo parmetro, p. ej. la
intensidad.

43

Es el cuantizador ms sencillo, pero el ms eficiente.

Del nmero de peldaos depende la cantidad de valores


de entrada (2x), pero los smbolos de salida son iguales
a la cantidad de peldaos.

Cada valor de entrada es procesado por el cuantizador y


comparado con los valores de decisin de cada
peldao.

Es una escalera de pasos iguales donde el continuum


de entrada se convierte a la salida en smbolos de igual
tamao.

Por norma, la cuantizacin de una imagen de video debe hacerse en 10


bits, pero no todos los fabricantes lo hacen. Al inicio de la era del video
digital los japoneses argumentaron que 8 bits 256 niveles eran ms
que suficientes para cuantizar las muestras de video. En Estados
Unidos un par de fbricas, pioneras en el desarrollo tecnolgico de la
televisin, opinaron que se deban utilizar 10 bits en la cuantizacin.
Esto significa que el video debera tener 210 niveles o sea 1,024.
Ya vimos que los bits no son divisibles o fraccionables. Son unidades
enteras.

44

256
224
192
160
128
96
64
32
0

salida 8. nivel
salida 7. nivel
salida 6. nivel
salida 5. nivel
salida 4. nivel
salida 3er. nivel
salida 2. nivel
salida 1er. nivel

Si la cuantizacin se hace en 10 bits, los smbolos en la salida sern 10


y los valores de entrada estarn entre 0 y 210 o sea 1024.

45

Cuando el cuantizador est operando, compara el rango del valor


calculado contra los valores de decisin, que son aquellos valores
comprendidos entre dos niveles o escalones. Si el valor es por ejemplo
73, entonces el smbolo es asignado a la salida del tercer nivel, y el
cdigo ser asignado de acuerdo a los valores establecidos en una
tabla de reconstruccin.

COMPRESIN DE LA
SEAL
(REDUCCIN DE BITS)
INFORM. RECUPERABLE

INFORM. IRRECUPERABLE

SUPRESION INTERVALO
DE BORRADO

MUESTREO SUB-NYQUIST

CODIFICACION

Cdigo Huffman
Cdigo
Aritmtico
VLC., FFT

DC

DCP

FF

TRANSFORMACION Y
COD. DE SUB-BANDAS
CODIGO VECTORIAL
CODIGO LONGITUDINAL
VLC

La compresin de una seal es el proceso de suprimir informacin


redundante, mediante procesos matemticos,

46

Si se emplean sistemas apropiados en el BRR Bit Rate Reduction la


reconstruccin de la imagen ser muy aceptable.
Hay procesos en que la recuperacin de la informacin es imposible, y
se recurre a tcnicas de manipulacin la informacin para aprovechar
las falencias de la operacin del cerebro, con el fin de que la falta de
informacin, tanto visual como auditiva, sea lo menos notoria posible.

El mximo concepto es secuencia de cuadros. Su


longitud es arbitraria: un clip de video; un programa
completo, o una concatenacin de programas.
Dentro de la secuencia, hacia abajo sigue GOP (Group
Of Pictures). El tpico tren de bits en MPEG es la
repeticin estructurada de GOPs.
La aplicacin tpica del GOP involucra imgenes
codificadas en tres formas y configuradas en una
estructura repetitiva entre 10 y 30 cuadros.
Tajada (slice), es la secuencia de cualquier cantidad de
macrobloques.
Macrobloque es un rea del cuadro de 16x16 pixeles de
luminancia. Se numeran en la misma secuencia del
barrido.
En la forma ms simple de codificacin sin compresin temporal, un
GOP es una imagen sencilla.
El concepto de cuadro es el utilizado en TV.: dos campos
entrelazados o un campo progresivo. Sin embargo, el concepto exacto
de entrelazado no est contemplado en MPEG, porque cada cuadro o
imagen debe tener todas las lneas necesarias para completar un cuadro
(frame) en la secuencia.

47

Los macrobloques se numeran de izquierda a derecha y de arriba abajo.


La caracterstica fundamental de las tajadas es que no estn
referenciadas entre s, es decir, participan de la misma caracterstica de
los smbolos generados por el DMS. Esto implica que si una tajada se
pierde, o se daa, su recuperacin se inicia al comienzo de la siguiente
tajada.

Existen tres tipos de cuadros.

INTRA es un cuadro que se codifica usando solo la


informacin que hay dentro del mismo cuadro.

PREDICHO (Cuadro P).


BIDIRECCIONAL (Cuadro B).

Aunque el MPEG 1 naci del JPEG (Joint Photographic Experts Group),


su estructura es, de lejos, mucho ms elaborada. La diferencia entre
estos dos sistemas de compresin no se limita al movimiento.
MPEG 2 tambin es mucho ms complejo que el 1, por ejemplo, para la
misma rata de muestreo, MPEG 2 es como un 50% ms complejo.
El MPEG 1 no es apropiado para la teledifusin, por lo cual fue
necesario desarrollar el MPEG 2, el cual puede manipular una imagen
que haya sido codificada en el sistema 1.
Los cuadros se denominan de acuerdo a su origen: el Intra (I), que no
contiene informacin de otras fuentes sino del mismo cuadro; el
Predicho (P), que se calcula de acuerdo a la informacin contenida por un

48

I; y el Bidireccional (B), cuya informacin contiene datos de cuadro


anterior I y B.
Con estas tres categoras de cuadros se forman las secuencias, los
GOPs, y las tajadas.
Los bloques y los macrobloques son reas de pixeles de cualquiera de
los tres tipos de cuadro.
Examinemos someramente el proceso.

Cuadro I, codificado solo con


informacin contenida dentro del
mismo cuadro.

Cuadro P. Cada macrobloque


se compara con el respectivo
macrobloque en X* buscando
similitudes.

DCT

Cuant

VLC

Cuadro
de Ref.

Cuadro B. Y se almacena luego de Z ; se compara con


X* y Z* para tener los vectores de casi todos los
macrobloques. Por eso es bidireccional.

49

De acuerdo a los parmetros matemticos del movimiento de la escena,


a cada cuadro X (que es de tipo I) se le aplica procesos de DCT
(Discrete Cosine Transf.) se cuantiza, y se codifica con VLC (Variable
Lenght Code) . Antes de la codificacin VLC, se ramifica el proceso, se
efecta la operacin inversa y se calcula el cuadro P (proceso Y) dando
origen a una imagen de referencia X*, la cual se almacena como un
cuadro B. Lo delineado en verde es la imagen X*, la imagen transparente
rosada es la imagen X.
La X* resultante del proceso Y se compara con la imagen inicial; esta
diferencia constituye el nuevo modelo matemtico resultado del
proceso Z, la cual se almacena como cuadro tipo P Predicho .

123 4 56 78
2
3
4
5
6
7
8

123 4 56 78
2
3
4
5
6
7
8

Bloque es un rea de la imagen formada por un grupo de pixeles


contiguos en una extensin de ocho pixeles por cada lado.

50

El macrobloque se compone de cuatro bloques contiguos en la


disposicin mostrada en la grfica.

Dentro del GOP las imgenes I y las P se denominan Cuadros Ancla


porque se usan como referencia para codificar otros cuadros haciendo
uso de la compensacin de movimiento. Los cuadros B nunca se usan
de referencia.
I debe ser siempre el tipo del primer cuadro codificado, porque de otra
manera no es posible iniciar una secuencia de compresin. Si no existe

51

una informacin previa, no es posible tener una referencia para


compensacin de movimiento.
Los GOPs se clasifican en abiertos y cerrados. El de esta grfica es
cerrado. El significado es que todas las predicciones se hacen dentro
del bloque. El bloque abierto tiene la secuencia I-B-I-B-I . y aunque
son eficientes, presentan la desventaja de ser un flujo contnuo y no
existe un punto donde se pueda separar. El cerrado tambin se
denomina regular porque la distancia y distribucin de las anclas es
regular y fijo.
El bloque tiene los parmetros M y N. M es la distancia entre Is y N es la
distancia entre cuadros P. Se pueden construr GOPs irregulares, pero
son poco frecuentes. Resultan de separacin de trenes de bits, o de
separacin de del mismo GOP.

2
1

6
9

12

10
13

11

Los cuadros de los GOPs se almacenan en un orden, pero se


emiten en secuencia diferente.
La grfica muestra el orden de transmisin.

52

MPEG

4:2:

4:2:

4:4:

Cada macrobloque se codifica de acuerdo al tipo de cuadro. MPEG 1


tiene una estructura 4:2:0, lo cual NO significa que R-Y no se
muestree. Indica que B-Y y R-Y tienen la mitad de la resolucin
vertical y horizontal de muestra Y. Obsrvese que la relacin espacial

53

de las muestras en MPEG 1 y MPEG 2 son diferentes, pero la


estructura de las muestras C y Y son iguales.
El significado de 4:2:2 es que las muestras de color tienen la mitad
de la resolucin horizontal de la luminancia.
En el caso de 4:4:4 la resolucin de B-Y y R-Y es igual horizontal y
verticalmente a la luminancia.
La luminancia requiere un macrobloque de 16x16 y cada diferencia
de color, 8x8 (la mitad).
Solo MPEG 2 (y sucesivos) permiten mejor resolucin, adems del
manejo del manejo entrelazado; en estos casos, Y y C estn
coposicionados.

La seal DTV se compone de video, audio,


subttulos, y otros datos tales como auxiliares,
metadatos y exgenos. No es solo televisin!
Cada vez se multiplexan ms seales para
transmitir varios programas en un solo canal.
La seal es un tren, flujo o torrente de bits
multiplexados que deben ser decodificados por
el receptor en forma apropiada.
MPEG 2 define la construccin de dos tipos de
flujos o trenes de datos: Program Stream (PS) y
Transport Stream (TS).
Las herramientas desarrolladas por el Grupo de Trabajo MPEG han
permitido que no solamente se desarrollen sistemas abiertos (sin

54

patentes) de compresin, sino que adems estos datos se pueden


multiplexar.
El proceso de multiplexaje es el sistema de transporte que hace
posible la convergencia de los medios, la informtica, la electrnica
para consumidor, y las telecomunicaciones.
El vehculo ms apto para transportar el paquete CONVERGENCIA es
DTV, y la tecnologa que hace posible este negocio es la IP.
La salida del codificador MPEG contiene el TS que lleva en su vientre
el mltiplex que transporta los varios PSs de los programas y datos
exgenos.
Esta convergencia de servicios es el gran valor econmico que
ofrece la DTV all donde se implemente.

SUPRESION
ESTADISTICA
DE INFORMACION

CUANTIZADOR

DISTORSION

CODIFICADOR
VL C

MEMORIA DE
AJ UST E

TS

55

Hemos llegado a la salida del CODIFICADOR MPEG 2. Los datos que


salen son llamados Transport Stream el cual est formado por una
multiplexacin de programas de televisin con sus respectivos audios
en diversos formatos. Adems de los programas de televisin, tambin
se pueden inclur datos auxiliares, metadatos, y datos exgenos como
telefona VoIP, telebanca, telecompras, y muchos otros ms.
Los programas de televisin pueden ser varios (ms de 4) en calidad
estndar SDTV , o cuatro decalidad mejorada EDTV , o dos de alta
definicin HDTV , o una combinacin de las tres calidades.
Este TS es la entrada para cualquiera de los sistemas o formatos de
transmisin de televisin, ya sea ATSC, DVB-T, DVB-C, DBV-S1, DVB-S2,
DVB-H, otros que se estn cocinando dentro de las normas ITU.

56

Вам также может понравиться