T5 Imagen PDF

Codificación y compresión de imagen
Bibliografía
1. Introducción. [FLU95] Understanding networked
2 Características de la imagen.
2. imagen multimedia
[GIB98] Digital Compression for
z 2.1 Captura y digitalización de imagen. Multimedia
z 2.2 Tipos de imagen [TSU99] Introduction to video coding
standards for multimedia communication
3. Compresión
3 C ió de
d imagen.
i [JPEGESC] JPEG escalado - Tesis
Redundancia espacial.
[JPEGAD] JPEG image coding with
adaptive quantization
z 3.1 Estándar JPEG [JPEG2000] JPEG 2000 performance
evaluation and assessment
z 3.2 JPEG Escalado
[Geo99] Wavelet-based Image Coding: An
Overview
[EZW] Embedded image coding using
zerotrees of wavelet coefficients
[LTW] Fast and efficient spatial scalable
image compression using wavelet lower
trees
Transmisión de Datos Multimedia – http://www.grc.upv.es/docencia/tdm – Master IC 2007/2008

C 2007/2008
a - Master IC 1. Introducción
Las imágenes que percibimos están compuestas de ondas

electromagnéticas (λ: 250nm - 780nm).
os Multimedia
z A diferentes longitudes de onda, diferentes sensaciones de color.

El ojo es más sensible a unos colores que a otros.
misión de Dato
z Dadas tres fuentes de luz de la misma intensidad y distinto color (una

roja, otra verde y otra azul), el ojo percibe la verde con el doble de
intensidad que la roja, y seis veces más intensa que la azul.
Transm
Los mecanismos de percepción visual humanos son menos

sensibles y estrictos que los auditivos.
z Ej.:
Ej : Variaciones de frecuencia,
frecuencia supresión de imágenes
imágenes, etc.
etc
Mezclando 3 colores (RGB) podemos obtener otro.
Integra la información que recibe.
w2
C 2007/2008
a - Master IC 2.1 Captura y digitalización de imagen I
Las imágenes digitales están compuestas de píxels (picture

element).
os Multimedia
Una cámara fotográfica digital utiliza un CCD (charge coupled

device) para realizar el proceso de adquisición analógica.
z El CCD tiene una serie de pequeños diodos sensibles a la luz que convierten luz
misión de Dato
en cargas eléctricas (o sea, fotones en electrones).

z Cada diodo del CCD captura un píxel de la imagen a adquirir.
Para poder situar cada píxel de la imagen (luz entrante) en su diodo
Transm
correspondiente del CCD se utiliza una lente.
Mediante la lente se puede conseguir

también realizar zoom óptico (no confundir
w3
con zoom digital)
di it l)
C 2007/2008
a - Master IC 2.1 Captura y digitalización de imagen II
Problemática del color:

z Si el CCD captura la luz directa que recibe de la lente,
lente sólo tenemos la
os Multimedia
intensidad de luz, pero no su color.

z Añadimos un filtro (R, G ó B) a cada píxel, de manera que algunos
píxels
í l reciben
ib sólo
ól la
l luz
l roja,
j otros
t la
l verde
d y otros
t la
l azul.
l
misión de Dato
z El número de píxels que reciben luz verde es el mismo que la suma de

los que reciben luz roja y azul.
Transm
¾ La información de color que no se ha

obtenido en cada píxel se interpola
directamente de sus vecinos, usando un DSP.
w4
C 2007/2008
a - Master IC 2.1 Captura y digitalización de imagen III
El CCD es un dispositivo analógico.

z Es necesario un conversor analógico digital (ADC) que obtenga la
os Multimedia
representación digital de cada píxel a partir de la señal eléctrica

generada por cada diodo.
misión de Dato
Una cámara digital necesita un DSP para

gestionar el funcionamiento de la cámara.
Realiza el acceso y almacenamiento de fotos en
Transm
¾
memoria, el proceso de compresión, la
interpolación de los colores, gestión de menús,
etc.
t
¾ Uno de los más usados, el TMS320DSC24 de
Texas Instruments, funciona a 80 Mhz y es
utilizado
ili d por Kodak
K d k en sus productos.
d
w5
C 2007/2008
a - Master IC 2.1 Captura y digitalización de imagen IV
Codificación y recodificación.
z Cada muestra RGB se codifica con una cantidad de bits por p
os Multimedia
componente de color (p.ej., 8 bits/componente→24 bits/muestra).

z A veces resulta interesante codificar el nivel de brillo de una muestra
((luminancia,, o componente
p Y)) y las diferencias de color (crominancias
(
misión de Dato
azul, roja y verde, o componentes Cb, Cr, Cg).

z La conversión de RGB a YCbCr (YUV) se realiza mediante una matriz de
conversión (aproximada):
Transm
Y = 0.3R + 0.6G + 0.1B (Nivel de brillo o luminancia)

U = B - Y (Diferencia de color azul) (equiv. Cb=U/2+128)
V = R - Y (Diferencia de color rojo) (equiv
(equiv. Cr=V/1
Cr V/1.6+128)
6+128)
z Cada uno de los componentes se codifica con 8 bits.
Y (8 bits): rango 16-235
Cb (8 bits) y Cr (8 bits): rango 16-240
16 240
La diferencia de color verde
(Cg) es redundante y no se
almacena, ya que se puede
obtener
bt a partir
ti d
de lla Y
Y, lla Cb y
la Cr.
w6
C 2007/2008
a - Master IC 2.1 Captura y digitalización de imagen V
Subsampling: El ojo es más sensible a la

información de luminancia que de crominancia. Muestra Cr + Muestra Cb
os Multimedia
Muestra Y 720
720
misión de Dato
480
o
576 360
480 Y
o
576 480
Transm
Y o
Cb 576
Cr Cb
Cr
Formato 4:4:4 Formato 4:2:2
720 720
480 480
o o
576 576 180
Y Y
360
240 480
o o
288 576
Cb Cb
Cr Formato 4:1:1 Cr
Formato 4:2:0
w7
C 2007/2008
a - Master IC 2.2 Tipos de imagen (según su resolución)
La resolución de una imagen se mide según el número de píxels

por lado (ancho x alto).
os Multimedia
En cámaras digitales se suele medir en Megapixels (millones de

píxels por imagen)
1) Common Intermediate Format (CIF) (352x288): Utilizado
misión de Dato
habitualmente en videoconferencia (junto con Quarter CIF)

2) VGA (640x480): Usado por cámaras de baja calidad.
3) n-Megapixels:
n Megapixels: Ofrecido por cámaras de mayor calidad.
calidad
Transm
A veces, la resolución real de una cámara digital no coincide con

la del CCD de esa misma cámara.
z P.ej, una cámara de 3,3 MP ofrece una resolución de 2048x1536.
z Parte de la circuitería del CCD que transporta los datos al ADC está
situada en determinados diodos q que no pueden
p ser usados.
w8
Resumen
1. Introducción.
2 Características
2. C t í ti de
d la
l imagen.
i
z 2.1 Captura y digitalización de imagen.
z 2.2 Tipos de imagen (según su resolución)
3. Compresión de imagen. Redundancia espacial.

z 3.1 Estándar JPEG
z 3.2 JPEG Escalado

C 2007/2008
a - Master IC 3. Compresión de imagen.
Una imagen suele presentar redundancia espacial:

z Redundancia espacial:
os Multimedia
Las imágenes tienen información redundante susceptible de ser eliminada

o reducida (por ejemplo, el color del cielo en una foto suele ser uniforme y
azul ::-)).
misión de Dato
z El proceso de compresión de imagen consistirá en:

1) Eliminar en la medida de lo posible la redundancia espacial utilizando
técnicas de source encoding (normalmente mediante transformada
Transm
matemática).
2) Codificar los datos obtenidos en el paso anterior usando entropy
enconding g ((elimina aun más la redundancia espacial).
p )
z Para conseguir mayores índices de compresión, este proceso será con
pérdidas (cuantización de los datos).
w1
0
C 2007/2008
a - Master IC 3.1 Redundancia espacial: JPEG
Es un estándar ISO (‘91) cuyo origen proviene del grupo JPEG

(Joint Photographic Expert Group).
os Multimedia
z Codifica imágenes de tono-continuo

z Dispone de cuatro modos de operación (incluyendo codificación sin
misión de Dato
perdidas).
z Se definen una serie de parámetros que permiten codificar las
imágenes para obtener una gran variedad de calidades de
Transm
compresión.
z Factor de compresión ronda 20:1*
z Es
E un sistema
i t d
de codificación
difi ió simétrico.
i ét i
z Forma parte de otros estándares de compresión de secuencias de
vídeo (MPEG y H.26*).
w1
1
C 2007/2008
a - Master IC Codificación JPEG (pasos)
Codificación JPEG en modo secuencial con pérdidas

os Multimedia
C difi ió fuente
Codificación f t C difi ió entrópica
Codificación tó i
Imagen Imagen
original (RGB) Prep. de Run codificada
DCT Cuantiz. Huffman
bloques Length
misión de Dato
Tabla Tabla
Transm
Paso 1: Preparación de la imagen.

¾ No define el formato de imagen original.
¾ Podría ser RGB, YUV, YIQ, YCrCb, etc.
¾ Convierte la imagen a formato YCbCr utilizando una reducción
de color 4:1:1 (sub-sampling)
( p g)
¾ Ej.: RGB 640x480 (VGA): Y (640x480), Cb y Cr (320x240)
¾ Se divide la imagen en bloques de 8x8 elementos
¾ Ej.
Ej anterior: 4800 bloques Y,
Y 1200 Cb y 1200 Cr.
Cr
w1
2
C 2007/2008
a - Master IC Codificación JPEG: Transformada DCT
Paso 2: Transformada discreta del coseno (DCT).

z Transforma un dominio de amplitudes al dominio de la frecuencia.
frecuencia
os Multimedia
Las componentes frecuenciales más altas son susceptibles de ser

eliminadas (percepción visual)
z Se aplica esta transformada a cada bloque de 8x8 obteniendo la
misión de Dato
matriz de coeficientes DCT asociada

Componente (0,0): el nivel de continua DC del bloque (Media)
Transm
Coeficiente
Amplitud DCT
Transformada
x DCT Fx
y
Fy
w1
3
C 2007/2008
a - Master IC Codificación JPEG: Transformada DCT(II)
DCT-1D: (vector 8 elementos)

Transformada
directa
os Multimedia
C (u ) 7 ⎡ (2 x + 1)uπ ⎤
S (u ) = ∑
2 x =0
s ( x) cos ⎢
⎣ 16 ⎥
⎦ 1
Si u = 0, C (u ) =
2
misión de Dato
Si u = 1, C (u ) = 1
7
C (u ) ⎡ (2 x + 1)uπ ⎤
s ( x) = ∑ S (u ) cos ⎢ ⎥
u =0 2 ⎣ 16 ⎦ Transformada
Transm
inversa
DCT-2D: (matriz 8x8 elementos)
1 N −1 N −1
⎡ (2 x + 1)iΠ ⎤ ⎡ (2 y + 1) jΠ ⎤
DCT (i, j ) = C (i )C ( j )∑∑ p pixel ( x, y ) cos ⎢ ⎥⎦ cos ⎢⎣ ⎥⎦
2N x =0 y =0 ⎣ 2N 2N
1 N −1 N −1
⎡ (2 x + 1)iΠ ⎤ ⎡ (2 y + 1) jΠ ⎤
pixel ( x, y ) =
2N
∑∑
i =0 j =0
C (i )C ( j ) DCT (i , j ) cos ⎢⎣ 2 N ⎥⎦ cos ⎢⎣ 2N ⎥⎦
w1
4
C 2007/2008
a - Master IC Codificación JPEG: Cuantificación
Paso 3: Cuantificación (quantization).

z Se eliminan los coeficientes menos representativos de la DCT
os Multimedia
(transformación con pérdidas).

z Cada coeficiente de la matriz 8x8 es dividido por un valor
almacenado en una tabla (q quantization table)).
misión de Dato
El estándar sugiere dos tablas una para la componente Y y otra para

las componentes Cb y Cr.
Estas tablas se pueden escalar con otro parámetro Q que nos
Transm
permitirá ajustar el índice de compresión requerido.
Tabla de 150 70 19 4 0 0 0 0
150 70 38 16 4 0 1 0 cuantificación 88 56 11 8 0 0 0 0
88 56 22 9 2 0 0 0 10 17 6 1 0 0 0 0
21 34 12 4 0 0 0 0 1 1 2 4 8 16 32 64 1 1 1 2 0 0 0 0
4 6 3 7 0 1 0 0 1 1 2 4 8 16 32 64 0 0 0 0 0 0 0 0
1 0 5 0 2 0 0 0 2 2 2 4 8 16 32 64 0 0 0 0 0 0 0 0
0 1 0 0 0 0 0 0 4 4 4 4 8 16 32 64 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 8 8 8 8 8 16 32 64
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 16 16 16 16 16 16 32 64
32 32 32 32 32 32 32 64
Coeficientes DCT
Coeficientes DCT 64 64 64 64 64 64 64 64
cuantificados
w1
5
C 2007/2008
a - Master IC Codificación JPEG: Codificación entropía
Paso 4: Codificación DPCM de los componentes DC de cada

bloque.
z Bloques
Bl sucesivos
i tienen
i un valor
l mediodi muy similar.
i il
os Multimedia
Paso 5: Codificación run-length de todos los componente de un

bloque.
q
misión de Dato
z Se hace un barrido “zig-zag” con el fin de agrupar todos los

componentes nulos.
Transm
150 70 19 4 0 0 0 0
88 56 11 8 0 0 0 0 150-70-88-10-56-19-4-11-17-1-0-1-6-8-0-0-0-1-1-0-0-0-0-0-2-..(39 0’s)
10 17 6 1 0 0 0 0
1 1 1 2 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 150-70-88-10-56-19-4-11-17-1-0-1-6-8-A0/3-A1/2-A0/5-2-A0/39
w1
6
C 2007/2008
a - Master IC Codificación JPEG: Codificación entropía
Paso 6: Codificación estadística VLC: Huffman

z A lo obtenido en el paso anterior se aplica el algoritmo de Huffman
os Multimedia
para comprimir aún más la información.

z El resultado de este paso es lo que debemos enviar o almacenar.
misión de Dato
La decodificación JPEG consiste en realizar el proceso inverso:

Transm
Inverse Inverse
Quantization DCT
Zig-zag Huffman
Run-lenght 110001110011100010
110001110011100010…..
ordering decoder
decoder
w1
7
C 2007/2008
a - Master IC Codificación JPEG: Ejemplo real (Quant)
40 44 47 40 40 55 79 75 411 -18 14 -8 24 -10 -14 -18

os Multimedia
44 52 40 47 40 48 67 79 20 -34 27 -9 -11 11 14 7
52 55 36 67 63 62 52 72 DCT -11 -23 -1 5 -19 4 -20 -2
68 45 56 60 52 55 36 60 -8 -5 14 -14 -8 -3 -3 9
62 48 56 48 40 36 47 62 -3 9 7 2 -10 17 18 16
47 67 40 55 55 40 36 62 3 -2 -17 8 7 -3 1 -8
misión de Dato
36 56 23 67 62 44 49 47 8 1 -2 3 -2 -7 -1 -2
48 55 36 55 52 47 47 36 1 -8 -4 2 2 3 -7 2
Bloque de muestras (pixels) Bloque de muestras transformadas

Transm
Quant
39 49 38 47 45 55 70 76 102 -22 1 0 1 0 0 -11
50 49 38 46 45 57 65 72 2 -4 2 0 0 0 0 0
54 46 43 55 54 60 53 60 IDCT -1 -2 0 0 -1 0 -1 0
58 47 50 59 55 57 43 55 0 0 1 -1 0 0 0 0
64 52 51 54 45 48 41 60 0 0 0 0 0 0 0 0
56 52 51 55 44 45 42 55 0 0 -1 0 0 0 0 0
43 50 47 58 51 49 43 42 0 0 0 0 0 0 0 0
42 50 40 53 50 51 48 39 0 0 0 0 0 0 0 0
Bloque recuperado de muestras Bloque de muestras cuantizadas
w1
8
C 2007/2008
a - Master IC Codificación JPEG: Ejemplo real I (RLE+VLC)
Codificación RLE+VLC de los coeficientes cuantizados

os Multimedia
Número de bits Código
102 -2 1 0 1 0 0 -1 0 100
2 -4 2 0 0 0 0 0 1 00
-1 -2 0 0 -1 0 -1 0 2 01
3 101
misión de Dato
0 0 1 -1
1 0 0 0 0
4 110
0 0 0 0 0 0 0 0
5 1110
0 0 -1 0 0 0 0 0 6 1111 0
0 0 0 0 0 0 0 0 7 1111 10
0 0 0 0 0 0 0 0 8 1111 110
Transm
9 1111 1110
Bloque de muestras cuantizadas 10 1111 1111 0
11 1111 1111 1
Tabla p
para la DC
Paso 1. Se codifica la DC usando codificación

diferencial DPCM
• Si DC Bloque anterior es 98 → codificar 102-98
• Se codifica como:
Num bits necesarios (tabla VLC) + codif + signo
Num.
• DC se codifica como: 101 100 0
w1
9
C 2007/2008
a - Master IC Codificación JPEG: Ejemplo real II (RLE+VLC)
Run Nivel Código

102 -2 1 0 1 0 0 -1
2 -4 2 0 0 0 0 0 EOB 10
-1 -2 0 0 -1 0 -1 0 0 1 11s
os Multimedia
0 0 1 -1 0 0 0 0 0 2 0100 s
0 3 0010 1s
0 0 0 0 0 0 0 0
0 4 0000 110s
0 0 -1 0 0 0 0 0 0 5 0010 0110 s
0 0 0 0 0 0 0 0 …
0 0 0 0 0 0 0 0
misión de Dato
1 1 011s
1 2 0001 10s
Bloque de muestras cuantizadas 1 3 0010 0101 s
1 4 0000 0011 00s
…
Paso
P 2
2: Se
S codifica
difi en zig-zag
i
Transm
2 1 0101 s
2 2 0000 100s
pares <Run (cuenta de ceros),

…
Escape 0000 01
coeficientes> Tabla para pares <Run

<Run, Niveles>
Run (Num. De Ceros) Valores Código VLC
0
0
-2
2
0100
0100
1
0
Existe código de escape:
0 -1 111 •
0000 01 RRRR RR NNNN NNNN
0 -4 0000 1101
0 1 110
1 2 0001 100
…
Parte del bloque codificado con VLC
w2
0
C 2007/2008
a - Master IC Codificación JPEG: Ejemplo real III (RLE+VLC)
Resultado final de la codificación RLE+VLC

102 -2 1 0 1 0 0 -1 Run (Num. De Ceros) Valores Código VLC
os Multimedia
2 -4 2 0 0 0 0 0
-1 -2 0 0 -1 0 -1 0 N/A 4 101 100 0
0 0 1 -1 0 0 0 0 0 -2 0100 1
0 2 0100 0
0 0 0 0 0 0 0 0 0 -1 111
0 0 -1
1 0 0 0 0 0
misión de Dato
0 -4
4 0000 1101
0 0 0 0 0 0 0 0 0 1 110
1 2 0001 100
0 0 0 0 0 0 0 0 0 -2 0100 1
5 1 0001 110
Bloque de muestras cuantizadas 3 1 0011 10
5 -1 0001 111
Transm
0 -1 111
2 -1 0101 1
4 -1 0011 01
7 -1 0001 001
EOB 10
Tasa de compresión: Bloque codificado con VLC
¾ Stream final: 1011000010010100011100001101 … 000100110 (85 bits)

¾ Bits por píxel:
í (Núm
ú bits/ Núm
ú píxels)
í 85/64= 1’33 bpp
¾ Factor de compresión:
¾ Tam_comprimida:Tam_original
Tam comprimida:Tam original= 85:(8
85:(8*8*8)=
8 8) 85:512
¾ 1:Tam_original/Tam_comprimida= (85/85):(512/85)= 1:6
w2
1
C 2007/2008
a - Master IC Codificación JPEG: Ejemplo real IV (Calidad)
40 44 47 40 40 55 79 75 Medida objetiva del error:

44 52 40 47 40 48 67 79
os Multimedia
52 55 36 67 63 62 52 72 MSE (Mean Square Error)

68 45 56 60 52 55 36 60
62 48 56 48 40 36 47 62
⎛⎜ s (i ) − s (i )′ ⎞
N 2
1
∑
47 67 40 55 55 40 36 62
MSE =
misión de Dato
36 56 23 67 62 44 49 47
N i =1 ⎝ ⎠
48 55 36 55 52 47 47 36
Bloque de muestras (pixels)

Medida objetiva de la calidad:
Transm
PSNR (Peak SNR)

2552
PSNR = 10 log10
39 49 38 47 45 55 70 76
50 49 38 46 45 57 65 72
54 46 43 55 54 60 53 60 MSE
58 47 50 59 55 57 43 55
64 52 51 54 45 48 41 60
56
6 52
2 51
1 55 44 4
45 42 55
43 50 47 58 51 49 43 42 Valores del ejemplo:
42 50 40 53 50 51 48 39
MSE = 49’53
Bloque
q recuperado
p de muestras
PSNR = 31’18 dB
w2
2
Resumen.
1. Introducción.
2 Características
2. C t í ti de
d la
l imagen.
i
z 2.1 Captura y digitalización de imagen.
z 2.2 Tipos de imagen (según su resolución)
3. Compresión de imagen. Redundancia espacial.

z 3.1 Estándar JPEG
z 3.2
32 JPEG Escalado

C 2007/2008
a - Master IC JPEG escalado
Motivación
ot ac ó
os Multimedia
Fundamentos del JPEG escalado

Compatibilidad con JPEG estándar
misión de Dato
Cuantificación variable
Resultados
Transm
C 2007/2008
a - Master IC Motivación
Utili
Utilización
a ión de tamaño de bloque
bloq e mayor:
ma o NxN.
N N
os Multimedia
Mayor compactación de energía pero mayor tiempo de cálculo.

Descartar coeficientes de alta frecuencia hasta quedarse con sólo
misión de Dato
una submatriz de 8x8.

Transm
C 2007/2008
a - Master IC Fundamentos del JPEG escalado
Di
División
isión de la imagen en bloques
bloq es de NxN
N N puntos
p ntos conservando
onse ando
os Multimedia
sólo los 8x8 primeros coeficientes.

Utilización de la DCT recortada de N a 8,, modificada.
misión de Dato
Utilización de nuevas matrices de cuantificación.

Elección de N=16.
Transm
C 2007/2008
a - Master IC
os Multimedia El proceso de codificación/decodificación JPEG escalado
Bloques de 16x16 Codificador de JPEG escalado

misión de Dato
Cuantifi-
Cuantifi Codificador
FDCT 16x16 16x16 a 8x8
cador de entropía
Imagen
FDCT 16x16 recortada
Imagen comprimida
Transm
Decodificador de JPEG escalado Bloques de 16x16
Decodifica. Descuanti- 8x8 a 16x16 IDCT 16x16

de entropía ficador
Imagen
comprimida
i id IDCT 16x16 recortada
Imagen
C 2007/2008
a - Master IC
os Multimedia
misión de Dato
Transm
Ejemplo de compresión JPEG escalado
Original
O i i l JPEG estándar
tá d JPEG escalado
l d
Tasa 24 - 180K Compresión 78:1
Tasa 0.3 - 2.2K
C 2007/2008
a - Master IC
os Multimedia
misión de Dato
Transm
Ejemplo de compresión JPEG escalado (continuación)
Original
O i i l JPEG estándar
tá d JPEG escalado
l d
Tasa 24 - 180K Compresión 128:1
Tasa 0.18 - 1.4K
C 2007/2008
a - Master IC Compatibilidad con JPEG estándar
Aunque el bloque de imagen es de 16x16 el de coeficientes es

os Multimedia
de 8x8 puntos.
Los coeficientes obtenidos se escalan para que estén en el
misión de Dato
rango de los que se obtienen en una DCT de 8x8.

Las funciones básicas son similares.
Se incluye información de tamaño real de la imagen
imagen, mediante
Transm
códigos definidos para extensiones.

C 2007/2008
a - Master IC
os Multimedia
Comparación de la DCT de 8 y 16 puntos
Funciones básicas de las DCT de 8 y 16 puntos

misión de Dato
0 1 2 3
Transm
4 5 6 7
DCT n=8 DCT n=16

C 2007/2008
Mezcla de formatos
a - Master IC
Imagen Leída como Se obtiene

os Multimedia
misión de Dato
JPEG escalado
Transm
JPEG estándar
JPEG estándar
JPEG escalado
C 2007/2008
a - Master IC Cuantificación variable
En el proceso de cuantificación se consigue la compresión a base de

os Multimedia
anular coeficientes
⎡ S 0,0
0 0 S 0,1 S 0,7 ⎤ ⎡ Sq 0,0
0 0 Sq 0,1 Sq 0,7 ⎤
misión de Dato
01 07 01 07
⎢ ⎥ ⎢ ⎥
⎢ S 1,0 S 1,1 S 1,7 ⎥ Cuantificación ⎢ Sq 1,0 Sq 1,1 Sq 1,7 ⎥
⎢ ⎥ ⎯⎯⎯⎯⎯→ ⎢ ⎥
⎢ ⎥ ⎢ ⎥
redondeo ⎛⎜ vu ⎞ = Sq vu
S
⎢ ⎥ ⎢ ⎥
Transm
⎣ S 7,0 S 7,1 S 7,7 ⎦ ⎝ Q vu ⎠ ⎣ Sq 7,0 Sq 7,1 Sq 7,7 ⎦
• Para
a a conseguir
co segu másás ceros
ce os hay
ay que
incrementar los valores Qvu, lo que afecta a
todos los bloques
C 2007/2008
a - Master IC
os Multimedia
Cuantificación variable: propuesta
Utilización
l ó de
d una función
f ó de
d cuantificación
f ó con umbral.
b l
⎧ ⎛S ⎞ S
⎪ redondeo ⎜ vu , si vu > um bral
misión de Dato
Sq vu = ⎨ ⎝ Q vu ⎠ Q vu
⎪ 0, en otro caso
⎩
Transm
• Clasificación de los bloques en categorías.

• Utilización de un umbral distinto para cada
categoría.
C 2007/2008
a - Master IC
os Multimedia
Ejemplo de clasificación de bloques y asignación de umbrales
Zona 1: Zona 2:
Hasta 47 ceros de 48 a 55 ceros
Umbral 1,0 Umbral 1,5
misión de Dato
Transm
Zona 3: Zona 4:
de 56 a 59 ceros de 60 a 63 ceros
Umbral 2,5 U b l 1,0
Umbral 10
C 2007/2008
Ejemplo de cuantificación adaptativa:
a - Master IC
os Multimedia
misión de Dato
Transm detalle de la cara de Lena
Sin
i cuantificación
ifi i Con cuantificación
ifi i
adaptativa adaptativa
C 2007/2008
Ejemplo de cuantificación adaptativa:
a - Master IC
os Multimedia
misión de Dato
Transm detalle del sombrero de Lena
Sin cuantificación Con cuantificación

adaptativa adaptativa
C 2007/2008
a - Master IC
Resultados
Detalle de la cara de Lena a 0.25 bpp

os Multimedia
misión de Dato
Transm
JPEG estándar JPEG escalado JPEG escalado con

cuantificación adaptativa
os Multimedia
misión de Dato
Transm C 2007/2008
a - Master IC Detalle de la cara de Lena a 0.15 bpp
JPEG estándar JPEG escalado JPEG escalado con

cuantificación adaptativa
C 2007/2008
Relación Señal-Ruido para distintas
a - Master IC tasas de bits de la imagen Lena
estándar escalado adaptativo

os Multimedia
30
29
28
misión de Dato
27
26
Transm
R'
SNR
25
24
23
22
21
Lena 512x512
20
0,1 0,15 0,2 0,25 0,3 0,35 0,4 0,45 0,5
Tasa de bits
C 2007/2008
Relación Señal-Ruido para distintas
a - Master IC tasas de bits de la imagen Catedral
estándar escalado adaptativo

estándar ((1:2)) escalado ((1:2)) adaptativo
p ((1:2))
os Multimedia
26
25
misión de Dato
24
23
R'
Transm
SNR
22
21
20
19
Catedral 899x1107 y 450x554(1:2)
( )
18
0,1 0,15 0,2 0,25 0,3 0,35 0,4 0,45 0,5
Tasa de bits
C 2007/2008
Relación del SNR de las imágenes con JPEG escalado y adaptativo frente al
a - Master IC estándar
1,1
Escalado
os Multimedia
Adaptativo
1,08
Estándar
Adaptativo / E
misión de Dato
1,06
1,04
Transm
Escalado y A
1,02
SNR' E
0,98
0,1 0,15 0,2 0,25 0,3 0,35 0,4 0,45 0,5
Tasa de bits

T5 Imagen PDF

Загружено:

Сведения о документе

Оригинальное название

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

T5 Imagen PDF

Загружено:

Авторское право:

Доступные форматы

Codificación y compresión de imagen

Transmisión de Datos Multimedia – http://www.grc.upv.es/docencia/tdm – Master IC 2007/2008

 Las imágenes que percibimos están compuestas de ondas

z A diferentes longitudes de onda, diferentes sensaciones de color.

z Dadas tres fuentes de luz de la misma intensidad y distinto color (una

 Los mecanismos de percepción visual humanos son menos

 Las imágenes digitales están compuestas de píxels (picture

 Una cámara fotográfica digital utiliza un CCD (charge coupled

en cargas eléctricas (o sea, fotones en electrones).

correspondiente del CCD se utiliza una lente.

 Mediante la lente se puede conseguir

 Problemática del color:

intensidad de luz, pero no su color.

z El número de píxels que reciben luz verde es el mismo que la suma de

¾ La información de color que no se ha

 El CCD es un dispositivo analógico.

representación digital de cada píxel a partir de la señal eléctrica

 Una cámara digital necesita un DSP para

componente de color (p.ej., 8 bits/componente→24 bits/muestra).

azul, roja y verde, o componentes Cb, Cr, Cg).

 Y = 0.3R + 0.6G + 0.1B (Nivel de brillo o luminancia)

 Subsampling: El ojo es más sensible a la

 La resolución de una imagen se mide según el número de píxels

 En cámaras digitales se suele medir en Megapixels (millones de

habitualmente en videoconferencia (junto con Quarter CIF)

 A veces, la resolución real de una cámara digital no coincide con

3. Compresión de imagen. Redundancia espacial.

Transmisión de Datos Multimedia – http://www.grc.upv.es/docencia/tdm – Master IC 2007/2008

 Una imagen suele presentar redundancia espacial:

 Las imágenes tienen información redundante susceptible de ser eliminada

z El proceso de compresión de imagen consistirá en:

 Es un estándar ISO (‘91) cuyo origen proviene del grupo JPEG

z Codifica imágenes de tono-continuo

 Codificación JPEG en modo secuencial con pérdidas

 Paso 1: Preparación de la imagen.

 Paso 2: Transformada discreta del coseno (DCT).

 Las componentes frecuenciales más altas son susceptibles de ser

matriz de coeficientes DCT asociada

 DCT-1D: (vector 8 elementos)

 Paso 3: Cuantificación (quantization).

(transformación con pérdidas).

 El estándar sugiere dos tablas una para la componente Y y otra para

permitirá ajustar el índice de compresión requerido.

 Paso 4: Codificación DPCM de los componentes DC de cada

 Paso 5: Codificación run-length de todos los componente de un

z Se hace un barrido “zig-zag” con el fin de agrupar todos los

 Paso 6: Codificación estadística VLC: Huffman

para comprimir aún más la información.

 La decodificación JPEG consiste en realizar el proceso inverso:

40 44 47 40 40 55 79 75 411 -18 14 -8 24 -10 -14 -18

Bloque de muestras (pixels) Bloque de muestras transformadas

Bloque recuperado de muestras Bloque de muestras cuantizadas

 Codificación RLE+VLC de los coeficientes cuantizados

Número de bits Código

 Paso 1. Se codifica la DC usando codificación

Run Nivel Código

pares <Run (cuenta de ceros),

coeficientes> Tabla para pares <Run

Run (Num. De Ceros) Valores Código VLC

 Resultado final de la codificación RLE+VLC

 Tasa de compresión: Bloque codificado con VLC

¾ Stream final: 1011000010010100011100001101 … 000100110 (85 bits)

40 44 47 40 40 55 79 75 Medida objetiva del error:

Las imágenes que percibimos están compuestas de ondas

Los mecanismos de percepción visual humanos son menos

Las imágenes digitales están compuestas de píxels (picture

Una cámara fotográfica digital utiliza un CCD (charge coupled

Mediante la lente se puede conseguir

Problemática del color:

El CCD es un dispositivo analógico.

Una cámara digital necesita un DSP para

Y = 0.3R + 0.6G + 0.1B (Nivel de brillo o luminancia)

Subsampling: El ojo es más sensible a la

La resolución de una imagen se mide según el número de píxels

En cámaras digitales se suele medir en Megapixels (millones de

A veces, la resolución real de una cámara digital no coincide con

3. Compresión de imagen. Redundancia espacial.

Una imagen suele presentar redundancia espacial:

Las imágenes tienen información redundante susceptible de ser eliminada

Es un estándar ISO (‘91) cuyo origen proviene del grupo JPEG

Codificación JPEG en modo secuencial con pérdidas

Paso 1: Preparación de la imagen.

Paso 2: Transformada discreta del coseno (DCT).

Las componentes frecuenciales más altas son susceptibles de ser

DCT-1D: (vector 8 elementos)

Paso 3: Cuantificación (quantization).

El estándar sugiere dos tablas una para la componente Y y otra para

Paso 4: Codificación DPCM de los componentes DC de cada

Paso 5: Codificación run-length de todos los componente de un

Paso 6: Codificación estadística VLC: Huffman

La decodificación JPEG consiste en realizar el proceso inverso:

Codificación RLE+VLC de los coeficientes cuantizados

Paso 1. Se codifica la DC usando codificación

Resultado final de la codificación RLE+VLC

Tasa de compresión: Bloque codificado con VLC

3. Compresión de imagen. Redundancia espacial.

Fundamentos del JPEG escalado

Mayor compactación de energía pero mayor tiempo de cálculo.

Utilización de nuevas matrices de cuantificación.

Aunque el bloque de imagen es de 16x16 el de coeficientes es

En el proceso de cuantificación se consigue la compresión a base de

⎣ S 7,0 S 7,1 S 7,7 ⎦ ⎝ Q vu ⎠ ⎣ Sq 7,0 Sq 7,1 Sq 7,7 ⎦