Вы находитесь на странице: 1из 42

Codificación y compresión de imagen

Bibliografía
‰1. Introducción. [FLU95] Understanding networked
‰2 Características de la imagen.
‰2. imagen multimedia
[GIB98] Digital Compression for
z 2.1 Captura y digitalización de imagen. Multimedia
z 2.2 Tipos de imagen [TSU99] Introduction to video coding
standards for multimedia communication
‰3. Compresión
‰3 C ió de
d imagen.
i [JPEGESC] JPEG escalado - Tesis

Redundancia espacial.
[JPEGAD] JPEG image coding with
adaptive quantization
z 3.1 Estándar JPEG [JPEG2000] JPEG 2000 performance
evaluation and assessment
z 3.2 JPEG Escalado
[Geo99] Wavelet-based Image Coding: An
Overview
[EZW] Embedded image coding using
zerotrees of wavelet coefficients
[LTW] Fast and efficient spatial scalable
image compression using wavelet lower
trees

Transmisión de Datos Multimedia – http://www.grc.upv.es/docencia/tdm – Master IC 2007/2008


C 2007/2008
a - Master IC 1. Introducción

‰ Las imágenes que percibimos están compuestas de ondas


electromagnéticas (λ: 250nm - 780nm).
os Multimedia

z A diferentes longitudes de onda, diferentes sensaciones de color.


‰ El ojo es más sensible a unos colores que a otros.
misión de Dato

z Dadas tres fuentes de luz de la misma intensidad y distinto color (una


roja, otra verde y otra azul), el ojo percibe la verde con el doble de
intensidad que la roja, y seis veces más intensa que la azul.
Transm

‰ Los mecanismos de percepción visual humanos son menos


sensibles y estrictos que los auditivos.
z Ej.:
Ej : Variaciones de frecuencia,
frecuencia supresión de imágenes
imágenes, etc.
etc
‰ Mezclando 3 colores (RGB) podemos obtener otro.
‰ Integra la información que recibe.

w2
C 2007/2008
a - Master IC 2.1 Captura y digitalización de imagen I

‰ Las imágenes digitales están compuestas de píxels (picture


element).
os Multimedia

‰ Una cámara fotográfica digital utiliza un CCD (charge coupled


device) para realizar el proceso de adquisición analógica.
z El CCD tiene una serie de pequeños diodos sensibles a la luz que convierten luz
misión de Dato

en cargas eléctricas (o sea, fotones en electrones).


z Cada diodo del CCD captura un píxel de la imagen a adquirir.
‰ Para poder situar cada píxel de la imagen (luz entrante) en su diodo
Transm

correspondiente del CCD se utiliza una lente.

‹ Mediante la lente se puede conseguir


también realizar zoom óptico (no confundir
w3
con zoom digital)
di it l)
C 2007/2008
a - Master IC 2.1 Captura y digitalización de imagen II

‰ Problemática del color:


z Si el CCD captura la luz directa que recibe de la lente,
lente sólo tenemos la
os Multimedia

intensidad de luz, pero no su color.


z Añadimos un filtro (R, G ó B) a cada píxel, de manera que algunos
píxels
í l reciben
ib sólo
ól la
l luz
l roja,
j otros
t la
l verde
d y otros
t la
l azul.
l
misión de Dato

z El número de píxels que reciben luz verde es el mismo que la suma de


los que reciben luz roja y azul.
Transm

¾ La información de color que no se ha


obtenido en cada píxel se interpola
directamente de sus vecinos, usando un DSP.

w4
C 2007/2008
a - Master IC 2.1 Captura y digitalización de imagen III

‰ El CCD es un dispositivo analógico.


z Es necesario un conversor analógico digital (ADC) que obtenga la
os Multimedia

representación digital de cada píxel a partir de la señal eléctrica


generada por cada diodo.
misión de Dato

‹ Una cámara digital necesita un DSP para


gestionar el funcionamiento de la cámara.
Realiza el acceso y almacenamiento de fotos en
Transm

¾
memoria, el proceso de compresión, la
interpolación de los colores, gestión de menús,
etc.
t
¾ Uno de los más usados, el TMS320DSC24 de
Texas Instruments, funciona a 80 Mhz y es
utilizado
ili d por Kodak
K d k en sus productos.
d

w5
C 2007/2008
a - Master IC 2.1 Captura y digitalización de imagen IV

‰ Codificación y recodificación.
z Cada muestra RGB se codifica con una cantidad de bits por p
os Multimedia

componente de color (p.ej., 8 bits/componente→24 bits/muestra).


z A veces resulta interesante codificar el nivel de brillo de una muestra
((luminancia,, o componente
p Y)) y las diferencias de color (crominancias
(
misión de Dato

azul, roja y verde, o componentes Cb, Cr, Cg).


z La conversión de RGB a YCbCr (YUV) se realiza mediante una matriz de
conversión (aproximada):
Transm

„ Y = 0.3R + 0.6G + 0.1B (Nivel de brillo o luminancia)


„ U = B - Y (Diferencia de color azul) (equiv. Cb=U/2+128)
„ V = R - Y (Diferencia de color rojo) (equiv
(equiv. Cr=V/1
Cr V/1.6+128)
6+128)
z Cada uno de los componentes se codifica con 8 bits.
„ Y (8 bits): rango 16-235
„ Cb (8 bits) y Cr (8 bits): rango 16-240
16 240
La diferencia de color verde
(Cg) es redundante y no se
almacena, ya que se puede
obtener
bt a partir
ti d
de lla Y
Y, lla Cb y
la Cr.
w6
C 2007/2008
a - Master IC 2.1 Captura y digitalización de imagen V

‰ Subsampling: El ojo es más sensible a la


información de luminancia que de crominancia. Muestra Cr + Muestra Cb
os Multimedia

Muestra Y 720

720
misión de Dato

480
o
576 360
480 Y
o
576 480
Transm

Y o
Cb 576
Cr Cb
Cr
Formato 4:4:4 Formato 4:2:2
720 720

480 480
o o
576 576 180
Y Y
360
240 480
o o
288 576
Cb Cb
Cr Formato 4:1:1 Cr
Formato 4:2:0
w7
C 2007/2008
a - Master IC 2.2 Tipos de imagen (según su resolución)

‰ La resolución de una imagen se mide según el número de píxels


por lado (ancho x alto).
os Multimedia

‰ En cámaras digitales se suele medir en Megapixels (millones de


píxels por imagen)
1) Common Intermediate Format (CIF) (352x288): Utilizado
misión de Dato

habitualmente en videoconferencia (junto con Quarter CIF)


2) VGA (640x480): Usado por cámaras de baja calidad.
3) n-Megapixels:
n Megapixels: Ofrecido por cámaras de mayor calidad.
calidad
Transm

‰ A veces, la resolución real de una cámara digital no coincide con


la del CCD de esa misma cámara.
z P.ej, una cámara de 3,3 MP ofrece una resolución de 2048x1536.
z Parte de la circuitería del CCD que transporta los datos al ADC está
situada en determinados diodos q que no pueden
p ser usados.

w8
Resumen

‰1. Introducción.
‰2 Características
‰2. C t í ti de
d la
l imagen.
i
z 2.1 Captura y digitalización de imagen.
z 2.2 Tipos de imagen (según su resolución)

‰3. Compresión de imagen. Redundancia espacial.


z 3.1 Estándar JPEG
z 3.2 JPEG Escalado

Transmisión de Datos Multimedia – http://www.grc.upv.es/docencia/tdm – Master IC 2007/2008


C 2007/2008
a - Master IC 3. Compresión de imagen.

‰ Una imagen suele presentar redundancia espacial:


z Redundancia espacial:
os Multimedia

„ Las imágenes tienen información redundante susceptible de ser eliminada


o reducida (por ejemplo, el color del cielo en una foto suele ser uniforme y
azul ::-)).
misión de Dato

z El proceso de compresión de imagen consistirá en:


1) Eliminar en la medida de lo posible la redundancia espacial utilizando
técnicas de source encoding (normalmente mediante transformada
Transm

matemática).
2) Codificar los datos obtenidos en el paso anterior usando entropy
enconding g ((elimina aun más la redundancia espacial).
p )
z Para conseguir mayores índices de compresión, este proceso será con
pérdidas (cuantización de los datos).

w1
0
C 2007/2008
a - Master IC 3.1 Redundancia espacial: JPEG

‰ Es un estándar ISO (‘91) cuyo origen proviene del grupo JPEG


(Joint Photographic Expert Group).
os Multimedia

z Codifica imágenes de tono-continuo


z Dispone de cuatro modos de operación (incluyendo codificación sin
misión de Dato

perdidas).
z Se definen una serie de parámetros que permiten codificar las
imágenes para obtener una gran variedad de calidades de
Transm

compresión.
z Factor de compresión ronda 20:1*
z Es
E un sistema
i t d
de codificación
difi ió simétrico.
i ét i
z Forma parte de otros estándares de compresión de secuencias de
vídeo (MPEG y H.26*).

w1
1
C 2007/2008
a - Master IC Codificación JPEG (pasos)

‰ Codificación JPEG en modo secuencial con pérdidas


os Multimedia

C difi ió fuente
Codificación f t C difi ió entrópica
Codificación tó i
Imagen Imagen
original (RGB) Prep. de Run codificada
DCT Cuantiz. Huffman
bloques Length
misión de Dato

Tabla Tabla
Transm

‹ Paso 1: Preparación de la imagen.


¾ No define el formato de imagen original.
¾ Podría ser RGB, YUV, YIQ, YCrCb, etc.
¾ Convierte la imagen a formato YCbCr utilizando una reducción
de color 4:1:1 (sub-sampling)
( p g)
¾ Ej.: RGB 640x480 (VGA): Y (640x480), Cb y Cr (320x240)
¾ Se divide la imagen en bloques de 8x8 elementos
¾ Ej.
Ej anterior: 4800 bloques Y,
Y 1200 Cb y 1200 Cr.
Cr
w1
2
C 2007/2008
a - Master IC Codificación JPEG: Transformada DCT

‰ Paso 2: Transformada discreta del coseno (DCT).


z Transforma un dominio de amplitudes al dominio de la frecuencia.
frecuencia
os Multimedia

„ Las componentes frecuenciales más altas son susceptibles de ser


eliminadas (percepción visual)
z Se aplica esta transformada a cada bloque de 8x8 obteniendo la
misión de Dato

matriz de coeficientes DCT asociada


„ Componente (0,0): el nivel de continua DC del bloque (Media)
Transm

Coeficiente
Amplitud DCT

Transformada
x DCT Fx

y
Fy

w1
3
C 2007/2008
a - Master IC Codificación JPEG: Transformada DCT(II)

‰ DCT-1D: (vector 8 elementos)


Transformada
directa
os Multimedia

C (u ) 7 ⎡ (2 x + 1)uπ ⎤
S (u ) = ∑
2 x =0
s ( x) cos ⎢
⎣ 16 ⎥
⎦ 1
Si u = 0, C (u ) =
2
misión de Dato

Si u = 1, C (u ) = 1
7
C (u ) ⎡ (2 x + 1)uπ ⎤
s ( x) = ∑ S (u ) cos ⎢ ⎥
u =0 2 ⎣ 16 ⎦ Transformada
Transm

inversa
‰ DCT-2D: (matriz 8x8 elementos)

1 N −1 N −1
⎡ (2 x + 1)iΠ ⎤ ⎡ (2 y + 1) jΠ ⎤
DCT (i, j ) = C (i )C ( j )∑∑ p pixel ( x, y ) cos ⎢ ⎥⎦ cos ⎢⎣ ⎥⎦
2N x =0 y =0 ⎣ 2N 2N

1 N −1 N −1
⎡ (2 x + 1)iΠ ⎤ ⎡ (2 y + 1) jΠ ⎤
pixel ( x, y ) =
2N
∑∑
i =0 j =0
C (i )C ( j ) DCT (i , j ) cos ⎢⎣ 2 N ⎥⎦ cos ⎢⎣ 2N ⎥⎦

w1
4
C 2007/2008
a - Master IC Codificación JPEG: Cuantificación

‰ Paso 3: Cuantificación (quantization).


z Se eliminan los coeficientes menos representativos de la DCT
os Multimedia

(transformación con pérdidas).


z Cada coeficiente de la matriz 8x8 es dividido por un valor
almacenado en una tabla (q quantization table)).
misión de Dato

„ El estándar sugiere dos tablas una para la componente Y y otra para


las componentes Cb y Cr.
„ Estas tablas se pueden escalar con otro parámetro Q que nos
Transm

permitirá ajustar el índice de compresión requerido.

Tabla de 150 70 19 4 0 0 0 0
150 70 38 16 4 0 1 0 cuantificación 88 56 11 8 0 0 0 0
88 56 22 9 2 0 0 0 10 17 6 1 0 0 0 0
21 34 12 4 0 0 0 0 1 1 2 4 8 16 32 64 1 1 1 2 0 0 0 0
4 6 3 7 0 1 0 0 1 1 2 4 8 16 32 64 0 0 0 0 0 0 0 0
1 0 5 0 2 0 0 0 2 2 2 4 8 16 32 64 0 0 0 0 0 0 0 0
0 1 0 0 0 0 0 0 4 4 4 4 8 16 32 64 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 8 8 8 8 8 16 32 64
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 16 16 16 16 16 16 32 64
32 32 32 32 32 32 32 64
Coeficientes DCT
Coeficientes DCT 64 64 64 64 64 64 64 64
cuantificados
w1
5
C 2007/2008
a - Master IC Codificación JPEG: Codificación entropía

‰ Paso 4: Codificación DPCM de los componentes DC de cada


bloque.
z Bloques
Bl sucesivos
i tienen
i un valor
l mediodi muy similar.
i il
os Multimedia

‰ Paso 5: Codificación run-length de todos los componente de un


bloque.
q
misión de Dato

z Se hace un barrido “zig-zag” con el fin de agrupar todos los


componentes nulos.
Transm

150 70 19 4 0 0 0 0
88 56 11 8 0 0 0 0 150-70-88-10-56-19-4-11-17-1-0-1-6-8-0-0-0-1-1-0-0-0-0-0-2-..(39 0’s)
10 17 6 1 0 0 0 0
1 1 1 2 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 150-70-88-10-56-19-4-11-17-1-0-1-6-8-A0/3-A1/2-A0/5-2-A0/39

w1
6
C 2007/2008
a - Master IC Codificación JPEG: Codificación entropía

‰ Paso 6: Codificación estadística VLC: Huffman


z A lo obtenido en el paso anterior se aplica el algoritmo de Huffman
os Multimedia

para comprimir aún más la información.


z El resultado de este paso es lo que debemos enviar o almacenar.
misión de Dato

‰ La decodificación JPEG consiste en realizar el proceso inverso:


Transm

Inverse Inverse
Quantization DCT

Zig-zag Huffman
Run-lenght 110001110011100010
110001110011100010…..
ordering decoder
decoder

w1
7
C 2007/2008
a - Master IC Codificación JPEG: Ejemplo real (Quant)

40 44 47 40 40 55 79 75 411 -18 14 -8 24 -10 -14 -18


os Multimedia

44 52 40 47 40 48 67 79 20 -34 27 -9 -11 11 14 7
52 55 36 67 63 62 52 72 DCT -11 -23 -1 5 -19 4 -20 -2
68 45 56 60 52 55 36 60 -8 -5 14 -14 -8 -3 -3 9
62 48 56 48 40 36 47 62 -3 9 7 2 -10 17 18 16
47 67 40 55 55 40 36 62 3 -2 -17 8 7 -3 1 -8
misión de Dato

36 56 23 67 62 44 49 47 8 1 -2 3 -2 -7 -1 -2
48 55 36 55 52 47 47 36 1 -8 -4 2 2 3 -7 2

Bloque de muestras (pixels) Bloque de muestras transformadas


Transm

Quant
39 49 38 47 45 55 70 76 102 -22 1 0 1 0 0 -11
50 49 38 46 45 57 65 72 2 -4 2 0 0 0 0 0
54 46 43 55 54 60 53 60 IDCT -1 -2 0 0 -1 0 -1 0
58 47 50 59 55 57 43 55 0 0 1 -1 0 0 0 0
64 52 51 54 45 48 41 60 0 0 0 0 0 0 0 0
56 52 51 55 44 45 42 55 0 0 -1 0 0 0 0 0
43 50 47 58 51 49 43 42 0 0 0 0 0 0 0 0
42 50 40 53 50 51 48 39 0 0 0 0 0 0 0 0

Bloque recuperado de muestras Bloque de muestras cuantizadas

w1
8
C 2007/2008
a - Master IC Codificación JPEG: Ejemplo real I (RLE+VLC)

‹ Codificación RLE+VLC de los coeficientes cuantizados


os Multimedia

Número de bits Código

102 -2 1 0 1 0 0 -1 0 100
2 -4 2 0 0 0 0 0 1 00
-1 -2 0 0 -1 0 -1 0 2 01
3 101
misión de Dato

0 0 1 -1
1 0 0 0 0
4 110
0 0 0 0 0 0 0 0
5 1110
0 0 -1 0 0 0 0 0 6 1111 0
0 0 0 0 0 0 0 0 7 1111 10
0 0 0 0 0 0 0 0 8 1111 110
Transm

9 1111 1110
Bloque de muestras cuantizadas 10 1111 1111 0
11 1111 1111 1

Tabla p
para la DC

‹ Paso 1. Se codifica la DC usando codificación


diferencial DPCM
• Si DC Bloque anterior es 98 → codificar 102-98
• Se codifica como:
Num bits necesarios (tabla VLC) + codif + signo
Num.
• DC se codifica como: 101 100 0
w1
9
C 2007/2008
a - Master IC Codificación JPEG: Ejemplo real II (RLE+VLC)

Run Nivel Código


102 -2 1 0 1 0 0 -1
2 -4 2 0 0 0 0 0 EOB 10
-1 -2 0 0 -1 0 -1 0 0 1 11s
os Multimedia

0 0 1 -1 0 0 0 0 0 2 0100 s
0 3 0010 1s
0 0 0 0 0 0 0 0
0 4 0000 110s
0 0 -1 0 0 0 0 0 0 5 0010 0110 s
0 0 0 0 0 0 0 0 …
0 0 0 0 0 0 0 0
misión de Dato

1 1 011s
1 2 0001 10s
Bloque de muestras cuantizadas 1 3 0010 0101 s
1 4 0000 0011 00s

‹ Paso
P 2
2: Se
S codifica
difi en zig-zag
i
Transm

2 1 0101 s
2 2 0000 100s

pares <Run (cuenta de ceros),



Escape 0000 01

coeficientes> Tabla para pares <Run


<Run, Niveles>

Run (Num. De Ceros) Valores Código VLC

0
0
-2
2
0100
0100
1
0
Existe código de escape:
0 -1 111 •
0000 01 RRRR RR NNNN NNNN
0 -4 0000 1101
0 1 110
1 2 0001 100

Parte del bloque codificado con VLC
w2
0
C 2007/2008
a - Master IC Codificación JPEG: Ejemplo real III (RLE+VLC)

‹ Resultado final de la codificación RLE+VLC


102 -2 1 0 1 0 0 -1 Run (Num. De Ceros) Valores Código VLC
os Multimedia

2 -4 2 0 0 0 0 0
-1 -2 0 0 -1 0 -1 0 N/A 4 101 100 0
0 0 1 -1 0 0 0 0 0 -2 0100 1
0 2 0100 0
0 0 0 0 0 0 0 0 0 -1 111
0 0 -1
1 0 0 0 0 0
misión de Dato

0 -4
4 0000 1101
0 0 0 0 0 0 0 0 0 1 110
1 2 0001 100
0 0 0 0 0 0 0 0 0 -2 0100 1
5 1 0001 110
Bloque de muestras cuantizadas 3 1 0011 10
5 -1 0001 111
Transm

0 -1 111
2 -1 0101 1
4 -1 0011 01
7 -1 0001 001
EOB 10

‹ Tasa de compresión: Bloque codificado con VLC

¾ Stream final: 1011000010010100011100001101 … 000100110 (85 bits)


¾ Bits por píxel:
í (Núm
ú bits/ Núm
ú píxels)
í 85/64= 1’33 bpp
¾ Factor de compresión:
¾ Tam_comprimida:Tam_original
Tam comprimida:Tam original= 85:(8
85:(8*8*8)=
8 8) 85:512
¾ 1:Tam_original/Tam_comprimida= (85/85):(512/85)= 1:6
w2
1
C 2007/2008
a - Master IC Codificación JPEG: Ejemplo real IV (Calidad)

40 44 47 40 40 55 79 75 Medida objetiva del error:


44 52 40 47 40 48 67 79
os Multimedia

52 55 36 67 63 62 52 72 MSE (Mean Square Error)


68 45 56 60 52 55 36 60
62 48 56 48 40 36 47 62
⎛⎜ s (i ) − s (i )′ ⎞
N 2
1

47 67 40 55 55 40 36 62
MSE =
misión de Dato

36 56 23 67 62 44 49 47
N i =1 ⎝ ⎠
48 55 36 55 52 47 47 36

Bloque de muestras (pixels)


Medida objetiva de la calidad:
Transm

PSNR (Peak SNR)


2552
PSNR = 10 log10
39 49 38 47 45 55 70 76
50 49 38 46 45 57 65 72
54 46 43 55 54 60 53 60 MSE
58 47 50 59 55 57 43 55
64 52 51 54 45 48 41 60
56
6 52
2 51
1 55 44 4
45 42 55
43 50 47 58 51 49 43 42 Valores del ejemplo:
42 50 40 53 50 51 48 39
MSE = 49’53
Bloque
q recuperado
p de muestras
PSNR = 31’18 dB
w2
2
Resumen.

‰1. Introducción.
‰2 Características
‰2. C t í ti de
d la
l imagen.
i
z 2.1 Captura y digitalización de imagen.
z 2.2 Tipos de imagen (según su resolución)

‰3. Compresión de imagen. Redundancia espacial.


z 3.1 Estándar JPEG
z 3.2
32 JPEG Escalado

Transmisión de Datos Multimedia – http://www.grc.upv.es/docencia/tdm – Master IC 2007/2008


C 2007/2008
a - Master IC JPEG escalado

‰ Motivación
ot ac ó
os Multimedia

‰ Fundamentos del JPEG escalado


‰ Compatibilidad con JPEG estándar
misión de Dato

‰ Cuantificación variable
‰ Resultados
Transm
C 2007/2008
a - Master IC Motivación

‰ Utili
Utilización
a ión de tamaño de bloque
bloq e mayor:
ma o NxN.
N N
os Multimedia

‰ Mayor compactación de energía pero mayor tiempo de cálculo.


‰ Descartar coeficientes de alta frecuencia hasta quedarse con sólo
misión de Dato

una submatriz de 8x8.


Transm
C 2007/2008
a - Master IC Fundamentos del JPEG escalado

‰ Di
División
isión de la imagen en bloques
bloq es de NxN
N N puntos
p ntos conservando
onse ando
os Multimedia

sólo los 8x8 primeros coeficientes.


‰ Utilización de la DCT recortada de N a 8,, modificada.
misión de Dato

‰ Utilización de nuevas matrices de cuantificación.


‰ Elección de N=16.
Transm
C 2007/2008
a - Master IC
os Multimedia El proceso de codificación/decodificación JPEG escalado

Bloques de 16x16 Codificador de JPEG escalado


misión de Dato

Cuantifi-
Cuantifi Codificador
FDCT 16x16 16x16 a 8x8
cador de entropía
Imagen
FDCT 16x16 recortada
Imagen comprimida
Transm

Decodificador de JPEG escalado Bloques de 16x16

Decodifica. Descuanti- 8x8 a 16x16 IDCT 16x16


de entropía ficador
Imagen
comprimida
i id IDCT 16x16 recortada
Imagen
C 2007/2008
a - Master IC
os Multimedia
misión de Dato
Transm
Ejemplo de compresión JPEG escalado

Original
O i i l JPEG estándar
tá d JPEG escalado
l d
Tasa 24 - 180K Compresión 78:1
Tasa 0.3 - 2.2K
C 2007/2008
a - Master IC
os Multimedia
misión de Dato
Transm
Ejemplo de compresión JPEG escalado (continuación)

Original
O i i l JPEG estándar
tá d JPEG escalado
l d
Tasa 24 - 180K Compresión 128:1
Tasa 0.18 - 1.4K
C 2007/2008
a - Master IC Compatibilidad con JPEG estándar

‰ Aunque el bloque de imagen es de 16x16 el de coeficientes es


os Multimedia

de 8x8 puntos.
‰ Los coeficientes obtenidos se escalan para que estén en el
misión de Dato

rango de los que se obtienen en una DCT de 8x8.


‰ Las funciones básicas son similares.
‰ Se incluye información de tamaño real de la imagen
imagen, mediante
Transm

códigos definidos para extensiones.


C 2007/2008
a - Master IC
os Multimedia
Comparación de la DCT de 8 y 16 puntos

Funciones básicas de las DCT de 8 y 16 puntos


misión de Dato

0 1 2 3
Transm

4 5 6 7

DCT n=8 DCT n=16


C 2007/2008
Mezcla de formatos
a - Master IC

Imagen Leída como Se obtiene


os Multimedia
misión de Dato

JPEG escalado
Transm

JPEG estándar

JPEG estándar

JPEG escalado
C 2007/2008
a - Master IC Cuantificación variable

‰ En el proceso de cuantificación se consigue la compresión a base de


os Multimedia

anular coeficientes

⎡ S 0,0
0 0 S 0,1 ’ S 0,7 ⎤ ⎡ Sq 0,0
0 0 Sq 0,1 ’ Sq 0,7 ⎤
misión de Dato

01 07 01 07
⎢ ⎥ ⎢ ⎥
⎢ S 1,0 S 1,1 ’ S 1,7 ⎥ Cuantificación ⎢ Sq 1,0 Sq 1,1 ’ Sq 1,7 ⎥
⎢ ⎥ ⎯⎯⎯⎯⎯→ ⎢ ⎥
⎢ “ “ ” “ ⎥ ⎢ “ “ ” “ ⎥
redondeo ⎛⎜ vu ⎞ = Sq vu
S
⎢ ⎥ ⎢ ⎥
Transm

⎣ S 7,0 S 7,1 ’ S 7,7 ⎦ ⎝ Q vu ⎠ ⎣ Sq 7,0 Sq 7,1 ’ Sq 7,7 ⎦

• Para
a a conseguir
co segu másás ceros
ce os hay
ay que
incrementar los valores Qvu, lo que afecta a
todos los bloques
C 2007/2008
a - Master IC
os Multimedia
Cuantificación variable: propuesta

‰ Utilización
l ó de
d una función
f ó de
d cuantificación
f ó con umbral.
b l

⎧ ⎛S ⎞ S
⎪ redondeo ⎜ vu , si vu > um bral
misión de Dato

Sq vu = ⎨ ⎝ Q vu ⎠ Q vu
⎪ 0, en otro caso

Transm

• Clasificación de los bloques en categorías.


• Utilización de un umbral distinto para cada
categoría.
C 2007/2008
a - Master IC
os Multimedia
Ejemplo de clasificación de bloques y asignación de umbrales

Zona 1: Zona 2:
Hasta 47 ceros de 48 a 55 ceros
Umbral 1,0 Umbral 1,5
misión de Dato
Transm

Zona 3: Zona 4:
de 56 a 59 ceros de 60 a 63 ceros
Umbral 2,5 U b l 1,0
Umbral 10
C 2007/2008
Ejemplo de cuantificación adaptativa:
a - Master IC
os Multimedia
misión de Dato
Transm detalle de la cara de Lena

Sin
i cuantificación
ifi i Con cuantificación
ifi i
adaptativa adaptativa
C 2007/2008
Ejemplo de cuantificación adaptativa:
a - Master IC
os Multimedia
misión de Dato
Transm detalle del sombrero de Lena

Sin cuantificación Con cuantificación


adaptativa adaptativa
C 2007/2008
a - Master IC
Resultados

Detalle de la cara de Lena a 0.25 bpp


os Multimedia
misión de Dato
Transm

JPEG estándar JPEG escalado JPEG escalado con


cuantificación adaptativa
os Multimedia
misión de Dato
Transm C 2007/2008
a - Master IC Detalle de la cara de Lena a 0.15 bpp

JPEG estándar JPEG escalado JPEG escalado con


cuantificación adaptativa
C 2007/2008
Relación Señal-Ruido para distintas
a - Master IC tasas de bits de la imagen Lena

estándar escalado adaptativo


os Multimedia

30

29

28
misión de Dato

27

26
Transm

R'
SNR

25

24

23

22

21
Lena 512x512
20
0,1 0,15 0,2 0,25 0,3 0,35 0,4 0,45 0,5
Tasa de bits
C 2007/2008
Relación Señal-Ruido para distintas
a - Master IC tasas de bits de la imagen Catedral

estándar escalado adaptativo


estándar ((1:2)) escalado ((1:2)) adaptativo
p ((1:2))
os Multimedia

26

25
misión de Dato

24

23
R'
Transm

SNR

22

21

20

19
Catedral 899x1107 y 450x554(1:2)
( )
18
0,1 0,15 0,2 0,25 0,3 0,35 0,4 0,45 0,5
Tasa de bits
C 2007/2008
Relación del SNR de las imágenes con JPEG escalado y adaptativo frente al
a - Master IC estándar

1,1
Escalado
os Multimedia

Adaptativo
1,08
Estándar
Adaptativo / E
misión de Dato

1,06

1,04
Transm

Escalado y A

1,02
SNR' E

0,98
0,1 0,15 0,2 0,25 0,3 0,35 0,4 0,45 0,5
Tasa de bits

Вам также может понравиться