Академический Документы
Профессиональный Документы
Культура Документы
Vídeo
Motivação:
Para que compressão?
Um vídeo é uma sequência de quadros (frames)
Em boa qualidade, um vídeo tem 30 fps
Se cada frame corresponde a uma imagem de
640x480 pixels, com 24 bits/pixel, precisaríamos de
27MB para cada segundo de vídeo
CÓDIGO
SINGULAR NÃO-SINGULAR
2-1+2-2+2-2=1
q
L= Pi*Li
i=1
COMPRIMENTO DO ARQUIVO
C= ORIGINAL
COMPRIMENTO DO ARQUIVO
COMPACTADO
Terry Welch
armazenamento de imagens
INICIALIZA DICIONÁRIO
[Prefixo] <- 0
C RECEBE O PRÓXIMO SÍMBOLO NO CÓDIGO
[Prefixo]C ESTÁ NO DICIONÁRIO?
SIM: [Prefixo] RECEBE [Prefixo]C E VOLTA A (3)
NÃO:
[Prefixo]C É ACRESCENTADO AO DICIONÁRIO
SAÍDA RECEBE CÓDIGO DE [Prefixo]
[Prefixo] <- C E VOLTA A (3)
Dicionário básico:
X = #0
Y = #1
Z = #2
W = #3
Entrada do codificador:
XYXZXYXW
Codificação Final
#0#1#0#2#4#0#3
Dicionário
X = #0 Y = #1
Z = #2 W = #3
XY = #4 YX = #5
XZ = #6 ZX = #7
XYX = #8 XW = #9
Decodificação
#0#1#0#2#4#0#3
Dicionário Básico
X = #0 Y = #1
Z = #2 W = #3
Redundância
Espacial
Redundância
Temporal
Padrão de Cores
RGB comum para imagens
MPEG usa o YCbCr
Mais apropriado para percepção do sistema visual
humano
RGB -> YCbCr
Y = 0,299R + 0,587G + 0,114B
Cb = -0,1687R – 0,3313G + 0,5B + 128
Cr = 0,5R -0,4187G -0,0813B + 128
(120; 60; 30)RGB -> (74,52; 102,88; 160,44)YCbCr
I B B P B B P …
Mudou…
Avaliação de codificação
Packet loss
Avaliação de rede
Imparidade temporal
Para um vídeo contínuo, difícil de avaliar, pois
pode ser um vídeo sem movimento
Qualidade visual
Avaliação de codificação
Qualidade visual
Full Reference
Reduced Reference
No Reference
Avaliação de codificação
No Reference
BLIINDS
VIIDEO
Difíceis de desenvolver (modelam a percepção
humana)
Geram uma estimativa de qualidade
Muitas aplicações
Avaliação de codificação
Full Reference
SSIM (e variações) – Structure Similarity Index
Original
JPG 80%
Carlos Alexandre Mello – cabm@cin.ufpe.br 56
O que é Qualidade?
Pior ainda!! Está imagem é de boa
qualidade??
Qualidade x Fidelidade
Erro = -2 Erro = 2
Diferença
Alto MSE !!
Problemas
4:4:4
4:2:2
4:2:0
Janela de
Silêncio
Semelhante ao Run-Length
Usado em arquivos VOC
Silêncio é definido como a amplitude da forma
de onda que não ultrapassa a janela de silêncio
Uma extensão de silêncio menor que a janela é
considerada muito curta para merecer a conversão
para bloco de silêncio
Problema: 1) Os blocos de silêncio não existem
na maioria dos sons gravados
Mascaramento em frequência e
mascaramento temporal
O mascaramento em frequência depende da
frequência em que o sinal se encontra,
podendo variar de 100 Hz a 4 KHz
Em função deste comportamento, o que o
método de compressão do MP3 faz é
identificar casos de mascaramento em
frequência e descartar sinais que não serão
audíveis devido a este fenômeno
Referências:
The Essential Guide to Video Processing,
A.C.Bovik, Academic Press, 2009
A Practical Guide to Video and Audio
Compression, C.Wootton, Focal Press, 2005
Introduction to Information Theory and Data
Compression, D.Hankersson, CRC Press, 2003