Академический Документы
Профессиональный Документы
Культура Документы
1.1. IMAGEM
Uma imagem nada mais é do que uma representação de uma cena real. Uma imagem
pode ser gerada de diversas formas. Alguns exemplos são: fotografias, radiografias, cinema,
televisão, etc. Entretanto, o foco deste curso reside na reprodução eficiente de imagens que
variam com o tempo, ou seja, a representação do movimento em uma cena.
(a) (b)
FIGURA 1.1 – (a) Ampliação do detalhe da imagem destacada em (b) para visualização dos pixels.
A captação de uma cena é feita por uma câmera, que possui um conjunto de lentes que
focalizam a cena sobre uma superfície foto sensível que converte o sinal óptico em impressão
química, no caso de filmes ou sinal elétrico no caso de TV. No caso de imagens para TV
existem, basicamente, dois tipos de transdutores óptico-elétricos: aqueles baseados em tubos a
vácuo tais como os Vidicons, Plumbicons e Orthicons e mais recentemente, os dispositivos de
carga acoplada ou CCD (Charge-Coupled Devices). Nos dispositivos do tipo tubo de
imagem, a superfície foto-sensível é varrida por um feixe de elétrons, ou outro método
eletrônico, de forma que um sinal óptico bi-dimensional é transformado em um sinal elétrico
1
O termo pixel é uma corruptela de picture element – picel.
1
GERALDO GIL R. GOMES NA1_VÍDEO BÁSICO
cuja amplitude varia de acordo com a intensidade de luz que excitou cada ponto da superfície
foto-sensível. Nos CCDs o sinal elétrico é lido diretamente de cada elemento de imagem foto-
sensível.
1.2. CINEMA × TV
Originalmente a televisão foi concebida para apresentar a mesma definição de um
filme de 16 mm. Na realidade, a definição de um filme de 16 mm é ligeiramente maior do que
a da TV convencional, mas a nitidez percebida é aproximadamente a mesma devido à melhor
resposta temporal da TV convencional. Para comparar o desempenho de diferentes sistemas
de apresentação de imagem, o conceito de números de linhas equivalentes é útil [1]. A Tabela
1.1 apresenta uma comparação de desempenho entre cinema e TV em termos de linhas
equivalentes.
Uma das características do olho humano é de reter por pouco tempo imagens
brilhantes. Com o passar do tempo os projetores de cinema se tornaram mais potentes e,
devido às características da persistência da visão humana, o efeito de cintilação passou a ser
percebido mais acentuadamente. Uma solução para o problema seria aumentar ainda mais a
taxa de quadros. No entanto, esta solução provocaria maior gasto de filme. A solução adotada
foi dotar os projetores de um obturador sincronizado com o avanço do filme de forma que
cada quadro fosse apresentado duas vezes, ao invés de uma. Conseqüentemente, o número de
exposições de quadros de filme foi mantido em 24 quadros por segundo, mas o número de
quadros projetados na tela passou a ser de 48 quadros por segundo. Atualmente, para os
projetores mais potentes um mesmo quadro de filme pode ser repetido até três vezes tornando
o número de quadros projetados igual a 72 quadros por segundo.
Na Europa adotou-se como padrão para TV acromática uma taxa de 25 quadros por
segundo, ou seja, ligeiramente superior à do cinema, em função da freqüência utilizada na
rede de energia elétrica que é igual a 50 Hz. Nos EUA, bem como no Brasil, a taxa de quadros
para TV acromática é igual a 30 quadros por segundo, adotado também em função da
freqüência utilizada na rede de energia elétrica que é igual a 60 Hz.
2
GERALDO GIL R. GOMES NA1_VÍDEO BÁSICO
1.3. VARREDURA
A varredura é uma forma de amostragem de um sinal bi-dimensional que varia
continuamente. A varredura permite a conversão de uma imagem bi-dimensional em uma
forma de onde unidimensional. A tela foto-sensível de um tubo é varrida linha após linha da
esquerda para a direita e de cima para baixo, conforme mostrado na Figura 1.2.
1
2
3
4
5
6
7
Note que entre a varredura de duas linhas é feito um retraço, muito mais rápido e
inativo em termos de geração de sinal elétrico. Em uma câmera de TV, a varredura é feita,
tipicamente, por um feixe de elétrons, que ao trocar cargas com a tela foto-sensível, gera uma
corrente elétrica cuja amplitude é proporcional à intensidade de luz que a excitou. Nos
sistemas que empregam varredura contínua como forma de gerar ou reproduzir uma imagem o
menor detalhe da cena que pode ser gerado ou reproduzido é definido também como pixel.
Assim, em sistemas onde o sinal elétrico gerado é um sinal que varia continuamente (sistemas
analógicos), um pixel não é necessariamente tão bem definido como aqueles apresentados na
Figura 1.1 (a), a não ser na direção vertical, onde o número de pixels é definido pelo número
de linhas de varredura.
3
GERALDO GIL R. GOMES NA1_VÍDEO BÁSICO
1
0
3
2
5
4
7
6
Campo ímpar Campo par
Enquanto a solução de varredura entrelaçada é boa para TV, o mesmo não ocorre para
monitores de computador. Os objetos de observação em monitores de computador são,
tipicamente, textos e gráficos. Para estes objetos, a varredura entrelaçada provoca
considerável desconforto para o observador em função da percepção de grandes áreas com
cintilação, da cintilação entre linhas e do efeito de arrasto de objetos em movimento. Para
evitar este problema, monitores de computadores usam varredura progressiva (ou seqüencial)
com taxas de atualização de 60 quadros/s ou maiores, como 72 quadros/s.
Algumas vezes pode ocorrer um descasamento entre uma imagem que foi produzida
originalmente para uma relação de aspecto, com o sistema que vai reproduzi-la, concebido
4
GERALDO GIL R. GOMES NA1_VÍDEO BÁSICO
com outra relação de aspecto. Para que a imagem possa ser reproduzida sem perdas, partes do
quadro não são utilizadas, conforme mostrado na Figura 1.4, onde uma imagem gerada com
relação de aspecto de 4/3 é apresentada por um sistema concebido com relação de aspecto de
16/9 e vice-versa.
L = 16/9 h
L = 4/3 h L
h h = 3/4 L h = 9/16 L
(a) (b)
FIGURA 1.4 – (a) Reprodução de uma imagem com relação de aspecto igual a 4/3 em tela com relação
de aspecto de 16/9 (b) vice-versa.
1.6. TV EM CORES
1.6.1. AS CORES
O sistema visual humano compõe uma imagem através da percepção de três
propriedades básicas da luz: brilho, matiz e saturação. O brilho está associado à intensidade
da luz. O matiz, que produz a sensação de cor, está associado ao comprimento de onda da luz.
A saturação está associada à pureza espectral da luz.
5
GERALDO GIL R. GOMES NA1_VÍDEO BÁSICO
Vermelho
Laranja
Amarelo
Luz branca
Prisma Verde
Azul
Roxo
Violeta
FIGURA 1.5 – Luz branca separada em seus principais componentes espectrais por um prisma
A cor é percebida pelo sistema visual humano por meio de foto sensores, situados na
retina do olho, chamados de cones. Existem três tipos de cones que são responsáveis pela
percepção de três cores distintas. Desta constatação originou-se a teoria tri cromática da visão
das cores, cuja implicação é que o matiz e a saturação de quase todas as cores podem ser
duplicados pela combinação apropriada de três cores primárias.
Um dos requisitos na escolha das cores primárias é que elas são independentes e suas
combinações devem permitir a reprodução da maior quantidade possível de matizes e
saturações. Existem basicamente dois tipos de cores primárias: as que são combinadas de
forma subtrativa e as que são combinadas de forma aditiva. As cores primárias subtrativas são
aquelas usadas na impressão, na fotografia e na pintura, enquanto as cores primárias aditivas
são usadas em TV em cores.
Vermelho
Amarelo Magenta
Amarelo
Branco
Azul
Verde Azul
Cyan
FIGURA 1.6 – Cores primárias do sistema aditivo de cores e suas principais combinações.
6
GERALDO GIL R. GOMES NA1_VÍDEO BÁSICO
ϕ = cv γ + b , (1.1)
TABELA 1.3 – Valores do Fator Gama para os sistemas NTSC, PAL e SECAM [1].
7
GERALDO GIL R. GOMES NA1_VÍDEO BÁSICO
EXEMPLO 1.1 – Determine o valor do sinal Y considerando que os sinais RGB gama corrigido
assumam valores iguais a 1 V.
Solução:
Y = 0,299 R'+0,587G '+0,114 B' = 0,299 + 0,587 + 0,114 = 1 V
* * *
Qualquer sistema de TV em cores, para ser compatível com o sistema acromático, deve
transmitir um sinal Y. Para qualquer sistema de TV em cores é necessário que os sinais RGB
gama corrigido sejam recuperados. Desta forma dois outros sinais são necessários para que,
juntamente com o sinal Y, os sinais RGB gama corrigido sejam recuperados. Estes sinais,
chamados de sinais de crominância podem ser denominados, genericamente, como sinais C1
e C2, da seguinte forma:
onde c11, c12, c13, c21, c22 e c23 são coeficientes numéricos. A Figura 1.7 mostra como os sinais
YC1C2 são produzidos a partir de uma câmera de TV.
R R’ Y
Tubo Conversor
G Corretor G’ R’G’B’ C1
Gama para ’
B B’ YC1C2 C2
8
GERALDO GIL R. GOMES NA1_VÍDEO BÁSICO
A operação inversa, isto é, a geração dos sinais RGB gama corrigido a partir de YUV é
feita da seguinte forma
A operação inversa, isto é, a geração dos sinais RGB gama corrigido a partir de YIQ é
feita da seguinte forma
A operação inversa, isto é, a geração dos sinais RGB gama corrigido a partir de YDrDb
é feita da seguinte forma
9
GERALDO GIL R. GOMES NA1_VÍDEO BÁSICO
EXEMPLO 1.2 – Determine os valores dos sinais de crominância para os padrões PAL, NTSC
e SECAM, supondo que os sinais RGB gama corrigido sejam iguais a 1.
Solução:
* * *
TABELA 1.4 – Número de linhas, taxa de quadro, largura de faixa e fator gama dos padrões NTSC,
PAL e SECAM [1].
10
GERALDO GIL R. GOMES NA1_VÍDEO BÁSICO
EXEMPLO 1.3 - Determine os valores dos sinais vídeo componentes YCrCb, admitindo que
os sinais RGB gama corrigido sejam iguais a 255.
Solução:
11
GERALDO GIL R. GOMES NA1_VÍDEO BÁSICO
Y Y
Cr Filtro Amostrador Quantizador Codificador Cr
Cb PCM Cb
De acordo com a Figura 1.8, os sinais componentes, na forma analógica, são entregues
à um filtro de entrada. Este bloco produz uma pré-filtragem nos sinais componentes de vídeo
de forma a limitar a largura de faixa do sinal a ser amostrado bem como limitar também a
faixa de passagem de ruído. A limitação da largura de faixa dos sinais, antes do processo de
amostragem é importante a fim de se evitar distorções por alising.
12
GERALDO GIL R. GOMES NA1_VÍDEO BÁSICO
Níveis de quantização
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
0
Intervalos de amostragem
Solução:
RSRq = 10 log(3.L2 ) = 10 log(3.16 2 )
RSRq = 28,85 dB
* * *
13
GERALDO GIL R. GOMES NA1_VÍDEO BÁSICO
(1, 1) resolução 8 × 6
(1, 8)
Pixel
Amostra Y
Amostras CrCb
(6, 1) (6, 8)
Pela mesma lógica, no formato 4:2:2, para quatro pixels dos quais amostras Y foram
tomadas, de apenas dois, alternadamente, são tomadas as amostras dos sinais Cr e Cb,
conforme mostrado na Figura 1.11.
14
GERALDO GIL R. GOMES NA1_VÍDEO BÁSICO
(1, 1) resolução 8 × 6
(1, 8)
Pixel
Amostra Y
Amostras CrCb
(6, 1) (6, 8)
(1, 1) resolução 8 × 6
(1, 8)
Pixel
Amostra Y
Amostras CrCb
(6, 1) (6, 8)
15
GERALDO GIL R. GOMES NA1_VÍDEO BÁSICO
TABELA 1.5 – Número de pixels para das taxas e formatos de amostragem da Recomendação ITU-R
BT601-5, para os padrões com 525 linhas e 30 quadros por segundo (NTSC e PAL-M).
EXEMPLO 1.5 – Determine a taxa de transmissão para os padrões de TV com 525 linhas e 30
quadros por segundo para taxas de amostragens de 13,5 MHz e 18 MHz, e
formatos de amostragem 4:2:2 e 4:4:4. Veja Tabela 1.5.
Solução:
Para a taxa de amostragem igual a 13,5 MHz e formato de amostragem 4:2:2, obtem-
se:
Rb = Rq .nb .l ( SY + SCr + SCb ) = 30 .8 .486 (720 + 360 + 360)
Rb ≅ 168 Mb/s
Para a taxa de amostragem igual a 13,5 MHz e formato de amostragem 4:4:4, obtem-
se:
16
GERALDO GIL R. GOMES NA1_VÍDEO BÁSICO
* * *
A Tabela 1.6 apresenta as taxas de transmissão para alguns tipos de imagens. Note
que, independentemente do tipo de serviço de vídeo, a necessidade de compressão torna-se
evidente.
Resolução
Serviço Taxa
(pixels × linhas × quadros/s)
Filme (USA, Japão) 480 × 480 × 24 133 Mb/s
Videofone (PSTN) 176 × 144 × 30 18 Mb/s
Videofone (ISDN) 352 × 288 × 30 73 Mb/s
ITU-R BT.601-5, 525/30, 4:2:2, 13,5 MHz 720 × 486 × 30 168 Mb/s
ITU-R BT.601-5, 525/30, 4:4:4, 13,5 MHz 720 × 486 × 30 252 Mb/s
EDTV 1280 × 720 × 30 Prob. 1.6
HDTV 1920 × 1080 × 30 Prob. 1.6
* * *
17
GERALDO GIL R. GOMES NA1_VÍDEO BÁSICO
Problemas
1.1. Determine qual é a cor transmitida quando os sinais Y, U e V assumem,
respectivamente, os valores 0,886V; -0,436V e 0,1V.
1.2. Determine os valores dos sinais Y, I e Q quando se deseja transmitir o amarelo saturado.
1.4. Determine os valores em binários das amostras quantizadas dos sinais Y, Cr, e Cb
correspondentes aos sinais R = 0,4V, G = 0,5V e B = 0,6V.
1.5. Quantos bits são necessários para representar um sinal de vídeo quantizado de forma
que a relação sinal/ruído de quantização seja igual a, pelo menos, 40 dB?
1.6. Determine a taxa de transmissão para a transmissão em EDTV e HDTV dos sinais Y, Cr
e Cb. Utilize as resoluções apresentadas na Tabela 1.6.
18