Открыть Электронные книги
Категории
Открыть Аудиокниги
Категории
Открыть Журналы
Категории
Открыть Документы
Категории
Ефимов ЦИФРОВАЯ
ОБРАБОТКА
ВИДЕОИНФОРМАЦИИ
учебное пособие
Щ-JsJ i
1шшщщт
# f
С. Н. Ефимов
ЦИФРОВАЯ ОБРАБОТКА
ВИДЕОИНФОРМАЦИИ
Москва, САЙНС-ПРЕСС,
2007
УДК 621.397
Е91
ББК 32.94
Учебное пособие
Серия:
«Радиоэлектронные средства бытового назначения»
Редакционный совет:
Смольский С. М., Румянцев К. Е., Артюшенко В. М.,
Кириллов А. В., Шелухин О. И. (председатель)
Ефимов С. Н.
Е91 Цифровая обработка видеоинформации. Учебное пособие для
вузов. - М.: САЙНС-ПРЕСС, 2007. - 272 е.: ил.
ISBN 5-88070-132-8
ISBN 5-88070-132-8
УДК 621.397
ББК 32.844
ПРЕДИСЛОВИЕ 6
Г Л А В А 1. П Е Р В И Ч Н Ы Е М Е Т О Д Ы
ЦИФРОВОЙ ОБРАБОТКИ ВИДЕОИНФОРМАЦИИ 8
1.1. Параметры аналого-цифрового преобразования
видеосигнала 8
1.1.1. Спектр видеосигнала 9
1.1.2. Структура видеосигнала монохромной системы 15
1.1.3. Структура полного цветного видеосигнала 17
1.2. Аналого-цифровое преобразование компонентного
видеосигнала 19
1.2.1. Дискретизация видеосигнала 19
1.2.2. Квантование видеосигнала 24
1.2.3. Цифровое кодирование 27
1.3. Аналого-цифровое преобразование композитного
видеосигнала 27
Г Л А В А 2. М Е Т О Д Ы С Ж А Т И Я В И Д Е О И Н Ф О Р М А Ц И И 29
2.1. Внутрикадровое кодирование 30
2.1.1. Дискретное косинусное преобразование 30
2.1.2. Вейвлет-преобразование 33
2.1.3. Групповое кодирование 39
2.1.4. Кодирование Хаффмана 41
2.2. Межкадровое кодирование 45
2.2.1. Дифференциальная импульсно-кодовая модуляция 45
2.2.2. Компенсация движения 47
2.3. Помехоустойчивое кодирование 48
Г Л А В А 3. М У Л Ь Т И М Е Д И Й Н Ы Е С Т А Н Д А Р Т Ы
СЖАТИЯ ВИДЕОДАННЫХ 59
3.1. Стандарт M-JPEG (основные этапы) 59
3.1.1. Представление цветового пространства 62
3.1.2. Субдискретизация компонентов цветности 63
3.1.3. Сегментация изображения 63
3.1.4. Дискретное косинусное преобразование 64
3.1.5. Квантование коэффициентов DCT 65
3.1.6. Кодирование 66
3.2. Семейство стандартов Н 69
3.2.1. Рекомендации Н.261 72
3.2.2. Рекомендация Н.262 79
3.2.3. Рекомендация Н.263 79
3.2.4. Иерархия алгоритмов обработки видеоинформации 80
ГЛАВА 4. С Е М Е Й С Т В О С Т А Н Д А Р Т О В MPEG 82
4.1. История развития семейства стандартов MPEG 82
4.2. Стандарт MPEG-1 84
4.3. Стандарт MPEG-2 85
4.3.1. Представление видеоданных в стандарте
MPEG-2 86
4.3.2. Устранение пространственной избыточности 91
4.3.3. Устранение временной избыточности 93
4.3.4. Профили и уровни стандарта MPEG-2 94
4.3.5. Основные типы искажений при цифровом
кодировании в стандарте MPEG-2 96
4.3.6. Системный уровень, потоки данных
и информационные таблицы стандарта MPEG-2 99
4.3.7. Принципы обеспечения синхронизации в MPEG-2 109
4.3.8. Интерфейсы для передачи потоков MPEG-2 112
4.4. Стандарт MPEG-4 114
4.4.1. Кодирование видеоинформации в стандарте
MPEG-4 116
4.4.2. Профили и уровни стандарта MPEG-4 123
4.4.3. Транспортировка потоков данных 127
4.5. Стандарт MPEG-7 129
Г Л А В А 5. Ц И Ф Р О В Ы Е С Т А Н Д А Р Т Ы
ТЕЛЕВИЗИОННОГО ВЕЩАНИЯ 136
5.1. Стандарт DVB 137
5.1.1. Основные этапы представления видеоинформации
в стандарте DVB 139
5.1.2. Стандарт DVB-T 147
5.1.3. Стандарт DVB-S 166
5.1.4. Стандарт DVB-C 168
5.2. Стандарт ATSC 172
5.2.1. Методы компрессии в стандарте ATSC 172
5.2.2. Методы модуляции в стандарте ATSC 175
5.3. Стандарт ISDB 195
5.3.1. Сервисные функции стандарта 1SDB 196
5.3.2. Параметры системы ISDB-T 202
5.3.3. Обработка данных и сигналов в системе ISDB-T 212
ГЛАВА 6. В И Д Е О И Н Т Е Р Ф Е Й С Ы 226
6.1. Цифровой параллельный интерфейс 226
6.2. Цифровой последовательный интерфейс 226
6.2.1. Мультиплексирование данных 227
6.2.2. Передача дополнительных данных 229
6.2.3. Проверка трактов последовательных цифровых
сигналов 233
ГЛАВА 7. Ц И Ф Р О В Ы Е Ф О Р М А Т Ы З А П И С И
ВИДЕОИНФОРМАЦИИ 237
7.1. Цифровые форматы магнитной видеозаписи 237
7.1.1. Формат D1 239
7.1.2. Формат D2 239
7.1.3. Формат D3 240
7.1.4. Формат D5 240
7.1.5. Формат D6 241
7.1.6. Формат Digital Betacam 241
7.1.7. Формат Betacam SX 243
7.1.8. Формат Digital-S (D9) 244
7.1.9. Формат miniDV 245
7.1.10. Формат DVCPRO (D7) 245
7.1.11. Формат DVCPRO 50 245
7.1.12. Формат DVCAM 246
7.1.13. Формат MPEG-IMX 246
7.2. Цифровые форматы оптической видеозаписи 249
7.2.1. Формат CD 250
7.2.2. Формат DVD 251
7.2.3. Технология XDCAM 256
ГЛАВА 8. О Ц Е Н К А К А Ч Е С Т В А Ц И Ф Р О В Ы Х
КОДИРОВАННЫХ ИЗОБРАЖЕНИЙ 259
8.1. Методы оценки качества видеоинформации 261
8.1.1. Субъективные измерения 261
8.1.2. Объективные измерения 263
8.1.3. Двухсторонние методы объективных измерений 263
8.1.4. Односторонние методы объективных измерений 265
8.2. Объективные методы измерения качества
видеоинформации 266
8.2.1. Среднеквадратическая ошибка 266
8.2.2. Метрики качества 268
ЛИТЕРАТУРА 271
ПРЕДИСЛОВИЕ
"с
а) б)
', = 1 / 4 = 1 / ^ 7 , , ; (1.2)
верхняя граничная частота спектра
/max=l/2r,=fc2/„/2. (1.3)
Разрешение мелких деталей по вертикали из-за дискретности рас-
тра несколько снижается, поэтому при условии равенства горизонталь-
ной и вертикальной четкостей можно несколько сократить полосу час-
тот в соответствии с положением шага развертки по вертикали (в кадре)
АЛ = Л/z , АЯор1 - оптимального размера горизонтального элемента,
равного полупериоду частоты / т а х - Д Нор ,. Отношение ДЛ/ДЯор| назы-
вают коэффициентом Кэлла.
По данным субъективных экспертиз pAh = AHopl =0,42 ... 0,65 .
Принятые в большинстве стандартов значения коэффициента Кэлла
превышают эту величину, т.е. обеспечивают запас четкости по горизон-
тали. Величину \/р можно рассматривать как формат элемента изобра-
жения. С учетом коэффициента Кэлла верхняя граничная частота спек-
тра видеосигнала
0.4)
Вывод (1.4) сделан для
идеализированной развертки.
В действительности изо-
бражение развертывается в тече-
ние не всего периода строки Т2,
а только во время прямого хода
строчной развертки (1 - а) Tz,
где а - г с г и jTz -относительная
Рис. 1.2. Активная и пассивная части
телевизионного растра длительность строчного гасяще-
го импульса (рис. 1.2).
Время aTz затрачивается на возврат луча к началу последующей
строки.
При развертке по кадру, время /ЗТг затрачивается на возврат луча
к началу следующего кадра, где /? = гкги/7"„ - относительная длитель-
ность кадрового гасящего импульса.
Телевизионным стандартом задаются число строк z и частота кад-
ров fn, которые принято называть номинальными.
В действительности длительность кадра полезно развертываемых
(активных) строк г л = ( \ - [S)z, a Pz строк будет потеряно за время
обратного хода кадровой развертки. Реальное число строк, определяю-
щее четкость по вертикали получается, таким образом, ниже номиналь-
ного. Для отечественного стандарта номинальное число строк 625,
в действительности 575 строк, так как 50 строк приходится на обратный
ход по кадру.
Изменение соотношения длительностей прямого и обратного хода
кадровой развертки сказывается только на реальной четкости по верти-
кали и не влияет на скорость развертки и, следовательно, на воспроиз-
ведение мелкой структуры изображения, т.е. не сказывается на ширине
спектра сигнала изображения. Для сохранения одинаковыми четкости
по вертикали и горизонтали последнюю можно искусственно умень-
шить сокращением полосы частот в 1/(1 - /?) раз.
Иначе обстоит дело со строчной разверткой. Желая передать номи-
нальное число элементов в строке kz и сокращая длительность развертки
строки за счет длительностей обратного хода, надо расширить спектр ТВ-
сигнала. Тогда реальное время развертки одного элемента
J max ^ /1 \ ^ '
2(1 -а)
Подставив в уравнение (1.7) значения коэффициентов 0,8,
а = 0,18 и Р = 0,08, можно получить более простую формулу
0,9х(4/3)х625 2 х50
/шах = з = 11,7 МГц.
0,9х(4/3)х625 2 х25
1
/max = у- *6 МГ
Ц•
( и
f \
f'z 1 - - (1.9)
V
г
V г x) l V J
zb
fn
Эти изменения, наряду с изменениями среднего значения яркости
объекта, составляют низкие частоты спектра видеосигнала. Они лежат в
интервале от 0 до 2 ... 3 Гц и не передаются непосредственно в видеокана-
ле, а воспроизводятся косвенным методом.
В заключение стоит отметить, что значение / т а х однозначно опре-
деляет горизонтальную четкость изображения (по строке), так как
именно ВЧ-составляющие видеосигнала определяют качество передачи
мелких деталей объекта и резкость переходов между различными уров-
нями яркости. В то же время вертикальная четкость изображения зави-
сит только от числа строк в растре.
1.1.2. Структура видеосигнала монохромной системы
На рис. 1.7 приведен простейший пример преобразования яркости переда-
ваемого изображения в электрический сигнал (видеосигнал) для объекта,
содержащего вертикальные черно-белые полосы (в левой части строки), и
для градационного клина (справа).
Рис. 1.7. Передаваемое изображение и сигнал при развертке строки
10...15%
Уровень белого
1.6 мс 20 мс
Рис. 1.9. Форма видеосигнала за период кадра
60
4:2:2:4
Рис. 1.16. Расшифровка кода, обозначающего формат дискретизации
сигнала изображения
костного сигнала равна 13,5 МГц, для цветоразностных сигналов -
6,75 МГц . В этом формате 4:2:2 существует возможность представить без
искажений сигнал яркости в полосе до 5,75 МГц, а цветоразностные сиг-
налы - в полосе до 2,75 МГц (с учетом защитного интервала между гра-
ничной частотой сигнала).
4:4:4 4:2:2
ФОФОФОФО ©ооо^ооо
еоеоеоео еоооеооо
ФОФОФОФО ©оооеооо
©оео©оео ©оооеооо
ФОФОФОФО ©оооеооо
©оеоеоео ©оооеооо
ФОФОФОФО ©ооо@ооо
еоеоео©о ©оооеооо
в) г)
^ ^ - отечет сигнала яркости Y
60 60
Рис. 1.18. Квантованная версия Рис. 1.19. Шумовая составляющая
исходного сиг нала (рис. 1.11) процесса квантования
изображения
\
коррелирован с сигналом, поэтому шум квантования не может быть устра-
нен последующей фильтрацией. Шум квантования убывает с увеличением
числа уровней квантования. Если еще несколько лет назад вполне доста-
точным казалось использовать 256 уровней для квантования видеосигнала,
то сейчас считается нормой квантовать видеосигнал на 1024 уровня.
При восьмибитном (256-и уровневом) квантовании уровню черного
сигнала яркости соответствует 16-й уровень, а номинальному уровню бело-
го - 235-й уровень квантования. Шестнадцать уровней квантования снизу и
двадцать уровней квантования сверху образуют резервные зоны на случай
выхода значений аналогового сигнала яркости за пределы номинального
диапазона. Особые назначения имеют 0- и 255-й уровни квантования. С
помощью соответствующих им кодов передаются сигналы синхронизации.
В этом случае аналого-цифровое преобразование сигнала яркости описыва-
ется соотношением
Y = 219£у +16. (1.13)
При квантовании цветоразностных сигналов также предусмотрены
резервные зоны - по 16 уровней квантования сверху и снизу. На АЦП по-
ступают не сами сигналы Е'кл и Е'вл, а компрессированные цветоразно-
стные сигналы, формируемые в соответствии с выражениями:
£cr=0,713^.y; (1.14)
£cb=0,564£b.y; (1.15)
причем значения сигналов Еск и Есв изменяются в диапазоне-0,5...0,5 В.
Аналого-цифровые преобразования цветоразностных сигналов, в ре-
зультате которых получаются цифровые цветоразностные сигналы CR и
С в , выполняются по следующим соотношениям:
CR =224£[, r +128 = 159,712£r. y +128 « 160£r_y +128 ; (1.16)
С в = 224Е'св +128 = 126,336£B.Y +128 »126£^ Y +128. (1.17)
Так как цветоразностные сигналы являются двуполярными, и мак-
симальные отклонения от нулевого значения в положительную и отри-
цательную стороны примерно одинаковы, 128-й уровень квантования
должен соответствовать нулевому значению этих сигналов. На рис. 1.20
показано соответствие между уровнями аналоговых телевизионных
сигналов и уровнями квантования для обычного тестового изображения
в виде восьми цветных полос (color bars).
В последние годы все шире применяется квантование яркостного и
цветоразностных сигналов с помощью 10-разрядных АЦП, что дает
1024 уровня квантования.
1,000 255(11111111)
0,922 2.15(11101011)
0,063 16(00010000)
0 0(00000000)
С « ,
1.000 255(11111111)
0,941 240(11110000)
0,502 128(10000000)
0.063 16(00010000)
О 0(00000000)
1,000 255(11111111)
0.941 240(11110000)
0,502 128(10000000)
0.063 16(00010000)
О 0(00000000)
800
240 [—
Г- —1
4 U L n и
ИМИ 1 I Л-4/с
Рис. 1.21. Дискретизация и квантование композитного телевизионного
видеосигнала
*- 1 Л М г
(2х+1]in (2>-И)./7г
cos ,(2.1)
1=0 у=0 ' 2N 2N
где
[1, при/',у>0.
• э о ю г о к м о
инйтшш
/•=О j=о
(2х+ \)in (2у + 1)7>
xcos cos (2.3)
2N 2N
' при / = 0;
л/лГ
C(ij) = (2.5)
2 (2у + 1)г'ж
cos при i > 0,
•Jn 2N
Lc{2k)=vl(k) +v
2
{k); (2.8)
v3 (к, п) = (2к, 2п) - Lc (2к +1,2п)+Ц. (2к, 2п +1) - Lc (2к +1,2п +1)]/4 ;
(2.12)
v'OU) v2(k,n)
у
2
Г (к,п)
а) б)
Я'=-(ЛГ-|)/2
(ЛГ-!)/2
и 2 (*,я) = £ L^(k,ri)hH (n-ri), (2.15)
л'=-(ЛГ-1)/2
Таблица 2.1
к К (*) М*)
0 1,115087052456994 0,6029490182363579
±1 0,5912717631142470 -0,2668641184428723
±2 - 0,05754352622849957 - 0,07822326652898785
±3 -0,09127176311424948 0,01686411844287495
±4 0 0,02674875741080976
±5 0 0
132 121 131 131 131 131 131 155 155 155 82 202 202 202 202
Выходной поток
••
132 121 131 ш 155 82 Щ, 202
•ш Ш
Рис. 2.8. Входной и выходной потоки RLE-кодера
3. (139, +140,), 132 4 137, (136, +138,), 129, 0 135,133 5 131 6 134,130, 7 ;
4. (139,+140,), 1324 137,(136, +138,), 129,0 (135, +133 5 ) ? 1316 134,130,7;
5. (139, +140,), 1324137, (136, +138,), 129м (135, +133 5 ), (1316 +134,\ 130,7;
%2
139 140, 132*
132, 137, 136, 138,
13! |29
20 135, '« 5 'Ч 134, 130
17
Я
3 / VА
/ <1 I "з 1
AZ_
7
X/
f
Ы 5
L32
Таблица 2.2
РВК
Варианты кодирования
10~5 Ю-8
Рида-Соломона + Витерби 6,5...7,5 8,5-9,5
Рида-Соломона + биортогональный 5...7 7-9
Рида-Соломона + короткий блоковый 4,5...5,5 6,5-7,5
Витерби 4...5,5 5-6,5
Блоковый код (жесткое решение) 3...4 4,5-5,5
Сверточный код (пороговое декодирование) 1,5-3 2,5-4,0
— >—(22/f - l ) . (2.17)
Такты
Изображение в
CR
Исходное изображение в
RGB-предстаалении
Закодированное
изображение
в формате JPEG
100110110010...
Квантование
z-сканирование
коэффициентов OCT
Дискретное
косинусное
преобразование
12 12 14 19 26 58 60 55 18 21 26 66 99 99 99 99
14 13 16 24 40 57 69 56 24 26 56 99 99 99 99 99
14 17 22 29 51 87 80 62 47 66 99 99 99 99 99 99
18 22 37 56 68 109 103 77 99 99 99 99 99 99 99 99
24 35 55 64 81 104 113 92 99 99 99 99 99 99 99 99
Разрядность, бит 8
Восстановление
коэфф.
1редыдущнй
1DCT
кадр <±>
Рис. 3.3. Схема оценки и формирования вектора движения
MPEG - это не метод цифрового сжатия как таковой; более того, опре-
делить MPEG каким-то одним термином затруднительно. MPEG - это
набор стандартных средств или точно определенных алгоритмов, кото-
рые могут комбинироваться многими способами при реализации аппа-
ратуры цифрового сжатия аудиовизуальной информации.