Вы находитесь на странице: 1из 9

Семейство форматов MPEG: история развития, описание

структуры, использования
История семейства форматов MPEG, к которому собственно и принадлежит
стремительно набирающий в последнее время популярность формат MPEG-4, началась в
далеком 1988 году. Именно в этом году был основан комитет Moving Pictures Expert Group,
что на русский переводится примерно как экспертная группы кинематографии (движущихся
изображений), аббревиатура которого - MPEG известна теперь любому, кто имел дело с
мультимедиа - компьютерами или с цифровым телевидением. В этом же году была начата
разработка формата MPEG-1, который в окончательном виде был выпущен в 1993 году.
Это была эпоха 286 и 386 процессоров, 4 Мб оперативной памяти и 250 Мб винчестер
считались роскошью, а не убогостью, как сейчас, Windows была примочкой для DOS, а не
наоборот, а в качестве легко переносимых носителей информации доминировали 5
дюймовые дискеты и только-только появившиеся 3,5" дискеты от фирмы SONY. В таких
условиях необходимо было найти носитель, на который можно было бы записать гигабайт
информации, при этом этот носитель должен был быть недорогим, иначе ни о какой
массовости не могло быть и речи.
И такой носитель был найден. Как раз в эти годы впервые на платформе PC появился
такой новый тип носителей информации как CD-ROM диски, которые смогли обеспечить
необходимый объем информации. Правда, на один диск фильм в формате MPEG-1 все-таки
не вмещался, но что мешало записать его на 2 CD, тем более, что новинка стоила очень
недорого? Разумеется, первые CD-ROM проигрыватели были односкоростными, поэтому не
стоит удивляться, что максимальная скорость пересылки потока данных (bitstream) в формате
MPEG-1 — 150 Кб/с.
В самом формате была заложена возможность сжатия и воспроизведения
видеоинформации с разрешением вплоть до 4095х4095 и частотой смены кадров до 60 Гц. Но
из-за того, что поток передачи данных был ограничен 150 Кб/сек., то есть так называемый
Constrained Parameters Bitstream (CPB) - зафиксированная ширина потока передачи данных,
разработчики формата, а в дальнейшем и создатели кодеков на его основе, были вынуждены
использовать разрешения кадра, оптимизированные под данный CPB. Наиболее широко
распространенными являются два таких оптимизированных формата - это формат SIF
352х240, 30 кадров в секунду и урезанный формат PAL/SECAM 352х288, 25 кадров в
секунду.
Принципы Сжатия информации в MPEG-1.
Что касается глубины цвета, то тут не все так просто, как в компьютерной графике, где
на каждый пиксел отводится определенное фиксированное число бит. MPEG-1 использует
цветовую схему YСbCr, где Y - это яркостная плоскость, Сb и Cr - плоскости цветовые. Эти
плоскости кодируются с разным разрешением. Существуют несколько вариантов
кодирования, которые можно представить с следующем виде:
Вариант Отношение разрешений Отношение разрешений
кодирования Сb/Y (Сr/Y) по горизонтали Сb/Y (Сr/Y) по вертикали
4:4:4 1:1 1:1
4:2:2 1:2 1:1
4:2:0 1:2 1:2
4:1:1 1:4 1:1
4:1:0 1:4 1:4
Как видно из таблицы Сb и Cr практически всегда кодируются с меньшим
разрешением, чем Y. Чем меньше разрешение цветовых плоскостей, тем грубее и
неестественнее цветопередача в видеоролике. Разумеется, самым некачественным, но и
самым компактным будет последний вариант.
Перед началом кодирования происходит анализ видеоинформации, выбираются
ключевые кадры, которые не будут изменяться при сжатии, а так же кадры, при кодировании
которых часть информации будет удаляться. Всего выделяется три типа кадров:
1. Кадры типа I - Intra frame. Ключевые кадры, которые сжимаются без изменений.
2. Кадры типа P - Predirected frame. При кодировании этих кадров часть информации
удаляется. При воспроизведении P кадра используется информация от предыдущих
I или P кадров.
3. Кадры типа В - Bidirectional frame. При кодировании этих кадров потери
информации еще более значительны. При воспроизведении В кадра используется
информация уже от двух предыдущих I или P кадров. Наличие В кадров в
видеоролике - тот самый фактор, благодаря которому MPEG-1 имеет высокий
коэффициент сжатия (но и не очень высокое качество).
При кодировании формируется цепочка кадров разных типов. Наиболее типичная
последовательность может выглядеть следующим образом: IBBPBBPBBIBBPBBPBB...
Соответственно очередь воспроизведения по номерам кадров будет выглядеть так: 1423765...
По окончании разбивки кадров на разные типы начинается процесс подготовки к
кодированию.
С I кадрами процесс подготовки к кодированию происходит достаточно просто - кадр
разбивается на блоки. В MPEG-1 блоки имеют размер 8х8 пикселов.
А вот для кадров типа P и B подготовка происходит гораздо сложнее. Для того, чтобы
сильнее сжать кадры указанных типов используется алгоритм предсказания движения.
В качестве входной информации алгоритм предсказания движения получает блок 8х8
пикселов текущего кадра и аналогичные блоки от предыдущих кадров (I или P типа). На
выходе данного алгоритма имеем следующую информацию о вышеуказанном блоке:
1. Вектор движения текущего блока относительно предыдущих
2. Разницу между текущим и предыдущими блоками, которая собственно и будет
подвергаться дальнейшему кодированию.
Вся избыточная информация подлежит удалению, благодаря чему и достигается столь
высокий коэффициент сжатия, невозможный при сжатии без потерь.
Но у алгоритма предсказания движения есть ограничения. Зачастую в фильмах
бывают статические сцены, в которых движения нет или оно незначительно и возникают
блоки или целые кадры, в которых невозможно использовать алгоритм предсказания
движения.
В случае же корректного срабатывания алгоритма предсказания движения, объемы
кадров разного типа в байтах соотносятся друг с другом примерно следующим образом -
I:P:B как 15:5:2. Как вы видите из данного соотношения, уменьшение объема
видеоинформации налицо уже на стадии подготовки к кодированию.
По окончании этой стадии начинается собственно само кодирование. Процесс
кодирования содержит в себе 3 стадии:
1. Discrete Cosine Transformation - DTC, дискретное преобразование косинусов,
преобразование Фурье.
2. Quantization - квантование. Перевод данных из непрерывной формы в
прерывистую, дискретную.
3. Преобразование полученных блоков данных в последовательность, то есть
преобразование из матричной формы в линейную.
При кодировании блоки пикселов или вычисленная разница между блоками
обрабатывается первым из преобразующим алгоритмов - DTC (дискретное преобразование
косинусов). Обычно пиксела в блоке и сами блоки изображения каким-то образом связаны
между собой - например однотонный фон, равномерный градиент освещения,
повторяющийся узор и т.д. Такая связь называется корреляцией. Алгоритм DTC, используя
коррелирующие эффекты, производит преобразование блоков в частотные фурье-
компоненты. При этом часть информации теряется за счет выравнивания сильно
выделяющихся участков, которые не подчиняются корреляции. После этой процедуры в
действие вступает алгоритм Quantization - квантование, который формирует Quantization
matrix. Quantization matrix - это матрица квантования, элементами которой являются
преобразованные из непрерывной в дискретную форму данные, то есть числа, которые
представляют собой значения амплитуды частотных фурье-компонентов. После
формирования quantization matrix происходит разбивка частотных коэффициентов на
конкретное число значений. Точность частотных коэффициентов фиксирована и составляет 8
бит. После квантования многие коэффициенты в матрице обнуляются. И в качестве
завершающей стадии происходит преобразование матрицы в линейную форму.
Все эти преобразования касаются только изображения. Но кроме изображения в
практически любом видеофрагменте присутствует так же и звук. Кодирование звука
осуществляется отдельным звуковым кодером. По мере развития формата MPEG, звуковые
кодеры неоднократно переделывались, становясь все эффективнее. К моменту окончательной
стандартизации формата MPEG-1 было создано три звуковых кодера этого семейства -
MPEG-1 Layer I, Layer II и Layer 3 (тот самый знаменитый MP3). Принципы кодирования
всех этих кодеков основаны на психоакустической модели, которая становилась все более и
более совершенной и достигла своего апофеоза для семейства MPEG-1 в алгоритмах Layer-3.
Синхронизация аудио- и видеоданных осуществляется с помощью специально
выделенного потока данных под названием System stream. Этот поток содержит встроенный
таймер, который работает со скоростью 90 КГц и содержит 2 слоя - системный слой с
таймером и служебной информацией для синхронизации кадров с аудиотреком и
компрессионный слой с видео- и аудиопотоками.
Под служебной информацией понимаются несколько видов меток, наиболее важными
из которых являются метки SCR (System Clock Reference) - инкремент увеличения
временного счетчика кодека и PDS (Presentation Data Stamp) - метка начала воспроизведения
видеокадра или аудиофрейма.
Качество аудиотреков в MPEG-1 может варьироваться в очень больших пределах - от
высококачественных до безобразных. Окончательно все форматы сжатия аудиоданных были
стандартизированы в 1992 году европейской комиссией по стандартам ISO.
В зависимости от используемого кодера и степени сжатия аудиоинформация
видеоролика может быть представлена в следующем виде: моно, dual mono, стерео,
интенсивное стерео (стереосигналы, чьи частоты превышают 2 КГц объединяются в моно),
m/s стерео (один канал - сумма сигналов, другой - разница) и по частоте дискретизации могут
быть: 48, 44.1и 32 КГц.
Но время шло, прогресс в области цифровых технологий шагал семимильными
шагами, и вот старичку MPEG-1 понадобилась существенная доработка, чтобы угнаться за
чудесами науки и техники. В результате возник формат MPEG-2, который является не
революционным, а скорее, эволюционным форматом, возникнув в результате переделки
MPEG-1 под нужды заказчиков.
Это сейчас формат MPEG-2 ассоциируется в первую очередь с DVD-дисками, а в 1992
году, когда стартовали работы по созданию этого формата, не существовало широко
доступных носителей, на которые можно было бы записать видеоинформацию сжатую
MPEG-2, но самое главное, компьютерная техника того времени не могла обеспечить
нужную полосу пропускания - от 2 до 9 Мбит в секунду. Зато данный канал могло обеспечить
спутниковое телевидение с новейшим по тем временам оборудованием. Такие высокие
требования к каналу вовсе не означали, что степень сжатия MPEG-2 ниже, чем у MPEG-1,
наоборот, значительно выше! А вот разрешение изображения и количество кадров в секунду
значительно больше, так как именно высокое качество при разумном битрейте и было той
основной целью, которую поставили перед комитетом MPEG заказчики.
Спустя несколько лет после начала работ, в октябре 1995 года через космический
телевизионный спутник "Pan Am Sat" было осуществлено первое 20-канальное ТВ-вещание
использующее стандарт MPEG-2. Спутник осуществлял и до сих пор осуществляет
трансляцию на территории Скандинавии, Бельгии, Нидерландов, Люксембурга, Ближнего
Востока и Африки.
В настоящее время идет широкая экспансия HDTV на Дальнем Востоке - в Японии и Китае.
Видеопотоки сжатые MPEG-2 с битрейтом 9 Мбит в секунду используются при студийной
записи и в высококачественном цифровом видеомонтаже. С появлением первых DVD-
проигрывателей, обладающих колоссальной емкостью и относительно доступной ценой,
MPEG-2, что вполне естественно был выбран в качестве основного формата компрессии
видеоданных за его высокое качество и высокую степень сжатия. Именно фильмы,
использующие MPEG-2, до сих пор являются главнейшим аргументом в пользу DVD.
MPEG-2. Что нового?
Надо сказать, разработчики MPEG-2 подошли к решению поставленной проблемы
творчески. Помимо улучшения алгоритмов компрессии видео (одна сторона) и аудио
(другая) был найден альтернативный путь уменьшения размера конечного файла прежде
ранее не использовавшийся.
Как стало известно из исследований комитета MPEG, свыше 95% видеоданных, так
или иначе, повторяются в разных кадрах, причем неоднократно. Эти данные являются
балластными или, если использовать термин, предложенный комитетом MPEG,
избыточными. Избыточные данные удаляются практически без ущерба для изображения, на
место повторяющиеся участков при воспроизведении подставляется один единственный
оригинальный фрагмент. К уже известным алгоритмам сжатия и удаления избыточной
информации, которые встречались нам в формате MPEG-1, добавился еще один, по-
видимому, наиболее эффективный. После разбивки видеопотока на фреймы, данный
алгоритм анализирует содержимое очередного фрейма на предмет повторяющихся,
избыточных данных. Составляется список оригинальных участков и таблица участков
повторяющихся. Оригиналы сохраняются, копии удаляются, а таблица повторяющихся
участков используется при декодировании сжатого видеопотока. Результатом работы
алгоритма удаления избыточной информации является превосходное высокочеткое
изображение при низком битрейте. Подобное соотношение размер/качество до появления
MPEG-2 считалось недостижимым.
Но и у этого алгоритма есть ограничения. Например, повторяющиеся фрагменты
должны быть достаточно крупными, иначе пришлось бы заводить запись в таблице
повторяющихся участков чуть ли не на каждый пиксел, что свело бы пользу от таблицы к
нулю, так как ее размер превышал бы размер фрейма. И еще оно обстоятельство делает этот
алгоритм менее эффективным - наиболее полезным и эффективным было бы применение
этого алгоритма не к отдельным фреймам, а ко всему видеоролику в целом, так как
вероятность нахождения повторяющихся участков в большом видеоучастке намного выше,
чем в отдельно взятом фрейме. Да и суммарный размер таблиц для всех фреймов намного
больше, чем возможный размер одной общей таблицы. Но, к сожалению, MPEG-2 - это
потоковый формат, который изначально предназначался для пересылки по спутниковым
каналам или по кабельным сетям, поэтому наличие фреймов обязательное условие.
Изменения в алгоритмах сжатия видеоданных по сравнению с MPEG-1.
Основные изменения коснулись алгоритмов квантования, то есть алгоритмов
преобразования непрерывных данных в дискретные. В MPEG-2 используется нелинейный
процесс дискретно-косинусного преобразования, который гораздо эффективнее
предшественника. Формат MPEG-2 предоставляет пользователям и программистам
значительно большую свободу по сравнению с MPEG-1. Так теперь стало возможным в
процессе кодирования задавать точность частотных коэффициентов матрицы квантования,
что непосредственно влияет на качество получаемого в результате сжатия изображения (и на
размер тоже). Используя MPEG-2, пользователь может задавать следующие значения
точности квантования - 8, 9, 10 и 11 бит на одно значение элемента, что делает этот формат
значительно более гибким по сравнению с MPEG-1, в котором было только одно
фиксированное значение - 8 бит на элемент.
Также стало возможным загрузить отдельную матрицу квантования (quantization
matrix) непосредственно перед каждым кадром, что позволяет добиться очень высокого
качество изображения, хоть это и довольно трудоемко. Как с помощью матрицы квантования
улучшить качество изображения? Не секрет что быстро движущиеся участки - традиционно
слабое место для семейства MPEG, в то время как статичные участки изображения
кодируются очень хорошо. Отсюда следует вывод, что нельзя статику и участки с движением
кодировать одинаково. Так как качество изображения зависит от стадии квантования, которая
во многом зависит от используемой матрицы квантования, то меняя эти матрицы для разных
участков видеоролика можно добиться улучшения качества изображения.
Из-за некоторых особенностей реализации алгоритмов предсказания движения в MPEG-2
появились некоторые ограничения на размер картинки. Теперь стало необходимо, чтобы
разрешение изображения по вертикали и горизонтали было кратно 16 в режиме покадрового
кодирование, и 32 по вертикали в режиме кодирования полей (field-encoder), где каждое поле
состоит из двух кадров. Размер фрейма увеличился до 16383*16383.
Было введено еще два соотношения цветовых плоскостей и плоскости освещенности - 4:4:4 и
4:2:2.
Помимо вышеперечисленных улучшений в формат MPEG-2 были введены еще
несколько новых нигде ранее не используемых алгоритмов компрессии видеоданных.
Наиболее важные из них - это алгоритмы под названиями Scalable Modes, Spatial scalability,
Data Partitioning, Signal to Noise Ratio (SNR) Scalability и Temporal Scalability. Несомненно,
эти алгоритмы внесли весьма важный вклад в успех MPEG-2 и заслуживают более
подробного рассмотрения.
Scalable Modes - набор алгоритмов, который позволяет определить уровень
приоритетов разных слоев видеопотока. Поток видеоданных делится на три слоя - base,
middle и high. Наиболее приоритетный на данный момент слой (например, передний план)
кодируется в большим битрейтом
Spatial scalability (пространственное масштабирование) - при использовании этого
алгоритма, базовый слой кодируется с меньшим разрешением. В дальнейшем полученная в
результате кодирования информация ислользуется в алгоритмах предсказания движения
более приоритетных слоев.
Data Partitioning (дробление данных) - этот алгоритм дробит блоки размером в 64
элемента матрицы квантования на два потока. Один поток данных, более
высокоприоритетный состоит из низкочастотных (наиболее критичные к качеству)
компонентов, другой, соответственно менее приоритетный состоит из высокочастотных
компонентов. В дальнейшем эти потоки обрабатываются по-разному. Именно поэтому в
MPEG-2 и динамические и статистические сцены смотрятся весьма неплохо, в отличие от
MPEG-1, где динамические сцены традиционно ужасны.
Signal to Noise Ratio (SNR) Scalability (масштабирование соотношения сигна/шум) -
при действии этого алгоритма разные по приоритету слои кодируются с разным качеством.
Низкоприоритетные слои более дискретизированны, более грубы, соответственно содержат
меньше данных, а высокоприоритетный слой содержит дополнительную информацию,
которая при декодировании позволяет восстановить высококачественное изображение.
Temporal Scalability (временное масштабирование) - после действия этого алгоритма
у низкоприоритетного слоя уменьшается количество ключевых блоков информации, при этом
высокоприоритетный слой, напротив содержит дополнительную информацию, которая
позволяют восстановить промежуточные кадры используя для предсказания информацию
менее приоритетного слоя
1. У всех этих алгоритмов много общего: все они работаю со слоями потока
видеоданных, использование этих алгоритмов позволяет достичь высокого сжатия
при практически незаметном ухудшении картинки. Но есть еще одно свойство
этих алгоритмов, возможно, что и не такое приятное. Использование любого из
них, делает видеоролик абсолютно несовместимым с форматом MPEG-1. Поэтому
эти алгоритмы были далеко не в каждом кодеке MPEG-2.
Уровни
назв
разре максимал качественно
ание
шение ьный битрейт е соответствие
уровня
352*24 CIF, бытовая
Low 4 Mbps
0*30 видео кассета
Mai 720*48 CCIR 601,
15 Mbps
n 0*30 студийное TV
High 1440*1 4x601,
60 Mbps
1440 152*30 бытовое HDTV
Hi-End
1920*1
High 80 Mbps видеомонтажное
080*30
оборудование
Профили
Назван
Описание
ие профиля
То же, что и профиль Main только без B -
Simple картинок. Используется в программах и в
кабельном ТВ
По сути, MPEG-1, PC, VCD-
Main
проигрыватели, приставки, CATV, спутники
Main+ Main со Spatial и SNR Scalability
Next Main+ c форматом 4:2:2
Допустимые комбинации Профилей и Уровней
Simpl N
Main Main+
e ext
4
High No No
:2:2
High Main c Spatial 4
No
1440 Scalability :2:2
90% от 4
Main Main c SNR Scalability
всех :2:2
N
Low No Main c SNR Scalability
o
Наиболее популярные стандарты.
Наз
Разрешение Комментарии
вание
VC 352*480*24
VHS
D (progressive)
SVC 544*480*30 Laserdisc (LD), D-2,
D (interlaced) Качество как у PAL
DV 704*480*30 Качество CCIR
D (interlaced) 601.Studio D-1
Изменения в алгоритмах сжатии аудиоданных формата MPEG-2.
Основное изменение - на смену многолетнему лидеру в области сжатия звука MPEG
Layer 3 пришел стандарт MPEG-2 AAC (Advanced Audio Coding), вернее целое семейство
форматов.
Из изменений касающихся форматов звука (не алгоритмов сжатия), можно назвать
новые виды частот: 16, 22.05, 24 КГц и поддержку многоканальности - теперь вместо двух
каналов, в MPEG-2 поддерживаются 5 полноценных каналов (left, center, right, left surround,
right surround) + 1 низкочастотный (subwoofer).
Объединение звука и видео в формате MPEG-2.
Системный уровень MPEG-2, отвечающий за синхронизацию видео и аудио,
обеспечивает это объединение в 2 этапа:
Первый этап называется Packetized Elementary Stream (PES) - разбивка звукокого и видео
потока на пакеты.
Второй этап может быть двух видов:
• MPEG-2 Program Stream, который полностью совместим с MPEG-1 System и
используется в основном для локальных передач (носители, сеть Internet, кабельное
телевидение).
• MPEG-2 Transport Stream - для передачи транспортных пакетов (длиной 188 либо
188+16 бит) двух типов (сжатые данные - PES - и сигнальную таблицу Program
Specific Information - PSI) через спутниковые каналы или на плохих участках сетей,
где возможно большое количество ошибок.
Пакет стандартов MPEG предусматривает также возможность перехода к телевидению
высокой четкости. Первоначально для этой цели предназначался стандарт MPEG-3. Однако
на последующих этапах работ он был объединен со стандартом MPEG-2, после чего стандарт
MPEG-3 как самостоятельный стандарт перестал использоваться.
Развитием формата MPEG-2 является MPEG-4. Все мы уже давно привыкли к звуку
MP3, а формат MPEG-4 сочетает отличный звук и максимальное уплотнение видеосигнала
(до 30-40% лучше чем у предшественника). Разница заключается в том, что кодируется
последовательность более чем из трех кадров (обычно до 250 кадров). Тем самым
достигается большее сжатие и возможность смотреть в режиме реального времени
качественное потоковое видео в интернет. Динамическое сжатие также эффективно
использует ресурсы, и на обычный компакт-диск помещается 1,5 часа видео в достаточно
хорошем качестве. Однако, в большинстве случаев, внимательный зритель сможет увидеть на
хорошем экране разницу между изображением, закодированном в MPEG2 и MPEG4.
Некоторые параметры, которые можно настроить при кодировании видео в MPEG-4
Некоторые видеокамеры позволяют записывать в формате MPEG-4 видео на
собственную карту памяти или работать как web-камера, передавая по USB кабелю видео со
звуком в формате MPEG-4.
Кроме того, современные технологии позволяют даже воспроизводить цифровое
телевидение (сжатое в формате MPEG-4 или MPEG-2) с помощью мобильных телефонов,
используя GPRS.
На сегодня, MPEG-4 - это наиболее популярный формат распространения видео в
интернете и на персональных компьютерах. Рациональное использование памяти при
хорошем качестве видео дают о себе знать. Каждая последующая версия кодека MPEG-4 (на
сегодня используются 3.хх, 4.хх и 5.хх версии) привносит всё новые и новые прогрессивные
улучшения. Большое количество бытовых плееров, КПК и прочих устройств без проблем
работают с этим форматом. MPEG-4 будет актуален еще, как минимум, лет десять, пока ему
на смену не придёт что-то принципиально новое.
MPEG 7 и MPEG 21 – форматы будущего
В октябре 1996 года группа MPEG приступила к разработке формата сжатия MPEG 7,
призванным определить универсальные механизмы описания аудио и видео информации.
Этот формат получил название Multimedia Content Description Interface. В отличие от
предыдущих форматов сжатия семейства MPEG, MPEG 7 описывает информацию,
представленную в любой форме (в том числе в аналоговой) и не зависит от среды передачи
данных. Как и его предшественники, формат сжатия MPEG 7 генерирует масштабируемую
информацию в рамках одного описания.
Формат сжатия MPEG 7 использует многоуровневую структуру описания аудио и
видео информации. На высшем уровне прописываются свойства файла, такие как название,
имя создателя, дата создания и т.д. На следующем уровне описания формат сжатия MPEG 7
указывает особенности сжимаемой аудио или видео информации – цвет, текстура, тон или
скорость. Одной из отличительных особенностей MPEG 7 является его способность к
определению типа сжимаемой информации. Если это аудио или видео файл, то он сначала
сжимается с помощью алгоритмов MPEG 1, MPEG 2, MPEG 4, а затем описывается при
помощи MPEG 7. Такая гибкость в выборе методов сжатия значительно снижает объем
информации и ускоряет процесс сжатия. Основное преимущество формата сжатия MPEG 7
над его предшественниками состоит в применении уникальных дескрипторов и схем
описания, которые, помимо всего прочего, делают возможным автоматическое выделение
информации как по общим, так и по семантическим признакам, связанным с восприятием
информации человеком. Процедура занесения в каталог и поиска данных находятся вне
сферы рассмотрения этого формата сжатия.
Разработка формата сжатия MPEG 21 - это долговременный проект, который
называется "Система мультимедийных средств" (Multimedia Framework). Над разработкой
этого формата сжатия эксперты начали работать в июне 2000 г. На первых этапах
планировалось провести расширение, унификацию и объединение форматов MPEG 4 и
MPEG 7 в единую обобщающую структуру. Подразумевалось, что она будет обеспечивать
глубокую поддержку управления правами и платежными системами, а также качеством
предоставляемых услуг.
Организация MPEG LA, объединяющая держателей патентов на элементы стандартов
сжатия звука и видео семейства MPEG, представила окончательный вариант условий
лицензирования формата MPEG-4.
Важной особенностью новых условий лицензирования является введение понятия
порога бесплатного лицензирования MPEG-4 и предела максимального объема
лицензионных отчислений. На основную часть кодировщиков и декодеров, как программных,
так и аппаратных, установлен единый размер лицензионных отчислений - 25 центов за
каждое устройство или копию программы. При этом первые 50000 единиц лицензируются
бесплатно, а верхний порог отчислений для одного юридического лица составляет 1 млн.
долл. США. Несколько более жесткие условия установлены для операторов кабельных и
спутниковых телевизионных сетей: для них лицензионные отчисления за каждое устройство
составляют 1,25 долл. без бесплатного порога и лимита общего объема отчислений.
За вещание в формате MPEG-4 через интернет и на мобильные устройства также
установлен единый размер лицензионных отчислений: 25 центов за каждого абонента или
0,0333 цента за минуту трансляции (2 цента за час). При первом варианте оплаты лицензия
на вещание первым 50000 подписчикам бесплатна, а общий объем отчислений лимитируется
все тем же миллионом долларов.
Видеозаписи в формате MPEG-4 также подлежат лицензированию. Установлены три
формы отчислений. В случае свежести контента (не старше 5 лет) размер отчислений
составляет 1 цент за каждые полные или неполные 30 минут видео, но не более 4 центов за
всю запись. Для записей старше 5 лет размер выплат вдвое меньше - 0,5 цента за каждые
полчаса, но не более 2 центов за весь фильм. В случае если длина записи не превышает 12
минут, размер отчислений составит 0,2 цента.

Использованные материалы:
1.http://www.3dnews.ru/multimedia/mpeg/print/
2.http://www.3dnews.ru/multimedia/mpeg2/print/
3.http://www.armosystems.ru/system/compression_mpeg.ahtm
4.http://net.compulenta.ru/35829/