Академический Документы
Профессиональный Документы
Культура Документы
Введение
О том, как пользоваться звуковой картой, написано множество книг и статей, в том числе и на
нашем сайте. Однако, на этот раз речь пойдет не о том, что уже и без того известно каждому
постоянному читателю раздела Мультимедиа, а о том, что называется практикой цифровой
звукозаписи. Наверняка любой владелец мультимедийного компьютера рано или поздно
приступает к этой увлекательной деятельности. Собственно, для этого (и не только) компьютер и
приобретают. Тем не менее, процесс этот не столь прост, и нужно иметь некоторый навык для
достижения максимального качества. Цель этой статьи - дать читателям сайта (и владельцам SB
Live! среди них в частности) некоторые полезные рекомендации в этой области, которые по тем
или иным причинам не освещены в прессе или Сети должным образом.
Начну с того, что в свое время передо мной встал вопрос сведения моей кассетной фонотеки в
MP3 файлы, и я вынужден был потратить не одну ночь для того, чтобы сделать процесс перегона
аудиоинформации в компьютер по возможности более качественным и более универсальным для
большинства аудиозаписей. Скажу сразу, несмотря на солидный опыт звукозаписи (и аналоговой
и цифровой), это, на первый взгляд, невинное занятие потребовало у меня мобилизации многих
сил и знаний.
Однако, пользователь приличной звуковой карты совершенно не обязан (как я) иметь высшее
радиотехническое образование, и все же, достойное качество полученной записи требовать вправе.
Считаю своим долгом дать аудитории iXBT тот самый минимум информации, который, надеюсь,
избавит многих от неприятностей, связанных с оцифровкой аудио (таких как помехи, наводки и
т.д). Полагаю, что некоторые сведения в этом материале будут полезны и опытным
пользователям. Для того чтобы не выйти за рамки приличия, скажу также, что все написанное
ниже - результат обобщения опыта многих людей, но, конечно же, не претендует на истину в
последней инстанции. Обоснованная критика от читателей - это всегда хорошо! (Свои отзывы на
статьи можно писать и в нашу конференцию О материалах сайта).
Общие замечания
Наиболее часто пользователям мультимедиа приходится оцифровывать следующие источники:
Виниловые пластинки. Здесь главное - хороший проигрыватель и предусилитель-корректор (тот,
что встраивается в дорогие усилители). Из отечественных проигрывателей порекомендую Феникс
ЭП 009С (алмазный эллипс в качестве головки, автоматический тонарм). А дальше - записываем
пластинку на компьютер, чистим от щелчков (Click Removal), фильтруем инфразвук ниже 16 Гц
(для устранения рокота) и нарезаем запись на песни. Шум лучше не удалять, так как шум в 65-70
дБ на выходе проигрывателя (или корректора) не так уж и велик. Например, 65-70 дБ выдает
аналоговый выход большинства CD-ROM и ведь ничего? А вот с фоном (неприятным
низкочастотным тоном в 50, 100, 150 и так далее Гц) лучше разобраться до оцифровки - где-то
висит земля, или перепутаны полюса внутри проигрывателя.
Микрофон. Я подразумеваю хороший микрофон и микрофонный усилитель. И про то, и про
другое можно найти массу информации в печатных изданиях, да и в Сети тоже. Дам совет только
в одном.
Дело в том, что в студийной практике применяется один очень умный принцип для
соединительных кабелей. Про витую пару сигнальных линий все уже знают, но вот как
припаивать провода на концах проводов - лишь посвященные, да и то не все.
На рисунке ниже показано, как правильно изготовить шнур, который не внесет никакого вклада в
качество записи, если он состоит из качественных проводов. В качестве экрана - медная оплетка
(желательно, чтобы везде применялась медь!). Сигнальные жилы внутри экрана - витая пара
медных многожильных проводов. Подобный кабель лучше купить в каком-нибудь магазине, где
продают профессиональные микрофоны, гитары, и т.п. (дешевле обойдется провод, чем помехи).
Стоит отметить, что только с микрофоном необходимо столь щепетильно отнестись к кабелю,
иначе будете менять микрофонные усилители и сами микрофоны до греческих календ.
1. Выравнивание АЧХ
Почти на любую стандартную кассету (TDK D, и т.д.), да и на кассеты подороже аудиозапись
попадает практически одинаково. Если у вас не TEAC за 900$ или не Nakamichi Dragon, то
разницы нет: AIWA или ВЕГА. На подобных "бюджетных" аппаратах воспроизводимый с кассеты
сигнал больше зависит от свойств магнитной ленты, нежели от тракта воспроизведения. А
магнитная лента на "железных" кассетах просто не пропустит частоты выше 14000 Гц, остальное
будет жестоко ослаблено.
АЧХ тракта запись-воспроизведение для магнитофона ВЕГА-МП122С:
Кроме того, всем известно, что АЧХ самой звуковой карты, тем более - внешнего кольца Line-Out-
Line-In тоже обладает характерным спадом в области высоких частот, и в этом обычно виновен
АЦП, нежели более-менее линейный ЦАП. Оцифровка получается тусклой, лишенной
прозрачности и воздушности в верхнем регистре. С этой проблемой желательно справиться перед
обработкой записанного материала и об этом речь пойдет ниже.
2. Владельцам SB Live!
Многие владельцы SB Live!1024 Value знают, что АЧХ кодека SigmaTel STAC9721 совсем не
идеальна и уже после 4,5 кГц начинается ступенчатый спад:
Основной вклад в это вносит АЦП кодека, в чем можно убедиться, скажем, в этой статье. Сделано
это, с одной стороны, для нашего же блага: таким образом предотвращается проникновение
паразитных гармоник в слышимую область спектра. С другой стороны, подобное "подрезание"
верхов имеет и негативное последствие: на достаточно серьезной Hi-Fi-аппаратуре этот ньюанс
может быть вполне заметен.
Поэтому, всем владельцам SB Live! НАСТОЯТЕЛЬНО рекомендую каждую записанную
фонограмму через Line-IN сначала, то есть до последующей обработки, пропустить через
следующий фильтр (тот же cool.ini и тот же раздел):
Item36=CORRECtion,3,20,0,0,83,0,532,1,793,1,1003,2,1223,4,1713,5,2046,10,2391,
12,2569,15,2710,18,3066,24,3234,27,3398,35,3480,41,3546,47,3628,56,3726,70,3825,
89,4096,100,20,0,0,83,0,532,1,793,1,1003,2,1223,4,1713,5,2046,10,2391,12,2569,15,
2710,18,3066,24,3234,27,3398,35,3480,41,3546,47,3628,56,3726,70,3825,89,4096,100,
2,0,12000,1,2,0,0,1000,100,3,-10,100,0,14,24000,1,0,0,1,48000
Кстати, номер Item должен не совпадать ни с каким другим, ну а так - любой…
После подобной операции неравномерность АЧХ в кольце LineOUT - LineIN для звуковой карты
SB Live! удалось уменьшить до +/-0,1 дБ! В этом можно убедиться, взглянув на спектрограмму
(мне это далось в свое время опять же ценой пары ночей).
АЧХ звуковой карты SBLive (кодек STAC9721) до и после частотной коррекции. Шкала графика 5
дБ!:
3. Шумоподавление
Теперь поговорим о шумоподавлении. Как я уже указал - Noise Reduction в Cool Edit - на мой
взгляд - лучший. Звукорежиссеры хвалят Arboretum Ionizer, якобы из-за того, что он избавлен от
внесения фазовых артефактов в обработанный материал (если знаете где взять - напишите!),
знакомые советуют Sonic Foundry Noise Reduction. Но мои уши пока что влюблены в CoolEdit-
овский шумодав. Кроме того, ни в каком другом нет столько настроек и опций, да и то, что он
работает медленнее (читай добросовестнее) других - тоже говорит о многом. Существует также
весьма неплохая программа реставрации DART Pro, однако детальное сравнение всех этих
программных продуктов выходит за рамки данной статьи.
Итак, после многотрудной фильтрации необходимо взять 1,5-1,6 секунд шума перед каждой (для
максималистов) или какой-нибудь средней фанерой (но только с той же кассеты и стороны, откуда
взята фонограмма). Далее:
1. 1. Сделать профиль этого 1,5 секундного шума (Get Profile from Selection) с параметрами:
Precision Factor = 12 (для максималистов - все 14, для Preview - 8). Параметр определяет точность
вычислений;
Smoothing Amount = 0 (именно 0!). Параметр вносит допуск на погрешность вычитания спектра
шума из спектра сигнала в дБ. Чем больше - тем хуже;
Transition Wide = 6 (для очень крутых аппаратов (400$) - 3, очень дешевых - 7…9). Параметр
подобен предыдущему, только более гибко управляет процессом вычитания спектра (тоже в дБ);
Noise Reduction Level = 35…42 (при Transition Wide = 6, в зависимости от уровня записи сигнала
на кассете. Если запись на ленте была точно под 0 дБ, ставьте 37). Параметр определяет уровень
порога удаляемого спектра шума. Наиболее капризный параметр. Обратно зависит от величины
Transition Wide.
Нередко приходиться повторно нормализовать фонограммы под -0,2 дБ (это стандарт для CD-
Audio), так как шумоподавление может серьезно уменьшить энергию сигнала. Все готово к MP3-
кодированию! Правда, бытует мнение, что нормализация перед сжатием в MP3 - это очень вредно,
и Вы на это должны идти лишь в случае ощутимого различия между уровнями отдельных каналов
или просто слабого (-3…-6 дБ) уровня фонограммы в конечном итоге. Это как раз тот случай,
когда решать Вам.
4. Сжатие
Лично я пользуюсь кодером Fraunhofer IIS, встроенный в BPM Studio Pro 3.0. Остальные кодеры
(ИМХО) от Fraunhofer IIS не могут преодолеть своеобразного шелеста в полученном файле,
причем на всех битрейтах. А вот к LAME -f я отношусь настороженно, этот кодер, по-моему,
только на АЧХ и хорош.
Теперь о битрейте. Честно говоря, все ньюансы сохраняются лишь при 256 Кбит/c, но и при 192
Кбит/c фонограмма почти неотличима от исходной. Для проверки того, какой битрейт наилучший
для данной фонограммы, я применяю довольно жестокую методику субъективного сравнения.
Сначала кодирую наиболее ответственный фрагмент (насыщенный высокими частотами или с
какими-нибудь знакомыми ньюансами) во все битрейты: 128, 160, 192, 224, 256. Затем
последовательно соединяю в Sound Forge оригинальный фрагмент с закодированным и слушаю.
Обычно 128 и 160 Кбит/с выпадают из рассмотрения сразу, а настоящая борьба разворачивается
между 192 и 256 Кбит/с (ну не люблю я поток в 224 Кбит/c, ибо кривой он какой-то :)).
Для отреставрированных фонограмм вполне хватает и 192 Кбит/с, но опять-таки некоторым и 256
Кбит/c подчас не хватает. Скажу также, что магнитофонные записи представляют собой весьма
непростой для кодирования материал. Как-то раз я подверг, как теперь принято говорить,
"зачистке" фонограмму с весьма посредственным качеством и закодировав потом все в 192 Кбит/c
я был потрясен услышанным! Результат звучал словно джаз на 112 Кбит/c, то есть омерзительно.
У этого феномена очень глубокая причина и я могу написать еще одну статью на эту тему, если
желаете. Так что, доверяйте технике и спектрограммам, но контрольное прослушивание устроить
не ленитесь. Тем не менее, по большей части эта информация относится к обладателям хорошего
тракта усилитель-колонки (наушники).
Заключение
Вот так, проявив стремление получить максимум из возможного, можно добиться вполне
пристойного качества записи с любого источника. Просто не нужно никогда довольствоваться
тем, чем нас снабдили производители звуковых карт, а искать, изучать и требовать Звук. Надеюсь,
вы со мной согласны, уважаемые читатели.
Игорь Бабайлов (bjcom@mail.ru)
Опубликовано - 27 декабря 2000 г.
Как качественно оцифровать звук
Часть 2
Прежде всего, позвольте мне поблагодарить всех читателей iXBT Hardware за проявленный
интерес к моей статье "Как качественно оцифровать Звук", а также за все ваши отзывы.
Затронутые в той статье вопросы о технике записи звука на PC - это лишь малая часть материала,
который может помочь тем из наших читателей, кто захочет использовать звуковую карту не
только для игр и прослушивания стянутых из Сети mp3-файлов, но и для других интересных и
увлекательных вещей. Поэтому, если вопросы по этой теме будут в дальнейшем интересны
читателям, мы будем освещать их более подробно. "За кадром" остались такие важные моменты,
как, например, техника записи вокала. А так же, пригоден ли для этого микрофонный вход на
звуковой карте, и что делать тем, кого гнездо "Mic In" никоим образом не устраивает... Тем не
менее, высказанные в статье рекомендации тоже требуют, судя по вашим многочисленным
отзывам, пояснений и уточнений.
Ниже я постараюсь ответить на наиболее типичные и часто задаваемые в переписке вопросы.
Заранее благодарю за конструктивную критику, ценные замечания и поправки. Итак, начнем.
1. В своей статье Вы написали: "…магнитная лента на "железных" кассетах просто не
пропустит частоты выше 14000 Гц, остальное будет жестоко ослаблено", тогда как
ферромагнитная лента запросто фиксирует и более высокочастотные сигналы. Как это
понимать?
Перед тем, как ответить на этот вопрос, я вкратце объясню сущность магнитной звукозаписи.
На рисунке 1 изображена схема процесса записи-воспроизведения. Упрощенно можно
представить, что участки рабочего слоя, намагниченные в одном направлении, - это магнит со
свойственным ему магнитным полем.
Рис. 1.
Упрощенно можно представить, что участки рабочего слоя, намагниченные в одном направлении,
- это магнит со свойственным ему магнитным полем.
Конечно, расположение намагниченных частиц, изображенных на рисунке, представлено очень
условно. Когда по обмотке сердечника головки записи пропускают переменный ток, сердечник
намагничивается, и создаваемое им переменное магнитное полевоздействует на рабочий слой
ленты. Участки последнего сначала намагничиваются до насыщения, а затем по мере удаления их
от зазора головки полностью размагничиваются. Так как лента плотно прилегает к рабочему
зазору головки записи, значительная часть магнитного потока головки записи проникает в
рабочий слой ленты и определенным образом ориентирует самопроизвольно намагниченные
области - магнитные домены. Как вы понимаете, число таких доменов, проходящих через рабочий
зазор головки за единицу времени, не бесконечно, а поэтому есть все основания считать даже
магнитную запись "цифровой", поскольку намагниченность домена имеет лишь два устойчивых
состояния. Другое дело, что "разрядность" и полоса рабочих частот в такой "цифровой системе"
заранее не известны из-за вмешательства многих факторов, таких как качество полива магнитной
ленты, особенности системы сердечник_зазор_лента и т.д.
Однако если руководствоваться только этими принципами, качественная запись не получится.
Открыто, что если помимо записываемого сигнала подвести к головке записи еще и
ультразвуковой переменный ток (ток подмагничивания), то удается на порядки снизить искажения
и шумы. Грубо это можно пояснить тем, что высокочастотное поле непрерывно как бы трясет
внутреннюю структуру магнитных частиц, и их "перемагничивание" низкочастотным полем
происходит точно в соответствии со значением напряженности этого поля.
При перемещении намагниченной ленты по головке воспроизведения в ее сердечник входит
основная часть изменяющегося по величине и направлению магнитного потока ленты и в обмотке
головки наводится переменная ЭДС, в соответствии с законом электромагнитной индукции. Эта
самая ЭДС - недостаточна, и поэтому требуется усилитель воспроизведения, который
индивидуален у каждой модели магнитофона, из-за различных свойств магнитных головок и
применяемых методик усиления сигнала различными производителями аппаратуры. Именно
поэтому и желательно знать особенности тракта запись-воспроизведение для аппарата, с которым
ведется работа.
Теперь о частотах.
Чем выше частота записываемого сигнала, то есть чем короче длина волны записи (где v -
скорость движения ленты и f - частота записываемого сигнала), тем меньше продольный размер
элементарного магнитного домена ( ) и, следовательно, тем сильнее размагничивающее
поле.
Таким образом, с повышением частоты записываемого сигнала и снижением скорости движения
ленты магнитный поток в рабочем слое носителя ослабевает и ЭДС, наводимая в обмотке головки
воспроизведения, уменьшается.
Вследствие этого, при скорости движения ленты 4,76 см/с крайне трудно обеспечить высокую
линейность АЧХ тракта запись-воспроизведение магнитофона в полосе более широкой, нежели
30-14000 Гц для ферромагнитной ленты (у этого типа ленты магнитные домены, грубо говоря,
самые крупные). Расширяя этот диапазон записываемых и воспроизводимых частот,
производители сталкиваются с массой проблем, связанных с низкой скоростью движения ленты,
трудоемкостью изготовления магнитных головок с весьма узким рабочим зазором (который
должен быть постоянным) и т.д. Уменьшая рабочий зазор - мы уменьшаем соотношение
сигнал/помеха. С другой стороны, при увеличении глубины коррекции в тракте записи
повышаются нелинейные искажения, вызываемые перемодуляцией ленты, увеличивая глубину
коррекции тракта воспроизведения - мы сталкиваемся с возросшим уровнем шумов. Отсюда ряд
технологических решений для выжимания честного Hi-Fi-диапазона (20-20000 Гц) из нашей
компакт-кассеты на скорости 4,76 см/с: системы динамического подмагничивания (например,
Dolby HX Pro), компандерные системы шумопонижения (Dolby B, C и т.д.), применение сложных
схем оптимизации, MPX-фильтры и многое другое. Особенно хочется упомянуть и про самую
совершенную на сегодня систему адаптивного динамического подмагничивания, разработанную
Николаем Суховым еще в 1983 г. Ну а про дорогие кассеты с двойным поливом (TDK AR) я
вообще деликатно умолчу. Не каждый может их себе позволить, да и категория продающихся
кассет с записями значительно ближе к куда более низкому ценовому диапазону.
И все же читатели правы в том смысле, что не лента является сдерживающим фактором для
широкого частотного диапазона записи, а само устройство. Но я об этом упомянул ровно абзацем
ранее. Повышая диапазон частот при записи на ферромагнитной ленте, можно еще
воспользоваться увеличением скорости движения ленты, относительно головки записи и при
помощи вращения последней, что с успехом используется в Hi-Fi-видеомагнитофонах. Надеюсь,
эта информация была полезной для читателя (несмотря на подобную наукоемкость :-)) и помогла
разобраться в смысле моей фразы, прозвучавшей в вопросе. Знать об основах магнитной записи
необходимо, хотя бы потому, что формат носителя на магнитной ленте будет существовать еще
долго (вспомним о MiniDV, Digital8, D-VHS, все носители этих форматов - лента, и все
вышесказанное относится и к ним).
2. Каким образом распаивается упомянутый в статье разъем Canon?
Поправку к моей статье прислал Дмитрий М. Климов. В письме он сообщил:
"...в разъемах Canon экран никогда не припаивается к центральному контакту, на этот контакт
идет так называемый "холодный" провод при симметричном кабеле. В случае, когда требуется
сделать переход на несимметрию, то "холодный" провод соединяется с экраном в разъеме. Но от
этого суть стандарта не меняется - экран паяется к первому контакту (а он боковой), при
этом, если внимательно посмотреть на разъем, то можно увидеть, что этот контакт чуть
выдвинут вперед к торцу разъема (я о "мамах" говорю) для того, чтобы экран законтачить
раньше сигнальных проводов при присоединении кабеля".
Абсолютно верное замечание, Дмитрий :).
Все дело в том, что я еще лет пять назад перепаял все свои XLR кабели с разъемом Canon по-
своему, (я, если честно, приверженец этого профессионального разъема), в том числе и
симметричные. К сожалению, на момент написания статьи под рукой не оказалось "заводского"
кабеля с разъемом Canon и пришлось, раскрутив свой собственный, написать именно о нем, ну а
про "честную" распайку я малость подзабыл, прошу великодушно извинить автора за эту
оплошность :-(. Но теперь истина восторжествовала и давайте разберемся раз и навсегда, что это
за зверь такой :-).
Гнездо разъема Canon (рисунок 2, а) представляет собой металлический конструктив с тремя
контактами. Как было указано, контакт №1 - это "холодный" контакт, который практически во
всех профессиональных микрофонных кабелях припаивается перемычкой к экрану в разъеме.
Видно также, что сигнальные контакты №2 и №3 несколько углублены внутрь конструкции, тогда
как №1 - действительно выдвинут чуток поближе к торцу.
а)
б)
Рис. 2. Разъем Canon
Экран в разъеме - это сама металлическая его часть, помимо контактов. На рисунке 2, б видно, что
к этому самому экрану припаян оголенный провод. При защелкивании разъема экран соединен с
экраном (металлическая часть "мамы" намертво присоединяется к металлу "папы"), и мы
добиваемся очень качественного экранирования аппаратуры (а микрофон ох как в этом
нуждается!). Про сигнальные контакты №2 и 3 беспокоиться не стоит, главное чтобы в кабеле №2
соединялся с №2, а №3, соответственно - с №3. Думаю не нужно объяснять, что качество
соединения аппаратуры, обеспечиваемое разъемом Canon - очень высокого уровня.
3. Я попытался найти в файле cool.ini раздел [Filters96] и не нашел! Может это зависит от
программы? У меня стоит Cool Edit Pro 1.1
Раздел [Filters96] в cool.ini версии Cool Edit Pro 1.1 и вправду отсутствует. Простите, не додумал :(.
Однако есть довольно простой рецепт. Необходимо сделать следующую последовательность
действий:
Открываем Cool Edit Pro 1.1 и какой-нибудь *.wav.
Открываем FFT-фильтр (он ведь есть в любой версии Cool Edit Pro, не так ли?).
Делаем какую-нибудь загогулину в окне графа. Сохраняем данный пресет (Add Preset) под
ОЧЕНЬ оригинальным именем (скажем, "!!!!!!!!!!!").
Теперь в cool.ini ищем это ОЧЕНЬ оригинальное имя, например в редакторе FAR нажмите F7.
Нашли? А что за раздел? [****]? Замечательно! Именно сюда заливаем содержимое строчки.
Наслаждаемся :)
Подобные махинации частенько помогают. Кстати, в Cool Edit 2000 раздел [Filters96] имеется. В
Cool Edit Pro 1.2 по сравнению с версией 1.1 увеличена скорость просчета большинства эффектов
на 30…300%, появилась кнопка Preview для многих из них. Да и стабильность повыше. Не стоит
этим пренебрегать.
Хочу сразу же предостеречь читателя от неправильного использования FFT-фильтра, которое
может повлечь за собой ощутимое искажение сигнала.
а)
б)
Рис. 5. Масштабированное представление фрагмента записи контрабаса:
а - эталонный фрагмент DAT-качества (16 бит, 48 кГц);
б - тот же фрагмент, после перезаписи на магнитофон.
Невооруженным глазом заметна разница в представленных осциллограммах. Видно, что гладкая
волна превратилась в хаотичное приближение к оригиналу. Заметим, что в данном случае в Sound
Forge делалось максимальное масштабирование по горизонтали (пиксел = выборка), а по
вертикали раза в четыре. То есть, налицо модуляция первоначальной низкочастотной волны
случайными гармониками. Так что, кодировать аналоговый звук - это задача не из легких. Кроме
того, с выходом кодека Ogg Vorbis beta 3, автор перешел с формата mp3 на формат ogg. Этот
новый формат превосходно сохраняет детальность и высокочастотные нюансы после
кодирования, что так необходимо для сжатия оцифрованных аналоговых фонограмм. Уже с
потоком 192 кбит/с получаются вполне приемлемые результаты. Жду, не дождусь официальной
версии.
6. Чем лучше всего отрезать инфразвук после оцифровки фонограмм с виниловых дисков?
На низких частотах вполне сгодится, скажем, Transform/Scientific Filter из редактора Cool Edit Pro.
Тип - Чебышевский (Chebychev 1), High Pass, Order - не более 18 (фазу можно сильно
перекорежить), CutOff - частота, с которой подрезаем инфраниз (см. иллюстрацию).