Реставрация фонограмм

Евгений Музыченко

Cool Edit 2000

Стремительное распространение и удешевление цифровых проигрывателей звука и используемых в них носителей, а также сжатых звуковых форматов (прежде всего — MP3) поставило многих любителей музыки перед дилеммой. С одной стороны, практически у каждого есть множество старых кассет, катушек и винилитовых пластинок. Состояние этих носителей с течением времени ухудшается, что, разумеется, отражается на качестве их звучания, и поэтому возникает желание «увековечить» эти фонограммы в цифре. Но с другой стороны, записи, которые вроде бы неплохо звучат при воспроизведении с катушечного магнитофона среднего класса или с китайского «бумбокса», при прослушивании с компакт-диска или файла MP3, начинают заметно резать слух очень «шершавым» звучанием, особенно по сравнению с «родной» CD-музыкой и сделанными из нее MP3-файлами.

Автор этой статьи сам год назад порывался перенести катушечную и винилитовую фонотеку на CD, но быстро понял, что слушать на компакт-диске музыку, переписанную со старых лент и пластинок со всеми шумами, тресками и шорохами, довольно неприятно. В то же время многие старые записи, существовавшие исключительно на магнитной ленте и пластинках, успешно были изданы на CD, и мало кто замечает в звучании этих дисков характерные шумы и призвуки¹. Такие фонограммы перед выпуском были отреставрированы — очищены от посторонних шумов, рокота, щелчков и подвергнуты частотной коррекции. Конечно, если прислушаться внимательно, то нетрудно заметить следы реставрации: в каком месте начинает работать фильтр, убирающий шипение в паузе или в тихом фрагменте, где остались следы от щелчков, и т.д. Однако для непритязательного (так называемого среднего) слушателя получается вполне привычный цифровой звук — чистая музыка, рождающаяся из тишины.

Для реставрации фонограмм со студийным качеством необходимы мощный компьютер², совершенное программное обеспечение с предельно точными алгоритмами обработки звука и ко всему этому — квалифицированный и опытный звукоинженер. Однако для получения весьма приличного качества на уровне стандартной бытовой техники вполне достаточно среднего компьютера и базовых знаний о свойствах звука и методах его обработки. При этом мощность компьютера влияет только на скорость работы с фонограммой: 386-й процессор справится с работой ничуть не хуже Pentium III, но затратит на аналогичную операцию в десятки раз большее время.

Я намеренно не касаюсь здесь традиционного камня преткновения — феномена цифрового звучания. Хочу еще раз подчеркнуть, что эта статья предназначена для тех, кто не замечает на слух ухудшения звучания фонограммы после оцифровки и кому компактность и долговечность записей вкупе с удобством пользования важнее незначительной потери «аналоговости»³ звука.

Аппаратура

Работу со звуком необходимо начинать с грамотного выбора аппаратуры, в данном случае — звукового адаптера (карты). Посмотрев на характеристики любой, даже самой дешевой, звуковой карты, можно подумать, что все они обеспечивают «CD-качество». Однако даже после непродолжительного сравнения на слух становится ясно, что это не так.

При взгляде на простейшие карты сразу видно, что большинство деталей, для которых предусмотрены посадочные места, на печатной плате даже не установлены. А ведь в их числе обычно находятся фильтрующие и сглаживающие цепи, которые снижают уровень шумов и помех, вносимых в проходящий через карту звуковой сигнал. Если для речевых переговоров по сети такая карта вполне годится, то при записи с магнитофона она может внести в звук едва ли не больше помех, чем их было на самой ленте. Поэтому, выбирая карту, прежде всего оцените чистоту записываемого звука: если в переписанном с магнитофона или пластинки звуке вы не можете отчетливо различить шумы и наводки самой звуковой карты, то такой вариант можно признать вполне приемлемым.

Из современных недорогих, но приличных звуковых карт можно рекомендовать Sound Blaster Live!, Aureal Vortex, Crystal, Diamond, Yamaha, Guillemot. К картам на микросхемах ESS следует относиться с осторожностью, поскольку они традиционно занимают самую дешевую нишу на рынке.

Программное обеспечение

Даже самая хорошая звуковая карта позволяет лишь перенести звук с аналогового носителя в цифровой файл на винчестере компьютера без потерь и дополнительных искажений. Собственно реставрация выполняется при помощи программ — как общего назначения, так и специальных. Сейчас на программном рынке представлено множество различных программ для обработки и реставрации звука. Я опишу несколько наиболее известных и популярных из них.

Cool Edit 2000

Разработчик: Syntrillium Software (http://www.syntrillium.com/)

Cool Edit — универсальный звуковой редактор, предназначенный для записи, монтажа и обработки звука. В области борьбы с шумами и помехами он известен тем, что здесь впервые был реализован алгоритм фильтрации звука по профилю — статистической кривой, вычисленной по образцу. В качестве образца обычно выбирается фрагмент паузы, где звучит только шум⁴. Вычисленный таким образом профиль будет представлять собой распределение энергии шумов по всему диапазону частот. Затем вся фонограмма подается на фильтр, управляемый полученным профилем, в результате чего фильтр максимально ослабляет те области частот, в которых локализованы максимумы шума, практически не затрагивая остальных областей.

Описанный метод позволяет очень аккуратно убирать из фонограммы низкочастотные звуки, порожденные механической системой магнитофона или проигрывателя, высокочастотные свисты из-за паразитной модуляции, шипение (так называемый хаотичный шум) с невысоким уровнем. При относительно высоком уровне хаотичного шума в фонограмме этот метод ведет к заметному ослаблению соответствующей частотной области полезного сигнала, отчего звучание фонограммы становится более глухим, «тупым».

Окно профильного шумоподавителя вызывается из меню Transform —> Noise Reduction. Порядок действий следующий: выделить как можно больший участок паузы фонограммы, открыть шумоподавитель и кнопкой Get Profile from Selection сформировать профиль шума. Затем закрыть окно с помощью кнопки Close, выделить фрагмент, подлежащий фильтрации, снова открыть шумоподавитель, при необходимости скорректировать его параметры и выполнить операцию, нажав OK.

Параметры шумоподавителя:

Noise Reduction Level — глубина, или степень фильтрации, фрагмента. При увеличении его значения производится более глубокая фильтрация, однако при этом могут быть заметно ослаблены и некоторые компоненты полезного сигнала.
FFT Size (размер преобразования Фурье) — двукратное количество частотных полос в обрабатываемом сигнале. Чем больше это значение, тем выше точность фильтрации, однако при этом увеличивается и необходимая продолжительность образца для построения профиля.
Smoothing Amount — степень сглаживания сигнала между частотными полосами.
Transition Width — разность между уровнем чистого шума в полосе и уровнем сигнала, на котором сигнал полностью подавляется. Иначе говоря, нулевое значение параметра означает, что сигнал с уровнем, равным уровню шума в данной полосе, подавляется полностью; значение в 10 дБ означает подавление и сигналов с большим уровнем, вплоть до +10 дБ к уровню шума, а –10 дБ — вплоть до уровней, на 10 дБ меньших. Увеличение значения этого параметра вызывает подавление сигнала с большим уровнем относительно уровня шума.
Cool Edit Pro содержит также простой подавитель тихого фонового шума (шипения, фона) Hiss Reduction, работающий по принципу полного удаления сигнала ниже заданного уровня. Он годится лишь для подавления шума в паузах, поскольку полезный сигнал с уровнем выше заданного в настройках не затрагивается. В достаточно тихих, но превышающих пороговый уровень фрагментах шум отчетливо слышен, зато не страдают высокочастотные составляющие полезного сигнала, как это происходит в алгоритме фильтрации по профилю.

ClickFix

Разработчик: Jeffery Klein (http://www.jdklein.com/)

Добавочный модуль (plug-in) для редакторов Cool Edit 2000/Pro. При установке пункт вызова ClickFix добавляется в меню Noise Reduction, рядом с описанным выше режимом Cool Edit. Модуль предназначен для подавления импульсных помех типа щелчков/тресков, характерных для грампластинок, и поддерживает 8-, 16- и 32-разрядные звуковые данные.

Принцип работы модуля состоит в поиске кратковременных и резких всплесков амплитуды звука, имеющих характерные признаки импульсных помех. При обнаружении такого всплеска берется группа предшествующих/последующих отсчетов и «вклеивается» на место помехи с последующим сглаживанием мест стыка. ClickFix не выполняет классической фильтрации или преобразования Фурье, пользуясь лишь арифметическими амплитудными преобразованиями волны.

Параметры модуля:

Passes — количество проходов по каждому звуковому блоку (модуль обрабатывает звук небольшими блоками). Дополнительные проходы позволяют обнаружить близко расположенные помехи, которые при одиночном проходе не обнаруживаются из-за защитного интервала детектора. Дополнительные проходы выполняются только в том случае, если в блоке был обнаружен хотя бы один щелчок. Таким образом, задание параметра с запасом не приведет к многократному увеличению времени на обработку.
Sensitivity — чувствительность при поиске помех. При больших значениях избирательность модуля снижается, и помехами считаются минимально похожие на них всплески, так что есть риск принять за помеху «честный» акустический всплеск. При снижении значения избирательность повышается и обрабатываются лишь наиболее заметные помехи.
Lowest Meaningful Frequency — низшая частота, присутствующая в полезном сигнале, обычно от 20 до 40 Гц. Этот параметр влияет только на процесс статистического анализа фонограммы.
Threshold — пороговое значение обнаружения помехи (ее уровень относительно 0 дБ). Снижение порога позволяет обнаруживать более тихие и мелкие помехи, но делает процесс поиска более длительным.
Maximum Click Width — максимальная длительность помехи в микросекундах. Увеличение параметра повышает вероятность обнаружения помех, но при этом возможно принять за помехи короткие ударные звуки.
Margin Size — размер участка «неиспорченного» сигнала вокруг помехи, включаемого в процедуру подавления. Значение выбирается исходя из качественного подавления помехи, при котором еще незаметно искажение полезного сигнала рядом с ней.
Musical Transient Rejection — безразмерный параметр, задающий степень сохранения незатронутых помехами звуков с резкой атакой, по своему характеру похожих на помехи (например, звуков ударных инструментов). Увеличение параметра заставляет детектор исключать из обработки больше импульсов, похожих на музыкальные звуки, и наоборот. Для достижения наилучшего эффекта рекомендуется регулировать этот параметр вместе с чувствительностью.
Blend Size — размер предшествующего и следующего за помехой участка сигнала, который будет «вклеиваться» вместо помехи. Чрезмерное увеличение значения вызывает эффект «заедания» из-за слышимого повторения участков звука.
Keep Only Clicks — «обратный» режим, который удаляет полезный сигнал и оставляет только обнаруженные помехи. Позволяет настраивать параметры модуля на слух, добиваясь обнаружения максимального количества помех. Удобен также при настройке исключаемых музыкальных звуков: если после работы в этом режиме не осталось явно музыкальных звуков, то параметр настроен верно.

Как и все добавочные модули, ClickFix имеет режим контрольного прослушивания (Preview), позволяющий быстро подобрать параметры на слух и обеспечивающий возможность создания, модификации и загрузки наборов параметров (пресетов).

Для ручного удаления импульсных помех, которые ClickFix не сумел корректно обнаружить и исправить, применяется операция Force Fix. Перед ее применением необходимо выделить участок помехи, захватив несколько незатронутых помехой отсчетов слева и справа (это удобнее всего делать, растянув осциллограмму кнопками Zoom). Длительность выделенного участка не должна превышать 0,1 с, а количество незатронутых помехой отсчетов не должно быть меньше значения параметра Blend Size (операция использует значение только этого параметра).

Этот модуль рекомендуется применять до общего шумоподавления, пока все помехи присутствуют в первозданном виде. Любой обычный шумоподавитель сгладит их, чем затруднит их обнаружение детектором ClickFix.

Restoration-NR

Разработчик: Arboretum (http://www.arboretum.com/)

Arboretum — известный производитель программных средств высококачественной обработки звука, признанных в среде профессиональных звукоинженеров. Restoration-NR — подключаемый модуль (plug-in) стандарта DirectX. Модули этого стандарта могут использоваться внутри многих популярных звуковых программ: Cool Edit Pro, Sound Forge, WaveLab, Cubase, Cakewalk и т.п. Работает по принципу простой динамической фильтрации, а также фильтрации по профилю.

Параметры модуля:

Threshold — смещение порога обнаружения шума, вычисленного модулем. Нулевое значение соответствует применению вычисленного значения данного параметра; положительные/отрицательные значения смещают этот порог вверх (меньшая чувствительность) и вниз (большая чувствительность).
Attenuation — степень ослабления шума, измеряемая в децибелах (дБ).
Hi Cutoff, Hi Boost — начальная частота и степень усиления высокочастотных составляющих сигнала после операции. Поскольку подавление шума выполняется путем выборочной фильтрации, при этом часто страдает высокочастотная часть спектра полезного сигнала. Модуль может усиливать частоты, лежащие выше значения Hi Cutoff, возвращая им амплитуду, близкую к исходной. Значение параметров подбирается экспериментально.
Hi Res — режим высокого разрешения (4096 частотных полос). По умолчанию модуль работает с разрешением 512 полос.
Guess — режим автоматического анализа сигнала для получения профиля шума. После активизации режима нужно воспроизвести фрагмент сигнала, при этом модуль вычислит по нему профиль шума. Полученный профиль можно сохранить посредством кнопки Save, а также загрузить впоследствии, нажав на кнопку Load.
Learn — режим автоматического формирования профиля из чистого шума. Необходимо выделить участок, не содержащий полезного сигнала, активизировать режим, затем воспроизвести сигнал, и в результате будет сформирован профиль.
Output — регуляторы выходного уровня обработанного сигнала. Режим Lock жестко связывает регуляторы левого и правого каналов.

Модуль поддерживает добавляемые/изменяемые пресеты. В демонстрационной версии в обрабатываемый звук вставляются паузы через каждые 10 секунд.

Надо сказать, что я не заметил никаких изменений при активизации режимов Guess и Learn. В описании модуля сказано, что воспроизводить сигнал нужно операцией Play, в то время как в модуле имеется лишь Preview. Возможно, эффективность «обучаемости» этого модуля хуже, чем встроенного в Cool Edit, ибо сколько-нибудь ощутимого снижения шума при установках по умолчанию не наблюдается.

DC-Art32, DC-Live

Разработчик: Diamond Cut Productions (http://www.enhancedaudio.com/)

Программы серии Diamond Cut обладают богатым набором средств анализа и обработки звукового сигнала и ведут свою родословную от первого популярного пакета для реставрации фонограмм — DART (Digital Audio Restoration Tool). Этот звуковой редактор/процессор ориентирован главным образом на подготовку фонограмм к изданию на компакт-дисках. Версия Live отличается от базовой наличием режима обработки сигнала, приходящего со звукового порта, в реальном времени с одновременным выводом результата в другой звуковой порт. Иначе говоря, DC-Live может использоваться в качестве многофункционального звукового процессора реального времени, при условии что компьютер имеет достаточную для этого мощность. Поддерживаются разрядность отсчетов до 24 бит и частоты дискретизации до 48 кГц.

В отличие от классических звуковых редакторов/процессоров, работающих по предложенной Microsoft документоориентированной концепции, что подразумевает разрушающую обработку (то есть сохранение результата непосредственно на месте оригинала), процессоры серии DART/DC оперируют понятиями «исходный файл» (source) и «результирующий файл» (destination). Исходный файл никогда не затрагивается операциями обработки, а все результаты сохраняются только в результирующем файле. При этом риск испортить оригинал сводится только к вероятности указать его же в качестве файла назначения (почему-то подобные ошибки в описываемых программах не отслеживаются). В главном окне отображаются осциллограммы обоих файлов.

Помимо богатого набора различных фильтров общего назначения, которые мы здесь рассматривать не будем, серия DC имеет специализированные фильтры — непрерывного и динамического шума, а также подавления импульсных помех и гармоник.

Непрерывный (continuous) фильтр, работающий по рассмотренному выше принципу построения шумового профиля (он называется так потому, что в каждой из частотных полос выполняется независимая фильтрация), имеет следующие параметры:

Attack — время отключения фильтра (в миллисекундах) при падении уровня сигнала в полосе ниже критического (считается, что при этом в полосе остается только шум). Позволяет регулировать так называемую остроту фильтрации, частично сохраняя кратковременные высокочастотные звуки ценой отказа от подавления шума в них.
Release — время включения фильтра после превышения критического уровня сигнала в полосе (считается, что появился полезный сигнал). Имеет такое же значение, что и параметр Attack.
Attenuation — степень ослабления сигнала с уровнем ниже критического (то есть чистого шума). Увеличение значения приводит к более глубокому подавлению, но увеличивает риск затронуть полезные компоненты сигнала.
Sample Noise — построение шумового профиля по образцу. Рекомендуется выбирать в качестве образца участок паузы в фонограмме.
Shift Threshold — перемещение линии критического (порогового) уровня вверх/вниз, служащее дополнительным средством регулировки чувствительности фильтра. Линию уровня можно также сдвигать при помощи мыши. Параллельная красная линия соответствует АЧХ фильтра.

Динамический (dynamic) фильтр шума аналогичен обычному аналоговому динамическому шумоподавителю, срезающему верхние частоты сигнала при падении уровня ниже критического, и позволяет управлять следующими параметрами:

Noise Threshold — безразмерное значение порогового уровня высокочастотных составляющих сигнала, ниже которого включается их ослабление.
Filter Freq — граничная частота, выше которой действует фильтр.
Attack Time, Release Time — время отключения и включения фильтра, определяющее время задержки перед его включением и отключением при соответственном изменении уровня сигнала.
Gain — уровень исходного сигнала, «подмешиваемый» в выходной сигнал фильтра. Позволяет в какой-то степени спасти вычищенные фильтром высокочастотные составляющие полезного сигнала.
Enhancer Mode — режим дополнительного усиления (расширения динамического диапазона) частотных составляющих, лежащих выше частоты среза и с уровнем выше критического. Дает возможность несколько улучшить результирующее звучание.

Фильтр импульсных (impulse) помех работает подобно описанному модулю ClickFix. Настраиваемые параметры:

Threshold — порог обнаружения импульсной помехи (щелчка) в единицах амплитуды (значениях отсчетов), на которую изменяется сигнал в соседних отсчетах.
Size — количество отсчетов, на протяжении которых должна сохраняться заданная параметром Threshold скорость изменения амплитуды. Позволяет различать высокочастотные и низкочастотные щелчки.
Tracking — уровень высокочастотных составляющих сигнала для коррекции порогового значения. При наличии вблизи найденного быстрого изменения амплитуды повышенного уровня высоких частот логично предположить, что это не щелчок, а звук ударного инструмента. Параметр позволяет пропорционально увеличивать уровень порога с ростом энергии высокочастотных составляющих в анализируемом коротком отрезке звука.
Recording Type — параметры для оптимизации обработки различных типов записей: 78 — шеллачные грампластинки со скоростью вращения 78 об./мин, Vinyl LP — винилитовые пластинки на 33 и 45 об./мин, HQ Mode — улучшенный алгоритм поиска помех, применимый к любому виду фонограмм.

Подавитель гармоник (harmonic reject) позволяет удалять из фонограммы призвуки, имеющие гармоническую структуру (например, сетевой фон несинусоидальной формы). Основные настройки этого фильтра:

Frequency — частота основного тона подавляемого сигнала.
Attenuation — степень ослабления основного тона и его гармоник.
Filter Harmonics — вид подавляемых гармоник (Even — четные, Odd — нечетные).

Непрерывный и гармонический фильтры имеют параметр Keep Residue, инвертирующий работу фильтра. В результирующем сигнале остаются только обнаруженные помехи, полезный же сигнал подавляется. Это позволяет гораздо точнее настроить параметры фильтра, чтобы затем провести обработку в обычном порядке.

Все имеющиеся в распоряжении фильтры могут быть объединены в линейку в режиме Multi-Filter.

При помощи мыши фильтры перетаскиваются из общего набора в линейку, сортируются в линейке или удаляются оттуда. Двойной щелчок на иконке фильтра в линейке открывает окно параметров. Всего в линейке может быть до 10 фильтров. Если позволяет мощность компьютера, линейка может быть применена для обработки сигнала в DC-Live в режиме реального времени.

Программы серии DC содержат интересный модуль — имитатор лампового усилителя (Virtual Valve Amplifier), добавляющий к сигналу синтезированные гармоники для достижения «лампового эффекта». Дополнительные режимы этого модуля позволяют использовать его в качестве иксайтера — преобразователя, придающего «теплое» звучание на основе психоакустических зависимостей. Управление модулем осуществляется при помощи следующих параметров:

Drive — количество синтезируемых гармоник.
Operating Point — положение рабочей точки (начальное смещение) на вольт-амперной характеристике лампы. Приближение рабочей точки к крайним значениям вызывает ограничение сигнала, вызывающее появление гармоник. В режиме эксайтера регулятор задает набор гармоник более конкретно: при значении 100 генерируются все гармоники, при значении –100 — только первые 3-4 четные гармоники.
Detail — степень детализации эффекта (чувствительность гармонайзера).
Mix — соотношение между исходным (dry) и обработанным (wet) сигналами на выходе обработчика.
Range — распределение гармоник по интенсивности (узкий/широкий спектр).
Advanced Controls — включение/отключение дополнительных органов управления.
Tube Type/Configuration — тип имитируемой лампы или режим работы эксайтера.

Заключение

Описание всех рассмотренных в статье программ и их возможностей носит скорее эмпирический, чем алгоритмический характер. По этой причине я намеренно не привожу здесь подробных инструкций по применению того или иного средства обработки, ограничившись описанием принципов действия и назначения каждого из параметров. Конкретные настройки в значительной степени зависят как от вида звукового материала, так и от индивидуальных вкусов слушателя. В любом случае, рекомендуется начинать обработку со значений по умолчанию и использовать имеющиеся пресеты, а уже после появления некоторого опыта можно начинать осознанно изменять нужные параметры обработки.

КомпьютерПресс 11'2001

1999	1	2	3	4	5	6	7	8	9	10	11	12
2000	1	2	3	4	5	6	7	8	9	10	11	12
2001	1	2	3	4	5	6	7	8	9	10	11	12
2002	1	2	3	4	5	6	7	8	9	10	11	12
2003	1	2	3	4	5	6	7	8	9	10	11	12
2004	1	2	3	4	5	6	7	8	9	10	11	12
2005	1	2	3	4	5	6	7	8	9	10	11	12
2006	1	2	3	4	5	6	7	8	9	10	11	12
2007	1	2	3	4	5	6	7	8	9	10	11	12
2008	1	2	3	4	5	6	7	8	9	10	11	12
2009	1	2	3	4	5	6	7	8	9	10	11	12
2010	1	2	3	4	5	6	7	8	9	10	11	12
2011	1	2	3	4	5	6	7	8	9	10	11	12
2012	1	2	3	4	5	6	7	8	9	10	11	12
2013	1	2	3	4	5	6	7	8	9	10	11	12