Мастер-класс по цифровому звуку

Часть 3. Основы редактирования цифровых фонограмм

Евгений Музыченко

В отличие от редактирования аналоговых фонограмм на магнитной ленте, которое выливается в многократную утомительную перезапись с регулировкой параметров, постоянную резку и склейку ленты с невозможностью достаточно точно подогнать стыки и прочими неудобствами, работа с цифровой фонограммой представляет собой гораздо более четкий и удобный процесс.

режде всего благодаря тому, что цифровая фонограмма представляет собой последовательность числовых значений амплитуды (отсчетов, называемых по-английски samples — выборки), ее можно легко отобразить на экране в виде графика (осциллограммы) в любом удобном масштабе по горизонтали и вертикали. Кроме того, коль скоро фонограмма уже оцифрована (представлена с конечной точностью), то и «горизонтальные» операции (по временной координате) будут выполняться с той же самой точностью, и резать/склеивать фонограмму можно с точностью до одного отсчета, каждый раз делая это в четко определенном месте, а не приблизительно, как при монтаже ленты. И наконец, накопление погрешностей обработки, возникающих вследствие конечной точности представления, при аккуратной и грамотной работе происходит гораздо медленнее, чем при перезаписи аналоговых фонограмм.

Основные способы обработки цифровой фонограммы непосредственно обусловлены ее представлением в виде последовательности числовых значений амплитуды. Звуковой редактор оперирует с этой последовательностью во многом подобно тому, как текстовый процессор работает с текстом — цепочкой символов различного начертания, размера, жирности и т.п. Если извлечь фрагмент последовательности и вставить его в другое место — между двумя отсчетами, которые до этого были соседними, то это будет аналогично резке/склейке ленты, вроде того, как фрагмент текста переносится в другое место документа. Если умножить каждый отсчет на фиксированное число больше единицы, это будет усилением интенсивности звука, а если множитель будет меньше единицы, то получится ослабление. Если менять множитель во времени, то это будет модуляция, и если он будет плавно нарастать или спадать, интенсивность звука в результате будет меняться таким же образом.

Как и в текстовом процессоре, в Cool Edit имеется курсор (Ruler) — пунктирная вертикальная линия, отмечающая текущую позицию в фонограмме, и существует операция выделения фрагмента фонограммы протяжкой (drag) курсора мыши при нажатой левой кнопке. Нажатие правой кнопки в каком-либо месте фонограммы выделяет фрагмент от курсора до указанного места. После того как фрагмент выделен, его края можно подровнять с помощью той же правой кнопки. Если операции выделения производить вблизи верхнего или нижнего краев окна, то выделяется только один канал стереофонограммы. Двойной щелчок выделяет весь видимый в окне фрагмент.

Основные органы управления расположены между окном фонограммы и индикатором уровня. Слева — панель, напоминающая магнитофонную и сделанная по аналогии с ней (пуск, стоп, медленная и быстрая перемотка, запись). Обычная кнопка пуска (Play) запускает проигрывание с позиции курсора, а если выделен фрагмент — от начала до конца фрагмента. Треугольник в кружке делает то же самое, но до конца фонограммы (Play to End). Значок бесконечности зацикливает проигрывание.

Правее расположена группа кнопок горизонтального масштабирования (слева направо и сверху вниз): сделать крупнее, сделать мельче, показать всю фонограмму, развернуть фрагмент во все окно, сделать крупнее с центрированием левой границы фрагмента, аналогично — с правой границы фрагмента. В случае когда укрупнение позволяет видеть отдельные отсчеты, они изображаются квадратиками, которые можно непосредственно перемещать вверх-вниз, захватив мышью, чтобы изменять величины отсчетов. Таким образом можно быстро и эффективно удалять короткие щелчки, длительность которых не превышает нескольких отсчетов. Эти отсчеты нужно выстроить так, чтобы они естественно и гладко замыкали участок кривой, на котором находятся.

Справа от панели масштабирования находится индикатор текущего момента (то есть положения курсора в фонограмме), который может иметь различный формат: минуты и секунды, отсчеты, один из профессиональных форматов SMPTE, кадры компакт-диска. Формат индикатора, как и формат временной шкалы окна, можно изменить, открыв щелчком правой кнопки на временной шкале контекстное меню (пункт Display Time Format). Левой кнопкой эту область можно зацепить, чтобы подвигать фонограмму влево-вправо.

Еще правее представлены параметры выделенного фрагмента (Sel) и окна (View): начало, конец и длительность. Двойным щелчком в любом поле можно включить режим прямого редактирования значения в этом поле. Наконец, в самой правой части находятся кнопки вертикального масштабирования. Можно изменить формат представления амплитуды (значения отсчетов, децибелы, проценты от максимума), открыв контекстное меню щелчком правой кнопки в области значений справа от окна. Эту область также можно зацепить левой кнопкой и перемещать фонограмму вверх-вниз.

При выделении фрагментов удобно использовать эффект западания (snapping), аналогичный тому, как в обычных аппаратных регуляторах иногда имеются положения, где регулятор слегка фиксируется для удобства его помещения в заданные положения. В Cool Edit 2000 такими положениями могут быть крупные (Coarse) и мелкие (Fine) деления временной шкалы, а также специально указанные места фонограммы (Cues). Режим «западания» курсора мыши при выделении в каждом из таких положений управляется в меню Snapping, доступном как из основного пункта Edit, так и из контекстного меню временной шкалы.

Итак, у нас уже имеется фонограмма, считанная с компакт-диска или записанная с аналогового носителя. Если вы записывали ее сами, она должна получиться без превышения максимального уровня (пики амплитуды не достигают границ окна). На компакт-дисках записи обычно хорошие, но встречаются (причем не только на пиратских копиях) и записи с сильно завышенным уровнем — это хорошо видно по положениям пиков. Если звучание в таких местах хотя бы слегка искажено, попробуйте укрупнить вид, чтобы стала отчетливо видна линия амплитуды. Превышение максимального уровня выглядит как принудительное ограничение: вместо плавного изгиба, который должен выходить за границу окна, получается что-то вроде горба со срезанным верхом. Автоматически исправить такие огрехи нельзя, поскольку информация о том, каким должен быть изгиб, безвозвратно утеряна, так что единственное, что вам остается, — это придать графику плавность вручную или посредством наложения огибающей (Transform а Amplitude а Envelope). Если таких срезов в фонограмме много, то удаление явно слышимых искажений может потребовать долгих часов работы.

Порой хочется убрать какую-то часть фонограммы: обрезать нудное повторение припева в конце песни, сократить затянувшееся вступление с аплодисментами и «разыгрыванием» на концерте или вырезать из середины «проигрыш», который, по вашему мнению, ломает изящную структуру композиции. Обрезание начала и конца можно делать достаточно грубо, поскольку потом все равно придется формировать в этих местах плавное нарастание или затухание громкости (Fade In/Out). Здесь можно просто выделить на глаз нужный фрагмент (на всякий случай лучше его предварительно прослушать), после чего достаточно нажать Delete или выбрать операцию Delete Selection из меню Edit. Кстати, есть и обратная операция Trim, которая оставляет только выделенный фрагмент, удаляя все остальное.

Удаление фрагмента из середины фонограммы гораздо сложнее, ибо нужно заботиться о стыковке краев, где уровень сигнала, его фактура и фоновый шум могут не совпадать. Попробуйте таким образом вырезать слова из речи — потребуется немало усилий, чтобы сохранить естественность динамики и интонации. А в случае с музыкой придется позаботиться еще и о сохранении ритмического рисунка.

Как правило, границы вырезаемого — как из начала и конца, так и из середины — фрагмента нужно выровнять по нулям, чтобы граница приходилась на момент перехода амплитуды через ноль или была достаточно близко от такого момента и чтобы после склейки краев амплитуда изменялась в том же направлении (возрастала/убывала). Тогда вероятность появления щелчка в образовавшемся стыке будет минимальна. Выровнять границы можно либо визуально, укрупнив вид, либо используя функцию Edit а Zero Crossings, которая позволяет (в порядке следования пунктов меню) сузить/расширить выделение, сдвинуть его левую границу влево/вправо, сдвинуть правую границу влево/вправо до попадания на нулевые значения амплитуды. В стереофонической фонограмме функция пытается подобрать такой момент, где значения амплитуд обоих каналов достаточно малы.

При вырезании фрагмента из достаточно ритмичной музыкальной композиции можно воспользоваться функцией Edit а Find Beats, которая сдвигает левую/правую границу выделения на очередную ритмическую долю (beat). Для удобства эта операция имеет горячие клавиши: «{» и «}». Если фонограмма обладает достаточно однообразной ритмической структурой, фрагмент выделен точно и его вырезка не нарушает ритмического рисунка, то можно добиться совершенно незаметного удаления фрагмента. Иногда место вырезки остается заметным, но на слух напоминает намеренную сбивку, встречающуюся и в целостных композициях, вследствие чего посторонний слушатель может вообще не обратить внимания на такую мелочь.

Как и в случае работы с текстом, вырезаемый фрагмент может быть просто удален либо помещен в буфер обмена (clipboard). Второе достигается выбором операции Cut или нажатием комбинации Shift-Delete. Разумеется, фрагмент может быть и просто скопирован в буфер (Copy или Ctrl-Insert). Сохраненный в буфере фрагмент может быть впоследствии использован для операций вставки (Paste, или Shift-Insert), причем не только в Cool Edit, но и в любом другом звуковом редакторе, поскольку формат буфера универсален. Кроме стандартного системного буфера, Cool Edit 2000 поддерживает еще пять внутренних буферов; текущий буфер задается операцией Edit а Set Current Clipboard.

Обычная операция Paste вставляет фрагмент перед отсчетом, на котором находится курсор, — точно так же, как это происходит со вставкой текста, либо заменяет выделенный фрагмент вставляемым. Операции Paste to New и Copy to New создают для фрагмента новый «звуковой документ», что удобно для разрезания фонограммы на более мелкие части: вступление, куплеты, припевы, проигрыши, завершение и т.п. Таким образом можно открыть несколько документов с заготовками, а потом скомбинировать их в новом документе. Операция Mix Paste служит для интеллектуальной вставки — подмешивания (Mix) фрагмента в фонограмму, замены выделенного фрагмента (Replace) наложения с затиранием (Overlap) либо вставки (Insert). Понятно, что для внедрения нового звука в фонограмму без ее разрыва должен использоваться режим смешивания (Mix), как это делается в микшерных пультах звукорежиссеров и диджеев.

Mix Paste позволяет изменить уровень вставляемого фрагмента, чтобы стыковка была менее заметна, а также сделать амплитудную склейку (Crossfade) стыкуемых краев, что очень полезно при вставке/замене, когда исходная фонограмма рвется. При амплитудной склейке края совмещаются не встык, а внахлест — с заданным временем перекрытия, а внутри такого перекрытия редактор автоматически делает плавное понижение уровня (Fade Out) для левого края и плавное повышение (Fade In) для правого. Вместе это дает перекрестное, или встречное, изменение уровня, которое носит название Crossfade. Звукорежиссер или диджей выполняет данное действие вручную, посредством одновременного встречного перемещения двух ползунков (Faders).

Описанные приемы принято именовать монтажом, по аналогии с резкой/склейкой лент. Операции, приводящие к изменению уровня или тембра звука, называют обработкой. Операции обработки собраны в меню Transform.

Основным и наиболее простым способом обработки сигнала является амплитудный (Amplitude), заключающийся в воздействии на величины отсчетов путем их умножения на какой-либо коэффициент. Главный прием амплитудной обработки — усиление (Amplify) с постоянным или переменным коэффициентом. Последнее называют также амплитудной модуляцией — в этом случае амплитуде сигнала в фонограмме придаются очертания другого, модулирующего, сигнала. Операция усиления (Amplify) в Cool Edit может выполняться с постоянным (constant) или c плавно меняющимся (fade) коэффициентом. В первом случае равномерно усиливается/ослабляется весь выделенный фрагмент, во втором происходит плавное нарастание/спадание громкости по аналогии с введением (in) и выведением (out) регулятора на пульте. Изменение коэффициента может быть линейным (linear) или логарифмическим (logarithmic), причем последнее более естественно для слуха, но годится только для значительных (10 секунд и дольше) отрезков времени, иначе изменение будет слишком резким. Для быстрого нарастания/затухания удобнее применять линейное изменение коэффициента.

Занимаясь усилением, следите за тем, чтобы пиковая амплитуда не вышла за пределы максимального уровня, ибо это чревато вышеописанным срезанием верхушек и появлением искажений. Чтобы привести фонограмму к максимально возможному уровню громкости, используйте специально предназначенную для этого операцию Normalize. При нормализации задается максимальный уровень, который должна будет иметь фонограмма (не задавайте 100%, ограничьтесь 99 или 98%, дабы впоследствии малейшее шевеление не привело к срезу амплитуды пиков), а редактор автоматически вычисляет нужный коэффициент постоянного усиления, чтобы наивысший пик фонограммы приобрел заданное значение амплитуды. Нормализацию имеет смысл применять после завершения всех операций по монтажу и обработке.

Возможно, вам понадобится придать участку фонограммы заданную амплитудную форму, например слегка и плавно ослабить громкость в тех местах, где потом планируется наложить речь или звуковые эффекты. Для этого подойдет операция формирования огибающей — Envelope. В специальном окне формы из прямых отрезков или гладких функций (сплайнов) строится огибающая, график которой является коэффициентом усиления при обработке фрагмента. В итоге общий амплитудный вид фонограммы приобретает очертания примененной огибающей.

Еще один вид амплитудной обработки — компрессия. В отличие от модной сейчас «горизонтальной» компрессии, сжимающей звуковой файл в объеме, традиционная компрессия сжимает динамический диапазон звука, то есть «расстояние» от самого тихого до самого громкого звука в фонограмме. Ровные однообразные музыкальные произведения в компрессии не нуждаются, так как их громкость примерно одинакова от начала до конца. Однако многие классические, электронные, авангардные композиции чередуют очень тихие и тонкие пассажи с чрезвычайно громкими и экспрессивными, отчего в определенных местах фонограммы могут возникать ощущения как слишком тихого, так и слишком громкого звучания. Можно частично сблизить эти уровни, применив управляемое усиление, при котором коэффициент уменьшается при повышении уровня фонограммы. Хотя замысел авторов или исполнителей при этом искажается, но зато повышается разборчивость тихих участков и снижается агрессивность громких.

Кроме того, посредством компрессии можно несколько ослабить эффект от свистящего звука «с», который получается при некачественной записи, искусственно снизив резкий подъем амплитуды на нем. Для этого необходимо выделить непосредственно звук «с» и применить к нему один из пресетов под названием De-Esser, манипулируя настройками до достижения наилучшего результата.

Кроме амплитудных, применяются также амплитудно-частотные методы обработки, важнейшим из которых является фильтрация — выборочное усиление в зависимости от частоты сигнала. Для этого в Cool Edit 2000 имеется группа Filters, включающая две операции: Quick Filter и FFT Filter. Quick Filter — обычный восьмиполосный графический эквалайзер, который допускает как обработку фрагмента с постоянными установками полос, так и задание начальной/конечной настройки, когда коэффициенты усиления в полосах линейно изменяются на протяжении фрагмента. Для простой обработки обычно используется постоянный режим, с помощью которого можно ослабить или подчеркнуть отдельные частотные области, выравнивая фонограмму после плохой кассеты или действий некомпетентного звукорежиссера (такое бывает не только у любителей). FFT Filter — это фильтр, основанный на преобразованиях Фурье и позволяющий более точно рисовать кривую усиления/ослабления и управлять точностью обработки сигнала.

И в завершение одна из наиболее мощных функций редактора — ослабление шума (Noise Reduction), — в результате применения которой можно кардинально улучшить звук. Функция работает на основе так называемого профиля шума (noise profile) — частотных и статистических параметров шумового сигнала, по которым выполняется обработка фонограммы.

Вначале шумоподавитель необходимо «обучить», то есть выделить в фонограмме фрагмент чистого шума, не содержащий полезного сигнала. В прошлом выпуске я советовал при записи с аналогового носителя оставлять в начале фрагменты тишины — именно эти фрагменты и нужно использовать для обучения. Если в фонограмме нет чистого шума — попробуйте выделить небольшой фрагмент с наиболее тихим и однообразным полезным сигналом; разумеется, это в большей степени исказит полезный сигнал в фонограмме, но может помочь добиться компромиссного звучания. Обучение шумоподавителя выполняется кнопкой Get Profile from Selection. В зависимости от длительности шумового фрагмента может потребоваться коррекция размера преобразования Фурье (FFT Size), поскольку для коротких фрагментов размер преобразования может оказаться слишком большим (во фрагменте не окажется достаточного количества точек). Если ничто вас не ограничивает, попробуйте задавать большие размеры преобразования: это хотя и увеличит время обработки, но повысит точность анализа и преобразования сигнала.

При обучении шумоподавитель обрабатывает выделенный фрагмент, анализируя его частотные параметры и статистические зависимости, и строит профиль шума, который представляет собой график минимально слышимых уровней полезного сигнала в каждой из частотных полос. Зеленые точки в окне профиля обозначают минимально возможную степень шумоподавления (около 3 дБ), а красные — максимально возможную (около 20 дБ). Окно показывает профиль только одного канала: либо левого, либо правого — на выбор.

После обучения шумоподавитель нужно закрыть, нажав на кнопку (Close), выделить в фонограмме фрагмент, в котором нужно ослабить шум, и снова открыть шумоподавитель. После настройки параметров операция подавления шума может быть запущена кнопкой OK. Подавитель последовательно анализирует спектр в каждом моменте выделенного фрагмента, определяет уровень сигнала в каждой из частотных полос и, если он ниже минимально допустимого уровня полезного сигнала для этой полосы, ослабляет в заданной степени сигнал в этой полосе. Регулятор Noise Reduction Level задает общую степень подавления шума. График под окном профиля шума задает степень подавления в зависимости от частоты; с его помощью можно усилить или ослабить подавление на выбранных частотах, добиваясь более эффективного удаления шума и меньшего влияния на полезный сигнал. Совокупная степень подавления в зависимости от частоты отображается желтыми точками в окне профиля.

Параметр Precision Factor определяет степень точности при обработке (максимальное эффективное значение — около 10). Параметр Smoothing Amount задает степень сглаживания профиля для случайных шумов, что уменьшает искажение полезного сигнала, но также уменьшает и степень ослабления самого случайного шума. Поле Transition Width позволяет задать ширину «зазора» между сохраняемым и удаляемым сигналом в каждой частотной полосе. По умолчанию этот зазор будет нулевым, поэтому снижение уровня сигнала чуть ниже минимально допустимого в этой полосе сразу же приводит к его полному удалению, что порождает нежелательные призвуки. Если зазор существует, то переход от полного сохранения сигнала к полному его подавлению в полосе происходит плавно от верхней границы зазора до нижней.

Ослабление шума — один из самых, если можно так выразиться, «эмпирических» процессов в обработке фонограмм, поскольку наиболее эффективно автоматическим способом могут быть удалены лишь регулярные или стационарные шумы, вроде фона электросети (50 Гц) или наводок телевизионной строчной развертки (около 15 кГц). Большая же часть шумов носит случайный характер и не может быть эффективно удалена без ощутимого ухудшения качества сигнала. Поэтому для достижения хорошего результата в каждом случае необходимо неустанно экспериментировать, принимая во внимание вид шума, его интенсивность в различных частотных областях, изменение во времени и т.п., чтобы надлежащим образом установить параметры подавителя. Однако вполне удовлетворительные результаты получаются и при стандартных установках — достаточно лишь «поиграть» с общим уровнем подавления.

О точности подбора параметров подавления можно судить, применяя обратную форму операции, удаляющую полезный сигнал и оставляющую только шум (Keep Only Noise). Если после такой операции полезный сигнал прослушивается очень слабо или не прослушивается вообще, — это значит, что параметры профиля подобраны надлежащим образом.

При работе не следует забывать и о функции отката (Undo), которая позволяет быстро и эффективно экспериментировать с параметрами, не тратя времени на повторную загрузку файла. Кстати, это относится и ко всем прочим операциям редактора.

КомпьютерПресс 10'2002

1999	1	2	3	4	5	6	7	8	9	10	11	12
2000	1	2	3	4	5	6	7	8	9	10	11	12
2001	1	2	3	4	5	6	7	8	9	10	11	12
2002	1	2	3	4	5	6	7	8	9	10	11	12
2003	1	2	3	4	5	6	7	8	9	10	11	12
2004	1	2	3	4	5	6	7	8	9	10	11	12
2005	1	2	3	4	5	6	7	8	9	10	11	12
2006	1	2	3	4	5	6	7	8	9	10	11	12
2007	1	2	3	4	5	6	7	8	9	10	11	12
2008	1	2	3	4	5	6	7	8	9	10	11	12
2009	1	2	3	4	5	6	7	8	9	10	11	12
2010	1	2	3	4	5	6	7	8	9	10	11	12
2011	1	2	3	4	5	6	7	8	9	10	11	12
2012	1	2	3	4	5	6	7	8	9	10	11	12
2013	1	2	3	4	5	6	7	8	9	10	11	12