Обзор программ для работы со звуком и музыкой
Где искать программы в Internet
Системы многоканальной записи и сведения
Генераторы и анализаторы сигналов
Считыватели звуковых дорожек с компакт-дисков
Системы для радиовещания и дискотек
Утилиты и управляющие программы
В последнее время наряду с термином «мультимедиа», получил распространение другой — «музыкальные программы». Новый термин оказался столь же многозначным, что и его родитель, — этим сочетанием стали называть любые программы, имеющие дело с каким-либо звуком; при этом нередко происходит смешение основных понятий и путаница в принципах работы программ. В результате одни пользователи даже не догадываются о некоторых доступных им возможностях, а другие ошибочно возлагают на программу (и компьютер в целом) неоправданные надежды. Цель данной статьи — классификация методов работы со звуком на PC и обзор технологий и программных средств для этой цели.
Профессионалы и «продвинутые любители», имеющие представление о технологиях обработки звука на PC, свободно могут пропустить следующую главу — она предназначена в основном для начинающих в этой области.
Audio и MIDI
В современных компьютерах можно выделить две наиболее популярные технологии, имеющие отношение к звуку и музыке:- Audio (аудио) — наиболее универсальная технология, представляющая произвольный звук как он есть — в виде цифрового представления исходного звукового колебания или звуковой волны (wave), отчего в ряде случаев она именуется wave-технологией. Позволяет работать со звуками любого вида, любой формы и длительности. Звуковая информация обычно хранится в файлах с расширением WAV.
- MIDI — нотно-музыкальная технология, основанная на регистрации событий, происходящих при игре на электронном инструменте, — нажатий клавиш, педалей, воздействий на регуляторы, тумблеры, кнопки и т.п. Последовательность подобных событий образует «электронную партитуру» музыкального произведения — как бы полную программу управления «автоматическим оркестром». Позволяет весьма точно записать достаточно сложное музыкальное произведение, а затем любое число раз исполнить его в точном соответствии с программой. Информация обычно хранится в файлах с расширением MID.
Audio-технология обычно применяется там, где имеется исходный звуковой сигнал, подлежащий обработке, — с ее помощью записывают, обрабатывают и сводят «живые» акустические и голосовые партии, речь, шумы, специальные сигналы и т.п. MIDI-технология снискала себе успех в создании музыкальных произведений «с нуля», посредством только электронных инструментов. При помощи MIDI-системы может быть создан как некий музыкальный каркас, к которому впоследствии будут добавлены голосовые или акустические партии, так и полноценное, законченное музыкальное произведение.
Для применения аудио-технологии достаточно простейшего звукового адаптера, содержащего АЦП и ЦАП — аналого-цифровые и цифро-аналоговые преобразователи. При этом сложность, качество и цена адаптера совершенно не влияет на принципиальные возможности обработки звука — от адаптера зависит лишь общее качество входного и выходного преобразования, а также сервисные возможности (например, быстрое аппаратное сжатие или фильтрование).
Для использования MIDI-технологии прежде всего нужен электронный музыкальный инструмент, преобразующий последовательность нот и команд управления в звук — обычный или сразу цифровой. Это может быть клавишный синтезатор, звуковой модуль (тонгенератор, или синтезатор без клавиатуры), музыкальная карта с аппаратным синтезатором или же программный синтезатор — программа, имитирующая работу реального синтезатора. Соответственно, все возможности, доступные в этой технологии, целиком определяются имеющимся набором MIDI-инструментов.
В Windows каждая технология представлена своим типом звукового устройства. Устройства могут быть реальными (аппаратные адаптеры) и виртуальными (программы-имитаторы, генераторы, фильтры и т.п.). Общение программ с устройствами происходит посредством аудио- и MIDI-портов, которые появляются в системе после установки соответствующих устройств.
Отдельным случаем аудио-портов являются порты DirectSound. Классический (Wave, MME) аудио-порт не гарантирует предельно быстрого вывода звука — при обмене небольшими фрагментами, за счет буферизации и невысокой частоты обращений к адаптеру, возникают значительные (относительно времени звучания самих фрагментов) задержки. Интерфейс DirectSound, входящий в комплект интерфейсов DirectX, дает возможность работать с адаптером с минимальной буферизацией и накладными расходами, заметно сокращая задержки. Кроме того, в DirectSound несколько программ могут использовать один порт одновременно, что далеко не всегда возможно при работе с Wave-портами.
Классификация программ
Любая программа для работы со звуком на PC использует в той или иной форме одну из этих технологий либо обе сразу. Я различаю следующие основные классы программ:Многие программы сочетают в себе функции из разных классов: например, звуковые редакторы и секвенсоры нередко предоставляют также возможности процессоров (обработка в реальном времени), а музыкальные процессоры и автокомпозиторы часто имеют функции секвенсора.
- Звуковые процессоры (audio processors)
- Системы многоканальной записи и сведения (multitrack recorders)
- Звуковые редакторы (audio editors)
- Генераторы и анализаторы сигналов (audio generators/analysers)
- Виртуальные (программные) синтезаторы (virtual/software synthesizers)
- Музыкальные редакторы (music/MIDI editors)
- секвенсоры (sequencers)
- трекеры (trackers)
- нотные редакторы (score editors)
- Музыкальные процессоры (music/MIDI processors)
- Автокомпозиторы (auto composers)
- Автоаккомпаниаторы (auto accompaniment generators, jammers)
- Распознаватели нот (score recognition software)
- Преобразователи форматов (format convertors)
- Считыватели звуковых дорожек с компакт-дисков (CD rippers/grabbers)
- Психоакустические компрессоры (psychoacoustic compressors)
- Проигрыватели (players)
- Системы для радиовещания и дискотек (delivery systems)
- Утилиты и управляющие программы (utility/control software)
Где искать программы в Internet
Ниже перечислены некоторые сайты, распространяющие программы звуко-музыкального направления, либо имеющие ссылки на них:- SoundStorm
- MAZ Sound Tools
- Shareware Music Machine
- WinFiles/Sound Tools
- Synth Zone
- Digital Sound Page
- The Sonic Spot
- Harmony Central/Windows Software
- Windows MIDI Software
Звуковые процессоры
Имитируют работу типовых устройств обработки звука, применяемых в студийной работе, — усилителей, ограничителей, шумоподавителей, компандеров, эффект-блоков и т.п. Существует три основных типа процессоров:- Нелинейные (off-line) — получают сигнал в виде дискового файла, предварительно записанного другими средствами, и записывают результат обработки в другой дисковый файл.
- Сквозные реального времени — получают сигнал непосредственно с аудиопорта и выводят результат в другой порт.
- Подключаемые модули (plugins) — получают сигнал от другой программы при помощи специального программного интерфейса (API) и возвращают результат обработки этой же программе. Фактическим стандартом такого интерфейса стал Microsoft DirectX. Модули обычно поддерживают обработку в реальном времени.
DSP/FX Virtual Pack
-
Разработчик — Power Technology
Последняя выпущенная версия — 6.2, коммерческая
Алгоритмы перенесены с аппаратной платы эффектов DSP/FX. При наличии в системе плат DSP/FX модули могут использовать процессоры плат; в противном случае вся обработка выполняется программно.
Каждый модуль поддерживает набор пресетов и управление параметрами посредством MIDI-контроллеров.
В состав пакета входят следующие модули обработки: .
Native Power Pack
-
Разработчик
— Waves
Последняя выпущенная версия — 2.6, коммерческая
В состав входит несколько классов модулей: Пакет защищен заглушкой для параллельного порта (WaveKey).
Специалисты и пользователи весьма высоко ставят качество обработки в модулях Waves.
Cylonix Vocoder
-
Разработчик
— James J. Clark
Последняя выпущенная версия — 2.00 (shareware)
18-полосный вокодер реального времени. Для удовлетворительной работы требуется Pentium-120. Задержка между входным и выходным сигналом на Pentium-166 — чуть больше полусекунды, на Celeron-460 — около 0.2 с. DirectX не поддерживается.
В основу многополосного вокодера положено то, что речевой аппарат человека работает по разностному принципу: исходный звук голосовых связок, богатый гармониками, подвергается динамическому управлению — резонансному усилению, амплитудной модуляции и фильтрованию — при прохождении через речевой тракт. Принцип работы такого вокодера состоит в разложении речевого управляющего сигнала (modulator) на заданное количество частотных полос и анализе динамики в каждой полосе. Полученные в результате анализа сигналы с определенной точностью повторяют динамику работы речевого тракта. Эти сигналы управляют банком частотных фильтров, через которые пропускается богатый гармониками несущий сигнал (carrier); в результате на выходе банка образуется «говорящий» несущий сигнал, как если бы звук подобного тембра издавали сами голосовые связки.
Как несущий, так и управляющий сигнал может быть сгенерирован несколькими способами — самой программой, введен с аудио-порта, либо взят из готового Wave-файла.
Вокодер имеет множество параметров: ширина полосы фильтра, пропорции смешивания входных и выходных сигналов, способы распознавания речевых звуков, режим воспроизведения высоты управляющего сигнала, виды отображения управляющих сигналов на банки фильтров. Различные способы отображения — сдвиг на несколько полос, инверсия, перестановка соседних полос и т.п. — позволяют в чрезвычайно широких пределах менять тембр полученного сигнала.
Каждый канал вокодера имеет набор регуляторов — уровень, стереопанорама, время затухания, задержка, время и интенсивность эха, уровень дополнительных искажений.
Возможно также отключение анализа управляющего сигнала — тогда программа работает, как обычный 18-полосный эквалайзер.
Системы многоканальной записи и сведения
Предназначены для многодорожечной записи и воспроизведения фонограмм подобно многоканальному магнитофону, а также для оконечного сведения (микширования) многодорожечной фонограммы. Основными функциями являются монтажные операции на дорожках, совмещение звуковых фрагментов, организация плавного перехода одних фрагментов в другие, регулировка громкости и положения на стереопанораме для каждой дорожки, перезапись всей дорожки или ее отдельных фрагментов.Большинство систем многоканальной записи предназначено для работы в серьезных студийных условиях, поэтому практически все они имеют поддержку удаленного управления (MMC), синхронизации с внешними устройствами (SMPTE). Ряд современных систем поддерживает также синхронизацию с видеороликами.
В многоканальных системах используется преимущественно неразрушающий (non-destructive) монтаж. Это означает, что программа оперирует на многодорожечной панели не с самими звуковыми данными, а лишь со ссылками на их фрагменты (clips). Это заметно уменьшает требования к памяти, ускоряет доступ к данным и вдобавок защищает их от нежелательного изменения.
DDClip Pro
-
Разработчик — SoftLab-NSK
Предоставляет до 32 аудиодорожек, одну MIDI-дорожку и две видеодорожки. Каждая дорожка может содержать произвольное количество клипов — звуковых или видеофрагментов, каждый из которых, в свою очередь, является ссылкой на определенный участок исходных данных — аудио, MIDI или видео.
Технология работы в DDClip основана на подборе и совмещении клипов всех трех видов. Для создаваемого ролика заготавливаются все необходимые фрагменты, затем они в нужном порядке расставляются по дорожкам, после чего выполняется точная подгонка, выравнивание, настройка уровней громкости и панорамы, наложение эффектов и окончательное сведение.
На видеодорожках доступны простые операции видеообработки — обрезание кадра, плавные переходы между кадрами. Видеоролики воспроизводятся на любом устройстве с интерфейсом Video for Windows.
Поддерживается дополнительный монитор для вывода видеороликов.
На клипы могут накладываться профили — огибающие громкости и стереобаланса. Также могут быть наложены эффекты реального времени — delay, echo, chorus, phaser, flanger, графический/параметрический эквалайзеры. Несколько эффектов могут быть связаны в цепочку. На весь проект могут быть наложены глобальные (master) эффекты из этого же набора.
Вспомогательное окно Clip Collection (коллекция клипов) является удобным средством для быстрого выбора подходящих клипов и перетаскивания их в нужные места дорожек.
Samplitude Studio
-
Разработчик — SEK'D
Поддерживаются огибающие громкости, панорамы и объема (surround). Несколько различных режимов воздействия мышью на объекты — выделение, перетаскивание, отрисовка огибающих и т.п. Удобный способ фиксации клипов при помощи специального значка в центре каждого клипа.
По краям выбранного клипа изображаются так называемые манипуляторы (handles) — в каждом из четырех углов и в середине верхней грани. Нижние угловые манипуляторы отвечают за левую/правую границы клипа, верхние угловые — за крутизну нарастания/спада громкости в начале/конце клипа, а верхний центральный — за общую громкость клипа.
Имеется интересная функция Convolution — выделение из звуковой дорожки общих с другой дорожкой гармоник с подавлением остальных частотных составляющих.
Широкий спектр операций обработки — ревербератор, спектральный анализатор, параметрический/графический эквалайзеры, многоточечный фильтр, компрессор/экспандер, расширитель стереобазы, шумоподавитель (общий и по образцу), генератор волновых форм. Поддерживаются модули обработки в стандарте DirectX.
Поддерживается запись звуковых компакт-дисков с возможностью расстановки пауз между дорожками.
n-Track Studio
-
Разработчик — Flavio Antonioli
Имеет раздельные индикаторы уровня записи и воспроизведения, возможность синхронизации с видеороликом (AVI/MPEG), огибающие громкости/панорамы в режиме неразрушающего редактирования, метроном.
Для обработки применяются собственные и DirectX-модули, обработка возможна как при воспроизведении, так и в режиме прямого ввода с порта (live input). В состав встроенных модулей входят Chorus, Vol/Pitch Shift, Echo, Compression, Reverb.
Для просмотра и редактирования MIDI-дорожек имеется окно Piano Roll с несложным интерфейсом и возможностью квантования (quantize).
Звуковые редакторы
Объединяют функции цифрового магнитофона, звуковой монтажной станции и набора устройств обработки звука (процессоров). Осуществляют запись, воспроизведение и монтаж (вырезка, вклейка, замена фрагментов фонограммы). Чаще всего имеют набор встроенных и/или подключаемых звуковых процессоров, с помощью которых реализуется сложная обработка записанной фонограммы. Редактор может быть многоканальным, допуская раздельную запись и обработку нескольких звуковых дорожек с последующим их сведением (микшированием). Ряд редакторов предоставляет звуковые процессоры реального времени, а также средства для исследования сигнала — спектроанализаторы, взвешивающие фильтры и статистические функции.Среди типовых функций звуковых редакторов наиболее общими являются:
- Запись и воспроизведение звукового сигнала через аудиопорт звукового адаптера (карты)
- Чтение и запись звуковых файлов, преимущественно формата RIFF PCM (WAV), а также других распространенных форматов
- Возможность обработки моно- и стереосигнала с разрядностью 8 и 16 и частотой дискретизации до 44 100 Гц (нередко – до 24 разрядов и 96 кГц)
- Монтаж сигнала (вырезка, вставка, удаление и размножение фрагментов)
- Различные способы выделения рабочего участка (selection) при монтаже с выравниванием (snap) по точкам пересечения нуля (zero crossing), по времени (time), по ритмическим долям (beats)
- Пометка точек и фрагментов фонограммы с ведением списка таких пометок, из которого можно быстро перейти к помеченному участку, а также поддержка списка участков проигрывания (play list), с помощью которого можно заменить линейное проигрывание на «рваное»
- Основные операции обработки: усиление/ослабление, нормализация (такое масшабирование сигнала, чтобы его амплитуда точно вписалась в заданный диапазон), плавное увеличение/снижение уровня громкости (fade), изменение стереобаланса (pan), сжатие/растяжение динамического диапазона (compress/expand), пороговое пропускание (gate), наложение огибающей (envelope)
- Основные виды эффект-обработки: phaser, flanger, reverb, delay, echo, overdrive, distortion, fuzz и т.п.
- Специальные операции: частотное фильтрование (filter/EQ), изменение высоты (pitch) сигнала или длительности (stretch) участка фонограммы, ослабление шумов (noise, hiss) и щелчков (clicks, pops), формирование музыкальных звуков из участков фонограммы, спектральный анализ всей фонограммы или ее участка
- Преобразование формата сигналов — частоты дискретизации, разрядности отсчета и количества каналов, смешивание стереоканалов в один
- Генерация сигналов различной формы и характеристик — как стационарных, так и с изменяющимися во времени параметрами, а также шумов с различным распределением
- Доступ к зарегистрированным в системе внешним модулям (plugins) обработки звука в стандарте DirectX/ActiveMovie, которым передается для обработки выделенный участок фонограммы
- Синхронизация записи/воспроизведения по MIDI — запуск записи или воспроизведения по внешнему событию, посылка синхронизирующих сообщений другим устройствам (ведущее устройство, master sync), синхронизация по приходящим от других устройств сообщениям (ведомое устройство, slave sync)
Sound Forge
-
Разработчик — Sonic Foundry
При работе с файлами в 16-разрядном формате PCM (WAV) есть возможность открыть файл в режиме непосредственного доступа (Direct mode), без промежуточного копирования. Это заметно ускоряет работу, однако лишает возможности сохранить прежнюю версию файла при аварийном завершении.
Максимально достижимое увеличение — одна точка экрана на один отсчет оцифровки, чего в ряде случаев явно недостаточно для хорошего рассмотрения формы волны.
Автоматическое выравнивание при выделении — по точкам пересечения нуля и временным меткам.
При монтаже удобно пользоваться функциями Preview Cur/Cursor (прослушивание, каким будет результат вырезки, до выполнения самой вырезки) и Pre-roll to Cursor (прослушивание небольшого участка перед курсором).
Поддерживается список помеченных участков (regions) и выборочного проигрывания.
В режиме записи возможно создание «пульта дистанционного управления» — Remote Control. При этом основное окно редактора заменяется на небольшое окно «пульта», находящееся поверх других окон. Эта функция удобна при записи сигнала, формируемого другой программой, либо устройством, управление которым производится из другой программы.
В режиме записи возможен также прямой сброс данных на диск, минуя системный кэш с обратной записью. Это позволяет избавиться от долгих пауз, когда Windows сбрасывает кэш на диск, останавливая при этом все программы, однако работа диска в таком режиме становится весьма напряженной за счет непрерывного позиционирования. Надо сказать, что и при работе через кэш Sound Forge использует диск гораздо более агрессивно, чем большинство других редакторов.
Редактор может работать с внешними семплерами (Akai, E-mu, Kurzweil, Peavey), поддерживающими стандарты MIDI SDS и/или SCSI SMDI. Поддерживается также подготовка семплов для ACID — другой программы Sonic Foundry, предназначенной для создания музыки из готовых фрагментов.
Генератор сигналов выдает простые периодические сигналы и серии DTMF, а также имеет функцию FM Synthesis — частотно-модуляционный операторный синтез, популярный в электронных синтазаторах начала 80-х.
Поддерживаются собственные подключаемые модули. При помощи модуля Batch Converter можно создать последовательность операций обработки, которая затем может быть автоматически применена к одному или нескольким файлам. CD Architect предназначен для формирования и записи звуковых компакт-дисков. Spectrum Analysis служит для спектрального анализа фонограммы, Noise Reduction — для ослабления помех и шумов, Q-Sound — для придания звуку эффекта объемности.
Синхронизация по MIDI возможна в обоих режимах — ведущем и ведомом.
Имеется любительская локализация SF 4.5 на русском языке (переведены тексты меню и сообщений). Качество перевода среднее.
WaveLab
-
Разработчик — Steinberg
Предоставляет все необходимые монтажные операции, нормализацию, преобразования динамики, коррекцию высоты/времени звучания. Операции сложной обработки немногочисленны: трехполосный эквалайзер, гармонайзер на 16 голосов (создает дополнительные гармоники основного голоса), качественный Chorus.
Основное внимание при обработке уделено поддержке модулей реального времени — собственных, DirectX и VST (от Cubase VST). Для управления модулями сделана специальная панель эффектов (Master Section), в которой можно выбрать до шести модулей одновременно. Для модулей WaveLab/VST изображаются панели управления, стилизованные под вид аппаратных стоечных блоков. Панели модулей, а также панели инструментов WaveLab (toolbars) могут находиться в любом месте экрана, а не только в окне редактора.
Имеет функции сравнения двух файлов, генерации тестового сигнала с огибающей, построения трехмерной спектрограммы с показом ее с различных точек зрения.
Функция Batch Processor позволяет сформировать алгоритм пакетной обработки набора файлов.
Поддерживает обмен данными с аппаратными семплерами AKAI, Ensoniq, E-mu, Kurzweil, Roland в стандартах SDS/SMDI. Может считывать звуковые дорожки с компакт-дисков. Содержит встроенный CD-рекордер с возможностью задания длительности пауз между дорожками.
Имеет несколько стилей и цветовых палитр интерфейса. После выполнения каждой операции отмечается время, затраченное на операцию, с точностью до миллисекунды, что удобно для оценки эффективности.