Перспективы однобитных звуковых форматов
На протяжении многих лет в сфере бытовой звуковоспроизводящей аппаратуры доминируют устройства, ориентированные на работу с многоразрядной цифровой записью. Но не исключено, что в будущем широкое распространение получит технология однобитной записи с высокой частотой дискретизации.
Призрак совершенства
В настоящее время цифровые технологии записи и обработки звука доминируют как в студийной, так и в бытовой аппаратуре. Благодаря простоте монтажа и обработки, а также возможности долговременного хранения и многократного копирования фонограмм без малейшей деградации, цифровые форматы быстро завоевали симпатии сначала профессионалов звукозаписывающей индустрии, а затем и конечных пользователей.
Однако вскоре после того, как цифровые устройства и носители за относительно короткий срок практически полностью вытеснили с массового рынка своих аналоговых предшественников, хор голосов, восхищающихся непревзойденным совершенством «кристально чистого» цифрового звука, поутих. Профессиональные музыканты, специалисты в области звукозаписи и просто ценители качественного звука стали обращать внимание на то, что, вопреки навязанному массированной рекламной кампанией стереотипу, цифровое представление звука отнюдь не является «совершенным».
Бесспорно, переход к цифровым технологиям позволил избавиться от ряда принципиальных недостатков, присущих аналоговой записи. Однако разработчикам цифровой аппаратуры пришлось поломать головы над решением специфических проблем, связанных с практической реализацией задачи преобразования аналогового сигнала в цифровой вид и обратно. Если раньше конструкторы звуковой аппаратуры были озабочены борьбой с характерными искажениями и шумами, присущими аналоговым технологиям и носителям, то в эпоху цифровой записи пришлось заняться поиском методов минимизации ошибок и артефактов, возникающих в процессе оцифровки аналогового сигнала и преобразования цифрового потока в аналоговый.
Наибольшие трудности вызывает разработка модулей, предназначенных для восстановления аналогового сигнала из цифровой записи. Вообщето создание цифроаналогового преобразователя (ЦАП), который смог бы идеально точно воссоздать форму исходного аналогового сигнала, является практически неразрешимой задачей. Как минимум, в силу того, что цифровая запись по своей природе дискретна. В процессе квантования аналогового сигнала неизбежно происходит округление мгновенных значений каждого отсчета. Таким образом, можно говорить лишь о большем или меньшем отклонении восстановленного сигнала относительно его исходной формы, которое способно обеспечить то или иное схемотехническое решение.
Тупик эволюции
Некоторые специалисты придерживаются мнения, что развитие цифровых технологий звукозаписи изначально пошло не по самому оптимальному пути. Как в сфере профессиональной, так и бытовой аппаратуры наиболее широкое распространение получили форматы и устройства, базирующиеся на многоразрядной цифровой записи.
Преобразование аналогового сигнала в такой формат осуществляется методом импульснокодовой модуляции (ИКМ). При этом амплитуда исходного аналогового сигнала измеряется через равные промежутки времени. Частота, с которой производятся эти измерения, называется частотой дискретизации. Ее численное значение должно быть как минимум вдвое выше верхней граничной частоты исходного сигнала. Таким образом, для оцифровки фонограммы с частотным диапазоном от 20 Гц до 20 кГц частота дискретизации должна составлять не менее 40 кГц. На практике обычно используются некратные значения — 44,1 кГц в случае компактдиска и 48 кГц в DAT-магнитофонах первого поколения.
Результат оцифровки аналогового сигнала методом импульсно-кодовой модуляции.
Для наглядности использована 4-разрядная шкала
Значения амплитуды аналогового сигнала, измеренные для каждого из отсчетов, округляются до ближайшего целого значения используемой шкалы. Этот процесс называется квантованием. Точность измерения ограничена как характеристиками АЦП, так и разрядностью цифрового сигнала, или, проще говоря, количеством битов, отведенных для записи каждого отсчета. Например, в случае 8-разрядной записи шкала имеет 256 значений, для 16-разрядной — 65 536, а для 24-разрядной — более 16,7 млн.
С одной стороны, очевидно, что по мере повышения частоты дискретизации и разрядности ИКМ-записи будет увеличиваться и точность преобразования. Но, с другой стороны, на практике потенциал для наращивания этих параметров ограничен множеством объективных факторов, в частности быстродействием микропроцессоров, пропускной способностью интерфейсов (посредством которых передается цифровой сигнал) и емкостью накопителей, на которых хранятся записи. Например, одна минута записи несжатого монофонического сигнала с частотой дискретизации 44,1 кГц и разрядностью 16 бит занимает порядка 5 Мбайт. А для хранения каждой минуты записи 24-разрядного сигнала с частотой дискретизации 96 кГц потребуется уже 16,5 Мбайт.
Таким образом, на протяжении многих лет предел качества цифровой звукозаписи определялся в первую очередь емкостью накопителей и технологическим уровнем доступной на тот момент элементной базы. По мере совершенствования схемотехники и повышения емкости используемых физических носителей появлялась техническая возможность увеличить частоту дискретизации и разрядность записываемого сигнала. Это, в свою очередь, обеспечивало рост качественных показателей, в частности частотного и динамического диапазона цифровых фонограмм. Однако движение в этом направлении привело в тупик.
По мере увеличения разрядности и частоты дискретизации систем, использующих ИКМ-преобразование, прирост качественных показателей фонограмм (например, частотного и динамического диапазона) становился всё менее заметным. Основная причина этого заключается в том, что характеристики реальных схем АЦП и ЦАП имеют определенные отклонения от идеальных. Даже самые совершенные варианты реализации этих схем не позволяют абсолютно точно восстановить форму исходного аналогового сигнала из цифровой записи — особенно ее высокочастотных составляющих. Таким образом, можно говорить лишь о большей или меньшей погрешности преобразования, которая характерна для тех или иных схемотехнических решений.
Серьезной проблемой, с которой приходится сталкиваться разработчикам, является необходимость использования на входе АЦП режекторных фильтров с очень крутой характеристикой. В идеале они должны полностью отсекать из исходного аналогового сигнала все составляющие, частоты которых равны или превышают половину используемой частоты дискретизации. Например, в случае записи сигнала с качеством компактдиска фильтр должен пропускать сигнал с частотой 20 кГц, но при этом отсекать сигнал с частотой 22,05 кГц и выше (44,1/2=22,05). Увеличение частоты дискретизации отчасти позволяет решить эту проблему, но при этом возникает другая — необходимость минимизировать влияние шумов квантования.
Однобитная альтернатива
В конце 90-х годов прошлого века сотрудники компаний Sony и Philips предложили использовать для мастеринга и архивного хранения цифровых записей однобитный формат, получивший название Direct Stream Digital (DSD). В этом случае аналоговый сигнал оцифровывается методом дельта-сигма модуляции с очень высокой частотой дискретизации (которая в десятки раз превосходит верхнюю границу частотного диапазона исходного сигнала). Например, у фонограмм, предназначенных для записи на носители Super AudioCD (SACD), частота дискретизации составляет 2,8224 МГц (против 44,1 кГц в случае AudioCD и 192 кГц для DVD Audio).
Как явствует из названия, однобитная цифровая запись представляет собой последовательность одноразрядных двоичных чисел. Иными словами, значение каждого отсчета может принимать одно из двух значений — «0» либо «1». Таким образом, информация о динамике изменения амплитуды аналогового сигнала представлена в виде серии импульсов различной ширины. Именно поэтому такой способ оцифровки иногда называют методом широтноимпульсной модуляции (ШИМ).
Какими же преимуществами обладает однобитная запись в сравнении с многоразрядной?
Результат оцифровки аналогового сигнала методом широтно-импульсной модуляции
Вопервых, это более простая схемотехника. Благодаря высокой частоте дискретизации нет необходимости в использовании режекторных фильтров с очень крутой характеристикой для предварительной обработки аналогового сигнала. Это значительно упрощает практическую реализацию схемотехнических решений — модулей ЦАП и АЦП. Нельзя не отметить и то, что однобитный поток обладает естественной совместимостью с усилителями класса D, которые получают всё более широкое распространение в бытовых электронных устройствах.
Вовторых, однобитное преобразование вносит гораздо меньшие искажения в фазо-частотную характеристику (ФЧХ) исходной записи. И это действительно важное преимущество по сравнению с ИКМ-преобразованием, побочным эффектом которого является значительный фазовый сдвиг в верхней четверти частотного диапазона.
В-третьих, сама структура однобитной записи снижает влияние ошибок на точность восстановления исходного аналогового сигнала. Поскольку все биты одноразрядного потока имеют одинаковую значимость, эффект от ошибок, возникших в процессе считывания цифровой записи с носителя (или передачи потока по линии связи) не зависит от того, какой именно бит оказался измененным. В этом смысле одноразрядная запись выгодно отличается от многоразрядной. Ведь в случае ошибки в старшем значащем бите (MSB) величина погрешности будет в 2L раз (где L — длина слова) больше по сравнению с ошибкой в младшем значащем бите (LSB). Данная проблема усугубляется тем, что системы обнаружения и коррекции ошибок (например, реализованные в проигрывателях дисков AudioCD) функционируют без учета этой особенности. Как следствие, при превышении определенного уровня плотности ошибок в процессе считывания или передачи многоразрядной цифровой записи происходит быстрая деградация последней.
И наконец, нельзя не обратить внимания на то, что для передачи однобитного потока можно использовать более простые методы коммутации и синхронизации. Соединение может осуществляться лишь одной парой проводников (как в аналоговой технике), и к тому же нет необходимости организации буфера для хранения многоразрядного слова. Да и пресловутый эффект джиттера, о котором так любят рассуждать ценители качественного звука, оказывает на однобитный поток значительно меньшее влияние, чем на многоразрядный.
Разумеется, как и у любого технического решения, у ШИМ-преобразования есть свои недостатки. Оцифрованный таким способом сигнал содержит большое количество шума. Для борьбы с ним применяется технология формирования шума (noise shaping). Суть ее заключается в перераспределении спектра шумов квантования таким образом, чтобы по возможности сдвинуть его за пределы слышимого диапазона, как правило, в сторону более высоких частот (область ультразвука). Нужный эффект достигается за счет применения ряда схемотехнических решений — частотных фильтров высокого порядка и цепей отрицательной обратной связи. Благодаря нелинейной АЧХ нашего слухового аппарата субъективно воспринимаемый уровень шумов, сдвинутых в высокочастотную область, будет гораздо ниже, чем при равномерном распределении по всему диапазону.
DSD для всех
Как уже было упомянуто, изначально DSD-формат был разработан исключительно для студийных нужд — мастеринга и архивного хранения цифровых фонограмм. Однако впоследствии была предпринята попытка внедрить эту технологию и в бытовом оборудовании.
В начале минувшего десятилетия был разработан новый формат аудиодисков — Super AudioCD (SACD). Принципиальным отличием этих дисков от AudioCD и DVD Audio было то, что цифровые фонограммы на них представлены в формате DSD с частотой дискретизации 2,8224 МГц. Однако выбор такого решения для продвижения новой (в сегменте потребительского оборудования) технологии в сложившихся на тот момент обстоятельствах оказался крайне неудачным.
Дебют носителей SACD состоялся в тот момент, когда уже стремительно набирал обороты процесс разрушения казавшейся еще недавно неразрывной связи физических носителей и медиаконтента. Одним из неизбежных следствий перехода к хранению изображений, звуко и видеозаписей в цифровом виде стала легкость копирования медиаконтента с одного носителя на другой, передачи на различные устройства и ПК по локальной сети или через Интернет и т.д. Если раньше для того, чтобы послушать новый альбом любимого исполнителя, необходимо было идти в магазин за пластинкой или компактдиском, то теперь можно не вставая со своего кресла за считаные минуты загрузить файлы с записями из Интернета на винчестер ПК или в мобильное устройство, а затем скопировать их на USB-флэшку, SD-карточку, во встроенную память портативного медиаплеера и т.д. Естественно, что в таких условиях попытка внедрения нового типа носителя звуковых записей, к тому же несовместимого с ранее выпущенными CD- и DVD-проигрывателями, была обречена на провал.
Проигрыватели с поддержкой дисков формата SACD
так и не получили широкого распространения
Понятно, что звукозаписывающие компании и производители воспроизводящих устройств кровно заинтересованы в том, чтобы распространять записи именно на физических носителях. Однако такой подход не устраивает конечных пользователей, которые уже в полной мере оценили преимущества хранения медиаконтента в виде файлов, не привязанных к тому или иному физическому носителю.
Для хранения, редактирования и мастеринга звуковых записей, оцифрованных методом ШИМ-преобразования, в 2000 году был разработан специальный файловый формат — Direct Stream Digital Interchange File Format (DSDIFF). Запись цифрового потока осуществляется без какого-либо сжатия, вследствие чего такие файлы занимают много места. Так, для хранения одной минуты монофонической записи в DSD с частотой дискретизации 2,8224 МГц требуется примерно 20 Мбайт. Это больше, чем занимает запись несжатого PCM-сигнала той же продолжительности, оцифрованного с частотой дискретизации 96 кГц и разрядностью 24 бита.
Позднее был разработан файловый формат Direct Stream Transfer (DST), в котором реализован алгоритм сжатия записываемого потока без потерь. Это позволило уменьшить объем файлов и снизить требования к ширине полосы пропускания интерфейсов, используемых для их передачи. В 2005 году формат DST стал частью стандарта MPEG-4 Audio (ISO/IEC 14496-3:2001/Amd 6:2005).
Хотя сейчас звуковые записи в виде файлов DSD и DST можно без особого труда отыскать на просторах Всемирной паутины, широкого распространения они пока не получили. Главная причина невостребованности фонограмм в однобитных форматах среди конечных пользователей объясняется тем, что львиную долю парка бытовых звуковоспроизводящих устройств составляют аппараты, оборудованные ЦАП с многоразрядным ИКМ-преобразованием. Именно поэтому современные меломаны предпочитают хранить в своих виртуальных фонотеках записи в форматах FLAC, APE и т.п.
В настоящее время существуют различные программы (в частности, Sony DSD Direct Player, TEAC HR Audio Player, HQPlayer Desktop, Korg AudioGate и т.д.), которые позволяют воспроизводить записи формата DSD на любом ПК, оборудованном звуковым адаптером. Однако в нынешней ситуации подобные решения полезны главным образом как инструменты для конвертации DSD-записи в один из многоразрядных форматов. Воспользоваться же преимуществами одноразрядной записи при воспроизведении DSD- и DST-файлов посредством таких приложений не получится. Дело в том, что в процессе воспроизведения записей этих форматов сначала осуществляется преобразование DSD-потока в многоразрядный, который затем транслируется на звуковую карту. Для того чтобы оценить преимущества одноразрядной записи, потребуется специальная воспроизводящая аппаратура.
Вторая попытка
В последнее время производители звуковоспроизводящего оборудования для потребительского сегмента стали вновь проявлять интерес к реализации поддержки однобитных форматов в выпускаемых устройствах. Разумеется, речь пока идет лишь о дорогих продуктах, созданных для искушенных ценителей качественного звука. И это вполне логично, учитывая то, что потребности подавляющего большинства пользователей бюджетных аппаратов в полной мере удовлетворяет уровень качества фонограмм, записанных в сжатых форматах вроде MP3, AAC и пр.
В начале мая на проходившей в Мюнхене выставке High End 2013 компания Buffalo продемонстрировала опытный образец NAS-накопителя серии LinkStationPro, в числе возможностей которого предусмотрена трансляция аудиозаписей формата DSD на DLNA-совместимые устройства через локальную сеть. Реализована данная функция совместными усилиями специалистов компаний Buffalo Technology и PacketVideo Corporation (последняя известна как разработчик программного обеспечения Twonky MediaServer). По мнению Масаказу Араки (Masakazu Araki), возглавляющего отдел маркетинга компании Buffalo, внедрение функции передачи DSD-потока произведет поистине революционные изменения в сегменте бытового звуковоспроизводящего оборудования класса high end.
В ближайшее время функция воспроизведения записей в формате DSD станет доступной владельцам портативного Hi-Fi-аудиоплеера iriver AK120, который был анонсирован несколько месяцев назад. Данная возможность будет реализована в новой версии микропрограммы этого устройства. Хотя iriver AK120 формально относится к категории портативных плееров, благодаря наличию входа и выхода цифрового оптического интерфейса S/PDIF его можно задействовать и как элемент стационарного оборудования, например в качестве внешнего ЦАП или источника цифрового сигнала.
Портативный аудиоплеер iriver AK120
Пока сложно сказать, чего здесь больше: маркетинговой составляющей или реальной возможности получить преимущество по тем или иным показателям при воспроизведении однобитной записи. Очевидно, что резервы экстенсивного развития многоразрядных форматов практически исчерпаны. Дальнейшее увеличение частоты дискретизации и разрядности цифровой записи в современных условиях утратило всякий смысл. Движение в этом направлении приводит к заметному увеличению объема файлов, в то время как ощутить разницу уже невозможно даже при прослушивании на аппаратуре класса high end в специально оборудованном помещении. В такой ситуации реализация поддержки формата DSD позволяет как минимум создать видимость качественного развития. А это крайне важно с точки зрения продвижения новых моделей.
Необходимо учитывать и то, что сейчас происходят значительные изменения в сегменте звуковоспроизводящей аппаратуры классов Hi-Fi и high end. Если ранее подобные устройства были ориентированы главным образом на воспроизведение фонограмм с физических носителей (грампластинок, CD, HDCD, DVD Audio), то теперь упор сделан на развитие сетевых функций, обеспечивающих доступ к онлайновым сервисам и взаимодействие с другими элементами «цифрового дома» — медиасерверами, NAS, DLNA-совместимой аппаратурой и т.д.
Учитывая эту тенденцию, интерес к формату DSD выглядит вполне логичным. Благодаря меньшей чувствительности к влиянию ошибок и естественной совместимости с усилителями класса D однобитная цифровая запись гораздо лучше, чем многоразрядная, подходит для трансляции несжатого звукового потока высокого качества с одного устройства на другое по локальной сети.
Вероятно, вторая попытка продвижения формата DSD в бытовом звуковоспроизводящем оборудовании будет куда более успешной. Во всяком случае, объективные предпосылки к этому есть.