В мире реалистичного звука

Сергей Пахомов

Вряд ли можно представить себе современный мультимедийный компьютер без звуковой карты. Она стала таким же неотъемлемым атрибутом, как, скажем, модем или принтер. И если для офисного компьютера необходимость наличия качественной звуковой карты еще можно как-то оспорить, то домашний компьютер без «звука» — это уже не компьютер.

Как правило, домашний компьютер не только предназначен для работы, но и выполняет функции своеобразного семейного центра развлечений, то есть является мультимедийным и ориентирован на компьютерные игры, прослушивание музыки, просмотр видеофильмов и прочие аналогичные задачи. Следовательно, качественный «звук» такому компьютеру крайне необходим. Учитывая возрастающие потребности рынка, практически все производители материнских плат интегрируют звуковые кодеки на саму материнскую плату, что чрезвычайно удобно и недорого. Действительно, к чему приобретать отдельную дорогостоящую звуковую карту, если нечто подобное уже имеется на самой материнской плате? Однако следует иметь в виду, что интегрированные решения предназначены для офисных компьютеров, а для домашних компьютеров могут рассматриваться только в качестве временного решения. Дело в том, что интегрированные звуковые карты далеко не всегда поддерживают многоканальную схему работы (то есть когда к компьютеру можно подключить не две, а, к примеру, сразу шесть колонок). Кроме того, подобные звуковые карты имеют более чем скромные возможности по настройке, невысокое качество звучания и, что немаловажно, в таких решениях зачастую отсутствует аппаратная поддержка алгоритмов обработки звука для создания реалистичного трехмерного звучания. Таким образом, некоторые эффекты в этих интегрированных картах, конечно, могут присутствовать, но достигаются они программным путем, что довольно неэффективно, хотя и дешево. Если кто-нибудь слышал о такой вещи, как софт-модем или бесконтроллерный модем, то разница между данными «ущербными» модемами и классическими аппаратными модемами примерно такая же, как между интегрированными полупрограммными звуковыми картами и классическими аппаратными звуковыми картами. Поэтому достичь высокого реалистичного качества звучания можно только с использованием качественной звуковой карты. Об одной из таких звуковых карт производства компании Philips мы вам расскажем.

Линейка звуковых карт компании Philips довольно разнообразна. Существуют дешевые (бюджетные) звуковые карты Rhythmic Edge PSC702 и Rhythmic Edge PSC703, первая из которых является двухканальной, а вторая — четырехканальной. Имеются и более дорогие решения, предоставляющие большие функциональные возможности: четырехканальная карта Seismic Edge PSC704 и шестиканальная карта Seismic Edge PSC705. Но самой «продвинутой» моделью (правда, и самой дорогой) является звуковая карта Acoustic Edge PSC706. Именно этой шестиканальной карте и посвящена данная статья.

Первое, что бросается в глаза, когда начинаешь всматриваться в эту звуковую карту, — это обилие микросхем. Многие звуковые карты имеют всего по одной микросхеме (однокристальное решение), но к карте Acoustic Edge PSC706 это не относится. Основой карты является звуковой DSP-процессор SAA7785 ThunderBird Avenger. Кроме того, имеются контроллер для обработки цифрового звука Philips TDA1315H, три операционных усилителя NE5532N (по одному на каждый канал) и два кодека SigmaTel STAC9708T и STAC9721T. На самой карте предусмотрены четыре входа: три аналоговых (CD Audio, TAD и AUX) и один цифровой (SPDIF). На планке портов размещены пять разъемов: два разъема mini-DIN, аналоговый вход для микрофона, аналоговый вход LINE IN и разъем для джойстика. Один из разъемов mini-DIN является аналоговым и позволяет с помощью входящих в комплект переходников подключать до шести колонок. Второй такой разъем реализует с помощью входящего в комплект переходника коаксиальный интерфейс S/PDIF (вход и выход).

Впрочем, для непосвященного пользователя в нашем описании может оказаться череcчур много заумных терминов, поэтому попробуем пояснить все это попроще. Начнем с кодеков. Кодек, или цифроаналоговый преобразователь, — это непременный атрибут любой звуковой карты. Именно кодек производит преобразование цифрового сигнала в аналоговый (ЦАП-преобразование) и наоборот (АЦП-преобразование). Любой кодек характеризуется разрядностью, определяющей количество различимых по амплитуде уровней воспроизводимого аналогового сигнала. Если, к примеру, разрядность кодека равна 8, то для представления одного уровня амплитуды используется 8 бит данных. Всего, используя 8 бит данных, можно задать 28=256 различных (то есть различимых между собой) уровней амплитуды сигнала. Для качественного звука такого количества явно маловато, поэтому используются кодеки с разрядностью 16 бит и более. В полупрофессиональных звуковых картах, к которым относится и карта Acoustic Edge PSC706, используются 18-битные кодеки, что позволяет задать 262 144 различных уровней амплитуды (отметим, что в профессиональных картах используются уже 24-битные кодеки).

Другой характеристикой кодеков является частота сэмплирования, или частота отсчетов. Эта частота показывает, сколько раз в течение одной секунды задается или определяется амплитуда аналогового сигнала. Очевидно, что чем выше частота отсчетов и больше разрядность кодека, тем более реалистичный сигнал возможно воссоздать. Не вдаваясь в математические тонкости, скажем, что частота отсчетов определяет максимальную частоту воспроизводимого аналогового сигнала. При этом частота отсчетов должна быть как минимум в два раза больше частоты воспроизводимого сигнала. Поскольку человеческое ухо способно воспринимать сигналы с частотами до 22 кГц (да и это доступно далеко не всем), становится понятным, что для качественного звука потребуются кодеки с частотой сэмплирования не ниже 44 кГц.

В звуковой карте Acoustic Edge PSC706 используются кодеки с частотой сэмплирования 48 кГц. Как уже отмечалось, таких кодеков используется два: SigmaTel — четырехканальный, а STAC9721T — двухканальный. Кодеки соединены по схеме Master-Slave, предусмотренной стандартом AC’97, позволяя тем самым выводить звук на шесть каналов: два фронтальных, два тыловых, один центральный и один сабвуферный.

Особое внимание хотелось бы уделить звуковому DSP-процессору SAA7785 ThunderBird Avenger. Если говорить в самых общих чертах, то основное назначение звукового процессора состоит в создании реалистичного трехмерного звука. Впрочем, прежде чем продолжить описание и начать перечисление поддерживаемых технологий, сделаем небольшое отступление и поясним, что такое трехмерный звук и для чего он нужен.

Трехмерный звук есть не что иное, как позиционируемый звук, то есть такой звук, все характеристики которого зависят от местоположения источника звука в трехмерном пространстве. Естественно, одного лишь позиционирования недостаточно для воссоздания реалистичного звучания, но технология 3D-звука — это основа основ. К примеру, если вы играете в компьютерную игру, то звук, воспроизводимый движущимся объектом, должен зависеть и от его положения в пространстве, и от скорости движения, и от наличия препятствий, и даже от среды распространения этого звука. Только тогда можно говорить о реалистичном звучании.

Для получения 3D-звука используются сложные математические модели, соответствующие особенностям восприятия звука человеком. Широкое распространение получили так называемые функции HRTF (Head-Related Transfer Function). Для создания библиотек HRTF используется специальный искусственный манекен KEMAR (Knowles Electronics Manikin for Auditory Research), в «уши» которого встраиваются микрофоны. Звук воспроизводится источниками, расположенными вокруг манекена, а запись осуществляется с микрофонов. В результате запись от каждого микрофона представляет собой звук, «прослушанный» соответствующим ухом манекена с учетом всех изменений, которые звук претерпел на пути к уху. Расчет HRTF производится с учетом исходного звука и звука, услышанного манекеном. При этом для наушников, двух, четырех и шести колонок используются совершенно разные алгоритмы. Так, при использовании наушников задача воспроизведения 3D-звучания относительно проста, поскольку в этом случае левое ухо способно слышать только звук левого наушника, а правое ухо — только правого. При использовании же пары колонок левое ухо слышит звук как левой колонки, так и частично правой, что нежелательно. Для компенсации такого явления используется метод cross-talk-cancelled.

На сегодняшний день разработано достаточно много алгоритмов (интерфейсов) создания трехмерного звука. Конечно, все эти алгоритмы актуальны прежде всего для компьютерных игр (не стоит надеяться на то, что высокопроизводительный звуковой процессор на карте сможет хоть как-нибудь улучшить звучание музыкального компакт-диска). Для того чтобы иметь возможность наслаждаться реалистичным трехмерным звуком, необходимо, чтобы, во-первых, сама компьютерная игра поддерживала ту или иную технологию, а во-вторых, чтобы звуковая карта (точнее, ее процессор) осуществляла аппаратную поддержку данной технологии (возможна и программная реализация, однако о качестве такого решения лучше промолчать).

Рассмотреть все разработанные интерфейсы в рамках одной статьи мы не можем, поэтому вкратце расскажем лишь о некоторых из них. Среди наиболее распространенных интерфейсов следует выделить DirectSound3D, который, как правило, используется совместно с расширением EAX 1.0 и EAX 2.0. Интерфейс EAX (Environmental Audio Extensions), разработанный компанией Creative, позволяет учесть особенности распространения звука в реальной окружающей среде. Например, предусматриваются такие эффекты, как реверберация (отражение звука), а в версии EAX 2.0 добавлены эффекты прохождения звука через препятствия (occlusions) и эффекты взаимодействия звука со звуконепроницаемыми препятствиями (obstructions), то есть дифракция звука. Для создания реалистичного звука в EAX используются готовые схемы, или пресеты. Такой подход имеет как плюс — вычислительные мощности компьютера не задействуются чрезмерно интенсивно, так и минус — если игра интерактивная, то звучание может быть не вполне реалистичным, поскольку заранее просчитать все возможные комбинации невозможно.

Если технология EAX является статичной по своей природе, поскольку основана на заранее определенных схемах, то API-интерфейс A3D, разработанный ныне не существующей компанией Aureal, позволяет в реальном времени производить расчет 3D-звучания. Первая версия A3D по своим функциональным возможностям приблизительно соответствует DirectSound3D, однако имеет ряд дополнительных возможностей, таких, например, как менеджер ресурсов, управляющий звуковыми потоками. В версии A3D 2.0 добавлена технология Wavetracing, позволяющая учитывать эффекты отражения звука и прохождения сквозь препятствия. Главной особенностью A3D является расчет эффектов в реальном времени, то есть по мере изменения расположения источников звука в игре меняется и 3D-звуковая картина. Естественно, это предъявляет повышенные требования к вычислительным ресурсам как звукового, так и центрального процессора системы и сказывается на количестве воспроизводимых кадров в секунду (fps), зато получается довольно реалистичная картина звучания.

Следующей технологией создания 3D-звука является технология Q3D от компании Qsound, которая позволяет создавать достаточно реалистичный трехмерный звук; и здесь наиболее важно, что для ее реализации не требуется столько вычислительных ресурсов, как для A3D, использующей расчет в реальном времени. В основе технологии Q3D для воспроизведения 3D-звука лежат все те же HRTF-функции, однако при вычислении этих функций упор делается не только на математику, но и на восприятие звука конкретными людьми. Влияние окружающей среды учитывается за счет использования технологии QEM (QSound Environmental Modeling), совместимой с EAX.

Разобравшись с технологиями реализации трехмерного звука, можно перейти непосредственно к особенностям звукового процессора SAA7785 ThunderBird Avenger. Процессор является 16-разрядным, сочетает функции по параллельной обработке аудиоданных и возможность программирования для создания специальных эффектов и полностью совместим с технологиями компании QSound по позиционированию звука. Поддерживается аппаратное ускорение следующих алгоритмов QSound 3D (Q3D):

  • 3D-позиционирование звука с использованием наушников, 2, 4 и 5.1 колонок;
  • QSound3DInteractive — технология создания трехмерного позиционирования звука, аналогичная DirectSound3D);
  • QSound Multi Speaker System — технология преобразования стереозвука в 4- или 5.1-канальное воспроизведение);
  • QEX (QSound Environmental Modeling) — технология учета окружающей среды при распространении звука, совместимая с интерфейсами EAX 1.0/2.0 и I3D Level 2.0;
  • Qxpander — технология преобразования стереозвука в 3D-звук на двух акустических колонках.

Но только лишь одной аппаратной поддержкой алгоритмов QSound процессор SAA7785 ThunderBird Avenger не ограничивается. Так, процессор одновременно обрабатывает до 256 потоков DirectSound и до 96 потоков DirectSound3D. Поддерживается полнодуплексный режим работы, частота сэмплирования 48 кГц на запись и воспроизведение, реализована совместимость с интерфейсами DirectSound, DirectSound3D, EAX 1.0/2.0, I3DL2 и A3D 1.0. Кроме того, имеется интегрированный 64-канальный аппаратный wavetable-синтезатор и программный 256-голосный XG-синтезатор.

Еще одно функциональное устройство, на котором мы остановимся, — это ресивер/трансмиттер Philips TDA1315H для обработки цифрового аудио. Именно этот функциональный блок отвечает за цифровой интерфейс S/PDIF. Большинство современных звуковых карт имеют интерфейс S/PDIF (напомним, что этот интерфейс является совместной разработкой компании Sony и Philips — Sony/Philips Digital Interface, так что было бы странно, если бы на звуковой карте Philips Acoustic Edge PSC706 он не присутствовал). Интерфейс S/PDIF поддерживает частоты сэмплирования 32, 44,1 и 48 кГц с разрядностью до 24 бит. S/PDIF-выход поддерживает также режим вывода цифрового потока AC3.

Рассмотрев функциональные возможности звуковой карты, перейдем к тестированию. Для тестирования звуковой карты мы воспользовались известной программой RightMark Audio Analyzer 3.4, которая позволяет снимать практически все характеристики звуковой карты и представлять их в графическом и цифровом виде. Наиболее важными характеристиками являются амплитудно-частотная характеристика канала (АЧХ), уровень шума, динамический диапазон, нелинейные искажения, интермодуляционные искажения и взаимное проникновение каналов.

Для проведения тестирования использовалась следующая конфигурация рабочей станции:

  • процессор Intel Pentium 4 2 ГГц;
  • оперативная память DDR266 1024 Мбайт;
  • материнская плата ABIT BD7L с чипсетом i845D;
  • видеокарта ASUS V8200 (GeForce3);
  • RAID-массив уровня 0 из двух дисков IBM IC35L040AVVA07-0.

В качестве операционной системы была выбрана ОС Windows XP Professional. Хотя в комплект поставки драйверы под Windows XP не включены, их можно скачать с сайта технической поддержки Philips. Мы использовали последнюю версию драйвера 5.12.1.10.

Мы тестировали как аналоговый тракт карты, так и цифровой. При исследовании аналогового тракта образовывалась петля обратной связи, для чего линейный выход аудиокарты замыкался на линейный вход с помощью экранированного кабеля длиной 20 см. Впрочем, как показали дальнейшие исследования, характеристики используемого кабеля практически не сказываются на результатах тестирования.

При тестировании использовались различные частоты дискретизации (44 100 Гц, 480 00 и 96 000 Гц) и разная разрядность (8 и 16 бит). При этом применялся режим вывода звука на две фронтальные колонки (схема 2.0). Результаты тестирования и оценки мы сгруппировали в две таблицы: табл. 1 соответствует 8-битному режиму квантования, а табл. 2 — 16-битному.

Расскажем о результатах тестирования более подробно.

Неравномерность АЧХ — это характеристика, показывающая, насколько точно передается амплитуда сигнала во всем спектральном диапазоне. В идеале АЧХ является строго прямой, то есть все частоты передаются одинаково. В действительности же уровни сигнала на разных частотах различны, и если звуковая карта не обеспечивает равномерности частотных характеристик, то пользователь ощутит характерные искажения сигнала. Неравномерность АЧХ измеряется в децибелах, причем учитываются максимальные отклонения от номинального уровня вверх и вниз.

Уровень шума, измеряемый в децибелах относительно номинального уровня сигнала, является характеристикой, определяющей, насколько «шумят» сами микросхемы звуковой карты.

Динамический диапазон — это запас по динамике звука между порогом из шумов и началом перегрузки акустических систем и усилителя. Измеряется динамический диапазон в децибелах, и чем показатель больше, тем лучше.

Коэффициент нелинейных искажений — некий интегральный показатель, который характеризует нелинейные искажения для данной системы. Измеряется коэффициент нелинейных искажений в процентах, которые определяют степень отклонения передаточной характеристики устройства от линейной.

Реальный сигнал включает частоты, на порядок отличающиеся друг от друга по значению. Вследствие нелинейности звукового тракта могут образовываться паразитные модуляционные гармоники, искажающие звучание. Для учета паразитных гармоник вводят коэффициент взаимной модуляции, характеризующий интермодуляционные искажения звуковой карты. Коэффициент взаимной модуляции принято измерять в процентах.

Другим типом искажений, характерным для звуковых карт, является взаимопроникновение стереоканалов. Степень такого влияния каналов друг на друга принято измерять в децибелах. Данная характеристика показывает, насколько качественно выполнено разделение каналов в звуковой карте. Чем ниже степень взаимопроникновения, тем лучше. Измерение степени взаимопроникновения проводятся на трех частотах: 100 Гц, 1 кГц и 10 кГц.

В целом по результатам тестирования можно сделать следующие выводы. При 8-битном квантовании показаны явно невысокие результаты (что, впрочем, вполне закономерно). Правда, относиться к этим результатам нужно осторожно, так как в данном тесте не анализируются возможности самой карты. Естественно, что при такой разрядности высок уровень шумов (шумов квантования), соответственно и все остальные результаты будут заведомо невысокими на любой звуковой карте.

При использовании 16-битного квантования результаты получаются значительно более высокие. Понятно, что при такой разрядности квантования уменьшается уровень шума. Нетрудно заметить, что оптимальным режимом для карты является режим с частотой сэмплирования 48 000 Гц (напомним, что эта частота является «родной» для кодеков карты). А вот пересчет в частоту сэмплирования 96 000 Гц приводит к негативным последствиям и прежде всего это сказывается на неравномерности AЧХ. Для сравнения на рис. 1 и рис. 2 приведены АЧХ при частоте дискретизации 48 000 и 96 000 Гц.

Аналогичным образом исследовался цифровой тракт карты, для чего с помощью коаксиального кабеля S/PDIF-выход замыкался на S/PDIF-вход. Результаты тестирования сведены в табл. 3 и 4.

Как и в предыдущем случае, оптимальной является 16-битное квантование с частотой дискретизации 48 000 Гц. Единственное, что вызывает некоторое недоумение, — это достаточно высокий уровень неравномерности АЧХ (рис. 3, 4). В целом же результаты тестирования (как, впрочем, и ожидалось) были достаточно высокими.

Приведенные выше результаты тестирования характеризуют звуковую карту прежде всего по качеству формирования и обработки звукового сигнала, то есть фактически по качеству воспроизведения. При этом осталась неисследованной способность карты поддерживать 3D-эффекты, столь важные в компьютерных играх. Для того чтобы исследовать возможности процессора звуковой карты, мы попытались протестировать карту на реальных игровых приложениях QUAKE III и Unreal Tournament. Измеряемым параметром в этом случае является количество воспроизводимых кадров в секунду (fps), а для оценки возможностей звукового «движка» один раз замеры производились без поддержки 3D-звуковых эффектов, а второй — с включением поддержки. Так, для QUAKE III один раз тест запускался в режиме без звука, а второй раз — в режиме DirectSound. Для игры Unreal Tournament первый прогон соответствовал режиму DirectSound, а второй — режиму A3D/EAX. Однако при использовании достаточно мощной конфигурации компьютера уловить разницу в количестве fps нам не удалось. Звуковая карта прекрасно справлялась со своими функциями, и никаких торможений в игре не наблюдалось.

В заключение хотелось бы сказать несколько слов о комплектации звуковой карты Philips Acoustic Edge PSC706. В комплект поставки входит два компакт-диска. Первый из них содержит драйверы под различные операционные системы, а также полезные программные утилиты: Siren XPress (mp3/CD-плейер с возможностью создания каталога медиафайлов), Acid XPress (многоканальный редактор для создания современной музыки из сэмплов и закольцованных фрагментов) и AudioPix (утилита для создания mpg-файлов из mp3-формата).

Отметим также, что процесс инсталляции драйверов происходит крайне просто и после этого становится доступной утилита настройки звуковой картой.

 

Редакция выражает признательность представительству компании Philips (http://www.philips.ru/) за предоставление для обзора звуковой карты Philips Acoustic Edge PSC706.

КомпьютерПресс 8'2002