Соло-тестирование «Уничтожителя» на GeForce 256

Результаты испытаний графического акселератора Creative 3D Blaster Annihilator1

Олег Денисов, Владимир Богданов

 

nVIDIA соревнуется уже сама с собой

Annihilator — аннулятор, уничтожитель… «терминатор», короче

Коротко о методике и результатах тестирования

nVIDIA соревнуется уже сама с собой

Во времена всеобщей «вудизации» (а всего-то два года прошло) мало кто мог предположить, что тон на рынке непрофессиональных 3D-карт будет задавать компания nVIDIA, начавшая свое успешное восхождение с графического процессора Riva 128. Потом уже были Riva TNT, Riva TNT2, Riva TNT2 Ultra и прочие чипы, названия которых на слуху у каждого геймера. Последняя разработка nVIDIA — чип GeForce 256 — с большой помпой появился у разработчиков 3D-карт осенью прошлого года. Нетерпеливые поклонники игр были вознаграждены на славу. Графический микропроцессор из 23 млн. транзисторов (у Pentium III с кэшем L2 на кристалле — 28 млн. транзисторов) обеспечивал рекордную производительность: скорость обработки треугольников — 15 млн. в секунду, скорость текстурирования — 480 млн. текселей в секунду плюс поддержку текстур размером 2048x2048 текселей с глубиной цвета 32 бита. Своим названием GeForce, очевидно, обязана встроенному геометрическому сопроцессору, отвечающему, в частности, за преобразование координат и установку освещения (Transform & Lighting). Transform — это, грубо говоря, этап обсчета 3D-cцены, при котором 3D-координаты переводятся в двухмерные для их последующего представления на «плоском» экране монитора. A Lighting — это процедура установки освещения для каждого трехмерного объекта. Геометрический же процессор может брать на себя функции клиппинга — урезания невидимых, с точки зрения пользователя, частей перекрывающихся объектов. Аппаратно поддерживается установка восьми источников света для всей сцены. Использование геометрического сопроцессора позволяет радикально снизить нагрузку на центральный процессор компьютера — порой больше, чем на 50%.

Список спецификаций и возможностей нового графического процессора может занять не одну журнальную полосу: частота ядра — 120 МГц, частота 128-разрядной шины памяти — 200 МГц, частота интегрированного RAMDAC (c гамма-коррекцией) — 350 МГц, поддержка AGP 4x, максимальный объем собственной видеопамяти — 128 Мбайт, 256-битное 2D-ядро, четыре конвейера рендеринга (вывод 4 пикселов за такт).

С момента выхода прошло достаточно времени, чтобы многочисленные эксперты сошлись во мнении: GeForce — самый быстрый «непрофессиональный» 3D-процессор и выдающийся 2D-акселератор, несколько даже опередивший свое время.

Примечательно, что процессоры nVIDIA достигли настолько высокого уровня производительности, что корректно сравнивать одни графические чипы nVIDIA с другими ее же процессорами, например Riva TNT2 Ultra с GeForce. Ничего не напоминает? Правильно — так лидер в производстве универсальных х86-микропроцессоров Intel традиционно производит сравнительное тестирование своих новых чипов с их предшественниками. Что ж, теперь и nVIDIA (кстати, Intel — один из ее крупнейших инвесторов) заслуживает такой привилегии.

 

В начало

В начало

Annihilator — аннулятор, уничтожитель… «терминатор», короче

Creative 3D Blaster Annihilator — одна из первых хорошо проявивших себя карт, выполненных по рекомендованному (референсному) дизайну nVIDIA, — пример для подражания другим разработчикам. Как и у большинства аналогичных 3D-карт на борту она несет «всего лишь» 32 Мбайт собственной видеопамяти типа SDRAM (время доступа 5,5 наносекунд). Это, конечно, не самая быстрая память; считается даже, что производительность работы с памятью является «узким местом» для многих карт на GeForce 256 с обычной SDR SDRAM (уже появились графические акселераторы с куда более быстрой памятью типа DDR SDRAM). Независимые испытания (например, проведенные в лаборатории IXBT Hardware, http://ixbt.stack.net/) уже доказали, что в самых тяжелых для пропускной способности памяти режимах (в первую очередь с 32-битным цветом) плата на nVIDIA GeForce 256 с SDR-памятью почти не превосходит по скорости видеокарты на NVIDIA Riva TNT2 Ultra.

При внешнем осмотре в глаза бросается вентилятор активного охлаждения, приклеенный (!) на сильно греющемся графическом процессоре карты. Annihilator, как и все видеокарты на базе nVIDIA GeForce 256, стандартно работают на частоте графического ядра 120 МГц и частоте памяти 166 МГц. Отдельные экземпляры карт Creative разгоняются до 140 и 200 МГц соответственно, достигая в результате теоретической2 пиковой скорости заполнения сцены (fillrate) в 560 мегапикселов в секунду в обычном режиме и 280 мегапикселов — при мультитекстурировании.

Creative 3D Blaster Annihilator оптимизирована для программного проигрывания DVD — загрузка центрального процессора при этой требовательной к ресурсам операции обычно не превышает 50%. И это не удивительно, ведь чипсет GeForce 256 имеет специальные аппаратные алгоритмы проигрывания DVD.

 

В начало

В начало

Коротко о методике и результатах тестирования

Как уже упоминалось, лаборатория «КомпьютерПресс» пошла по пути сравнения результатов тестирования двух поколений графических карт nVIDIA на графических процессорах nVIDIA — Creative 3D Blaster RIVA TNT2 Ultra и Creative 3D Blaster GeForce 256. Испытания проводились по той же методике, что и тестирование видеокарт, опубликованное в КомпьютерПресс 11’99. Драйверы Creative 3D Blaster Annihilator (CT6941) созданы на основе Detonator 3.48, поэтому дополнительно были взяты самые новые официальные драйверы от nVIDIA Detonator 3.53.

Производительность графических плат в 2D-приложениях измерялась с помощью пакета ZD WinBench 99 v1.1, для чего снимались показатели Business Graphics WinMark 99 и High-End Graphics WinMark 99. Все тесты выполнялись в двух видеорежимах: с разрешением 1024x768 пикселов, глубиной цвета 16/32 бита и частотой регенерации 85 Гц.

Для измерения производительности видеокарт в 3D-приложениях был использован набор тестов 3DMark 99 Max Pro — Build 200 (http://www.3dmark.com/), разработанный компанией Futuremark Corporation (http://www.futuremark.com/) и предназначенный для измерения производительности видеоподсистемы в 3D-играх. Из численных результатов, рассчитываемых пакетом, стоит обратить внимание на два основных: 3DMark Score и Synthetic CPU 3D Speed Score, которые измеряются, соответственно, в единицах 3DMarks и CPU 3DMarks. 3DMark Score — это показатель общей реальной производительности компьютера в 3D-приложениях, который зависит от скорости работы как самого видеоадаптера, так и центрального процессора с системной памятью. А Synthetic CPU 3D Speed Score — это синтетический показатель максимально возможного быстродействия подсистемы центрального процессора и оперативной памяти на операциях расчета 3D-объектов. Во время его выполнения графический адаптер в вычислениях не участвует, так что производительность последнего никак не сказывается на значении CPU 3D Speed Score. Все тесты из пакета 3DMark 99 Max Pro — Build 200 выполнялись в четырех видеорежимах: 1024x768 пикселов x16/32 бита x85 Гц и 1280x1024 пикселов x16/32 бита x72 Гц.

Для замеров производительности графического ускорителя с OpenGL-приложениями был использован пакет 3D ExerciZer 1.0, написанный французским программистом Маа Берье (Maa Berriet), который доступен с Web-сайта Intergraph Corporation (http://download.intergraph.com/ics/3DExerciZer.zip/). Пакет состоит из нескольких сцен, во время проигрывания которых измеряется частота вывода кадров (FPS): The Wheel (Texture Stress) — тест на скорость обработки текстур; The Blob (Light Stress) — тест на скорость вычислений при освещении движущегося объекта несколькими источниками света, также передвигающимися; The Explosion (Processor Stress) — расчет траекторий движения большого количества частиц, вылетевших из одной точки, тест на скорость вычислений центрального процессора при операциях с плавающей точкой; Ping and Co (Geometry Stress) — скорость расчета движения трехмерных тел (используется модель человеческого тела) с наложенными текстурами отражения; Introducion и Credits — начальная и завершающая заставки. Все тесты выполнялись в четырех видеорежимах: 1024x768 пикселов x16/32 бита x85 Гц и 1280x1024x16/32 бита x72 Гц.

Конфигурация испытательного стенда: процессор: Intel Pentium III с тактовой частотой 450 МГц; оперативная память — 128 Мбайт (два SDRAM DIMM-модуля по 64 Мбайт с поддержкой SPD и номинальным временем доступа 7 нс, соответствующие спецификации PC100 SDRAM); материнская плата: ASUS-P2B с чипсетом Intel 440BX; жесткий диск: Fujitsu MAC3045SP с интерфейсом Ultra Wide SCSI и емкостью 4,5 Гбайт; SCSI-адаптер: Adaptec 2940 U2W; IDE-дисковод CD-R/CD-RW: Philips PCA460RW; источник бесперебойного питания: PLUS UPS Back Pro 1200VA; ОС Microsoft Windows 98 Second Edition PE.

Как и предполагалось, при работе в двухмерных приложениях уровень производительности карты на GeForce 256 не намного лучше, чем у ее предшественницы на базе графического процессора Riva TNT 2 Ultra — можно ожидать, что карты идут «ноздря в ноздрю». По аналогии с центральными микропроцессорами можно лишь отметить, что на современном этапе добиться заметного роста производительности графического процессора на 2D-операциях едва ли не менее сложно, чем добиться заметного прироста быстродействия ЦП на целочисленных операциях (например, в офисных приложениях).

В среде OpenGL процессор GeForce уходит в безнадежный отрыв от своего преследователя. Так, при обсчете освещенности (показатель Blob) карта Annihilator опережает Blaster TNT 2 Ultra по меньшей мере на 33%, а на расчете траекторий движения — на 15% в разрешении 1024x768. Очевидно, это заслуга геометрического сопроцессора. Обратите внимание, что отрыв заметен при 16-битной глубине цвета. Как только дело доходит до 32 бит — картина смазывается (как мы и предполагали, «узким местом» остается скорость работы с памятью). При более высоком разрешении 1280x1024 картина радикально не меняется, разве что отрыв при 32-битном цвете еще более заметно сокращается.

Да, кто обратил внимание — худшие результаты Creative 3D Blaster Annihilator в тестах Credits можно объяснить несовершенством самой методики обсчета финальной заставки ExerciZer Intergraph Computer Systems 1.0.

При измерении 3D-производительности при помощи тестового пакета 3Dmark 99 Max Pro по показателям 3D Marks можно судить об общей реальной производительности всей видеоподсистемы ПК, которая складывается из показателей эффективности работы графического чипсета, центрального микропроцессора и взаимодействия с системной памятью). Испытания показали, что за счет использования более мощного графического процессора 3D-производительность системы возрастает на 7% в режиме 1280x1024 при 16-битном цвете, а при 32-битном — аж на 35%. Поистине выдающийся результат! Обратите внимание, что речь идет о тесте реальных приложений, а не о синтетическом («страшно далеком от народа»).

Что ж, тестирования убедительно доказали большинство предположений и данных прогностического характера, изложенных во вступлении к статье. GeForce 256 и карта Creative на его основе продемонстрировали очень высокую производительность в 3D-приложениях. «Узкое место» при взаимодействии с памятью мешает реализовать весь потенциал процессора, поэтому он редко демонстрирует убедительное превосходство на режимах с высоким разрешением при 32-разрядном цвете. Тем не менее на реальных приложениях вклад графического процессора в общую производительность системы остается очень заметным. Приятно также, что графический чип GeForce 256 использует наборы SIMD-инструкций AMD 3D Now! и Intel SSE.3

 

КомпьютерПресс 1'2000