ATI CrossFire
30 мая прошлого года компания ATI Technologies анонсировала свою технологию ATI CrossFire, что стало ответным ходом на представленное ранее решение компании NVIDIA Corporation — NVIDIA SLI, открывшее возможность для повышения производительности графической подсистемы путем объединения двух видеокарт. Специалисты компании ATI Technologies реализовали в своей технологии ряд инноваций, к примеру возможность работы в четырех режимах формирования кадра: Scissor, Alternate Frame Rendering, SuperTiling и Super AA, благодаря которым их решение с успехом могло бы конкурировать с NVIDIA SLI. На деле перспективы первых продуктов ATI CrossFire оказались не столь радужными, как это предполагали производители. Причиной тому стали, во-первых, ограничения самой технологии, например ограничение по максимальному разрешению и частоте обновления кадров (при разрешении 1600x1200 точек максимально доступная частота обновления кадра составляет 60 Гц), что обусловлено пропускной способностью канала связи между картами, работающими в тандеме. Во-вторых, недостаточная популярность чипсетов, способных обеспечить поддержку этой технологии, и материнских плат, на них построенных (в первое время после анонса реализовать технологию CrossFire можно было только на материнских платах, построенных на наборе микросхем ATI RADEON Xpress 200 CrossFire Edition). Однако после не совсем удачных первых решений CrossFire, представленных в сериях RADEON X800 и RADEON X850, появилось новое поколение видеокарт с поддержкой этой технологии. В данном обзоре мы расскажем о том, как были исправлены недостатки первого поколения CrossFire в новых продуктах семейства ATI RADEON X1K, и попробуем на практике оценить те возможности, которые откроет нам использование этой технологии. В качестве объекта для рассмотрения реализации данной технологии в семействе тысячников мы выбрали CrossFire-решение для самой производительной сегодня серии Х1900 от компании ATI Technologies — ATI RADEON X1900 CrossFire Edition, взяв в качестве второй графической карты топовую модель ATI RADEON X1900 XTX.
Но прежде чем перейти к рассмотрению технической стороны реализации технологии CrossFire, отметим, что способствовать ее популяризации будет поддержка данной технологии материнскими платами на чипсетах Intel (Intel 975X Express). С появлением новых процессоров Intel Core 2 Duo это позволит составить серьезную конкуренцию так популярной ныне в топовых решениях связке: процессор AMD Athlon 64 + SLI-тандем видеокарт на графических чипах от компании NVIDIA Corporation. Однако следует сделать одну оговорку: в свете последних событий (слияние компаний AMD и ATI) союз ATI и Intel может вскоре распасться, хотя пока этот брак по расчету приносит пользу обоим. Стоит также отметить, что теоретически такая технология мультирендеринга, как ATI CrossFire, способна работать на любой материнской плате, поддерживающей работу двух слотов PCI Express x16. Таким образом, одну из проблем неудачного дебюта технологии CrossFire, связанную с непопулярностью поддерживающих ее материнских плат, можно считать решенной, ведь топовые решения на чипсете Intel 975X Express всегда найдут своего покупателя. Небольшая доработка технической реализации этой технологии сняла и еще одно препятствие — ограничение по величине максимально поддерживаемого разрешения и частоте обновления кадров. Так, в видеокартах серий CrossFire Edition RADEON X800 и RADEON X850 для связи с ведомой картой, которая была организована посредством интерфейса DVI, использовался один TMDS-ресивер, обеспечивающий канал с полосой пропускания 165 мегапикселов в секунду, а для вывода уже объединенного в ядре совмещения (Compositing Engine) кадра — один TMDS-трансмиттер с аналогичной полосой пропускания. Максимум, который мог обеспечить такой канал сопряжения, — это разрешение 1600x1200 точек при частоте обновления кадров 60 Гц. Реализация технологии CrossFire в видеокартах семейства Х1000 предусматривает использование двухканальных линий связи ядра совмещения, для чего теперь используется пара TMDS-ресиверов и TMDS-трансмиттеров, работающих в режиме dual link с суммарной частотой передачи 330 мегапикселов в секунду, что позволяет поддерживать разрешение QXGA (2048x1536 точек) при частоте обновления кадров 75 Гц. Если рассматривать конкретную реализацию Compositing Engine и сопутствующих линий сопряжения на примере видеокарты Sapphire RADEON X1900 CrossFire Edition, то, сняв радиатор охлаждения, можно увидеть, что в качестве пары TMDS-ресиверов используются чипы Silicon Image SiI 163B, в качестве TMDS-трансмиттеров — Silicon Image Sil178, для вывода видеосигнала в аналоговом виде — RAMDAC ADV7123 от Analog Devices, Inc.; само же ядро Compositing Engine реализовано программируемой матрицей FPGA Xilinx XC3S400, которая применялась для сборки кадра в мастер-картах CrossFire и прежде (рис. 1).
Рис. 1. Compositing Engine графической карты Sapphire RADEON X1900 CrossFire Edition
И уж раз мы заглянули под радиатор, отметим, что на плате Sapphire RADEON X1900 CrossFire Edition в качестве видеопамяти используются восемь 512-мегабитных GDDR3 SDRAM-чипов Samsung K4J52324QC-BJ12 со временем выборки 1,2 нс. Таким образом, общий объем видеопамяти этой графической карты составляет 512 Мбайт, при этом для работы с памятью используется 256-битный интерфейс, «общение» по которому происходит с частотой 725 МГц (эффективная частота 1450 МГц). Основой для создания этой видеокарты послужило графическое ядро ATI Radeon 1900 XT (R580), работающее на частоте 625 МГц. Не будем останавливаться на описании всех возможностей этого графического чипа (о нем уже подробно рассказывалось на страницах нашего издания), скажем лишь, что данная мастер-карта обладает всей мощью топовых решений серии X1900. Попробуем сравнить ее с обычной (CrossFire Ready) видеокартой серии X1900, например с Sapphire RADEON 1900 XTX, построенной на самом производительном сегодня графическом ядре от ATI Technologies — ATI Radeon 1900 XTX, частота работы которого составляет 650 МГц при эффективной частоте шины памяти 1550 МГц (хотя по сути это все тот же чип R580). Отличие у этих графических плат проявляется только в части выходного интерфейса, сопряженного с графическим ядром: у решения CrossFire Edition реализован Compositing Engine с соответствующей обвязкой, у обычного варианта видеоадаптера этого нет, зато имеется чип видеозахвата ATI RageTheater (рис. 2 и 3).
Рис. 2. Sapphire RADEON X1900 CrossFire Edition (без радиатора) | Рис. 3. Sapphire RADEON X1900 XTX (без радиатора) |
При установленной системе охлаждения эти видеокарты можно различить разве что по едва заметному за коробом вентилятора чипу TMDS-ресивера (сверху) и TMDS-трансмиттера (снизу), если, конечно, не брать в расчет наклейку, на которой указано наименование графической карты (рис. 4 и 5).
Рис. 4. Sapphire RADEON X1900 CrossFire Edition | Рис. 5. Sapphire RADEON X1900 XTX |
Кратко рассмотрев некоторые особенности реализации CrossFire, перейдем к практической части и попытаемся оценить на примере некоторых тестов и приложений, что может дать пользователю применение тандема видеокарт, объединенных с помощью данной технологии. Для проведения тестирования мы использовали тестовый стенд следующей конфигурации:
- процессор — Intel Core 2 Extreme X6800;
- материнская плата — Intel D975XBX (чипсет Intel 975X Express);
- оперативная память — DDR2 667 Kingston HyperX KHX6000D2K2/1G (2x512 Мбайт);
- тайминги памяти:
- CAS Latency — 5,
- RAS to CAS Delay — 5,
- Row Precharge — 5,
- Active to Precharge — 15;
- дисковая подсистема — два диска Seagate Barracuda 7200.7 объемом 120 Гбайт, организованные в RAID 0, файловая структура NTFS.
Для оценки производительности использовался набор тестовых сцен для популярных игр:
- Quake 4 (Patch 1.05 при активированном режиме поддержки мультипроцессорности);
- Half-Life 2;
- Far Cry (Patch 1.33);
- DOOM 3 (Patch 1.3).
Кроме того, применялись тестовые пакеты FutureMark 3DMark 2005 и FutureMark 3DMark 2006. Тестирование проводилось под управлением операционной системы Windows XP Professional SP2, причем частота строчной развертки монитора устанавливалась равной 75 Гц, а глубина цвета — 32 бит. Для всех видеокарт использовался видеодрайвер ATI Catalyst 6.7.
Для запуска игровых тестов применялась утилита BenchemAll 2.652beta. Все игровые тесты запускались по три раза при различных разрешениях экрана: 640x480, 800x600, 1024x768, 1280x1024, 1600x1200 точек. При этом тестирование проводилось для двух вариантов настройки качества изображения (табл. 1).
Для оценки прироста производительности, который обеспечивает применение технологии CrossFire, в качестве спарринг-партнера для CrossFire-тандема (Sapphire RADEON X1900 CrossFire Edition + Sapphire RADEON X1900 XTX) мы выбрали видеокарту Sapphire, основанную на графическом ядре ATI RADEON X1900 XTX, которое в настоящее время является самым производительным решением от ATI Technologies. Контроль рабочих характеристик показал, что, как и следовало ожидать, в случае CrossFire-конфигурации тандем карт работает с частотными характеристиками наиболее медленной из них (см. рис. 1), то есть Sapphire RADEON X1900 CrossFire Edition, построенной на чипе ATI Sapphire RADEON X1900 XT (частота ядра — 621 МГц, частота графической памяти — 720 МГц (эффективная — 1440)) (рис. 6).
Рис. 6. Рабочие параметры CrossFire-тандема Sapphire RADEON X1900 CrossFire Edition + Sapphire RADEON X1900 XTX
Таким образом, видеокарта Sapphire RADEON X1900 XTX, работая самостоятельно, имеет лучшие частотные характеристики: частота графического ядра 641,25 МГц при частоте работы шины памяти 774 МГц (эффективная — 1548 МГц) (рис. 7).
Рис. 7. Рабочие параметры видеокарты Sapphire RADEON X1900 XTX
Из приведенных рисунков видно, что в 2D-режиме обе конфигурации работают на пониженных и при этом одинаковых частотах: частота графического ядра 499,5 МГц и частота шины памяти 594 МГц.
Прежде чем перейти к рассмотрению результатов тестирования, скажем несколько слов о возможных режимах обработки кадра, поддерживаемых CrossFire-системами. Итак, технология CrossFire предусматривает четыре различных режима рендеринга кадра:
- Scissor — кадр разбивается пополам, при этом верхняя его часть обрабатывается одним графическим процессором, а нижняя — другим;
- SuperTiling — каждая видеокарта рендерит кусочки изображения размером 32x32 пиксела, расположенные в шахматном порядке, что обеспечивает более равномерное распределение нагрузки между графическими ядрами;
- Alternate Frame Rendering — обеспечивает наиболее сбалансированное распределение нагрузки между видеокартами, что достигается за счет того, что каждая из них рендерит свой кадр, при этом кадры выводятся на экран по очереди. Таким образом, каждая графическая карта обрабатывает лишь половину от общего числа кадров;
- Super Antialiasing — позволяет получить наилучшее качество изображения, что достигается за счет того, что каждая видеокарта рендерит один и тот же кадр, используя разные схемы антиалиазинга, что реализуется для дополнительных режимов FSAA 8x, 10x, 12x и 14x.
При включенной функции Catalyst A.I. выбор режима рендеринга происходит автоматически, в зависимости от конкретного приложения. В случае если приложение не идентифицируется Catalyst A.I. или функция Catalyst A.I. отключена, то используется режим по умолчанию (SuperTiling для Direct3D, Scissor для OpenGL). Режим Alternate frame rendering включается только для приложений, идентифицированных Catalyst A.I. Режим Super Antialiasing включается через Catalyst Control Center при выборе FSAA 8x/10x/12x или 14x.
Таким образом, можно предположить, что в режиме CrossFire в нашем случае игровые тесты Doom 3, Quake 4 и Half-Life 2 (API OpenGL) выполнялись в режиме Scissor, а для игры Far Cry и тестовых пакетов FutureMark 3DMark 2005 и FutureMark 3DMark 2006 (API DirectX) использовался режим SuperTiling.
Теперь обратимся к результатам проведенного нами тестирования (табл. 2).
Как следует из приведенных в табл. 2 данных, эффект от использования тандема карт, объединенных на основе технологии CrossFire, оказался весьма ощутимым. Особенно заметный прирост производительности применение CrossFire-связки дает при установке настроек высокого качества изображения и при использовании больших значений разрешения экрана, что ведет к увеличению нагрузки на графическую подсистему. Например, в специализированных тестах, способных наиболее эффективно использовать всю мощь графической подсистемы, коими являются пакеты FutureMark 3DMark 2005 и FutureMark 3DMark 2006, прирост производительности для разрешения 1600x1200 точек при высоком качестве картинки превысил 60% (64,07 и 66,65% соответственно), да и в играх он оказался весьма ощутимым: 44,3% в Half-Life 2, 43,47% в Quake 4 и 35,4% в DOOM 3 (разрешение 1600x1200 точек при использовании настроек для высокого качества изображения). Исключением является игра Far Cry, в которой даже при максимальном качестве и высоком разрешении эффект оказался минимальным: всего 17,5% прироста производительности. Чтобы разобраться, в чем здесь дело, обратимся к диаграммам зависимости производительности, которую в данном случае характеризует количество выводимых в секунду кадров (для игровых тестов), от разрешения экрана, взяв для сравнения три случая: диаграмму для Far Cry (рис. 8), для DOOM 3 (рис. 9) и для FutureMark 3DMark 2006 (рис. 10).
Рис. 8. Диаграмма зависимости производительности от разрешения экрана в тестовой сцене игры Far Cry
Рис. 9. Диаграмма зависимости производительности от разрешения экрана в тестовой сцене игры DOOM 3
Рис. 10. Диаграмма зависимости результата 3DMark Score тестового пакета FutureMark 3DMark 2006 от разрешения экрана
В предыдущих статьях мы уже не раз рассказывали, что пологий участок подобных диаграмм можно интерпретировать как процессорозависимость рассматриваемого теста, а наличие ниспадающего участка говорит о зависимости от производительности графической подсистемы. Таким образом, из приведенных диаграмм следует, что результаты теста, основанного на игре Far Cry, уже при использовании одного графического адаптера Sapphire RADEON 1900 XTX практически на любом разрешении зависят только от производительности процессорной подсистемы и лишь при максимальном разрешении, используемом при проведении тестирования, удается в полной мере загрузить видеоподсистему и начинает проявляться некоторая зависимость результатов от ее производительности, при этом возможности тандема CrossFire остаются не полностью востребованы даже в этом случае. На диаграмме для теста DOOM 3 на графиках для случая использования настроек высокого качества изображения мы можем отчетливо видеть точку перехода от чисто процессорной зависимости производительности системы к условиям, при которых полностью задействуется потенциал графической подсистемы и результат становится функцией от ее производительности (это происходит на разрешении 1024x768 точек). В то же время в тестовом пакете FutureMark 3DMark 2006 зависимость результата от производительности видеоподсистемы наблюдается уже при разрешении 640x480 точек, что, в общем-то, не удивительно — этот тест для того и создавался, чтобы оценить весь потенциал компьютерной системы, в особенности ее графической подсистемы, для использования ее в игровых приложениях.
Из всего вышесказанного можно сделать вывод, что новая реализация технологии ATI CrossFire, реализованная в видеокартах семейства RADEON X1K и, в частности, в картах серии RADEON X1900, — это действенное решение, способное значительно повысить производительность графической подсистемы. Но при использовании данной технологии, как и при выборе любого другого решения для графической подсистемы, не стоит забывать об общей сбалансированности компьютерной системы, иначе эффект от применения технологии будет сведен к минимуму.