NVIDIA 3-Way SLI: стоит ли игра свеч?
Расчет интегральной оценки производительности видеокарт
Интегральная оценка производительности в играх
Определение эффективности теплоотвода
Компания NVIDIA, которая является лидером в производстве графических видеоадаптеров для современных компьютеров, уже давно анонсировала технологию NVIDIA SLI, подразумевающую использование нескольких дискретных графических адаптеров на одной системной плате. Всемирная паутина пестрит различными результатами тестирования данной технологии в самых непредсказуемых вариациях конфигурации. При этом отметим, что некоторые пользователи относятся к этим результатам скептически, другие же восхваляют и превозносят работу в таком режиме. Попробуем разобраться в преимуществах, которые дает пользователю использование этой технологии, а также не забудем указать ее очевидные недостатки. Сразу обратим внимание читателей на тот факт, что, проводя данное тестирование, мы не ставили перед собой задачу получения максимальных показателей в играх или игровых бенчмарках путем разгона частот графических адаптеров, «шаманства» с драйверами видеокарт или оптимизации работы связки «процессор — системная плата».
Zotac GeForce GTX280 AMP!
Стенд для тестирования
Цель данного тестирования — показать различие между производительностью в разных режимах работы видеокарт с и без применения технологии SLI. Безусловно, гонка за количеством кадров в секунду в популярных играх — это увлекательное и азартное занятие, но обычный пользователь будет ориентироваться не только на эти цифры, но и в первую очередь на цену устройств, то есть, другими словами, на первом месте для него стоит соотношение «цена/качество», а не количество fps.
Методика тестирования
В нашу редакцию попали видеокарты на основе самых мощных однопроцессорных графических адаптеров компании NVIDIA — Zotac GeForce GTX280 AMP!. Они были любезно предоставлены нам представительством компании Zotac в России и являются передовыми графическими видеокартами на базе процессоров всемирно известной компании NVIDIA. На данный момент связка технологии 3-Way SLI и трех описанных выше видеокарт дает пользователю максимальную производительность, которую компания NVIDIA может предоставить конечным пользователям в своей продукции. Поскольку столь мощная графическая подсистема требует значительных ресурсов центрального процессора, а также системной памяти, в тестировании мы использовали самую производительную на данный момент систему на основе четырехъядерного процессора Intel Core i7 965 Extreme. Нельзя не отметить, что установка трех очень мощных видеокарт, каждая из которых имеет пиковую мощность 250 Вт, очень сильно загружает блок питания. Поскольку на момент тестирования в нашей тестовой лаборатории не оказалось подходящего блока питания с большой выходной мощностью, пришлось использовать то, что было под рукой. К счастью, установленный на стенде блок питания Tagan с заявленной мощностью в 750 Вт показал себя с лучшей стороны и без проблем принял на себя столь большую нагрузку. Стенд для этого тестирования имел следующую конфигурацию:
- процессор — Intel Core i7 965 Extreme с частотой 3,2 ГГц;
- системная плата — ASUS RAMPAGE II EXTREME;
- чипсет системной платы — Intel X58 Express;
- оперативная память — DDR3-1600 (Corsair CM3X2G1600C9DHXNV);
- объем памяти — 4 Гбайт (два модуля по 2048 Мбайт);
- режим работы памяти — DDR3-1333, двухканальный режим;
- тайминги памяти — 8-8-8-20;
- жесткий диск — Intel SSD X25-M (Intel SSDSA2MH080G1GN) объемом 80 Гбайт, файловая структура NTFS;
- монитор Acer P243W с максимальным разрешением 1920x1200 (Full HD);
- операционная система — Windows Vista x86 Service Pack 1;
- блок питания компании Tagan мощностью 750 Вт.
Для тестирования видеокарт в игровых приложениях применялся набор из пяти популярных игр:
- Quake 4 (Patch 1.43);
- S.T.A.L.K.E.R. Shadow of Chernobyl (Patch 1.006);
- Half-Life 2: Episode 2;
- Crysis v.1.2;
- Call of Juares Demo Benchmark v .1.1.1.0.
Кроме того, при тестировании использовались два популярных игровых бенчмарка — 3DMark’06 (версия 1.1.0) и 3DMark Vantage (версия 1.0.1).
В ходе тестирования применялась операционная система Windows Vista Ultimate 32 bit с установленным пакетом обновлений Service Pack 1. Устанавливалась частота строчной развертки монитора 60 Гц, а глубина цвета составляла 32 бит. Монитор подключался к установленной видеокарте через цифровой вход DVI. При тестировании устанавливался последний на тот момент видеодрайвер NVIDIA ForceWare 180.48.
Настройка игровых приложений
Прежде всего поясним выбор тестовых инструментов, которые использовались для тестирования видеокарт. Не секрет, что игр, которые имеют встроенные бенчмарки, сейчас очень мало. Большинство современных игр позволяют определить лишь мгновенный fps (частоту кадров в секунду) и не дают возможность записывать и проигрывать демо-сцены, а результаты помещать в отдельный файл. Конечно, в таких случаях можно применять очень популярную сегодня утилиту FRAPS, позволяющую собирать информацию о текущем fps в фоновом режиме при любой запущенной игре. Однако тестирование с помощью этой программы будет некорректным, поскольку в играх, где нет возможности проиграть одну и ту же сцену, приходится каждый раз проходить один и тот же этап самому тестеру. Очевидно, что пройти один и тот же путь в игре со стопроцентной идентичностью невозможно, поэтому результаты тестирования с помощью такого метода будут варьироваться в зависимости от каждого прохода, а это критично. С учетом того, что некоторые видеокарты отличаются по производительности всего на несколько процентов, использовать вышеописанный метод нельзя, так как в противном случае полученные результаты не будут отражать реального положения вещей. Поэтому в нашем тестировании применялись только игры, имеющие свои встроенные бенчмарки: Quake 4, Half-Life 2, Call of Juares, S.T.A.L.K.E.R. и Crysis, а также известные тестовые пакеты 3DMark’06 и 3DMark Vantage.
Специально для тестирования видеокарт в нашей тестовой лаборатории на базе игровых бенчмарков были разработаны автоматизированные скрипты, которые значительно облегчили работу с приложениями и позволили поставить тестирование на поток. Игры для тестирования выбирались с учетом наличия встроенного бенчмарка, поддающегося автоматизации, который автоматически определял среднее количество кадров в секунду (fps) в записанных демо-сценах и позволял сохранять их в текстовом формате. Игра Crysis тестировалась с двумя демо-сценами, одна из которых служила для тестирования графического процессора, а другая — центрального процессора в совокупности с графическим, поскольку при проигрывании затрагивает физическую составляющую движка игры (обе демо-сцены идут в комплекте с игрой). Чтобы уравновесить влияние «тяжеловеса» Crysis, который выдает небольшое количество кадров в секунду даже на самых современных видеокартах, в игровые тесты были включены уже устаревшие Quake 4 и Half-Life 2 — это позволило получить итоговый результат, отображающий реальную усредненную производительность тестируемых видеокарт в режиме максимального качества в современных играх.
Все игровые тесты запускались по пять раз при разном разрешении экрана: 1280x800, 1440x900, 1680x1050 и 1920x1200 точек. При тестировании применялся монитор Acer P243w с диагональю 24 дюйма и максимальным разрешением 1920x1200 точек (Full HD). Исходя из результатов измерений рассчитывались среднее значение и погрешность измерения с доверительной вероятностью 95%. Игры для тестирования подбирались таким образом, чтобы они были максимально ресурсоемкими при высоких настройках качества и в то же время производительными при низком качестве изображения.
В отличие от обычных тестирований, которые мы проводим для сравнения видеокарт, на этот раз каждая видеокарта проходила тест только в режиме Quality. Режим Performance в данном тестировании был исключен, поскольку некоторые игры просто не позволяют получить большее количество fps, а кроме того, в данном случае результаты тестирования в режиме Performance не столь важны, поскольку дают возможность оценить, какого максимального результата позволяет достичь в игре видеокарта при заданном разрешении. А с учетом того, что даже одиночная видеокарта GeForce GTX280 способна выдавать очень высокие показатели fps, полученные при максимальном и минимальном качестве изображения, можно предположить, что комфортно будет играть во все игры при средних настройках качества изображения. Отметим, что Performance — это режим максимальной производительности за счет отказа от таких технологий, как анизотропная фильтрация текстур, экранное сглаживание, низкая детализация изображения и т.д. Настройка на режим максимального качества изображения (Quality) во время тестирования производится как в играх, так и непосредственно в драйвере видеокарт. В драйвере видеокарты все возможные опции по автоматическому регулированию параметров изображения были выставлены в режим управления самим игровым приложением, опция Texture Quality была переведена в режим High Quality, а вертикальная синхронизация была отключена во всех приложениях. Отметим, что для сравнения видеокарт (получения интегральной оценки производительности) мы использовали только результаты тестирования в режиме Quality, то есть в режиме максимальной нагрузки на видеокарту.
По характеру зависимости скорости обработки кадров (fps) от разрешения экрана в игровых тестах можно определить, чем ограничивается результат теста: производительностью видеокарты или производительностью подсистемы «процессор — чипсет — память», — и таким образом установить, насколько корректно в данном случае сравнение производительности видеокарт. Если в ходе тестирования выясняется, что полученный результат ограничивается производительностью процессора, а не видеокарты, то сравнивать видеокарты по производительности нельзя, поскольку отсутствуют условия для реализации всех их возможностей. Во избежание подобной ситуации мы использовали в тестировании один из последних и самых производительных на данный момент процессоров — четырехъядерный Intel Core i7 965 Extreme. Пороговое значение скорости обработки кадров, при котором пользователь может комфортно играть в компьютерные игры, составляет 40 fps (значение выбрано исходя из мнения большинства игроков в компьютерные 3D-шутеры).
Расчет интегральной оценки производительности видеокарт
Поскольку основная цель нашего тестирования заключалась в составлении рейтинга производительности исследуемых видеокарт, то, кроме получения результатов в каждом бенчмарке, необходимо было разработать алгоритм, позволяющий свести воедино результаты всех бенчмарков, чтобы определить интегральную оценку производительности, которая даст возможность корректно сравнивать видеокарты. При этом, поскольку игры и приложения трехмерного моделирования — это абсолютно разные сценарии применения ПК, мы не пытались свести все результаты к единой оценке производительности, а ввели интегральные оценки производительности только для игровых тестов в соответствии с моделями применения видеокарт.
Для получения интегральной оценки производительности, как и в предыдущих наших тестированиях, вводилось понятие референсной видеокарты, в качестве которой выступала одиночная видеокарта Zotac GeForce GTX280 AMP! на базе графического процессора NVIDIA GeForce GTX280. Результаты тестирования одиночной видеокарты во всех тестах принимались равными единице, и относительно них нормировались результаты остальных связок видеокарт — 2-Way SLI и 3-Way SLI. Такой подход позволил нам перейти к безразмерным результатам во всех тестах.
Интегральная оценка производительности в играх
Для расчета интегральной оценки производительности в играх сначала вычислялся интегральный показатель производительности для каждой игры. С учетом того, что максимальная нагрузка на видеокарту реализуется в режиме Quality, интегральный показатель производительности для каждой игры рассчитывался как средневзвешенное нормированных результатов при каждом разрешении в режиме Quality. При этом, принимая во внимание, что с увеличением разрешения растет и нагрузка на видеокарту, для разных разрешений применялись различные весовые коэффициенты. В итоге интегральный показатель производительности для каждой игры вычислялся по формуле [1], где Pixk — нормированный результат при разрешении txk. Соответственно самый высокий коэффициент был назначен для теста, при котором разрешение было максимальным — 1920x1200 точек на дюйм (Full HD).
Интегральная оценка производительности по совокупности всех игр рассчитывалась как среднее геометрическое от интегральных показателей производительности по каждой игре (см. формулу [2]).
Определение эффективности теплоотвода
Кроме сравнения производительности видеокарт в играх, мы оценивали эффективность их систем теплоотвода. Поскольку в данном тестировании принимали участие только одинаковые видеокарты, различающиеся лишь серийными номерами, мы измерили эффективность теплоотвода только у одной из них. Однако с учетом того обстоятельства, что при установке всех трех видеокарт две из них оказываются заблокированными для забора холодного воздуха, мы измерили температуру видеокарт при максимальной нагрузке. В данном случае эффективность системы охлаждения играет большую роль, поскольку в замкнутой системе, то есть в корпусе компьютера, повышенная температура может оказать влияние на работу других основных комплектующих компьютера. К тому же тестируемые видеокарты имеют повышенные частотные характеристики как графического процессора, так и графической памяти.
Тестирование эффективности системы теплоотвода видеокарты заключалось в том, чтобы в стрессовом режиме загружать графический процессор и одновременно контролировать его температуру. Для контроля температуры графического процессора мы использовали известную утилиту RiveTuner 2.10, которая позволяет регистрировать данные в фоновом режиме, а загрузка графического процессора производилась путем непрерывного проигрывания в течение 30 мин демо-сцены из игры Crysis (выбор этой игры обусловлен тем, что она самая «прожорливая»). Следует отметить, что стенд для тестирования располагался на открытом пространстве (на столе), в реальных же условиях, когда ПК монтируется в корпусе, температура графического процессора будет несколько выше, если, конечно, не установлены дополнительные вентиляторы охлаждения. Также в некоторых случаях использовались данные, которые предоставляет популярная в последнее время утилита GPU-Z версии 0.2.8 и другие бета-версии.
Zotac GeForce GTX280 AMP!
Видеокарта Zotac GeForce GTX280 AMP! основана на новейшем графическом процессоре компании NVIDIA — GeForce GTX280. На данный момент эта серия включает самые производительные из всех присутствующих на рынке видеоадаптеров, построенных на графических ядрах этой компании. В ней сочетаются самые передовые технологии. Аббревиатура AMP в названии видеокарты говорит о том, что данная модель представляет собой разогнанную версию. Однако этот разгон производится не «на коленке», как это обычно бывает у компьютерных энтузиастов, а непосредственно на заводе-изготовителе. По сравнению с обычной референсной видеокартой GeForce GTX280 от компании NVIDIA, исследуемая модель имеет повышенную частоту памяти и графического ядра. Так, частота работы графического ядра составляет 700 МГц, а унифицированные процессоры, которых в этой видеокарте насчитывается 240, работают на тактовой частоте 1400 МГц. В видеокарте Zotac GeForce GTX280 AMP! установлены микросхемы памяти компании Hynix. Графическая память стандарта GDDR3 работает на тактовой частоте 1150 МГц (2300 МГц — DDR), ее объем составляет 1 Гбайт. В данной видеокарте применяется 512-битная шина памяти. Кстати, это самая широкая по битности шина среди всех видеокарт, доступных пользователям на данный момент. Графическое ядро построено по 65-нм техпроцессу, оно аппаратно поддерживает DirectX 10 и OpenGL 2.1. На момент написания статьи это был самый мощный однопроцессорный графический адаптер компании NVIDIA, имеющийся в широкой продаже. Технические характеристики этого ядра рассматриваются во многих обзорах, поэтому мы сразу перейдем к самому главному — к результатам тестирования.
Результаты тестирования
Технические характеристики видеокарт представлены в табл. 1, а краткие сводные результаты тестирования (итоговый рейтинг производительности видеокарт) — на рис. 1.
Рис. 1. Рейтинг производительности исследуемых видеокарт
В каждом из режимов — отдельная видеокарта, 2-Way SLI и 3-Way SLI — тестирование было идентичным. Опишем подробно результаты для каждой из игр. Отметим, что в большинстве игровых приложений, которые были применены в ходе тестирования, даже одиночная видеокарта Zotac GeForce GTX280 AMP! продемонстрировала очень высокий уровень производительности. В некоторых играх уровень производительности сопоставим с производительностью самого мощного двухпроцессорного видеоадаптера ATI HD4870 X2, их интегральные результаты при максимальном качестве изображения практически не различаются (по результатам предыдущих тестирований). Даже в режиме настройки на максимальное качество одна видеокарта обеспечивает предельно комфортные условия для игры при любом разрешении (рис. 2-9) во всех современных играх, кроме Crysis и Call of Juares. В режиме максимальной производительности она позволяла комфортно играть в игры при любом устанавливаемом разрешении. Отметим, что мы также протестировали эту видеокарту при набирающем популярность разрешении Full HD — 1920x1200.
В игре Quake результаты тестирования оказались не слишком понятными (см. рис. 2). При максимальных настройках качества и максимальном разрешении 1920x1200 показатель FPS для всех трех режимов был гораздо выше, чем при остальных значениях разрешения. Скорее всего, это объясняется невозможностью работы с таким разрешением. Однако даже приведенные результаты дают полную картину увеличения производительности в зависимости от режима работы с использованием технологии SLI.
Для популярной игры S.T.A.L.K.E.R. (см. рис. 3) график выглядит более правдоподобно, чем для игры Quake 4. На нем четко видно, что в режиме 2-Way SLI, когда установлены две видеокарты Zotac GeForce GTX280 AMP!, производительность графической подсистемы возрастает линейно на 50%. В режиме 3-Way SLI (с тремя графическими адаптерами Zotac GeForce GTX280 AMP!) производительность по сравнению с режимом 2-Way увеличивается не более чем на 10%.
Результаты тестирования в игре Half-Life 2: Episode 2 (см. рис. 4) показали, что эта игра не оптимизирована для работы с видеокартами NVIDIA в многопроцессорной конфигурации SLI. Прироста производительности ни в одном режиме не было, а полученные результаты практически не отличались друг от друга.
В игре Crysis (см. рис. 5 и 6) производительность в режимах 2-Way SLI и 3-Way SLI была гораздо выше, чем у одиночной видеокарты. Отметим также, что в режиме 2-Way SLI производительность возросла на 50% при всех разрешениях. В режиме работы трех графических адаптеров Zotac GeForce GTX280 AMP! производительность увеличилась на 20%, но только при высоком разрешении (1680x1050 и 1920x1200). Скорее всего, это объясняется тем, что именно новые игры наиболее оптимизированы для работы с несколькими графическими адаптерами.
Результаты тестирования в бенчмарке Call of Juares Demo (см. рис. 7) очень похожи по зависимости производительности от режима работы на график для игры S.T.A.L.K.E.R. Однако здесь следует отметить, что в режиме 3-Way SLI производительность была гораздо выше, а прирост составил более 40% от результата в режиме 2-Way SLI.
Мы также решили привести графики зависимости «попугаев», которые получаются при тестировании в популярных бенчмарках 3DMark’06 и 3DMark Vantage (см. рис. 8 и 9). При тестировании в этих пакетах также наблюдалось увеличение производительности в зависимости от режима работы технологии SLI.
Рис. 2. Результаты тестирования в игре Quake 4 |
Рис. 3. Результаты тестирования в игре S.T.A.L.K.E.R. |
Рис. 4. Результаты тестирования в игре Half-Life 2: Episode 2 |
Рис. 5. Результаты тестирования в игре Crysis: GPU-тест |
Рис. 6. Результаты тестирования в игре Crysis: СPU-тест |
Рис. 7. Результаты тестирования в игре Call of Juares |
Рис. 8. Результаты тестирования в бенчмарке 3DMark’06 |
Рис. 9. Результаты тестирования в бенчмарке 3DMark Vantag |
На данных видеокартах установлен более крупный вентилятор (50 мм), расположенный в верхней части платы, а радиатор имеет большую высоту, поэтому видеокарта занимает сразу два слота. Применение продвинутой управляемой системы охлаждения обусловлено увеличенными тактовыми частотами графического ядра и памяти, поскольку тепловыделение при этом больше. При активном использовании одной видеокарты Zotac GeForce GTX280 AMP! утилита RivaTuner показывала температуру графического ядра порядка 75 °С. При минимальной нагрузке на GPU температура ядра составляла не более 45 °С. Тактовые частоты как графической памяти, так и графического ядра при работе в 2D-режиме практически не изменялись. При активной работе нескольких графических адаптеров температура двух видеокарт, вентиляторы которых были заслонены другими видеокартами, была несколько выше и составила порядка 80 °С. Стоит еще раз напомнить, что тестирование проводилось на открытом стенде, а в корпусе температура будет гораздо выше.
Выводы
Исходя из результатов тестирования, можно сделать следующие выводы. Поскольку целью тестирования было выявление оптимального по соотношению «производительность/качество» режима работы, можно сказать, что оба режима — и 2-Way SLI, и 3-Way SLI — невыгодны в плане покупки. Приведенные цены взяты из прайс-листа компании «НИКС» (http://www.nix.ru).
Как видно из табл. 2, оптимально использование именно одиночной видеокарты, а не связки из двух или более видеокарт. Безусловно, производительность графической подсистемы в этих режимах возрастает, однако плата за нее несопоставимо велика. Исходя из результатов тестирования, можно смело утверждать, что применение технологии 3-Way SLI не дает существенного прироста производительности в играх даже в сравнении с режимом 2-Way SLI. Более того, некоторые игры на данный момент не предназначены для использования таких режимов и пользователь не добьется прироста производительности, что, несомненно, его обескуражит, ведь затрачены большие деньги. Поэтому на данный момент мы бы рекомендовали применять технологию 2-Way SLI, которая сократит расходы и обеспечит приемлемую производительность. Конечно, видеокарты класса Zotac GeForce GTX280 AMP! и технологии SLI подходят для любых динамичных игр при разрешении экрана более 1920x1200 точек при настройке на максимальное качество отображения. Такие видеокарты предназначены для работы в приложениях, использующих DirectX 10 на полную мощность. Их стоимость полностью соответствует их производительности, поэтому за эти видеокарты пользователю придется отдать приличную сумму. Таким образом, для них целесообразно выбирать монитор с диагональю 24 дюйма и более. Кроме того, для получения сбалансированной конфигурации ПК в сочетании с этими видеокартами необходимо применять высокопроизводительные процессоры, память и жесткие диски, а также блоки питания и корпуса с хорошим теплоотводом.
Редакция выражает признательность представительству компании Zotac (http://www.zotac.com) за предоставленные для тестирования три видеокарты Zotac GeForce GTX280 AMP!.