Исследование новых драйверов NVIDIA ForceWare
Расчет интегральной оценки производительности
Интегральная оценка производительности в играх
Определение эффективности теплоотвода
Компания NVIDIA всегда старается обеспечить пользователя самыми передовыми, функциональными и стопроцентно рабочими приложениями. В данном случае под приложениями подразумеваются не только сам драйвер для видеокарты, но и сопутствующее ему программное обеспечение для управления. Нередко пользователи сталкиваются с проблемой, что для корректной работы каждого нового игрового хита необходимо устанавливать новые драйверы для видеокарт, поскольку их производительность, выражаемая в количестве кадров в секунду (fps), оставляет желать лучшего. В большинстве случаев такая ситуация складывается с теми играми, в которых действие происходит от первого лица, то есть со«стрелялками» и «бродилками». Именно такие игрушки чаще всего оказываются наиболее требовательными к ресурсам видеоадаптеров, установленных на компьютерах пользователей. В этой небольшой статье мы рассмотрим различие между старыми и новыми драйверами NVIDIA. Мы решили провести это небольшое исследование, чтобы проверить утверждение компании, что с новыми бета-версиями драйверов ForceWare для видеокарт последнего семейства GeForce GTX*** производительность, точнее количество кадров в секунду, в новых играх должно существенно возрасти. Для этого небольшого тестирования мы использовали высокопроизводительный стенд, который применяется нами с недавнего времени для целого ряда задач. Стенд обеспечивает максимальную на текущий момент производительность, которую может дать домашний компьютер. Он основан на новейшем процессоре компании Intel с архитектурой Nehalem, наборе системной логики Intel X58 и двухпроцессорном видеоадапторе Gigabyte GeForce GTX295. Вот более подробные характеристики этого тестового стенда:
- процессор — Intel Core i7 965 Extreme с частотой 3,2 ГГц;
- системная плата — ASUS RAMPAGE II EXTREME;
- чипсет системной платы — Intel X58 Express;
- оперативная память — DDR3-1333 (референсные модули Qimonda);
- объем памяти — 3 Гбайт (три модуля по 1024 Мбайт);
- режим работы памяти — DDR3-1333, двухканальный режим;
- тайминги памяти:
- CAS Latency — 7,
- RAS to CAS Delay — 7,
- Row Precharge — 7,
- Active to Precharge — 20;
- жесткий диск — Intel SSD X25-M (Intel SSDSA2MH080G1GN) объемом 80 Гбайт, файловая структура NTFS;
- монитор — Acer P243W с максимальным разрешением 1920x1200 (Full HD);
- операционная система — Windows Vista x86 Service Pack 1;
- блок питания компании Tuniq Ensemble мощностью 1200 Вт.
Для тестирования в игровых приложениях использовался набор из пяти популярных игр:
- Quake 4 (Patch 1.43);
- S.T.A.L.K.E.R.: Shadow of Chernobyl (Patch 1.006);
- Half-Life 2: Episode 2;
- Crysis (v.1.2);
- Call of Juares Demo Benchmark v .1.1.1.0;
- Left 4 Dead (v 1.1);
- S.T.A.L.K.E.R.: Clear Sky Patch 1.005 Rus.
Кроме того, при тестировании применялись два популярных игровых бенчмарка: 3DMark 2006 (версия 1.1.0) и 3DMark Vantage (версия 1.0.1).
Тестирование проводилось на операционной системе Windows Vista Ultimate 32 bit с установленным пакетом обновлений Service Pack 1. Частота строчной развертки монитора принималась равной 60 Гц, а глубина цвета — 32 бит. Монитор подключался к установленной видеокарте через цифровой вход DVI. При тестировании в операционную систему поочередно устанавливались видеодрайверы следующих версий: NVIDIA ForceWare 181.20, NVIDIA ForceWare 181.22 и NVIDIA ForceWare 182.05Beta. Отметим, что драйвер NVIDIA ForceWare 181.22 представлял собой последнюю версию январского видеодрайвера, а NVIDIA ForceWare 182.05Beta относился уже к февральским релизам.
Методика тестирования
Методика тестирования, которая применялась нами и ранее, не претерпела практически никаких существенных изменений. Однако стоит отметить, что в будущих статьях, посвященных тестированию видеоадаптеров, мы несколько изменим способ представления информации — не станем утруждать читателя многочисленными графиками и диаграммами, а перейдем к единой системе показателя производительности, основанного на стенде с максимальной производительностью. Однако подробнее о новой методике мы расскажем в следующем тестировании видеокарт, а здесь приведем полную версию старой методики тестирования.
Стенд для тестирования
Настройка игровых приложений
Необходимо акцентировать внимание читателей на наборе тестовых инструментов, которые применялись при тестировании. Не секрет, что игр, которые имели бы встроенные бенчмарки, сегодня очень мало. В большинстве современных игр можно определить лишь мгновенный fps (частоту кадров в секунду), а кроме того, не предусмотрены запись и проигрывание демо-сцен, чтобы на основе их проигрывания можно было записывать результаты в отдельный файл. Конечно, в таких случаях можно использовать очень популярную сегодня утилиту FRAPS, позволяющую собирать информацию о текущем fps в фоновом режиме при любой запущенной игре. Однако тестирование с помощью этой программы будет некорректным, поскольку в играх, где нет возможности проиграть одну и ту же сцену, приходится каждый раз проходить один и тот же этап самому тестировщику. Очевидно, что пройти один и тот же путь в игре со стопроцентной идентичностью невозможно, поэтому результаты тестирования, полученные таким методом, будут варьироваться в зависимости от каждого прохода, а это критично. С учетом того, что некоторые видеокарты имеют производительность, различающуюся всего на несколько процентов, применять данный метод нельзя, поскольку полученные результаты не будут отражать реального положения вещей. Поэтому в нашем тестировании использовались только игры, имеющие собственные встроенные бенчмарки: Quake 4, Half-Life 2, Call of Juares, S.T.A.L.K.E.R.: Shadow of Chernobyl, S.T.A.L.K.E.R.: Clear Sky, Left 4 Dead и Crysis, а также известные тестовые пакеты 3DMark 2006 и 3DMark Vantage.
Специально для тестирования видеокарт в нашей тестовой лаборатории на базе игровых бенчмарков были разработаны автоматизированные скрипты, которые заметно облегчили работу с приложениями и позволили поставить тестирование на поток. Игры для тестирования выбирались с учетом наличия встроенного бенчмарка, поддающегося автоматизации, который автоматически определял среднее количество кадров в секунду (fps) в записанных демо-сценах и позволял сохранять их в текстовом формате. Игра Crysis тестировалась с двумя демо-сценами, одна из которых служила для тестирования графического процессора, а другая — для тестирования центрального процессора в совокупности с графическим, поскольку при проигрывании затрагивается физическая составляющая движка игры (обе демо-сцены поставляются в комплекте с игрой). Чтобы уравновесить влияние «тяжеловеса» Crysis, который выдает небольшое количество кадров в секунду даже на самых современных видеокартах, в игровые тесты были включены уже устаревшие Quake 4 и Half-Life 2 — это позволило получить итоговый результат, который отображал реальную усредненную производительность тестируемых драйверов в режиме максимального качества в современных играх. В этом тестировании, в отличие от предыдущих сравнительных тестирований, в набор тестов были включены две относительно новые игры: S.T.A.L.K.E.R.: Clear Sky и Left 4 Dead. Отметим, что игра Left 4 Dead хотя и базируется на движке Half-Life 2 Source, но является его обновленным вариантом, что больше загружает видеоподсистему. Следует упомянуть и относительно новую игру S.T.A.L.K.E.R.: Clear Sky, в которой в движок также добавлены новые функции, что позволяет задействовать DirectX 10 в большей степени, чем в предыдущей игре этой серии.
Все игровые тесты запускались по пять раз при разном разрешении экрана: 1280x800, 1440x900, 1680x1050 и 1920x1200 точек. При тестировании применялся монитор с диагональю 24 дюйма — Acer P243w с максимальным разрешением 1920x1200 точек (Full HD). Исходя из результатов измерений рассчитывались среднее значение и погрешность измерения с доверительной вероятностью 95%. Для тестирования подбирались игры максимально ресурсоемкие при высоких настройках качества и в то же время производительные при низком качестве изображения.
Тестирование каждого драйвера выполнялось в режимах Quality и Performance (настройка на данные режимы тестирования производится как в играх, так и непосредственно в драйвере видеокарты). С учетом того, что даже одна мощная видеокарта GeForce GTX280 способна выдавать очень высокие показатели fps, полученные при максимальном и минимальном качестве изображения, можно предположить, что комфортно будет играть во все игры при средних настройках качества изображения. Тем не менее результаты тестирования в режиме Performance тоже интересны, поскольку дают возможность оценить, какого максимального результата позволяет достичь в игре видеокарта при заданном разрешении. Отметим, что режим Performance — это максимальная производительность за счет отказа от таких технологий, как анизотропная фильтрация текстур, экранное сглаживание, низкая детализация изображения и т.д. Настройка на режим максимального качества изображения (режим Quality) во время тестирования производится как в играх, так и непосредственно в драйвере видеокарты. В драйвере видеокарты все возможные опции по автоматическому регулированию параметров изображения были выставлены в режим управления самим игровым приложением, опция Texture Quality была переведена в режим High Quality, а вертикальная синхронизация была отключена во всех приложениях.
По характеру зависимости скорости обработки кадров (fps) от разрешения экрана в игровых тестах можно определить, чем ограничивается результат теста — производительностью видеокарты или производительностью подсистемы «процессор — чипсет — память», и таким образом установить, насколько корректно в данном случае сравнение производительности. Если в ходе тестирований выясняется, что полученный результат ограничивается производительностью процессора, а не видеокарты, то сравнивать видеокарты по производительности нельзя, поскольку отсутствуют условия для реализации всех их возможностей. Во избежание подобной ситуации мы использовали в тестировании один из последних и самых производительных на данный момент процессоров — четырехъядерный Intel Core i7 965 Extreme. Пороговое значение скорости обработки кадров, при котором пользователь может комфортно играть в компьютерные игры, составляет 40 fps (это значение назвали большинство игроков в компьютерные 3D-шутеры).
Расчет интегральной оценки производительности
Поскольку основная цель нашего тестирования заключалась в составлении рейтинга производительности исследуемых драйверов, то кроме получения результатов в каждом бенчмарке необходимо было разработать алгоритм, позволяющий свести воедино результаты всех бенчмарков и получить интегральную оценку производительности, которая даст возможность корректно сравнивать работу видеокарты с различными драйверами. При этом, поскольку игры и приложения трехмерного моделирования — это абсолютно разные сценарии применения ПК, мы не пытались свести все результаты к единой оценке производительности, а ввели интегральные оценки производительности только для игровых тестов в соответствии со сценарием применения видеокарты.
Для получения интегральной оценки производительности, как и в предыдущих наших тестированиях, вводилось понятие референсной видеокарты. Результаты тестирования одиночной видеокарты во всех тестах принимались равными единице, и относительно них нормировались результаты видеокарты с разными драйверами. Такой подход позволил нам перейти к безразмерным результатам во всех тестах.
Интегральная оценка производительности в играх
Для расчета интегральной оценки производительности видеокарты в играх сначала вычислялся интегральный показатель производительности для каждой игры. С учетом того, что максимальная нагрузка на видеокарту реализуется в режиме Quality, интегральный показатель производительности для каждой игры рассчитывался как средневзвешенное нормированных результатов при каждом разрешении в режиме Quality. При этом, принимая во внимание, что с увеличением разрешения растет и нагрузка на видеокарту, для разных разрешений применялись различные весовые коэффициенты. В итоге интегральный показатель производительности для каждой игры вычислялся по формуле [1], где Pixk — нормированный результат при разрешении ixk. Самый высокий коэффициент был назначен для теста, при котором разрешение было максимальным — 1920x1200 точек на дюйм (Full HD).
Интегральная оценка производительности по совокупности всех игр рассчитывалась как среднегеометрическое от интегральных показателей производительности по каждой игре (формула [2]).
Определение эффективности теплоотвода
Кроме сравнения производительности, мы оценивали эффективность системы теплоотвода. Измерялась эффективность теплоотвода при разных драйверах. В данном случае эффективность системы охлаждения играет большую роль, поскольку в замкнутой системе, то есть в корпусе компьютера, повышенная температура может повлиять на работу других основных комплектующих компьютера. К тому же тестируемая видеокарта имеет повышенные частотные характеристики как графического процессора, так и графической памяти.
Тестирование эффективности системы теплоотвода видеокарты заключалось в том, чтобы в стрессовом режиме загружать графический процессор и одновременно контролировать его температуру. Для контроля температуры графического процессора мы использовали известную утилиту RiveTuner 2.10, которая позволяет регистрировать данные в фоновом режиме, а загрузка графического процессора производилась с помощью непрерывного проигрывания в течение 30 мин демо-сцены из игры Crysis (выбор этой игры обусловлен тем, что она самая «прожорливая» в плане ресурсов). Следует отметить, что стенд для тестирования располагался на открытом пространстве (на столе) — в реальных же условиях, когда ПК монтируется в корпусе, температура графического процессора будет несколько выше, если, конечно, не установлены дополнительные вентиляторы охлаждения. Кроме того, в некоторых случаях использовались данные, предоставляемые популярной в последнее время утилитой GPU-Z версии 0.3.1 и другими бета-версиями.
Результаты тестирования
Чтобы не быть голословными, начнем сразу с результатов тестирования (рис. 1-19). Технические характеристики тестируемой видеокарты представлены в таблице.
Следует отметить, что в процессе тестирования компании — производители компьютерных игр выложили несколько патчей для своих продуктов. Исправления, вносимые этими обновлениями, значительно повышают производительность в этих играх, из чего можно сделать простой вывод — на конечное количество кадров в секунду влияют не только драйверы. Очень многое зависит и от качества исполняемого кода игры, правильных текстур и грамотной работы с драйверами видеокарт. В качестве примера можно привести патч 1.07 для игры S.T.A.L.K.E.R.: Clear Sky, который увеличивает значение fps на топовых видеокартах в несколько раз (с 20 до 125). Данные приведены в сравнении с предыдущим патчем 1.05. На момент завершения описания данного исследования патч 1.07 был еще недоступен, а потому не применялся нами при тестировании. Отметим, что подобные результаты были получены и в других игровых приложениях.
Рис. 1. Результаты тестирования в игре Quake 4 (режим Performance) |
Рис. 2. Результаты тестирования в игре Quake 4 (режим Quality) |
Рис. 3. Результаты тестирования в игре S.T.A.L.K.E.R.: Shadow of Chernobyl (режим Performance) |
Рис. 4. Результаты тестирования в игре S.T.A.L.K.E.R.: Shadow of Chernobyl (режим Quality) |
Рис. 5. Результаты тестирования в игре Half-Life 2: Episode 2 (режим Performance) |
Рис. 6. Результаты тестирования в игре Half-Life 2: Episode 2 (режим Quality) |
Рис. 7. Результаты тестирования в игре Crysis: GPU-тест (режим Performance) |
Рис. 8. Результаты тестирования в игре Crysis: GPU-тест (режим Quality) |
Рис. 9. Результаты тестирования в игре Crysis: СPU-тест (режим Performance) |
Рис. 10. Результаты тестирования в игре Crysis: СPU-тест (режим Quality) |
Рис. 11. Результаты тестирования в игре Call of Juares Demo (режим Performance) |
Рис. 12. Результаты тестирования в игре Call of Juares Demo (режим Quality) |
Рис. 13. Результаты тестирования в игре Left 4 Dead (режим Performance) |
Рис. 14. Результаты тестирования в игре Left 4 Dead (режим Quality) |
Рис. 15. Результаты тестирования в игре S.T.A.L.K.E.R.: Clear Sky (режим Performance) |
Рис. 16. Результаты тестирования в игре S.T.A.L.K.E.R.: Clear Sky (режим Quality) |
Рис. 17. Результаты тестирования в бенчмарке 3DMark`06
(режим Performance)
Рис. 18. Результаты тестирования в бенчмарке 3DMark`06
(режим Quality)
Рис. 19. Результаты тестирования в бенчмарке 3DMark Vantage
Если говорить о текущем исследовании, то на этот раз оно не преподнесло никаких сюрпризов. Для уменьшения количества графиков результаты всех трех протестированных драйверов приведены на двух диаграммах (режим максимальной производительности и режим максимального качества) для каждой игры (см. рис. 1-19).
Заключение
Исходя из результатов тестирования трех выбранных нами драйверов, можно сделать следующий вывод. Практически никакого прироста производительности, за исключением двух игр на движке Source, где наблюдался прирост 1-2%, во всех играх обнаружено не было. Также стоит обратить внимание на небольшой прирост производительности в бенчмарке 3DMark`06, который проявился в режиме максимальной производительности. Поэтому еще раз обратим внимание читателей на то, что во многих случаях малое количество кадров в секунду может быть вызвано «сыростью» самой игры. Поэтому рекомендуем перед запуском игры или после получения невеселых результатов производительности установить последние обновления. А если таковых не найдется, пройтись по форумам разработчиков игры — возможно, такая проблема с производительностью возникает у многих пользователей, а следовательно, компания-разработчик в ближайшее время выпустит обновление, устраняющее эти недостатки. Удачных вам игр!
Редакция выражает признательность представительству компании Gigabyte (http://www.gigabyte.ru) за предоставленную для тестирования видеокарту Gigabyte GeForce GTX295.