Новое поколение видеокарт NVIDIA

Многие пользователи во всем мире с нетерпением ожидали анонса и выпуска следующего поколения видеокарт именитого производителя — компании NVIDIA. И вот наконец в середине марта NVIDIA официально представила свой новый флагман — видеокарту GeForce GTX 680, которая базируется на архитектуре следующего поколения Kepler. Поскольку семплы этой видеокарты пока недоступны тестовым лабораториям специализированных изданий, мы рассмотрим новые технологии, примененные в этих видеокартах, а также немного расскажем об архитектуре Kepler.

Главный конкурент NVIDIA — компания AMD анонсировала свои новые видеокарты еще в конце прошлого года — об этих новинках мы уже рассказали на страницах нашего журнала, а также протестировали некоторые из видеокарт на базе архитектуры Graphics Core Next. Компания NVIDIA подходит к анонсам своей продукции более тщательно, стремясь, чтобы новые видеокарты полностью соответствовали ожиданиям пользователей. Задержка с выпуском новых видеокарт позволила разработчикам NVIDIA учесть недостатки новинок конкурента на базе Tahiti и в полной мере реализовать свои задумки.

Ровно два года назад, в апреле 2010-го, компания NVIDIA представила широкой общественности видеокарту GTX 480 на основе новой архитектуры Fermi, названной в честь итальянского физика Энрико Ферми. В то время данная архитектура предлагала пользователям вычислительную мощность 512 скалярных процессоров (или CUDA-ядер), что позволяло получить мощную прибавку производительности по сравнению с предыдущими решениями на базе GTX 200. Теперь компания NVIDIA выпустила еще более производительную архитектуру Kepler, названную в честь другого великого ученого — Иоганна Кеплера. Хотя имя новой архитектуры стало известно спустя некоторое время после анонса архитектуры Fermi, подробности о ней практически не сообщались. Из доклада, посвященного архитектуре Kepler, следовало, что ее основная задача связана с энергоэффективностью новых решений. Почему было выбрано такое направление, стало понятно после того, как первые видеокарты GTX 480 на базе Fermi появились в продаже. Да, они оказались высокопроизводительными, однако имели существенный минус — большое энергопотребление и тепловыделение. Это было вызвано тем, что при разработке архитектуры Fermi основной упор был сделан на значительное увеличение производительности, ускорение обработки геометрии и тесселяцию. Новые видеокарты на базе графических процессоров GTX 580 (GF110) оказались, по сути, своеобразным ремейком GTX 480 (GF100) со сниженным тепловыделением, доработкой основных функциональных модулей и включением отключенных блоков. Доработанная версия Fermi обеспечила небольшой прирост производительности, но при этом позволила решениям на ее основе успешно конкурировать на рынке видеокарт.

Задачей разработчиков архитектуры Kepler было получение максимальной энергоэффективности в сочетании с увеличенной производительностью. Взяв за основу опыт, полученный при работе с видеокартами на базе архитектуры Fermi, инженеры NVIDIA сделали новую архитектуру действительно высокоэффективной. Важную роль в этом сыграл не только 28-нм техпроцесс, но и исполнительные блоки, переработанные для получения максимальной отдачи. Первым анонсированным чипом на базе новой архитектуры стал GeForce GTX 680, имеющий кодовое наименование GK104. Но прежде, чем говорить о семлпе видеокарты, который был показан журналистам, рассмотрим более подробно архитектуру Kepler (рис. 1).

 

Архитектура Kepler

Рис. 1. Блок-диаграмма Kepler

Как уже говорилось, архитектура Kepler во многом базируется на архитектуре Fermi, поэтому даже ее схематическое изображение очень напоминает предыдущую архитектуру. Главным отличием Kepler является переход на новый технологический процесс — 28 нм, что позволило переработать часть блоков процессора, уменьшить площадь кристалла, увеличив при этом общее количество транзисторов. Новый графический чип поддерживает интерфейс PCI-Express последнего поколения — PCI-Express 3.0. Теоретическая пропускная способность в этом случае может достигать 8 GT/s (гигатранзакций в секунду). Здесь присутствуют четыре кластера обработки графики (Graphics Processing Clusters), в каждом из которых по два SMX (Next Generation Streaming Multiprocessors), то есть потоковых мультипроцессора. Всего в новой архитектуре восемь мультипроцессоров SMX. Название потоковых процессоров было изменено с SM (как в архитектуре Fermi) на SMX, поскольку это новое поколение мультипроцессоров, отличающихся объемом внутренних блоков.

Новый блок SMX имеет структуру, показанную на рис. 2. Теперь в каждом из потоковых мультипроцессоров находятся 192 CUDA-ядра (скалярных процессора). По сравнению с предыдущим поколением SM это довольно большой прорыв, так как в Fermi мультипроцессоры вмещали только 32 скалярных процессора. Соответственно SMX несет в себе текстурные блоки и движок PolyMorph Engine версии 2.0, в котором находятся исполнительные блоки Tesselation, Vertex Fetch, Viewport Transform, Attribute setup и Steam output, он же отвечает и за тесселяцию.

 

Потоковый процессор SMX

Рис. 2. Потоковый процессор SMX

По уверениям компании NVIDIA, производительность PolyMorph Engine 2.0 выросла вдвое по сравнению с архитектурой Fermi. Также в новой версии SMX имеются все необходимые вспомогательные блоки для работы, а именно: загрузки и хранения (Loader/Store Unit), специальной функциональности (Special Function Unit), планировщиков (Warp Sheduler), диспетчеров (Dispatch Unit) и др. Таким образом, в новой архитектуре SMX увеличено количество внутренних блоков, что позволяет достичь большей производительности по сравнению с предыдущим решением просто за счет числа блоков. Общее количество скалярных процессоров в новом флагмане на базе Kepler теперь в три раза больше по сравнению с GTX 580 — 1536 штук. Для параллельных вычислений на базе GPGPU такое количество ядер CUDA должно значительно повысить производительность в соответствующих приложениях, применяющих графический процессор для просчета. В отличие от флагмана на базе Fermi, который использует шесть 64-битных каналов памяти (общая ширина 384 бит), в новой архитектуре Kepler применяются только четыре 64-битных канала. Для увеличения пропускной способности памяти, а также для того, чтобы она оставалась на уровне предыдущего решения, в новых флагманах графическая память уже штатно работает на повышенной частоте — 6 ГГц. Это своеобразный рекорд среди видеокарт, представленных на данный момент на рынке.

Новые графические процессоры на базе Kepler будут поддерживать DirectX версии 11.1, который появится с выходом новой операционной системы Windows 8. Новая видеокарта GeForce GTX 680, которая является однопроцессорным флагманом новой линейки видеокарт GTX 600, также поддерживает этот API. Количество блоков растеризации в новой видеокарте (так называемых ROP) уменьшилось с 48 до 32 по сравнению с предыдущим флагманом GTX 580. Объем графической памяти увеличился до 2 Гбайт (2048 Мбайт) из-за использования 256-битной шины памяти, поскольку устанавливать всего 1 Гбайт сейчас уже бессмысленно. Частота работы памяти в 6 ГГц и 256-битная шина обеспечивают общую пропускную способность около 192,3 Гбит/с.

В новой видеокарте и, видимо, в других моделях этой серии применяется новая технология энергосбережения и автоматического разгона графического ядра. Так, у видеокарты GeForce GTX680 базовая тактовая частота графического процессора составляет 1006 МГц, причем она не снижается при разгоне. Однако теперь она не статична, а может динамически изменяться в зависимости от условий работы. По сути, новая технология динамического изменения частоты является аналогом Turbo Boost/ Turbo Core, если говорить о центральных процессорах. Напомним, что данная технология позволяет увеличивать тактовую частоту работы ядер выше номинальной, если при этом не превышаются установленные нормы энергопотребления и TDP. Соответственно процессор начинает работать на повышенных частотах без вмешательства пользователя. Это позволяет получить прибавку в производительности для приложений, которые не полностью задействуют все ядра процессора. Неудивительно, что компания NVIDIA решила перенять этот полезный опыт и внедрила в новое поколение GPU аналогичную технологию под названием NVIDIA GPU Boost.

Динамический разгон в этой технологии зависит от TDP. Так, если 3D-приложение не полностью нагружает графическое ядро, то видеокарта автоматически повышает тактовую частоту с 1006 до 1058 МГц (при штатных настройках разгона). Частота может быть и выше, но это уже настраивается с помощью специальных утилит. Соответственно без нагрузки на графическое ядро видеокарта уменьшает частоту до 324 МГц, а также понижает напряжение. Пользователь может изменить базовую частоту работы графического ядра, тогда при необходимости видеокарта, основываясь на показаниях датчиков по всей карте и GPU, увеличит частоту еще больше. При этом частота может увеличиваться только до достижения порога теплового пакета. Кроме того, пользователь может менять базовое значение TDP (Power Target), однако делать это не рекомендуется, поскольку в таком случае тепловыделение превышает установленные производителем рамки, а это может привести к сбоям в работе или полному выводу из строя графического процессора и видеокарты. В целом технология получилась инновационная и весьма интересная. В будущем, когда другие семплы видеокарт станут доступны пользователям, появится возможность лучше изучить ее достоинства и недостатки.

 

Видеокарта GeForce GTX 680

Видеокарта GeForce GTX 680

Еще одна технология, усовершенствованная в новой серии графических адаптеров, — NVIDIA Surround. Теперь ее возможности расширились — посредством одной видеокарты она позволяет объединить уже четыре монитора. Безусловно, геймеры редко подключают сразу несколько мониторов, поскольку чем больше разрешение, тем выше должна быть производительность видеоподсистемы. Однако вполне вероятно, что такая возможность будет актуальна для пользователей, которые применяют несколько мониторов именно для работы, а не для игр.

Наряду с новой серией видеокарт была анонсирована новая технология работы режима Vertical Sync. Напомним, что режим Vertical Sync подразумевает, что частота кадров привязывается к частоте вертикальной развертки монитора. Поскольку большинство ЖК-мониторов имеют частоту 60 Гц, то в играх при включенной вертикальной синхронизации количество кадров в секунду (fps) будет соответствовать этой цифре. Однако некоторые отключают данную технологию, поскольку снижение количества fps чувствуется в особо динамичных играх. Тем не менее она необходима, так как позволяет избежать разрыва кадров, когда один кадр накладывается на другой. Основная проблема проявляется в том случае, когда видеокарта не может одномоментно выдать 60 fps. Тогда частота кадров автоматически падает до следующего кратного значения — 30, в итоге изображение на экране воспроизводится с разрывами, поскольку случаются частые переключения между режимами 60 и 30.

Компания NVIDIA предлагает пользователям решить эту проблему с помощью новой технологии Adaptive VSync. Принцип ее работы основан на том, что когда видеокарта выдает более 60 кадров в секунду, то VSync работает в стандартном режиме. Как только видеокарта уже не может выдать 60 fps, Adaptive VSync автоматически отключает режим вертикальной синхронизации и на экран выводится то количество кадров, которое видеокарта может выдать в данный момент. Соответственно, если видеокарта снова выдает 60 кадров в секунду, Adaptive VSync включает режим вертикальной синхронизации и продолжает работать в штатном режиме.

Помимо Adaptive VSync, компания NVIDIA предлагает в новой серии видеокарт новый метод сглаживания под названием TXAA. Как объясняют специалисты NVIDIA, данный режим — это комбинация мультисемплинга (MultiSampling AA) и специального фильтра, который использует информацию о глубине и контрастности изображения. По заявлениям компании NVIDIA, второй уровень TXAA по воспроизводимому качеству примерно соответствует режиму MSAA 8x, но при этом создает нагрузку на видеокарту аналогично режиму MSAA 4x. Это будет полезно пользователям, которые хотели бы получить высокое качество изображения при хорошей производительности.

В целом новая серия видеокарт GeForce 600 должна хорошо зарекомендовать себя в плане энергопотребления и производительности, если верить заявлениям NVIDIA. Выпуск новых решений, отличных от флагманского, пока не заявлен, поэтому тестирование новой серии еще предстоит. Но уже сейчас, по первым данным, можно сказать, что геймеры и компьютерные энтузиасты получили очередного нового короля 3D-графики от NVIDIA.

 

В начало В начало

КомпьютерПресс 04'2012

Наш канал на Youtube

1999 1 2 3 4 5 6 7 8 9 10 11 12
2000 1 2 3 4 5 6 7 8 9 10 11 12
2001 1 2 3 4 5 6 7 8 9 10 11 12
2002 1 2 3 4 5 6 7 8 9 10 11 12
2003 1 2 3 4 5 6 7 8 9 10 11 12
2004 1 2 3 4 5 6 7 8 9 10 11 12
2005 1 2 3 4 5 6 7 8 9 10 11 12
2006 1 2 3 4 5 6 7 8 9 10 11 12
2007 1 2 3 4 5 6 7 8 9 10 11 12
2008 1 2 3 4 5 6 7 8 9 10 11 12
2009 1 2 3 4 5 6 7 8 9 10 11 12
2010 1 2 3 4 5 6 7 8 9 10 11 12
2011 1 2 3 4 5 6 7 8 9 10 11 12
2012 1 2 3 4 5 6 7 8 9 10 11 12
2013 1 2 3 4 5 6 7 8 9 10 11 12
Популярные статьи
КомпьютерПресс использует