Новые APU Trinity
Компания AMD официально объявила 15 мая о выпуске новых, 32-нм гибридных процессоров для настольных систем AMD APU серии А второго поколения с кодовым наименованием Trinity. Первая информация об этих процессорах появилась еще в самом начале текущего года на выставке CES 2012, однако официально они были представлены только весной. Спустя некоторое время были обнародованы сведения о характеристиках новых моделей, а также об особенностях нового чипсета A85, который предназначен для работы с этими процессорами.
Процессоры Trinity
Новое поколение процессоров Trinity (кодовое название архитектуры Piledriver) должно прийти на смену архитектуре Bulldozer, которая, увы, не оправдала ожиданий в плане производительности. Согласно плану развития AMD, каждая новая архитектура ежегодно увеличивает производительность на 10-15%, поэтому все надежды сейчас возложены на ее последователя — APU Trinity. Кроме того, по сравнению с предыдущим поколением APU — Llano, в процессорах Trinity используется новая графическая архитектура. В новых процессорах вместо модулей VLIW5, которые применяются в видеокартах Radeon HD 6800, используются модули VLIW4, на которых работают карты серии Radeon HD 6900. Несмотря на то что последнее поколение видеокарт AMD основано на архитектуре Graphics Core Next, в процессорах Trinity применяется предыдущее поколение архитектуры графического ядра — это более эффективное, с точки зрения теплового пакета, решение. Компания AMD называет все новые модели не процессорами, а APU (Accelerated Processing Unit), однако в переводе на русский язык этот термин звучит нескладно, а другого устоявшегося перевода пока нет. Важно понимать, что название APU — это не более чем маркетинговый ход, так как по сути APU — это самый обычный процессор с интегрированным графическим ядром.
Анонс новых процессоров, состоявшийся в мае, охватывал только мобильные версии чипов семейства Trinity. Интеграция графического ядра в центральный процессор, безусловно, поможет решить ряд проблем мобильных ПК, таких как высокая температура, ограниченное пространство и большое энергопотребление. Однако в этом плане процессоры Trinity не предоставляют особых преимуществ, так как для мобильных решений в первую очередь критичными всегда будут проблемы тепловыделения, а уж потом производительности.
Процессоры для настольных ПК получили возможность стать более производительными благодаря новой архитектуре Piledriver. Тут уже возникает масса вопросов, на которые сложно ответить без тестирования новых моделей. Что даст применение архитектуры Piledriver в процессорах серии FX, предназначенных для обычных ПК? Устранит ли она недостатки архитектуры Bulldozer? Каково преимущество процессоров Trinity с новой архитектурой Piledriver и модулями VLIW4 в настольных системах по сравнению с процессорами Llano на базе Stars и VLIW5, учитывая, что максимальный тепловой пакет составит 100 Вт, а технологический процесс останется прежним — 32 нм?
Сравнение разъемов Socket FM1 и FM2
Чтобы ответить на эти вопросы, необходимо иметь в своем распоряжении системные платы на базе нового чипсета, которых до сих пор нет в широкой продаже. Да и процессоры AMD нового поколения отыскать практически невозможно. Это объясняется тем, что у AMD еще осталось много процессоров предыдущего поколения (APU Llano), которые необходимо реализовать. И ноутбуки, и настольные системы с чипами Trinity поступят в продажу ближе к осени, так как материнские платы с поддержкой нового разъема Socket FM2 еще не готовы окончательно к массовым продажам. Так что у компании AMD всё как обычно: после анонса придется подождать еще какоето время, пока процессоры появятся на рынке.
Архитектура Trinity
Конструктивно процессоры семейства Trinity включают до четырех вычислительных ядер с кодовым наименованием Piledriver (микроархитектура Enchanced-Bulldozer) и графическое ядро серии HD 7000G.
Процессоры Trinity производятся по 32-нм техпроцессу SOI на мощностях Global Foundries c использованием транзисторов с high-k-диэлектриками и металлическим затвором. Площадь кристалла процессора Trinity составляет 246 мм2. Процессоры Trinity будут выпускаться в двух- и четырехъядерном вариантах как для настольных, так и для мобильных ПК.
Также следует отметить, что новые процессоры Trinity для настольных ПК имеют разъем Socket FM2 (904 контакта). Хотя внешне разъемы практически одинаковые, новые процессоры по разъему не совместимы со старыми, соответственно и старые процессоры в новый разъем установить нельзя (см. рисунок). Выпуск более производительных процессоров под новый разъем отложен на неопределенное время. Напомним, что в планах компании — реализация высокопроизводительных многоядерных процессоров серий Komodo и Terramar, о которых сообщалось в прошлом году.
Все процессоры Trinity для настольных ПК, как и процессоры предыдущего поколения Llano, будут иметь интегрированный контроллер PCI Express 2.0, двухканальный контроллер памяти с поддержкой модулей до DDR3-1866 и кэш L2 размером из расчета по 1 Мбайт на каждое ядро (L3-кэш отсутствует). Кроме того, все процессоры Trinity поддерживают технологию динамического разгона новой версии Turbo Core 3.0, которая несколько отличается от той, что использовалась ранее. Различие между ними состоит в том, что в Turbo Core 3.0 компания AMD реализовала автоматическое повышение частоты каждого из ядер на различные значения. То есть каждое ядро, в зависимости от нагрузки, может повышать свою частоту независимо от других ядер, если при этом общее энергопотребление не выходит за рамки TDP. Согласно представленным AMD слайдам, теперь эта технология динамически меняет частоту и CPU и GPU.
Процессоры Llano применяли стандартную шину HyperTransport и Fusion Control Link для работы графического ядра с памятью. В новых процессорах Trinity эту связку заменяет объединенный северный мост под названием Unified NorthBridge. В данном случае это первая реализация Unified NorthBridge от AMD в процессорах для настольных ПК, а не для серверов. Данный компонент связывает остальные модули с памятью и подсистемой вводавывода. Он предназначен для обслуживания различных функциональных блоков, каждый из которых делает особые запросы со специфическими параметрами. Так, модули центрального процессора отправляют незначительное количество запросов по шине UNB, но при этом они имеют высокий приоритет, поскольку дополнительная задержка может серьезно повлиять на производительность. При этом графическое ядро активно использует память для обработки поступающей информации, но скорость обработки в этом случае не так важна. Шина UNB построена таким образом, чтобы оптимизировать и направлять запросы для наиболее эффективного применения процессора всеми модулями. Немаловажная роль отведена UNB в операциях снижения мощности и изменения частоты памяти в зависимости от нагрузки, чтобы обеспечить оптимальное энергопотребление для каждого рабочего модуля.
Как и у процессоров Llano, дизайн Trinity разработан с учетом нересурсоемких приложений. AMD провела основные улучшения по энергопотреблению, включающие оптимизацию питания в режиме C6, при котором могут выключаться отдельные модули Piledriver, когда в трех или четырех исполнительных ядрах нет необходимости, а также возможность отключать модули целиком. Инженеры AMD также увеличили буферизацию памяти на кристалле таким образом, чтобы к памяти было как можно меньше запросов. В результате, несмотря на приложения, потребляющие большое количество памяти, сама память остается в состоянии низкого энергопотребления как можно дольше.
Вычислительная мощность предыдущих процессоров Llano составляла 572 гигафлоп, однако в новых процессорах Trinity потенциал производительности увеличился до 736 гигафлоп. Это в большей степени связано с улучшениями в графической составляющей процессора и использованием нового блока IOMMUv2. Данный модуль добавляет виртуальную адресацию для дискретной графики, тем самым позволяя внешнему графическому процессору получать доступ к тому же виртуальному адресному пространству, к которому получает доступ и интегрированное графическое ядро через таблицы страниц. Всё это осуществляется в рамках постепенного внедрения модели программирования архитектуры гетерогенных систем AMD (Heterogeneous Systems Architecture, HAS).
В новых процессорах Trinity появилась поддержка технологии AMD Eyefinity. Поскольку они имеют четыре, а не два контроллера для вывода на дисплей, это подразумевает, что пользователь может создать конфигурации из трех или четырех мониторов с помощью соответствующей комбинации выходов. Поддерживаются распространенные интерфейсы DoisplayPort 1.2, DVI и HDMI в основном блоке процессора и VGA в чипсете A85.
Модели процессоров
В настоящее время компания AMD представила пять моделей настольных процессоров Llano и пять моделей для мобильных ПК. Как и раньше, серии A10 и A8 включают процессоры с четырьмя и более ядрами, а младшие модели серии A4 имеют только два процессорных ядра. Разница между процессорами A8 и A10 заключается не в их TDP, как было раньше, а в тактовой частоте и версии графического ядра.
Поскольку к настоящему моменту официально представлены лишь мобильные версии процессоров Trinity, их характеристики известны, а вот подробности о настольных процессорах этой серии обнародованы пока не все. Мы приводим две таблицы с уже известными характеристиками как настольных, так и мобильных процессоров Trinity (табл. 1 и табл. 2).
Процессор A10-5800K стал новым флагманом AMD. Два модуля Piledriver фактически делают эту модель четырехъядерным APU Trinity, однако, как мы знаем, каждый модуль имеет некоторые общие ресурсы. Базовая частота данной модели A10 составляет 3,8 ГГц и повышается до 4,2 ГГц с помощью технологии Turbo Core. У каждого модуля APU A10-5800K есть собственный кэш второго уровня объемом 2 Мбайт, что в целом дает 4 Мбайт памяти второго уровня. Процессоры AMD A10 для настольных ПК имеют самое мощное графическое ядро Radeon HD 7660D, частота которого меняется в зависимости от модели. В мобильной версии A10 применяется графическое ядро Radeon HD 7660G или 7620G — по своим характеристикам они являются такими же, как Radeon HD 7660D, но с уменьшенной частотой.
Чуть менее производительные процессоры серии A8 (A8-5600K, A8-5500 и A8-4500M) также имеют два модуля Piledriver с общим кэшем L2 на 4 Мбайт для всего процессора. Единственным исключением является модель A8-4400M, у которой только один модуль, — соответственно она является двухъядерной модификацией процессора. Графические ядра Radeon HD 7560D в настольных процессорах A8 (A8-5600K, A8-5500) имеют на 128 ядер меньше, чем у старших моделей, за счет отключенного блока SIMD. При этом частота графического ядра в данных моделях соответствует A10-5700 (760 МГц). Мобильные процессоры серии A8 отличаются друг от друга не только частотой, но и графическими ядрами (Radeon HD 7640G и Radeon HD 7520G).
Процессор для настольных ПК AMD A6-5400K заметно отличается от других чипов серии K, так как имеет меньший тепловой пакет (65 Вт) и только два ядра для целочисленных операций и один блок для вычислений с плавающей запятой. Общий кэш второго уровня у модели 5400K уменьшен с 2 до 1 Мбайт. Графическая подсистема Radeon HD 7540D состоит из 192 потоковых ядер, частота которых на данный момент неизвестна.
Если процессоры для настольных ПК штатно поддерживают работу с памятью стандарта DDR3-1866, то мобильные версии максимально поддерживают только частоту DDR3-1600. При этом процессоры со сверхнизким энергопотреблением, к которым относятся модели A10-4655M и A6-4455M, поддерживают память стандарта DDR3-1333. Соответственно для мобильных процессоров могут применяться как стандартные модули памяти DDR3, так и память с низким напряжением DDR3U и DDR3L. В настольную платформу можно установить до 64 Гбайт памяти с пиковой пропускной способностью 29,8 Гбайт/с. Мобильные платформы поддерживают установку памяти объемом до 32 Гбайт с пропускной способностью 25,6 Гбайт/с.
Все графические ядра в процессорах Trinity поддерживают DirectX 11 и имеют в своем составе унифицированный видеодекодер третьего поколения Unified Video Decoder (UVD3), который поддерживает аппаратное декодирование видео в форматах H.264, VC-1, MPEG-2, WMV, DivX, MVC и Adobe Flash. Отметим, что в новом процессоре при нагрузке графическое ядро активно задействует оба канала памяти DDR3 для графических данных. В то же время, когда графическая нагрузка минимальна и активность графического процессора понижается, вывод переопределяется на применение только одного канала памяти, что позволяет снизить энергопотребление. Процессор может отправить неиспользуемый канал в режим «сна» и уменьшить тактовую частоту активного канала до минимума, необходимого для дисплея.
Чипсет A85 PCH
Конкретной информации о новом чипсете пока нет. Предполагается, что чип получит сертификацию USB-IF и будет иметь «родную» поддержку контроллера USB 3.0. Это частично подтверждается слайдами AMD, которые появились еще в то время, когда чипсет имел только кодовое название Hudson D4. В реальности новая версия чипсета, помимо нового разъема для процессоров, мало чем отличается от предыдущего AMD A75.
Оба чипсета имеют встроенный контроллер PCI Express 2.0 и поддерживают по четыре линии PCI Express 2.0. Кроме того, чипсеты поддерживают шину PCI, а для связи с процессором применяется шина UMI (Unified Media Interface), в основе которой лежит шина PCI Express 2.0 x4.
Чипсет AMD A75 поддерживает шесть портов SATA 6 Гбит/с с возможностью организации RAID-массивов уровней 0, 1 и 10, четыре порта USB 3.0, десять портов USB 2.0 и два порта USB 1.1. Увы, AMD до сих пор не добавила поддержку нового интерфейса PCI Express 3.0 ни в одной своей платформе, и в ближайшее время это не предвидится. Однако поставщикам материнских плат ничто не мешает подключить существующий Fusion Controller Hub к новому UMI-интерфейсу процессора. Поэтому вполне вероятно, что к моменту выпуска новых процессоров могут появиться платы на чипсете A75 с разъемом Socket FM2 или же платформы на базе A85, но с более богатым набором функций.