Долгожданный процессор AMD Bulldozer
Процессорное ядро AMD Bulldozer
Производительность процессора AMD FX-8100
Ровно год назад мы писали о новой процессорной микроархитектуре компании AMD, известной под названием Bulldozer. И вот год спустя, 12 октября, компания AMD наконец-то анонсировала семейство процессоров AMD FX на основе архитектуры Bulldozer. Более того, у нас появилась возможность протестировать один из восьмиядерных процессоров семейства AMD FX — процессор AMD FX-8100. Итак, давайте подробнее познакомимся с новыми процессорами компании AMD.
Общие сведения
В официальном прессрелизе компании AMD, посвященном выпуску процессоров AMD FX, отмечается, что это семейство полностью разблокированных и настраиваемых процессоров для настольных ПК, использующих новую многоядерную архитектуру AMD (кодовое название Bulldozer).
Семейство AMD FX включает как восьмиядерные модели процессоров (серия FX-8000), так и шести (серия FX-6000) и четырехъядерные (серия FX-4000). Все процессоры AMD FX имеют процессорный разъем AMD AM3+.
Процессоры AMD FX на базе микроархитектуры Bulldozer стали первыми процессорами AMD, выполненными по 32-нм техпроцессу.
Как известно, компания AMD планирует выпустить три серии процессоров на базе микроархитектуры Bulldozer с кодовыми наименованиями Interlagos, Valencia и Zambezi. Процессоры Interlagos и Valencia — это серверные процессоры, а процессор Zambezi ориентирован на рынок настольных ПК. В данной статье мы детально познакомимся с процессорами Zambezi.
Как следует из прессрелиза компании, одно из главных достоинств новых процессоров AMD Zambezi заключается в их невероятных возможностях в плане разгона тактовой частоты. В частности, об этом свидетельствуют недавно установленный мировой рекорд по разгону восьмиядерного процессора AMD FX, зафиксированный в «Книге рекордов Гиннесса», и титул «самый высокочастотный компьютерный процессор». Собственно, тот факт, что разгонные возможности процессора крайне важны для пользователей, не вызывает сомнения. Тем не менее немного странно слышать это из уст представителей компании AMD. Ведь когда у процессоров AMD наблюдались явные проблемы с тактовой частотой, представители данной компании на всех прессконференциях заявляли, что тактовая частота — не главное и что производительность процессора определяется совсем другими параметрами.
Впрочем, политика двойных стандартов свойственна не только компании AMD — она является своеобразным символом Америки. Однако не будем заниматься критикой американской морали, а лучше поближе познакомимся с процессорами AMD FX.
Итак, согласно официальному прессрелизу, всего компания AMD представила четыре модели процессоров AMD FX: восьмиядерные процессоры FX-8150 и FX-8120, шестиядерный процессор FX-6100 и четырехъядерный процессор FX-4100 (табл. 1). Однако уже сейчас в продаже можно встретить еще один восьмиядерный процессор — FX-8100, а в скором времени компания собирается анонсировать также четырехъядерные процессоры FX-B4150 и FX-4170.
Все процессоры серии AMD FX поддерживают AMD Turbo Core — технологию динамической оптимизации производительности на уровне процессорных ядер. Она представляет собой упрощенный аналог технологии Intel Tubo Boost, которая используется в современных процессорах Intel. Почему мы говорим об упрощенном аналоге данной технологии? Дело в том, что технология AMD Turbo Core подразумевает три режима работы процессора: на штатной частоте, в режиме Turbo Core и в режиме MAX Turbo. В режиме Turbo Core реализуется возможность увеличения тактовой частоты на несколько ступеней одновременно всех ядер процессора, но только в случае, если при этом не превышается TDP процессора. MAX Turbo — это режим, в котором повышается на несколько ступеней тактовая частота только половины процессорных ядер, в то время как другая половина ядер отключается (переходит в режим C6). Опять-таки, режим MAX Turbo возможен только в том случае, если энергопотребление процессора не превышает его TDP.
Понятно, что от режима MAX Turbo выигрыш могут получить однопоточные приложения или приложения, которые не могут загружать все ядра процессора, а режим Turbo Core подходит для хорошо распараллеливающихся приложений, загружающих все ядра процессора.
В случае четырехъядерных процессоров Intel Core второго поколения с технологией Tubo Boost режим динамического разгона ядер процессора является более интеллектуальным. Если, например, загружены все четыре ядра процессора, то в рамках заданного TDP коэффициент умножения может быть увеличен на определенное число ступеней. Если загружены три ядра процессора, то количество ступеней, на которое увеличивается коэффициент умножения, может быть больше. Аналогично при загрузке только двух ядер процессора количество ступеней, на которое увеличивается коэффициент умножения, станет еще выше, а максимальная частота достигается в случае, когда загружено только одно ядро процессора.
Кроме того, в BIOS можно настраивать режим Tubo Boost, то есть задавать максимальные коэффициенты умножения для четырех, трех, двух и одного активного ядра. Также можно задавать TDP процессора, в рамках которого может быть реализован режим Tubo Boost.
В случае процессоров AMD возможности по динамическому разгону гораздо скромнее. В то же время справедливости ради отметим, что с помощью фирменной утилиты AMD OverDrive, поддерживающей процессоры AMD FX, режим AMD Turbo Core, как и всю систему в целом, можно настраивать в широких пределах.
Все процессоры семейства AMD FX оснащены кэшем L3 размером 8 Мбайт и имеют встроенный контроллер памяти DDR3-1866 (и ниже). Кроме того, на каждое ядро процессора семейства AMD FX приходится кэш L2 размером 1 Мбайт. Соответственно в случае восьмиядерных процессоров суммарный размер кэша L2 составляет 8 Мбайт, а в случае четырехъядерных — 4 Мбайт.
Процессорное ядро AMD Bulldozer
Подробно об особенностях микроархитектуры AMD Bulldozer мы писали ровно год назад в статье «Процессорная микроархитектура AMD Bulldozer» (КомпьютерПресс № 11’2010), а потому не будем повторяться и вновь углубляться в детали — напомним лишь наиболее важные аспекты микроархитектуры AMD Bulldozer.
Говоря о многоядерных процессорах на базе микроархитектуры AMD Bulldoze, очень важно подчеркнуть, что ядро в микроархитектуре AMD Bulldozer и процессорные ядра в других микроархитектурах — это не одно и то же. Поэтому не вполне корректно сравнивать по количеству ядер, к примеру, процессоры AMD FX (Zambezi) с процессорами Intel Cote i3/i5/i7 (Sandy Bridge). Дело в том, что процессоры AMD на базе микроархитектуры AMD Bulldozer предусматривают модульную архитектуру. Каждый модуль сам по себе (в терминологии компании AMD) является двухъядерным. К примеру, в восьмиядерном процессоре Zambezi содержатся четыре двухъядерных модуля (рис. 1).
Рис. 1. Блок-схема восьмиядерного процессора Zambezi
Однако то, что компания называет в данном случае ядром, на самом деле до настоящего процессорного ядра не дотягивает. Собственно, тут весь фокус в терминологии. Модуль, в котором расположены два ядра, вполне можно было бы назвать ядром, а сами ядра — вычислительными целочисленными кластерами. То есть, на наш взгляд, более корректно говорить не о модуле с двумя ядрами, а о ядре с двумя вычислительными целочисленными кластерами. Конечно, операционной системой каждый такой модуль в процессоре будет восприниматься как два отдельных ядра, но ведь и каждое ядро процессора Intel с технологией Hyper-Threading воспринимается операционной системой как два отдельных ядра, при этом мы говорим об одном ядре, способном одновременно обрабатывать два потока.
Впрочем, оставим особенности терминологии. Главное помнить, что в случае модуля AMD речь идет не об истинных двух ядрах, а о неком решении, способном одновременно обрабатывать два потока. Причем в плане эффективности такой двухъядерный модуль AMD превосходит одно ядро Intel с поддержкой Hyper-Threading, но уступает по эффективности двухпоточной обработки двум отдельным истинным ядрам.
Теперь разберемся, почему между двухъядерными модулями AMD и двумя истинными ядрами нельзя ставить знак равенства.
Прежде всего, в каждом псевдодвухъядерном модуле AMD часть ресурсов разделяется между обоими псевдоядрами. В частности, в модуле AMD предпроцессор, отвечающий за выборку инструкций из кэша инструкций L1I, их декодирование и продвижение к исполнительным блокам, а также кэш инструкций L1I и кэш L2 разделяются между обоими псевдоядрами (рис. 2). Кроме того, сами по себе псевдоядра двухъядерного модуля AMD имеют лишь целочисленные исполнительные конвейеры, а для работы с вещественными данными используют разделяемый на уровне модуля FP-кластер. Это напоминает ситуацию, когда центральный процессор x86 дополнялся сопроцессором x87 для выполнения арифметических операций с плавающей запятой. И хотя сама компания AMD этот исполнительный FP-кластер не называет сопроцессором, по сути это именно сопроцессор, разделяемый между двумя ядрами, которые могут выполнять только целочисленные операции.
Рис. 2. Блок-схема двухъядерного модуля
в процессорной микроархитектуре AMD Bulldozer
Если каждый процессорный модуль в микроархитектуре AMD Bulldozer наделен разделяемым между двумя ядрами кэшем L2, то кэш L3 является разделяемым между всеми процессорными модулями.
Чипсеты AMD 9-й серии
Еще задолго до анонса процессоров Zambezi компания AMD анонсировала чипсеты AMD 9-й серии, которые хотя и совместимы со всеми процессорами AMD с разъемом AM3+, но ориентированы как раз на новые процессоры AMD FX.
Чипсеты AMD 9-й серии являются основой для платформы, известной под названием AMD Scorpius. Помимо чипсетов AMD 9-й серии основу платформы AMD Scorpius составляет процессор Zambezi, а также дискретная видеокарта серии AMD Radeon HD 6000.
Чипсеты AMD 9-й серии поддерживают как новый процессорный разъем AMD Socket AM3+, так и старый разъем Socket AM3. То есть платы на базе чипсета AMD 9-й серии совместимы не только с новыми процессорами Zambezi, но и с процессорами предыдущего поколения семейства Phenom II с разъемом AMD Socket AM3.
В какойто мере чипсеты AMD 9-й серии являются улучшенной версией чипсетов AMD 8-й серии, обеспечивая более широкие возможности. Напомним, что новые процессоры Zambezi с разъемом Socket AM3+ теоретически совместимы и с чипсетами AMD 8-й серии, однако в этом случае не все функциональные возможности процессоров Zambezi могут быть реализованы.
В настоящий момент 9-ю серию чипсетов AMD составляют три модели: AMD 990FX (кодовое наименование чипа RD990), AMD 990X (кодовое наименование чипа RD990) и AMD 970 (кодовое наименование чипа RD970). Все три чипсета поддерживают новый 942-контактный разъем Socket AM3+ и выполняются по 65-нм техпроцессу. Во всех чипсетах AMD 9-й серии имеется блок управления памятью для операций вводавывода IOMMU (Input/Output Memory Management Unit).
Так же как и традиционный процессорный блок управления памятью (MMU), который транслирует видимые процессором виртуальные адреса в физические, блок IOMMU занимается трансляцией виртуальных адресов, видимых аппаратным устройством, в физические адреса.
Чипсеты AMD 9-й серии связаны с процессором по традиционной шине HyperTransport. При этом во всех чипсетах реализована поддержка шины HyperTransport 3.1 с пропускной способностью до 6,4 GT/s.
Топовая модель AMD 990FX поддерживает 42 линии PCI Express 2.0, которые распределяются следующим образом: 32 линии PCI Express 2.0 могут быть сгруппированы в два порта PCI Express 2.0 x16 либо в четыре порта PCI Express 2.0 x8, оставшиеся десять линий могут быть сгруппированы в один порт PCI Express 2.0 x4 и в шесть портов PCI Express 2.0 x1, а могут применяться интегрированными на плате контроллерами.
Естественно, платы на базе топового чипсета AMD 990FX поддерживают технологию объединения дискретных видеокарт CrossFireX в режиме двух или четырех слотов PCI Express x16.
Чипсет AMD 990X отличается от AMD 990FX как раз количеством поддерживаемых линий PCI Express 2.0. В данном чипсете предусмотрено 26 линий PCI Express 2.0, но только 16 линий PCI Express 2.0 могут использоваться для организации одного порта PCI Express 2.0 x16 либо двух портов PCI Express 2.0 x8. Оставшиеся линии PCI Express 2.0 могут быть сгруппированы в один порт PCI Express 2.0 x4 и шесть портов PCI Express 2.0 x1, а могут применяться интегрированными на плате контроллерами. Чипсет AMD 990X, как и его старший брат AMD 990FX, поддерживает технологию CrossFireX в режиме двух слотов PCI Express x16.
Платы на базе младшего чипсета AMD 970 могут иметь только один слот PCI Express 2.0 x16 и не поддерживают технологию CrossFireX.
Собственно говоря, функциональность чипов AMD 990FX, 990X и 970, которые являются северными мостами соответствующих чипсетов, ограничивается лишь поддержкой ими линий PCI Express 2.0. Вся остальная функциональность чипсета сосредоточена в южном мосте. Для связи северного и южного мостов используется шина A-Link Express III с пропускной способностью 4 Гбайт/с (эквивалентно пропускной способности шины PCI-Express 2.0 x4).
Теоретически северные мосты AMD 990FX, 990X и 970 совместимы с южными мостами SB710, SB750, SB810, SB850, SB920 и SB950. Южные мосты SB710, SB750, SB810 и SB850 уже не новые и применяются давно. А вот мосты SB920 и SB950 специально предназначены для чипсетов AMD 9-й серии.
Южные мосты SB920 и SB950 поддерживают до 14 портов USB 2.0, шину PCI и шесть портов SATA 6 Гбит/с (SATA III). Мост SB950 поддерживает создание RAID-массивов уровней 0, 1, 5 и 10, а мост SB920 — только уровней 0, 1 и 10. Еще одно различие между мостами SB920 и SB950 заключается в том, что мост SB950 поддерживает четыре линии PCI Express 2.0 x1, а мост SB920 — только две такие линии.
Естественно, мосты SB920 и SB950 поддерживают HD Audio и гигабитный Ethernet.
Отметим, что энергопотребление чипов SB920 и SB950 составляет 5 Вт; энергопотребление северного моста AMD 990FX — 19,6 Вт, северного моста AMD 990X — 14 Вт, а северного моста AMD 970 — 13,6 Вт.
Плата GIGABYTE GA-990FXA-UD7 основана на новом топовом чипсете AMD 990FX в связке с южным мостом AMD SB950. Она имеет формфактор ATX (30,5x26,3 cм) и может применяться для создания игровых и высокопроизводительных компьютеров. Плата ориентирована на использование процессоров AMD FX (Zambezi) с разъемом AM3+, но также совместима с процессорами семейств AMD Phenom II и Athlon II c разъемом AM3. Для установки модулей памяти на плате предусмотрены четыре DIMM-слота, что позволяет устанавливать до двух модулей памяти DDR3 на каждый из двух каналов памяти. Всего плата поддерживает установку до 32 Гбайт памяти (спецификация чипсета), и с ней оптимально применять два или четыре модуля памяти. Отметим, что в штатном режиме плата поддерживает память DDR3-1866, DDR3-1600, DDR3-1333 и DDR3-1066, а в режиме разгона — также память DDR3-2000. Для установки видеокарт и других плат расширения на GIGABYTE GA-990FXA-UD7 реализованы шесть слотов с формфактором PCI Express 2.0 x16, но, естественно, не все они работают на скорости x16.
Чипсет AMD 990FX (северный мост) поддерживает 42 линии PCI Express 2.0, которые распределяются следующим образом: 32 линии PCI Express 2.0 могут быть сгруппированы в два порта PCI Express 2.0 x16 либо в четыре порта PCI Express 2.0 x8. Оставшиеся десять линий могут быть сгруппированы в порты PCI Express 2.0 x4 и PCI Express 2.0 x1 или использоваться интегрированными на плате контроллерами. Собственно, на плате GIGABYTE GA-990FXA-UD7 32 линии PCI Express 2.0, поддерживаемые чипсетом, используются для организации четырех слотов с формфактором PCI Express 2.0 x16. Причем если применяются только два из этих слотов, то они работают на скорости x16, а при использовании одновременно всех четырех или трех портов они переключаются в скоростной режим x8. Еще два порта с формфактором PCI Express 2.0 x16 всегда работают в скоростном режиме x4. Таким образом, всего для организации шести слотов с формфактором PCI Express 2.0 x16 применяется 40 линий PCI Express 2.0, поддерживаемых северным мостом AMD 990FX. Естественно, плата GIGABYTE GA-990FXA-UD7 поддерживает технологию объединения дискретных видеокарт CrossFireX в режиме двух, трех или четырех слотов PCI Express x16, а также технологию NVIDIA SLI. Кроме упомянутых слотов с формфактором PCI Express 2.0 x16, на плате есть один традиционный слот PCI, который реализован на PCI-шине, поддерживаемой южным мостом AMD SB950. Также шину PCI использует FireWire-контроллер VIA VT6308, который предоставляет в распоряжение пользователя два порта IEEE-1394a, один из которых выведен на заднюю панель платы, а другой можно вывести на тыльную сторону ПК, подключив соответствующую плашку к разъему на плате. Для подключения жестких дисков на плате GIGABYTE GA-990FXA-UD7 предусмотрены восемь внутренних и два внешних SATA-порта. Вопервых, имеются шесть портов SATA 6 Гбит/с, реализованные через интегрированный в южный мост AMD SB950 SATA-контроллер. Эти порты поддерживают возможность организации RAID-массивов уровней 0, 1, 10 и 5. Вовторых, на плате интегрированы два двухпортовых SATA 6 Гбит/с контроллера Marvell 88SE9172, посредством одного из которых реализованы два внутренних порта SATA 6 Гбит/с с возможностью организации RAID-массивов уровней 0 и 1, а посредством другого — два внешних порта eSATA 6 Гбит/с (один из них разделяемый с USB). Отметим, что один из контроллеров Marvell 88SE9128 задействует линию PCI Express 2.0, поддерживаемую северным мостом AMD 990FX, а другой — линию PCI Express 2.0, поддерживаемую южным мостом AMD SB950 (всего южный мост AMD SB950 поддерживает четыре линии PCI Express 2.0). Для подключения разнообразных периферийных устройств на плате GIGABYTE GA-990FXA-UD7 имеются 18 портов USB. Посредством южного моста AMD SB950 реализовано 14 традиционных портов USB 2.0 (южный мост SB950 поддерживает до 14 портов USB 2.0), восемь из которых (включая комбинированный порт eSATA/USB) выведены на заднюю панель платы, а еще шесть портов можно вывести на тыльную сторону ПК, подключив соответствующие плашки к разъемам на плате. Кроме того, на плате интегрированы два двухпортовых USB 3.0-контроллера Etron EJ168, причем два порта выведены на заднюю панель платы, а еще два можно вывести на тыльную сторону ПК, подключив соответствующую плашку к разъему на плате. Отметим, что один из контроллеров Etron EJ168 задействует линию PCI Express 2.0, поддерживаемую северным мостом AMD 990FX, а другой — линию PCI Express 2.0, поддерживаемую южным мостом AMD SB950. Аудиоподсистема этой материнской платы построена на базе HD-аудиокодека Realtek ALC889. Соответственно на тыльной стороне материнской платы имеются шесть аудиоразъемов типа mini-jack, а также коаксиальный и оптический разъемы SPDIF (выходы). На плате интегрирован гигабитный сетевой контроллер Realtek RTL8111E, который занимает одну линию PCI Express 2.0, поддерживаемую южным мостом AMD SB950. Если посчитать количество контроллеров, интегрированных на плате GIGABYTE GA-990FXA-UD7, которые используют шину PCI Express 2.0, то получится, что всего их пять. Действительно, шину PCI Express 2.0 задействуют два контроллера Marvell 88SE9172, два контроллера Etron EJ168 и контроллер Realtek RTL8111E. При этом из четырех линий PCI Express 2.0, поддерживаемых южным мостом AMD SB950, применяются три, а из десяти оставшихся линий PCI Express в северном мосте AMD 990FX — все десять (два слота PCI Express 2.0 x4 и два контроллера). Система охлаждения платы GIGABYTE GA-990FXA-UD7 состоит из трех радиаторов, связанных друг с другом тепловой трубкой. Один радиатор закрывает MOSFET-транзисторы, расположенные рядом с процессорным разъемом, другой установлен на северном мосте AMD 990FX, а третий закрывает южный мост AMD SB950. Отметим также, что на плате имеются два четырехконтактных и два трехконтактных разъема для подключения вентиляторов. На плате GIGABYTE GA-990FXA-UD7 используется 10-фазный (8+2) регулятор напряжения питания процессора на базе управляющего контроллера Intersil ISL6330 и технология DrMOS, когда пара MOSFET-транзисторов и микросхема драйвера этих транзисторов интегрируются в одной микросхеме DrMOS SiC769CD. |
Производительность процессора AMD FX-8100
В заключение нашего обзора приведем результаты тестирования восьмиядерного процессора AMD FX-8100. Процессор, конечно, не топовый, однако он вполне годится для того, чтобы получить представление о производительности процессоров AMD FX.
Для тестирования процессора AMD FX-8100 использовался стенд следующий конфигурации:
- материнская плата — GIGABYTE GA-990FXA-UD7;
- чипсет — AMD 990FX+ SB950;
- видеокарта — NVIDIA GeForce GTX 590;
- видеодрайвер — ForceWare 280.26
- память — DDR3-1333;
- объем памяти — 4 Гбайт;
- режим работы памяти — двухканальный;
- жесткий диск — WD1002FBYS;
- операционная система — Windows 7 Ultimate (64-бит).
Для тестирования мы применяли наш новый тестовый скрипт ComputerPress Benchmark Script v.10.0, подробное описание которого можно найти в этом номере журнала.
Кроме процессора AMD FX-8100, мы протестировали процессоры Intel Core i7-2600K, Intel Core i5-2500K и Intel Core i5-2400. Их технические характеристики представлены в табл. 2.
Для тестирования процессоров Intel использовался стенд следующей конфигурации:
- материнская плата — FOXCONN Z68A-A;
- чипсет — Intel Z68 Express;
- видеокарта — NVIDIA GeForce GTX 590;
- видеодрайвер — ForceWare 280.26;
- память — DDR3-1333;
- объем памяти — 4 Гбайт;
- режим работы памяти — двухканальный;
- жесткий диск — WD1002FBYS;
- операционная система — Windows 7 Ultimate (64-бит).
Заключение
По стоимости процессор AMD FX-8100 должен быть чуть дороже процессора Intel Core i5-2400 и чуть дешевле процессора Intel Core i5-2500K, так что его сопоставление именно с этими процессорами вполне уместно.
Кроме того, напомним, что в качестве референсной системы в нашем тестировании применялся ноутбук ASUS G53SX с процессором Intel Core i7-2630QM (базовая тактовая частота 2 ГГц; максимальная тактовая частота в режиме Turbo Boost 2,9 ГГц) в совокупности с чипсетом Intel HM65 Express, 8 Гбайт памяти DDR3-1333, а также дискретной видеокартой NVIDIA GeForce GTX 560M и жестким диском HITACHI HTS547564A9E384 (640 Гбайт).
Итак, если посмотреть на результаты тестирования восьмиядерного процессора AMD FX-8100, то можно сделать только один вывод: не получилось (табл. 3). Ну не получилось у компании AMD сделать высокопроизводительный, конкурентоспособный процессор. Восемь псевдоядер AMD вчистую проигрывают четырем истинным ядрам Intel. И получается, что настольный ПК, оснащенный мощной видеокартой и восьмиядерным процессором AMD FX-8100, на деле оказывается на 16% слабее ноутбука на базе четырехъядерного процессора Intel. Наверное, любые комментарии в данном случае просто бессмысленны.
Если сравнивать процессор AMD FX-8100 с процессорами семейства Sandy Bridge, то ситуация следующая. Он уступает по производительности процессору Intel Core i7-2600K целых 54%, а процессорам Intel Core i5-2500K и Intel Core i5-2400 — 46 и 37% соответственно.
Вообще, у компании AMD наблюдается довольно странный тренд: каждый следующий свой процессор компания умудряется сделать чуть хуже предыдущего. Вопрос только в том, кому нужны такие процессоры.
Итак, микроархитектура AMD Bulldozer себя не оправдала. И самое печальное, что она оказалась неконкурентоспособной уже на момент выхода, а ведь именно она станет основой для процессоров AMD в течение нескольких последующих лет. Что ж, остается только сожалеть, что нас лишили удовольствия наблюдать за увлекательным поединком между Intel и AMD.