Процессоры семейства Penryn: первые подробности

 

 

На прошедшем в апреле форуме компании Intel IDF 2007 одно из центральных мест было отведено новому семейству процессоров c кодовым названием Penryn, выполненных по 45-нанометровому технологическому процессу. В ходе форума нам удалось провести экспресс-тестирование двухъядерного и четырехъядерного процессоров семейства Penryn и сравнить их с четырехъядерным процессором Intel Core 2 Extreme QX6800. В данной статье мы расскажем о результатах данного тестирования, а также приведем более подробную информацию о новом процессоре.

Одним из наиболее значимых событий прошедшего 17-18 апреля в Пекине форума IDF 2007 компании Intel стало объявление нового семейства процессоров Penryn для настольных ПК.

Пока еще не известны ни официальные названия новых процессоров, ни их кодовые обозначения. Под загадочным словом Penryn понимаются процессоры на базе процессорной микроархитектуры Intel Core, выполненные на основе нового, 45-нанометрового технологического процесса c использованием принципиально новых материалов High-K на основе гафния (материалы с высоким значением диэлектрической постоянной) для изготовления подзатворного диэлектрика транзистора, а также новых материалов самого затвора. Напомним, что современные процессоры семейства Intel Core 2 Duo и Intel Core 2 Quad производятся на основе 65-нанометрового технологического процесса. Впрочем, тонкости нового технологического процесса изготовления транзисторов — это тема для отдельной статьи. Пока же мы рассмотрим лишь особенности нового семейства процессоров.

 

В состав семейства Penryn войдут шесть моделей, включая двух- и четырехъядерные процессоры для настольных ПК и двухъядерный процессор для мобильных ПК (они выйдут под торговой маркой Intel Core), а также новые двух- и четырехъядерные серверные процессоры под торговой маркой Intel Xeon.

Все процессоры семейства Penryn изготовляются по новому техпроцессу, что позволяет уменьшить размеры транзисторов, а значит, увеличить их плотность размещения на кристалле процессора, то есть повысить общее количество транзисторов в процессоре без изменения его размеров. Поэтому вполне естественно, что в новых процессорах увеличен размер L2-кэша. В двухъядерном процессоре Penryn, который является своего рода преемником двухъядерного процессора Intel Core 2 Duo (кодовое название Woodcrest), размер кэша увеличен до 6 Мбайт (по 3 Мбайт на каждое ядро процессора). В четырехъядерном процессоре Penryn, который сменит четырехъядерный процессор Intel Core 2 Quad (кодовое название Kentsfield), размер кэша увеличен до 12 Мбайт (по 3 Мбайт на каждое ядро процессора).

 

Кроме размера кэша L2, возрастет и уровень ассоциативности кэш-памяти, что, как ожидается, еще больше ускорит работу и обеспечит максимальное использование ресурсов кэш-памяти. Впрочем, увеличенный размер кэша L2 — это лишь одно из нововведений новых процессоров.

В новом двухъядерном процессоре Penryn количество транзисторов составит 820 млн, при этом площадь кристалла двухъядерной модели будет равна 107 мм2, что на 25% меньше, чем у современной продукции Intel, выпускаемой по 65-нанометровой производственной технологии, а энергопотребление останется на том же уровне, что и в современных двухъядерных процессорах Intel, или даже будет снижено.

Конечно, размер L2-кэша и новые материалы, используемые при производстве транзисторов, — это не единственные нововведения в поколении процессоров семейства Penryn. По сути, речь идет о существенном обновлении процессорной микроархитектуры Intel Core, которая получила название Enhanced Intel Core Microarchitecture.

 

Среди нововведений этой микроархитектуры можно выделить:

  • поддержку набора инструкций SSE4;
  • механизм суперперестановок (Super Shuffle Engine);
  • новую технологию Fast Radix-16 Divider;
  • новую технологию управления энергопотреблением Deep Power Down Technology;
  • новую технологию Enhanced Intel Dynamic Acceleration Technology.

Все процессоры семейства Penryn будут поддерживать набор инструкций Intel Streaming SIMD Extensions 4 (SSE4), в который включено 47 дополнительных инструкций Intel 64, позволяющих повысить производительность и создать новые функциональные возможности для архитектуры Intel. Новый набор инструкций SSE4 ориентирован на обработку графики, кодирование и обработку видео, синтез трехмерных изображений, а также на игровые приложения.

 

Напомним, что еще в рамках осеннего форума IDF 2006 корпорация Intel обнародовала планы по реализации новых инструкций SSE4, расширяющих набор инструкций архитектуры Intel 64.

Еще одна новая технология, применяемая в процессорах семейства Penryn, — это механизм суперперестановок Super Shuffle Engine. Благодаря реализации однопроходного 128-разрядного модуля перестановок, процессоры Penryn могут выполнять перестановки значений сразу во всем 128-разрядном регистре за один такт. Это существенно повышает производительность при выполнении инструкций из наборов SSE2, SSE3 и SSE4, которые содержат операции, связанные с перестановкой, — такие, как упаковка, распаковка и сдвиг упакованных значений. Эта функция позволяет повысить производительность при создании контента, обработке изображений и видео, а также при высокопроизводительных вычислениях.

 

Кроме того, в процессорах Penryn реализован новый метод выполнения деления, получивший название Fast Radix-16 Divider. Как ожидается, данный метод обеспечит ускорение работы делителя примерно вдвое по сравнению с процессорами предыдущих поколений.

Также в процессорах семейства Penryn будет использоваться улучшенная технология Intel Virtualization Technology, что обеспечит сокращение времени переключения виртуальных машин в среднем на 25-75%.

Следующее нововведение — это технология Enhanced Intel Dynamic Acceleration Technology (улучшенная технология динамического ускорения), смысл которой заключается в следующем. В многоядерных процессорах в том случае, когда нагружено только одно ядро, а другое находится в состоянии простоя (состояния C3 — C6) с низким энергопотреблением, динамически повышается тактовая частота нагруженного ядра. Повышение тактовой частоты одного ядра реализуется таким образом, чтобы энергопотребление процессора становилось меньше его энергопотребления в состоянии, когда оба ядра работают на номинальной частоте.

Мобильный процессор с кодовым названием Penryn оснащен новым режимом работы с усовершенствованными функциями управления энергопотреблением — Deep Power Down Technology, позволяющим существенно сократить энергопотребление процессора в моменты его простоя за счет снижения влияния токов утечки внутри транзисторов. Эта технология, способствующая продлению срока автономной работы ноутбука от батарей, является важнейшим усовершенствованием мобильных процессоров Intel.

 

Ну и последняя особенность новых процессоров — это более высокая тактовая частота. Так, в двухъядерном и четырехъядерном процессорах Penrуn тактовая частота будет равна 3,33 ГГц, а частота FSB (Front Side Bus) — 1333 МГц. Таким образом, пропускная способность процессорной шины составит уже 10,6 Гбайт/с (1333 МГц x 64 бит).

Если говорить об основных отличиях четырехъядерного процессора Penryn от двухъядерного, то в конструктивном плане четырехъядерный процессор Penryn представляет собой два двухъядерных процессора Penryn, совмещенных в одном процессорном корпусе.

Такой подход имеет свои плюсы и минусы. К плюсам можно отнести простоту изготовления этих процессоров. Фактически кристаллы для двухъядерных и четырехъядерных процессоров изготавливаются на одних и тех же фабриках. Соответственно дополнительные расходы на производство четырехъядерных процессоров минимальны, что положительно сказывается на их конечной стоимости для потребителей. Кроме того, это дает компании Intel определенную гибкость в производстве двухъядерных процессоров, поскольку для четырехъядерных процессоров на этапе тестирования отбираются кристаллы с наименьшим энергопотреблением.

 

Если же говорить о минусах четырехъядерного процессора Penryn в плане конструкции, то отметим, что он представляет собой «псевдочетырехъядерный» процессор, поскольку истинным четырехъядерным является процессор, в котором все четыре ядра расположены на одном кристалле. Такая организация позволяет использовать общий кэш для всех ядер, повысить скорость передачи данных от одного ядра к другому, а также улучшить масштабируемость системы. В этом смысле двухъядерный процессор Penryn представляет собой истинно двухъядерный. Таким образом, можно утверждать, что производительность процессора, в котором четыре ядра выполнены на одном кристалле, будет выше производительности процессора с четырьмя ядрами, выполненными как два двухъядерных кристалла в одной упаковке.

 

Двухъядерный и четырехъядерный процессоры Penryn имеют разъем LGA775 и поддерживаются чипсетами Intel 975 Express, однако требуют определенной поддержки со стороны BIOS. Поэтому далеко не все платы на чипсете Intel 975 Express подойдут для процессоров Penryn. Естественно, новое поколение чипсетов Intel уже точно будет ориентировано на поддержку процессоров Penryn.

Итак, после краткого знакомства с процессорами Penryn перейдем к результатам тестирования, сравнив их с процессором Intel Core 2 Extreme QX6800.

Краткие технические характеристики этих процессоров приведены в табл. 1.

Таблица 1. Краткие технические характеристики процессоров

 

Двухъядерный процессор Penryn

Четырехъядерный процессор Penryn

Intel Core 2 Extreme QX6800

Техпроцесс

45-нм High-K

45-нм High-K

90-нм

Количество ядер

2

4

4

Тактовая частота, ГГц

3,33

3,33

2,93

Частота FSB, МГц

1333

1333

1066

Объем кэш-памяти L2, Мбайт

6

12

8

Для тестирования использовался стенд следующей конфигурации:

  • материнская плата — Intel BadAxe 2 Desktop Board D975XBX2 Rev. 505;
  • BIOS — Pre Production;
  • видеокарта — ASUS NVIDIA GeForce 8800GTX;
  • драйвер графической карты — NVIDIA nForce 100.65;
  • память — 2x1 Гбайт Corsair TWIN2X2048-8500C2);
  • режим работы памяти — DDR2-800 (тайминги 5-5-5-15);
  • жесткий диск — Seagate Barracuda 7200.10 320 Гбайт;
  • драйвер чипсета — Intel Chipset Software Installation Utility 8.1.1.1010;
  • драйвер жесткого диска — Intel Matrix Storage Driver 6.20.1.1002;
  • аудиодрайвер — Sigmatel Audio Driver 6.10.5275;
  • операционная система — Microsoft Windows Vista Ultimate (32-битная версия).

Тестирование проходило в рамках форума IDF 2007, поэтому времени на детальное исследование процессора у нас не было. Кроме того, бенчмарки были отобраны специалистами компании Intel. Их не так много, да и нельзя утверждать, что с помощью этих тестов можно получить объективную картину для сравнения производительности процессоров. Но все же это лучше, чем ничего. Итак, применялись следующие бенчмарки и приложения:

  • Futuremark 3DMark06 Pro Build 1.1.0 (CPU Score);
  • Futuremark 3DMark06 Pro Build 1.1.0 (Overall Score);
  • Mainconcept H.264 Encoder (с);
  • Cinebench R 9.5 (CPU Benchmark);
  • Cinebench R 10 Beta (CPU Benchmark);
  • Half-Life 2 Lost Coast Built 2707 (fps);
  • DivX 6.6 Alpha + VirtualDub 1.7.1 (с).

Тест Futuremark 3DMark06 Pro Build 1.1.0 является синтетическим бенчмарком и предназначен для измерения производительности процессоров и видеокарт. С тем чтобы увеличить нагрузку именно на процессор, данный тест запускался с настройками по умолчанию, то есть при отключенных функциях анизотропной фильтрации и антиалиасинга.

Игра Half-Life 2 Lost Coast Built 2707 использовалась для измерения производительности процессоров в играх. В данном случае результат теста представлял собой количество отображаемых кадров в секунду (frames per second, fps).

Приложение Mainconcept H.264 Encoder применялось для преобразования AVI-файла при помощи кодека H.264 High в видеофайл MPEG-2 (mpg). Результатом теста являлось время кодирования в секундах, причем чем оно меньше, тем лучше.

Тест Cinebench предназначен для тестирования графических карт и процессоров и позволяет определить скорость рендеринга. В нем использовался подтест CPU Benchmark, а конечным результатом стала скорость рендеринга при применении всех процессоров системы (для многопроцессорных систем), выраженная в безразмерных единицах Cinebench.

Утилита DivX 6.6 Alpha использовалась для конвертирования видеоклипа в формате MPEG-2 в видефрагмент DivХ. Результатом теста являлось время кодирования в секундах — чем оно меньше, тем лучше.

Результаты сравнительного тестирования процессоров представлены в табл. 2, а на рисунке показаны нормированные результаты тестирования.

Таблица 2. Результаты сравнительного тестирования процессоров

Тесты

Двухъядерный Penryn (45-нм High-K)

Четырехъядерный Penryn (45-нм High-K)

Intel Core 2 Extreme QX6800

Futuremark 3DMark06 Pro Build 1.1.0 (CPU Score)

3061

4957

4070

Futuremark 3DMark06 Pro Build 1.1.0 (Overall Score)

11 015

11963

11 123

Mainconcept H.264 Encoder (с)

119

73

89

Cinebench R 9.5 (CPU Benchmark)

1134

1935

1549

Cinebench R 10 Beta (CPU Benchmark)

7045

13 068

10 416

Half-Life 2 Lost Coast Built 2707 (fps)

210

210

153

DivX 6.6 Alpha + VirtualDub 1.7.1 (с)

22

18

38

Как видно из результатов тестирования, производительность четырехъядерного процессора Penryn оказалась выше производительности четырехъядерного процессора Intel Core 2 Extreme QX6800, что вполне логично, поскольку у процессора Penryn выше тактовая частота и больше размер L2-кэша. В то же время если сравнивать двухъядерный процессор Penryn с четырехъядерным процессором Intel Core 2 Extreme QX6800, то выясняется, что в большинстве приложений четырехъядерный процессор Intel Core 2 Extreme QX680 демонстрирует более высокую производительность.

 

]

Нормированные результаты тестирования

Наибольший прирост производительности при применении четырехъядерного процессора Penryn наблюдается при выполнении задач видеокодирования с использованием кодека DivX 6.6 Alpha. Так, при видеокодировании с помощью данного кодека скорость кодирования при применении четырехъядерного процессора Penryn оказывается более чем в два раза меньше, чем в случае четырехъядерного процессора Intel Core 2 Extreme QX6800.

В приложении Mainconcept H.264 Encoder преимущество четырехъядерного процессора Penryn несколько скромнее — скорость кодирования оказывается быстрее всего на 21% по сравнению с Intel Core 2 Extreme QX6800.

Синтетический тест 3DMark06 позволяет выявить преимущество четырехъядерного процессора Penryn только в подтестах, ориентированных на загрузку процессора (прирост CPU Score на 21%). Если же рассматривать общие результаты (Overall Score), то у четырехъядерного процессора Penryn и Intel Core 2 Extreme QX6800 они не сильно различаются, что вполне логично, поскольку они определяются в основном возможностями видеокарты.

В игровом тесте Half-Life 2 Lost Coast Built 2707 новый четырехъядерный процессор Penryn, равно как и одноименный двухъядерный, позволяют добиться производительности на 37% выше в сравнении с процессором Intel Core 2 Extreme QX6800. По всей видимости, в данном случае прирост производительности определяется не количеством ядер и не размером кэша, а просто более высокой тактовой частотой процессоров этого семейства.

В тесте Cinebench (рендеринг сцен) скорость рендеринга с помощью четырехъядерного процессора Penryn оказывается на 25% выше, чем при использовании процессора Intel Core 2 Extreme QX6800.

Архитектура набора инструкций процессора (Instruction Set Architecture, ISA) определяет типы данных, с которыми работает процессор, выполняемые процессором инструкции, режимы адресации памяти, архитектуру памяти, типы прерываний, обработку исключительных ситуаций и пр. ISA включает также спецификацию машинных команд, реализованную в процессоре. В пределах одного семейства процессоров ISA часто расширяется, то есть дополняется новыми наборами выполняемых инструкций, чтобы обеспечить более высокую энергетическую эффективность процессоров, то есть реализовать возможность выполнения большего числа инструкций за один такт работы процессора.

Для различных процессоров Intel существует три разных типа ISA: IA-64, IA-32 и Intel 64. Тип IA-64 представляет собой архитектуру 64-разрядных вычислений, реализованных в серверных процессорах семейства Intel Itanium. Архитектура IA-32 определяет набор команд для 32-разрядных вычислений, поддерживаемых большинством процессоров Intel для настольных и мобильных систем (семейства Intel Celeron, Intel Pentium и Intel Core Duo).

Архитектура Intel 64 определяет набор команд для 64-разрядных вычислений, поддерживаемых процессорами Intel. Отметим, что архитектура Intel 64 является 64-битной версией архитектуры IA-32 и полностью с ней совместима.

Как известно, производительность процессора определяется скоростью выполнения им программных инструкций, которая, в свою очередь, зависит как от частоты процессора, так и от количества выполняемых за один такт инструкций. Последнее обусловлено микроархитектурой процессора и оптимизацией программного кода к ней, которая, в свою очередь, зависит от архитектуры ISA. Именно поэтому развитие процессоров неразрывно связано с развитием набора команд и специализированных расширений базового набора команд, что позволяет увеличивать вычислительную мощность процессора. К примеру, первое расширение набора инструкций (Float Point, FP) для работы с действительными числами (числами с плавающей запятой) было реализовано еще в процессоре i8086. Затем был введен набор инструкций SIMD (Single Instruction, Multiple Data), позволяющий реализовать технологию параллелизма на уровне команд, то есть одновременного выполнения нескольких команд в микроархитектуре P5. В 1997 году было введено расширение набора инструкций MMX, позволяющее повысить производительность в графических приложениях, приложениях потокового видео и др.

В процессорной микроархитектуре P6 (процессор Intel Pentium III) была реализована архитектура набора команд Streaming SIMD Extensions (SSE), расширившая технологию MMX и позволившая реализовать одновременно четыре FP-операции при использовании восьми 128-битных регистров процессора.

Одновременно с архитектурой Intel NetBurst (семейство процессоров Intel Pentium 4) компания Intel представила набор инструкций SSE2 - расширенную версию набора SSE, учитывающую особенности архитектуры Intel NetBurst.

Вслед за SSE2 был выпущен набор инструкций SSE3, оптимизированный для процессоров, выполняемых по 90-нанометровому техпроцессу. Этот набор инструкций представлял собой расширенный вариант SSE2 и включал 13 дополнительных SIMD-команд.

В процессорной архитектуре Intel Core появился набор команд Supplemental SSE3, в котором были добавлены 32 новые инструкции, позволяющие оптимизировать приложения под новую микроархитектуру процессора, а в архитектуре Enhanced Intel Core - набор команд SSE4, в который было включено еще 47 инструкций.

В начало В начало

КомпьютерПресс 5'2007


Наш канал на Youtube

1999 1 2 3 4 5 6 7 8 9 10 11 12
2000 1 2 3 4 5 6 7 8 9 10 11 12
2001 1 2 3 4 5 6 7 8 9 10 11 12
2002 1 2 3 4 5 6 7 8 9 10 11 12
2003 1 2 3 4 5 6 7 8 9 10 11 12
2004 1 2 3 4 5 6 7 8 9 10 11 12
2005 1 2 3 4 5 6 7 8 9 10 11 12
2006 1 2 3 4 5 6 7 8 9 10 11 12
2007 1 2 3 4 5 6 7 8 9 10 11 12
2008 1 2 3 4 5 6 7 8 9 10 11 12
2009 1 2 3 4 5 6 7 8 9 10 11 12
2010 1 2 3 4 5 6 7 8 9 10 11 12
2011 1 2 3 4 5 6 7 8 9 10 11 12
2012 1 2 3 4 5 6 7 8 9 10 11 12
2013 1 2 3 4 5 6 7 8 9 10 11 12
Популярные статьи
КомпьютерПресс использует