oldi

Новый процессор Prescott

На проходившем 18-21 февраля 2003 года в г.Сан-Хосе (шт. Калифорния) Форуме компании Intel для разработчиков (Intel Developer Forum, IDF) Луис Бeрнс (Louis Burns), вицe-прeзидeнт и один из генеральных менеджеров подразделения Desktop Platforms Group корпорации Intel, обнародовал планы компании по выпуску следующих версий процессоров для настольных ПК. Речь идет о процессоре с кодовым названием Prescott.

Как известно, процессоры характеризуются производительностью. Многие знают, что процессор Intel Pentium 4 3,06 ГГц с поддержкой технологии Hyper-Threading более производителен, чем, к примеру, процессор Intel Pentium III 800 МГц или Intel Pentium 4 2,53 ГГц. Однако задумаемся над тем, что именно следует называть производительностью процессора. Если, скажем, сравнивать друг с другом процессоры Intel Pentium 4, то понятно, что чем выше тактовая частота, тем больше производительность процессора. Но правомерно ли утверждать, что производительность процессора находится в прямой зависимости от его тактовой частоты? Вспомним первую модель процессора Intel Pentium 4 с тактовой частотой 1,3 ГГц, который во многих тестах проигрывал процессору Intel Pentium III с меньшей тактовой частотой. Так от чего все-таки зависит производительность процессора?

Общепринято отождествлять производительность процессора со скоростью выполнения им инструкций программного кода. Производительность (Performance) — это отношение общего числа выполненных инструкций программного кода ко времени их выполнения:

В этом смысле производительность процессора отождествляется с количеством инструкций, выполняемых за секунду (Instructions rate). Поскольку одной из важных характеристик процессора является его тактовая частота, то желательно связать с ней производительность процессора. Это можно сделать, если количество инструкций, выполняемых за единицу времени, рассматривать как произведение количества инструкций, выполняемых за один такт процессора (Instruction Per Clock, IPC), на количество тактов процессора в единицу времени:

Количество тактов процессора в единицу времени — это и есть его тактовая частота. Таким образом, производительность процессора зависит в равной степени и от его тактовой частоты, и от количества инструкций, выполняемых за такт (IPC):

Количество инструкций, выполняемых за время одного такта, зависит от микроархитектуры процессора, то есть от количества исполняемых блоков, от длины конвейера и эффективности его заполнения, от блока предвыборки и т.д. Кроме того, естественно, существует также зависимость от оптимизации программного кода к данной микроархитектуре процессора. Частота процессора зависит и от его микроархитектуры, и от технологии его производства, определяющей минимальные размеры используемых транзисторов, их быстродействие и время задержки передачи сигнала в межуровневых соединениях.

Итак, в общих чертах становится ясно, почему вполне корректным является сравнение производительности процессоров на основании их тактовой частоты в пределах одной и той же микроархитектуры, и в то же время некорректно сравнение производительности процессоров с различной микроархитектурой исключительно на основе тактовой частоты.

Все процессоры Intel Pentium 4 имеют, по существу, одну и ту же микроархитектуру, называемую Intel NetBurst. Впрочем, в различных версиях процессоров используются те или иные «косметические» улучшения микроархитектуры, которые положительно сказываются на увеличении производительности процессора. В качестве примеров незначительного видоизменения микроархитектуры можно назвать реализацию технологии Hyper-Threading или увеличение размера кэша процессора.

Однако наряду с совершенствованием микроархитектуры процессора немаловажное значение имеет и его тактовая частота. Как уже отмечалось, тактовая частота процессора в значительной степени определяется технологическим процессом производства ядра процессора. Процессор Intel Pentium 4 первоначально изготавливался по 0,18-микронному технологическому процессу (кодовое название этого процессора — Willamette), затем пришло время 0,13-микронной технологии (кодовое название процессора — Northwood). Одновременно с переходом на новый технологический процесс алюминиевые соединения внутри процессора были заменены медными, что позволило снизить время задержки передачи сигнала. Кроме того, медные соединения обладают меньшим удельным сопротивлением (в результате чего снижается требование по энергопотреблению процессора), более высокой устойчивостью к прохождению тока и способны выдерживать более высокую плотность тока, что немаловажно при уменьшении размеров проводников.

Технологический процесс производства процессора фактически определяет его потенциальные возможности по наращиванию тактовой частоты. Так, процессоры Willamette имели тактовые частоты от 1,3 до 2 ГГц, а процессоры Northwood — от 1,6 до 3,06 ГГц. Но, похоже, что трехгигагерцевый рубеж является предельным для процессора Northwood. Для дальнейшего увеличения тактовой частоты необходимо уменьшение размеров транзисторов (чтобы увеличить их быстродействие). Поэтому следующее поколение процессора Intel Pentium 4, известное под кодовым название Prescott, будет выполняться уже по 90-нанометровому технологическому процессу.

В 90-нанометровом процессе применяется целый ряд передовых технологий. Это и самые маленькие в мире серийно изготавливаемые КМОП-транзисторы с длиной затвора 50 нм, что обеспечивает рост производительности при одновременном снижении энергопотребления, и самый тонкий оксидный слой затвора у всех когда-либо производившихся транзисторов  — всего 1,2 нм, или менее 5 атомарных слоев, и первая в отрасли реализация высокоэффективной технологии напряженного кремния. Вследствие всех нововведений на 10-20% улучшаются рабочие характеристики транзисторов, при том что затраты на производство увеличиваются всего на 2%.

Пожалуй, из вышеперечисленных характеристик в комментариях нуждается лишь понятие «напряженный кремний». В таком кремнии расстояние между атомами больше, чем в обычном полупроводнике (рис. 1). Это, в свою очередь, обеспечивает более свободное протекание тока, аналогично тому, как на дороге с более широкими полосами движение свободнее и не образуются «пробки».

Кроме того, в 90-нанометровом технологическом процессе используется 7 слоев медных соединений (рис. 2), что на один слой больше, чем в 130-нанометровом технологическом процессе.

При производстве по новому технологическому процессу Prescott будет иметь порядка 100 млн. транзисторов (у Intel Pentium 4 Northwood — 55 млн.). Основная часть транзисторов будет составлять кэш L2 процессора размером 1 Мбайт (вместо 512 Мбайт в процессоре Northwood); увеличится вдвое и размер кэша данных L1 — теперь он составит 16 Кбайт. Размер кэша особенно актуален для процессоров с поддержкой технологии Hyper-Threading, поскольку кэш распределяется между выполняемыми потоками задач.

Кроме того, в результате использования новых технологий процессор будет поддерживать системную шину с тактовой частотой 800 МГц и масштабироваться по частоте до 4…5 ГГц (рис. 3).

Впрочем, новый технологический процесс — далеко не единственное усовершенствование процессора Prescott, позволяющее существенно повысить его производительность. Наряду со всеми теми достижениями, которые уже реализованы в процессорах Willamette и Northwood, в Prescott добавится еще ряд усовершенствований (рис. 4):

  • улучшенный блок предвыборки данных (Pre-Fetcher Branch Predictor);
  • улучшенная технология Hyper-Threading;
  • дополнительные буферы отложенной записи;
  • 13 новых инструкций процессора;
  • улучшенное распределение блоков на кристалле;
  • улучшенное управление питанием;
  • поддержка новой технологии La Grande аппаратной защиты передаваемых по шинам данных.

В процессоре Prescott изменено расположение различных блоков процессора на кристалле, что привело к существенному повышению производительности процессора при операциях с вещественными числами. В процессоре Prescott блоки, отвечающие за операции с вещественными числами (FP), находятся в непосредственной близости друг от друга, а это позволяет снизить задержки при передаче данных от одного блока к другому (рис. 5).

Изменению в новом процессоре подвергся и блок предсказаний ветвления (Pre-Fetcher Branch Predictor), что обеспечивает высокий процент попаданий в кэш L1 с отслеживаниями (Trace Cache). Этот блок предсказания позволяет модифицировать мини-программы, основываясь на спекулятивном предсказании. Таким образом, если в программном коде имеется точка ветвления, то блок предсказаний может предположить дальнейший ход программы вдоль одной из возможных ветвей и с учетом этого построить мини-программу.

В процессоре Prescott имеются 13 новых инструкций (рис. 6), что позволяет повысить общую производительность в играх и мультимедийных приложениях. Возможно, что в будущем можно будет говорить о новом наборе команд SSE 3.

Новые инструкции разделены на пять групп:

  • операции преобразования чисел с плавающей точкой к целым (Floating point to integer conversions);
  • сложные математические операции (Complex arithmetic);
  • операции кодирования-декодирования видео (Video encoding);
  • SIMD FP-операции с использованием формата AOS (SIMD FP using AOS format);
  • операции синхронизации потоков (Thread synchronization).

Ну и последнее новшество, достойное упоминания, — это улучшенная технология Hyper-Threading, которую уже окрестили как Hyper-Threading II. Никаких официальных данных по поводу нового названия этой технологии нет, а на форуме IDF о ней говорилось как об улучшенной технологии Hyper-Threading. Об изменениях свидетельствует хотя бы тот факт, что в новом наборе команд присутствуют две команды для синхронизации потоков, то есть две специфические команды, реализующие многопоточную обработку данных.

 

В статье использованы материалы весеннего Форума корпорации Intel для разработчиков IDF Spring 2003.

КомпьютерПресс 4'2003