Долгожданный Prescott и другие новинки Intel

Сергей Пахомов

Процессор Intel Pentium 4 (Northwood) 3,4 ГГц

Процессор Intel Pentium 4 Extreme Edition 3,4 ГГц

Процессор Prescott

Особенности микроархитектуры

Заключение

 

Итак, свершилось. Процессор Prescott, которого так долго ждали и о котором говорили на протяжении всего прошлого года, наконец-то анонсирован корпорацией Intel. Официальное представление нового процессора состоялось 2 февраля 2004 года, причем одновременно с объявлением сразу пяти его моделей были анонсированы еще две модели процессоров: процессор Intel Pentium 4 Extreme Edition с тактовой частотой 3,4 ГГц и хорошо известный процессор Intel Pentium 4 (Northwood) c тактовой частотой 3,4 ГГц.

Интересно отметить, что если о планах выпуска нового процессора Prescott было известно давно, то новые модели Northwood и Extreme Edition оказались как бы внеплановыми. Видимо, последние успехи компании AMD заставили Intel в срочном порядке пересмотреть свои планы и здоровая конкуренция сыграла на руку конечным пользователям.

Так что новинок много, и это, конечно же, не может не радовать. Однако не будем мешать все в одну кучу и поговорим обо всем по порядку.

Процессор Intel Pentium 4 (Northwood) 3,4 ГГц

Процессор Intel Pentium 4 c тактовой частотой 3,4 ГГц — это продолжение хорошо известной серии процессоров на ядре Northwood. Напомним, что предыдущая модель этого процессора имела тактовую частоту 3,2 ГГц. Естественно, что новая его модель поддерживает технологию Hyper-Threading и частоту FSB 800 МГц (частота системной шины 200 МГц). Таким образом, единственным отличием по сравнению с процессором Intel Pentium 4 3,2 ГГц является увеличение тактовой частоты на 200 МГц. Нетрудно подсчитать, что коэффициент умножения для нового процессора равен 17 (200 МГцЅ17=3,4 ГГц).

Процессор Intel Pentium 4 с тактовой частотой 3,4 ГГц — это последний процессор на ядре Northwood. Поэтому логично предположить, что частота 3,4 ГГц является своего рода физическим пределом (при гарантированной стабильной работе) для ядра Northwood. Дело в том, что все процессоры с ядром Northwood выпускаются по 0,13-микронной технологии. Технологический процесс производства определяет в конечном счете размеры транзисторов — базовых структурных элементов любых процессоров. Очевидно, что чем меньше размеры самих транзисторов, тем менее они инертны, то есть тем быстрее переключаются, что в итоге отражается на тактовой частоте процессора. Однако всему есть свои физические пределы, и определенному размеру транзисторов соответствует некоторая максимальная частота (определяемая инертностью транзистора), предельная для его возможностей. Следовательно, существует и максимальная тактовая частота процессора, соответствующая размеру транзисторов. Таким образом, между технологическим процессом производства процессоров и максимальной тактовой частотой существует прямая зависимость: фактически, технологический процесс производства процессора определяет его потенциальные возможности по наращиванию тактовой частоты. Для любителей разгона (оверклокинга) это означает, что процессор Intel Pentium 4 с тактовой частотой 3,4 ГГц практически не будет разгоняться. В то же время тактовой частоты в 3,4 ГГц с учетом архитектурных особенностей самого процессора вполне достаточно, чтобы обеспечить производительность, востребованную наиболее ресурсоемкими приложениями.

В начало В начало

Процессор Intel Pentium 4 Extreme Edition 3,4 ГГц

Процессор Intel Pentium 4 Extreme Edition с тактовой частотой 3,4 ГГц и поддержкой технологии Hyper-Threading продолжает линейку процессоров Extreme Edition, которая теперь состоит из двух моделей: модели с тактовой частотой 3,2 ГГц и частотой 3,4 ГГц. Процессоры данной серии рассчитаны на частоту FSB 800 МГц (частота системной шины составляет здесь 200 МГц), а коэффициент умножения процессора при тактовой частоте 3,4 ГГц равен 17.

Процессор Intel Pentium 4 Extreme Edition изготавливается по 0,13-микронному технологическому процессу и имеет ядро Northwood. Основным же его отличием от процессоров Intel Pentium 4 на том же ядре Northwood является кэш третьего уровня (L3) размером 2 Мбайт. Именно это обстоятельство роднит данный процессор с серверным вариантом Xeon MP и выводит в разряд наиболее высокопроизводительных процессоров, ориентированных на использование в рабочих станциях или игровых компьютерах.

В остальном же архитектура процессоров Intel Pentium 4 Extreme Edition и Intel Pentium 4 совпадает. Кэш первого уровня, как и прежде, разбит на кэш данных размером 8 Кбайт и кэш инструкций емкостью на 12 тыс. декодированных микроинструкций. Кэш L2 также не претерпел изменений — он по-прежнему имеет размер 512 Кбайт.

По внешнему виду процессор Intel Pentium 4 Extreme Edition мало чем отличается от своего собрата — процессора Intel Pentium 4. У обоих используется одинаковая корпусировка mPGA-478 (один и тот же разъем на материнской плате). Единственная разница заключается в схеме обвязки процессора — в случае Extreme Edition элементов обвязки стало значительно больше.

В начало В начало

Процессор Prescott

Как уже отмечалось, возможности по наращиванию производительности процессоров на ядре Northwood практически себя исчерпали, причиной чего является сам технологический процесс производства с проектной нормой 130 нм. Для того чтобы иметь возможность и далее повышать тактовые частоты процессора, необходимо уменьшить размеры транзистора, то есть перейти на процесс изготовления с меньшей проектной нормой. Однако, говоря о процессоре Prescott, было бы неправильно объяснять всю его эксклюзивность и потенциальный запас по наращиванию тактовых частот только новой проектной нормой производства. Чтобы разобраться во всех нюансах нового процессора, давайте для начала сформулируем, что понимается под производительностью процессора.

Общепринято отождествление производительности процессора со скоростью выполнения им инструкций программного кода; таким образом, производительность (Performance) — это количество инструкций, выполняемых процессором в единицу времени:

 

Поскольку одной из важных характеристик процессора является его тактовая частота, было бы желательно связать производительность процессора именно с ней. Это можно сделать, если количество инструкций, выполняемых за единицу времени, рассматривать как произведение количества инструкций, выполняемых за один такт процессора (Instruction Per Clock, IPC), на количество тактов процессора за единицу времени:

 

Количество тактов процессора за единицу времени — это и есть его тактовая частота. Таким образом, производительность процессора определяется как произведение количества инструкций, выполняемых за один такт (IPC), на тактовую частоту процессора.

Количество инструкций, выполняемых за время одного такта, зависит от микроархитектуры процессора, то есть от количества исполняемых блоков, от длины конвейера и от эффективности его заполнения, от блока предвыборки и т.д. Кроме того, естественно, существует также зависимость от оптимизации программного кода к данной микроархитектуре процессора. Частота процессора зависит и от его микроархитектуры, и от технологии его производства, определяющей минимальные размеры используемых транзисторов, их быстродействие и время задержки передачи сигнала в межуровневых соединениях.

Учитывая, что производительность процессора зависит от его микроархитектуры и тактовой частоты, можно выделить два формальных способа увеличения этой самой производительности: революционный и эволюционный.

Революционный способ — это изменение микроархитектуры процессора, что, во-первых, приводит к увеличению IPC и, во-вторых, создает базис для дальнейшего эволюционного повышения производительности процессора путем увеличения тактовых частот.

Рассмотренные выше процессоры Intel Pentium 4 Extreme Edition и Intel Pentium 4 на ядре Northwood с тактовыми частотами 3,4 ГГц как раз и представляют собой классический пример эволюционного развития процессоров, то есть увеличение производительности путем наращивания тактовой частоты. Новый процессор Prescott в этом плане выделяется тем, что представляет собой пример революционного изменения микроархитектуры процессора.

В начало В начало

Особенности микроархитектуры

Итак, рассмотрим те изменения микроархитектуры нового процессора, которые позволяют нам говорить о том, что произведен очередной революционный скачок в технологии производства процессоров и заложен базис для дальнейшего эволюционного увеличения производительности процессоров.

Прежде всего процессор Prescott выполняется по 90-нанометровому технологическому процессу, в котором применяется целый ряд передовых технологий. Если при 130-нанометровом технологическом процессе используется литографический процесс с длиной волны 248 нанометров, то при 90-нанометровом процессе длина волны составляет 193 нм. В результате удается получить и самые маленькие в мире серийно изготавливаемые КМОП-транзисторы с длиной затвора 50 нм, что обеспечивает рост производительности при одновременном снижении энергопотребления, и самый тонкий оксидный слой затвора у всех когда-либо производившихся транзисторов — всего 1,2 нм, или менее 5 атомарных слоев, и первую в отрасли реализацию высокоэффективной технологии напряженного кремния. Вследствие всех этих нововведений на 10-20% улучшаются рабочие характеристики транзисторов, при том что затраты на производство увеличиваются всего на 2%.

Пожалуй, из вышеперечисленных характеристик в комментариях нуждается лишь понятие «напряженный кремний». В таком кремнии расстояние между атомами больше, чем в обычном полупроводнике (рис. 1). Это, в свою очередь, обеспечивает более свободное протекание тока, подобно тому, как на дороге с более широкими полосами во время движения «пробки» образуются реже.

Кроме того, в 90-нанометровом технологическом процессе используется семь слоев медных соединений, что на один слой больше, чем в 130-нанометровом технологическом процессе. Также изменен материал диэлектрика с низкой диэлектрической проницаемостью, используемый для изоляции отдельных слоев медных соединений. Помимо этого изменен и диэлектрик затвора — теперь это силицид никеля вместо силицида кобальта.

При площади кристалла 112 кв. мм процессор Prescott имеет 125 млн. транзисторов, основная часть которых составляет кэш L2 размером 1 Мбайт (вместо 512 Мбайт в процессоре Northwood). Отметим, что если в процессорах с ядром Northwood ячейка SRAM памяти имела размер 2 кв. мкм, то в Prescott размер ячейки удалось уменьшить до 1,15 кв. мкм.

Также вдвое увеличен и размер кэша данных L1 — теперь он составляет 16 Кбайт. Размер кэша особенно критичен для процессоров с поддержкой технологии Hyper-Threading, поскольку кэш в этом случае распределяется между выполняемыми потоками задач.

Если взглянуть на блок-схему нового процессора Prescott (рис. 2), то можно заметить, что никаких существенных отличий по сравнению с блок-схемой процессора Northwood нет. Действительно, микроархитектура Intel NetBurst осталась почти неизменной. Но…только почти. К примеру, длина конвейера нового процессора стала еще больше и теперь составляет 31 ступень. Кроме того, существенной переработке подверглись отдельные блоки процессора (дополнительные WC-буферы, улучшенная предварительная выборка данных, усовершенствованное предсказание ветвлений и т.д.), поэтому более правильно говорить, что в процессоре Prescott используется усовершенствованная микроархитектура Intel NetBurst.

Улучшения микроархитектуры не только касаются переработки отдельных блоков процессора — так, реализован полный редизайн размещения этих блоков на кристалле процессора. Также впервые была применена фирменная технология оптимизированного размещения отдельных блоков процессора на кристалле (рис. 3) что позволяет более рационально использовать площадь кристалла и, что более важно, снизить задержки распространения сигналов от одного блока к другому. Так, в результате оптимизированного размещения различных блоков процессора на кристалле существенно повышается производительность процессора при операциях с вещественными числами, поскольку блоки, отвечающие за операции с вещественными числами, находятся в непосредственной близости друг от друга, что позволяет снизить задержки при передаче данных от одного блока к другому.

В результате использования новых технологий процессор будет поддерживать системную шину с тактовой частотой 800 МГц и масштабироваться по частоте до 4…5 ГГц.

Впрочем, новый технологический процесс — далеко не единственное усовершенствование процессора Prescott, позволяющее существенно повысить его производительность. Наряду со всеми теми достижениями, которые уже были реализованы в процессорах Willamette и Northwood, в Prescott добавится еще целый ряд усовершенствований (рис. 4):

• улучшенный блок предвыборки данных (Pre-Fetcher Branch Predictor);

• улучшенное предсказание ветвлений;

• усовершенствованная технология Hyper-Threading;

• дополнительные буферы отложенной записи;

• 13 новых инструкций процессора (набор инструкций SSE3);

• улучшенное распределение блоков на кристалле;

• улучшенное управление питанием;

• усовершенствование выполнения операций сдвига.

В новом процессоре подвергся изменениям и блок предсказаний ветвления (Pre-Fetcher Branch Predictor), что обеспечивает высокий процент попаданий в кэш L1 с отслеживаниями (Trace Cache). Этот блок предсказания позволяет модифицировать мини-программы, основываясь на спекулятивном предсказании. Таким образом, если в программном коде имеется точка ветвления, то блок предсказаний может предположить дальнейший ход программы вдоль одной из возможных ветвей и построить с учетом этого мини-программу.

В процессоре Prescott имеются 13 новых инструкций (рис. 5), что позволяет повысить общую производительность в играх и мультимедийных приложениях. Данный набор инструкций теперь известен как набор SSE3.

Новые инструкции разделены на пять групп:

• операции преобразования чисел с плавающей запятой в целочисленный формат;

• операции с комплексными числами;

• операции кодирования-декодирования видео;

• SIMD FP-операции с использованием формата AOS;

• операции синхронизации потоков.

Конечно, для того, чтобы получить преимущества от использования нового набора команд, необходимо, чтобы эти команды поддерживались приложениями. Но это дело времени, и в дальнейшем станут появляться приложения, оптимизированные для использования нового набора команд. Отметим также, что последняя версия компилятора Intel поддерживает набор инструкций SSE3.

Рассмотрев особенности микроархитектуры нового процессора, коснемся такого важного аспекта, как обеспечение термоконтроля для платформ на базе процессора Prescott. Помимо всех тех технологий, что уже были реализованы в процессорах Northwood, добавилась также новая технология управления скоростью вращения вентилятора. Суть этой технологии достаточно проста: для обеспечения необходимого теплоотвода в процессоре Prescott определена пороговая температура T(control). При достижении данной температуры подается сигнал на увеличение скорости вращения вентиляторов. Если же температура процессора ниже пороговой, то скорость вращения вентиляторов падает.

В начало В начало

Заключение

Итак, подводя итог рассмотрению нового процессора Prescott, отметим, что в настоящее время доступны модели процессора с тактовыми частотами 3,4; 3,2 и 3,0 ГГц и две модели с тактовой частотой 2,8 ГГц. Для того чтобы отличать эти процессоры от процессоров на ядре Northwood, в официальном названии процессоров используется (Prescott — это кодовое название) буква «E». Поэтому если процессор маркируется как Intel Pentium 4 3,40 ГГц, то речь идет о процессоре на ядре Northwood, а если процессор имеет маркировку Intel Pentium 4 3,40E ГГц, то это процессор на ядре Prescott. Единственное исключение из данного правила — процессоры с тактовой частотой 2,8 ГГц. Таких процессоров может быть два: Intel Pentium 4 2,80A ГГц и Intel Pentium 4 2,80E ГГц. Процессор Intel Pentium 4 2,80A ГГц отличается тем, что не поддерживает технологию Hyper-Threading и рассчитан на шину с FSB 533 МГц. Все остальные процессоры семейства Prescott поддерживают Hyper-Threading и частоту FSB 800 МГц.

Полный перечень современных процессоров Intel Pentium 4 представлен в таблице.

КомпьютерПресс 2'2004


Наш канал на Youtube

1999 1 2 3 4 5 6 7 8 9 10 11 12
2000 1 2 3 4 5 6 7 8 9 10 11 12
2001 1 2 3 4 5 6 7 8 9 10 11 12
2002 1 2 3 4 5 6 7 8 9 10 11 12
2003 1 2 3 4 5 6 7 8 9 10 11 12
2004 1 2 3 4 5 6 7 8 9 10 11 12
2005 1 2 3 4 5 6 7 8 9 10 11 12
2006 1 2 3 4 5 6 7 8 9 10 11 12
2007 1 2 3 4 5 6 7 8 9 10 11 12
2008 1 2 3 4 5 6 7 8 9 10 11 12
2009 1 2 3 4 5 6 7 8 9 10 11 12
2010 1 2 3 4 5 6 7 8 9 10 11 12
2011 1 2 3 4 5 6 7 8 9 10 11 12
2012 1 2 3 4 5 6 7 8 9 10 11 12
2013 1 2 3 4 5 6 7 8 9 10 11 12
Популярные статьи
КомпьютерПресс использует