Последний процессор на ядре Northwood
В июне корпорация Intel анонсировала новый процессор Intel
Pentium 4 с тактовой частотой 3,2 ГГц, частотой FSB 800 МГц и поддержкой технологии
Hyper-Threading.
овым данный процессор можно считать довольно условно. Действительно: и технология Hyper-Threading появилась не вчера, и поддержка частоты FSB, равной 800 МГц, уже реализована в процессорах с тактовыми частотами 3,0; 2,8; 2,6 и 2,4 ГГц. Поэтому единственным (но отнюдь не маловажным) новшеством процессора Intel Pentium 4 3,2 ГГц является более высокая, по сравнению с предыдущей моделью, тактовая частота (в предыдущей модели процессора с частотой FSB 800 МГц тактовая частота составляла 3,0 ГГц). Таким образом, частота увеличилась на 200 МГц, или на 6,7%. Если в процессоре с тактовой частотой 3,0 ГГц коэффициент умножения был равен 15 (15Ѕ800 МГц = 3 ГГц), то в новой версии процессора он фактически равен 16 (16Ѕ800 = 3,2 ГГц).
Казалось бы, стоит ли уделять столько внимания очередной версии процессора, если она отличается от предыдущей версии всего лишь увеличением таковой частоты на 6,7%? Учитывая результаты всех проведенных ранее тестирований, можно предположить вполне закономерный рост производительности на те же 6-7%. Но… не все так однозначно. Дело в том, что в модельном ряду процессоров Intel Pentium 4 с ядром Northwood процессор с тактовой частотой 3,2 ГГц является последним, и ему на смену придет процессор Prescott с более высокими тактовыми частотами. Но это будет осенью, а пока давайте поближе познакомимся с последней версией процессора на ядре Northwood.
Итак, прежде всего отметим, что поскольку речь идет о последней версии процессора, то логично предположить, что частота 3,2 ГГц является своего рода физическим пределом (при гарантированной стабильной работе) для ядра Northwood. Почему? Да потому, что все процессоры с ядром Northwood выпускаются по 0,13-микронной технологии. Технологический процесс производства определяет в конечном счете размеры транзисторов — базовых структурных элементов любых процессоров. Очевидно, что чем меньше размеры самих транзисторов, тем менее они инертны, то есть быстрее переключаются, и это в конечном счете отражается на тактовой частоте процессора. Однако всему есть свои физические границы и определенному размеру транзисторов соответствует некоторая максимальная частота (определяемая инертностью транзистора), предельная для его возможностей. Следовательно, существует и максимальная тактовая частота процессора, соответствующая размеру транзисторов. Таким образом, между технологическим процессом производства процессоров и максимальной тактовой частотой существует прямая зависимость: фактически, технологический процесс производства процессора определяет его потенциальные возможности по наращиванию тактовой частоты.
Какие же выводы можно сделать на основании того, что тактовая частота 3,2 ГГц является предельной для процессоров с проектной нормой 0,13 микрон?
Во-первых, к разочарованию любителей оверклокинга, можно предположить, что этот процессор явно не предназначен для разгона, то есть увеличить его тактовую частоту путем увеличения частоты FSB вряд ли удастся.
Во-вторых, поскольку тактовая частота 3,2 ГГц является предельной (или близкой к этому), можно предположить, что увеличение тактовой частоты на 6,7% (по сравнению с предыдущей версией процессора) приведет к пропорциональному (на 6-7%) росту производительности. Это и понятно, поскольку, когда говорят о производительности процессора, имеют в виду скорость выполнения им инструкций программного кода. Таким образом, производительность (Performance) — это отношение общего числа выполненных инструкций программного кода ко времени их выполнения. В этом смысле производительность процессора отождествляется с количеством инструкций, выполняемых за секунду (Instructions rate).
Кроме того, количество инструкций, выполняемых за секунду, можно рассматривать как произведение количества инструкций, выполняемых за один такт процессора (Instruction Per Clock, IPC), на количество тактов процессора в единицу времени. Но количество тактов процессора в единицу времени — это и есть его тактовая частота. Следовательно, производительность процессора зависит в равной степени от его тактовой частоты и от количества инструкций, выполняемых за такт (IPC): Performance = IPC Ѕ Frequency.
Количество инструкций, выполняемых за время одного такта, зависит от микроархитектуры процессора, то есть от количества исполняемых блоков, от длины конвейера и эффективности его заполнения, от блока предвыборки и т.д. Естественно, что существует и зависимость от оптимизации программного кода к данной микроархитектуре процессора.
Поскольку все процессоры с ядром Northwood, поддерживающие технологию Hyper-Threading и одну и ту же частоту FSB, имеют одинаковую микроархитектуру, логично предположить, что количество инструкций, выполняемых за один такт при выполнении одного и того же программного кода, будет одинаковым для всех процессоров. Поэтому производительность процессора в пределах одной и той же микроархитектуры определяется его тактовой частотой. Соответственно и прирост производительности процессора должен быть пропорционален приросту его тактовой частоты.
Конечно, на практике не приходится наблюдать прямо пропорциональный рост производительности процессора с ростом тактовой частоты. Различные приложения по-разному откликаются на рост тактовой частоты. К примеру, если приложение требовательно к пропускной способности памяти (то есть память является узким местом), то вряд ли увеличение тактовой частоты процессора позволит получить пропорциональный прирост производительности. Следовательно, если мы хотим на практике наблюдать прирост производительности, пропорциональный приросту тактовой частоты, необходимо, чтобы процессор был утилизирован приложением на 100%, а это встречается не так уж часто. Поэтому в реальных ситуациях увеличение тактовой частоты на 6,7% может приводить к существенно меньшему росту производительности.
Впрочем, хватит умозрительных заключений — давайте обратимся к результатам тестирования и посмотрим, какими преимуществами обладает новый процессор. Для того чтобы иметь возможность сопоставить производительность нового процессора с производительностью уже известных процессоров, мы провели сравнительное тестирование. Кроме процессора Intel Pentium 4 3,2 ГГц, мы использовали процессоры Intel Pentium 4 3 ГГц с частотой FSB 800 МГц и Intel Pentium 4 3,06 ГГц с частотой FSB 533 МГц. Использование процессоров с различными тактовыми частотами позволяет оценить, насколько увеличение тактовой частоты отражается на росте производительности процессора, а использование процессора с FSB 533 МГц дает возможность оценить и влияние роста частоты FSB на результаты теста.
Методика тестирования
ля тестирования мы собрали стендовый ПК следующей конфигурации:
• процессор Intel Pentium 4 3,2 ГГц (FSB 800МГц), Intel Pentium 4 3,0 ГГц (FSB 800 МГц), Intel Pentium 4 3,06 ГГц (FSB 533 МГц);
• материнская плата ABIT IC7-G (Intel 875P);
• память 2Ѕ256 Мбайт SDRAM DDR433 (Kingston PC3500 CL2);
• тайминги памяти:
- RAS Act. to Pre 7;
- CAS# Latancy 2;
- RAS# to CAS# delay 2;
- RAS# Precharge 3;
• видеокарта Gigabyte RADEON 9800PRO;
• дисковая подсистема два диска SATA WD Raptor WD360, объединенных в RAID-массив уровня 0 с размером страйп-блока 64 Кбайт;
• файловая система NTFS с размером кластера по умолчанию (4 Кбайт).
В качестве операционной системы использовалась ОС Windows XP Professional (English) c SP 1. Кроме того, дополнительно устанавливались все последние обновления Windows XP Hotfix (SP2), доступные на момент проведения тестирования.
Для получения максимальных результатов при тестировании отключались опция System Restore и все визуальные эффекты (использовалась настройка «Adjust for best performance»). Из дополнительных утилит и драйверов применялись:
• Intel Chipset Software Utility Version 5.0.0.1012;
• Intel Application Accelerator 3.0 RAID Edition;
• версия драйвера RAID-контроллера — 3.0.0.2344;
• версия видеодрайвера ATI Catalyst 3.4;
• версия сетевого драйвера Intel PRO/1000CT Network Connection v. 7.0.36.0.
Все тесты производились при разрешении экрана 1024Ѕ768, при глубине цвета 32 бита и частоте строчной развертки 75 Гц. Вертикальная синхронизация Vsync отключалась как для приложений OpenGL, так и для DirectX.
С целью реализации потенциальных возможностей нового процессора с частотой FSB 800 МГц мы использовали материнскую плату Abit IC7-G, построенную на наборе микросхем Intel 875P. Этот набор микросхем, ранее известный под кодовым названием Canterwood, рассчитан на высокопроизводительные high-end-решения. Он поддерживает процессор Intel Pentium 4 с технологией Hyper-Threading и 800- или 533-мегагерцевой шиной. Из других новшеств можно отметить двухканальный контроллер памяти, технологию ускоренного доступа к памяти (Performance Acceleration Technology, PAT), технологию Communication Streaming Architecture (CSA) и новый концентратор ввода-вывода ICH5R.
При тестировании процессоров Intel Pentium 4 3,2 ГГц и Intel Pentium 4 3,0 ГГц (оба процессора поддерживают частоту FSB 800 МГц) настройками BIOS активизировались технология ускоренного доступа к памяти PAT и технология Hyper-Threading. Кроме того, применение двух одинаковых модулей памяти DDR433 (PC3500) позволило нам задействовать двухканальный режим работы контроллера памяти. При этом сама память работала в режиме DDR400, а не в режиме DDR433. Попутно нужно отметить, что на практике эксплуатация памяти DDR400 с платами на чипсетах Canterwood и Springdale часто приводила к весьма плачевным результатам, а более быстродействующая память DDR433 (имеющая небольшой запас по скоростным характеристикам) обеспечивала стабильность работы системы.
При использовании процессора Intel Pentium 4 3,06 ГГц с частотой FSB
533 МГц в соответствии со спецификацией чипсета Intel 875P поддерживается только память DDR333. И хотя мы использовали все ту же память DDR400, работала она на частоте 333 МГц. При этом тайминги памяти по умолчанию составляли: RAS Act. to Pre 7; CAS# Latancy 2; RAS# to CAS# delay 2; RAS# Precharge 3.
Чтобы выявить максимальную производительность системы, использовались два новых SATA-диска WD Raptor WD360 со скоростью вращения шпинделя 10 000 об./мин, объединенных в RAID-массив уровня 0 с помощью встроенного в чипсет RAID-контроллера (южный мост ICH5R). Размер страйп-блока составлял 64 Кбайт. При установке операционной системы на всем доступном объеме RAID-массива уровня 0 создавался один логический диск с файловой системой NTFS и с размером кластера по умолчанию.
Бенчмарки
ля тестирования производительности системы в целом применялись следующие бенчмарки:
• VeriTest Content Creation Winstone 2003 v.1.0;
• VeriTest Business Winstone 2002 v.1.0.1;
• SYSmark 2002 Internet Content Creation;
• SYSmark 2002 Office Productivity;
• Future Mark 3DMark 2003.
Бенчмарк VeriTest Business Winstone 2002 использует такие офисные приложения, как Lotus Notes R5, Microsoft FrontPage 2002 SP-1, Microsoft PowerPoint 2002 SP-1, Microsoft Excel 2002 SP-1, Microsoft Access 2002 SP-1, Microsoft Word 2002 SP-1, Microsoft Project 2000, WinZip 8.0, Norton AntiVirus from Symantec, Netscape 6.2.1.
Бенчмарк VeriTest Content Creation Winstone 2003 v.1.0 работает с популярными приложениями для создания контента: Adobe Photoshop 7.0, Adobe Premiere 6.0, Macromedia Director 8.5.1, Macromedia Dreamweaver UltraDev 4, Netscape Navigator 6.2.3, NewTek Lightwave 7.5, Microsoft Windows Media Encoder 7.01 и Sonic Foundry Sound Forge 6.0.
Бенчмарк SYSmark 2002 Office Productivity применяет следующие офисные приложения: Microsoft Word 2002, Microsoft Excel 2002, Microsoft PowerPoint 2002, Microsoft Outlook 2002, Microsoft Access 2002, Netscape Communicator 6.0, Dragon Naturally Speaking Preffered v.5, WinZip 8.0 и McAfee VirusScan 5.13.
Бенчмарк SYSmark 2002 Internet Content Creation работает с такими приложениями, как Adobe Photoshop 6.01, Adobe Premiere 6.0, Microsoft Windows Media Encoder 7.1, Macromedia Dreamweaver 4 и Macromedia Flash 5.
Набор приложений, с которыми работают тестовые пакеты VeriTest и SYSmark 2002, весьма разнообразен. Кроме того, в данных тестовых пакетах используется различная методика подсчета интегрального результата, поэтому можно утверждать, что оба этих теста позволяют получить достаточно объективную картину производительности системы при работе с различными приложениями.
Тест Future Mark 3DMark 2003 также хорошо известен и фактически является общепризнанным игровым бенчмарком, оценивающим производительность видеоподсистемы вместе с процессорной подсистемой и подсистемой памяти.
Перечисленные выше тесты оценивают производительность системы в целом, то есть результаты этих тестов зависят от дисковой подсистемы, видеокарты, процессора и т.д. Однако, учитывая тот факт, что при тестировании процессоров единственным изменяемым компонентом является сам процессор, будет уместно связать изменение результатов тестирования именно с изменением тактовой частоты процессора, и в этом плане результаты тестов вполне объективно позволяют оценить прирост производительности процессора.
Кроме тестов общего назначения, для тестирования процессора и чипсета использовались следующие утилиты:
• RealStormBench v. 1.10;
• CPU Bench 2003_beta 2;
• скорость кодирования WAV ® MP3 (RazorLame 1.1.5 + Lame 3.93.1);
• скорость кодирования AVI ® MPEG4 (VirtualDub 1.4.13 + DivX 5.0.4);
• скорость архивации WinZip 8.1;
• скорость расчета математической задачи ScienceMark 2.0 (Molecular Dynamics Benchmark);
• скорость 3D-рендеринга POV-Ray v.3.5 (benchmark.pov).
Тест RealStormBench v. 1.10, измеряющий производительность процессора, основан на собственном трехмерном движке компании RealStorm, который обрабатывает эффекты преломления и отражения лучей в реальном времени. Отметим, что бенчмарк не использует возможности видеокарты и работает целиком за счет процессора.
В тесте CPU Bench 2003_beta 2, позволяющем протестировать производительность связки процессора и памяти, присутствуют тесты на операции с целыми числами и с плавающей запятой, тест памяти, созданный на основе кода STREAM, 3D software raytracing, и т.д.
Утилита CPU RightMark это тест, предназначенный исключительно для измерения производительности процессоров в таких вычислительных задачах, как решение системы дифференциальных уравнений, соответствующих моделируемым физическим процессам взаимодействия системы многих тел, и в решении задач из области трехмерной графики. Отличительной особенностью CPU RightMark является то, что результаты зависят от самого процессора, от памяти и шины «памятьпроцессор», а влияние остальных компонентов системы сведено к минимуму.
Результаты тестирования
CPU RightMark содержит два программных блока, один из которых предназначен для расчета физической модели, то есть для решения системы дифференциальных уравнений, а второй отвечает за визуализацию (рендеринг) полученного решения, то есть за прорисовку сцены. У каждого блока имеются разные варианты, оптимизированные под различные системы процессорных команд. Расчет физической модели возможен с использованием как набора команд SSE2 (процессор Intel Pentium 4), так и набора команд для FPU.
Блок визуализации состоит из двух частей — предварительной обработки и отрисовки (рендеринга). Первая часть откомпилирована с использованием набора команд сопроцессора x87, а вторая имеет несколько вариантов, оптимизированных под различные наборы инструкций (FPU+GeneralMMX, FPU+EnhancedMMX и SSE+EnhancedMMX). Скорость работы блока визуализации отражает производительность процессора и памяти при выполнении геометрических расчетов с использованием действительных чисел одинарной точности.
Для определения скорости кодирования WAV ® MP3 применялась оболочка RazorLame 1.1.5 вместе с новым кодеком Lame 3.93.1. Кодированию подвергался WAV-файл с исходным размером 623 Мбайт, который после преобразования в формат MP3 имел размер 56,5 Мбайт. Все настройки самого кодека использовались по умолчанию, а в ходе теста измерялось время кодирования.
В тесте на определение скорости архивации применялся архиватор WinZip 8.1. Сжатию подвергалась директория с большим количеством разных по размеру файлов и общим размером 2,12 Гбайт (установочная директория теста SySmark 2002). В тесте достигалась максимальная степень сжатия, а измеряемым параметром являлось время архивации.
Утилита POV-Ray v.3.5 предназначена для измерения производительности процессора и чипсета при рендеринге сложной трехмерной сцены методом трассировки лучей. В комплекте POV-Ray v.3.5 имеется довольно много сцен для рендеринга, но при тестировании процессора мы использовали стандартный тест benchmark.pov с разрешением 512Ѕ384 (установки по умолчанию).
Результаты сравнительного тестирования представлены в таблице и на рис. 1, 2.
Рис. 1. Результаты сравнительного тестирования процессоров при использовании бенчмарков, измеряющих общую производительность системы
Рис. 2. Результаты сравнительного тестирования процессоров при использовании специализированных бенчмарков, измеряющих общую производительность процессора
Выводы
режде чем перейти к рассмотрению результатов тестирования, следует остановиться на абсолютных значениях тестов для процессора Intel Pentium 4 3,2 ГГц, поскольку эти цифры — рекорд производительности на сегодняшний день. Никакие другие конфигурации ПК не позволяют получить столь выдающихся результатов. Не так давно мы проводили тестирования высокопроизводительных домашних ПК, результаты которого опубликованы в июньском номере журнала, и даже лучшие результаты, продемонстрированные этими высокопроизводительными ПК, существенно ниже тех, которые показал процессор Intel Pentium 4 3,2 ГГц. При этом цены многих ПК зашкаливали за 3000 долл., а приблизительная стоимость ПК в рассматриваемой нами конфигурации составляет всего 1800 долл.
Итак, после общих замечаний по поводу рекордной производительности перейдем к более детальному рассмотрению результатов тестирования. Сравнивая итоги тестирования процессора Intel Pentium 4 3,06 ГГц и процессора Intel Pentium 4 3,2 ГГц, нетрудно заметить, что средний прирост производительности (усредненный по всем тестам) составляет 10%. Прирост производительности достаточно весомый, хотя его нельзя однозначно связывать его с увеличением тактовой частоты процессора. Ведь помимо тактовой частоты в процессорах Intel Pentium 4 3,06 ГГц и Intel Pentium 4 3,2 ГГц различаются частоты FSB, а также режимы работы памяти (DDR333 против DDR400). Кроме того, при использовании процессора Intel Pentium 4 3,2 ГГц была задействована технология PAT ускоренного доступа к памяти, которую принципиально невозможно активизировать при использовании процессора с частотой FSB 533 МГц.
Если же сравнивать процессор Intel Pentium 4 3,2 ГГц с процессором Intel Pentium 4 3,0 ГГц, то средний по всем приложениям прирост производительности, обусловленный приростом тактовой частоты, равен 4,3%. Соответственно прирост производительности процессора Intel Pentium 4 3,0 ГГц по сравнению с процессором Intel Pentium 4 3,06 ГГц, вызванный увеличением частоты FSB и изменением режима работы памяти, составляет в среднем 5%.
В тесте VeriTest Content Creation Winstone 2003 v.1.0, где используются приложения для создания контента, увеличение тактовой частоты процессора на 200 МГц сказывается на росте результата почти на 5%, в то время как увеличение частоты FSB и изменение режима работы памяти в том же тесте приводит к росту результата лишь на 2,7%.
В тесте VeriTest Business Winstone 2002 v.1.0.1, использующем офисные приложения, рост тактовой частоты процессора приводит к увеличению результата лишь на 2,4%, а изменение пропускной способности памяти и увеличение частоты FSB дают выигрыш в 3,25%.
В тесте SYSmark 2002 Internet Content Creation прирост производительности, связанный с ростом тактовой частоты, составляет 4,5%, а изменение FSB и режима работы памяти дает увеличение на 3,3%. Интересно отметить, что повышение показателей в тестах VeriTest Content Creation Winstone 2003 v.1.0 и SYSmark 2002 Internet Content Creation приблизительно одинаково, несмотря на использование различных приложений и разные методики расчета интегрального результата.
В тесте SYSmark 2002 Office Productivity увеличение частоты FSB и изменение режима работы памяти приводят к очень весомому приросту результата — на 7%, в то время как увеличение тактовой частоты позволяет повысить результат лишь на 2,7%.
Цифры говорят сами за себя, поэтому мы не будем описывать результаты тестирования отдельно по каждому бенчмарку, а лишь подведем общие итоги. Главное — это прекрасное подтверждение теоретических предположений относительно прироста производительности процессора результатами тестирования.
Несмотря на то что Intel Pentium 4 3,2 ГГц является последним процессором в модельном ряде с ядром Northwood, он продемонстрировал прекрасную масштабируемость, то есть линейный рост производительности с ростом тактовой частоты процессора. Это наводит на мысль, что разгонные возможности процессора далеко не исчерпаны и что в принципе возможна работа и на более высоких тактовых частотах.
Редакция выражает признательность московскому представительству корпорации Intel за предоставление процессоров Intel Pentium 4 и представительству компании Abit за предоставление материнской платы IC7-G для проведения тестирования. |