Тестирование двухъядерного процессора Intel Pentium Extreme Edition 840

Сергей Пахомов

Способы увеличения производительности процессора

Технология Hyper-Threading — первый шаг к многоядерности

Многоядерность — следующий этап развития

Intel Pentium Processor Extreme Edition 840

Чипсет Intel 955X Express (Glenwood)

Методика тестирования

Бенчмарки

Выводы

18 апреля корпорация Intel объявила о выходе новейшей двухъядерной платформы, включающей процессор Intel Pentium Extreme Edition 840 с тактовой частотой 3,2 ГГц и набор микросхем Intel 955X Express.

первые о двухъядерных процессорах компании Intel официально было объявлено на весеннем Форуме корпорации Intel для разработчиков (Intel Developer Forum, IDF), проходившем в марте сего года в Сан-Франциско (шт.Калифорния). В первый же день Форума IDF Патрик Гелсингер (Pat Gelsinger), вице-президент подразделения Digital Enterprise Group корпорации Intel, выступая с докладом, огласил стратегические планы компании по внедрению многоядерных процессоров. Позднее на специальном брифинге Стивен Смит (Stephen Smith), глава подразделения Digital Enterprise Group, рассказал о 15 многоядерных проектах Intel и привел подробности архитектуры двухъядерных процессоров и чипсетов.

Способы увеличения производительности процессора

онка тактовых частот, которая продолжалась на протяжении многих лет, похоже, окончательно ушла в прошлое. За эти годы в умах пользователей укоренилось мнение, что именно тактовая частота процессора является показателем его производительности, однако планы компании Intel по наращиванию тактовых частот так и остались планами и, скорее всего, увидеть процессор с тактовой частотой 10 ГГц нам предстоит весьма нескоро. По всей видимости, масштабирование процессоров по тактовой частоте оказалось не столь простой задачей, как предполагалось, и потому при сегодняшних технологических нормах производства процессоров и малоэффективных воздушных системах охлаждения добиться линейного масштабирования тактовой частоты процессоров не удается. Осознав, что увеличение тактовых частот процессоров прежними темпами не представляется возможным, нужно было искать принципиально иные технологии увеличения производительности процессоров. Одновременно с этим необходимо было (по маркетинговым соображениям) убедить пользователей в том, что производительность процессора определяется не только и не столько его тактовой частотой. И первым шагом на пути к такому «перевоспитанию» пользователей стал отказ компании Intel от указания в названии процессора его тактовой частоты — на смену процессорам Intel Pentium 4 3,0 ГГц пришли загадочные обозначения вроде Intel Pentium 4 560 и т.п.

Давайте разберемся, от чего же в действительности зависит производительность процессора.

Общепринято отождествлять производительность процессора со скоростью выполнения им инструкций программного кода. Производительность (Performance) — это отношение общего числа выполненных инструкций программного кода к времени их выполнения:

В этом смысле производительность процессора отождествляется с количеством инструкций, выполняемых за секунду (Instructions rate). А поскольку одной из важных характеристик процессора является его тактовая частота, то желательно именно с ней связать производительность процессора. Это можно сделать, если количество инструкций, выполняемых за единицу времени, рассматривать как произведение количества инструкций, выполняемых за один такт процессора (Instruction Per Clock, IPC), на количество тактов процессора в единицу времени (тактовая частота процессора):

Количество тактов процессора в единицу времени — это и есть его тактовая частота (Frequency). Таким образом, производительность процессора зависит в равной степени и от его тактовой частоты, и от количества инструкций, выполняемых за такт (IPC):

Производительность =

= IPC · Frequency.

Последняя формула, по сути, определяет два разных подхода к увеличению производительности процессора, первый из которых связан с увеличением тактовой частоты процессора, а второй — с увеличением количества инструкций программного кода, выполняемых за один такт процессора.

Вполне очевидно, что увеличение тактовой частоты не может быть бесконечным и определяется технологией изготовления процессора. При этом рост производительности не является прямо пропорциональным росту тактовой частоты, то есть наблюдается тенденция насыщаемости, когда дальнейшее увеличение тактовой частоты становится нерентабельным. Количество инструкций, выполняемых за время одного такта, зависит от микроархитектуры процессора: от количества исполняемых блоков, от длины конвейера и эффективности его заполнения, от блока предвыборки и т.д., а кроме того, естественно, от оптимизации программного кода к данной микроархитектуре процессора.

Итак, в общих чертах мы выяснили, почему вполне корректным является сравнение производительности процессоров на основании их тактовой частоты в пределах одной и той же микроархитектуры (при одинаковом значении IPC процессоров) и почему некорректно сравнение производительности процессоров с различной микроархитектурой исключительно на основе тактовой частоты. К примеру, основываясь на тактовой частоте, нельзя сравнивать производительность процессоров с разным размером L2-кэша или производительность процессоров, поддерживающих и не поддерживающих технологию Hyper-Threading.

Другим подходом к увеличению производительности процессорной подсистемы, типичным для серверных решений, является использование многопроцессорных SMP-конфигураций. В этом случае достигается параллельное (Thread Level Parallelism, TLP) и в какой-то мере независимое решение нескольких разных задач или нескольких потоков одной задачи на нескольких процессорах, что, естественно, сопровождается приростом общей производительности вычислительной подсистемы сервера. Впрочем, ожидать адекватного количеству процессоров роста производительности и в данном случае не приходится — многое зависит от типа решаемых задач, от реализации в серверной операционной системе поддержки SMP. Всегда можно найти такое приложение, которое в двухпроцессорной конфигурации будет показывать результаты ниже, чем в однопроцессорной, и потому любой «талантливый» программист вполне сможет свести на нет все преимущества многопроцессорной архитектуры.

Между тем, кроме перечисленных способов увеличения общей производительности процессорной подсистемы, существуют технологии, позволяющие реализовать параллельное выполнение нескольких задач на одном процессоре. Такая многозадачность реализована в том или ином виде во всех современных процессорах. Отход от последовательного исполнения команд и использование нескольких исполняющих блоков в одном процессоре позволяют одновременно обрабатывать несколько процессорных микрокоманд, то есть организовывать параллелизм на уровне инструкций (Instruction Level Parallelism, ILP), что, разумеется, увеличивает общую производительность.

Технология Hyper-Threading — первый шаг к многоядерности

нонсированная в 2002 году компанией Intel технология Hyper-Threading — пример многопоточной обработки команд. Данная технология является чем-то средним между многопоточной обработкой, реализованной в мультипроцессорных системах, и параллелизмом на уровне инструкций, реализованном в однопроцессорных системах. Фактически технология Hyper-Threading позволяет организовать два логических процессора в одном физическом. Таким образом, с точки зрения операционной системы и запущенного приложения в системе существует два процессора, что дает возможность распределять загрузку задач между ними точно так же, как при SMP-мультипроцессорной конфигурации.

Посредством реализованного в технологии Hyper-Threading принципа параллельности можно обрабатывать инструкции в параллельном (а не в последовательном) режиме, то есть для обработки все инструкции разделяются на два параллельных потока. Это позволяет одновременно обрабатывать два различных приложения или два различных потока одного приложения и тем самым увеличить IPC процессора, что сказывается на росте его производительности.

В конструктивном плане процессор с поддержкой технологии Hyper-Threading состоит из двух логических процессоров, каждый из которых имеет свои регистры и контроллер прерываний (Architecture State, AS), а значит, две параллельно исполняемые задачи работают со своими собственными независимыми регистрами и прерываниями, но при этом используют одни и те же ресурсы процессора для выполнения своих задач. После активации каждый из логических процессоров может самостоятельно и независимо от другого процессора выполнять свою задачу, обрабатывать прерывания либо блокироваться. Таким образом, от реальной двухпроцессорной конфигурации новая технология отличается только тем, что оба логических процессора используют одни и те же исполняющие ресурсы, одну и ту же разделяемую между двумя потоками кэш-память и одну и ту же системную шину. Использование двух логических процессоров позволяет усилить процесс параллелизма на уровне потока, реализованный в современных операционных системах и высокоэффективных приложениях. Команды от обоих исполняемых параллельно потоков одновременно посылаются ядру процессора для обработки. Используя технологию out-of-order (исполнение командных инструкций не в порядке их поступления), ядро процессора тоже способно параллельно обрабатывать оба потока за счет использования нескольких исполнительных модулей.

Идея технологии Hyper-Threading тесно связана с микроархитектурой NetBurst процессора Pentium 4 и является в каком-то смысле ее логическим продолжением. Микроархитектура Intel NetBurst позволяет получить максимальный выигрыш в производительности при выполнении одиночного потока инструкций, то есть при выполнении одной задачи. Однако даже в случае специальной оптимизации программы не все исполнительные модули процессора оказываются задействованными на протяжении каждого тактового цикла. В среднем при выполнении кода, типичного для набора команд IA-32, реально используется только 35% исполнительных ресурсов процессора, а 65% исполнительных ресурсов процессора простаивают, что означает неэффективное использование возможностей процессора. Было бы вполне логично организовать работу процессора таким образом, чтобы в каждом тактовом цикле максимально использовать его возможности. Именно эту идею и реализует технология Hyper-Threading, подключая незадействованные ресурсы процессора к выполнению параллельной задачи.

Поясним все вышесказанное на примере. Представьте себе гипотетический процессор, в котором имеются четыре исполнительных блока: два блока для работы с целыми числами (арифметико-логическое устройство, ALU), блок для работы с числами с плавающей точкой (FPU) и блок для записи и чтения данных из памяти (Store/Load, S/L). Пусть, кроме того, каждая операция осуществляется за один такт процессора. Далее предположим, что выполняется программа, состоящая из трех инструкций: первые две — арифметические действия с целыми числами, а последняя — сохранение результата. В этом случае вся программа будет выполнена за два такта процессора: в первом такте задействуются два блока ALU процессора (красный квадрат на рис. 1), во втором — блок записи и чтения данных из памяти S/L.

Рис. 1. Реализация параллелизма на уровне инструкций (Instruction Level Parallelism, ILP)

В современных приложениях в любой момент времени, как правило, выполняется не одна, а несколько задач или несколько потоков (threads) одной задачи, называемых также нитями. Давайте посмотрим, как будет вести себя наш гипотетический процессор при выполнении двух разных потоков задач (рис. 2). Красные квадраты соответствуют использованию исполнительных блоков процессора одного потока, а синие квадраты — другого. Если бы оба потока исполнялись изолированно, то для выполнения первого и второго потоков потребовалось бы по пять тактов процессора. При одновременном исполнении обоих потоков процессор будет постоянно переключаться между обоими потоками, следовательно, за один такт процессора выполняются только инструкции какого-либо одного из потоков. Для исполнения обоих потоков потребуется в общей сложности десять процессорных тактов.

Рис. 2. Выполнение двух потоков на процессоре без реализации и с реализацией технологии Hyper-Threading

Теперь давайте подумаем над тем, как можно повысить скорость выполнения задачи в рассмотренном примере. Как видно из рис. 2, на каждом такте процессора используются далеко не все исполнительные блоки процессора, поэтому имеется возможность частично совместить выполнение инструкций отдельных потоков на каждом такте процессора. В нашем примере выполнение двух арифметических операций с целыми числами первого потока можно совместить с загрузкой данных из памяти второго потока и выполнить все три операции за один такт процессора. Аналогично на втором такте процессора можно совместить операцию сохранения результатов первого потока с двумя операциями второго потока и т.д. Собственно, в таком параллельном выполнении двух потоков и заключается основная идея технологии Hyper-Threading.

Конечно, описанная ситуация является идеализированной, и на практике выигрыш от использования технологии Hyper-Threading куда более скромен. Дело в том, что возможность одновременного выполнения на одном такте процессора инструкций от разных потоков ограничивается тем, что эти инструкции могут задействовать одни и те же исполнительные блоки процессора.

Рассмотрим еще один типичный пример работы нашего гипотетического процессора. Пусть имеется два потока команд, каждый из которых по отдельности выполняется за пять тактов процессора. Без использования технологии Hyper-Threading для выполнения обоих потоков потребовалось бы десять тактов процессора. А теперь выясним, что произойдет при использовании технологии Hyper-Threading (рис. 3). На первом такте процессора каждый из потоков задействует различные блоки процессора, поэтому выполнение инструкций легко совместить. Аналогичное положение вещей наличествует и на втором такте, а вот на третьем такте инструкции обоих потоков пытаются задействовать один и тот же исполнительный блок процессора, а именно блок S/L. В результате возникает конфликтная ситуация, и один из потоков должен ждать освобождения требуемого ресурса процессора. То же самое происходит и на пятом такте. В итоге оба потока выполняются не за пять тактов (как в идеале), а за семь.

Рис. 3. Возникновение конфликтных ситуаций при использовании технологии Hyper-Threading

Многоядерность — следующий этап развития

збежать конфликтных ситуаций, возникающих при использовании технологии Hyper-Threading, можно в том случае, если изолировать в пределах одного процессора выполнение различных потоков инструкций. Фактически для этого потребуется использовать не одно, а два и более ядер процессора. Тогда в идеальном варианте каждый поток инструкций утилизирует отведенное ему ядро процессора (и исполнительные блоки), что позволяет избежать конфликтных ситуаций и увеличить производительность процессора за счет параллельного выполнения потоков инструкций.

В рассмотренном примере возникновения конфликтных ситуаций при использовании технологии Hyper-Threading применение двух независимых ядер для выполнения двух потоков инструкций позволило бы выполнить весь программный код не за семь (как в случае процессора с технологией Hyper-Threading), а за пять тактов (рис. 4).

Рис. 4. Преимущество двухъядерной архитектуры процессора

Конечно, говорить о том, что двухъядерные процессоры в два раза производительнее одноядерных, не приходится. Причина заключается в том, что для реализации параллельного выполнения двух потоков необходимо, чтобы эти потоки были полностью или частично независимы друг от друга, а кроме того, чтобы операционная система и само приложение поддерживали на программном уровне возможность распараллеливания задач. И в связи с этим стоит подчеркнуть, что сегодня далеко не все приложения удовлетворяют этим требованиям и потому не смогут получить выигрыша от использования двухъядерных процессоров. Должно пройти еще немало времени, чтобы написание параллельного кода приложений вошло в привычку у программистов, однако первый и самый важный камень в фундамент параллельных вычислений уже заложен. Впрочем, уже сегодня существует немало приложений, которые оптимизированы для выполнения в многопроцессорной среде, и такие приложения, несомненно, позволят использовать преимущества двухъядерного процессора.

Intel Pentium Processor Extreme Edition 840

ервым двухъядерным процессором стал Intel Pentium Processor Extreme Edition 840, продолжающий знаменитую серию Extreme Edition. Правда, теперь данная серия претерпела существенные изменения, и для того, чтобы подчеркнуть, что речь идет об абсолютно новом процессоре, компания Intel изменила даже его логотип. В названии исчезла цифра «4» (кстати, это характерно для всего нового поколения двухъядерных процессоров), но взамен появилась нумерация 8xx, аналогичная той, которая присутствует в десктопных и мобильных линейках процессоров Intel.

Единственное, что осталось неизменным в серии Extreme Edition, — это их позиционирование на рынке. Этот процессор, как и прежде, является своего рода флагманом линейки десктопных процессоров Intel и ориентирован на самые мощные ПК. Но если раньше серия процессоров Extreme Edition позиционировалась компанией Intel в том числе и как процессоры для мощных игровых ПК, то теперь ориентация на игровые ПК отсутствует (что подтвердило и наше тестирование).

«Эта платформа обеспечивает пользователям ПК высококачественные видео и звук, позволяя выполнять визуализацию трехмерных изображений для цифрового дизайна и игр, — подчеркнул Дон Макдональд (Don MacDonald), вице-президент подразделения Digital Home Group корпорации Intel. — Она обладает повышенной мощностью и возможностями, которые позволяют людям получать больше от своих ПК. Новая платформа сможет изменить модели использования ПК дома и на работе».

Прежде чем начать описание результатов тестирования, ознакомимся с техническими характеристиками нового процессора.

Intel Pentium Extreme Edition 840 — это процессор с двумя ядрами на одном кристалле и с корпусировкой LGA775. Тактовая частота составляет 3,2 ГГц. Кроме того, имеются процессоры Intel Pentium Extreme Edition 830 с тактовой частотой 3,0 ГГц и Intel Pentium Extreme Edition 820 — 2,8 ГГц.

Каждое ядро процессора имеет микроархитектуру NetBurst. Процессор поддерживает технологию Hyper-Threading, что в целом обеспечивает обработку до четырех потоков, поэтому один (с точки зрения операционной системы) такой физический процессор определяется как четыре логических процессора. Каждое ядро процессора имеет собственный кэш второго уровня L2 объемом 1 Мбайт, а общий объем кэша L2 составляет 2 Мбайт (рис. 5).

Рис. 5. Структурная схема процессора Intel Pentium Extreme Edition 8хх

Процессор производится по 90-нанометровому технологическому процессу, при этом размер самого кристалла процессора составляет 206 мм2, а количество транзисторов внутри него насчитывает 230 млн. Казалось бы, такой мощный двухъядерный процессор будет выделять чрезмерно много тепла и потребует эффективной системы охлаждения, однако, по данным компании Intel, процессор Intel Pentium Extreme Edition 840 поглощает всего 130 Вт, а максимальная температура поверхности кристалла не превосходит 70 °С. Напряжение питания ядра составляет от 1,2 до 1,4 В, а максимальный ток — 125 А.

Процессоры Intel Pentium Extreme Edition 8хх поддерживают частоту шины FSB 800 МГц, а пропускная способность процессорной шины равна 6,4 Гбайт/с. Соответственно тактовая частота системной шины составляет 200 МГц, а коэффициент внутреннего умножения для процессора 840 — 16x.

Отметим также, что в процессорах Intel Pentium Extreme Edition 8xx реализованы технология Executable Disable Bit (защита от вирусов на аппаратном уровне) и технология 64-разрядной адресации памяти Intel EM64T, что вполне естественно, поскольку все новые процессоры компании Intel являются 64-разрядными.

Процессоры Intel Pentium Processor Extreme Edition совместимы с новым чипсетом Intel 955X Express (кодовое название Glenwood).

Чипсет Intel 955X Express (Glenwood)

месте с новыми процессорами Intel Pentium Extreme Edition 8хх компания Intel представила и новый чипсет Intel 955X Express, который является логическим продолжением чипсета Intel 925X Express и поддерживает двухъядерный процессор Intel Pentium Extreme Edition 8хх с частотой FSB 800 МГц или одноядерный процессор Intel Pentium 4 Extreme Edition c частотой FSB 1066 МГц.

Перечислим основные особенности набора системной логики Intel 955X Express (рис. 6). Контроллер памяти поддерживает память DDR2-667 в двухканальном режиме, а шина памяти имеет пропускную способность 8,5 Гбайт/с. Всего поддерживается до 8 Гбайт памяти, причем реализована поддержка памяти с ECC. Кроме того, в контроллере памяти реализована технология оптимизации производительности памяти (Performance Memory Optimizations), хотя особенности этой технологии пока не обнародованы. Для совместимости с процессорами Intel Pentium 4 Extreme Edition частота FSB может быть как 800 МГц, так и 1066 МГц.

Рис. 6. Структурная схема чипсета Intel 955X Express

Южный мост чипсета ICH7 — это новая версия уже хорошо знакомого контроллера ввода-вывода ICH6. Среди его функциональных характеристик — поддержка четырехканального контроллера SATA RAID, восьмиканального аудиоформата Intel High Definition Audio, PCI-шины и шести слотов шины PCI Express x1.

Методика тестирования

осле подробного описания новой платформы компании Intel обратимся к результатам тестирования процессора Intel Pentium Extreme Edition 840. Конечно, сами по себе абсолютные результаты тестирования мало о чем говорят, и для того, чтобы иметь возможность оценить преимущества нового процессора, мы сравнили его с процессором Intel Pentium 4 3,73 ГГц Extreme Edition, который был анонсирован компанией в нынешнем феврале.

Этот процессор выпускается по 90-нанометровому технологическому процессу, а размер кэша второго уровня составляет 2 Мбайт. Кроме того, Intel Pentium 4 3,73 ГГц Extreme Edition поддерживает частоту FSB 1066 МГц, то есть опорная частота системной шины составляет 266 МГц. Коэффициент внутреннего умножения данного процессора равен 14 — отсюда и появляется цифра в 3,73 ГГц (14x266 МГц = 3,73 ГГц).

Если привести сухие факты о процессоре Intel Pentium 4 3,73 ГГц Extreme Edition, то они таковы: процессор рассчитан на напряжение от 1,25 до 1,4 В при максимальной потребляемой мощности 115 Вт. Максимальная температура корпуса процессора составляет 70,8 °С. Кристалл процессора имеет площадь 135 мм², а общее количество транзисторов составляет 169 млн. Кроме того, Intel Pentium 4 3,73 ГГц Extreme Edition поддерживает технологию Hyper-Threading, Execute Disable Bit (EDB) и EM64T.

Следует особо подчеркнуть, что при тестировании обоих процессоров использовалась абсолютно одинаковая конфигурация стенда, то есть одними и теми же были системная плата, память, дисковая подсистема, видеокарта и т.д. Стенд для тестирования имел следующую конфигурацию:

материнская плата: Intel D955XBK;
чипсет материнской платы: Intel 955X (ICH7);
память: Micron Technologies 2x512 Мбайт DDR2-667 (PC5300);
тайминги памяти: 5-5-5-15;
видеокарта: ATI RADEON X850 XT (256 Мбайт) (интерфейс PCI Express x16);
частота работы графического ядра: 520 МГц;
частота работы видеопамяти: 540 МГц;
дисковая подсистема: Seagate Barracuda ST3160827AS (емкость 160 Гбайт);
файловая система: NTFS с размером кластера по умолчанию (4 Кбайт).

В качестве операционной системы использовалась ОС Windows XP Professional (English) c SP2.

Из дополнительных утилит и драйверов применялись:

Intel Chipset Software Utility Version 7.0.0.1019;
версия видеодрайвера: ATI 6.14.0010.6512.

Все тесты проводились при глубине цвета 32 бит и частоте строчной развертки 75 Гц. Отметим также, что при тестировании видеодрайвер настраивался на максимальную производительность, то есть отключались эффекты антиалиасинга и анизотропной фильтрации и т.д.

При тестировании процессоров память DDR2-667 функционировала в двухканальном режиме с установленными таймингами (by SPD): 5-5-5-15.

Бенчмарки

Для тестирования процессоров использовались следующие тестовые пакеты и приложения:

• офисные тесты:

- VeriTest Business Winstone 2004,

- VeriTest Multimedia Content Creation Winstone 2004,

- WebMark 2004;

• синтетические тесты:

- PCMark 2004,

- SiSoftware Sandra 2005;

• 3D-приложения:

- Alias WaveFront Maya 6.5,

- Discreet 3d Studio Max 7.0,

- LightWave 3D 8.2,

- Maxon Cinema 4D Cinebench 2003;

• OCR-распознавание:

- ABBYY FineReader 7.0;

• видео- и аудиокодирование:

- Lame 3.97a,

- iTunes 4.71,

- XMPEG 5.2+DivX 5.2.1,

- TMPGenc 2.524,

- Windows Media Encoder 9.0,

- Windows Move Maker 2.1,

- Roxio VideoWave 7.0,

- Adobe After Effects 6.5,

- Adobe Premiere Pro 1.5;

• растровая графика:

- Adobe Photoshop CS;

• игровые приложения:

- 3DMark 2005 v. 1.2.0,

- FarCry (Patch 1.3),

- DOOM III Patch 1.1,

- Half-Life 2 (сцена d1_town_01.dem),

- Unreal Tournament 2004.

Первые три теста — традиционные бенчмарки, предназначенные для тестирования производительности системы в целом c использованием популярных офисных приложений. Результаты этих тестов определяются не только процессором, но и пропускной способностью памяти, а также производительностью дисковой подсистемы компьютера. При использовании данных тестов устанавливалось разрешение экрана 1024x768 точек при 32-битной глубине цвета.

Утилиты SiSoftware Sandra 2005 и PCMark 2004 — синтетические бенчмарки, позволяющие оценить производительность процессора и памяти.

В следующую группу тестов входили популярные 3D-приложения Alias WaveFront Maya 6.5, Discreet 3d Studio Max 7.0, LightWave 3D 8.2, Maxon Cinema 4D Cinebench 2003. При использовании пакета Alias WaveFront Maya 6.5 запускался скрипт SPECapc_Maya 6.0_v1.0 при разрешении 1280x1024 точек и 32-битной глубине цвета. Кроме того, учитывая, что данный тест ориентирован в первую очередь на измерение производительности видеокарты, дополнительно производился рендеринг сцены wolf4.ma при разрешении 1280x1024 точек и 32-битной глубине цвета. При использовании пакета Discreet 3d Studio Max 7.0 запускался скрипт SPECapc_3dsmax_6.0_rev1_1 при разрешении 1280x1024 точек и 32-битной глубине цвета. В приложении LightWave 3D 8.2 использовался рендеринг сцены Radiosity-Box.lws, входящей в комплект поставки приложения.

Приложение ABBYY FineReader 7.0 использовалось для распознавания многостраничного pdf-документа, в процессе которого измерялось время выполнения задачи.

Еще одна группа тестов была ориентирована на измерение производительности процессора при обработке аудио- и видеоданных (конвертирование в различные форматы). Так, кодеки Lame 3.97a и iTunes 4.71 использовались для конвертации аудиоданных в формате WAV в формат MP3, утилита XMPEG 5.2 с кодеком DivX 5.2.1 — для конвертации видеофайла в формате MPG в формат AVI, утилита TMPGenc 2.524 — для конвертации из формата AVI в формат M2V, программы Windows Media Encoder 9.0, Windows Move Maker 2.1 и Roxio VideoWave 7.0 — для преобразования формата AVI в формат WMV, а программный пакет Adobe Premiere Pro 1.5 — для конвертации формата MPEG в формат WMV.

В пакете Adobe Photoshop CS использовался скрипт, запускающий различные фильтры над исходным изображением.

На последнем этапе тестировалась производительность процессора в современных 3D-играх. Для того чтобы минимизировать влияние видеокарты на результаты игровых тестов, мы, во-первых, использовали самую высокопроизводительную на сегодняшний день видеокарту (чтобы она по возможности не стала узким местом в системе), а во-вторых, все игровые тесты проводили при различных разрешениях экрана. По характеру зависимости результата теста от разрешения экрана можно сделать вывод — данный результат упирается в производительность либо видеокарты, либо самого процессора. Понятно, что при низких разрешениях экрана нагрузка в большей степени ложится на процессор и результаты зависят от производительности процессора, а при высоких разрешениях, наоборот, в большей степени нагружается видеокарта и результаты теста зависят в основном от производительности видеокарты. Чтобы свести результаты тестирования системы при различных разрешениях к единому интегральному показателю, каждому разрешению присваивался весовой коэффициент, а интегральный показатель производительности рассчитывался как средневзвешенное геометрическое:

Общий интегральный результат в играх рассчитывался как среднее геометрическое интегральных результатов всех игр.

Результаты сравнительного тестирования процессоров представлены в таблице и на рис. 7-13.

Результаты сравнительного тестирования процессоров

Рис. 7. Результаты сравнительного тестирования процессоров в тесте DOOM 3 v.1.1

Рис. 8. Результаты сравнительного тестирования процессоров в тесте Half-Life 2 (сцена d1_town_01.dem)

Рис. 9. Результаты сравнительного тестирования процессоров в тесте FarCry 1.3

Рис. 10. Результаты сравнительного тестирования процессоров в тесте Unreal Tournament 2004

Рис. 11. Результаты сравнительного тестирования процессоров в тесте 3DMark 2005 (GT1 — Return To Proxycon)

Рис. 12. Результаты сравнительного тестирования процессоров в тесте 3DMark 2005 (GT2 — Firefly Forest)

Рис. 13. Результаты сравнительного тестирования процессоров в тесте 3DMark 2005 (GT3 — Canyon Flight)

Выводы

заключение попробуем проанализировать результаты тестирования.

В тестах офисных приложений (Business Winstone 2004, Multimedia Content Creation Winstone 2004, WebMark 2004) процессор Intel Pentium Extreme Edition 840 проигрывает процессору Intel Pentium 4 Extreme Edition 3,73 ГГц. Видимо, в данном случае большее значение имеет тактовая частота процессора, а не количество ядер, а у процессора Intel Pentium 4 Extreme Edition 3,73 ГГц она на 16% выше. Исходя из результатов офисных тестов, можно сделать первый важный вывод: двухъядерный процессор Intel Pentium Extreme Edition 840 не ориентирован на выполнение офисных приложений, так что его использование для решения типичных офисных задач не позволяет получить выигрыша от двухъядерности и в этом смысле нерентабельно.

Синтетические тесты SiSoftware Sandra 2005 и PCMark 2004 демонстрируют преимущество двухъядерной архитектуры нового процессора, но в то же время обращает на себя внимание и тот факт, что платформа на базе процессора Intel Pentium Extreme Edition 840 проигрывает все тесты по пропускной способности памяти платформе на базе процессора Intel Pentium 4 Extreme Edition 3,73 ГГц. Это может показаться несколько странным, поскольку в обоих случаях используются одна и та же материнская плата и одинаковые модули памяти DDR2-667. Однако давайте вспомним, что процессор Intel Pentium 4 Extreme Edition 3,73 ГГц использует частоту FSB 1066 МГц, а не 800 МГц, как Intel Pentium Extreme Edition 840. Это приводит к тому, что пропускная способность процессорной шины в первом случае составляет 8,6 Гбайт/с, а во втором — только 6,4 Гбайт/с. Кроме того, в обоих случаях память работает в асинхронном режиме, но при этом используются различные коэффициенты умножения. Для частоты FSB 1066 МГц опорная частота составляет 266 МГц, частота памяти 333 МГц получается за счет умножения на коэффициент 5/4. Для частоты FSB 800 МГц опорная частота составляет 200 МГц, частота памяти 333 МГц получается за счет умножения на коэффициент 5/3. Естественно, что использование разных коэффициентов умножения и различная пропускная способность процессорной шины приводят к различным результатам при тестировании пропускной способности памяти.

В пакете Alias WaveFront Maya 6.5 при использовании бенчмарка SPECapc Maya 6.0 v1.0 опять-таки выигрывает «старый» процессор. Но, как уже отмечалось, результат этого теста в первую очередь определяется возможностями видеокарты и сильно зависит от пропускной способности памяти. Именно поэтому и наблюдается отставание новой платформы от старой. Но если посмотреть на результат рендеринга трехмерной сцены в пакте Alias WaveFront Maya 6.5, то видно, что в данном случае новый процессор позволяет получить выигрыш на 45%.

Аналогичная ситуация наблюдается и в пакете Discreet 3d Studio Max 7.0. В тестах, результаты которых зависят от производительности памяти и видеокарты, новая платформа несколько проигрывает старой, а при рендеринге сцен выигрыш новой платформы составляет 60%.

При рендеринге трехмерной сцены Radiosity-Box.lws в пакете LightWave 3D 8.2 новая платформа позволяет получить прирост производительности на 81%, а рендеринг тестового изображения в пакете Maxon Cinema 4D Cinebench 2003 дает выигрыш в производительности на 51%.

Исходя из результатов тестирования новой платформы в 3D-пакетах, можно сделать второй важный вывод: двухъядерный процессор Intel Pentium Extreme Edition 840 демонстрирует явный прирост производительности в задачах рендеринга трехмерных изображений и потому может позиционироваться как процессор для графических рабочих станций.

Пакет ABBYY FineReader 7.0 можно отнести к разряду офисных приложений, однако, в отличие от большинства других офисных приложений, преимущества от использования двухъядерной архитектуры здесь очевидны. Так, распознавание многостраничного pdf-документа происходит на новой платформе на 48% быстрее. В общем-то, это и понятно, поскольку распознавание отдельных страниц текста — независимые друг от друга задачи, которые должны хорошо распараллеливаться. Поэтому при использовании процессора Intel Pentium 4 Extreme Edition 3,73 ГГц одновременно распознаются две страницы текста (два потока с использованием двух логических процессоров), а в случае Intel Pentium Extreme Edition 840 — четыре страницы (четыре потока с использованием четырех логических процессоров).

При решении задач конвертации аудио- и видеоданных новая платформа тоже имеет преимущество в сравнении со старой (хотя и не столь очевидное, как на задачах трехмерного рендеринга). Существенный прирост наблюдается при использовании программных пакетов Adobe Premiere Pro 1.5 (перекодирование формата MPEG в формат WMV) и Windows Media Encoder 9.0 Advanced Profile (перекодирование формата AVI в формат WMV). Основываясь на результатах тестирования новой платформы, можно сделать вывод, что двухъядерная архитектура процессора позволяет получить прирост производительности при обработке мультимедийных данных.

Анализ итогов тестирования нового процессора в играх однозначно говорит о том, что он не ориентирован на игровые ПК — во всяком случае, пока нет игр, которые позволили бы получить преимущества от новой платформы.

Редакция выражает признательность московскому представительству корпорации Intel (www.intel.ru) за предоставление процессоров для проведения тестирования.

КомпьютерПресс 6'2005

1999	1	2	3	4	5	6	7	8	9	10	11	12
2000	1	2	3	4	5	6	7	8	9	10	11	12
2001	1	2	3	4	5	6	7	8	9	10	11	12
2002	1	2	3	4	5	6	7	8	9	10	11	12
2003	1	2	3	4	5	6	7	8	9	10	11	12
2004	1	2	3	4	5	6	7	8	9	10	11	12
2005	1	2	3	4	5	6	7	8	9	10	11	12
2006	1	2	3	4	5	6	7	8	9	10	11	12
2007	1	2	3	4	5	6	7	8	9	10	11	12
2008	1	2	3	4	5	6	7	8	9	10	11	12
2009	1	2	3	4	5	6	7	8	9	10	11	12
2010	1	2	3	4	5	6	7	8	9	10	11	12
2011	1	2	3	4	5	6	7	8	9	10	11	12
2012	1	2	3	4	5	6	7	8	9	10	11	12
2013	1	2	3	4	5	6	7	8	9	10	11	12