Pentium !!! Третьим будет?. Лаборатория «КомпьютерПресс» протестировала новый процессор Intel Pentium III, ранее известный под рабочим названием Katmai
«Ходовые испытания» Pentium III. Отчет тестовой лаборатории «КомпьютерПресс»
Сложный старт
В конце февраля на рынок был выведен давно ожидаемый «процессор сложной судьбы», который разработчики из Intel в лучших монархических традициях назвали Pentium III. Его характеристики ранее были известны лишь по слухам, но в компьютерных изданиях имя Katmai фигурировало часто в контексте «процессора Intel с расширенным набором команд, сходным с технологией 3D Now!, который отстает от AMD K6-2 по крайней мере на полгода». Теперь же сама технология, похоже, мало кого интересует, а все взоры обращены на злосчастный внутренний идентификационный код процессора, который может определять операционная система. Последний рассматривается передовой американской общественностью как явное нарушение privacy пользователей (запрета на вторжение в личную жизнь). Впрочем, они всегда комплексовали на сей счет. Тем не менее Intel пошла на попятную, пообещав блокировать доступ к серийному коду по умолчанию. Но осадок, как говорится, остался.
Отбросив скандальную составляющую, рассмотрим, какие же технологические новинки реализованы в Pentium III? Прежде всего процессор использует новые потоковые расширения. Раньше их называли MMX2, но на самом деле такого названия, даже рабочего, Intel никогда не использовала (оперируя KNI-Katmai New Instructions), а «термин» появился с легкой руки западной прессы. Теперь надо говорить о SSE (Streaming SIMD Extensions — потоковые расширения SIMD). Напомним, что SIMD — это обозначение типа инструкций Single Instruction — Many Data, что можно понимать как возможность получения процессором одной инструкции на обработку нескольких массивов однотипных данных. Так, например, к типу SIMD относится большинство мультимедийных инструкций MMX, позволяющих оптимизировать обработку звука, видео и другой мультимедийной информации, что требует интенсивных целочисленных вычислений. Уже упомянутая процессорная технология предварительной обработки потоков «трехмерных» данных 3D Now!, изобретенная AMD, основывается также на использовании дополнительных SIMD-команд, радикально ускоряющих операции с плавающей точкой, и на снижении точности отдельных расчетов. Особо следует подчеркнуть, что и MMX, и 3D Now!, и SSE — это пустой звук, лишняя красивая наклейка, если приложение (игра, графический редактор) не написаны специально с учетом этих расширений. До сих пор множество современных приложений не поддерживает даже MMX с многолетним стажем, — что уж говорить об остальных. Впрочем, те же MMX «прижились» в программах оптического распознавания символов (OCR), графических редакторах, некоторых играх, а 3D Now! поддерживаются 6-й версией Microsoft Direct 3D. По всей видимости, поддержка SSE будет внедряться разработчиками программ с не меньшим скрипом.
Из семидесяти новых инструкций, поддерживаемых Pentium III, пятьдесят приходится на SIMD для оптимизации операций одинарной точности с плавающей запятой (SIMD-FP). Кроме того, в Pentium III предусмотрен дополнительный блок из восьми 128-разрядных регистров для инструкций SIMD-FP (в PII соответствующие регистры 64-разрядные), а остальные регистры 32-разрядные. «Трехмерный» блок ОПЗ позволяет получить до четырех результатов с плавающей запятой на один цикл. В этом его основные отличия от соответствующего блока Pentium II.
Кроме того, число мультимедийных инструкций MMX, унаследованных от PII, увеличилось на 12 штук (добавилась поддержка вычисления минимума, максимума, среднего значения и т.д.). «Двухмерные» MMX и «трехмерные» потоковые расширения SIMD-FP прекрасно уживаются друг с другом и могут задействоваться одновременно в специально написанных приложениях. Архитектурным инновациям подвергся и блок взаимодействия с системной шиной SMA (Streaming Memory Architecture): появилось восемь новых инструкций кэширования (инструкций поточного запоминания), увеличились внешние буферы — все нацелено на повышение быстродействия графической шины и других высокопроизводительных компонентов ПК. Кроме того, программисты получили большее пространство для маневра — теперь они могут гибко управлять загрузкой кэша, а не подстраиваться под фиксированные правила. Тем не менее при всех «потоковых» улучшениях процессор Pentium III сохранил прежнюю архитектуру ядра P6 (как у Pentium Pro или Celeron), что поднимает новые вопросы по поводу его слишком уж радикального порядкового номера.
Зачем все это нужно?
Ответ, казалось бы, лежит на поверхности — для игр и 3D-пакетов! Но не только. Разработчики уверяют, что Pentium !!! (цифра III в логотипе действительно состоит из восклицательных знаков) с его потоковыми расширениями SIMD способен радикально повысить скорость работы в Internet через существующие узкие каналы, а главное — стимулировать наполнение Сети трехмерной графикой. Известно, что, в принципе, процессор — плохой помощник для путешествий в Internet (хотя, Internet Explorer 4.0 поддерживает MMX). Главное — ширина и качество канала, но с Pentium III — случай особый.
Сотворить чудо предполагается, например, через использование технологии NURBs (Non Uniform Rational B-splines, неоднородный рациональный B-сплайн). Насколько удалось понять, механизм NURBs, метод моделирования объектов, обеспечивающий высокоточный контроль их формы, предполагает передачу через Сеть лишь минимального набора данных, необходимых для визуализации трехмерных объектов.
Скажем, для того чтобы «объемная» кукла показала рукой в направлении коммунизма, ей не обязательно нужно знать обо всех промежуточных положениях руки. Вполне достаточно указать ей конечную точку траектории (и нам заодно), а все остальное процессор мгновенно просчитает по заданным алгоритмам и формулам. Такой механизм визуализации трехмерных объектов в Internet можно грубо сравнить с масштабированием векторных изображений по сравнению с растровыми. Естественно, уровень детализации 3D-объектов в Internet можно менять в зависимости от производительности соединения и мощности клиентской рабочей станции. На предварительном объявлении нового Pentium III в офисе Intel присутствующим показали подвижную трехмерную куклу, созданную французскими специалистами с использованием технологии NURBs. Сначала виртуальная кукла кривлялась достаточно резво и выглядела прекрасно (графическая прорисовка была на высоте). Все это происходило как бы под управлением Pentium III. При переводе же системы на Pentium II сопоставимой или той же частоты количество треугольников, из которых состояла виртуальная 3D-кукла, снизилось в четыре раза. Понятно, что от былого лоска не осталось и следа, так как процессор, лишенный SSE, был вынужден многократно понизить уровень детализации или кадровую частоту.
При рендеринге NURBs процессор Pentium III значительно быстрее выполняет кодовые комбинации доступа к данным, повторяющиеся в алгоритмах трехмерной геометрии, а «заданные в явном виде команды предварительной выборки и поточного запоминания сводят к минимуму засорение кэш-памяти». Кроме того, обновленный блок операций с плавающей точкой Pentium III допускает выполнение одной командой четырех арифметических действий. Такой рост производительности особенно полезен при обсчете проволочных моделей и трехмерных пейзажей со сложными тенями и «естественным» распространением света.
Падение frame-rate (выражается в торможении движущейся картинки) в отсутствие потоковых инструкций у процессора особенно заметно при воспроизведении сложных 3D-игр (например, Dispatched производства Rage). Сложный рендеринг, математический расчет поверхностей объектов, световых оттенков и других декоративных примет современных игр вынуждает процессор понижать кадровую частоту, если в графический конвейер не впрягаются новые потоковые инструкции. Аналогичные функции выполняют SIMD 3D Now! от AMD. Кстати, в Intel, как и в AMD, не отрицают полезности 3D-акселераторов, работающих в одной упряжке с процессором. Появление программного обеспечения, оптимизированного для работы с Pentium III, может стать делом не самого далекого будущего, так как поддержка SSE реализована в бета-версии Microsoft DirectX 6.1. Инструкции 3D Now! конкурирующей AMD, напомним, поддерживаются уже существующим Microsoft DirectX 6.0.
Но на трехмерных играх свет клином не сошелся — чрезмерной силе Pentium III инженеры Intel прочат и массу других полезных применений. Одним из самых перспективных является качественное распознавание речи и перевод устных фраз в текстовую форму. Производители клавиатур могут, правда, не волноваться — речевой ввод победит не сегодня и не завтра, но прогресс определенно наметился. За счет команд предварительной выборки и поточного запоминания Pentium III может существенно ускорить обработку данных по алгоритмам Витерби, применяемым для распознавания речи. Сообщается также о дополнительных MMX-командах «максимум-минимум», служащих для обнаружения максимальных и минимальных элементов вектора, что используется в тех же алгоритмах Витерби.
Ускорение видео для PC было достигнуто еще внедрением набора инструкций MMX, но и для SSE остался обширный фронт работ: Pentium III, по информации Intel, без труда справится с кодировкой видео по стандарту MPEG-2 в режиме реального времени. Основной удар в этом случае придется на дюжину новых инструкций в составе MMX, а также на новые инструкции поточного запоминания.
Косвенно «мультимедийную привлекательность» Pentium III можно оценить, используя результаты собственных процессорных испытаний Intel на задачах, оптимизированных для SSE. Так, например, по данным Intel, тест 3D WinBench 99 T/L (преобразование/освещенность) при поддержке DirectX 6.1 свидетельствует о скачкообразном росте производительности на 74% у «третьего» Пентиума по сравнению со «вторым» при прочих равных условиях в ОС Windows 98. В дальнейшем собственное тестирование лаборатории «КомпьютерПресс» подтвердило справедливость этих выводов. Но, по нашим данным, если запустить 3D WinMark в режиме Null Device (когда все обязанности 3D-карты берет на себя процессор), то результат теста 3D WinBench 99 Processor отразит 24-процентное превосходство Pentium III 500 МГц над Pentium II 450 МГц (речь идет о трехмерной составляющей), то есть при одинаковых тактовых частотах «трехмерное» превосходство Pentium III над Pentium II ограничится 11,5%. В реальных применениях пользователям стоит рассчитывать именно на последний результат.
Что касается офисных приложений, то вряд ли новые инструкции приведут к ощутимому приросту производительности. Согласно результатам предварительного тестирования, которое проводила сама Intel, показатель Business Winstone 99 под Windows 98 вырос на 1% для процессора Pentium III 450 МГц по сравнению с Pentium II с той же выставленной внутренней (и внешней) частотой. А уровень SYSMark98 под «самой деловой» Windows NT 4.0 вообще остался без изменений для Pentium III по сравнению с предшественником. Даже учитывая предстоящую оптимизацию офисного ПО под SSE, нет оснований надеяться на скачок производительности.
Как с этим работать?
От назойливых сравнений с судьбой Pentium MMX новому процессору с SSE будет не так-то просто избавиться. Вспомним, что пока программы, поддерживающие MMX, можно было пересчитать по пальцам, Pentium MMX показывал скромный прирост производительности по сравнению с Pentium-обычным. И объяснялось это главным образом двукратным увеличением емкости кэш-памяти первого уровня до 32 Кбайт по сравнению с прежними шестнадцатью. Не избежать некоторого «программного вакуума» и новоиспеченному Pentium III, у которого, кстати, объем кэша L1 не увеличился, составив прежние 32 Кбайт.
В настоящий момент полная поддержка всех функциональных возможностей Pentium III реализована лишь в «персональной» операционной системе Windows 98 и «корпоративной» Windows 2000. Имеется в виду, что специально написанные программы смогут задействовать SSE и другие новые возможности в перечисленных ОС. Для аналогичной полной поддержки со стороны Windows NT 4.0 (с Service Pack 4) понадобится установить дополнительный драйвер Intel. Остальные существующие ОС Microsoft также работают с новым процессором и программами для него, но все попытки воспользоваться новыми расширениями будут игнорироваться.
Благие намерения
Шаг к совершенствованию управления и защиты компьютерных ресурсов — приблизительно так оценивает сама Intel применение функции порядковой нумерации процессора, впервые реализованной в Pentium III. Предполагалось, что 64-разрядный процессорный номер (плюс 32-разрядный идентификатор CPUid) будет служить для безобидной идентификации процессора и его платформы. Кроме того, его можно использовать для повышения конфиденциальности данных (через их компрессию или криптографическую защиту), что позволит усилить безопасность сделок через Internet. Грубо говоря, процессору с идентификационным номером отводится роль, отдаленно напоминающая электронные ключи. Специально оговорено, что процессорный номер поможет системному администратору проводить сквозную инвентаризацию корпоративного оборудования. И тут со всех сторон на Intel посыпались вопросы: кто гарантирует, что действия ничего не подозревающего пользователя не будут отслежены злоумышленниками во время Internet-сеанса или других сетевых действий? Конечно, процессорный номер можно отключить программно, но ведь программно его можно и включить?
Лично одному из авторов видится иная подоплека идентификационных инициатив Intel. Процессорный номер потенциально позволяет (в том числе и негласно) отслеживать потоки проданного оборудования, определяя утечки в страны, разрабатывающие ядерное оружие. Конечно, в чистом виде системы на базе Pentium III угрозы миру не представляют. Для крупных расчетов или для моделирования военных задач такие процессоры безнадежно слабы. Но существуют ведь и кластерные решения. К тому же мощные персоналки несут косвенную угрозу, стимулируя развитие академического образования в неблагонадежных странах. «Мирное» использование номера тоже весьма перспективно: статистика предпочтений и действий пользователей в Internet является просто бесценной информацией для крупных маркетинговых служб. А как там насчет принципа добровольности?
Нельзя не отметить и полезные свойства процессорного номера — в нем может быть заложена нестираемая фабричная информация о частоте процессора, что снизит риск обмана покупателей со стороны недобросовестных продавцов и заодно ограничит возможности «разгона» (дескать, получите только ту тактовую частоту, за которую заплатили).
Товары и цены
Процессоры Pentium III будут поставляться в новой корпусировке S.E.C.C. 2. По сути она представляет собой упрощенный вариант уже знакомого картриджа с односторонним расположением контактов S.E.C.C., в который «пакуется» Pentium II. Заметное отличие состоит в отсутствии у S.E.C.C. 2 отводящей тепло металлической пластины и второй половинки внешнего пластикового кожуха. На место отсутствующей половинки кожуха будет крепиться унифицированный вентилятор (cooler). Точно такой же кулер будет устанавливаться на процессоры Сeleron в «вертикальном» исполнении S.E.P.P. Предполагается, что облегченная конструкция картриджа S.E.C.C. 2 позволит достичь заметной экономии при производстве больших партий процессоров. Pentium III устанавливаются в процессорный разъем Slot1.
В конце февраля были выпущены два варианта Pentium III с тактовыми частотами 450 и 500 МГц. Ориентировочные цены при поставках партиями по 1000 штук составят соответственно 496 и 696 долларов. Емкость сверхоперативной памяти второго уровня (кэша L2) для новых процессоров сохранится на уровне 512 Кбайт. Как уже упоминалось, емкость кэш-памяти первого уровня не изменится, составив 32 Кбайт. Считается, что ее увеличение ставит новые нетривиальные задачи перед конструкторами, не давая при этом адекватного увеличения производительности. Pentium III 450 МГц можно устанавливать в платы, предназначенные для Pentium II и поддерживающие соответствующую частоту. Но при этом, возможно, придется прибегнуть к несложному хирургическому вмешательству — модернизировать BIOS платы. С 500-мегагерцевыми моделями Pentium III такой трюк не пройдет и может потребоваться замена платы. Как и их соседи по процессорной линейке, Pentium III поддерживают внешнюю тактовую частоту 100 МГц.
У Pentium III, ориентированном на массовый рынок, вскоре появится и старший брат в лице Pentium III Xeon, который предназначен для установки в серверы и высококлассные рабочие станции. Ранее он был известен под кодовым именем Tanner. Все эти процессоры пока выпускаются по 0,25-микронной технологии, а переход на 0,18-микронную состоится, вероятно, с выходом в середине этого года процессора с рабочим названием Cascades для серверов и рабочих станций. Ждем-с!
«Ходовые испытания» Pentium III. Отчет тестовой лаборатории «КомпьютерПресс»
Все, что вы прочитали в этой статье ранее, — это смесь предварительных данных, официальной (и не очень) информации; утечки, домыслы, мнения. Другими словами, до сих пор речь шла о том, чего потребители и разработчики ждут от нового процессора, а теперь тестовая лаборатория нашего журнала готова рассказать, на что же реально способен Pentium III. Методика тестирования, которому был подвергнут образец Pentium III с 512 Кбайт кэш-памяти второго уровня и тактовой частотой 500 МГц, практически не отличается от той, что была опубликована в статье на нашем февральском CD-ROM. В ней же подробно расписано назначение и особенности каждого теста и приведены точные конфигурации тестовых установок для испытания различных процессоров. Для того чтобы отчет о производительности бывшего Katmai был наиболее наглядным, рядом приведены результаты тестирования его «классовых союзников», начиная от Celeron 366 МГц и заканчивая мощными RISC-процессорами Alpha. Тем не менее наиболее легитимным, на наш взгляд, является сравнение Pentium III с Pentium II 450 МГц. В пользу такого шага выступает наибольшее архитектурное сходство (х86, ядро P6), одинаковый объем сверхоперативной памяти второго уровня (512 Кбайт) и, наконец, сопоставимая тактовая частота: 500 против 450 МГц. Последнее обстоятельство все же вносит определенное искажение в результаты и не позволяет достоверно вести лобовое сравнение Pentium II 450 МГц и Pentium III 500 МГц. Поэтому внимательному читателю придется давать «Пентиуму II» небольшую фору.
В двух словах напомню особенности использованных программных тестовых пакетов. Тестирование процессора можно сравнить с испытаниями автомобиля: можно тестировать машину на стенде, определяя отдельно эффективность, мощность и кпд двигателя, а можно отправить автомобиль на кольцевые гонки, где все зависит от комплекса факторов: характеристик подвески, аэродинамических параметров кузова, ну и, конечно, от мощности двигателя. И стенд, и ходовые испытания одинаково необходимы, но имеют разное значение с точки зрения потребителя. Так и у процессоров: существуют синтетические тесты, которые позволяют абстрагироваться от производительности окружающих процессор устройств (например, системной памяти) и сконцентрироваться почти исключительно на внутренних характеристиках самого процессора. Достигается это следующим образом: синтетические тесты имитируют подпрограммы реального приложения, но с предельно малыми массивами данных, которые либо полностью помещаются в кэш-память первого уровня, либо написаны так, что по минимуму задействуют оперативную память. Процессор как бы варится в собственном соку, реализуя весь заложенный в нем потенциал. Но при работе с реальными приложениями далеко не все возможности процессора будут использоваться с максимальной интенсивностью, а кроме того, общая производительность тесно увязана со свойствами чипсета, с быстродействием графической и дисковой подсистемы, а также с другими факторами. Поэтому другая группа тестов ведет хронометраж работы системы на реальных приложениях. В нашем исследовании к синтетическим тестам относится набор BYTEmark 2.0, а также тесты CPUmark 32 и FPU WinMark из пакета WinBench 99. К тестам на реальных приложениях относятся все остальные задания из пакета WinBench 99 (за исключением упомянутых) и 3D WinBench 99.
Теперь о результатах. Как и ожидалось, наибольший прирост производительности процессор Pentium III показал на наборе тестов 3D WinMark Suite (плюс 23,8%; здесь и далее по сравнению с Pentium II 450 МГц). В режиме «Processor» (в результате чего рассчитывается безразмерный показатель 3D WinMark Processor) все вычисления выполняются только центральным процессором, и получаемый в результате поток видеоданных не выводится на графический адаптер, а перенаправляется в системное «нуль-устройство». Таким образом, графический адаптер остается без работы и никак не используется при выполнении тестов в этом режиме. Результат прогона 3D WinMark Suite в режиме «Processor» может служить хорошим показателем того, насколько хорошо собственно процессор справляется с 3D-вычислениями.
Второй по величине прирост производительности был отмечен на синтетическом тесте CPUmark32, характеризующем процессорную подсистему (плюс 12,3% для Windows 98 и плюс 15% для Windows NT 4.0). Далее заметный скачок производительности показал синтетический тест блока операций с плавающей точкой FPU WinMark (плюс 10,3/11,7% соответственно для Windows 98/NT). А вот High End Graphics — это уже посерьезнее. Он проводит натурные испытания процессора при работе с мощными, требовательными 32-разрядными графическими пакетами и программами для разработчиков, включая продукты Adobe (Photoshop 4.01 и Premier 4.2), Microsoft Visual C++ 5.0. На этом реальном тесте Pentium III продемонстрировал увеличение производительности на 10,5-12,5%. Триумф Windows NT? Шутки шутками, но беглый взгляд на результаты позволяет утверждать, что прирост быстродействия системы, управляемой Windows NT, на 1-3% превышает соответствующие показатели для Windows 98. Зато, как и ожидалось, популярные деловые приложения (MS Office 97, Corel WordPerfect Suite 8) не стали «бегать» намного быстрее, получив в свое распоряжение новый процессор, хотя прирост производительности в 7-8% все же что-нибудь да значит.
Возможно, наиболее показательными станут результаты выполнения видеотестов из пакета WinBench 99 в среде Windows 98. Процессор раскрыл себя в полную силу. Может быть, именно новые MMX-инструкции помогли значительно поднять кадровую частоту и снизить общую загруженность процессора. Надеемся, что все остальные выводы читатель сделает самостоятельно на основе приведенных табличных данных. Ниже приводится конфигурация тестовой установки, на которой производилось испытание как Pentium III, так и Pentium II:
- материнская плата: для тестирования под управлением Windows 98 использовалась Chaintech 6BTM с чипсетом Intel 440BX, а для тестирования под Windows NT 4.0 Workstation с Service Pack 4 — A-Trend ATC-6400 с чипсетом Intel 440GX;
- видеокарта: для тестирования под управлением Windows 98 использовалась ASUS AGP-V3400TNT (чипсет — 128-битный RIVA TNT от nVIDIA, интерфейс — AGP, объем видеопамяти — 16 Мбайт), а для тестирования под Windows NT 4.0 Workstation с Service Pack 4 использовалась Diamond Viper V330 (чипсет — 128-битный RIVA 128 от nVIDIA, интерфейс — PCI, объем видеопамяти — 4 Мбайт);
- оперативная память: 128 Мбайт (два SDRAM DIMM-модуля по 64 Мбайт с поддержкой SPD и номинальным временем доступа 7 нс, соответствующие спецификации PC100 SDRAM);
- накопитель на жестких магнитных дисках: Fujitsu MAC3045SP объемом 4,5 Гбайт с интерфейсом Ultra Wide SCSI;
- SCSI-адаптер: Adaptec AHA-2940UW с интерфейсом Ultra Wide SCSI и шиной PCI;
- CD-ROM: ASUS CD-S340 со скоростью 34x и интерфейсом IDE.
С результатами тестирования вы можете ознакомиться в приложении 1.
КомпьютерПресс 3'1999