Тестирование процессоров AMD Athlon и Intel Pentium 4 на профессиональных High-End-приложениях
До недавнего времени для пользователей-профессионалов вопроса о выборе ПК-платформы под рабочую станцию как такового не существовало: ответ был очевиден — Intel. Однако сегодня ситуация уже не столь однозначна, поскольку в сегменте высокопроизводительных процессоров для ПК в данный конкретный момент существуют не просто два сильных игрока (Intel и AMD), но две весьма различающиеся между собой микропроцессорные архитектуры — Pentium 4 от Intel и Athlon от AMD. В связи с этим мы и решили провести испытания машин, построенных на базе данных процессоров и оснащенных профессиональным программным обеспечением, с целью выяснения того, как конкретные приложения, наиболее часто инсталлируемые и исполняемые на компьютерах класса «рабочая станция», будут использовать преимущества той или иной архитектуры.
Для начала стоит сказать несколько слов о самих архитектурах и их теоретически предполагаемых сильных и слабых сторонах в сравнении друг с другом.
Разработав процессор Intel Pentium 4, компания Intel в очередной раз сделала весомую заявку на революцию в архитектуре IA-32. Действительно, несмотря на то что Intel Pentium 4 является процессором с архитектурой IA-32, последняя существенно отличается от архитектуры процессоров семейства P6 (в него входят процессоры Intel Pentium Pro, Intel Pentium II, Intel Pentium III, Intel Celeron и Intel Xeon). Эта архитектура даже получила специальное название — NetBurst. Среди ее основных новшеств — гиперконвейерная (Hyper-Pipelined) технология, 400-мегагерцевая системная шина и новый набор инструкций для обработки мультимедийных данных SSE2 (Streaming SIMD Extensions 2).
Суть технологии Hyper-Pipelined заключается в том, что конвейер Intel Pentium 4 стал значительно длиннее по сравнению с конвейерами его предшественников и состоит из 20 стадий, при этом в архитектуру процессора внесены значительные изменения, призванные существенно улучшить систему предсказания ветвлений. Отметим, что увеличение длины конвейера — это неизбежный шаг, вызванный необходимостью дальше наращивать тактовую частоту ядра ЦПУ, чему в будущем обязательно последуют и другие производители микропроцессоров, в том числе и главный на сегодняшний день конкурент Intel — компания AMD. Так что компания Intel здесь оказалась первой, и Intel Pentium 4 получит солидный запас по увеличению тактовой частоты ядра процессора при переходе на более тонкие технологические процессы.
Подобная архитектура с очень длинным конвейером и высокими частотами ядра отлично подходит для задач потоковой обработки данных с ничтожно малым количеством ветвлений. Однако на задачах с большим количеством ветвлений множество ошибок предсказания и соответственно сбросов конвейера может привести к значительному снижению производительности, поскольку каждая ошибка предсказания будет означать задержку выполнения следующей операции на 20 тактов. Сегодня тактовые частоты Intel Pentium 4 еще слишком малы для того, чтобы явно обходить своего ближайшего конкурента AMD Athlon (с вдвое более коротким конвейером в 10 стадий) на задачах такого рода, но ситуация может кардинально измениться с преодолением Intel Pentium 4 рубежа в 2-2,5 ГГц.
Огромный плюс Intel Pentium 4 — 400-мегагерцевая системная шина, преимущества от использования которой весьма ощутимы. Напомним, что физически системная шина у Intel Pentium 4 тактируется частотой в 100 МГц, однако благодаря использованию технологии Quad Pumping по этой шине передается 4 блока данных за один такт (аналогично тому, как это делается при передаче данных в режиме AGP 4X по AGP-шине). Поэтому эффективная рабочая частота системной шины у Intel Pentium 4 (которую также называют Quad Pumped Bus) составляет 400 МГц, а пропускная способность — 3,2 Гбайт/с. Здесь же отметим, что у старших моделей AMD Athlon эффективная рабочая частота системной шины составляет 266 МГц (133 МГц DDR), а пропускная способность — 2,1 Гбайт/с, вследствие чего по пропускной способности системной шины Intel Pentium 4 значительно опережает своего конкурента.
Кроме того, сегодня Intel Pentium 4 работает в паре с двухканальной RAMBUS-памятью (на материнских платах с чипсетом Intel 850), суммарная пропускная способность которой составляет 3,2 Гбайт/с (по 1,6 Гбайт/с на каждый канал), в то время как AMD Athlon — с DDR SDRAM-памятью (на материнских платах с чипсетами AMD 760 и VIA KT266) с максимальной пропускной способностью до 2,1 Гбайт/с. Кстати, нужно отметить, что обе платформы весьма грамотно сбалансированы — пропускная способность системной шины процессора равна пропускной способности шины памяти.
Таким образом, по пропускной способности системной шины и подсистемы оперативной памяти Intel Pentium 4 на настоящий момент превосходит AMD Athlon и, по идее, должен выигрывать у своего конкурента в тех случаях, когда выполняется обработка больших объемов данных, например на задачах потоковой обработки мультимедиа-данных (то есть опять же в тех приложениях, где наиболее ярко проявляются преимущества гиперконвейерной архитектуры).
Помимо этого AMD Athlon имеет три FPU-конвейера, которые способны выполнить по две инструкции за каждый такт, в то время как Intel Pentium 4 имеет только два блока FPU. А потому с чисто расчетными задачами, требующими выполнения большого объема операций с плавающей точкой, AMD Athlon должен справляться быстрее (иногда — значительно быстрее), чем Intel Pentium 4.
Однако здесь нужно обязательно учитывать то обстоятельство, что у обоих процессоров имеются специальные наборы инструкций, предназначенные для параллельной обработки данных с плавающей точкой, — SSE/SSE2-наборы у Intel Pentium 4 и Enhanced 3DNow!-набор у AMD Athlon, и некоторые приложения могут быть оптимизированы для работы с этими наборами инструкций. Однако сегодня ситуация складывается так, что если современные компьютерные игры оптимизируются, как правило, под оба набора команд (SSE/SSE2 и Enhanced 3DNow!), то профессиональный софт в большинстве своем пока не оптимизирован ни под один из них!
Правда, в последнее время ситуация меняется, и на рынке ПО появляется все больше профессиональных приложений с оптимизацией под расширенные наборы SIMD-инструкций, но пока с явным «уклоном» в сторону Intel. Дело в том, что если на сегодняшний день профессиональные приложения High-End-класса и оптимизируются каким-либо образом, то пока только под наборы инструкций Intel SSE/SSE2, но никак не под AMD Enhanced 3DNow!. И похоже, что на ближайшую перспективу эта тенденция сохранится. По крайней мере несколько софтверных компаний уже объявили о своих планах выпустить к концу года новые версии известных профессиональных пакетов, оптимизированные под SSE2. И в этом смысле использование рабочей станции на базе Intel Pentium 4 может оказаться более предпочтительным.
Резюмируя все вышесказанное, можно предположить, что Intel Pentium 4 будет выигрывать на задачах потоковой обработки данных, которые требуют большой пропускной способности системной шины и шины памяти, а также в приложениях, оптимизированных под наборы инструкций SSE/SSE2. В то же время AMD Athlon будет впереди в чисто вычислительных задачах, требующих выполнения большого объема вычислений с плавающей точкой и не требующих «прокачки» очень большого объема данных (например, финальный рендеринг 3D-сцены), — но только тогда, когда программный код не оптимизирован под наборы инструкций Intel SSE/SSE2.
Исходя из этого нельзя заранее сказать, какой из двух процессоров — Intel Pentium 4 или AMD Athlon — лучше подойдет для решения той или иной задачи. Все будет зависеть от конкретного программного приложения. И этот вывод наглядно подтверждается результатами проведенного тестирования.
Для проведения испытаний мы использовали два компьютера, которые любезно предоставила нам компания «Клондайк Компьютерс». AMD-платформа была собрана на базе процессора AMD Athlon 1333, материнской платы ASUS A7M266 с интегрированным звуковым контроллером C-Media CM-8738 и 512 Мбайт DDR SDRAM-памяти, а Intel-платформа — на процессоре Intel Pentium 4 1700, материнской плате ASUS P4T, 512 Мбайт RDRAM-памяти и звуковом адаптере Creative Vibra 128. Во всем остальном оба компьютера были абсолютно идентичны: видеокарта ASUS AGP-V8200 на чипсете nVIDIA GeForce3 с 64 Мбайт DDR SRDAM-памяти; системный жесткий диск IBM IC35L020AVER07-0 с IDE-интерфейсом, подключенный к IDE-контроллеру, интегрированному на материнской плате; рабочая зона дисковой подсистемы для хранения пользовательских данных — 4 жестких диска IBM IC35L020AVER07-0 с IDE-интерфейсом, подключенные к IDE RAID-контроллеру Promise FastTrak 100 и объединенные в RAID-массив типа Level 0; CD-ROM-дисковод — 50x-скоростной ASUS CD-S500 с IDE-интерфейсом и подключенный к IDE-контроллеру, интегрированному на материнской плате; LAN-адаптер Intel Pro 100+ Management Adapter; флоппи-дисковод — 3,5-дюймовый на 1,44 Мбайт; корпус InWin Q500 BigTower.
Программа тестирования состояла из двух этапов. На первом этапе выполнялись тесты из тестовых пакетов SYSmark 2001, SPECviewperf 6.1.2 и Intel P4 Application Launcher 2.1. На втором этапе вручную прогонялись тесты, эмулирующие реальную работу с High-End-приложениями: поворот изображения и наложение фильтров на изображение в Adobe Photoshop 5.5; рендеринг 3D-сцен в Alias|Wavefront Maya 3.0; рендеринг 3D-сцены в Discreet 3D Studio MAX R3; тонирование трехмерной модели в Autodesk AutoCAD 2000; обработка видеороликов в Adobe Premier 6.0; обработка видеороликов в Ulead Media Studio Pro 6.0. Все тесты выполнялись под управлением операционной системы MS Windows 2000 Professional Workstation (ENG) с Service Pack 2 при установленном Desktop-видеорежиме с разрешением в 1024×768 пикселов и глубиной цвета в 32 бита.
А вот полученные в ходе тестирования результаты, наверное, имеет смысл рассматривать применительно к определенным классам задач, поскольку профессионал вряд ли в равной мере использует в своей повседневной работе приложения всех типов. И очень многим читателям будет в первую очередь интересно узнать, как ведет себя тот или иной процессор на задачах какого-либо определенного типа, с которыми им приходится сталкиваться чаще всего.
Для начала вкратце остановимся на результатах тестирования машин под офисными приложениями, полученными во время прогона сценария Office Productivity Suite из пакета SYSmark 2001. Этот сценарий базируется на офисных пакетах Microsoft Word 2000, Microsoft Excel 2000, Micosroft PowerPoint 2000, Microsoft Access 2000, Microsoft Outlook 2000, Dragon Naturally Speaking Preferred 5, Netscape Communicator 6.0, WinZip 8.0 и McAfee VirusScan 5.13. Здесь AMD Athlon 1333 обогнал Intel P4 1700, но настолько незначительно, что можно сказать, что оба процессора были практически равны: 156 баллов у AMD Athlon и 150 баллов у Intel P4. Честно говоря, сегодня уже мало кого интересует производительность современных платформ в офисных приложениях, да и перечисленное ПО можно назвать High-End-приложениями с большой натяжкой. Поэтому можно с легкостью забыть об офисной половине пакета SYSmark 2001 и перейти к обсуждению второй, куда более интересной части результатов испытаний.
«Интересную» часть начнем с тестов двухмерной графики. В качестве наиболее типичного программного продукта, используемого для обработки 2D-изображений, был выбран популярнейший в нашей стране пакет Adobe Photoshop 5.5.
Тестовый графический файл, загруженный в этот пакет, был подвергнут определенному преобразованию, как-то: поворот и наложение фильтров на изображение. В табл. 1 приведено время выполнения каждой операции в секундах, меньший результат — лучший и выделен цветом.
Показательно, что данные результаты никоим образом не могут выявить явного победителя. В тестах, связанных с расчетом геометрии и с цветоделением, выиграл AMD Athlon, зато в тестах с преимущественно попиксельной обработкой изображения выиграл Intel Pentium 4. Особенно показательна разница результатов в пользу Intel на фильтрах Gaussian Blur и Lighting Effects, которые оптимизированы под использование инструкций Intel SSE.
Следующий класс задач — задачи видеообработки и видеомонтажа. В данном классе в качестве объектов исследования были выбраны наиболее известный среди дизайнеров пакет Adobe Premier 6.0 и чуть менее популярный в нашей стране Ulead Media Studio Pro 6.0.
В Adobe Premier 6.0 производилось сведение трех исходных видеороликов формата Quick Time Movie (mov-файл, размер кадра — 800×340 точек, частота кадра — 25 кадров/с) в один результирующий видеоролик формата MPEG-4/MPEG-2/MPEG-1 с наложением переходных видеоэффектов. Длительность результирующего видеоролика — 2:12 (мин:с). В табл. 2 приведено время выполнения данных операций в формате мин:с. Меньший результат — лучший, он выделен цветом.
В Ulead Media Studio Pro 6.0 производилась пятикратная состыковка одного и того же исходного видеоролика в некомпрессированном RGB-формате (avi-файл, размер кадра — 720×576 точек, частота кадра — 25 кадров/с, продолжительность видеоролика — 15 с) в один результирующий видеоролик формата MPEG-4 / MPEG-2 / MPEG-1 / Quick Time MOVIE с наложением переходных видеоффектов. Длительность результирующего видеоролика — 1:07 (мин). В табл. 3 приведено время выполнения данных операций в формате мин:с. Меньший результат — лучший, он выделен цветом.
Очень интересно в данном контексте выглядят результаты испытаний двух пакетов, предназначенных для обработки видеоданных, — собственно Adobe Premier 5.1 с Plug-In от Ligos и Ulead Video Studio 4.0 из состава Intel Pentium 4 Processor Application Launcher 2.1 (Rating: лучший результат — больший; Raw Data: лучший результат соответственно — меньший; табл. 4).
В обоих случаях при тестировании Adobe Premier использовался Plug-In от Ligos, оптимизированный под набор инструкций Intel SSE2, однако использовались разные версии самого Adobe Premiere: в Adobe Premiere 6.0 с большим отрывом выиграл Intel Pentium 4, а в Adobe Premiere 5.1 — AMD Athlon. Причем интересно отметить, что версия Adobe Premiere 5.1 используется в Intel Pentium Processor Application Launcher 2.1, которым советует тестировать ПК сама компания Intel.
При тестировании продукции Ulead сложилась не менее оригинальная ситуация: в Ulead Media Studio Pro 6.0 практически везде выиграл AMD Athlon, зато в Ulead Video Studio 4.0 с огромным отрывом впереди был Intel Pentium 4.
Итак, в разных версиях одного и того же продукта ситуация может оказаться диаметрально противоположной, как и в разных продуктах одной и той же фирмы. И очень похоже, что тут сработала обещанная оптимизация под SSE в Adobe Premier 6.0. К тому же, как мы предполагаем, очень многое зависит от конкретной выполняемой операции, от типа используемого кодека, что очевидно на примере Ulead Media Studio Pro 6.0 и от разницы в реализации алгоритмов MPEG- и Quick Time-кодеков.
Следующий важнейший класс задач — программы трехмерного моделирования/проектирования.
Здесь мы опять использовали три известных пакета — Discreet 3D Studio MAX R3, Alias|Wavefront Maya 3.0 и Autodesk AutoCAD 2000 — для определения производительности процессоров на задачах финального рендеринга трехмерных сцен. Кроме того, мы использовали тест SPECviewperf 6.1.2, моделирующий работу профессиональных OpenGL-приложений в режиме визуализации/preview, которая в реальной деятельности дизайнера занимает весьма немалое время.
Время выполнения операции рендеринга представлено в табл. 5, 6, 7 (в формате мин:с). Меньший результат — лучший, он выделен цветом.
Операции рендеринга, как известно, выполняются сопроцессором (FPU), а здесь AMD Athlon сейчас мощнее Intel P4 1700, поэтому AMD Athlon вышел вперед на вполне законных основаниях. Интересно отметить: чем больше геометрических деталей и других эффектов, которые необходимо просчитывать, тем больше отрыв AMD, но чем больше объем текстур, тем большую роль играет пропускная способность памяти на платформе Intel и тем ближе результаты Intel Pentium 4 подтягиваются к результатам AMD Athlon.
Результаты SPECviewperf 6.1.2 представлены в табл. 8. Результаты — в кадрах/с, больший результат — лучший и выделен цветом.
Здесь налицо абсолютная победа Intel Pentium 4! Сказывается наличие видеокарты на чипе nVIDIA GeForce 3, использующей аппаратный Transform & Lighting и таким образом частично освобождающей на подобных операциях центральный процессор. Поэтому важную роль здесь играет скорость прокачки больших объемов видеоданных из памяти в видеокарту, а пропускная способность памяти на платформе Intel Pentium 4 / Dual channel RDRAM выше, чем на AMD Athlon / DDR SDRAM. К тому же сказывается великолепная оптимизация драйверов nVIDIA под Intel SSE/SSE2, хотя и оптимизация этих драйверов под 3DNow! тоже весьма неплоха.
Теперь попробуем обратиться к приложениям обработки мультимедиа-данных. Яркими представителями таких приложений могут служить пакеты eJay MP3 Plus 1.3, NaturallySpeaking Pref 4.0 и Microsoft Windows Media Encoder 7.0, входящие в состав теста Intel Pentium Processor Application Launcher 2.1 (Rating: лучший результат — больший, Raw Data: лучший результат соответственно — меньший; табл. 9).
В eJay MP3 Plus 1.3 и NaturallySpeaking Pref 4.0 оба процессора были практически равны, хотя номинально выиграл Intel Pentium 4. Зато в оптимизированном под использование расширенного набора команд Intel SSE2 пакете Windows Media Encoder 7.0 процессор Intel Pentium 4 выиграл с 50-процентным отрывом.
В заключение можно привести результат обобщенной производительности процессоров на High-End-приложениях, часто используемых для создания Internet-контента. Для этих целей предназначен SYSmark 2001 Internet Content Creation Suite, в состав которого входят Macromedia Dreamweaver 4, Adobe Photoshop 6.0, Adobe Premiere 6.0, Microsoft Windows Media Encoder 7.0 и Macromedia Flash 5. Больший результат — лучший (табл. 10).
Выводы
Во-первых, как показали проведенные тесты, их результаты довольно неплохо согласуются с нашими теоретическими предположениями, высказанными в начале статьи.
Во-вторых, отсюда следует, что на сегодняшний день нет абсолютного лидера среди процессоров для всех классов профессиональных приложений, поэтому выбор процессора между AMD Athlon и Intel Pentium 4 должен определяться кругом задач, под которые планируется использовать компьютер.
В-третьих, очень важную роль играет оптимизация используемого программного обеспечения под расширенные наборы команд для параллельной обработки данных. С этой точки зрения Intel Pentium 4 является, возможно, потенциально более выгодным приобретением, ибо как ни жаль отличные процессоры AMD, но производители профессионального программного обеспечения предпочитают, в силу сложности работ (да и из-за определенной консервативности), оптимизировать свои продукты только под расширенный набор команд Intel SSE/SSE2.
И наконец, наиболее оригинальный вывод, к которому мы пришли в итоге, звучит так: «Определяясь с выбором платформы под профессиональные задачи, сегодня нужно выбирать процессор не только под конкретный класс задач, но даже под конкретную версию того или иного программного пакета».
Тестирование проведено тестовой лабораторией «КомпьютерПресс» при технической поддержке компании «Клондайк Компьютерс». Стендовые компьютеры для проведения испытаний были любезно предоставлены компанией «Клондайк Компьютерс» (тел. (095) 363-9222; http://www.klondike.ru/). Благодарим фирму «Русская Промышленная Компания» (тел. (095) 923-0030, 923-0070; http://www.cad.ru/, http://www.rebis.ru/) за помощь в проведении тестов с использованием пакета Autodesk AutoCAD 2000. |
КомпьютерПресс 8'2001