Процессор Intel Core 2 Extreme QX9650 — новый рекордсмен

Сергей Пахомов

Особенности нового поколения процессоров

Методика тестирования

Этап подготовки

Этап обучения

Этап тестирования

Используемые бенчмарки и приложения

Стенд для проведения тестирования

Результаты тестирования

 

О новом семействе процессоров, известном под кодовым наименованием Penryn, говорят уже давно. Собственно, первые результаты тестирования этих процессоров были преданы публичной огласке еще в апреле 2007 года на пекинском форуме IDF 2007. Однако тогда речь шла лишь о результатах тестирования инженерных сэмплов процессоров. Кроме того, проводилось оно специалистами самой компании Intel на очень ограниченном наборе бенчмарков, что, конечно же, не давало полного представления о возможностях нового процессора. И вот наконец у нас появилась возможность ликвидировать все пробелы и подробно протестировать топовый четырехъядерный процессор нового семейства, именуемый Intel Core 2 Extreme QX9650 и известный также под кодовым названием Yorkfield XE. В этой статье мы сравним производительность процессора Intel Core 2 Extreme QX9650 с производительностью процессоров Intel предыдущих поколений.

Особенности нового поколения процессоров

В семейство с кодовым наименованием Penryn входят процессоры с микроархитектурой Enhanced Intel Core Microarchitecture, выполненные на основе нового, 45-нанометрового технологического процесса c использованием принципиально новых материалов high-k (материалов с высоким значением диэлектрической постоянной) для изготовления подзатворного диэлектрика транзистора, а также новых материалов для самого затвора.

Данное семейство объединяет в себе как двухъядерные процессоры для мобильных систем (ноутбуков), так и четырех- и двухъядерные процессоры для настольных систем, а также процессоры для серверов и рабочих станций. Собственно, это и создает некоторую путаницу, поскольку и семейство мобильных процессоров, и семейство процессоров для настольных систем, и семейство процессоров для серверов имеют собственные кодовые названия, причем под кодовым наименованием Penryn понимают как все семейства процессоров, производимых по 45-нм техпроцессу, так и только семейство мобильных процессоров.

Поэтому, на наш взгляд, более корректно говорить не о семействе процессоров Penryn вообще, а о конкретных семействах процессоров на основе микроархитектуры Enhanced Intel Core Microarchitecture.

Итак, на основе микроархитектуры Enhanced Intel Core Microarchitecture будут производиться следующие семейства процессоров:

  • Penryn — семейство мобильных двухъядерных процессоров серий Intel Core 2 Extreme и Intel Core 2 Duo с кэшем L2 до 6 Мбайт. Процессоры станут доступны в I квартале 2008 года;
  • Yorkfield — семейство десктопных четырехъядерных процессоров серий Intel Core 2 Extreme и Intel Core 2 Quad с кэшем L2 до 12 Мбайт. Они будут выпускаться с TDP 95 Вт (Intel Core 2 Quad) и 130 Вт (Intel Core 2 Extreme). Серия процессоров Intel Core 2 Extreme уже доступна с 12 ноября 2007 года, а серия процессоров Intel Core 2 Quad станет доступна в I квартале 2008 года;
  • Wolfdale — семейство десктопных двухъядерных процессоров серии Intel Core 2 Duo с кэшем L2 до 6 Мбайт. Будут выпускаться с TDP 65 Вт. Станут доступны в I квартале 2008 года;
  • Hapertown — семейство серверных четырехъядерных процессоров серии Intel Xeon с кэшем L2 12 Мбайт. Будут выпускаться с TDP 120, 80 и 50 Вт. Процессоры станут доступны до конца 2007 года;
  • Wolfdale-DP — семейство серверных двухъядерных процессоров серии Intel Xeon DP с кэшем L2 6 Мбайт для двухпроцессорных серверов. Будут выпускаться с TDP 80, 65 и 40 Вт. Процессоры станут доступны до конца 2007 года;
  • Dunnington — семейство серверных процессоров серии Intel Xeon MP для многопроцессорных серверов. Совместимы по разъему с процессорами серии Intel Xeon 7300. Станут доступны со второй половины 2008 года.

Все семейства процессоров на основе микроархитектуры Enhanced Intel Core Microarchitecture (Penryn, Yorkfield, Wolfdale, Hapertown, Wolfdale-DP и Dunnington) будут производиться по новому, 45-нм технологическому процессу с применением сухой 193-нм литографии (DUV-литография).

Что касается процессорной микроархитектуры, лежащей в основе процессоров семейства Penryn, то первоначально это будет усовершенствованная микроархитектура Intel Core, получившая название Enhanced Intel Core Microarchitecture.

Среди ее особенностей:

  • новая технология Fast Radix-16 Divider;
  • улучшенная технология виртуализации;
  • увеличенный размер кэша L2 и повышенный уровень ассоциативности кэш-памяти;
  • улучшенная технология Intel Smart Memory Access;
  • поддержка набора инструкций SSE4;
  • механизм суперперестановок (Super Shuffle Engine);
  • новая технология управления энергопотреблением Deep Power Down Technology;
  • новая технология Enhanced Intel Dynamic Acceleration Technology.

Технология Fast Radix-16 Divider — это новый метод выполнения деления, который обеспечивает ускорение работы делителя примерно вдвое по сравнению с процессорами предыдущих поколений.

Улучшенная технология Intel Virtualization Technology сокращает время переключения виртуальных машин в среднем на 25-75%.

Новый набор инструкций SSE4 ориентирован на обработку графики, кодирование и обработку видео, синтез трехмерных изображений, а также на игровые приложения. В него вошли 47 дополнительных инструкций.

Еще одна новая технология, применяемая в процессорах семейства Penryn, — это механизм суперперестановок Super Shuffle Engine. Благодаря реализации однопроходного 128-разрядного модуля перестановок, процессоры Penryn могут выполнять перестановки значений сразу во всем 128-разрядном регистре за один такт. Это существенно повышает производительность при выполнении инструкций из наборов SSE2, SSE3 и SSE4, которые содержат такие операции, связанные с перестановкой, как упаковка, распаковка и сдвиг упакованных значений. Данная функция позволяет повысить производительность при создании контента, обработке изображений и видео, а также при высокопроизводительных вычислениях.

В новых процессорах увеличен размер L2-кэша. В двухъядерном процессоре Penryn он вырос до 6 Мбайт (по 3 Мбайт на каждое ядро процессора), а в четырехъядерном — до 12 Мбайт (по 3 Мбайт на каждое ядро процессора).

Кроме размера кэша L2, увеличен и уровень ассоциативности кэш-памяти, что, как ожидается, еще больше ускорит работу и обеспечит максимальное использование ресурсов кэш-памяти.

Следующее нововведение — это технология Enhanced Intel Dynamic Acceleration Technology (улучшенная технология динамического ускорения), смысл которой заключается в следующем. В многоядерных процессорах в том случае, когда нагружено только одно ядро, а другое находится в состоянии простоя (состояния C3 — C6) с низким энергопотреблением, динамически повышается тактовая частота нагруженного ядра. Повышение тактовой частоты одного ядра реализуется таким образом, чтобы энергопотребление процессора становилось меньше его энергопотребления в состоянии, когда оба ядра работают на номинальной частоте.

Мобильный процессор семейства Penryn оснащен новым режимом работы с усовершенствованными функциями управления энергопотреблением — Deep Power Down Technology, позволяющими существенно сократить энергопотребление процессора в моменты его простоя за счет снижения влияния токов утечки внутри транзисторов. Эта технология, способствующая продлению срока автономной работы ноутбука от батарей, является важнейшим усовершенствованием мобильных процессоров Intel.

Ну и последняя особенность новых процессоров — это более высокая частота FSB. Так, в двухъядерном (Penryn и Wolfdale) и четырехъядерном (Yorkfield) процессорах частота FSB составит 1333 МГц.

Если говорить об основных отличиях четырехъядерного процессора (Yorkfield) от двухъядерного (Wolfdale), то в конструктивном плане четырехъядерный процессор Yorkfield представляет собой два двухъядерных процессора Wolfdale, совмещенных в одном процессорном корпусе.

Методика тестирования

Подробно общие принципы проведения тестирования под управлением операционной системы Windows Vista Ultimate 32-bit мы рассмотрели в статье «Windows Vista против Windows XP: кто быстрее?», опубликованной в октябрьском номере журнала, обосновав необходимость и последовательность всех производимых настроек и операций. Дабы не повторяться лишний раз, здесь мы только вкратце напомним основные моменты методики тестирования.

Тестирование проводилось под управлением операционной системы Windows Vista Ultimate 32-bit (английская версия).

Основная идея, положенная в основу разработанной нами методики тестирования, заключается в том, чтобы учесть особенности операционной системы Windows Vista по динамической самонастройке, то есть динамической подстройке системы под различные сценарии использования приложений, и обеспечить при этом повторяемость результатов.

Итак, наша методика тестирования предполагает три этапа: подготовка, обучение и получение результатов.

Этап подготовки заключается в установке операционной системы, всех драйверов и обновлений, а также необходимых бенчмарков и приложений. На этапе обучения системы производится сбор и анализ необходимых для самонастройки операционной системы данных, а на этапе получения результатов тестирования — собственно тестирование системы.

Последовательность тестирования в данном случае следующая.

Этап подготовки

  1. Устанавливается операционная система.
  2. Устанавливаются все необходимые драйверы и обновления операционной системы.
  3. Производится необходимая настройка операционной системы.
  4. Устанавливаются все необходимые бенчмарки и приложения, требуемые для проведения тестирования.

Этап обучения

  1. Производится очистка папок %SystemRoot%\Prefetch и %SystemRoot%\Prefetch\ReadyBoot в Windows Vista.
  2. Осуществляется трехкратная перезагрузка операционной системы с выдерживанием двухминутной паузы после каждой перезагрузки.
  3. Запускается тест.
  4. По окончании теста выдерживается двухминутная пауза.
  5. Выполняется команда Rundll32,exe advapi32, dll,ProcessIdleTasks.
  6. Производится дефрагментация жесткого диска.

Этап тестирования

  1. Каждый тест запускается пять раз с перезагрузкой компьютера после каждого прогона теста и выдерживанием двухминутной паузы после перезагрузки.
  2. По результатам пяти прогонов теста рассчитываются средний арифметический результат и среднеквадратичное отклонение.

Настройка операционной системы Windows Vista на этапе подготовки заключалась в следующем:

  • отключалась функция User Account Control (UAC);
  • отключалось отображение панели Windows Sidebar;
  • отключалась функция Screen Saver;
  • отключалась функция восстановления системы (System Protection);
  • отключалась возможность дефрагментации по расписанию;
  • отключалась служба Windows Defender;
  • отключался встроенный Windows Firewall;
  • отключалась функция автоматического обновления системы (Automatic Updates);
  • блокировалась служба Security Center;
  • отключалось отображение панели задач поверх других окон;
  • отключалась функция удаленного управления (Remote Desktop);
  • производилось включение всех визуальных эффектов рабочего стола (Adjust for best appearance);
  • блокировалась возможность отключения монитора и жестких дисков, а также возможность ухода системы в режим Sleep.

В описанной выше процедуре проведения тестирования в комментариях нуждается, пожалуй, лишь этап обучения. Он начинается с очистки папок %SystemRoot%\Prefetch и %SystemRoot%\Prefetch\ReadyBoot. В них содержатся данные, используемые для оптимизации размещения файлов на жестком диске и упреждающей загрузки данных в оперативную память. На этапе обучения системы необходимо очистить содержимое этих папок, чтобы начать сбор нужной информации для оптимизации с нуля.

Трехкратная перезагрузка операционной системы производится для того, чтобы дать возможность собрать необходимую для оптимизации операционной системы информацию.

Запуск теста на этапе обучения необходим для того, чтобы опять-таки дать возможность операционной системе оптимизировать на жестком диске размещение файлов данных и приложений, а также накопить информацию, необходимую для упреждающего чтения данных. Отметим, что результаты теста, полученные на этапе обучения, не являются показательными и не учитываются при обработке результатов тестирования.

Команда Rundll32,exe advapi32,dll,ProcessIdleTasks выполняется для того, чтобы принудительно завершить все фоновые процессы оптимизации, производимые операционной системой.

По завершении выполнения команды Rundll32,exe advapi32,dll,ProcessIdleTasks будет произведена оптимизация размещения файлов на жестком диске на основе накопленной информации.

Важно отметить, что если при тестировании применяется не один, а несколько бенчмарков, то использование каждого нового бенчмарка необходимо вновь начинать с этапа обучения.

Как видите, описанная методика тестирования довольно кропотлива, и если для тестирования используется не один, а несколько бенчмарков, то она будет под силу разве что женщине — мужского терпения просто не хватит. К примеру, в нашем тестировании мы применяли более десяти различных тестов и общее время тестирования только одного процессора занимало более 16 часов. Поэтому единственный способ реализовать описанную выше методику заключается в том, чтобы полностью автоматизировать процесс тестирования. Собственно, именно это и было сделано: мы написали специальный скрипт, который полностью автоматизировал весь процесс тестирования. Он последовательно запускал все необходимые тесты, выполнял этап подготовки системы и перезагружал компьютер, выдерживал необходимые паузы и т,д,, то есть действовал по принципу «вечером запустил — утром получил результаты». Конечно, на написание этого скрипта и его отладку ушло более месяца кропотливой работы, но… это того стоило! Во-первых, скрипт полностью исключил человеческий фактор, то есть возможность появления ошибки в ходе тестирования, а во-вторых, тестирование всех процессоров проводилось по абсолютно одинаковой схеме, что немаловажно.

Используемые бенчмарки и приложения

Итак, после изложения общих принципов разработанной нами методики тестирования нам осталось лишь назвать тесты и приложения, которые использовались для тестирования:

  • Futuremark 3DMark06 v.1.1.0;
  • Futuremark PCMark05 v. 1.2.0;
  • Lame 4,0 Beta;
  • WinRAR 3,71;
  • Windows Media Encoder 9.0;
  • DivX Converter 6.5;
  • DivX Codec 6.7;
  • DivX Player 6.6;
  • Adobe Photoshop CS3;
  • Microsoft Excel 2007.

Тест Futuremark 3DMark06 v.1.1.0 запускался при отключенных функциях антиалиасинга (Anti-Aliasing: None) и режима фильтрации Optimal (Filtering: Optimal) при разрешениеи экрана 640Ѕ480, 800Ѕ600, 1024Ѕ768, 1280Ѕ1024 и 1600Ѕ1200. Естественно, для каждого разрешения экрана тест запускался пять раз.

В настройках теста Futuremark PCMark05 v. 1.2.0 выбирались подтесты System Test Suite, CPU Test Suite, Memory Test Suite, Graphics Test Suite и HDD Test Suite.

Приложение Lame 4.0 Beta использовалось для определения производительности при конвертировании аудиофайлов из формата WAV в формат MP3. Исходный WAV-файл имел размер 619 Мбайт, а кодирование осуществлялось с битрейтом 192 Кбит/с. Результатом теста являлось время конвертирования — чем оно меньше, тем выше производительность процессора.

Для перекодирования аудиофайла из формата WAV в формат MP3 мы также создали на основе приложения Lame 4,0 Beta полусинтетический многопотоковый тест. С его помощью мы хотели один и тот же WAV-файл одновременно, в четыре потока переконвертировать в четыре MP3-файла с разными именами. Такая задача абсурдна с точки зрения пользователя, поскольку в ней нет никакой практической значимости. Именно поэтому мы и называем данный тест полусинтетическим, хотя он реализован на базе реального приложения. Казалось бы, более целесообразно взять четыре отдельных WAV-файла (пусть даже и одинаковые, но с разными именами) и одновременно, в четыре потока переконвертировать их в четыре отдельных MP3-файла. Собственно, в плане практического применения эта задача куда более реалистичная. Однако в данном случае есть одна тонкость. Дело в том, что при одновременном перекодировании четырех WAV-файлов в четыре MP3-файла узким местом в системе будет не процессор, а жесткий диск. Даже слабый процессор (не говоря уже о современных четырехъядерных процессорах) окажется в таком случае недозагружен, поскольку каждому процессу конвертирования будут требоваться различные данные, считываемые с жесткого диска, и диск просто не будет успевать обрабатывать запросы процессора. Если же речь идет о конвертировании одного WAV-файла в четыре отдельных MP3-файла, то каждый процесс будет использовать одни и те же данные. Соответственно в данном случае жесткий диск уже не будет узким местом и время выполнения задачи будет определяться возможностями процессора. Ну а поскольку мы пытались измерить именно производительность процессора, то применение такого многопоточного теста вполне обоснованно.

Приложение WinRAR 3.71 использовалось для определения производительности при архивировании большого массива данных. В качестве тестового задания для архивирования служила директория размером 548 Мбайт, содержащая 743 файла. Результатом теста являлось время архивирования — чем оно меньше, тем выше производительность процессора.

На основе приложения WinRAR 3.71 мы тоже создали многопоточный тест, смысл которого заключался в том, чтобы один и тот же массив данных одновременно, в четыре потока заархивировать в четыре RAR-файла с разными именами. Использование одного и того же массива данных для одновременного архивирования в четыре RAR-файла с разными именами объясняется в данном случае точно так же, как и в случае с приложением Lame 4,0 Beta. Такой подход позволяет максимально загрузить процессор и не упираться в возможности жесткого диска.

Приложение Windows Media Encoder 9.0 применялось для определения производительности процессора при конвертировании видеофайла размером 150 Мбайт, записанного в формате WMV, в видеофайл с меньшими разрешением и видеобитрейтом. Исходный файл имел разрешение 1440Ѕ1080 и видеобитрейт 8000 Кбит/с, а результирующий — разрешение 320Ѕ240 и видеобитрейт 282 Кбит/с.

Приложение DivX Converter 6.5 с кодеком DivX Codec 6.7 использовалось для определения производительности процессора при конвертировании исходного видеофайла размером 150 Мбайт, записанного в формате WMV и имеющего разрешение 1440Ѕ1080 и видеобитрейт 8000 Кбит/с, в видеофайл формата DivX с разрешением 720Ѕ540 и видеобитрейтом 4854 Кбит/с (предустановка Ноme Theater в приложении DivX Converter 6.5).

Приложение DivX Player 6.6 применялось в паре с приложением Windows Media Encoder 9.0 для создания многозадачного теста. Смысл этого теста заключался в том, чтобы на фоне проигрывания видеофайла с разрешением 1440Ѕ1080 и битрейтом 8000 Кбит/с с использованием приложения DivX Player 6.6 запустить процесс конвертирования этого же видеофайла с помощью приложения Windows Media Encoder 9.0. Результирующий файл имел разрешение 320Ѕ240 и видеобитрейт 282 Кбит/с. Результатом теста являлось время конвертирования видеофайла.

Еще один многозадачный тест заключался в том, чтобы проигрывать видеофайл при помощи приложения DivX Player 6.6 и одновременно с этим реализовать конвертирование этого же видеофайла с использованием приложения Windows Media Encoder 9.0, конвертирование аудиофайла из формата WAV в формат MP3 посредством приложения Lame 4.0 Beta и архивирование большого массива данных с применением архиватора WinRAR 3.71. То есть в данном тесте мы реализовали одновременное выполнение большинства тех тестов, которые ранее производились по отдельности.

Приложение Adobe Photoshop CS3 использовалось нами для определения производительности процессора при обработке цифровых фотографий. Вообще, нужно отметить, что ресурсоемких фильтров, входящих в состав Adobe Photoshop CS3, не так уж много — большинство типичных операций, с которыми приходится сталкиваться при обработке цифровых фотографий, требует ничтожно малого времени. Кроме того, как выяснилось, далеко не все те фильтры, которые действительно загружают процессор и выполняются в течение долгого времени, являются многопоточными, то есть способны загрузить несколько ядер процессора.

Конечно же, выбирать для теста только ресурсоемкие фильтры, которые загружают все ядра процессора, не вполне объективно. Поэтому мы решили разбить наш тест с приложением Adobe Photoshop CS3 на два подтеста. В первом подтесте мы последовательно применяли различные ресурсоемкие фильтры к одной и той же фотографии, имитируя при этом процесс художественной обработки фотографии. Всего использовалось десять фильтров: Radial Blur (Spin), Radial Blur (Zoom), Shape Blur, Smart Blur, Surface Blur, Twirl, Polar Coordinates, Spherize, ZigZag, Filter Gallery (Colored Pencil). Отметим, что такие фильтры, как Smart Blur и Filter Gallery (Colored Pencil), являются однопоточными и даже в случае применения четырехъядерных процессоров позволяют загрузить лишь одно ядро.

Результатом данного теста являлось время последовательного выполнения всех фильтров, включая время открытия файла и время его сохранения в формате TIF.

В следующем подтесте с приложением Adobe Photoshop CS3 имитировалась пакетная обработка большого количества фотографий. Обработка каждой фотографии не отнимает много времени и включает типичные операции, как-то: открытие файла, дублирование слоя, наложение слоев, объединение слоев, изменение размера фотографии и сохранение результатов в формате TIF. Все эти типичные операции являются однопоточными и не позволяют выявить преимущества многоядерной архитектуры. Однако именно с этими простейшими операциями и приходится, как правило, сталкиваться при редактировании фотографий, а потому этот тест хоть и не позволяет выявить преимущества многоядерной архитектуры, но более актуален. Всего в тесте проводилась пакетная обработка 50 фотографий, сделанных 10-мегапиксельной камерой. Результатом данного теста являлось время пакетной обработки всех фотографий. Отметим, что результат этого теста, то есть время пакетной обработки фотографий, зависит не только и даже не столько от производительности процессора, сколько от производительности всей системы в целом, включая и производительность жесткого диска, и производительность и объем оперативной памяти.

Приложение Microsoft Excel 2007 применялось для определения производительности процессора при выполнении вычислений в электронных таблицах Excel. Важно отметить, что данный тест никоим образом не отражает возможности процессора при выполнении типичных офисных задач. Вообще, найти типичную офисную задачу, с которой бы современный процессор плохо справлялся, практически невозможно  — работа с электронными таблицами Excel не является ресурсоемкой. Поэтому мы применили абсолютно нетипичную офисную задачу, которая позволила оценить вычислительные возможности процессора. Она представляла собой макрос по пересчету электронных таблиц, написанный на языке VBA.

Мы использовали две задачи в приложении Excel. Первая заключалась в пересчете электронной таблицы размером 6,2 Мбайт, включающей 28 тыс. записей с использованием таких математических операций, как сложение, вычитание, деление, округление и вычисление квадратного корня. Кроме того, применялись операции статистического анализа, такие как нахождение максимального и минимального значений, среднего значения и т.п. Вторая задача состояла в имитации метода Монте-Карло для вероятностной оценки экономического риска. Имитационное моделирование по методу Монте-Карло позволяет построить математическую модель для проекта с неопределенными значениями параметров и, зная вероятностные распределения параметров проекта, а также связь между изменениями параметров, получить распределение его доходности. В данном тесте использовалось 300 тыс. итераций, а таблица Excel с исходными данными имела размер 70,1 Мбайт.

Стенд для проведения тестирования

Для проведения сравнительного тестирования процессоров мы собрали стенд следующей конфигурации:

  • системная плата — Gigabyte GA-P35T-DQ6;
  • версия BIOS — F5c;
  • чипсет системной платы — Intel P35 (Bearlake);
  • тип памяти — DDR3 (Patriot PDC32F 1866LLK (PC3-1866));
  • объем памяти — 2 Гбайт (два модуля емкостью по 1024 Мбайт, двухканальный режим работы);
  • видеокарта — ATI Radeon HD 2900 XT (512 Мбайт видеопамяти);
  • жесткий диск — Seagate Barracuda ST3120827AS (120 Гбайт, 7200 RPM, SATA).

В соответствии со спецификацией память Patriot PDC32F 1866LLK (PC3-1866), которую мы использовали в ходе тестирования, поддерживает максимальную частоту 1866 МГц при таймингах 8-8-8-20 и напряжении питания 1,9 В. Однако, дабы обеспечить стабильность в работе и сымитировать стандартную ситуацию, при использовании процессоров с FSB 1333 МГц память работала в режиме DDR3-1333, то есть с эффективной частотой 1333 МГц при напряжении питания 1,9 В. В случае применения процессоров с FSB 1066 МГц память работала в режиме DDR3-1066, а при использовании процессоров с FSB 800 МГц — в режиме DDR3-800. Во всех режимах работы памяти устанавливались одинаковые тайминги:

  • CAS Latency (CL)  7T;
  • RAS to CAS Delay (tRCD) 7T;
  • RAS Precharge (tRP) 7T;
  • Precharge Delay (tRAS) 20T;
  • ACT to ACT Delay (tRRD) 4T;
  • Rank Write To Read Delay 4T;
  • Write to Precharge Delay 8T;
  • Refresh to ACT Delay 48T;
  • Read to Precharge Delay 4T;
  • Static tRead Value 5T.

Все процессоры тестировались на одном и том же стенде без изменения его конфигурации. Характеристики процессоров представлены в табл. 1.

Результаты тестирования

Итак, мы подошли к самому главному — к результатам сравнительного тестирования процессоров. Они представлены в табл. 2, а также на рисунках.

 

Результаты сравнительного тестирования процессоров в тесте 3DMark06 (3DMark Score)

Результаты сравнительного тестирования процессоров в тесте 3DMark06 (CPU Score)

Результаты сравнительного тестирования процессоров в тесте
PCMark05 (PCMark Score)

Результаты сравнительного тестирования процессоров в приложении
Lame 4.0 Beta

Результаты сравнительного тестирования процессоров в приложении
WinRAR 3.71

Результаты сравнительного тестирования процессоров в приложении
DivX Converter 6.5

Результаты сравнительного тестирования процессоров в приложении
Windows Media Encoder 9.0

Результаты сравнительного тестирования процессоров в многозадачном тесте
(WME 9.0 + DivX Player 6.6)

Результаты сравнительного тестирования процессоров в многозадачном тесте
(WME 9.0 + DivX Player 6.6+ WinRAR 3.71+ Lame 4.0 Beta)

Результаты сравнительного тестирования процессоров в приложении
Adobe Photoshop CS3

Результаты сравнительного тестирования процессоров в приложении
Microsoft Excel 2007

Как видите, мы постарались протестировать не только топовый процессор Intel Core 2 Extreme QX9650, но и вообще все процессоры Intel, которые сумели найти в нашей тестовой лаборатории. Собственно, это позволило нам провести уникальное сравнение процессоров Intel различных поколений и выяснить, как изменилась производительность процессоров за несколько лет. В нашем тестировании принимали участие и четырехъядерные процессоры (Intel Core 2 Extreme QX9650, Intel Core 2 Extreme QX6850, Intel Core 2 Extreme QX6700, Intel Core 2 Quad Q6600), и двухъядерные процессоры с микроархитектурой Intel Core (Intel Core 2 Duo E6700, E6600, E6420, E6320), и двухъядерный процессор с микроархитектурой NetBurst (Intel Pentium D 820), и даже одноядерные процессоры с поддержкой технологии Hyper-Threading (Intel Pentium 4 Extreme Edition 3,73 ГГц, Intel Pentium 4 670). Всего было протестировано 12 процессоров Intel. Если учесть, что процессоры Intel Pentium 4 Extreme Edition 3,73 ГГц и Intel Pentium 4 670 появились в начале 2005 года, то наше тестирование позволяет оценить, как изменилась производительность процессоров за последние три года.

Результаты достаточно красноречивы и вряд ли нуждаются в комментариях. Поэтому давайте сформулируем основные выводы.

Итак, если результаты процессора трехлетней давности Intel Pentium 4 670 принять за единичные и сравнить с ними результаты процессора Intel Core 2 Extreme QX9650, то получится следующая картина.

В тесте 3DMark06 (CPU Score) производительность процессора Intel Core 2 Extreme QX9650 превышает производительность процессора Intel Pentium 4 670 более чем в 4 раза при любом разрешении.

В тесте PCMark05 (CPU Score) производительность процессора Intel Core 2 Extreme QX9650 превышает производительность процессора Intel Pentium 4 670 более чем в 2 раза.

Скорость аудиокодирования с использованием приложения Lame 4.0 Beta для процессора Intel Core 2 Extreme QX9650 выше в 1,5 раза по сравнению с процессором Intel Pentium 4 670, а применение четырехпоточного кодирования позволяет достичь прироста скорости уже в 3,6 раза.

Скорость архивирования с помощью приложения WinRAR 3.71 для процессора Intel Core 2 Extreme QX9650 выше в 2,5 раза в сравнении с процессором Intel Pentium 4 670, а при использовании четырехпоточного архивирования она возрастает в 3,5 раза.

При использовании процессора Intel Core 2 Extreme QX9650 скорость конвертирования видеофайлов посредством кодека DivX Codec 6.7 возросла в 2 раза, а с помощью Windows Media Encoder 9.0 — в 2,7 раза.

В многозадачных тестах прирост производительности (время выполнения задачи) для процессора Intel Core 2 Extreme QX9650 в сравнении с процессором Intel Pentium 4 670 еще более впечатляющий. Так, скорость конвертирования видеофайлов на фоне проигрывания видеоролика увеличилась в 3,5 раза, а при одновременном с этим выполнении задач архивирования и аудиокодирования — в 5,2 раза.

Скорость применения последовательности фильтров в Adobe Photoshop CS3 выше в 3 раза для процессора Intel Core 2 Extreme QX9650 в сравнении с процессором Intel Pentium 4 670, а скорость пакетной обработки фотографий — в 1,5 раза.

Но самый высокий прирост производительности процессора Intel Core 2 Extreme QX9650 в сравнении с процессором Intel Pentium 4 670 наблюдается в расчетных задачах в приложении Excel 2007. Скорость пересчета листа возросла в 8,8 раза, а скорость выполнения метода Монте-Карло — в 8 раз.

Дабы иметь возможность сравнить производительность процессоров не на отдельных приложениях, а интегрально, то есть на наборе приложений, мы использовали понятие интегральной производительности процессора. Никакой единой и общепризнанной методики расчета интегрального показателя производительности не существует — каждый волен поступать как ему угодно. В конечном счете понятие интегральной производительности весьма абстрактно и его трудно наделить конкретным физическим смыслом.

На наш взгляд, интегральный показатель производительности процессора должен отражать усредненный по всему набору используемых для тестирования приложений прирост производительности процессора. Поэтому под интегральным показателем производительности процессора мы понимали средний прирост его производительности по всем приложениям в сравнении с эталонным процессором, результаты которого принимались равными единице.

Процедура расчета интегрального показателя производительности процессора следующая. Первоначально все полученные результаты нормируются на результаты эталонного процессора (в качестве эталонного процессора выступал процессор Intel Pentium 4 670). Далее вычисляется среднее геометрическое всех нормированных результатов. При его расчете в тесте 3DMark06 учитывался только результат CPU Score для каждого разрешения. Аналогично в тесте PCMark05 учитывался только результат CPU Score. Полученный таким образом результат и представлял собой интегральный показатель производительности процессора, который можно ассоциировать с усредненным приростом производительности в сравнении с производительностью процессора Intel Pentium  670.

Итак, интегральный показатель производительности для процессора Intel Core 2 Extreme QX9650 составляет 3,32. То есть производительность процессора Intel Core 2 Extreme QX9650 в среднем в 3,32 раза выше производительности процессора Intel Pentium 4 670.

Отметим также, что интегральная производительность процессора Intel Core 2 Extreme QX6850 равна 3,18, и если сравнивать интегральную производительность процессоров Intel Core 2 Extreme QX9650 и QX6850, то разница между ними будет невелика — всего 4%, то есть процессор Intel Core 2 Extreme QX9650 производительнее процессора Intel Core 2 Extreme QX6850 всего в 1,04 раза. Конечно, заметить такую разницу на глаз просто нереально, а потому можно констатировать, что новое поколение процессоров Intel (Yorkfield) не дало ощутимого прироста производительности в сравнении с процессорами предыдущего поколения (Kentsfield).

Однако в целом за последние три года производительность процессоров Intel увеличилась более чем в три раза!

 

В начало В начало

КомпьютерПресс 12'2007

Наш канал на Youtube

1999 1 2 3 4 5 6 7 8 9 10 11 12
2000 1 2 3 4 5 6 7 8 9 10 11 12
2001 1 2 3 4 5 6 7 8 9 10 11 12
2002 1 2 3 4 5 6 7 8 9 10 11 12
2003 1 2 3 4 5 6 7 8 9 10 11 12
2004 1 2 3 4 5 6 7 8 9 10 11 12
2005 1 2 3 4 5 6 7 8 9 10 11 12
2006 1 2 3 4 5 6 7 8 9 10 11 12
2007 1 2 3 4 5 6 7 8 9 10 11 12
2008 1 2 3 4 5 6 7 8 9 10 11 12
2009 1 2 3 4 5 6 7 8 9 10 11 12
2010 1 2 3 4 5 6 7 8 9 10 11 12
2011 1 2 3 4 5 6 7 8 9 10 11 12
2012 1 2 3 4 5 6 7 8 9 10 11 12
2013 1 2 3 4 5 6 7 8 9 10 11 12
Популярные статьи
КомпьютерПресс использует