Процессор Intel Pentium 4 2,4 B ГГц
Только в прошлом номере КомпьютерПресс мы познакомили наших читателей с новым процессором Intel Pentium 4 2,4 ГГц, и вот новое событие, которое мы не могли обойти стороной, — компания Intel объявила о выпуске процессора Intel Pentium 4 2,4 B ГГц.
ля того чтобы дать возможность отличить по названию новый процессор с тактовой частотой 2,4 ГГц от его предшественника с той же тактовой частотой, к названию добавлена буква «B». Напомним, что приблизительно аналогичная ситуация имела место и при появлении процессора Intel Pentium 4 2 B ГГц с ядром Northwood. Чтобы его можно было отличить от процессора с той же тактовой частотой, но с ядром Willamette, в название включили букву «A».
Подобно предшественникам Pentium 4 2 A ГГц, Pentium 4 2,2 ГГц и Pentium 4 2,4 ГГц, новый процессор построен на ядре Northwood (0,13-микронная технология) и имеет кэш второго уровня размером 512 Кбайт. Внешне этот процессор ничем не отличается от предыдущих — все тот же корпус FC-PGA2 (Flip-Chip Pin Grid Array) и формфактор mPGA-478. А вот внутренних различий куда больше. Новый процессор рассчитан на частоту системной шины 533 МГц. Эта шина, называемая также Quad Pumped Bus, связывает процессор с северным мостом чипсета (контроллером памяти) и позволяет благодаря особой организации на физическом уровне передавать четыре пакета данных за один такт FSB-шины с частотой 133 МГц. Таким образом, эта 64-битная шина имеет пиковую пропускную способность 4,26 Гбайт/с, а не 3,2 Гбайт/с, как в предыдущих моделях.
Итак, основное отличие нового процессора — это изменение интерфейса согласования с системной шиной. Естественно, что для реализации поддержки системной шины с частотой 533 МГц потребовалась и новая модификация чипсета. В случае использования памяти RDRAM — это i850E. Как и все последние чипсеты от компании Intel, i850 построен на основе хаб-архитектуры и включает контроллер-концентратор памяти (Memory Controller Hub, MCH) и контроллер-концентратор ввода-вывода (I/O Controller Hub) ICH2.
«Общение» контроллера-концентратора памяти с процессором осуществляется по 533-мегагерцевой 64-битной шине, c пропускной способностью 4,26 Гбайт/с. А вот общение контроллера с двухканальной памятью RDRAM PC800 пока не претерпело изменений. Шина памяти, как и прежде, работает на частоте 400 МГц и имеет пропускную способность 3,2 Гбайт/с.
Конечно, при этом наблюдается некий дисбаланс между пропускной способностью памяти и процессора, но даже в этом случае, как будет показано ниже, системе обеспечивается довольно неплохой прирост производительности по сравнению с 400-мегагерцевой системной шиной при той же частоте процессора.
Кроме того, следует иметь в виду, что в скором времени на рынке появится новый тип двухканальной RDRAM-памяти PC1066, поддерживающей частоту шины 533 МГц и имеющей пропускную способность 4,26 Гбайт/с.
Скорее всего, сам чипсет i850E будет поддерживать и шину памяти с частотой 533 МГц (во всяком случае, никаких технических препятствий к этому нет, хотя сама компания Intel не объявляла о поддержке новой памяти). В этом случае появляется потенциальная возможность создавать сбалансированные высокопроизводительные решения. Однако на момент тестирования в нашем распоряжении отсутствовала память RDRAM, поддерживающая частоту 533 МГц, поэтому мы не имели возможности проверить поддержку частоты памяти в 533 МГц чипсетом i850E.
Для работы с графической подсистемой Memory Controller Hub поддерживает шину с интерфейсом AGP 4x, обеспечивающую пропускную способность чуть более 1 Гбайт/с.
Контроллер-концентратор ввода-вывода (ICH2) знаком нашим читателям еще со времен чипсета i815, поэтому мы ограничимся лишь кратким перечислением его функциональных возможностей: два USB-контроллера (четыре канала с пропускной способностью до 24 Мбит/с), двухканальный ATA/100-контроллер, шестиканальный звуковой контроллер AC’97, поддержка CNR/AMR-слота. Взаимодействие между контроллерами осуществляется по специальной шине, имеющей пропускную способность 266 Мбайт/с.
Для того чтобы на практике оценить все преимущества нового процессора в случае использования более высокочастотной системной шины, мы протестировали его, задействовав следующую конфигурацию тестового стенда:
- материнская плата Intel D850MV;
- жесткий диск IBM IC35L080AVVA07-0 с файловой системой NTFS;
- 512 Мбайт оперативной памяти RDRAM PC800-45 (Samsung);
- видеокарта Gigabyte GF3200TF (GeForce 3 Ti 200, 64 Мбайт).
Кроме того, использовалось следующее программное обеспечение:
- операционная система Windows XP Professional (English);
- видеодрайвер nVIDIA detonator v. 28.32 (разрешение 1024Ѕ768, глубина цвета 32 bit,Vsync — откл.);
- Intel Application Accelerator v 2.2;
- Intel® Chipset Software Installation Utility, v 3.20.1008.
Для тестирования мы отобрали следующие программы:
- SYSmark 2002 Internet Contenet Creation;
- SYSmark 2002 Office Productivity;
- Ziff Davis Business Winstone 2001;
- Ziff Davis Content Creation 2002;
- RazorLame 1.1.5+Lame 3.92;
- VirtualDub 1.4.10+DIVx 5.0.1 Pro;
- WinAce v2.11;
- WinZip 8.1;
- CPU RightMark;
- MadOnion 3DMark 2001SE;
- MadOnion PCMark 2002;
- SPECviewPerf;
- SiSoft Sandra Pro v 2002.1.8.59.
Конечно, интерес представляют не столько абсолютные результаты тестирования (глядя на голые цифры, делать выводы довольно трудно), сколько результаты сравнения тестов для данного процессора с аналогичными результатами его предшественников. Именно поэтому мы попытались провести сравнительное тестирование сразу нескольких процессоров: Intel Pentium 4 2,4 B ГГц, Intel Pentium 4 2,4 ГГц, Intel Pentium 4 2,2 ГГц и Intel Pentium 4 2 ГГц. Особый интерес, на наш взгляд, представляют результаты сравнения процессоров Intel Pentium 4 2,4 B ГГц, Intel Pentium 4 2,4 ГГц, то есть с одной и той же частотой, но с разными частотами системной шины.
Учитывая возможность материнской платы Intel D850MV поддерживать частоту системной шины как 533, так и 400 МГц, мы использовали один и тот же стенд для тестирования всех четырех процессоров, что позволило более корректно сравнивать между собой тестируемые процессоры. Если бы, к примеру, для тестирования разных процессоров использовались различные материнские платы, то результаты тестирования, естественно, зависели бы не только от процессоров, но и от самих плат, то есть сравнение процессоров было бы не вполне корректным. Впрочем, достичь «идеальной» стендовой конфигурации нам также не удалось. Дело в том, что использовавшаяся нами плата при работе с процессором Intel Pentium 4 2,4 B ГГц имела частоту FSB 132,6 МГц, то есть чуть ниже, чем требуется. При коэффициенте умножения, равном 18, это приводило к частоте процессора 2386,6 Гц, то есть до обещанных 2,4 ГГц не хватало 13,4 МГц. При работе с процессором Intel Pentium 4 2,4 ГГц частота FSB составляла 99,7 МГц, соответственно при коэффициенте умножения 24 внутренняя частота процессора составляла уже 2392,7 МГц, то есть несколько выше, чем в предыдущем случае. Таким образом, процессор Intel Pentium 4 2,4 ГГц оказывался в несколько более выгодных условиях, чем процессор Intel Pentium 4 2,4 B.
Результаты тестирования всех четырех процессоров представлены в таблице.
Рассмотрим результаты тестирования более подробно. Начнем с традиционных тестов SYSmark 2002 Internet Contenet Creation и SYSmark 2002 Office Productivity. Прежде всего отметим, что эти тесты, эмулирующие работу пользователя с реальными приложениями, не являются «процессорными», а в большей степени позволяют определить производительность системы в целом. Однако если учесть, что изменялся не сам стенд, а только процессор, то данные результаты, точнее их изменение, можно напрямую связать с влиянием процессора на производительность системы.
При переходе от процессора Intel Pentium 4 2,4 ГГц к процессору Intel Pentium 4 2,4 B ГГц прирост производительности в тесте SYSmark 2002 Internet Contenet Creation составляет 5,8%, а в тесте SYSmark 2002 Office Productivity — 2,8%. При этом рост производительности при переходе от процессора Intel Pentium 4 2,2 ГГц к процессору Intel Pentium 4 2,4 ГГц составляет в тесте SYSmark 2002 Internet Contenet Creation всего 3,7%, а в тесте SYSmark 2002 Office Productivity — 4,1 %.
Другими традиционно используемыми тестами на определение общей производительности системы являются тесты Ziff Davis Business Winstone 2001 и Ziff Davis Content Creation 2002. К сожалению, высокая погрешность результатов не позволяет достаточно корректно оценить прирост производительности не только при переходе от 400-мегагерцевой шины на 533-мегагерцевую, но и при повышении тактовой частоты от 2,2 до 2,4 ГГц.
Кроме традиционных тестов на измерение общей производительности системы, для сравнения прироста производительности мы использовали отдельные программы, позволяющие оценить эффективность работы с аудио- и видеоданными.
Для оценки скорости конвертации wav-файла в mp3-формат использовался wav-файл с исходным размером 48,8 Мбайт и новый кодировщик Lame 3.92 с программной оболочкой RazorLame. Выяснилось, что переход от 400-мегагерцевой шины на 500-мегагерцевую обеспечивает выигрыш в скорости конвертации на 2,1%, в то время как увеличение тактовой частоты процессора с 2,2 до 2,4 ГГц приводит к росту производительности в 9,8%.
При конвертации avi-файла в формат MPEG-4 использовались видеофайл с исходным размером 1,31 Гбайт и новый кодировщик DIVx 5.0.1 Pro с программной оболочкой VirtualDub 1.4.10. Прирост по скорости конвертации для нового процессора по сравнению с Intel Pentium 4 2,4 ГГц составил 4,8%, а прирост при переходе с частоты 2,2 ГГц на частоту 2,4 ГГц при неизменной частоте системной шины — 6,1%.
Другим набором тестов, позволяющих оценить прирост производительности системы, являются популярные архиваторы. Мы использовали архиваторы WinAce v2.11 и WinZip 8.1. В качестве архивируемой директории была взята директория с общим размером 2,1 Гбайт, насчитывающая 12 109 различных по формату файлов. Оба архиватора были настроены на максимальную степень сжатия с размерами словарей по умолчанию (1024 K). Прирост в скорости архивирования для процессора Intel Pentium 4 2,4 B ГГц составил 4,75% по сравнению с процессором Intel Pentium 4 2,4 ГГц при использовании архиватора WinAce v2.11 и 1,3% — при использовании архиватора WinZip 8.1. При увеличении тактовой частоты от 2,2 до 2,4 ГГц с частотой системной шины 400 МГц прирост производительности составляет 2,9% для архиватора WinAce v2.11 и 9,2% для архиватора WinZip 8.1.
Прекрасная масштабируемость нового процессора проявилась и в тесте MadOnion 3DMark 2001SE. Прирост производительности при переходе на 533-мегагерцевую шину (при неизменной частоте процессора) составил 1,36%, что приблизительно соответствует приросту производительности при увеличении частоты процессора с 2,2 до 2,4 ГГц (при неизменной частоте системной шины), который составил 1,43%.
Графический тест SPECviewPerf не выявил однозначного преимущества нового процессора. Впрочем, результаты этого теста слабо зависят не только от частоты системной шины, но и от частоты процессора. Практически разброс результатов для всех типов процессоров определяется погрешностью измерений, поэтому можно говорить, что сам по себе процессор уже не является в данном тесте слабым местом. Результаты же теста в значительно большей степени зависят от типа используемой видеокарты.
Следующий тест, использовавшийся нами для тестирования процессоров, — это новый пакет MadOnion PCMark 2002. Данный тест хотя и не является полностью синтетическим, позволяет сконцентрироваться на тестировании именно процессора и оперативной памяти. При тестировании процессора выполняются такие типичные операции, как декодирование в Jpeg-формат, компрессия и декомпрессия файлов, поиск по тексту, конвертация аудиофайлов, а также расчет 3D-векторов. Как и следовало ожидать, в процессорных тестах никакого преимущества нового процессора выявлено не было, что и неудивительно. Эти результаты определяются тактовой частотой процессора (при той же архитектуре процессора) и не должны зависеть от частоты системной шины, связывающей процессор с контроллером CMH. Набор тестов на производительность памяти (всего таких тестов 25) в этом смысле более показателен. При чтении блоков памяти размером 6, 48 и 384 Кбайт роста производительности не наблюдается, поскольку в этом случае процессор общается с кэшем данных, а не с памятью. Однако при чтении больших по размеру блоков (1536 и 3072 K) наблюдается прирост производительности при переходе на 533-мегагерцевую шину. Аналогичный прирост производительности наблюдается и при произвольном доступе к памяти.
И наконец, последний тест, о котором хотелось бы рассказать, — новый тестовый пакет CPU RightMark. Особенно отрадно, что на этот раз речь идет не о тесте иностранного производства, а о качественном тестовом пакете, разработанном нашими соотечественниками.
Тест CPU RightMark предназначен для измерения производительности процессоров в таких вычислительных задачах, как решение системы дифференциальных уравнений, соответствующих моделируемым физическим процессам взаимодействия системы многих тел, и решение задач из области трехмерной графики.
Отличительной особенностью теста CPU RightMark является то, что результаты напрямую зависят от самого процессора, памяти и шины «память-процессор», тогда как влияние остальных компонентов системы сведено к минимуму. Это достигается за счет учета только времени работы процессора, а время работы выполнения «внешних» задач, таких как обращение к жесткому диску, переключение видеостраниц и др., не учитывается.
CPU RightMark содержит два программных блока, один из которых предназначен для расчета физической модели (то есть для решения системы дифференциальных уравнений), а другой отвечает за визуализацию (рендеринг) полученного решения, то есть за прорисовку сцены. У каждого блока есть разные варианты, оптимизированные под различные системы процессорных команд. Расчет физической модели возможен при помощи как набора команд SSE2 (процессор Intel Pentium 4), так и набора команд для FPU, поскольку при расчете используются числа типа double. Скорость работы этого блока отражает производительность процессора в связке с памятью при выполнении математических расчетов с использованием действительных чисел двойной точности.
Блок визуализации состоит из двух частей: блока предварительной обработки и блока отрисовки (рендеринга). Первый блок откомпилирован с использованием набора команд сопроцессора x87, а второй имеет несколько вариантов, оптимизированных под различные наборы инструкций: FPU+GeneralMMX, FPU+EnhancedMMX и SSE+EnhancedMMX. Скорость работы блока визуализации отражает производительность процессора и памяти при выполнении геометрических расчетов с использованием действительных чисел одинарной точности.
Отметим, что в тестовом приложении преимущественно выполняется эффективное предварительное кэширование данных, поэтому производительность памяти не оказывает существенного влияния на результаты. Это позволяет сконцентрироваться на определении непосредственно производительности процессоров без учета пропускной способности самой памяти.
Собственно, наше тестирование еще раз подтвердило, что результаты теста прежде всего определяются производительностью процессора и мало зависят от памяти. Выигрыш при переходе на 533-мегагерцевую шину, как и следовало ожидать, практически отсутствует. А вот при прорисовке сцены, что также понятно, наблюдается прирост производительности в 6,7%.
Итак, даже с учетом того, что при тестировании нового процессора мы использовали несколько несбалансированную систему — в том смысле, что пропускная способность памяти RDRAM PC800 была ниже пропускной способности самого процессора (процессор работал на частоте системной шины 533 МГц, а память имела частоту 400 МГц), — налицо явный прирост производительности. По сравнению с процессором Intel Pentium 4 2,4 МГц, имеющим такую же тактовую частоту, но поддерживающим системную шину 400 МГц, средний прирост производительности составляет порядка 4-5%; прирост производительности при решении задач конвертирования аудио- или видеофайлов — в среднем 3-4%.
Также наблюдается прирост производительности и в других приложениях, таких как архивирование данных, работа с 3D-графикой и пр. Путем простой экстраполяции нетрудно предположить, что при использовании нового типа RDRAM-памяти PC1066, поддерживающей частоту 533 МГц, прирост производительности системы в целом будет еще более значительным, особенно в приложениях, использующих эффективный обмен процессора с памятью. В следующем номере мы планируем ознакомить наших читателей с результатами тестирования этого процессора уже с новой RDRAM-памятью — PC1066.
КомпьютерПресс 6'2002