Процессор AMD Athlon 2100+ — сравнение с предшественниками

Басир Ахмедов, Алексей Шобанов

В марте этого года на международной выставке CeBIT представители компании AMD объявили о выпуске трех новых процессоров, пополнивших завоевавшее заслуженную популярность семейство AMD Athlon. В числе анонсированных процессоров были модель для настольных компьютеров — AMD Athlon XP 2100+, модель для серверов и рабочих станций — AMD Athlon MP 2000+ и модель из мобильной линейки AMD Athlon 4 1600+.

Мобильная и серверная модельные линейки семейства AMD Athlon являются, по большому счету, производными от линейки процессоров для настольных систем, старшие модели которой имеют максимальную тактовую частоту и обеспечивают наивысшую производительность. Именно поэтому мы сочли необходимым рассмотреть старшую модель из линейки процессоров для настольных персональных компьютеров — AMD Athlon XP 2100+. Этот процессор был любезно предоставлен нам представительством компании AMD в Москве, и мы получили возможность оценить его производительность. Это, на наш взгляд, особенно любопытно в свете последних публикаций, посвященных выходу новых моделей процессоров компании Intel. Но прежде чем перейти непосредственно к результатам проведенного нами тестирования, кратко рассмотрим основные архитектурные особенности процессоров семейства AMD Athlon. В нашей статье мы остановимся лишь на ключевых моментах, однако начать придется издалека. Долгие годы ахиллесовой пятой процессоров компании AMD (и не только AMD) был блок операций с вещественными числами — блок FPU, низкая производительность которого не позволяла этим продуктам сколь-нибудь серьезно конкурировать с лидерами процессорного рынка тех лет. Но, как говорится, высшая мудрость состоит в том, чтобы любые недостатки превратить в достоинства. И это с успехом удалось сделать специалистам компании AMD. В августе 1999 года был выпущен процессор AMD Athlon, построенный по новой оригинальной архитектуре. Одним из основных достоинств этого процессора был и остается по сей день полностью конвейеризированный (15 ступеней) блок FPU, объединяющий три независимых конвейера:

  • конвейер операций с вещественными числами (FSTORE);
  • конвейер суммирования (FADD) для выполнения простейших арифметических операций;
  • конвейер умножения (FMUL) для выполнения сложных арифметических операций.

Подобная реализация блока FPU позволяет выполнять до трех вещественных операций за такт — такая производительность и сейчас является рекордной среди х86-совместимых процессоров. Блок операций с целыми числами также полностью конвейеризирован (10 ступеней) и состоит из трех распараллеленных частей, что в итоге позволяет выполнять три целочисленные операции за один такт. Как и в большинстве современных х86-совместимых процессорах, имеющих внутреннюю RISC-архитектуру, в процессоре AMD Athlon внешние CISC-команды декодируются во внутренние RISC-инструкции. Для этого используется состоящий из трех независимых блоков декодер команд, особенность которого заключается в том, что его блоки являются равноценными и осуществляют дешифрацию х86-инструкций независимо от их сложности. Это позволяет декодировать по три CISC-команды за один такт даже при неоптимизированном коде. Для временного хранения декодированных RISC-команд предусмотрен буфер (Instruction Control Unit), хранящий до 72 инструкций. Такой подход дает возможность распараллелить выполнение программного кода и по возможности равномерно загрузить все вычислительные мощности процессора. Для повышения производительности процессора при работе с приложениями, требующими потоковой обработки данных, процессор поддерживает выполнение набора инструкций потоковых SIMD(single-instruction multiple-data)-расширений, который носит фирменное название — Enhanced 3DNow!. Говоря об особенностях архитектуры процессора AMD Athlon, нельзя не упомянуть и об организации кэшей. Процессоры Athlon оснащены эксклюзивным (то есть содержимое кэша первого уровня не дублируется в кэше второго уровня) двухуровневым кэшем, при этом ширина шины кэша как первого, так и второго уровня составляет 64 бит (плюс 8 бит для ECC). Полноскоростной кэш первого уровня (L1) общим размером 128 Кбайт имеет деление на кэш данных и кэш инструкций, каждый размером по 64 Кбайт. Первоначально (при изготовлении процессорного ядра (К7) с использованием 0,25-мкм технологии) кэш второго уровня (L2) имел размер 512 Кбайт, был размещен вне кристалла, в процессорном картридже, и работал на половинной частоте ядра процессора. В дальнейшем, с переходом на 0,18-мкм технологию производства (ядро Thunderbird), кэш L2 разместили на одном кристалле с процессорным ядром, для чего пришлось пойти на некоторые жертвы, уменьшив его размер вдвое, то есть до 256 Кбайт, однако это позволило сделать его полноскоростным. Справедливости ради отметим, что первые процессоры Athlon, выполненные по 0,18-мкм технологии (ядро К75), так же как и их предшественники, имели внешний кэш L2, который работал на частотах, равных 1/2, 2/5 или 1/3 от тактовой частоты процессора. Использование интегрированного кэша второго уровня позволило, кроме всего прочего, отказаться от картриджной упаковки (Card Module) процессора и перейти на более прогрессивный конструктив, разместив кристалл в керамическом корпусе (CPGA) с 462-пиновым разъемом (Socket A). Кроме того, это дало возможность улучшить теплообмен процессора, хотя и по сей день проблема тепловыделения является, на наш взгляд, основной для процессоров семейства Athlon. Говоря о кэшах, конечно же, необходимо упомянуть и о таком их виде, как многоуровневый TLB (Translation Look-aside Buffers), хранящий карту декодированных адресов инструкций и данных, что позволяет значительно сократить время доступа к ним. Процессоры AMD Athlon имеют двухуровневый TLB (L1 TLB и L2 TLB), который также делится на буфер данных и буфер инструкций. L1 TLB кэширует 24 адреса инструкций и 32 адреса данных, в то время как L2 TLB хранит 256 адресов как для инструкций, так и для данных. И в заключение, рассматривая особенности архитектуры процессора Athlon, нельзя не сказать о поддерживаемой им системной шине Alpha EV-6, которую компания AMD лицензировала у Digital Equipment Corp (DEC). Первоначально была применена системная шина EV-6, работающая на частоте FSB 200 МГц, но в последней модификации AMD Athlon на ядре Thunderbird (Athlon-C) частота системной шины была увеличена до 266 МГц. В данном случае речь идет о эффективной частоте FSB. Реально физическая частота, на которой работает системная шина, составляет соответственно 100 и 133 МГц, но поскольку передача пакетов идет как по переднему, так и по заднему фронту тактового импульса, эта частота удваивается. При переходе на ядро Palomino (именно это ядро является основой процессоров Athlon XP, Athlon MP и Athlon 4), выпускаемое на базе той же 0,18-мкм технологии с использованием медных соединений (пeреход на эту технологию произошел еще при производстве процессоров Athlon-B на ядре Thunderbird), в архитектуру процессора был внесен еще ряд изменений, одним из которых стало применение новой QuantiSpeed Architecture. Если отбросить маркетинговое красноречие и оставить лишь суть, то можно сказать, что сделано два весьма полезных нововведения:

  1. Введена аппаратная предвыборка (Hardware Data Prefetch), смысл которой состоит в том, что данные, которые могут потребоваться для дальнейших вычислений (critical data), выбираются из системной памяти в кэш данных первого уровня (кэш данных L1).
  2. TLB (Translation Look-aside Buffers) стал эксклюзивным и спекулятивным, что позволит теперь увеличить количество сохраняемых транслированных адресов (за счет отсутствия дублирования L1 TLB и L2 TLB) и ускорить генерацию карт, необходимых для дальнейших вычислений. Кроме того, TLB L1 для данных (DTLB L1) был увеличен с 32 до 40 записей.

К тому же был расширен набор поддерживаемых SIMD-инструкций, который получил фирменное название 3D Now! Professional (набор полностью совместим с интеловским SSE). Все это позволило значительно увеличить производительность процессора, даже не прибегая к переходу на новый техпроцесс (недаром новый десктопный процессор на ядре Palomino получил название Athlon XP, где XP — eXtreme Performance). Изменилась и «упаковка» процессора — Athlon XP получил новый корпус OPGA (Organic Pin Grid Array). Еще одна немаловажная деталь: процессор семейства Athlon наконец обзавелся интегрированным на кристалле термодиодом, позволяющим сформировать сигнал критического перегрева процессорного ядра (при условии, что эта функция поддерживается средствами системной платы). Помимо всех перечисленных изменений специалистами компании AMD была также проведена перекомпоновка процессорного ядра, результатом которой стало снижение тепловыделения на 20%. Таким образом, старшая на сегодняшний день модель процессоров AMD — процессор AMD Athlon XP 2100+ — при размере кристалла 128 мм2 (37,5 млн. транзисторов) имеет тепловыделение 64,3 Вт. И чтобы окончательно завершить тему эволюционного развития процессоров семейства AMD Athlon, несколько слов скажем о рейтинговых значениях, вновь введенных для обозначения процессоров серии AMD Athlon XP. Хотя сейчас производитель называет это значение номером модели, однако по сути это рейтинговое значение тактовой частоты, которую должен был бы иметь процессор AMD Athlon (хотя, вероятнее всего, имеется в виду тактовая частота процессоров старших моделей основных конкурентов) для достижения той же производительности. На этот раз для определения подобного рейтингового значения (номера модели) компания AMD использует довольно обширный набор общепризнанных офисных, мультимедийных и игровых тестов, что позволяет говорить о корректности этого рейтинга в целом (правда, при рассмотрении отдельно взятых задач, в силу значительных отличий в архитектуре от продуктов-конкурентов, данное рейтинговое значение не всегда соответствует действительному положению вещей). При этом реальная тактовая частота, на которой работает процессор AMD Athlon XP, в его маркировке никак не отображается, что, конечно же, можно объяснить лишь маркетинговыми соображениями, поскольку для большинства покупателей именно тактовая частота процессора является основным показателем его производительности. Говоря о тактовой частоте, необходимо отметить, что благодаря очень удачной архитектуре ядра процессоры AMD Athlon XP смогли достичь тактовой частоты 1733 МГц при применении все той же 0,18-мкм технологии. Это прекрасный результат для процессорного ядра, имеющего сравнительно небольшой 12-стадийный конвейер (такой размер конвейера, видимо, оказался оптимальным, поскольку обеспечил возможность наращивать тактовую частоту до достаточно высоких значений, в то же время позволяя минимизировать потери при ошибочном предсказании переходов ветвления). А с учетом высокой степени распараллеливания процесса обработки данных (до 9 операций за такт) можно говорить просто о феноменальной для х86-совместимого процессора, выполненного по 0,18-мкм техпроцессу, производительности.

Ознакомив читателя с нашим видением архитектурных особенностей процессоров AMD Athlon XP, перейдем к практике. С помощью ряда тестовых программ и приложений попытаемся оценить производительность, которую обеспечивает старшая на сегодняшний день в этой линейке модель — AMD Athlon XP 2100+ (тактовая частота 1733 МГц). Чтобы определить, какой эффект дало увеличение тактовой частоты, подвергнем тем же испытаниям процессор AMD Athlon XP 1900+, работающий на частоте 1600 МГц. Тестирование проводилось на тестовом стенде следующей конфигурации:

  • процессор AMD Athlon XP 2100+ и AMD Athlon XP 1900+;
  • системная плата Gigabyte GA-7DXR (на чипсете AMD 761);
  • жесткий диск Quantum Fireball+ AS 40 Гбайт с файловой системой NTFS;
  • 512 Мбайт оперативной памяти DDR SDRAM PC2100 (CL 2,5);
  • видеокарта Abit Siluro GF3 Vio (GeForce 3, 64 Мбайт) с видеодрайвером nVIDIA detonator v. 23.11 (разрешение 1024×768, глубина цвета 32 бит, Vsync — откл.).

Для тестирования использовалась операционная система Microsoft Windows XP. Результаты тестирования приведены в таблице.

При тестировании процессоров мы применяли как синтетические тестовые программы, позволяющие оценить производительность процессорной подсистемы независимо от производительности других подсистем компьютера, так и тесты на общую производительность компьютерной системы при работе с офисными, мультимедийными и профессиональными графическими приложениями, 3D-играми, а также при выполнении специфических задач по архивированию и конвертированию файлов. В качестве синтетических тестов служили утилита MadOnion PCMark 2002 (при этом использовались лишь подтесты на процессорную подсистему) и новый тестовый пакет CPU RightMark 2002, созданный отечественными разработчиками и уже заслуживший признание специалистов (http://cpu.rightmark.org/). Результаты, полученные нами в ходе тестирования утилитой CPU RightMark 2002, показывают, что использование процессора AMD Athlon XP 2100+ дает более чем 6% прирост производительности по сравнению с AMD Athlon XP 1900+, причем на стадии просчета графической сцены результат был улучшен почти на 9%. Аналогичный результат был получен нами и при тестировании процессоров средствами тестового пакета MadOnion PCMark 2002 — в этом случае старшая модель процессора AMD Athlon XP показала 8% прирост производительности. Для оценки производительности при работе с офисными и мультимедийными приложениями мы использовали хорошо знакомый нашим читателям тестовый пакет SYSmark 2002. Тесты этого пакета показали, что использование компьютерной системы, основой которой является последняя модель линейки AMD Athlon XP, позволяет получить выигрыш порядка 6,6% при работе с мультимедийными и графическими приложениями, служащими для создания контента (тест Internet Contenet Creation), и 4,3% — при работе с офисными приложениями (тест Office Productivity). Оценка времени архивирования директории, содержащей 11 015 файлов общим размером 2,1 Гбайт в 1093 папках, показала, что увеличение тактовой частоты процессора AMD Athlon XP с 1600 до 1733 МГц позволило получить 4% выигрыш. При этом прирост производительности при выполнении задач по конвертированию .wav- и .avi-файлов в файлы форматов MJPEG 3 и MPEG 4 составил соответственно 9,5 и 5,4%. Оценить преимущества, которые дает использование более старшей модели процессора AMD Athlon XP на игровых приложениях, мы попытались с помощью тестовой программы MadOnion 3DMark 2001SE. Тестирование проводилось в двух режимах: с использованием аппаратного рендеринга и программного рендеринга. В последнем случае вся нагрузка по просчету трехмерных сцен ложится на центральный процессор. В реальной жизни, конечно, мало кому придет в голову перекладывать работу дорогостоящей графической карты на центральный процессор, однако этот режим хорошо раскрывает вычислительный потенциал последнего. В случае аппаратного рендеринга система на базе AMD Athlon XP 2100+ показала результат на 2,1% выше, чем при использовании процессора Athlon XP 1900+. При программном рендеринге, когда роль процессорной системы возрастает, результат старшей модели оказался выше почти на 2,7%.

Подводя итоги проведенного тестирования, отметим прекрасную масштабируемость полученных результатов при увеличении тактовой частоты процессора AMD Athlon XP с 1600 до 1733 МГц (8% увеличение тактовой частоты принесло вполне соизмеримый с этой цифрой прирост производительности в приложениях), причем наибольший прирост производительности наблюдался при решении задач потоковой обработки. В целом же результаты, показанные процессором AMD Athlon XP 2100+, дают возможность утверждать, что этот процессор может послужить основой высокопроизводительной рабочей станции, которая с успехом позволит решать сложные вычислительные задачи, а также обеспечит комфортную и продуктивную работу с офисными, мультимедийными и игровыми приложениями.

 

Редакция выражает признательность российскому представительству компании AMD (http://www.amd.ru/, тел.: 795-0622) за предоставленный для тестирования процессор AMD Athlon XP 2100+.

КомпьютерПресс 7'2002

Наш канал на Youtube

1999 1 2 3 4 5 6 7 8 9 10 11 12
2000 1 2 3 4 5 6 7 8 9 10 11 12
2001 1 2 3 4 5 6 7 8 9 10 11 12
2002 1 2 3 4 5 6 7 8 9 10 11 12
2003 1 2 3 4 5 6 7 8 9 10 11 12
2004 1 2 3 4 5 6 7 8 9 10 11 12
2005 1 2 3 4 5 6 7 8 9 10 11 12
2006 1 2 3 4 5 6 7 8 9 10 11 12
2007 1 2 3 4 5 6 7 8 9 10 11 12
2008 1 2 3 4 5 6 7 8 9 10 11 12
2009 1 2 3 4 5 6 7 8 9 10 11 12
2010 1 2 3 4 5 6 7 8 9 10 11 12
2011 1 2 3 4 5 6 7 8 9 10 11 12
2012 1 2 3 4 5 6 7 8 9 10 11 12
2013 1 2 3 4 5 6 7 8 9 10 11 12
Популярные статьи
КомпьютерПресс использует