Появление процессора AMD Athlon произвело настоящий фурор: претендовавшая до этого на производство только процессоров начального уровня компания AMD выпустила кристалл, по многим параметрам превосходящий безальтернативного на тот момент лидера — Pentium III. В результате Intel пришлось изменить даже подход к архитектуре, чтобы опередить конкурента если не по производительности, то хотя бы по тактовой частоте. Вскоре, по аналогии с Intel Celeron, появился и облегченный вариант Athlon?а — Duron. Через некоторое время, однако, выпуск Duron?ов прекратился — в нижнюю часть ценового диапазона стали плавно переходить устаревающие модели сначала Athlon, а затем и Athlon XP.
С появлением Athlon 64 все семейство Athlon XP по сути перешло в нижний сегмент рынка, что компанию AMD по понятным причинам не устраивало. Во-первых, AMD хотелось бы, чтобы имя Athlon ассоциировалось у пользователя исключительно с передовыми и высокопроизводительными решениями. Во-вторых, в нижнем ценовом диапазоне процессорам AMD приходится конкурировать не с Pentium 4, а с Celeron, при этом складывается неблагоприятная для AMD ситуация с исчислением рейтингов. Впрочем, о рейтингах следует рассказать подробнее.
Производительность процессора в первом приближении определяется количеством инструкций, выполняемых за единицу времени. Как нетрудно догадаться, оно равно произведению тактовой частоты на количество инструкций, выполняемое за один такт. Следовательно, процессор, выполняющий большее их количество за такт, может оказаться производительнее процессора, работающего на более высокой частоте. Но проблема в том, что процессоры обладают довольно большим набором инструкций, имеющих различное время выполнения. Поэтому для двух разных процессоров часть инструкций будет быстрее выполняться на одном, а часть — на другом. Значит, различие в их производительности зависит от соотношения между частототами появления различных инструкций, т. е. в конечном счете от конкретной программы. При использовании одних программ более производительным окажется один процессор, а при использовании других — другой.
Оказавшись в нижнем ценовом диапазоне, 32-разрядные процессоры AMD неизбежно будут сравниваться не с Pentum 4, а с Celeron. Но сама компания Intel неоднократно упоминала, что при одинаковой тактовой частоте ее процессоры Celeron существенно уступают Pentium 4. Следовательно, существующая система исчисления рейтингов будет неадекватно отражать расстановку сил среди процессоров нижнего ценового диапазона. Поэтому AMD официально «привязала» рейтинг своих процессоров к частоте процессора Intel Celeron, объявив попутно, что изменен как набор применяемых тестов, так и способ вычисления рейтинга, поэтому сравнивать «старые» и «новые» неправомерно. Но вводить новый рейтинг для старых процессоров было бы со стороны AMD совсем уж некрасиво. Выход нашелся достаточно очевидный: вместе со сменой рейтинга изменить и название процессоров. Почему-то воспользоваться уже имеющимся именем Duron компания AMD не решилась. Наверно, посчитала, что это слово не слишком благозвучно для русскоязычного пользователя . В результате появился Sempron.
Прежде всего необходимо отметить, что Sempron — это не процессор, а торговая марка. Подобно тому как имя Celeron корпорация Intel дает процессору независимо от того, на базе какого ядра он изготовлен — Pentium II, Pentium III или Pentuim 4, под названием Sempron также выпускаются процессоры с совершенно различными ядрами.
Процессоры Sempron |
В этой связи можно подчеркнуть, что расширением набора команд SSE2 обладает пока только единственная модель — Sempron 3100+. Кроме того, все процессоры семейства Athlon XP работают с внешней частотой передачи данных 333 МГц. Как показали наши тесты, при обеспечении двухканального режима работы памяти самым эффективным режимом с точки зрения производительности является синхронный, т. е. память должна работать в режиме PC2700. Для этого в BIOS частоту памяти следует установить в положение Auto. Если увеличить частоту памяти до PC3200 (400 МГц или режим By SPD для PC3200), производительность падает из-за возникающих вследствие асинхронности дополнительных тактов ожидания. Все выпускаемые ко времени подготовки настоящей статьи процессоры Sempron имеют 256 Кбайт кэш-памяти второго уровня. Впрочем, в спецификациях AMD можно найти упоминания и о кэш-памяти 512-Кбайт и шине 400-МГц. Так что в дальнейшем такие процессоры, скорее всего, будут появляться.
Компания AMD предприняла максимум усилий для того, чтобы новые Sempron трудно было отождествить со старыми Athlon XP. Нет ни одного точного совпадения. Даже работающие на частотах 1667 и 2000 МГц процессоры различаются частотой шины. То есть, по мнению AMD, производительность 2800-МГц Celeron слегка уступает производительности 2400-МГц Pentium 4, что похоже на правду.
К нам в редакцию попали два образца Sempron, выполненные на основе разных ядер, — это модели с рейтингами 2800+ и 3100+. Сравнение проводилось с кристаллом Athlon 2700+.
При проведении тестов были использованы системные платы ASUS A7NBX-VM для Sempron 2800+, Aopen n250a FR для Sempron 3100+ и Albatron KM18G PRO для Athlon 2700+. Обе платы Socket 462 были выполнены на базе НМС nForce2 IGP в формфакторе MicroATX, а плата Socket 754 — на НМС nForce3 250. Кроме того, тестовая платформа включала 512-Мбайт ОЗУ типа DDR PC-2700 (два модуля по 256 Мбайт), видеоплату nVidia GeForce 5600 Ultra, 40-Гбайт жесткий диск Seagate Barracuda 7200.1 ST340014A на 7200 об/мин, CD-ROM дисковод Lite On LTN483L 48x, блок питания VT-420LD (400 Вт) и ОС Windows XP SP1.
Производительность оценивалась на стандартном наборе тестов, применяемом нами при испытаниях процессоров и системных плат. Однако на этот раз мы изменим последовательность изложения, показав сначала основные различия двух ядер, используемых в Sempron.
Ядро Athlon 64 отличается от предыдущих процессоров AMD, а также от изделий конкурентов тем, что содержит встроенный контроллер памяти, позволяющий избежать некоторой части «накладных расходов» при обращении к оперативной памяти. Это приводит почти к двукратному увеличению скорости чтения — наиболее часто используемой операции.
Если же проследить зависимость скорости обмена от объема данных, то можно заметить еще некоторые особенности: во-первых, более низкую латентность кэш-памяти первого уровня, а во-вторых, в среднем более высокую скорость передачи в основном объеме памяти. Скорость обмена с кэш-памятью второго уровня у всех трех процессоров определяется исключительно тактовой частотой.
Максимальное значение на графике скорости обмена при произвольном доступе на самом деле отражает скорость работы генератора псевдослучайных чисел, которая, очевидно, пропорциональна тактовой частоте процессора. Это справедливо до тех пор, пока объем массива для выборки не превысит объем кэш-памяти первого уровня. Однако у ядра Athlon 64 падение скорости обмена с ростом объема массива происходит медленнее. Это ядро также выигрывает при больших объемах массива (более 16 Мбайт).
Итак, AMD присвоила низкочастотному процессору более высокий рейтинг по трем причинам:
- меньшая латентность кэш-памяти первого уровня;
- более высокая скорость обмена с оперативной памятью;
- наличие дополнительного набора инструкций SSE2.
Посмотрим, какова реальная производительность процессоров на различных алгоритмах и задачах.
Здесь и в дальнейшем Sempron 2800+ и Athlon XP 2700+ ведут себя в точном соответствии с их тактовой частотой, поэтому будем описывать только отличие поведения Sempron 3100+ от двух других процессоров.
Блоки целочисленных вычислений, вычислений с плавающей точкой, включая итерационные вычисления, а также блок логических вычислений и управления, обеспечивающий ветвление программы, демонстрируют производительность в строгом соответствии с тактовой частотой. И для таких задач Sempron 3100+ подходит хуже, чем его «младшие» братья, работающие на более высокой частоте. А вот что касается обработки объемных массивов, особенно с использованием векторных инструкций MMX и SSE, ситуация радикально меняется и Sempron 3100+ вырывается вперед.
Зависимость скорости пересылки от объема данных |
Тестовые программы SiSoft Sandra и PassMark в целом оценили производительность процессоров практически по тактовой частоте, отказав модели 3100+ в праве называться «старшей». Однако применение набора инструкций SSE2 вместо стандартных операций с плавающей точкой привело к 20%-му увеличению производительности. Правда, здесь же зафиксирован провал во время мультимедийных вычислений, притом как раз там, где 3100+ вместо SSE пытался использовать SSE2. По-видимому, AMD еще не до конца сумела использовать новые идеи, привнесенные Intel в процессор Pentium 4. А может, новые инструкции исполняются на микропрограммном уровне с применением тех же SSE.
Скорость произвольного доступа при записи |
Среди продуктов компании Future Mark, известной ранее под названием MadOnion, тест на общую производительность не сообщил нам ничего нового, а вот графический тест, написанный с использованием DirectX, показал заметное (примерно на 10%) превосходство над «собратьями». За исключением чисто процессорного теста, что и понятно: в возможностях процессора мы уже имели возможность убедиться, а вот когда наиболее трудоемкую работу можно переложить на 3D-акселератор, на долю центрального процессора остается в основном интенсивная работа с памятью, где, как мы видели, Sempron 3100+ весьма силен. Естественно, с увеличением экранного разрешения вклад графического процессора в общую производительность растет, а центрального — уменьшается.
При использовании OpenGL, если верить тесту XSMark, модели 3100+ удается обогнать «собрата» и вплотную приблизиться к более высокочастотной модели Athlon 2700+.
Решение системы линейных уравнений |
В существующих игровых приложениях, правда, не отличающихся особой новизной (но мы ведь сравниваем процессоры, а не видеоплаты!) при использовании DirectX процессор Sempron 3100+ выходит на первое место, как ему и положено по рейтингу. А вот в приложениях OpenGL, требующих большей процессорной мощи, он занимает промежуточное положение между Sempron 2800+ и Athlon XP 2700+. Однако при максимальном пространственном разрешении, когда основное ограничение уже связано с графическим, а не c центральным процессором, Sempron 3100+ вырывается вперед. Очевидно, играет роль скорость обмена с памятью. Но чья это заслуга — контроллера памяти процессора или нового НМС nVidia, обеспечивающего взаимодействие с AGP, — сказать трудно.
По нашим прогнозам, при обработке потоковых данных с использованием векторных наборов команд (MMX, SSE, SSE2) старшая модель Sempron должна показывать наилучший результат, и измерениями эти предположения подтверждаются: при обработке как видео, так и видео вместе со звуком 3100+ требует наименьшего времени. Это, правда, не распространяется на обработку только звука в формате MP3. Последнее, впрочем, объяснимо, так как на единицу объема данных обработка сильно сжатого звука требует гораздо большей процессорной мощи.
Скорость произвольного доступа при чтении |
При проведении математических расчетов сравнительная производительность процессоров также ведет себя вполне предсказуемо: при небольших объемах данных она определяется тактовой частотой ядра, а при больших — скоростью доступа к оперативной памяти.
Однако не следует забывать, что процессоры нижнего ценового диапазона предназначены в первую очередь для работы, не требующей интенсивных вычислений, а именно для офисной и иных видов профессиональной деятельности, ориентированных на обработку текста и сравнительно несложной графики. Расстановку сил для таких приложений демонстрирует SYSmark 2004. Как видим, места здесь также распределяются в соответствии с рейтингами (с учетом поправки для рейтинга Athlon XP).
Итак, первое, на что хотелось бы еще раз обратить внимание читателя, — это изменение системы исчисления рейтингов в процессорах Sempron по сравнению с Athlon. Коэффициент пересчета равен примерно 1,11—1,16, хотя AMD и возражает против непосредственного сравнения рейтингов. Это следует учитывать, когда при покупке приходится выбирать между Athlon XP и Sempron. Второе — нельзя забывать о том, что, хотя старшая модель Sempron и основана на ядре Athlon 64, 64-разрядный код она выполнять не может. В принципе, можно было бы сегодня купить недорогой Sempron вместе с платой Socket 754, а когда появится полноценная 64-разрядная версия Windows, модернизировать процессор до полного Athlon 64, который к тому времени, несомненно, подешевеет. Однако AMD переводит производство своих 64-разрядных процессоров на Socket 939, так что вполне может оказаться, что к тому моменту, когда «настанет время», Athlon 64, подходящий к имеющейся плате, подобрать будет затруднительно.
Решение системы дифференциальных уравнений |
Ну и наконец, система рейтингов. Конечно, вполне логично, что для тех процессоров, которые будут рассматриваться в качестве альтернативы Celeron, и рейтинги надо считать по сравнению с этим процессором. Однако первое время выбор между различными моделями AMD-32 будет осложнен неоднозначностью системы рейтингов, что приведет к определенной путанице, причем затруднения будут испытывать не только покупатели, но и продавцы. Вместе с тем, применительно к основным классам приложений, как-то: офисная, профессиональная работа или игры, — написанных с использованием DirectX, рейтинг моделей Sempron на различных ядрах определяется довольно адекватно. А вот в экзотических случаях, возможно, следует предпочесть Athlon XP или Sempron на его основе.
Редакция благодарит российское представительство компании AMD (www.amd.ru) за предоставленное для проведения тестирования оборудование.
Рейтинг — за и против
Первым рейтинг для процессоров с системой команд x86 ввела компания Cyrix: так называемый P-рейтинг, т.е. частоту процессора, на которой должен был бы работать Intel Pentium для обеспечения такой же производительности, как и процессор Cyrix. Однако тогда эта идея себя скомпрометировала, притом сразу по двум причинам. Во-первых, если до того в сфере применения персональных компьютеров преобладали задачи, требующие исключительно целочисленных вычислений, то как раз в описываемое время в игровой мир мощно ворвалась 3D-графика, требующая интенсивных вычислений с плавающей точкой. И если на целых числах процессоры Cyrix действительно опережали Pentium, то с вещественными числами все было наоборот. Во-вторых, Intel вскоре выпустила процессор Pentium II, выполняющий больше инструкций за такт, чем Pentium, т.е. обладающий большим, по мнению Cyrix, P-рейтингом. Но Intel продолжала маркировать свои новые процессоры значением тактовой частоты, из-за чего изделия Cyrix сильно проигрывали им даже на одинаковой тактовой частоте, не говоря уже о рейтинге. Поэтому идея рейтинга на некоторое время оказалась забытой.
После выхода AMD Athlon компания Intel поняла, что состязаться с новым процессором будет довольно сложно, и применила хитрый ход: она изменила архитектуру своих процессоров, чтобы максимально увеличить достигаемые ими значения тактовой частоты. При этом количество инструкций, выполняемых за такт, у них заметно снизилось. То есть процессоры Pentium 4 существенно проигрывали работающим с ними на одной частоте как Athlon, так и собственным Pentium III. По логике 1400-МГц процессору Pentium 4 следовало бы присвоить рейтинг в районе 800—900, но Intel владела 80% рынка и диктовала свои условия. Пришлось вводить рейтинг компании AMD. Формально рейтинг процессоров Athlon XP соответствовал тактовой частоте, на которой должен был работать Athlon для достижения аналогичной производительности. Реально же все (и наш журнал здесь не исключение) сравнивали рейтинговые цифры AMD с тактовыми частотами процессоров Intel Pentium 4. И надо сказать, в большинстве случаев приходили к выводу, что рейтинг присвоен достаточно объективно. Впрочем, на конкретных задачах различие между процессором Intel и соответствующим ему по рейтингу процессором AMD могло достигать полутора-двух раз. И притом как в одну, так и в другую сторону.