Пять лет назад компания AMD представила первый процессор, работающий на частоте более гигагерца, опередив в гонке тактовых частот компанию Intel. Вскоре Intel, поняв, что состязание с AMD обещает быть тяжелым, пересмотрела свои взгляды на принципы процессорной архитектуры. И появился Pentium 4 — ради достижения более высоких тактовых частот впервые в истории процессоростроения было уменьшено количество инструкций, выполняемых за один такт. То есть прирост тактовой частоты достигался без увеличения производительности. AMD ответила введением рейтинга — числа, характеризующего производительность. При этом, хотя на разных задачах процессоры, имеющие различную архитектуру, демонстрировали различную производительность, практика показывала, что в среднем рейтинг процессоров AMD примерно соответствует тактовой частоте процессоров Intel.
И вот в то время как Intel, выпустив процессор с частотой 3,8 ГГц, заявляет, что не планирует дальнейшего наращивания тактовой частоты, а собирается добиваться более высокой производительности другими методами, AMD выпускает процессор с рейтингом 4000+.
Ничего революционного не произошло: все параметры, присущие новому процессору, по отдельности уже были нам знакомы: кэш-память объемом 1 Мбайт, тактовая частота 2400 МГц, гнездо с 939 контактами. Похоже, что как Intel исчерпала возможности повышения тактовой частоты, так и AMD до конца использовала все способы увеличения рейтинга своих процессоров при существующем технологическом процессе.
Сегодня мы решили исследовать производительность процессора Athlon 64 4000+ и сравнить его с другими ЦП AMD и Intel.
Испытания проводились в разное время, поэтому в точности выдержать идентичность всех комплектующих было невозможно. Варианты конфигурации тестового стенда приведены в таблице.
Последовательный доступ (пересылка данных) |
При определении производительности процессоров AMD 3500+ и 4000+ была использована системная плата Soltek K8T800Pro. К ее особенностям следует отнести то, что она не поддерживает режим работы памяти выше PC2700 (333 МГц), что ведет к некоторому занижению результатов во всех тестах, кроме видеосжатия.
При последовательном обмене с памятью в пределах объема кэш-памяти новый процессор ведет себя идентично ЦП с рейтингом 3700+, совпадающему с ним как по тактовой частоте, так и по объему кэш-памяти. За пределами кэш-памяти производительность, естественно, выше (даже несмотря на меньшую частоту работы памяти) за счет двухканального режима работы. Любопытно, что в диапазоне от половины до нескольких мегабайт AMD 4000+ немного уступает 3500+. Как ни парадоксально, это обусловлено влиянием большего объема кэш-памяти. На графиках видно, что сразу по исчерпании объема кэш-памяти производительность резко падает, а затем плавно возрастает по мере увеличения пересылаемого объема данных.
Скорость произвольного доступа (запись) |
При произвольном доступе картина в целом сохраняется (на графике показана только область, соответствующая работе с основным объемом памяти — внутри кэш-памяти определяющей является тактовая частота). По сравнению с процессорами Intel наблюдается более низкая скорость последовательного обмена, более высокая — произвольного чтения и примерный паритет для произвольной записи.
Скорость произвольного доступа (чтение) |
В большей части синтетических тестов, характеризующих процессорную производительность, результат, как и следовало ожидать, зависит практически только от тактовой частоты. При «быстрой» же пересылке (с использованием инструкций SSE управления кэш-памятью) или нахождении простых чисел методом «решета Эратосфена» он обусловлен шириной шины памяти с учетом «провала» производительности за пределами кэш-памяти второго уровня. В среднем производительность процессоров AMD по сравнению с Intel в этой группе тестов оказывается выше. Исключение составляют компрессия/декомпрессия, преобразование цвета посредством инструкций MMX и «решето Эратосфена».
Общие тенденции сохраняются и в результатах таких известных тестов, как SiSoft Sandra и PassMark. Правда, здесь необходимо учитывать, что Sandra оптимизирована под процессоры Intel. Впрочем, это не мешает сравнивать изделия AMD между собой.
Компьютерная техника — наиболее быстро развивающаяся отрасль человеческой деятельности. Поэтому набор тестов приходится периодически обновлять. Хотя острой необходимости в этом нет — все-таки мы определяем производительность процессоров, а не видеоплат, — на этот раз кроме 3DMark03 был использован и 3DMark05. Впрочем, чтобы читатель имел возможность сравнить результаты с более ранними публикациями, приведены и результаты теста 2003 г. Кроме того, использован новый тест SPECviewperf, характеризующий производительность системы в наиболее распространенных профессиональных 3D-приложениях. В их число входят: 3DSMax, CATIA, CEI EnSight, Lightscape, Maya, Pro/ENGINEER 2000, SolidWorks, Unigraphics V17. Тест является кроссплатформным и использует OpenGL. Он разработан в компании IBM, в дальнейшем в его усовершенствовании принимали участие SGI, Digital (Compaq, HP), 3Dlabs (Creative Labs) и другие компании.
Решение системы линейных уравнений |
В целом можно сказать, что тесты производительности процессора, естественно, показывают заметное различие между тестируемыми образцами, а результаты тестов, использующих DirectX, напротив, от производительности ЦП практически не зависят (для выявления разницы нужна видеоплата помощнее), хотя для OpenGL влияние процессора сохраняется.
Весьма существенным показателем для процессоров AMD является скорость обмена с памятью, при обработке видео определяемая шириной шины (т.е. двухканальным режимом в Socket-939 и его отсутствием в Socket-754), а при обработке аудио — в большей степени мощностью процессорного ядра. И в том и в другом случае обработка ведется в основном потоковыми инструкциями MMX/SSEx.
Решение системы дифференциальных уравнений |
При анализе производительности процессоров в деловых приложениях необходимо учитывать, что значительный вклад в результат дает производительность жесткого диска, а она у изделия Maxtor несколько выше, чем у Western Digital. Ну и нельзя забывать про вдвое больший объем оперативной памяти у системы Intel.
В научных расчетах значительную роль играет производительность процессорного ядра. По крайней мере, при решении систем дифференциальных уравнений — благодаря эффективному использованию кэш-памяти. Что же касается систем линейных уравнений, то в классическом тесте Донгарра на скорость их решения производительность при использовании больших массивов уже давно определяется не свойствами процессора, а скоростью работы памяти.
Итак, ничего принципиально нового компания AMD нам не преподнесла. Тот же Athlon 64, только с максимальным использованием всех возможностей по тактовой частоте, объему кэш-памяти и ширине внешней шины данных. Логичное завершение линейки, основанной на технологии 0,13 мкм. Даже инструкций SSE3 не добавилось. Остается только ждать перехода AMD на 0,09-мкм технологический процесс. Впрочем, несмотря на отсутствие новизны производительность все-таки впечатляет. А процессорный номер (рейтинг) — еще больше.