В октябре этого года произошло долгожданное событие: компания AMD представила миру процессоры на основе своей новой микроархитектуры под названием Bulldozer. Четыре процессора семейства Zambezi, предназначенного для настольных ПК, должны появиться в розничной продаже ко времени публикации этого номера «Мира ПК».
Начать рассказ об этой новинке стоит, пожалуй, с приятной новости для энтузиастов разгона. В свое время суффиксом FX обозначались модели процессоров Athlon 64, имевшие разблокированный множитель. Конечно, тот факт, что именно это имя получили процессоры на основе новой архитектуры — не случайность. Семейство Zambezi ориентировано на высокопроизводительные игровые системы, а также на аудиторию оверклокеров. Для последних AMD приготовила приятный сюрприз: все модели FX имеют разблокированный множитель. Кроме того, эти ЦП, производимые по 32-нм техпроцессу, имеют большой потенциал для повышения тактовой частоты. Финский оверклокер macci установил на процессоре FX-8150 мировой рекорд по тактовой частоте, разогнав его до 8429 МГц. До этого в течение долгого времени первенство по тактовой частоте принадлежало процессорам Celeron семейства Cedar Mill, появившимся еще в 2006 г. и производимым по 65-нм техпроцессу.
Наборы инструкций
Отличительной особенностью, позволяющей причислить процессоры на основе микроархитектуры Bulldozer к новому поколению, является поддержка новых наборов инструкций, в первую очередь AVX(Advanced Vector Extensions), также AES, ускоряющего шифрование, и обновленных версий SSE – 4.1 и 4.2. Это ставит Bulldozer в один ряд с Sandy Bridge -- самой совершенной в настоящее время микроархитектурой компании Intel. Кроме того, AMD добавили еще два набора инструкций, направленных на ускорение обработки потоков данных, причем как целочисленных, так и с плавающей запятой. Кстати, процессоры семейства Llano, появившиеся на рынке незадолго до выхода Bulldozer, основаны на микроархитектуре предыдущего поколения -- K10.
Многопоточность
Компания AMD позиционирует старшие модели FX как первые 8-ядерные процессоры, предназначенные для настольных ПК. По мере того как число ядер, размещенных на одном кристалле, увеличивается, возрастает необходимость в оптимизации использования площади кристалла. В компании AMD эту задачу решили путем объединения ядер в модули по два, с разделением части функциональных блоков. Для любителей разоблачений действий маркетологов это сразу же стало поводом для громких заявлений о том, что в действительности FX не является полноценным 8-ядерным процессором, а двухъядерные модули AMD — это не что иное, как реализация принципа SMT(Simultaneous multithreading), реализованного в ЦП Intel под названием Hyper Threading. Впрочем, продвинутые потребители уже привыкли к тому, что производительность процессора нельзя оценивать по числу ядер или тактовой частоте. Кроме того, цены на процессоры Intel Core i5 без Hyper-Threading отличаются от близких по тактовой частоте моделей Core i7 с HT, и те, кто покупает последние, знает, за что переплачивает. Реальный прирост эффективности от применения многопоточности сильно зависит от приложения: одни сравнительно плохо масштабируются даже на независимых ядрах, а другие могут показывать прирост, почти пропорциональный числу потоков.
Итак, давайте разберемся, что же сделали инженеры из AMD. Как известно, ни одно из приложений не использует ресурсы процессора на 100%. Иначе говоря, среднее значение производительности на временном отрезке всегда оказывается ниже максимально возможной (пиковой) производительности. Значит, часть времени исполнительные модули ядра просто простаивают. Происходит это из-за латентности памяти, ошибок в работе модуля предсказания ветвлений и других причин. В технологии Hyper-Threading от Intel оптимизация достигается дублированием модулей, ответственных за декодирование и построение очередности выполнения микроопераций. Если при выполнении одного из потоков возникает простой, то цикл используется вторым потоком. Bulldozer построен с точностью до наоборот. Двухъядерный модуль содержит по два независимых целочисленных исполнительных блока, каждый из которых имеет собственный кэш данных объемом в 16 Кбайт и планировщик. Остальные функциональные блоки спарены: это модуль выполнения операций с плавающей запятой, общий кеш второго уровня объемом 2 Мбайт, декодер и блок захвата инструкций.
TurboCore
Процессоры Zambezi поддерживают функцию TurboCore, которая позволяет процессору в некоторых случаях работать с частотой, превышающей номинальную. Причем теперь частота может быть кратковременно повышена не только в те моменты, когда часть ядер простаивает, но и когда задействованы все четыре двухъядерных модуля. К сожалению, операционная система Windows 7 не оптимизирована для Zambezi. Менеджер процессов не различает, какие из ядер находятся в одном кластере. Поэтому в бета-версии Windows 8 новые процессоры показывают чуть более высокую производительность.
Северный мост
Новые процессоры совместимы лишь с процессорным разъемом АМ3+. Чипсеты серии 900 имеют два моста, один из которых, как и полагается, содержит в себе контроллер шины PCI Express, а другой отвечает за периферию. Несмотря на это, часть процессора, содержащую в себе контроллер оперативной памяти и шины Hyper Transport, в AMD называют северным мостом. Частота работы северного моста отличается от тактовой частоты процессора. У двух младших моделей она составляет 2 ГГц, у старших -- 2,2 ГГц. Заявлена «родная» поддержка памяти DDR3-1866.
Измерения
Для проведения измерений мы собрали два тестовых стенда. Первый из них -- на основе процессора AMD FX-8150 и системной платы MSI 990FXA-GD65. Второй -- с процессором Intel Core i5-2500K на плате Gigabyte G1.Sniper2 с набором микросхем Intel Z68 Express.
Плата MSI отказалась запуститься с модулями памяти Silicon Power SP002GBLYU213S02, поэтому тестирование проводилось с памятью DDR3-1333. Это вполне справедливо, поскольку ставит в равные условия решения компаний AMD и Intel. Хотя процессоры Intel официально совместимы лишь с памятью DDR3-1333, все же на практике они успешно работают и с более быстрыми модулями.
Тесты проводились в 64-разрядной операционной системе Windows 7 SP1. Мы не случайно включили в набор тестов последние версии архиваторов WinRAR и 7-Zip. Это пока одни из немногих широко доступных программ, использующих современные наборы инструкций.
Результаты измерений пропускной способности ОЗУ (DDR3-1333, тайминги 9-9-9-24)
Технические характеристики процессоров семейства AMD Zambezi
***
По результатам тестов заметно, что процессор AMD FX способен полноценно раскрыть свой потенциал лишь в многопоточных приложениях. При этом во многих тестах он сильно опережает близкий по цене Intel Core i5-2500K. К сожалению, современные игровые приложения, на которые AMD ориентирует свой продукт, распараллеливаются не столь эффективно, как, например, архиваторы. По скорости работы ОЗУ AMD сильно уступает Intel. Однако платформа AMD позволяет эффективно использовать до четырех видеоплат, что делает ее наиболее подходящей для производительных игровых ПК. Это будет актуально по меньшей мере до тех пор, пока на рынке не появятся новые процессоры Intel Ivy Bridge с поддержкой шины PCI Express 3.0.