В январе текущего года компания Intel официально представила процессоры на основе микроархитектуры Sandy Bridge. В этой статье будет рассказано об особенностях новой микроархитектуры и платформе, в состав которой входят новые процессоры, а также приведены результаты тестирования одного ЦП нового семейства.

Около года назад на рынке появились процессоры семейства Intel Clarkdale, первые в истории ЦП с интегрированным графическим адаптером. Правда, микросхема Clarkdale состоит из двух кристаллов. На одном из них, выполненном по 32-нм технологии, располагаются два ядра микроархитектуры Nehalem. Другой, изготовленный по 45-нм техпроцессу, играл роль северного моста, т.е. содержал в себе контроллеры памяти и интерфейса PCI Express, а также графическую подсистему. Между собой кристаллы были связаны шиной QPI.

Как известно, компания Intel при производстве новых процессоров основывается на принципе, который она называет tick-tock. Он заключается в попеременном обновлении микроархитектуры и техпроцесса производства микросхем. Следом за освоением 32-нм техпроцесса свет увидела очередная микроархитектура, в которой интеграция доведена до уровня кристалла.

Процессоры на базе микроархитектуры Sandy Bridge существенно отличаются от своих предшественников. Чтобы на одном кристалле разместить и ядра, и графическую подсистему, инженеры Intel провели большую работу. Да и сами ядра были значительно усовершенствованы, равно как и графический адаптер, если сравнивать его с Clarkdale.

Обратите внимание на блок-схему, представленную на иллюстрации. Ниже компоненты процессора, представленные на этой схеме, будут рассмотрены по отдельности.

Блок-схема процессора микроархитектуры Sandy Bridge

Ядра

Описание процессора, наверное, стоит начать с ядер, поскольку эта функциональная часть ЦП по-прежнему остается главной по значению, несмотря на все усовершенствования и усложнения, проведенные разработчиками Intel в последних двух поколениях.

Функциональные улучшения заключаются во внедрении очередного набора векторных инструкций х86 под названием AVX(Advanced Vector Extensions), а также в оптимизации, направленной на ускорение обработки инструкций AES, которые впервые были реализованы в микроархитектуре Nehalem. Разработчики стремились осуществить модернизацию таким образом, чтобы соотношение производительность/энергопотребление сохранилось на прежнем уровне либо повысилось.

Так же как и в процессорах с микроархитектурой Nehalem, ядра имеют по 32 Кбайт кэша данных первого уровня и такое же количество кэша инструкций. Правда, у последнего теперь не четыре, а восемь рядов ассоциативности. Помимо кэша инструкций, новые ядра содержат кэш декодированных микроопераций объемом 6 Кбайт, называемый еще «кэшем нулевого уровня». Модуль предсказания переходов подвергся существенной переработке: объем таблицы истории переходов был увеличен вдвое, благодаря чему повысилась вероятность успешного предсказания.

Усовершенствование модуля внеочередного исполнения инструкций заключается в увеличении объема его буферов примерно на треть, что было одним из ключевых условий для успешной реализации AVX. Поскольку такое изменение не могло не отразиться на энергопотреблении процессора, в противовес ему было сделано еще одно усовершенствование, способное это компенсировать. Оно заключается в оптимизации метода вывода результатов. Если раньше после выполнения инструкции ее результат помещался в регистровый файл, то теперь для этого используется так называемый физический регистровый файл (PRF, Physical Reg File), куда перемещаются не сами данные, а лишь указатель, соответствующий регистру, в который записана нужная переменная.

Поскольку набор инструкций AVX предполагает применение 256-бит регистров YMM вместо 128-бит XMM, как это было в предыдущем поколении процессоров, модернизации подвергся и исполнительный кластер. Инженеры объединили имеющиеся тракты данных внутренней шины исполнительных блоков, и теперь ядро способно за один такт производить до восьми 256-бит операций и до шестнадцати 128-бит.

Желтым на блок-схеме ядра обозначены блоки, подвергнутые модернизации

Системный агент и кольцевая шина

Для того чтобы эффективно управлять работой всех доменов многофункционального процессора, разработчики ввели новый модуль, именуемый системным агентом. Он содержит в себе все контроллеры ввода-вывода данных, а именно контроллер памяти DDR3, шины PCI Express, интерфейсов DMI и FDI для связи с микросхемой PCH. Помимо того, в системном агенте имеется аппаратный контроллер питания, обеспечивающий работу технологии TurboBoost 2.0. Кстати, Intel в новом поколении процессоров переименовала кэш-память второго и третьего уровней в MLC (Middle Level Cache) и LLC (Last Level Cache) соответственно. Во избежание путаницы далее в статье будут употребляться именно эти термины.

Компоненты процессора связаны между собой посредством единой шины, построенной по кольцевой топологии. Это предоставляет разработчикам широкие возможности, позволяющие впоследствии добавить дополнительные ядра или блоки LLC. Как показано на блок-схеме, благодаря кольцевой шине, доступ к LLC имеют не только ядра, но и графическая подсистема.

Контроллер памяти — двухканальный. Согласно официальной спецификации, процессоры Core второго поколения поддерживают до 32 Гбайт оперативной памяти. Правда, пока не появилось достоверной информации о том, когда мы увидим первые модули памяти DDR3 объемом 8 Гбайт, пригодные для использования в настольных ПК (без буферизации и поддержки кодов коррекции). Поскольку базовая частота процессора теперь составляет не 133, а 100 МГц, соответствующим образом были изменены и множители. Как и раньше, официально поддерживается память DDR3 с частотами работы 1066 и 1333 МГц, но большинство системных плат позволяет выставить и более высокие множители.

Графика

Графический адаптер также подвергся модернизации по сравнению с предыдущим поколением интегрированной графики Intel. Была добавлена поддержка DirectX 10.1. Производительность исполнительных блоков возросла вдвое благодаря добавлению новых инструкций, а также увеличению объема регистрового файла, что повышает эффективность параллелизации вычислений. Немаловажен также тот факт, что графический домен получил быстрый доступ к ОЗУ через кэш третьего уровня (LLC).

Аппаратное кодирование и декодирование видеоданных теперь осуществляется не шейдерными процессорами, а отдельным узко-специализированным модулем. Кстати, чипсет Intel H67 Express имеет выход HDMI 1.4a, так что любители стереоскопического видео отныне смогут наслаждаться просмотром фильмов даже на интегрированном адаптере.

Еще одним качественным улучшением, которого ожидали от Intel, была, конечно же, поддержка программных интерфейсов, обеспечивающих неграфические вычисления на ГП. Но к сожалению, пока такой функционал в процессорах Intel отсутствует.

Turbo Boost 2.0

За работу функции Turbo Boost теперь отвечает аппаратный модуль PCU (Power Control Unit), являющийся частью системного агента. PCU способен независимо изменять питающие напряжения и рабочие частоты графического домена и ядер. Еще одна особенность TurboBoost версии 2.0 заключается в том, что алгоритм учитывает теплоемкость системы охлаждения. Это позволяет процессору при кратковременной нагрузке настолько повысить тактовую частоту, что потребляемая мощность будет превосходить паспортный термопакет (TDP). Такой подход делает еще более комфортной работу с прикладным ПО, которое большую часть времени создает минимальную нагрузку на процессор.

Модельный ряд ЦП

К настоящему времени Intel выпустила на рынок первое семейство процессоров для настольных ПК на основе новой микроархитектуры, включающее в себя десять моделей. Данный модельный ряд также известен как процессоры Intel Core второго поколения. Стоит запомнить это на случай беседы с продавцом-консультантом. Во избежание путаницы между процессорами разных поколений маркетологи Intel использовали проверенный прием — изменили число цифр в номерах моделей ЦП. И теперь их снова четыре.

Среди десяти представленных процессоров есть одна энергосберегающая модель, Core i5-2500T, с термопакетом всего 45 Вт. Для остальных ЦП стандартным является термопакет 95 Вт. Также имеются два ЦП с разблокированным множителем, которые заинтересуют любителей разгона, — Core i5-2500K и Core i7-2600K.

Отличие моделей Core i5 и Core i7 заключается в объеме LLC, а также в поддержке технологии Hyper Threading.

Новые процессоры еще не поступили в розничную продажу в России, поэтому мы можем привести лишь оптовые цены Intel для партий от 1000 шт. Самый дорогой процессор — Core i7-2600K; он стоит 317 долл. А самый дешевый — Core i5-2400; его цена — 195 долл. Процессор Core i5-2500K, который мы протестировали, стоит 216 долл.

На первый квартал этого года запланирован выпуск двухъядерных процессоров на основе микроархитектуры Sandy Bridge, которые будут иметь еще меньшее энергопотребление: 17--35 Вт.

Новый разъем и чипсеты

Процессоры Intel Core второго поколения несовместимы с наборами микросхем предыдущей серии. Новая платформа включает в себя два чипсета для настольных ПК: P67 Express и H67 Express. Обе микросхемы РСН (Platform Controller Hub) способны обеспечить до восьми линий PCI Express через порты х1, х2 или х4, до 14 портов USB 2.0, четыре порта SATA 2 и два — SATA 3. Обе они поддерживают режимы RAID 0, 1, 5, 10.

Чипсет Intel P67 Express предназначен для использования в производительных системах. Поддержка интегрированной графики в нем отсутствует, зато есть возможность подключения двух дискретных видеоплат через два 8-линейных разъема PCI Express. Соответственно микросхема Intel H67 Express поддерживает вывод графики встроенного в процессор видеоадаптера, но допускает подключение лишь одной дискретной видеоплаты.

Новый процессорный разъем LGA1155 по габаритам аналогичен LGA1156, так что, несмотря на несовместимость процессоров и системных плат разных поколений, крепление системы охлаждения осталось прежним.

Системные платы

Для проведения тестирования мы использовали две системные платы на разных наборах микросхем. Первая из них, MSI P67A-GD65, в данное время является «топовым» продуктом компании MSI. Она поддерживает массивы ATI CrossFireX и nVidia SLI, имеет контроллер интерфейса IEEE 1394, дополнительный контроллер SATA 3 и два контроллера USB 3.0, один из которых подключается к специальной панели, предназначенной для установки в 3,5-дюймовый отсек.

Системная плата MSI P67A-GD65

Из нового функционала обращают на себя внимание обновленная версия функции OC Genie, обеспечивающая разгон одним нажатием кнопки, а также встроенная операционная система Winki 3 на основе Linux. BIOS системной платы имеет графический пользовательский интерфейс с поддержкой мыши. Наряду с кнопкой OC Genie о предрасположенности этой системной платы к разгону свидетельствует наличие на ней точек контроля напряжения, к которым можно подключить мультиметр. Кроме того, MSI теперь использует танталовые конденсаторы в цепях питания ЦП и более качественные дроссели, чем на предыдущих платах. Цена платы MSI P67A-GD65 — 5600 руб.

Системная плата Biostar TH67XE стоит немного дешевле, чем устройство компании MSI; ее розничная цена составляет 4000 руб. Помимо функциональности, обеспеченной чипсетом, плата Biostar отличается наличием контроллера USB 3.0 и одного разъема расширения PCI. На ней распаяны два разъема PCI Express x16, однако один из них фактически является портом х1 и разведен через РСН. На задней панели есть все современные видеовыходы, в том числе DisplayPort.

Системная плата Biostar TH67XE

Тесты производительности

Комания Intel любезно предоставила нашему изданию образец процессора Core i5-2500K. Для тестирования производительности мы собрали стенд, в состав которого, наряду с упомянутым процессором и системными платами, входили жесткий диск Seagate Barracuda 7200.11 ST31500341AS емкостью 1,5 Тбайт, блок питания Hiper HPU-4M780PE мощностью 780 Вт и два модуля памяти Apacer 78.AAGC6.BS1 (DDR3-1333, тайминги 9-9-9-24, питающее напряжение 1,5 В). На тестовый стенд была установлена 64-разрядная ОС Microsoft Windows 7 Ultimate.

Для наглядности мы представили в таблице результаты нескольких других процессоров, взятые из предыдущих статей.

Главное преимущество нового процессора, которое показали результаты тестирования, – отличная пропускная способность ОЗУ. По результатам синтетических тестов, напрямую замеряющих пропускную способность, она не хуже, чем у процессоров с 3-канальным контроллером памяти. Это преимущество также заметно и в общих тестах производительности, работающих в один поток. Там Core i5-2500K идет, как говорится, ноздря в ноздрю с процессором Core i7-980X семейства Gulftown, но значительно превосходит Core i7-875K семейства Lynnfield. Несомненно, столь значительного повышения эффективности удалось добиться благодаря применению «умной» кольцевой шины, обеспечивающей минимальные задержки.

Для оценки производительности интегрированного графического адаптера был выбран синтетический тест FutureMark 3DMark Vantage, в котором он показал весьма неплохие результаты, сравнимые с показателями дискретных видеоплат нижнего ценового диапазона. Однако в играх, использующих DirectX 10, картина оказалась не столь радужной. В игре Resident Evil 5 при отключенном сглаживании и разрешении 1280х1024 процессор выдал 22 кадр/с, а в Metro 2033 при том же разрешении экрана и минимальных настройках качества — 17 кадр/с. Впрочем, чуда от интегрированной графики никто и не ожидал. Имеющейся производительности, вероятно, будет достаточно для не слишком ресурсоемких онлайн-игр, а большего от нее не требуется.

Разгон

После того как основная часть тестирования завершилась, мы оценили разгонный потенциал процессора. Благо мы располагаем ЦП с разблокированным множителем. Разгон осуществлялся на системной плате MSI. Для охлаждения был применен воздушный кулер Scythe Kabuto. Нам удалось заставить процессор работать стабильно при тактовой частоте 4,7 ГГц, подняв питающее напряжение ядер с номинальных 1,2 до 1,4 В. Это очень хороший результат. Ранее ни один из процессоров, которые нам доводилось тестировать, не сохранял стабильность на столь высокой частоте при использовании простой воздушной системы охлаждения. Остается лишь надеяться, что модели, которые скоро поступят в розничную продажу, по разгонному потенциалу не будут слишком сильно отличаться от инженерного образца, рассмотренного нами.

* * *

Подведем итоги. Новый процессор, который побывал в нашей тестовой лаборатории, сам по себе оказался отличной иллюстрацией того значительного шага на пути развития, который сделали инженеры из Intel. Помимо интеграции графического домена в процессор, что само по себе было непростой задачей, наблюдается прирост производительности, энергоэффективности и ценовой эффективности ЦП. Особенно радует то, что выпуск ЦП на основе новой микроархитектуры был начат со среднего ценового диапазона, что безусловно обрадует взыскательного потребителя.

Мы присуждаем процессорам Intel Core второго поколения награду «Техническая инновация».