Великий все-таки был философ Иммануил Кант: введенное им понятие «вещь в себе» вполне применимо, например, к процессору. Конечно, последний можно использовать по прямому назначению в вычислительных системах, но, с другой стороны, центральные процессоры могли бы неплохо отапливать небольшие помещения, выступать в роли декоративных брошек или, будучи положены ножками вверх на стул школьной учительницы, заменить собою целую россыпь канцелярских кнопок.
А если серьезно, то и для обычных пользователей, и для продвинутых экспертов центральный процессор таит в себе массу загадок и неожиданностей. Еще бы, даже непосредственные разработчики микропроцессоров не знают точно, как поведет себя их логическая схема узлов после воплощения в кусочке обычного кремния.
Мог ли кто предположить несколько лет назад, что ядра процессоров Athlon/Athlon 64 и R3xx/R4xx позволят компаниям AMD и ATI на равных тягаться с гигантами Intel и nVidia? А между тем лишь благодаря технической фортуне да пытливости журналистов новинки AMD и ATI буквально ворвались в компьютерные системы многих домашних пользователей.
Вот и сейчас, задумав серию материалов об энергосберегающих технологиях в «настольных» процессорах, в ряде тестов мы получили очень неожиданные данные, от которых глаза технических специалистов Intel и AMD становились круглыми, а амбиции знатоков — скромными . Но давайте сначала познакомимся с теоретическими выкладками технологий AMD Cool?n?Quiet (аналог AMD PowerNow!) и Intel Geyserville 3 (аналог Enhanced Intel SpeedStep), а затем оценим их реальную эффективность.
В теории
ПК DESTEN eStudio-832P и счетчик СО-505: тестовый стенд готов к работе |
Если раньше интересные процессорные технологии сначала появлялись в дорогих серверных системах, а затем медленно спускались в класс домашних и мобильных компьютеров, то с энергосберегающими технологиями AMD и Intel все произошло иначе. Зародившись несколько лет назад под именами AMD PowerNow! и Enhanced Intel SpeedStep в мобильных платформах, они постепенно перекочевывают в сегменты настольных и серверных компьютеров.
Действительно, зачем круглые сутки гонять на 100% корпоративный почтовый сервер, если известно, что основная нагрузка ложится на него лишь с девяти до 18 часов? И зачем нужна энергозатратная производительность ЦП в офисных приложениях или во время простоя домашнего ПК? Согласитесь, потребителю есть где сэкономить на электроэнергии...
Отметим сразу, энергосберегающие технологии от компаний AMD и Intel, за исключением небольших технических нюансов, очень сходны между собой. А вот настольные процессоры Pentium 4, в отличие от микропроцессоров Athlon 64, пока поддерживают технологию Intel Geyserville 3 лишь в умах маркетологов да в некоторых инженерных образцах, коих мы так и не смогли раздобыть. Однако уже в первой половине 2005 г. ситуация должна кардинально поменяться.
Разумеется, все новейшие процессоры AMD и Intel поддерживают стандарт управления питанием ACPI версии 2.0, который включает характерные уровни управления системой (S-State), подсистемой, устройством (D-State), шиной, процессором (C-State и P-State). Самым интересным здесь представляется подмножество состояний процессора C-States: C1(Halt), C2(Stop Grand), C3(Sleep) и C0(интересующий нас набор режимов управления ЦП — P-States). Все современные центральные процессоры можно условно разделить на устройства с поддержкой С0(или P-States) и без нее (более подробную информацию о стандартах управления питанием и используемой терминологии можно найти на сайте www.acpi.info).
Режимы P-States (Processor Performance States, рабочее состояние процессора) — это правильные комбинации напряжений и частот работы ядра процессора для разных нагрузок. Идеально подобранная пара «напряжение—частота» позволяет адекватно выставить необходимую производительность для выполнения текущих задач, что в свою очередь позволит снизить энергопотребление и тепловыделение ЦП в большинстве рабочих ситуаций.
Различные процессоры могут иметь разное число возможных режимов P-States, например, в процессорах Pentium 4 количество запрограммированных комбинаций «напряжение — частота» может колебаться от двух (в дешевых образцах) до 16 (в самых продвинутых ЦП). Аналогичный маркетинговый подход мы видим и в процессорах AMD Athlon 64, а полную раскладку по типам существующих процессоров AMD и возможным режимам P-States мы привели в таблице к статье «Процессоры AMD разорят РАО «ЕЭС России»?» (см. «Мир ПК», № 1/05).
Важная роль в энергосберегающих технологиях процессоров отводится соответствующей поддержке в системных платах, поскольку используемая BIOS должна:
- уметь определять наличие поддержки режимов P-States в установленном ЦП (т.е. анализировать поля CPUID и возвращаемое значение функции 8000_0007h);
- иметь полную таблицу комбинаций «напряжение—частота»;
- иметь набор микросхем и системных ограничений для работы с/без поддержки объектов P-States, описанных стандартом ACPI версии 2.0.
С учетом поддержки современными операционными системами объектов ACPI, вырисовывается следующий алгоритм выполнения переходов между состояниями P-States:
- ОС, проанализировав накопленную статистику простоев, решает, что требуется сделать переход от одного P-State к другому, и вызывает драйвер процессора (допустим, для повышения производительности).
- Драйвер процессора (см. «МирПК», №1/05, с.32) сообщает ОС, что необходимый переход допустим, и начинает его осуществление.
- Драйвер процессора поэтапно повышает напряжение ядра до необходимого максимума с одинаковыми шагами MVS (Maximum Voltage Step) за одинаковые промежутки времени VST (Voltage Stabilization Time).
- Драйвер процессора, достигнув необходимого напряжения, меняет частоту работы ядра на новое значение, которое запросила система (и в этот короткий промежуток времени ЦП недоступен, так что чем этот промежуток меньше, тем лучше).
Когда системе требуется пониженный P-State, то выполняется точно такой же алгоритм действий, но с учетом необходимого понижения напряжения на ядре.
Наглядно представить весь процесс смены состояний P-States помогут две схемы восходящих переходов в процессорах AMD и Intel (см. график 1 и график 2). Налицо некоторая разница: технология AMD Cool?n?Quiet на третьей ступеньке нашего алгоритма к необходимому новому напряжению добавляет небольшой задел RVO (Ramp Voltage Offset — превышение напряжения), который убирается сразу после смены частот ядра (шаг 4) и частотно-вольтажные показатели нового состояния P-State возвращаются к стандартным. Такое поведение придает надежности работе процессора Athlon 64, но отнимает лишние 100 мкс для полного выполнения всего перехода. А все эти мгновения складываются в доли секунды, уже ощутимые для человека.
Шаги изменения напряжения ядра (MVS) в процессорах Athlon 64 в 2 раза больше, чем у процессоров Pentium 4, а значит, нужные значения напряжения выставляются за меньшее количество стабилизационных периодов. Но вот стабилизационное время у процессоров AMD в 20 раз больше, чем у конкурентных решений, и поэтому процессоры Pentium 4 выигрывают у семейства Athlon 64 по необходимому времени стабилизации для итогового изменения состояния P-State. Более того, в момент, когда процессор недоступен (на этапе смены частоты), провал ЦП Athlon 64 должен быть заметней, но напомним, это лишь в теории. На практике мы уже более года плотно работаем с технологией AMD Cool?n?Quiet, а вот процессоров Pentium 4 с поддержкой технологии Intel Geyserville 3 пока не видели вообще.
На практике
ПК DESTEN eStudio-832P |
Надеемся, с теорией мы разобрались, теперь можно перейти к реальным тестам энергопотребления современных процессоров в различных рабочих ситуациях. Поскольку начало нашему тестированию было положено в вышеупомянутой статье «Процессоры AMD разорят РАО «ЕЭС России»?» при работе с ПК Formoza S320+ на базе процессора AMD Athlon 64 3200+, то на этот раз мы подобрали серийный ПК Desten eStudio-832P на базе 3,2-ГГц процессора Intel Pentium 4 (Northwood).
На техническом уровне компьютеры Formoza S320+ и DESTEN eStudio-832P отличались друг от друга лишь процессором, системной платой и корпусом. Так что сравнение «прожорливости» процессоров прошло максимально корректно (тем более, что в системный блок ПК DESTEN мы установили БП Thermaltake XP480, используемый в ПК Formoza S320+). Пользуясь таким случаем, мы еще сняли показания с компьютера DESTEN eStudio-832P, заменив в нем штатный процессор на 3,2-ГГц Intel Pentium 4E (Prescott).
Для уверенности в полученных результатах и наших выводах мы замеряли энергопотребление по ГОСТ 6570—96 счетчиком СО-505, а потребляемую мощность — сертифицированным прибором SATURN LF-202 SE (www.saturn.com.ru). И полученные с разных измерительных устройств данные оказались взаимосвязанными.
Общий анализ результатов тестов показывает гипотетическую выгоду в затратах на электроэнергию при эксплуатации системы на базе процессора AMD Athlon 64 3200+. Но необходимо помнить, что системная плата компьютера должна поддерживать технологию AMD Cool?n?Quiet, иначе более привлекательным становится ПК на базе 3,2-ГГц Intel Pentium 4 (Northwood).
Пока процессор Pentium 4 не поддерживает энергосберегающие технологии GV3, но тем не менее управление питанием системной платы Gigabyte GA-8IK1100, использующейся в ПК DESTEN, позволяет аккуратно работать с энергоресурсами в ситуациях частого простоя и при решении офисных задач.
Как и предполагалось, самым «прожорливым» в тестах оказался ЦП Prescott, но в среднем его результаты лишь чуть хуже показателей Athlon 64 с отключенной функцией Cool?n?Quiet. А поскольку свое будущее компания Intel связывает именно с ядром Prescott, то вывод один: нужно скорее внедрять технологию Geyserville 3 в настольные системы. Иначе в руках конкурентов останутся важные козыри.
Но самое интересное содержится в первом столбце таблицы результатов. Из него видно, что даже «выключенный» ПК использует немало электроэнергии по дежурной шине +5Vsb. Потребляемая мощность по ней составляет 25 Вт у процессора Northwood и 16—17 Вт у альтернативных ЦП. И если сделать элементарный подсчет, то видно, что простой сетевой фильтр типа «пилот» с кнопкой выключения позволит хорошо сэкономить и без технологии AMD Cool?n?Quiet (главное — как можно реже включать компьютер ). Кстати, это первый неожиданный результат тестирования, но возможно, он обусловлен влиянием 400-Вт блока питания Thermaltake XP480.
А вот то, что в выключенном состоянии системная плата на базе Northwood потребляла больше электроэнергии, чем аналогичная платформа с процессором Prescott, стало для нас откровением. Что это, скрытые сюрпризы электропитания процессора нового поколения или все дело в плате? По возможности мы обязательно проверим разные гипотезы и вскоре сообщим результаты.
Если заглянуть в близкое будущее, то не за горами появление в наших ПК двухъядерных процессоров, и пока можно лишь предсказать их завидную производительность при использовании специального программного обеспечения и прогнозируемый проигрыш в устаревших тестах. Но сразу очевидно одно: в целях энергосбережения и последующего снижения тепловыделения разработчики новейших ЦП (с двумя ядрами) заложат в них возможность отключения одного вычислительного центра в случаях простоя компьютера (или его низкой загрузки). А как иначе? На рынок пришло время бережного отношения к финансам пользователя.
Редакция выражает благодарность компаниям Desten (www.desten.ru) и Formoza (www.formoza.ru) за предоставленные для тестирования серийные ПК.
Перекресток технологий Geyserville 3 (GV3) и Hyper-Threading (HT)
Операционная система рассматривает ЦП с поддержкой Hyper-Threading как два логических процессора, но сам физический процессор может находиться лишь в одном состоянии P-State. При этом оба логических устройства используют одну и ту же пару значений «напряжение—частота».
Важно отметить, что каждый логический ЦП может запрашивать свое состояние P-State, и BIOS координирует эти требования. По умолчанию выставляется самый высокий P-State из требуемых процессорами режимов.
Пока в обычных процессорах Intel Pentium 4 при загрузке одной ли нитки Hyper-Threading или двух разницы в энергопотреблении нет. Впрочем, если технологию HT просто отключить в BIOS, различия в «прожорливости» тоже не будет.