Обзор февральского 2003 года выпуска журнала Computer (IEEE Computer Society, V. 36, No 2, February 2003)
В исследованиях, влияющих на разработку серверов, используются научные и технические эталонные тесты, такие как SPECint и SPECfp. Это объясняется несколькими причинами. Среди них привычка исследователей к таким тестовым наборам, трудность работы с коммерческой нагрузкой, включая повышенные требования к аппаратуре, отсутствие доступа к исходному коду коммерческих приложений и т.д. |
Темой февральского номера являются подходы к оцениванию серверов в условиях коммерческой рабочей нагрузки. В соответствии с этим названа и заметка приглашенных редакторов Кимберли Китон (Kimberly Keeton, Hewlett-Packard Labs), Рассела Клэппа (Rassel Clapp, Fabric7 Systems) и Ашвини Нанда (Ashwini Nanda, IBM Watson Research Center): Evaluating Servers with Commercial Workloads. В этой заметке отмечается, что большинство современных микропроцессорных серверных систем используется в условиях коммерческой рабочей загрузки. К соответствующим видам приложений отнесены классические приложения баз данных категорий OLTP (online transaction processing — «оперативная обработка транзакций») и DSS (decision support system — «система поддержки принятия решений»), Web-серверы, почтовые серверы, многозвенные приложения электронной коммерции. Однако в исследованиях, влияющих на разработку этих серверов, используются научные и технические эталонные тесты, такие как SPECint и SPECfp. Это объясняется несколькими причинами. Среди них привычка исследователей к таким тестовым наборам, трудность работы с коммерческой нагрузкой, включая повышенные требования к аппаратуре, отсутствие доступа к исходному коду коммерческих приложений и т.д. В последние годы ситуация стала меняться, и этим изменениям посвящена тематическая подборка данного номера.
Название первой большой статьи подборки — «Тестовые испытания серверов Internet на суперскалярных машинах» (Benchmarking Internet Servers on Superscalar Machines). У статьи пять авторов из Техасского университета и из корпорации IBM. Имя первого по списку автора Ю Люо (Yue Luo). В статье обсуждаются результаты пропуска трех популярных тестовых наборов для серверов Internet на трех современных микропроцессорах, и эти результаты сравниваются с результатами испытаний на тестовом наборе SPECint2000. Использовались два RISC-процессора IBM (RS64-III и IBM POWER3-II) и Intel Pentium III. Платформы IBM работали под управлением операционной системы AIX, а компьютер на базе Pentium III был оснащен Windows NT Workstation 4.0. В качестве Web-сервера использовался Apache 1.3.23. Виртуальные машины Java поддерживались с помощью IBM Java Development Kit 1.1.8 (платформа IBM) и с помощью Sun JDK 1.3.0 вместе с HotSpot Server (Intel). В качестве тестовых наборов для сервера Internet были выбраны SPECweb99, VolanoMark и SPECjbb2000. Тест SPECweb99 (www.spec.org/web99) предназначен для измерения производительности Web-сервера. В рабочей нагрузке этого тестового набора моделируется множественный доступ к Internet-провайдеру, а сервер поддерживает Web-страницы для нескольких разных организаций. VolanoMark (www.volano.com/benchmarks) основан на коммерческом чат-сервере VolanoChat. Пакет можно поделить на клиентскую и серверную части. По требованию клиента сервер устанавливает с ним соединения. Далее в клиенте моделируется наличие нескольких разговорных комнат, в каждой из которых может находиться несколько пользователей. Клиент непрерывно посылает серверу сообщения и ожидает, пока сервер выполнит широковещательную рассылку этого сообщения всем пользователям той же разговорной комнаты. Наконец, SPECjbb2000 (www.spec.org/jbb2000) — это первый тестовый набор для приложений электронного бизнеса. Java Business Benchmark эмулирует в трехзвенной системе рабочую нагрузку, характерную для электронной коммерции. В этом тестовом наборе содержатся бизнес-логика и манипулирование объектами реального бизнес-сервера. Если не вдаваться в технические детали, то результаты испытаний микропроцессоров IBM существенно убедительнее Pentium III. С другой стороны, для всех процессоров среднее число тактов, требуемое для выполнения команды, на тестовых наборах для сервера Internet, заметно больше, чем в случае SPECint2000.
У следующей статьи два автора — Даниель Гарсия (Daniel Garcia) и Жевиер Гарсия (Jevier Garcia). Статья называется «Применение тестового набора электронной коммерции TPC-W» (TPC-W E-Commerce Benchmark Evaluation). При оценке производительности на основе какого-либо тестового набора электронной коммерции необходимо учитывать три ключевых аспекта.
- Определение параметров рабочей нагрузки. Между разными моделями электронной коммерции имеются существенные различия, и одна рабочая нагрузка не может должным образом соответствовать всем моделям.
- Метрика, используемая для измерения производительности. Наиболее частой метрикой является максимум пропускной способности сервера при наличии ограничений на время выполнения транзакций.
- Чувствительность метрики. Понимание поведения метрики при изменении параметров системы является существенным фактором применимости тестового набора.
Тестовый набор TPC-W имеет архитектуру «клиент-сервер». Функцией клиентов является эмуляция удаленных браузеров с целью моделирования рабочей нагрузки реальных потребителей. Эмулятор шлюза платежей представляет объект, аутентифицирующий пользователей и авторизующий платежи. Тестируемая система, включающая сервер HTTP со своей средой хранения, сервер приложений и базу данных приложения, взаимодействует с клиентами через выделенную сеть. Авторы статьи условно разделяют системы электронной коммерции на три класса. Модель киберпосредника (cybermediary) представляет компанию, которая выступает в качестве посредника между поставщиком продуктов или услуг и конечными потребителями. TPC-W хорошо соответствует этой модели, но с тем ограничением, что в тестовом наборе все продукты поставщика считаются зарегистрированными во внутренней базе посредника. Модель производителя представляет компанию, которая продает и распространяет свои продукты прямо конечным потребителям. TPC-W покрывает все основные аспекты этой модели. Наконец, модель аукциона представляет компанию, которая заведует фондовым аукционным рынком, где и продавцы (предоставляющие компании списки товаров), и покупатели (предлагающие свои цены на товары) являются конечными потребителями. TPC-W не соответствует этой модели должным образом. Далее в статье авторы обсуждают, каким образом можно сформировать рабочую нагрузку в каждой из моделей, и рассматривают различные реализационные аспекты TPC-W.
В списке авторов статьи «Моделирование коммерческого сервера стоимостью в два миллиона долларов на персональном компьютере ценой в две тысячи» (Simulating a $2M Commercial Server on a $2K PC) сразу восемь имен. Семь человек работают в университете Висконсин, еще один — в университете Дюка. Первым в списке числится Алаа Аламелдин (Alaa Alameldeen). В статье описываются результаты проекта, выполненного группой Multifacet Project Висконсинского университета. Проект основывался на использовании имитационной среды Simix шведской компании Virtutech (см. обзор журнала Computer за февраль 2002 года). Задача состояла в том, чтобы добавить к этой среде ряд дополнительных компонентов, позволяющих запускать в ней тестовые наборы, предназначенные для мощных коммерческих серверов, а также создать дополнительное программное обеспечение, адаптирующее рабочую нагрузку тестовых наборов к имитационной среде. Разработанные средства позволяют запускать в имитационной среде четыре тестовых набора: TPC-C с использованием СУБД IBM DB2, SPECjbb (см. выше), собственный тестовый набор для Web-сервера со статическими страницами (на основе Apache), а также собственный тестовый набор для Web-сервера с динамическими страницами (на основе Slashcode).
Тин-Фонг Цуи (Thin-Fong Tsuei) и Вэйне Ямамото (Wayne Yamamoto) из корпорации Sun Microsystems представили статью «Имитационная модель с очередями для мультипроцессорных систем» (Queuing Simulation Model for Multiprocessor Systems). В предложенной авторами модели процессора с очередями обеспечивается оценивание подсистем памяти и архитектуры больших многопроцессорных систем при наличии коммерческих рабочих нагрузок категории OLTP с интенсивной работой с памятью. В модели не имитируется выполнение команд; она основывается на характеристиках процессора и рабочей нагрузки, которые легко собрать и оценить. Моделируется минимальный набор характеристик процессора и рабочей нагрузки, которые фиксируют важные взаимодействия между сложным процессором и иерархией памяти. Чтобы убедиться в том, что предложенная модель позволяет получить достаточно точные результаты, авторы сравнивали результаты пропуска TPC-C на своей модели и на модели, эмулирующей команды процессора. Вывод состоит в том, что модель с очередями удовлетворительно точна, просто реализуется и быстро выполняется.
Наконец, еще одна статья подборки называется «Разработка рабочих нагрузок для исследования компьютерных архитектур» (Designing Computer Architecture Research Workloads). Ее написали три автора из бельгийского университета Гента: Ливен Екхаут (Lieven Eeckhout), Ханс Вандерендонк (Hans Vandeirendonck) и Коен Де Боссчере (Koen De Bosschere). В статье предлагается методология, позволяющая сократить число тестовых наборов и уменьшить объемы их входных данных, но сохранить при этом рабочую нагрузку, необходимую для исследования компьютерной архитектуры. Основная цель состоит в сокращении времени пропуска тестовых наборов на имитационной модели микропроцессора на этапе его проектирования.
Мартовский выпуск журнала Computer должен быть посвящен инженерии программного обеспечения. Увидимся. Сергей Кузнецов, kuzloc@ispras.ru.