мультимедиа является необходимым атрибутом самого понятия «рабочая станция». Мы, однако, использовали в заголовке статьи термин «графические станции», чтобы подчеркнуть графические возможности (в первую очередь для задач трехмерной графики) компьютеров, архитектуру которых мы анализируем в данной статье.
С точки зрения автора, рассматриваемые ниже рабочие станции двух ведущих в этой области фирм - Silicon Graphics и Intergraph - являются наиболее «продвинутыми» продуктами, доступными для платформы x86, и соответственно представляют наибольший интерес для потребителя.
Новые микропроцессоры Intel Pentium II/III, особенно с быстрым кэшем второго уровня (Xeon), уже обгоняют по целочисленной производительности (SPECint95) большинство процессоров RISC-архитектуры, кроме Alpha и HP PA-RISC. Хотя по производительности операции с плавающей запятой Intel пока отстает (это касается 64-разрядных чисел с плавающей запятой). Внедрение специализированных команд с плавающей запятой в архитектуру х86 компаниями AMD и Intel позволило существенно повысить производительность этих процессоров для задач машинной графики, в которых достаточно использовать короткие числа с плавающей запятой.
В результате применение x86-процессоров в рабочих станциях при решении графических и мультимедийных задач представляется весьма перспективным. Однако, как мы увидим ниже, для решения данного класса задач высокой производительности процессоров недостаточно. Возникает вопрос, достаточно ли использование в этой области обычных современных ПК, архитектурные особенности которых задаются, кроме собственно процессоров, поддерживающим набором микросхем (таким, как Intel 440BX/GX и т.п.), если оснастить эти ПК мощной графической картой. Забегая вперед, скажем, что ответ на этот вопрос - «нет, недостаточно».
Чтобы прояснить ситуацию, обратимся к типовой архитектуре современного ПК на базе Intel Pentium II (рис.1).
В более старой архитектуре ПК мы имели 66 - мегагерцевую процессорную шину, что при ее разрядности в 8 байт начало приводить к проблемам, связанным с ограничением пропускной способности (ПС) тракта процессор-оперативная память (ОП). Возможно, еще одним узким местом для потенциальных рабочих станций с данной архитектурой является подсистема ввода-вывода. Вся ее ПС лимитируется единственной 32-разрядной PCI-шиной с пиковой ПС 133 Мбайт/с.
В слотах этой шины, с учетом областей применения рабочей станции, должны размещаться графическая, сетевая и звуковая карты и (поскольку хорошо бы иметь быстрые диски) впридачу карта SCSI (если не Fibre Channel). Но уже одни лишь требования к ПС от графической карты могут превысить ПС PCI-шины.
Современная сетевая карта имеет пиковую ПС 12,5 Мбайт/с (Fast Ethernet), UltraWIde SCSI - 40 Мбайт/с (конечно, если диск один, эта ПС не будет выбрана) и т.д., так что обычно PCI-шина не может «тянуть» столько слотов. Поэтому в архитектуру PCI-шины вводится мост, обеспечивающий буферизацию данных и дополнительные (вторичные) PCI-слоты (рис.1). Однако не все PCI-карты могут работать во вторичных слотах. Выделение «графического слота» на отдельную шину, т.е. идея AGP-порта, представляется вполне естественным. AGP-шина с ПС 533 Мбайт/с (против 133 Мбайт/с у PCI) способна существенно поднять графическую производительность. Кроме того, в этом варианте архитектуры ПС тракта процессор-ОП также была увеличена до 800 Мбайт/с за счет применения 100-мегагерцовой процессорной шины и более быстрой памяти SDRAM.
Однако ясно, что теперь узким местом может стать суммарная ПС всех потоков данных, пропускаемых через поддерживающий набор микросхем: передача данных из ОП в AGP-порт, обмен данными между процессором и ОП и передача данных от PCI-устройств ввода-вывода в ОП (представьте себе, например, что передается видеоинформация) - одно может мешать другому.
Собственно, это и позволяет утверждать, что даже такая усовершенствованная архитектура ПК для профессиональной рабочей станции негодится. Двухпроцессорные или четырехпроцессорные системы с архитектурой, подобной представленной на рис.2, т.е. когда к процессорной шине подсоединяется более одного процессора, имеют те же самые узкие места, и утверждение о непригодности остается в силе.
Что касается рабочих станций на базе RISC-архитектуры, то для многих из них также возникали подобные проблемы. Однако современные рабочие станции RISC-архитектуры поддерживают более одной шины ввода-вывода, в т.ч. 64-разрядные PCI, и для решения проблемы «соперничества» между потоками данных все чаще используется не системная шина, а технология коммутации.
Очевидно, ничто не мешает использовать коммутаторы в архитектуре высокопроизводительных рабочих станций на базе х86-Intel, хотя эти процессоры и разрабатывались в расчете на системную шину. Таким путем пошли специалисты компании Silicon Graphics при разработке рабочих станций на платформе Intel. Другой подход, пожалуй, более традиционный, продемонстрировала фирма Intergraph. В этой статье мы рассмотрим оба подхода.
Архитектура рабочих станиций Intergraph TDZ2000
Пожалуй, наиболее популярными среди графических рабочих станций на платформе Intel x86 в последнее время были ViZual Workstation TDZ2000 производства компании Intergraph (мы, естественно, имеем в виду область профессиональных приложений - в 3D-графике, при обработке видеоинформации и т.п.).
Эта фирма предлагает пользователям рабочие станции не с ОС Unix, а с Windows NT, что, как считается, способствует уменьшению стоимости. Рост производительности процессоров Intel, а также применение высокопроизводительных графических карт позволил этим рабочим станциям составить конкуренцию рабочим станциям RISC-архитектуры, в том числе «законодателю мод» в этой сфере - SGI.
Cекрет успеха Intergraph связан не только с наличием мощной графической карты и с ростом производительности процессора Intel x86, но и с особой архитектурой станций TDZ2000, называемой CMA (Concurrent Multiport Architecture), Особенности архитектуры по сравнению с представленной на рис.1 обусловлены применением поддерживающего набора микросхем компании Reliance Computer - Сhampion 2.0.
Общая идея CMA состоит в использовании в архитектуре TDZ2000 двух наборов микросхем вместо одного. Кстати, аналогичные идеи были реализованы и некоторыми другими производителями рабочих станций на платформе Wintel. В архитектуре СМА имеется два контроллера ОП, соответственно в 2 раза увеличена ее емкость (до 3 Гбайт) и ПС (до 1,6 Гбайт/с). В сочетании с поддержкой трех PCI-шин и возможностью применения двух процессоров Pentium II станции TDZ2000 представляют собой действительно мощный графический инструмент.
В наборе микросхем Champion поддерживается система буферов чтения/записи для всех основных трактов: процессор-ОП, процессор-шина AGP, ОП-PCI и т.д. Эти буферы имеют к тому же большую емкость, чем в альтернативных наборах микросхем. В результате уменьшается конкуренция потоков данных и возрастает эффективная ПС. Однако гарантированной ПС, в отличие от коммутатора, такой подход не дает.
В наборе микросхем Champion поддерживаются также кэши ввода-вывода, которые обеспечивают и когерентность кэшей процессора в двухпроцессорной системе. Кроме того, в этих кэшах буферизуются данные, передаваемые шинами PCI в ОП.
Процессор Pentium II поддерживают при работе с ОП расщепленную обработку транзакций. Обычно до 4 запросов процессор в ОП могут обрабатываться одновременно. При использовании Champion 2.0 может одновременно обрабатываться уже до 8 таких запросов. Кроме того, подсистема ОП TDZ2000 подерживает до 8 открытых страниц ОП. Все это позволяет достигнуть высокого реального уровня ПС ОП.
В качестве процессора в TDZ2000 использовались сначала Pentium II/300 МГц. В моделях TDZ2000 GT1 (строго говоря, именно об их архитектуре мы рассказали выше) применяются Pentium II/400 МГц. Пиковая ПС ОП в этих системах выше, чем в двухпроцессорных рабочих станциях SGI Octane на базе RISC-процессора.
Недавно Intergraph анонсировала новейшую рабочую станцию ViZual Workstation TDZ2000 GX1 на базе Pentium II Xeon/450 МГц или Pentium III Xeon/500 МГц с кэшем второго уровня емкостью
512 Кбайт, также содержащую до 2 МП. Известно, что емкость ее ОП составляет от 64 Мбайт до 2 Гбайт, и что в GX1 используются наборы микросхем Intel 440GX AGPset.
Что касается собственно графических подсистем, применяемых в TDZ2000, то здесь Intergraph предлагает целый спектр возможностей. Вместе с TDZ2000 GX1 могут поставляться графические подсистемы (акселераторы) Intense 3D Wildcat 4000, которую Intergraph назвала «новым стандартом для 3D-графики», а также Realizm II 3D, Intense 3D Pro 2200S и хорошо известные платы Matrox Millenium G 200.
Последние системы уже можно отнести к более низкому классу графической производительности. Realizm II 3D предлагается в нескольких модификациях и пользователь может выбирать, заказывать ли дополнительные функции с соответствующим увеличением цены. По мнению Intergraph, это позволяет достичь лучшего соотношения стоимость/производительность при работе с конкретными трехмерными приложениями пользователя.
В акселераторах использована технология Direct Burst фирмы Intergraph, позволяющая повысить производительность OpenGL, Heidi и RenderGL. При всех стандартных разрешениях (всего поддерживается до 2.5 млн. пиксел) обеспечивается работа с 24-разрядным цветом. В модификации VX113A обеспечивается разрешение до 1280х1240; двойной буфер кадра имеет емкость 16 Мбайт, а память текстур - до 16 Мбайт. Вариант VX-25 предусматривает разрешение до 1280х1386 при емкости буфера кадра 32 Мбайт, и памяти текстур - от 16 до 64 Мбайт.
Характеристики производительности этих систем весьма высоки. На тестах OpenGL (Viewperf) по данным на 1997 г. TDZ2000 VX25-GT c Pentium II/300 МГц вообще превосходила рабочие станции RISC-архитектуры, в том числе SGI O2 и Octane. Однако стоимость этих систем составляла порядка 18 тыс. долларов, то есть они дороже, чем SGI O2, хотя и дешевле старших моделей рабочих станций SGI-архитектуры, в том числе SGI Octane.
Мы не будем рассматривать здесь технические характеристики менее мощных систем Intense 3D Pro 2200S (их можно найти на Web-сервере Intergraph. Для профессионалов в области машинной графики не составит труда дать им собственную оценку.
Укажем только некоторые данные по новой системе Intense 3D Wildcat 4000: 16-мегабайтный буфер кадра (SDRAM); 64 Мбайт памяти текстур; производительность 3 GFLOPS против 0,8 GFLOPS в VX25-GT; поддержка DirectDraw, Direct 3D, OpenGL, RenderGL и других графических API. Данный акселератор, естественно, поддерживает 24-разрядные цвета с двойным буферированием при всех разрешениях, а также допускает подсоединение двух мониторов.
Стоимость TDZ2000 GX1 начинается от 3945 долл. (цена в США). Однако можно предположить, что при комплектации мощными графическими подсистемами она будет существенно выше.
Архитектура рабочих станций SGI Visual Workstation
Как и Intergraph, компания SGI при разработке новых рабочих станций на базе процессоров Intel x86 пошла по пути разработки собственного набора микросхем. Однако общая архитектура этих станций, у которых кодовое название Visual PC было заменено на Visual Workstation, кардинально отличается от используемой в TDZ2000. Основные архитектурные идеи SGI связаны с применением техники коммутации, использованием основной ОП помимо прочего для памяти текстур и буфера кадра, а также выделением отдельных трактов для передачи мультимедийной информациии вместо применения для этих целей шин PCI.
Архитектура Visual Workstation названа разработчиками IVC (Integrated Visual Computing). Она является естественным развитием архитектуры UMA, используемой в рабочих станциях SGI O2 на базе RISC-процессоров R5000/R6000.
Преимуществом применения коммутатора является обеспечение гарантированной ПС, что не реализуется в архитектуре Intergraph TDZ2000. Кроме того, с точки зрения автора, в архитектуре CMA при передаче данных с шины PCI, «подсоединенной» к одному набору микросхем, в ОП, подсоединенную к другому набору микросхем, возникают дополнительные расходы на ПС процессорной шины.
По мнению специалистов Intergraph, к минусам коммутатора относятся ограниченное число портов (т.е. каналов передачи данных) и задержка после запуска в канале одного из потоков данных вплоть до момента возникновения возможности начала передачи другого потока данных. По мнению автора, ограниченное число портов не является очень важным ограничением в условиях реально доступных компьютерных ресурсов. Что же касается проблемы задержек, то их оценка по сравнению с применением архитектуры CMA представляется нам достаточно сложной.
Общее представление об архитектуре IVC дает рис. 3, на котором изображен вариант IVC для моделей Visual Workstation 540. Отличие архитектуры моделей 320 не принципиально. Главное, что в моделях 320 имеется до 2 процессоров Pentium II/III, а в моделях 540 - до 4 МП Pentium II/III Xeon, и что возможности подсистемы ввода-вывода в моделях 320 несколько скромнее.
Если сравнить эту архитектуру с архитектурой UMA в O2, то в первую очередь следует обратить внимание на возросшую ПС коммутатора, которая увеличилась с 2,1 Гбайт/с до 3,2 Гбайт/с. По мнению разработчиков, возможность пересылать данные в ОП и обратно с такой высокой ПС - в 6 раз больше, чем у шины AGP-2x - является ключевой характеристикой, обеспечивающей высокую графическую производительность всей системы.
В разработанном SGI наборе микросхем всего 3 микросхемы: Сobalt, Lithium и Arsenic. Основной микросхемой является Cobalt, от чего получил название и весь набор.
Полузаказная микросхема Cobalt состоит из 4 логических блоков, и кроме собственно коммутатора содержит, в частности, устройство управления ОП. Контроллер ОП позволяет динамически перераспределять физическую ОП между обычной ОП и памятью текстур. Применение Cobalt обеспечивает возможность мультипроцессорного рендеринга, что существенно повышает графическую производительность.
Cobalt имеет размеры 13.6х13.6 мм, содержит 10 млн транзисторов и имеет 1521 контактный вывод. Благодаря этой микросхеме в первую очередь удалось существенно повысить производительность OpenGL по сравнению с SGI O2.
Микросхема Arsenic ориентирована на графический монитор (рис.3). Она отвечает, в частности, за генерацию сигналов дисплея, поддержку режима DMA для буфера кадров и т.п.
Микросхема Lithium является контроллером ввода-вывода. Она обеспечивает работу двух 64-разрядных PCI-шин (в моделях 320 один из слотов - 32-разрядный), чья пиковая ПС вдвое больше, чем у 32-разрядных шин в TDZ2000. Кроме того, Lithium поддерживает аудио - и видео-порты. Так, поддерживается 2 коннектора IEEE1394 с ПС 400 Мбит/с, предназначенные для работы с цифровыми видеокамерами, и карта ввода-вывода для цифрового видео (в моделях 540). Это выгодно отличает Visual Wоrkstation от O2. Плата цифрового видео управляет одновременно двумя видеовходами и двумя видеовыходами, т.е. четырьмя видеопотоками в реальном времени. Очевидно, что это сильно разгружает PCI-подсистему ввода-вывода. Поддержка IEEE1394 на уровне ОС будет реализована только с выходом в свет новой версии Windows NT.
Детали архитектуры Visual Workstation, как и O2, держатся в секрете. Однако данные о ПС ОП (3.2 Гбайт/с) и подсистемы ввода-вывода (1.6 Гбайт/с) позволяют предположить, что коммутатор Cobalt является 8-портовым, с ПС порта 800 Мбайт/с. При этом 1 порт соединен с процессорной шиной, 4 порта - с ОП, 2 порта - с подсистемой ввода-вывода, и 1 порт - с микросхемой Arsenic.
Если сравнить ПС 3.2 Гбайт/с c cуммарной ПС потоков графических данных в Intergraph TDZ2000 GT1, то, по данным, представленным на телеконференции пользователей компьютеров SGI, Intergraph оказывается впереди. Однако, по мнению специалистов SGI, такое сопоставление некорректно; 3.2 Гбайт/с составляет лишь видимую часть ПС, к которой следует добавить, в частности, трафик при рендеренге. Не вдаваясь в дискуссию, отметим, что лучше сравнивать реальную производительность на графических приложениях.
ОП в моделях Visual Workstation 320 имеет 2 банка, а в моделях 540 - 4 банка. Максимальная емкость ОП в этих моделях составляет 1 и 4 Гбайт соответственно. В ОП используется технология SDRAM при частоте 100 МГц и 256-разрядная шина памяти. Поддерживаются модули памяти DIMM емкостью 128/256/512 Мбайт, а число слотов ОП в моделях 320 и 540 составляет соответственно 2 и 4. Как обычно (для данной технологии) ОП защищена от ошибок кодами ЕСС. До 80% всей ОП в моделях 320 и до 90% в моделях 540 может быть использовано под память текстур. Это гораздо больше, чем в TDZ2000.
Visual Workstation поставляются с МП Pentium II/III, в т.ч. Xeon, c различными тактовыми частотами. Минимальная цена модели 320 в США составляет 3995 долл. (без монитора). Как указывает SGI, это меньше, чем стоимость некоторых высокопроизводительных графических акселераторов. Хотя минимальная стоимость TDZ2000 GX1 близка к стартовой цене модели 320, при комплектации мощной графической подсистемой, такой, как Wildcat 4000, станция Intergraph будет стоить гораздо дороже.
Вообще модели TDZ2000 c Wildcat 4000 относятся к старшему классу рабочих станций, а модели 320 - к младшему классу. Прямые данные об их производительности на общеупотребительных тестах автору неизвестны. По некоторым предварительным данным, Wildcat 4000 опережала модели 320 а на других тестах - отставала. Однако можно предположить, что по соотношению стоимость/производительность SGI Visual Workstation 320 окажутся лучше Intergraph Wildcat 4000.
На момент подготовки данной статьи для модели 320 известны следующие результаты на тестах Viewperf: 200 для CDRS-04, 18,7 для DX-04, 13,1 для DRV-05, 1,75 для Light 02 (1280x1024).
Мы обращаем особое внимание на модели 320, поскольку относительно низкие цены (в частности, ниже, чем у SGI O2) могут способствовать их широкому распространению в нашей стране. Есть у этой модели и определенный недостаток: в ней применяются PCI-слоты с напряжением 3,3 В, а более старые PCI-карты с рабочим напряжением 5 В работать не будут. В отличие от О2, на сегодня в модели 320 нет аппаратной поддержки работы со сжатой видеоинформацией, поэтому ее не рекомендуется использовать для приложений редактирования видеоданных.
С точки зрения автора, в российских условиях, особенно с учетом финансового дефицита, модели SGI Visual Workstation 320 будут представлять больший интерес, чем старшие модели TDZ2000 GX1.
Вместе с ОС WIndows NT компания SGI поставляет развитые программные средства, в том числе средства интероперабельности с платформами Unix и Macintosh. Кроме того, завершаются работы над версией Linux для этой платформы.
Таблица 1. Некоторые характеристики рабочих станций Intergraph TDZ2000 GX! | |
Микропроцессоры | Pentium II/III Xeon |
Тактовая частота | 400/500 МГц |
Емкость кэша второго уровня | 512 Кбайт |
Число микропроцессоров | 1-2 |
Емкость оперативной памяти | 64 Мбайт-2 Гбайт |
Число слотов шин ввода-вывода | 5 PCI; 1 ISA/PCI; 1 AGP; 2 USB |
Встроенная поддержка SCSI | Ultra2 LVD SCSI |
Число отсеков для внешних устройств I/O | 7, в т. ч. 4 свободных, из них 2 внешних |
Интегрированный сетевой интерфейс | Ethernet 10/100 Мбит/с |
Таблица 2. Некоторые характеристики рабочих станций SGI Visual Workstation |
||||
Рабочая станция | О2 | mdl320 | mdl540 | |
Микропроцессоры | R5000SC | R10000 | Pentium II/III | Pentium II/III Xeon |
Число микропроцессоров | 1 | 1 | 1-2 | 1-4 |
Тактовая частота, МГц | 200 | 195/200 | 350-550 | до 550 |
Емкость кэша второго уровня, Кбайт | 512 | 1024 | 512 | 512-2048 |
Емкость ОП, Гбайт | до 1 | до 1 | до 1 | до 2 |
ПС коммутатора, Гбайт/с | 2.1 | 2.1 | 3.2 | 3.2 |
Число шин PCI | 1 | 1 | 2 | 2 |
Число слотов PCI-64/32 | 2/0 | 2/0 | 2/1 | 6/0 |
Стандартная поддержка SCSI | Ultra Wide (2 шины) | нет | Ultra2 | Wide |
Интегрированная сетевая плата Ethernet, Мбит/с | 10/100 | 10/100 | 10/100 |