Прошло два года с момента выхода предыдущего обзора графических систем [1], которые, как известно, отличаются от остальных архитектур наличием специальной аппаратуры и программного обеспечения, позволяющих профессионально работать с объемными геометрическими объектами. Для динамично развивающейся отрасли два года - это большой срок, и мир графических систем прожил его полнокровной жизнью - что-то рождалось, что-то отмирало, редко, но появлялись и новые виды.
Чтобы разобраться в ситуации, выделим в качестве базовой характеристики графических систем три их категории: настольные рабочие станции, масштабируемые серверы, суперкомпьютеры визуализации.
Графические рабочие станции - это то, с чего все начиналось. Имеется определенный уровень аппаратных ресурсов, начиная с которого можно заниматься серьезной 3D-графикой. Сейчас станции такого класса представляют собой хорошо сбалансированные компьютерные системы с высокопроизводительным процессором, большим объемом ОП (64 Мбайт и выше), развитой периферией, системными магистралями с высокой пропускной способностью (около 1 Гбайт/с) и, самое важное, графическим ускорителем. Категория графических станций наиболее населенная: как правило, компании-разработчики выпускают сразу семейства моделей с ускорителями разной производительности. Оценить класс ускорителя довольно просто. Сейчас стандарт в мире 3D-графики - OpenGL и все ускорители высокого класса обеспечивают его полную аппаратную поддержку, включая: двойной буфер кадра с 32-разрядным цветом, отсечение по глубине (аппаратный Z-буфер), текстурирование, антиалиасинг, растеризацию треугольников, аппаратные плоскости трафаретов и т. д.
Следующие две категории систем визуализации выпускаются гораздо меньшим числом производителей, что вполне естественно. Масштабируемые многопроцессорные серверы применяются для приложений, в которых нужна высокая производительность обработки прикладных данных, например, для построения медиасерверов или при моделировании и визуализации в реальном времени. Обычно на серверах устанавливаются те же графические ускорители, что и на рабочих станциях. В относительно новой категории графических суперкомпьютеров сочетается высокая вычислительная и высокая графическая производительность. Реально такие системы имеются пока только у SGI, но о своей заинтересованности в этом секторе рынка уже давно заявила компания Hewlett-Packard.
1. Графические системы от Sun
Хорошо известно, что конек Sun - рабочие станции. Если верить отчету IDC, эта компания продает больше рабочих станций, чем SGI, HP, IBM и DEC вместе взятые. Выпустив летом 1997 года новую линию однопроцессорных рабочих станций Ultra 30, Sun обновила для них и графическую систему, перейдя к ускорителям Creator 3D. Сейчас в этой линии две модели 250 и 300, различающиеся по частоте процессоров.
Общая архитектура новой линии полностью соответствует современному уровню развития компьютерных технологий: станция Ultra 30 Model 300 с внешним процессорным кэшем объемом 2 Мбайт демонстрирует производительность 12.1 Specint95, 18.3 Specfp95. К станции подключаются диски UltraSCSI, имеющие скорость передачи данных 40 Мбайт/с. Высокая пропускная способность системных магистралей, а также масштабируемость обеспечивается с помощью Ultra Port Architecture (UPA). На архитектуре UPA обмен данными между различными блоками системы, включая графический ускоритель, идет со скоростью до 800 Мбайт/с. Закачка данных в процессор происходит в 3 раза быстрее, чем у ПК, при этом объем памяти типа DIMM в Ultra 30 может быть доведен до 2 Гбайт. Системы Ultra 30 стали первыми рабочими станциями Sun, в которых для подключения периферии ввода/вывода используются многоканальные шины PCI в 64-разрядной реализации.
Что касается графической подсистемы, то новое поколение технологии Creator Graphics - Creator 3D стало существенно быстрее (рост производительности оценивается в 50%), может обслуживать мониторы с более высоким разрешением (два монитора в режиме HDTV с разрешением 1920х1200), включает поддержку для проигрывания видео. Показатели графической производительности, приведенные в таблицах 1,2, позволяют отнести линию Ultra 30 с ускорителями Creator 3D к высшему классу графических станций.
1.1. Особенности графической аппаратуры Creator 3D
Какие архитектурные принципы разработчики Sun считают наиболее важными в новой линии графических станций?
Производительность рендеринга во многом зависит от общей пропускной способности системы. Поэтому особое внимание уделено созданию такого средства соединения ЦПУ, ОП и графической подсистемы, которое могло бы обеспечить высокоскоростной трафик. В линии Creator Graphics эту роль играет кроссбар UPA, к которому непосредственно через 64-разрядный интерфейс подключается модуль ускорителя Creator 3D.
Далее, по сравнению с предыдущей моделью ускорителя Creator, в Creator 3D введено несколько новшеств. В частности, реализована полная аппаратная поддержка 3D-графики с ориентацией на функциональность OpenGL, что дает возможность работать с твердотельными моделями MCAD. Кроме того, увеличен объем 3D-RAM памяти - 15 Мбайт (Creator - 5 Мбайт), которая используется для двойной буферизации и увеличения производительности Z-буфера.
Помимо наращивания объема, усовершенствована также архитектура 3D-RAM. Обычно узкое место аппаратуры 3D графики - скорость, с которой пикселы заносятся в Z-буфер для отсечения по глубине. От того, насколько велика эта скорость, зависит производительность операции удаления невидимых поверхностей. Здесь все дело в архитектуре памяти: нужна память большого объема, быстрая и недорогая. На сегодняшний день для буфера кадров используются три наиболее распространенных типа памяти, но каждый из них имеет свои недостатки:
- динамическая память DRAM имеет наибольшую плотность, производится по хорошо отработанной технологии, но она довольно медленна;
- двухпортовая видеопамять VRAM имеет более высокую пропускную способность, чем DRAM, однако за последние 5 лет производительность VRAM удалось увеличить лишь на 30%;
- статическая память SRAM быстрее, но слишком дорога для настольных систем.
Более экзотические архитектуры, к примеру массовая DRAM с расслоением, пока невыгодны экономически.
Существует и другая проблема архитектуры памяти, используемой для графических приложений: большое количество транзакций чтение - модификация - запись. Особенно много их порождается при отсечении по глубине в Z-буфере. Z-координаты прикладных данных должны дважды проходить по контактам чипа: первый раз при чтении старого значения Z, второй раз при записи нового значения. Такие же трехступенчатые транзакции вызывают и операции антиалиасинга, смешивания, наложения шаблона. Их следует минимизировать, иначе обработка может занять в 4 раза больше времени, чем просто транзакция записи.
Решение этих проблем в Creator 3D основано на том, что 3D RAM интегрирует кэши DRAM и SRAM на одном чипе и на нем же размещается блок арифметики АЛУ, поэтому отсечение и вызванные им циклы модификации выполняются целиком внутри 3D-RAM. В результате получается 10-мегабитный блок, который управляет 3D-графикой по оценке разработчиков в 10 раз быстрее, чем обычная VRAM, но имеет более низкую стоимость.
2. Решения Hewlett-Packard
Сегодняшний уровень развития систем визуализации Hewlett-Packard определяют графические ускорители семейства Visualize, которые устанавливаются на настольные станции класса C - C180, C160 и C110 и на многопроцессорные SMP-серверы K260 и K460. Вся линия продуктов базируется на 64-разрядном процессоре PA-8000. Самая мощная модель станции, C180-XP, показывает производительность 11.8 Specint95, 18.7 Specfp95.
Архитектура рабочих станций позволяет наращивать объем ОП до 768 Мбайт, устанавливать дополнительные платы шин GSC, EISA, PCI, Ethernet. В качестве системного соединения используется шина с пиковой пропускной способностью 960 Мбайт/с. В серверных моделях увеличен объем поддерживаемой ОП и внешней дисковой памяти (до 5.7 Тбайт), добавлен кэш объемом 2 Мбайт, сетевые интерфейсы FDDI и ATM.
В HP Visualize входят несколько типов графических подсистем в порядке увеличения их мощности: -EG, -8, -24, -48, -48XP. Системы Visualize-8/24, включающие 3D геометрический ускоритель и аппаратный Z-буфер, показывают достойную 3D-производительность (PLBwire93 - 117, PLBsurf93 - 170). В Visualize-8 всего 8 цветовых плоскостей, но благодаря технологии восстановления цветов имитируется режим true color и на экране воспроизводится 4 млн. полутонов. Эти варианты графических систем Visualize не имеют аппаратной поддержки нанесения текстуры.
HP Visualize-48XP является сегодня самой мощной графической станцией с производительностью 425 PLBsurf93, 400 PLBwire и 800 тыс. текстурированных треугольников в секунду. По этим показателям она опережает графические подсистемы, которые устанавливаются на рабочих станциях и серверах других производителей, в 1,5 - 2 раза, не отличаясь от них по стоимости. У данной графической системы 24 цветовые плоскости, двойная буферизация и реальный режим воспроизведения цветов true-color. Для работы с текстурой предлагается отдельная плата с собственной памятью объемом 16 Мбайт.
Так же, как и в Creator, в графической системе Visualize применяется распределенная технология: сложные вычисления над вещественными числами, широко используемые для 3D-рендеринга, выполняются как в центральном процессоре (PA-8000 имеет набор мультимедиа-команд), так и при помощи геометрического ускорителя.
В текущем конструктиве на плате Visualize-48XP размещаются 4 геометрических ускорителя и 10 растеризаторов. Для того чтобы получить высокую производительность операции растеризации, необходима большая скорость передачи данных в буфер кадров. Разработчики HP применяют для этого широкополосный интерфейс - 320 и 640 бит в Visualize-48 и 48XP соответственно.
Семейство станций, оснащенных системой Visualize, функционирует под ОС HP-UX, для работы с графикой предлагается несколько 3D API: Starbase, PEX и PHIGS. К числу важных событий можно отнести то, что HP хоть и последней из всех производителей, но выпустила наконец собственный вариант OpenGL.
В июле 1997 г. компания HP объявила о новой визуализационной системе Visualize PxFl, которая основывается на предложенной в Университете Северной Каролины технологии PixelFlow. Цель этой разработки - обеспечить при интерактивной работе в реальном времени рендеринг высококачественных изображений без ухудшения качества и фотореализма. На традиционных системах для получения реалистической анимации с точными цветовыми бликами, тенями и отражениями используется фоновый рендеринг, а генерация каждого кадра занимает по крайней мере несколько минут.
Visualize PxFl имеет совершенно новую для систем визуализации суперкомпьютерную архитектуру с массовым параллелизмом и демонстрирует графическую производительность от 4 до 100 млн. полигонов в секунду. Система содержит от нескольких десятков до нескольких тысяч растровых процессоров, соединенных сетью с внутренней скоростью передачи 12.8 Гбайт/с.
До сих пор только компания SGI выпустила продукт, который можно отнести к категории суперкомпьютеров, - Onyx2. Теперь к ней присоединяется HP, однако между двумя подходами имеется существенная разница: Visualize PxFl - это графическая подсистема, построенная по суперкомпьютерной технологии, и она может подключаться к разным компьютерам.
На одно шасси Visualize PxFl устанавливается до 9 "потоковых устройств", каждое из которых имеет два процессора PA-8000 и 8192 растровых процессора, что дает возможность выводить 16 млн. треугольников в секунду. Если считать, что масштабирование происходит линейно, то уже два связанных шасси превзойдут производительность системы Onyx2 InfiniteReality. Возможно использование 6 и более шасси.
Ожидается, что Visualize PxFl начнет поставляться в первом квартале 1998 г. для SMP серверов класса J, однако самые нетерпеливые уже видели первые экземпляры, которые демонстрировались на выставке SIGGRAPH '97.
3. Решения от DEC
Многое из того, что происходит сейчас на рынке графических систем, отражает важную тенденцию: все большее значение приобретают продукты для платформы Windows NT. Подход компании DIGITAL - в этой струе, но он оригинален: предлагаются "открытые" графические ускорители PowerStorm, которые могут эффективно работать и на платформе Windows NT, и на платформе Unix. Такая универсальность базируется на нескольких положениях.
DEC ориентируется на основные стандарты: OpenGL, X Window, NT, Unix и PCI. Поскольку шина PCI имеется на всей линии компьютеров DIGITAL, меняя рабочее место, можно просто переставить графическую плату. Ускорители PowerStorm демонстрируют высокую эффективность на рабочих станциях Alpha, независимо от того, установлена на них NT или Unix. Если же нужна совместимость 3D-графики и Intel-приложений, большинство моделей PowerStorm предлагается для персональных рабочих станций i-Series. Не требуется двух рабочих мест на разных платформах - под NT есть необходимое графическое ПО, а мощность ускорителей PowerStorm достаточна, чтобы справиться с рендерингом.
Всего в семействе PowerStorm 6 моделей. Две из них (4D20 и 3D30) относятся к классу высокопроизводительного 2D и начального уровня 3D (проволочные модели). Средний класс 3D представлен в семействе PowerStorm моделью 4D40T, отличительная особенность которой - низкая цена при наличии аппаратного наложения текстуры. Высший класс 3D представлен моделями 4D60T, 4D50T, которые поддерживают разрешение 1920х1200, имеют видеопамять 16-32 Мбайт, 24 цветовые плоскости с двойной буферизацией, 32 (24)-разрядный Z-буфер. Аппаратно реализованы антиалиасинг, прозрачность, текстурирование. В базовую конфигурацию самой мощной модели, 4D60T, включается 16 Мбайт памяти текстуры, которую можно расширить до 64 Мбайт. 4D60T имеет следующие показатели производительности: свыше 2,3 млн. 3D-векторов/с, 1 млн. треугольников/с с закраской Гуро. Ускорители PowerStorm прошли тестирование на приложениях OpenGL со следующими результатами для 4D50T (4D60T): 44.72 (48.72) CDRS-03, 10.0 (11.47) DX-03, 6.03 (7.21) DRV-04. Летом цена на 4D60T была снижена с 12 тыс. до 6 тыс. долл.
Новейшая модель 4D30T была показана на SIGGRAPH'97 в варианте для Alpha и персональных станций x86 под NT, вариант для DIGITAL Unix будет выпущен позднее в этом году. Для конфигурации c 4 Мбайт памяти текстуры объявлена цена 3 тыс. долл. Следует отметить, что ускоритель 4D30T построен на основе типовых продуктов третьих производителей: процессора OpenGL REALimage (Evans&Sutherland) и набора чипов 3DPro (Mitsubishi), который включает 15 Мбайт 3DRAM для буфера кадров. Скорость аппаратного рендеринга 4D30T составляет 2 млн. треугольников в секунду, а показатель CDRS равен 42.87 на новой персональной станции a-Series 600.
4. Точка зрения IBM
Как и DEC, компания IBM работает на два фронта, но несколько другим способом. Для платформы Intel/NT выпускаются персональные графические станции IntelliStation с процессорами Pentium II или Pentium Pro, к которым по шине PCI подключается графическая карта Intense 3D (Intergraph). Второе направление - рабочие Unix-станции RS/6000 с процессорами PowerPC 604e и графическими ускорителями семейства Power GXTxxxP. Cистемы визуализации строятся на базе трех моделей RS/6000:
- настольной рабочей станции 43P, модель 140;
- одно-, двухпроцессорной настольной SMP 43P модель 240;
- одно-, двухпроцессорном сервере рабочих групп, модель F40.
IBM завершила переход на шину PCI, и теперь графические карты непосредственно интегрируются с ней; в то же время поддерживаются и системы на базе Micro Channel. Из семейства ускорителей классу 3D соответствуют модели начиная с GXT500P и GXT550P - это начальный уровень. Среднему уровню 3D соответствует GXT800P (табл. 1), который устанавливается на RS/6000 43P модели 140/240 и на сервер F40. Этот ускоритель обеспечивает полную поддержку стандартов OpenGL, graPHIGS 3D и частичную - PEX. Аппаратное текстурирование включается в GXT800P как опция. Реализация стандартных API интересна тем, что IBM применяет распараллеливание приложений под graPHIGS и OpenGL через аппарат нитей.
5. Машинная графика в SGI
Характерная черта компании SGI - последовательность в применении "перевернутого" подхода. Разрабатываются решения для самых производительных систем и затем, путем упрощения, они же применяются для всего остального спектра продуктов. В 1996 году SGI перешла от систем класса "I" (Indy, Indigo,...) к системам "O" (O2, Octane,...) и стала единственной пока компанией, выпускающей все категории систем визуализации от мала до велика. Это и настольная графическая рабочая станция O2, и масштабируемые серверы Origin, и суперкомпьютеры визуализации Onyx2.
Задача нового подхода SGI - обеспечить на единой основе, архитектуре S2MP, гармоничное, без возникновения узких мест, наращивание общей пропускной способности системы, а не только вычислительной или графической производительности. Архитектура S2MP, разработанная совместно SGI и Cray Research, позволяет создавать полностью модульные системы, составленные из блоков - процессорных, коммутирующих узлов и специализированных подсистем (графических, ввода/вывода, сетевых), оставаясь при этом в рамках модели симметричного мультипроцессирования.
Семейство Onyx2 разработано для поддержки наиболее сложных приложений вычислительной визуализации в производстве, проектировании, медицине, обработке медиаданных и визуальном моделировании. В Onyx2 объединены технологии многопроцессорных суперкомпьютеров и самых мощных графических ускорителей высшего класса: RealityEngine2 и InfiniteReality. Сохраняя преемственность с предыдущей линией Challenge, Onyx2 открывает новые возможности, позволяя параллельно вести обработку графики, изображений и видео в реальном времени.
В линию Onyx2 входят несколько моделей, и во всех используются процессоры MIPS R10000 (180-195 Мгц). В самую мощную модель - Onyx2 RealityMonster можно включить до 16 процессоров и до 8 графических конвейеров. Onyx2 является сейчас самой быстрой системой визуализации. Ее показатели тестов OpenGL (161.29 CDRS-03, 36.25 DX-03, 20.82 DRV-04) превосходят аналогичные показатели самых мощных рабочих станций в 2-3 раза. То же можно сказать и о графических подсистемах: InfiniteReality генерирует 11 млн. треуг./с (RealityMonster - 80 млн. треуг./с), в то время как самый мощный ускоритель рабочих станций Visualize 48XP - 3,8 млн. Все это и дает основание отнести систему визуализации Onyx2 к суперкомпьютерному уровню.
Высокая скорость передачи данных между разными компонентами системы в архитектуре S2MP позволяет поддерживать такой режим рендеринга одной сцены, в котором параллельно задействовано несколько графических конвейеров InfiniteReality. Этот режим рендеринга называется многоконвейерным, он существенно отличается от традиционного способа, когда каждый из конвейеров занят отдельной графической задачей. Многоконвейерный рендеринг, в котором совокупная скорость обработки и суммарная память нескольких конвейеров применяются для решения одной задачи, позволяет справиться с более сложной геометрией сцен, повысить реалистичность рендеринга и одновременно обеспечить требуемую скорость обновления кадров.
Octane наследует ту же архитектуру S2MP, но она получает новое звучание. Octane выпускается с одним или двумя процессорами, и кроссбар S2MP позволяет устранить возможные затруднения при передаче больших массивов данных, что характерно для 3D-обработки, между различными подсистемами компьютера. В результате графические операции выполняются более гладко.
В Octane устанавливается три разновидности ускорителя Impact, унаследованные от модели Indigo2: SI, SSI и MXI. Система Octane/SI включает графический процессор и специальную аппаратуру растеризации. Конфигурация Octane/SSI имеет два графических процессора и соответственно большую скорость графических операций. Она ориентирована на выполнение задач трехмерного твердотельного моделирования, проведение механического анализа, разработку систем подготовки и анализа данных для научных приложений и трехмерную анимацию без использования текстуры. Octane/MXI - самая мощная модель, наряду с графическими процессорами и аппаратурой растеризации она включает устройства для обработки текстур и память для их хранения емкостью 4 Мбайт. Это инструмент для профессиональной работы с графикой, будь то анимация, видео, сложное трехмерное моделирование или виртуальная реальность.
Показатели Octane по тестам CDRS, DX-03 и DRV-04 (табл.1) - позволяют позиционировать графическую подсистему SI как систему среднего уровня 3D, SSI и MXI - высшего.
В настольной рабочей станции O2 архитектура S2MP превратилась в UMA - Universal Memory Architecture. В отличие от традиционных архитектур, где существуют различные виды памяти и данные постоянно передаются между ними, в UMA только одна память - оперативная, которая динамически распределяется между системной памятью, буферами кадров, Z-буфером, памятью текстуры, и все обрабатывающие блоки имеют к ОП прямой доступ. Графическая подсистема O2 полностью поддерживает OpenGL с аппаратным текстурированием. Ее показатели (17.24 CDRS-03, 3.05 DX-03, 2.27 DRV-04) соответствуют начальному уровню 3D.
O2 стала первой настольной рабочей станцией, в которой аппаратное кодирование/декодирование JPEG в реальном времени встроено стандартно. Изображение с экрана можно выводить прямо на диск или на рекордер через порты O2.
6. 3D графика для Windows NT
Практически вся история становления коммерческих систем 3D-графики связана с платформой RISC/Unix, однако если сейчас просмотреть рейтинги систем визуализации, можно обнаружить, что в графе ОС в равной мере присутствуют и Unix, и NT. Хотя число систем на платформе Intel/Windows NT возрастает к концу списка, практически для любой производительности можно найти решение на каждой из этих двух платформ. Но уникальность платформы Unix сохраняется в категории суперкомпьютерных систем.
Уже говорилось о решениях для платформы Wintel компаний IBM и DEC. Однако самые мощные графические рабочие станции TDZ производит компания Intergraph, продукты которой занимают далеко не последние места в рейтинге производительности (табл. 1), превосходя некоторые станции Sun, DEC и IBM.
Станции TDZ производятся в различных вариантах: на базе одного или двух 32-разрядных процессоров Pentium II/MMX либо одного или четырех процессоров 200 МГц Pentium Pro. В последней модели - TDZ 2000 используются один/два процессора Pentium II 300 МГц. Модели TDZ оснащаются построенными по технологии DirectBurst 3D графическими ускорителями семейства RealiZm 3D: VX25, ZX25, ZX13. Это профессиональная аппаратура, имеющая все признаки высокопроизводительных графических систем для интерактивной работы с 3D-моделями. Полностью поддерживая OpenGL, ускорители содержат 32 Мбайт памяти двойного буфера кадра true color при разрешении до 1824х1368, память текстуры наращивается до 64 Мбайт.
Геометрический ускоритель включает 7 специализированных процессоров с суммарной мощностью 840 MFLOP. Аппаратно реализовано текстурирование в режиме трилинейной интерполяции с картами MIP. По показателям графической производительности (1.6 млн. треуг./с, 2.7M 3D векторов/с, скорости нанесения текстуры 55.2M пикселов при трилинейной интерполяции) ускоритель VX25 превосходит, например, PowerStorm 4D60T. Если рассмотреть результаты тестов производительности OpenGL (табл. 1), то у VX25 они вообще лучшие среди графических станций, однако и объявленная цена TDZ 2000 - около 18 тыс. долл. Это чуть ниже стоимости сопоставимых с ними UNIX-станций, но нужно учитывать, что в стандартную поставку для них всегда включается различное графическое ПО, например OpenGL, чего нельзя сказать о системах Wintel.
Другой класс 3D графических систем для платформы Wintel образуют так называемые "персональные" рабочие станции, которые часто продаются по цене меньше 10 тыс. долл., но на них уже можно профессионально работать с 3D-графикой. Одно из действующих лиц в этой нише - компания AccelGraphics, производящая 4 разные линии 3D графических систем для компьютеров Intel Pentium, Pentium Pro и Digital Alpha.
Весьма важно, что AccelGraphics предлагает комплексное решение - 3D аппаратные ускорители, оптимизированный программный интерфейс к ним и прикладное ПО, которые интегрированы друг с другом на основе стандарта OpenGL и других графических API. Для поддержки профессиональных 3D-приложений, таких как Pro/Engineer, I-DEAS, 3D Studio MAX и остальных, включая текстовые процессоры и Web-браузеры, поставляются стандартные драйверы Windows NT.
Ускорители линии AccelPRO TX поддерживают разрешение 1280х1024, 15-разрядный цвет и 24-разрядный Z-буфер. Уже у этой, средней по возможностям линии, имеется аппаратная поддержка текстурирования и выделенная память текстур объемом от 3 до 5 Мбайт. По оценке AccelGraphics аппаратная поддержка 3D-графики дает пятикратное увеличение производительности по сравнению с 2D-ускорителями. Кроме того, AccelPRO TX увеличивает производительность текстурирования до 10 раз по сравнению с программным решением. Модель AccelPRO 2500TX имеет показатели 20.11 CDRS-03, 4.22 DX-03, 2.01 DRV-04 - примерно такие же, как у O2.
Наиболее мощная линия у AccelGraphics - AccelECLIPSE, в которой режим true color (32-разрядный RGBA) сочетается с высоким разрешением, антиалиасинг выполняется аппаратно, для закраски поддерживается трилинейное MIP отображение, память текстуры наращивается до 16 Мбайт. Этот ускоритель способен работать с самыми сложными приложениями MCAD, MCAE и научной визуализации. На станции Compaq Professional Workstation 6300 AccelECLIPSE показывает производительность 43.45 CDRS-03, 6.53 DX-03, 3.75 DRV-04. Стоимость такой системы около 10 тыс. долл.
Кроме упомянутых, на рынке 3D графических систем для Windows действует еще несколько компаний, среди которых Evans&Sutherland, 3Dlabs, Dynamic Pictures, ELSA, NeTрower [2]. Для снижения цен на продукты очень многие производители применяют модульные решения, компонуя свои графические системы из типовых чипов. Так, ускоритель AccelECLIPSE собирается из нескольких чипов, выпускаемых компанией Mitsibishi: процессор рендеринга 3DPRO/2mp, построенный по технологии REALimage (Evans&Sutherland) и выполняющий ключевые функции графического конвейера (закраску, нанесение текстуры и тумана, отсечение, антиалиасинг и т. д.); 3DRAM-память буфера кадров (15 Мбайт); память текстуры DRAM (до 16 Мбайт) с кэшем.
7. Перспективы развития графического ПО
Находясь в центре разнообразных приложений, машинная графика испытывает постоянное давление смежных отраслей - требуются все более крупные модели, более высокая скорость обработки. Подчас прогресс в графике приводит к радикальным изменениям производственных технологий, как, например, в автоматизированном проектировании, где возможность эффективной работы с большими сборками позволяет обойти дорогостоящий этап построения физического прототипа. Некоторые разработчики пытались поднять производительность крупных графических приложений своими силами, однако сейчас определенно ощущается ориентация на открытые графические стандарты, так что проблему их развития нужно решать централизованно.
Долгое время ускорение графики определялось прогрессом в аппаратуре, интерфейсом к которой служили стандарты типа OpenGL. В этом году компании HP и SGI предложили программные средства DirectModel и OpenGL Optimizer соответственно, которые могут стать новым поколением инструментального графического ПО для работы со сложными моделями.
Основные идеи двух подходов, по существу, совпадают. Например, сложная модель автомобиля содержит несколько миллионов полигонов, но при заданном ракурсе наблюдения их не обязательно показывать все и с одинаковым уровнем детализации. Если имеется база данных модели, можно путем сортировки и фильтрации определить оптимальное подмножество графических данных и послать в аппаратную часть графической системы только его. Таким способом без ущерба для качества изображения можно манипулировать даже самыми сложными моделями с беспрецендентным уровнем интерактивности. Компания HP объявила о программной технологии DirectModel в мае 1997 г., и сейчас оценивает возможное повышение производительности приложений на два порядка. OpenGL Optimizer уже поставляется SGI, и тесты на приложениях MCAD показывают, что в среднем производительность возрастает от 2 до 10 раз, а в некоторых случаях на два порядка, причем чем больше модель, тем лучше.
OpenGL Optimizer строится как открытое расширение API OpenGL. В нем, как и в другом продукте - Open Inventor, в качестве базы данных используется граф сцены, по которому производится динамическое, без препроцессирования, отсечение модели. Среди важных функций OpenGL Optimizer - поддержка интегрированного мультипроцессирования в рамках одной задачи, что позволяет линейно наращивать производительность приложения при увеличении числа процессоров. Сейчас распространяется версия Optimizer 1.0 под ОС IRIX 6.2 и старше. Планируются также реализации для Windows, HP-UX и Sun Creator.
Технология HP DirectModel также была задумана как независимый от платформы промышленный стандарт, обеспечивающий интероперабельность Unix - Windows NT. Реализован DirectModel в виде надстройки над традиционными API 3D-графики, такими как OpenGL, Direct3D или Starbase, и может быть расширен на другие 3D API. Компания HP будет поставлять DirectModel только для своих платформ. Версиями для Windows занимается Microsoft - она приобрела лицензию и собирается интегрировать новую технологию в базовую среду DirectX. Остальные платформы, включая DEC, IBM, SGI и Sun, собирается обслужить компания Template Graphics Software.
8. Немного сравнения графических систем
Производители графических систем, лучше других знающие сильные и слабые стороны своих изделий, очень неохотно делают сравнительные оценки. Гораздо больше в них заинтересованы пользователи. Нужно, правда, признать, что это не только деликатная, но в современной ситуации объективно трудная задача. Если бы все графические ускорители можно было поставить на какой-то один компьютер, было бы просто сравнить их собственную производительность. Однако в результаты графических тестов в той или иной степени вносят вклад все компоненты компьютерной системы: процессор, быстродействие памяти и системного соединения, наличие кэшей и т. д.
Для измерения 3D графической производительности сейчас используются две основные группы тестов. Первый вид тестирования осуществляется с помощью написанной компанией IBM на языке C мобильной программы Viewperf, которая дает интегральную оценку конвейера OpenGL - программной и аппаратной его реализации. На входе получаются управляющие параметры и файлы визуализируемых данных. Viewperf выполняет все подготовительные операции и производит рендеринг входных данных, выдавая в качестве меры производительности количество генерируемых за секунду кадров, а также ряд дополнительных характеристик. Сейчас имеется 5 стандартных тестов Viewperf, различающихся наборами данных для визуализации, 3 из которых приведены в таблицах:
- предложенный Parametric Technology набор данных CDRS относится к области промышленного проектирования;
- DX - Data Explorer (IBM) представляет собой приложение визуализации данных;
- DRV - Design Review (Intergraph) моделирует обзор 3D моделей.
Вторая группа распространенных тестов PLB (Picture-Level Benchmark), PLBsurf93 и PLBwire93, измеряет скорость генерации полигонов в твердотельной и проволочной модели соответственно.
Сравнение графических систем часто осложняется тем, что разные производители применяют для своих платформ разные тесты. SGI, например, очень критически относится к тестам PLB и вообще не приводит данные по ним, аргументируя это тем, что они искажают реальную картину. Возможно, более адекватны тесты Viewperf, к тому же все производители имеют уже оптимизированные для родного оборудования версии OpenGL. Однако HP, по-видимому, еще не успела провести соответствующую работу для семейства Visualize и по-прежнему пользуется показателями PLB. Поэтому в таблицах 1-3 приведены данные и по тестам Viewperf, и по тестам PLB для наиболее мощных моделей всех производителей. Что же следует из этих таблиц?
Три категории систем визуализации довольно четко разделяются по стоимости: суперкомпьютеры имеют цену около 100 тыс. долл., многопроцессорные серверы в районе 50 тыс. долл., а рабочие станции - ниже 30 тыс. долл. Графическая производительность суперкомпьютера SGI Onyx2 2x195 МГц с ускорителем Infinite Reality в 2-3 раза превышает показатели всех остальных систем. Основываясь на показателях Viewperf, делаем вывод, что на Onyx2 можно производить высококачественную анимацию в реальном времени для весьма сложных моделей. В масштабируемых серверах HP K460 и SGI Octane используются те же графические системы, что и на рабочих станциях. У K460 в однопроцессорном варианте графическая производительность примерно такая же, как и у C180-XP. За счет более высокой общей пропускной способности SGI удалось поднять производительность Octane на некоторых тестах (DX и DRV) примерно в 1,5 раза по сравнению с Indigo2.
Похоже, что производители рабочих станций Unix научились выпускать модели всех классов производительности. К высшему классу можно отнести системы на базе ускорителей Intergraph VX25, DIGITAL Powerstorm 4D60T, Sun Creator 3D, SGI Maximum Impact (MXI) и IBM GXT800T, причем последний ускоритель находится на границе со средним классом. На первое место в этом списке следует поставить HP Visualize 48XP, хотя по уже упоминавшимся причинам этот ускоритель отсутствует в табл. 1. Основанием для самой высокой оценки HP C180-XP Visualize 48XP служат опубликованные показатели скорости генерации примитивов: 6,8 млн. вект./с, 3,9 млн. треуг./с, 1,9 млн. четырехуг./с, в то время как, например, у SGI 200 МГц R10000 Maximum Impact эти же показатели равны: 1,85 млн. вект./с, 1,8 млн. треуг./с, 676 млн. четырехуг./с. По этим данным можно заключить, что графическая производительность C180-XP в три раза выше, однако будет ли эта система производить в три раза больше кадров за секунду при работе с приложениями OpenGL, остается под вопросом.
Таблица 1 может служить хорошей иллюстрацией того, как производительность зависит от задачи. Графические системы расставлены в ней по результатам CDRS-03, если же упорядочить их по тестам DX-03 или DRV-04, то на первое место среди станций выйдет Octane MXI, на второе - Digital Workstation 600a Powerstorm 4D60T, а Intergraph TDZ 2000 переместится на третье место.
Стоит обратить внимание на то, что стандарт OpenGL уже имеет хорошую поддержку на платформе Windows NT. Из приведенных в табл. 1 систем высшего класса на нем работают DEC и Intergraph. В табл. 3 приведены данные о наиболее производительных системах для платформы Wintel, из которых видно, что ускорители REALimage 1000, AccelECLIPSE и GLmax88M на тестах CDRS-03 опережают IBM RS/6000 GXT800P.
Заключение
Несмотря на ежегодный прирост графической производительности в 1,5 - 2 раза, современные системы визуализации (за исключением суперкомпьютеров) все еще не позволяют работать с практически интересными моделями в реальном времени: имеется существенный разрыв между моментом, когда изменено положение устройства ввода, и моментом обновления изображения на экране.
Дальнейший прогресс может дать переход от функциональности OpenGL к более продвинутым алгоритмам, связанным, например, с интеллектуальным отсечением. Если программные инструменты типа Optimizer или DirectModel смогут на порядок увеличить производительность без какой-либо аппаратуры, то это замечательно, почему только они не появились раньше?
Горячий вопрос: что лучше - Intel/Windows или RISC/UNIX? Конкуренция между ними весьма полезна, в частности для снижения цен. Мне больше нравится RISC/Unix, хотя бы потому, что все программное обеспечение для этой платформы сделано более профессионально. Но главное вот что: эта платформа была и остается генератором новых идей. При условии, что производители, специализирующиеся сейчас на RISC/Unix, сохранят новационный потенциал, нет ничего плохого в том, что их будущие продукты, став еще более открытыми, начнут обслуживать еще и процессоры Intel.
Таблицы
CDRS-O3 | DX-O3 | DRV-O4 | Цена по отношению к О2 | |
SGI Onyx2 DS 2х195 MГц R10000 InfiniteReality (1RM7) | 161.29 | 35.65 | 20.82 | 11.736 |
SGI i-Station R10000InfiniteReality (1RM6) | 138.05 | 19.89 | 10.55 | 9.355 |
Intergraph TDZ2000 300 MГц Realizm II VX25-GT | 65.81 | 11.11 (ZX13-GT) | 8.58 | 1.256 |
Digital Personal Workstation 600a PowerStorm 4D30T | 55.63 | 8.11 | 4.71 | 1.505 |
Sun ULTRA 30 Creator 3D Model 300 | 50.67 | 9.49 | N/A | 1.552 |
Digital Personal Workstation 600a PowerStorm 4D60T | 49.01 | 11.47 | 7.22 | 1.664 |
SGI 1х195 Octane R10000 MXI | 48.63 | 13.66 (SSI) | 8.22 | 3.725 |
IBM RS/6000 Model 43P-140 332 MГц 6XT800P | 40.31 | 8.01 (GXT550P) | 4.05 | 1.618 |
SGI O2 R5000 200 MГц | 19.89 (R10000/175M??) | 3.15 | 2.67 | 1.00 |
Таблица 1. Тесты Viewperf самых мощных графических систем разных производителей.
PLB surf 93 | PLBwire93 | Цена по отношению к O2 | |
HP C180-XP Visualize-48XP | 425.2 | 389.1 | 2.414 |
HP K460-XP Visualize-48XP | 420.6 | 399.1 | 7.150 |
HP C160 Visualize-48 | 328.9 | 252.1 | 1.435 |
Sun ULTRA 30 Creator 3D Model 300 | 317.1 | 225.0 | 1.552 |
IBM RS/6000 43P-240 233 MГц GXT800P | 286.7 | 164.4 | 1.606 |
Sun ULTRA 30 Creator 3D Model 250 | 266.3 | 192.7 | 1.207 |
IBM RS/6000 43P-140 332 MГц GXT 800PPLBsurf93 | 241.9 | 153.2 | 1.480 |
Таблица 2. Тесты PLB самых мощных графических систем разных производителей.
CDRS - O3 | DX - O3 | DRV - O4 | Цена по отно-шению к O2 | Производитель | |
Compaq Professional Workstation 6000 Model 6300 REALimage 1000 | 46.81 | 6.64 | 4.28 | 0.618 | Evans & Sutherland |
Compaq Professional Workstation 6000 AccelECLIPS | 43.45 | 6.53 | 3.75 | 0.692 | Unisis |
MaxVision Symbion AXP164LX MaxVision GLmax88M | 41.30 | 7.26 | 3.97 | 0.635 | 3Dlabs |
Compaq Professional Workstation 6000 Oxygen 402 | 37.49 | 2.71 (Oxygen 202) | 1.16 (Oxygen 202) | 0.608 | Dynamic Pictures |
Compaq Professional Workstation 5100 ELSA GLoria-XL | 36.35 | 7.31 | 3.95 | 0.495 | ELSA |
Таблица 3. Тесты Viewperf самых мощных систем для платформы Intel/Windows NT.
Литература
- Дм. Волков, Графические средства современных RISC-систем. Открытые cистемы, 1995, #5.
- В. Аджиев, Системы NeTpower: NT, power и никакого РИСКА. Открытые системы, 1997, #5. С. 24-29.