Мы описываем интерактивную систему, которая поддерживает реконструкцию трехмерного томографического изображения (и, как следствие, возможность совместного анализа) данных, полученных с удаленного научного оборудования.
Появление все новых возможностей, позволяющих моделировать и измерять все большее число явлений, приводит к тому, что на нас обрушивается лавина информации. В ближайшем будущем мы сможем принимать данные со скоростью несколько терабайт в день из приложений самых разных классов, в том числе модели, работающие на компьютерах с производительностью в несколько терафлоп и экспериментальные данные, полученные в результате работы все более чувствительных и точных инструментов, таких как телескопы, микроскопы, ускорители частиц и спутники.
Генерация или получение данных - отнюдь не конечная цель, а всего лишь механизм, позволяющий проникнуть в суть явлений. Хотя анализ и преобразование данных играют немаловажную роль, во многих случаях смысл явления становится понятным только тогда, когда человек начинает интерпретировать данные. Хорошо известная способность человека визуально распознавать и интерпретировать сложные шаблоны - крайне важное дополнение к аналитическим методикам, позволяющим выявлять значение (и аномалии) наборов научных данных. Однако, визуализация становится все более важным инструментарием для постижения смысла явления, описанного с помощью данных большого объема, полученных с помощью научного оборудования и в результате моделирования процесса [1].
В процесс визуализации вовлекается все больше и больше географически разнесенных источников данных, конечных пользователей, устройств анализа информации и визуализации. Необходимость в удаленной визуализации порождает новые проблемы, касающиеся таких аспектов, как защита, работа глобальных сетей, гетерогенность и надежность компонентов. Решение этих проблем структурным образом требует реализации новых подходов к архитектуре визуализации. В частности, инфраструктура, которая была разработана для создаваемых национальных вычислительных «решеток» с одной стороны упрощает, а с другой - увеличивает отказоустойчивость, производительность и мобильность систем удаленной визуализации.
В данной статье мы поговорим о причинах создания систем удаленной визуализации, укажем основные технические трудности и опишем интерактивные системы совместной работы, которые реконструируют и анализируют томографические данные, полученные с удаленных рентгеновских систем и электронных микроскопов.
НАУЧНЫЕ ПРОБЛЕМЫ
Поскольку преобразование данных в точные и осмысленные изображения - процесс крайне трудный, визуализация научных данных сама по себе является областью сложных и важных научных изысканий. Алгоритмы, компьютерная архитектура и системы визуализации постоянно совершенствуются с целью обеспечить возможность выполнять более развернутый и детальный анализ больших объемов данных. Передовые настольные системы позволяют вести интерактивное исследование наборов данных объемом в несколько гигабайт. Серьезные исследования проводятся в таких областях, как создание дисплеев с высоким разрешением, позволяющих генерировать объемные изображения (изображения виртуальной реальности), усовершенствованный анализ, дающий возможность выявлять характеристики и отслеживать параметры, а также работа с наборами данных емкостью несколько терабайт (или даже петабайт) и ряд других вопросов, которые имеют крайне важное значение для расширения возможностей визуализации [2].
Но существует и еще один аспект визуализации, которому уделяется недостаточно большое внимание, а именно, все возрастающей роли физической распределенности компонентов процесса визуализации. Принимая во внимание тот факт, что потребность в детальном анализе данных стимулирует спрос на среду визуализации, становится все труднее удовлетворить все требования к этой среде в рамках одной вычислительной платформы или даже в пределах одного офиса. В то же самое время, высокоскоростные сети и развитие междисциплинарной науки приводит к тому, что использование удаленных ресурсов становится не только возможным, но и необходимым.
При удаленной визуализации сети с различными возможностями могут связывать географически распределенные источники данных, пользователей, которым нужны изображения, а также механизмы визуализации, которые преобразуют данные в изображения. Например, наша система удаленной визуализации позволяет совместно в интерактивном режиме выполнять реконструкцию и анализ томографических данных, полученных с удаленных рентгеновских систем и электронных микроскопов.
Рис. 1. Интерактивная система удаленной визуализаци. Источники данных находятся в Иллинойсе и в Японии, устройства анализа - в Калифорнии и Иллинойсе, а конечные пользователи - в Калифорнии, Флориде, Иллинойсе и Японии. С правой стороны рисунка: микроизображение, полученное с помощью Advanced Photon Source - самого лучшей в мире высокоэнергетической рентгеновской станции, расположенной в Арагонской национальной лаборатории в Иллинойсе, и ячейка Пуркинье, изображение которой было получено на самом мощном в мире электронном микроскопе, установленном в Университете Осака в Японии. (Информация предоставлена М. Эллисманом). |
Advanced Photon Source в Арагонской национальной лаборатории в штате Иллинойс - это лучшая в мире высокоэнергетическая рентгеновская система, а самый мощный электронный микроскоп находится в университете Осака в Японии. На рисунке 1 показана наша интерактивная система анализа, связывающая это оборудование с суперкомпьютерами, установленными в Арагоне, и институтом по информационным наукам университета Южной Калифорнии, а также с пользователям по всей Америке. Esnet министерства энергетики США и vBNS Национального научного фонда США предоставили сеть для доступа к суперкомпьютерам и удаленным пользователям, в то же время соединение Transpac через Star Tap (http://www.startap.net) обеспечивает высокоскоростной доступ к оборудованию университета Осака.
Географическое распределение серьезно осложняет процесс визуализации. Каждый гетерогенный набор ресурсов может иметь различную конфигурацию, локальную систему управления ресурсами и свои требования к защите. Более того, добавление сети увеличивает сложность, поскольку расширяется пространство проектирования и предусматривает применение различных протоколов и коммуникационных технологий. Наконец, нам приходится решать традиционные для распределенных систем задачи, к примеру, обеспечивать гарантии того, что все приложения корректно реагируют на сбой в ресурсах.
Архитектуры визуализации, используемые сейчас, не рассчитаны на то, чтобы их можно было распределять. В тех редких случаях, когда архитектура обеспечивает некоторые возможности распределения, она обычно интегрируется с приложением на самом низком уровне, тем самым ограничивая возможность приложений работать в широко распределенных гетерогенных средах.
Удаленная визуализация требует создания нового поколения ориентированных на работу в сети архитектур визуализации. Глубинное решение вопросов, возникающих как следствие распределенной природы таких систем, в противовес созданию дополнений к существующим архитектурам, - вот то, что может значительно упростить приложения удаленной визуализации. Использование усовершенствованных серверов, разрабатываемых в новой вычислительной инфраструктуре, известной как Grid, может значительно расширить возможности удаленной визуализации [3].
МЕХАНИЗМ РАБОТЫ УДАЛЕННОЙ ВИЗУАЛИЗАЦИИ
Рисунок 2. Объемная трехмерная визуализация головы муравья. Воссозданная с помощью метода стохастической выборки для генерации одновременно трех изобразительных слоев. Экспериментальные данные, в Арагонской национальной лаборатории, составляют 256 проекций размером 512 x 512 пикселов, а в результате реконструкции создается трехмерное изображение размером 512 x 512 x 512 пикселов. Сбор данных занимает 15 минут, генерация окончательного результата - около 10 минут, с применением для реконструкции 32 процессоров. |
Рассмотрим следующую ситуацию. Ученый, изучая, увеличенное изображение биологического образца, как показано на рисунке 2, поворачивает ручку настройки научного прибора с тем, чтобы более детально рассмотреть те области, которые представляют для него наибольший интерес. Его коллега замечает какую-то особенность и ученый передает ей управление, чтобы она могла внимательнее рассмотреть то, что ее заинтересовало. Они обсуждают увиденное и сравнивают результаты с другим образцом, который видели чуть раньше.
Что именно в этой, на первый взгляд, совершенно обычной ситуации, представляет интерес? А то, что оборудование, о котором идет речь, это не традиционный микроскоп, а набор сложной электронной аппаратуры. И на выходе получается не видимый свет, а гигабайты данных, используя которые суперкомпьютер должен выполнить сложную реконструкцию, прежде, чем эти данные можно будет увидеть. Сравнение с другим образцом предполагает извлечение гигабайтов данных из удаленной системы хранения. Более того, ученый и его коллега вовсе необязательно находятся в том же помещении, где установлено оборудование, и даже необязательно в одной комнате. На самом деле они могут находится за тысячи километров друг от друга, даже на разных берегах Тихого океана [4].
Этот пример иллюстрирует, как географическое распространение компонентов процесса доступа к данным, анализа и визуализации, позволяет использовать большие вычислительные ресурсы, чем обычно имеются в экспериментальных лабораториях. Процесс томографической реконструкции , который обычно применяется для получения наборов данных, при выполнении на современной рабочей станции занимает десятки часов. Благодаря высокоскоростной сети, которая связывает оборудование с удаленными суперкомпьютерами, время этой обработки можно сократить до нескольких десятков минут, то есть вполне реально получить реконструированные данные в то время, как исследуемый образец находится под микроскопом или исследуется с помощью другого научного оборудования.
Географическое распределение данных в таком контексте дает ученым дополнительные преимущества: они могут работать с оборудованием не покидая своих лабораторий. Сейчас ученым приходиться часто ездить в дальние командировки для того, чтобы собрать необходимые данные или им приходится посылать техников или студентов для сбора этих данных, но ни то, ни другое решение, не являются идеальными. Получение данных становится даже более проблематичным, когда (как часто и бывает) в проведении эксперимента принимает участие большая группа людей.
В совокупности обе этих возможности кардинально меняют то, каким образом ученые применяют научное оборудование для интерактивного пакетного сбора и анализа данных.
ДЕКОМПОЗИЦИЯ И РАСПРЕДЕЛЕНИЕ
Во врезке «Почему важно расстояние?» описывается ситуация, в которой возникают вопросы, связанные с удаленной работой. По существу, мы разбиваем на этапы весь процесс доступа к данным/анализа/визуализации, который традиционно выполнялся на одном компьютере, и размещаем отдельные компоненты на различных системах, а возможно даже и на географически разнесенных узлах. Декомпозиция и распределение ставят новые вопросы, которые не возникали в относительно простых, гомогенных и, следовательно, предсказуемых компьютерах, которые применялись для создания традиционных систем визуализации. Для решения таких вопросов требуются специальные методики.
Специализированные ресурсы
Разработчики приложений часто используют возможности распределенной структуры для доступа к специализированными компьютерам, научному оборудованию и архивам. Сети, которые они применяют для обращения к этим ресурсам, могут иметь продукты, требующие широкой полосы пропускания и имеющие большую задержку или ряд других необычных характеристик. Чтобы воспользоваться этими специализированными ресурсами, разработчикам возможно придется применять нестандартные протоколы, алгоритмы или методики программирования, которые им не знакомы, такие как упреждающая выборка по сетям.
Параллелизм
В высокопроизводительных приложениях распараллеливание функций становится важным для распределения работы между компьютерами, сетями, дисками и даже устройствами вывода изображения. Нам необходимы специализированные методики для эффективного применения такого параллелизма.
Гетерогенные возможности
Поскольку удаленный доступ часто означает использование разнородных систем, приложения удаленной визуализации должны работать ресурсами, имеющими различные возможности. К примеру, устройства вывода изображений могут быть самыми разными, от карманных компьютеров до систем виртуальной реальности, а сети варьируются от многогигабайтных систем до коммутируемых каналов. Даже идентичные на первый взгляд ресурсы, размещенные в разных узлах, могут иметь разную конфигурацию или предоставлять разные интерфейсы и сервисы. Обычно разработчики не знают, каковы возможности удаленных ресурсов, поэтому они должны создавать приложения, которые могут выявлять, а затем действовать в соответствии с информацией о конфигурации.
Правила работы
Распределенность также приводит к необходимости действовать по различным правилам, которые определяют, кто именно может использовать ресурсы, какие ресурсы могут использоваться и каким образом мы платим за эти ресурсы. К примеру, узел, который обеспечивает возможности удаленного рендеринга может ограничивать размер полосы пропускания сети, которую разрешается использовать любому конкретному удаленному дисплею, если только тот, кому требуются эти ресурсы, не работает в пределах локальной сети или не оплачивает дополнительно за доступ к ресурсам. Приложения должны иметь возможность выяснять природу значимых правил и затем действовать в соответствии с этой информацией при выборе и использовании ресурсов.
Отсутствие доверия
Удаленная визуализация объединяет пользователей и провайдеров ресурсов, которые могут не иметь друг с другом доверительных взаимоотношений. Нам необходимы механизмы для определения подлинности, определяющие, кто может использовать, какие ресурсы и когда, а также защищающие целостность и конфиденциальность данных.
Динамичное поведение
Учитывая, насколько велико количество ресурсов, вовлеченных в глобальную систему, число совместно используемых ресурсов (в частности, сетей), а также разнообразие правил работы, управляющих доступом к ресурсам, поведение ресурсов изменчиво и, с точки зрения пользователя, непредсказуемо. Возможно придется применять специализированные механизмы, такие как резервирование и зеркалирование, для снижения влияния такой непредсказуемости. Кроме того, приложения должны иметь возможность выбирать альтернативную декомпозицию, ресурсы или алгоритмы для учета изменений характеристик ресурсов. К примеру, если удаленная аппаратная система рендеринга становится недоступной, приложение может переключиться на программный механизм рендеринга, одновременно снизив скорость передаваемых кадров. Или, к примеру, может переконфигурироваться автоматически таким образом, чтобы выполнять рендеринг в месте генерации данных, а затем уже пересылать удаленным пользователям видеопоток.
УСОВРЕШЕНСТВОВАННЫЕ СЕТЕВЫЕ ПРИЛОЖЕНИЯ
Декомпозиция и распределенность одновременно увеличивают сложность и снижают предсказуемость среды визуализации. Сочетание этих двух факторов может сделать создание надежной системы удаленной визуализации крайне сложной задачей. Системы, ориентированные на использование конкретной аппаратной конфигурации и стратегии декомпозиции не являются гибкими; системы, которые удовлетворяют некому минимальному набору предположений в отношении каждого ресурса, работают неадекватно. Нам необходимо программное обеспечение, которое адаптирует свое поведение к характеристикам ресурсов, доступных ей в данный конкретный момент времени.
Разработка программного обеспечения с такими характеристиками требует новых подходов к структурированию приложений визуализации. Более точно, мы можем отнести все проблемы к трем различным группам: вопросы, касающиеся конкретного приложения; вопросы, которые не зависят от приложения, но являются особенностями удаленной визуализации; вопросы, которые относятся к проблемам, свойственным распределенной среде. Разделение этих проблем позволяет увеличить надежность и сократить объем кода, который необходимо написать, чтобы решить вопросы, являющиеся особенностями конкретного приложения. Инструментальные средства удаленной визуализации позволяют решать вопросы, не зависящие от приложения.
Понятно, что в то время как такое разделение проблем в общем и целом вещь неплохая, мы по-прежнему должны определять, как добиться этого в приложении удаленной визуализации, а также можем ли мы на самом деле продемонстрировать существенного снижения сложности и повышения надежности.
Хотя передовые системы визуализации научных данных, такие как SCIrun [5], Advanced Visualization Systems и IRIS Explorer компании Numerical Algorithm Group, используют развернутые структуры для поддержки модульного конструирования конвейеров анализа и визуализации за счет объединения объединенных компонентов, они не в состоянии эффективно решать вопросы удаленной работы.
ТОМОГРАФИЧЕСКАЯ РЕКОНСТРУКЦИЯ
В нашей работе за последние два года в рамках проектах Grand Challenge министерства энергетики мы разработали вычислительную оболочку, которая поддерживает интерактивную трехмерную реконструкцию томографического изображения (и, как следствие, совместный анализ) данных, полученных с удаленного научного оборудования [6].
Интерактивная томографическая реконструкция и анализ требуют оболочки удаленной визуализации, способной быстро извлекать из научного оборудования полученные в результате измерений данные, например, программное обеспечение получения данных, работающее на компьютере. Оболочка передает данные на суперкомпьютер для реконструкции трехмерного набора данных, выполняет рендеринг данных для создания трехмерного графического представления и дает возможность одному или нескольким пользователям просматривать и взаимодействовать с этим представлением. Обычно оборудование и суперкомпьютер, применяемые в работе приложения удаленной визуализации, а также конечные пользователи, которым предназначены эти данные, размещаются на различных узлах.
Томография использует серию двухмерных измерений, сделанных под различными углами, позволяющих определить трехмерную структуру объекта. Такую информацию может генерировать самое разное оборудование, в том числе рентгеновские системы и электронные микроскопы, которые используют электронные лучи для измерения образца. Реконструкция предусматривает большой объем вычислений, поскольку один набор данных, который включает в себя измерения, сделанные под сотней разных углов (каждое из которых содержит 2048 x 2048 16-разрядных пикселов), может иметь объем в несколько гигабайт.
Как показано на рисунке 3, базовую структуру нашей оболочки реконструкции и анализа составляет традиционный конвейер. Он состоит из следующих основных этапов: генерация данных (получаемых с помощью компьютера, подключенного к научному оборудованию), томографическая обработка (на суперкомпьютере или наборе рабочих станций) и отображение (на дисплеях старшего класса, способных создавать объемное изображение, таких как ImmersaDesk, или на дисплеях с меньшими возможностями). Мы используем графический компьютер, подключенный напрямую к дисплею, для выполнения вычислений объемного рендеринга, которые необходимы для генерации изображения. С другой стороны, мы выполняем объемный рендеринг удаленно и затем пересылаем данные на дисплей младшего класса как видео. Мастер-процесс управляет конвейером, который позволяет нам реконструировать данные по мере того, как они генерируются оборудованием. Совместные элементы управления позволяют любому узлу, участвующему в конвейере, манипулировать параметрами визуализации, в том числе менять точку зрения.
Этот процесс сложен и непредсказуем, поскольку конвейер обычно «размещается» в трех областях администрирования, на двух или трех компьютерных архитектурах, использует различные системы защиты и, по крайней мере, два коммуникационных протоколах. Мы стремимся адекватно реагировать на эти сложности, используя двухкомпонентный подход, при котором мы
- применяем определенные сервисы, которые инструментальный набор Globus [3] обеспечивает для управления ресурсами, аутентификацией и информацией;
- добавляем несколько более специализированных, но по-прежнему не зависящих от приложений сервисов удаленной визуализации, причем часть этих сервисов была реализована во время предыдущей работы, а часть создана специально для этого проекта.
Такой подход позволяет нам увеличить уровень абстракции, на котором мы пишем наше приложение, упростить разработку и увеличить надежность.
Существующие сервисы
Наша реализация использует Globus Resource Allocation Manager (GRAM) для управления ресурсами, Grid Security Infrastructure (GSI) для аутентификации и Metacomputing Directory Service (MDS) для получения информации. Мы также применяем Nexus - коммуникационную библиотеку Globus, для межкомпонентных коммуникаций.
Как и в других приложениях удаленной визуализации нам требуется механизм для обнаружения подходящих ресурсов, инициации вычислений на этих ресурсах, а также мониторинга и управления этими вычислениями. Разнообразие типов ресурсов, систем управления ресурсами, механизмов защиты и правил резервирования ресурсов, с которым мы сталкиваемся на различных узлах, серьезно осложняет эти задачи.
Мы используем коммуникационную библиотеку Nexus для того, чтобы добиться тех же преимуществ, стремясь создать конвейер, который мы можем распространять различным образом, в зависимости от характеристик доступных нам компьютеров и сетей. Такая цель усложняет реализацию межэтапных коммуникаций. Например, в некоторых случаях, каждый этап может размещаться на отдельном компьютере, доступ к которому осуществляется только по каналам, поддерживающим протокол TCP/IP. С другой стороны, подмножество узлов может быть объединено на параллельном компьютере со специализированными высокопроизводительными коммуникационными библиотеками, такими как Message Passing Interface или разделяемой памятью. Nexus помогает создать программы для этих альтернатив в приложении за счет поддержки многовариантной связи - методики, в которой, по сути, единому набору коммуникационных примитивов ставится в соответствие диапазон базовых протоколов. С помощью Nexus мы можем написать томографическое приложение в терминах единого набора коммуникационных операций; библиотека Nexus отображает эти операции на наиболее эффективный коммуникационный протокол, доступный для данного сеанса связи в данный момент.
Сервисы, не зависящие от приложений
Эффективное выполнение в распределенных средах может потребовать использования специализированных методик, таких как маскировка задержки, сжатие и многоадресная рассылка для совместного использования информации. Сложность этих методик ставит серьезный барьер на пути эффективной удаленной визуализации. Чтобы преодолеть этот барьер мы можем создать прикладной инструментальный пакет, который включает в себя «наилучшие решения».
Работа над томографическим приложением помогла нам выяснить эффективность этого общего подхода. Для этого мы разработали три не зависящие от приложения, но ориентированные именно на визуализацию сервисы для буферизации сетевых данных, совместного использования элементов управления и удаленного отображения. Затем мы применили эти сервисы для того, чтобы упростить реализацию томографического приложения. Пока наш опыт работы с этими сервисами был положительным в том, что мы повторно использовали эти сервисы в другом контексте.
Чтобы упростить рендеринг данных, которые последовательно генерируются на удаленном узле, мы разработали сервис буферизации, который асинхронно получает обработанные данные по сети, в то же время предоставляя простой локальных интерфейс для высокоскоростного локального доступа к произвольным фрагментам обработанных данных. Этот интерфейс также позволяет нам обращаться к фрагментам набора данных по мере того, как они становятся доступны, давая возможность осуществлять инкрементальную визуализацию наборов данных на более низком разрешении.
Второй дополнительный сервис предоставляет разделяемые элементы управления для совместного исследования. Основываясь на способности Nexus поддерживать надежную многоадресную рассылку, мы разработали сервис с разделяемым состоянием, который позволяет считывать или записывать значение переменной с различных узлов. Мы применили этот сервис для реализации компонент пользовательского интерфейса, которые поддерживают совместное управление приложением визуализации с различных узлов.
Компонент визуализации томографического приложения отображает результат одновременно и на локальных, и на удаленных дисплеях. Локальные дисплеи поддерживаются традиционным образом. Локальное графическое аппаратное обеспечение выполняет объемный рендеринг и посылает результаты на подключенный дисплей. В этом контексте, поддержка аппаратного рендеринга позволяет нам использовать результирующие трехмерные данные интерактивно, удаляя фрагменты, поворачивая их и так далее. Однако этот интерактивный элемент делает удаленный вывод изображений затруднительным, поскольку мы должны также иметь возможность передавать последовательность изображений достаточно быстро, чтобы обеспечить интерактивные манипуляции. По этой причине мы создали специализированный сервис удаленного вывода изображения, который осуществляет локальный рендеринг представления, предназначенного для удаленного дисплея, а затем использует видео кодек и стандартные протоколы видеоконференций для передачи сгенерированного изображения на удаленный дисплей. В будущих реализациях мы планируем предложить удаленный рендеринг как общий сервис, использующий ресурс рендеринга, который выделен для удаленного дисплея.
БУДУЩИЕ АРХИТЕКТУРЫ
Наш опыт убеждает нас в том, что архитектурный подход, который мы предложили, имеет значительное положительное влияние на возможность создания и развертывания полезных систем удаленной визуализации. Этот опыт был проверен рядом других исследователей, таких как Дэвид О?Халларон и его коллеги [7], который также пришел к выводу о необходимости создания кардинально новых архитектур визуализации, интегрирующих возможности удаленной работы как базовую концепцию. В нашей текущей работе мы реализовали эти идеи с целью определить архитектуру Network-Oriented Visualization Architecture (NOVA).
Оболочка обслуживания и адаптации к событиям
NOVA должна обеспечить развернутую поддержку адаптации на уровне приложений к меняющимся условиям. Исходя из этого мы определяем новый сервис событий Grid для поддержки обнаружения и передачи информации, требуемой для такой адаптации. На уровне прикладного инструментария мы исследуем пригодность конструирования оболочки адаптации, ориентированной именно на визуализацию, которая даст программистам возможность описывать конвейер визуализации, ограничения на производительность, которым должен удовлетворять конвейер, компромиссы, предлагаемые в случае изменения доступности ресурсов и правила, которые мы можем использовать для осуществления таких компромиссов.
Управление потоками
Поскольку приложения удаленной визуализации передают данные, управляют информацией, а также поддерживают аудио, видео и другие методы совместной работы, эти приложения часто включают в себя сложную смесь потоков. Мы можем решить эту задачу путем сопоставления этим потокам доступных коммуникационных ресурсов, определяя сервис управления потоками, который дает пользователям возможность регистрировать требуемые характеристики и приоритеты потоков. Этот сервис может автоматизировать некоторые функции управления ресурсами и уведомлять приложения о том, когда такие требования не выполняются. Архитектура управления потоками будет наиболее эффективной, если она также интегрирует другие функции управления ресурсами, например, управление специализированным аппаратным обеспечением, таким как механизмы рендеринга и видео кодеки.
Коммуникационные библиотеки для визуализации
Гибкий уровень коммуникаций, который мы разработали для томографического приложения, играет важную роль в их реализации. На коммуникационном уровне используются протоколы и форматы данных, разработанные специально для этого приложения. Однако мы уверены, что могут быть созданы и коммуникационные библиотеки, предназначенные и оптимизированные для передачи данных между этапами конвейера визуализации. Такие библиотеки упростят процесс разработки приложений, в то же время предоставляя стандартный механизм для обмен данными между компонентами визуализации. К примеру, мы проанализировали работу коммуникационной библиотеки, оптимизированной для транспортировки пяти базовых типов данных: единый, прямолинейный, структурированные и неструктурированные решетки и множество многоугольников. При создании этих программ особое внимание было уделено производительности с тем, чтобы можно было, к примеру, удалять данные из сети и направлять из непосредственно на аппаратное устройство рендеринга без переформатирования.
Специализированные коммуникационные протоколы
В некоторых случаях мы можем добиться в целом лучшей производительности при интерактивных взаимодействиях и отображении за счет применения «полунадежных» коммуникационных протоколов, которые гарантируют только доставку некоторых подмножеств данных. Интерполяционные кадры MPEG - пример такого рода данных. Точно также, удаленное отображение полученных в результате рендеринга данных визуализации может быть усовершенствованно за счет применения специализированных схем кодирования и передачи, которые позволяют найти компромисс между наблюдаемой задержкой и доступной полосой пропускания сети. Эти примеры предполагают, что NOVA может получить преимущества от применения гибких средств выбора протокола, определяемых требованиями приложения, а также доступными ресурсами.
Сервисы совместной работы
Немаловажное значение будет иметь и инструментарий, позволяющий осуществлять совместную работу в рамках визуализации. К примеру, среда CavernSoft представляет собой инструментарий, который обеспечивает высокоуровневый набор абстракций, предназначенных для поддержки разделяемого просмотра, телеконференций и совместных исследований [8]. Мы рассчитываем подготовить инструментальные средства совместной работы следующего поколения с тем, чтобы предоставить усовершенствованные возможности за счет использования более общих сервисов NOVA.
Выражение удаленной визуализации вызывает в воображении восхитительную картину: возможности механизма визуализации, которые мы используем для понимания (или, по крайней мере изображения) данных, больше не ограничиваются теми, которые мы в состоянии поместить на свою настольную систему. Вместо этого мы можем создавать механизмы виртуальной визуализации, которые интегрируют ресурсы, распределенные по машинному залу, институт, или всему земному шару. Мы можем применять эти ресурсы для выполнения анализа и совместного использования информации так, как это раньше было невозможно.
Чтобы эта фантастическая картина стала реальностью, необходимо преодолеть немало препятствий. Мы должны изучить, как сопоставить проблемы, которые мы хотим решить, и доступные ресурсы, а также должны понять, как связать эти ресурсы в интегрированную среду. Однако эти трудности будут преодолены и мы сможем решать проблемы в этой богатой, распределенной среде таким образом, каким с помощью современных технологий сделать попросту невозможно.
Благодарности
Мы благодарны своим коллегам из Арагонской национальной лаборатории и университета Калифорнии Сан-Диего), которые помогали нам в разработке микротомографических приложений, описанных в данной статье. В частности, мы благодарим Джона Бреснахана, Карла Цаджиковски, Марка Эллисмана, Питера Лане, Яна Макнули, Марка Риверса, Мей-Хуи Су, Стива Тьюке и Стива Ванга. Эта работа получила поддержку в рамках подпрограммы отдела «Математических, информационных и вычислительных наук» подразделения передовых научных вычислительных исследований министерства энергетики США.
Ян Фостер, Джозеф Инсли, Грегор ван Лацевски - Арагонская национальная лаборатория.
Карл Кессельман, Маркус Тибау - Университет Южной Калифорнии.
Ian Foster, Joseph, Insley, Gregor von Laszewski, Catl Kesselman, Marcus Thiebaux. Remoute Visualisation. IEEE Computer, december 1999, pp.36. Reprinted with permission, Copyright IEEE CS, 1999. All rights reserved.
Почему важно расстояние?
В данном исследовании расстояние играет особую роль, поскольку специализированное оборудование предоставляет данные, а процесс анализа требует другого специализированного оборудования - суперкомпьютера. Мы не должны, однако, делать вывод, что расстояние вызывает проблемы только тогда, когда используются такие уникальные ресурсы. Как показано на рисунке A, расстояние может играть важную роль на любом этапе в конвейере, реализующем процесс визуализации.
Визуализация данных
При удаленной визуализации могут использоваться самые разные источники данных, от научного оборудования до архивов данных и моделей, генерируемых суперкомпьютерами. Использование удаленных возможностей позволяет реализовать другие этапы визуализации (и, в случае необходимости, допускает вмешательство пользователя), в местах, удаленных от источников данных.
Анализ и интерпретация
Анализ преобразует «сырые» данные в производные величины, необходимые для ответа на вопросы пользователя; интерпретация генерирует изображаемые представления обработанных данных. Анализ может включать в себя широкий круг проблем, от задач, связанных с простым управлением данными, такими как фильтрация и выборка данных, до задач, требующих объемных вычислений, таких как выявление характеристик. Удаленные возможности (и, как следствие, возможность обращаться к распределенным ресурсам) позволяют проводить анализ, используя значительно большие вычислительные мощности, чем имеются в лабораториях, где размещается оборудование, генерирующее исходные данные.
Рендеринг и растеризация
Рендеринг определяет соответствие изображаемого представления в графический язык; растеризация затем генерирует пикселы самого изображения. Когда зрители удалены от источников данных, определение различных комбинаций функций анализа, интерпретации, рендеринга или растеризации может оказаться полезным. К определяющим факторам относятся число зрителей, требования зрителей (одни и та же точка зрения или разные, одинаковое разрешение или разное), размер данных на различных этапах конвейера визуализации, сетевые возможности и готовность специализированных устройств, таких как механизмы рендеринга. К примеру, при наличии быстрых сетей и аппаратных механизмов рендеринга в местах нахождения зрителей, мы можем передавать анализируемые данные и выполнять рендеринг удаленно. С другой стороны, при работе с медленными сетями или большими наборами анализируемых данных, ил в том случае, когда механизмы рендеринга отсутствуют в удаленных лабораториях, мы можем передавать уже растеризованные данные.
Отображение и интерфейс
Совместные исследования и управление зачастую требуют использования удаленных возможностей как при отображении и интерфейсе, так и при реализации управляющих функций. Более того, использование удаленной растеризации позволяет применять удаленные функции при отображении.
Вопросы, связанные с удаленной работой могут возникать на каждом из семи этапов процесса визуализации |
Литература
[1] L. Rosenblum et al., Scientific Visualization Advances and Challenges, Harcourt Brace, London, 1994.
[2] P. Smith and J. van Rosendale, eds., Data and Visualization Corridors: Report on the 1998 DVC Workshop Series, Tech. Report CACR-164, Calif. Inst. Technology, Pasadena, Calif., 1998; http://www.cacr.caltech.edu/Publications/DVC/index.html.
[3] I. Foster and C. Kesselman, eds., The Grid: Blueprint for a Future Computing Infrastructure, Morgan Kaufmann, San Francisco, 1999.
[4] M. Hadida-Hassan et al., «Web-Based Telemicroscopy,» I. Structural Biology, Vol. 125, 1999, pp. 235-245.
[5] S.G. Parker, D.M. Weinstein, and C.R. Johnson, «The SCIRun Computational Steering Software System,» Modern Software Tools for Scientific Computing, E. Arge et al., eds., Birkhдuser, Boston, 1997, pp. 1-44.
[6] G. von Laszewski et al., «Real-Time Analysis, Visual-ization, and Steering of Microtomography Experiments at Photon Sources,» Proc. 9th SIAM Conf. Parallel Processing for Scientific Computing, Soc. of Industrial and Applied Mathematics, Philadelphia, 1999, CD-ROM. Допечатную копию можно найти по адресу http://www.mcs.anl. gov/xray.
[7] M. Aeschlimann et al., «Preliminary Report on the Design of a Framework for Distributed Visualization,» Proc. Int?l Conf. Parallel and Distributed Processing Techniques and Applications (PDPTA 99), CSREA Press, Athens, Ga., 1999, pp. 1833-1839.
[8] J. Leigh et al., «A Methodology for Supporting Collaborative Exploratory Analysis of Massive Data Sets in Tele-Immersive Environments,» Proc. 8th IEEE Int?l Symp. High Performance Distributed Computing, IEEE CS Press, Los Alamitos, Calif., 1999, pp. 62-69.