В тематической подборке четыре большие статьи. Приглашенным редактором тематической части номера является Оливер Бимбер (Oliver Bimber), а его вводная заметка называется «Запечатление мира» (Capturing the World). В 1796 году Александр фон Гумбольт написал своему другу Марку-Августу Пикте: «У меня возникла идея составить физическое описание мира», а спустя три года он отправился в величайшее путешествие, посвященное исследованию Латинской Америки. Вместе со своим компаньоном Еме Бонпланом он прошел 2776 км вдоль русла реки Ориноко по дикой и малообитаемой стране, достиг высоты в 5878 м, пытаясь определить высоту вулкана Чимборасо, находящегося на территории современного Эквадора, что в то время было мировым рекордом. Для определения координат своего местоположения и выполнения других измерений Гумбольт использовал около 50 приборов, включая секстанты, телескопы и астрономические квадранты. Эта легендарная экспедиция в конечном счете привела к образованию физической географии. Через 40 лет после написания письма Пикте и после экспедиции в Россию, во время которой он прошел 15 472 км, Гумбольт приступил к созданию четырехтомного труда «Космос: набросок физического описания мира» (Kosmos – Entwurf einer physischen Weltbeschreibung).
За прошедшие 200 лет многое изменилось, но стремление запечатлеть и описать мир в целом по-прежнему существует. Сегодня на поверхности Земли на площади около 150 млн кв. км в примерно 1,5 млрд домов проживает почти 7 млрд человек. С точки зрения геометрии, для физического описания мира уже не требуются рискованные экспедиции – горстку исследователей заменили миллиарды туристов, вместо секстантов используются спутники, самолеты, специальные наземные транспортные средства, цифровые камеры и мобильные телефоны. Однако за все эти годы не изменилось одно: ровно так же, как планы Гумбольта «корректировались» по воле Наполеона, описанию мира сегодня мешают политики и военные конфликты.
Первая основная статья тематической подборки написана Францем Леберлом (Franz Leber), Херстом Бишофом (Horst Bischof), Томасом Поком (Thomas Pock), Арнольдом Иршара (Arnold Irschara) и Стефаном Клюкнером (Stefan Kluckner) и называется «Надземное машинное зрение для поддержки трехмерной виртуальной среды обитания» (Aerial Computer Vision for a 3D Virtual Habitat).
В 2005 году корпорация Microsoft реализовала идею виртуальной Земли, которая называется теперь сервисом Bing Maps. В этом проекте используются нетривиальные данные – для поддержки стандартной фоновой карты мира с геометрическим разрешением около 15 см, получаемой из инфракрасных-красных-зеленых-синих изображений с высоким уровнем перекрытия, требуются исходные данные объемом примерно 200 Пбайт. Кроме того, требуются объекты, которые люди могут рассмотреть, находясь на улице. Например, чтобы прочитать уличные вывески, нужно обеспечить геометрическое разрешение примерно в 2 см, а для полноценного посещения виртуальных магазинов и музеев необходимо моделирование внутренних помещений и находящихся в них объектов, что потребует разрешения в 0,5 см. Повышение уровня детализации для поддержки передвижения пешеходов приводит к появлению приложений для мобильных телефонов. На первый взгляд аэрофотосъемка конкурирует с получением изображений с искусственных спутников Земли, особенно если требуются данные о запретных районах, контролируемых недружественными властями. Однако спутниковые изображения дают разрешение 50 см на пиксел, а этого недостаточно для размещения на картах объектов масштаба человека, в то время как аэрокамеры могут обеспечить разрешение от 5 см до 15 см на пиксел, требуемое для представления таких подробностей, а для обеспечения полной автоматизации они могут предоставить десятикратную избыточность без дополнительных расходов.
Рис. 1 иллюстрирует эволюцию картографии: традиционные уличные схемы являются разреженными и обычно используются для простой навигации; на аэроснимках в ортографической проекции появляется уже больше информации; наиболее полную информацию обеспечивают трехмерные данные.
Аэрофотоснимки всего мира на уровне улиц занимают 1 экзабайт, и проект Virtual Earth основан на информации, извлекаемой из этих данных: трехмерная модель «голой» Земли; трехмерные объекты, расположенные на ее поверхности; объекты внутри и вне зданий, представляющие интерес. Такое представление не только позволяет полностью реализовать идею поиска в Интернете с использованием деталей текущего местоположения человека, но и дает основу для возникновения «окружающего интеллекта» (ambient intelligence). Вооружив виртуальную среду обитания датчиками, подключенными к Интернету, мобильными устройствами и RFID-маркерами, можно отслеживать перемещения людей и объектов, определять их текущее положение и обеспечивать соответствующие средства поиска в Интернете.
Статья «Google Street View: запечатление мира на уровне улиц» (Google Street View: Capturing the World at Street Level) представлена Драгомиром Ангеловым (Dragomir Anguelov), Кэрол Дюлон (Carole Dulong), Дэниэлом Филипом (Daniel Filip), Кристином Фрю (Christian Frueh), Стефаном Лафоном (Stephane Lafon), Ричардом Лионом (Richard Lyon), Абхиджитом Огале (Abhijit Ogale), Люком Винцентом (Luc Vincent) и Джошем Вивером (Josh Weaver). Несколько лет назад сооснователь Google Ларри Пейдж проехал на машине вдоль залива Сан-Франциско и отснял несколько часов чернового видеоматериала, ориентируясь на фасады домов. Идея состояла в организации исследований и разработок, направленных на то, чтобы сделать подобные изображения полезными в крупном масштабе. В результате возник проект CityBlock со Стэндфордским университетом, выросший в сервис Street View, что хорошо иллюстрирует два основных принципа, которыми руководствуется Google: новые проекты надо начинать без долгих обсуждений способов их выполнения; имеет смысл сразу браться за решение крупных проблем.
По данным Всемирной книги фактов (The World Factbook, https://www.cia.gov/library/publications/the-world-factbook), издаваемой ЦРУ, в 219 странах мира имеется примерно 50 млн миль дорог, с покрытием и без покрытия. Объехать все их по одному разу – это все равно что 1250 раз объехать Землю по экватору, и команде Street View предстоит долго работать (рис. 2) для завершения проекта.
Авторами статьи «Воссоздание Рима» (Reconstructing Rome) являются Самир Агарвал (Sameer Agarwal), Ясутака Фурукава (Yasutaka Furukawa), Ноа Сневели (Noah Snavely), Брайан Кэлесс (Brian Curless), Стивен Сейц (Steven Seitz) и Ричард Зелиски (Richard Szeliski). Когда-то любительская фотография была частным делом людей – человек с фотоаппаратом фиксировал на пленку какое-то событие и показывал снимки небольшому числу друзей и членов семьи, однако появление цифровых фотокамер и сайтов, поддерживающих совместное использование фотографий, таких как Flickr, привело к радикальным изменениям. Сегодня фотоснимок, сделанный любителем и выложенный в Интернет, потенциально могут увидеть миллионы людей, а у людей, создающих трехмерные модели городов, теперь имеется доступ к огромной, постоянно расширяющейся коллекции фотографий по всему земному шару. Например, в ответ на запрос по ключевому слову «Rome» Flickr возвращает более двух миллионов фотографий.
Какие трехмерные модели Рима можно построить на основе этой фотоколлекции? В принципе, изображения Рима из собрания Flickr являются идеальным набором данных для исследований в области трехмерного моделирования, поскольку представлены городские достопримечательности во всех деталях и в разных ракурсах. Однако построить высококачественные трехмерные модели на основе этой коллекции вряд ли получится. Во-первых, фотографии не структурированы. Во-вторых, они не калиброваны. В-третьих, огромен масштаб – если в предыдущих методах трехмерного моделирования использовалось не более нескольких тысяч фотографий, то теперь нужно быстро обработать целые коллекции.
Трехмерные модели городов могут использоваться в различных приложениях. В секторе государственного управления модели требуются для планирования и визуализации развития городов. Модели не менее важны и в научных дисциплинах, включая историю, археологию, географию и т.д. Цифровые модели городов играют центральную роль в интернет-приложениях, а также в навигационных системах, основанных на GPS. В недалеком будущем эти модели обеспечат появление средств дополненной реальности (augmented reality), которые позволят распознавать и аннотировать объекты на дисплеях мобильных телефонов со встроенными фотокамерами и других мобильных устройств.
Специалисты по машинному зрению изучили много подходов к трехмерному моделированию городов, однако существующие крупномасштабные системы опираются на данные из структурированных источников, например на аэрофотоснимки, полученные со специальных летательных аппаратов, или на изображения улиц, запечатленные с движущегося автомобиля. Такие системы рассчитаны на использование фотоснимков, сделанных одинаково калиброванными фотокамерами, которые производят фотографирование с одинаковой частотой и обычно оснащаются дополнительными датчиками, такими как GPS и инерциально-навигационные устройства (inertial navigation unit). Это значительно упрощает вычисления, но у изображений, собираемых в Web, все это отсутствует, поэтому основной упор в исследовании авторов делается на разработку новых методов трехмерного машинного зрения, которые могли бы создавать трехмерные модели городов на основе огромных коллекций разнородных изображений.
Последняя статья тематической подборки называется «Воссоздание сцен на основе фотоколлекций сообществ» (Scene Reconstruction from Community Photo Collections), и написана она Микаэлом Геселе (Michael Goesele), Йенсом Акерманом (Jens Ackermann), Симоном Фурманном (Simon Fuhrmann), Ронни Кловски (Ronny Klowsky), Фабианом Ланггутом (Fabian Langguth), Патриком Мюке (Patrick Mucke) и Мартином Рицом (Martin Ritz). Открытый в феврале 2004 года сайт Flickr позволяет пользователям размещать фотографии, добавлять к ним теги и географическую привязку и использовать фотографии и видео совместно с сообществом. На сегодня пользователи Flickr закачали на сайт 4,5 млн файлов, образующих громадную, быстро растущую базу данных аннотированных изображений.
Появление и доступность такого нового, огромного и разнотипного набора данных немедленно поставили перед исследователями ряд вопросов. Для чего его можно было бы использовать? Насколько это будет полезно? Пригоден ли этот набор данных для обработки методами машинного зрения, машинной графики и т.д.
И на самом деле, вскоре после открытия Flickr исследователи поняли, что у этого ресурса имеется огромный потенциал. Первые исследования концентрировались на двух областях: «коллективная расстановка тегов» (community tagging) и способы взаимодействия пользователей. В 2006 году Александр Джаффе со своими коллегами разработал средство обобщения визуальных сцен на основе изображений с географическими привязками. Ноа Сневели и его коллеги создали систему Photo Tourism, которая строит трехмерное представление сцены, используемое затем в интуитивно понятном интерфейсе. С тех пор исследования, основанные на применении фотоколлекций сообществ, распространились на разные области.
В статье обсуждается конкретный вопрос: как воссоздать визуальную сцену на основе фотоколлекций сообществ. Авторы концентрируются на проблемах сложности и разнородности изображений.
Вне тематической подборки опубликованы две большие статьи. Статью «Беспроводная PKI-безопасность и мобильное голосование» (Wireless PKI Security and Mobile Voting) представили Йаак Тепанди (Jaak Tepand), Станислав Васильев (Stanislav Vassiljev) и Илья Захиров (Ilja Tsahhirov). Инфраструктура открытых ключей (public key infrastructure, PKI) позволяет пользователям самостоятельно аутентифицироваться для доступа к Web-сервисам, пользоваться электронной подписью и шифровать тексты. PKI связывает личности пользователей с их открытыми ключами посредством удостоверяющих центров. PKI может поддерживать критические по безопасности приложения, что предполагает регистрацию пользователей и наличие среды PKI. Для удовлетворения этих требований уполномоченные удостоверяющие центры могут выпускать «проверенные сертификаты» (qualified certificate), сохраняемые в идентификационных карточках (ID-PKI).
В Эстонии, стране с населением 1,4 млн человек, выпущено более миллиона идентификационных карточек, электронные подписи используются в договорах и других официальных документах, основные банки страны признают безопасность PKI на основе идентификационных карточек и требуют, чтобы все транзакции на сумму, превышающую некоторый порог, аутентифицировались и авторизовались посредством идентификационных карточек.
В то время как механизм ID-PKI обеспечивает значительные преимущества в отношении безопасности по сравнению с традиционными методами аутентификации, такими как списки одноразовых паролей и аппаратные аутентификационные жетоны, у этого подхода имеется ограничение, поскольку для аутентификации требуется устройство чтения идентификационных карточек, а также компьютер. Однако такие устройства не всегда доступны. Более удобными оказываются мобильные телефоны. В приложениях, критичных по безопасности, можно использовать компьютеры и мобильные телефоны, оснащенные картой Universal Subscriber Identity Module, для аутентификации и создания электронной подписи.
Последнюю статью июньского номера написали Анита Сарма (Anita Sarma), Дэвид Редмайлс (David Redmiles) и Андре ван дер Хок (Andre van der Hoek). Статья называется «Категоризация спектра технологий координации» (Categorizing the Spectrum of Coordination Technology). Эффективная координация, играющая центральную роль в любой групповой работе, – это, по существу, управление зависимостями заданий с применением объединения, упорядочения или устранения результатов некоторых, уже выполненных работ. В области разработки программного обеспечения отсутствие координации приводит к задержкам при выполнении проектов и возрастанию трудозатрат. Для координации даже одиночного централизованного проекта необходимо управлять многочисленными зависимостями каждого артефакта. Рассредоточение разработчиков по подгруппам, помещениям или странам значительно повышает уровень трудозатрат, требуемых для координации. Несмотря на наличие многочисленных инструментальных средств и использование прочно установившихся процессов, координация часто нарушается.
Технология координации состоит из инструментальных средств, поддерживающих совместную разработку программного обеспечения. Доступно огромное число таких средств. Для сравнения различных технологических средств на основе некоторой конкретной парадигмы (например, парадигм структурированных процессов или раскрытия информации) полезно использовать фреймворки. Однако традиционные каркасы (framework) основываются только на какой-то одной парадигме, что ограничивает области их применения. Для обеспечения возможности получения более полной картины авторы создали пирамиду координации (Coordination Pyramid), в которой увязываются пять разных парадигм координации и обеспечивается классификация технологий координации в соответствии с основными поддерживаемыми ими парадигмами. Пирамида координации помогает компаниям оценить и четко сформулировать свои потребности в координации, а также подобрать набор инструментов, удовлетворяющих эти потребности. Пирамида, поскольку в ней технология
в целом представляется на основе иерархии парадигм координации, помогает формулировать и документировать тенденции развития технологии, а также выявлять перспективные направления исследований и области применения.
Всего доброго, до следующей встречи, Сергей Кузнецов, kuzloc@ispras.ru.