Лаборатории HP Labs работают над перспективными инновационными решениями, которые компания сможет вывести на рынок через семь-десять лет, причем тематика исследований лабораториям не навязывается, хотя очевидно, что вероятность применения полученных результатов будет выше, если они лежат в русле существующего бизнеса компании либо дополняют его. Никто не запрещает исследователям самостоятельно ставить научные задачи, и, если сотруднику удается обосновать потенциал нового исследования, лаборатория получает финансовые и временные ресурсы для его реализации. По словам директора Лаборатории HP в Санкт-Петербурге Владимира Полутина, по-настоящему революционные новые продукты и сервисы компании рождаются как раз из таких нестандартных решений.

Проблема «информационного взрыва» – осуществление эффективного управления информацией на предприятиях в условиях ее экспоненциального роста – является одним из пяти основных направлений работы HP Labs наряду с задачами трансформации контента, построения интеллектуальной высокопроизводительной инфраструктуры для обработки и хранения данных, создания «облачных» сервисов и сохранения живой природы.

Лаборатория реализует уникальный для HP Labs проект по созданию платформы предоставления контекстуальной информации (Contextualized Information Delivery Platform, CIDP). Платформа предназначается для так называемых «информационных работников» (knowledge worker) – финансовых или политических аналитиков, специалистов по продажам или маркетингу, научных сотрудников и любых других пользователей, повседневный труд которых связан с обработкой больших объемов информации для принятия или рекомендации решений.

Характер деятельности лабораторий HP напоминает работу стартапов, поскольку речь идет о новых технологиях, с тем единственным отличием, что риски, связанные с успешностью реализации, которые всегда велики для начинающих фирм, покрываются материнской компанией.

Выработан стандартный путь трансформации результатов научных исследований лабораторий HP в продаваемые решения. В структуре HP Labs имеется особое подразделение Technology Transfer, которое отвечает за передачу технологий бизнесу. Начиная с определенной фазы исследования, когда появляются первые обнадеживающие результаты, превосходящие уже существующие в мире технологические достижения в данной области, эти результаты начинают демонстрироваться в бизнес-подразделениях HP с целью вызвать к ним интерес и подготовить почву для создания на их основе коммерческих продуктов или для интеграции с уже существующими решениями.

Так замыкается обратная связь – определяя тематику исследований, HP Labs получают информацию от бизнеса о том, что может представлять интерес для HP с технологической и маркетинговой точки зрения, а результаты исследования предоставляются бизнесу через канал Technology Transfer для оценки их применимости. Данный процесс происходит с определенной периодичностью по ходу работы над проектами, что позволяет оперативно реагировать на критику или рекомендации по внесению корректировок исходя из рыночной конъюнктуры.

Проектное предложение по созданию платформы CIDP успешно прошло защиту и было утверждено в сентябре 2008 года, официальные сроки проекта определены на пять лет, а первые контакты
с бизнесом по каналу Technology Transfer запланированы на конец третьего года реализации.

Союз образования и науки

Исследование новых подходов к информационному поиску станет основным направлением деятельности учебно-научного центра HP, который открылся в июне 2009 года в Санкт-Петербургском государственном университете. Центр создан в рамках программы «Международный институт технологий HP», но его отличительной особенностью по сравнению с другими центрами в вузах – участниках этой программы является специализация именно на научной работе, которая будет выполняться студентами и аспирантами университета под руководством профессоров СПбГУ и ведущих исследователей НР Labs в Санкт-Петербурге.

Союз HP Labs и ведущего отечественного университета призван выполнить двойную миссию: способствовать эффективному обучению студентов через конкретную научно-практическую работу и при этом обеспечить получение научных результатов мирового уровня. Созданные в центре и на математико-механическом факультете СПбГУ информационно-поисковые технологии войдут
в состав проекта CIDP.

В лаборатории в тесной координации с учеными HP Labs профессура, преподаватели, аспиранты и студенты матмеха будут вести исследования по следующим направлениям:

  • обработка текстов на естественном языке;
  • извлечение семантической информации из мультимедийных данных;
  • извлечение объектов, событий, сложных событий, фактов при глубинном анализе текстов;
  • интеграция информации из гетерогенных источников;
  • контекстуальное сжатие, автоматическое резюмирование;
  • масштабируемые алгоритмы на графах;
  • сервис-ориентированные архитектуры и облачные сервисы.

Лаборатория планирует развивать широкое академическое партнерство – научные доклады профессорско-преподавательского состава и аспирантов СПбГУ будут представляться во всех лабораториях НР. С другой стороны, университет предоставит возможность демонстрировать свои научные результаты ученым НР и их коллегам из лабораторий других компаний. Будет сформирована программа стажировок молодых кандидатов наук в HP Labs, а ученые СПбГУ будут проводить спецкурсы и консультации для сотрудников питерской НР Labs в соответствии с потребностями, возникающими в ходе их исследовательской работы.

Опыт совместной научной работы центра HP и СПбГУ в МИТ HP намерены распространить и на другие центры программы. Успех программы был отмечен руководством HP – она приобрела международный статус и сегодня объединяет 20 университетов России и Восточной Европы.


Вся сила в кадрах

ВЛАДИМИР ПОЛУТИН: «Россия во второй половине 90-х — начале 2000-х годов потеряла многих хороших исследователей, но научные школы остались, и их молодые представители работают у нас в лаборатории».Успех любого научного исследования определяют вовлеченные в него люди. Владимир Полутин, директор Лаборатории HP в Санкт-Петербурге, рассказывает об особенностях организации работы в HP Labs.

Какое место занимает лаборатория в Санкт-Петербурге в структуре HP Labs?

Основным фактором в пользу России для открытия лаборатории HP был уровень специалистов, которых все еще продолжает готовить страна. Выбор Санкт-Петербурга продиктован тем, что это город с большим количеством сильных университетов, общепризнанных в России и за рубежом, город с развитой инфраструктурой, международным аэропортом и пока еще более низкой стоимостью жизни по сравнению с Москвой.

Проект, который вы сейчас ведете, единственный?

Мы начали формирование лаборатории параллельно с разработкой плана исследований и фактически подбирали людей под задуманный проект. Сейчас в нашей лаборатории работают одиннадцать специалистов, включая одного ученого из США, которого заинтересовала тема CIDP, – он взаимодействует с нами удаленно, приезжая в Россию раз в квартал. Есть статистические данные, согласно которым одиннадцать человек – оптимальный коллектив для реализации серьезного исследования. Сегодня в лаборатории полным ходом идет работа над платформой предоставления контекстуальной информации для так называемых «информационных работников». Мы думаем о следующих направлениях, и у нас уже есть несколько идей.

В рамках проекта CIDP вы можете определить, что есть информация, а что данные?

Моя личная трактовка состоит в том, что сырые данные – это набор фактов, событий, цифр и т.д. Понятие же информации может быть применено по отношению к конкретному пользователю и с учетом фактора времени. Если вам нужен прогноз погоды на завтра и вы его прочитаете, то для вас это будет информация. Но вчерашний прогноз погоды для вас как обычного человека информацией не является. Хотя это информация для метеоролога, которому надо, например, отслеживать тенденции по глобальному потеплению.

Помимо привязки по времени информация определяется характером деятельности или личными пристрастиями человека. Меня, например, не интересуют данные по фигурному катанию, я увлекаюсь шахматами или большим теннисом. Поэтому я просто игнорирую все данные, поступающие о фигурном катании, в контексте моих личных потребностей они для меня никакой роли не играют, я не воспринимаю это как информацию. Таким образом, я считаю, что информация – это данные, обработанные под конкретного пользователя и в конкретное время. В этом смысле в нашем проекте мы работаем над извлечением и персонализацией именно информации, необходимой конкретному пользователю.

По каким критериям набирались сотрудники Лаборатории HP в Санкт-Петербурге?

Мы ориентируемся на специалистов, которые доказали свою научную дееспособность. Общепринятые в научном мире доказательства – это публикации в трудах научных конференций или в серьезных журналах, цитируемость этих публикаций, наличие кандидатской или докторской степени. Кроме того, мы прислушиваемся к рекомендациям других ученых – коллег кандидатов на работу в лаборатории,
к заключениям их научных руководителей во время обучения в аспирантуре. В этой связи у лаборатории налажено тесное партнерство с математико-механическим факультетом .

Существуют также хорошие связи с академическими институтами в Москве и Санкт-Петербурге. Ряд работ реализуется в партнерстве с этими организациями, в частности с матмехом СПбГУ и Институтом системного программирования РАН, поскольку мы считаем, что не нужно дублировать научные ресурсы и проводить исследования, которые лучше могут сделать наши коллеги.

Считаете ли вы, что научное подразделение крупной коммерческой компании имеет возможность влиять на ситуацию с наукой и образованием в стране?

К нам постоянно обращаются за консультациями по вопросам изменения учебных планов вузов в области computer science, по вопросам организации науки в западном понимании, вопросам правильной организации технопарков. Я консультирую правительство Санкт-Петербурга, были обращения от представителей Государственной думы по проблеме активизации внедрения инновационных технологий в России. Мы всегда открыты к таким контактам.

АУДИТОРИЯ

ИТ для будущих энергетиков

В Московском энергетическом институте создан Академический центр компетенции IBM, основными задачами которого являются улучшение качества образования путем повышения уровня знаний в области ИТ и развитие партнерских связей в целях подготовки квалифицированных кадров для предприятий энергетической отрасли, а также в сфере совместных научных исследований. МЭИ уже присоединился к международной программе IBM Academic Initiative, предусматривающей сотрудничество с учебными заведениями, осуществляющими подготовку специалистов в области информационных и коммуникационных технологий. Один из примеров использования решений IBM в учебной программе МЭИ – курс «CASE-технологии разработки программных средств», в рамках которого студенты специальности «Прикладная математика и информатика» осваивают разработку крупных программных систем с применением UML и пакета Rational Rose, их отладку на базе Rational Purify Plus, создание технических заданий и управление качеством разработки с помощью инструментов Rational Requisite Pro и Clear Case. В другом курсе, «Современные методы ведения крупных программных проектов», студенты знакомятся с созданием приложений на основе сервисной архитектуры с применением IBM WebSphere. В МЭИ считают, что сотрудничество с IBM будет способствовать реализации таких исследовательских проектов, как создание комплексов управления энергетическими установками с использованием методов искусственного интеллекта, проектирование объектов энергетики и управление их жизненным циклом.

Суперкомпьютерный консорциум пополнил ряды

Компания «Т-Платформы» принята в качестве ассоциированного члена в состав Суперкомпьютерного консорциума университетов России, основателями которой являются российские университеты, обладающие самыми мощными вычислительными ресурсами. Суперкомпьютерный консорциум, созданный в конце декабря 2008 года, занимается вопросами внедрения суперкомпьютерных технологий в промышленные предприятия и организацией взаимодействия университетов по использованию и развитию суперкомпьютерных технологий и разработке совместных программ подготовки специалистов. Президентом консорциума является ректор МГУ В.А. Садовничий. На сегодняшний день в состав консорциума входят 15 российских вузов.

Платформа для информационного работника

Платформа CIDP будет включать в себя несколько модулей. Прежде чем информация непосредственно поступит к пользователю, она должна пройти через модуль персонализации – фильтр, который сотрудник создает для себя самостоятельно исходя из своих рабочих задач или личных пристрастий. Например, специалист по финансам будет извлекать из корпоративных архивов или Internet информацию, связанную с финансовыми объектами. Фильтр допускает тонкую настройку предметной области, которой смогут воспользоваться, продолжая пример финансистов, страховщики или специалисты по кредитованию. Дополнительным к модулю персонализации является сервисный модуль, который предоставляет возможность отображать информацию в наиболее предпочтительном для пользователя виде. Перед модулем персонализации информация проходит через модуль снижения информационной нагрузки. Этот модуль выполняет функцию контекстуального сжатия информации, позволяя предоставить пользователю по его запросу не десятки тысяч страниц, как при обычном поиске, а минимально необходимый объем информации для достаточно полного отражения контекста запроса. Следующий модуль извлечения объектов, событий и фактов опирается на сервисы семантической фильтрации информации из многочисленных источников. Далее
в платформе CIDP имеется модуль обработки первичной информации.

Проект CIDP не ограничивает возможности информационных работников только текстовыми источниками информации. Ученые HP Labs в Питере изучают возможности работы с мультимедийной информацией, что является достаточно сложной научной задачей. Кроме того, они работают над усовершенствованием применения методов математической статистики к обработке текстовой информации.

Реализация модулей платформы CIDP опирается на технологию автоматического построения онтологий на базе Wikipedia и других открытых энциклопедий в Internet. Одна из целей проекта – научиться использовать смысловое содержание, заложенное в открытых энциклопедиях, для более точного извлечения информации. Wikipedia как источник семантического знания имеет большое преимущество, поскольку это открытая система, которая постоянно совершенствуется и пополняется. При тонкой настройке платформы под нужды определенных категорий пользователей возможно подключение других подобных источников, например открытых энциклопедий по научным трудам для научных сотрудников.

По существу, основная задача CIDP – оптимизировать работу пользователя, работающего с информацией. Эта оптимизация реализуется по трем основным направлениям: реальный масштаб времени, минимально-контекстуальная информация и полнота покрытия этой информации. Информация должна предоставляться как можно быстрее, однако информационный работник не должен быть перегружен данными – ему нужен минимальный объем контекстуальной информации. Но в то же время эта минимально-контекстуальная информация должна быть достаточно полной для грамотного принятия решения.

Фактор времени имеет в проекте первостепенное значение. Все модули платформы CIDP максимально автоматизированы, чтобы избавить пользователя от ручной обработки информации. Кроме того, в проекте реализуется семантическое кэширование информации, которое позволит не обращаться с запросом к громадному информационному полю, а заранее идентифицировать более узкую область знаний. Например, осуществляя обработку запроса пользователя по финансовой информации, система проведет его через всю цепочку вплоть до запроса к внешним источникам таким образом, чтобы опрашивался только нужный сектор информационного поля, и поместит нужную пользователю информацию в кэш. Тем самым минимизируется обмен информацией с хранилищами данных, разбросанными по всему миру, и значительно ускоряется работа с нужной информацией.