За семь лет работы над этой технологией IBM оформила более 100 патентов. Сейчас решение переходит из стадии прототипа в стадию коммерческого продукта, получившего название System S. В основу потоковых вычислений IBM положила кардинально иной подход к бизнес-аналитике, позволяющий анализировать данные в постоянно обновляемых потоках информации, получаемых из множества источников, а не из статических файлов, загруженных ранее в хранилище данных.
"System S может анализировать одновременно сотни или даже тысячи потоков данных – котировок акций, сведений о розничных продажах, прогнозов погоды и т. д., причем результаты анализа выдаются практически мгновенно. Это именно то, что нужно руководителям бизнеса, от которых требуется быстро принимать решения, - говорится в заявлении IBM. – Программное обеспечение поможет всем организациям, которые должны реагировать на меняющиеся условия в реальном времени. Это государственные структуры и правоохранительные органы, финансовые институты, сети розничной торговли, транспортные предприятия, медицинские учреждения и многие другие".
Потоковые вычисления уже используют Шведский институт космической физики, Ирландский институт биологии моря и TD Securities.
"TD Securities применяет System S для анализа торговой информации, получаемой со скоростью более 5 млн. бит в микросекунду, чтобы быстрее принимать решения, связанные с продажами", - сообщили представители IBM.
Проектом, посвященным потоковым вычислениям и впервые представленным два года назад, руководил директор инициативы System S по науке Нагуи Халим; участвовало в проекте 80 человек. Халим уточнил, что это программное обеспечение предназначено для кластеров массовых Linux-серверов. Прейскурантная цена системы составляет 400 тыс. долл., но ее стоимость может варьироваться от 100 тыс. до 1 млн долл. в зависимости от размера.
Вместо файлов и каталогов System S обрабатывает данные в одноименных потоках, которые Халим сравнил с окнами в Microsoft Windows, поскольку они предоставляют инструмент для взаимодействия пользователя с системой. "Здесь поток становится 'живым' объектом, к которому вы подключаетесь и который вы обрабатываете, - пояснил он. – Можно, например, попросить предоставить один поток или десять потоков, назвать их, включать и отключать их, вести их мониторинг. Потоки становятся базовыми элементами".
Халим отметил, что разработчикам пришлось решать множество серьезных задач в самых разных областях - математике, связи, планировании, восстановлении после сбоя и работе в сети.
"Оглядываясь назад, можно сказать, что потребовалось, например, несколько итераций, чтобы выбрать правильный язык, - сказал он. – Мы попробовали несколько различных подходов, и после третьей или четвертой попытки остановились – я в этом совершенно убежден – на очень мощном решении".
Существуют и другие системы, которые обрабатывают данные в режиме реального времени по мере появления информации из внешних источников, но Халим подчеркнул, что System S, созданная IBM, отличается высочайшими показателями производительности и масштабируемости, а также самыми широкими возможностями анализа.
В Дублине IBM открыла центр Stream Computing Center, который занимается исследованиями, оказывает поддержку пользователям и проводит тестирование. Пробная версия кода System S уже выпущена, а инструментарий разработчика и адаптеры помогут пользователям разобраться в возможностях программного обеспечения и понять, какую пользу оно принесет их бизнесу.
IBM не сообщила, планирует ли она доступ к System S через Web в рамках модели хостинга, но Халим отметил, что ситуация может измениться.