Термин «большие» почти полвека назад закрепили за составными системами, которые затруднительно было анализировать. Теперь уровень системного развития информационных технологий остановился перед необходимостью работы с большими объемами разнообразных данных, поэтому термин big data («большие данные») становится весьма популярным при представлении новых возможностей программных продуктов и систем.
Прошедшая в Москве пресс-конференция компании SAS и была посвящена теме «Большая Аналитика для Больших данных». Внимание к мероприятию привлек ряд обстоятельств. Во-первых, назывались причины интереса к проблеме «больших данных», а именно заинтересованность бизнеса в возможностях IT по их обработке. Во-вторых, был представлен круг задач, нуждающихся в подобных технологиях, что было продемонстрировано на примере работ по бизнес-аналитике, проводимых в банке ВТБ 24 и использующих решения, предлагаемые компанией SAS. В-третьих, определенный интерес для участников конференции представлял продукт, с которым выходит на рынок один из известнейших и старейших поставщиков аналитических решений, каковым является компания SAS.
Генеральный директор компании SAS Россия/СНГ В. Панкратов охарактеризовал суть их сегодняшнего корпоративного видения аналитической обработки информации, а именно -- переход от получения простых отчетов к прогнозированию будущего состояния бизнеса и его оптимизации на основе допустимых моделей развития. В своих разработках SAS придерживается следующего толкования понятия «большие данные»: это стремительно растущий многообразный объем информации -- тексты, структурированные таблицы, документы, сообщения электронной почты, SMS-сообщения, данные измерительных приборов, видео, аудио, данные биржевых торгов и другие. К компании предъявляются высокие требования по быстродействию их обработки, чтобы удовлетворять условиям управления функционирования бизнеса.
Вице-президент, заместитель директора финансового департамента ВТБ 24 С. Анохин отметил, что необходимость работы с «большими данными», прежде всего связана с переходом от продуктовой модели развития бизнеса к клиент-ориентированной. При этом подчеркивалась необходимость обработки данных, относящихся к множеству клиентов. Говорилось, что объемы этих данных серьезно растут, а значит, использование решений, предлагаемых компанией SAS, позволит более полно описывать состояние и развитие бизнеса банка.
Руководитель направлений аналитики и гарантирования доходов компании SAS Россия/СНГ А. Свирщевский, представляя концепцию аналитики «больших данных» и реализацию в Grid-среде решений и программных продуктов для отраслей бизнеса, охарактеризовал основные этапы аналитической обработки информации. Это определение задачи; подготовка, исследование и преобразование данных; построение, оценка и применение модели, а также оценка мониторинга результатов. Что касается пользователей, то это -- бизнес- и IT-менеджеры, бизнес-аналитики и аналитики-математики.
К основным технологическим достоинствам своих решений и продуктов компания SAS относит то, что инфраструктура аналитической обработки включает возможности обработки в Grid-среде, в БД и в памяти. Первая включает кластер серверов, вторая различные БД и третья выполнение вычислений в ОП.
Продукт SAS -- High-Performance Analytics -- позволяет ставить задачи с учетом взаимодействий с миллионом клиентов, с тысячью анализируемых параметров и с различными аспектами анализа функционирования компании. При этом, например, построение моделей для анализа выполняется от 30 до 120 раз быстрее, что служит увеличению средней доходности компании в расчете на одного клиента до 1%.
Ряд прикладных решений на базе SAS High-Performance Analytics компания предлагает на рынке. Это SAS High-Performance Risks -- продукт для моделирования оценки рисков; SAS High-Performance Markdown Optimization и SAS High-Performance Marketing Optimization -- для моделирования маркетингового поведения компании.
Руководитель направления платформенных решений SAS Россия/СНГ Алексей Мещеряков представил продукт SAS Visual Analytics -- для визуализации полученных результатов анализа данных, в том числе при использовании мобильных устройств.