04.06.2012
Большая Аналитика для Больших Данных
Компания SAS Россия/СНГ, лидер в области решений и услуг в сфере бизнес-аналитики, объявляет о выводе на рынок полной линейки аналитических инструментов – технологий и продуктов – нового поколения: SAS High Performance Analytics. Они позволяют решать бизнес-задачи принципиально другого уровня сложности, давая возможность обрабатывать и анализировать большие объемы данных, с гораздо большей точностью и в десятки раз быстрее. Использование Большой Аналитики открывает для бизнеса не виданные ранее возможности.
Об этом объявил на пресс-конференции 30 мая в Москве Валерий Панкратов, генеральный директор SAS Россия/СНГ.
Что дает анализ Больших Данных?
«Решая задачи, связанные с анализом и визуализацией Больших Данных, компании получают весомые конкурентные преимущества в виде доступности обоснованных результатов аналитических исследований, проведенных на громадных объемах структурированных и неструктурированных данных, причем в условиях жестких ограничений по времени. Такой подход меняет саму парадигму ведения бизнеса, позволяя руководителям применять не доступные ранее методы и возможности для управления компанией, - заявил Валерий Панкратов. - Умение оперативно анализировать Большие Данные предоставляет уникальные возможности для управления рисками и предотвращения индивидуального и группового мошенничества (вплоть до остановки подозрительных транзакций в режиме реального времени) в банках и страховых компаниях, для анализа больших потоков данных абонентов в телекоме, для сложных аналитических задач в энергетике, госсекторе и т.д. Список можно продолжать. По всей видимости, именно банковский сектор и телеком могут быть отраслями, где новые решения наиболее востребованы, экономически обоснованы и где сконцентрированы профессиональные кадры, способные использовать возможности нового ПО».
Сегодня многие крупные организации накопили терабайты структурированной и неструктурированной информации. Это данные о миллионах клиентов и их действиях, об операционной деятельности самих организаций… По данным McKinsey Global Institute, объем этих данных стремительно нарастает, процессы их обработки и анализа занимают все больше времени, поэтому и получать из них полезные для бизнеса знания становится все сложнее. До сих пор углубленный анализ Больших Данных был либо слишком дорог, либо очень сложен, и занимал недели и месяцы, но появление нового класса аналитических инструментов сделало эту задачу возможной и доступной для целого ряда предприятий, которые уделяют серьезное внимание использованию аналитики для принятия оперативных и взвешенных решений.
Экономисты исследовательского центра Cebr (Великобритания) подсчитали, что развитие технологий Больших Данных в ближайшие пять лет может принести экономике страны 216 млрд фунтов стерлингов и создать около 58 тыс. рабочих мест. Применение аналитики нового поколения для исследований и разработок может помочь созданию новых товаров и услуг и даже новых рынков, что к 2017 году даст экономике Великобритании 24,1 млрд фунтов стерлингов, считают в Cebr. Улучшение выявления случаев мошенничества позволит сэкономить порядка 2 млрд фунтов средств госбюджета, а повышение эффективности управления производительностью принесет еще 3,6 млрд фунтов.
Уже сегодня организации, применяющие на практике разработки High Performance Analytics, добились впечатляющих результатов. Одна из лидирующих мировых компаний смогла сократить время на решение задач оптимизации маркетинговых кампаний для 25-ти млн клиентов и 1000 различных продуктовых и сервисных предложений с 5-ти с половиной часов до менее чем 6-ти минут. Теперь стало возможным проводить моделирование различных сценариев и принимать решения, такие, как изменение бюджета или других параметров (например, количества операторов в колл-центре), которые могут существенно увеличить доход компании, полученный от целевого маркетинга.
Другой пример анализа Больших Данных: крупнейший в Европе по размеру рыночной капитализации банк HSBC, внедрив систему SAS по противодействию кредитному мошенничеству, повысил эффективность службы по выявлению случаев мошенничества в 3 раза, а точность его выявления – в 10 раз. При этом в первые же 2 недели эксплуатации 7 специалистов службы безопасности HSBC выявили новые криминальные группы и схемы с общим потенциальным ущербом более 10 млн долларов.
Что касается России, то говорить о многочисленных внедрениях пока не приходится. Однако уже есть первые компании, использующие эти технологии. Например, в одном из Тор-5 банков России для анализа поведения клиентов и управления кредитными рисками применяются специальные средства для анализа Больших Данных.
Своим видением ресурсоемких задач поделился Сергей Анохин, Вице-президент, заместитель директора финансового департамента Банка ВТБ24. Он считает, что в современной конкурентной среде помимо традиционных факторов успеха в банковской сфере, таких как стабильность, качественное обслуживание и привлекательная продуктовая линейка, все более важными становятся эффективность, скорость и гибкость изменений. «Степень развития и использования этих факторов зависит от того, насколько комплексно вы видите рынок, своих клиентов и свои внутренние процессы, действия и результаты, насколько быстро и раньше конкурентов вы выявляете изменения, перспективы или угрозы рынка, а также как быстро осуществляете необходимые изменения действий банка и работы с клиентами. А для этого важно не просто обладать всем спектром необходимой информации в хранилище или аналитических системах, а иметь возможность быстро ею воспользоваться для получения ответов на сложные вопросы, требующие обработки огромных массивов данных», - заявил Сергей Анохин.
SAS High Performance Analytics – аналитика нового поколения
Для решения бизнес-задач аналитическими методами организации нужно пройти определенный набор шагов, требующих вовлечения разных специалистов – бизнес-менеджеров, бизнес-аналитиков, аналитиков-математиков и ИТ-специалистов. Перед каждым из участников аналитического процесса стоят свои задачи, поэтому они предъявляют разные требования к функциональности средств бизнес-аналитики.
«У компании SAS есть специализированное программное обеспечение для каждого типа пользователей и для каждого типа задач в бизнес-аналитике - рассказал Андрей Свирщевский, руководитель направлений Аналитики и Гарантирования доходов SAS Россия/СНГ. - Эта линейка технологий, состоящая из трех частей, а также основанных на них продуктов и решений, получила название SAS High Performance Analytics. Наша компания развивает ее уже несколько лет. Все три технологии SAS по работе с Большими Данными представляют собой разные способы их распределенной обработки».
Первая из них - SAS Grid Computing – предназначена для управления распределенными вычислениями в среде SAS при работе как на одном сервере, так и на большом количестве серверов. Это некий аналог «облачных» технологий.
Вторая технология, разработанная около года назад, воплощена в продуктах класса in database: в этом случае распределенная обработка достигается путем переноса вычислений внутрь хранилища данных, то есть с аналитического сервера SAS - на сервер внешней базы данных. Этот метод применим для различной функциональности, но дает самый существенный выигрыш в ситуации, когда аналитические модели разрабатываются на инструментах SAS, а корпоративное хранилище данных реализовано на СУБД другого вендора. Поскольку новые данные появляются именно в хранилище, то применение аналитических моделей оптимально выполнять, не извлекая данные большого объема из хранилища. Продукты серии SAS Scoring Accelerator переводят аналитические модели на язык партнерских СУБД и переносят их внутрь этих СУБД для регламентного применения. Например, сначала специалисты банка средствами углубленной аналитики выявляют факторы, определяющие вероятность невозврата кредита, а потом внутри хранилища данных проводится регулярная переоценка уровня кредитного доверия по всем клиентам банка.
«Сегодня мы представляем новые продукты и решения, созданные по технологии in memory - распределенные вычисления в оперативной памяти блейд-серверов, - объявил Андрей Свирщевский, проводя демонстрацию их работы в режиме реального времени. - Область технологий in-memory развивается в SAS по следующим направлениям: визуализация данных, аналитика в различных ее областях (вплоть до анализа закономерностей в тексте) и прикладные аналитические решения для конкретных бизнес задач. Мы представляем рынку два продукта, работающих по технологии in-memory: это средство визуализации данных SAS Visual Analytics и средство построения аналитических моделей SAS High Performance Analytics. На основе этой технологии также создан ряд прикладных решений».
Продукт SAS High Performance Analytics позволяет алгоритмам основных существующих направлений аналитики выполняться на десятках и сотнях миллионов записей с фантастической производительностью. Если раньше на анализ закономерностей и построение аналитических моделей требовались часы или даже дни, то теперь эти операции проходят за секунды и минуты. Например, банки, разрабатывая модели принятия решений о выдаче кредитов на основе регрессионного анализа, реально могут получить ускорение в 100 раз.
Преимущества для бизнеса и прикладные решения
Что на деле дает способность работать с Большими Данными за минуты вместо часов? Во-первых, точность аналитических моделей. Раньше аналитики часто были вынуждены для построения моделей брать подвыборки данных, теперь они могут проводить анализ на всей генеральной совокупности. В некоторых случаях можно перейти на более детальный уровень анализа, например, не по клиентам, а по их транзакциям. Также важно, что теперь аналитик может запустить анализ большее число раз и тем самым лучше подобрать оптимальные настройки. Немаловажно и увеличение скорости получения результатов анализа – это существенно, например, для оперативной реакции на произошедшие изменения.
Как это работает на практике, проверил один из крупных банков в Америке. За счет сокращения среднего времени работы аналитической процедуры с 5-ти часов до 3-х минут появилась возможность применять больше видов алгоритмов в более сложной конфигурации. В результате точность моделей возросла с 1.6 до 2.5. Это означает, например, что на маркетинговое предложение откликнулось бы в полтора раза больше клиентов (отношение 2.5/1.6), чем если бы предложение рассылалось клиентам, выбранным менее производительной аналитической моделью, и в 2.5 раза больше клиентов, чем если бы они выбирались случайным образом. Условно говоря, не 100 человек из 1000 и даже не 160, а 250. В масштабах крупного банка дополнительная прибыль может составить внушительную сумму.
На основе технологии in-memory компанией SAS уже создан ряд прикладных решений:
• SAS High Performance Risks - для высокопроизводительного расчета уровня риска портфеля на рынках капитала;
• SAS High Performance Markdown Optimization - для расчета оптимальной стоимости и скидок для розничной торговли;
• SAS High Performance Marketing Optimization - для определения оптимального предложения каждому клиенту.
SAS Visual Analytics
Этот новый продукт сочетает в себе высокопроизводительные средства анализа и удобный графический интерфейс визуализации данных. Он позволяет бизнес-пользователям и аналитикам самостоятельно анализировать большие объемы данных и получать точные, наглядные и удобные для интерпретации отчеты. Эти отчеты можно публиковать в интернете, а благодаря приложениям для мобильных устройств, с ними можно работать, например, и на iPad. Это означает, что на встречах, в командировках или же при удаленной работе у менеджеров, маркетологов, исследователей и других пользователей, которым нужны аналитические данные и выводы, сохраняется доступ к нужной информации. Они могут ею пользоваться и принимать на ее основе оперативные и взвешенные решения.
«Анализ занимает всего несколько секунд, максимум несколько минут, что дает бизнесу значительные преимущества и фору по времени перед конкурентами, - объяснил, проводя «живую» демонстрацию продукта Алексей Мещеряков, руководитель направления платформенных решений компании SAS Россия/СНГ. - Поскольку пользователи работают с данными напрямую, самостоятельно, не делая для этого никаких запросов в ИТ-службу, то меняется весь бизнес-процесс проведения анализа и принятия решений. Он становится более простым и эффективным. В свою очередь, ИТ-специалисты освобождаются от рутинных операций по обработке пользовательских запросов на предоставление доступа к информации и создание новых представлений данных и разовых отчетов. Поэтому компания может направить высвободившиеся ресурсы на решение других важных задач».
ЗАКЛЮЧЕНИЕ
Тема Больших Данных сегодня активно обсуждается во всем мире, разрабатываются инструменты для работы с ними. Но есть важные отличия продуктов и решений SAS среди других. Только компания SAS смогла добиться, чтобы продвинутая аналитика стала работать в оперативной памяти сервера, включая все необходимые средства для решения задач углубленного анализа данных (Data Mining). Кроме того, сегодня только SAS обладает полным спектром технологий для решения задач бизнес-аналитики на основе Больших Данных: это хранение данных, их обработка, визуализация данных, продвинутая аналитика, а также прикладные решения для бизнеса.