Многие аналитики отмечают, что 2014 год стал переломным для Больших Данных. Появившиеся результаты первых проектов достигли определенной критической массы. Но, несмотря на то что они оказались успешными, многие заказчики по-прежнему проявляют некоторую осторожность и не торопятся делать шаг навстречу новым возможностям. Как уверен Николай Зезюлинский, директор по развитию бизнеса компании «ФОРС», типичная ошибка — не понимать качественной разницы между традиционной аналитикой и технологиями Больших Данных, в основе которых лежат иные принципы. Мы попросили его поделиться своим видением перспектив технологий Big Data в России.
Большие Данные пока известны как «технологии не для всех». В чем причина? Чего не хватает поставщикам и заказчикам для их более широкого использования?
Таких причин несколько. Во-первых, возможности Больших Данных пока только начали осваиваться — можно сказать, что мы стоим на пороге новых открытий, связанных с использованием этих технологий. Спектр их применения гораздо более широк, чем казалось вначале, а последствия могут оказаться куда серьезнее, чем мы видим сегодня. Поэтому наша задача как интегратора — активнее вести исследовательскую деятельность в этом направлении, чем мы и занимаемся, искать и находить новые задачи, которые могли бы быть решены при помощи такого инструментария, и быть достаточно убедительными для заказчика, который бы осознал, что ему это действительно надо.
Во-вторых, не для всех типов заказчиков потребность в этих технологиях сейчас очевидна. То, что в банковской сфере, ретейле и телекоме эти технологии востребованы и дают ощутимые преимущества, уже ни у кого не вызывает сомнений. А вот в других сферах — промышленности, ЖКХ, муниципальном управлении, госсекторе — только начинают присматриваться к возможностям Больших Данных. И концентрировать свои усилия мы пока будем именно на них.
В-третьих, у таких проектов довольно высокая стоимость, она в первую очередь складывается из оплаты труда разработчиков и консультантов. Действительно, далеко не все могут себе позволить такой программный продукт — для этого должен быть серьезный ИТ-бюджет. Хотя думается, что со временем, по мере накопления практик внедрения, стоимость подобных проектов будет снижаться.
Основная польза аналитических технологий для компаний раскрывается, когда эти технологии проникают «в массы» — применяются даже на уровне рядовых исполнителей. Верно ли это применительно к Большим Данным или их польза проявляется в иных условиях?
Да, верно. С точки зрения пользователя или рядового исполнителя принципиальной разницы между традиционной аналитикой и Большими Данными нет — просто для их получения используются разные технологии, но ведь это остается «за кадром». Действительно, возможности традиционной BI-системы раскрываются наиболее полно тогда, когда она существует в виде «проникающей аналитики», то есть аналитическая система встроена в оперативную, благодаря чему пользователи любого уровня могут получать в режиме реального времени нужную им информацию.
А теперь представим, что обрабатываются не только внутренние данные предприятия, но и огромный массив данных из внешних источников, при этом вся аналитика строится на других алгоритмах и с применением других методов анализа — например, семантического и лингвистического. Чем шире круг сотрудников, имеющих доступ к такой информации и пользующихся ею, тем более продуктивной будет эксплуатация системы, развернутой с использованием технологий Больших Данных. И это уже происходит. Нам известны проекты в банках, где результаты анализа спроса на розничные банковские продукты и потребительского поведения клиентов использует не только руководство, но и обычные сотрудники департаментов.
Актуальны ли для российских компаний Большие Данные с учетом того, что даже «традиционная» аналитика освоена далеко не всеми и не полностью?
Безусловно, актуальны. Типичная ошибка — не понимать качественной разницы между традиционной аналитикой и технологиями Больших Данных, в основе которых лежат иные принципы. Если в бизнес-анализе главное — вычисления, то здесь — эффективность поисковых операций, возможность интуитивного исследования данных, которое должно инициировать гипотезы и идеи. Другими словами, Большие Данные не столько позволяют получать ответы на заранее известные вопросы, сколько помогают в процессе исследования уточнять задачу и находить новые способы ее решения.
Это означает, что система, в основе которой будут лежать технологии Больших Данных, может быть создана и без традиционной BI-системы либо поверх нее. Привычную бизнес-аналитику Большие Данные, с одной стороны, не отменяют, а с другой — могут использоваться в качестве самостоятельного инструмента, не требующего создания хранилищ или витрин данных. Это другие программные платформы, другие языки программирования, специализированные средства статистических и математических исследований, методики прогнозирования, позволяющие решать совсем иной класс задач. Российскими компаниями они уже востребованы, несмотря на то что рынок классического бизнес-анализа далек от насыщения. Сервис «Яндекс.Пробки» — наглядный тому пример.