Термин «Большие Данные» сегодня трактуется по-разному, но главное, что речь идет не только о сверхбольших объемах данных, хотя этот фактор ключевой, — не менее важно решение таких сложных задач, как работа в реальном масштабе времени, совместный доступ и анализ данных разных приложений, учет связей между различными данными, анализ разнородных данных. Однако в России в ближайшее время главным фактором будет все-таки объем бизнес-данных — это актуально для заказчиков, сталкивающихся с необходимостью собирать и анализировать огромные массивы данных, которые невозможно обработать с помощью существующих технологий. Четко сформулированных задач по анализу неструктурированных данных у российских заказчиков, судя по всему, пока еще не возникло — в стране не так давно начался бум социальных сетей, еще только планируется повсеместное внедрение систем геопозиционирования, слабое распространение получили радиометки RFID и т. п., поэтому анализ неструктурированных данных пока не первый на повестке дня.
Вместе с тем имеется большая категория заказчиков, уже сейчас обладающих большими объемами структурированных данных, которые необходимо обрабатывать в реальном масштабе времени, поэтому ключевой задачей системных интеграторов на ближайшие три – пять лет будет проектирование и построение соответствующих инфраструктурных решений на базе специализированных программно-аппаратных комплексов обработки сверхбольших данных.
Решения для Больших Данных для российского рынка еще в новинку — опыт выполнения соответствующих проектов невелик и сконцентрирован в небольшом количестве компаний, поэтому у заказчиков возникают обоснованные опасения относительно адекватности предлагаемых им решений. При этом сами технологии развиваются очень динамично, и в каком-то смысле отставание России во внедрении этих продуктов от западных стран является преимуществом, так как сегодня для российских заказчиков доступны более зрелые и проверенные решения.
Ключевой результат внедрения технологий Больших Данных — это, конечно же, изменение в лучшую сторону экономических показателей: снижение расходов или увеличение прибыли — что невозможно без полученной вовремя достоверной информации. Например, для таких компаний, как Apple, технологии Больших Данных стали одним из ключевых конкурентных преимуществ, но сегодня эти технологии доступны уже не только крупным игрокам — они приходят практически в любой бизнес. Да, закупка и внедрение специализированных решений — это затраты, однако они обеспечивают лучшие показатели стоимости в расчете на единицу хранимой и обрабатываемой информации. И поэтому стоит задуматься, надо ли продолжать расширять имеющееся хранилище данных или мигрировать на новые технологии работы с Большими Данными. С точки зрения ИТ-службы новые технологии — это возможность соответствовать стратегическим задачам компании и служить фактором роста бизнеса, а для бизнеса — это средство обретения новых конкурентных преимуществ, удовлетворения запросов своих клиентов и корректировки спектра предлагаемых продуктов или услуг.
На сегодняшний день спрос на технологии работы с Большими Данными формируют крупные компании и организации (телекоммуникации, ретейл, банки), решающие масштабные задачи взаимодействия с многочисленными клиентами. Другая категория российских потенциальных потребителей технологий Больших Данных — это государственные структуры. По роду своей деятельности, и особенно с учетом реализации задачи оказания услуг в электронной форме и решения других программ в области информатизации, они обладают гигантскими массивами данных, которые необходимо хранить, анализировать, обеспечивать обмен между ведомствами и обрабатывать для предоставления оперативных и качественных государственных услуг. До появления технологий работы с Большими Данными создание масштабных систем для отечественных госструктур было практически невозможно — централизованная обработка огромных массивов данных стоила бы слишком дорого или была невозможна из-за технологических ограничений.
Запросы российских компаний на решения в области Больших Данных связаны также с тем, что текущие вычислительные ресурсы уже не позволяют выполнять задачи бизнеса либо стоимость владения существующими системами становится по мере накопления данных очень высокой. Кроме того, многие компании разворачивают сегодня проекты по централизации своих информационных ресурсов, чему способствует, в частности, широкое распространение широкополосного Интернета, однако это требует изменения архитектуры инфраструктурных решений. В ряде случаев новые решения позволяют выполнить такую централизацию экономически эффективней. Дополнительно к этому ряд российских компаний проводит сейчас замену устаревшего оборудования, и выбор в пользу технологий Больших Данных может стать очень привлекательной альтернативой.
Несмотря на то что российские компании и организации при внедрении ИТ в целом повторяют путь западных, отличия все-таки имеются, и решения по работе с Большими Данными не исключение. Во-первых, российские компании практически ничего не внедряют, не покупают и не применяют без длительных тестирований и проверок на практике обещаний производителей, причем процесс нередко затягивается из-за проведения сравнений нескольких решений. Это связано с тем, что на Западе поставщики часто предоставляют свои решения на условиях лизинга и многие западные заказчики этим пользуются, заменяя системы по ходу смены поколений и версий, сокращая, таким образом, капитальные вложения. В России же системы, как правило, приобретаются в собственность и ставятся на баланс, поэтому единоразовые вложения выше, что вынуждает очень ответственно подходить к выбору приобретаемого решения.
Во-вторых, у нас другой менталитет и другая управленческая культура. В России многие руководители находятся в плену представлений, будто их предприятие уникально, поэтому они часто говорят: «Я хочу именно на своих данных попробовать технологию, а то, что вы тестировали для кого-то другого, — не показатель».
В-третьих, по мнению аналитиков, маркетинг, особенно социальный, направленный на сбор и обработку информации о клиентах, становится на Западе основным двигателем всех изменений в ИТ, вплоть до того что бюджет маркетинговых подразделений превышает бюджет на ИТ, однако в России такая ориентированность на клиента еще в стадии осознания.
Кроме этого, проекты внедрения решений для Больших Данных обнажают проблему взаимодействия ИТ и бизнеса — такие проекты уже в принципе не могут начинаться в подразделении ИТ. Технологии сложные, а задачи очень глубоко завязаны на стратегические цели бизнеса, поэтому выполнение таких проектов требует тесной работы бизнес-подразделений и корпоративных ИТ-специалистов, но далеко не у всех российских компаний и организаций такое взаимодействие выстроено. Здесь появляется место для системного интегратора.
Компания IBS одной из первых в стране стала выполнять проекты, связанные с Большими Данными, в частности для Федеральной налоговой службы и Федерального казначейства, используя для этого следующий портфель решений: Oracle — линейка «экзасистем» (Exadata, Exalytic, Exalogic и Oracle Database Appliance), IBM Netezza и Teradata. Технологии от Teradata и Netezza применяются для решения аналитических задач, а Exadata эффективна при работе со смешанной — транзакционной и аналитической — нагрузкой.
Одна из ключевых задач ФНС на сегодняшний день — сбор и консолидация всей информации из регионов при заданных временных и ресурсных параметрах. Благодаря решениям из спектра технологий Больших Данных была создана система, способная удовлетворить запросы этого ведомства. В результате ФНС успешно решает задачу сбора налогов, предоставления отчетности, выявления невыплат и обнаружения фактов мошенничества. В проекте для ФНС используются сразу две платформы: Teradata и Oracle Exadata. Первая отвечает за решение блока аналитических задач, а Exadata отвечает за консолидацию баз данных Oracle, используемых различными транзакционными приложениями, работающими в ведомстве.
В рамках проекта для Федерального казначейства была выполнена миграция существующей информационно-аналитической системы на решение Oracle Exadata. В итоге, помимо значительного улучшения производительности, заказчик получил возможность формировать отчеты и готовить проверки, которые раньше вообще были невозможны. К тому же благодаря сжатию данных на 50% была достигнута экономия ресурсов, что естественным образом сказалось на снижении стоимости владения.
***
Спрос на решения для работы с Большими Данными со стороны российского бизнеса растет, однако какое-то время уйдет на убеждение в необходимости соответствующих решений. Но опыт выполненных проектов такого класса показывает, что готовность потенциальных заказчиков достаточно высока. Например, в 2012 году количество предпроектных работ и запросов от клиентов по тематике Больших Данных в IBS выросло как минимум вдвое по сравнению с прошлым годом, что, кстати, согласуется с прогнозами многих производителей, ожидающих похожих темпов развития спроса в России.
Максим Исаев (MIsaev@IBS.ru) — менеджер по развитию бизнеса департамента системных решений, отдел программно-аппаратных комплексов компании IBS (Москва).