Впрочем, возникающие трудности несравнимы с той потенциальной выгодой, которую сулит предприятиям эффективная обработка сложных и всеобъемлющих наборов данных. Процесс создания новых ценностей включает в себя два основных этапа.
- Закладывание надежных основ для масштабируемого управления данными.
- Внедрение новых аналитических инструментов, помогающих глубже проникнуть в суть бизнеса.
Исследование вопросов управления данными в процессе бизнес-анализа, проведенное Aberdeen в начале 2012 года, затронуло 99 организаций, каждая из которых имела в своем распоряжении по крайней мере 5 Тбайт «активных» бизнес-данных и уже успела в том или ином виде реализовать общекорпоративную инициативу в области Больших Данных.
Используемые при этом стратегии и инструменты позволяют описать требования, предъявляемые сегодня к управлению данными, и нарисовать картину развивающихся решений, представленных на рынке.
Интересно, что наиболее популярные источники сведений, задействованные в инициативах по анализу Больших Данных, охватывают минимальные объемы накопленной на сегодняшний день информации.
Структурированные транзакционные данные в реляционных СУБД демонстрируют ежегодный рост на уровне 36% и не в состоянии приблизиться к другим источникам, присутствующим в Интернете.
Вместе с тем 93% организаций сообщают, что структурированным данным отводится важная или даже очень важная роль в рамках общей инициативы Больших Данных. Эта информация формирует ядро проектов, в то время как другие источники служат лишь дополнением к ним, расширяя границы традиционного испытанного репозитория, в котором хранятся сведения о продажах, клиентах и товарах.
К популярным источникам данных относится информация из социальных медиа, а также статистика о поведении пользователей в социальных сетях и Интернете, которая помогает сформировать более полную картину предпочтений потребителей и успешности тех или иных товаров и услуг.
С увеличением пропускной способности беспроводных каналов связи растет роль других форматов подачи информации. Обращаясь к аудио и видео, клиенты получают более полное представление об интересующих их областях.
Распространение мультимедийных средств открывает перед предприятиями возможность динамичного взаимодействия с клиентами, позволяя анализировать, к каким темам и форматам пользователи проявляют наибольший интерес.
Исследование Aberdeen показало, что при выстраивании структуры поддержки новых источников данных большая часть организаций задействует базовые компоненты своей ИТ-инфраструктуры.
Инструменты сжатия данных и устранения их дублирования помогают исключить избыточные файлы и сократить потребности в пространстве хранения.
Со стороны конечных пользователей и лиц, принимающих решения, ощущается рост потребности в средствах самообслуживания, которые сняли бы с ИТ-службы обязанности по формированию и доставке отчетов и позволили сотрудникам быстро и легко получать ответы на интересующие их вопросы.
Большая часть ожиданий, связанных с Большими Данными, касается эффективного применения новых технологий (как уже доступных, так и разрабатываемых в настоящее время), организации специфичного управления крупными и разносторонними объемами данных и проведения их анализа.
Чтобы понять, какие из этих мощных инструментов имеют наибольшую ценность, ИТ-директор должен принимать непосредственное участие в определении текущих потребностей предприятия и формировании представления о долгосрочной эволюции товаров и услуг.
В настоящее время уже существуют решения, обеспечивающие обработку в режиме реального времени огромных объемов данных, поиск и анализ любых типов как структурированной, так и неструктурированной информации, а также доставку этой информации всем заинтересованным лицам фактически в любую точку.
Исследование Aberdeen показывает, что можно выделить несколько крупных технологических категорий, демонстрирующих невероятный потенциал роста. Руководителям ИТ-служб следует обратить на них особое внимание, продумав возможность применения их с пользой для бизнеса.
Организации, которым требуется ускорить выполнение задач, связанных с управлением данными или оперативным получением результатов анализа, проявляют все больший интерес к технологиям обработки информации в оперативной памяти. Такие технологии обеспечивают более чем стократное увеличение производительности по сравнению с традиционными инструментами.
Интеграция в реальном времени позволяет обновлять имеющуюся информацию быстрее, чем при использовании традиционных средств пакетной интеграции.
Конечным этапом всего процесса является передача этой информации в руки нужных людей. В нынешний век смартфонов компании могут снабжать своих удаленных сотрудников эффективными средствами бизнес-анализа в виде мобильных приложений и технологий.
Сегодня в области обработки Больших Данных открываются манящие перспективы.
При этом объединение разобщенной ранее информации и быстрая доставка ее пользователям представляет собой лишь верхушку айсберга.
Роль ИТ-директора в новой информационной революции становится важна, как никогда ранее. Именно он отвечает за поиск путей эффективного применения в компаниях Больших Данных, выявление незадействованных информационных источников и выбор технологий, которые в наибольшей степени отвечают потребностям организации и стоящим перед ней целям.
Натаниэль Рау – аналитик-исследователь компании Aberdeen Group, занимающийся проблемами управления корпоративными данными
Наиболее важные источники Больших Данных
Транзакционные данные | 93 |
Социальные медиа | 85 |
Данные о поведении пользователей в Интернете и соцсетях | 83 |
Мультимедийный контент | 61 |
Данные от датчиков, M2M | 60 |
Источник: Aberdeen Group, 2012
Быстрое распространение инструментов Больших Данных
Используют | Планируют использовать | |
Предиктивная аналитика | 45 | 45 |
Интеграция данных в реальном времени | 32 | 49 |
Мобильная бизнес-аналитика | 16 | 59 |
Обработка в памяти | 14 | 51 |
MapReduce | 11 | 50 |
Источник: Aberdeen Group, 2012