В опросе принимали участие 325 руководителей ИТ-служб, бизнес-пользователей и консультантов, представляющих небольшие, средние и крупные компании.
Чуть больше трети респондентов сообщили, что уже сейчас в той или иной форме занимаются аналитикой Больших Данных – в основном, при помощи средств бизнес-анализа, упреждающего анализа, добычи данных и статистического анализа.
Почти 45% опрошенных ожидают, что аналитика Больших Данных позволит более точно оценивать различные вопросы бизнеса, а 38% планируют использовать эту технологию для улучшения анализа продаж и возможностей, предоставляемых рынком. Более 60% надеются, что аналитика Больших Данных поможет им укрепить ресурсы своего социального маркетинга.
По мнению участников опроса TDWI, быстрее всего популярность аналитики Больших Данных будет расти в сфере визуализации данных. Все больше компаний сегодня используют сложные аналитические инструменты для создания комплексного визуального представления своих данных.
«Решение вопросов, связанных с управлением большими объемами данных, порождает серьезные трудности, – отметил аналитик TDWI и автор отчета Филип Рассом. – Причем, в отличие от традиционных технологий бизнес-анализа и хранилищ данных, с Большими Данными возникает гораздо больше осложнений».
Под Большими Данными понимаются наборы данных очень большого объема, измеряемые в сотнях терабайтов и петабайтах. Зачастую этот термин применяется по отношению не только к большим объемам структурированной информации, но и к неструктурированным данным: блогам, сведениям о маршрутах перемещения посетителей, информации, поступающий с датчиков и других аппаратных средств, социальным медиа.
Во многих случаях компании накапливают большие объемы данных, обрабатываемые контактными центрами или поступающие от микросхем RFID, приложений управления цепочками поставок и логистических инструментов, на протяжении долгого времени. При этом эффективных средств извлечения накопленной информации у организаций нет.
Технологические достижения наряду со снижением стоимости оборудования и средств хранения позволяют компаниям организовать хранение и управление большими объемами данных, быстро и эффективно проводя их анализ. Все больше предприятий просеивают большие объемы сложной и детализированной информации в поисках фактов и шаблонов, о которых им не было известно и которые не удалось выявить в прошлом.
В решении этих задач организациям помогают специализированные СУБД и технологии анализа данных, разрабатываемые компаниями Aster Data, GreenPlum, Teradata, Netezza, ParAccel, Vertica и SAP.
Продукты таких поставщиков базируются на использовании новых технологий и инновационных решений, позволяющих преодолеть технологические ограничения старых СУБД. К таким новым технологиям относятся механизмы размещения баз данных в памяти, аналитические технологии колоночной, массово-параллельной обработки и тесно интегрированные с ними аппаратные комплексы, обеспечивающие хранение, управление и выборку больших данных способами, которые ранее были просто неосуществимы.
Новые пути манипулирования Большими Данными предлагают и технологии с открытым кодом наподобие Hadoop и MapReduce.
«Аналитические инструменты и СУБД имеют сегодня все необходимое для управления Большими Данными, – подчеркнул Рассом. – Они могут выполнять сложные запросы и осуществлять разбор таблиц в рекордные сроки. Инструменты и платформы предыдущих поколений помогли нам подняться на новый уровень производительности, который необходим приложениям, сумевшим обуздать Большие Данные».
Вместе с тем внедрение передовых аналитических средств, способных справляться с Большими Данными, без трудностей не обходится.
Более 45% респондентов главным препятствием на пути повсеместного внедрения анализа Больших Данных считают серьезную нехватку квалифицированных специалистов. Ситуацию усугубляет то, что навыки, требуемые для работы с новыми аналитическими приложениями, отличаются от тех, которые нужны для управления традиционными средствами бизнес-анализа и хранилищами данных.
Другим сдерживающим фактором является отсутствие необходимой поддержки со стороны бизнеса и высокая стоимость внедрения механизмов аналитики Больших Данных.