Хартмут Вагнер: «Речь идет не о данных, речь идет о значении. Речь идет не о машинах, а о людях. Требуется отделить важное от ненужного» |
Вместе с тем, как следует из докладов, прозвучавших на первом в России форуме Big Data 2012, организованном издательством «Открытые системы», интерес ведущих вендоров к этой тематике огромен. Захлестнувшие мир Большие Данные — не проблема компьютеров, а проблема людей, заставляющая ИТ-компании менять свои взгляды на ведение бизнеса, уверен Хартмут Вагнер, вице-президент по управлению информацией HP в странах Европы, Ближнего Востока и Африки.
Что в HP подразумевают под Большими Данными?
Главная проблема наших клиентов заключается сегодня в переизбытке неструктурированных данных; они составляют 85% всех данных, которыми оперируют сегодня предприятия. Именно на их обработку будут направлены наши основные усилия — важно не только собрать и организовать хранение структурированных и неструктурированных данных, а еще требуется организовать эффективный поиск, установить сквозные связи и понять их значение. Ключевые слова и метаданные не решают проблему управления информацией так, как это делает мозг человека, фильтрующий поступающие в него потоки данных и устанавливающий причинно-следственные связи. Информация не статична, она находится в постоянной динамике, а мир вокруг нас не структурирован и его не втиснуть только в реляционную модель, причем каждый фрагмент данных, взятых в обработку, может оказаться огромен.
Всеми этими соображениями руководствовались создатели платформы Intelligent Data Operating Layer (IDOL), позволяющей в реальном времени организовать обработку сколь угодно больших массивов разнородных данных; сегодня в платформе четыре сотни конвертеров для разных источников. Продукты компании Autonomy обеспечивают обработку неструктурированных данных, а Vertica предоставляет аналитическую платформу реального времени.
Между тем рынок неоднозначно воспринял решение HP о покупке британской компании Autonomy за 10 млрд долл., оправданно ли было такое приобретение?
Действительно, некоторые аналитики проявили скепсис, но сейчас можно с уверенностью сказать, что это решение было верным, если, конечно, покупку не рассматривать лишь как просто коммерческую сделку. Речь идет не только о приобретении очередного программного инструмента, а об изменении всего взгляда на бизнес компании, предоставляющей информационные сервисы современному рынку. Это было стратегическое приобретение — сейчас в HP создано специальное подразделение по управлению информацией, объединяющее все наследие Autonomy, Vertica и уже имеющиеся у HP решения в данной области. Это подразделение тесно работает со всеми другими структурами компании, чтобы создать интегрированные решения для наших клиентов. Большие Данные — это не проблема компьютеров, а проблема людей. Современные ИТ-инфраструктуры умеют хорошо оперировать структурированными данными, но мозг человека работает с неструктурированными. Собрать и сохранить данные не проблема, реальная проблема — анализировать их должным образом, особенно если учесть, например, что многие предприятия уже сегодня активно внедряют мобильные устройства в свою практику ведения бизнеса, а смартфон — это неструктурированные данные, которых очень много и из которых надо уметь выделить контекст, установить связи, причем в реальном времени. Мобильные устройства — одна из главных целей Autonomy, которая предоставляет инструменты, вычленяющие полезные бизнесу сведения из неструктурированных данных, таких как аудио, видео, почтовая переписка, веб-контент и позволяющие трансформировать телефон в интеллектуальное устройство хранения.
Рынок управления информацией достаточно конкурентен, и кроме IDOL здесь имеется ряд альтернатив. Какие явные преимущества есть у Autonomy?
Управление информацией — это не только оборудование и программы, но и сервис, в частности по интеллектуальной обработке данных. У HP имеется крупнейшее облако, предоставляющее сервис Digital Safe архивации и управления информацией (сегодня в нем хранится 40 Пбайт различных метаданных) и позволяющее нашим клиентам индексировать все их данные в единой системе для автоматической обработки на одной платформе информации вне или внутри компаний и формирования связей между контентом с целью подготовки метаданных приложениям по обнаружению данных. Для поддержания сервиса по управлению информацией в актуальном состоянии мы заключаем много OEM-контрактов по обработке различных данных.
IDOL, платформа, имеющая сотни коннекторов к разным источникам данных, — сильное решение для задач поиска, категоризации и фильтрации, но сегодня пользователей интересуют интегрированные продукты управления информацией, где, например, сильны позиции Microsoft SharePoint...
Действительно, для простейших аналитических задач вполне достаточно и Excel, но для бизнес-анализа Больших Данных требуются иные решения. SharePoint является сегодня стандартом, а стандартные универсальные решения всегда уступают специализированным в скорости, точности, качестве обработки и масштабировании. HP предлагает на единой платформе IDOL решения для обработки больших массивов данных любой природы, где общеупотребительных продуктов недостаточно. Например, уже при решении такой простой задачи, как обработка звонка клиента в центр обслуживания банка, возникает масса проблем по распознаванию голоса, анализу предыдущих обращений, обработке кредитной истории и т. п., которые надо решать в реальном времени. Вряд ли можно обработать стандартными средствами большие массивы уникальных данных.
Недавно HP объявила о выпуске аппаратно-программных решений на базе Autonomy на потребительский рынок, на котором они будут напрямую конкурировать с такими продуктами, как Google Search Appliance. Каковы шансы компании на рынке, где сегодня доминируют Microsoft, Google и Apple?
Исторически продукты Autonomy были ориентированы только на корпоративный рынок, а спецсерверы Autonomy Appliance предназначены для небольших компаний, получающих теперь доступ к мощным инструментам корпоративного поиска и анализа данных. В конце февраля было объявлено о выходе встраиваемых, в том числе и мобильных устройств на платформе IDOL, представляющих собой мощные, гибкие и эффективные решения для архивирования, поиска и распознавания информации. Встраивание технологии Autonomy в принтеры и сканеры фактически превращает их в интеллектуальные устройства работы с данными и создает облачную структуру хранения документов, связанную с онлайн-сервисами HP. В результате возможна ситуация, когда, например, распечатывая документ, принтер «скажет» вам: «Эй, эта страница из пакета вашей страховки, которая истекает через неделю, не пора ли ее обновить?»
Конкуренция с названными вами компаниями нас не пугает хотя бы потому, что новые решения будут предлагаться 60 тыс. клиентам HP во всем мире, что намного больше, чем, например у Google Search Appliance. Большие Данные — вызов всей ИТ-индустрии, требующий принципиально новых подходов, и здесь все мы еще находимся в самом начале пути.