Cloudera

Учитывая, что общий объем финансирования Cloudera достиг уже 300 млн долл., можно видеть, насколько оптимистично инвесторы настроены относительно перспектив Hadoop на предприятиях.

Примечателен и сам состав инвесторов на данном раунде: главным из них стал фонд T. Rowe Price, к которому присоединились Google Ventures и компания, аффилированная с Майклом Деллом. До того, как стали известны имена инвесторов, сообщалось, что объем финансирования составит 200 млн долл., а большую часть суммы вложит Intel.

Особое внимание привлекает участие Google Ventures, поскольку у Google есть собственный вариант Hadoop в виде сервиса — BigQuery. «На многих предприятиях заинтересованы в гибком подходе к обработке Больших Данных, и по нашим прогнозам, соответствующий рынок продолжит быстро расти, — отметил генеральный партнер Google Ventures Карим Фарис. — Cloudera кардинально снижает затраты предприятий на надежное хранение и реализует принципиально новые способы аналитической обработки обширных срезов данных».

Cloudera предлагает дистрибутив Hadoop, который во многом сохраняет особенности материнского проекта Apache с открытым кодом, но также добавляет ряд усовершенствований. В частности, в Cloudera разработали инструментарий администрирования и мониторинга Cloudera Manager и технологию Impala, позволяющую обращаться к данным Hadoop с помощью запросов на SQL. Дистрибутив Hadoop от Cloudera не является целиком продуктом с открытым кодом. Когда заказчикам Cloudera нужно что-то отсутствующее в Apache Hadoop, необходимая функциональность либо разрабатывается, либо заимствуется у партнера, уже реализовавшего ее. Как отмечают аналитики Forrester, чтобы выделяться на фоне конкурентов, Cloudera придерживается принципов сохранения основ Hadoop и оперативной разработки новшеств согласно требованиям заказчиков. Эта стратегия окупается: число пользователей платформы Cloudera стабильно растет и на сегодня уже достигло около двухсот. У некоторых из клиентов объем обрабатываемых данных уже больше петабайта, а число узлов Hadoop — свыше тысячи.

Cloudera впервые заявила о себе в 2009 году, и сегодня является одним из ведущих поставщиков дистрибутивов Hadoop. Ее основные конкуренты — Hortonworks, Teradata, MapR Technologies, Microsoft и Amazon Web Services.

Изначально Hadoop применялась онлайн-гигантами вроде Google и Yahoo, а сегодня эту самую популярную платформу управления Большими Данными активно осваивают и другие предприятия. Основных причин этому две: у предприятий накопливаются огромные объемы информации, а Hadoop отлично подходит для ее обработки, в том числе когда нужно объединять исторические данные с новыми, неструктурированными; многие ИТ-компании подключаются к предоставлению услуг технической поддержки и других, связанных с Hadoop, делая платформу более привлекательной для предприятий.

«Рынок Hadoop неудержимо растет: платформа с открытым кодом прочно укореняется в корпоративных архитектурах управления данными, — пишут аналитики Forrester Майк Гвалтьери и Ноэль Юханна в докладе Wave Report. — В Forrester убеждены, что Hadoop — обязательная система для больших предприятий, являющаяся краеугольным камнем любой гибкой платформы управления данными. Если у вас много структурированных, неструктурированных или двоичных данных, Hadoop в вашей организации самое место».

Как отмечают в Forrester, выбор поставщиков сегодня уже достаточно велик. Аналитики перечисляют девять компаний, предлагающих услуги, связанные с Hadoop, и отмечают их преимущества и недостатки. Авторы доклада приходят к выводу, что на сегодня явного лидера рынка еще нет, и относительно молодые компании предлагают услуги не хуже, чем у ИТ-гигантов.

Hadoop, напомним, — это проект Apache, доступный для загрузки всеми желающими и состоящий из следующих основных модулей: набора библиотек Hadoop Common, распределенной файловой системы Hadoop Distributed File System, планировщика заданий YARN и программируемой платформы обработки данных MapReduce. Одна из главных возможностей Hadoop — распределение рабочих задач между множеством узлов, счет которых может идти на тысячи. Дистрибутивы и сервисы, упрощающие работу с Hadoop, сегодня предлагаются целым рядом ИТ-компаний, каждая со своей стратегией.