Компания Cloudera выпустила новую версию дистрибутива фреймворка распределенной обработки данных Hadoop — CHD3, существенно расширив набор вспомогательных инструментальных средств. В состав CHD3 включено интегрировано семь дополнительных приложений, упрощающих процессы настройки и исполнения задач Hadoop.
В частности, среди новых компонентов — инструмент агрегации данных Flume, конвертер форматов данных Sqoop, графический пользовательский интерфейс Hadoop Hue и инструмент конфигурирования Zoolkeeper. Все новые компоненты предлагаются по публичной лицензии Apache. Как утверждают в Cloudera, новая версия требует значительно меньшего объема работы по составлению скриптов для загрузки данных в Hadoop, их реогранизации и экспорта результатов.
CHD3 совместим с дистрибутивами Red Hat, CentOS, SuSE и Ubuntu Linux. Hadoop можно исполнять в облаках Amazon и Rackspace, а кроме того, фреймворк интегрирован с рядом систем бизнес-аналитики и извлечения, преобразования и загрузки данных.