MapR, VMware, Teradata, Pentaho и многие другие компании представили свои новые подходы к решению задач обработки больших объемов данных с помощью кластерной СУБД с открытым исходным кодом Hadoop на конференции Hadoop Summit в Сан-Хосе. На конференцию прибыло свыше 2100 участников, а спонсорами ее являются такие известные компании, как Cisco, Facebook, IBM, Microsoft, Splunk и VMware.
Незадолго до конференции вышли новые версии всех трех основных дистрибутивов Hadoop — Cloudera, Hortonworks и MapR, а также основанных на них пакетов компаний Teradata, Pentaho и других разработчиков. Новая версия дистрибутива MapR стала первой с реализацией многоарендной архитектуры. Средства администрирования теперь поддерживают несколько кластеров с возможностью логического разбиения и указания конкретных узлов для выполнения заданий. Дистрибутив Hadoop MapR теперь работает и в сервисе Elastic MapReduce облачной системы Amazon Web Services.
VMware выпустила пакет с открытым кодом Serengeti, позволяющий создавать узлы Hadoop в виртуальных контейнерах, управлять которыми можно через VMware vCenter. А DataStax показала новую, на 20% более быструю версию пакета DataStax Enterprise 2.1, объединяющего Hadoop и нереляционную СУБД Cassandra.