Платформа Open Data Platform будет сопоставлять конкретные версии Apache Hadoop и предназначенных для них программных средств в виде единого целого, упрощая предприятиям создание и поддержку сложных систем анализа данных Hadoop.
«По мере того как предприятия начинают понимать ценность Apache Hadoop для бизнеса, потребность в тщательно протестированной, согласованной и хорошо проработанной экосистеме растет, – указал Райми Стата, директор компании Altiscale, одного из поставщиков Hadoop. – Open Data Platform станет той нормативной базой, на основе которой поставщики ИТ-продуктов и сервисов смогут сертифицировать свои решения корпоративного класса».
Управление программным кодом Hadoop осуществляет организация Apache Software Foundation. Подобно ядру операционной системы Linux, Hadoop компонуется различными поставщиками в коммерческие дистрибутивы, не все из которых оказываются совместимыми. Кроме того, имеется целый ряд смежных программ (Hive, Ambari, ZooKeeper и т.д.), для интеграции которых в Hadoop требуется приложить определенные усилия.
Аналогичного подхода Linux Foundation придерживается в отношении Linux Standard Base – набора базовых компонентов, поддерживающих взаимодействие друг с другом.
Формируя для Hadoop общую базовую библиотеку, Open Data Platform помогает понять, какие технологии и какие версии этих технологий хорошо сочетаются друг с другом. Организациям становится легче интегрировать в системы Hadoop уже готовое программное обеспечение и отдельные компоненты Hadoop, предлагаемые различными поставщиками.
Помимо IBM, Hortonworks и Pivotal в реализации новой инициативы примут участие компании General Electric, Infosys, SAS, Altiscale, Capgemini, CenturyLink, EMC, Splunk, Verizon Enterprise Solutions, Teradata и VMware.