Если поставщики приложений бизнес-аналитики заявляют о полной интеграции своих продуктов с СУБД Hadoop, покупателям следует отнестись к таким заявлениям с осторожностью и постараться выяснить в точности, что это значит, пишет аналитик Forrester Борис Эвельсон.
Hadoop — это конгломерат множества проектов, нацеленных на решение разных задач обработки больших объемов данных: доступа к данным, интеграции данных, администрирования систем и баз данных, построения отчетов, аналитики, исследования данных и так далее, подчеркивает аналитик. Если в компании используют Hadoop для работы с большими объемами данных, то уровень интеграции с бизнес-аналитическими приложениями очень важен.
Интерес коммерческих компаний к обработке больших объемов данных, в особенности неструктурированных, привел к зарождению целой экосистемы разработчиков приложений, использующих Hadoop для хранения данных, а также приложений для интеграции Hadoop с популярными реляционными СУБД. Но перед покупкой таких приложений следует выяснить, работают ли они с разными версиями Hadoop, в том числе коммерческими от Cloudera или Hortonworks, какие пакеты для доступа они используют — Hive, Hbase, Pig или Sqoop, может ли приложение напрямую исследовать данные в системе HDFS и многое другое.