Очередная версия платформы интеграции данных Informatica 9.1 включает в себя модуль связи с HDFS, распределенной файловой системой Hadoop, благодаря которому Informatica может извлекать данные из кластеров Hadoop и записывать их обратно.
Платформа Hadoop, разработка которой ведется под управлением фонда Apache и при активном участии компании Yahoo, предназначена для построения приложений, работающих с большими объемами данных в распределенной вычислительной системе, и распространяется под лицензией с открытым исходным кодом. Хотя первоначально Hadoop была ориентирована на задачи веб-компаний, сейчас ее начинают применять и в корпоративной среде, отмечают в компании Informatica.
Помимо модулей для Hadoop, популярных реляционных СУБД DB2 и Oracle и аналитических пакетов Netezza и Teradata, для Informatica 9.1 разработаны модули, извлекающие данные с сайтов социальных сетей, в том числе Facebook, Twitter и LinkedIn.
Впрочем, аналитики Forrester полагают, что связь с Hadoop не останется уникальной особенностью Informatica. Для эффективного использования Hadoop нужен стандартный набор технологий, который еще предстоит создать.