Бизнес-аналитические средства разработки BI-средства компании Informatica теперь могут использовать в качестве источника данных системы на платформе с открытым кодом Hadoop. Эта платформа предназначена для создания распределенных систем хранения больших объемов данных и в последнее время начинает привлекать внимание коммерческих компаний, которым необходимо анализировать объемы данных, слишком масштабные для традиционных систем. Поддержку Hadoop реализовали в своих продуктах Pentaho, разработчик пакетов бизнес-аналитики, и специализирующаяся в области хранилищ данных компания Teradata.
Разработку Hadoop ведет Apache Software Foundation, а компания Cloudera выпускает коммерческий дистрибутив Cloudera Distribution for Hadoop.
Графический интерфейс Informatica позволит управлять вводом и выводом данных в Hadoop, а отображения данных (data mapping), построенные в Informatica, можно будет использовать на базах Hadoop.
Одним из крупнейших пользователей Hadoop является интернет-аукцион eBay. К концу года компания планирует завершить строительство кластера Hadoop на 8500 процессоров и 16 петабайт данных.