Потребность многих компаний в извлечении полезных для бизнеса сведений из протоколов веб-серверов и социальных медиа обусловливает рост интереса к технологии управления данными с открытым кодом Hadoop. Она способна обрабатывать тера- и даже петабайты неструктурированных и структурированных данных путем разбиения больших задач на фрагменты, которые для ускорения обработки распределяются по узлам кластеров, построенных на базе стандартного оборудования.
Hadoop используется онлайн-гигантами - сайтами Facebook, eBay, Amazon и Yahoo, и в последнее время все активнее внедряется банками, рекламными, биотехнологическими и фармацевтическими компаниями, - утверждает аналитик RedMonk Стивен О'Грэди.
В компании Tynt Multimedia, специализирующейся в области веб-аналитики, перешли на Hadoop около полутора лет тому назад, когда ежедневный объем обрабатываемых данных вырос до терабайта, и MySQL перестала справляться с нагрузкой. В Tynt отмечают, что Hadoop намного быстрее, чем реляционные СУБД, позволяет загружать новые данные в базу.