Компания Revolution Analytics обновила свой главный продукт — дистрибутив языка программирования R, — обеспечив возможность его использования с платформой распределенной обработки данных Hadoop. Новая версия языка, Revolution R Enterprise 7, также позволяет обрабатывать с помощью R данные из хранилищ Teradata.
Язык R предназначен для статистической обработки и визуализации данных; с его помощью можно выполнять линейное и нелинейное моделирование, анализ временных рядов, классификацию и кластерный анализ. Как утверждают в Revolution Analytics, cилами компании язык R становится все популярнее, так как дает больше возможностей, чем типовые системы бизнес-анализа.
В RRE7 появилась библиотека алгоритмов статистического и прогнозного анализа на R с возможностью распараллеливания между множеством узлов. RRE7 работает с дистрибутивами Hadoop CDH3 и 4, а также с Hortonworks Data Platform 1.3. Благодаря анализу данных непосредственно на узле, где они находятся, R позволяет решать задачи быстрее, утверждают в Revolution Analytics.
В компании также реализовали новый интерфейс моделирования потоков операций, который не требует знаний способов реализации конкретных алгоритмов на R, сообщают в компании. В Revolution Analytics надеются, что благодаря этому больше бизнес-менеджеров смогут пользоваться R с Hadoop.