Корпорация Oracle представила расширение своего связующего программного обеспечения Oracle Data Integrator, которое дает администраторам баз данных и специалистам по хранилищам данных возможность рассматривать репозитории Больших Данных как еще один источник данных наряду со структурированными базами и хранилищами данных.
«Oracle Data Integrator for Big Data позволяет разработчику, не имеющему навыков работы с технологиями Hadoop, получить присущую Hadoop эффективность, – пояснил вице-президент Oracle по управлению продуктами Джефф Поллок. – Платформы Больших Данных, такие как Hadoop и Spark, в которых используются языки Java и Python, изначально больше ориентированы на программистов, чем на администраторов баз данных. А между тем в традиционном анализе корпоративных данных основная роль отводится администраторам и специалистам по инструментам интеграции данных наподобие ETL (Extract, Transform, Load — 'извлечение, преобразование, загрузка'), использующим SQL и визуальные интерфейсы».
Data Integrator for Big Data расширяет возможности Oracle ODI в части управления источниками Больших Данных.
ODI обеспечивает организациям возможность извлекать данные, представленные в различных форматах и в разных источниках, в частности в реляционных СУБД IBM и Microsoft или в хранилищах данных Teradata. С этой точки зрения подключение репозиториев Больших Данных к ODI представляется вполне естественным.
Благодаря новому расширению компаниям не придется направлять администраторов баз данных на переобучение, чтобы овладеть инструментами вроде Hive for Hadoop. Им предлагается уже знакомый набор инструментов. Администратор получает привычную концепцию сущностей и отношений, а также средства отображения потоков данных 4GL. «Data Integrator for Big Data автоматически генерирует необходимый для выполнения поставленных задач код на нужном языке», – пояснил Поллок.
Новый инструментарий может работать в любой среде Hadoop или Spark, не требуя установки каких-либо дополнительных средств на узлах данных. Опираясь на мощь распределенных вычислительных сред, Data Integrator for Big Data обращается к узлам, где хранятся данные, и выполняет там все требуемые операции.
Системы сбора данных в реальном времени, такие как Oracle GoldenGate 12c, могут перемещать транзакционные данные в кластер Hadoop, где будет проходить подготовка к последующему анализу их с помощью ODI.
В своих попытках объединить новые инструменты Больших Данных с традиционным программным обеспечением анализа данных Oracle не одинока. Недавно компания Hewlett-Packard выпустила программный пакет, позволяющий клиентам интегрировать аналитическую СУБД HP Vertica с платформой HP Autonomy IDOL (Intelligent Data Operating Layer), тем самым организации обретают возможность ускорить анализ больших объемов неструктурированных данных.