Благодаря приверженности идеям Open Source, экосистема Hadoop и Apache Spark, важнейших на сегодня технологий в мире Больших Данных, развивается быстрее, чем если бы технология принадлежала только одному разработчику.
Иногда в мире Больших Данных их считают конкурентами, но чаще преобладает точка зрения, согласно которой они дополняют друг друга.
Streams дает возможность создавать потоки путем «подписки» на источники данных. Подписчиками могут быть как люди, так и машины. Например, отдел ИТ может подписаться на поток данных из журналов операций, чтобы автоматизировать обнаружение аномалий, указывающих на проблемы.
При организации подготовки в университетах специалистов по технологиям Больших Данных наряду c проблемами методологического характера возникают и сложности с доступом к наборам данных и соответствующим инструментам. Наиболее эффективным в этой ситуации оказывается развертывание виртуальной среды Hadoop/Spark.
Пакеты Teradata Listener и Teradata Aster Analytics для Hadoop предназначены для анализа в реальном времени журналов серверов, лент социальных сетей, потоков данных с датчиков и телеметрического оборудования и прочих источников.
Спецслужбе не доверяют, обнаружив, что в ней собирают огромные массивы информации о людях, не афишируя это и не объясняя, для чего это делается.
До наступления эпохи Больших Данных было относительно просто найти информацию, релевантную запросу, однако ситуация изменилась, когда организации перестали довольствоваться только своими внутренними базами и стали смотреть на сторону в поисках источников сведений, способствующих повышению конкурентоспособности.
Социальные сети могут стать источником дополнительных данных о клиентах, однако для его использования требуются специализированные инструменты. Открытые технологии из стека Hadoop позволяют строить платформы, способные в режиме массовой обработки извлекать ценную информацию для обогащения профилей клиентов.
В компании добавляют, что HANA Vora будет полезен организациям, которым надо анализировать большие объемы данных в контексте бизнес-процессов, в том числе предприятиям, работающим в финансовой сфере и в отраслях услуг связи, здравоохранения и производства.
Система была создана в Агентстве национальной безопасности США и выпущена в 2014 году под лицензией с открытым кодом. Сейчас разработка ее координируется фондом Apache.
Эффективность анализа данных о функционировании телекоммуникационного оборудования определяется возможностями системы сбора и обработки этих данных, объемы которых могут увеличиваться экспоненциально. Как выполнить глубокий анализ поведения сетевого оборудования в условиях лавинообразного роста показаний телеметрии?
На платформе Cazena доступны озеро данных, витрина данных и «песочница» в виде сервиса — все они, как утверждают в компании, вводятся в действие «в три щелчка».
CA Technologies выпустила новые версии инструментальных средств мониторинга производительности приложений и инфраструктуры — CA APM и CA UIM.