Исход западных производителей СУБД с российского рынка и активизация процессов импортозамещения обострили проблему выбора альтернативных систем, позволяющих отечественным компаниям и предприятиям решать насущные бизнес-задачи. Команда аналитиков проекта «Круги Громова» провела исследование современного отечественного рынка СУБД и попыталась систематизировать доступные сведения для построения наглядного представления, помогающего пользователям выбрать наиболее подходящую систему.
Еще во времена демократизации массово-параллельных СУБД и становления экосистемы Hadoop была в целом решена задача линейного масштабирования аналитических нагрузок, однако с транзакционными базами такого еще не случилось. По состоянию на первую половину 2020-х годов проблема открыта, хотя определенные продвижения есть, вызванные как усовершенствованием технологий в сфере оборудования, так и появлением новых архитектур СУБД.
Прогресс в области технологий баз данных и востребованность множества нишевых решений привели к трансформации ландшафта СУБД — сегодня востребованы разработчики, способные создавать специализированные системы с нуля, что свело на нет роль объективных критериев выбора системы управления базами данных.
По мере роста потребностей в обработке Больших Данных появляются новые модели управления данными, позволяющие выполнять миллиарды запросов в секунду. Одновременно, чтобы не отстать от рынка, меняют и традиционные реляционные модели. Как разобраться в современном ландшафте СУБД и выбрать решение, наилучшим образом удовлетворяющее конкретным требованиям?
В его рамках будут предоставляться услуги по созданию предсказательных математических моделей, проведению маркетинговых исследований, консалтингу в области развития инфраструктуры и методологии работы с большими данными.
Корпорация стремится создать под своей маркой мощный набор средств бизнес-аналитики, машинного обучения и искусственного интеллекта.
Streams дает возможность создавать потоки путем «подписки» на источники данных. Подписчиками могут быть как люди, так и машины. Например, отдел ИТ может подписаться на поток данных из журналов операций, чтобы автоматизировать обнаружение аномалий, указывающих на проблемы.
Сегодня только в ходе одного эксперимента в области физики высоких энергий генерируется такой объем метаданных, который сравним с объемом данных экспериментов, полученных за весь XX век. Однако для организации хранения и эффективного доступа к этим метаданным прежние реляционные технологии уже непригодны. Объемы метаданных
Проектирование архитектур систем работы с Большими Данными связано с множеством трудностей. В частности, архитектуру распределенного ПО надо тесно увязать со структурами данных и архитектурой развертывания. Чтобы удовлетворить требования к качеству, при проектировании системы нужно учитывать особенности всех трех архитектур одновременно.
Преимущество популярного инструментария с открытым кодом, считают разработчики, заключается в том, что он напрямую работает с неструктурированными данными, находящимися в базе, не приводя их в традиционный реляционный вид. Распространенные средства анализа и визуализации — например, Tableau — работают со структурированными данными.
Компания ранее уже предлагала аналогичные инструменты для своей собственной СУБД, а вариант для Hadoop позволит уменьшить потребности в переносе информации и анализировать более разнообразные срезы данных.