Добыча данных, хранилища данных

От разрозненных хранилищ — к платформам данных

Усложнение и развитие систем работы с данными, внедряемыми в рамках проектов импортозамещения, означает решение новых задач – по сути, речь идет о изменении самих подходов к владению данными. Переход от разрозненных хранилищ к платформам данных требует специфических решений по каталогизации, управлению, организации разработки и обеспечению безопасности. Компаниям экономики данных требуется не просто импортозамещение «как есть», а качественное изменение корпоративных ИТ-ландшафтов.

Apache Ignite и машинное обучение

Традиционные системы хранения не могут расширяться бесконечно или хотя бы достаточно быстро, что особенно критично для задач глубинного обучения, в случае когда данных больше, чем может поместиться на одной машине. Поэтому для поддержки работы с большими данными все чаще применяются распределенные горизонтально масштабируемые архитектуры хранения и обработки в памяти.

Российское озеро научных данных

Создание озер научных данных актуально сегодня для всех стран, претендующих на ведущие роли в научных сообществах. В противном случае ученые из таких стран потеряют возможность контроля над хранимыми в рамках федерации данными.

Системы хранения: методики определения ценности данных

Различные данные имеют для компании разную ценность, и затраты на их хранение должны быть адекватными. Ошибки в определении реальной ценности и востребованности данных в лучшем случае сведут на нет попытки сэкономить, а в худшем — приведут к рискам.

От данных к информации

Переход от монолитных ИТ-систем к слабо связанным сервисным архитектурам влечет за собой пересмотр отношения к данным и информации.

Средства добычи знаний в бизнесе и финансах

KDD — обнаружение знаний в базах данных — реальный способ повышения эффективности работы. Вопрос не в том, нужны ли такие технологии, а в том, как их применить в каждом конкретном случае.

Как сравнивать эффективность развертывания КХД в «облаке» и на «земле»?

О нюансах выбора облачной или локальной инфраструктуры для развертывания корпоративного хранилища данных и его интеграции с другими ИТ-системами.