18 января 2024 г. VK Cloud открывает доступ к Cloud Spark — сервису для работы с большими данными на базе технологий Apache Spark и Kubernetes. С помощью Cloud Spark бизнес может структурировать данные из разрозненных источников для создания аналитических и предиктивных систем, а также моделей машинного обучения. Сервис позволяет сократить до 60% стоимости вычислительных ресурсов при работе с большими данными за счет автоматического масштабирования Kubernetes в зависимости от текущей нагрузки.
Cloud Spark обеспечивает распределенную пакетную и потоковую обработку неструктурированных и слабоструктурированных данных из разных источников, таких как S3, ClickHouse, Kafka и других. Благодаря оптимизации и кэшированию в памяти, сервис выполняет аналитические запросы к данным практически любого объема.
С помощью Cloud Spark можно оперативно и с минимальными затратами на инфраструктуру решать задачи Data Science и аналитики, в том числе проводить разведочный анализ данных (EDA), а также обучать модели машинного обучения на данных компании. Аналитики и специалисты по работе с данными получают быстрый доступ к необходимым данным из разных источников посредством SQL-запросов, а ML-разработчики могут использовать возможности встроенной библиотеки MLlib для работы с машинным обучением. Все пользователи также могут управлять сервисом из любого удобного окружения, в том числе с локального компьютера и из JupyterHub, за счет встроенной клиентской библиотеки.
Cloud Spark развернут на базе управляемого сервиса Kubernetes от VK Cloud, который позволяет автоматически масштабировать и сокращать вычислительные ресурсы в зависимости от текущей нагрузки. Таким образом, компания может гибко управлять и оптимизировать затраты на сервис, экономя до 60% стоимости инфраструктуры. Поддержку работоспособности и администрирование Cloud Spark обеспечивает платформа VK Cloud, что избавляет от необходимости тратить время и ресурсы собственных специалистов на рутинные задачи.
«Облачный сервис Cloud Spark делает технологии корпоративного уровня доступными для компаний любого размера. Бизнес получает масштабируемый инструмент для работы с большими данными без необходимости самостоятельно запускать, настраивать и администрировать Spark или Kubernetes. Платформа VK Cloud обеспечивает гибкое масштабирование ресурсов, безопасность и соответствие требованиям 152-ФЗ, в то время как специалисты компании могут сосредоточиться на аналитических и исследовательских задачах, работе с машинным обучением, то есть на извлечении из данных пользы для бизнеса», — отмечает Александр Волынский, технический менеджер продукта, VK Cloud.
О VK Cloud
VK Cloud — платформа с широким набором облачных сервисов для эффективной разработки и работы с данными для компаний любого масштаба. VK Cloud входит в портфель решений VK Tech и базируется на многолетнем опыте развития интернет-сервисов и технологий на базе открытого кода.
VK Cloud предоставляет инфраструктурные и платформенные сервисы, экспертную поддержку, а также помогает мигрировать в облако. Клиенты компании: X5 Group, АШАН, DNS, Битрикс24, Газпромнефть, Росатом и другие крупнейшие игроки своих отраслей. Платформа VK Cloud аттестована с полным соответствием 152-ФЗ (УЗ-1).