Ориентируясь на конкурентов, в том числе Amazon Aurora и Snowflake, компания Oracle расширила возможности ускорителя обработки запросов в оперативной памяти MySQL HeatWave в среде Oracle Cloud MySQL Database Service за счет использования передовых методов машинного обучения. При этом поясняется, что указанные улучшения вовсе не означают посягательства MySQL Database Service на позиции флагманской СУБД Oracle Database.
В августе компания выпустила MySQL Autopilot – компонент HeatWave, использующий передовые технологии машинного обучения для увеличения скорости выполнения запросов и повышения масштабируемости. MySQL HeatWave работает с MySQL Database Service в среде Oracle Cloud Infrastructure (OCI) для повышения производительности аналитической и смешанной рабочей нагрузки OLTP и OLAP.
Бесплатно поставляемый вместе с HeatWave компонент Autopilot автоматизирует различные аспекты масштабного повышения производительности запросов, включая их инициализацию, загрузку данных, выполнение и обработку ошибок. Для выборки данных, сбора статистики о данных и запросах и построения моделей машинного обучения применяются передовые технологии, обращающиеся к Oracle AutoML для моделирования использования памяти, нагрузки на сеть и времени исполнения. По мере роста числа выполняемых запросов Autopilot повышает интеллектуальный уровень оптимизатора запросов HeatWave, что способствует непрерывному увеличению производительности.
Перечислим основные особенности MySQL Autopilot.
— Автоматическая инициализация за счет прогнозирования числа узлов HeatWave, необходимых для выполнения рабочей нагрузки с использованием адаптивной выборки данных, требующей аналитики.
— Автоматическая параллельная загрузка для оптимизации времени загрузки и использования памяти путем прогнозирования оптимального параллелизма для каждой таблицы, загружаемой в HeatWave.
— Автоматическое размещение данных с прогнозированием столбца, по которому таблицы должны быть разделены в памяти, с тем чтобы обеспечить наивысшую производительность обработки запросов.
— Автоматическая оценка времени обработки запроса перед его выполнением.
— Автоматическое восстановление в случае ошибки с предоставлением новых узлов и повторной загрузкой необходимых данных, если один или несколько узлов не отвечают.
Несмотря на расширение возможностей MySQL в Oracle настаивают, что никакого посягательства на собственные корпоративные сервисы компании нет. Oracle Database предназначена для крупномасштабных корпоративных развертываний, тогда как MySQL – для разработчиков, облачных приложений с открытым кодом и компаний, у которых никогда не было собственной необходимой инфраструктуры.
Например, облачный сервис Oracle Exadata может работать с базой данных объемом в 2-5 Пбайт, тогда как возможности HeatWave ограничены 32 Тбайт. Публичная компания, являющаяся крупным поставщиком финансовых услуг, в силу огромного объема имеющихся у нее данных будет использовать Oracle Autonomous Database или облачный сервис Exadata, а не MySQL с HeatWave.
Наряду с MySQL Autopilot, Oracle представила MySQL Scale-Out Data Management, благодаря чему скорость повторной загрузки данных в HeatWave повышается в сто раз. Теперь HeatWave может поддерживать кластер, объединяющий до 64 узлов. Ранее его размеры были ограничены 24 узлами. Объем обрабатываемых HeatWave данных ранее был ограничен 12 Тбайт, а теперь – 32 Тбайт.