В Google сообщили о некоторых технических деталях перехода на производственные кластеры, способные одновременно работать как на базе процессоров с архитектурой x86, так и на базе собственных чипов Axion Arm. Основные сервисы компании, включая YouTube, Gmail и BigQuery, теперь поддерживают обе архитектуры наборов команд. В Google перевели на Arm более 30 тыс. — почти треть — своих приложений. Такая мультиархитектурная (multiarch) стратегия знаменует переход к новой эре аппаратной нейтральности и подчеркивает растущее влияние Arm в гипермасштабных облачных средах, считают эксперты.

В процессе миграции на смешанную архитектуру исследователи Google запускали производственные сервисы на процессорах Axion на базе Arm и проанализировали 38 156 коммитов (сохранений) в огромном едином репозитории Google3, который хранит коды множества проектов, позволяя отслеживать типы изменений. Они начали с задач, работающих с базами данных F1, Spanner и Bigtable, используя традиционные методы портирования, и отметили, что современные компиляторы и инструменты поиска ошибок хорошо справляются с такими архитектурными различиями платформ, как расхождения в вычислениях с плавающей запятой, производительность, реализуемые только одной из них инструкции.

Чтобы масштабировать миграцию на более чем 100 тыс. приложений, в Google применили автоматизацию, включая систему, которая разбивала крупные изменения на более мелкие коммиты, ускоряя проверку полученного кода. Для выявления и устранения ошибок использовались санитайзеры, фаззеры и постоянный мониторинг здоровья сервисов, что позволяло быстро выявлять проблемы и исправлять их.

Важнейшим комонентом стала разработка ИИ-системы CogniPort, которая автоматически исправляла ошибки сборки и тестирования, используя три агента — «оркестратор», «билд-фиксер» и «тест-фиксер». Ранние тесты показали успешное исправление ошибок в 30% случаев. В итоге, благодаря сочетанию ручной работы, масштабной автоматизации и ИИ, в Google успешно перевели миллионы строк кода с x86 на Arm, обеспечив поддержку производственных сервисов на обеих архитектурах

Новые приложения Google теперь по умолчанию являются мультиплатформенными. Это стало возможным благодаря единому хранилищу кода, завершению большинства структурных изменений и автоматизации процессов развертывания без значительного участия ИТ-персонала.

Аналитики отмечают, что такие крупные облачные провайдеры, как AWS и Microsoft, уже активно переходят на собственные серверы на базе Arm. Раньше процессоры Arm использовалась для легких облачных задач, однако сейчас эта архитектура поддерживает гораздо более широкий спектр рабочих нагрузок, включая масштабируемые облачные решения и традиционные серверные задачи. Ожидается, что поддержка таких игроков, как Nvidia, сделает Arm еще более популярной архитектурой в ЦОДах предприятий, облачной и ИИ-инфраструктуре.