В Институте компьютерных технологий Китайской академии наук предложили основанную на ИИ систему автоматизации проектирования процессорных чипов. В журнале National Science Review опубликована парадигма полностью автоматизированного проектирования, в рамках которой на основе высокоуровневых функциональных требований формируется проверенный высокопроизводительный аппаратно-программный стек решений.
Авторы публикации выделяют три основные проблемы, препятствующие полной автоматизации. К ним относится значительный объем ручной работы для интерпретации исходных спецификаций на естественном языке, поскольку инструментам автоматизированного проектирования чипов нужны строгие формальные описания с использованием таких языков, как Си/C++, Verilog или VHDL. Кроме того, проектируемые процессоры требуют абсолютной функциональной корректности с уровнем «11 девяток» при анализе всех возможных сценариев, а большие языковые модели не дают детерминированных гарантий. И, наконец, — огромное пространство решений реализации.
Чтобы преодолеть эти барьеры, исследователи предложили трехкомпонентную рамочную структуру, основанную на специализированной доменной большой модели процессорного чипа — LPCM (Large Processor Chip Model), — аналоге LLM типа GPT, но обученной только на данных проектирования процессоров.
LPCM читает неформальные описания, разрешает неоднозначности и генерирует начальный формальный дизайн на языке высокого уровня. Из-за дефицита качественных обучающих данных авторы отмечают важность синтеза данных LLM и кросс-верификации для автоматического создания масштабных, высококачественных наборов обучающих примеров для тренировки LPCM. Такой подход уже доказал эффективность в работе по проектированию RTL (Register Transfer Level) с использованием логических выводов.
Второй компонент отвечает за функциональную корректность. Не полагаясь на результаты работы только одной модели, платформа интегрирует инструменты автоматической проверки для анализа промежуточных проектов и использует полученные данные для автоматического исправления ошибок. При их обнаружении она «откатывается» к проверенной версии, регенерирует ошибочную часть и повторяет итерации до полного прохождения тестов. Это уже реализовано в процессоре QiMeng-CPU-v1, где с применением графической структуры BSD (Binary Speculation Diagram) для описания его логики, булева расстояния как метрики верификации и расширения BSD превышены «11 девяток» и загружался Linux.
Третий компонент решает проблему оптимизации производительности в огромном пространстве возможных дизайнов чипов. Для этого дизайны-кандитаты (варианты архитектуры, логики, схем) образуют дерево, в корне которого — базовая спецификация, а ветви – изменения компонентов (конвейера, кеша, АЛУ). LLM предсказывает и измеряет производительность IPC (Instructions Per Cycle) в промежуточных узлах, «обрезает» медленные ветви и фокусируется только на быстрых. Подобные идеи поиска с обратной связью уже применялись при автоматизированном проектировании базового ПО.
Авторы поясняют, что полностью автоматизированная система не «отменяет» традиционную экосистему EDA (Electronic Design Automation), а модель LPCM может управлять существующими инструментами проектирования, выступая в роли «интеллектуального дирижера», координирующего работу средств создания комплексных автоматизированных решений.