Конференция Intel Nervana AI Summit Moscow прошла в рамках глобального турне, организованного корпорацией Intel с целью продвижения платформы полного цикла поддержки решений искусственного интеллекта, включающей аппаратно-программные системы машинного обучения. Для консолидации работ, связанных с искусственным интеллектом, в корпорации сформировано подразделение Intel Artificial Intelligence Products Group, техническим директором которого, а также сооснователем компании Nervana Systems является Амир Хосровшахи. По его убеждению, Большие Данные и прогресс процессорных технологий привели к реинкарнации данного технологического направления. Открылись широкие возможности для обучения нейронных сетей, в частности растет популярность глубинного обучения, не требующего вмешательства со стороны человека при подготовке обучающих выборок.
Создание беспилотных автомобилей, распознавание изображений, речевые интерфейсы, поиск аномалий в данных Интернета вещей и ряд других новых задач требуют повышения качества моделей и обеспечения возможности решения этих задач в реальном времени. По прогнозам, к 2020 году каждый беспилотный автомобиль будет в течение дня генерировать 5 Тбайт данных, и если на современных стационарных компьютерных платформах можно решать задачи искусственного интеллекта, связанные с управлением машиной, то для бортовых систем это пока сложно: обучение нейронной сети из 100 слоев на четырехпроцессорном сервере занимает до шести дней.
По мнению Амира Хосровшахи, Большие Банные и прогресс процессорных технологий привели к реинкарнации искусственного интеллекта |
Глубинное обучение и нейронные сети могут найти применение везде, где есть данные, однако масштабировать соответствующие решения столь же сложно, как и быстро строить модели, адекватные прикладной области. Платформа поддержки глубинного обучения Intel Nervana призвана предоставить специалистам в предметных областях эффективные инструменты, позволяющие не отвлекаться на освоение методов машинного обучения, а сосредоточиться на разработках моделей и топологий нейронных сетей.
Стек решения для поддержки задач, использующих нейронные сети, выглядит следующим образом: процессоры и аппаратные ускорители (Xeon, Xeon Phi, Crest), библиотеки (Intel MKL, DAAL), инструменты (Nervana Deep Learning, Cloud, Graph). Анонсирован выход в середине этого года семейства аппаратных ускорителей Crest, специально предназначенных для задач глубинного обучения (например, чип Lake Crest — это доступ к памяти на скорости 8 Тбит/с; 32 Гбайт памяти HBM2, которая в 12 раз быстрее DDR4; межсоединения внутри чипа, по быстродействию в 20 раз превосходящие PCIe). Программисты, использующие решения на базе нейронных сетей, могут применять пакет Intel Distribution for Python, который позволяет получать ускорение до 150 раз по сравнению со стандартными средствами. Это отметила в своем докладе Виктория Федотова, ведущий программный инженер подразделения программных продуктов Intel.
Как может использоваться этот стек, в частности, для задач машинного зрения, продемонстрировали Алексей Мяков, директор подразделения компьютерного зрения Intel Internet of Things Group, и Игорь Фаломкин из компании AxxonSoft, партнера Intel. Многообразие задач класса машинного зрения (обнаружение оставленных предметов, распознавание номерных знаков, распознавание QR-кодов и т. д.) в условиях огромных потоков данных (например, 10–12 кадров в секунду только от одной камеры наружного наблюдения, которых в Москве 130 тыс.) не оставляет места традиционному машинному обучению, предполагающему участие человека при подготовке обучающей выборки. При глубинном обучении человеку приходится заниматься лишь созданием топологии сети, а не градиентов, но здесь для каждого объекта требуется гораздо больше образцов — сотни, а не единицы тысяч. В этих условиях одна из задач Intel состоит в том, чтобы оптимизировать свои решения в области глубинного обучения на «легких» платформах, например организовав обучение сети на больших кластерах с последующим переносом ее для промышленной эксплуатации на бортовые системы — в видеокамеры наружного наблюдения и т. д. Как отметил Фаломкин, сегодня весьма востребована задача обработки архивов видеонаблюдений для выявления нерегулярных событий, таких как пересечение границ территорий, скопление объектов в конкретной зоне или обнаружение дыма или огня. В России уже имеются пилотные проекты развертывания системы поиска по лицам в городе в реальном времени, однако большинство камер сегодня построено на платформе ARM, и для применения решений от подразделения Intel Artificial Intelligence Products Group еще требуется проделать определенную работу.
По мнению Мякова, «натренированная» сеть может быть передана от Intel конечному пользователю, работающему с недорогой платформой, а соответствующие решения могут быть интегрированы в многочисленные продукты, сервисы и бизнес-процессы. Однако стоимость решений постепенно все больше определяется не вычислительными и интеллектуальными технологиями, как было когда-то, а затратами на сбор данных.