Благодаря машинному обучению и интеллекту вещей, предприятия могут теперь намного быстрее обрабатывать свои данные, переводя их виртуальные запасы в полезные ресурсы для проведения более мощных маркетинговых кампаний, развертывания эффективных логистических операций, оптимизации затрат на персонал и расширения лояльной клиентской базы в стремлении опередить конкурентов. Однако статистика не радует: от половины до 85% проектов, связанных с искусственным интеллектом, терпят неудачу, несмотря на то что инвестиции в корпоративную инфраструктуру поддержки решений машинного обучения ежегодно увеличиваются более чем на 50%.
Среди наиболее частых причин провалов называются отсутствие доступа к качественным данным, игнорирование проблемы необходимости обеспечения их достоверности и актуальности. И это неудивительно, ведь почти 90% компаний ошибочно считают, что проекты с использованием искусственного интеллекта не требуют специальной работы с данными. Однако для успеха таких проектов критична информационная инфраструктура своевременной подачи чистых данных на различные участки конвейера искусственного интеллекта.
Данные могут быть запутанными, несогласованными, «грязными», а значит, требуется система их очистки и обогащения.
Данных может быть слишком мало для обучения искусственной нейронной сети, а значит, требуется эффективная система их сбора и передачи в реальном времени, что стало возможным, например, благодаря устройствам Edge AI. Инференс нейросети блока управления беспилотным автомобилем на данных, полученных хотя бы с минутной задержкой, не только уже не нужен, но и смертельно опасен.
Данные и нейросетевые модели их обработки должны быть защищены от подмены или искажения, а значит, еще на этапе создания системы машинного обучения надо предусмотреть ее защиту.
Интернет вещей — отличный источник сырья для нейросетевой модели, однако способна ли его нынешняя инфраструктура справляться с этой задачей? Многие устройства Интернета вещей лишены даже элементарных механизмов безопасности, а их фирменные прошивки потенциально могут содержать вредоносный код или уязвимости. Львиная доля такого бортового ПО — это программы с закрытым исходным кодом, о котором конечные пользователи обычно не имеют представления и не задумываются о его обновлении, уповая на то, что после «заливки» устройства неким новым двоичным кодом все будет работать не хуже прежнего. Не будет. С ростом популярности Интернета вещей оказалось, что не все может функционировать, как ожидается, — появились атаки, нацеленные на изменение прошивок при их обновлении с целью коррекции функций устройства. И даже автомобили, в которых традиционно применяются полностью закрытые от внешнего враждебного мира системы, а работа с прошивками контролируется производителем, как выясняется, запросто могут быть дистанционно остановлены на трассе из-за уязвимости в бортовом контроллере. А значит, для проектов искусственного интеллекта актуальна проблема автоматизированного анализа и обезвреживания прошивок устройств Интернета вещей.
Системы машинного обучения демонстрируют впечатляющие успехи при классификации изображений, переводе текстов, управлении беспилотными повозками и выполнении других задач, требующих только опоры на предыдущий опыт их решения. В 2020 году в североамериканских организациях более миллиона рабочих мест, на которых выполняются рутиные операции, будут отданы системам, в той или иной форме использующим машинное обучение. Правда, одновременно появится более 300 тыс. новых мест, для которых нужны навыки, свойственные человеку разумному: интуиция, эмпатия и нестандартное мышление. Как бы то ни было, искусственный интеллект у всех на слуху, наблюдается ажиотажный рост его применения, причем часто без должного понимания принципов действия реализующих его систем. И это опасно, поскольку подобные внедрения несут регулярные риски, которые необходимо учитывать еще на этапе проектирования. Тем не менее в условиях, когда маркетинг торжествует над разумом, глубинное обучение продолжают наделять чудодейственными возможностями.
Нынешний прогресс в сфере искусственного интеллекта во многом обусловлен увеличением мощности процессоров и большим объемом потенциально доступных данных, но не особыми прорывами в научных исследованиях, большинство которых пока фокусируется на принципах обучения, а не на самих обучающих данных, в неменьшей степени влияющих на принятие решения «умной» системой. Изменения в ее поведении можно вызвать путем модификации входных данных, обучающих данных или собственно модели — при обработке будет выдаваться не тот результат, на который рассчитывали создатели системы: неверная классификация знака остановки, ошибочная интерпретация высказываний в социальных медиа, искаженный медицинский диагноз или финансовый прогноз и т. п. Не следует забывать и про атаки извлечения, в ходе которых из системы незаметно скачивается конфиденциальная информация. Все это говорит о том, что и сами системы машинного обучения нуждаются в надежной инфраструктуре, предотвращающей попытки нарушить нормальный «мыслительный» процесс машины.
По мнению аналитиков, настало время от увлеченных разговоров о возможностях и перспективах технологий искусственного интеллекта переходить к обсуждению места и роли человека в грядущем интеллектуальном ландшафте, где люди и системы взаимодействуют во все более открытых, связанных и скоординированных средах для создания нового опыта. Однако открытость граничит с похищением и вторжением, а значит — для интеллекта вещей потребуется адекватная инфраструктура работы с данными, обеспечивающая реализацию самых смелых бизнес-сценариев.