Технологии на службе прогресса человечества

Статьи выпуска журнала Computer за июнь посвящены опыту и оптимальным методам разработки и внедрения систем искусственного интеллекта, который сегодня напрямую влияет на жизнь людей по всему миру, соответствующие алгоритмы, например, используются для предотвращения, обнаружения и лечения инфекционных заболеваний; более того, средства искусственного интеллекта применяются сейчас повсеместно, от игрушек до бытовой техники и систем управления беспилотными транспортными средствами.

Статья «Практика и инфраструктура создания систем машинного обучения в организациях Финляндии» (Practices and Infrastructures for Machine Learning Systems: An Interview Study in Finnish Organizations) Денниса Муйрури (Dennis Muiruri) и соавторов подготовлена по результатам проведенного опроса о цикле разработки и развертывания систем, использующих средства машинного обучения. Вопросы анкетирования касались процедур обучения и используемых инструментальных цепочек. Отмечены зрелость ряда инженерных подходов и нехватка общепринятых принципов и инструментов тестирования и мониторинга работы систем.

Еще две статьи касаются практических аспектов разработки и внедрения приложений, требующих автоматизации процессов объединения больших объемов поточных данных, поступающих от сетей сенсоров; использования машинного обучения в системах, предусматривающих мгновенный отклик; обеспечения работы человека и машины в команде и упрощения модификации интеллектуальных функций на протяжении жизненного цикла системы.

Публикация «Фреймворк непрерывного обучения для системы автономного вождения, работающей во взаимодействии с инфраструктурой» (Pi-Learner: A Lifelong Roadside Learning Framework for Infrastructure Augmented Autonomous Driving) группы авторов во главе с Кунай Чжаном (Kunai Zhang) посвящена созданию соответствующей коммерческой системы на дорогах общего пользования. Показано, насколько такая система позволила повысить безопасность эксплуатации беспилотных автомобилей.

В свою очередь в статье «Поиск пропавших людей с помощью машинного обучения и слияния данных» (Applying Machine Learning and Data Fusion to the ‘ Missing Person’ Problem) К.М.А. Солеймен (K.M.A. Solaiman) с соавторами описывают систему, которая, интегрируя данные из множества источников, помогает в поиске пропавших детей и лиц, находящихся под следствием.

Статьи июльского номера Computer посвящены технологиям, которые, как ожидается, обеспечат прогресс человечества: космическим Интернет-каналам, человекоцентричному искусственному интеллекту, слиянию центров обработки данных с суперкомпьютерами и будущему машинного обучения. В нынешних условиях как никогда актуальны научные достижения, способствующие устойчивому развитию и решению социальных проблем, а данный выпуск журнала Computer непосредственно отражает девиз его издателя — IEEE CS: «Технический прогресс во имя человечества».

Публикация «Углеродный след машинного обучения достигнет плато, а потом уменьшится» (The Carbon Footprint of Machine Learning Training Will Plateau, Then Shrink) Дэвида Паттерсона (David Patterson) и соавторов содержит прогноз затрат на обеспечение устойчивого развития систем искусственного интеллекта. Авторы оспаривают существующие опасения по поводу неуклонного роста выбросов углерода, обусловленных обучением интеллектуальных систем. Описываются перспективы существенного снижения углеродного следа с помощью ряда методов, включая оптимизацию моделей и переход на ускорители новых типов. По прогнозу авторов, всеобщее следование лучшим практикам управления энергозатратами позволит уменьшить углеродный след от инфраструктур поддержки систем машинного обучения уже к 2030 году.

Торстен Хефлер с соавторами подготовили статью «Конвергенция сетей гиперскалярных центров обработки данных и систем высокопроизводительных вычислений» (The Convergence of Hyperscale Data Center and High-Performance Computing Networks). По прогнозу, размывание границ между двумя видами сетей будет происходить на нескольких уровнях, прежде всего на уровне приложений. Авторы полагают, что основным катализатором конвергенции станут интеллектуальные сетевые адаптеры smartNIC, а двигателем — инновация в области высокопроизводительных вычислений. При этом в ЦОДах ввиду потребности в сохранении обратной совместимости внедрение сетевых новшеств будет происходить инкрементально, но так или иначе оба вида сетевых стеков изменятся.

Имин Хуо (Yiming Huo) в статье «Космический широкополосный доступ: гонка начинается» (Space Broadband Access: The Race Has Just Begun) объясняет, что прогресс в области космической связи будет зависеть от доступности низкоорбитальных спутников и возможности запуска космических аппаратов по приемлемой стоимости. Благодаря такому прогрессу можно будет обеспечить доступом к Интернету не обслуживаемые сейчас районы Земли, наладить обмен данными в околоземном пространстве, а также с Луной, Марсом и более далекими планетами. Благодаря конкуренции стоимость космической связи будет уменьшаться, а пропускная способность — расти: к первым участникам рынка, таким как Starlink, OneWeb и Telesat, уже присоединились новые игроки, в том числе Amazon и Boeing.

Риа Черуву (Ria Cheruvu) опубликовала статью «Нестандартные вопросы человекоцентричного искусственного интеллекта» (Unconventional Concerns for Human-Centered Artificial Intelligence). В ней рассматривается ряд сценариев, в которых работа искусственного интеллекта увеличивает уязвимость для атак и повышает вероятность систематической ошибки (предубежденности) системы. По прогнозу автора, на уязвимость будут сильно влиять характер взаимодействия людей с системой и уровень сложности алгоритмов. В связи с таким влиянием, в свою очередь, будут меняться технологии и нормативное регулирование. В публикации приводятся прогнозы по поводу автономии и прозрачности искусственного интеллекта на предстоящее десятилетие.

Заключительную статью июльского номера Computer «Вызов цифровому неравенству: факторы, влияющие на освоение технологий будущего пожилыми» (Challenging the Digital Divide: Factors Affecting the Availability, Adoption, and Acceptance of Future Technology in Elderly User Communities) подготовили Рамалатха Маримутху (Ramalatha Marimuthu) и соавторы. В публикации рассматриваются модели освоения новых технологий пожилыми людьми, в особенности представителями коренного населения и других маргинализованных сообществ. Анализируется неравенство, возникшее вследствие недостатка образования и финансовых возможностей, учитываются факторы доступности, навыков, мотивации и эмоциональных барьеров. Предлагаются меры по обучению, оказанию помощи и эмоциональной поддержки, решению проблем безопасности и регулирования. Приводится формальная классификация требований и пробелов, устранение которых поможет пожилым интегрироваться в цифровой мир.

Августовский номер Computer посвящен теме воспроизводимости научно-технических исследований — основополагающего фактора обеспечения их надежности. Возможность повторить исследование — главный способ подтвердить достоверность открытия и обеспечить доверие к результатам. Все более важную роль в научной деятельности и инженерном проектировании играют ИТ и данные, но из-за роста сложности приложений, оборудования и платформ работы с данными достигать воспроизводимости становится все труднее. Статьи освещают трудности обеспечения воспроизводимости исследований, основанных на данных, решения по преодолению таких трудностей, соответствующий опыт внедрения и лучшие практики.

Номер открывает публикация «Связи для соблюдения принципов FAIR и обеспечения воспроизводимости исследований на основе данных» (CUF-Links: Continuous and Ubiquitous FAIRness Linkages for Reproducible Research), которую подготовили Иэн Фостер (Ian Foster) и Карл Кессельман (Carl Kesselman). Речь идет о механизмах, позволяющих эффективно фиксировать необходимую для целей воспроизводимости информацию об использованных и созданных в рамках проекта наборах данных. В качестве инструмента соблюдения принципов находимости, доступности, интероперабельности и возможности многократного использования (findability, accessibility, interoperability, reusability — FAIR) данных предлагается формировать непрерывную цепочку связей между входными и выходными данными с фиксацией ссылок на источники. Приводятся примеры инструментов, позволяющих реализовать такую возможность.

Статья «Прогресс воспроизводимости в Национальном научном фонде» (Advancing Reproducibility at the NSF), подготовленная Мартином Халбертом (Martin D. Halbert), посвящена инициативам, направленным на развитие научной киберинфраструктуры, в частности, стандартов открытых данных, контроля происхождения, отчетности на основе принципов FAIR и воспроизводимости научных исследований. Приводится обзор соответствующих исследований, профинансированных американским Национальным научным фондом.

Лорена Барба (Lorena A. Barba) опубликовала статью «Роль программного обеспечения с открытым кодом в воспроизводимости исследований» (Defining the Role of Open Source Software in Research Reproducibility). Автор оценивает успех модели разработки ПО с открытым кодом, ее применение при создании программ научного назначения и влияние такого ПО на прогресс науки. Анализируется роль, которую открытый код играет в воспроизводимости исследований, проводятся параллели и отмечаются контрасты между деятельностью сообщества Open Source и научного сообщества.

Заключительная публикация номера — «Оценка эффективности науки о данных: 12 способов лгать с помощью статистики» (Benchmarking Data Science: 12 Ways to Lie With Statistics and Performance on Parallel Computers) Торстена Хефлера (Torsten Hoefler). Автор в юмористической манере обсуждает типичные ошибки при составлении отчетов о результатах исследования данных, приводящие к неверным выводам. Перечисляются 12 подобных ошибок, описываются меры по их предотвращению. Статья может быть полезным практическим руководством по поиску и исправлению недоработок при составлении и рецензировании отчетов.

Актуальность задачи воспроизводимости научно-технических исследований сегодня как никогда высока в свете падения доверия к результатам исследований, обусловленного в том числе растущим числом составленных с помощью средств искусственного интеллекта фейковых «докладов», которые успешно проходят процедуру рецензирования. В то же время меняются и сами процессы издания научных работ — растет число публикаций ознакомительных версий отчетов, которые еще не прошли рецензирование. К тому же все чаще выявляются работы, которые приходится отзывать в связи с обнаружением неверных результатов и выводов.

Александр Тыренко (shoorah@osp.ru) — независимый автор (Москва).