Еще несколько лет назад упоминание о студенте, изучающем программирование и анализ данных в Высшей школе экономики, могло вызвать у собеседника недоумение. Тем не менее факультет компьютерных наук НИУ ВШЭ, созданный в 2014 году при участии компании «Яндекс», уже завоевал хорошую репутацию и пользуется популярностью среди абитуриентов — из года в год практически все бюджетные места на первом курсе бакалавриата занимают победители олимпиад по математике и информатике, несмотря на ежегодное ужесточение условий предоставления таких льгот.

Учебные программы факультета формировались с учетом опыта Стэнфордcкого университета и Федеральной политехнической школы Лозанны (EPFL, Швейцария), а также Школы анализа данных «Яндекса».

Доктор физико-математических наук, декан ФКН НИУ ВШЭ Иван Аржанцев рассказал о том, какие козыри имеются у молодого факультета перед «патриархами» академического образования в области computer science, чему и как учат на ФКН и где ждут его выпускников.

 

— До появления факультета компьютерных наук в Вышке был факультет бизнес-информатики с отделениями программной инженерии и прикладной математики и информатики. Но пришла компания «Яндекс» и создала ФКН. Зачем?

Я в тот момент работал руководителем академических программ «Яндекса», заведовал базовой кафедрой компании на отделении прикладной математики и информатики и участвовал в выработке концепции нового факультета. Основная задача, актуальная тогда и сохраняющая актуальность сейчас, — расширение сообщества computer science в России. Сам я чистый математик, занимаюсь алгеброй. Московская математическая школа — одна из ведущих в мире, и математическое сообщество здесь достаточно велико. И хотя математика и компьютерные науки тесно связаны, сообщество computer science не совсем то же самое, что сообщество математиков. Специалистов в области компьютерных наук очень не хватает. Став соорганизатором нового факультета, «Яндекс» решает задачу подготовки кадров как для индустрии, так и для научной работы и расширения сообщества в целом.

В основу ФКН легли три компонента: два отделения факультета бизнес-информатики — прикладной математики и информатики (ПМИ) и программной инженерии (ПИ), а также базовая кафедра «Яндекса», на основе которой был создан департамент больших данных и информационного поиска.

 

Иван Аржанцев: «Основной принцип формирования программ ФКН — это соблюдение баланса. Программы ориентированы на практику, но при этом важно, чтобы студенты получали фундаментальную подготовку»

— На каких принципах строятся учебные программы ФКН?

Основной принцип — это соблюдение баланса. Программы ориентированы на практику. Мы разрабатываем их в содружестве не только с «Яндексом», но и с другими партнерами. Только что открылась базовая кафедра компании SAS, есть три базовые кафедры институтов РАН, в феврале открылась лаборатория Samsung, реализуются совместные магистерские программы со Сколтехом и Сбербанком. Но при этом очень важно, чтобы студенты получали фундаментальную подготовку. Мы должны обеспечивать элитный уровень знаний в области математики и информатики.

Вначале на факультете были две бакалаврские программы, унаследованные от отделений факультета бизнес-информатики. Программа ПМИ была полностью реорганизована, и в 2014 году запущена принципиально новая программа по прикладной математике и информатике, в создании которой активно участвовали коллеги из «Яндекса». В этом году мы выпустили первых бакалавров, поступавших на новую программу.

Бакалаврская программа ПИ не подвергалась жесткой реструктуризации и развивается эволюционно. Кстати, только что первой в России она получила аккредитацию американской инженерной ассоциации ABET.

Что касается магистерских программ, то на момент открытия факультета их было две: программа «Науки о данных», обновленная незадолго до создания факультета, и англоязычная программа «Системная и программная инженерия». Поэтому мы не пошли по пути реорганизации существующих магистерских программ, а начали открывать новые. Сейчас их шесть. Помимо уже названных, это программа «Анализ данных в биологии и медицине», совместная со Сколтехом программа «Статистическая теория обучения», совместная с ИСП РАН программа «Системное программирование» и совместная со Сбербанком программа «Финансовые технологии и анализ данных».

 

— Область, в которой работают ваши выпускники, весьма динамична. Насколько удается соответствовать этой динамике в программах факультета?

В любой системе образования должен быть некий костяк. Есть образовательный стандарт. ВШЭ получила право на собственные стандарты, поэтому мы достаточно свободны в их изменении, но подходим к этому очень осторожно. Как бы ни менялись компьютерные науки, в программу первого курса должны обязательно входить курсы математического анализа, линейной алгебры, дискретной математики. Необходимо учить студентов языкам программирования, хотя выбор, каким именно, неизбежно меняется со временем.

Но на старших курсах бакалавриата студенты расходятся по специализациям, список и содержание которых действительно постоянно меняются.

Как это происходит? Обратная связь идет со всех сторон. Мы много общаемся с партнерами из индустрии, и они обращают наше внимание на то, каких направлений обучения нам не хватает. И мы включаем актуальное направление в учебный план, если удается найти сильный преподавательский коллектив для его реализации. Например, компания Postgres Professional сейчас помогает нам с организацией современных курсов по базам данных.

С предложениями по обновлению курсов приходят преподаватели. Также мы активно собираем обратную связь от студентов. В Вышке это очень хорошо развито: регулярно проводится студенческая оценка преподавателей, два раза в год у меня в кабинете проходят встречи со студентами. Например, после их настойчивых просьб курс дискретной математики на бакалаврской программе ПМИ, который читался только на первом году обучения, был расширен и на второй год. Или другой пример. При разработке новой программы в 2014 году мы заявили в ней специализацию по распределенным системам, но через два года, когда подошел срок ее запуска, поняли, что пока не готовы ее реализовать, и решили перенести старт этой специализации на год. Однако студенты пришли ко мне с самыми решительными требованиями выполнить наши обещания и дать им возможность выбрать специализацию по распределенным системам. Мы в короткие сроки нашли для нее руководителя, и сейчас это одна из двух наиболее популярных специализаций наряду с машинным обучением.

 

— Каково соотношение практиков и академических преподавателей на факультете?

Преподаватели математических курсов, как правило, высококвалифицированные математики, ведущие научную работу. Среди преподавателей по предметам из области компьютерных наук и программирования большинство, наряду с исследованиями, занимаются той или иной прикладной деятельностью. Это не обязательно работа в компании, у ВШЭ есть много своих проектов в сотрудничестве с индустрией. Кроме того, более 40 сотрудников «Яндекса» работают на факультете как совместители. Для преподавания языков, например Python или С++, привлекаются молодые специалисты «с передовой», способные рассказать, как все это работает в конкретных ИТ-компаниях. Привлечение к преподаванию совместителей, работающих на постоянной основе в индустрии и в академических институтах, — один из основополагающих принципов факультета.

 

— Правильно ли будет сказать, что основной профиль выпускников учебных программ, которые сложились на базе отделения прикладной математики и информатики, — это исследователи данных (data sсience)? Где востребованы их знания и компетенции?

Совершенно верно. Для наших выпускников существует несколько возможных профессиональных траекторий. Одна из них — академическая: исследовательская работа в научных центрах, преподавание в университетах. Есть острая нехватка преподавателей по машинному обучению, и мы очень надеемся, что студенты, закончившие факультет, восполнят этот пробел. При создании ФКН мы рассчитывали, что по академическому треку пойдут 10–15% наших выпускников, но пока, к сожалению, их меньше. Повышать престиж академической профессии — одна из важнейших задач, стоящих перед факультетом.

Вторая карьерная траектория — работа на позиции data scientist в ИТ-компании: анализ данных в крупных корпорациях или небольших стартапах, специализирующихся на ИТ. И третий путь — data science в компаниях других отраслей: в телекоммуникациях, в финансах и банках, в страховом секторе, ретейле.

 

— Существует мнение, что в индустрии среднестатистическому исследователю данных необходим очень небольшой процент тех знаний, которые даются в магистратуре ФКН, и простая бизнес-аналитика все еще востребована гораздо больше, чем машинное обучение. Согласны ли вы с такой оценкой?

Бизнес-аналитика действительно очень востребована, но я бы не называл это более низким уровнем. Скорее, это другое направление анализа, в котором тоже много трудных и содержательных задач. В ответ на потребность в таких специалистах мы в этом году открыли третью бакалаврскую программу «Прикладной анализ данных». Эта англоязычная программа, дающая право на получение двух дипломов, реализуется в партнерстве с Лондонским университетом. Совместная со Сбербанком магистерская программа «Финансовые технологии и анализ данных» также ориентирована в определенной степени на бизнес-аналитику.

Теперь к вопросу об избыточности квалификаций, которые получают наши выпускники. Сегодня требуется гораздо больше ИТ-специалистов, чем в состоянии выпустить все наши университеты, но при этом определенная часть вакансий действительно не требует очень высокого уровня подготовки. Видимо, нужны колледжи, которые будут массово готовить таких специалистов. Но это не наша задача. Факультет ориентирован на подготовку элитных специалистов, которые не просто владеют современными технологиями, но и готовы к разработке новых. Факультет немаленький, в этом году на первый курс бакалавриата принято более 500 абитуриентов и 220 — в магистратуру. Но, по нашим наблюдениям, выпускники такого высокого уровня, как наши, без проблем находят работу по специальности и в российских, и в зарубежных компаниях, рынок не насыщен. Так что специалистам, закончившим факультет, не придется работать над примитивными задачами.

 

— Система бакалавр-магистр, поначалу вызывавшая большой скепсис, прижилась в российском образовании, а рынок стал принимать бакалавров. Как реализуют себя выпускники бакалавриата ФКН?

ВШЭ отличается от других университетов тем, что мы систему бакалавр-магистр принимаем как есть. Ее основная идея была в том, чтобы добавить гибкости: поступив на одну бакалаврскую программу, в магистратуре студенты могут перейти на более специализированную — по тому же направлению, что и бакалавриат, близкому к нему или совсем другому, то есть корректировать свою образовательную траекторию. В Вышке это активно реализуется. Если в большинстве университетов студенты магистратуры — это выпускники бакалавриата той же специальности и потому магистратуру часто называют «5–6-й курс», то у нас такого нет. Более половины поступающих в магистратуру факультета — выпускники бакалавриата других университетов, а наши студенты идут в магистратуру в другие вузы, например в Сколтех. Кроме того, происходит межфакультетский обмен внутри Вышки: на наши магистерские программы поступают выпускники факультета экономических наук, факультета математики, а часть наших выпускников уходят, например, на программы по образованию или финансам.

Мы стараемся отслеживать, какой процент выпускников бакалавриата поступает в магистратуру. В 2018 году более 40% продолжили обучение в магистратуре Вышки и других российских университетов, часть выпускников уехала за границу. Причем после нашего бакалавриата в зарубежных университетах можно поступать сразу в аспирантуру.

 

— Как организована научная жизнь на факультете, какие области компьютерных наук вы развиваете?

У нас стремительно растет количество научных лабораторий, их уже восемь, и их названия отражают те направления сomputer science, по которым мы ведем научную работу. Несколько лабораторий связаны с тематикой анализа данных и машинного обучения. Есть группа байесовских методов, которая сейчас создала совместную лабораторию с компанией Samsung по искусственному интеллекту. Есть лаборатория процессно-ориентированных информационных систем (processs mining), ее специалисты занимаются анализом данных, ориентированным на процессы. Процесс анализируется по тем следам, которые он оставляет в информационной системе, и предлагаются его улучшения.

Важное для нас направление — биоинформатика. В этом году был первый выпуск магистерской программы под руководством Михаила Гельфанда, открыта научно-учебная лаборатория, и мы надеемся, что скоро сможем открыть специализацию по биоинформатике и в бакалавриате.

По направлению системной и программной инженерии совместно с ИСП РАН реализуется магистерская программа по системному программированию, которую можно позиционировать как программу для самых «суровых» программистов. Это разработка операционных систем, верификация программ, компиляторы — сложные темы, требующие полного погружения.

С факультетом сотрудничает Юрий Нестеров, один из мировых лидеров в области оптимизации, входящей в число приоритетных для нас направлений. Имеется очень сильная группа по теоретической информатике — это наиболее «математизированная» часть научной работы факультета.

Активно формируем направление обучения и исследований по финансовым технологиям и, в частности, блокчейну. Такие курсы реализуются в рамках совместного проекта со Сбербанком, на отделении программной инженерии и на программах дополнительной профессиональной подготовки в Центре непрерывного образования ФКН.

 

— Вы активно сотрудничаете с ИТ-индустрией. Планируете ли привлекать компании из других отраслей, где все более востребованы компетенции data science? Например, из промышленности?

Основные отрасли, с которыми мы имеем и налаживаем сотрудничество, — это телекомммуникации, финансовый и страховой сектор. Проявляют интерес представители ретейла. Что касается взаимодействия с промышленностью, то, боюсь, это будет непросто, потому что заказчики с таких предприятий не всегда готовы четко сформулировать задачи, которые хотели бы решать с нашей помощью. Но у нас есть первый успешный опыт — реализовано несколько проектов по заказу компании Schlumberger.

 

— У ФКН такие сильные конкуренты, как СПбГУ, Физтех, мехмат и ВМК МГУ, ИТМО. Какие у молодого факультета козыри перед этими заслуженными вузами?

В этом году значительно выросло количество победителей и призеров Всероссийской олимпиады школьников по информатике, математике и физике, которые выбрали наш факультет. Если в прошлом-позапрошлом годах их было 18–20, то в этом — 39. Самый высокий показатель среди факультетов нашего профиля в стране. Это очень сильные, мотивированные абитуриенты, и их выбор демонстрирует, что мы действительно завоевали прочные позиции.

Если сравнивать, например, с Физтехом, то наша конкуренция максимально дружественная — у нас постоянные контакты c коллегами, нас объединяет компания «Яндекс», которая работает с обоими университетами. Но есть принципиальные отличия. Например, в Вышке жестко ограничено количество одновременно читаемых учебных курсов. Если на Физтехе бывает шесть-семь пар в день, то у нас это официально запрещено, студентам может читаться одновременно не более пяти курсов. Акцент делается на самостоятельной и проектной работе.

У нас проводится проектный семинар, на который мы приглашаем менторов от индустрии для реализации проекта. Список компаний, участвующих в таких семинарах, обширный, среди них есть и небольшие стартапы. Под руководством ментора группа студентов выполняет проектные работы по тематике компании, но делает это на факультете и в конце учебного года защищает проект.

Вышка привлекает к работе специалистов на открытом международном рынке, и хотя это уже не является уникальным преимуществом университета, я считаю это дополнительным плюсом обучения на ФКН.

 

— Можете назвать другие примеры международного сотрудничества?

Мы ведем совместные исследования. В Вышке есть формат международной лаборатории, руководит которой всегда специалист мирового класса. Например, нашу международную лабораторию стохастических алгоритмов и анализа многомерных данных возглавляет профессор Эрик Мюлине из парижской Ecole Polytechnique, действительный член Академии наук Франции. В сентябре лаборатория провела международную конференцию по многомерной статистике — большое событие в научной жизни факультета.

Весной ВШЭ официально вошла в состав коллаборации одного из четырех больших экспериментов в ЦЕРН — LHCB. Работа ведется на базе нашей лаборатории LAMBDA, там занимаются анализом данных на этом эксперименте. Мы также организуем международную олимпиаду по анализу данных IDAO.

Кроме того, зарубежные партнеры заинтересованы в совместных учебных программах (на факультете реализуются несколько программ двойных дипломов) и в обменах на уровне бакалавриата, магистратуры и аспирантуры. Интерес к факультету очень большой, инициатив и предложений множество.

 

«Три кита» ФКН

Факультет компьютерных наук НИУ ВШЭ включает в себя три департамента.

Департамент анализа данных и искусственного интеллекта создан в 2014 году на основе одноименной кафедры, существовавшей с 2006 года. Среди направлений обучения и научной деятельности департамента: анализ и майнинг данных, семантические технологии, машинное обучение, автоматическая обработка текста, анализ социальных сетей, медицинская информатика. Руководитель — профессор Сергей Кузнецов.

Департамент больших данных и информационного поиска объединяет научные группы, ведущие исследования в области машинного и глубинного обучения, комбинаторной и выпуклой оптимизации, теоретической информатики, распределенных вычислений и биоинформатики. В состав департамента входят базовая кафедра компании «Яндекс», Международная лаборатория теоретической информатики, Центр глубинного обучения и байесовских методов, Лаборатория компании Samsung. Руководитель — доцент Владимир Подольский.

Департамент программной инженерии создан в 2014 году на базе отделения программной инженерии, существующего с 2006 года. Научные и учебные направления департамента включают в себя архитектуру программных систем, системное программирование, анализ и моделирование бизнес-процессов, технологии блокчейна, параллельное программирование, компьютерную графику и нейроинформатику. Руководитель — профессор Сергей Авдошин.

Более 1,5 тыс. студентов ФКН учатся на трех бакалаврских и шести магистерских программах. В состав факультета входят пять базовых кафедр, один научный центр и восемь научных лабораторий.

 

— В Вышке есть межфакультетская программа Data Culture. Какая роль отведена ФКН в ее реализации и что от этой программы получают студенты ФКН?

Программа реализуется преимущественно нашим факультетом совместно с преподавателями МИЭМ, Школы лингвистики и Школы бизнес-информатики. Ее идея, заключается в том, что теперь все студенты, независимо от того, на какую образовательную программу они поступили, изучают анализ данных — его основы или более продвинутые профессиональные курсы по этой теме. Студенты ФКН напрямую в программе не участвуют, анализ данных — наша специальность, и с учетом программы Data Culture наши учебные планы не корректировались. Но для нас здесь возникает существенная косвенная польза. Например, расширился пул преподавателей, которых мы можем задействовать на наших основных программах. К проекту Data Culture удается привлекать интересных специалистов, которые готовы читать курсы по анализу данных для разных специальностей — историков, дизайнеров, экономистов.

Появился еще один отличный повод взаимодействовать с большим количеством профессиональных сообществ. В рамках Data Culture возникают совместные инициативы с другими факультетами — семинары, прикладные проекты по смежным темам, которые реализуются с опорой на компьютерные науки. Это расширяет возможности межфакультетского сотрудничества.

Сейчас в Вышке стартовал второй проект, в котором по той же схеме будет реализована идея предпринимательства. Во все образовательные программы будут интегрированы компоненты, связанные с предпринимательской деятельностью. В этой программе ФКН уже не будет «донором»: мы намерены включать в наши программы дополнительные курсы и учить предпринимательству наших студентов.

 

— Современные студенты активно используют различные формы онлайн-образования. Поддерживается ли это на ФКН?

Высшая школа экономики входит в число университетов-лидеров по числу курсов на платформе Coursera, и они пользуются большой популярностью. Наш факультет активно участвует в разработке онлайн-курсов.

В феврале 2016 года мы запустили англоязычную специализацию Data Structure and Algorithm сoвместно c Калифорнийским университетом в Сан-Диего. В октябре 2017-го стартовали еще две специализации: Introduction to Discrete Mathematics for Computer Science (совместно с этим же университетом, в партнерстве с «Яндексом») и Advanced Machine Learning (в партнерстве с «Яндексом»). Каждая специализация — это связка из нескольких курсов и практико-ориентированный итоговый проект, основанный на знаниях, которые слушатели получают на всех курсах специализации. К такому проекту допускаются только те, кто успешно освоил эти курсы.

Помимо, крупных форм на Coursera, активны наши вводные курсы по основам программирования на Python и машинному обучению, а также курсы по формальному анализу понятий и по проектированию взаимодействия с мобильными устройствами.

Онлайн-компоненты включены в учебные планы наших основных образовательных программ. К курсам, разработанным при нашем участии, студенты факультета получают полный доступ по мотивационному письму.

 

— Судя по результатам приемной кампании, из года в год даже очень сильный абитуриент, который не участвовал в олимпиадах, практически лишен шанса поступить в бакалавриат ПМИ. Ваше отношение к этому? Не много ли льгот по олимпиадам?

Такая проблема действительно есть, и мы ежегодно ищем ее решение. В 2014 году при создании факультета мы установили те же правила приема по олимпиадам, которые были на старой программе ПМИ. Тогда на 100 бюджетных мест было подано 230 заявлений от абитуриентов, которые имели право поступить без экзаменов. В последующие годы мы регулярно поднимали планку по олимпиадам, но каждый год случается перебор, в том числе в этом году, когда условия льготного приема на ПМИ резко ужесточились. Это демонстрирует рост интереса сильных абитуриентов к нашему факультету.

Наталья Дубова (dubova@osp.ru) — научный редактор, «Открытые системы. СУБД» (Москва).