Как и во всем мире, в Казахстане остро не хватает специалистов в области работы с данными, поэтому «Альфа-Банк Казахстан» инициировал программу Alfa Data School, направленную как на подготовку специалистов для своих подразделений, так и на развитие рынка квалифицированных кадров в стране в целом. Максат Нуриденулы, управляющий директор и Chief Data&Operating Officer «Альфа-Банка Казахстан», рассказывает, почему такая школа важна для выработки и реализации стратегии управления данными и какое влияние она оказывает на культуру работы с данными, способствуя формированию в стране отрасли данных.

— Как возникла идея создания Alfa Data School?

В 2017–2018 годах в «Альфа-Банке» шло формирование блока по управлению данными: создавалась соответствующая инфраструктура для работы с данными, была построена архитектура данных банка, централизованы коммуникации и процессы управления данными. Нам пришлось сразу же столкнуться с проблемой острой нехватки исследователей данных (data scientists) и инженеров данных (data engineers), а уже имеющихся сотрудников, в обучение и развитие которых мы инвестировали, перекупали другие национальные корпорации. Сегодня специалисты по данным нужны всем: и квазигосударственному сектору, и частным компаниям Казахстана. По примерным оценкам, в стране не хватает минимум тысячи топ-менеджеров и около 10 тыс. специалистов по работе с данными. В результате в январе 2019 года родилась идея создания собственной школы для подготовки сотрудников, обладающих нужными компетенциями. Вскоре была предложена и утверждена концепция, а в апреле 2019 года открылась Alfa Data School.

Для запуска школы потребовались минимальные инвестиции, поскольку уже была готова инфраструктура для работы с данными, подготовлены теоретические и практические учебные материалы. Нашу инициативу поддержали несколько партнеров — международных ИТ-вендоров, заинтересованных в получении специалистов для себя.

О наборе слушателей было объявлено в конце марта 2019 года, причем лишь по двум каналам: на сайте банка и через внутренние коммуникации «Альфа-Банка Казахстан». Тем не менее за первую неделю мы получили более 500 заявок, а всего на стартовый поток их было подано 652. Обучение запускалось по трем направлениям: аналитики, исследователи данных и инженеры данных. На каждом направлении формировалась одна группа из 10 человек, а кандидаты проходили отбор с помощью тестирования и собеседований.

— Что собой представляют эти три направления?

Первое направление — введение в анализ данных — предназначено для тех, кто хочет поближе познакомиться с анализом данных и уже имеет базовые знания в этой области. Обычно это руководители отделов, начальники управлений, а также начинающие аналитики. В ходе учебы слушатели изучают основы статистики, методы реализации аналитических проектов, а также знакомятся с языком программирования R, в котором, благодаря отличным библиотекам, относительно просто реализована работа с данными и математическими вычислениями. Кроме того, на языке R сегодня реализуется до 90% всех задач аналитики.

В рамках этого направления слушатели получают как теоретические, так и практические знания. Теоретическая часть предусматривает знакомство с основами статистики, необходимыми для дальнейшей работы. К ним относятся меры центральной тенденции, понятие корреляции, виды переменных и особенности их анализа, меры изменчивости и многое другое. Глубокого погружения в теорию не предполагается — студентам даются базовые понятия. Важным компонентом обучения является понимание метрик анализа данных. Студенты учатся правильно оценивать работу аналитиков. Особенностью курса является то, что теория подкрепляется реальными практическими кейсами из бизнеса.

Студенты применяют полученные знания, работая с реальным инструментом — R Studio. Используя язык R, они знакомятся с базовыми формулами на языке программирования и основными библиотеками для преобразования и визуализации данных. При этом обучающиеся анализируют реальные данные и пытаются решать актуальные задачи бизнеса.

В завершение обучения по этому направлению студенты выполняют реальные проекты по анализу той или иной ситуации с выработкой рекомендаций, которые затем передаются бизнесу.

Курс обучения для исследователей данных ориентирован на специалистов, уже имеющих опыт анализа данных, но не обладающих достаточной фундаментальной подготовкой. Студенты изучают теорию и практику алгоритмов машинного обучения с учителем, разбирают методы решения вопросов, связанных с задачами регрессии и классификации: проблемы переобучения модели, ограничения параметрических подходов, проблемы пустых значений. Здесь разбираются L1- и L2-регуляризация — ядерная регрессия, бустинг и шкалирование, а на лекциях слушателям рассказывают об основных проблемах построения моделей машинного обучения. Студентов учат работать с «грязными» данными, очистка которых обычно становится основной проблемой при проведении анализа.

Практический инструмент этого направления — язык программирования Python, на котором студенты выполняют свою финальную работу. По итогам обучения слушатели выполняют проект, схожий с типичными задачами аналитиков «Альфа-Банка». Хорошим результатом считается правильно обученная модель — с корректно настроенными параметрами, показывающая приемлемые результаты как на тестовых, так и на целевых выборках.

Инженерам данных требуется разбираться в работе хранилищ данных и витрин данных, с которыми работают аналитики. Основной язык здесь — SQL, его знание обязательно для любого сотрудника, работающего с данными.

Кроме того, изучаются инструменты ETL (Extract, Transport, Load) — извлечения, преобразования и загрузки данных. Студентов знакомят с основными принципами работы с источниками и реляционными базами данных. Попутно мы знакомим слушателей с языком управления данными (Data Manipulation Language, DML) и языком описания данных (Data Definition Language, DDL). Начав с команды SELECT, в конце обучения студенты уже свободно пользуются аналитическими функциями, пишут сложные запросы, создают и модифицируют сложные таблицы.

Итоговой работой становится проект построения витрины на тестовых данных банка. Для его выполнения студентам приходится использовать все полученные знания, поскольку данных действительно много и нужно обладать хорошей подготовкой, чтобы справиться с задачей.

— Как в школе организовано обучение?

Учебные программы по каждому из трех направлений длятся три месяца. Материалы курсов мы готовили совместно с партнерами: DIS Group, SAP, IBM и Prime Source. Эти компании помогали нам в организации практических занятий. Наши студенты работают с реальными маскированными данными банка, а преподавателями являются сотрудники банка и компаний-партнеров, прекрасно ориентирующиеся в этих массивах.

К концу 2019 года в Alfa Data School прошло три потока обучения: было подготовлено 90 человек по трем специальностям, часть из них мы взяли на работу в «Альфа-Банк». При этом новые сотрудники пришли не только в блок по управлению данными и операционной деятельностью, но и в другие подразделения: ИТ-департамент, блок рисков, блок массового бизнеса. Опыт обучения первого потока показал, что нужно создать еще один курс — «Углубленный Excel», и по этой дополнительной программе мы уже обучили около ста человек.

Максат Нуриденулы: «Подготовка кадров для банка — ключевая задача Alfa Data School, но кроме того, школа помогает формировать в Казахстане отрасль работы с данными»

— Каковы итоги первого неполного года работы школы?

Наша гипотеза подтвердилась: школа Alfa Data School востребована и обеспечивает банку собственный кадровый резерв. Инвестируя в обучение, мы тратим в разы меньше, чем заплатили бы за готовых специалистов, которых к тому же очень трудно найти на рынке. Недавно мы презентовали Alfa Data School на уровне всего холдинга «Альфа Груп» и получили положительные отзывы. Многие банки группы заинтересованы в том, чтобы запустить у себя аналогичный проект. В конце 2019 года мы провели первую в истории холдинга внутреннюю конференцию Alfa Data, посвященную управлению данными, на которой во всех деталях рассказали о школе.

Школа Alfa Data School открыта для всех желающих, а не только для сотрудников «Альфа-Банка». Обучение в ней бесплатное.

— Образовательная программа требует серьезного подхода к содержанию, методикам обучения и подбору преподавателей. Как это происходило у вас?

Чтобы направить работу школы в правильное русло, мы привлекли коллег из HR-подразделения. Будущие преподаватели — сотрудники банка — прошли в нашем обучающем центре специальные курсы. Мы совместно разрабатывали программы подготовки, советовались с партнерами, каким образом лучше выстроить учебный процесс, изучали зарубежный опыт аналогичных проектов.

В таком проекте важен комплексный научный подход, что в полной мере будет воплощено в Alfa Data School 2.0, которую мы собираемся запустить в течение 2020 года. Кроме того, планируется заключить соглашения о долгосрочном сотрудничестве с рядом казахстанских, европейских и североамериканских университетов, что обеспечит научный фундамент нашим учебным программам.

— Как вы выбираете слушателей?

Для начала абитуриенты Alfa Data School проходят тестирование. Кандидаты на обучение по программам исследования данных и подготовки инженеров данных выполняют сложные тесты: программа по анализу данных предполагает владение базовыми знаниями. Прошедших тестирование кандидатов приглашают на собеседование, цель которого — понять, есть ли у человека желание развивать свою карьеру в банке после завершения обучения в школе и понимание того, каким образом он сможет это сделать.

— Если выпускник не остается работать в банке, какой «вес» имеет его диплом?

Выпускники получают документы разных категорий. Обязательной частью курса является выполнение итогового проекта. Если курс пройден и проект сдан, студент получает диплом об успешном окончании школы и мы предлагаем ему работу в банке. Если курс пройден, но итоговый проект сделан не лучшим образом, то учащемуся будет выдан диплом о прохождении курса. А если студенту вообще не удалось сдать итоговый проект, он получает документ о том, что прослушал курс.

Мы рассчитываем на то, что сотрудничество с вузами даст нам возможность включить диплом Alfa Data School в государственный реестр документов об образовании. Кроме того, в рамках концепции Alfa Data School 2.0 планируется создать собственный информационный ресурс, где можно будет проверить оригинальность диплома и получить сведения о выпускнике.

— Как проект Alfa Data School связан со стратегией банка в области работы с данными?

Стратегия управления данными интегрирована в общую стратегию «Альфа-Банка» и проходит красной нитью через все бизнес-инициативы по всем сегментам работы банка. Одно из направлений стратегии управления данными — это люди, развитие их компетенций. И в рамках этого направления школе Alfa Data School принадлежит ключевая роль. Кроме того, мы хотим использовать Alfa Data School как R&D-лабораторию — площадку для различных экспериментов и пилотирования самых смелых идей.

В блоке под моим руководством объединены два направления: управление данными и операционная деятельность. Для трансформации бизнеса это идеальная смычка. Статистика показывает, что цифровая трансформация банка на 60% эффективнее, если начинать ее с бэк-офиса, а не фронт-офиса. Имея в своем распоряжении данные не только по клиентам банка, но и по бизнес-процессам, я могу эффективнее решить задачу успешной трансформации операционного блока.

— Какие здесь достигнуты результаты?

Большую часть своей 25-летней истории работы в Казахстане банк концентрировался на корпоративном и среднем бизнесе. Но около трех лет назад стратегия изменилась: мы пошли в малый и розничный бизнес, стали работать с компаниями, которые занимаются внешнеэкономической деятельностью. Новый курс заставил банк начать оптимизацию и цифровизацию, чтобы быть готовым к масштабированию бизнеса, а это требует понимания всех процессов. На текущий момент главная цель — полная автоматизация операционных процессов. Ежегодно объем транзакций, которые совершаются без участия сотрудников банка, возрастает на 10%.

— Есть ли в банке своя культура data-driven?

Наша стратегия по управлению данными так и называется — «создание data-driven-организации». Любые управленческие решения, определяющие, в каком направлении развиваться, что оптимизировать и цифровизировать, должны приниматься на основе статистики и данных. Идея создания блока по управлению данными принадлежит СЕО банка, который является «амбассадором» этого направления.

— Знаниями в области работы с данными должны обладать не только специалисты вашего департамента, но и сотрудники всех подразделений банка?

Верно. В банке принята agile-культура работы над продуктами, и мы ставим условие, чтобы каждый владелец продукта («мини-СЕО») имел как минимум базовые знания в области аналитики и управления данными. Для этого он должен пройти обучение в Alfa Data School.

— Какую роль играет проект Alfa Data School в реализации стратегических целей банка и как планируется его развивать?

Во-первых, банк получает кадровый резерв специалистов по работе с данными в условиях их острого дефицита на рынке. Во-вторых, благодаря этой программе мы в целом влияем на развитие отрасли и формирование профессий будущего. Есть и другой важный эффект: Alfa Data School создает банку хорошую репутацию на рынке, позволяет сформировать HR-бренд, узнаваемый как в Казахстане, так и за пределами страны.

В версии Alfa Data School 2.0 будет расширен перечень курсов, появится возможность онлайн-обучения. Но обязательно сохранится и традиционный формат. Обучение будет смешанным, потому что студенты должны делать проекты на реальных данных — чтобы результаты этих проектов могли применяться в бизнесе. Кроме того, мы хотим увеличить число партнеров, участвующих в проекте. У ряда крупных международных компаний есть желание присоединиться. Например, поступили предложения от телекоммуникационных корпораций об участии в организации школы.

Наталья Дубова (dubova@osp.ru) — научный редактор, «Открытые системы.СУБД» (Москва).