Задача внедрения в организации системы управления данными, как правило, рассматривается в трех аспектах:
- люди — создание команды управления данными, внедрение функционально-ролевой модели, института Владельцев данных, офицеров данных («дата-стюардов»), менеджеров качества данных;
- процессы — разработка методологии управления качеством данных, описания бизнес- и технических метаданных, внедрение ключевых показателей эффективности (КПЭ) и метрик оценки эффективности процессов и участников функционально-ролевой модели управления данными;
- технологии — внедрение бизнес-глоссария, каталога метаданных, инструментария построения карт потоков данных, инструментария контроля и мониторинга качества данных, проектирования моделей данных.
Как правило, инструментарий сбора технических метаданных, формирования карт потоков данных и управления качеством данных с точки зрения ценности для компании, а также парадигмы использования вопросов не вызывает. Однако глоссарий бизнес-терминов часто незаслуженно выпадает из фокуса внедрения и дальнейшего использования — не всегда в компании есть понимание, для чего нужен этот инструмент и как его использовать, следовательно, и ценность его не очевидна. Зачем нужен бизнес-глоссарий и для чего необходимо инвестировать в технологию его создания и поддержки?
С точки зрения классической теории Data Governance задача бизнес-глоссария состоит в обеспечении единого понимания основных понятий и терминов и снижении риска неправильного использования данных из-за неверного понимания связанных с бизнесом понятий и концепций. Основной функцией глоссария является создание общего понятийного аппарата и единой терминологии внутри компании. Но возникает вопрос, насколько часто унификация требуется именно на уровне понятий и терминов? Конечно, практически в каждой компании есть прикладные кейсы отсутствия единой терминологии, требующие решения, например, термин «Активный клиент». Во многих компаниях есть расхождения в понимании того, «кто это», и разные алгоритмы определения активности клиента в разных подразделениях: финансовом, подразделениях операционной поддержки, в бизнес-линиях. Встречаются компании, в которых используется более десятка определений активного клиента, применяемых разными подразделениями в управленческой и регуляторной отчетности. И, конечно, в таких случаях методологию определения активного клиента необходимо «выравнивать», и бизнес-глоссарий здесь будет очень уместен в качестве единой точки учета терминов и их определений, а также для их согласования внутри компании. Но в то же время стоит отметить, что такие ситуации случаются достаточно редко, так как в компании уровня зрелости «выше среднего» терминология уже практически полностью унифицирована на уровне методологии и процессов управленческой отчетности, регламентов операционной деятельности и других процессов. Поэтому внедрение, ведение и актуализация глоссария бизнес-терминов только для согласования описания и определения терминов внутри подразделений компании еще не являются достаточным обоснованием для инвестиций.
Дополнительную ценность приносит комплексное использование глоссария, не только для унификации определений бизнес-терминов, но и для учета конкретных объектов данных (сущностей, атрибутов) с указанием информационных систем (мастер-систем), в которых содержится достоверная информация об этих данных; требований к качеству данных, ведению реестра проверок качества данных и результатов их выполнения; связей объектов данных с техническими метаданными, и, конечно, для каждого бизнес-термина должны быть определены участники функционально-ролевой модели управления данными: владелец данных, архитектор данных, офицер данных и др.
Таким образом, стандартные функции глоссария:
- учет бизнес-терминов и объектов данных компании с поименованием определения термина и алгоритма расчета;
- формирование реестра требований к качеству данных и связей этих требований с бизнес-терминами и объектами данных;
- связь бизнес-термина с Владельцем данных, дата-стюардом и другими участниками функционально-ролевой модели управления данными;
- связь объектов данных с мастер-системой, физической моделью информационной системы, логической моделью, входными и выходными параметрами сервисов;
- связь бизнес-терминов и объектов данных с бизнес-процессами компании;
- учет реестра проверок качества данных и результатов их выполнения, связь проверок с бизнес-терминами, менеджерами качества данных, ИТ-системами;
- ведение реестра контрактов на поставку данных.
Для обеспечения такого широкого функционала в глоссарии необходимо иметь довольно существенный объем сведений о данных: бизнес-термины; домены данных, сущности и атрибуты, в том числе реестр витрин данных и отчетов, реестр справочников; перечень информационных систем организации и их интерфейсов, а также логические и физические модели данных информационных систем; организационно-штатная структура, список сотрудников, а также иные функциональные иерархии сотрудников, такие как команды развития продукта (трайбы, стримы); проекты, в рамках которых изменяются данные компании; бизнес-процессы, нормативные документы; требования к качеству данных, реестр проверок качества данных, а также результаты этих проверок; КПЭ и метрики эффективности сотрудников и процессов.
Естественно, нет необходимости и, более того, неправильно вести непосредственно в бизнес-глоссарии учет всех перечисленных данных, таких как, например, организационно-штатная структура и список сотрудников, но, однозначно, глоссарий должен быть интегрирован с соответствующими мастер-системами и позволять устанавливать необходимые связи.
Для обеспечения комплексного использования глоссария необходимо выстроить правильный процесс создания и потребления сведений о данных на разных этапах процесса производства таким образом, чтобы обеспечить связь бизнес-терминов, формируемых уже на этапах создания бизнес-сервисов и продуктов и однозначно понимаемых бизнес-пользователями, с терминологией, используемой ИТ-подразделениями при описании функциональных требований, проектировании архитектуры, моделей данных, API- и ETL-потоков. Приняв концепцию, что именно глоссарий является единым репозиторием бизнес-метаданных, можно выстроить процесс повторного использования сущностей и атрибутов глоссария, имеющих понятные описания и назначенных владельцев данных, в ИТ-процессах.
Таким образом формируется полная картина: есть бизнес-термин «ИНН физического лица», есть его описание, понятен бизнес-процесс, где появляются данные, назначен их владелец. Кроме этого определена мастер-система, понятны API для получения данных при проектировании нового сервиса, есть знание, где найти ИНН в платформе данных вплоть до поля в конкретной таблице базы данных. Данный процесс также предполагает автоматическое заполнение артефактов, таких как функциональные требования и архитектура данных, из бизнес-глоссария. Бизнес-глоссарий при таком подходе активно используется на каждом шаге производства программного обеспечения (см. рис.).
Использование бизнес-глоссария в процессе производства ПО |
Глоссарий может стать в компании единым окном в мир данных, когда сотрудник, зная только название показателя, который ему необходим, может найти определение и описание методики расчета показателя, ссылки на нормативную документацию, ответственных за методологию расчета, витрину в платформе данных, где, возможно, этот показатель уже существует, информационную систему — поставщика исходных данных и многое другое. Глоссарий в полном объеме должен обеспечивать функционал поиска данных в ИТ-ландшафте компании и ответы на такие вопросы, как: «в какой витрине в платформе данных/таблице/поле таблицы найти нужный показатель отчетности», «с какой информационной системой необходимо интегрироваться, чтобы получить актуальные и унифицированные данные о клиенте», «кто отвечает в компании за ИНН клиента, какие требования к качеству данных существуют и как они контролируется, какой текущий уровень качества данных».
Кроме этого глоссарий должен стать инструментом контура контроля по мониторингу эффективности процессов управления данными: обеспечения полноты, актуальности описания данных компании; мониторинга качества данных; оценки влияния качества данных на эффективность бизнес-процессов и понимания материальности влияния данных на эти процессы, в том числе включения показателей качества данных в систему управления операционным риском.
***
Необходимость совершенствования процессов, направленных на повышение эффективности сбора, обработки, хранения и использования данных как ценного актива сейчас очевидна для большинства компаний. Однако любые инвестиции требуют грамотного и детального экономического обоснования и взвешенного подхода к реализации соответствующих инициатив [1]. В полной мере это утверждение относится и к бизнес-глоссарию. Применение описанных подходов позволит организации получить максимальную ценность от внедрения и использования этого инструмента.
Литература
1. Светлана Бова, Алексей Наталенко. Как обосновать инвестиции в качество данных // Открытые системы.СУБД. — 2023. — № 2. — С. 35–37. URL: https://www.osp.ru/os/2023/02/13057147 (дата обращения: 31.12.2024).
Светлана Бова (bova@vtb.ru) — директор по данным, управляющий директор департамента ИТ-архитектуры, вице-президент; Алексей Наталенко (natalenko@vtb.ru) — директор по управлению проектами департамента ИТ-архитектуры, банк ВТБ (Москва).