Цифровые партнерские системы сегодня растут, как грибы после дождя. И если непременным условием появления и развития грибов являются осадки, то для цифровых экосистем обязательным условием их роста и «симбиоза» с другими организациями становятся данные — совместно используемые, взаимно полезные, качественные. Гарантированно получить их можно, только если выстроить достаточно зрелые процессы управления данными, причем не на уровне отдельных партнеров и контрагентов, а в рамках всей цифровой экосистемы.

О главных отличиях управления данными в цифровых экосистемах от управления данными на отдельных предприятиях, а также о необходимых для этого технологических изменениях мы попросили рассказать экспертов, принявших участие в девятом по счету форуме «Управление данными 2024» — единственном в России ежегодном мероприятии такого уровня, посвященном стратегическим аспектам организации работы с данными и бизнес-управления, основанного на данных.

Главные особенности управления данными в цифровых партнерских экосистемах

Как подчеркивают наши эксперты, эти отличия не радикальны, но весьма существенны, и пренебрегать этими отличиями не стоит.

Так, по словам Игоря Моисеева, директора по развитию компании DataCatalog (входит в группу Arenadata), управление данными в цифровых экосистемах затрагивает большое количество разнородных данных, источниками и потребителями которых выступает множество участников этих экосистем. В таких сценариях необходимо использовать подходы и механизмы для обеспечения целостности, доступности и безопасности, обеспечивающие широкий охват разнородных ландшафтов данных. Показательным долговременным эффектом внедрения процессов управления данными в экосистемах, как правило, становятся стандартизация ландшафта корпоративных хранилищ участников экосистемы и снижение стоимости владения данными.

Олег Гиацинтов: «Цифровые экосистемы строятся на основе охвата большей части задач целых направлений и полной совместимости используемых компонентов»

«Обычно каждая организация развертывает у себя решения, исходя в первую очередь из собственных конкретных функциональных требований. При этом обеспечение совместной работы разных видов ПО нередко откладывается на более поздний период, — отмечает Олег Гиацинтов, технический директор DIS Group. — Цифровые экосистемы строятся на основе охвата большей части задач целых направлений (а не отдельных функций) и полной совместимости используемых компонентов. Поэтому в цифровых экосистемах данные более эффективно используются разными модулями и реже возникает вопрос о дополнительной интеграции».

По наблюдениям Кирилла Евдокимова, руководителя направления Data Governance компании GlowByte, управление данными на отдельных предприятиях или в холдингах строится на взаимном обмене ограниченным набором данных, способным обогатить и дополнить информацию, которая уже имеется в компании. Основное внимание при этом уделяется обеспечению прозрачного и стандартизированного слоя сервисов предоставления данных, вопросам информационной безопасности и юридической чистоты обмена, в том числе управлению согласиями. Вместе с тем, хранение данных, их описание, обеспечение их качества и гармонизации остаются локальными задачами каждой конкретной компании, участвующей в обмене. «Иными словами, этот подход, как правило, не требует построения единых точек хранения данных и центральной “надструктуры” управления данными, — поясняет Евдокимов. — Согласование стандартов или спецификаций обмена данными может производиться участниками коллегиально или в формате декларации, когда каждая сторона публикует формат своего сервиса и обеспечивает его реализацию и поддержку. Если рассматривать такую группу партнеров как единую систему, то можно говорить и о реализации децентрализованной модели управления данными с фиксированными контрактами».

Кирилл Евдокимов: «Для управления данными в экосистемах требуется консолидированный подход с предоставлением данных всем участникам на основе сервисной модели»

Цифровые экосистемы, продолжает Евдокимов, предполагают более тесную интеграцию различных сервисов и продуктов, в том числе поставляемых различными провайдерами, поэтому для управления данными в экосистемах требуется более консолидированный подход с предоставлением данных всем участникам по схеме «данные как сервис»: «В этом случае уместно говорить не просто о слое сервисов обмена данными, а о централизованном облаке или хранилище данных, в котором обеспечивается консолидация и гармонизация ключевой информации (например, о клиентах), доступная всем или большинству продуктов и сервисов, входящих в экосистему. Для эффективной реализации такой схемы требуется федеративный подход: централизованная команда отвечает за единое “облако данных”, в том числе за их качество, прозрачность (управление метаданными) и безопасность. Эта же команда определяет единые для всех участников стандарты и технические сервисы сбора и обновления данных в центральном хранилище, и кроме того, предоставляет интерфейсы и инструменты для анализа общих данных».

«Экосистема создается, чтобы в рамках сервисной модели дать клиенту некий расширенный перечень актуальных для него услуг, — развивает дискуссию Борис Bольпе, президент ГК «Максима». — При этом любое предприятие в рамках экосистемы оказывает только какой-то один вид услуг (например, каршеринга, банкинга или торговли) и для осуществления этой деятельности создает свою модель данных. Это всегда ограниченная модель, ограниченный набор данных. И по всем таким данным мы можем делать выводы. Чем больше и шире наше понимание клиента, его интересов, тем больше мы ему сможем предложить и тем точнее будут наши предложения. Как следствие, вовлеченность в использование экосистемы тоже будет выше».

Управляя всеми этими данными, необходимо учитывать множество нюансов, добавляет Bольпе: «Во-первых, каждый вид бизнеса имеет свои ограничения и регуляторные особенности, касающиеся конфиденциальных данных (например, медицинских). Кроме того, есть требования 152-ФЗ, согласно которым, данные надо обезличивать. Поэтому сама модель обогащения данных — это нелинейная модель. С учетом правовых норм ни один банк даже в рамках своей экосистемы не сможет обогатить свои данные, например, данными медицинской организации. Поэтому появляются наборы инструментов для обогащения данных с соблюдением регуляторных требований, и чем жестче эти требования в сегменте, тем сложнее в реализации будут механизмы обогащения. Поэтому управление данными цифровой экосистемы — это даже не сумма задач по управлению данными отдельных компонентов, а новая огромная задача, которая решается с использованием другого класса платформ, в частности, Customer Data Platform (CDP). С точки зрения технологий, это качественно более сложная задача».

Станислав Шлишевский, руководитель направления по работе с финансовым сектором компании «Инфосистемы Джет», считает, что главная особенность цифровых экосистем — это объемы данных, которыми нужно управлять: «Представим, что вы управляете данными в двух разных организациях: в крупном федеральном банке и в малом региональном. У федерального банка есть большое количество представительств и филиалов, множество типов продуктов и услуг, и по всем им поступают данные. Кроме того, есть мастер-данные из MDM-системы и данные машинного обучения. Суммарные объемы просто огромны! В региональном банке все гораздо проще: есть данные о нескольких ключевых продуктах и базовая информация о клиентах — такой объем легко контролировать. Также есть отличия по структуре данных: федеральный банк имеет дело с разнородными данными, и, чтобы понять общую картину, их нужно как-то собрать воедино. В региональном банке все данные более или менее однородные, и их легко организовать. Отличается и подход к взаимодействию: у федерального банка может быть экосистема с большим количеством партнеров, поставщиков и непрофильных продуктов, между которыми нужно обмениваться данными. В региональном банке основные взаимодействия происходят внутри него. Очевидно, что у этих двух банков разные требования и к обеспечению информационной безопасности, и к согласованию стандартов. Крупным игрокам требуются существенно более гибкие системы, учитывая разнообразие сценариев использования данных и специфику партнеров».

Сергей Шевяков: «В структуре данных экосистем изначально содержится большое количество дублирующей информации»

Сергей Шевяков, архитектор компании PARMA TG, в целом соглашается со Станиславом: «В экосистемах объем данных значительно больше, чем в отдельных организациях. Это очевидное, но не главное отличие. Важнее то, что в структуре данных экосистем изначально содержится большое количество дублирующей информации. Например, в сети медицинских центров один и тот же специалист может называться совершенно по-разному (например, участковый врач, семейный доктор, терапевт). При наличии пересекающихся сущностей сложно получить достоверную аналитическую информацию, невозможно принимать правильные управленческие решения, базирующиеся на данных. Установить соответствие схожих данных и исправить ошибки дублирования можно — для этого есть множество технических средств и алгоритмов, в том числе на базе ИИ. Но, по моему опыту, ни один алгоритм пока не способен решить эту проблему полностью. Вместе с программой должен работать эксперт, и его голос имеет решающее значение для проверки того или иного значения. Кроме того, для экосистем не существует общих алгоритмов для выявления дублей, каждый инструмент приходится разрабатывать под конкретный проект».

Эльвин Мустафаев: «Цифровые экосистемы требуют высокой гибкости в управлении данными, чтобы быстро реагировать на изменения внешней среды»

Эльвин Мустафаев, директор департамента BI Polymatica компании SL Soft, выделяет пять основных особенностей экосистем: «Во-первых, данные в экосистемах должны быть интегрированы и открыты для обмена между различными организациями, тогда как в пределах предприятия управление данными обычно сосредоточено в рамках внутренних систем и стандартов. Во-вторых, цифровые экосистемы требуют высокой гибкости в управлении данными, чтобы быстро реагировать на изменения внешней среды, тогда как на предприятиях процессы могут быть более формализованными. В-третьих, управление данными в экосистемах должно учитывать большее количество внешних (в первую очередь государственных) нормативов и стандартов, в то время как внутри предприятия внимание концентрируется на соблюдении внутренних правил. В-четвертых, партнерство в экосистемах критически важно, в то время как в традиционных моделях акценты могут быть смещены на конкуренцию. Наконец, в-пятых, цифровые экосистемы часто полагаются на распределенные, как правило, облачные технологии, в то время как отдельные предприятия могут использовать традиционные локальные решения».

Дополнительные технологические решения для управления данными в экосистемах

Эксперты сходятся во мнении о том, что для управления в экосистемах потребуются дополнительные архитектурные или инфраструктурные решения. При этом коллеги выделяют разные аспекты и инструменты.

«Для построения цифровой экосистемы нужна мощная архитектурная проработка, так как необходимо заставить работать компоненты как единое целое. Это касается как программных, так и аппаратных компонентов, — уверен Гиацинтов. — Они должны обмениваться данными в режимах, требуемых для функционирования каждого отдельного компонента».

Борис Вольпе: «В экосистемах совершенно иные требования к уровню надежности, интеграции, быстродействию и кибербезопасности»

Вольпе, в частности, обращает внимание на кибербезопасность: «Требуется огромный набор архитектурных приемов, обеспечивающих клиентам безопасный доступ в экосистему. Для этого, например, может применяться двухфакторная авторизация или видеодетекция — Face ID. Кроме того, нужны системы передачи данных, гарантирующие полное шифрование данных. Также необходимо обеспечить раздельное хранение ключей и данных, в том числе территориально распределенное, чтобы они физически не хранились в одном ЦОДе».

Кроме того, добавляет Вольпе, в экосистемах предъявляются гораздо более высокие требования к производительности ИТ-инфраструктуры — это нужно, чтобы предоставляемый клиентам сервис был быстрым. И, опять же, ИТ-инфраструктура экосистемы должна быть устойчивой не только в отношении сбоев и катастроф, но и DDoS-атак. «Иными словами, в экосистемах совершенно иные требования к уровню надежности, интеграции, быстродействию и кибербезопасности», — развивает свою мысль Борис. И поскольку объемы данных в экосистемах кратно больше, нужны технологии для работы с большими данными и огромные информационные хранилища.

Все перечисленные требования выливаются в кратно большее увеличение затрат, считает Вольпе. Поэтому важно заранее оценить, сможет ли увеличение выручки с клиента перекрыть эти затраты, будет ли спрос на новые виды предложений и не уйдут ли вообще клиенты из экосистемы.

Станислав Шлишевский: «Главная особенность цифровых экосистем — это объемы данных, которыми нужно управлять»

С коллегами соглашается и Шлишевский: крупной организации, в том числе экосистеме, потребуется изменение подходов как в архитектуре, так и в том, что касается выбора и интеграции инструментов: «Ядром экосистемы является умное озеро данных. Также должны присутствовать инструменты и культура Data Governance, автоматизация создания ETL-процедур, ИИ-средства для оптимизации сервисов подготовки качественных данных и различных рекомендаций, а также высококачественный контент всех видов метаданных и их связей».

Мустафаев отмечает пять основных направлений развития управления данными в экосистемах: «Первый — многослойная архитектура, включающая уровни сбора, хранения, обработки и анализа данных, которые могут находиться в разных организациях. Второй — обеспечение интероперабельности, в том числе разработка стандартов и протоколов для взаимодействия и обмена данными между различными системами и платформами экосистемы. Третий — безопасность и конфиденциальность, создание устойчивых систем для защиты данных и соблюдения нормативных требований по их безопасности при взаимодействии организаций. Четвертый — управление доступом, чтобы разделить и распределить права и роли пользователей из различных организаций. Наконец, пятый — аналитические платформы и инструменты, они должны уметь обрабатывать большие объемы данных из множества различных источников, что требует специфической инфраструктуры».

Игорь Моисеев: «Первостепенную важность в экосистеме приобретают механизмы сквозного управления качеством данных»

Моисеев добавляет: «С увеличением объема и сложности данных в экосистеме первостепенную важность приобретают механизмы сквозного управления качеством данных. Даже небольшая ошибка в данных, например, несоответствие параметров качества, допущенное одним из участников экосистемы, может повлечь серьезные последствия для всей группы».

Как видим, управление данными в экосистемах предъявляет высокие требования к самым разным аспектам. Чтобы их обеспечить, необходима серьезная трансформация не только применяемых подходов, но и инструментов.