Цифровые партнерские системы сегодня растут как грибы после дождя. И если непременным условием появления и развития грибов являются осадки, то для цифровых экосистем обязательным условием их роста и «симбиоза» с другими организациями становятся данные — совместно используемые, взаимно полезные, качественные. Гарантированно получить их можно, только если выстроить достаточно зрелые процессы управления данными, причем не на уровне отдельных партнеров и контрагентов, а в рамках всей цифровой экосистемы.
Переход от управления данными на предприятиях и в холдингах к управлению данными в цифровых партнерских экосистемах должен сопровождаться переосмыслением и согласованием не только технологических, но также методологических и организационных аспектов. Необходимость в этом возникает в связи с тем, что в рамках экосистем взаимодействуют компании, придерживающиеся, как правило, различных подходов к управлению данными и применяющие разные форматы, инструменты и платформы.
Обсуждение наиболее острых вопросов, возникающих при выстраивании управления данными в экосистемах, стало одной из тем форума «Управление данными 2024» — ежегодного всероссийского мероприятия, посвященного стратегическим аспектам организации работы с данными и управления компаниями с опорой на данные (data-driven).
Эксперты
Андрей Андриченко (info@sdi-solution.ru) — директор по развитию, компания «ЭсДиАй Солюшен»
Борис Bольпе (info@maxima.ru) — президент, ГК «Максима»
Олег Гиацинтов (info@dis-group.ru) — технический директор, DIS Group
Кирилл Евдокимов (contact@glowbyteconsulting.com) — руководитель направления Data Governance, компания GlowByte
Станислав Лазуков (sales@tdata.tech) — генеральный директор TData
Эльвин Мустафаев (info@slsoft.ru) — директор департамента BI Polymatica, компания SL Soft
Игорь Моисеев (hello@arenadc.io) — директор по развитию, компания «ДатаКаталог» (ГК Arenadata)
Станислав Шлишевский (info@jet.su) — руководитель направления по работе с финансовым сектором, компания «Инфосистемы Джет»
Сергей Шевяков (hello@parma.ru) — архитектор, компания PARMA TG
Наиболее острые проблемы
Согласно наблюдениям Олега Гиацинтова, программная основа цифровых экосистем обычно не пишется с «нуля», а собирается из доступных компонентов или продуктов. Их встраивание в единую архитектуру с учетом возможностей и ограничений каждого компонента требует немалых ресурсов. «Основная задача, которую должны выполнить создатели экосистемы, — это формирование и поддержка в актуальном состоянии всех процессов ее использования, чтобы не возникали дисбалансы, когда один компонент перегружен, а другой вообще не используется. Экосистемы вообще страдают от наличия неиспользуемых решений, при этом включение в их состав новых компонентов может оказаться затруднительным из-за сложностей с интеграцией с уже имеющимися компонентами, а также качеством используемых данных, — поясняет Гиацинтов. — Необходимы постоянный архитектурный контроль над экосистемой и разумный подход к ее развитию».
Кирилл Евдокимов: «Очень важно обеспечить безопасность данных и требования законодательства о персональных данных». |
Кирилл Евдокимов выделяет три основные проблемы при создании экосистемы. Первая — это обеспечение безопасности данных и требований законодательства о персональных данных: «Кроме технических сервисов защиты информации, необходимо обеспечить учет и управление разрешениями на обработку персональных данных, полученных от клиента или отозванных им, а также управление данных, которые в совокупности позволяют однозначно идентифицировать клиента. Эту задачу можно решать различными способами, в том числе путем маскирования, контроля доступа и пр. Основой для этого служит управление метаданными с поддержкой разметки и классификации элементов».
Вторая важная задача, по мнению Евдокимова, — управление изменениями: «Состав сервисов, набор централизованных данных, правила и подходы к гармонизации и пр. — все это требует внимания центральной команды и регулярных циклов обратной связи от продуктовых и сервисных команд, развивающих экосистему». Третья задача, требующая решения, — стимулирование взаимного интереса к обмену данными внутри экосистемы. «Необходимо выстроить процессы по принципу Data Mesh и мотивировать команды продуктов и сервисов на предоставление общего доступа к большей части их данных (разумеется, с учетом юридических ограничений и требований безопасности). Для обеспечения такой мотивации необходим «магазин данных», в котором конечный потребитель платит за них поставщику данных или делится с ним прибылью», — добавляет Кирилл.
Эльвин Мустафаев: «Первая из наиболее острых проблем касается возможных нарушений безопасности и конфиденциальности данных в результате кибератак, несанкционированного доступа и утечек данных». |
Эльвин Мустафаев перечисляет пять наиболее острых проблем. Первая касается возможных нарушений безопасности и конфиденциальности данных в результате кибератак, несанкционированного доступа и утечек данных. Для защиты необходимы многоуровневые системы безопасности, регулярные аудиты ИБ и систематическое обучение сотрудников. Вторая проблема связана с качеством и совместимостью данных: их недостоверность или нестандартный формат способны исказить аналитические выводы или помешать исполнению управленческих решений. Повысить качество данных помогут установление и обеспечение стандартов их качества, регулярные проверки и очистка. Проблема актуальности данных, третья по счету, решается через регулярное обновление данных и использование автоматизированных систем для мониторинга их актуальности. Преодолеть сложности в масштабировании, представляющие собой четвертую проблему, помогут внедрение облачных решений и использование платформ, позволяющих масштабировать инфраструктуру по мере необходимости. Наконец, пятая проблема связана с тем, что неэтичное использование данных может вызывать недовольство со стороны общества. Для ее решения нужны четкие этические стандарты и практики использования данных, а также вовлечение заинтересованных сторон в поиск приемлемых для всех вариантов.
Игорь Моисеев: «Участникам экосистем предстоит большая работа в области гармонизации стандартов, соглашений и процессов между различными элементами, а также вопросов совместимости и согласованности данных». |
«Участникам экосистем предстоит большая работа в области гармонизации стандартов, соглашений и процессов между различными элементами, а также вопросов совместимости и согласованности данных, — считает Игорь Моисеев. — Поскольку в цифровых экосистемах метаданные могут распространяться между различными субъектами, становятся еще более востребованными каталоги метаданных — они позволяют участникам экосистемы безопасно делиться информацией о накопленных ими объектах данных, не создавая угроз для конфиденциальности. Наличие единого инструмента для управления данными и централизованного бизнес-глоссария становится признаком зрелости экосистемы в области работы с информацией».
По мнению Станислава Шлишевского, актуальными с практической точки зрения будут вопросы реализации и внедрения инструментов управления данными, а также выбора между решениями с открытым исходным кодом и вендорскими продуктами. Среди других важных вопросов Станислав выделяет поиск новых способов монетизации данных, а также инструментов управления данными, позволяющих ее обеспечить.
Станислав Лазуков в числе наиболее острых проблем видит мотивацию и заинтересованность всех участников экосистемы в выработке подходов к управлению данными и их соблюдению: «Необходимо выбрать подход и решение, позволяющие с минимальными усилиями и затратами охватывать основные бизнес-запросы, касающиеся анализа и поиска доступных в рамках экосистемы данных. Кроме того, компании могут различаться по уровню зрелости процессов управления данными, качеству данных и разрезов, в которых они рассматриваются, поэтому важно, чтобы инструменты позволяли выравнивать все эти показатели до единого уровня».
Андрей Андриченко: «Синхронизировать разрозненную терминологию можно, опираясь на методологию открытых технических словарей». |
Андрей Андриченко призывает обеспечить синхронизацию терминов и справочников: «Объекты НСИ, из которых складываются прикладные модели данных, являются общим достоянием участников экосистем. Вместе с тем их прикладные информационные системы содержат собственные, дублирующие друг друга базы данных НСИ, заставляя специалистов задумываться над синхронизацией терминологии и сводить к общему знаменателю варианты описаний одних и тех же информационных объектов. Синхронизировать разрозненную терминологию можно, опираясь на методологию открытых технических словарей (ОТД) из стандарта ГОСТ Р ИСО 22745, предполагающую создание единого реестра атрибутов и библиотеки шаблонов, которые разрабатываются для группы однородных номенклатурных позиций и включают набор утвержденных терминов (характеристик), описывающих свойства объектов НСИ в соответствии с нормативно-технической документацией».
Борис Bольпе: «Первым среди наиболее острых вопросов построения цифровых экосистем является взаимное обогащение данных». |
Борис Bольпе первым среди важных вопросов цифровых экосистем называет взаимное обогащение данных: «Оно необходимо для формирования широкого и продуктивного профиля пользователя, динамично обновляющегося по мере накопления нового пользовательского опыта. Вопрос в том, чтобы создать динамичную обогащаемую модель данных, не допуская при этом угроз безопасности, не нарушая регуляторных требований и быстро адаптируясь к их изменениям».
Другой важный вопрос касается поддержки безопасности и целостности экосистемы в условиях, когда ее участники продолжают работать над достижением технологической независимости, развитием собственных решений и вносят различные изменения в модели данных. «Обычно удержание такого динамического равновесия достигается усилиями сводных квалифицированных команд: группы архитекторов, группы маркетологов, группы ИТ-экспертов и пр., — продолжает свою мысль Вольпе. — Такая работа должна идти как между участниками, так и между отдельными вертикалями, чтобы не было разногласий между маркетингом, правовыми отделами, ИТ-службами, командами, отвечающими за управление данными, и т. д.». Наконец, прежде чем браться за создание экосистемы, считает Вольпе, бизнес должен просчитать и сопоставить выгоды от экосистемы и затраты на нее, а также оценить уровни зрелости ИТ у ее участников: «Это нужно, например, чтобы в составе экосистемы не было тех, через кого может произойти хищение данных. По-хорошему, участники должны иметь равный уровень зрелости систем управления данными, в том числе качества данных, чтобы один сегмент недостоверных данных не исказил аналитику и не привел к сбоям в работе всех остальных участников экосистемы».
Распределение ответственности
Один из важных вопросов, которые приходится решать, выстраивая управление данными в экосистемах, — распределение зон ответственности и полномочий между участниками.
Станислав Лазуков: «Полномочия и ответственность участников должны регулироваться дата-контрактами, определяющими поставку данных». |
Полномочия и ответственность участников должны регулироваться дата-контрактами, определяющими поставку данных, уверен Лазуков: «Спецификация контракта данных, поддержка его версионности, проверки качества, интеграция в каталог данных и необходимая аналитика дают не только прозрачное представление о качестве данных, получаемых от поставщика, но и определяют полномочия потребителей данных. В их числе — требования SLA, объем получаемых уведомлений об изменениях, если они встроены в процессы CI/CD, и др. Несомненно, имеющаяся у участников экосистем степень зрелости процессов управления данными оказывает непосредственное влияние не только на содержимое, но и на саму необходимость внедрения дата-контрактов в модель взаимодействия. Так, в проекте, реализованном в периметре группы "Ростелеком", мы опирались на уже выстроенные процессы, что позволило закрыть большую часть вопросов с использованием уже подготовленных и заполненных в инструментарии для документирования данных RT.DataGovernance описаний продуктов и артефактов данных».
Мустафаев отмечает, что распределение зон ответственности и полномочий особенно важно обеспечить не только в технических направлениях, таких как управление данными и обеспечение их безопасности, аналитика и отчетность, но и в организационных — в области коммуникации и совместного взаимодействия, а также управления конфликтами, мониторинга, оценки и развития процессов работы с данными.
Станислав Шлишевский: «Важно не упустить из виду поиск новых способов монетизации данных, а также инструментов управления данными, позволяющих ее обеспечить». |
Чтобы показать, как работает распределение зон ответственности и полномочий, Шлишевский приводит несколько примеров: «Первый — Банк России и цифровой рубль: здесь ответственность за платформу и регулирование лежит на ЦБ РФ. Другой пример — Национальная информационная страховая система (НСИС) и страховые компании: участники рынка являются заказчиками аналитических данных, получая доступ к ним через сервисы НСИС, чтобы, опираясь на них, повышать эффективность своей работы. Третий пример — "Сбер" и его экосистема: здесь мы видим пример взаимного обмена и обогащения данных между участниками».
По мнению Вольпе, экосистема, объединяющая, к примеру, банк, страховую компанию, сеть автозаправок и сервис готовой еды, не может работать так же, как «плоская» организация: «Да, на одном сайте можно сделать пять приложений, но это еще не экосистема. Должна быть компания-оркестратор, которая определяет сквозные финансовые модели, бизнес-процессы и устанавливает приоритеты, а также правила и требования к качеству данных, периодичности аудитов данных, надежности и резервированию систем участников и пр. Это очень сложная работа — построить открытую экосистему, которая сможет бесшовно и быстро вбирать в себя новых поставщиков данных. Для этого необходимо задействовать масштабируемую платформу Customer Data Platform (CDP), систему расширения полей в описании профиля клиента и масштабируемую систему информационной безопасности. Также нужны системы таргетинга, аналитики и рекомендательные решения, которые могут работать со всеми этими системами».
Сергей Шевяков: «Создание экосистемы данных должно начинаться с выстраивания системы управления бизнеспроцессами, которая обеспечит поддержку методик и регламентов работы с данными». |
Первым важным шагом для управления данными в рамках экосистем является нормализация мастер-данных. По наблюдениям Сергея Шевякова, ответственность за ведение справочников и классификаторов на отдельных предприятиях несут профильные специалисты, которые знают свою сферу деятельности и способны корректно вносить новые или править существующие записи. «Для экосистем такая схема неприменима — необходимы централизованные механизмы обновления данных и специально разработанные методики, определяющие, в частности, полномочия и ответственность за действия с данными, — продолжает Шевяков. — В любой системе управления данными существует два главных участника — владелец и потребитель: потребитель готовит заявку на создание или изменение элемента, а владелец предоставляет необходимые данные. В экосистемах между этими двумя шагами может происходить несколько этапов согласований — это нужно, чтобы результаты изменений негативно не повлияли на других участников. Поэтому создание экосистемы данных всегда должно начинаться с выстраивания системы управления бизнес-процессами, которая сможет обеспечить поддержку методик и регламентов работы с данными».
Гиацинтов, впрочем, не видит особенных отличий от ситуаций с разнородными решениями, состоящими из различных продуктов, за исключением введения ответственности как за отдельные компоненты экосистемы, так и за ее функционирование в целом.
Ключевые технологические особенности
Насколько управление данными в современных партнерских экосистемах отличается от управления данными в отдельно взятых организациях? Обязательным условием роста и «симбиоза» цифровых экосистем с другими организациями становятся данные — совместно используемые, взаимно полезные, качественные. Гарантированно получить их можно, только если выстроить достаточно зрелые процессы управления данными, причем не на уровне отдельных партнеров и контрагентов, а в рамках всей экосистемы.
Как подчеркивают эксперты, особенности управления данными в цифровых партнерских экосистемах есть и пренебрегать ими не стоит. Так, по словам Игоря Моисеева, управление данными в цифровых экосистемах затрагивает большое количество разнородных данных, источниками и потребителями которых выступает множество участников этих экосистем. В таких сценариях необходимо использовать подходы и механизмы для обеспечения целостности, доступности и безопасности, обеспечивающие широкий охват разнородных ландшафтов данных. Показательным долговременным эффектом внедрения процессов управления данными в экосистемах, как правило, становятся стандартизация ландшафта корпоративных хранилищ участников экосистемы и снижение стоимости владения данными.
«Обычно каждая организация развертывает у себя решения, исходя в первую очередь из собственных конкретных функциональных требований. При этом обеспечение совместной работы разных видов ПО нередко откладывается на более поздний период, — отмечает Олег Гиацинтов. — Цифровые экосистемы строятся на основе охвата большей части задач целых направлений (а не отдельных функций) и полной совместимости используемых компонентов. Поэтому в цифровых экосистемах данные более эффективно используются разными модулями и реже возникает вопрос о дополнительной интеграции».
По наблюдениям Евдокимова управление данными на отдельных предприятиях или в холдингах строится на взаимном обмене ограниченным набором данных, способным обогатить и дополнить информацию, которая уже имеется в компании. Основное внимание при этом уделяется обеспечению прозрачного и стандартизированного слоя сервисов предоставления данных, вопросам информационной безопасности и юридической чистоты обмена. Вместе с тем хранение данных, их описание, обеспечение их качества и гармонизации остаются локальными задачами каждой конкретной компании, участвующей в обмене. «Иными словами, этот подход, как правило, не требует построения единых точек хранения данных и центральной "надструктуры" управления данными, — поясняет Евдокимов. — Согласование стандартов или спецификаций обмена данными может производиться участниками коллегиально или в формате декларации, когда каждая сторона публикует формат своего сервиса и обеспечивает его реализацию и поддержку. Если рассматривать такую группу партнеров как единую систему, то можно говорить и о реализации децентрализованной модели управления данными с фиксированными контрактами».
Олег Гиацинтов: «Необходимы постоянный архитектурный контроль над экосистемой и разумный подход к ее развитию». |
Цифровые экосистемы, продолжает Евдокимов, предполагают более тесную интеграцию различных сервисов и продуктов, в том числе поставляемых различными провайдерами, поэтому для управления данными в экосистемах требуется консолидированный подход с предоставлением данных всем участникам по схеме «данные как сервис»: «В этом случае уместно говорить не просто о слое сервисов обмена данными, а о централизованном облаке или хранилище данных, в котором обеспечиваются консолидация и гармонизация ключевой информации (например, о клиентах), доступной всем или большинству продуктов и сервисов, входящих в экосистему. Для эффективной реализации такой схемы требуется федеративный подход: централизованная команда отвечает за единое "облако данных", в том числе за их качество, прозрачность (управление метаданными) и безопасность. Эта же команда определяет единые для всех участников стандарты и технические сервисы сбора и обновления данных в центральном хранилище и, кроме того, предоставляет интерфейсы и инструменты для анализа общих данных».
«Экосистема создается, чтобы в рамках сервисной модели дать клиенту некий расширенный перечень актуальных для него услуг, — развивает дискуссию Борис Bольпе. — При этом любое предприятие в рамках экосистемы оказывает только какой-то один вид услуг (например, каршеринга, банкинга или торговли) и для осуществления этой деятельности создает свою модель данных. Это всегда ограниченная модель, ограниченный набор данных. И по всем таким данным мы можем делать выводы. Чем больше и шире наше понимание клиента, его интересов, тем больше мы ему сможем предложить и тем точнее будут наши предложения. Как следствие, вовлеченность в использование экосистемы тоже будет выше».
Управляя всеми этими данными, необходимо учитывать множество нюансов, добавляет Bольпе: «Во-первых, каждый вид бизнеса имеет свои ограничения и регуляторные особенности, касающиеся конфиденциальных данных (например, медицинских). Кроме того, есть требования 152-ФЗ, согласно которым данные надо обезличивать. Поэтому сама модель обогащения данных нелинейная. С учетом правовых норм ни один банк даже в рамках собственной экосистемы не сможет обогатить свои данные, например, данными медицинской организации. Поэтому появляются наборы инструментов для обогащения данных с соблюдением регуляторных требований, и чем жестче эти требования в сегменте, тем сложнее в реализации будут механизмы обогащения. Поэтому управление данными цифровой экосистемы — это даже не сумма задач по управлению данными отдельных компонентов, а новая огромная задача, которая решается с использованием другого класса платформ, в частности, CDP. С точки зрения технологий, это качественно более сложная задача».
Станислав Лазуков напоминает о важности гармонизации задач управления данными внутри отдельно взятого предприятия с задачами, стоящими на уровне экосистемы: «Если внутри организации основной фокус выстраивается на методологии, системах и стандартах с акцентом на наиболее актуальные вопросы целевых групп пользователей, то в экосистеме в центре внимания будут механизмы и регламенты совместной работы и обмена данными. При этом важность вопросов, касающихся владельцев данных, их доступности, безопасности и пр., остается высокой на любом уровне управления».
Станислав Шлишевский считает, что главная особенность цифровых экосистем — это объемы данных, которыми нужно управлять: «Представим, что вы управляете данными в двух разных организациях: в крупном федеральном банке и в малом региональном. У федерального есть большое количество представительств и филиалов, множество типов продуктов и услуг, и по всем им поступают данные. Кроме того, есть мастер-данные из MDM-системы и данные машинного обучения. Суммарные объемы просто огромны! В региональном банке все гораздо проще: есть данные о нескольких ключевых продуктах и базовая информация о клиентах — такой объем легко контролировать. Также есть отличия по структуре данных: федеральный банк имеет дело с разнородными данными, и, чтобы понять общую картину, их нужно как-то собрать воедино. В региональном банке все данные более или менее однородные, и их легко организовать. Отличается и подход к взаимодействию: у федерального банка может быть экосистема с большим количеством партнеров, поставщиков и непрофильных продуктов, между которыми нужно обмениваться данными. В региональном банке основные взаимодействия происходят внутри него. Очевидно, что у этих двух банков разные требования и к обеспечению информационной безопасности, и к согласованию стандартов. Крупным игрокам требуются существенно более гибкие системы, учитывая разнообразие сценариев использования данных и специфику партнеров».
Шевяков в целом соглашается с Шлишевским: «В экосистемах объем данных значительно больше, чем в отдельных организациях. Это очевидное, но не главное отличие. Важнее то, что в структуре данных экосистем изначально содержится большое количество дублирующей информации. Например, в сети медицинских центров один и тот же специалист может называться по-разному (например, участковый врач, семейный доктор, терапевт). При наличии пересекающихся сущностей сложно получить достоверную аналитическую информацию, невозможно принимать правильные управленческие решения, базирующиеся на данных. Установить соответствие схожих данных и исправить ошибки дублирования можно — для этого есть множество технических средств и алгоритмов, в том числе на базе ИИ. Но, по моему опыту, ни один алгоритм пока не способен полностью решить эту проблему. Вместе с программой должен работать эксперт, и его мнение имеет решающее значение для проверки того или иного значения. Кроме того, для экосистем не существует общих алгоритмов для выявления дублей, каждый инструмент приходится разрабатывать под конкретный проект».
Мустафаев выделяет пять основных особенностей экосистем: «Во-первых, данные в экосистемах должны быть интегрированы и открыты для обмена между различными организациями, тогда как в пределах предприятия управление данными обычно сосредоточено в рамках внутренних систем и стандартов. Во-вторых, цифровые экосистемы требуют высокой гибкости в управлении данными, чтобы быстро реагировать на изменения внешней среды, тогда как на предприятиях процессы могут быть более формализованными. В-третьих, управление данными в экосистемах должно учитывать большее количество внешних (в первую очередь государственных) нормативов и стандартов, в то время как внутри предприятия внимание концентрируется на соблюдении внутренних правил. В-четвертых, партнерство в экосистемах критически важно, в то время как в традиционных моделях акценты могут быть смещены на конкуренцию. Наконец, в -пятых, цифровые экосистемы часто полагаются на распределенные, как правило, облачные технологии, в то время как отдельные предприятия могут использовать традиционные локальные решения».
Дополнительные технологические решения для управления данными в экосистемах
Эксперты сходятся во мнении о том, что для управления в экосистемах потребуются дополнительные архитектурные или инфраструктурные решения, выделяя разные аспекты и инструменты.
«Для построения цифровой экосистемы нужна мощная архитектурная проработка, так как необходимо заставить работать компоненты как единое целое. Это касается как программных, так и аппаратных компонентов, — уверен Гиацинтов. — Они должны обмениваться данными в режимах, требуемых для функционирования каждого отдельного компонента».
Вольпе, в частности, обращает внимание на кибербезопасность: «Требуется огромный набор архитектурных приемов, обеспечивающих клиентам безопасный доступ в экосистему. Для этого, например, может применяться двухфакторная авторизация или видеодетекция — Face ID. Кроме того, нужны системы передачи данных, гарантирующие полное шифрование данных. Также необходимо обеспечить раздельное хранение ключей и данных, в том числе территориально распределенное, чтобы они физически не хранились в одном ЦОДе». Кроме того, добавляет Вольпе, в экосистемах предъявляются гораздо более высокие требования к производительности ИТ-инфраструктуры — это нужно, чтобы предоставляемый клиентам сервис был быстрым. И, опять же, ИТ-инфраструктура экосистемы должна быть устойчивой не только в отношении сбоев и катастроф, но и DDoS-атак. «Иными словами, в экосистемах совершенно иные требования к уровню надежности, интеграции, быстродействию и кибербезопасности», — развивает свою мысль Борис. И поскольку объемы данных в экосистемах кратно больше, нужны технологии для работы с большими данными и огромные информационные хранилища. Все перечисленные требования выливаются в кратно большее увеличение затрат, считает Вольпе. Поэтому важно заранее оценить, сможет ли увеличение выручки с клиента перекрыть эти затраты, будет ли спрос на новые виды предложений и не уйдут ли вообще клиенты из экосистемы.
С коллегами соглашается и Шлишевский: крупной организации, в том числе экосистеме, потребуется изменение подходов как в архитектуре, так и в том, что касается выбора и интеграции инструментов: «Ядром экосистемы является умное озеро данных. Также должны присутствовать инструменты и культура Data Governance, автоматизация создания ETL-процедур, ИИ-средства для оптимизации сервисов подготовки качественных данных и различных рекомендаций, а также высококачественный контент всех видов метаданных и их связей».
Мустафаев отмечает пять основных направлений развития управления данными в экосистемах: «Первый — многослойная архитектура, включающая уровни сбора, хранения, обработки и анализа данных, которые могут находиться в разных организациях. Второй — обеспечение интероперабельности, в том числе разработка стандартов и протоколов для взаимодействия и обмена данными между различными системами и платформами экосистемы. Третий — безопасность и конфиденциальность, создание устойчивых систем для защиты данных и соблюдения нормативных требований по их безопасности при взаимодействии организаций. Четвертый — управление доступом, чтобы разделить и распределить права и роли пользователей из различных организаций. Наконец, пятый — аналитические платформы и инструменты, они должны уметь обрабатывать большие объемы данных из множества различных источников, что требует специфической инфраструктуры».
Станислав Лазуков призывает не упускать из виду вопросы интеграции: «Для обеспечения эффективного взаимодействия между различными компонентами цифровой экосистемы в первую очередь разрабатываются стандарты и механизмы интеграции данных, позволяющие выполнять обмен данными, отвечающий требованиям инфорционной безопасности, — они представляют собой так называемый технологический минимум».
Моисеев добавляет: «С увеличением объема и сложности данных в экосистеме первостепенную важность приобретают механизмы сквозного управления качеством данных. Даже небольшая ошибка, например, несоответствие параметров качества, допущенное одним из участников экосистемы, может повлечь серьезные последствия для всей группы».
Все эксперты сходятся в том, что партнерам, участвующим в экосистеме, необходимо о многом между собой договариваться и многое согласовывать, чтобы избежать ситуации лебедя, рака и щуки. От продуктивности этих согласований и дальновидности принятых при этом решений будет зависеть и техническое «долголетие» экосистемы, и ее ценность для конечных потребителей, и выгода для каждого из ее участников. Кроме этого, управление данными в экосистемах предъявляет высокие требования к самым разным аспектам. Чтобы их обеспечить, необходима трансформация подходов и инструментов.
Михаил Зырянов (mikez@osp.ru) — шеф-редактор, OSP.RU (Москва).