Ключ к гиперавтоматизации: онтологические модели

Современные корпоративные ИТ представляют собой множество методов и инструментов обработки одних и тех же корпоративных данных. Различные модные технологии и методологии направлены на улучшение существующего состояния дел путем автоматизации определенных операций. Например, для решения меняющихся бизнес-задач активно развиваются модульные подходы к автоматической компоновке и перекомпоновке прикладных систем (Kubernetes — автоматизация развертывания, масштабирования и управления контейнеризованными приложениями), а специалисты в области машинного обучения стремятся внести элементы автоматизации в выполнение рутинных операций в зависимости от условий решаемых задач. Однако нишевая автоматизация не может стать основой интеграции, и именно такая разрозненность стала сегодня основной стратегической проблемой корпоративных ИТ. Аналитики Gartner назвали гиперавтоматизацию одной из ключевых современных технологических тенденций: все, что можно автоматизировать, должно быть автоматизировано с одновременной оптимизацией бизнес-процессов. Иными словами, аналитики объявили бой унаследованным, неоптимальным для поддержки меняющихся бизнес-процессов системам, не указав, правда, как его выиграть.

Дата-центрическая архитектура

Корпоративные данные имеют ряд свойств, которые необходимо учитывать при создании ИТ-архитектуры цифрового предприятия.

Комплексная информатизация и цифровые бизнес-процессы коренным образом меняют парадигму обработки корпоративных данных. Если раньше было достаточно экономично хранить данные и обеспечивать доступ к ним, то сегодня ключевым становится повторное использование уже имеющихся данных, причем в разных контекстах.

Компании собирают все более крупные и детализированные массивы сведений о своих операциях, клиентах, участниках внутренних и внешних бизнес-процессов, объектах бизнес-операций и их характеристиках, в том числе с учетом всей истории. Однако об эффективности использования этих данных говорить не приходится, хотя и имеются попытки работать с обезличенными данными, накопленными сторонними организациями и компаниями, что предполагает экспоненциальный рост количества внутренних интеграций между различными прикладными системами. Отсюда вытекает другое ключевое свойство современных корпоративных данных — связанность. Связи между данными порождают, в частности, аналитические умозаключения и новые расчетные характеристики, обогащающие исходные данные и фактически превращающие корпоративные данные в корпоративные знания.

Переиспользование и связанность меняют представления о необходимой ИТ-архитектуре: важными становятся не сами данные, а их модель.

Наилучшим образом требованиям гиперавтоматизации отвечает дата-центрическая архитектура [1] поддержки логической связанности всех данных и обеспечения работы с ними разнообразных приложений, включая прогнозную аналитику и ПО машинного обучения.

Для создания единого описания данных, обеспечивающего поддержку их связанности и повторного использования, отлично подходят семантические модели [2], фактически добавляющие в структуру корпоративной информационной системы новый уровень — виртуальные сущности (образы сущностей реального мира: деталь, прибор, сотрудник и т. д.) и связи между ними.

Онтологические модели — наиболее развитый сегодня вариант семантического описания предметной области, формализующий знания о ней. В общем случае они включают словарь терминов предметной области и множество их логических взаимосвязей. В этом качестве онтологии претендуют на роль универсальной модели представления знаний для различных предметных областей. Критически важно, что онтологические модели пригодны для машинной обработки и поэтому обеспечивают возможность автоматической работы со знаниями (логический вывод) с целью получения нового знания в стиле, подобном логическим рассуждениям человека-эксперта.

Яркий представитель семантической парадигмы компьютерных ресурсов — Semantic Web, который базируется на онтологических ресурсах и специально разработанном для них консорциумом W3C языке онтологий Web Ontology Language (OWL), ставшем стандартом для многих технологических направлений (информационный поиск в больших массивах неструктурированных данных, обработка текстов на естественном языке и пр.), где используются специальные лингвистические онтологии. Онтологические модели также применяются в корпоративных информационных системах, в которых остро стоит проблема интеграции данных из разнородных источников.

Средством интеграции данных в виде логически организованной структуры для облегченного доступа и обмена в распределенной среде является матрица данных (data fabric) — с ней бизнес-пользователи встречаются при работе с «графом знаний» (knowledge graph) [3], визуализирующим объекты и отношения, описывающие знания той или иной онтологической модели. По сути, в корпоративной информационной системе появляется новый уровень абстракции — семантический, что открывает следующие возможности:

гибкость описаний данных и их комплексов;
единое описание данных и процессов;
оперативное внесение изменений (информационные системы меняются в реальном времени вслед за изменениями в бизнес-процессах);
обогащение семантического описания по мере развития бизнес-процессов и решения задач.

В целом онтологии выполняют функцию интеграции, обеспечивая общий семантический базис в процессах принятия решений и интеллектуального анализа данных, а также единую платформу для объединения разнообразных информационных систем. При этом появляется возможность естественным образом решать ряд актуальных для ИТ-подразделения задач.

Обеспечение системного подхода к накоплению данных. Не секрет, что сегодня огромные усилия ИТ-департаментов тратятся на очистку сырых данных, их проверку и валидацию. Мышление в терминах моделей принципиально меняет ситуацию: появляется унификация при описании различных данных с учетом их семантики.

Создание отраслевых и типовых корпоративных моделей данных. Такие модели модифицируют при появлении новых бизнес-задач путем добавления необходимых атрибутов, сущностей и связей.

Реализация простых и удобных механизмов работы с данными, доступных из единой витрины, формируемой из распределенного децентрализованного хранилища для поддержки разнообразной аналитической обработки и обогащения данных новыми аналитическими признаками. Это открывает возможности для создания прогнозных моделей любой сложности в интуитивно понятной форме, доступной бизнес-пользователям.

Обеспечение естественной среды консолидации и обмена опытом сотрудников. Эта задача приобретает особую значимость по мере роста мобильности бизнеса.

Рис. 1. Элементы семантической структуры дата-центрического корпоративного хранилища

Источник: Comindware

Иными словами, онтологические модели становятся посредниками между бизнес-пользователями и информационной системой. В частности, функции описания и управления бизнес-логикой могут перейти к бизнес-сотрудникам, а это не что иное, как один из вариантов реализации подхода Low-code к передаче функции автоматизации бизнес-процессов от ИТ-специалистов к бизнес-пользователям. Онтологии позволяют устранить искусственное разделение функционала бизнес-аналитиков и ИТ: первые могут теперь сами управлять структурой данных, внося изменения в онтологию, которая описывает и структуру данных, и логику их обработки.

Так на основе онтологических моделей создается семантическая структура единого дата-центрического корпоративного хранилища, ориентированного на совместное использование единого пространства данных. На базе этого хранилища могут быть сформированы цифровые образы сущностей реального мира (цифровые клиенты, цифровые продукты и сервисы, цифровые «вещи», цифровые бизнес-процессы) и объединены в цифровые комплексы и экосистемы (рис. 1).

Роль бизнес-процессов

Цифровые бизнес-процессы в семантической архитектуре играют роль связующего звена отдельных «вещей» и прочих объектов (сущностей), участвующих в цифровой бизнес-деятельности предприятий. Эта роль становится еще более важной по мере роста детализации информационных объектов — например, при создании цифрового двойника предприятия.

Рис. 2. Эволюция BPMS

Источник: Comindware

Современная цифровая платформа управления бизнес-процессами включает, в частности, управление регламентами бизнес-процессов, поручениями и кейсами (Adaptive Case Management, ACM), документооборотом, задачами и ресурсами и обеспечивает интеграцию с механизмами Интернета вещей и RPA, а также быстрое создание и изменение цифровых решений для любых предметных областей, в том числе за счет механизмов Low-code. В результате ядром гиперавтоматизации становится BPMS (рис. 2).

Семантические подходы становятся ключом к реализации концепции гиперавтоматизации, интегрируя в единое целое различные технологии на базе единого семантического поля (онтологические модели и графовые базы).

Практическая реализация

Ключ к гиперавтоматизации: онтологические модели

Рис. 3. ИТ-архитектура на основе графовой базы с децентрализованной логикой back-end

Источник: https://hackernoon.com

Для реализации онтологической модели используются графовые базы данных, такие как HyperGraphDB — модель мультиграфа, ArangoDB и OrientDB — мультимодельные СУБД, GraphX — распределенный фреймворк для работы с графами в экосистеме Hadoop, использующий вычислительный механизм Spark. Все графовые базы обеспечивают поддержку децентрализованной структуры данных и распределенных структур (рис. 3). Если логика работы бизнес-приложений децентрализована, то NP-полные (позволяющие решить любую вычислительную задачу) смарт-контракты, такие как Ethereum, EOS или Cardano, могут ее поддерживать на нативном языке. Кроме того, в таких базах реализованы связанность данных через семантический слой ИТ-архитектуры и хранение как структурированной, так и неструктурированной информации. Все эти свойства — ключевые для онтологических моделей.

Поскольку главная особенность графовой базы данных — описание связей (отношений) между объектами предметной области, в ней могут размещаться данные любых типов, а также любые базовые интеллектуальные комплексы онтологий. По этой причине графовые базы достаточно гибкие и позволяют автоматически осуществлять логический вывод — решать на основе данных онтологического хранилища такие интеллектуальные задачи, как управление цепочкой розничных поставок или поддержка принятия решений при обслуживании цифровых месторождений.

***

Идея гиперавтоматизации, связанная с тотальной цифровизацией объектов и процессов в корпоративных информационных системах, получила реальное подкрепление в виде онтологического подхода к описанию предметной области и графовых баз как адекватного инструмента реализации масштабных проектов. Как подход, так и инструменты станут набирать популярность по мере того, как бизнес будет двигаться к гиперавтоматизации. Графовые базы применяются в Facebook — для управления социальной сетью, а в Amazon — для работы рекомендательного сервиса. В «Сбере» экспериментируют с прототипом бизнес-решения на основе сверхбольших графов, рассчитывая с их помощью решать в интерактивном режиме задачи с миллиардами связей: от поиска аффилированных лиц и организаций, до продуктовых рекомендаций. На основе графовой базы и онтологической модели данных работает российская BPMS-система Comindware Business Application Platform категории Low-code, которая позволяет бизнес-аналитикам создавать без посредников отраслевые решения на базе семантического содержания и менять их бизнес-логику с минимальным привлечением ИТ-специалистов.

Литература

1. Сергей Горшков. Три шага к дата-центричной архитектуре // Открытые системы.СУБД. — 2019. — № 4. — С. 26–29. URL: https://www.osp.ru/os/2019/04/13055224 (дата обращения: 21.09.2021).

2. Bastian Eine, Matthias Jurisch, Werner Quint. Ontology-Based Big Data Management // URL: https://www.mdpi.com/2079-8954/5/3/45/pdf, doi:10.3390/systems5030045 (дата обращения: 21.09.2021).

3. Евгений Хлызов. Управление данными на основе графов знаний // Открытые системы.СУБД. — 2018. — № 3. — С. 28–29. URL: https://www.osp.ru/os/2018/03/13054405 (дата обращения: 21.09.2021).

Елена Гайдукова (elena.haidukova@comindware.com) — аналитик группы цифровых инициатив, Comindware (Москва).