Программа мероприятия отразила особенности работы над качеством данных в условиях экономической неопределенности и внезапных изменений.
Павел Тойменцев, независимый эксперт по цифровой трансформации холдинговых компаний, — о развитии систем по управлению мастер-данными и их роли в деятельности современных компаний.
На базе стека Open Source в «Газпромбанке» развернута система, позволившая решить ключевые задачи управления качеством данных. Наличие конструктора проверок, системы визуализации и рассылки уведомлений, а также инструментов интеграции с любыми системами, работающими в контуре организации, позволяет оперативно выстраивать процессы контроля основных показателей качества данных и интегрировать их в бизнес-процессы.
Это единственная в России конференция, посвященная решениям для обеспечения гарантированного качества данных.
Мероприятия издательства «Открытые системы» неизменно остаются вашим навигатором в мире, движущей силой которого выступают данные!
Цифровые двойники помогают принимать оптимальные решения на каждом этапе жизненного цикла физического объекта, компонентов конкретной системы и рыночных сегментов. Однако чтобы можно было доверять двойнику, необходимо обеспечить качество и достоверность данных, от которых напрямую зависит информационная безопасность.
Эффективность любой корпоративной информационной системы определяется качеством и достоверностью содержащихся в ней данных – именно вера пользователя в истинность сведений делает систему пригодной для использования. Но на практике возможно появление в системе ложных данных. Для современных корпоративных информационных систем необходимы инструменты проверки истинности вводимых данных.
Анна Серебряникова, президент Ассоциации больших данных и управляющий партнер компании nlogic, рассказывает о возможностях искусственного интеллекта в работе с документами и актуальных задачах российской индустрии больших данных.
Результаты нового опроса Anaconda показывают, что на очистку и подготовку данных они расходуют почти половину своего рабочего времени.
Сейчас правки в устаревшие фактические сведения — цифры, даты, имена, географические названия и т. п. — волонтеры вносят вручную.
Данные — топливо для систем искусственного интеллекта, сырье для аналитических алгоритмов и основа для систем автоматизации бизнес-процессов. Однако наивно ожидать, что данные изначально будут чистыми и пригодными для обработки, а если исходные данные некорректны, то и результаты будут соответствующими. Что можно сделать для устранения дефектов в данных? Как определить, что следует исправить, а что нет? Как узнать, когда надо устранить проблему, а когда лучше ничего не трогать? Иначе говоря: как управлять качеством данных?
Обсуждение «цифровизации» сегодня обычно вращается вокруг технологий больших данных, машинного обучения, прогнозной аналитики, но цифровизация — это не про технологии, а про управление данными, бизнес-модели и культуру работы с данными. Деньги бизнесу всегда приносили люди, а не технологии.