Елена Донцова, СП.АРМ
 

В то время как общероссийская система электронных медицинских карт (ЭМК) еще только формируется, перед медицинскими организациями, активно работающими с электронными медицинскими документами, уже стоит вопрос другого порядка: как с максимальной пользой использовать информацию? Ведь во многих медучреждениях электронная медкарта представляет собой набор текстовых документов.

Врачи советской медицинской школы, воспитанниками или преемниками которой являются российские медики, привыкли составлять развернутые медицинские описания, а не делать отметки в стандартных формах. Поэтому разработчики значительной части отечественных медицинских информационных систем (МИС) в свое время сделали акцент на внесение в карту свободного текста, а не на структурированное ведение записей по строгой форме. В результате в российских клиниках скопились огромные массивы неструктурированных медицинских данных, которые формально являются частью ЭМК, но при этом их практически невозможно анализировать, строить на их основе прогнозы, применять в системах поддержки принятия врачебных решений или использовать в научной работе.

Между тем одна из главных задач обработки медицинских записей, если не считать сбора статистических данных, — сделать их пригодными для анализа врачом в момент принятия решений.

Чтобы обсудить различные подходы к решению данной проблемы, корпорация InterSystems провела в рамках конференции «Информационные технологии в медицине» панельную дискуссию под названием «ЭМК как набор текстовых документов. Что с этим делать?».

Формализованный подход

Сегодня есть два варианта ведения ЭМК. Первый — заполнение ЭМК с помощью стандартизованных шаблонов и форм, что позволяет хранить медицинскую информацию в структурированном виде. Второй — ведение записей в произвольной форме, в этом случае информация хранится в виде неструктурированного текста. У каждого подхода есть свои сильные стороны и ограничения, поэтому они развиваются параллельно.

«Мы хотим максимально формализовать и стандартизовать ведение ЭМК, чтобы упростить процедуру анализа клинических данных», — говорит Елена Донцова, руководитель проектов компании СП.АРМ, российского разработчика МИС. В созданной СП.АРМ системе qMS содержатся шаблоны с самыми разными формами полей: от строго формализованных до свободных текстовых. Шаблоны не просто позволяют ускорить работу врача, они задают определенную культуру ведения медицинских записей, так как в них закрепляются алгоритмы организации труда наиболее опытных и высокопрофессиональных специалистов. «Шаблон — это инструмент управления качеством работы врача и средство, позволяющее новичку влиться в коллектив, в котором приняты свои правила работы», — отметила Донцова. Иногда шаблоны лишь берутся за основу и меняются в соответствии с пожеланиями врачей, но в некоторых областях, например в трансфузиологии, шаблоны должны быть жесткими.

Сегодня формализация, как правило, проводится для конкретной прикладной задачи. Например, чтобы врачи, читая ЭМК, понимали друг друга, некоторые шаблоны разрабатываются совместно со специалистами, работающими в одной технологической цепочке, например диагностами и хирургами. Таким образом повышается эффективность применения информационного «инструмента» для хирурга: он получает из ЭМК исчерпывающие данные о состоянии конкретного пациента для принятия максимально обоснованного решения об оперативном вмешательстве.

Формализованная система ввода медицинских записей позволяет врачу в дальнейшем без особых трудозатрат визуализировать данные, введенные не только им, но и другими специалистами, рассчитывать интегральные показатели и прогностические индексы на основе результатов диагностических исследований и клинических данных. Это достигается благодаря тому, что все данные хранятся в полях СУБД, к ним могут быть привязаны индексы, и поэтому они могут быть легко проанализированы.

Свободный текст

«Как бы ни старались разработчики сделать МИС удобными и эргономичными, разнообразие клинических ситуаций не вписывается в набор шаблонов — врачу в них тесно. Сочетание формализованной и неформализованной информации в ЭМК неизбежно, нужно соблюдать баланс между ними, а для этого понимать, кому и для чего нужна формализация», — подчеркнул Михаил Шифрин, руководитель медико-математической лаборатории НИИ нейрохирургии им. Н. Н. Бурденко. За время своей работы он убедился, что поначалу врачи «уходят» в формализацию, но затем оказывается, что ввести короткую фразу удобнее, чем много раз щелкнуть мышкой. Вот и возникает объективная необходимость оставить в медкарте место для свободного текста – для удобства врачей, а также для ввода того, что не поддается формализации.

«Медицинские записи должны быть такими, какие удобны врачу», — уверен Михаил Бахтин, помощник директора по медицинским информационным технологиям Всероссийского центра экстренной и радиационной медицины им. А. М. Никифорова МЧС России.

Но даже внутри одной клиники потребности медиков могут серьезно различаться. По всей видимости, для каждой врачебной специальности оптимальное соотношение структурированной и неструктурированной информации в ЭМК свое. Для радиологов, которые особенно противились формализации, в клиниках ВЦЭРМ сделали большие мемо-поля, впоследствии они превращаются в документ, выдаваемый пациенту. На другом полюсе — офтальмологи, для которых жестко регламентированные шаблоны и протоколы первичного осмотра — это своего рода инструмент управления качеством, своеобразный чек-лист. Но итог для всех одинаков: формирование документа, попадающего в ЭМК.

Однако текст требует использования специальных технологий для обработки и анализа.

Технология анализа неструктурированного текста

Итак, ЭМК в конце концов трансформируется в некий гибрид из формализованных и неформализованных данных. Но вопрос, вынесенный в тему дискуссии, остается: что делать с частью неструктурированной информации, представленной в текстовом виде? Ведь ключ к пониманию проблемы конкретного пациента или этиологии заболевания может оказаться именно там...

В 2011 году в линейке продуктов InterSystems появилась технология iKnow. Она предназначалась для работы именно с неструктурированными данными, с информацией, представленной в таком виде, что, казалось бы, использовать ее в автоматизированных информационных системах невозможно. Но оказалось, что такая задача вполне решаема, если применить определенные принципы и подходы к обработке данных. И такие подходы в InterSystems нашли: в iKnow можно загрузить текст, который будет разделен на концепты, и затем будут установлены взаимосвязи этих концептов. В качестве концепта может выступать слово или группа слов.

Особенность этой технологии состоит в том, что концепты выделяются без использования громоздких словарей. Вместо словарей в iKnow заложена компактная математическая языковая модель, существенно ускоряющая обработку данных. Изначально технология разрабатывалась для поддержки языков, основанных на латинице, но уже сегодня добавлены семантические модели русского и украинского языков. iKnow позволяет добавлять в решения элемент анализа неструктурированных данных.

Предположим, что в проекте в качестве исходных данных присутствуют метаданные — поля фиксированного типа, например целочисленные значения, дробные значения, наименования медицинских препаратов в виде строки и пр. Исходными данными может быть и неструктурированная информация, представленная в текстовом виде, например анамнез, описание жалоб пациента.

iKnow выполняет анализ данных, позволяя понять, о чем идет речь; производит анализ трендов, давая возможность проследить изменения в частоте упоминания в тексте определенных концептов (например, в осенне-зимний период частота записей об инфекционных заболеваниях резко возрастает); категорирует тексты — производится выборка фрагментов с упоминанием определенных концептов (например, можно показать записи всех заболевших ОРВИ за выбранный период, где заболевание развивалось на фоне хронического заболевания, или кому был прописан тот или иной препарат), извлекает данные, помогая находить в тексте конкретные значения, например наименования медицинских препаратов или лекарственных средств с числовыми значениями дозировок и др. iKnow может посчитать, сколько раз упоминался тот или иной концепт, какие концепты связываются между собой чаще всего, найти похожие концепты (как по содержанию, так и по упоминанию в тексте).

В результате с помощью iKnow можно получить из текста ряд параметров, которые впоследствии могут быть использованы в качестве формализованных данных, что упрощает дальнейшую работу с ними в МИС. iKnow повышает ценность текстовой информации благодаря тому, что переводит ее в структурированный вид.

В настоящее время InterSystems активно развивает поддержку русскоязычного iKnow, в частности в последней версии платформы данных Caché реализован механизм лемматизации — приведения к исходной форме слова.

«Мы ищем возможности новых решений для медицинского рынка. В ЭМК всегда будет присутствовать неструктурированная информация, но теперь в России есть технология для ее обработки и анализа, — рассказал Владимир Островский, руководитель проектов по медицинским информационным системам компании InterSystems. — Сейчас в НИИ нейрохирургии им. Н. Н. Бурденко пробуют c ее помощью анализировать имеющийся массив медицинских записей и подбирают наиболее удачные варианты применения iKnow».