В детской больнице Торонто испытали систему аналитической обработки данных, позволяющую точнее прогнозировать риск инфекционного заражения еще нерожденных детей. Фото: Карлос Гарсия Роулинз, Reuters. |
Больница, как правило, весьма беспокойное место, но активность в отделении интенсивной терапии новорожденных детской больницы Торонто необычна даже для учреждений такого рода. Состояние здоровья недоношенных детей, более подверженных риску инфекционных и других заболеваний, прогнозируется здесь с использованием аналитических методов, разрабатываемых при поддержке и непосредственном участии технологических компаний.
В больнице анализируются данные о температуре тела, частоте сердцебиения, насыщении крови кислородом и кровяном давлении. Вся информация в потоковом режиме поступает с электронных устройств, осуществляющих мониторинг состояния недоношенных младенцев.
Детская больница в Торонто находится в хорошей компании. Сегодня предприятия отрасли здравоохранения, начиная от страховых компаний и заканчивая больницами, стараются внедрять самые передовые технологии, которые помогают им заботиться о пациентах. В результате не только повышается уровень профилактики и персональная ориентация на каждого конкретного больного, но и экономятся деньги.
По словам вице-президента исследовательской компании IDC Сюзан Фельдман, новые технологии порождают процессы, которые изменят всю нашу жизнь. Одна из тенденций развития системы здравоохранения — это понимание, что любые действия должны быть обоснованными, а следовательно, нужно организовать соответствующим образом обработку, отбор информации и предоставление ее в удобном виде специалисту, принимающему решение.
Преимущества упреждающего анализа используют сегодня не только представители отрасли здравоохранения. Технологии такого рода находят достаточно широкое применение в финансовой области, организациях по борьбе с чрезвычайными ситуациями, сфере развлечений и юриспруденции.
«Сейчас общество более готово к переменам, чем когда-либо прежде, и поддерживает методы принятия решений, которые в прошлом были нам недоступны, – подчеркнул профессор медицины Йельского университета Харлан Крумхольц, участвующий в реализации исследовательских проектов, связанных с Большими Данными, в составе консорциума крупных медицинских центров. – Впрочем, конкретные результаты еще требуют проверки. К заявлениям, что повсеместное использование ИТ-систем улучшит медицину, следует относиться критически. Вопрос заключается в том, какое применение информации, предоставляемой этими системами, мы сможем найти.
Если на основе некорректной информации будут приниматься неверные решения, вряд ли можно вести речь о достижениях».
Профилактика заболеваний у детей
Вернемся, однако, в Торонто, в больницу, где информация в режиме реального времени обрабатывается в системе IBM InfoSphere Streams, которая анализирует сведения, поступающие из нескольких тысяч источников. Технологический институт при Университете провинции Онтарио (UOIT) использует это программное обеспечение для сбора потоковых данных с электронных устройств, следящих за состоянием еще не рожденных детей.
«Новые технологии предоставляют UOIT возможность анализировать данные, чтобы своевременно обнаружить у детей заражение крови и, если нужно, начать профилактику целого ряда заболеваний», – сообщила Каролин Макгрегор, председатель научно-исследовательского совета UOIT, занимающегося вопросами информатизации медицины.
Испытания новых методов проводятся параллельно с существующей клинической практикой, благодаря чему доктора и исследователи могут сравнивать два эти подхода. Копия данных, собранных и проанализированных в течение дня, отправляется обратно в UOIT, где подвергается автономному анализу.
«На вход платформы Artemis, предназначенной для анализа информации о состоянии здоровья детей, поступает набор клинических правил, и на этой основе делаются первоначальные прогнозы, – пояснила Макгрегор. – Сегодня медицинские устройства, размещенные у кровати пациентов, позволяют получать самый широкий спектр информации. Приборы считывают данные с очень высокой частотой, и человек должен иметь возможность анализировать постоянно меняющиеся результаты».
Окончательные выводы о целесообразности внедрения системы в целом пока не сделаны. Возможно, в ближайшее время исследователи подготовят для своих коллег доклад, который будет опубликован в конце текущего года. Однако первоначальный этап исследований уже позволяет говорить об эффективности Artemis. Анализу подвергаются данные о 400 пациентах, находящихся в трех корпусах. Объем информации, который был получен исследователями с помощью новой системы, в обычных условиях пришлось бы собирать на протяжении двух десятков лет.
При определении наличия инфекции медицинский персонал учитывает и традиционные признаки (например, повышение температуры тела), но платформа Artemis формирует гораздо более разностороннюю среду, позволяющую анализировать широкий диапазон сигналов о самых различных заболеваниях, которым могут подвергнуться дети.
«Эта система проектировалась для выдачи прогноза о заражении крови у детей примерно за сутки до клинического обнаружения заболевания, – отметил Марти Кох, научный директор направления медицинских систем IBM. – Структурированные данные используются здесь для поиска шаблонов, чтобы врачи могли проводить раннюю диагностику серьезных заболеваний на основе клинических наблюдений. В таких ситуациях каждый час на счету, и своевременное медицинское вмешательство заметно увеличивает вероятность благополучного исхода».
Исследователи из UOIT и сотрудники медицинского центра планируют использовать полученные данные для проведения дополнительных клинических исследований. Система Artemis с высокой долей вероятности укажет, что изменения в поведении ребенка могут свидетельствовать о наличии у него инфекционного заболевания.
Информационное наводнение
Стремление к анализу неструктурированной информации и ранней диагностике побудили корпорацию IBM создать набор инструментов, включающих уже упоминавшауюся технологию Watson. В наши дни на врачей регулярно обрушиваются огромные массивы информации. Совершенно ясно, что справиться с таким объемом очень сложно.
«Количество информации в мире непрерывно растет, и человеку практически невозможно управлять такой физической библиотекой или электронной коллекцией, – пояснила Фельдман. – Нужны интеллектуальные средства доступа. Естественный язык настолько богат и многообразен, что одну и ту же мысль можно высказать множеством различных способов. Необходимы технологии, позволяющие воспринимать и распознавать информацию так, как это делает человек».
Инструменты, которые структурируют и анализируют информацию, полученную из различных источников, помогают медицине выйти на новый интеллектуальный уровень. По прогнозам IDC, объем продаж на рынке информационных технологий Больших Данных и соответствующих услуг увеличится с 3,2 млрд. долл. в 2010 году до 16,9 млрд. долл. в 2015-м.
«Технологию Watson называют прорывом, потому что она умеет понимать вопросы и пытается правильно их интерпретировать, выдвигая гипотезы на основе анализа текста и применения специальных методов», – отметила Фельдман. Корпорация IBM создавала технологию Watson для реализации концепции Deep Q/A – глубокого анализа вопросов и выдачи соответствующих ответов. Технология анализирует влияние, которое один объект оказывает на другой. Например, в области медицины компьютер может проанализировать влияние лекарства определенного типа на человека с определенным заболеванием.
Подход этот отличается от того, как работают поисковые механизмы. Поисковый механизм пытается дать ответ на вопрос путем предварительного анализа нескольких ключевых слов. Затем он ищет сайты или страницы, которые в наибольшей степени соответствуют выделенным ключевым словам. Процесс занимает много времени и часто оказывается неэффективным. Технология же Watson распознает фразу, сформулированную на естественном языке, сканирует имеющуюся литературу и, используя набор массово-параллельных «вероятностных алгоритмов», предназначенных для анализа информации определенного характера, выдает упорядоченные результаты, в которых содержатся ответы на заданный вопрос.
Отвечая на сложные вопросы
В компании WellPoint, называющей себя крупнейшим в США плательщиком медицинских страховок, хорошо понимают, что инициативу Watson Deep Q/A можно использовать и для автоматизации управления… Прежде чем врачи смогут приступить к лечению пациента, им предстоит пройти сложный и длительный путь к санкционированию их действий страховыми компаниями, – отметил Ашок Ченнуру, технический директор WellPoint. – Согласно методикам и руководствам по лечению рака, для достижения максимального эффекта нужны определенные процедуры и лекарства. Но сегодня у нас нет рационального подхода, придерживаясь которого можно было бы оперативно удовлетворять поступающие из медицинских учреждений заявки на терапевтическое лечение. Иногда документы предоставляются не в полном объеме, и это тоже мешает быстрому решению вопросов.
Осенью прошлого года компания внедрила у себя систему поддержки принятия решений IBM Content and Predictive Analytics (ICPA), позволяющую автоматизировать процедуру обработки заявок и обмена информацией между врачом и плательщиком. Если в медицинском учреждении все правильно документировано, данные направляются в систему Watson WellPoint, которая определяет, соответствуют ли представленные документы утвержденным критериям, выдает положительный или отрицательный ответ и при необходимости запрашивает дополнительную информацию.
«В настоящее время мы реализуем в одном из регионов проект, который должен подтвердить, что выбранный инструмент работает хорошо, – сообщил Ченнуру. – К концу текущего года систему планируется внедрить во всех 14 штатах, где представлена компания».
Если опыт в онкологии окажется успешным, новый инструментарий может найти применение и в других областях: при лечении заболеваний органов дыхания, сахарного диабета, поражений сердечно-сосудистой системы и почек. С помощью Watson компания WellPoint может просматривать огромные объемы медицинской литературы, информации, циркулирующей в системе здравоохранения, и медицинских карт пациентов, получая ответы на действительно сложные вопросы.
В конечном итоге должны быть разработаны новые приложения, они помогут врачам изучать историю болезни пациентов, получать в Watson результаты последних анализов, выписки с рекомендациями по лечению и информацию о новейших научных исследованиях. Цель заключается в том, чтобы иметь возможность обсудить с пациентами наиболее эффективные схемы лечения.
«Мощь современных компьютерных систем должна помочь онкологам справиться с огромными объемами новой информации, которую они получают каждый день», – подчеркнул Ченнуру.
Предотвращение повторной госпитализации
Компания Seton Healthcare Family, оказывающая медицинские услуги и обслуживающая около 1,9 млн человек в центральной части Техаса, ищет пути предотвратить повторную госпитализацию пациентов с застойной сердечной недостаточностью. В масштабах США стоимость повторной госпитализации оценивается примерно в 35 млрд долл. Ежегодно Seton Healthcare диагностирует 500 тыс. случаев новых заболеваний, и более чем половине пациентов, прошедших курс лечения, в течение полугода с момента выписки требуется повторная госпитализация.
«Программа Medicare предусматривает наложение штрафов на больницы, в которых присутствует слишком большое число пациентов, нуждающихся в повторном лечении, – отметил Тревис Фрелих, директор Seton Healthcare по выработке стратегии. – Для выявления пациентов, подверженных высокому риску повторной госпитализации, наша компания использует систему ICPA, позволяющую идентифицировать известные факторы риска (например, курение). Таким образом, медики могут сконцентрировать свои усилия на профилактике и более эффективном амбулаторном лечении».
В Seton применяется инструмент ICPA for Healthcare, он анализирует неструктурированные данные с помощью методов обработки естественного языка и поисковых технологий. На сегодняшний день более 80% медицинской информации представлено в неструктурированном виде. Сюда относятся записи врачей, регистрационные формы, выписные эпикризы, кардиограммы и другие медицинские документы.
В сочетании со структурированными данными все это помогает получить более точную картину тенденций, типовых шаблонов и отклонений, позволяя врачам назначить наиболее правильное лечение.
Качество информации, извлеченной из неструктурированных данных, зависит от эффективности лингвистической модели, созданной пользователем. Точность лингвистической и прогнозной моделей определяется тем, насколько хорошо модель была оптимизирована пользователем.
Что касается окупаемости, то стоимость перевода необходимой информации в структурированный вид будет поистине огромной. В перспективе можно отказаться от выделения отдельного заполняемого поля под каждую конкретную порцию структурированной информации. Интуитивно мы понимаем, что эффективный анализ неструктурированной информации сулит очень весомую экономию, сказал Фрелих.
Эту точку зрения разделяет и старший эпидемиолог Seton Healthcare Кристин Джессер. «Высококвалифицированные врачи тратят сегодня неоправданно много времени на заполнение структурированных полей, – подчеркнула она. – Из-за этого у них остается меньше времени непосредственно на лечение пациентов. Врачам, конечно, известно, что курение пагубно отражается на состоянии здоровья пациентов с сердечно-сосудистыми заболеваниями, однако некоторые выводы системы, оценивающие вероятность повторной госпитализации, оказались для них неожиданными».
Интересные результаты были получены при анализе образа жизни и возможного злоупотребления алкоголем и наркотиками. Речь идет о социальных факторах, выявленных при анализе неструктурированной информации. И факторам этим в модели отводится очень важная роль.
«Если ICPA сумеет превратить данные в информацию, от которой мы сможем отталкиваться, то удастся сократить затраты и заметно ускорить процесс поиска и анализа информации, – подчеркнул Фрелих. – Главная наша надежда — повысить качество лечения и одновременно сократить затраты».