Анализ онлайн-активности человека способен указать на вероятность наличия у него онкологического заболевания, показывают научные сотрудники Microsoft Research в опубликованном недавно докладе. Исследователи объявили, что по результатам обработки истории поисковых запросов им удавалось выявлять людей, болеющих раком поджелудочной железы, еще до того, как тем поставили диагноз.
Как пишут авторы, результаты исследования указывают на возможность создания «недорогих систем наблюдения с широким охватом» для пассивного мониторинга поисковой активности и заблаговременной выдачи предостережений о вероятности рака поджелудочной железы, а также, после расширения разработанной методологии, и других опасных видов рака, пишут авторы. «Такие системы могли бы постоянно сохранять общие данные и ключевые ориентиры, рекомендуя пользователю темы для обсуждения c врачом», — добавляют они.
В исследовании использовалась база из 9,2 млн запросов к поисковой системе Bing, поступивших от англоязычных американцев за период с октября 2013-го по май 2015 года. Для построения статистической модели применялись не только сами запросы, но и данные переходов по ссылкам, позволившие уточнять намерения пользователей.
Участники исследовательской группы, в которую вошли научные сотрудники Microsoft Research Эрик Хорвитц и Райен Вайт, а также аспирант Колумбийского университета Джон Папарризос, сообщили, что данные были анонимизированы, но каждому поисковому запросу был присвоен идентификатор, привязывающий его к конкретному браузеру, чтобы можно было прослеживать индивидуальную историю поиска.
Вначале, по словам авторов, были выявлены пользователи, делавшие запросы, которые указывали на недавнюю постановку диагноза «рак поджелудочной железы». К таким запросам, например, относились фразы «причины развития рака поджелудочной» и «к чему готовиться, если диагностировали рак поджелудочной».
С помощью специальным образом настроенных фильтров Bing исследователи отсеяли запросы со специальной лексикой, указывавшей на то, что их делали профессиональные медики. В результате для изучения осталось около 7,2 млн запросов от людей, у которых предположительно диагностировали заболевание.
Затем исследователи проанализировали запросы о симптомах, совершавшиеся теми же пользователями на несколько месяцев раньше.
«Мы убедились, что можем идентифицировать рак в 5-15% случаев при очень низком количестве ложно-положительных результатов», — пишут исследователи. По их словам, уровень таких результатов составлял от одного на 100 тыс. до одного на 10 тыс.
В отличие от многих других видов злокачественных опухолей, которые могут расти медленно, рак поджелудочной железы — один из самых агрессивных, поэтому в его случае более ранняя диагностика улучшает шансы больного.
Ранние признаки рака поджелудочной железы малозаметны и нередко проявляются в форме неспецифичных симптомов, меняющихся со временем, отмечают исследователи.
Результаты анализа поисковых запросов указывают на возможность раннего обнаружения заболевания — до пяти месяцев перед официальной постановкой диагноза.
«Журналы запросов веб-поиска способны стать ценным источником сигналов для скрининга на рак поджелудочной железы на довольно ранних этапах, — пишут исследователи. — Учитывая, что этот вид рака может перейти от первой к четвертой стадии всего за год с лишним, такой скрининг способен улучшить пятилетнюю выживаемость».