Программная система, разработанная в компании dMetrics, обрабатывает текстовую информацию из блогов, Facebook, Twitter, форумов, комментариев к новостям и видеозаписям и т. п. — всего из миллиона с лишним источников. Система анализирует онлайн-беседы о болезнях, лекарствах, медицинской технике и услугах, пополняя базу данных, которая на сегодня уже содержит сведения более чем о 14 тыс. продуктах для здравоохранения.
Заказчики dMetrics с помощью ПО компании могут, например, получить ответы на вопросы о том, сколько пациентов воспользовались тем или иным медикаментом для лечения конкретной болезни за определенный период времени, или о том, кто из покупателей задумывается, не перейти ли ему на лекарство, выпускаемое конкурентом.
Система основана на методах машинного обучения и обработки естественного языка; она не только учитывает количество слов с позитивной и негативной окраской, но и анализирует смысл высказываний, причем ее не сбивают с толку сленг, ошибки в орфографии и пунктуации, чрезмерно длинные предложения и прочие особенности онлайн-дискуссий.
По словам разработчиков, система состоит из трех уровней: на верхнем анализируются все значения слова или словосочетания, касающегося заданного медицинского продукта, и отсеиваются спамерские сообщения; на среднем уровне личный опыт комментаторов отделяется от маркетинговых материалов и новостей; на самом нижнем уровне определяются решения и реакции людей — например, сведения о том, что кто-то начал или думает начать пользоваться продуктом, испытывает опасения или неуверенность либо собирается перейти на другое средство.
В dMetrics не ограничиваются только отраслью здравоохранения, обучая свою платформу также отвечать на вопросы, касающиеся финансовых услуг и политических организаций.