Недавно профессор и студент Массачусетского технологического института объявили о разработке своего алгоритма, который с точностью 95% предсказывает попадание тем в «тренды» Twitter еще за полтора часа до их появления в списке, а иногда даже за четыре-пять часов. По словам ученых, их алгоритм опирается на новый метод статистического анализа, который в теории можно применить к прогнозированию любых меняющихся со временем величин, — возможно, даже биржевых котировок.
Алгоритм обучается на сведениях о темах, раньше попадавших или не попадавших в тренды, и пытается найти закономерности. Особенность в том, что он не делает предположений о специфике закономерностей, тогда как обычно заранее разрабатывается модель — общая гипотеза о виде закономерности, объясняют исследователи. Конкретно их алгоритм сравнивает изменения, происходящие со временем в числе твитов о каждой новой теме, с изменениями во времени каждого образца из учебного набора данных. Образцам, чья статистика похожа на новые темы, дается больше веса в предсказании «трендовости» будущих тем.