Для ученых из Корнельского университета таким материалом стали 509 млн сообщений в Twitter, написанных за два года 2,4 млн пользователей из 84 стран мира. Исследователи обнаружили, что в них отражаются колебания настроения людей в течение суток, и что процесс этих колебаний не зависит ни от языка, ни от национальной культуры.
Для анализа такого огромного количества сообщений ученые использовали платформу Hadoop. На кластере из 55 узлов работала программа анализа текста Linguistic Inquiry and Word Count. Она искала в текстах сообщений определенные слова, связанные с позитивными и негативными эмоциями. Сопоставление частоты появления таких слов со временем публикации сообщения показало явную зависимость: по утрам большинство людей веселы и жизнерадостны, а в течение дня становятся все более мрачными и раздраженными. Вечером же настроение у людей снова поднимается.
Хотя результаты могут показаться очевидными, авторы полагают, что их работа является первым крупномасштабным исследованием, показавшим это поведение на реальных данных.