29 февраля примерно в 1 час 45 минут по Гринвичу в облачной системе Microsoft Azure начались сбои. Прежде всего пользователи заметили, что перестал работать компонент управления сервисами, в результате чего исчезла возможность как запускать новые копии приложений, так и останавливать работу уже запущенных. Как впоследствии показало расследование специалистов Microsoft, сбой был вызван ошибкой в программном обеспечении, связанным с вычислением времени действия сертификатов на зашифрованную передачу данных между виртуальными машинами внутри Azure. Ошибка проявилась лишь в високосный год.
Специалистам компании далеко не сразу удалось взять ситуацию под контроль. На некоторых кластерах Azure в момент сбоя проводилось обновление компонентов системы, и при восстановлении этих кластеров специалисты допустили еще одну ошибку, которая привела к невозможности работы виртуальных машин с сетевыми соединениями. В общей сложности восстановление нормальной работы Azure заняло больше суток. По первым оценкам Microsoft, сбой затронул около 4% размещенных в облаке приложений. Корпорация намеревается снизить на треть оплату за месяц всем пользователям отказавших сервисов, независимо от того, были ли затронуты их приложения.