На протяжении нескольких лет банк демонстрирует высочайшие темпы роста портфеля кредитных карт. Дальнейшие планы по наращиванию клиентской базы и вместе с тем возросшие требования к скорости обработки накопленной информации создали необходимость применения специализированных средств работы с Большими Данными.
Первым этапом выбранной стратегии стал проект по миграции корпоративного хранилища данных на распределенную аналитическую платформу EMC Greenplum. Важным критерием выбора стала интеграция с аналитическими продуктами SAS Institute.
В ходе проекта существовавшая инфраструктура в виде стандартной СУБД, работающей на серверах архитектуры SPARC, была заменена системой EMC Greenplum. В результате время решения аналитических задач сократилось минимум в 10 раз, а для некоторых видов – более чем в 100 раз. Использование же в качестве узлов системы серверов стандартной архитектуры позволило получить экономически эффективную и неограниченную линейную масштабируемость вычислительных мощностей.
В дальнейшем банк планирует развивать не только инструмент Greenplum, но и Apache Hadoop, предназначенный для обработки неструктурированных данных, а также платформу Chorus, которая предоставляет возможность совместной работы с корпоративными данными, получаемыми из разных источников.