Важность работы с внешними, «альтернативными» источниками данных сейчас признается во многих отраслях. И хотя результаты усилий, предпринимаемых компаниями в этой области, зачастую спорны, они не могут не вызывать интереса со стороны бизнес-сообщества. Банки находятся в авангарде исследования возможностей получить пользу от внешних источников данных: финансовые отношения с малоизученными клиентами всегда более рискованны.

Нынешний кризис в банковской отрасли связан не столько с падением благосостояния людей, сколько с демографическим кризисом 90-х годов: наблюдаются сокращение экономически активного населения, общее его старение. Роста пока ждать неоткуда, и банкам приходится более активно работать с существующей клиентской базой, а кроме того, учиться эффективнее выявлять сущность и потребности новых клиентов.

Плохой клиент плох во всем

Как согласились участники форума «Розничное кредитование: только для своих или посторонним вход разрешен?», проведенного Объединенным кредитным бюро, к прежнему массовому кредитованию клиентов «с улицы» с его высокими и часто неоправданными рисками финансовый рынок уже не вернется. Будет расти значимость партнерства банков с ретейлом, телекомом и другими отраслями, тем более что в бизнес, связанный с предоставлением данных о клиентах, стремятся войти многие, не говоря уже о появившихся специализированных компаниях.

Алексей Кордичев, председатель правления банка «Восточный»: «Да, мы используем внешние данные, но это, скорее, дань моде. Новые данные лишь подтверждают то, что банк знает и без них»

По словам Алексея Кордичева, председателя правления банка «Восточный», эффективность дополнительных внешних источников данных сильно зависит от того, чем занимается банк. Если он на протяжении многих лет предоставляет стандартные продукты и имеет значительный сегмент повторных клиентов с хорошей кредитной историей, дополнительные данные мало что дают.

«Да, мы используем внешние данные, но это, скорее, дань моде. На Дальнем Востоке каждая третья семья является нашим клиентом, поэтому новые данные лишь подтверждают то, что банк знает и без них», – говорит Кордичев.

Другое дело, если банк обращает внимание на новые рыночные сегменты, о которых не накопил значительных знаний и вынужден их собирать на рынке. Использование новых источников данных может дать эффект лишь при наличии стратегии роста и бесполезно для улучшения действующего бизнеса. На данный момент никакие внешние источники данных не могут полноценно заменить информацию, предоставляемую различными бюро кредитных историй (БКИ). «Вход в наш банк для новых клиентов есть, но с “рамкой” в виде БКИ на входе, которая “пищит” в случае неблагонадежных посетителей», – подчеркивает Кордичев.

Сергей Голицын, директор по рискам МФО «Домашние деньги»: «Мы тестируем огромное количество источников данных и даже получаем неплохие модели. Но как только в них включаются данные БКИ, все остальное становится неактуальным»

«Мы тестируем огромное количество источников данных и даже получаем неплохие модели. Но как только в них включаются данные БКИ, все остальное становится неактуальным», – согласен Сергей Голицын, директор по рискам МФО «Домашние деньги». Данные настолько коррелируют, что совершенно очевидно: отрицательный персонаж плох везде – и в телекоме, и в социальных сетях, и в отношениях с банками. Проблема в том, что владельцы данных, особенно телеком-операторы, продают свои данные гораздо дороже, чем они того заслуживают, – видимо, считая, что на этих данных можно построить фантастическую систему идентификации клиентов. На самом деле это не так, и пока что адекватной альтернативы БКИ нет.

Разочарован той пользой, которую внешние данные приносят для увеличения разрешающей способности кредитного конвейера, и Александр Соколов, директор департамента анализа рисков ВТБ24.

«Я – большой поклонник Больших Данных, романтик риск-менеджмента. Несколько лет назад я надеялся на то, что мы научимся обрабатывать данные социальных сетей и ценную информацию из них встроим в кредитный конвейер, существенно повысив качество модели. Казалось бы, возможности огромны: друзья, круг общения, интересы, членство в сообществах. Но, к сожалению, проводимые нами исследования дают околонулевую эффективность», – признает он. С точки зрения рекламы и демонстрации своей инновационности использование Больших Данных – отличный проект. Однако он не позволяет повышать прибыльность в низкорисковом сегменте, где работает ВТБ24.

 Александр Соколов, директор департамента анализа рисков ВТБ24: «Я – большой поклонник Больших Данных, романтик риск-менеджмента... Но, к сожалению, проводимые нами исследования дают околонулевую эффективность»

Гораздо больший эффект ожидался от данных, приобретаемых у телеком-операторов. Разумеется, польза от них существенно выше, чем от работы с соцсетями, но радикально ситуация не меняется. Были большие надежды и на обработку фотографий, позволяющую фиксировать уникальный портрет клиента и составлять их базу, но эти надежды не оправдались. Возможно, если бы шла работа с потоком, в котором 20% составляют мошенники, результат был бы иным, но для низкорискового сегмента эффективность всей совокупности инструментов, созданных ВТБ24, крайне низка.

«Я до сих пор вынужден 10% всего потока заявок – а это сотни тысяч – пропускать через ручной андеррайтинг, – сетует Соколов. – Будущее наступает гораздо медленнее, чем хотелось бы. Несколько лет назад я надеялся, что к нынешнему году у нас не будет ручного андеррайтинга. Теперь понимаю, что этого не произойдет и в два ближайших года».

Сбербанк уходит «в цифру»

Наиболее фундаментальный подход к оценке альтернативных источников данных продемонстрировал Сбербанк. В течение 2016 года им был проведен масштабный пилотный проект, в ходе которого сравнивалась эффективность и сопоставлялись результаты моделей, построенных на данных из множества внешних источников.

Дмитрий Берестнев, начальник отдела моделей оценки рисков розничных клиентов Сбербанка: «Полученные результаты говорят о том, что с использованием внешних данных мы действительно можем глубоко уходить “в цифру”»

«Нам предлагали сотрудничество много разных компаний, обладавших определенными данными, которые могут быть использованы в процессе кредитования. Всегда интересно, насколько они соответствуют нашим транзакционным данным и как соотносятся между собой, какие из них дают наибольший эффект с точки зрения улучшения качества моделей», – говорит Дмитрий Берестнев, начальник отдела моделей оценки рисков розничных клиентов Сбербанка. В ходе проекта партнерам предлагалось либо прислать свою версию скоринговых баллов для предоставленной выборки из 150 тыс. клиентов банка, либо передать в Сбербанк свою тестовую выборку для построения модели. Полученные результаты планировалось сравнить. К проекту были привлечены и зарекомендовавшие себя поставщики данных: сотовые операторы, Mail.Ru, а также профессиональные поставщики Больших Данных – Double Data и MFM.

У каждой компании данные довольно специфичны: мобильные операторы обладают биллингом, Mail.Ru – информацией о поведении в Сети, ретейлеры – данными о покупках. А сами компании используют различные типы источников, чтобы обогатить свои данные, поэтому вопрос их пересечения не является праздным.

При работе с внешними данными важна вероятность того, что нужного клиента удастся там найти, – шанс попадания, так называемый хитрейт (hit rate).

«Если с помощью приобретенных данных удается построить действительно качественную модель, но при этом получается так, что использовать ее можно лишь для нескольких процентов клиентов, итоговый результат будет ничтожным. Это полностью убивает смысл работы с источником данных», – отмечает Берестнев. По оценкам Сбербанка, если компания может обеспечить хитрейт больше 40%, имеет смысл рассматривать ее в качестве поставщика данных и уже затем исследовать качество получаемых моделей. У Mail.Ru этот показатель получился около 40%, у операторов связи колебался от 20 до почти 100%, у Double Data составил 56%, а у MFM – превысил 90%.

Далее аналитики пытались понять, насколько различна получаемая из разных источников информация. Самое простое, что можно для этого сделать, – посчитать коэффициент корреляции между построенными рейтингами. Получилось, что каждая из компаний обладает действительно уникальной информацией. Небольшой всплеск взаимозависимости наблюдался лишь между данными Double Data и Mail.Ru. В целом информация была получена действительно разная и довольно интересная, и имело смысл ее рассматривать.

«Получив модели от поставщиков внешних данных или построив их самостоятельно, мы сделали вывод, что наш внутренний транзакционный скоринг очень эффективен», – отмечает Берестнев. Среди других источников выделился Mail.Ru, показавший высокую эффективность при выявлении социальных дефолтов, и особенно – при идентификации мошенников. Однако у него один из самых невысоких показателей хитрейта – тот самый случай, когда ценность источника данных радикально снижается.

Далее построенные модели добавлялись к уже существующим и работающим в Сбербанке и оценивался достигнутый прирост эффективности. Оказалось, что практически вся информация оправдывает себя при выявлении мошенничества и социальных дефолтов.

«Пока остается вопрос: а каких поставщиков данных мы хотим у себя видеть и в какой комбинации? Например, исходя из соотношения цена-качество, вместо одного хорошего и дорогого источника можно подключить два более простых, но дешевых», – считает Берестнев.

Другая важная и довольно сложная задача – предсказание не только рисков, связанных с клиентом, но и его реальных доходов, а значит, и потенциальной прибыльности. Все люди хотят, получая кредиты, предоставлять минимум информации, да и банки понимают, что излишняя назойливость отпугнет клиентов. Самостоятельный поиск информации о доходах делает кредитный продукт более «цифровым», удобным, привлекательным.

Выяснилось, что ни один из рассмотренных источников данных по отдельности не может точно определить доход клиента. Но объединение данных в рамках единой модели дало совсем другие результаты: удалось с точностью 95% угадывать, что доход клиента находится в пределах заданного интервала.

«С использованием внешних данных мы действительно можем глубоко уходить “в цифру”. Возможно, наступит время, когда мы даже откажемся от справок 2-НДФЛ и будем уверены в том, что наши оценки доходов качественные», – заявляет Берестнев.

Большие Данные – романтика и практика

Персонализация – не только для продаж

Многие банковские сообщества слишком погружены в себя и не замечают того, что делают их соседи – страховщики, особенно те, кто выглядят достаточно медленными, неповоротливыми. Возможно, взгляд с этой стороны несет в себе много синергии, ведь страхование даже на заре своего становления в XVII веке было игрой цифр, а применявшиеся актуарные данные были «большими» для своего времени, недоступными для понимания обычным человеком.

Елена Ладыгина, советник генерального директора по управлению рисками «АльфаСтрахования»: «Не имеет смысла сегментировать клиентов по возрасту или маркам машин и при этом отправлять им стандартные SMS»

«Нам точно так же приходится строить портрет клиента, с абсолютно теми же целями. Мы должны снижать уровень риска, создавать персонализированные продукты, заниматься перекрестными и повторными продажами, предотвращать мошенничество», – говорит Елена Ладыгина, советник генерального директора по управлению рисками «АльфаСтрахования». Пользоваться приходится всеми возможными данными, причем на сегодняшний день в список источников входят телематические устройства, смартфоны, социальные сети, камеры. Никого не удивляет, когда страховщики сельхозурожая пользуются спутниковыми фотографиями, оценивая ход посевной кампании и наблюдавшуюся погоду.

Внешние источники данных часто дают больше информации, чем стандартные подходы. Они позволяют предложить не только более интересную цену, но и подстроить продукт под клиента, а также выбрать для взаимодействия с ним наиболее подходящий канал.

«Не имеет смысла сегментировать клиентов по возрасту или маркам машин и при этом отправлять им стандартные SMS. Вполне возможно, что клиент не отреагирует на почтовое или SMS-сообщение, но обратит внимание на твит с информационного ресурса, на который подписан», – подчеркивает Ладыгина.

В автостраховании на смену стандартным вопросам из анкеты приходит телематика. Согласно прогнозам, к 2020 году доля «умного» страхования в США достигнет лишь 25%. В России похвастаться также нечем – разные компании заявляют об 1-5%.

В настоящее время в автостраховании предлагается два вида «умных» контрактов – Pay as you drive и Pay how you drive, основанные соответственно на фактически проезжаемой дистанции и стиле вождения. Второй вариант дает массу возможностей для анализа и работы с клиентами, попутно выполняя важную социальную функцию – повышение безопасности на дорогах. «Умное» страхование открывает для компаний пласт молодых водителей, которые не являются любимчиками страховщиков. Телематика показывает, что многие из них могут быть хорошими водителями, как, впрочем, могут неожиданно для банков оказаться и хорошими заемщиками.

«Было бы интересно посмотреть на взаимосвязь между качеством вождения молодых клиентов и качеством обслуживания ими своего долга», – говорит Ладыгина.

Очень интересным оказалось использование Больших Данных в страховании жизни и здоровья – здесь действительно есть где развернуться. Ключевую роль играют транзакционные данные с кредитных карт о том, что, где и в каких количествах покупает клиент, как он относится к фастфуду, есть ли в его продуктовой корзине фрукты и овощи.

Кроме того, все большее применение находит информация, получаемая от «умных» часов и браслетов. У компаний вызывает интерес информация о физической активности и качестве сна. Согласно исследованию Accenture, треть американских страховщиков предлагают клиентам вместе со страховкой бесплатные браслеты. Предусматриваются серьезные скидки, если выполнены простые условия: 10 тыс. шагов и не менее 7-8 часов сна в сутки.

Социальные сети также помогают отслеживать физическую активность людей: много кто публикует в Instagram и на других ресурсах свои фотографии после тренировок и маршруты своих пробежек. Самое интересное, клиенты охотно делятся такой довольно личной информацией.

«Мы работаем на одном поле с банками и вполне можем использовать данные друг друга. Наша дорога привела нас к кредитным бюро: если человек хорошо платит, то он зачастую хорошо водит машину, правильно питается, укрепляет здоровье», – констатирует Ладыгина.

Что касается исследования данных из социальных сетей, то специалисты «АльфаСтрахования» были разочарованы: в отрыве от кредитного скоринга такие данные показали себя неинтересными. Единственным ценным зерном в них оказались связи мошенников с различными социальными группами. Например, членство в группе стритрейсеров увеличивает убыточность клиента в несколько раз, а наличие в друзьях автослесарей и продавцов запчастей повышает в десятки раз вероятность подозрительной аварии или угона.

«Это не значит, что если у потенциального клиента одноклассник является автоюристом, то мы его не будем страховать. Но если он придет с убытком, то, видя столь интересное окружение, мы будем уделять ему особое внимание», – подчеркивает Ладыгина. Это другая сторона персонализации взаимодействия с клиентом: она имеет значение не только при продажах, но и в остальных процессах.

***

Все больше финансовых организаций говорят о необходимости выхода в онлайн-пространство и работе с клиентом там, где ему удобно. Регулярно приходится слышать, что тот или иной крупный банк включил в свой арсенал работу в электронных каналах. Это направление для многих по-прежнему является Terra Incognita, потому что полностью нарушает привычный цикл работ. Но взаимодействие с клиентом начинается еще до его идентификации.

Большие Данные – романтика и практика