Марк Шмулевич считает главными задачами государства в области Больших Данных популяризацию этих технологий и подготовку кадров |
Применение технологий Больших Данных может существенно изменить к лучшему многие стороны общественной жизни и сделать более эффективным государственное управление, считает Марк Шмулевич, заместитель министра связи и массовых коммуникаций РФ. В преддверии конференции BIG DATA 2013 «Открытые системы» попросили его поделиться своим видением наиболее серьезных проблем, стоящих на пути развития технологий Больших Данных в России, а также рассказать, что уже сейчас предпринимает наше государство для решения ключевых вопросов в области их использования.
- Как вы считаете, когда проекты в области Больших Данных станут в России достаточно массовыми? Что для этого необходимо?
Такие проекты в любом случае станут массовыми, полагаю, это произойдет уже в нынешнем десятилетии. Чтобы они стали массовыми уже через три-пять лет, потребуются определенные усилия, и популяризация, вероятно, станет главным направлением этих усилий. Еще одно направление, на которое сделает акцент государство, — подготовка кадров, это наиболее важная часть в плане продвижения технологий Больших Данных в России. Также важно не ограничивать возможности компаний, работающих на этом рынке, и расширять исследования в области Больших Данных.
- Какие наиболее важные задачи государственного управления на федеральном уровне можно решать с использованием технологий Больших Данных?
Таких задач множество. Одна из них, очень важная для государства, — детальный анализ ключевых показателей эффективности и их реализуемости в различных федеральных программах. Или, например, задача отслеживания финансовых потоков, она интересна различным органам.
Совершенно отдельная тема — безопасность. Анализируя огромные массивы данных, можно выявлять сложные шаблоны и схемы, которые не удается найти иным способом, это высоко ценят органы безопасности ведущих держав, а также близкие к ним негосударственные структуры. Не случайно, например, американский венчурный фонд In-Q-Tel, созданный и финансируемый ЦРУ, инвестирует в такие компании, как Cloudera, которая разрабатывает ПО связующего слоя для работы с Большими Данными, или Palantir Technologies, чьи решения способны анализировать транзакции кредитных историй с целью выявления потенциальных террористов.
Еще одно очень перспективное направление — медицина. Государство, конечно, должно поддерживать внедрение ИТ в здравоохранении. Технологии Больших Данных, примененные к геному, в будущем помогут создавать персонифицированные лекарства.
- Каким образом применение технологий Больших Данных могло бы способствовать развитию российских регионов и муниципальных образований?
Во-первых, на уровне регионов можно решать те же задачи, что и на уровне федеральных ведомств, но в локальном масштабе. Во-вторых, их применение способствовало бы решению проблемы кадрового потенциала. Специалисты, которые умеют внедрять и использовать технологии Больших Данных для решения различных практических задач, уже нужны сейчас и будут очень востребованы в скором будущем. Растить таких специалистов можно как раз в регионах. Наличие таких специалистов — важный для регионов шаг к повышению своей конкурентоспособности.
- Рассматривает ли Минкомсвязи какую-либо возможность участия в инициативах в области Больших Данных хотя бы на уровне популяризации этих технологий в госучреждениях?
Да, рассматривает. В рамках данной проблемы мы не выделяем отдельно госучреждения и ставим вопрос шире: что вообще может сделать государство, чтобы Большие Данные активнее внедрялись. Здесь мы выделяем два основных направления: популяризация, в том числе и для государственных заказчиков, и подготовка кадров. Они в равной степени важны и для коммерческих предприятий, и для госучреждений. Остальное сделает рынок.
- Уже сейчас в России имеется огромное количество данных, из которых можно было бы получить ценные сведения самого разного характера, начиная с тех, которые касаются безопасности государства, и заканчивая весьма и весьма подробными данными о личной жизни граждан. Собирается ли Минкомсвязь каким-либо образом усиливать меры по предотвращению анализа данных в целях, противоречащих интересам государства и о бщества?
Каких-либо конкретных планов в этом направлении у нас нет. Задачи, которые следует решать в рамках данной проблемы, во многом схожи с теми, что решает сейчас Совет по открытым данным при комиссии по Открытому правительству. Есть концепция открытия доступа к данным из государственных баз данных. Мне кажется важным следующий очевидный принцип: открывая доступ к каждому набору данных, нужно быть уверенным, что не становится открытой проприетарная информация, использование которой может принести существенный вред. Но мировой опыт говорит о том, что эта задача решаема.
Нередко путем небольших изменений можно превратить информацию, способную нанести вред, в безопасную. Например, если из данных о нарушениях правил дорожного движения убрать номера машин, то можно получить ценную информацию о нарушениях ПДД на том или ином участке дороги, используя которую легко корректировать дорожные знаки и принимать другие меры для повышения безопасности дорожного движения, при этом никакая персональная информация не будет распространяться.
- Известно, что в области Больших Данных имеется широкое поле для фундаментальных исследований. Какие направления представляются вам наиболее интересными с точки зрения значимости их результатов для политического и экономического развития России?
Одно из перспективных направлений фундаментальных исследований в этой области — поиск новых методов распараллеливания вычислений. Например, в случаях, когда невозможно распределить обработку данных между процессорами так, чтобы каждый из них смог работать автономно, без взаимодействия с другими процессорами. Впрочем, наиболее перспективными я считаю прикладные исследования, нацеленные на оптимизацию существующих алгоритмов и на более эффективное применение методов Больших Данных на практике. Уже сегодня в России имеется набор технологий в этой области, которые можно и нужно коммерциализировать. Важно, чтобы Большие Данные были и в форсайтах институтов развития, поскольку сегодня есть отличные перспективы для создания компаний, занимающихся технологиями Больших Данных.
- Какие российские организации наиболее активно ведут исследования в области Больших Данных?
К большому сожалению, их не так много. Из тех, которые активно занимаются исследованиями, могу упомянуть «Яндекс», Mail.ru. Знаю, что есть планы по созданию специальных исследовательских центров по Большим Данным, возможно, в рамках программы центров прикладных исследований Сколково. Активно работающих центров, занимающихся Большими Данными, в России я на сегодня не знаю.
- Западные аналитики говорят о появлении новой дисциплины — науки о данных, а также новой специальности — научный сотрудник по изучению данных. Планирует ли министерство популяризировать и развивать эту дисциплину и эту специальность в России?
В России есть очень качественное математическое и статистическое образование — на мой взгляд, это отличная база для подготовки специалистов в такой области. Чего сейчас не хватает, так это понимания прикладных задач, где применение методов Больших Данных будет эффективно. Поэтому, как и по многим другим направлениям ИТ, здесь очень важно соединить теоретическую подготовку кадров в вузах и академических центрах и практическую — в организациях, решающих практические задачи с использованием различных технологий, в том числе технологий Больших Данных. Хотелось бы, чтобы к образованию в такой прикладной области, как наука о данных, изначально подключались компании, которым нужны специалисты этого профиля. Также очень важно, чтобы исследования в области Больших Данных велись при совместном финансировании научных институтов и коммерческих компаний.
- Какую пользу могло бы дать применение технологий Больших Данных в российских научных исследованиях — фундаментальных и прикладных?
Практически во всех направлениях, где применяются Большие Данные, эти технологии принесут пользу исследователям. Прорывы могут быть в таких областях, как медицина. Например, стоимость секвенирования (общее название методов, которые позволяют установить последовательность нуклеотидов в молекуле ДНК. — Прим. ред.) нескольких маркеров в геноме за последние несколько лет снизилась с нескольких тысяч долларов до менее чем 100 долл. И ожидается, что стоимость полного секвенирования генома вскоре упадет с нынешних 100 долл. до гораздо более доступной суммы, и тогда появится возможность делать вещи, которые сегодня кажутся невероятными, вплоть до создания персонализированных лекарств, способных по геному человека распознавать и устранять имеющиеся у него проблемы со здоровьем. Это может привести к феноменальным изменениям в медицине, а известно, что ее улучшение имеет колоссальное общественное значение, поскольку неизбежно ведет к переменам в ключевых направлениях жизни человечества.
- Планирует ли Минкомсвязи наладить между российскими специалистами и организациями обмен знаниями и практическим опытом в области Больших Данных?
Мы рассматриваем возможность в кооперации с другими организациями провести серьезное мероприятие по Большим Данным, а также поддержать другие мероприятия, которые будут проводиться по этому направлению, чтобы повысить осведомленность общественности о возможностях этих технологий. Очень важно привлекать на такие мероприятия специалистов из российских регионов — представителей и госструктур, и коммерческих компаний, которые могут быть потенциальными потребителями технологий Больших Данных. Это же облегчит и привлечение спикеров — тогда такие конференции и форумы получатся многовендорными и не превратятся в общение какого-то одного поставщика с клиентами. Вариант, который будет выигрышным для всех, — когда пул поставщиков и исследователей в рамках мероприятия общается со своими потенциальными заказчиками.
- Большинство представленных в России решений в области Больших Данных — это зарубежные продукты со всеми вытекающими отсюда последствиями. Что Минкомсвязи считает возможным делать для развития отечественных технологий Больших Данных?
В ряде критически важных областей, прежде всего связанных с обеспечением безопасности, целесообразна работа специально протестированных программных продуктов, в первую очередь, российских. Ряд российских компаний применяют собственные программные решения для работы с Большими Данными или те продукты, которым они доверяют. Чтобы отечественных продуктов для работы с Большими Данными стало больше, нужно развивать исследования в тех направлениях, в которых это возможно. Уже есть планы по созданию ряда центров ИТ мирового уровня при российских НИИ и вузах, и даже соответствующее поручение Председателя Правительства РФ. Я думаю, что в них будут проводиться исследования, в том числе, и в области Больших Данных. Другая перспективная возможность — развитие отечественных облачных сервисов и инфраструктуры, на которой технологии Больших Данных будут работать.