Ваша компания скрытно планирует слияние — они об этом знают, а ребенок вашего генерального директора недавно заболел редкой болезнью — они об этом знают. Один из ключевых сотрудников вашей организации по ночам со своего домашнего компьютера ходит на порносайты — им и это известно. Кто этот «Большой брат», который столько знает о вашей организации? Это не некие государственные структуры, а компании, которые предоставляют такие бесплатные Internet-сервисы, как поиск, карты местности? и электронная почта. Другими словами, это Google, Yahoo, Microsoft, AOL, Map-Quest и др.
Вряд ли эти компании сейчас получают ежедневные сводки о внутренних операциях, стратегиях и сотрудниках вашей организации. Тем не менее, в таких сервисах почти наверняка сохраняется соответствующая информация (в том числе каждое слово, которое ваши сотрудники набирают в окне поиска), благодаря чему их провайдеры могут все это узнать, если захотят. Особенно если их интересует какая-то конкретная организация или группа людей, возможно имеющих определенный диапазон IP-адресов или зарегистрированные пользовательские бюджеты. Бесплатные Web-сервисы на самом деле не бесплатны: пользователи платят за них информацией, так что в итоге получается весьма значительная сумма.
Неизвестные открытия
Большинство из нас полагают, что пользуются Internet-сервисами конфиденциально и анонимно, поэтому искренне удивляются, когда выясняется, как много о нас самих и своих компаниях мы сами же и сообщаем: безобидными на первый взгляд словами, которые указываем при поиске, картами местности, которые просматриваем, и другими «бесплатными» сервисами, к которым обращаемся в Internet. Действительно, Internet становится одним из центральных аспектов нашего мира, и мы реагируем как на обычные, так и на важные события в своей личной и профессиональной жизни, обращаясь к нему. К сожалению, информация об этих событиях, крупных или мелких, будет еще в течение неопределенно долгого времени находиться на серверах провайдеров сервиса.
Длительное существование этой информации в сочетании со все более широкими возможностями связывать ее с реальными пользователями — это и есть риск, о котором большинство людей и организаций даже не подозревают. Объем информации, собираемой о нашей активности и поведении в Сети, достиг беспрецедентных масштабов. Эта информация — один из самых драгоценных корпоративных ресурсов для компаний, которые ее накапливают, и огромная ценность такой информации гарантирует, что многие захотят ее заполучить.
Уязвимость сохраняемых данных (и риск, связанный с предположением, что взаимодействия между пользователями и онлайновыми сервисами сугубо конфиденциальны), возможно, получила самое лучшее доказательство в августе 2006 года, когда компания AOL непреднамеренно разгласила информацию примерно о 20 млн. поисковых Web-запросов, сделанных 658 тыс. своих пользователей [1]. Этот известный инцидент подтвердил то, о чем давно подозревали специалисты по безопасности и эксперты по вопросам защиты информации [2, 3]: данные, полученные при работе с Web-инструментарием, представляют серьезную угрозу для конфиденциальности. И хотя ни один из 20 млн. поисковых запросов AOL не содержал имени пользователя или IP-адреса, обнародованные данные вместо имен пользователей включали в себя уникальные числовые идентификаторы. Выбрав такой «анонимный» идентификатор и связанные с ним поисковые запросы, журналисты New York Times Майкл Барбаро и Том Зеллер быстро показали, насколько легко можно использовать е запросы для того, чтобы выяснить, кто именно те реальные люди, которые отправляли эти самые запросы [4]. Web-сайты, такие как www.aolstalker.com и www.aolpsycho.com, открыли для этого еще более широкие возможности, позволив своим посетителям совместно анализировать, помечать и, в некоторых случаях, идентифицировать пользователей, информация о которых присутствовала в данных AOL. Например, когда мы недавно посетили сайт AOL Stalker, то заметили, что запросы пользователя под номером 672368 просматривались 30813 раз, и этот пользователь был помечен как «забавный». Запросы данного человека были весьма разнообразными, от самых обычных до глубоко личных, как это бывает и у нас самих. Они касались религии, беременности, покупок и клиники в г. Шарлот, где делают аборты. Если вы сами захотите посмотреть набор данных AOL, такие сайты, как AOL Stalker, не только проследят, что вы ищете, но иногда позволят другим пользователям сайта точно узнать, что именно вас интересует.
Первый инцидент в AOL и последующие случаи с разглашением данных с Web-сайтов спровоцировали появление множества статей и активные дискуссии в блогах [5, 6], еще больше подчеркнув, насколько острыми являются вопросы обеспечения конфиденциальности в данных ситуациях. Внимание прессы к этой теме быстро пробудило интерес общественности к проблемам разглашения информации и сохранения данных, но возникает ощущение, что сам факт разглашения информации в AOL практически никак не повлиял на общественное сознание. Несмотря на то что большинство экспертов по вопросам конфиденциальности считают этот инцидент своего рода переломным событием, проведенный недавно опрос среди студентов колледжей и пилотный опрос обычных пользователей, не являющихся техническими специалистами, показал, что соответственно 83 и 84% из них ничего не знают об инциденте в AOL [7]. С точки зрения обычного пользователя, такого инцидента, по-существу, и не было.
Пока случай с набором данных AOL не стал достоянием гласности, понимание того, сколько информации мы передаем в Internet, до сознания общественности доходило крайне медленно. Одним из первых об этом заговорил Джон Беттелли, который ввел в употребление термин «база данных намерений», используемый для описания информации, собранной путем записи всех наших поисковых запросов [8].
«База данных намерений — это просто следующее: объединенные результаты всех когда-либо вводимых поисковых запросов, всех когда-либо предоставленных списков результатов поиска и всех путей, выбранных в качестве результата. Такая база много где существует, но в трех или четырех местах, в частности в AOL, Google, MSN, Yahoo, содержится огромный объем такой информации», — заметил Беттелли. Беттелли и несколько других современных авторов [3] приводят ряд убедительных примеров того, сколько информации о нас самих, наших организациях и нашем обществе становится известно благодаря нашему обращению к Web-сервисам.
Причины сохранения данных
Важно понимать, что компании, предлагающие онлайновые сервисы, имеют весьма веские причины для сбора пользовательских данных.
Бизнес-модели
Провайдеры бесплатных приложений в Web предлагают свои инструментальные средства в качестве общедоступного сервиса не просто так. Какими бы альтруистами они ни казались, эти компании имеют юридические обязательства перед своими акционерами и обязаны получать прибыль. Несмотря на различие в бизнес-моделях, существующих для рекламы «бесплатных» сервисов, общий вывод состоит в следующем: Web-компании зависят от того, смогут ли они убедить рекламодателей, что затраты последних на размещение рекламы на Web-страницах и в электронной почте оправданны. Эта модель приносит провайдеру сервисов всего несколько центов за каждый щелчок мыши и переход по ссылке, но если вспомнить, что Google обрабатывает свыше 100 млн. поисковых запросов в день [9], легко понять, что адаптированная к пользователю целевая реклама — это отрасль с миллиардным оборотом.
Инновации и совершенствование сервисов
Основной способ, который используют провайдеры для совершенствования своих сервисов, — это исследования, а содержательные исследования требуют данных. Цель каждого провайдера Web-сервисов — стать популярным и привычным в каждой семье, таким как Google, Microsoft или Yahoo. В условиях этой интенсивной борьбы те, кто в данный момент на вершине, прилагают колоссальные усилия, чтобы сохранить свои позиции.
Требования нормативных актов
Уже в скором времени требования законодательства могут стать важной причиной, которая заставит Web-компании накапливать огромные объемы данных. Компании, предлагающие онлайновые сервисы, и Internet-провайдеры, как правило, сопротивляются таким мерам, ссылаясь на сопровождающие их большие административные, технические и финансовые затраты. Еще одна причина для такого противодействия (хотя о ней редко упоминают) — общественное мнение. Компании, предлагающие онлайновые сервисы, и Internet-провайдеры, зависят от доверия пользователей, и любая тень на их репутации сразу же отражается на финансовом положении. В силу этого законодатели по всему миру все чаще рассматривают возможность Web сохранять аудиторский след данных как основной инструмент обеспечения выполнения законов. Возможно, именно учитывая то, что архивированные данные поиска все чаще будут затребоваться контролирующими органами, компания Google недавно приняла решение по истечении полутора-двух лет удалять соответствующие IP-адреса из сохраненных пользовательских запросов [11].
Баланс инноваций, прибыли и конфиденциальности
О создании системы, позволяющей полностью решить все проблемы, связанные с разглашением данных и сохранением информации, сейчас говорить не приходится, однако мы уверены, что инструментальные средства самомониторинга, возможность анонимного просмотра и открытый диалог могли бы стать прекрасными отправными точками и в совокупности помочь в сложившейся ситуации.
Первый важный шаг к этому — разработка простых в использовании инструментов самомониторинга, например функции поддержки истории работы с браузером, позволяющей пользователям просматривать всю информацию (в том числе условия поиска). Такие инструментальные средства, интегрированные в браузеры и применяемые в корпоративных сетях, дадут обществу представление о том, сколько информации мы сообщаем, и могут подвигнуть как отдельных пользователей, так и организации разумно контролировать, какие именно данные они передают в Web. В идеале именно онлайновые компании могли бы выступить с подобной инициативой и помочь создать инструментарий, который охватывает не только поиск, но и все поступающие в Web потоки информации.
Технологии анонимного просмотра будут становиться все совершеннее и поддерживать более высокий уровень готовности. Однако пользователям по-прежнему придется доверять свою информацию нескольким организациям (возможно, далеко не одной). К таким организациям могут относиться Internet-провайдер, поставщик онлайновых сервисов, производитель системных плат, разработчик операционной системы и компания, поддерживающая анонимную работу в Web. Основное требование в решении этого вопроса заключается в том, чтобы пользователи рассматривали разглашение информации как свою личную, а не чужую проблему.
Открытое обсуждение между Web-компаниями, теми, кто определяет политику, организациями, представляющими права пользователей на конфиденциальность, и индивидуальными конечными пользователями, — критически важный шаг для решения этих проблем. Деятельность Electronic Frontier Foundation (www.eff.org), Electronic Privacy Information Center (www.epic.org) и Лоурена Вайнштейна [3] — прекрасные примеры этого.
***
В наши дни, когда реклама «подстраивается» под запросы людей, формируется тенденция к автоматизированной добыче и корреляции сообщаемых нами данных, и этот процесс имеет множество этических моментов. Бесплатные сервисы электронной почты, такие как Gmail, часто используют машины для анализа контента электронной почты, к которому затем добавляют подходящую рекламу. Но насколько далеко это заходит? К примеру, один из наших знакомых заметил, что как только в его электронной переписке появились сведения о том, что у него недавно умер родственник, то в его бесплатном бюджете электронной почты в Web тут же стали появляться рекламные объявления о консультациях для тех, кто потерял близких.
Вопросы конфиденциальности возникают и в связи с новыми бесплатными сервисами, такими как Wink.com и Spock.com, которые «ползают» по Web, собирая находящиеся в открытом доступе материалы, в том числе размещенные на сайтах социальных сетей, и используют эту информацию для составления «досье» на пользователей. Деятельность подобных сайтов демонстрирует, как информация, которая по отдельности кажется совершенно безобидной, может стать разоблачительной, если ее собирать со знанием дела и с должной организацией. Все это дало журналу Wall Street Journal основание провести дискуссию по этому вопросу в статье, озаглавленной «История вашей жизни — теперь и в Сети» (The Story of Your Life, Now Available Online) [12].
Усовершенствованным Internet-сервисам как для повышения эффективности, так и с точки зрения перспектив развития бизнеса, скорее всего, будет требоваться все больше информации о пользователе. И поэтому вопросы конфиденциальности, связанные со средствами поиска и сбора данных через бесплатные Internet-сервисы, будут становиться все острее.
1.R. Singel, AOL’s Search Gaffe and You. Wired News Online, 11 Aug. 2006; www.wired.com/news/politics/privacy/0,71579-0.html.
2.G. Conti, Googling: I’m Feeling (un)Lucky. Presented at DEFCON 14, 4 Aug. 2006; www.defcon.org/html/defcon-14/dc-14-speakers.html#Conti.
3. L. Weinstein. An Open Letter to Google: Concepts for a Google Privacy Initiative. 9 May 2006; www.vortex.com/google-privacy-initiative.
4. M. Barbaro, T. Zeller, A Face Is Exposed for AOL Searcher No. 4417749. The New York Times, 9 Aug. 2006. www.nytimes.com/2006/08/09/technology/09aol.html?ex=1312776000&en=f6f61949c6da4d38&ei=5090.
5. M. Arrington, AOL Proudly Releases Massive Amounts of Private Data. TechCrunch, 6 Aug. 2006; www.techcrunch.com/2006/08/06/aol-proudly-releases-massive-amounts-of-user-search-data.
6. AOL Releases Search Logs of 657,427 Users. Slashdot.org, 7 Aug. 2006; http://yro.slashdot.org/article.pl?sid=06/08/07/2022244.
7. G. Conti, E. Sobiesk, An Honest Man Has Nothing to Fear: User Perceptions on Web-Based Information Disclosure. Proc. Symp. Usable Privacy and Security, 2007.
8. J. Battelle, The Search: How Google and Its Rivals Rewrote the Rules of Business and Transformed Our Culture. Portfolio, 2005.
9. G. Gilder, The Information Factories. Wired, vol. 14, no. 10, 2006; www.wired.com/wired/archive/14.10/cloudware.html.
10. G. Conti, Googling Considered Harmful. Proc. New Security Paradigms Workshop, 2006; www.nspw.org/2006.
11.S. Diaz, Google to Tighten Privacy. The Washington Post, 15 Mar. 2007.
12. J. Vascellaro, The Story of Your Life, Now Available Online. The Wall Street J., 14 Mar. 2007.
Эдвард Собиск (edward.sobiesk@usma.edu), Грегори Конти (gregory-conti@usma.edu) — доценты факультета электронной инженерии и информатики Военной академии США.