В Cети помимо английского можно найти информацию еще на 201 языке
Лоуренс Лессиг: «Internet Archive — вежливый и тихий библиотекарь, помогающий вам получить доступ к нужной информации» |
Сайт Wayback Machine, открытие которого состоялось 24 октября, представляет собой интерактивный архив Web-сайтов. Он является своего рода лицом некоммерческой организации Internet Archive, поставившей себе задачу построения общедоступной цифровой библиотеки. Один из профессоров университета штата Мэриленд уже использовал архив для создания индекса текстов на венгерском языке, а исследователи из центра Xerox PARC попытались выяснить с его помощью, действительно ли английский язык доминирует в Сети, вытеснив все остальные языки.
Теперь благодаря архиву мы знаем, что в Web имеется около 1,5 млн. страниц на венгерском языке. А исследователи из Xerox обнаружили, что во Всемирной паутине помимо английского представлен еще 201 язык, и все они мирно уживаются друг с другом в цифровой вселенной.
Огромный объем Internet-архива является гарантией того, что каждый найдет здесь что-то интересное для себя. Если перевести все книги Библиотеки конгресса США в цифровую форму, то они займут около 20 Тбайт дискового пространства. Но даже столь впечатляющая цифра — лишь часть информационной емкости Wayback Machine, которая составляет более 100 Тбайт.
«У нас вполне достаточно ресурсов, чтобы не превращаться в службу для избранных, — отметил директор Internet Archive Брюс Кайль в своем выступлении на торжественном ужине, состоявшемся в Университете Беркли сразу после презентации Wayback Machine. — Наша цель не только в том, чтобы вобрать в себя весь этот объем информации, но и в том, чтобы предоставить его самой широкой общественности».
Однако вместить в себя все совсем непросто. Объем Internet Archive ежемесячно увеличивается на 12 Тбайт. Иными словами, новые материалы, появляющиеся в архиве за двухмесячный срок, содержат больше информации, чем вся Библиотека конгресса. Чтобы сохранить набранные темпы, в Internet Archive задействовали для размещения данных 300 объединенных в сеть настольных ПК, которые располагаются в подвале бывшей крепости Сан-Франциско Presidio.
Но это совсем не те машины, на которых работают «среднестатистические» пользователи.
«Большинство из них построено на базе процессоров с тактовой частотой 1,5 ГГц, на них установлено по четыре жестких диска на 80 Гбайт, а емкость оперативной памяти составляет 640 Мбайт», — сообщил Найджел О?Дрисколл, вице-президент компании Alexa Internet, входящей в группу Internet Archive. «Сравнение с библиотекой очень подходит для Internet, — заметил профессор Стэнфордского университета Лоуренс Лессиг. — Если следовать этой метафоре, то Internet Archive — вежливый и тихий библиотекарь, помогающий вам получить доступ к нужной информации».
Просмотр прошлогодних Web-страниц напоминает чтение огромной подшивки старых газет, вот только на пальцах не остается следов типографской краски |
На страницах Wayback Machine размещены «специальные коллекции», повествующие об атаке 11 сентября, об отражении в Web деятельности американского правительства и о перипетиях, сопровождавших президентские выборы 2000 года в Соединенных Штатах. Коллекция «пионеров Web» отдает дань тем сайтам, которые в свое время определили облик Сети. К их числу относится и сайт Кембриджского университета Trojan Room Coffee Machine — первая Web-камера, появившаяся еще в 1991 году.
«Наконец-то нам удалось создать библиотеку для всего мира», — подвел итог Лессиг.