По словам Александра Гладкого, руководителя отдела вычислительных платформ и систем хранения IBS Platformix, «архивы бывают разные» — медийные, архивы документов, архивы систем видеонабюдения, у каждого типа, как убедились в компании в ходе соответствующих проектов, имеется своя специфика. Также есть сложные вопросы, связанные с сохранением проектной информации, по этой теме, заявил Гладких, у его компании и вовсе вопросов больше, чем ответов.
Под «долгосрочным» понимается хранение на протяжении десятков лет — скажем, информация относительно зданий должна быть доступна даже после их сноса. А в течение жизни объекта, как отметил Дмитрий Сергеев, старший технический консультант EMC, чертежи, схемы, данные зачастую должны быть доступны не только для просмотра, но и для редактирования. Например, здание может ремонтироваться с применением материалов, не существовавших во время его строительства.
Хранение данных в течение десятков лет рождает две проблемы — программную и аппаратную. Данные должны сохраниться в целости и сохранности, при этом в «читабельном» формате. Сейчас трудно найти дисковод не только для восьмидюймовых, но и для трехдюймовых дискет, проблема выбора формата хранения данных не менее сложна. Многие старые файлы не вполне корректно читаются современными программами, что не очень сщественно при открытии текстов, но может оказаться фатальным при попытке открыть файл сложной структуры.
В последнее время для архивистов стандартом становятся форматы представления данных, основанные на XML и PDF. Программы будущего смогут корректно открывать такого рода документы, «читая» их внутреннюю структуру. Многие производители используют XML для своих собственных форматов данных, что помогает осуществлять конвертацию популярных типов файлов.
В области аппаратных технологий проблема совместимости и преемственности тоже очень важна. На роль носителя для долговременного хранения претендовали и Zip, и магнитооптические диски, некогда казавшиеся, по словам Гладких, идеальным решением, и оптические диски различных поколений. Однако всех их «пережили» ленточные технологии, хотя их начали хоронить еще лет двадцать назад. Разумеется, на ленту победившего стандарта LTO пишутся редко используемые данные, но все же по долговечности и стоимости хранения им по-прежнему нет равных.
Видеоархив ВГТРК базируется на ленточных накопителях Quantum и дисковых хранилищах EMC Isilon. На первом этапе в библиотеке использовались приводы формата LTO 5, на втором добавились приводы формата LTO 6, а емкость картриджа увеличилась с 1,5 до 2,5 Тбайт. По данным на конец осени, было оцифровано около 1,2 Пбайт информации. Всего в системе сейчас 5,5 тыс. слотов под кассеты LTO, емкость дисковых систем EMC Isilon составляет 15 Пбайт. Диски используются в том числе для хранения прокси-копий — «черновых» копий материалов, просматривая которые можно решить, что именно нужно заказать в ленточной библиотеке. Процесс получения заказанных лент, как утверждается, 12-15 минут против 40-50 минут даже в «пожарном» порядке в старом варианте хранения (чаще всего процесс получения кассеты занимал два-три часа — если кассета не была востребована кем-либо другим ранее).
Дублирование информации пока осуществляется посредством хранения одной ленты в библиотеке, а второй — отдельно, «на полке». В дальнейшем планируется создать две идентичные территориально разнесенные библиотеки. Это, помимо прочего, позволит быстрее получать доступ к материалам, особенно в случае «лавинного спроса», когда тот или иной архивный материал внезапно становится нужным всем и немедленно.
Что касается перспектив облачных архивов, то это, как полагают представители IBS Platformix и EMC, дело будущего, но не самого скорого. «Корпоративный архив – большой соблазн для конкурентов и злоумышленников, а кроме того, бизнес-критичная информация, а где гарантии надежности ее хранения и доступности в публичном облаке?» — считает Гладких. При шифровании информации возникнут проблемы с ее хранением на зарубежных серверах. Впрочем, это больше проблемы крупных структур, данные небольших компаний, как правило, не так сильно интересуют конкурентов.