Кривая роста объема хранимых данных круче, чем описываемая законом Мура.
В истории развития информационных технологий, наверное, не было ни одного периода, когда потребности в хранении данных и управлении ими сокращались. Наоборот, кривая их роста даже значительно круче, чем описываемая законом Мура. И в этом нет ничего странного: ведь помимо экономического и технологического аспекта данные имеют еще и философскую составляющую. Как утверждает Жан Поль Бергманс, глава представительства Sun Microsystems в России, данные — это память цивилизаций, что налагает высокую ответственность на тех, кто обеспечивает ее сохранность.
ДРУГИЕ ЗАКОНЫ
В последнее время степень ответственности значительно повысилась еще и благодаря юридическому аспекту. Нормативные акты SEC 17a-4, NASD 3010, акт Sarbanes-Oxley (SOX) и закон Health Insurance Portability and Accountability Act (HIPAA) прямо или косвенно предъявляют к организациям специфические требования в отношении правил хранения и архивирования электронных документов. Например, SOX предписывает торговым предприятиям обеспечить целостность финансового учета посредством соблюдения правил хранения; SEC 17a-4 обязывает компании из сферы финансовых услуг хранить разнообразные записи, включая электронные мгновенные сообщения, в течение шести лет с момента их создания; HIPAA требует от организаций здравоохранения гарантировать целостность персональных данных и точную их принадлежность конкретному пациенту.
Все это способствовало тому, что самой злободневной в отрасли хранения стала тема защиты данных. Это понятие подразумевает целый комплекс мер по обеспечению доступа к ним: резервное копирование, восстановление, архивирование, быстрый поиск и обеспечение непрерывности бизнеса. Причем, как утверждают эксперты, приоритеты пользователей начинают меняться — от защиты данных к восстановлению. Как считают специалисты Gartner, к 2008 г. компании смогут использовать программное обеспечение непрерывной защиты данных (Continuous Data Protection, CDP) для восстановления информации из любой точки, а к 2009 г. в восстановлении будут нуждаться более 35 млн Тбайт данных.
По прогнозам IDC, рынок резервного копирования, архивирования и тиражирования данных вырастет с 4,3 млрд долларов в 2003 г. до 6,58 млрд долларов в 2008 г. Учитывая, сколько данных придется перевести в цифровые хранилища, весьма вероятны и очередные проблемы, как, например, длительное время поиска в больших массивах информации. Уже сегодня многие игроки рынка присматриваются к резервному копированию на диск, виртуальным ленточным библиотекам, контентно-адресуемым системам хранения, системам непрерывной защиты данных, новым схемам тиражирования и мгновенных снимков, усовершенствованным технологиям компрессии данных и т. д.
КРУЖАТСЯ ДИСКИ
Один из наиболее перспективных методов хранения и быстрого поиска данных по контенту (Content Addressable Storage, CAS) реализуется на базе дисковых систем, где для поиска используется локатор или дескриптор. CAS часто рассматривают как новую парадигму архивирования данных. Пока на рынке имеется всего два устройства такого назначения — EMC Centerra и недавно выпущенная StorageTek Intellistore (Trinity).
Виртуальные ленточные библиотеки позволяют на базе дискового массива эмулировать ленточную библиотеку. Это обеспечивает более высокую производительность резервного копирования и восстановления по сравнению с решениями, в которых применяются физические ленточные накопители, и поддержку привычных для пользователей технологических процессов, рассчитанных на ленточную среду. Западные потребители отреагировали на появление технологии с большим энтузиазмом. В 2003 г. компании потратили 1,7 млрд долларов на приобретение дисковых систем хранения: по данным Strategic Research, 18% пользователей уже заменяют свои ленточные системы хранения на диски и 58% планируют это сделать.
Согласно прогнозам многих экспертов, при использовании ПО с резервированием данных на диск последний станет основной средой, откуда будет происходить восстановление. Не далеко то время, когда вся процедура будет занимать лишь несколько минут и даже секунд, а не часов, как сегодня. По интересу со стороны пользователей и объему продаж копирование на диск будет продолжать доминировать на протяжении 2006 г., после чего приоритет в концепции непрерывной защиты данных перейдет к решениям по восстановлению. В 2008 г., по утверждению Gartner, 80% данных будут восстанавливаться с диска.
Впрочем, полностью расставаться с лентой пока никто не собирается. Среди важнейших преимуществ хранения на лентах отмечают простоту выполнения и высокую мобильность резервной копии, благодаря чему ее можно перевезти на любую, даже самую отдаленную, территорию в рамках реализации стратегии аварийного восстановления. Другое достоинство ленточных накопителей — их высокая надежность. В случае механического повреждения содержащуюся на них информацию почти всегда можно спасти. Гарантированный срок хранения, что проверено на практике, — 30 лет (правда, для оптических дисков он составляет 100 лет, но без подтверждения опытным путем нет и уверенности, найдутся ли по истечении указанного времени устройства, поддерживающие формат записи столетней давности).
БАЙТЫ ЛЮБЯТ СЧЕТ
Наиболее важное соображение все же касается вопроса цены. С каждым новым поколением ленточных картриджей стоимость единицы емкости накопителя снижается и по-прежнему остается не в пример ниже дисковых аналогов. Дисковый массив корпоративного уровня (FISCON, ESCON, FC, SCSI) обходится около 40—70 долларов за 1 Гбайт, дисковый массив среднего уровня (SCSI, FC, оптические диски SCSI) — примерно в 15—35 долларов за 1 Кбайт, а стоимость дискового пространства недорогих систем (JBOD, MAID, SATA) колеблется в пределах 3—15 долларов за 1 Кбайт. Цена хранения 1 Гбайт информации на магнитной ленте составляет всего от 0,5 до 3 долларов.
В России наблюдается неуклонный рост продаж ленточных систем (стримеров, автозагрузчиков, автоматизированных библиотек): по данным IDC, в 2004 г. этих устройств приобретено на 27 млн долларов, в 2005 г. ожидается объем поставок на 29 млн долларов, а в 2008 г. — на 36 млн долларов. Для сравнения, в 2004 г. дисковых систем было продано на сумму 98 млн долларов, в 2005 г., согласно прогнозам, она составит 102 млн долларов, а в 2008 г. достигнет 142 млн долларов.
Одна из сложнейших проблем архивирования порождается использованием приложений электронной почты. Microsoft Outlook и Outlook Express — наиболее популярные продукты, и в них пользователи привыкли хранить все документы, которыми они обмениваются с внешним миром. К сожалению, копирование файлов Outlook в формате PST обычными системами резервного копирования затруднено. Разработчики ПО немедленно отреагировали на увеличение потребности: уже сегодня инструменты для архивирования электронной почты поставляют Veritas (на базе продукта KVault Software), EMC (на базе Legato), iLUMIN Software Services, Zantaz и Connected (на базе Iron Mountain).
В зависимости от размера компании и сложности среды хранения стоимость архивирования электронной почты, по-видимому, будет варьироваться от 20 до 25 долларов в год за одно рабочее место. Это не кажется расточительным по сравнению с 10 млн долларов, которые Bank of America вынужден был заплатить в качестве штрафа за несоблюдение закона о хранении записей о клиентах. Три последних случая пропажи незашифрованных лент при их транспортировке в резервные центры (инциденты в AmeriTrade, Bank of America, Time Warner), когда частная информация о клиентах или сотрудниках учреждений потенциально могла оказаться в чужих руках, — еще одно подтверждение того, что строгость законов оправдана, но она должна подкрепляться надежными средствами обеспечения сохранности и безопасности данных.
По данным консалтинговой компании Horison Information Strategies, ежегодно объемы данных возрастают на 50—70%, в то время как администратор может справиться с их увеличением лишь на 20—30%, в результате чего нехватка специалистов в области хранения данных ощущается все сильнее. При хранении данных на устройствах DAS затраты на персонал составляют до 80% от общих расходов на эксплуатацию этих систем, в среде SAN и на системах NAS — 40%, поэтому единственным выходом может стать автоматизация процессов хранения данных.
Как бы ни были разнообразны схемы обеспечения защиты данных, основной проблемой остается неэффективность использования ресурсов хранения. По результатам исследований аналитических компаний, только 20% хранимых данных актуальны для пользователя, остальные 80% уже устарели, но подвергаются полному резервному копированию и восстановлению. Именно поэтому специалисты отрасли настаивают на необходимости учета всех особенностей жизненного цикла информации с целью оптимизации ресурсов хранения.
ЕЩЕ БЫСТРЕЕ
В 2004 г. заказчики стали инсталлировать компоненты с поддержкой скорости передачи данных 4 Гбит/с. За не намного большую цену разработчики предложили обратно совместимые компоненты сетей хранения, обеспечивающие вдвое большую скорость: подгоняемые ужесточающимися требованиями к хранению со стороны корпоративных приложений, они готовят к выпуску компоненты инфраструктуры SAN, которые будут в два раза быстрее сегодняшних коммутаторов и адаптеров шины хоста на 2 Гбит/с. Те, кто инвестируют в 2005 г. в компоненты 4 Гбит/c, даже если пока в слабой степени используют эту пропускную способность, окажутся хорошо подготовлены к ситуации, когда для хранения данных при работе с новыми приложениями придется обеспечивать большую производительность, ускоренное резервное копирование и восстановление при отказе оборудования, а, кроме того, в будущем им удастся избежать инфраструктурной модернизации SAN.
Наталья Жилкина — научный редактор «Журнала сетевых решений/ LAN». С ней можно связаться по адресу: nzil@lanmag.ru.