Обеспечение непрерывности бизнеса требует ответственного подхода к выбору стратегии хранения и доступа к информации. Классическое решение этой задачи состоит в консолидации ресурсов хранения на базе SAN, организации процедуры резервного копирования в обход серверов, построении резервного центра для защиты от катастроф.

Бизнес современной компании в значительной степени зависит от состояния ее инфраструктуры. Особенно это справедливо в отношении тех высокотехнологичных компаний, деятельность которых непосредственным образом связана с обслуживанием клиентов. Специфика их работы состоит в обработке больших объемов данных, поступающих в режиме реального времени, причем делать это приходится быстро, пока клиент еще готов ждать. Для гарантированного обслуживания способы хранения, обработки и доступа к информации должны быть тщательно продуманы, поскольку они существенно влияют на характер ведения бизнеса, предоставляя конкурентные преимущества в виде выигрыша во времени и появления дополнительных возможностей для привлечения новых клиентов. Наиболее наглядно эта взаимосвязь проявляется в работе предприятий банковской сферы.

СМЕНА ПАРАДИГМЫ

В фокусе очередного выпуска рубрики — проект по внедрению стратегии консолидированного хранения данных и построения резервного центра для защиты от катастроф в «Банк24.ру» в Екатеринбурге. Банк работает на рынке финансовых услуг Свердловской области уже более 11 лет. С приходом к руководству банка в 2002 г. профессиональной команды стратегия банка претерпела кардинальные изменения. До реорганизации это был небольшой банк — «Уралконтактбанк». Новый подход к ведению бизнеса, нашедший отражение в смене названия на «Банк24.ру», предполагал круглосуточную работу в полнофункциональном режиме, с поддержкой всех видов операций по вкладам и самых передовых услуг для клиентов. Для этого требовалось полностью изменить, а точнее говоря, создать инфраструктуру, способную поддерживать новую концепцию деятельности банка. Учитывая специфику работы финансово-кредитных учреждений, где самым важным компонентом операционного процесса является информация, менеджеры проекта тщательно подошли к проработке принципов организации хранения данных.

Что же заставило банковское руководство решиться на серьезную модернизацию инфраструктуры своей сети? До этого в банке использовались серверы со встроенными дисками, на которых, собственно, и хранилась вся имеющаяся информация. При такой организации хранения выход из строя одного сервера означает недоступность данных в течение длительного периода времени, что неприемлемо при работе с клиентами. Разнообразие приложений (большая часть которых представляла собой продукты местных разработчиков) существенно осложняло сопровождение системы и управление ею. Каждое из приложений размещалось на определенном сервере, имело собственные настройки, инструментарий и регламент обновления свежих версий, свою специфическую систему резервного копирования — все это создавало много проблем в работе системного администратора, которому приходилось разбираться с управлением каждого из приложений в отдельности. Использование ресурсов памяти осуществлялось крайне неэффективно: на одних серверах приложения испытывали нехватку дискового пространства, в то время как на дисках других серверов оставалось много свободного места. Подобная разрозненная схема хранения данных не была рассчитана на рост клиентской базы и исключала возможность построения катастрофоустойчивого решения (Disaster Recovery Solution, DRS) — тиражирование разрозненных данных не могло обеспечить их согласованность на удаленной площадке.

АКТИВЫ И РЕЗЕРВЫ

После приобретения нового комплекса зданий были выделены помещения для размещения основного и резервного центра обработки данных, причем резервный центр оказался удален от основного на расстояние около 500 м и соединен с ним посредством многомодового волоконно-оптического кабеля. Весь цикл работ по данному проекту, включая поставку техники через дистрибьюторский канал OCS и прокладку кабелей, а также проектирование и внедрение стратегии хранения, подразумевающей резервное копирование и удаленное тиражирование данных в резервный центр, выполнила компания ХОСТ. В рамках проекта ею была осуществлена поставка 20 серверов HP DL380 G3, часть которых используется в качестве резервных и тестовых. Все приложения выполняются более чем на 10 серверах под управлением ОС Linux RedHat, Windows 2003 Server, Novell и ряда других. Разнообразие ОС объясняется тем, что «Банк24.ру» внедрял приложения местных разработчиков, которые проектировались для работы в различных операционных средах. При выходе из строя одного из серверов достаточно переключить соединительный шнур на резервный сервер, а время простоя займет всего несколько минут.

На обеих площадках установлены по одной системе хранения CLARiiON CX400, каждая подключена к серверам через коммутаторы McDATA на 16 портов с возможностью расширения до 24 портов и скоростью передачи данных 2 Гбит/с по интерфейсу Fibre Channel (см. Рисунок 1). Одним из определяющих аргументов при выборе систем хранения EMC CX400 стала их способность к модернизации до более производительных систем без перемещения данных. (Модернизация осуществляется путем замены контроллеров и добавления дисковых полок.) Например, устройства могут быть преобразованы в недавно анонсированные системы EMC CLARiON CX500 и CX700 с большей емкостью и скоростью доступа к информации.

Географическая рассредоточенность систем хранения гарантирует функциональную неуязвимость в случае физического уничтожения части компонентов или даже одной из систем целиком в результате воздействия внешних факторов. Использование абсолютно идентичного оборудования на двух площадках позволило организовать удаленное зеркалирование между ними и тем самым реализовать полностью катастрофоустойчивое решение путем создания зеркальных копий дисков и целых дисковых массивов на удаленных друг от друга кластерных узлах. Синхронное тиражирование данных выполняется с помощью специализированного ПО EMC MirrorView (см. врезку «В зеркальном отражении»). Это программное обеспечение не зависит от серверного оборудования и выполняется на контроллерах систем хранения.

Системы хранения CLARiiON CX400 спроектированы исходя из принципов катастрофоустойчивости, все компоненты (расположенные на контроллерах входные порты, сами контроллеры, блоки питания, вентиляторы и проч.) дублированы, а кроме того, в самих системах созданы группы RAID для зеркалирования данных на внутреннее дисковое пространство. Тем не менее, в случае выхода из строя одной системы хранения, второй центр имеет полную синхронную копию всей информации, и время простоя составит при самом неблагоприятном стечении обстоятельств всего несколько минут, которые необходимы для перезагрузки серверов. Для надежного хранения, доступа и обработки информации помимо резервной системы хранения используется также резервный коммутатор, применение которого обеспечивает еще один резервный путь от каждого сервера к системе хранения (все серверы, кроме серверов Novell, имеют по два адаптера HBA). За переключение путей и балансировку нагрузки отвечает программное средство EMC PowerPath.

ПО PowerPath позволяет на базе доступных серверам дисковых массивов организовать логические диски и тем самым эффективно задействовать их общую емкость. В 2003 г. функциональность продукта была расширена — тома теперь можно объединять в логические группы на уровне сервера, а доступ к конечным устройствам хранения осуществлять с помощью маскирования LUN. Если произойдет отказ одного из коммутаторов Fibre Channel, одного из портов дискового массива или одного из НВА в сервере, то это никак не отразится на доступности данных для приложений, потому что PowerPath автоматически перейдет на работу по второму резервному пути до логических дисков массива (с использованием исправленных устройств).

При создании решения использовался принцип разделения вычислительных мощностей и систем хранения. Установка CX400 на основной площадке позволила консолидировать все данные и приложения в одном месте и отделить вычислительные процессы от процедур сохранения и доступа к данным. Серверы, не имеющие собственных внутренних дисков, теперь загружаются непосредственно с дисковых систем, что значительно облегчает процедуру обновления программного обеспечения.

С изменением архитектуры вычислительного центра принципиально изменилась процедура резервного копирования. Теперь она выполняется в обход серверов приложений средствами ПО EMC SnapView для моментального и полного копирования и восстановления данных. Построение SAN обеспечило гораздо более эффективное использование дискового пространства и позволило применить единый инструментарий, причем в дальнейшем, при желании, этот процесс может быть усовершенствован с помощью модуля автоматизации процесса резервного копирования (Replication Manager). Благодаря созданию сети хранения данных вновь приобретаемые системы хранения в последующем могут быть гибко интегрированы и на них безболезненно перенесены наиболее актуальные данные с устаревших массивов.

Резервное копирование осуществляется с периодичностью один раз в сутки. Систему хранения останавливают буквально на минуту для создания моментальной копии, а затем в конце рабочего дня создается полная резервная копия. Другие «приятные» следствия такого разделения — возможность увеличения дискового пространства на лету и изменения уровня RAID практически без остановки сервера, моментальная замена устаревших серверов путем переключения адаптеров шины хоста (в проекте использованы HBA производства QLogic).

Чем руководствовались менеджеры проекта, остановив свой выбор на аппаратно-программном комплексе EMC? Сергей Федоров, руководитель отдела продаж серверного оборудования и систем хранения компании ХОСТ, объясняет это специализацией компании на разработке и производстве аппаратных и программных решений исключительно в области систем хранения, а также их способностью к масштабированию и адаптации к будущим изменениям.

Программные решения EMC позволяют организовать управление пакетами MirrorView и SnapView с одной консоли, независимо от ее местоположения. Перспективу развития инфраструктуры банка специалисты компании ХОСТ видят в дальнейшей модернизации систем хранения при увеличении потребностей в большей емкости и производительности, в использовании других возможностей пакета ПО EMC для полной консолидации и автоматического управления данными.

ЗА ФАСАДОМ

Проект стал следствием изменений в управлении банка и воплощением стратегических инициатив его нового руководства. Он стартовал осенью 2003 г., а в феврале 2004 г. оборудование уже было введено в эксплуатацию. В настоящее время «Банк24.ру» — первый и единственный в Уральском Федеральном округе и второй в России банк, работающий в круглосуточном режиме. Он входит в десятку крупнейших банков Екатеринбурга, является членом Национальной фондовой ассоциации и Ассоциации российских банков. Ввод в эксплуатацию нового оборудования позволил не только перейти к удобной схеме обслуживания клиентов, но дал возможность быстро внедрять новые технологии и качественно поддерживать уже хорошо себя зарекомендовавшие. Клиенты банка могут теперь воспользоваться самыми современными банковскими услугами, включая платежи в удаленном режиме через Internet, в том числе посредством мобильного телефона.

В ходе проекта была доказана правильность и своевременность внедрения данного решения. За время эксплуатации комплекса произошла одна внештатная ситуация — сбой в работе коммутатора. Устройство было заменено по гарантии, но для клиентов этот инцидент остался незамеченным.

В конце марта компания EMC и дистрибьюторская компания OCS подвели итоги совместной с партнерами деятельности и назвали лучшие проекты года. Комплекс работ, выполненный компанией ХОСТ для «Банка24.ру», получил награду в номинации «Лучший региональный проект».

Наталья Жилкина — научный редактор «Журнала сетевых решений/ LAN». С ней можно связаться по адресу: http://www.lanmag.ru.


Коротко о главном

ОАО «Банк.ру»

ОАО «Банк24.ру»

620075, г. Екатеринбург,

ул. Малышева, 84

http://www.bank24.ru

Факты. «Банк24.ру» (прежнее название — «Уралконтактбанк») работает на рынке финансовых услуг Свердловской области более 11 лет. В конце 2002 г. в его истории начался новый этап: к управлению банком пришло новое руководство, советом директоров была выработана новая стратегия развития.

Задача. В рамках выбранной стратегии предполагалось кардинальным образом улучшить качество обслуживания клиентов банка и перейти на их круглосуточное обслуживание. Новым руководством банка была поставлена задача построения сетевой инфраструктуры, способной поддерживать автоматизированную работу банка в круглосуточном режиме и предоставлять клиентам весь спектр современных банковских услуг.

Решение. За полгода банк полностью переоснастил свою технологическую базу. Компания ХОСТ выполнила весь цикл работ по данному проекту, включая поставку техники через дистрибьюторский канал OCS, прокладку кабелей, проектирование и внедрение стратегии хранения, подразумевающей консолидацию данных в сети хранения, резервное копирование в обход серверов и построение катастрофоустойчивого решения путем реплицирования данных в резервный центр.

Вывод. Благодаря консолидации данных и созданию резервного центра удалось создать надежную инфраструктуру хранения данных, обеспечить высокую степень их готовности, что, в свою очередь, позволило перейти к удобной для клиентов схеме круглосуточного обслуживания. Реализация проекта благодаря внедрению новых технологий открыла клиентам доступ к самым современным банковским услугам с возможностью осуществления платежей в удаленном режиме через Internet, в том числе посредством мобильного телефона. В «Банке24.ру» в настоящее время разрабатывается около 40 проектов по созданию новых продуктов и услуг.


В зеркальном отражении

Организации зеркалирования данных может осуществляться по ряду причин, в том числе для защиты от повреждения диска, сохранения непрерывности бизнеса при запланированных простоях, восстановления после катастроф из удаленного резервного центра и улучшения локального доступа к данным. Известны два типа зеркалирования: синхронное и асинхронное. Какая из этих стратегий наиболее предпочтительна в том или ином случае, можно решить исходя из задач, ради которых этот процесс организуется.

При синхронном зеркалировании данные сохраняются одновременно. Обе копии обновляются до того, как операционной системе приложения посылается подтверждение о завершении операции записи. Это дорогой способ, и он может снизить общую производительность сети хранения. Асинхронное зеркалирование, в котором вторая копия данных может кэшироваться, не гарантирует их полную идентичность на зеркалах в случае возникновения проблемы. Однако стоимость этого способа невысока.

Основной фактор выбора между синхронным и асинхронным зеркалированием — производительность. Для приложений пакетной обработки задержка в несколько секунд допустима или даже незаметна. Для систем, передающих транзакции, или интерактивных приложений с интенсивным обменом информации даже секундная задержка может оказаться неприемлемой.

Программный продукт MirrorView обеспечивает непрерывный доступ к данным посредством их зеркалирования между системами EMC CLARiiON. Он предназначен для работы с системами хранения, поэтому никак не влияет на работу хостов. Управление им осуществляется с помощью программного обеспечения EMC ControlCenter Navisphere. MirrorView интегрируется с программным обеспечением резервного копирования SnapView для создания вторичного массива мгновенных копий. Две версии продукта обеспечивают синхронное (Synchronous Mirroring) и асинхронное (Asynchronous Mirroring) зеркалирование.

Расстояние между зеркалируемыми площадками существенно влияет на дизайн (а следовательно, и стоимость) решения. Как правило, до 500 м достаточно обычных каналов Fibre Channel, до 10 км передача может быть осуществлена с использованием длинноволнового волокна между коммутаторами Fibre Channel. Зеркало на расстоянии до 100 км организуется с помощью оптических расширителей, включая технологию DWDM. Свыше 100 км синхронное зеркалирование бывает затруднено из-за проблем с задержками, которые вносит система передачи данных. На расстояниях, превышающих протяженность сети уровня кампуса, могут также возникнуть проблемы обеспечения QoS на границе сети при пересечении трафиком точки сопряжения.