|
Чтобы найти неисправность или, например, определить, что является причиной снижения производительности, приходится потратить немало сил и времени, а значит, и средств.
Замена ПО также может занять массу времени. Но, как известно, время - деньги: пока вычислительная система корпорации простаивает, деятельность предприятия приостанавливается, компания теряет прибыль. Но деньги - это не только время, но и надежность и безопасность операций с данными, ведь потеря иной транзакции или, наоборот, появление фальшивой электронной «платежки», созданной хакером или недобросовестным сотрудником, может нанести компании весьма ощутимый удар. В свою очередь, и надежность и безопасность корпоративной сети в целом вряд ли возможно обеспечить без эффективных средств управления. Между тем существует целый класс систем, способных помочь администратору сети решить проблемы управления приложениями и вычислительными ресурсами корпорации. Эти системы позволяют объединить ресурсы в единую схему, благодаря чему системным администраторам удается по-новому взглянуть на свои корпоративные системы, оптимально планируя потребление ресурсов различными приложениями и пользователями.
Разные системы для разных задач
Можно выделить три больших класса задач, которые способны выполнить системы управления вычислительными ресурсами. Первый - это управление собственно сетями (топологией, трафиком, сетевыми устройствами). Второй - удаленное управление серверами и рабочими станциями. Наконец, третий - управление работой СУБД, промежуточного ПО и приложений, в том числе распределенных. Системы, которые мы рассмотрим, в той или иной степени позволяют обеспечить выполнение любой из перечисленных задач. Разница состоит в том, что можно сделать с помощью данных систем, не прибегая к помощи других программ (или хотя бы не используя продуктов других фирм), а также в том, насколько удобно и естественно применять те или иные системы по отношению к этим задачам.
Включенные в обзор продукты представляют собой нечто большее, чем просто системы для управления определенными классами объектов. Это платформы, позволяющие наращивать собственные возможности путем интеграции с другими приложениями. Например, для управления сетевыми устройствами систему можно интегрировать с приложениями, разработанными производителем сетевого оборудования, с приложениями для управления работой конкретных СУБД, серверов приложений или систем управления предприятием. Основная проблема, которая может возникнуть в этом случае перед системным администратором, - есть ли у разработчика конкретной платформы управления либо у производителя сетевого устройства или приложения интерфейс, позволяющий приложению взаимодействовать с платформой.
Многогранный инструментарий
Для выполнения вышеперечисленных задач инструментарий должен обладать рядом важных функций. Прежде всего необходимы средства мониторинга, управления ресурсами и взаимодействия с пользователями сети.
Мониторинг. Системный администратор должен иметь возможность отслеживать состояние как вычислительной системы в целом, так и ее отдельных компонентов и параметров, причем с той степенью подробности, какая необходима ему для решения конкретных проблем. Наблюдение за работой системы в реальном времени позволяет следить за нагрузкой различных компонентов системы, лучше понимать, какие процессы в ней происходят, вовремя обнаруживать неприятные ситуации и распознавать подсистемы, работающие недостаточно эффективно. Функцию этого типа мониторинга обеспечивают практически все рассматриваемые системы, это базовая возможность, поэтому мы решили выделить ее особо.
Другой тип мониторинга - автоматическое распознавание появления новых ресурсов и их отключения. Поддержка этого свойства способна значительно облегчить жизнь системных и - возможно, даже в первую очередь - сетевых администраторов.
Как еще одну разновидность мониторинга можно рассматривать и инвентаризацию ресурсов системы. Продукты, поддерживающие данную функцию, позволяют составлять отчеты о подключенных к сети устройствах, об аппаратных и программных конфигурациях рабочих станций и т. д.
Во всех перечисленных системах функции мониторинга обеспечиваются посредством механизма управления событиями. Все системы способны собирать и анализировать события, инициированные различными элементами вычислительной системы. Зафиксированные события регистрируются и заносятся в хронологические базы данных. Анализ событий происходит, как правило, сразу после их обнаружения. Обработка событий происходит в соответствии с заранее определенными наборами правил - «политиками». Большинство «политик» обычно поставляется вместе с системами управления либо с ПО производителей сетевых устройств и приложений. Разработкой «политик» частенько занимаются также независимые разработчики, системные интеграторы, иногда - сами сотрудники информационной службы.
На основе анализа баз данных, содержащих хронологию событий, можно судить об эффективности использования ресурсов. Как правило, возможности анализа, имеющиеся в средствах управления ресурсами (если таковые вообще предусмотрены), дают лишь общее представление об использовании тех или иных ресурсов. Для получения более детальной информации рекомендуется применять СУБД, способные работать с форматами баз данных, используемых для хранения событий, либо продукты, предназначенные для анализа событий, производства третьих фирм.
Управление ресурсами. Помимо мониторинга желательно иметь возможность активно вмешиваться в работу информационной системы. В частности, это необходимо при возникновении критических ситуаций - выхода отдельных параметров системы за допустимые границы, отказа устройств, получения сигналов от датчиков, например следящих за противопожарной безопасностью и т. д. Такие ситуации обычно требуют по крайней мере немедленного оповещения ответственных должностных лиц. Оповещение о критических ситуациях основывается на механизме событий и может реализовываться различными способами - от особой визуализации на карте, имеющейся на консоли системного администратора, до отправки сообщений по электронной почте или пейджинговой связи. Особенности обработки критических ситуаций определяются различными «политиками».
Очень полезной функцией систем управления ресурсами является своевременное оповещение администратора о сбоях и критических ситуациях. Обычно это обеспечивается путем выставления нескольких пороговых значений: одни из них считаются границами потенциально опасных состояний, а другие - действительно критическими границами. Подобные возможности есть практически у всех систем. В составе OpenView, кроме того, имеются средства моделирования и долгосрочного прогнозирования поведения сетей. В других продуктах аналогичных средств пока нет. Производители планируют реализовать их в следующих версиях, а пока рекомендуют продукты третьих фирм.
Когда сеть насчитывает более 100 компьютеров, установка или обновление ПО превращается в весьма сложную проблему. Некоторые продукты (Tivoli, OpenView, TNG) обеспечивают удаленную установку программ и тиражирования конфигураций с помощью встроенных средств. Тиражирование конфигураций возможно также с помощью Novell Z.E.N.works.
Встроенные средства разграничения доступа к ресурсам корпоративной вычислительной системы имеются в системах Unicenter TNG, Tivoli и в семействе программ Solstice Manager. Эти средства дополняют функции безопасности операционных систем и позволяют определить наборы ресурсов и функций, доступных тому или иному пользователю. ManageWise обеспечивает эти возможности, опираясь на средства управления доступом системы каталогов NDS и функции управления пользователями и рабочими станциями продукта Z.E.N.works.
В идеале для каждого пользователя определяется операционная среда, с которой он должен работать в соответствии со своими должностными обязанностями. Эта среда появляется перед пользователем каждый раз, когда он подключается к сети, и оказывается одинаковой (настолько, насколько позволяют ресурсы ПК) на любой рабочей станции. Таким образом можно, например, избежать запуска нежелательных программ, самовольной модификации среды ОС, запретить доступ к флоппи-дисководу, ограничить набор действий пользователя при работе с приложениями и пр.
Взаимодействие с пользователями (Helpdesk). Рядовые пользователи корпорации довольно часто обращаются в отделы информатизации с просьбой помочь им решить те или иные проблемы. Подавляющее большинство вопросов систематически повторяется. Для сокращения времени на обработку вопроса бывает целесообразно заготовить набор шаблонов с описанием решений различных проблем. Автоматизировать эту внутрикорпоративную службу техподдержки помогают системы оперативной технической помощи. Средства организации оперативной технической помощи входят в состав OpenView, Unicenter TNG и Tivoli. Остальные производители рекомендуют использовать продукты третьих фирм.
Расходы ради экономии
|
Еще один источник возможных простоев - необходимость заменить ПО или установить «заплатку» к нему. Эта задача не вызывает особых сложностей при условии, что предприятие располагается компактно: вся работа выполняется всего за несколько часов (обычно ночью). Если же у компании в разных концах города имеются связанные единой компьютерной сетью отделения (эта схема типична, например, для коммерческих банков средней руки, страховых и торговых компаний), то все становится гораздо сложнее. В таком случае задача решается вполне успешно и в срок, если есть возможность установить ПО централизованно. Если замена происходила ночью, то уже на следующее утро пользователи приступят к работе с модифицированным продуктом, скорее всего, даже не заметив каких-либо перемен в его работе. О подобном опыте работы с клиентами рассказали в Центральном московском депозитарии.
Вторая большая статья экономии средств - строгий учет ресурсов системы. Как правило, оценка объемов необходимых закупок производится на глазок. В результате предприятие делает массу ненужных затрат: какого-то оборудования оказывается с избытком, а какого-то опять не хватает. Если совершенно четко известно, например, сколько в компании имеется компьютеров, какие на них стоят процессоры, системные и видеоплаты, сколько у каждой из машин оперативной и дисковой памяти, то в этом случае можно, во-первых, сократить к минимуму перерасход средств на закупку дополнительного оборудования, комплектующих и программ (ведь не секрет, что нынешнее весьма ресурсоемкое ПО отнюдь не на всяком компьютере будет нормально работать). Кроме того, строгий учет ресурсов позволит минимизировать число необходимых лицензий на ПО (в особенности, если часть лицензий уже закуплена), а в сочетании с мониторингом производительности дает возможность оперативно перераспределять ресурсы, устраняя узкие места в системе за счет уже имеющегося оборудования и ПО.
Следует заметить, что реальную оценку потерь компании, а также экономии средств за счет внедрения системы управления вычислительными ресурсами можно делать только в том случае, когда на предприятии ведется систематический учет различных потерь, с одной стороны, и стоимости инфраструктуры - с другой. Если такого учета нет, то и эффективность системы вряд ли удастся объективно оценить в денежном выражении. Придется либо делать чисто гипотетические оценки, либо довериться анализу окупаемости средств, сделанному кем-нибудь из западных клиентов производителя понравившейся системы.
Как показывают проведенные IDC результаты исследований, срок окупаемости системы управления вычислительными ресурсами у клиентов на Западе обычно составляет от 6 до 12 месяцев (для отечественных заказчиков оценки окупаемости будут, вероятнее всего, другими, поскольку при примерно равных ценах на инструментарий соотношение стоимостей других компонентов информационных инфраструктур систем корпораций иное, чем на Западе). Приведенные выше оценки могут очень сильно варьироваться в зависимости от того, какого рода задачи решает заказчик с помощью своей компьютерной системы. Исследования, в частности, показали, что если необходимо контролировать от 1000 и более узлов, то внедрять системы управления сетями и вычислительными ресурсами, как правило, экономически выгодно. Управление меньшим числом узлов оказывается оправданным с финансовой точки зрения в случаях, когда нормальное функционирование сетевой компьютерной системы очень важно для бизнеса компании. Впрочем, в последнее время производители средств управления стараются предложить выгодные ценовые условия и для относительно небольших сетей. Эти шаги позволят производителям расширить круг потенциальных клиентов, а клиентам - на деле познакомиться с системами управления сетями и вычислительными ресурсами и научиться эффективно их использовать.
Готова ли Матушка Россия?
Беседуя с экспертами, мы часто спрашивали их мнение и по такому вопросу: готов ли отечественный рынок к тому, чтобы принять и использовать системы управления вычислительными ресурсами? Некоторое время корпоративные пользователи присматривались к продуктам этого класса, но в последние полгода объемы продаж этих систем значительно выросли. В России в той или иной степени продаются все приведенные в обзоре системы. Крупных инсталляций не очень много - едва ли больше сотни, но инсталляций с числом узлов в несколько десятков и сотен уже достаточно много. Так что, похоже, время для внедрения систем управления вычислительными ресурсами уже настало - рассвет забрезжил, но до полудня еще далеко.
Пользователи рассказывают
Национальный резервный банк
Соколов считает, что эффективные средства управления имеются сегодня только для мэйнфреймов и сетей Novell. Собственно, из-за наличия развитых средств управления, реализованных в продуктах Novell, было отдано предпочтение сетям на базе NetWare вместе с NDS и ManageWise. (Соколов является приверженцем системы каталогов NDS, поскольку она обеспечивает высокую степень защиты от несанкционированного доступа: вся работа пользователя с ресурсами сети происходит только посредством NDS.) По мнению Соколова, такой набор средств позволяет свести к минимуму численность персонала, обслуживающего сеть (на одного такого сотрудника сейчас приходится около сотни простых пользователей). В системах Novell очень хорошо организовано иерархическое управление ресурсами. Управление сетью должно строиться так же, как управление корпорацией, - со строгой иерархией внутри структуры. Без иерархии очень сложно добиться порядка в управлении, а без порядка вряд ли возможно нормальное функционирование сложной системы.
Серьезной проблемой, не имеющей пока приемлемого решения ни в одной из систем управления сетями и ресурсами, является отсутствие развитых средств анализа журналов событий. В результате работа системного администратора по анализу журналов событий превращается в кошмар. Например, чтобы понять, кем запущен некий подозрительный процесс на Unix-сервере, приходится вручную искать звенья цепочки процессов-родителей и процессов-потомков до тех пор, пока не обнаружится, что какой-то процесс был инициирован одним из пользователей. Естественно, чтобы отследить такую цепочку, системный администратор должен в деталях знать особенности организации процессов в среде Unix. В конечном итоге отсутствие развитых средств анализа журналов крайне затрудняет работу системного администратора, так как не позволяет адекватно воспринимать происходящее в системе.
Банк «Московский деловой мир» (МДМ)
Тамбиев считает, что в принципе без систем такого типа банк обойтись может. До поры до времени и МДМ жил без такой системы. Информационная инфраструктура банка росла по кускам, формировалась концептуально разрозненной, разнородной, поэтому очень трудно было
выработать единую политику в отношении ее дальнейшего развития. Продукт Unicenter TNG стал связующей платформой, основой всей инфраструктуры информационной системы банка. По словам заместителя начальника управления информационных технологий Леха Гудалевича, управление аппаратурой, программами (СУБД, серверами транзакций, почтовыми и прикладными системами), системой безопасности - все теперь «завязано» на TNG.
Оба собеседника едины в своем мнении о том, что продукты для управления компьютерными сетями и системами (Unicenter TNG и ему подобные) упорядочивают работу с вычислительными ресурсами, заставляя руководителей подразделения тщательно планировать потребление ресурсов, а пользователей - правильно работать с этими ресурсами. Когда есть единая схема имеющихся в распоряжении ресурсов, информационную систему гораздо легче развивать и наращивать.
И тем не менее одним из главных мотивов приобретения продукта был мотив экономический - сокращение простоев, а также периодов неправильного, неоптимального функционирования системы и как результат - «радикальное» (по определению Гудалевича) повышение отказоустойчивости информационной системы корпорации. По оценкам Тамбиева, за счет одной только службы взаимодействия с пользователями система окупится примерно за два года, а с учетом всех возможностей системы это произойдет значительно раньше.
Сейчас банк рассматривает вопрос о переводе управления информационных технологий на работу по соглашению об уровне услуг (Service Level Agreement). Если это произойдет, то ИТ-управление станет своего рода поставщиком информационных услуг для банка. Чтобы понять, как соглашение об уровне услуг действует на практике, МДМ изучает опыт западных банков (наши финансовые учреждения по этой схеме не работают, да и на Западе их пока еще не так много).
Естественно, у специалистов из банка МДМ имеется и ряд претензий к Unicenter TNG. Продукт весьма требователен к ресурсам, в частности к объемам оперативной памяти. Не совсем понятна схема комплектования продукта различными функциональными модулями (чувствуются последствия многочисленных покупок компанией Computer Associates других фирм). Интерфейс системного администратора кажется противоречивым - нет единого стандарта работы с разными функциями продукта. Так, некоторые очень близкие по смыслу вещи приходится делать по-разному. Некоторые функции почему-то реализованы только для Solaris или только для NT.
Центральный московский депозитарий
И наконец, самое главное - Unicenter TNG позволяет эффективно решать задачи, стоящие перед специалистами ЦМД. Как пояснил Максим Пятницкий, менеджер по информационным технологиям, ЦМД имеет ряд компаний-клиентов - паевых инвестиционных фондов. Для этих компаний ЦМД разрабатывает системы для автоматизации их прикладной деятельности, а также оказывает услуги по их сопровождению. Романов вспоминал, как до перехода на Unicenter
TNG специалисты ЦМД тратили массу сил на то, чтобы заложить в разрабатываемые продукты возможности по дистанционному управлению создаваемыми системами.
С появлением в компании системы TNG разработка значительно упростилась. Теперь специалисты пишут модули-агенты TNG, встраиваемые в прикладное ПО и поставляемые вместе с ним. В результате сотрудники подразделения информационных технологий получили возможность осуществлять удаленный мониторинг и управление программными системами, установлеными в офисах заказчиков. В случае появления сбоя есть возможность попытаться быстро провести диагностику и исправить ситуацию, не тратя времени на выезд к клиентам (тем более что некоторые из них находятся в Подмосковье). Раньше ЦМД приходилось для этих целей держать специальную команду специалистов, готовых выехать к заказчику в любой момент. Таким образом, время простоя заказчиков существенно сокращается, уменьшаются и издержки самого ЦМД.
Еще одно важное преимущество дистанционного управления проявляется при необходимости заменить разрабатываемое в ЦМД ПО. По словам директора программно-технического обеспечения Геннадия Дурнева, потребность в этом возникает очень часто, что объясняется частыми изменениями, вносимыми в российское законодательство. К процессу замены предъявляются весьма жесткие условия: замена должна проводиться в нерабочее для паевых инвестиционных фондов время, причем она должна осуществляться у всех клиентов одновременно. Unicenter TNG помогает решить и эту проблему, позволяя заменять ПО на сотнях и тысячах компьютеров одновременно. Раньше для проведения этой процедуры приходилось выезжать к заказчикам, работая днем и ночью в субботу и воскресенье и рискуя не успеть объехать все точки. Сейчас замена ПО происходит за ночь.
Романов также отметил удобство логической организации работы с объектами в рамках реализованной в Unicenter TNG идеологии бизнес-процессов.