Появление новых программ управления аварийными ситуациями поможет сетевым администраторам быть всегда в курсе и устранять неисправности в работе серверов прежде, чем сбои успеют серьезно нарушить работу сети.


ПАССИВНЫЕ ПРОГРАММЫ
ПРОГРАММЫ, РАЗМЕЩАЕМЫЕ НА СЕРВЕРЕ
СИСТЕМЫ, БАЗИРУЮЩИЕСЯ НА СТАНДАРТАХ
СЛУЖБЫ ПРЕДУПРЕЖДЕНИЯ
ПЕРСПЕКТИВЫ ИСПОЛЬЗОВАНИЯ WEB

На заре клиент-серверных вычислений компьютерная отрасль уделяла большое внимание разработке приложений управления сетью, но практически игнорировала проблему управления серверами. В результате механизмы управления аварийными ситуациями, предупреждающие администраторов сетей об аварийной остановке сервера или о том, что сервер находится в процессе аварийной остановки, отсутствовали. Чаще всего администраторы сетей узнавали о сбоях в работе сети лишь тогда, когда им звонили по телефону раздраженные пользователи.

Однако по мере того, как серверы приобретали все большее значение в повседневной деятельности множества организаций, отрасль начала осознавать важность проблемы управления аварийными ситуациями.

В ответ на растущую потребность в средствах управления аварийными ситуациями многие поставщики разработали программы, способные информировать (а иногда и предупреждать заранее) администраторов сетей о сбоях в работе серверов. Разработанные программные средства обладали самыми разными наборами возможностей, занимая весь спектр от элементарных систем уведомления, поставляемых бесплатно вместе с оборудованием, до сложных, основанных на стандартах приложений, интегрированных в крупные платформы управления сетью. Первоначально большинство этих продуктов было ориентировано главным образом на среду NetWare, так как именно NetWare была - и продолжает оставаться - наиболее популярным сервером для локальных сетей. Однако выпущенные недавно программные продукты нарушают сложившуюся традицию, поскольку обеспечивают поддержку таких операционных систем, как Windows NT, OS/2 и Unix.

ПАССИВНЫЕ ПРОГРАММЫ

Самые первые системы управления серверами представляли собой пассивные программы, написанные системными интеграторами или администраторами сетей, которым от безвыходности приходилось самим разрабатывать примитивные средства предупреждения. Такие программы могли, например, выполнять логическую циклическую проверку перечня работающих серверов, непрерывно контролировать возможность пользователей входить в систему, а также выполнять ping. В некоторых случаях эти продукты распространялись в качестве условно-бесплатного программного обеспечения. Классическим примером здесь может служить программа AlertPage, разработанная компанией Geneva Software. Вначале AlertPage была создана для внутреннего использования компанией Denmac Systems, системным интегратором и поставщиком комплексных систем. Впоследствии от Denmac отделилась компания Geneva Software, занявшаяся разработкой программного обеспечения. Теперь Geneva предлагает версию AlertPage под названием AlertPage Enterprise. Данная программа генерирует предупреждения для серверов в таких операционных системах, как NetWare 3.х, NetWare 4.х и Windows NT 3.5.

AlertPage - это клиентское приложение для Windows 95 или Windows NT. С помощью примитивных протокольно-независимых интерфейсов прикладного программирования (API) программа связывается с сервером и контролирует его системный журнал. Будучи клиентской, программа следит за сервером в пассивном режиме, не вмешиваясь в его работу; она лишь читает записи в журнале событий, создаваемом операционной системой сервера.

AlertPage задает указатели, связывающие журнальные файлы и ее внутреннюю базу данных, разбирает текст журнального файла в поисках признаков события и в необходимых случаях генерирует соответствующие предупреждения. Последние выдаются в форме описательных сообщений и могут посылаться на алфавитно-цифровые пейджеры или в большинство прикладных программ электронной почты. Управляемые устройства можно объединить в логические группы, а предупреждения о сбоях направлять в соответствующие логические группы адресатов.

Президент компании Geneva Энди Дененберг согласен, что AlertPage основана на довольно простом принципе, но, по его мнению, как раз простота этой программы обеспечивает высокий уровень ее окупаемости. Для администраторов локальных сетей, не имеющих достаточно времени или опыта для установки и работы со сложной системой управления, программа AlertPage может оказаться прекрасной альтернативой. Более того, поскольку программа клиентская и имеет пассивный характер, она не способна нарушить работу сервера. Как считает Дененберг, независимо от того, насколько безопасны в этом отношении аналогичные серверные программы, до тех пор, пока разработчик программы не проведет тесты на совместимость со всеми возможными сочетаниями аппаратуры и других программ, опасность появления сбоя сервера из-за несовместимости или по какой-то иной причине исключить нельзя. Программа AlertPage Enterprise продается в виде лицензионных пакетов, причем цена пакета варьируется от 695 долларов за комплект лицензий для пяти серверов до 5500 долларов за лицензию для неограниченного количества устройств.

ПРОГРАММЫ, РАЗМЕЩАЕМЫЕ НА СЕРВЕРЕ

В отличие от клиентских приложений управления аварийными ситуациями, аналогичные серверные программы выполняются в фоновом режиме, следя за работой сервера. Обычно серверные приложения имеют нестандартную природу в том смысле, что они взаимодействуют с операционной системой сервера не через стандартные API, а через опубликованные API поставщика операционных систем. Такие программы, как правило, обладают более широким, нежели клиентские программы, набором функций. Благодаря наличию добавочных модулей они не только выдают предупреждения, но и позволяют оператору проводить настройку основных параметров, оптимизацию быстродействия и генерировать отчеты.

Если говорить о среде NetWare, то компания Frye (входящая теперь в состав Seagate Software) была основным производителем инструментов уведомления и предупреждения, размещаемых на сервере. Первым продуктом, разработанным компанией Frye, стала программа Frye Utilities for NetWare (FUN). Впоследствии к ней были добавлены два интегрированных модуля управления - система раннего оповещения (NetWare NetWare Early Warning System - NEWS) и система управления консолью NetWare (NetWare Console Commander - NCC).

Утилиты предупреждения NEWS и NCC могут работать в виде загружаемых модулей NetWare на серверах NetWare 3.х или NetWare 4.х. Не вмешиваясь в работу сервера, они способны собирать статистические данные о его работе, используя для этого те же механизмы API, что и утилита NetWare Monitor. Через протокол SPX данные утилиты взаимодействуют с консолью рабочей станции под DOS, способной сравнивать значения 75 параметров с заранее заданными пороговыми величинами. Если значение какого-либо из параметров превышает установленный порог, то утилита NEWS может послать предупреждение по электронной почте или на пейджер, запустить исполняемые и пакетные процедуры, а также, совместно с утилитой NetWare Console Commander, начать выполнение заранее составленного сценария.

Пакет Seagate Server Management Suite объединяет все три упомянутых продукта в один комплект. Цена пакета 770 долларов на один сервер. Данный продукт приобрел хорошую репутацию и получил много благоприятных оценок в специализированных публикациях. Однако DOS-подобный интерфейс, а также ориентация на NetWare 3.х и протокол IPX свидетельствуют о его солидном возрасте, а в современном мире 32-разрядных графических интерфейсов и гетерогенных сред это, увы, не в почете.

Seagate располагает еще одним продуктом, приобретенным ею также в результате слияния компаний. Продукт называется LANAlert и следит за работой серверов NetWare и Windows NT с помощью агента, а тот взаимодействует с сервером управления в NetWare. Сервер управления собирает данные и предупреждения от агентов и посылает прерывания (traps) на Windows- или Unix-консоль, которая, в свою очередь, может ретранслировать сообщение оператору либо по электронной почте, либо на пейджер. Программа Message Forwarding Gateway (шлюз ретрансляции сообщений) также принадлежит компании Seagate. Преобразуя предупреждения IPX в прерывания SNMP по TCP/IP, программа обеспечивает сопряжение между нестандартной архитектурой LANAlert и стандартизованными системами.

Многие разработчики пытаются объединить в серверных агентах управление аварийными ситуациями и оптимизацию производительности, но качество реализации одной из этих функций неизбежно уступает качеству исполнения другой. Например, программа NetTune Pro, выпущенная компанией BMC Software, прекрасно справляется с задачами управления производительностью. С помощью интеллектуального серверного агента она выдает подробные рекомендации относительно того, как сервер NetWare или NT следует настроить для его оптимальной работы. Однако NetTune Pro довольно несовершенна в том, что касается выдачи предупреждений о возможных сбоях, и поэтому большинству организаций, имеющих данную программу, приходится приобретать дополнительное программное обеспечение для управления аварийными ситуациями. (Более подробную информацию о программе NetTune Pro см. в статье "Сервер настраивается сам", "LAN Magazine/Русское издание", февраль 1996 г.)

Применив свою технологию экспертных агентов (Server Expert Agent), Seagate добавила к программе LANAlert такие функции управления производительностью, как настройка основных параметров сервера и выдача рекомендаций по заданию пороговых величин. В этой конфигурации LANAlert может оказаться неплохим компромиссом для тех предприятий, где необходимо как управление эффективностью, так и уведомление о возможных сбоях в работе серверов NetWare и NT. Тем не менее некоторые компании все же могут посчитать экспертную систему и поддержку доставки предупреждений в LANAlert недостаточно развитыми по сравнению со специализированными продуктами.

СИСТЕМЫ, БАЗИРУЮЩИЕСЯ НА СТАНДАРТАХ

Учитывая широкое использование архитектуры SNMP для управления гетерогенными сетями, этот протокол вполне логично было бы адаптировать к задаче управления серверами. В 1992 и 1993 гг. Группа инженерной поддержки Internet (IETF) утвердила документы RFC 1298 и RFC 1420, описывающие стандарт SNMP поверх IPX. Этот стандарт обеспечивает передачу сообщений по протоколу SNMP без их дополнительного преобразования непосредственно в базу управляющей информации (MIB) на сервере NetWare.

В том же, 1993, году IETF был представлен на утверждение стандарт MIB для описания компьютерной системы. Данный документ, опубликованный под номером RFC 1514, определяет базу управляющей информации о ресурсах главной ЭВМ (Host Resourses MIB). База описывает все аппаратные и микропрограммные компоненты компьютера, а также его прикладное программное обеспечение и файловые системы; после ее реализации менеджер SNMP сможет направлять к ней запросы независимо от того, на какой платформе работают сервер и менеджер SNMP. В прошлом возможности контроля за функционированием серверов определялись способностью операционной системы следить за состоянием аппаратной части и при необходимости выдавать соответствующие предупреждения. Другое решение состояло в том, что поставщик операционной системы создавал специальные приложения для каждой отдельной модели сервера, имеющейся на рынке.

По словам одного из соавторов идеи базы MIB, Пита Грилло из компании Network, MIB, описывающая ресурсы главной ЭВМ, была одной из первых баз управляющей информации, не предназначавшаяся для анализа трафика и протоколов и изначально ориентированная не на управление сетью, а на управление системами.

Хотя база управляющей информации не описывает прерываний и системных предупреждений, она предоставляет стандартный базис для управления системами. Такие поставщики и разработчики операционных систем, как Compaq, Hewlett-Packard, Sun Microsystems, Microsoft и Novell, уже разработали собственные MIB, с определениями счетчиков, порогов и прерываний, с помощью которых обнаружение и управление аварийными ситуациями может осуществляться стандартным образом. Благодаря этим базам управление серверами становится частью корпоративной системы управления, поскольку они (базы) позволяют серверам посылать прерывания на консоли корпоративной системы типа HP OpenView (Hewlett-Packard), NetView/AIX (IBM), SunNet Manager (Sun) и Spectrum (Cabletron).

Стандартизованная MIB, описывающая ресурсы главной ЭВМ, и аналогичные базы управляющей информации, разработанные различными компаниями, могут быть настроены на работу с любой операционной системой. Например, приложение управления сервером Insight Manager компании Compaq поставляется бесплатно с каждым сервером этой компании. Независимо от того, под какой операционной системой работает сервер - NetWare, Windows NT, OS/2 или SCO Unix, база управляющей информации сервера Insight может посылать прерывания менеджеру SNMP, оповещая консоль о таких событиях, как перегрев аппаратуры или неисправность дисковода.

Поставщики операционных систем способны создавать свои базы MIB для конкретных параметров операционной системы, что позволяет администраторам сетей получать более подробную информацию о работе сервера. Например, в разработке компании Novell, названной NetWare Management Agent 2.1 (NMA), база управляющей информации собирает данные почти о пятистах параметрах сервера NetWare, начиная со свободной памяти, не занятой программными модулями NetWare, и заканчивая объемом информации, находящейся в очереди на печать. Microsoft поставляет операционную систему Windows NT с четырьмя MIB, поддерживающими серверы и совместимыми с протоколом DHCP, службой именования объектов в Windows (WINS) и с другими MIB, удовлетворяющими стандарту RFC 1213 (MIB-2).

Помимо разработки собственных баз управляющей информации для выпускаемых ими продуктов, многие поставщики серверов и операционных систем создали и свои программы управления на базе стандартной технологии MIB. Например, компания Novell пополнила рынок платформ системного и сетевого управления новой разработкой, получившей название ManageWise. В крупных организациях, однако, этот продукт используется лишь в качестве средства управления системами, поставляющего данные для другой программы, которая обеспечивает управление корпоративной сетью.

Тем не менее версия 2.1 этого продукта, поставляемая с августа нынешнего года, обеспечивает также полную поддержку Windows 95 и поддержку управляющего агента для Windows NT, базирующегося на протоколе SNMP. Агент NT пока еще не столь богат функциями, как агент NMA, однако оказалось, что это чрезвычайно полезный продукт в смешанных средах NetWare и NT. В ManageWise могут быть включены и определения MIB других поставщиков, базирующиеся на протоколе SNMP, что позволяет программе управлять агентами, работающими под другими операционными системами, и получать от них предупреждения о возможных сбоях.

ManageWise обеспечивает не только управление аварийными ситуациями, но и управление сетью, анализ пакетов, защиту от вирусов, инвентаризацию и управление настольными системами во всех основных операционных системах. Эта прикладная программа выполняет и некоторые функции оптимизации: она позволяет администраторам сетей собирать данные о работе серверов, анализировать тенденции и на основании полученных данных составлять графические отчеты. Как считают в Novell, богатство и разнообразие функций ManageWise делает ее очень полезным инструментом поиска неисправностей, когда наблюдение за работой всех компонентов сети является критически важным. Для работы с ManageWise нужно приобрести лицензию на сервер и на каждого пользователя; версия программы для 250 пользователей стоит 6995 долларов.

Продукт управления, разработанный Microsoft, - сервер управления системами (Systems Management Server, SMS) был традиционно ориентирован на решение задач управления системами, а не на обнаружение аварийных ситуаций и сбоев. Однако благодаря недавнему приобретению Network Managers Corp. (NMC) Microsoft включила в новую версию SMS, имеющую порядковый номер 1.2, некоторые дополнительные функции. С их помощью события в операционной системе Windows NT будут преобразовываться в прерывания протокола SNMP.

Компания Seagate вынашивает грандиозные планы по созданию платформы управления. Она намеревается разработать эту платформу на основе своего продукта NerveCenter Pro. С помощью консоли управления SNMP, данный коррелятор событий может обрабатывать и реагировать на события в сетевых устройствах и системах Unix. А используя программу LANAlert, NerveCenter Pro может реагировать на события на серверах Windows NT и NetWare. Текущая версия NerveCenter Pro нуждается в SNMP-совместимой консоли управления стороннего разработчика. Такой программой может быть, например, OpenView Network Node Manager (NNM) компании Hewlett-Packard, хотя, по словам Роберта Куиллена, специалиста из компании Seagate Enterprise Management Software West (SEMS West), версия NerveCenter Pro для Windows NT, которая появится на рынке в конце этого года, может работать как независимое приложение, и консоли сторонних компаний ей не понадобятся.

Наиболее совершенным вариантом платформы управления системами является группа продуктов ТМЕ, разработанных компанией Tivoli. Название этой компании долгое время ассоциировалось с такими стандартами, как среда распределенных вычислений (DCE) и среда распределенного управления (DME). Теперь же Tivoli создала группу модульных программ, призванных обеспечить всестороннее управление распределенной средой клиент-сервер. Компания использует комбинацию определенных методов и архитектур, в частности SNMP, серверных агентов и пассивной обработки журналов.

Например, в организации с большим числом серверов Compaq, работающих под операционной системой Windows NT, группу программ ТМЕ можно использовать для получения предупреждений от приложения Insight Manager, а также агента Tivoli для NT, запрашивающего информацию более чем о 500 параметрах и величинах у NT Performance Monitor и NT Registry. Дополнительную информацию о работе серверов администраторы могут получить от специального процесса Tivoli для чтения и разбора текста таких журналов, как NT System, Security и Application Event.

Программы ТМЕ имеют также функции оптимизации и службы управления системами. В качестве примера здесь можно назвать модули управления конфигурацией и учета системных ресурсов, встраиваемые в среду ТМЕ. Продукт ТМЕ - не такое уж дешевое удовольствие: обычно их приобретают организации, входящие в число 50 компаний с наибольшим уровнем доходов и тратящие от 250 тысяч до 1 миллиона долларов на управление крупными сетями, объединяющими тысячи серверов.

В настоящее время протокол SNMP - это единственная технология, обеспечивающая взаимодействие различных платформ управления и интеграцию управления серверами в более обширную среду управления гетерогенными системами. Однако у платформ, базирующихся на стандартах, есть и определенные недостатки: они неизбежно дороже и сложнее как в установке, так и в управлении. Крупным предприятиям зачастую приходится организовывать специальные отделы со значительным числом сотрудников, единственная задача которых - "управление платформой управления".

Кроме того, несмотря на очевидную адаптируемость архитектуры, эти продукты довольно медленно реагируют на появление новых программ и технологий в смысле их поддержки и интегрирования. Например, сейчас имеется довольно мало базирующихся на протоколе SNMP программ управления, способных поддерживать службу каталогов NetWare (NDS) компании Novell. Даже в самой Novell признают, что широкая поддержка прерываний NDS в системе ManageWise вряд ли будет реализована раньше середины 1997 года. Программа же AlertPage, наоборот, уже сейчас может следить за системными журналами и выдавать предупреждения об ошибках в NDS, а следующая версия программы LANAlert (по сведениям, имевшимся на момент публикации, она должна была быть выпущена два месяца назад) будет обеспечивать регистрацию параметров сервера NDS.

СЛУЖБЫ ПРЕДУПРЕЖДЕНИЯ

Предупреждение о возможных сбоях и неисправностях в сети является необходимой частью любой системы управления аварийными ситуациями. В конце концов, даже самая совершенная программа оказывается бесполезной, если она не содержит в себе механизма доставки предупреждений. Мигание красной пиктограммы или появление сообщения в 25-й строке экрана в среде NetWare имеют смысл лишь в том случае, если оператор круглосуточно дежурит у пульта. Обычно несложные программы управления, как клиентские, так и серверные, включают в себя механизмы доставки предупреждений в качестве одного из своих стандартных элементов. Этого, однако, нельзя сказать о платформах управления: такой механизм приходится приобретать для них отдельно в виде дополнительного модуля. Например, для доставки предупредительных сообщений ManageWise требуется дополнительный продукт - AlertPage for ManageWise, разработанный компанией Geneva. В разных программных продуктах механизмы доставки предупреждений могут быть реализованы по-разному. Да и сами программные продукты обеспечивают разный уровень поддержки всевозможных систем электронной почты и пейджинговой связи. Некоторые из них могут поддерживать только почтовый интерфейс стандарта MHS, тогда как другие (например AlertPage) - практически все известные типы архитектур электронной почты.

Программа AlertPage очень хорошо справляется и с поддержкой пейджинговой связи. Генерируемые программой предупреждения могут быть разбиты на логические группы, относящиеся к одному физическому устройству и адресуемые соответствующему специалисту или группе специалистов. Предупреждения можно также обрабатывать с помощью электронного расписания дежурств и таким образом определять, кто в конкретный момент отвечает за данное устройств.

Чтобы в полной мере воспользоваться преимуществами, предоставляемыми приложениями типа AlertPage, дежурные администраторы должны перейти на использование пейджеров. Тогда они смогут получать предупреждения с описанием типа аварийной ситуации и названием неисправного устройства. Думается, цифровые сообщения в виде адресов управления доступом к среде передачи (Media Access Control - MAC), представляющие собой цепочку из шестнадцатеричных цифр, мало кому по душе. Сейчас компания Geneva работает над совершенствованием предложенной недавно новой системой персональной связи (Personal Communication System - PSP). Эта технология, по сути, является архитектурой цифровой связи следующего поколения и предвестником двусторонней пейджинговой связи.

ПЕРСПЕКТИВЫ ИСПОЛЬЗОВАНИЯ WEB

Похоже, что сейчас все средства компьютерной связи тяготеют к использованию возможностей World Wide Web, и управление серверами не составляет исключения. Некоторые поставщики программного обеспечения уже анонсировали консоли управления, базирующиеся на Web, и сейчас несколько крупных компаний образовали консорциум с целью разработать проект группы стандартов управления сетями и системами на базе технологии Internet. Эта группа стандартов получила название управление корпоративными сетями на базе Web (Web-Based Enterprise Management - WBEM), и разрабатывают их входящие в консорциум компании BMC Software, Cisco Systems, Compaq, Intel и Microsoft.

Сформулированные консорциумом предложения направлены на создание единого интерфейса управления всеми сетями, системами и приложениями. Интерфейс должен освободить администраторов сетей от необходимости связываться с приложениями управления через специальные консоли. Используя технологию Web, администраторы смогут получать доступ к этим приложениям через любой совместимый с форматом HTML браузер Web и применять меры защиты, реализованные в рамках протокола HTTP.

Предложения консорциума охватывают три области: стандартную модель данных для описания объектов данных (HyperMedia Management Schema), коммуникационный протокол для передачи в рамках протокола HTTP сложных данных (HyperMedia Management Protocol), и систему управления для сбора данных от объектов управления SNMP и интерфейса управления настольными системами DMI (HyperMedia Object Manager).

В компании Novell, в данный момент не входящей в этот консорциум (что само по себе довольно подозрительно), разрабатываются новые версии ManageWise на основе технологии Java.

Seagate заявила о выпуске в середине 1997 года программы SeaView - логического развития пакета Seagate Network Management Suite. SeaView будет представлять собою консоль управления на базе HTML-браузера и поддерживать операционную систему Windows NT и службу каталогов NDS. По мнению Ларри Кэдлоффа, технического руководителя Группы сетевых систем и управления (Network Systems and Management Group) компании Seagate, FUN и NEWS придется переписать заново для того, чтобы они поддерживали графический интерфейс и NDS. Поскольку такую работу все равно пришлось бы делать, Seagate решила перейти на платформенно-независимую архитектуру. Консоль по-прежнему будет взаимодействовать не с процессами SNMP, а с агентами серверов NetWare и Windows NT.

Консоли, базирующиеся на технологии Web, делают процессы управления независимыми от протоколов и платформ и позволяют администратору сети осуществлять процесс управления из любой точки сети.

Новые технологии пополнят арсенал средств, необходимых администратору сети для обеспечения нормальной работы сети и серверов. До тех пор пока оборудование серверов и их операционные системы не обретут способности самостоятельно устранять неполадки и сбои в своей работе, сетевым администраторам придется держать наготове средства управления аварийными ситуациями. Благодаря этим программам серверы обретут голос и получат возможность выдавать предупреждения о возникновении неисправностей в сети. А значит, администраторы перестанут вздрагивать при звуке каждого телефонного звонка.


Шеннон Гоу - руководитель сетевого отдела компании Fleet Finance. С ним можно связаться через Internet по адресу: shannon.gaw@fleetfin.com