Достаточно ли хорошо ваша платформа управления сетью и вы сами готовы к катастрофическим сбоям сети?
Мерцают огни Кремниевой долины, хакеры гуляют на воле, и каждая неделя приносит известие о кончине очередной, некогда преуспевающей Internet-компании. В такой ситуации управление сетью невозможно игнорировать: система должна быть готова к самому худшему, обладать способностью предвидеть и предупреждать проблемы еще до их появления, а также достойно выходить из ситуаций, когда корпоративная сеть перестает функционировать либо когда компания стала жертвой поглощения другой компанией (или, наоборот, инициатором такого поглощения).
К сожалению, развитие отрасли сетевого управления проходит не без трудностей. Известные платформы подвергаются критике со всех сторон за то, что из-за их сложности развертывание отнимает много времени, причем зачастую оно невозможно без дорогостоящих консультационных услуг. Продукт компании HP OpenView — лидер на рынке сетевого управления, но даже эта компания призналась, что не успевает идти в ногу с новейшими достижениями в данной области. Хорошей новостью стало известие о том, что сейчас она наверстывает упущенное, как, впрочем, и ее конкуренты.
Признанным поставщикам сетевых платформ, равно как и новым игрокам на этом рынке, приходится разрабатывать соответствующее решение для сетей любого типа — VLAN, Fibre Channel, основанных на плотном спектральном мультиплексировании (Dense Wavelength Division Multiplexing, DWDM), или беспроводных микросетей piconet. Причем каждый поставщик имеет собственную (часто запатентованную) технологию. Хотя стандарты начинают складываться, работа над ними далеко еще не завершена.
Возможно, в будущем появятся разумные решения для получения информации со всех видов устройств, оказывающих влияние на работу сети. В настоящее время, если из вашего сервера пойдет дым, брандмауэры не смогут вам ничем помочь. Само по себе выявление вторжений не дает информации о том, когда взломщик собирается унести ваш центральный маршрутизатор. Разумеется, многие компании уже предпринимают шаги по предотвращению подобных случаев, но физическая и сетевая безопасность еще не составляет единое целое. Программное обеспечение управления сетью со временем будет учитывать такие параметры внешней среды, как температура, влажность и сейсмическая активность. Например, если в главном информационном центре кондиционеры выйдут из строя, то программное обеспечение осуществит запуск резервных серверов, и перегревания основного сервера не произойдет.
ОТЗЫВЫ КЛИЕНТОВ
Платформы управления сетью консолидируют управляющую информацию от различных устройств локальной сети, причем во многих случаях она поступает от удаленных агентов. Основное внимание уделяется третьему уровню коммутации, работающему в основном с логическими структурами IP. До недавних пор немногие из платформ могли управлять коммутаторами, и это было главной проблемой, так как сети постепенно переходят от маршрутизации к коммутации. Кроме того, немалые трудности для платформ управления создают выход в глобальную сеть и сторонние услуги — два важнейших аспекта новой сети общего пользования.
Основные поставщики платформ пытаются решить эти проблемы различными путями (см. Таблицу 1). Например, OpenView от HP представляет собой модульную систему и поддерживается более чем 400 поставщиками сетевого оборудования, причем они не только предоставляют соответствующие драйверы для Windows или UNIX, но также разрабатывают агенты управления для среды ОpenView. Крупнейший конкурент HP, Compu-ter Associates, заявляет, что послед-няя версия Unicenter TNG также может управлять практически любым устройством.
Платформы управления сетью довольно дороги — итоговая сумма, включая плату за консультационные услуги, может достигать более миллиона долларов, — но они стоят того, если, конечно, выполняют свои функции. По информации аналитической компании Infonetics Research, американские корпорации теряют в среднем 2% годового дохода из-за полной неработоспособности сети. Возможно, на первый взгляд эта цифра не кажется большой, но при нынешнем состоянии экономики 2% может как раз составить разницу между преуспеванием и финансовой несостоятельностью. Гораздо труднее измерить стоимость потерь в результате частичных отказов сети, которые приводят к низкой производительности работы сети, малой эффективности труда персонала, а то и к потере клиентов.
Кнут Нильсен, менеджер по информации на предприятии по изготовлению одежды Scandinavian Garment Services, пользуется платформой Unicenter TNG для управления корпоративной международной сетью, причем в ее состав входит все: от мэйнфрейма IBM AS/400 до сотен телефонов, работающих по протоколу беспроводного доступа (WAP), которые подключаются к остальной части сети через шлюз Nokia. «Установка новой системы для нас обходится очень дешево и не вызывает трудностей», — подчеркивает он. За 18 месяцев с момента развертывания сети не было ни одного сбоя.
HP также имеет внушительный список благодарных клиентов. Один из них, Дин Гардинер, менеджер по обслуживанию сети в CSR Building Materials, крупнейшей компании-производителе на рынке строительных материалов в Австралии, говорит, что с помощью OpenView проблемы решаются еще до того, как пользователи их осознали.
Но далеко не все так благодушны. «В результате накапливается большое количество ненужного программного обеспечения, — отмечает Джереми Трейси, бывший консультант по сетям и вице-президент инвестиционного банка Goldman Sachs. — Многие компании чувствуют себя так, словно поставщики сетевых платформ управления на них наживаются». Он был так недоволен существующим программным обеспечением управления сетью, что открыл собственную компанию Entuity, разрабатывающую решения для второго уровня коммутации и других новейших сетевых устройств. В этом же направлении работает еще ряд новых компаний. Они пытаются найти иные решения помимо маршрутизаторов, либо «опускаясь вниз» по стеку протоколов до уровня коммутаторов, либо «поднимаясь вверх» на уровень конкретных приложений.
СТРАТЕГИИ КОММУТАЦИИ
Как поставщик, компания HP ведет себя исключительно честно. «Продукт, который мы поставляли ранее, не в состоянии справляться абсолютно со всеми задачами», — признает Пит Зветков, разработчик архитектуры OpenView HP. Последняя версия 6.2, выпущенная в мае 2001 г., впервые предоставляет возможность управления коммутаторами. «Но первая версия функционально весьма ограничена, — предупреждает он. — Она работает только с оборудованием производства Cisco Systems или самой HP».
Новый, улучшенный, вариант программы должен быть доступен уже к концу 2001 г., благодаря сотрудничеству HP с Riversoft, одним из поставщиков решений второго уровня. В конечном итоге это приведет к включению части продукта Network Management Operating System (NMOS) компании Riversoft в будущую версию OpenView. «Наконец-то в HP поняли, что их технология перестала удовлетворять требованиям времени», — говорит Ланс Рэй, главный менеджер Riversoft. Он надеется, что технология NMOS, реализующая расширенные функции управления работой сети, станет фактическим стандартом для управления на втором уровне модели OSI.
Riversoft добилась впечатляющих результатов. Помимо HP она заключила подобные соглашения с Cisco и Intel, в результате ее программное обеспечение оказалось интегрировано в беспроводные сети следующего поколения и будущие «устройства управления» соответственно. Аналитики весьма похвально отзываются о новых разработках: Gartner Group утверждает, что большинство инвесторов корпорации Riversoft уже в этом году получат солидное приращение своих вложений; International Data Corporation считает, что NMOS позволит сократить простои в среднем на 65%, а Aberdeen Group рассматривает слияние OpenView с NMOS как «тихую революцию».
Тем не менее для Riversoft все проходит не так уж и гладко. И даже аналитики заявляют, что стремление компании сделать свой продукт фактическим стандартом слишком уж амбициозно: компания Gartner считает, что, скорее всего, HP будет предлагать NMOS в качестве полезного «расширения», но не включит его в ядро платформы OpenView, а также прогнозирует, что до 2005 г. рынок сетевого управления будет все еще заполнен несовместимыми решениями.
Созданием систем мониторинга второго уровня занимаются и другие авторитетные поставщики, но иными способами. Продукт Eye of the Storm компании Entuity объединяет средства управления для второго уровня со средствами анализа производительности. В результате различные факторы, влияющие на сетевые операции, сводятся к единому показателю. Для каждого порта, устройства или сетевого сегмента вычисляется определенный процент, так называемый обобщенный индекс деградации (Generalized Index of Degradation, GID), на основании которого администратор сети может судить о приближающихся или уже фактически появившихся проблемах. GID отличается от стандартных показателей, таких, как доля используемой пропускной способности и время отклика, тем, что он позволяет оценить значимость конкретного порта для различных приложений и таким образом отражает фактическое влияние возникшей в сети проблемы на пользователей.
Подобный анализ приобретет еще б'ольшую важность, если оправдаются некоторые из прогнозов развития рынка ASP. Теоретически приложения будут арендовать, а не покупать, а компании станут отдавать внешним исполнителям все большее число задач по управлению своей сетевой инфраструктурой. Аренда приложения из пакета Office счасто сводится к покупке ограниченной по времени версии и ее регулярному обновлению, между тем как поддержка всей корпоративной системы электронной почты или «управление цепочкой поставок» является гораздо более сложной процедурой.
РАСШИРЕННЫЕ СТАНДАРТЫ
Даже если вы не хотите отдавать обслуживание сети сторонней организации, существует тенденция к увеличению межсетевых взаимодействий. Если вы уже используете Extranet или снабдили свой персонал ноутбуками, тем самым ваша сеть уже включает в себя офисы других компаний и частные дома сотрудников. По данным агентства Forrester Research, подобные перемены должны привести к появлению спроса на программное обеспечение управления сетью нового типа, — для объединения сетей различных компаний. По прогнозу Forrester, не желающие отказаться от прежних парадигм поставщики решений управления сетью окажутся не подготовлены к такому спросу.
Если вы действительно приобретаете (или арендуете) что-либо у ASP, то вам понадобятся сложные средства мониторинга, чтобы убедиться, что получено именно то, за что заплатили. Компания Micromuse уже осваивает этот рынок, предлагая свой продукт Netcool в качестве средства мониторинга за соблюдением соглашения об уровне сервиса. Micromuse продает Netcool в основном операторам связи и провайдерам услуг в расчете на то, что эти заказчики передадут данный продукт собственным клиентам. В конце концов, если модель ASP имеет право на жизнь, она должна будет доказать, что соответствует заявленным обещаниям. Причем это справедливо как для любого приложения, арендуемого у стороннего поставщика, в том числе и для систем сетевого управления.
К сожалению, отсутствие стандартов может вызвать серьезные неудобства: если система управления ASP не настроена надлежащим образом в соответствии с требованиями клиентов, никто не может быть вполне уверен, что приложение справляется со своими функциями в полной мере. Большинство поставщиков уже структурируют свои данные, основываясь на стандарте Conceptual Information Model (CIM), и планируют передавать их заказчикам и провайдерам услуг с помощью языка XML. Однако расширяемость XML означает, что в действительности он не является фиксированным, так как каждый поставщик может добавить свои собственные расширения к языку, как Netscape и Microsoft поступили с HTML.
Хотя полностью прозрачного взаимодействия между различными системами вряд ли удастся добиться, XML поможет упростить данную процедуру для тех производителей, которые в этом заинтересованы. На разработку дополнительных средств для существующих платформ, а не на их замену особенно нацелены поставщики решений для второго уровня модели OSI и другие начинающие компании. Мало кто признает, что им требуется дополнительное программное обеспечение для нормальной работы, но все хотят иметь возможность интегрироваться с любым уже установленным продуктом.
Единственным исключением является компания Ipswitch, которая заявляет, что ее продукт What?sUp Gold — это все, что нужно для полного решения задачи управления сетью. Правда, ее программа работает на одном компьютере и таким образом не в состоянии измерить нагрузку на индивидуальные порты или процессоры. Поэтому разработчик и не говорит о возможности управлять процессами за пределами сети либо принимать сложные решения, но все эти недостатки компенсируются простотой и низкой ценой.
В то время как стоимость большинства платформ выражается шестизначным числом, полная стоимость всего продукта What?sUp Gold составляет всего 795 долларов. В отличие от платформ управления сетью, для работы которых требуются серверы и мэйнфреймы, данному продукту вполне достаточно 486-го процессора и операционной системы Windows 95. Полнофункциональную версию с ограниченным сроком работы можно бесплатно загрузить с сайта Web компании Ipswitch, при этом, как утверждается, время установки не превысит нескольких минут. Для отрасли средств управления сетью, где могут потребоваться недели для настройки одной системы, это весьма амбициозное заявление.
Конечно же мысль о том, что программа, продающаяся тем же способом, что и текстовый редактор, может быть сравнима с громоздкими и сложными платформами управления сетью, может показаться абсурдной, но клиенты Ipswitch с этим не согласны. В их число входит руководство компании Deutsche Flugsicherung, контролирующей воздушный трафик Германии. Компания использует продукт What?sUp Gold, чтобы контролировать работу всех имеющихся компьютеров, а те в свою очередь отслеживают все, что перемещается в одном из самых загруженных воздушных пространств. Данное программное обеспечение непрерывно опрашивает каждое устройство, приводя в действие резервные линии, либо находящиеся в резерве машины в случае внештатной ситуации. Сеть и воздушные судна не падают, а все аварии ограничены пространством серверной комнаты.
САМОЕ УДАЛЕННОЕ УПРАВЛЕНИЕ
Хотя далеко не всегда судьбы сотен людей зависят от непрерывности функционирования сети, тем не менее сбои могут иметь катастрофические последствия. Они, как минимум, могут отнять целый день работы сетевого администратора или еще хуже — целую ночь.
Если хотя бы однажды вам приходилось просыпаться от писка зуммера, то у вас наверняка появлялась мысль, что телекоммуникационные сети могли бы быть не столь продвинутыми. Компания-производитель программного обеспечения AppForge намерена изменить ситуацию. Она работает над программным обеспечением для устройств с операционной системой Palm, причем оно сможет не только подавать пронзительный сигнал тревоги в неурочное время. Неисправность можно будет устранить прямо с вашего карманного компьютера (Palm) или сотового телефона, не выезжая за сотни миль до места происшествия.
Платформа управления сетью Unicenter TNG уже обладает подобными свойствами, благодаря двум компаниям-партнерам CA. MobileSys может доставить сигнал тревоги абонентам большинства двусторонних пейджинговых систем и обеспечить выбор ответа с помощью меню. Компании Thinkers Group удалось воспроизвести запрос на ввод управляющей команды Unicenter на любом телефоне WAP, так что доступ в реальном времени стал возможен ко всем функциям сетевой платформы. К сожалению, ограничения в нынешней версии протокола WAP означают, что с его помощью нельзя инициировать соединение; сетевым администраторам приходится устанавливать связь вручную, после того как их проинформировали о проблеме каким-либо иным способом.
С точки зрения перспектив управление сетью карманные компьютеры (PDA) одновременно и хороши, и плохи: те компьютеры, которые подключаются к сети пользователями, могут представлять угрозу, но ваш собственный — полезный инструмент для вас. Объединенные беспроводной связью третьего поколения, они, быть может, позволят вскоре постоянно контролировать состояние вашей сети практически из любой точки. Находясь дома, в баре или на пляже, вы всегда будете иметь консоль управления в кармане.
К сожалению, полноценный контроль зависит от того, насколько уцелевшая часть сети позволит осуществить подключение (см. врезку «Работа с сетью при свечах»). Хотя некоторые проблемы всегда будут требовать выполнения трудоемкой работы руками, было бы неплохо, если бы сети могли самостоятельно обнаруживать и устранять проблемы, не нарушая покоя сетевого администратора. Чтобы этого добиться, программное обеспечение управления сетью должно обладать элементами искусственного интеллекта (AI).
Наиболее известным примером управления с применением искусственного интеллекта является нейронная сеть, задуманная как вычислительная система, работающая по образцу человеческого мозга. Платформа управления Unicenter TNG на протяжении двух лет включает в свой состав нейронных агентов Neugents. Это было сделано с целью создать самообучающуюся систему, которая могла бы адаптироваться к различным условиям в сети. Технология все еще развивается, но, в конце концов, должно появиться программное обеспечение, которое сможет решать проблемы интуитивно.
Компания System Management Arts также встраивает элементы искусственного интеллекта в продукт InChar-ge. Он основан на патентованной технологии под названием Codebook, которая является вариантом экспертной системы — это более старый вариант AI, использующий алгоритмы «на основе правил». Программа обнаруживает, диагностирует и, по возможности, устраняет неисправности в сети. Основное отличие Codebook от стандартных экспертных систем состоит в ее способности самостоятельно обновлять базы знаний, с учетом характеристик конкретных сетей, поэтому с течением времени, как и в случае Unicenter TNG, производительность должна улучшаться.
Но несмотря на усилия таких поставщиков, как CA и Smart, задача управления сетью оказалась чрезвычайно неподатлива для средств искусственного интеллекта. Компьютеры могут играть в шахматы, управлять самолетами и даже убедить пользователей в чате, что они беседуют с человеком, однако компьютеры все еще не могут управлять сетью. Это удивит кого угодно, но только не администраторов сетей. Все дело в сложности управления сетью по сравнению с любой из подобных задач.
Пока еще не создано — и вряд ли когда-нибудь это случится — такое волшебное программное обеспечение, при помощи которого неопытные пользователи ПК могли бы контролировать сотни различных устройств. Платформы, многочисленные специализированные программы и искусственный интеллект могут несколько облегчить вашу жизнь, но они не смогут выполнить за вас всю работу — человеку всегда останется самая трудоемкая ее часть.
Энди Дорнан — зам. главного редак-тора Network Magazine. С ним можно связаться по адресу: adornan.cmp.com.
Ресурсы Internet
Первой аналитической компанией, специа-лизирующейся в области управления сетью, была Enterprise Management Associates (http://www.enterprisemanagement.com). Как и другие аналитические компании, она помещает в Web лишь краткие выжимки из своих исследований, но даже там можно найти много интересного.
Университет Карлетон занимается исследованиями в области управления сетью и имеет неплохой архив документов на http://www.sce.carleton.ca/netmanage/. В них обсуждаются такие темы, как агенты искусственного интеллекта и управление обслуживанием, а также футуристические идеи, наподобие бионики, которые позволят создать новые стратегии управления.
Информацию об оборудовании для частных радиостанций, наиболее гибкой из всех технологий, вы найдете на странице федеральной комиссии по связи (FCC) http://www.fcc.gov/wtb/plmrs/.
Работа с сетью при свечах
Неважно, насколько хороша ваша система управления. Об этом бесполезно говорить, если вы не можете войти в сеть. В условиях, когда от аварийных отключений электроэнергии никто не застрахован, настало время оценить, как поведет себя ваша сеть, если ее обесточить.
Широко распространенным методом защиты против любой аварии энергосистемы признано использование источников бесперебойного электропитания (ИБП). Они могут оказаться полезными и в том случае, когда электроэнергия поступает нерегулярно, обеспечивая различную степень защиты, в зависимости от размера, объема заряда и года выпуска. (ИБП — по сути очень крупная батарея, а все батареи со временем теряют свою емкость.) Если вы защищаете информационный центр, где во всем остальном предусмотрена необходимая избыточность, нескольких секунд часто бывает достаточно для перенаправления трафика.
Некоторые поставщики предлагают системы управления ИБП, применение которых позволяет подать электропитание на конкретные устройства. При затяжных авариях бывает полезно отключить принтеры и мониторы, чтобы сохранить питание для сервера электронной коммерции. Такого же результата вы можете добиться, если пройдетесь по своему офису и отключите все ненужные приборы, тем самым сэкономив энергию и деньги (даже если авария и не произошла).
ИБП не в состоянии защитить удаленных пользователей, но в ноутбуках имеются собственные батареи, способные работать час или два, и этого бывает достаточно, чтобы переждать повторяющиеся отключения электричества. Карманные компьютеры могут непрерывно работать в течение нескольких дней между подзарядками и даже подзаряжаться от солнца при условии, что они не связаны с энергоемкими модемами или картами беспроводной сети передачи данных. Чтобы обрести полную энергетическую независимость, английский изобретатель Тревор Бейлис планирует вслед за сотовым телефоном, работающим от часового механизма, создать компьютер с аналогичным питанием.
Телефонная сеть общего пользования имеет собственное энергопитание, хотя многие системы УATC им не пользуются. Это значит, что в случае отключения электроэнергии сотрудники, работающие в удаленном режиме, имеют больше шансов остаться на связи, чем их коллеги в офисе. Но иногда даже они оказываются беззащитны, когда обрыв отрежет их от питающей городской АТС. Ну а если природная катастрофа выводит из строя силовые кабели, могут отказать и телефонные линии.
Восстановление соединения «точка-точка»
Беспроводные сети — более гибкие и надежные, но и они могут быть подвержены неблагоприятным воздействиям. Сотовый телефон должен находиться не далее 35 км от своей станции, между тем она тоже может быть выведена из строя. К тому же после землетрясения или урагана каждый прежде всего пытается воспользоваться своим сотовым телефоном, что приводит к заторам в сети.
Более гибкой технологией является спутниковая связь, но клиенты компании Iridium обнаружили, что и спутники не защищены от того, что происходит на нашей планете. Сама сеть Iridium могла бы пережить даже конец света, но ее работа целиком зависит от наземных станций, связывающих клиентов с Internet и коммутируемой телефонной сетью общего пользования. После банкротства пользователи этой компании могли звонить только друг другу.
Единственной информационной системой, гарантированно работающей без внешних источников электроэнергии, можно назвать полносвязную радиосеть, где каждый узел передает информацию любому другому узлу. Беспроводные локальные сети — пример такой системы: точкам доступа требуется электроэнергия, но ноутбуки, оснащенные картами IEEE 802.11, могут связываться между собой как равноправные узлы. Их единственный недостаток заключается в радиусе действия, ограниченном 100 м. Для покры-тия большего расстояния грамотным решением станет собственная транковая радиостанция — технология, часто незаметная среди других технологий передачи данных, но обладающая большой гибкостью.
Некоторые операторы предлагают услуги, основанные либо на европейском стандарте транковой радиосвязи (TETRA), либо на решении компании Motorola (Integrated Digital Enhanced Network, iDEN). Они оба могут работать как обычные сотовые телефоны, а также позволяют связываться друг с другом на расстоянии нескольких километров без участия наземной станции сопряжения. Еще одно их преимущество — в более высоких скоростях передачи данных, чем у обычных сотовых телефонов (от 28,8 до 64 Кбит/с, т. е. такие же скорости, как у модема для наземных линий), хотя многие пользователи жалуются, что качество передачи голоса ниже.