Средства мониторинга ИТ-инфраструктуры

Благодаря виртуализации и облакам получать необходимые ресурсы для новых инфраструктур и приложений сегодня как никогда просто, однако следствием этого стало усложнение ИТ-среды. Более того, сегодня системы нередко географически распределены и могут полагаться на разные операционные системы, из-за чего усложняется администрирование. В результате опять стала актуальна достаточно старая тема мониторинга ИТ-сред и приложений. На начальном этапе необходимо организовать мониторинг ИТ-инфраструктуры на уровне оборудования, сервисов и приложений (рис. 1). Рассмотрим современные инструменты мониторинга сетей, позволяющие обнаруживать неполадки, обеспечивать доступность компонентов и измерять объемы расходуемых ими ресурсов.

Архитектура системы мониторинга инфраструктуры ИТ

Выбор инструментов

При выборе инструментария мониторинга инфраструктуры нужно учесть ряд факторов, в первую очередь — оценить соответствие функционала вашим техническим и бизнес-требованиям. Затем нужно рассмотреть особенности развертывания и сопровождения, чтобы подобрать инструмент, соответствующий ресурсам и уровню компетенции вашей команды ИТ-специалистов. И наконец, оценив, насколько новый инструмент будет полезен вашей организации, нужно подсчитать общую стоимость владения.

Функциональность

Для выбора функциональности нужно знать потребности различных пользователей (разработчиков, эксплуатационного персонала и т. д.). К примеру, ответственный за принятие бизнес-решений может быть заинтересован в отчетах о выполнении соглашений об уровне обслуживания, которые, в свою очередь, могут оказаться ценными и для технических специалистов в качестве подспорья при выявлении проблем с производительностью и их первопричин. Оценивать придется самые разные аспекты; инструмент должен поддерживать мониторинг как серверной, так и интерфейсной части среды и быть способным распознавать широкий круг проблем — от снижения быстродействия и аварийных завершений до утечек памяти.

Пользовательские интерфейсы. Инструменты мониторинга инфраструктуры существуют уже давно, и можно положиться на проверенные пакеты, однако их пользовательские интерфейсы не всегда поспевают за современными тенденциями. Оцените, удовлетворяет ли интерфейс рассматриваемого решения вашим потребностям. В зависимости от специальности пользователя и его должностных обязанностей, возможно, будет обязательным наличие веб-интерфейса либо мобильного приложения для универсальной доступности.

Уведомления, интеграция со службой поддержки и автоматизация. Назначение системы мониторинга состоит в том, чтобы помочь как можно быстрее реагировать на проблемы, например на ухудшение качества обслуживания. В этом случае, возможно, приоритетной будет настраиваемая система выдачи предупреждений. При выборе инструментария следует обратить внимание на следующие факторы: поддержку различных способов уведомления (по SMS, электронной почте, с помощью произвольных скриптов и т. п.); объем конфигурирования, который понадобится конкретно для вашей среды; поддерживаемые операционные системы и возможность интеграции с вашей системой поддержки пользователей (в частности, надо оценить простоту встраивания системы в имеющиеся процессы разрешения проблем).

По мере сбора сведений об инфраструктуре можно автоматизировать запуск различных задач при наступлении разных событий, что даст больше контроля над неполадками.

Развертывание и сопровождение

Прежде всего способ развертывания инструментария должен согласовываться с корпоративными политиками. Кроме того, выбранный инструмент должен поддерживать используемые у вас языки программирования, быть совместимым с инфраструктурой и отвечать уровню компетенции ИТ-специалистов. Нужно также провести оценку методов сбора показателей с точки зрения возможности извлечения ценных сведений. Стоит учесть, что выбор способа мониторинга производительности зависит от того, что является источником диагностической информации. К примеру, она может извлекаться из кода, из журналов операций, а также поступать от клиентских систем и сетевого оборудования.

И наконец, надо оценить стоимость инсталляции и сопровождения — любые инструменты мониторинга придется адаптировать к конкретной среде, а потому роль процессов их установки и конфигурирования в проектах внедрения трудно переоценить. Нужно обратить внимание на простоту развертывания, на возможность автоматического распознавания топологии приложений и соотнести это с имеющимися навыками и ресурсами.

Стоимость

При установке инструментария нужно ориентироваться на его быструю окупаемость. Для оценки общей стоимости владения понадобится, например, произвести сравнение облачной версии с локальной альтернативой, для которой затраты на лицензирование и оборудование могут быстро вырасти.

Восемь популярных решений для мониторинга ИТ-сред

Восемь популярных инструментов

Рассмотрим наиболее широко применяемые инструменты мониторинга ИТ-сред [1, 2].

Nagios

Nagios — один из самых известных инструментов с открытым кодом для мониторинга ИТ-инфраструктур, в том числе рабочих станций конечного пользователя, ИТ-сервисов и активных сетевых компонентов. Помимо бесплатной версии с открытым кодом Nagios Core, имеется коммерческая Nagios XI с дополнительными возможностями, обладающая более современным и простым в навигации веб-интерфейсом, предлагающим интерактивную информационную панель с обзором хостов, сервисов и сетевых устройств. Возможность построения графиков тенденций и наличие наглядных инструментов планирования мощности помогают в подготовке модернизаций инфраструктуры.

Инсталляция проста, но работа с конфигурационными файлами для управления устройствами и тестами потребует обстоятельного изучения документации.

Вокруг Nagios сформировалось обширное и активное сообщество поддержки, участники которого разрабатывают новые плагины, устраняющие недоработки основного инструмента, такие как трудности конфигурирования и отсутствие возможности автоматического распознавания устройств. Есть плагин для поддержки виртуальных сред.

Zabbix

Zabbix — система с открытым кодом, характеризующаяся высоким быстродействием при сборе данных и масштабируемая до корпоративного уровня. Она позволяет вести мониторинг серверов, сетевых устройств и приложений со сбором детальной статистики, касающейся производительности. Zabbix отличается простотой инсталляции, но конфигурирование может вызывать сложности, особенно если требуется настраивать особые режимы проверки. Zabbix имеет продуманный веб-интерфейс и развитые средства создания отчетов и построения графиков. Все это входит в стандартный пакет, который, помимо функций мониторинга, реализует возможности выявления тенденций. Уведомления о выходе за допустимые значения параметров система отправляет по электронной почте и SMS. Как и у Nagios, у Zabbix имеется активное сообщество поддержки.

Hyperic

Hyperic — проект компании VMware, представляющий собой систему мониторинга и администрирования для виртуальных сред. Предлагаются бесплатная версия с открытым кодом Hyperic HQ и коммерческая vFabric Hyperic. Решение обеспечивает эффективное управление многими операционными системами, веб-серверами, а также серверами приложений и баз данных. Среди дополнительных возможностей vFabric Hyperic — автоматизированное устранение неполадок.

Инсталляция проста и занимает минуты. Hyperic имеет настраиваемый пользовательский интерфейс с продуманным дизайном. Предусмотрена возможность редактирования информационных панелей — например, добавления часто используемых графиков. Уведомления приходят по SMS или электронной почте, можно назначать административные операции, которые должны выполняться при получении тех или иных уведомлений. Hyperic способен автоматически распознавать программное обеспечение и сетевые ресурсы. Имеется активное сообщество поддержки.

Главный недостаток Hyperic — большие, в сравнении с другими инструментами, потребности в ресурсах, которые нужны виртуальной машине Java.

SolarWinds

SolarWinds предлагается в качестве локально размещаемого решения и SaaS-сервиса. Установка может занимать от нескольких минут до нескольких часов в зависимости от сложности конфигурационных данных и обычно не требует помощи поставщика. Система легко масштабируется и может использоваться в больших организациях. Она также обеспечивает нативную поддержку VMware. Консультации по SolarWinds можно получить в соответствующем онлайн-сообществе.

Пользовательский интерфейс интуитивно понятен, с настраиваемыми формами ввода и возможностью доступа с мобильных устройств. Подробные графики отображают сетевые сбои, уровни готовности и быстродействия. Уведомления легко настраиваются, есть возможность создавать сложные последовательности операций на основе правил. SolarWinds предоставляет заранее сконфигурированные информационные панели, которые можно менять по своему усмотрению. Система генерирует настраиваемые отчеты, в том числе автоматически по заранее заданному расписанию.

ManageEngine OpManager

OpManager инсталлируется быстро и легко, но конфигурировать его нужно вручную, что может вызвать затруднения. Впоследствии можно автоматизировать рутинные операции сопровождения и устранения неисправностей.

OpManager предлагает несколько информационных панелей, компоновку которых можно менять. Правда, навигация по пользовательскому интерфейсу довольно сложная. Инструмент генерирует много видов отчетов и позволяет настраивать выдачу уведомлений при выходе за пороговые значения с отправкой по электронной почте, SMS и через произвольные скрипты. Имеются три уровня уведомлений: «предупреждение», «неисправность» и «ошибка». Для OpManager предлагается ряд плагинов — все как самостоятельные продукты.

HP Operations Manager

HP Operations Manager — центральный компонент комплекса для системного мониторинга от HP, представляющий собой клиент-серверное решение, требующее наличия программных агентов на каждом узле. Если нужно установить несколько пакетов, начальная настройка может оказаться непростой.

HP Operations Manager имеет превосходный графический пользовательский интерфейс для мониторинга состояния приложений, систем и сети. В состав решения входят средства планирования, в том числе инструменты прогнозного анализа и моделирования ЦОД. Уведомления можно фильтровать по весу ошибки и типу узла. Имеются механизмы упреждающего мониторинга и автоматизированной выдачи уведомлений. Сведения о событиях сопровождаются рекомендациями по исправлению ситуации, есть готовые инструменты и автоматизированные операции устранения неисправностей.

IBM Tivoli

Установка Tivoli проста и занимает несколько минут, но конфигурирование, обновление и тонкая настройка средств аналитики и реагирования требуют определенной квалификации.

Система имеет интуитивно понятный веб-интерфейс с конфигурируемыми рабочими пространствами, снабжена простым в использовании хранилищем данных и развитыми средствами отчетности. Имеется механизм динамического анализа пороговых значений и производительности, помогающий в предотвращении инцидентов. Есть системы упреждающего мониторинга и автоматизированного управления сбоями. Пользуясь накопленными данными, инструментарий реализует функции отчетности, анализа производительности и выявления тенденций.

IBM предоставляет поддержку по телефону и электронной почте в рабочее время, а также обширную документацию и пользовательскую базу знаний.

WhatsUp Gold

Установить WhatsUp Gold нетрудно — конфигурирование выполняется с помощью веб-консоли и Windows-приложения. Предлагается более 200 настраиваемых отчетов, в том числе по тенденциям, выявленным в процессе анализа данных за прошлые периоды. Возможно формирование отчетов в реальном времени, что помогает в устранении неисправностей. Доступны несколько плагинов, расширяющих возможности системы. Однако пользовательский интерфейс неудобен даже при доступе к простым функциям — например, при создании отчетов по индивидуальным элементам. При выходе параметров устройств за пороговые значения уведомления могут отправляться по электронной почте, SMS или через произвольные скрипты.

Перспективы

С ростом популярности облаков становится нормой перенос в них корпоративных приложений [3]. Облачные средства мониторинга ИТ-инфраструктуры могут быть проще во внедрении и сопровождении, но требуют большего внимания к проблеме приватности данных и контроля над ними. Выбор схемы развертывания (локальное, в общедоступном облаке, в частном, гибридном и т. д.) зависит от корпоративной политики и технических ограничений — например, при облачном развертывании нужно учитывать возможную несовместимость между разными провайдерами.

Уже скоро традиционные инструменты мониторинга инфраструктуры уступят место средствам управления производительностью приложений, от быстродействия которых все сильнее зависит рентабельность бизнеса. «Отзывчивость» приложений — ключевой параметр, влияющий на характеристики бизнес-процессов и способность удерживать клиентуру. В то же время изменчивость рынка и потребность в более быстром получении результатов побуждают компании переходить на скорые (agile) методы разработки, позволяющие ускорить выпуск ПО. При этом качество ПО надо оценивать не только по функциональности (способности проходить тесты), но и по характеристикам производительности. На смену традиционным методам управления ИТ-инфраструктурой придут подходы на основе идей DevOps, при которых инструменты управления производительностью приложений будут полезными на протяжении всего жизненного цикла разработки ПО.

Литература

J. Kowall, W. Cappelli. Magic Quadrant for Application Performance Monitoring. Gartner, Oct. 2014. URL: http://www.gartner.com/doc/2889421/magic- quadrant- application- performance- monitoring (дата обращения: 30.11.2015).
Vendor Landscape: Systems Management. Info-Tech Research Group, 2011. URL: http://www.infotech.com/research/ss/it- vendor- landscape- systems- management (дата обращения: 30.11.2015).
K. Fatema et al. A Survey of Cloud Monitoring Tools: Taxonomy, Capabilities and Objectives // J. Parallel and Distributed Computing. — 2014. Vol. 74, N. 10. — P. 2918–2933.

Николя Серрано, Хосуне Эрнантес, Горка Галлардо ({nserrano, jhernantes, ggallardo}@tecnun.es) — сотрудники, Университет Наварры (Испания).