Примерно десять лет назад сокращение RAID (redundant array of inexpensive disks - избыточный массив недорогих дисков) вошло в лексикон специалистов в области систем хранения информации.

Теперь, по аналогии с ним, понятие кластеризации пробивает себе путь в лексикон специалистов в области обработки информации. Под кластеризацией понимают использование в качестве единой компьютерной установки системы из взаимосвязанных компьютеров, каждый из которых работает под управлением собственной операционной системы.

Идея эта стара как мир. Чтобы увеличить масштабируемость и повысить экономичность периферийных устройств, мы долгое время объединяли в кластеры мэйнфреймы. Новое заключается в том, что теперь это предполагается делать, используя процессоры производства Intel. Компания Microsoft выступила с инициативой применения в этих системах Windows NT, за ней последовали Novell и IBM. Производители дисковых накопителей EMC и Hitachi, а также такие разработчики программного обеспечения, как Oracle, Teradata и Veritas, продвигают свою концепцию решения проблемы.

На проведенном недавно брифинге мой коллега из International Data Corp. Дэвид Флойер предсказал, что к 2001 году примерно треть серверов, поставляемых Intel, будет применяться в кластерах, главным образом основанных на Windows NT. Для сравнения, в настоящее время в такой конфигурации работает лишь незначительное количество компьютерных систем.

Думаю, как и в случае с RAID, пользователи собираются применять кластеры недорогих процессоров Intel с целью замены компьютеров среднего уровня и мэйнфреймов.

Флойер ожидает появления нескольких разновидностей кластеров. Одни из них будут предназначены для обеспечения постоянной доступности системы, другие - для совместного использования ресурсов, какие-то - для выполнения отдельных приложений, таких как SAP R/3, часть - для обеспечения масштабируемости системных функций.

Я не сомневаюсь в правильности прогнозов Флойера - многим из нас придется в будущем заниматься настройкой кластеров серверов на процессорах Intel. Я беспокоюсь о том, сможем ли мы делать это достаточно разумно. И сможем ли предсказать перемену в потребностях пользователей, которая может сделать кластеризацию неэкономичной.

Флойер указывает на то, что восхваляемая масштабируемость кластеров серверов возможна только по отношению к простым приложениям, а постоянная доступность системы означает ее отказоустойчивость и обойдется недешево. Флойер также говорит, что в ходе поддержки работы кластеров почти наверняка возникнут большие непредвиденные расходы. Я думаю, должен пройти достаточно долгий период проб и ошибок, прежде чем специалисты из области информационных служб научатся использовать кластеры наилучшим образом.

Как профессионала в сфере информационных систем меня очень беспокоит возможность беспрепятственного расширения кластеров. Чем больше в кластере серверов, тем вероятнее, что интенсивность коммуникаций выйдет за допустимые пределы. Уровень белого шума растет логарифмически. Слишком велик риск, что 99% времени работы процессоров будет уходить на координирование действий системы.

Я бы посоветовал не спешить в этом деле. Прежде чем технология дисковых массивов RAID стала достаточно надежной, чтобы на нее можно было положиться, сменилось несколько поколений дисковых подсистем. То же самое справедливо и в отношении кластеров - чтобы определить реальные возможности и накопить достаточный опыт, должно смениться несколько их поколений. Последнее, что вы захотите сделать, - это потратить два года на разработку и установку приложения, ориентированного на работу в кластере, чтобы затем убедиться в необходимости использования просто более мощного компьютера.

В принципе идея использования кластеров представляется мне весьма привлекательной, ведь при этом работу большой и сложной компьютерной системы выполняют связанные друг с другом недорогие серверы. Однако мне почему-то кажется, что это не так-то легко сделать.


Джон Гантц - старший вице-президент компании International Data Corp. Его Internet-адрес jgantz@idcresearch.com.