Инженеры Mitsubishi Electric разработали высокопроизводительный механизм извлечения информации из крупных баз данных, основанный на технологии параллельных вычислений. Разработчикам удалось преодолеть ограничения традиционных систем извлечения информации, производительность которых на крупных массивах данных при заполнении кэш-буфера существенно падает.
Экспериментальная система состоит из 16 серверов с гигагерцевыми Pentium III, соединенных гигабитным коммутатором и управляемых с хост-компьютера. Емкость накопителей составляет 1,7 Тбайт. Система способна выполнять полнотекстовый поиск по ключевым словам, обрабатывая по 100 млрд. символов в секунду. Высокой производительности поиска удалось достичь за счет равномерного распределения нагрузки между серверами. Число серверов в системе можно увеличить до 256, емкость систем хранения - до 27 Тбайт; новые серверы можно добавлять, не устанавливая дополнительного ПО. Серверы работают под управлением Linux, а хост-компьютер, который принимает запросы и выдает результаты, управляется Windows 2000. Продажу системы в Японии планируется начать в нынешнем году.
Служба новостей IDG, Токио