Интеграция Enterprise Miner и Warehouse Administrator позволяет клиентам создавать глобальные метаданные

Несмотря на шум, поднятый вокруг инициатив в области хранилищ информации, разработанных Oracle, Microsoft и Informix, опытные пользователи средств добычи данных по-прежнему уделяют наибольшее внимание программному обеспечению SAS Institute и IBM. Компания SAS Institute собирается выпустить новые версии своих продуктов, которые призваны еще более укрепить ее позиции на этом рынке.

Большие надежды возлагаются на программный пакет Enterprise Miner 3.0, бета-версия которого должна появиться в декабре. В SAS намерены интегрировать Enterprise Miner с ПО для построения хранилищ данных SAS Warehouse Administrator и надеются на то, что Enterprise Miner будет одной из наиболее популярных программ на рынке хранилищ данных.

Корпорация IBM сохраняет лидерство на этом сегменте рынка во многом благодаря большим объемам развернутых ею серверов хранилищ данных. Однако на пятки ей наступает SAS, сумевшая укрепить свою репутацию среди пользователей за счет тесной интеграции всех представителей семейства выпускаемых ею программных продуктов.

Как успехи?

Как закончились ваши проекты по использованию хранилищ данных

36,2% очень успешно
28,7% успешно
4,3% почти успешно
18% плохо
12,8% рано говорить

Данные получены в результате опроса 100 менеджеров ИТ компаний, использующих хранилища данных

Источник: IDC

  
«Некоторые производители ПО разрабатывают средства поддержки информационных хранилищ, не уделяя должного внимания возможностям добычи данных, - отметил директор подразделения добычи данных компании SAS Institute Марк Браун. - Мы же создаем базы, при эксплуатации которых с добычей данных не возникает никаких сложностей».

Корпорация IBM выбрала несколько иную стратегию. По мнению менеджера по маркетингу средств управления данными подразделения IBM Software Джеффа Джонса, центральное место при проектировании информационного хранилища все же должно отводиться базе данных.

«SAS при создании хранилищ данных концентрирует свои усилия на обеспечении полнофункционального анализа, - подчеркнул Джонс. - Но до тех пор пока база данных не наполнена информацией, говорить о каком-либо анализе не приходится».

  

Функциональные возможности Enterprise Miner

Transform Variables Node обеспечивает автоматическое преобразование данных и их перевод в форму целевых двоичных переменных.

Imputation and Replacement Node позволяет восстановить недостающие значения за счет использования алгоритма дерева решений.

Multiplot Node автоматически генерирует графики распределения каждой переменной, а также графики, иллюстрирующие взаимосвязь переменных.

Reporter Node автоматически создает отчеты в формате HTML с указанием подробной информации и конечных результатов процесса построения диаграмм.

«С помощью средств Enterprise Miner из хранилищ извлекается метаинформация, - возражает технический консультант SAS Тоня Этчисон. - Этот процесс можно образно назвать 'предварительным бурением' (pre-mining mining). Появляется возможность автоматически сократить число переменных и определить те из них, которым присвоено только одно значение».

Интеграция Enterprise Miner и Warehouse Administrator позволяет клиентам создавать глобальные метаданные, определяя переменную таким образом, чтобы в ходе операции импорта она преобразовывалась в заранее выбранную форму. Добытые данные помещаются обратно в хранилище, дополняя его переменными, определенными в процессе добычи.

«Отличительной чертой стратегии SAS было и остается ее стремление к оптимизации хранилищ данных и к получению конкретных решений, позволяющих обобщить информацию, которая ранее была разбросана по всем подразделениям компании», - подчеркнул издатель ежемесячного посвященного проблемам построения хранилищ данных бюллетеня DM Review Рон Роуэлл.