Но прежде всего AnswerTree — это инструмент «для обнаружения сегментов и скрытых тенденций в данных», состоящий из четырех специализированных алгоритмов. Быстро работающего CHAID — многомерного статистического способа построения дерева для эффективного исследования данных, служащего цели быстрого выделения важных зависимостей. «Исчерпывающего» CHAID — методов законченного многомерного статистического всестороннего анализа данных. «Дерева Классификации и Регрессии» — способа полного построения двоичного дерева для разбиения данных, с помощью которого выделяются однородные подгруппы. QUEST — статистического отбора несмещенных переменных, а также ускоренного и эффективного построения двоичных деревьев.
Кроме построения моделей, программа дает возможность анализировать данные и другими способами — например, методами линейной и логистической регрессии с автоматическим учетом всех взаимодействий переменных. Причем даже тогда, когда число переменных больше, чем количество наблюдений, а при рассмотрении таблиц сопряженности исследуются категориальные и непрерывные переменные. В отчете вся информация сводится к единой форме. Для нейронных сетей получаются более адекватные модели, поскольку можно четко задать правила принятия решений. Кластерный анализ позволяет выявлять целевую переменную, по отношению к которой проводится классификация.
В итоге можно сказать, что AnswerTree позволяет быстро и просто строить деревья, ускоренно выделять важные зависимости, получать надежные результаты обработки, ориентировать модели на потребности пользователя, допуская сохранение правил принятия решений для выбранных сегментов в формате синтаксиса SPSS или SQL, выбирать наиболее удобный режим работы для него, а также четко представлять результаты анализа данных в виде древовидных диаграмм, таблиц и графиков, пригодных для презентации. В спецификации программы AnswerTree можно найти подробные описания возможностей, здесь же отметим лишь некоторые. Четыре упомянутых выше алгоритма построения деревьев обслуживают процедуры принятия решений, позволяющие ускорять анализ путем выбора части дерева (усечения) на основании стандартной ошибки или минимального риска. Выбор правил остановки построения дерева определяется либо его максимальной высотой, контролируемой количеством уровней или наблюдений, либо другими характеристиками. К дополнительным возможностям пакета относятся: обучение модели на подвыборке данных и применение ее к оставшимся (допустима случайная выборка данных); перекрестная проверка путем деления совокупности всех данных на обучающую и контрольную, что позволяет оценить модель на подвыборках меньшего объема; возможность управления данными и файлами, в том числе файлами пакета SPSS; импорт файлов из поддерживающих ODBC приложений с помощью драйвера SPSS; сохранение файлов в форматах SPSS, SYSTAT и ASCII; экспорт древовидных диаграмм в виде bmp-файлов, а остальных результатов — в виде текстовых.
В заключение можно сказать, что продукт целесообразно использовать при проведении маркетинговых исследований для построения профилей клиентов фирмы, прямой рассылки партнерам или на собственные филиалы сегментов данных с наибольшей вероятностью отклика, в банковской сфере при оценке кредитных рисков в случае описания групп кандидатов с высоким и низким рейтингом, улучшения качества работы благодаря возможности определения основных причин, вызывающих неполадки, а также в биомедицинских исследованиях для выявления групп пациентов, для которых наиболее эффективен данный способ лечения.
AnswerTree 2.0
Системные требования: 486DX, ОЗУ 12 Мбайт (рекомендуется 16 Мбайт), 40 Мбайт на жестком диске, монитор VGA (рекомендуется SVGA), Windows 95/NT 3.51, 4.0.
Цена: для одного пользователя 1340 долл.,
от двух до девяти — 900 долл. за рабочее место,
для десяти и более — 600 долл.
Где купить: представительство компании SPSS в Москве, тел.: (095) 125-00-69.