Для тех, кто понимает толк
Осторожное и ироничное отношение к статистике отражает известная пословица: есть ложь, есть грубая ложь и есть статистика. В самом деле, возможности статистического анализа велики, методы далеко не всем понятны, а результаты исследований весьма парадоксальны. Однако те, кто понимает толк в статистике, наверняка сумеют отличить достоверные исследования от состряпанных по чьему-то заказу. Именно на таких пользователей рассчитан программный пакет Statistica, созданный компанией StatSoft. Рассказу о возможностях выпущенной в этом году версии пакета был посвящен семинар, организованный 30 июня российским представительством компании.
Как рассказали технические специалисты компании Марина Чадеева и Виталий Титов, данный пакет рассчитан на решение статистических задач в области экономики и финансов, при проведении социальных, медицинских, экологических исследований, при планировании экспериментов и в профессиональном обучении. Структурно ПО Statistica представляет собой набор модулей, реализующих функции описательного анализа данных, поиска переменных, оказывающих наиболее сильное влияние на результаты.
Предусмотрены модули, дающие возможность понижения размерности, предсказания неизвестных значений (линейный и нелинейный регрессионный анализ), построения и подгонки модели, планирования эксперимента (обобщенный вариант дисперсионного анализа) и пр. Часть модулей к настоящему моменту локализована, работа над другими продолжается.
Примечательная особенность пакета — возможность исследовать графики путем варьирования значений различных величин без изменения первичных значений, на основе которых эти графики были изначально построены. Другая интересная возможность, на которую обратила внимание Чадеева, — создание категоризованных графиков. Пакет позволяет выбирать для категоризации любую исследуемую переменную. Еще одна графическоя новинка — так называемые пиктографики, позволяющие увидеть зависимость не между двумя-тремя, а между всеми переменными сразу. Все графики и синтезируемые таблицы, которые создаются в процессе исследования, система может автоматически записывать в файл формата RTF. При желании можно сохранить графики в формате HTML и разместить в Web. Разумеется, обеспечивается динамический обмен данными с другими приложениями (в качестве иллюстрации демонстрировалось взаимодействие с Excel), поддерживаются стандарты OLE и DDE, а также все наиболее популярные стандарты пользовательского интерфейса операционной системы Windows (перетаскивание, обмен данными через буфер и пр.).
В системе реализовано два варианта доступа к файлам данных: последовательный (в этом случае файл рассматривается как набор наблюдений) и прямой (в данном варианте предполагается, что файл представляет собой матрицу данных). Связь с индустриальными СУБД обеспечивается с помощью интерфейсов ODBC. Имеется интерфейс к системам оперативной аналитической обработки производства компании Business Objects. Предусмотрена возможность создания макросов и стыковки с другими приложениями Windows. Последнее, в частности, может быть использовано для создания прикладных решений на базе Statistica. Как правило, они либо самостоятельно разрабатываются заказчиками, либо создаются специалистами российского представительства StatSoft по заказу. Насколько удалось выяснить, компания не ведет в России целенаправленных работ по созданию или локализации прикладных решений для определенных отраслей.