Ю. Н. Тюрин, А. А. Макаров Анализ данных на компьютере М.: ИНФРА-М, 2003. 544 с.: с ил. |
Почти четверть века общество проявляло повышенный интерес к развитию собственно системных информационных технологий и средств, а сейчас на повестку дня выносятся вопросы более интенсивной разработки приложений для рабочих мест пользователей, где и решаются те задачи, ради которых создаются различные системы. Поэтому так важны книги, помогающие справляться с подобными проблемами.
Издательский дом «ИНФРА-М» выпустил книгу профессора МГУ Ю. Н. Тюрина и А. А. Макарова, посвященную теории и практике статистического анализа данных. Как утверждают авторы, она стала результатом их преподавательской, консультационной и практической деятельности и потому будет полезна самым разным группам читателей — от студентов до менеджеров. Причем, чтобы разобраться в ней, не требуется предварительных знаний по теории вероятностей и математической статистике, но все же необходимо иметь минимальные знания по математике (в объеме первого курса вуза) и навыки работы на ПК.
Авторы не стали следовать строгому математическому формализму и ограничились при необходимости обсуждениями и объяснениями, благодаря чему книга стала доступной широкому кругу читателей. Кроме того, в ней уделено значительное внимание разъяснению, что такое статистические модели рассматриваемых задач. В частности, излагаются не только гауссовские методы анализа данных, но и непараметрические. Чтобы оценить использование ПК для анализа данных, можно рассмотреть многочисленные примеры расчетов, приведенных в книге и выполненных с помощью пакетов программ STADIA, STATGRAPHICS, «Эвриста», SPSS, SYSTAT, «Мезозавр», «Статистик-Консультант» и STATISTICA. Это позволяет составить представление об основных средствах и их разнообразии применяемых для статистического анализа данных, имеющихся на отечественном рынке.
Благодаря своему большому педагогическому опыту авторы сумели достаточно эффективно подать материал, изложенный в разделе «Как читать эту книгу?» Собранные в ней материалы можно условно разделить на следующие части: основная — содержит методы анализа данных; приложение — описывает средства анализа на ПК; справочная — включает таблицы для выполнения расчетов; консультационная — помогает выбрать и приобрести статистический пакет.
Методы описательной статистики, важные законы распределения вероятностей, основы проверки статистических гипотез и начала теории оценивания рассмотрены в первых главах книги. Далее читатель может познакомиться с проверками нормального распределения у одной или двух выборок, независимости признаков и гипотез с использованием критериев согласия, а также с некоторыми видами анализа — одно- и двухфакторным, линейным регрессионным. Упомянутые методы подкреплены примерами их реализации в пакетах STADIA и SPSS. Еще в четырех главах книги описаны теоретические основы и дан практический анализ временных рядов наблюдений, включая линейные модели. Программная реализация этих методов анализа проиллюстрирована на ПК с помощью пакетов SPSS и «Эвриста».
Завершающие главы посвящены выборочным обследованиям, методам многомерного анализа и некоторым другим, например дискриминантному, кластерному, многомерному шкалированию и контролю качества. При этом также обсуждается, с помощью каких пакетов можно выполнить анализ на ПК.
В книге рассматриваются пакеты, работающие под управлением ОС Windows. Предлагается классификация статистических пакетов и дается их краткая характеристика. Кроме того, описаны возможности табличных процессоров (Excel, Lotus 1-2-3) и баз данных, а также указывается, когда предпочтительнее воспользоваться статистическим пакетом. Полезны перечисленные требования к пакетам общего назначения, поскольку это помогает ответить на вопрос, какой же пакет больше других подходит для работы. Конечно будет интересно узнать мнение авторов данной книги по поводу того, чем различаются отечественные и западные пакеты для статистической обработки.
В целом книгу можно оценить как весьма нужную и не без удовольствия порекомендовать будущим читателям.