«Открытые системы»

В компьютерной истории немало случаев, когда из-за нехватки должного технического обеспечения надолго задерживается распространение интересного изобретения или плодотворной идеи

В приложении к data mining (по-русски — раскопка или добыча данных) применение термина «технология» не вполне корректно. «Технология» это что-то более определенное, а data mining есть совокупность идей и методов, нацеленных на выделение полезной информации из наборов данных. Используя их, можно создать инструмент для получения информации из данных. Близкую по смыслу задачу решают поисковые машины, в последние годы они получили большее распространение, поскольку созданы в ответ на массовый спрос и к тому же не столь пугающе академичны.

№ 10, 1996: Продукты класса data mining наводнят рынок в 1997 году

«Компания DataMind намерена анонсировать в апреле ПО, которое должно внести в информационные системы предприятий преимущества несколько непонятной и экзотической технологии — data mining (добыча данных). Как заявил Браун, вице-президент по маркетингу в DataMind, компания планирует вывести область применения продуктов этого класса «за рамки академических проектов и систем искусственного интеллекта». ... Больше десятка компаний предлагают средства data mining. Согласно META Group, доход почти каждой из этих фирм составляет менее 10 млн. долл. в год, а годовой оборот рынка — всего около 70 млн. Однако аналитики ожидают, что в 1997 году произойдет прорыв, который расширит рынок до 300 млн. долл.».

Увы, и этот прогноз, как и многие другие, не оправдался. Нет, не наводнили такие продукты рынок ни в 1997 году, ни позже. Не случилось этого из-за незрелого отношения к информации и, прежде всего, из-за недостаточного понимания того, что такое данные и что такое информация. Как они между собой связаны? Как они соотносятся со знанием? Чисто умозрительно можно утверждать, что данные — это сырой материал, руда. Они превращаются в информацию при интерпретации их человеком, а знание — это информация, которую человек может активно использовать. В известных подходах к data mining подобное, но формальное и четкое определение предмета отсутствует. Обычно в более широком контексте под data mining понимают обнаружение знаний в базах данных (Knowledge Discovery in Databases, KDD), подчеркивая тем самым, что data mining — не технология, а мультидисциплинарное исследование, направленное на выбор полезных знаний из больших баз данных. В более узком контексте термин data mining применяют для обозначения статистических методов и методов машинного обучения, объединенных с хранилищами данных, применяемых для решения конкретных бизнес-задач. На протяжении последних двадцати лет использовались с той же целью и другие математические методы, такие, как нейронные сети, алгебра размытых множеств, различного рода алгоритмы распознавания образов.

Можно выделить несколько поколений средств data mining. Первое датируется началом 80-х годов, когда в академических институтах проводились исследовательские проекты, направленные на решение уникальных задач, в основном они были связаны с популярными тогда сверхбольшими базами данных (VLDB). Второе поколение датируется началом 90-х годов, тогда стали создаваться инструментальные наборы для обнаружения знаний, в их числе Clementine компании SPSS, а также Mineset от Silicon Graphics и Intelligent Miner от IBM. Третье поколение, приближенное к практическим задачам бизнеса, зародилось во второй половине 90-х годов, его основным двигателем выступили небольшие начинающие компании.

По времени третье поколение совпало с возникновением интереса к хранилищам данных. Еще одним импульсом к развитию data mining стали Internet-технологии: во времена Internet-бума возникла необходимость в оценке эффективности рекламы в Сети. Далее в Массачусетском технологическом университете родилось еще одно направление раскопки данных, получившее название collaborative filtering. Оно построено на предположении, что люди, ищущие чего-то, могут воспользоваться тем, что им предложат, системы такого рода стремятся предсказать поведение пользователя и угодить ему. Из необходимости оценки поведения потребителя возникло еще одно направление — аналитика предсказаний (predictive analytics). Аналитика предсказаний нацелена на прогнозирование спроса и поведения покупателей, на создание брэндов и управление ими и на другие маркетинговые задачи глобального характера. Направление Predictive analytics постепенно «отпочковывалось» от data mining. Его иногда рассматривают как замену раскопки данных, что, вообще говоря, неверно: оба направления останутся, и могут сосуществовать параллельно.

В области data mining вполне успешно работают несколько отечественных компаний. Одна из них — компания «Мегапьютер», выросшая из исследовательской группы, занимавшейся проблемами искусственного интеллекта в МГУ еще в восьмидесятые годы. В 1993 году эта группа была преобразована в компанию и с 1994-го начала поставлять программный продукт PolyAnalyst. Его версия PolyAnalyst 3.0 для Windows NT появилась в 1997 году. В том же году была зарегистрирована американская компания Megaputer Intelligence. Ей удалось поставить свои программные продукты в несколько десятков фирм, входящих в список Fortune 100. Последняя версия PolyAnalyst — 4.5, кроме того, компания разрабатывает продукты для раскопки текстов (Text Mining) и данных в Сети.


Из подшивок Computerworld

Представлен стандарт на объектно-ориентированные СУБД

Дэн Ричмэн, № 10, 1996

Консорциум производителей СУБД предложил стандарт, призванный обеспечить свободный перенос приложений между различными объектно-ориентированными СУБД. Такую же задачу в отношении SQL пытаются решить и разработчики реляционных СУБД...

Рынок объективно ориентированных систем управления базами данных невелик — в 1994 году его объем составлял 97 млн. долл., однако подобные стандарты — это основа для будущего роста. Возможность переносить программы с одной ООСУБД на другую важна для пользователя, так как тогда он перестает быть намертво привязанным к одной системе.

http://www.osp.ru/cw/1996/10/33.htm

DVD борется за свое существование

Дебора де Во, № 10, 1997

«Новорожденный» продукт семейства технологий CD-ROM — цифровой видео?диск DVD, — намереваясь покорить вершину «рыночного Олимпа», вступил на долгий и тяжкий путь борьбы за корпоративного клиента.

У DVD-ROM-накопителя хорошие шансы быть в конце концов признанным в качестве стандартного компонента ПК, так как он не только совместим со «старым» CD-ROM, но и обладает информационной емкостью в семь раз большей, чем у CD-ROM...

http://www.osp.ru/cw/1997/10/023.htm

Radio-Ethernet шагает по стране

Александр Крейнес, № 10, 1998

Похоже, свершилось. Беспроводной доступ на базе технологии Radio-Ethernet прочно занял свое место в ряду средств доступа к магистральным сетям. Большие городские сети с беспроводным доступом работают в таких городах, как Екатеринбург, Санкт-Петербург, Тольятти. В Москве таких сетей несколько; зона их действия распространяется на большую часть территории города.

http://www.osp.ru/cw/1998/10/49.htm

Что угодно к чему угодно

Стивен Броуди, № 10, 1999

В январе компания Sun Microsystems официально представила сетевую технологию Jini, которая должна избавить пользователей от постоянных забот о совместимости аппаратного обеспечения....

Технология Jini может использоваться для подключения «чего угодно к чему угодно». Во всяком случае, именно так утверждает Sun в своих рекламных лозунгах. Цифровые камеры напрямую подключаются к принтерам, которые, в свою очередь, взаимодействуют с ПК, интегрированными в единую сеть с посудомоечными машинами, кофеварками и другими бытовыми и офисными устройствами. При этом не требуется никакого дополнительного программного обеспечения.

http://www.osp.ru/cw/1999/10/32.htm

Tera покупает Cray у SGI

Мэри Элизабет Деамико, № 10, 2000

Компания Tera Computer, производитель компьютеров старшего класса, приняла решение о приобретении подразделения суперкомпьютеров Cray корпорации Silicon Graphics (SGI).

Финансовая сторона сделки не разглашается, но представители Tera сообщили, что оговоренная сумма будет выплачена наличными, векселями и акциями. Завершив сделку, Tera создаст новую объединенную компанию, которая унаследует название Cray, где будут работать около 900 сотрудников, а предполагаемый годовой оборот нового предприятия составит около 200 млн. долл.

По условиям соглашения Tera получит торговую марку Cray, семейство суперкомпьютеров SGI Cray... а также действующие контракты на обслуживание и заказы на суперкомпьютеры Cray.

http://www.osp.ru/cw/2000/10/010_1.htm

Они работают на Itanium

Джеймс Николаи, № 10, 2001

В ходе IDF состоялась дискуссия среди участников тестирования серверов с новыми процессорами. Участники дискуссии положительно отозвались о возможностях Itanium, что, по мнению представителей Intel, доказывает целесообразность оснащения новым процессором более мощных рабочих станций и серверов, где сейчас господствуют RISC-архитектуры.

DoubleClick тестировала серверы с Itanium; компания считает бесперспективным дальнейшее расширение своей инфраструктуры за счет добавления к ней серверов на базе Pentium III Xeon, как это было раньше.

http://www.osp.ru/cw/2001/10/032_0.htm

Из «доткомов» уже почти не увольняют

№ 10, 2002

В феврале число сотрудников американских Internet-компаний, уволенных по сокращению, составило 670 — рекордно низкий показатель за последние два года, сообщает компания Challenger, Gray & Christmas.

Компания начала следить за уровнем сокращений в Internet-компаниях с декабря 1999 года; с тех пор всего было уволено 144 912 служащих. Как отмечают в Challenger, снижение уровня сокращений не обязательно свидетельствует об улучшении ситуации: количество Internet-компаний сильно уменьшилось, а оставшиеся сумели выжить лишь за счет строжайшей экономии.

http://www.osp.ru/cw/2002/10/000_13.htm

Sun создает процессоры с несколькими ядрами

Эшли Ванс, № 10, 2003

UltraSPARC IV будет принципиально отличаться от разработок конкурентов.

В последнее время Sun Microsystems интенсивно занимается разработкой микропроцессоров с несколькими ядрами, причем ее новые процессоры будут принципиально отличаться от тех, что сегодня делают конкурирующие с ней корпорации IBM и Intel. Подробная информация о планах Sun прозвучала на конференции финансовых аналитиков, участники которой смогли ознакомиться с конструктивными особенностями базового семейства UltraSPARC, а также нового класса микропроцессоров.

http://www.osp.ru/cw/2003/10/037_1.htm

Борьбе — конец

Вадим Вирин, № 10, 2004

Сегодня на рынке систем автоматизации управления технологическими процессаминаличествуют две основные архитектуры: классическая «закрытая» PLC и более «открытая», использующая технологии персональных компьютеров.

http://www.osp.ru/cw/2004/10/046_1.htm