Сегодня проходит много мероприятий, непосредственно связанных с технологиями СУБД. Одно из них — конференция «Базы данных и информационные технологии XXI века», организаторами которой выступили Министерство образования РФ, РГГУ, Межвузовский центр по информационному обеспечению гуманитарного образования, кафедра математики, логики и интеллектуальных систем в гуманитарной сфере и холдинг ФОРС.
Конференция была посвящена тридцатилетию начала работы семинара «Теория и методология проектирования баз данных» под руководством М.Ш. Цаленко, работавшего в ту пору в лаборатории НИИ ЦСУ. Роль этого события Сергей Кузнецов, главный научный сотрудник ИСП РАН, охарактеризовал так: «Она дала возможность ведущим ученым, занимающимся разработкой теории и практикой баз данных, встретиться и поделиться своими взглядами и достижениями. Подобный факт невозможно переоценить. Жаль, что такие встречи сегодня происходят не часто».
В качестве почетного гостя и приглашенного докладчика выступил профессор, доктор технических наук Михаил Шамсонович Цаленко, а среди присутствовавших на семинаре были и те, кто еще в студенческую пору начал работать в его семинаре. С особым теплом об этом времени вспомнил Алексей Голосов, генеральный директор холдинга ФОРС: «Я начал участвовать в семинаре Цаленко в 1976 году, будучи студентом, впоследствии привлек к нему и своих коллег по ВНИИ системных исследований. Работать в семинаре было тяжело — могли ?пощипать? с разных сторон, но это была среда, где учили думать и излагать мысли. Я выступаю за то, чтобы возродить такие научные семинары».
Вступительное слово на конференции произнес сам Цаленко, озаглавив его «Чему нас учит история?», обратив внимание на исторические моменты, в той или иной мере оказавшие влияние на жизнь его семинара. В частности, не смотря на справедливо негативное отношение к культу личности, в истории систем управления базами данных личности играли важную роль. Кроме того, интерес к базам данных укладывался в хорошо известную схему этапов от крайнего восторга через умеренный оптимизм и здоровый скептицизм до крайнего пессимизма. Цаленко сделал краткий обзор работ, связанных с деятельностью семинара, начиная с известной публикации по реляционным моделям баз данных в сборнике «Алгоритмы организации решения экономических задач», сыгравшем заметную роль в становлении в нашей стране исследований в области баз данных. Вместе с этим он отметил, что некоторыми участниками семинара были выполнены интересные исследования, позволившие некоторым из них состояться в качестве хороших специалистов.
Подводя итоги, Цаленко сделал следующие выводы. Люди, вышедшие из семинара, заняли достойное место в науке, они впитали в себя идеи универсализма, которые позволили успешно работать как в исследовательской, так и практической деятельности. Семинар сыграл свою социальную роль, предоставив его участникам возможность прижизненной реализации: можно было выявлять реализуемость теоретических изысканий. И, наконец, значима образовательная роль семинара — на нем не только получали знания, но и учились ими делиться, выступая перед слушателями.
Профессор Леонид Калиниченко из ИПИ РАН прочитал на конференции доклад «Гетерогенность и каноническое моделирование данных: ретроспективный взгляд», в котором обратил внимание участников на конструирование унифицированных моделей данных, на связь объектного контекста и модели и в частности на неоднородные модели. Михаил Когаловский из Института проблем рынка остановился на рассмотрении технологий XML и XML-данных, имеющих отношение к базам данных. Ольга Горчинская, специалист по СУБД Oracle, представила доклад о хранилищах данных и технологии их анализа, используемых в больших СУБД.
Во второй день конференции был представлен доклад Алексея Голосова об управлении информационными ресурсами, в котором дан анализ опыта использования СУБД в проектах современных корпоративных информационных систем, разработанных в компании ФОРС. Михаил Цаленко выступил также с докладом о нерешенных проблемах теории баз данных и нереализованных проектах их применения. Сергей Кузнецов посвятил свой доклад трем манифестам баз данных и их реализации: «Манифест ООБД» (Киото, 1983 г.), «Манифест баз данных третьего поколения» (1993 г.) и «Третий манифест» Дарвена и Дейта (1995 г.). Как отметил Кузнецов, на этом пути модель данных стала религией. Завершил конференцию доклад профессора Евгения Бениаминова из Института лингвистики РГГУ на тему «Системы формирования и использования баз понятий и проблемы построения открытых языков представления знаний», который опирался на книгу автора «Алгебраические методы в теории баз данных и представлении знаний».
Завершила конференцию, как нельзя лучше, цитата из Осипа Мандельштама, произнесенная Цаленко: «Я не люблю протяжных расставаний». И подтверждением этому стала его небольшая беседа с журналистами издательства «Открытые системы».
Более четверти века назад ваши работы по моделям реляционных баз данных были опубликованы в сборниках «Алгоритмы и организация решения экономических задач». Интересным в них было то, что реляционные СУБД рассматривались с позиций их математических моделей и для этого привлекались алгебраические теории. Так ли это сегодня?
Отмечу две вещи. Есть уровень использования знаний в работе, и есть уровень образования. Конечно, имеется и третий уровень образованности — то, что остается после образования. Ранее, по крайней мере, в США, и в значительной мере в России, пытались на уровне образовательных программ по информационным системам сделать необходимым обучение не только языкам программирования, но и сложившейся концептуальной основе баз данных, прежде всего связанной с реляционной моделью. И это считалось обязательным элементом стандартного образования, который в дальнейшем обеспечит общее понимание того, что происходит с базами данных. Таким образом, что касается образовательного уровня, то здесь все в порядке, по крайней мере, в западных университетах. На уровне же использования этого не делается — далеко не все занимаются проектированием баз данных, а в основном создают и поддерживают системы. Такие знания не обязательны — достаточно навыков, связанных с работой компонентов и нет необходимости пользоваться фундаментальными знаниями о базах данных. И последнее, но весьма важное обстоятельство, связано с тем, что большинство людей, имеющих отношение к ИТ, привыкли действовать «методом тыка», не вдаваясь в теоретический анализ. И этот разрыв между научным подходом и использованием метода проб и ошибок серьезно обсуждался на Международном конгрессе по вычислительной технике еще в 1989 году в Сан-Франциско. С тех пор он постоянно увеличивается и не редкость, когда получают удовлетворительный результат в области технологических новшеств путем экспериментов, укладывающихся в приемлемое время, и обходясь без строгих научных выводов.
Но это приводит к потере навыков модельного мышления и, следовательно, провоцирует ошибки?
Согласен. Эта точка зрения провозглашалась корифеями программирования, например Э. Дийкстрой. Из нее следовало, что единственно чему надо учить системных программистов, это умению абстрактно мыслить. Пожалуй, данное суждение можно рассматривать, как цитату из его работы «Абстрактные типы данных». Это понятно корифеям, но сегодня в программирование вовлечено большое количество людей, а навыки абстрактного мышления не поддерживаются школой, и даже на уровне четырех курсов американских университетов. Обучать же этим навыкам работающих специалистов уже поздно. Я постоянно говорю об этом. Подтверждением этого служат такие понятия, как абстрактные типы данных, имеющие отношение к современным конструкциям универсальной алгебры. К сожалению, разрыв, о котором я упоминал, существует и не сокращается.
Насколько семантические модели данных и текстовой информации, используемые сегодня в базах данных, характеризуют успехи ИТ в лингвистической обработке информации?
Семантические проблемы, связанные с базами данных, на сегодняшний день более важны по сравнению с математическими. В целом математические модели в значительной мере исследованы и даже имеются их строгие описания — дело за их детальным изучением. Тогда как семантические представления весьма пестры и размыты. Я специально писал об этом книгу, пытаясь передать дух исследований семантических проблем, потому что часть из них имеет корни в информационно-поисковых системах и связана с построением тезаурусов и отражением родо-видовых отношений между понятиями и т.п. В других исследованиях исходят из необходимости разработки естественных языков в урезанной форме, как это сделано в SQL-языках, что позволяет сохранять структуру предложения в запросе и ответе на него. Кроме того, имеются работы, использующие языки на основе теорий логического вывода, в которых преследуется цель получить ответ в форме удобной для пользователя, например, при работе с табличными данными. Поэтому обещания возможности работы с базами данных на естественном языке пока остаются только обещаниями. Реализация подобных попыток в значительной мере зависит от усилий лингвистов и даже для бизнес-приложений не удается никому получить приемлемые результаты, в том числе и специалистам из IBM, хотя это было обещано к середине 90-х годов. Здесь имеется много проблем, прежде всего технологических. Они связаны с распознаванием и синтезом речи — превращением ее в исполняемые команды и преобразованием результатов их действий в речевые отклики. Семантическим моделям базам данных и моделированию семантики в них посвящены две мои книги [1, 2]. А по поводу лингвистических подходов к решению проблемы общения человека с компьютером была опубликована моя статья вместе с Т. Янко.
Не складывается ли у вас впечатление, что успехи коммерческих СУБД последнего десятилетия, главным образом, связаны с успехами в развитии технологий программирования и аппаратных средств, а не отражают успехи теории?
Во-первых, существуют разные информационные системы, создаваемые в мире на основе СУБД. Одни весьма примитивны и достаточны в смысле необходимого времени и объемов для решения практических задач. Другие отражают дополнительные требования по характеру обработки информации на выходе с помощью исследовательских программ и служат для поддержки более сложных системных задач. Обо всех СУБД не стоит судить одинаково. И поскольку речь идет не об исследовательской работе, а о добавлении новых функциональных компонентов, расширяющих возможности именно информационной системы, не СУБД, как ее ядра, а окружения, которое улучшает сервис, то это происходит с ориентацией на конечного пользователя с обращением к взаимодействию человека и системы. Поэтому все усилия, направленные на совершенствование СУБД, относятся к улучшению, прежде всего, сервиса. Это делается специально и составляет суть индустриального подхода к созданию СУБД и к теоретическим исследованиям имеет слабое отношение. Это направление развивается в значительной степени под влиянием таких языков программирования, как Java.
Как вы чувствуете себя в отрыве от отечественной школы и от своих учеников?
Вопрос очень личный и непростой. Здесь я потерял возможность работать как прежде — мне очень трудно было читать и писать, потому что возникли серьезные проблемы со зрением, а кроме последствий врожденной катаракты, прогрессировала глаукома, и пришлось уехать в США, где сделали операцию и несколько стабилизировали мое состояние. Современные средства коммуникации сделали возможной не только связь с учениками, но даже позволили подготовить конференцию. Передайте читателям журнала «Открытые системы» мою искреннюю благодарность за проявленный интерес к проблемам баз данных; хочу обратить внимание читателей на то, что в этой области их, несомненно, еще ожидают глубокие впечатления.
Литература
- "Итоги науки и техники. Информатика". Том 9. - М.: ВИНИТИ, 1985.
- М. Цаленко, "Моделирование семантики в базах данных". - М.: Наука, 1989.
Михаил Шамсонович Цаленко — выпускник кафедры алгебры механико-математического факультета МГУ (1961 год). Первые работы выполнил по теории категорий. После завершения учебы в аспирантуре на кафедре и защиты дисертации работал в Артиллерийской академии на кафедре математики. В 1973 году перешел в НИИ при Госкомстате СССР, где и начал исследовательскую и практическую работу по базам данных. Затем после открытия РГГУ начал в нем преподавательскую и научную деятельность. При его активном участии был поставлен курс по базам данных и создана программа для сответствующих кафедр гуманитарных вузов. В связи с ухудшением здоровья в 1995 году выехал в США для лечения, где в настоящее время живет и работает. Автор ряда монографий, в том числе, по теории категорий и по различным моделям баз данных.