Виктор Мартынюк,
НИИ "Оргстанкинпром", Москва
(095)300-7576

Основные элементы информационного исчисления
Понятийная модель
Некоторые общие свойства и возможности ДПМ
Формализация построения и применения ДПМ
Приложения понятийных моделей
Заключение
ЛИТЕРАТУРА

Как известно, в материальном мире существует логика развития каждого его компонента, начиная от рождения и до отмирания. И познавая эту всесильную логику человек, физически находясь одновременно как внутри макромира, так и вне микромира, стремится отобразить ее наиболее верно и полно, проходя через итерационный процесс познания не только в своем сознании но и вне его через любой носитель информации. Настало время обсудить общий способ адекватного отображения этой логики на внешнем носителе информации, отличный от текста, формул или схем. Еще в конце 60-х годов была сформулирована гипотеза представления знаний человека в одной из предметных областей через понятия этой области. В последующем положения этой гипотезы были реализованы при создании одной из первых отечественных систем документооборота. Отдельные результаты этой работы, позволившие по иному взглянуть на проблему интерпретации и анализа документов представлены в виде ряда статей, первая из которых предлагается читателям.

В таком понятии, как "информатика", академик Дородницын А.А. выделяет три компонента: технические средства, программы и алгоритмы или "brainware" [1]. Однако следует заметить, что алгоритму в свою очередь предшествуют такие этапы, как формулирование проблемы, выбор метода ее решения, используя те или иные формы и языки описания. Далее Дородницын отмечал, что "информатика снабжает методами исследований другие предметные области... Она внесла два основных метода в решение задачи прогнозирования (диагностирования) явлений..: метод математического моделирования и метод распознавания образов. Построение математической модели есть прежде всего определение структуры оператора, а для этого алгоритмов нет". Поэтому представляется целесообразным прежде всего разработать язык, позволяющий создавать структуру предметной области в понятиях этой области, затем генерировать на этом языке проблему (задачу) и указать направление ее решения.

Между построением двух разделов механики - статики и динамики прошло около 2 тыс. лет, пока не появились дифференциальное и интегральное исчисления. Арифметики и геометрии, которыми располагал Архимед, при всей его гениальности было недостаточно для описания связи между силой и скоростью. Во всех этих случаях одним из препятствий было отсутствие языка информационного исчисления, изучающего не только процессы передачи и обработки информации, но и отображения, накопления, познания и использования информации как в живых, так и в неживых или гибридных системах.

Основные элементы информационного исчисления

Между исчислениями высказываний и определенными типами электрических схем нет принципиальной разницы - любая формула исчисления высказываний имеет своего представителя в классе релейно - контактных схем и любая такого рода схема может быть описана в виде некоторой формулы исчисления высказываний [2]. Это означает, что существует некоторый класс высказываний на естественном языке, которому соответствует некоторая модель. Первым классом функциональных элементов в естественном языке являются обозначения единичных объектов, явлений и процессов, а также средства для обозначения классов таких элементов. Вторым классом функциональных элементов языка являются отношения между объектами, явлениями и процессами. Эти два основополагающие свойства естественного языка и целесообразно использовать при создании информационного исчисления.

Обычно тексты на естественном языке рассчитаны на восприятие их людьми, поэтому они не содержат всего того количества информации, которая подразумевается человеком, воспринимающим текст. По-видимому, у читателя уже имеется свое представление о предмете обсуждения в форме некоторой понятийной модели. При этом каждое понятие в этой модели было в свое время для данного человека открытием. Наши знания о мире не лежат на одном уровне - одни из них отражают единичные факты, другие обладают определенной степенью общности. В основе наших знаний о мире лежат системы классификации, позволяющие нам воспринимать мир не в виде хаотического нагромождения событий и фактов, а как структуризированный, упорядоченный по степени общности мир. Таким образом, обозначения, отношения и иерархическая структура понятий естественного языка должны прежде всего найти отражения в информационном исчислении, в частности, в понятийных моделях предметных областей.

Понятийная модель

Для разработки удобного языка представления знаний обратимся к хорошо известному языку логики, изучающему взаимосвязь между посылками и заключениями. Требуется построить такую модель, в которой отражались бы и связи между понятиями и порождались бы конкретные высказывания, имеющие смысл. Расширение логики сочетает в себе использование элементов здравого смысла подобно тому, как это делается в естественном языке.

Рассмотрим с этой точки зрения клаузы, предложенные в [3] из древнегреческой мифологии. Представим их в инфиксной форме (F1,.. F8) и построим для них понятийную модель (рис. 1).

Picture 1

Рисунок 1.
Инфиксная форма.

Видно, что все имена в модели, представленные клаузами (F), связаны между собой достаточно компактно, образуя связи без разрывов. Назовем эту модель декларативно-процедурной моделью (ДПМ). В ней декларативными понятиями в данном случае являются имена "ЗЕВС", "ГЕРА" и т.д., а процедурными понятиями - "отец" и "мать".

При этом первые понятия связаны между собой по смыслу стрелками через другие понятия.

Пользуясь общеизвестными знаниями (истинами), нетрудно установить в этой схеме дополнительные смысловые процедурные и декларативные связи такие, как "дочь", "сын" и "родители" (Рис. 3), а так - же "мужчины", "женщины","дедушка", "бабушка", "внук", "внучка" и все последующие связи с приставкой "пра", "прапра" и т.п., введя еще такие обобщенные понятия, как "предки" и "потомки".

При этом можно говорить, что изначальная модель (рис. 2) "порождает" определенные понятия и с их отображением (рис. 3) превращается в более полную ДПМ, которая в свою очередь так же может "генерировать" новые понятия, новые связи и т.д.

Picture 2

Рисунок 2.
Декларативно-процедурная модель "Отцы и матери".

Picture 3

Рисунок 3.
ДПМ "Родители", "дочери" и "сыновья".

Некоторые общие свойства и возможности ДПМ

Различаются прямые связи: отец, мать, сын, дочь первичных (декларативных) понятий (в данном случае Зевс, Гера, Арес и т.д. ) и связи, объединяющие понятия: родители, мужчины, предки. Прямые связи - это процедурные понятия; объединяющие - это связи-понятия, обладающие общими свойствами, признаками и т.п. В свою очередь в прямых связях различатся первичные, вторичные и т.д. N-ричные связи, которые образуют цепочку связей между двумя понятиями в виде петли, одна из дуг которой является n-ричной связью, а другая - m связей (n-1)-го типа. Например,

дед - {отец.отец},
дед - {отец.мать}

Легко видеть, что n-ричная связь является по существу новым понятием - связью связей (n-1)-го типа, которая ими порождается и также имеет смысл.

Новым объединяющим понятием-связью является n-ричная связь для понятий (n-1)-го типа, объединяемых союзом "и". Например,

родители - { Зевс и Гера };
женщины - { и Гера и Афродита и...}

Вершина в описываемой ДПМ отсутствует, поэтому ее построение можно начинать с любого понятия в любую сторону по уровням типа n. Приостановить построение можно также по любому "верхнему" понятию, присвоив его наименование всей созданной к данному моменту ДПМ. Очевидно, что такого рода построенные связи допускают суперпозицию понятий и бесконечность суперпозиций, ограниченной человеческими визуальными и "понятийными" возможностями.

Таким образом, ДПМ конкретной предметной области обладает свойством саморазвития до такого "верхнего" понятия которое "обеспечивает" некоторую полноту при данных составляющих понятий.

Формализация построения и применения ДПМ

В теории чисел, как замечает Л. Эйлер, "наши самые большие надежды мы можем возлагать на наблюдения". В середине XVIII века он специально для того, чтобы сделать классическую логику Аристотеля доступной для понимания, придумал графический способ изображения основных логических отношений между понятиями в виде сегодня хорошо известной системы кругов Эйлера. Заметим, что тогда еще не существовало теории множеств, а эти круги изображают суть всей силлогистики Аристотеля и поэтому могут рассматриваться в качестве первого в истории науки примера когнитивного графического языка.

Само информационное исчисление как язык представления знаний человека из любой предметной области можно также представить в виде понятийной модели (рис. 4), которую можно назвать "моделью информационного исчисления искусственного интеллекта (4И)".

Picture 4

Рисунок 4.
Графическое представление модели 4И на макроуровне.

Основные элементы любой понятийной модели выражаются через следующую "понятийную геометрию":

  • прямоугольники, в которые вписаны декларативные и процедурные понятия естественного языка (понятийные прямоугольники - ПП), обладающие свойством двунаправленной (в сторону мини- и макси-) фрактальности (понятийная относительность);
  • причинно-следственные отношения между понятийными прямоугольниками, выраженные в виде одно- или двунаправленных стрелок;
  • уровни вложения понятийных прямоугольников, образующих однонаправленные уровни 1-го, 2-го и т.д. порядка, вплоть до терминальных, конечных на данном этапе развития наших знаний в виде понятий, представляющих собой последний (n-ый) уровень вложения.
  • Родословной 4И можно считать такие понятия, как:

  • двоичная логика Аристотеля;
  • универсум Эрбрана;
  • непрерывная логика Заде;
  • фрактальная геометрия Мандельброта;
  • когнитивная графика, начиная с кругов Эйлера;
  • язык диаграмм Чена;
  • формальная грамматика Хомского.
  • На построенной модели-4И (рис. 4 до линии А) для отображения "влияний" формальной грамматики Хомского, когнитивной графики Эйлера и непрерывной логики Заде использован механизм вложенности (фрактальности) Мандельброта. В свою очередь понятия фрактальной геометрия Мандельброта, а также непрерывной логики Заде и язык диаграмм Чена для удобства и наглядности объединены конъюктивной связкой как единое целое, на уровне идеи, порождающей 4И наряду с когнитивной графикой Эйлера и формальной грамматикой Хомского. При этом неважно, с какой стороны понятия "4И" "воздействуют" на все родословные понятия, которые в данном случае отображены так, чтобы затем показать перспективу использования 4И - ее развития (ниже линии А).

    Таким образом, любой понятийный прямоугольник образует информационное пространство (среду), внутри которого, если считать его за начало построения понятийной модели, строятся "подчиненные" ему ПП (в сторону мини-), начиная со 2-го уровня. В свою очередь, любой ПП "верхнего" уровня может "войти" в состав другого ПП, который становится для "верхнего" уже макроуровнем. В таком подходе к построению понятийной модели любой предметной области заложены по существу принципы понятийной относительности и понятийной масштабируемости. Внутри ПП допускается любое понятийное перемещение, удобное создателю модели для наглядности и образования нового ПП, стоящего по уровню на ступень выше.

    Очевидно, что процесс создания и модернизации понятийных моделей типа "модели-4И" для соответствующих предметных областей желательно осуществлять на компьютере. Специалист по 4И, имеющий перед собой текст, сгенерированный, как правило, специалистом данной предметной области, строит ее понятийную модель путем итерационного чтения и уяснения смысла текста. Вся "ответственность" за адекватное отображение данной предметной области в своей голове и генерацию этого отображения в виде текста или разговора лежит на специалистах этой предметной области.

    Приложения понятийных моделей

    На рис. 5 представлен фрагмент понятийной модели статьи А.И.Лившица "Куда идем? Экономика России в 2000 году" [4]. Сегодня уже пришло понимание того, что всякое явление, процесс или дело развиваются в соответствии со своей, внутренней логикой, не зависящей по сути от внешних по отношению к ней организационных и/или корпоративных структур и их логики развития. Однако эти структуры могут замедлить или ускорить сам процесс познания, отображения и использования этой всесильной логики.

    На модели статьи выделена информационная среда "инфляция", внутрь которой как преамбула перенесены изложенные в ней причины инфляции. Далее, в эту среду вложена среда "финансовая стабилизация" куда в свою очередь вложены по конъюнкции среды "вторичный рынок акций", "внешний рынок" и т.д. Эти среды так же состоят из им "подчиненных" сред. Некоторые среды связаны их причинно-следственной зависимостью. Процесс построения информационных сред проводился в данном случае до момента исчерпания всех понятий статьи. В таком виде эта модель несет в себе основной смысл статьи и именно по модели можно воспроизвести (сгенерировать) ее текст, решив обратную задачу.

    Понятийная модель как новая информационная среда дает также возможность манипулировать ее элементами таким же образом, как и с текстом, перемещая их внутри порождающей элементы среды. Поэтому для модели доступны также и процессы ее наращивания, поиска новых решений или прогнозирования - сама модель становится объектом исследования как парадигма любой предметной области. В данном случае, с точки зрения информационного исчисления, под парадигмой понимается отображение в информационной среде, обладающей свойством вложенности взаимосвязанных понятий (от сложных до неразложимых на составляющие), простирающихся до границ взаимодействия с понятиями парадигм других предметных областей.

    В результате общая модель наполняется новыми ответвлениями и подробностями, каждое из которых является по существу найденным в соответствующей области деятельности другими специалистами решением (прецедентом).

    На модели можно отображать также предложения отдельных личностей, организаций, партий, движений и т.п. и тем самым оценивать их конструктивность или неконструктивность, полезность и эффективность, а затем в режиме, например, ежемесячного мониторинга в газете или через одну из уже существующих электронных информационных систем давать возможность заинтересованным читателям в режиме "on line" самим знакомиться с моделью и оценивать по вкладу в развитие модели "кто есть кто", будь то отдельные личности, фирмы, банки, партии или государственные структуры.

    Заключение

    Анализируя уже построенную на сегодня модель, следует отметить, что пока мы находимся на стадии ее формирования на макроуровне, обусловленном составом понятий и смыслом как самого исходного текста статьи, так и других газетных материалов, когда еще пока не видно, как модель "живет" под воздействием тех или иных принятых людьми решений. Развитие этой модели вширь и вглубь на основе механизма понятийного масштабирования, в данный момент зависит лишь от наличия дополнительной информации. Так, на основе информационного исчисления был построен ряд следующих понятийных моделей: "Банки", "Машиностроение в России", "Компьютеризированная корпорация".

    Сегодня появилась реальная возможность, используя прогресс в области информационных технологий по-новому, с помощью информационного исчисления представить знания любой из предметных областей. В связи с этим можно рассматривать продукционные правила, широко применяемые при создании экспертных систем, как одну из форм генераций соответствующей понятийной модели. Следовательно, понятийная модель оказывается "компактнее" при отображении смысла продукционных правил. Отсюда следует, что экспертные системы можно строить не только на основе системы продукционных правил, которая сама по себе требует тщательного построения и отладки, а непосредственно по понятийной модели.


    ЛИТЕРАТУРА

    [1]. Дородницын А.А. Информатика: предмет и задачи.-В сб. Кибернетика, становление информатики. М.: Наука, 1986.

    [2]. Поспелов Д.А. Фантазия или наука, на пути к искусственному интеллекту. М.: Наука, 1982.

    [3]. Ковальски Р. Логика в решении проблем. М.: Наука, 1990.

    [4]. Лившиц А.И. Куда идем? Экономика России в 2000 году. "Известия", ## 217-218, 11-12.11.1994.