Современные объектные СУБД открывают новые перспективы для создания экспертных систем.

С годами мозг мыслителя искусный

Мыслителя искусственно создаст.

* * *

Внимание! Звенящий этот звук

Стал голосом и переходит в слово.

И.В. Гете. Фауст

В XX в. после создания первых вычислительных машин идея искусственного интеллекта стала актуальной. В какие-то моменты казалось, что современный электронный гомункулус вот-вот разобьет колбу и появится на свет. Достаточно правильно применить или несколько улучшить технологию в микроэлектронике, разработать новое программное обеспечение, привлечь к работе лучших ученых, выделить деньги на финансирование проектов - и через два-три года придет победа. Но ситуация на удивление похожа на ту, которая складывалась у средневековых алхимиков: успех в самый последний момент ускользал. Как и они, многие современные специалисты в области искусственного интеллекта получали побочные полезные результаты. Хотя интеллектуальная ЭВМ, способная имитировать мышление человека, так и не была создана, во многих областях человеческой деятельности разработаны и успешно применяются экспертные и робототехнические системы.

Накоплен значительный опыт создания экспертных систем (ЭС) различного назначения. Традиционно ЭС выполняются в виде аппаратно-программных комплексов или компьютерных программ, с помощью которых воспроизводятся результаты, обычно достигаемые специалистами достаточно высокой квалификации в конкретной области профессиональной деятельности. Практические достижения в области разработки ЭС свидетельствуют о возможном использовании технологии приобретения и накопления знаний для построения систем семантической обработки текстов. Системы машинного понимания текста, в которых применяется ограниченный естественный язык, постоянно развиваются и являются одним из наиболее перспективных способов построения пользовательского интерфейса в сложных информационных системах.

Попытки интеллектуального компьютерного анализа текстовой информации, чаще всего применяемые для исследования правовых документов, приводят к осознанию необходимости поиска и разработки механизмов логико-семантического анализа, позволяющих создавать аргументно-предикатную структуру высказываний или какой-либо другой вид семантического представления текстов.

В 1975 г. в Гейдельбергском и Дармштадтском университетах была разработана одна из первых юридических ЭС - JUDITH, позволявшая юристам получать экспертные заключения по гражданским делам. База данных системы включала предпосылки и исполнительные файлы, указывающие на взаимоотношения, существующие между наборами таких предпосылок. Кроме того, она помогала при обучении юридическим рассуждениям.

Разработанная в Массачусетском технологическом институте ЭС, Legal Analysis System, помогает адвокатам проводить юридический анализ дел об умышленном оскорблении действием. Правовые знания и факты дела представляются в виде семантических сетей. В результате можно получить выводы с логическим обоснованием, заключения, сопровождаемые ссылками на судебные решения, и другие вспомогательные законодательные документы.

Норвежский исследовательский центр по компьютерам и праву предложил демонстрационный прототип ЭС - SARA, который помогает юристам анализировать решения исходя из правовых норм, введенных в БД ЭС.

Естественно, приведенные примеры далеко не исчерпывают всего перечня известных разработок в области юридического компьютерного анализа.

Современные ПК предоставили пользователю множество новых возможностей. Однако проблема компьютерного анализа естественного языка сведена лишь к разработке средств автоматизации ввода-вывода и других видов обработки информации с участием человека. Основное внимание уделяется разработке "интуитивно понятных" пользователю интерфейсов, хотя пока еще отсутствуют достаточно глубокие представления о принципах формализации интуиции.

Основные предпосылки создания проекта "Минерва"

Конкретная проблема создания правовой ЭС актуальна для самых различных организаций, в частности для компании "Интелтек Плюс", уже много лет занимающейся вопросами разработки правовых информационно-поисковых систем (ИПС) и мультимедийных БД. О ее работах и используемых при этом технологиях проектирования уже появились публикации (см. "Мир ПК", № 8/97 и № 4/98). НПЦ "Интелтек Плюс" при продвижении ИПС ODB-Text, а также выполнении заказов по разработке документальных систем правовой направленности получил много откликов и пожеланий пользователей, которые обычно используют БД нормативных актов известных правовых информационных систем, например, компаний "КонсультантПлюс" и "Гарант", а для создания БД собственных документов предпочитают ODB-Text. Несмотря на то что данная ИПС предоставила пользователю ряд новых возможностей по организации БД, а также снабдила удачным механизмом поиска по запросам на языке, близком к естественному, некоторые задачи все же остались нерешенными.

В результате поиска пользователь хочет получить не список найденных документов, а конкретный ответ на вопрос или соответствующее место в документе. Хотя ODB-Text ранжирует список найденных документов в соответствии с близостью к поисковому запросу таким образом, что очень часто нужный документ оказывается первым в списке, проблему это, безусловно, исчерпывающим образом не разрешает.

Правовые информационные системы должны предоставлять пользователю (по его запросу) документы в той редакции, которая действует на сегодняшний день, т. е. поддерживать формирование временных срезов правовой базы. В существующих системах эти вопросы решаются редактированием документов с участием опытных юристов и занесением сделанных изменений в базу. Однако такой подход годится только для официальных, а не пользовательских правовых документов, так как таит в себе опасность редакторских ошибок. С помощью ODB-Text пользователь может изменять документы и сохранять все необходимые ему редакции в БД, но по-прежнему необходимо привлекать к работе опытных юристов и также существует опасность внесения ошибок при редактировании документов.

Законодательство Российской Федерации претерпевает в последнее время постоянные изменения. Кроме того, законы бывают весьма противоречивы, что серьезно беспокоит органы государственной власти на всех уровнях, специалистов, вовлеченных в законотворческий процесс, а также юристов-практиков. Поэтому необходима система, которая помогала бы уже на ранней стадии разработки нормативного документа обнаруживать, не противоречит ли он Конституции РФ, действующему законодательству России и субъектов Российской Федерации, а также вскрывать внутренние противоречия в нем. Аналогичные проблемы имеют место и при составлении договоров и контрактов, когда также необходимо исключить противоречия с законами России, а в ряде случаев и с международным правом. Если этого не сделать, то может возникнуть ситуация, когда исковое дело в суде будет проиграно не потому, что неверно заключены сделки, а из-за неправильного оформления документов. Данная проблема существующими правовыми системами не решается.

Как правило, пользователь имеет большое число одинаковых или близких по форме собственных документов, отличающихся лишь отдельными реквизитами. Например, каждый банк подписывает со своими клиентами договоры на банковское обслуживание. Тексты их часто бывают однотипными и отличаются только своими номерами, датами подписания, названиями и реквизитами клиентов. Для таких документов желательно иметь возможность автоматически формировать их тексты при изменении реквизитов, что в простейших случаях делается сравнительно легко и будет под силу любому программисту, освоившему VisualBasic. Офисные приложения, формирующие документы в среде Microsoft Word или Microsoft Excel, распространены довольно широко. Однако в более сложных случаях такое механическое изменение реквизитов неизбежно будет приводить к ошибкам, которые трудно найти в документах значительного объема. Поэтому успешно решить задачу синтеза документов по заданным формам и реквизитам можно лишь тогда, когда программа будет понимать смысл той информации, которую компьютер должен обработать. Следовательно, ее также нужно решать в правовой ЭС.

С указанными недостатками в значительной мере справляется правовая ЭС, проект которой имеет рабочее название "Минерва".

Проект "Минерва"

Основной целью проекта является создание ЭС, предоставляющей пользователю возможность формирования семантического описания текста документа и помещения его в БД, что позволит при добавлении нового документа проверять ланные на противоречивость и анализировать смысл нового документа.

Предлагается, по существу, новый механизм поиска информации в правовой БД - семантический поиск. При этом будет найдена та информация, которая по сути соответствует запросу пользователя, а не просто выдан список документов, имеющих поисковые ключи.

Как и во многих информационных системах, анализ документов разделяется на морфологический, синтаксический, семантический блоки. Морфологический и синтаксический анализ слов и предложений могут опираться на статистический или процедурный подходы, однако, как показывает практика, это не приносит удовлетворительных результатов, и целесообразнее применять их сочетание. Наиболее легко выполняются морфологический и синтаксический анализ текста. Ключевым в системе для понимания текста является переход от синтаксического представления высказывания к его семантической интерпретации. Известно ведь, что невозможно создать адекватный машинный переводчик, если программа не будет передавать смысла переводимого текста.

Современные системы справляются с семантическим анализом лишь в определенной степени и, как правило, в рамках узкой предметной области, ограничиваемой словарем и набором правил, причем последние могут оказаться неверными или неполными при переходе к работе с другой предметной областью. Трансформация структуры предложения из синтаксического графа осуществляется с помощью вспомогательных структур, называемых по-разному в зависимости от работы или проекта: квазилогические формы, семантические шаблоны и правила и т.п.

Структура системы

Можно выделить три основных блока ЭС: логический анализатор текста (ЛАТ), семантический анализатор (СА) и БД для хранения знаний ЭС (рис. 1). В соответствии с таким системным подходом при ее проектировании ведется разработка моделей представления и хранения знаний, синтаксиса языков запросов и описания знаний, а также выполняется программная реализация соответствующих компиляторов, проработка интерфейсных элементов системы и т. п. Кроме того, проведена значительная по объему подготовительная работа, выявляющая и систематизирующая языковые конструкции нормативных актов, содержащихся в текстах документов, которая обеспечит высокую степень автоматизации отображения синтаксических структур в семантические конструкции.

Типовые конструкции (шаблоны) существенно упрощают этап синтаксического анализа и обеспечивают автоматическое преобразование выражений, записанных на естественном языке, в выражения на языке описания, позволяющем отображать семантику документов. В случае, когда программа не в состоянии адекватно обработать фрагмент текста, пользователь может ответить на ряд уточняющих вопросов и ввести информацию, дополняющую неясное место.

Квалифицированный пользователь, владеющий языком "Минерва", может самостоятельно описывать знания непосредственно на нем, используя собственные представления о предметной области. И в этом случае будут обнаружены противоречия в его формулировках и указаны конкретные нормативные акты, с которыми они конфликтуют.

В правовой ЭС поддерживаются основные платформы - Windows 3.1, Windows 95, Windows NT. Предусмотрена интеграция разрабатываемой экспертной системы в документальную корпоративную. Ведутся также работы по стыковке объектной СУБД JASMINE (разработанной компаниями Computer Associates International, Inc. и Fujitsu Limited) и объектно-ориентированной СУБД ODB-Jupiter (НПЦ "Интелтек Плюс"), для того чтобы можно было создавать ИПС корпоративного уровня, поддерживающие русскоязычную полнотекстовую индексацию. Такой подход позволит поддерживать платформы Mac OS и Unix, а также получить доступ к документам по сетям Internet/intranet.

Ниже рассмотрим более подробно основные элементы ЭС.

Логический анализатор текста

Логический анализатор текста (ЛАТ) состоит из словаря с ограниченным запасом слов русского языка, морфологического и синтаксического анализаторов (рис. 2).

Функция ЛАТ заключается в преобразовании написанного на русском языке предложения текста, содержащего термины предметной области, в граф, отражающий синтаксические связи между его членами. В дальнейшем он преобразуется в эквивалентное выражение на языке описания знаний ЭС.

Словарь русского языка с ограниченным запасом слов можно пополнять. Его создала группа экспертов, которая включила в него слова, употребляемые в документах предметной области. Качество преобразований предложений на естественном языке в семантические конструкции прямо зависит от его полноты.

Для каждого слова в зависимости от языковой категории указываются его морфологические характеристики, например, для существительного - род, число, склонение, одушевленность/неодушевленность. Выделяются также одно или несколько метапонятий, которые могут определяться словом в зависимости от контекста.

Пример метапонятия

Слово "лицо", в зависимости от контекста может интерпретироваться по-разному: либо как часть тела человека, либо как юридический термин (физическое лицо или юридическое лицо).

Для предикатов задаются модели управления, с помощью которых на этапе синтаксического анализа можно существенно уменьшить количество рассматриваемых вариантов, подлежащих анализу, что в свою очередь на этапе семантического анализа позволит для конкретной модели управления идентифицировать семантическую роль термина в предложении. Набор моделей управления также формируется специалистами на этапе создания ЭС.

Пример

Модель управления для предиката ВЫПОЛНЯТЬ. Глагол ВЫПОЛНЯТЬ может встречаться, например, в таких предложениях:

  1. Министерство Российской Федерации выполняет постановление.
  2. Экспертная группа выполняет анализ состояния финансового рынка для подготовки отчета.
  3. Подрядчик выполняет работы по поручению заказчика.

Термины "постановление", "анализ", "работа" - слова - кандидаты на семантическую роль, определяемую моделью управления (см. таблицу).

Модели управления для предиката ВЫПОЛНЯТЬ

ПредлогСлово - часть речи-кандидатСинтаксический падеж слова-кандидатаСемантическое метапонятие слова-кандидатаСемантическая рольЕсть альтернативы
-СуществительноеИменительныйСУБЪЕКТАгентНет
ДляСуществительноеРодительныйОБЪЕКТЦельНет
ПоСуществительноеДательныйОБЪЕКТИнициаторНет

Морфологический анализатор производит разбор входного потока слов с распознаванием частей речи, а также знаков препинания. Для каждой части речи имеется набор характеристик, определяющих возможные словоформы.

В настоящее время уже создан действующий прототип ЛАТ (рис. 3 и 4). В результате синтаксического разбора создается дерево предложения, в вершинах которого располагаются термины.

Синтаксический анализатор (СА) строит синтаксический граф предложения. Отметим ряд особенностей его функционирования:

  • при выполнении анализа учитываются синтаксические характеристики русского текста, например для определения идиом;
  • выявляются именные группы, определяющие понятия;
  • отмечаются предикативные слова и группы;
  • производится идентификация синтаксических конструкций, которые могут быть автоматически транслированы в текст на формальном языке "Минерва" с учетом созданных экспертами шаблонов.

Блок семантического анализа

Семантический анализ выполняется как преобразование графа предложения, который строится СА, в выражения на языке "Минерва" c применением шаблонов. Семантический анализатор включает собственно анализатор и библиотеку шаблонов синтаксических конструкций русского языка, для которых на формальном языке уже существует представление знаний.

Пример

Рассмотрим фрагменты текста Постановления Верховного Совета Российской Федерации "О порядке введения в действие Закона Российской Федерации "Об основах налоговой системы в Российской Федерации"

... Правительству РФ ...

провести переговоры о заключении с иностранными государствами соглашений об избежании двойного налогообложения доходов (прибыли) и имущества юридических и физических лиц;

и

разработать и ввести, начиная с 1992/93 учебного года, в программу средней школы курс по налоговому законодательству.

Они имеют сходную структуру, в которой присутствуют следующие смысловые категории:

СУБЪЕКТ - ПРЕДИКАТ - ОБЪЕКТ - ТЕМА

Шаблон, формирующий знание для предложений такого рода, выглядит так:

Boolean СУБЪЕКТ::ПРЕДИКАТ(ОБЪЕКТ)
begin
  if(ОБЪЕКТ.Название()=ТЕМА)
    assign Истина
  else
    assign Ложь
end

Ключевое слово Boolean означает, что данный шаблон выдает логический ответ (ИСТИНА или ЛОЖЬ) в зависимости от названия получаемого ОБЪЕКТА.

Программа на языке "Минерва"

Язык описания семантики текстов документов должен быть объектно-ориентированным, чтобы можно было адекватно отразить их сущность (например, СУБЪЕКТ ПРАВА, ПРЕЗИДЕНТ, НАЛОГ), свойства и модели отношений между ними. Основой модели представления знаний в экспертной подсистеме служит понятие абстрактного объекта, или класса, представляющего описание совокупности элементов данных, объединенных под общим именем. Элементы данных, называемые свойствами класса, в свою очередь характеризуются именами, типами и значениями. В вырожденном случае класс может вовсе не иметь свойств, а описываться только именем. Если множества свойств нескольких классов вложены друг в друга, то можно говорить об иерархии классов. В этом случае между классами устанавливается отношение наследования: базовый класс - производный класс.

Объект, или экземпляр (представитель) класса, - это совокупность элементов данных с заданными значениями, которую можно уподобить записи в БД соответствующей структуры. В частном случае некоторые свойства отдельного объекта не задаются.

На множестве объектов, представителей своих классов, возможны отношения трех видов: факты, правила, следствия. Факт - отношение между экземплярами классов в виде сведений об объектах, заданных извне, своего рода исходные данные для системы, или первичные знания. Правило - отношение между классами или внутри класса, которое распространяется на все объекты. На основании фактов и правил с помощью механизма вывода системой могут быть получены новые знания. Следствие - это разновидность правила, посредством которого системой устанавливаются "вторичные факты", используемые для проверки знаний на противоречивость.

Итак, знания о предметной области представляются в терминах введенной модели как совокупность объектов с набором свойств, определяемых классом каждого объекта, и множество отношений между отдельными объектами и целыми классами. Для описания классов, объектов и отношений разработан специальный язык описания знаний, позволяющий отображать семантику документов. Такой формальный язык получил рабочее название, сходное с названием самого проекта, - "Минерва".

Далее представлен пример обработки системой нормативного акта - от исходного текста до отражения заложенных в нем знаний на формальном языке.

Текст исходного документа:

П О С Т А Н О В Л Е Н И Е

ВЕРХОВНОГО СОВЕТА

РОССИЙСКОЙ ФЕДЕРАЦИИ

О порядке введения в действие Закона Российской Федерации "Об основах налоговой системы в Российской Федерации"

1. Ввести в действие Закон Российской Федерации "Об основах налоговой системы в Российской Федерации" с 1 января 1992 года, за исключением положений о порядке распределения в бюджетную систему налогов на добавленную стоимость и прибыль предприятий и организаций.

. . .

3. Правительству Российской Федерации:

. . .

в) разработать и ввести, начиная с 1992/93 учебного года, в программу средней школы курс по налоговому законодательству;

г) провести переговоры о заключении с иностранными государствами соглашений об избежании двойного налогообложения доходов (прибыли) и имущества юридических и физических лиц;

После морфологического и синтаксического анализа из исходного текста автоматически выделяется набор именных групп (в тексте примера выделены жирным шрифтом) и предикатов, которые к ним относятся (выделены подчеркиванием).

Пример выделения понятий и предикатов

Верховный Совет РФ {постановлять} постановление

постановление {вводить в действие} Закон РФ "Об основах налоговой системы в РФ"

1.1 постановление {ввести в действие} Закон РФ "Об основах налоговой системы в РФ"

1.2 постановление {ввести в действие} Закон РФ "Об основах налоговой системы в РФ" с 1 января 1992 года

1.3 постановление {ввести в действие} положение

1.4 положение {есть} "О порядке распределения в бюджетную систему налогов на добавленную стоимость и прибыль предприятий и организаций"

3.11 Правительство РФ {разработать} курс по налоговому законодательству

3.12 Правительство РФ {ввести} курс по налоговому законодательству

3.13 курс по налоговому законодательству {ввести в программу} средней школы

3.14 Правительство РФ {ввести} курс с 1992/93 учебного года

3.15 Правительство РФ {провести} переговоры

3.16 переговоры {провести} с иностранными государствами

3.17 переговоры {избежать} двойного налогообложения доходов (прибыли)

Система формирует объект и модель его поведения. Если в базе знаний такой объект уже существует, то его модель дополняется.

Пример

Объект Правительство РФ
Модель его поведения определяется следующими предикатами:
{определить}
{взимать}
{разработать}
{ввести}
{провести}
{решить}

Затем система в соответствии с синтаксическими шаблонами конвертирует графы предложения в выражения на языке "Минерва". Если в тексте встречается предложение, структура которого не соответствует ни одному из шаблонов, то пользователю задается ряд уточняющих вопросов. Он может добавить описание такого предложения в качестве нового шаблона.

Пример

Возьмем рассмотренные ранее предложения и шаблон для них. В роли СУБЪЕКТа выступает Правительство РФ, ОБЪЕКТ в первом случае - переговоры, во втором - курс. Модель поведения в первом случае определяется глаголом Провести, во втором - Ввести. Система автоматически сформирует два следующих выражения для объекта:

Правительство РФ:

Boolean Правительство РФ::Провести	(Переговоры)
begin
    if(Переговоры.Название () = "двойное налогообложение")
      assign True
    else
      assign False
  end
  Boolean Правительство РФ::Ввести	( Курс )
  begin
    if(Курс.Название () = "налоговое законодательство")
      assign True
    else
      assign False
  end

БД для хранения объектов и моделей поведения

Для эффективного хранения атрибутов объектов и их методов целесообразно использовать объектно-ориентированную СУБД, которая также обеспечивает хранение объектов и взаимодействие между ними посредством передачи сообщений (в терминах объектного программирования - вызовом методов с определенными параметрами), а также чтение/запись из/в БД. Применение подобной БД позволяет совместить хранение знаний в виде объектов и связей между ними наряду с текстами самих документов. Для этой цели вполне подходит СУБД ODB-Jupiter. В ИПС ODB-Text, использующей эту СУБД как сервер документов, решены вопросы хранения юридических документов в виде гипертекстов и реализован сложный полнотекстовый поисковый механизм.

Именно эти идеи и были положены в основу ЭС по организационно-правовой защите интеллектуальной собственности в высшей школе - "ПраЗИС" и разработанной группой сотрудников кафедры "Электронные вычислительные машины и системы" МГТУ им. Н.Э. Баумана.

Ниже на конкретном примере, взятом из действующего законодательства, показано, как эта ЭС будет выявлять противоречия в правовых документах.

Пример

Выявление противоречия статьи 11 Федерального закона "О государственной регистрации прав на недвижимое имущество и сделок с ним" по отношению к Конституции Российской Федерации.

Конституция РФ. Статья 57:

Каждый обязан платить законно установленные налоги и сборы. Законы, устанавливающие новые налоги или ухудшающие положение налогоплательщиков, обратной силы не имеют.

На основании статьи 57 система сформирует такие знания:

Субъект_права.Платить (Налог)

Субъект_права.Платить (Сбор)

Субъект_права.Иметь (Имущество)

Федеральный закон "О государственной регистрации прав на недвижимое имущество и сделок с ним". Статья 1:

...недвижимое имущество (недвижимость), права на которое подлежат государственной регистрации в соответствии с настоящим Федеральным законом, - земельные участки, участки недр, обособленные водные объекты и все объекты, которые связаны с землей так, что их перемещение без несоразмерного ущерба их назначению невозможно, в том числе здания, сооружения, жилые и нежилые помещения, леса и многолетние насаждения, кондоминиумы, предприятия как имущественные комплексы...

Статья 11:

1. Система государственной регистрации прав создается за счет платы

за регистрацию и предоставление информации о зарегистрированных правах, бюджетных средств и иных не запрещенных законом источников.

2. Плата за регистрацию и предоставление информации о зарегистрированных правах на недвижимое имущество и сделок с ним взимается в размерах, установленных субъектами Российской Федерации.

Максимальный размер платежей на территории Российской Федерации устанавливается Правительством Российской Федерации.

3. Средства, получаемые в виде платы за регистрацию и предоставление указанной информации, используются исключительно на создание, поддержание и развитие системы государственной регистрации прав на недвижимое имущество и сделок с ним, в том числе на обеспечение государственных гарантий зарегистрированных прав.

Статья 1, которая определяет необходимость регистрации недвижимого имущества, на языке "Минерва" будет представлена так:

Boolean Субъект_права::Должен_Регистрировать (Имущество)
begin
  if (Субъект_права.Иметь (Имущество) AND Имущество = Недвижимость)
    return Истина
  else
    return Ложь
end

Статья 11, которая определяет порядок такой регистрации, на языке "Минерва" будет представлена так:

Boolean Субъект_права.Регистрация (Имущество)
begin
  if (Субъект_права::Регистрировать(Имущество) AND Субъект_права.Платить (Плата))
    return Истина
  else
    return Ложь
end

После описания на формальном языке "Минерва" процедуры регистрации при попытке добавить информацию в базу знаний будет выявлено отсутствие у объекта Субъект права метода Платить с аргументом Плата, поскольку в Конституции РФ декларируется обязанность Субъект права Платить только налоги и сборы. В законе "Об основах налоговой системы в Российской Федерации", где определяется понятие налогов, термин Плата также не фигурирует, следовательно, среди объектов формального языка отсутствует. Пользователь получит сообщение с информацией о документах, в которых встречались упоминание о Субъекте права (в нашем случае - "Конституция РФ" и Закон "Об основах налоговой системы в Российской Федерации"). Система укажет ему имя объекта и метода, вызвавших конфликт, и выделит строку программы на языке "Минерва":

if (Субъект_права.Регистрировать(Имущество) AND Субъект_права.Платить (Плата)),

на которой произошел останов. Система также имеет возможность позиционирования в том абзаце и на тех словах документа, где выявлено противоречие. В данном примере это будет статья 11 Закона "Об основах налоговой системы в Российской Федерации".

Синтез текста документа, временной срез

Полученное на формальном языке описание смысла документа может быть преобразовано в текст документа на естественном языке. Для этого необходимо выполнить преобразование, обратное тому, которое осуществляется ЛАТ.

Также автоматически решается задача получения текущей редакции документа и редакции, действующей на заданную дату. Для этого должно быть сформулировано поисковое выражение на языке "Минерва". В большинстве случаев достаточно использовать поисковые выражения, подготовленные специалистами, изменяя в них лишь дату. Если добавить диалоговый интерфейс, то конечный пользователь сможет просто вводить дату и получать текст документа, не прибегая к формальному языку.

Текущий статус проекта "Минерва"

В апреле 1998 г. уже был создан действующий прототип ЛАТ, разработан объектный язык "Минерва" для описания семантики текстов документов и начата реализация компилятора для него, специфицирована модель знаний в ODB-Jupiter. На финише создания прототипа рассматриваемой правовой ЭС предстоит:

  • завершить разработку словаря терминов и правил, необходимых для функционирования ЛАТ;
  • провести комплексное тестирование ЛАТ;
  • создать библиотеку синтаксических шаблонов;
  • решить ряд вопросов по обеспечению взаимодействия программистов, лингвистов и юристов.

Работы планируется завершить к концу 1998 г. и приступить к комплексному тестированию ЭС на реальных правовых базах, а также к внедрению ее опытного образца.

В заключение следует отметить, что НПЦ "Интелтек Плюс" совместно с Информационно-аналитическим управлением Совета Федерации Федерального Собрания Российской Федерации проводит научные исследования, направленные на разработку подходов к компьютерному анализу смысла правовых документов по проекту "Минерва" и внедрению данной правовой ЭС в работу органов государственного управления, связанных с законотворческим процессом. Надеемся, публикация данной статьи привлечет внимание как государственных, так и частных заинтересованных организаций. n

ОБ АВТОРАХ: А.М. Андреев - канд. техн. наук, доцент МГТУ им. Баумана, Д.В. Березкин - канд. техн. наук, Ю.А. Кантонистов - сотрудники НПЦ "Интелтек Плюс". Контактный тел.: (095) 177-80-28

Примеры зарубежных разработок

На сегодняшний день существует несколько завершенных проектов в этой области.

Название проектаРазработчикОсобенности системыПрименение
RELATUSМассачусетский

технологичский

институт
Приобретает знания посредством отображения точных и явных текстов в динамическое представление знаний в виде структурированных ссылок. Такое представление ценно само по себе, например, для восстановления исходного текста, а также для дальнейших умозаключений, аналогий, обобщений. Работа с RELATUS по силам лишь специалистам, рядовому пользователю требуется серьезная подготовкаСоздавалась для анализа текстов, описывающих политические события. Помогает выявить общие моменты в возникновении и развитии ряда локальных конфликтов в течение последних сорока лет
START INTERNET-системаЛаборатория

искусственного

интеллекта

Массачусетского

технологического

института
"Понимает" несложные вопросы на английском языке и генерирует осмысленные ответы, например, на вопросы: "Кто является создателем программы анализа текста?" (ответ - доктор Бервик), "Как связаться с доктором Бервиком?" (в ответ - адрес его электронной почты)Электронный секретарь Web-узла
Core Language Engine (Анализатор Ядра Языка)Кембриджиский

научно-

исследовательский

центр по компьютерным

наукам
Один из наиболее "продвинутых" проектов, в котором для представления знаний используются так называемые квазилогические формы. Знания в нем представляются в виде набора форм, слабо зависящих от контекста. Может использоваться в системах перевода текстов и при реализации СУБД для интерпретации поисковых запросов на естественном языке. Применение CLE позволяет ограничить область возможных интерпретаций синтаксической структуры предложения, отсекая варианты, не имеющие квазилогической формы для преобразования. Слабую зависимость CLE от контекста в большинстве случаев следует считать скорее недостатком, так как смысл слов и высказываний часто варьирует в зависимости от контекстаМашинный перевод, преобразование текстовых документов в базу знаний
DYANAУнисверситет Амстердама

(координатор)
Академический проект, результаты которого могут использоваться для создания ЭС и средств для общения с компьютером на естественном языкеДинамическая интерпретация естественного языка