Компания Advantis представляет новую систему машинного перевода

Познакомиться с системой машинного перевода Retrans Vista журналистов пригласили незадолго до ее официального выпуска. Эта система имеет давнюю историю. Ее непосредственная предшественница — система Retrans, права на которую принадлежат ВИНИТИ. В ноябре прошлого года после доработки продукт был зарегистрирован под названием Retrans Vista, которым владеет компания «Виста Текнолоджис», распространять же программу будет родственная ВТ компания Advantis. Пока это единственный продвигаемый ею продукт, но Advantis планирует удивить рынок и другими лингвистическими программами, построенными вокруг того же ядра. Сейчас две системы — Retrans и Retrans Vista — существуют параллельно. ВИНИТИ продолжает предлагать свой продукт, который стоит около 300 долл. и распространяется не только ВИНИТИ, но и SoftLine. Обещано, что Advantis будет предлагать Retrans Vista по более гуманным ценам и значительную часть своих прибылей рассчитывает получать по модели OEM.

При создании пакета Retrans Vista система Retrans была радикально переработана: переписано лингвистическое ядро, «вычищены» и одновременно расширены словари

Идеолог системы, профессор Герольд Белоногов, уверен в том, что создание системы машинного перевода требует не одного десятилетия работы. Retrans Vista реализует концепцию фразеологического машинного перевода, учитывающего сочетания слов, обозначающих понятия, отношения между понятиями и типовые ситуации. Теоретически это несколько увеличивает нагрузку на вычислительные средства, значительно улучшая качество перевода, образцы которого были представлены. (Образцы, правда, были получены не в автоматическом, а в интерактивном режиме). Концепция Белоногова опубликована еще в 1975 году. Далее работы велись в режимном НИИ и в ВИНИТИ, который являлся своего рода полигоном. Огромный многолетний труд — это не только оттачивание лингвистических концепций, но прежде всего составление словарей, в данном случае фразеологических. Всего в общем и тематических словарях около 4 млн. словарных статей, из них более 3 млн. — словосочетания. Словарь двусторонний — русско-английский и англо-русский. Выбор языка — дань рынку.

Немало усилий отдано было системам перевода, ориентированным на французский язык, и эти усилия были довольно щедро оплачены французскими заказчиками, что в свою очередь стимулировало продолжение разработок.

Новой жизнью система зажила с приходом Юрия Сокова, ранее работавшего в ряде компьютерных компаний. Ему удалось найти инвестиции и в рамках новой компании «Виста Текнолоджис» существенно переработать систему, в основном силами разработчиков, вышедших из ВИНИТИ. Лингвистическое ядро системы подвергалось значительным изменениям, полностью были интегрированы подсистемы перевода русско-английского и англо-русского, добавлены пользовательский словарь и возможности технологии Translation Memory.

Особое внимание уделили пользовательскому интерфейсу. Появились развитые возможности интерактивного перевода с автоматическим пополнением пользовательского словаря, который сохраняется в отдельном файле, обеспечивая переносимость данных. С системой можно работать не выходя из Word или Internet Explorer.


Retrans Vista и ее братья по разуму

Поскольку производители систем машинного перевода обычно не стесняются выложить свои Internet-версии, грех не воспользоваться их предложениями и не подставить собственные тестовые тексты. В качестве тестовой была взята фраза на заурядном разговорном английском с сайта группы www.tindersticks.co.uk, которую «предложили» четырем претендентам: «Промт» (разработчик — компания «Промт»), «Сократ» («Арсеналъ»), Retrans и американской InterTran (Translation Experts).

Исходная фраза: «Well the new year is under way and we have some news for you all, we have confirmed some shows, see below for details. The one thing I know a lot of you will ask is ?what about Al?».

«Рукотворный» перевод: «Ну что же, скоро Новый Год, и у нас есть для вас новости. Подтверждены даты некоторых предстоящих выступлений, детали см. ниже. Уверен, что многие из вас спросят: «А как насчет Эла?» (Как нетрудно догадаться человеку, даже не отягощенному музыкальными увлечениями, Эл — это член группы.)»

«Промт»: «Хорошо Новый Год — в процессе разработки, и мы имеем некоторые новости для Вас всех, мы подтвердили некоторые показы, видим ниже для деталей. Одна вещь, которую я знаю много, Вы спросит — ?что относительно Ала?».

«Сократ»: «Хорошо новый год осуществляет и у нас есть некоторые новости для Вас, мы подтвердили некоторые показывают, смотри ниже относительно деталей. Одна вещь, которую Я знаю много Вы спросите, ?как насчет Al?».

InterTran: «Колодец грамматический определенный член Новый год быть на ходу и мы вспомогательный глагол для образования сложных времен некий новость для ты весь, мы вспомогательный глагол для образования сложных времен хронический некий показывать, видеть ниже для подробность. Грамматический определенный член один вещь Я знать высшая отметка за классную работу жребий яние) от ты воля спрашивать быть ?какой кругом Al?».

Retrans: «Колодезный новый год осуществляется и мы некоторый последнее известие для вас всем, мы подтверждали некоторые бои, смотри ниже относительно деталь. Единица вещи я знаю массы вы будете спрашивать являетесь «как обстоят дела с алюминием».

«Промт» и «Сократ» решили, что «Well» — наречие, Retrans — прилагательное, а InterTran была настолько прямолинейна, что приняла за существительное. Можно предположить, что все четверо — не мастера разговорного жанра, не на то «заточены». Проверим. Подставим наш перевод — «Ну что же, скоро Новый Год» и попросим перевести на английский. «Сократ»: «Well that, soon The New Year»... Все он умеет, просто не хочет.

Онлайновой версии Retrans Vista пока не существует, что неудивительно, ведь у молодого продукта нет пока и собственного сайта. По словам менеджеров Advantis, система Retrans была радикально переработана: переписано лингвистическое ядро, «вычищены» и одновременно расширены словари. Демо-версия с компакт-диска выдала следующее: «Хорошо новый год осуществляется и мы некоторые новости для вас весь, мы подтверждали некоторые выставки, смотри ниже относительно деталей. Один вещей я знаю большое количество вы будете спрашивать являетесь ?как обстоите дела с алюминий?».

Advantis, предлагая Retrans Vista, больше рассчитывает, как выяснилось, на перевод не в автоматическом режиме, а в интерактивном режиме. Система — не замена переводчику, а инструмент, облегчающий и ускоряющий его труд: добавляя варианты перевода в пользовательский словарь, можно добиться от текста значительно большей осмысленности.