Благодаря проекту, финансируемому Европейской комиссией, бельгийской полиции станет намного проще следить за действиями организованной преступности в Италии.

Бельгия и Италия в числе восьми европейских стран участвуют в проекте Sensus. Цель этого проекта, как подчеркнул Стефан Боденкамп, представитель МИДа Германии, - определить путь использования технологии для многоязычных коммуникаций и анализа информации, дабы помочь полиции и другим правоохранительным органам бороться с такими противозаконными явлениями, как нелегальная иммиграция и организованная преступность. В не меньшей степени в этом проекте заинтересована Europol - новая европейская организация по борьбе с преступностью.

Во многих европейских проектах немало внимания уделяется решению межъязыковых проблем, тем не менее европейские правоохранительные органы сталкиваются с теми же трудностями, что и любой пользователь, вынужденный разбирать кучу бумаг, написанных в различных форматах.

«Аналогичные вопросы возникают у любого пользователя хранилища данных, когда он обращается к системе, чтобы получить ту информацию и в том виде, которая ему необходима, причем именно тогда, когда это требуется», - сказал Боденкамп.

Задача Sensus - выяснить, насколько многоязычная добыча и хранение данных, а также технология машинного перевода могут ускорить принятие решений и обмен информацией между участниками инициативы.

Проект стартовал в июне, сейчас, по словам Боденкампа, развертывается этап определения требований пользователей, в дальнейшем предполагается создание конкретных продуктов, предназначенных для коммерческого применения. Среди разработчиков программного обеспечения, участвующих в реализации Sensus, такие компании, как Lernout & Hauspie - бельгийская фирма, специализирующаяся в области голосовых технологий и методов перевода, а также Systems Software Engineering - дублинский филиал корпорации Siemens. В проекте участвуют Греция, Италия, Франция, Испания, Португалия, Бельгия, Великобритания и Германия.

Среди инструментальных средств, которые участники намерены опробовать в течение двух лет (срок реализации проекта), - машинный переводчик T1 компании L&H, позволяющий переводить текст одновременно на несколько языков, а также новая система поиска в Internet - I-translator (во время разработки ей было присвоено кодовое название Coronado) того же производства. I-translator, который выйдет в четвертом квартале, даст возможность пользователям, работающим в рамках проекта, обращаться с запросами к большинству механизмов поиска в Internet на английском, немецком, испанском, французском, португальском, итальянском, арабском и русском языках. Позднее появится возможность работы с японским и китайским языками. Результаты поиска группируются и снабжаются краткими комментариями, что позволяет выбрать наиболее интересующий пользователей материал для машинного перевода.

По словам Боденкампа, правоохранительные органы смогут проводить более тщательный поиск информации на различных языках, основываясь на технологии извлечения данных, разработанной ранее Университетом Шеффилда в Великобритании. К примеру, сотрудники полиции получат в свое распоряжение инструментарий, позволяющий проводить поиск информации на различных языках в базах данных, которые способны обрабатывать запросы на естественном языке, без использования более формальных языков, таких как SQL, для взаимодействия с базами данных. Другой инструментарий позволит автоматически генерировать создаваемые по шаблонам (форматированные) отчеты по результатам многоязычного поиска. К примеру, пользователь передает запрос по-французски, после этого запускается механизм поиска на всех языках во всех доступных источниках, в конце концов ключевые слова в найденных материалах переводятся на родной язык пользователя, в данном случае - французский.

Sensus был развернут на основе другого общеевропейского проекта Aventinus, который посвящен разработке программных средств, предназначенных в помощь полиции, разведывательным агентствам и Europol в борьбе с наркоторговцами в Европе. Например, один из его участников - Spanish Liaison Office, входящая в состав Europol использует систему T1 производства L&H для перевода на английский язык донесений о деятельности наркодилеров в Испании, после чего распространяет информацию по сети Europol Drugs Unit по всей Европе.

Aventinus, который находится на стадии завершения, позволяет выявить трудноразрешимые вопросы с добычей и использованием информации в курируемых организациях и разработать информационные инструментальные средства для их устранения. В проекте Sensus планируется задействовать многие из этих инструментальных средств и развивать их с учетом накопленного опыта. Поскольку в проекте Aventinus принимают участие несколько разведывательных агентств, по словам Боденкампа, разработчики особое внимание уделяют задаче получения данных из организаций, имеющих дело главным образом с засекреченной информацией. L&H работает в проектах Sensus и Aventinus с июня 1997 года, после того как в ее состав вошла немецкая компания GMS, специализирующаяся на системах машинного перевода. Основатель GMS - Пир ван Драйстен теперь возглавляет отдел языковых технологий L&H.

Боденкамп является директором центра тестирования технологий, финансируемого немецким правительством. Здесь работает почти 170 лингвистов и экспертов в области информационных технологий из Мюнхена, Берлина и Бонна. Многие проекты центра используются Европейским союзом, поскольку этой организации, как никому другому, требуются многоязычные технологии.