приходится слышать жалобы на то, что некоторые сообщения электронной почты прочитать не удается, несмотря ни на какие ухищрения. Для решения этой проблемы создано немало программ, интегрируемых с различными почтовыми системами.
Недавно появилась такая «распознавалка» и для Lotus Notes. Ее создала компания «Арсеналъ», разработавшая специальную версию своего продукта «Реаниматор», адаптированную для встраивания в клиентские программы Notes.
Первыми пользователями и участниками бета-тестирования «Реаниматора» для Notes стали сотрудники российского представительства Lotus Development. По словам Александра Данилина, менеджера представительства по развитию бизнеса в России и странах СНГ, когда он увидел вместо непонятных символов-«чебурашек» русский текст, он настолько обрадовался, что практически сразу предложил «Арсеналу» собрать совместную пресс-конференцию по случаю предстоящего выхода в свет «Реаниматора» для Lotus Notes. Она состоялась 21 августа.
Как рассказал менеджер по маркетингу компании «Арсеналъ» Александр Каплинский, «Реаниматор» представляет собой разработанное для операционных систем Windows 3.1, Windows 95, Windows 98 и Windows NT приложение, которое интегрируется с почтовыми клиентами Notes. Оно позволяет декодировать сообщения, применяя как единую схему преобразования символов, так и разные схемы, подбираемые индивидуально для каждого поля документа. Среди рассматриваемых кодировок - стандартные DOS, Windows, Unix, транслитерация, а также Uuencode, Base 64 и Quoted Printable. Число перебираемых вариантов практически неограниченно. Во время демонстрации подходящая кодировка была найдена после того, как система проанализировала свыше 12 тыс. вариантов. На практике сотрудники «Арсенала» не встречались со случаями декодирования, требовавшими более 4,5 тыс. вариантов, конечно, при условии, что текст не является безнадежно испорченным. Перебор прекращается, когда система находит подходящую кодировку или если пользователь сам остановит этот процесс. После этого система предлагает пользователю просмотреть несколько вариантов декодированного текста. При желании один из них можно сохранить вместо исходного текста сообщения. Примечательно, что «Реаниматор» - очень компактное приложение: размер его ядра составляет всего лишь 64 Кбайт.
Сотрудники «Арсенала» приоткрыли журналистам и некоторые тайны своих ноу-хау. В «Реаниматоре» имеется небольшой словарь, содержащий наиболее употребительные слова русского языка. Вывод о том, является ли данный вариант преобразования декодированным русскоязычным текстом, делается на основе эмпирического (предположительно статистического) анализа с использованием словаря. Точность распознавания кодировок - примерно 80%. Наибольшую трудность составляют короткие сообщения. Что касается времени декодирования, оно пропорционально размеру текста, содержащегося в сообщении, если он не превышает 4 Кбайт. Тексты более объемные декодируются примерно за одинаковое время. Из этого можно сделать вывод, что программа анализирует только первые 4 Кбайт текста.
Продажа «Реаниматора» для Lotus Notes начнется в сентябре и будет осуществляться по корпоративным каналам продаж. Кстати, некоторые дистрибьюторы компании Lotus уже познакомились с продуктом и выразили желание поставлять «Реаниматор» вместе с Notes (благо цена одной лицензии не превысит 10 долл.). Вполне возможно, что в дальнейшем программа декодирования будет продаваться в составе русскоязычной версии Notes, руководители «Арсенала» очень на это надеются. Однако, по мнению Данилина, компаниям предстоит решить немало вопросов, касающихся авторских прав и политики лицензирования.
Декодировщик для Notes стал первым продуктом «Арсенала» для системы Notes. В ближайших планах компании - создание для этой платформы версий программы автоматизированного перевода «Сократ» и встраивание в Notes технологии редактирования документов Lexicon Editor Toolkit - той самой, что применяется в продуктах «Лексикон» и «Лексикон-XL».