Все расширяющееся использование компьютерной техники и усиливающаяся конкуренция определяют возрастающий интерес потенциальных патентообладателей на изобретения в области компьютерных технологий к возможностям их защиты патентным правом. Защита программного обеспечения авторским правом, включая явочную регистрацию его в Роспатенте, фактически является косвенной защитой системы компьютерных команд, а не компьютерных технологий, реализуемых программным обеспечением. Получение же патентов на техническую сущность процессов, происходящих в компьютере, намного важнее в правовом и коммерческом плане, чем традиционная регистрация компьютерных программ. Дело в том, что эти процессы при возможности различных программных реализаций практически одинаковы.
В процессе создания патентно-правового поля, защищающего изобретение, в частности, необходимо сформировать определения материального объекта и совершаемых над ним операций. Поэтому, как правило, такие патенты могут быть подготовлены в творческом содружестве разработчика программного обеспечения и квалифицированного патентоведа, обладающего знаниями в области компьютерных технологий.
В первую очередь целесообразно охарактеризовать особенности («ноу-хау»), определяющие свойства материализуемой информации как объекта, над которым посредством компьютера осуществляется совокупность тех или иных операций. При формулировке существенных признаков, характеризующих эти операции, удобно ориентироваться на использование гипотезы, согласно которой информацию можно рассматривать как разновидность материальной категории. Для целей патентования информацию можно определить как материальную категорию, отражающую, фиксирующую и характеризующую степень упорядоченности материи и/или целенаправленной организации материального мира, определяемую, в том числе, количественными характеристиками с возможностью фиксации на материальных носителях и многократного ее воспроизведения. Однако если эта гипотеза неприемлема, для характеристики операций по преобразованию информации следует использовать возможность ее материализации в виде совокупности адекватных информации электромагнитных сигналов, материальный характер которых не вызывает сомнения.
Проиллюстрировать это можно на примере патентования технологий Fine Reader распознавания визуальной информации, в частности, изобретения «Групповой способ АБИ (ABBYY) верификации компьютерных кодов с соответствующими им оригиналами» (заявка №98114579/09, по которой заявителем - компанией Abbyy получено решение о выдаче патента). Одним из важнейших практических аспектов составления заявки и дальнейшего взаимодействия с экспертизой является четкая и детальная система расшифровки и определения используемых обозначений, символов и/или терминов. В описании рассматриваемого изобретения приведена совокупность следующих определений.
«Исходное графическое изображение, преимущественно, буквенно-цифровой текст (может быть более, чем на 40 языках) на материальном носителе - подлежащее вводу в компьютер изображение с целью последующей компьютерной обработки или хранения в машиночитаемом виде.
Графическое изображение, введенное в компьютер, - компьютерное представление некоторого фрагмента графической информации.
Компьютерный код (символ) - компьютерное представление в виде совокупности электромагнитных сигналов некоторого фрагмента символьной информации.
Компьютерные коды (символы) получают в процессе компьютерного распознавания графического изображения или его фрагментов, введенного в компьютер, например, с помощью сканера.
Процесс верификации - производимое человеком и/или заменяющим его устройством, и/или компьютерной программой сличение (определение адекватности) компьютерных кодов (символов) с графическим изображением, введенным в компьютер.
Процесс распознавания - процесс обработки системой распознавания введенного в компьютер графического изображения некоторого символа, в результате чего система распознавания приписывает изображению компьютерный код этого символа.
Точность процесса распознавания - усредненный процент правильно распознанных символов по статистически представительному практически релевантному множеству текстов.
Правильно распознанные символы - символы, компьютерный код которых правильно определен системой распознавания.
Неправильно распознанные символы - символы, компьютерный код которых неправильно определен системой распознавания.
Выделенные символы - символы, выделенные в процессе фильтрации для последующей верификации. В идеале выделенные символы должны включать все неправильно распознанные символы.
Цена ошибки - параметр, адекватный величине убытка, причиненного попаданием неправильно распознанного символа в окончательный результат распознавания.»
Данным изобретением решается задача совершенствования способов верификации компьютерных кодов с соответствующими им оригиналами с достижением технического результата в виде повышения скорости верификации и ее усредненной точности, что можно охарактеризовать совокупностью операций, осуществляемых над материализованной в виде компьютерных кодов информацией в виде, изложенной во врезке формулы изобретения.
В упрощенном виде запатентованную совокупность операций можно охарактеризовать таким образом, что после преобразования исходной символьной информации оригинала документа в совокупность адекватных ей компьютерных кодов в найденных и отобранных полях документа, в процессе фильтрации выделяют компьютерные коды (символы), определяя достоверность распознавания каждого символа на основе результатов распознавания изображения этого символа различными известными способами. Затем группируют после фильтрации одинаково распознанные компьютерные коды и выводят для их верификации специализированным устройством или оператором. Производят верификацию, сличая, например, показанное на устройстве отображения визуальной информации изображение, введенное в компьютер, с изображением компьютерного кода (символа).
Практический опыт патентования данного изобретения может быть полезен и при патентной защите иных компьютерных, информационных и Internet-технологий. Целесообразно еще раз отметить, что использование в процессе патентно-правовой охраны вышеуказанных особенностей может значительно повысить коммерческую ценность получаемых патентов по сравнению с той, которую имеют охранные документы на основе регистрации программного обеспечения — его конкурирующих версий можно зарегистрировать массу. Поэтому регистрация является только косвенной, а не прямой защитой компьютерных технологий.
Лев Линник — российский и евразийский патентный поверенный, профессор, действительный член Международной академии авторов научных открытий и изобретений. С ним можно связаться по электронной почте по адресу: l.linnik@g23.relcom.ru
Формула изобретения
(заявка №98114579/09, по которой заявителем - компанией Abbyy получен патент РФ №2145145, формула изобретения опубликована в Бюллетене изобретений №3 2000).
«Групповой способ АБИ (ABBYY) верификации компьютерных кодов с соответствующими им оригиналами, включающий преобразование исходной символьной информации оригинала документа в совокупность адекватных ей компьютерных кодов в найденных и отобранных полях документа и приведение в соответствие компьютерных кодов с оригиналом, отличающийся тем, что в процессе фильтрации выделяют компьютерные коды (символы), определяя достоверность распознавания каждого символа на основе результатов распознавания изображения этого символа различными известными способами, сравнения этих результатов между собой и с результатом словарного контроля, и выбирая их из исходной последовательности компьютерных кодов общим числом Nисх, в количестве Nвыд = F - aNневыд. непр, где a - экспериментальный коэффициент, выбираемый в зависимости от цены ошибки и усредненной точности системы распознавания в пределах: 10-12 <= a <= 1015, а F - экспериментальный параметр, выбираемый в зависимости от точности системы распознавания и числа подлежащих распознаванию символов в документе в пределах: 1 <= F <= 1016, группируют после фильтрации одинаково распознанные компьютерные коды общим числом Nвыд таким образом, что в каждую группу включают NвыдС одинаковых компьютерных кодов, где С - числовое значение верифицируемого компьютерного кода из всего множества допустимых значений, выбирая значение NвыдC в пределах:
1 <= (NвыдС + Nвыд) / Nвыд <= 2, причем в каждую группу NвыдС включают правильно распознанные компьютерные коды (символы) в количестве Nвыд прС и неправильно распознанные компьютерные коды в количестве Nвыд непрС, а соотношение между Nвыд прС и Nвыд непрС выбирают в следующих пределах: 0.5 <= (Nвыд прС + Nвыд непрС - bNвыдС) / Nвыд прС <= 1.5, где b - экспериментальный коэффициент, выбираемый в зависимости от четкости и контрастности исходного графического изображения в пределах: 10-9 <= b <= 1, выбирая количество Nгр сгруппированных для верификации одинаковых компьютерных кодов в пределах Nгр = NвыдС , где g экспериментальный коэффициент, в зависимости от количества группируемых выделенных компьютерных кодов и включаемых дополнительно эталонных и/или вспомогательных и/или информационных кодов, выбираемый в пределах 10-5 <= <= 106, - экспериментальный вероятностный коэффициент уверенности в достоверности распознавания, выбираемый на основании статической обработки и результатов оценки качества исходных графических изображений на материальном носителе, в пределах 0,01 <= <= 1, группы одинаково распознанных компьютерных кодов выводят для их верификации специализированным устройством или оператором, например, в случайном порядке либо в порядке убывания весовой WC значимости группы компьютерных кодов, которую определяют экспериментально на основе статистической обработки больших массивов информации в зависимости от алфавитного порядка и/или размера группы компьютерных кодов, и/или степени важности данного компьютерного кода для содержания документа и др., исходя из практической значимости достоверности верификации компьютерных кодов, и выбирают в пределах: 10-8 <= WC/N2C <= 1016, производят верификацию, сличая, например, показанное на устройстве отображения визуальной информации изображение, введенное в компьютер, с изображением компьютерного кода (символа), для чего одновременно в устройство отображения визуальной информации вводят Nэкр разных графических изображений, предоставляя при этом на верификацию одного изображения промежуток Tвер времени, который по отношению к Nэкр выбирают в экспериментально найденных пределах:
-20 <= log2(TверNэкр) <= 37, где - экспериментальный коэффициент, выбираемый в зависимости от кинетических характеристик устройства ввода символьной информации в компьютер в пределах 0.2c-1 <= <= 10c-1.»