Михаил Головко
Управление знаниями и интеллектуальный капитал — это громкие слова, породившие тысячи книг, статей и конференций... Но еще никто из практически работающих в этой области не смог оценить, увеличиваются ли активы знания или уменьшаются. Эти оценки показывают только то, что управление знаниями эволюционирует от волшебства к астрологии...

Пол Страссман

Очерки о базах знаний и интеллектуальной обработке вызывают закономерный скепсис — в них мало объективности и технически точной информации, зато много двусмысленности, а иногда и безграмотности. Названия «интеллектуальный», «система обработки знаний» ставятся на множество изделий. Но на вопрос «а почему, собственно?» никто из производителей не может внятно ответить. Например, к какому классу интеллектуальных программных средств (ПС) принадлежит данный продукт? К какой системе классификации? Какие типы знаний обрабатывает ПС? Как выражаются зависимости интеллектуальной обработки от логической полноты и семантической «рыхлости» знаний (например, разбавления сути знаний эмоциональной составляющей в виде литературных и просторечных слов и оборотов)? Да и можно ли правильно классифицировать знания и интеллектуальные ПС, если до сих пор для них нет каких-либо вразумительных метрик?

Замечу, что сам Страссман не определяет (в пределах статьи) знания и интеллектуальность, но дает неплохую бизнес-метрику для их денежной оценки. Однако его высказывания подразумевают знания как человеческий актив и умалчивают о знаниях как предмете технологической обработки. Из его слов очевиден лишь факт, что и носителем интеллектуальных знаний, и инструментом их обработки является человек.

Цель и намерение

Настоящая статья имеет целью хотя бы немного прояснить ситуацию вокруг проблемы знаний и средств их обработки, включая людей как основное из этих средств.

Хотелось бы также побудить специалистов, работающих с автоматизацией обработки знаний, аккуратно обращаться с понятиями «знания» и «интеллектуальный»: бездумная игра имен лишь добавляет путаницы и дискредитирует это направление ИТ. Особо хочется подчеркнуть роль ИТ-специалистов и их ответственность за чистоту информационного пространства. Дав всем желающим возможность без ограничений рыхлить и засевать «информационные угодья», мы превратили пространство вокруг себя в безразмерную мусорную кучу. Во многом из-за непонимания фундаментальных понятий, с которыми ежедневно имеем дело.

Поэтому попробуем уточнить, что такое знания, уровень знаний и какими могут и должны быть требования к знаниям на предприятии.

Добро пожаловать в мир хаоса

Информационный хаос прогрессирует — лавинообразный рост объемов информации и ее обесценивание сопровождаются соразмерным падением объема знаний. На мой взгляд, этот процесс имеет две веские причины.

Первая является техногенной и заключается в резком удешевлении доступа к данным и ее носителям, в том числе и к Internet. Это позволило тиражировать информацию в огромных, ничем не ограниченных количествах. Именно благодаря Сети бизнес стал массово получать деньги за информацию, а не за знания. Выходя на просторы Сети, этой великой мусорной кучи, чувствуешь себя копошащимся компьютерным бомжом — а вдруг найдешь то, что нужно?

Вторая причина заключается в резком падении качества и ценности технической информации. Истоки этого в том, что за последние лет десять изделия ИТ (включая электронную информацию) как класс товара, стали все более приближаться к ширпотребу. Соответственно изменились и методы сбыта ИТ-изделий, которые теперь включают все рекламные трюки психологической «ломки» покупателя, основанные на знании его вкусов, предпочтений и слабостей. К тому же изделия ИТ, особенно информация, — бурно изменяющийся класс товара с коротким жизненным циклом. Не успеешь продать сегодня — не успеешь никогда; неудивительно, что принципы «и так сойдет» и «пока живут на свете дураки...» процветают в ИТ-индустрии, как нигде. Многие производители публично возводят их в ранг своей бизнес-политики и весьма успешно практикуют с согласия большинства ИТ-потребителей, предпочитающих плохое хорошему. Применительно к информации знания подменяются схоластикой. Объективно этому способствует дефицит времени как производителя (на качество производства ИТ-изделий), так и покупателя (на качество потребления).

Чтобы понять происходящее в ИТ, важно выяснить, чем же знания принципиально отличаются от информации и данных.

Что это такое?

Начнем с попытки дать определения терминам «знание», «информация», «данные». Сложность этой задачи заключается в следующем.

Общеупотребительность этих терминов и их кажущаяся синонимичность. Отличаются друг от друга определения этих терминов в различных справочниках, в том числе и прошедших серьезное научное рецензирование. Большинство этих определений описывают понятия предметных областей (например, «документальная информация», «коммерческая информация») и мало дают представления о собственных свойствах знаний, информации и данных как таковых.

Взаимная трансформация терминов «знания-информация», «информация-данные». Этому явлению в статье уделяется особое внимание, так как граница между ними даже для большинства ИТ-специалистов весьма условна.

Миграция понятий этих терминов от общеупотребительного смысла к информационно-технологическому. Обусловлена возросшим влиянием ИТ. Если раньше знания традиционно являлись лишь средством описания предметных областей, то сейчас сами стали предметом изучения и обработки («знания о знаниях»).

Теперь — определения (за основу была взята часть справочных определений, переработанных автором в целях устранения неточностей).

  • Данные — сведения, представленные в определенной знаковой системе и на определенном носителе для обеспечения возможностей хранения, передачи, приема и обработки этих сведений. Уходя от способов представления, хранения и передачи, данные можно рассматривать как абстрактную субстанцию, несущую некоторую информацию. Данные безотносительны к содержанию информации.
  • Знание — проверенные общественной практикой полезные сведения, которые могут многократно использоваться людьми для решения тех или иных задач. Обратите внимание на «рыхлость» этого традиционного определения в сравнении с нижеследующим.
  • Знание как объект коммерции и автоматизации — логически полный ограниченный набор сведений для непосредственного решения требуемой задачи (ряда задач) подготовленными специалистами. Такие сведения выражаются в системе понятий, принятой в рамках некоторой науки или производственной деятельности, и имеют стандартное представление. Ограниченный набор позволяет задать уровень подготовки специалистов (обладание требуемым уровнем понимания).
  • Полезная информация — набор сведений (разъяснений, сигналов), уменьшающих степень неопределенности у их получателя. В отличие от знаний этот набор может быть логически неполным.
  • Релевантная информация (недостающие знания). Полезная информация, полностью устраняющая степень неопределенности у ее получателя.
  • Информационный мусор — данные, не несущие полезной информации и многократно увеличивающие временные и прочие издержки пользователя на извлечение и обработку полезной информации.
  • Информация (в общем случае) — совокупность знаний с информационным мусором.

Обратите внимание на степень неопределенности. СН является той чертой, которая мешает провести границу между релевантной информацией и знаниями согласно их определениям. СН, как антипод уровню подготовленности, является индивидуальным свойством человека и его состояния, и именно она влияет на взаимную трансформацию терминов «знания-информация-мусор». Если после получения человеком сведений СН становится равна нулю, то информация в этом сообщении является стопроцентной релевантной информацией, если же СН = 1, то информация является стопроцентным мусором.

Уровни знаний

Говоря об уровне подготовки специалиста, необходимо определить и уровень знаний. В противном случае очень трудно фиксировать их набор, обеспечивающий решение требуемой задачи. Например, для опытного специалиста этот набор будет весьма ограничен и содержит знания целевого назначения, непосредственно обеспечивающие достижение результата. Назовем его набором 1-го уровня. Для начинающего специалиста часть сведений из этого набора будет полезной, но недостаточной для понимания. Таким образом, этому специалисту потребуется еще и дополнительная часть набора знаний, описывающих знания из набора 1-го уровня. Назовем его набором 2-го уровня. Этот набор обеспечивает преобразование информации из набора 1-го уровня в соответствующие знания. Очевидно, что 1) процесс декомпозиции знаний является многоуровневым; 2) наборы знаний из разных уровней и подмножества требуемых сведений из этих наборов для решения задач (релевантные наборы) индивидуальны для каждого специалиста, согласно его уровню образования и подготовки.

Я предлагаю понимать под знаниями в первую очередь знания какого-либо уровня. Без поуровневой разбивки знания превращаются в конгломерат и не поддаются оценке. Безразмерные знания невозможно автоматизировать или продать. Именно проверка работодателем определенного уровня знаний лежит в основе трудоустройства специалистов большинства специальностей. Кстати, система требований к работникам (и при приеме на работу, и при выполнении должностных инструкций) как проекция штатного расписания имеет подобную поуровневую иерархию. По сути, это один из старейших вариантов системы требований к знаниям.

Реальность: обесценивание информации и потеря знаний

Сегодня по интересующему вопросу вы можете обнаружить множество источников сведений и получить множество порций разнородной информации, вес знаний в которых крайне мал. Но даже лишь у мизерной части этих знаний семантика формализована и обеспечена стандартным доступом в виде известных форматов и интерфейсов.

Причины

Легкая генерация информации. На одном наборе знаний можно изготовить множество наборов информации. Степень неопределенности, допускаемая при чтении информационного сообщения, позволяет описывать информацию множеством способов. Если за информацию платят, то почему бы этим не воспользоваться? Например: берем справочные сведения, перефразируем, разбавляем приятными читателю эмоциональными фразами и — получите очередную книжку!

Легкое засорение знаний. Нет проблем с засорением знаний и их постепенным превращением в информацию. Понимание, как семантический эффект, возникает главным образом при чтении текстов. Тексты выражены средствами естественных языков, которые легко объединяют и техническую информацию, и эмоциональное состояние человека. Этим объединением стала страдать современная техническая литература, сильно разбавляемая эмоциями авторов книг. При этом удельный вес технической части в книгах и ее качество падает. Печально, но факт: мы платим за бумагу, ее объем (и книжные полки под эту макулатуру), за избыток потраченного времени на ее чтение и обработку, и лишь в мизерной части — за полученные знания. Все это в полной мере относится и к информации в электронном виде.

Отсутствие средств единого синтаксического и семантического представления знаний. Посмотрите хотя бы на ИТ-специалистов. Они — живое воплощение отсутствия таких средств! Сегодня весьма немногие из них понимают сущность знаний и умеют ясно и доступно излагать их, особенно в виде технически грамотных спецификаций. Отсюда множество проблем, достойных отдельной статьи.

Сложность семантической и синтаксической верификации знаний. Мизерное изменение текста может легко изменить смысл знаний.

Например, перестановка запятой в известной фразе «казнить нельзя, помиловать» при отсутствии или неполноте смыслового контекста у фразы.

Легкая потеря семантической полноты. Достаточно потерять запятую в примере «казнить нельзя, помиловать» (например, при распознавании через сканирование), и знания превращаются в мусор.

Добыча и использование знаний

После всего вышесказанного уместен вопрос: что же мы собрались добывать? информацию? полезную информацию? знания? Сможем ли мы их грамотно описать и эффективно использовать? Как заставить работать интеллектуальный потенциал работников фирмы, который, как убедительно показал Страссман, сопоставим не только со стоимостью ее материальных активов, но и нередко кратно их превышает?

Эта тема безусловно достойна отдельной статьи.

Михаил Владимирович Головко — руководитель группы автоматизации и связи филиала ООО «Межрегионгаз» в Курской области, ОАО «Газпром». Контактный адрес электронной почты — mrg@pub.sovtest.ru.

Знания и информация: почувствуйте разницу

Чем же знания как объект коммерции и автоматизации качественно отличаются от информации? Позвольте предложить вам небольшую таблицу сравнения качеств этих понятий. Конечно, описанные критерии верны только при соблюдении условий применения знаний и стабильности условий на определенном интервале времени. То, что эти условия — неотъемлемая часть знаний, многие упускают из виду. Поэтому очень часто условия не рассматриваются достаточно тщательно и не соблюдаются. Отсюда провал множества ИТ-проектов.

ПоказательИнформацияЗнания
Объем сведений и объем данных, связанные с непосредственным решением задачиНеограниченные. В общем случае степень неопределенности неизвестна и не позволяет определить ограниченный, релевантный профиль сведенийОграниченные. Степень неопределенности = 0, объемы сведений и данных ограничены весьма четко
Прогнозирование и гарантия времени принятия решений (или решения конкретной задачи)НетОбязательно
«Алгоритмичность» (наличие четкого плана действий для достижения результата или четкого направления работ)Нет Обязательно
Степень необходимости для достижения результатаВ общем случае неизвестнаПрямо (непосредст-венно) необходимы
Логическая связанность (сочетание правил и знаний, которое обеспечивает решение задачи, а нарушение которого не обеспечивает)НетДа
«Переносимость» (описание знаний доступно для понимания сторонними специалистами, знания являются переносимыми по отношению к разным специалистам)ЧастичноДа
Тенденция к представлению в стандартной формализованной форме (обязательное требование для обеспечения ценности, реальной стоимости и возможности автоматизированной обработки)НетДа
Гарантировано достижение результата НетДа
СтоимостьРеальная стоимость невеликаЗнания стоят дорого, но обеспечивают быстрый возврат инвестиций