|
Глава I. АВТОМАТИЗИРОВАННЫЕ СИСТЕМЫ ИНЖЕНЕРИИ ЗНАНИЙ 1.1 Задача формирования баз знаний 1.2 Способы представления знаний
Продукционные системы • Семантические сети •
Фреймы • Логические исчисления •
Комбинированные способы представления знаний •
Модели проблемных областей
1.3 Инструментальные экспертные системы1.4 Принципы организации опроса эксперта и системы приобретения знаний
Простое и структурированное интервью • Протокольный анализ •
Метод декомпозиции цели • Методы сопоставления •
Методы заочной консультации
1.5 Принципы построения автоматизированных систем инженерии знаний1.6 Специальные обозначения Глава II. МЕТОД ПРОСТЫХ СИСТЕМ АЛЬТЕРНАТИВ 2.1 Основные понятия 2.2 Логический вывод в системах альтернатив 2.3 Модули знаний в системах альтернатив
Модуль альтернативы • Модуль несовместимости •
Модуль запрета • Модуль импликации •
Модуль продукции • Структурирование систем альтернатив
2.4 Реализация процедуры логического вывода2.5 Модифицированные системы альтернатив Глава III. ИНСТРУМЕНТАЛЬНАЯ ЭКСПЕРТНАЯ СИСТЕМА ФИАКР 3.1 Организация базы знаний
Модель проблемной области в системе ФИАКР •
Модули знаний •
Флаги существования атрибутов • Флаги существования подсистем •
Флаги активизации • Флаги целей • Флаги опроса
3.2 Программное обеспечение режима эксперта
Входной язык системы ФИАКР •
Редакторы базы знаний • Конструктор модулей знаний
3.3 Программное обеспечение режима пользователя
Блок консультации • Подсистема объяснений
3.4 Особенности реализации системы ФИАКР3.5 Методы отладки баз знаний в системе ФИАКР
Тестирование баз знаний •
Статические методы исследования баз знаний •
Динамические методы исследования баз знаний
Глава IV. МЕТОДЫ ВОССТАНОВЛЕНИЯ ФОРМАЛЬНЫХ ГРАММАТИК 4.1 Постановка задачи грамматического вывода 4.2 Структура контекстно-свободных языков
Нормальные контекстно-свободные грамматики •
П-сети • Структура КС-языков
4.3 Метод обобщения4.4 Методы структурирования
Восстановление регулярных языков •
Восстановление однозначных контекстно-свободных языков •
Эвристический метод восстановления контекстно-свободных языков
Глава V. МЕТОДЫ РЕАЛИЗАЦИИ АВТОМАТИЗИРОВАННЫХ СИСТЕМ ИНЖЕНЕРИИ ЗНАНИЙ, ОСНОВАННЫЕ НА СОПОСТАВЛЕНИИ РЕШЕНИЙ
5.1 Метод репертуарных решеток
Свойства метода репертуарных решеток •
Игровой подход к реализации метода репертуарных решеток
5.2 Языки образов для построения сценариев извлечения знаний5.3 Метод ролевых диалогов для построения сценариев извлечения знаний
Задачи выбора • Сценарий извлечения знаний "Рекламный агент"
5.4 Комбинированные сценарии извлечения знаний
Задачи управления • Интерактивная процедура синтеза схем управления
5.5 Метод доводки именГлава VI. ИГРОВЫЕ МЕТОДЫ РЕАЛИЗАЦИИ АВТОМАТИЗИРОВАННЫХ СИСТЕМ ИНЖЕНЕРИИ ЗНАНИЙ
6.1 Экспертная игра "Черный ящик"
Правила игры • Анализ протоколов
6.2 Экспертная игра "Буриме"
Правила игры • Анализ протоколов
6.3 Экспертная игра "Угадай-ка"
Правила игры • Анализ протоколов
ЗАКЛЮЧЕНИЕ ЛИТЕРАТУРА
Возможности электронно вычислительных машин уже никого не удивляют. Компьютеризация различных областей человеческой деятельности, помимо прямого эффекта от внедрения вычислительной техники, зачастую порождает новые классы программных продуктов и технологии их разработки. Любая технология - это прежде всего поле интеллектуальной деятельности для специалистов, однако, в отличии от других видов деятельности технологии разработки программных продуктов немедленно становятся объектами автоматизации, что выводит соответствующий раздел программирования на новый уровень развития. Типичную эволюцию от конкретных программ до инструментальных средств разработки прошли системы, основанные на знаниях, и в первую очередь - экспертные системы, предназначенные для решения задач из тех областей, где решающую роль играют знания и опыт профессиональной деятельности. В экспертных системах поиск решений осуществляется посредством имитации рассуждений, присущих выдающимся профессионалам. Формализованные знания составляют ядро экспертной системы - ее базу знаний. Остальные блоки системы реализуют функции преобразования знаний и определяются не столько содержимым знаний, сколько свойствами их формальных структур. Технология разработки систем, основанных на знаниях, не совсем точно называется инженерией знаний. Согласно требованиям технологии построением базы знаний занимается специально подготовленный когнитолог, работа которого требует не только инженерных навыков, но и определенных творческих способностей. Когнитолог должен выявить и структурировать знания с тем, чтобы они могли эффективно функционировать по формальным правилам. Трудоемкость процесса разработки баз знаний практически не поддается предварительной оценке; в ходе разработки приходится неоднократно пересматривать ранее принятые решения и повторять некоторые этапы. Принципиальное отсутствие универсальной технологии формирования баз знаний навсегда гарантирует профессии когнитолога статус творческой профессии. Вместе с тем в помощь когнитологу создаются специальные программные системы, поддерживающие те или иные этапы формирования баз знаний. В частности, для извлечения и формализации личных знаний экспертов предназначены автоматизированные системы инженерии знаний (АСИЗ). В настоящее время автоматизированные системы инженерии знаний представляют собой уникальные программные продукты, обобщающие конкретный опыт разработки баз знаний. Назрела настоятельная необходимость в разработке общей концепции АСИЗ, которая позволит:
Соответственно задача диссертации состоит:
В первой главе диссертации:
Выбор конкретного способа представления знаний является наиболее ответственным решением в ходе разработки экспертной системы. При отсутствии универсальных критериев выбора круг потенциальных решений когнитолога определяют четыре основных модели знаний, которые допускают разнообразные реализации способов представления как в рамках отдельной модели, так и посредством их комбинирования. Причем комбинирование может выполняться либо на глобальном уровне основных понятий моделей знаний, либо на более низком уровне машинно независимых методов реализации баз знаний. Инструментальные средства, предназначенные для формирования баз знаний, подразделяются на инструментальные экспертные системы и системы приобретения знаний. Первые из них ориентированы преимущественно на обслуживание формальных структур знаний, они позволяют существенно упростить заключительные этапы разработки экспертных систем. Сама возможность построения такого рода инструментария связана с тем, что экспертные системы имеют достаточно устоявшуюся структуру функциональных блоков, основными из которых являются машина вывода, подсистема объяснений и средства формирования баз знаний. В то же время набор операций, предоставляемых в распоряжение когнитолога, существенно зависит от тех способов представления знаний, которые поддерживает тот или иной инструментарий. В свою очередь системы приобретения знаний ориентированы на поддержку деятельности когнитолога в его работе непосредственно с источником знаний. При этом структура и функциональное наполнение этих систем определяется прежде всего особенностями источника знаний. В случае формирования баз знаний, когда носителем знаний выступает эксперт, когнитологу приходится считаться с тем, что (1) знания эксперта не имеют модульной структуры, (2) наиболее существенные знания эксперта носят невербализованный характер, и, наконец, (3) эксперт неспособен фиксировать ход своих рассуждений. В связи с этим технология прямого извлечения, предполагающая самостоятельную работу эксперта над базой знаний, оказывается малопродуктивной. Более плодотворными оказываются методы косвенного извлечения, когда эксперт выполняет отдельные задания в пределах своей профессиональной компетенции, а когнитолог при этом имеет возможность реконструировать схему его рассуждений. Однако сама по себе задача разработки методов извлечения знаний удобных одновременно и для эксперта и для когнитолога является очень непростой. Утилитарное назначение АСИЗ состоит в сохранении и
тиражировании тех методов извлечения знаний, которые поддаются
строгой формализации. Определяющими особенностями АСИЗ являются:
Анализ известных приемов опроса показывает, что существуют всего два принципиальных подхода к организации автоматизированного опроса эксперта: сопоставление решений или заочная консультация. Причем в рамках каждого из этих подходов допускаются различные и весьма непохожие реализации АСИЗ. Во второй главе диссертации рассматривается метод простых систем альтернатив; метод предназначен для организации и обработки данных в интересах решения переборных задач, возникающих в АСИЗ при реализации алгоритмов анализа протоколов. Иное применение метода состоит в том, что в виде простых систем альтернатив можно создавать базы знаний для решения задач распознавания и классификации. По определению простая система альтернатив есть множество однородных записей, состоящих из основных и вспомогательных фактов. Такие записи называются альтернативами. Основные факты соответствуют признакам проблемных ситуаций. Вспомогательные факты, вообще говоря, не имеют содержательной интерпретации, они задают связи связи между альтернативами. По ходу решения конкретной задачи факты могут либо устанавливаться, либо опровергаться, причем в каждой альтернативе разрешается иметь ровно один установленный факт. Если это условие не выполняется, то множество установленных фактов считается недопустимым для данной системы альтернатив. Таким образом, систему альтернатив можно рассматривать как генератор допустимых множеств фактов. Если из каждого допустимого множества рассматривать только основные факты, то полученное подмножество представляет собой формальное описание некоторой проблемной ситуации, а совокупность таких формальных описаний образует так называемый класс распознавания простой системы альтернатив. Доказано, что системы альтернатив позволяют сформировать любой класс распознавания и с этой точки зрения метод реализации баз знаний является универсальным. Если некоторый набор фактов из класса распознавания задан своим подмножеством, то нахождение недостающих фактов этого набора составляет задачу логического вывода. Исчерпывающее решение этой задачи возможно только путем полного перебора различных вариантов разрешения альтернатив. Вместе с тем, для практических целей достаточно ограничиться упрощенной процедурой логического вывода, основанной на правилах элиминации опровергнутых фактов во всех альтернативах заданной системы. Различные модификации этой процедуры позволяют реализовать эффективный логический вывод в простых системах альтернатив. Как правило, базы знаний строятся из отдельных, достаточно самостоятельных
модулей. В связи с этим во второй главе приводятся специальные конструкции
альтернатив, реализующие следующие модули знаний:
В третье главе диссертации описывается инструментальная экспертная система ФИАКР, которая поддерживает внутреннее представление баз знаний в виде простых систем альтернатив. Соответственно, машина вывода системы ФИАКР реализует процедуру логического вывода для простых систем альтернатив. В состав системы ФИАКР входит подсистема отладки, построенная на принципах АСИЗ. Система ФИАКР позволяет строить признаковые модели проблемных областей, в которых все факты, предназначенные для описания проблемных ситуаций, представляют собой высказывания о значениях однозначных атрибутов. Более того, каждый атрибут в ходе логического вывода функционирует как модуль альтернативы для всех фактов, связанных с данным атрибутом. Таким образом, некоторые альтернативы базы знаний выполняют дополнительные обязанности структур данных. В целом же принцип двойного использования альтернатив выдерживается для всех логических структур, представленных в базе знаний. Система ФИАКР поддерживает пять различных классификаций атрибутов, что позволяет уточнить их роли в базе знаний. Помимо фактов, предназначенных для описания проблемных ситуаций, в базе знаний разрешается использовать специальные флаги, определяющие поведение самой экспертной системы. Флаги также относятся к классу основных фактов. В системе ФИАКР синтаксические конструкции модулей знаний позволяют задавать отрицания фактов, а также разрешают использовать так называемые составные дескрипторы свойств, объединяющие несколько значений одного атрибута. В связи с этим процедура логического вывода дополнена правилом интерпретации составных дескрипторов. Для формирования баз знаний в системе ФИАКР предназначены:
В ходе консультации экспертная система ведет целенаправленный опрос пользователя о признаках проблемной ситуации. Для организации такого опроса предназначен аппарат анкет, каждая из которых может содержать несколько атрибутов. Средства управления диалогом разделены на две части. К первой из них относятся специальные флаги, сигнализирующие о необходимости опроса по данной анкете. Для того, чтобы флаги опроса могли выполнять свою функцию, когнитолог должен внести в базу знаний особые модули управления диалогом. Вторую часть составляет реализованная в диалоговом мониторе процедура приоритетного выбора очередной анкеты. Подсистема объяснений, по сути дела, предоставляет пользователю гипертекст, узлами которого являются модули знаний, а связи между ними определяются схемами доступа и трассировки. Схема доступа позволяет просматривать текущие состояния любой структуры базы знаний. Эти связи являются статическими, они определяются иерархическим строением базы знаний. Схема трассировки создается в ходе логического вывода и позволяет отслеживать возникшие цепочки причинно-следственных связей. Система ФИАКР содержит развитые средства отладки баз знаний, которые состоят из подсистемы тестирования и проблемно-независимых программных модулей, предназначенных для проверки тех или иных свойств баз знаний. Несоответствия, выявленные в ходе отладки, предполагают последующее обращение к эксперту за дополнительными разъяснениями. В четвертой главе диссертации рассматриваются
конструктивные методы восстановления формальных грамматик.
Представленный в этой главе аппарат существенно используется в
различных автоматизированных системах извлечения знаний. Методы
восстановления рассматриваются в связи с функционированием
абстрактной системы грамматического вывода, состоящей из
источника и анализатора. Источник - это устройство, которое на
каждом такте своей работы передает одно новое предложение языка
источника на вход анализатора. Источник фактически формирует
последовательность вложенных образцов, содержащих все переданные
на данный момент предложения. На каждом такте анализатор -
применяя к очередному образцу метод восстановления - строит
конечное множество решающих грамматик. Задача грамматического
вывода называется разрешимой
В практических приложениях чаще всего используются контекстно-свободные (КС) грамматики и их разновидности. Для целей грамматического вывода структуру КС-языка удобно представить бесконечной П-сетью с помеченными ребрами. Доказано, что конечная подсеть, сохраняющая внешнюю структуру бесконечной П-сеть, позволяет восстановить всю бесконечную П-сеть и порождающую ее КС-грамматику с точностью до переименования нетерминалов. Метод обобщения, основанный на этом утверждении, позволяет построить несколько решающих грамматик по заданной подсети. Фактически, метод обобщения сводит задачу восстановления грамматик к задаче структурирования заданного образца в виде конечной П-сети. Методы структурирования существенно зависят от особенностей языков источника. В связи с этим в четвертой главе рассматриваются три различных метода структурирования, рассчитанных на полные положительные последовательности образцов. (Последовательность называется полной положительной, если каждое предложение языка источника будет обязательно передано на вход анализатора.) Метод структурирования для регулярных языков позволяет однозначно восстановить искомую П-сеть при помощи левой факторизации множества цепочек. По сути дела, для регулярных языков предложена уточненная версия известного метода Фельдмана. Метод структурирования для однозначных КС-языков позволяет построить несколько конечных П-сетей. Метод существенно использует то обстоятельство, что структуру КС-языка можно представить в виде комбинации бесконечных П-сетей, имеющих простую циклическую структуру. Эвристический метод структурирования постулирует некоторые свойства КС-языков и некоторые принципы решения переборных задач, возникающих по ходу структурирования. При этом метод оказывается достаточно удобным. В частности, он позволяет выявить предложения, пропущенные в заданном образце, что особенно важно для практического применения методов восстановления. В пятой главе диссертации рассматриваются методы реализации АСИЗ, основанные на принципе сопоставления решений. Эти методы ориентированы на разные классы задач и разные способы представления знаний; вместе с тем, все они подводят эксперта к необходимости назвать некоторый атрибут и перечислить его значения. В конечном счете, такого рода опросы позволяют по крайней мере формировать признаковые модели проблемных областей. Наиболее популярным и известным методом, основанным на принципе сопоставления, является автоматизированный опрос эксперта в стиле репертуарных решеток. Наряду с несомненными достоинствами метода репертуарных решеток у него существуют и проблемы, связанные с монотонностью опроса и отсутствием формальной универсальности. В развитие метода репертуарных решеток предложен ряд его модификаций, допускающих реализацию в АСИЗ. Идея игрового подхода к реализации опроса в стиле репертуарных решеток состоит в разделении этапов сопоставления и объяснения. При этом первый этап приобретает необходимый динамизм, поскольку эксперт лишь фиксирует разбиение предъявленной тройки решений. За счет исключительной простоты единичного акта сопоставления на первом этапе удается просмотреть и зафиксировать избыточное (в некотором смысле) множество различных разбиений. На втором этапе эксперту приходится объяснять сделанные им разбиения. Помимо атрибута, каждое объяснение задает определенную классификацию решений, которая, в свою очередь, позволяет формально объяснить некоторые разбиения из числа нерассмотренных на данный момент. Таким образом, появляется возможность оценивать "продуктивность" объяснений. Другой подход к разрешению проблем метода репертуарных решеток заложен в ролевых диалогах, которые предлагают эксперту соотнести область его профессиональных интересов с некоторой общеизвестной сферой деятельности. Сценарий "Рекламный агент" предлагает использовать с этой целью терминологию примитивных рыночных отношений, что позволяет построить разнообразные по форме и содержанию ситуации сопоставления. Набор эмоционально окрашенных реплик придает опросу специфический характер. При программной реализации ролевых диалогов основная трудность состоит в разработке алгоритмов, поддерживающих смысловую целостность опроса. Считается, что методы сопоставления применимы для извлечения декларативных знаний. С этой точки зрения, задачи управления представляют собой нетрадиционную область применения методов сопоставления. Знания о задачах управления представляются в виде особых семантических сетей, которые называются схемами управления. Опрос эксперта с целью синтеза схемы состоит из ряда этапов. На ранних этапах эксперту предлагается построить или оценить предъявленную последовательность действий. Переход от примеров последовательностей к диаграмме переходов осуществляется при помощи метода восстановления регулярных грамматик. На заключительном этапе проводится опрос эксперта, направленный на выявление условий переходов. При этом локальные фрагменты диаграммы трактуются как готовые результаты сопоставлений, требующие объяснений эксперта. Диаграмма, дополненная условиями переходов, представляет собой искомую схему управления. При разборе произвольных ситуаций сопоставления (возникающих, например, при синтезе схем управления) существует угроза взаимного непонимания из-за излишне сложных формулировок вопросов и ответов. Для решения этой проблемы предназначен метод графических образов, позволяющий экономно и понятно вести диалог с экспертом. Язык графических образов опирается на ряд естественных соглашений об использовании рисунков. Все методы сопоставления, рано или поздно, предлагают эксперту записать или произнести имена атрибута и его значений. Однако эта задача не всегда является простой. Для того, чтобы облегчить поиск подходящих формулировок предназначен специальный метод доводки имен, который позволяет привести произвольные наименования фактов к единообразной форме и разделить их на имена атрибута и его значений. Метод предлагает сначала построить, а затем использовать по прямому назначению вопросительное предложение, общее для всех названий фактов. Интерактивная процедура доводки имен использует приемы эвристического метода восстановления грамматик. В шестой главе диссертации излагаются особенности построения экспертных игр - особого подкласса АСИЗ, предназначенных для извлечения знаний о закономерностях проблемной области и правилах принятия решений. Эти методы реализации АСИЗ применяются, когда признаковая модель проблемной области уже сформирована. Кроме того, когнитолог должен заранее подготовить несколько примеров решения задач. В экспертных играх опрос эксперта строится в виде компьютерных игр с присущими им штрафами и поощрениями. В общем случае АСИЗ, опираясь на некоторый пример решения задачи, предлагает эксперту отгадать этот пример. Причем правила игры заставляют его выдвигать гипотезы в обмен на наводящую информацию. По сути дела, правила игры вынуждают эксперта рассуждать и "оставлять следы" своих рассуждений. В соответствии с типологией сценариев опроса экспертные игры реализуют принцип заочной консультации.В правила игры - помимо чисто игрового сценария - закладываются возможности последующей интерпретации протокола в интересах выявления тех или иных модулей знаний. Так, игра "Черный ящик" предлагает эксперту узнать решение по его характерным признакам. Выдвижение гипотез реализуются посредством ставок на те или иные потенциально возможные решения. Правила игры позволяют эксперту по мере получения новой информации увеличивать и уменьшать ранее сделанные ставки. Игровой результат эксперта зависит от того насколько удачно он манипулировал ставками. Игра "Черный ящик" позволяет выявлять запреты и продукции. Другая игра - "Буриме" - предлагает эксперту указать характерные признаки заранее известного решения, что позволяет выявить понятийную структуру проблемной области в виде И/ИЛИ-графа. В свою очередь, игра "Угадай-ка" предлагает узнать задуманное решение, отгадывая его признаки. Эта игра ориентирована на выявление запретов и модулей несовместимости. Помимо перечисленных, существуют и другие экспертные игры, построенные на иных игровых принципах и предназначенные для выявления других структур знаний. В связи с тем, что правила игры могут существенно повлиять на действия эксперта, когнитолог должен прежде всего выявить в протоколе его наиболее продуктивную часть с точки зрения проявленных знаний. Инструментарий предварительного анализа реализует методику оценки протокола, предоставляя когнитологу необходимую информацию и средства редактирования. Инструментарий анализа протоколов позволяет выявить продуктивную часть протокола игровых действий и преобразовать ее в формальные структуры знаний. Так, в игре "Угадай-ка" модули знаний оформляются в соответствии с соглашениями входного языка системы ФИАКР. Как правило, преобразование протокола может выполняться разными способами и приводить к различным результатам. Например, в игре "Черный ящик" эксперту предоставляется право указать необходимый тип продукций. Возможны и более сложные варианты, предполагающие подключение эксперта для оценки выявленных структур. Процедура такого рода реализована в игре "Буриме", где эксперт привлекается для выбора подходящего варианта И/ИЛИ-графа. В заключении приводятся основные результаты, полученные в диссертации.
Описанные в диссертации методы построения автоматизированных систем инженерии знаний реализованы в программных системах ФИАКР, ФИАКР+, КАПРИЗ, ЭСКИЗ и АФОРИЗМ. Эти системы были использованы для разработки экспертных систем:
Кроме того, системы переданы для использования в:
Результаты диссертационной работы использованы при выполнении
В диссертации получены следующие основные результаты:
|
Написать автору | К следующей главе |