Образец цитирования
Гинкул Г.П., Соловьев С.Ю.
Алгоритм цитирования для построения
гибридных выводов в продукционных системах
// Сб. "Программные системы и инструменты"
/ Под ред. Л.Н.Королева
- М.: Издательский отдел факультета ВМК МГУ;
МАКС Пресс, 2013. No.14. c.172-175
Рассматривается задача построения гибридных выводов
в контексте совместного функционирования продукционных
систем. Предлагается алгоритм цитирования, позволяющий
строить гибридный логический вывод за счет привлечения
сторонних продукций. Обсуждаются методы численного
оценивания гибридных выводов.
Введение
Развитие глобальной сети Интернет актуализировало
большое количество исследований, посвященных
различным аспектам взаимодействия между распределенными
программными системами вообще и экспертными системами
в частности. Для экспертных систем отличительными видами
взаимодействий являются: выработка коллективного мнения [1],
обмен знаниями, обучение, а также цитирование из внешних
источников знаний. Формализация перечисленных процессов
еще не закончена, идет процесс накопления частных решений.
Рассмотрим задачу цитирования для хорошо изученных
монотонных продукционных систем [2].
1. Продукционные системы
В общем случае продукционная система состоит из трех
компонент: набора продукций, рабочей памяти и управляющей
структуры [3]. Из всего многообразия продукционных систем
выделим для дальнейшего рассмотрения один специальный
подкласс.
Будем рассматривать продукционные системы с обратным выводом,
различающиеся наборами правил, списками окончательных диагнозов
и алгоритмами разрешения конфликтов. Соответственно каждая
такая продукционная система определяется тройкой
< P, D, E >, где
P – множество продукционных правил (продукций);
D – упорядоченный список потенциально возможных заключительных диагнозов;
E – алгоритм разрешения конфликтов.
Дополнительно будем полагать, что в рабочую память
продукционной системы заранее загружено множество фактов
F0, описывающих проблемную ситуацию, для которой
необходимо найти диагноз.
Продукционные правила множества P имеют вид
IF f1 & ... & fn THEN f.
Правила, в THEN-частях которых располагается факт f,
называются f-правилами.
Упорядоченный список диагнозов
D = (d1, d2, ..., dm)
используется как очередь гипотез, подлежащих
последовательной проверке. Если очередная гипотеза
d = di подтверждается, то продукционная
система формирует так называемое мотивированное
заключение и завершает свою работу. Если же гипотеза
di не подтверждается, то проверяется
гипотеза di+1 и т.д. Если ни одна гипотеза
из списка D не подтверждается, то продукционная система
вырабатывает сообщение ОТКАЗ.
Алгоритм E позволяет из заданного множества
продукционных правил выбрать одно правило. Обычно
алгоритм E реализует некоторую универсальную
стратегию разрешения конфликтов [4].
На каждом такте своей работы алгоритм обратного вывода
анализирует заданную гипотезу h, формирует множество
h-правил, из которого при помощи алгоритма E выбирает
для продолжения некоторое правило
IF h1 & ... & hn THEN h.
Гипотеза h считается подтвердившейся, если для каждого
факта hj из IF-части выбранного правила
выполняется одно из двух:
либо hj содержится в рабочей
памяти продукционной системы;
либо гипотеза hj подтверждается
тем же самым алгоритмом обратного вывода.
Подтвердившиеся гипотезы заносятся в рабочую память
продукционной системы, а подтвердившие их правила
рассматриваются как материал для построения мотивированного
заключения. Однажды выбранные продукционные правила
в дальнейшей работе продукционной системы участия
не принимают, они игнорируются алгоритмом разрешения
конфликтов E. Если алгоритм E не в состоянии выбрать
продукцию для продолжения, то он вырабатывает сообщение
ОТКАЗ, и гипотеза h считается опровергнутой.
Для наших целей важно зафиксировать, что алгоритм
разрешения конфликтов для заданной гипотезы h
вырабатывает либо некоторое продукционное правило,
либо сообщение ОТКАЗ:
E(h) есть либо h-правило, либо ОТКАЗ.
Под мотивированным заключением диагноза d понимается
минимальное по количеству элементов множество продукций
Pd ⊆ P,
удовлетворяющее следующим свойствам:
1. Pd содержит ровно одно d-правило;
2. если Pd содержит правило
IF h1 & ... & hPn THEN h,
то для каждого факта hi из IF-части
этого правила справедливо одно из двух:
либо hi ∈ F0;
либо Pd содержит ровно одно hi-правило.
Приведенное определение мотивированного заключения является
самодостаточным: любое заданное множество продукций Q можно
проверить на соответствие определению, а при положительном
ответе можно выявить факт, играющий роль заключительного
диагноза d, а также множество невыводимых фактов T(Q).
По определению множество T(Q) составляют факты, которые
встречаются в IF-частях правил из Q и не встречаются в
THEN-частях:
если Q ⊆ P, то T(Q) ⊆ F0.
Если мотивированное заключение Pd
адресуется человеку, то Pd
необходимо снабдить подсистемой объяснений
или преобразовать в удобочитаемый текст.
В настоящей работе вопросы конвертации Pd
в текст не рассматриваются.
Схематично действие продукционной системы
S = < P, D, E >
по анализу заданной проблемной ситуации F0
сводится
либо к виду S : F0 → Pd,
либо к виду S : F0 → ОТКАЗ.
2. Задача цитирования
Рассмотрим две различные, но согласованные продукционные
системы
S = < P, D, E >и
S1 = < Q, D1, E1 >.
Под согласованностью будем понимать выполнение трех условий.
Во-первых, одинаковые по смыслу элементы,
описывающие проблемные области систем S и S1,
в обеих системах представляются одним и тем же фактом.
Во-вторых, в обеих системах продукционные правила
построены с использованием одинакового синтаксиса.
В-третьих, D ∩ D1 ≠ ∅.
Первые два условия позволяют переносить продукции
из системы в систему без технических затруднений,
а третье условие позволяет использовать обе системы
в консилиумах.
Предположим, что в проблемной ситуации F0
система S1 способна построить мотивированное
заключение Qd некоторого диагноза d, а система
S сообщает о невозможности построить заключение Pd,
хотя d ∈ D. То есть:
S : F0 → ОТКАЗ,
S1 : F0 → Qd,
для некоторого d из D ∩ D1.
На месте системы S настойчивый ученый способен
воспользоваться (в порядке цитирования) чужими
знаниями и все-таки построить некоторый
– гибридный – вывод диагноза d.
Между тем современные продукционные системы
такими способностями не обладают, а потому разработка
и включение в состав продукционных систем алгоритма
цитирования представляет определенный научный интерес.
Строго говоря, для системы S задача цитирования состоит
в построении мотивированного заключения диагноза d
посредством привлечения некоторых продукций из Qd
с последующей оценкой оригинальности полученного заключения.
Предлагаемый метод решения задачи цитирования для описанного
класса продукционных систем состоит в модификации алгоритма
разрешения конфликтов. Фактически предлагается в продукционной
системе
S = < P, D, E >
алгоритм E заменить на E +
и перейти к продукционной системе
S + = < P, D +, E + >,
где список D + получается из D
перемещением гипотезы d на первое место.
Алгоритм E + в качестве дополнительного
аргумента использует мотивированное заключение Q d
и реализует следующее вычисление:
E+(h,Qd) : |
Если |
E(h) = ОТКАЗ, |
|
но |
Qd \ P содержит h-правило q, |
|
то |
результатом является правило q, |
|
иначе |
результатом является E(h). |
При Q d = ∅ алгоритм E +
вырождается в E, а при Q d ≠ ∅
продукционная система S + гарантированно
строит мотивированное заключение P' d
диагноза d:
S+ : (F0, Qd) → P'd,
причем P' d
содержит хотя бы одно правило из Q d \ P.
Простейшая оценка оригинальности полученного заключения
определяется величиной
k = k1 / k2,
где k1 – количество элементов множества
P'd \ Qd, а k2 – количество
элементов в P'd. В худшем случае, соответствующем 100%
заимствованию знаний, P'd = Qd и k = 0.
В наилучшем, но недостижимом случае, когда в заключении
P'd не используются сторонние правила, k = 1.
Более тонкие оценки оригинальности вычисляются как меры
сходства [5] множеств T(Qd) и T(P'd).
Заключение
Описанный алгоритм цитирования не гарантирует построение
максимально возможного оригинального заключения
Pd,
однако этот недостаток окупается лаконизмом предложенного
алгоритма. Включение в состав продукционной системы
алгоритма цитирования требует минимальных изменений
лишь в одном модуле управляющей структуры.
Литература
- Гинкул Г.П.
Согласованное принятие решения
в распределенных экспертных системах
// Труды 54 научно-технической конференции МИРЭА, часть 1.
- М.: МИРЭА, 2005. С. 90-94.
www.park.glossary.ru/serios/read_24.php#3
- Kumar E.
Artificial Intelligence.
- New Delhi: I.K.International Publishing House, 2008.
- Люгер Дж.
Искусственный интеллект:
средства и методы решения сложных проблем.
- М.: ООО "И.Д. Вильямс", 2003.
- Джаррантано Д., Райли Г.
Экспертные системы: принципы разработки и программирования.
- М.: ООО "И.Д. Вильямс", 2007.
- Раушенбах Г.В. Меры близости и сходства
// Анализ нечисловой информации в социологических исследованиях.
- M.: Наука, 1985. С. 169-203.
|