В статье рассматривается вариант задачи конструирования
решетки формальных понятий и обсуждаются особенности
алгоритма ее решения. Для повышения эффективности алгоритма
предлагается использовать метод экспертной классификации.
Введение
Анализ формальных понятий (англ. Formal Concept Analysis; FCA)
– отрасль интеллектуального анализа данных, в которой
предполагается переход к понятийным структурам проблемных
областей. Методология конструирования понятий из
неколичественных данных составляет предмет и главную задачу
FCA. В работе рассматривается разновидность главной задачи
FCA, решение которой сводится к последовательности, вообще
говоря, дорогостоящих итераций. На каждой итерации
обрабатывается предварительно построенное множество
кандидатов в понятия, и для некоторых из них принимаются
положительные или отрицательные классификационные решения;
процесс завершается, когда классификационные решения
приняты для всех кандидатов. В интересах сокращения числа
итераций в работе предлагается использовать метод
экспертной классификации, позволяющий переносить
классификационные решения, принятые для одних кандидатов
на подмножества других кандидатов.
Систематическому изложению FCA и экспертной классификации
посвящены монографии [1-4], здесь же приводится
минимально необходимый набор сведений из FCA (п. 1), а также
адаптированные под конкретную задачу (п. 2) основы
экспертной классификации (п. 3). Результатом совмещения
двух родственных методов стали новые подходы к обработке
формальных понятий (п. 4) и постановки новых задач.
1. Некоторые определения FCA
FCA исходит из весьма общей модели данных, именуемой
формальным контекстом. По определению,
Формальный контекст есть тройка множеств
( G, M, I),
в которой элементы G называются объектами,
элементы M называются признаками,
а I есть подмножество пар
из G × M.
Если ( g, m) ∈ I,
то говорят "объект g обладает признаком m"
либо, что тоже самое, "признак m встречается в
описании объекта g".
Для конечных множеств G и M –
а в дальнейшем изложении рассматривается именно такой
случай – эквивалентным представлением контекста
K = ( G, M, I)
является объектно-признаковая таблица Tab( K),
в которой именами столбцов служат признаки из M,
кодами строк – объекты из G, а на
пересечении строки g и столбца m
стоит [×],
если ( g, m) ∈ I.
Формальный контекст
K = ( G, M, I)
порождает формальные понятия.
Пара непустых подмножеств ( A, B),
где A ⊆ G
и B ⊆ M,
называется формальным понятием, если
(a) каждый объект из A обладает
всеми признаками из B, и
(b) никакая другая
пара ( A ∪ A ′, B ∪ B ′)
не удовлетворяет требованию (а).
Кроме того,
пары множеств (∅, M) и ( G,∅)
являются формальными понятиями по определению.
Если ( A, B) – формальное понятие,
A называется объемом понятия,
B – его содержанием.
Далее используются только формальные понятия и
формальные контексты, а потому указания на их
формальные статусы опускаются.
Множество C( K) всех понятий контекста
K образует полную решетку, с отношением
частичного порядка
(A1,B1) « (A2,B2) ⇔ B1 ⊇ B2
Решеткой также является множество содержаний
S( K) = { B | ( A, B) ∈ C( K) }
с отношением частичного порядка ⊇.
Решетки C( K) и S( K) изоморфны,
однако решетка S( K) более удобна, так как
охватывает все понятия контекста, но не зависит от наличия
в контексте объектов-дубликатов, которым в Tab( K)
соответствуют строки, отличающиеся только кодами.
Контексты без объектов-дубликатов будем называть простыми
контекстами. Не ограничивая общности, можно полагать, что
в простом контексте ( G, M, I)
каждый объект g из G
однозначно описывается подмножеством признаков 1, а
I = φ(G) ≡ {(g,m) | g ∈ G, m ∈ g }.
При таком подходе для задания простого контекста
достаточно перечислить описания его объектов.
Независимо от особенностей того или иного контекста
K = ( G, M, I)
для S( K) всегда можно указать некоторое
объемлющее его подмножество U( K)
элементов из 2 M.
В простейшем случае
U( K) = 2 M.
S( K) ⊆
U( K) ⊆
2 M.
Ценность множества U( K) состоит в том, что
его элементы являются кандидатами в содержания формальных
понятий. Кандидаты, не относящиеся к S( K),
образуют множество
So( K) =
U( K) \
S( K).
В свою очередь, элементы So( K)
подразделяются на запреты и все прочие.
Для контекста
K = ( G, M, I)
собственное подмножество признаков H,
H ⊂ M,
будем называть запретом, если в описаниях объектов
признаки из H вместе никогда не встречаются:
∀ g ∈ G
∃ b ∈ H :
(g,b) ∉ I.
Множество всех запретов контекста K обозначим
P( K).
Кроме того, обозначим Po( K)
множество So( K) \ P( K).
Таким образом, для произвольного кандидата A из
U( K) возможны следующие классификационные
решения:
- либо A ∈ S(K),
- либо A ∈ So(K)
и дополнительно:
- либо A ∈ P(K),
- либо A ∈ Po(K).
Наличие дополнительной классификации элементов
So( K)
позволяет более тонко анализировать кандидатов
в содержания.
2. Задача совмещения формальных контекстов
Любой нетривиальный контекст K
способен порождать некоторые производные контексты
методом вычеркивания из Tab( K)
отдельных строк-объектов и/или столбцов-признаков.
Прямая задача построения контекстов, производных от
заданного, затруднений не вызывает. Иначе обстоит
дело с обратной задачей, которая (в несколько ослабленной
формулировке) состоит в построении решетки
S( K) неизвестного контекста K
по заданным контекстам
K1 и
K2, производным от K.
При всех различиях в дополнительных предположениях и
целевых установках многие известные подходы [1, 5, 6]
к решению задачи совмещения не претендуют на точное
построение решетки S( K). Для случая
простых контекстов строгое, хотя и трудоемкое решение
задачи совмещения обеспечивает метод @FC [7,8].
Представим этот метод.
Назовем глобальным контекстом неизвестный простой контекст
K = ( G, M, φ( G))
Заданную проекцию множества G
на фиксированное подмножество признаков MT
назовем локальным контекстом. Формально,
локальный контекст KT
есть производный контекст вида
K = (GT, MT, φ(GT)),
где
GT = { g ∩ MT | g ∈ G }.
На практике получение KT
может быть связано, например, со снаряжением
дорогостоящей экспедиции к местам обитания
изучаемых объектов G,
причем исследовательские возможности экспедиции
позволяют установить для этих объектов признаки
из относительно ограниченного множества MT.
Для глобального контекста K
и пары локальных контекстов
K1 = ( G1,
M1,
I1 )
и
K2 = ( G2,
M2,
I2 )
в случае
M1 ∪ M2 = M
метод @FC предлагает сначала построить
множество кандидатов 2
V =
{ B1 ∪ B2 | B1 ∈ S(K),
B2 ∈ S(K) },
| (1) |
а затем пошагово выделить из V
элементы S( K).
На каждом шаге построения принимается решение о запросе
нового локального контекста 3, и по итогам его
специальной обработки для некоторых кандидатов принимаются
классификационные решения. Процесс формирования
S( K) заканчивается, когда классификационные
решения приняты для всех кандидатов. Доказано,
что S( K) ⊆ V, и метод @FC
позволяет построить множество S( K)
за конечное число шагов. Запрос нового локального контекста,
оформленный в виде множества его
признаков MT, формируется автоматически
или в диалоге с пользователем. При этом возможные варианты
запросов рассчитываются заранее, и задача сводится к выбору
лучшего варианта.
В части обработки локальных контекстов KT
метод @FC использует классификационные правила, которые
позволяют относить элементы v множества V
к классам S( K)
или So( K).
Типичные классификационные правила выглядят так:
(K1) Если
v ∈ P( KT),
и
v ∪ v ′ ∈ V
для нек.
v ′,
то
v ∪ v ′ ∈ P( K).
(K2) Если
v ∈ Po( KT),
то
v ∈ Po( K).
(K3) Если
v ∈ Po( KT),
и
v ∪ v ′ ∈ V
для нек.
v ′ из M \ MT ,
то
v ∪ v ′ ∈ So( K).
(K4) Если
v ∈ Po( KT),
{ v ′ | v ∪ v ′ ∈ V } = { ∅, v ′ },
и
v ∈ ≠ ∅,
то
v ∪ v ′ ∈ S( K).
(K5) Если
v ∈ S( KT),
и
{ v ′ | v ∪ v ′ ∈ V } = { ∅ },
то v
∈ S( K).
С одной стороны, классификационные правила
представляют собой строго доказанные достаточные условия [8],
а с другой стороны – они вполне пригодны для
использования в программах.
Обработка очередного локального контекста заканчивается,
когда все правила классификации оказываются неприменимыми.
При высокой стоимости локальных контекстов возникает
потребность в технологиях, позволяющих при их обработке
классифицировать как можно больше кандидатов в содержания
из V. Аналогичная потребность исследовалась
в 1980-х научным коллективом под руководством О.И.Ларичева.
Результатом этой работы стал метод экспертной классификации,
позволяющий при незначительных дополнительных,
но контролируемых предположениях существенно увеличить
количество классификационных решений.
3. Основы экспертной классификации в терминах FCA
Метод экспертной классификации позволяет в диалоге
с экспертом построить неизвестное множество объектов
GE некоторого целевого простого
контекста
( GE, M, φ( GE)).
При этом множество признаков M, задействованных
в описаниях объектов, считается (a) известным,
(b) состоящим из k непересекающихся подмножеств и
(c) порождающим универсум
такой, что
GE ⊆ UEk.
Собственно говоря, на эксперта возлагается обязанность
последовательно относить предъявляемые ему элементы
универсума либо к GE,
либо к UEk \
GE.
В интересах скорейшего построения множества объектов
метод экспертной классификации постулирует гипотезу,
согласно которой элементы каждого множества
MEi
различаются по степени характерности для объектов
GE.
Принимая эту гипотезу, эксперт способен заранее построить
на элементах множества
MEi
асимметричное, антирефлексивное и транзитивное отношение
характерности < i;
запись
" mi1 < i mi2"
означает, что признак mi1
менее характерен для объектов GE,
чем признак mi2.
Экспериментально установлено, что фраза
"быть характерным для объектов GE"
понятна эксперту
без разъяснений, и он вполне способен построить k
штук отношений характерности – по одному для
каждого множества
MEi.
Заметим, что в оригинальном описании экспертной
классификации предполагается линейность всех
отношений характерности. В настоящей работе вместо
линейного порядка предполагается наличие частичного
порядка, что сказывается на методе хранения данных
и на организации диалога с экспертом при извлечении
знаний об отношениях характерности.
Совокупность построенных экспертом отношений характерности
< 1, ..., < k
порождает рефлексивное, антисимметричное и транзитивное
отношение доминирования ≤ на всевозможных элементах
универсума UEk.
По определению, пара подмножеств
u1 и u2 связана отношением
u1 ≤ u2,
если для любого
i = 1, ..., k
выполняется одно из двух:
либо
u1 = u2,
либо
mi1 < i mi2,
где
u1 ∩ MEi = { mi1 },
u2 ∩ MEi = { mi2 }.
Если отношение доминирования удается построить,
то механизм переноса классификационных решений,
полученных для некоторого объекта g из
UEk,
описывается двумя вполне разумными правилами:
(П1)
Если g ∈ GE, и
g ≤ u,
то u ∈ GE;
(П2)
Если g ∈
UEk \ GE,
и
u ≤ g,
то g ∈ UEk \ GE.
4. Экспертная классификация и задача совмещения контекстов
Метод @FC решения задачи совмещения простых контекстов
оперирует локальными контекстами
K1 = ( G1,
M1,
I1 )
и
K2 = ( G2,
M2,
I2 )
в интересах построения решетки S( K)
неизвестного глобального контекста K.
Дополнительно потребуем
и положим
ME1 = S( K1)
и
ME2 = S( K2).
Между множеством кандидатов в содержания V
и формально построенным универсумом
UE2 =
ME1 ×
ME2
(см. формулы (1) и (2) при k = 2)
существует взаимно однозначное соответствие
Ψ(v) = (v ∩ M1, v ∩ M2).
С учетом требования (3) отображение Ψ
представляет собой утверждение о возможности
однозначной раскраски всех кандидатов из V
двумя цветами: признаки из M1
окрашиваются, скажем, красным цветом, а признаки
M2 – зеленым.
При таком подходе отношение доминирования ≤,
построенное для целевого простого контекста
( SE,
ME1 ×
ME2,
φ( SE)), где
SE = Ψ( S( K)),
оказывается весьма полезным для решения задачи совмещения.
Сконструированное экспертом/экспертами на универсуме
UE2
отношение ≤ естественным образом порождает отношение
доминирования ≤ на множестве V,
а также модификации правил П1 и П2:
v1 ≤ v2 ⇔
Ψ(v1) ≤ Ψ(v2),
(П1м)
Если v ′ ∈ S( K), и
v ′ ≤ v,
то v ∈ S( K);
(П2м)
Если v ∈ So( K), и
v ′ ≤ v,
то v ′ ∈ So( K).
Вновь полученные классификационные правила П1м и П2м
расширяют области действий правил типа K1 - K5.
Так, в случае исполнения правила К3 все кандидаты из
{ x | x ≤ v ∪ v ′ }
зачисляются в So( K).
Аналогично, в случае срабатывания правила К5
все кандидаты из { x | v ≤ x }
зачисляются в S( K).
Замечание 1.
Успех описанного подхода к усовершенствованию метода @FC
за счет привлечения правил П1м и П2м находится в прямой
зависимости от количества экземпляров отношений
характерности < 1 и < 1,
выявленных экспертом на множествах
S( K1) и
S( K2).
Замечание 2.
Задача построения отношения характерности < 1,
определенного на S( K1),
осложняется большим 4 количеством элементов
в S( K1), а также сложно
устроенными описаниями этих элементов. В связи с этим
наиболее перспективным "лобовым" подходом к построению
отношений характерности является метод балльных оценок,
выставляемых элементам S( K1).
Замечание 3.
Если множество признаков M1
допускает разбиение на
M11 ∪ ... ∪
M1m
подклассы значений некоторых однозначных атрибутов,
то отношение характерности < 1,
определенное на S( K1),
можно сконструировать из отношения доминирования
≤ 1, определенного на
M11 × ... ×
M1m,
путем удаления из ≤ 1 всех пар вида
u ≤ 1 u.
Замечания 2 и 3 в равной степени относятся к
отношению < 2,
определенному на S( K2).
Замечание 4.
В ходе решения задачи совмещения контекстов помимо
первоначально построенного отношения доминирования
≤, полученного при посредничестве универсума
U2E,
могут появиться и другие пригодные для использования
отношения доминирования. Организация непротиворечивого
сосуществования двух и более отношений доминирования
составляет предмет самостоятельной задачи.
Заключение
По большому счету, отношение доминирования, построенное
методом экспертной классификации, является эвристикой,
сокращающей перебор кандидатов в содержания понятий.
В связи с этим возникает необходимость хранить для каждого
принятого классификационного решения историю его вывода
с тем, чтобы иметь возможность отказаться
от неподтвердившихся решений. По завершении итерационного
процесса истории выводов позволяют вывести итоговую оценку
достоверности построенного множества содержаний.
Литература
- Ganter B., Wille R. Formal Concept Analysis: Mathematical Foundations. Springer, 1999.
- Гуров С.И. Булевы алгебры, упорядоченные множества, решетки: Определения, свойства, примеры. М.: ЛИБРОКОМ, 2013.
- Ларичев О.И. Теория и методы принятия решений, а также Хроника событий в Волшебных Странах. М.: Логос, 2000.
- Ларичев О.И., Мечитов А.И., Мошкович E.M., Фуремс Е.М. Выявление экспертных знаний. М.: Наука, 1989.
- Guan-yu L., Shu-peng L., Yan Z. Formal Concept Analysis based Ontology Merging Method // Proceeding of 3rd IEEE International Conference on Computer Science and Information Technology. Vol. 8, 2010. P. 279 - 282.
- Bendaoud R., Napoli A., Toussaint Y. A proposal for an Interactive Ontology Design Process based on Formal Concept Analysis // Frontiers in Artificial Intelligence and Applications., Vol. 183, Formal Ontology in Information Systems, 2008. P. 311-323.
- Стельмашенко Д.Е. Алгоритм восстановления глобального контекста // Сборник статей молодых ученых факультета ВМК МГУ. Вып. 9, 2012. C.191-209.
- Соловьев С.Ю., Стельмашенко Д.Е.
Подходы к исследованию формальных контекстов
// Информационные процессы. Том 11, № 2, 2011.
С. 277-290.
www.park.glossary.ru/serios/read_14.php
1то есть g ⊆ M
2кандидатов в содержания понятий глобального контекста K
3то есть решение о снаряжении новой экспедиции
4нетипично большим для традиционных задач экспертной классификации
THE EXPERT CLASSIFICATION METHOD
AS A FORMAL CONCEPT ANALYSIS TOOL
Stelmashenko Daria Evgenyevna,
Lomonosov Moscow State University, Russia, Moscow,
Soloviev Sergey Yurievich,
Lomonosov Moscow State University, Russia, Moscow.
ABSTRACT:
The article is devoted to one of the methods of constructing
a formal context lattice. The peculiarities of this method's
algorithm are considered. It is suggested that the efficiency
of this algorithm can be improved by the expert classification
method.
Key words: formal concept analysis,
expert classification method,
principle of domination by specificity,
specificity scale.
|