Bishop Gregory (hgr) wrote,
Bishop Gregory
hgr

Categories:

критическая агиография

2.6.2. Основные понятия нечеткой логики

 

Из многочисленных приложений нечеткой логики прямо сейчас нас будет интересовать только одно: представление в ней пропозиций естественного языка. Этой задаче посвящены труды Л. Заде, начиная, главным образом, с середины 1970-х годов, но они, разумеется, опираются на те понятия, которые были сформулированы раньше (понятия нечеткого множества и лингвистической переменной).

Но эти же понятия будут крайне важны и для интерпретации логической макроструктуры и логической микроструктуры собственно нарратива (а не одной только его текстуры, которой посвящена настоящая глава). Поэтому мы воспользуемся случаем и представим основные понятия нечеткой логики так, чтобы потом можно было к ним обращаться на всем протяжении этого исследования. Исходя из таких требований, мы отбираем ниже те понятия нечеткой логики, которые будем считать «основными».

В

Нечеткое множество. Подмножество А универсального множества U называется нечетким множеством (fuzzy set), если оно характеризуется функцией fA (u) , которая для каждого элемента u U принимает значение реального числа в интервале [0, 1].

Функция fA (u) является мерой нечеткости множества А и называется функцией принадлежности (membership function), характеризующей степень принадлежности элемента u нечеткому множеству А. Для не принадлежащих А элементов она принимает значение 0, для определенно принадлежащих — значение 1 (поэтому функция принадлежности четкого множества принимает только два значения: 0 или 1), а для всех остальных элементов — различные значения в единичном интервале.

В описанном типе нечеткого множества сама функция fA (u) является обыкновенной «четкой» (crisp, а не fuzzy) функцией. Это так называемые нечеткие множества типа 1. Подразумевается, что четкие множества — это частный случай нечетких, а именно, нечеткие множества типа 0.

Для описания физической реальности более адекватными оказываются нечеткие множества типа 2[1]. От нечетких множеств типа 1 они отличаются тем, что и сама функция fA (u) является в них нечеткой, то есть ее значениями являются не сами реальные числа в интервале [0, 1], а нечеткие множества (типа 1) реальных чисел внутри этого интервала.

Разумеется, теоретически возможно построение нечетких множеств типа 3 и выше, но при этом происходит резкое усложнение математики, и практической нужды в разработке таких теорий пока не обнаружилось.

Подробности различий между 1, 2 и далее типами нечетких множеств для нас не являются принципиальными[2]. Принципиально другое. Идея нечеткого множества, несмотря на несколько дезориентирующее в данном случае слово «нечеткость», — это идея о том, как можно сопоставить вполне четкое математическое число тем реалиям, по отношению к которым этого нельзя сделать принятыми в естественных науках статистическими методами. На каком-то уровне нечеткому множеству любого типа соответствует обычная «четкая» функция принадлежности. С эмпирической реальностью такая функция будет согласовываться обычными методами математической статистики.

То, что не поддается исчислению «в лоб», все-таки можно посчитать, если посмотреть «сбоку».

Пути реализации этой идеи составляют все теории, построенные на нечетких логиках. Мы будем рассматривать только те из этих теорий, которые непосредственно затрагивают пропозиции естественного языка.

 

Гранулирование информации. Нечеткое множество — это не более чем математическое понятие, которое может дать лишь основу для логической интерпретации тех категорий, которыми реально оперирует когнитивная сфера человека. В качестве базового понятия для интерпретации категорий когнитивной сферы Заде ввел понятие «лингвистической переменной». Название это, может быть, не очень удачное, но прижившееся. Точнее было бы, может быть, назвать эту конструкцию Заде «когнитивной переменной», поскольку она имеет одинаково близкое отношение и к понятиям естественного языка, и к понятиям всей остальной когнитивной сферы человека[3]. Сейчас это понятие успешно применяется, например, в распознавании образов, но почти не привлекает внимания лингвистов[4].

Для введения понятия лингвистической переменной Заде понадобилось соединить концепцию нечеткого множества с еще одним фундаментальным понятием, фундаментальность которого была им осознана далеко не сразу. В современных теориях, связанных с нечеткими логиками, оно носит название «гранулирование»[5]. Заде особо настаивает на фундаментальности гранулирования для устройства всей вообще когнитивной сферы человека и, в частности, для естественного языка[6].

Гранулирование информации — это другое название того, о чем мы все время говорим на протяжении этой книги, когда подчеркиваем, что человеческому восприятию свойственна дискретность. Так, разбиравшиеся нами особенности нарративного пространства, структура которого описывается графом[7], — пример грануляции восприятия пространства.

Понятия естественного языка тоже оказываются гранулированными. Иногда это очевидно, как в примерах, которые обсуждаются ниже в связи с понятием лингвистической переменной («возраст», который воспринимается как «молодой», «старый» и т. п.). Иногда это менее очевидно, как в примерах, которые обсуждаются ниже в связи с понятием пропозиции в нечеткой логике.

Перед тем, как остановиться на этом подробнее, подчеркнем, что Заде вводит свои понятия, выражающие нечеткую гранулированность информации, как нечеткие аналоги интенсионалов Монтегю и многомировой семантики[8].

 

Лингвистическая переменная. Лингвистическая переменная задается как множество информационных гранул[9], причем, каждая гранула является нечетким множеством, характеризующимся функцией принадлежности. Информационные гранулы связаны между собой неким правилом (функцией)[10], образуя так называемый «фрейм объяснительной базы данных» (EDF = Explanatory Database Frame). EDF может быть интерпретирована как множество возможных миров, а связующая эти миры функция (определяющая значение лингвистической переменной в каждом из возможных миров) — как интенсионал Монтегю.

Благодаря тому, что таким образом переосмысленный интенсионал Монтегю может принимать нечеткие значения, преодолевается то ограничение формальной семантики Монтегю, которое было вызвано ее построением на основе принципа композициональности. Заде интерпретирует это как существенную корректировку принципа композициональности по сравнению с семантикой Монтегю, но не его совершенное отвержение[11]. Но, наверное, можно найти не меньше формальных оснований, чтобы сказать, что Заде решительно переходит от принципа композициональности к принципу контекстуальности, то есть к его антагонисту. Впрочем, тут лучше не спорить о словах, так как едва ли не наиболее естественно понимать эти концепции Заде как попытку найти баланс между обоими принципами.

Приведем простейшие примеры.

Лингвистическая переменная «возраст».

Она может быть определена на универсальном множестве количества лет, от нуля до бесконечности, причем, для практических задач можно определить ее на более коротком интервале, например, от 0 до 100 лет. EDF зависит от практической задачи, ради которой мы заговорили о возрасте, — а отнюдь не от строения естественного языка, которым мы пользуемся. Например, мы можем говорить о возрасте только в терминах «молодой» / «старый», совершенно игнорируя промежуточные градации, хотя любой естественный язык мог бы предоставить нам весьма нюансированную шкалу. Но мы можем говорить о возрасте в терминах возрастных групп, сколь угодно дробных, и это даже не обязательно будет искусственная ситуация: например, у некоторых народов Восточной Африки (например, оромо) весь родовой строй основывается на стратификации общества по нескольким возрастным группам с интервалами около 8 лет. В языках этих народов бинарная оппозиция «молодой» / «старый» может вообще не иметь смысла: вместо этого у них пять разных возрастных состояний людей, а люди старше 40 являются редчайшими исключениями, так как столько не живут. В примерах Лотфи Заде для терма «старый» рассматриваются значения после 50 лет, но для наших народов Восточной Африки определять категории человеческого возраста для групп старше 50 лет еще более бессмысленно, чем в примерах Заде расширять значения универсального множества значений возраста дальше отметки 100 лет.

Если мы не сами формулируем какое-то представление о возрасте, а пытаемся понять текст, то мы должны будем понять EDF из контекста, как эксплицитного, так и имплицитного. Пример африканских народов, делящихся на возрастные группы, подчеркивает, что важнейшая часть имплицитного контекста — знания о жизни соответствующего мира.

Итак, EDF представляет собой некоторое «разбиение» значения лингвистической переменной, то есть ее гранулирование. Каждое конкретное значение возраста функция принадлежности позволит соотнести с той или иной возрастной группой. Возрастные группы оромо, надо сказать, являются четким множеством (или, в более близкой нам терминологии, нечетким множеством типа 0), так как любое значение возраста однозначно вписывается только в одну из этих возрастных групп (то есть значение функции принадлежности для данного возраста будет равно 1 для одной группы и 0 для всех остальных). Но с нашими европейскими представлениями о молодости и старости мы обязательно приходим к нечеткой логике. Например, 55 лет — это, скорее, старость, нежели средний возраст, а 75 лет — уже старость почти наверняка. Такое свойственное нам интуитивное представление о возрасте в нечеткой логике типа 1 может быть представлено как значение функции принадлежности для гранулы (терма) «старость» 0,6 для аргумента «55 лет» и 0,95 для аргумента «75 лет», тогда как для гранулы (терма) «средний возраст» для аргумента «55 лет» ее значение 0,4, а для аргумента «75 лет» равно 0. Если мы захотим, вдобавок, учесть нашу нерешительность, которая проявилась в только что сделанном выборе значений функции принадлежности, то мы можем перейти к нечеткой логике типа 2 и тогда вместо выбора числа в единичном интервале [0, 1] выбирать интервалы значений внутри единичного интервала. В любом случае мы будем руководствоваться в своих представлениях о функции принадлежности нашими представлениями о мире и о том, что мы хотим сказать, а не об устройстве естественного языка. Если же мы заняты интерпретацией текста, то и здесь, как в случае с EDF, мы можем руководствоваться только контекстом, эксплицитным и имплицитным.



[1] Впервые описаны Л. Заде в 1975 году, но серьезная разработка соответствующих теорий и практических приложений началась только в последнее десятилетие. См. теперь, главным образом: Oscar Castillo, Patricia Melin, Type-2 Fuzzy Logic: Theory and Applications (HeidelbergN. Y., 2008) (Studies in Fuzziness and Soft Computing, 223). См. также монографию: А. П. Рыжов, Элементы теории нечетких множеств и ее приложений. Изд. 2-е [электронное: http://intsys.msu.ru/staff/ryzhov/FuzzySetsTheoryApplications.htm ] (М., 2003) [бумажное изд. 1-е: М., 1998 (под названием «Элементы теории нечетких множеств и измерения нечеткости»], автор которой едва ли не первым углубился в проблемы нечетких множеств типа 2 (он называет их «гипернечеткими»), но его труды не получили международной известности.

[2] Bergmann, An Introduction to Many-Valued and Fuzzy Logic..., 313, подчеркивает, что конкретный вид функции принадлежности для логической стороны дела не принципиален.

[3] Разработка этого понятия, подытоженная Заде в обширной статье 1975 года [L. A. Zadeh, The Concept of Linguistic Variable and its Application to Approximate Reasoning // Zadeh 2000, 121–304; рус. пер.: Л. А. Заде, Понятие лингвистической переменной и его применение к принятию приближенных решений (М., 1976) (Новое в зарубежной науке. Математика. Вып. 3)], была результатом сотрудничества между Л. Заде и Дж. Лакоффом. Из работ последнего на смежные темы см. особ.: G. Lakoff, Hedges: A Study in Meaning Criteria and the Logic of Fuzzy Concepts, Journal of Philosophical Logic 2 (1973) 458–508.

[4] За исключением некоторых направлений в когнитивной лингвистике; см.: Burghard B. Rieger, Semiotic Cognitive Information Processing: Learning to Understand Discourse. A systemic model of meaning constitution // Adaptivity and Learning. An Interdisciplinary Debate / Eds. R. Kühn, R. Menzel, W. Menzel, U. Ratsch, M. M. Richter, I.-O. Stamatescu (Heidelberg—N. Y., 2003) (Lecture Notes in Computer Science) 347–403, и указанную здесь библиографию.

[5] Из работ Заде см. особо: L. A. Zadeh, Fuzzy Sets and Information Granularity [1979] // Zadeh 2000, 384–411; idem, Toward a Theory of Fuzzy Information Granulation and Its Centrality in Human Reasoning and Fuzzy Logic [1997] // Ibid., 461–503; Some Reflections on Information Granulation and its Centrality in Granular Computing, Computing with Words, the Computational Theory of Perceptions and Precisiated Natural Language // Data Mining, Rough Sets and Granular Computing / Eds. Tsau Y. Lin, Yiyu Yao, Lotfi A. Zadeh (Heidelberg—N. Y., 2002) (Studies in Fuzziness and Soft Computing, 95) 3–20.

[6] См., дополнительно к предыдущей сноске: L. A. Zadeh, A New Direction in AI: Toward a Computational Theory of Perceptions, AI Magazine 22 (2001) 73–84; idem, Precisiated Natural Language (PNL), AI Magazine 25 (2004) 74–91.

[7] См. ч. 1….

[8] Пионерская статья 1982 года: L. A. Zadeh, Test-score semantics for natural languages and meaning representations via PRUF // Zadeh 1996, 542–586; см. также более эксплицитную, в логико-философском отношении, статью: L. A. Zadeh, A Fuzzy-Set Theoretic Approach to the Compositionality of Meaning: Propositions, Dispositions and Canonical Forms [1983] // Zadeh 1996, 594–613, — а также некоторые другие статьи, переизданные в том же сборнике.

[9] В ранней терминологии Заде — множество термов, терм-множество.

[10] В ранней терминологии Заде — синтаксическим правилом; в этой же терминологии функция принадлежности для каждого элемента множества каждому из термов называлась семантическим правилом.

[11] См. особо: Zadeh, A Fuzzy-Set Theoretic Approach to the Compositionality of Meaning…


и

Subscribe

  • Post a new comment

    Error

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 4 comments