第1章概率语言术语集
决策存在于现实生活的方方面面,如国家资源分配、政府科技评价、企业风险投资、个人绩效考核等均离不开决策过程。鉴于客观事物的复杂性,衡量方案优劣时往往需要综合考虑多个相互制约或无法相互替代的属性。本书所讨论的决策问题主要是多属性决策问题,它是指根据多个相互冲突且不可公度的属性对多个备选方案进行评估,并采用特定决策方法对备选方案进行排序或择优的问题。在实际决策过程中,定性属性往往必不可少。方案在定性属性下的优劣程度难以直接用精确数值来衡量,只能通过专家主观地做出评价。模糊理论被引入多属性决策问题中用来处理带有主观性和不确定性的决策信息。此外,由于单个专家在知识和经验上的局限性,为确保决策信息的可靠性,通常需要多位专家参与评价。
语言是*贴近人类思维与认知的表达方式。在评估中,专家倾向于用语言来表达意见,如“快”的速度、“高”的价格、“低”的温度和“好”的疗效等。与数值相比,用语言进行评价不仅降低了评估难度且更能反映专家的真实意见。为规范化语言评价在决策中的应用,Zadeh[1_3]在1975年提出了语言变量的概念和模糊语言方法。语言变量的取值是自然语言中的词或句子,而非具体数字,它由语言描述算子及其语义构成,如外观的取值可描述为不时尚、不太时尚、时尚、较时尚、十分时尚。模糊语言方法用语言术语来表达评估信息,增强了评估的可行性、灵活性和可信度,同时,将决策分析推进到了一个新的研宄领域一语言决策分析。
然而,由于决策问题的复杂性和人类认知的模糊性,基于单个语言术语评价的传统模糊语言方法在实际应用中具有一定局限性。一方面,用单个语言术语难以全面地表达专家个体的评估意见,例如,在评价应聘者的管理能力时,专家可能会给出复杂的表达形式,如“中等偏下水平”、“介于中等与差之间”或“30%的可能性为中等,70%的可能性为差”等。另一方面,决策小组内部的专家通常持有不同的意见并且难以达成共识;此时,单值语言术语的表达方式难以适用于群体决策。个体和群体的评估信息往往呈现为复杂语言形式。基于简单语言术语评估的多属性决策理论己无法满足解决复杂语言多属性决策问题的需要。
准确刻画和表达评估信息是解决复杂不确定决策问题的基础。传统模糊语言方法将评估值描述为单一语言术语,如“高”的稳定性、“差”的质量等,是*简单的语言评估表达工具。为反映语言表达的多样化和个性化,近年来,学者纷纷提出了模糊语言方法的扩展形式。考虑到语言术语的计算结果通常与定义的语言术语集不匹配,Herrera和Martinez提出了二元语义表达模型,通过引入精确数刻画计算得出的值与*接近的语言术语间的差额,避免了传统模糊语言方法在计算中的信息丢失。进一步地,Wang和Hao提出了比例二元语义表达模型,以表征非均衡分布的语言术语集。受直觉模糊集理论的启发,王坚强和李婧婧提出了直觉语言集的概念,指出专家在进行评价时可能会对某个语言术语同时做出正面和反面的描述,如“该产品质量属于‘好’的隶属度是0.6,不属于‘好’的隶属度是0.4”。随后,Lm和Jm将直觉语言集拓展为区间形式,如“该科研项目的创新性属于‘一般与较大之间’的隶属度为0.8,不属于‘一般与较大之间’的隶属度为0.2”。然而,这种带有隶属度和非隶属度的表达方式运算量较大,因此其未得到很好的应用。由于主观事物的不确定性,专家经常在多个语言术语间犹豫不决,例如“介于好与不好之间”“至少好”“优于中等”等。为此,Rodriguez等提出了犹豫模糊语言术语集的概念用于表达专家的犹豫信息。为进一步描述专家个体的不确定信息以及专家组中的不一致信息,Pang等提出了概率语言术语集,通过引入概率来表达不同语言术语的偏好度、置信度、比例、概率或权重等含义。例如,“五位专家认为质量是好,两位专家认为质量是非常好,三位专家认为质量介于好与非常好之间”,此时,可根据具有不同语言评价信息的专家的比例为语言术语“好”和“非常好”分配不同的权重。此外,专家个体在做评估时也会对不同的语言术语有不同的偏好,如“某产品质量好的可能性为80%,差的可能性为20%”。概率语言术语集是一个具备一般性的语言评估表达模型,能有效地刻画个体或群体给出的复杂语言评估信息。
本章主要阐述概率语言术语集的来源、定义、运算法则及其在多属性决策中的应用。首先,介绍语言评估方法的理论基础、12种代表性语言表达模型以及语言信息的运算框架;其次,介绍概率语言数的基本概念、运算法则和比较方法,分析概率语言术语集与其他语言评估表达模型相比的优势;*后,引入多属性决策和价值理论,并梳理概率语言多属性决策方法的研宄进展。
1.1语言评估方法概述
本节对语言评估方法的表达模型和运算框架进行概述。模糊语言方法是对语言评估信息进行表征的基本方法。首先,本节介绍模糊语言方法的基本原理,包括语言评估信息的五元组表达和基于语言标度函数的语言术语的语义刻画。其次,介绍12种常用的语言评估表达模型,将其分为4种类型,并对不同类型的语言评估表达模型进行对比分析,概括各模型的主要特征。*后,将语言信息的运算框架分为3类,分别是基于扩展原理、序关系和特征值的运算框架,并对其进行对比分析。基于特征值的语言信息运算框架是本书作者在语言标度函数的基础上提出来的,它可以对均衡和非均衡语义形式的语言术语集进行灵活运算。
1.1.1模糊语言方法
当专家用语言自由地表达评估意见时,评价信息的真实含义可能令人难以理解,例如,专家可能会评估某位候选人“基本上是合格的”或“他成功的机会有点弱”。事实上,“基本合格”“有点弱”这样的表达式在没有参考对象进行比较的情况下是很难被度量的。为此,Zadeh了模糊语言方法,其核心思想是利用语言变量来管理和刻画语言描述算子内在的模糊性和不确定性,通过模拟人类认知过程来表达定性信息。其中,语言变量的可能取值是一系列可相互比较的语言术语。
定义1.1语言变量可用一个五元组(X,S(X),U,G,M)来表征。其中,X表示语言变量的名称;(可简写为S)表示刻画X的语言术语集,由X的可能语言取值组成;U表示一个语言变量X对应的基变量x的论域,其中,x表示变量X的实际数值;G表示生成中语言术语的语法规则;M表示生成中的每个语言术语s的含义的一个语义规则,其中,M(s)表示U的一个模糊子集。
集合S是论域U的一个模糊划分,也可表示一个语言变量不确定性的粒度。语言变量的语法规则和语义规则应根据实际情况而定。当使用语言变量表示自然语言信息时,每个对象只使用一个由语法规则创建的具有隶属函数的语言值。例如,当判断人的年龄时,人们只会用“年轻”“中年”“年老”当中的一个术语来表示。下面举例说明语言变量五元组的具体含义。
例1.1令某产品的“价格”为一个语言变量,记为X;其对应的基变量记为x,表示该产品的具体价格,用定量数字表示。假设该产品价格的取值范围为50~100元,即基变量x的论域为U=[50,100]。语言变量“价格”的语言术语集为极低,有点低,—般,有点高,该语言术语集由7个语言术语组成,表示语言变量“价格”的可能取值,这些取值也称为语言标度或语言标签。假设^中每个语言术语用三角模糊数表示,如语言术语“一般”对应的三角模糊数为。图1.1展示了该语言变量的语法规则。假设这些语言术语的语义为均衡分布,以语言术语“一般”为例,“M(一般)”表示将基变量x的取值分配给语言术语“一般”的一种规则,即M(一般),其中。
图1.1下标对称且均衡分布的七值语言术语集的语法
对于给定的价格75元,其属于“一般”的隶属度为0.5,62元属于“一般”的隶属度为0.2,而60元属于“一般”的隶属度为0。图1.2展示了下标对称且均衡分布下语言变量“价格”的语义。
图1.2下标对称且均衡分布下语言变量“价格”的语义
在利用语法规则的映射来识别非线性隶属函数之间的关系时,具体的映射关系是难以确定的。为了直观地确定语言值的隶属函数并对语言值进行比较,Herrera等提出了另一种语言描述方法,即多粒度语言术语集,简称为语言术语集。常用的语言术语集S可定义为
(1.1)
其中,表示S中的语言术语。g为一个正整数,其取值不宜过高或过低。过低会使对语言变量值的划分过于模糊,过高会使相邻语言术语之间的语义难以区分,从而增加评估难度。g+1表示S的粒度。一般情况下,粒度的取值是5~9中的整数。图1.1展示了粒度为7的情形。
现实问题中,语言变量的取值一般具有对称性,如外观的美与丑、食物味道的好与坏、身高的高与矮等。为了便于计算,Xu定义了下标对称的语言术语集为
(1.2)
其中,中间项S)表示语言值为“无差别”,正面和反面值在&两边对称分布,和分别表示语言变量取值的下界和上界,2r+1为S的粒度。
上述语言术语集是离散形式的,即各语言值下标取值为整数。然而,在语言值的运算过程中,计算得出的语言术语的下标可能会出现含小数点的结果,该结果无法对应于离散型语言术语集中的任何一项。为了有效地表示在语言运算过程中出现的语言值,Xu提出了虚拟语言术语集,表示为
(1.3)
它们分别为上述两种离散型语言术语集的连续形式。需要指出的是,虚拟语言术语集不仅可用来表示运算过程中出现的语言值,也可直接用于刻画相对精确的语言评估值。例如,设“质量”的语言术语集为。某专家认为“某产品质量70%的比例贴近于高,30%的比例贴近于极高”,则该评估信息可用连续语言术语表示。
在决策问题中,同一个语言术语可能会因为专家的评判标准不同而具有不同的语义。此外,人们的思维认知通常具有非线性特征。前景理论指出,人们面对得失时的风险偏好是不一致的。因此,语言术语集的语义可能是非均衡或非对称分布的。Wang等提出了语言标度函数的概念,它是确定非均衡分布的语言术语集语义的有效工具。随后,Liao等、Wu和Liao对语言标度函数的性质进行了详细分析,并给出了各语言标度函数的适用范围。
定义1.2令sa为语言术语集S中的一个语言术语,为sa的特征值,使得属于的隶属度为1。语言标度函数可表示为
(1.4)
三种常用的语言标度函数分别用来确定均衡分布的语言术语集、对称且相邻语言术语的语义差随中间值向边界移动而增大的语言术语集、对称且相邻语言术语的语义差随中间值向边界移动而减小的语言术语集的语义,如公式(1.5)~公式(1.7)所示。
(1)当语言术语集的语义均衡分布时,语言标度函数为
(1.5)
(2)当语言术语集对称且相邻语言术语的语义差随中间值向边界移动而增大时,语言标度函数为
(1.6)
其中,表示一个指示函数,当时;当时。指示函数具有相似的含义。V表示一个大于1的敏感性系数,越大,相邻语言术语的特征值差异越大。的取值应根据实际情况而定。图1.4呈现了此情况下的语言术语集语义的分布情况。
图1.4非均衡分布的语言术语集
(3)当语言术语集对称且相邻语言术语的语义差随中间值向边界移动而减小时,语言标度函数为
(1.7)
其中,表示专家对待“差”的风险态度;表示专家对待“好”的风险态度。的取值越小,表示专家的风险偏好度越高。和可取不同的值。若,则公式(1.7)表示的语言标度函数与公式(1.5)表示的一致。图1.5呈现了时语言术语集语义的分布情况。
展开