基于乐观概念的不完备决策信息系统规则提取算法.pdf

上传人:C*** 文档编号:11112855 上传时间:2021-09-04 格式:PDF 页数:11 大小:654.19KB
收藏 版权申诉 举报 下载
基于乐观概念的不完备决策信息系统规则提取算法.pdf_第1页
第1页 / 共11页
基于乐观概念的不完备决策信息系统规则提取算法.pdf_第2页
第2页 / 共11页
基于乐观概念的不完备决策信息系统规则提取算法.pdf_第3页
第3页 / 共11页
文档描述:

《基于乐观概念的不完备决策信息系统规则提取算法.pdf》由会员分享,可在线阅读,更多相关《基于乐观概念的不完备决策信息系统规则提取算法.pdf(11页完成版)》请在专利查询网上搜索。

1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 201910814478.0 (22)申请日 2019.08.30 (71)申请人 太原理工大学 地址 030024 山西省太原市迎泽西大街79 号 (72)发明人 陈泽华闫心怡柴晶赵哲峰 刘晓峰刘帆 (74)专利代理机构 太原高欣科创专利代理事务 所(普通合伙) 14109 代理人 崔雪花冷锦超 (51)Int.Cl. G06N 5/02(2006.01) G06N 20/00(2019.01) (54)发明名称 基于乐观概念的不完备决策信息系统规则 提取算法 (57)摘要 本。

2、发明公开了基于乐观概念的不完备决策 信息系统规则提取算法, 针对不完备决策信息系 统的规则提取算法, 首次提出了一种基于相容关 系的乐观概念格,并在此基础上提出相应的不完 备决策信息系统的规则提取算法。 该算法引入了 粒度的概念,在由粗到细的粒度空间下求取每层 的乐观概念,并根据乐观概念与决策信息系统中 决策属性的关系获取决策信息系统中的最简规 则,设定已提取到规则的论域元素是否覆盖整个 论域为算法终止条件,最终实现决策信息系统的 规则提取过程。 并通过定理证明、 实例分析说明 了新算法的正确性和有效性, 并通过实验验证了 算法的有效性和快速性。 权利要求书2页 说明书6页 附图2页 CN 1。

3、10580526 A 2019.12.17 CN 110580526 A 1.基于乐观概念的不完备决策信息系统规则提取算法, 其特征在于, 包括如下步骤: 步骤一: 计算不完备决策信息系统的决策属性下所有等价类, 在不同粒度下计算决策 属性子集关于论域的相容类; 步骤二: 计算所有相容类所对应的最小乐观概念; 步骤三: 对于任意的乐观概念, 判断其外延是否为某个决策相容类的子集: 针对乐观概念的外延是某个决策相容类的子集的情况, 将得到的规则中各属性添加属 性值存入规则集; 针对乐观概念的外延不是某个决策相容类的子集的情况, 对下一个乐观概念进行判 断, 直至所得到的规则将论域对象完全覆盖为止。

4、; 步骤四: 输出逻辑规则, 实现对不完备决策信息系统的规则提取。 2.根据权利要求1所述的基于乐观概念的不完备决策信息系统规则提取算法, 其特征 在于, 所述不完备决策信息系统是指: 设完备决策信息系统用一个四元组TU, A, V, f来表示, 其中U为对象集, A表示属性 集, V为全部属性A的值域; f: UAV是信息函数; 它指定U中每个对象的属性值; 对于任意的 满足条件的 属性集合B , 一种不可分辨关 系被定义为 式中, RB表示不可分辨关系, x、 y表示论域中任一的对象, a表示属性集中的任一属性, f (x, a)表示论域中对象x关于属性a所对应的属性值, f(y, a)表。

5、示论域中对象y关于属性a所 对应的属性值; 而U关于RB的划分表示为U/RB, 则U/RBxB|xU; 其中xB表示论域对象x在属性B 下的等价类, xByU|(x, y)RB; 不完备决策信息系统是指: 完备决策信息系统中存在使得f(x, a)未知的属性值, 记做 (f(x, a)*), 则称决策表是不完备的, 否则称决策表是完备的。 3.根据权利要求1所述的基于乐观概念的不完备决策信息系统规则提取算法, 其特征 在于, 所述最小乐观概念通过如下方法得到: 1)获得最小概念: 在形式背景T(U, A, I)中, 令2U、 2A分别为对象集U和属性集A的幂集, 对于任意对象集 合和任意属性集合。

6、Wille定义了两个映射P : 2U2A和Q: 2A2U: 易知, ( , )为2U和2A之间的伽罗瓦(Galois)连接; a表示属性集A中的任一属性, u表示 对象集U中的任一对象; 三元组T(U, A, I)为一个形式背景, U为对象集, A表示属性集,表示对象与属 性之间的二元关系; 对于集合满足P Q且QP; 若存在满足且不存在满足则定义概念(P, Q1)为最小 概念; 权利要求书 1/2 页 2 CN 110580526 A 2 2)获得乐观概念: 在不完备决策信息系统T(U, A, V, f)中, U为对象集, A表示属性集, V为全部属性A的值 域, f: UAV是信息函数, 。

7、它指定U中每个对象的属性值; 设B表示属性集A的子集, B 表示扩展属性集合的子集, P表示对象集U的子集, 则集合 且由T转化为的单值背景下B扩展的所有属性值为b1, b2, ., bs; 将存在 使得B P的情况, 定义(P, B)为一个乐观概念; 3)获得最小乐观概念: 在不完备决策信息系统T(U, A, V, f)中, 其中U为对象集, A表示属性集, V为全部属性A 的值域, f: UAV是信息函数, 它指定U中每个对象的属性值; 对于任意满足条件的属性集合B, 设属性集B关于U的任一个相容类为UB, 针对不 存在的情况, 使得B 关于U的相容类为UB, UB满足UBUB, 则称乐观。

8、概念(UB, B)为最 小乐观概念; 在相同的粒度下, 设两个属性子集为B1和B2, 且满足|B1|B2|, 当所述两个属性子集B1 和B2其关于U的相容类Ui和Uk满足UiUk时, 则定义第一个求得的乐观概念为最小乐观概念, 即(Ui, B1)是最小乐观概念。 4.根据权利要求1所述的基于乐观概念的不完备决策信息系统规则提取算法, 其特征 在于, 所述关于论域的相容类通过以下方法获得: 当存在aA、 xU使得f(x, a)未知时, 记作f(x, a)*, 则称决策表是不完备的, 不存在 时, 则称决策表是完备的; 设DT(U, A, V, f)为一个不完备决策信息系统, 对于任意满足条件的属。

9、性集合B, 定义U上的一种相容关系SIM(B)为: 式中, x表示论域中的任一对象, y表示论域中的任一对象, a表示属性集中的属性, f(x, a)表示论域中对象x关于属性a所对应的属性值, f(y, a)表示论域中对象y关于属性a所对应 的属性值; 对于任意对象xU, 定义论域中x的相容类集合为SB(x), 则SB(x)y|(x, y)SIM (B); 再定义集合U/SIM(B)表示U关于B的覆盖, 则 U/SIM(B)SB(x)|xUX1, X2, ., Xk, 即满足且存在Xi、 XjU/SIM(B)使得 根据相容概念的定义, 计算决策属性下所有相容类, 并在不同粒度下计算属性子集关 。

10、于论域的相容类。 5.根据权利要求1所述的基于乐观概念的不完备决策信息系统规则提取算法, 其特征 在于, 按照最小乐观概念的定义, 计算所有相容类所对应的最小乐观概念, 求取不完备决策 信息系统的乐观概念的依据: 在决策信息系统TU, A, V, f中, 对于任意满足条件的属性集合B, 针对U关于 属性子集B产生的某一个相容类为Ui的情况, Ui表示相容类, 则定义集合(Ui, B)为一个乐观 概念; 在决策信息系统TU, A, V, f中, 由所有相容类产生的最小乐观概念组成的集合BT为 一个完备格。 权利要求书 2/2 页 3 CN 110580526 A 3 基于乐观概念的不完备决策信息。

11、系统规则提取算法 技术领域 0001 本发明基于乐观概念的不完备决策信息系统规则提取算法, 属于决策信息系统规 则提取技术领域。 背景技术 0002 信息系统是机器学习的主要研究对象, 决策信息系统是信息系统的一种重要的表 现形式。 决策信息系统的规则提取是数据分析的研究内容之一, 粗糙集理论(rough set theory,RST)是一种有效的处理数据的数学工具, 近年来利用粗糙集对决策信息系统的规 则提取吸引了大多数学者的研究。 0003 1982年Wille提出了概念格(concept lattice)理论,它是一种刻画不完整和不确 定信息的数学工具,能有效地分析不精确、 不一致、 不。

12、完整等各种不完备信息。 运用概念格 进行数据分析,可以发现数据中隐含的知识、 揭示潜在的规律.概念格的研究对象往往是形 式背景,且用形式概念表示从形式背景中获得的知识粒,因此概念格理论也被称作形式概 念分析(formal concept analysis,FCA)。 近年来,很多学者利用FCA对决策信息系统的规 则提取进行了广泛的研究:针对完备决策信息系统的研究相对较多。 不完备决策信息系统 的研究更具有显示意义,李想等人将不完备信息系统转换为一种特殊的形式背景,提出了 相容概念以及相容概念格,最后基于相容概念获取规则。 但相容概念的求取过程比较繁琐, 获取的决策规则中存在冗余。 魏玲等人研究。

13、了基于k阶关系的近似概念获取问题,并分析了 它们与形式概念、 面向属性概念、 面向对象概念之间的关系,但是并没有进行知识获取。 0004 FCA和RST具有相同的研究背景和目标,必然也存在一些本质联系.魏玲讨论了FCA 与RST中等价类幂集之间的关系,并且给出了由分划构造概念格、 由概念格获得划分的具体 方法; Kang基于FCA理论提出了一种粗糙集理论模型,该模型提供了一个信息系统中代数结 构问题的解决方案,并定义了粗糙集概念来进行规则提取,但是该模型最终约简的规则中 存在冗余规则; Zhu同时将FCA和RST理论用于决策信息系统的多知识获取中,提出了一种新 的知识获取算法,该算法降低了传统。

14、概念格规则提取算法的复杂度; 李金海比较了通过FCA 和RST两种理论进行规则提取的过程,用两个规则提取的算法比较了两种方式之间的异同, 并对以后两种理论的发展进行了展望,但是文献并没有探讨两种理论之间的对应关系。 发明内容 0005 为克服现有技术的不足, 本发明提供了基于乐观概念的不完备决策信息系统规则 提取算法, 该算法复杂度低、 收敛速度快。 0006 本发明通过以下技术方案实现: 0007 基于乐观概念的不完备决策信息系统规则提取算法, 包括如下步骤: 0008 步骤一: 计算不完备决策信息系统的决策属性下所有相容类, 在不同粒度下计算 决策属性子集关于论域的相容类; 0009 步骤。

15、二: 计算所有相容类所对应的最小乐观概念; 说明书 1/6 页 4 CN 110580526 A 4 0010 步骤三: 对于任意的乐观概念, 判断其外延是否为某个决策相容类的子集: 0011 针对乐观概念的外延是某个决策相容类的子集的情况, 将得到的规则中各属性添 加属性值存入规则集; 0012 针对乐观概念的外延不是某个决策相容类的子集的情况, 对下一个乐观概念进行 判断, 直至所得到的规则将论域对象完全覆盖为止; 0013 步骤四: 输出逻辑规则, 实现对不完备决策信息系统的规则提取。 0014 优选地, 所述不完备决策信息系统是指: 0015 设完备决策信息系统用一个四元组TU,A,V。

16、,f来表示, 其中U为对象集,A表示 属性集,V为全部属性A的值域; f:UAV是信息函数; 它指定U中每个对象的属性值; 0016对于任意的满足条件的属性集合B, 一种不可分辨关系被定义为 0017 式中RB表示不可分辨关系, x表示表示论域中任一的对象, y表示表示论域中任一 的对象, a表示属性集中的任一属性, f(x, a)表示论域中对象x关于属性a所对应的属性值, f (y, a)表示论域中对象y关于属性a所对应的属性值; 0018 而U关于RB的划分表示为U/RB, 则U/RBxB|xU; 其中xB表示论域对象x在属 性B下的等价类, xByU|(x, y)RB; 0019 不完备。

17、决策信息系统是指: 0020 不完备决策信息系统是指: 完备决策信息系统中存在使得f(x, a)未知的属性值, 记做(f(x, a)*), 则称决策表是不完备的, 否则称决策表是完备的。 0021 优选地, 所述最小乐观概念通过如下方法得到: 0022 1)获得最小概念: 0023 根据形式概念进行规则提取, 因概念的内涵存在冗余属性导致决策规则存在冗 余, 因此本发明在原概念定义的基础上提出了最小概念的定义。 0024 在形式背景T(U,A,I)中,令2U、 2A分别为对象集U和属性集A的幂集,对于任意对 象集合和任意属性集合Wille定义了两个映射P :2U2A和Q:2A2U: 0025 。

18、0026 0027 易知,( , )为2U和2A之间的伽罗瓦(Galois)连接; a表示属性集A中的任一属性, u 表示对象集U中的任一对象; 0028三元组T(U, A, I)为一个形式背景, U为对象集, A表示属性集,表示对 象与属性之间的二元关系; 对于集合满足P Q且QP; 0029若存在满足且不存在满足则定义概念(P, Q1)为最小概念; 0030 通过提取形式背景中的最小概念, 在规则提取时可以减少冗余规则的判断,降低 算法的复杂度。 0031 2)获得乐观概念: 说明书 2/6 页 5 CN 110580526 A 5 0032 由FCA基本概念可知, 其研究对象为单值形式背。

19、景和多值形式背景, 而多值形式背 景在形式上与决策信息系统相同, 因此FCA也可对决策信息系统进行数据分析。 在FCA中, 首 先需要将决策信息系统转化为单值形式背景, 转化之后, 每个属性下的每个属性值均在单 值背景下充当一个属性。 为了避免决策信息系统的扩展会导致增加计算的复杂性, 本发明 考虑概念格与粗糙集的联系, 定义了乐观概念。 0033 在不完备决策信息系统T(U, A, V, f)中, U为对象集, A表示属性集, V为全部属性A 的值域, f:UAV是信息函数, 它指定U中每个对象的属性值; 0034 设B表示属性集A的子集, B 表示扩展属性集合的子集, P表示对象集U的子集。

20、, 则集 合且由T转化为的单值背景下B扩展的所有属性值为b1, b2, , bs; 将存在 使得B P的情况, 定义(P, B)为一个乐观概念; 0035 3)获得最小乐观概念: 0036 若在将决策信息系统转化为的单值形式背景下, 根据传统形式概念, 其内涵不仅 蕴含属性并且蕴含属性值; 若直接对决策信息系统计算乐观概念, 根据我们的发明的乐观 概念其内涵仅仅蕴含属性。 0037 不完备决策信息系统中所有属性子集产生的相容类之间可能存在重复, 由此得到 外延相同、 内涵不同的多个乐观概念。 在这种情况下, 为保证最终提取的规则中不含冗余, 本发明定义最小乐观概念便于提取最简规则。 0038 。

21、在不完备决策信息系统T(U, A, V, f)中, 其中U为对象集, A表示属性集, V为全部 属性A的值域, f:UAV是信息函数, 它指定U中每个对象的属性值; 0039对于任意满足条件的属性集合B, 设属性集B关于U的任一个相容类为UB, 针 对不存在的情况, 使得B 关于U的相容类为UB, UB满足UBUB,则称乐观概念(UB, B) 为最小乐观概念。 0040 在相同的粒度下, 设两个属性子集为B1和B2, 且满足|B1|B2|, 若所述两个属性 子集B1和B2关于U的相容类Ui和Uk满足UiUk, 则定义第一个求得的乐观概念为最小乐观概 念,即(Ui, B1)是最小乐观概念。 00。

22、41 当不完备决策信息系统变为完备决策信息系统, 相容关系退化为等价关系, 上述 结论仍然成立。 0042 优选地, 所述关于论域的相容类通过以下方法获得: 0043 若存在aA、 xU使得f(x,a)未知(记作f(x,a)*),则称决策表是不完备的,若 不存在称决策表是完备的. 0044设DT(U,A,V,f)为一个不完备决策信息系统, 对于任意满足条件的属性 集合B, 定义U上的一种相容关系SIM(B)为: 0045式中, x 表示论域中的任一对象, y表示论域中的任一对象, a表示属性集中的属性, f(x, a)表示论域 中对象x关于属性a所对应的属性值, f(y, a)表示论域中对象y。

23、关于属性a所对应的属性值。 0046 对于任意对象xU, 定义论域中x的相容类集合为SB(x), 则SB(x)y|(x,y)SIM (B); 再定义集合U/SLM(B)表示U关于B的覆盖, 则U/SIM(B)SB(x)|xUX1,X2,., 说明书 3/6 页 6 CN 110580526 A 6 Xk, 即满足且存在Xi、 XjU/SIM(B)使得 0047 根据相容概念的定义计算决策属性下所有相容类, 并在不同粒度下计算属性子集 关于论域的相容类。 0048 优选地, 按照最小乐观概念的定义, 计算所有相容类所对应的最小乐观概念, 求取 不完备决策信息系统的乐观概念的依据: 0049在决策。

24、信息系统TU,A,V,f中, 对于任意满足条件的属性集合B, 针对U关 于属性子集B产生的某一个相容类为Ui的情况, Ui表示相容类(本质上是对象集合), 则定义 集合(Ui,B)为一个乐观概念; 0050 在决策信息系统TU,A,V,f中, 由所有相容类产生的最小乐观概念组成的集合 BT为一个完备格。 0051 与现有技术相比, 本发明具有如下有益效果: 0052 本发明直接由不完备决策信息系统生成一种具有格结构的乐观概念提出了一种 基于相容关系的乐观概念格规则提取算法。 本算法基于相容关系, 相较于传统概念格规则 提取算法的扩展决策信息系统的过程,降低了算法的时间空间复杂度。 0053 1。

25、).本发明提出了一种新的概念格形式, 省略了去除规则中冗余属性的过程; 0054 2).本发明利用最小乐观概念的外延与决策属性之间的联系进行规则提取, 简易 了规则的判断, 降低了算法复杂度; 0055 3).本发明省去了传统概念格规则提取算法的扩展决策信息系统的过程, 降低了 算法的时间空间复杂度; 0056 4).本发明设定已提取到规则的论域元素是否覆盖整个论域为算法终止条件, 加 快了算法的收敛速度。 附图说明 0057 图1为本发明算法的流程示意图。 0058 图2为本发明算法的最小乐观概念格结构图。 具体实施方式 0059 下面结合具体实施例对本发明做进一步的详细说明, 但是本发明的。

26、保护范围并不 限于这些实施例, 凡是不背离本发明构思的改变或等同替代均包括在本发明的保护范围之 内。 0060 如图1所示, 是本发明提供的一种基于相容关系的乐观概念格生成算法的流程示 意图。 0061 本发明方法的步骤详细如下: 00621.计算决策属性D下所有相容类, 初始化粒度1、 已覆盖论域元素 00632.在粒度下计算属性子集x下关于论域的相容类; (且为满足|x|的所 有集合); 0064 3.计算所有相容类所对应的最小乐观概念; 0065 4.对于任意的乐观概念(P, B), 判断其外延是否为某个决策相容类的子集,做如下 说明书 4/6 页 7 CN 110580526 A 7 。

27、处理: 0066若P为决策相容类Di的子集, 即则得到规则BDi, 并且将规则中各属性添 加属性值存入rules(属性值为T中论域元素P下的各属性的值),并更新Un:UnUnP; 0067 若P不包含于任何决策相容类,则转至步骤4对下一概念进行判断,直至所有概念 判断结束, 转至步骤5; 0068 5.判断Un是否等于U: 若相等, 则转步骤7; 否则, 转至步骤6; 0069 6.若|C|, 则+1, 返回步骤2继续计算; 否则转至步骤7; 0070 7.输出rules中的逻辑规则。 0071 实施例1 0072 如表1所示是一个不完备决策信息系统TU,A,V,f, 0073 其中U1,2,。

28、3,4,5,6, AP,M,S,X,D, 其中P代表属性Price、 M代表属性 Mileage、 S代表属性Size、 X代表属性Max_speed、 D为决策属性。 0074 表1.不完备多值背景 0075 0076 首先, 求得决策属性下所有相容类为: U/D1,2,4,6,3,5。 0077 在粒度1的情况下, 求条件属性下关于U的覆盖, 得到所有相容类, 并得到相应 乐观概念, 如表2所示: 0078 表2.1时乐观概念计算过程 0079 0080 判断所有乐观概念的外延是否为决策相容类的子集, 可得到: 只有概念(3,S)满足 条件, 由此可得一条决策规则: 0081 多值背景中论。

29、域元素3的属性值Scompact、 Dpoor, 规则即为Size 说明书 5/6 页 8 CN 110580526 A 8 compactDpoor。 0082 在粒度2的情况下, 求得所有乐观概念如表3所示: 0083 表3.2时乐观概念计算过程 0084 0085 判断乐观概念的外延是否为决策相容类的子集, 可知只有概念(126,SX)满足条 件, 由此可得一条决策规则: 0086 多值背景中论域元素1,2,6共同拥有的属性值为Sfull、 Xlow、 Dgood,规 则即为SizefullMax_speedlowDgood。 0087 至此我们可以看出, 所得规则已覆盖论域元素1,2,。

30、3,6, 还剩下元素4,5。 0088 由表3可以看出, 多值背景中论域4,5下是不一致的(即相同的条件属性值下得 到不相同的决策值), 因此即使在更细粒度下也无法得到规则覆盖该论域元素。 不妨将其决 策类放置在一个相容类中, 使得概念(45,PX)也满足规则提取的条件。 4,5共同拥有的属 性值为Phigh、 Xhigh、 Dgoodexcellent, 规则即为PricehighMax_speed highDgoodexcellent。 0089 最终得到的3条规则覆盖论域U, 计算结束。 0090 本发明提出了一种新的概念格形式, 省略了去除规则中冗余属性的过程; 利用最 小乐观概念的外延与决策属性之间的联系进行规则提取, 简易了规则的判断, 降低了算法 复杂度; 省去了传统概念格规则提取算法的扩展决策信息系统的过程, 降低了算法的时间 空间复杂度; 设定已提取到规则的论域元素是否覆盖整个论域为算法终止条件, 加快了算 法的收敛速度。 0091 本发明不会限制于本文所示的实施例, 而是要符合与本文所公开的原理和新颖性 特点相一致的最宽范围。 说明书 6/6 页 9 CN 110580526 A 9 图1 说明书附图 1/2 页 10 CN 110580526 A 10 图2 说明书附图 2/2 页 11 CN 110580526 A 11 。

展开阅读全文
内容关键字: 基于 乐观 概念 完备 决策 信息系统 规则 提取 算法
关于本文
本文标题:基于乐观概念的不完备决策信息系统规则提取算法.pdf
链接地址:https://www.zhuanlichaxun.net/pdf/11112855.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1