基于深度项目反应理论的认知诊断方法.pdf
《基于深度项目反应理论的认知诊断方法.pdf》由会员分享,可在线阅读,更多相关《基于深度项目反应理论的认知诊断方法.pdf(10页完成版)》请在专利查询网上搜索。
1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 201910676812.0 (22)申请日 2019.07.25 (71)申请人 中国科学技术大学 地址 230026 安徽省合肥市包河区金寨路 96号 (72)发明人 刘淇陈恩红程松黄仔 黄振亚陈玉莹马海平 (74)专利代理机构 北京凯特来知识产权代理有 限公司 11260 代理人 郑立明郑哲 (51)Int.Cl. G06F 16/33(2019.01) G06F 16/335(2019.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G。
2、06Q 50/20(2012.01) (54)发明名称 基于深度项目反应理论的认知诊断方法 (57)摘要 本发明公开了一种基于深度项目反应理论 的认知诊断方法, 包括: 获取学生的历史习题数 据; 对历史习题数据进行预处理, 使用深度学习 方法并结合预处理结果对学生和习题数据进行 建模, 获得学生的潜在特质、 以及习题难度和区 分度; 根据学生的潜在特质、 以及习题难度和区 分度, 利用项目反应理论的二参数模型预测学生 在习题上的得分。 上述方法可以给学生提供更有 效、 更详细以及更鲁棒的认知诊断结果。 权利要求书3页 说明书5页 附图1页 CN 110377707 A 2019.10.25 。
3、CN 110377707 A 1.一种基于深度项目反应理论的认知诊断方法, 其特征在于, 包括: 获取学生的历史习题数据; 对历史习题数据进行预处理, 使用深度学习方法并结合预处理结果对学生和习题数据 进行建模, 获得学生的潜在特质、 以及习题难度和区分度; 根据学生的潜在特质、 以及习题难度和区分度, 利用项目反应理论的二参数模型预测 学生在习题上的得分。 2.根据权利要求1所述的一种基于深度项目反应理论的认知诊断方法, 其特征在于, 所 述历史习题数据包含了M个习题, 每一习题包括的习题描述文本以及习题包含的知识点集 合。 3.根据权利要求1或2所述的一种基于深度项目反应理论的认知诊断方法。
4、, 其特征在 于, 假设有L个学生和M个习题, 则组成了答题记录RRij|1iL, 1jM; 其中Rij是一条答题记录, 表示一个学生Si在一道习题Qj上的实际得分为rij; 习题Qj, 包含习题描述文本QTj和知识点集合QKj两个部分; 所有习题共包含 有P个知识点; 初始化学生Si在每个知识点p上的掌握度记为 p, 所有知识点掌握度组成一个 P维的向量 ( 1, 2, , P)。 4.根据权利要求1所述的一种基于深度项目反应理论的认知诊断方法, 其特征在于, 所 述对历史习题数据进行预处理包括: 假设一道习题Qj中的习题描述文本QTj由U个单词组成, 通过预训练得到Word2Vec模型 将。
5、习题描述文本QTj中的每一个单词表示成向量形式, 得到QTjw1, w2, , wU, 其中包含, 每一个单词u都被表示成一个d0维的向量 假设一道习题Qj中的知识点集合QKj由V个知识点组成, 将每一个知识点v表示成一个P 维的one-hot向量Kv0, 1P, 得到QKjK1, K2, , KV, 再使用一个d1维的密集层将每一个 知识点的one-hot向量Kv转化为一个d1维的密集向量转换方式为: kvKvWk 其中,是密集层的参数; 转换后的知识点向量集合记为 5.根据权利要求1或4所述的一种基于深度项目反应理论的认知诊断方法, 其特征在 于, 所述使用深度学习方法并结合预处理结果对学。
6、生和习题数据进行建模, 获得学生的潜 在特质、 以及习题难度和区分度, 包括三个部分: 利用深度神经网络建模学生的潜在特质、 利用基于注意力机制的长短期记忆网络建模习题难度、 以及利用深度神经网络建模习题区 分度。 6.根据权利要求5所述的一种基于深度项目反应理论的认知诊断方法, 其特征在于, 所 述利用深度神经网络建模学生的潜在特质包括: 假设一个学生Si在的知识点掌握度向量为 ( 1, 2, , P), 其中的P为所有历史习题 数据中知识点的总数; 预处理后的一道习题Qj的知识点向量集合为 则将知识点向量集合与相应的掌握度对应相乘, 得到一个d1维的向量计算方 权利要求书 1/3 页 2 。
7、CN 110377707 A 2 式为: 将d1维的向量输入到一个深度神经网络DNN中, 得到学生潜在特质 : DNN()。 7.根据权利要求5所述的一种基于深度项目反应理论的认知诊断方法, 其特征在于, 利 用深度神经网络建模习题区分度包括: 预处理后的一道习题Qj的知识点向量集合为将所有知识点向量累 加, 得到一个d1维的向量计算方式为: 将得到的d1维的向量A输入到一个深度神经网络DNNa中来确定习题Qj的区分度; 对深度神经网络DNNa的输出值DNNa(A)进行变换: 先通过一个sigmoid函数归一化到区 间0, 1; 然后通过平移和放缩变换, 将sigmoid函数输出值减去0.5,。
8、 再乘以8, 从而将DNNa 的输出值变换到习题区分度的理论范围区间-4, 4中, 得到习题Qj的区分度a, 变换方式表 示为: a8(sigmoid(DNNa(A)-0.5)。 8.根据权利要求5所述的一种基于深度项目反应理论的认知诊断方法, 其特征在于, 所 述利用基于注意力机制的长短期记忆网络建模习题难度包括: 将预处理后的一道习题Qj的习题描述文本QTjw1, w2, , wU以及相应的知识点向量 集合经过注意力机制融合得到输入序列x(x1, x2, , xN), 并输入到步 长为N的长短期记忆网络中, 得到长短期网络输出的隐含状态序列h(h1, h2, , hN); 其中, NU; 。
9、每一个时刻t的状态ht定义如下: it (Wxixt+Whiht-1+bi) ft (Wxfxt+Whfht-1+bf) ot (Wxoxt+Whoht-1+bo) ctftct-1+ittanh(Wxcxt+Whcht-1+bc) htottanh(ct) 其中, i, f, c, o分别表示长短期记忆网络中的输入门、 遗忘门、 记忆单元和输出门, (.) 为激活函数, W*, b*表示每个门中的可学习参数; 每一个时刻t的输入xt定义如下: 其中,是放缩因子; j是习题描述文本QTj中的单词wt, 和习题知识点集合中知 识点的相关性, 表示知识点的深度和广度, 当UtN时, wt用0向量来。
10、表示; j的计算方式如 权利要求书 2/3 页 3 CN 110377707 A 3 下: 将长短期记忆网络的最后一个时刻N的输出值hN用均值池化操作得到习题难度, 然后通 过平移和放缩变换, 先将averagePooling函数输出值averagePooling(hN)减去0.5, 再乘以 8, 从而将输出值变换到区间-4, 4中, 得到习题难度b, 变换方式表示为: b8(sigmoid(averagePooling(hN)-0.5)。 9.根据权利要求1、 6、 7或8所述的一种基于深度项目反应理论的认知诊断方法, 其特征 在于, 根据学生Si的潜在特质 、 以及习题Qj的难度b和区分度。
11、a, 利用项目反应理论的二参数 模型预测学生Si在习题Qj上的得分表示为: 其中, D为常数。 10.根据权利要求1、 6、 7或8所述的一种基于深度项目反应理论的认知诊断方法, 其特 征在于, 在训练阶段针对预处理时的参数以及深度学习方法的参数进行更新, 目标损失函数为 负对数似然函数; 在获取学生的历史习题数据时同样获取了学生的实际得分, 一个学生Si 在一道习题Qj上的实际得分为rij, 训练阶段, 学生Si在一道习题Qj上的预测得分为则损 失函数为: 通过Adam优化器最小化目标损失函数 来训练, 以更新相应参数。 权利要求书 3/3 页 4 CN 110377707 A 4 基于深度。
12、项目反应理论的认知诊断方法 技术领域 0001 本发明涉及深度学习和教育数据挖掘领域, 尤其涉及一种基于深度项目反应理论 的认知诊断方法。 背景技术 0002 当前的大数据和数据挖掘技术快速发展, 尤其是在教育领域, 大量的习题数据被 收集, 并且被广泛应用于教育相关领域。 比如个性化试题推荐可以给学生推荐合适的练习 题, 来加强学生在知识点或者答题技巧上的熟练度; 自适应测试可以根据学生自身的认知 情况, 给学生提供个性化的测试方案。 而对学生的认知情况, 也就是学上在知识点或者答题 技巧上的掌握程度的准确诊断, 是这些应用的基础。 0003 传统的认知诊断方法都基于统计学, 仅仅使用学生答。
13、题结果的历史数据来对学生 进行诊断, 对数据敏感, 且鲁棒性不好。 围绕认知诊断这个问题, 很多研究者提出了不少方 法, 但是这些方法都没能够使用习题文本数据来提升诊断效果, 然而, 教育领域已经积累了 很多习题数据, 尤其是文本数据。 0004 因此如何利用习题文本, 来增强传统认知诊断模型的有效性以及鲁棒性, 是当前 教育大数据背景下亟待解决的一个重要问题。 发明内容 0005 本发明的目的是提供一种基于深度项目反应理论的认知诊断方法, 可以给学生提 供更有效、 更详细以及更鲁棒的认知诊断结果, 从而能够更有针对性的给学生推荐合适的 习题。 0006 本发明的目的是通过以下技术方案实现的:。
14、 0007 一种基于深度项目反应理论的认知诊断方法, 其特征在于, 包括: 0008 获取学生的历史习题数据; 0009 对历史习题数据进行预处理, 使用深度学习方法并结合预处理结果对学生和习题 数据进行建模, 获得学生的潜在特质、 以及习题难度和区分度; 0010 根据学生的潜在特质、 以及习题难度和区分度, 利用项目反应理论的二参数模型 预测学生在习题上的得分。 0011 由上述本发明提供的技术方案可以看出, 充分利用了习题数据, 能够增强认知诊 断的有效性和鲁棒性, 同时, 弥补了传统项目反映理论的单维性和不能冷启动以及大规模 训练的弊端。 附图说明 0012 为了更清楚地说明本发明实施。
15、例的技术方案, 下面将对实施例描述中所需要使用 的附图作简单地介绍, 显而易见地, 下面描述中的附图仅仅是本发明的一些实施例, 对于本 领域的普通技术人员来讲, 在不付出创造性劳动的前提下, 还可以根据这些附图获得其他 说明书 1/5 页 5 CN 110377707 A 5 附图。 0013 图1为本发明实施例提供的一种基于深度项目反应理论的认知诊断方法的流程 图。 具体实施方式 0014 下面结合本发明实施例中的附图, 对本发明实施例中的技术方案进行清楚、 完整 地描述, 显然, 所描述的实施例仅仅是本发明一部分实施例, 而不是全部的实施例。 基于本 发明的实施例, 本领域普通技术人员在没。
16、有做出创造性劳动前提下所获得的所有其他实施 例, 都属于本发明的保护范围。 0015 本发明实施例提供一种基于深度项目反应理论的认知诊断方法, 其具体基于深度 项目反应理论实现, 如图1所示, 主要包括如下步骤: 0016 步骤11、 获取学生的历史习题数据。 0017 本发明实施例中, 所述历史习题数据包含了M个习题, 每一习题包括的习题描述文 本以及习题包含的知识点集合。 同时, 还获取学生的答题记录, 其中的实际得分将用于训练 阶段。 0018 步骤12、 对历史习题数据进行预处理, 使用深度学习方法并结合预处理结果对学 生和习题数据进行建模, 获得学生的潜在特质、 以及习题难度和区分度。
17、。 0019 本步骤主要包括两个阶段: 预处理阶段与建模阶段, 下面给出各阶段的优选实施 方式。 0020 一、 预处理阶段。 0021 预处理的目的是使用通信的数学形式来表示相关数据。 0022 1)假设有L个学生和M个习题, 则组成了答题记录RRij|1iL, 1jM; 其中 Rij是一条答题记录, 表示一个学生Si在一道习题Qj上的实际得分为rij; 习题Qj , 包含习题描述文本QTj和知识点集合QKj两个部分; 所有习题共包含有P个知识 点; 初始化学生Si在每个知识点p上的掌握度记为 p, 所有知识点掌握度组成一个P维的向量 ( 1, 2, , P)。 0023 2)对习题的描述文。
18、本和知识点数据进行表征。 0024 假设一道习题Qj中的习题描述文本QTj由U个单词组成, 通过预训练得到Word2Vec 模型将习题描述文本QTj中的每一个单词表示成向量形式, 得到QTjw1, w2, , wU, 其中包 含, 每一个单词u都被表示成一个d0维的向量 0025 假设一道习题Qj中的知识点集合QKj由V个知识点组成, 将每一个知识点v表示成一 个P维的one-hot向量(独热向量)Kv0, 1P, 得到QKjK1, K2, , KV, 再使用一个d1维的 密集层将每一个知识点的one-hot向量Kv转化为一个d1维的密集向量转换方式 为: 0026 kvKvWk 0027其中。
19、,是密集层的参数; 0028转换后的知识点向量集合记为 0029 二、 建模阶段。 说明书 2/5 页 6 CN 110377707 A 6 0030 建模主要包括三个部分: 利用深度神经网络建模学生的潜在特质、 利用基于注意 力机制的长短期记忆网络建模习题难度、 以及利用深度神经网络建模习题区分度。 0031 1)利用深度神经网络建模学生的潜在特质。 0032 深度神经网络建模学生潜在特质。 学生的潜在特质 对于学生在习题上的表现具 有很强的可解释性, 并且与学生在每个知识点上的掌握度有很重要的关系, 在每个知识点 上都具有很高的掌握度的学生, 潜在特质也会比较高, 因为对每个知识点的掌握度。
20、可以反 映学生综合能力。 深度学习方法具有很好的数据自动表征和学习的能力, 因此使用一个深 度神经网络DNN来诊断学生的潜在特质 。 0033 本发明实施例中, 假设一个学生Si在的知识点掌握度向量为 ( 1, 2, , P), 其 中的P为所有历史习题数据中知识点的总数; 预处理后的一道习题Qj的知识点向量集合为 0034则将知识点向量集合与相应的掌握度对应相乘, 得到一个d1维的向量计 算方式为: 0035 0036本发明实施例中, 知识点向量集合的元素数量V小于等于知识点掌握度向量 的元素数量P, 上述计算时只考虑与知识点向量具有对应关系的掌握度向量。 0037 将d1维的向量输入到一个。
21、深度神经网络DNN中, 得到学生潜在特质 : 0038 DNN()。 0039 区别于传统项目反映理论中的潜在特质保持不变, 本发明实施例中得到的学生潜 在特质针对不同的的习题是不同的, 比传统项目反映理论中的潜在特质具有更强的解释 性。 0040 2)利用深度神经网络建模习题区分度。 0041 习题区分度a可以用来分析学生在习题上的表现的分布情况, 区分度的建模方法, 受到多维项目反映理论中习题区分度和知识点之间关系的启发, 习题区分度和习题所包含 的知识点之间有很紧密的关系。 因此, 通过对习题的知识点进行建模来得到习题的区分度, 同样, 深度学习方法具有很好的数据自动表征和学习的能力, 。
22、使用一个和DNN结构一样的 深度神经网络DNNa来建模习题区分度a, 深度神经网络DNNa和DNN结构一样, 但是他们之间 的参数并不共享。 0042 本 发 明 实 施 例 中 , 预 处 理 后 的 一 道 习 题 Qj的 知 识 点 向 量 集 合 为 将所有知识点向量累加, 得到一个d1维的向量计算方式为: 0043 0044 将得到的d1维的向量A输入到一个深度神经网络DNNa中来确定习题Qj的区分度; 0045 由于在传统的项目反映理论中, 习题区分度的理论范围区间为-4, 4, 因此, 对深 度神经网络DNNa的输出值DNNa(A)进行变换: 先通过一个sigmoid函数归一化到。
23、区间0, 1; 然后通过平移和放缩变换, 将sigmoid函数输出值减去0.5, 再乘以8, 从而将DNNa的输出值 说明书 3/5 页 7 CN 110377707 A 7 变换到习题区分度的理论范围区间-4, 4中, 得到习题Qj的区分度a, 变换方式表示为: 0046 a8(sigmoid(DNNa(A)-0.5)。 0047 3)利用基于注意力机制的长短期记忆网络建模习题难度。 0048 习题难度b决定了一个题目被解决的难易程度。 确定习题难度可以从两个角度入 手, 其一是可以通过习题的描述文本来确定难度, 因为习题难度跟描述文本是紧密相关的, 比如有些题目的文本难以理解, 那么难度就。
24、可想而知了, 而在处理文本这样的长时间序列 数据, 长短期记忆网络具有很好的处理这种长时间依赖数据的优势, 能够自动的从文本中 学习语义信息, 从而能够给出现次数少的习题提供更好的鲁棒性, 因此使用一个长短期记 忆网络从文本的角度来建模难度。 另一方面, 习题知识点考察的深度和广度, 对习题的难度 也都有很大的影响, 知识点被考察的深度越深广度越广, 那么此题的难度也就会越大, 显 然, 知识点的广度和深度可以通过习题文本与每个知识点的相关程度来表示, 为了能够捕 捉到习题文本和知识点之间的关联性, 使用注意力机制来来实现。 综合这两个方面, 设计了 一个基于注意机制的长短期记忆网络, 来融合。
25、这两个方面对习题难度的影响。 0049 本发明实施例中, 将预处理后的一道习题Qj的习题描述文本QTjw1, w2, , wU以 及相应的知识点向量集合经过注意力机制融合得到输入序列x(x1, x2, , xN), 并输入到步长为N的长短期记忆网络中, 得到长短期网络输出的隐含状态序列h (h1, h2, , hN); 其中, NU; 0050 每一个时刻t的状态ht定义如下: 0051 it (Wxixt+Whiht-1+bi) 0052 ft (Wxfxt+Whfht-1+bf) 0053 ot (Wxoxt+Whoht-1+bo) 0054 ctftct-1+ittanh(Wxcxt+W。
26、hcht-1+bc) 0055 htottanh(ct) 0056 其中, i, f, c, o分别表示长短期记忆网络中的输入门、 遗忘门、 记忆单元和输出门, (.)为激活函数, W*, b*表示每个门中的可学习参数; 0057 每一个时刻t的输入xt定义如下: 0058 0059其中,是放缩因子; j是习题描述文本QTj中的单词wt, 和习题知识点集合 中知识点的相关性, 表示知识点的深度和广度, 当UtN时, wt用0向量来表示; j的计算方 式如下: 0060 0061 将长短期记忆网络的最后一个时刻N的输出值hN用均值池化操作得到习题难度, 然后通过平移和放缩变换, 先将averag。
27、ePooling函数输出值averagePooling(hN)减去0.5, 再乘以8, 从而将输出值变换到区间-4, 4中, 得到习题难度b, 变换方式表示为: 0062 b8(sigmoid(averagePooling(hN)-0.5)。 0063 步骤13、 根据学生的潜在特质、 以及习题难度和区分度, 利用项目反应理论的二参 说明书 4/5 页 8 CN 110377707 A 8 数模型预测学生在习题上的得分, 实现认知诊断。 0064 根据学生Si的潜在特质 、 以及习题Qj的难度b和区分度a, 利用项目反应理论的二 参数模型预测学生Si在习题Qj上的得分表示为: 0065 006。
28、6 其中, D为常数, 示例性的, 可以设置D-1.7。 0067 上述方案, 不仅保留了相关参数在传统项目反映理论中的可解释性, 并且其诊断 结果也得到了深度学习方法的增强。 0068 本发明实施例中上述方案可以构成一个完整的网络模型, 为了确保预测结果的准 确性, 需要进行模型训练在训练阶段针对预处理时的参数以及深度学习方法的参数进行更 新, 即: 文本嵌入word2vec模型的参数WQ和知识点嵌入的密集层参数WK, 建模学生潜在特质 、 习题难度b、 习题区分度a的深度学习方法的参数本发明实施例 中, 设定目标损失函数为负对数似然函数。 在获取学生的历史习题数据时同样获取了学生 的实际得。
29、分, 一个学生Si在一道习题Qj上的实际得分为rij, 训练阶段, 学生Si在一道习题Qj 上的预测得分为则损失函数为: 0069 0070通过Adam优化器最小化目标损失函数 来训练, 以更新相应参数。 0071 利用训练好的参数, 对于任意一个学生Si和习题Qj, 通过梯度下降算法更新学生Si 在每个知识点上的掌握度, 并且可以利用项目反映理论的二参数模型预测出得分。 0072 通过以上的实施方式的描述, 本领域的技术人员可以清楚地了解到上述实施例可 以通过软件实现, 也可以借助软件加必要的通用硬件平台的方式来实现。 基于这样的理解, 上述实施例的技术方案可以以软件产品的形式体现出来, 该。
30、软件产品可以存储在一个非易 失性存储介质(可以是CD-ROM, U盘, 移动硬盘等)中, 包括若干指令用以使得一台计算机设 备(可以是个人计算机, 服务器, 或者网络设备等)执行本发明各个实施例所述的方法。 0073 以上所述, 仅为本发明较佳的具体实施方式, 但本发明的保护范围并不局限于此, 任何熟悉本技术领域的技术人员在本发明披露的技术范围内, 可轻易想到的变化或替换, 都应涵盖在本发明的保护范围之内。 因此, 本发明的保护范围应该以权利要求书的保护范 围为准。 说明书 5/5 页 9 CN 110377707 A 9 图1 说明书附图 1/1 页 10 CN 110377707 A 10 。
- 内容关键字: 基于 深度 项目 反应 理论 认知 诊断 方法
印章弯曲文本行矫正方法、装置及系统.pdf
电缆切断装置.pdf
可调节板仓.pdf
骨料烘干装置.pdf
防停机落尘的分切机双通道吸尘机构.pdf
高精度垂直升降顶升设备.pdf
电池水冷散热器结构.pdf
手机视频采集器.pdf
不锈钢无缝管接头.pdf
棒料折弯装置.pdf
蔬菜温室大棚温湿度检测装置.pdf
铜合金电缆加工用电缆夹持装置.pdf
电路板检测用定位机构.pdf
具有高可靠性的调浆机输送装置.pdf
储能移动电源分体装置.pdf
药学西药碎药器.pdf
水循环喷淋式旋风分离除尘装置.pdf
龙虾扣检测机.pdf
管道连接的机械密封结构.pdf
多工位钻孔定位机构.pdf
圆筒混料机掘进式清料装置.pdf
低净空安装隔热保冷管托.pdf
PICC导管防压伤连接座.pdf
用于钾肥生产的筛分装置.pdf
基于JDE多任务网络模型的多目标跟踪方法.pdf
基于碳减排的多能源协调优化控制系统及方法.pdf
基于图像分析的工地大气污染物检测方法及相关装置.pdf
挤出机挤出稳定性测试装置.pdf
沉水植物群落生态系统构建方法.pdf
路网生成方法、可读存储介质及智能设备.pdf
路由表维护方法、路径选择方法、设备、系统及存储介质.pdf
照明模组、照明系统及车辆.pdf
种子脱粒辅助机.pdf
全喂入联合收割机用茎杆切碎装置.pdf
一种甜叶菊育苗基质及其制备方法.pdf
一种可用于制作果冻的复合食品胶.pdf
一种玉米自交系新品系的选育方法.pdf
一种高产玉米杂交种的选育方法.pdf
一种高产优质玉米杂交新品种的选育方法.pdf
聚合物纳米水凝胶及其制备方法.pdf
一种便捷的定量倾倒液体的方法及其装置.pdf
一种治疗糖尿病眼病的中药.pdf
一种治疗糖尿病肢端坏死的中药.pdf
一种治疗糖尿病性心脏病的中药.pdf
一种复方罗汉果浸出液及其制备方法和应用.pdf
长寿花的栽培方法.pdf
康乃馨试管种苗移栽基质.pdf
洋桔梗种子催芽的方法.pdf
来自番茄的具有抗氧化和降血脂作用的乳酸菌.pdf
百合栽培基质.pdf
紫罗兰无土栽培基质.pdf