医疗数据的结构化方法、装置、设备及存储介质.pdf
《医疗数据的结构化方法、装置、设备及存储介质.pdf》由会员分享,可在线阅读,更多相关《医疗数据的结构化方法、装置、设备及存储介质.pdf(13页完成版)》请在专利查询网上搜索。
1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 201911358649.X (22)申请日 2019.12.25 (71)申请人 南京医睿科技有限公司 地址 210000 江苏省南京市江北新区浦滨 路211号15层1502室 申请人 南京懿医云大数据科技有限公司 (72)发明人 侯婧刘水清 (74)专利代理机构 北京嘉科知识产权代理事务 所(特殊普通合伙) 11687 代理人 刘力 (51)Int.Cl. G06F 16/22(2019.01) (54)发明名称 一种医疗数据的结构化方法、 装置、 设备及 存储介质 (57)。
2、摘要 本申请提供了一种医疗数据的结构化方法、 装置、 设备及存储介质, 所述方法包括: 获取待结 构化的医疗数据; 根据所述待结构化的医疗数 据、 预设的关键实体和关键实体关系, 生成以所 述关键实体的个数为维度数的实体向量, 以对所 述待结构化的医疗数据进行结构化; 其中, 所述 实体向量的每个维度分别与不同的关键实体具 有对应关系。 本申请基于预设的关键实体和关键 实体关系在待结构化的医疗数据中的出现情况, 生成待结构化的医疗数据对应的实体向量, 实现 医疗数据的结构化, 能够满足各个行业对医疗数 据的应用需求。 权利要求书2页 说明书8页 附图2页 CN 111190902 A 2020。
3、.05.22 CN 111190902 A 1.一种医疗数据的结构化方法, 其特征在于, 该方法包括: 获取待结构化的医疗数据; 根据所述待结构化的医疗数据、 预设的关键实体和关键实体关系, 生成以所述关键实 体的个数为维度数的实体向量, 以对所述待结构化的医疗数据进行结构化; 其中, 所述实体 向量的每个维度分别与不同的关键实体具有对应关系。 2.根据权利要求1所述的方法, 其特征在于, 所述根据所述待结构化的医疗数据、 预设 的关键实体和关键实体关系, 生成以所述关键实体的个数为维度数的实体向量, 包括: 识别所述待结构化的医疗数据中的所述关键实体, 并统计各个关键实体在所述待结构 化的医。
4、疗数据中的出现次数; 识别所述待结构化的医疗数据中是否存在预设至少两个关键实体的关键实体关系, 并 得到各个关键实体关系的识别结果; 基于各个关键实体在所述待结构化的医疗数据中的出现次数, 以及各个关键实体关系 的识别结果, 生成所述待结构化的医疗数据对应的实体向量中各个维度的数值。 3.根据权利要求2所述的方法, 其特征在于, 所述基于各个关键实体在所述待结构化的 医疗数据中的出现次数, 以及各个关键实体关系的识别结果, 生成所述实体向量中各个维 度的数值, 包括: 利用各个关键实体在所述待结构化的医疗数据中的出现次数, 生成所述实体向量中对 应维度的数值; 将识别结果为存在于所述待结构化的。
5、医疗数据中的关键实体关系包括的关键实体, 在 所述实体向量中对应维度的数值乘以预设倍数, 以更新所述实体向量中对应维度的数值。 4.根据权利要求3所述的方法, 其特征在于, 所述利用各个关键实体在所述待结构化的 医疗数据中的出现次数, 生成所述实体向量中对应维度的数值, 包括: 利用各个关键实体在所述待结构化的医疗数据中的出现次数与所属优先等级对应的 权值之间的乘积, 更新所述实体向量中对应维度的数值。 5.根据权利要求1所述的方法, 其特征在于, 所述对所述待结构化的医疗数据进行结构 化之后, 该方法还包括: 对结构化的医疗数据进行聚类处理, 得到划分为多个类别的聚类结果; 将每个聚类结果中。
6、质心对应的医疗数据, 作为样本数据。 6.一种医疗数据的结构化装置, 其特征在于, 该装置包括: 获取模块, 用于获取待结构化的医疗数据; 生成模块, 用于根据所述待结构化的医疗数据、 预设的关键实体和关键实体关系, 生成 以所述关键实体的个数为维度数的实体向量, 以对所述待结构化的医疗数据进行结构化; 其中, 所述实体向量的每个维度分别与不同的关键实体具有对应关系。 7.根据权利要求6所述的装置, 其特征在于, 所述生成模块, 包括: 第一识别子模块, 用于识别所述待结构化的医疗数据中的所述关键实体, 并统计各个 关键实体在所述待结构化的医疗数据中的出现次数; 第二识别子模块, 用于识别所述。
7、待结构化的医疗数据中是否存在预设至少两个关键实 体的关键实体关系, 并得到各个关键实体关系的识别结果; 第一生成子模块, 用于基于各个关键实体在所述待结构化的医疗数据中的出现次数, 权利要求书 1/2 页 2 CN 111190902 A 2 以及各个关键实体关系的识别结果, 生成所述实体向量中各个维度的数值。 8.根据权利要求7所述的装置, 其特征在于, 所述第一生成子模块, 包括: 第二生成子模块, 用于利用各个关键实体在所述待结构化的医疗数据中的出现次数, 生成所述实体向量中对应维度的数值; 更新子模块, 用于将识别结果为存在于所述待结构化的医疗数据中的关键实体关系包 括的关键实体, 在。
8、所述实体向量中对应维度的数值乘以预设倍数, 以更新所述实体向量中 对应维度的数值。 9.一种终端设备, 包括存储器、 处理器以及存储在所述存储器中并可在所述处理器上 运行的计算机程序, 其特征在于, 所述处理器执行所述计算机程序时实现如权利要求1至5 任一项所述的方法。 10.一种计算机可读存储介质, 所述计算机可读存储介质存储有计算机程序, 其特征在 于, 所述计算机程序被处理器执行时实现如权利要求1至5任一项所述的方法。 权利要求书 2/2 页 3 CN 111190902 A 3 一种医疗数据的结构化方法、 装置、 设备及存储介质 技术领域 0001 本发明属于数据处理技术领域, 尤其涉。
9、及一种医疗数据的结构化方法、 装置、 设备 及存储介质。 背景技术 0002 随着互联网技术的不断发展以及医疗行业信息化水平的不断提高, 医疗大数据的 价值体现越来越明显, 医疗大数据能够为医疗、 制药、 保险和研究等提供大量有用信息。 然 而大量的传统医疗信息都是以病历文本形式存在的, 想要有效的利用这些以病历文本形式 存在的医疗数据, 就需要根据具体需求对病历文本形式的医疗数据进行结构化处理。 0003 目前, 如何更好的实现医疗数据的结构化是医疗领域不断探索的问题。 发明内容 0004 有鉴于此, 本发明实施例提供了一种医疗数据的结构化方法、 装置、 设备及存储介 质, 能够实现医疗数据。
10、的结构化, 更好的满足各个行业对医疗数据的应用需求。 0005 第一方面, 本申请提供了一种医疗数据的结构化方法, 所述方法包括: 0006 获取待结构化的医疗数据; 0007 根据所述待结构化的医疗数据、 预设的关键实体和关键实体关系, 生成以所述关 键实体的个数为维度数的实体向量, 以对所述待结构化的医疗数据进行结构化; 其中, 所述 实体向量的每个维度分别与不同的关键实体具有对应关系。 0008 第二方面, 本申请提供了一种医疗数据的结构化装置, 该装置包括: 0009 获取模块, 用于获取待结构化的医疗数据; 0010 生成模块, 用于根据所述待结构化的医疗数据、 预设的关键实体和关键。
11、实体关系, 生成以所述关键实体的个数为维度数的实体向量, 以对所述待结构化的医疗数据进行结构 化; 其中, 所述实体向量的每个维度分别与不同的关键实体具有对应关系。 0011 第三方面, 本申请还提供了一种终端设备, 包括存储器、 处理器以及存储在所述存 储器中并可在所述处理器上运行的计算机程序, 其特征在于, 所述处理器执行所述计算机 程序时实现上述任一项所述的方法。 0012 第四方面, 本申请还提供了一种计算机可读存储介质, 所述计算机可读存储介质 存储有计算机程序, 其特征在于, 所述计算机程序被处理器执行时实现上述任一项所述的 方法。 0013 本发明实施例与现有技术相比存在的有益效。
12、果至少在于: 0014 本申请提供的医疗数据的结构化方法中, 基于预设的关键实体和关键实体关系在 待结构化的医疗数据中的出现情况, 生成待结构化的医疗数据对应的实体向量, 实现医疗 数据的结构化, 能够满足各个行业对医疗数据的应用需求。 说明书 1/8 页 4 CN 111190902 A 4 附图说明 0015 为了更清楚地说明本发明实施例中的技术方案, 下面将对实施例或现有技术描述 中所需要使用的附图作简单地介绍, 显而易见地, 下面描述中的附图仅仅是本发明的一些 实施例, 对于本领域普通技术人员来讲, 在不付出创造性劳动的前提下, 还可以根据这些附 图获得其它的附图。 0016 图1为本。
13、申请实施例提供的一种医疗数据的结构化方法的流程图; 0017 图2为本申请实施例提供的一种样本数据的获取方法的流程图; 0018 图3为本申请实施例提供的一种医疗数据的结构化装置的结构示意图; 0019 图4是本申请实施例提供的一种医疗数据的结构化设备的示意图。 具体实施方式 0020 以下描述中, 为了说明而不是为了限定, 提出了诸如特定系统结构、 技术之类的具 体细节, 以便透彻理解本发明实施例。 然而, 本领域的技术人员应当清楚, 在没有这些具体 细节的其它实施例中也可以实现本发明。 在其它情况中, 省略对众所周知的系统、 装置、 电 路以及方法的详细说明, 以免不必要的细节妨碍本发明的。
14、描述。 0021 为了实现医疗数据的结构化, 本申请提供了一种医疗数据的结构化方法, 具体的, 首先, 获取待结构化的医疗数据; 然后, 根据待结构化的医疗数据、 预设的关键实体和关键 实体关系, 生成以关键实体的个数为维度数的实体向量, 以对待结构化的医疗数据进行结 构化; 其中, 实体向量的每个维度分别与不同的关键实体具有对应关系。 通过上述结构化处 理, 使得医疗数据能够被应用于各个行业。 0022 以下为本申请实施例提供的一种医疗数据的结构化方法, 其中, 本申请实施例提 供的医疗数据的结构化方法可以应用于各种终端, 如台式电脑、 手机、 笔记本电脑、 其他智 能终端等。 0023 参。
15、考图1, 为本申请实施例提供的一种医疗数据的结构化方法的流程图。 0024 该方法具体包括: 0025 S101: 获取待结构化的医疗数据。 0026 本申请实施例中, 待结构化的医疗数据可以为以病历文本形式存在的医疗数据。 0027 以如下的以病历文本形式存在的医疗数据1作为待结构化的医疗数据为例, 包括: 0028 入室, 全麻后, 取仰卧位, 常规消毒, 铺单。 经口置支撑喉镜, 沿舌背正中送入, 越过 舌根, 挑起会厌, 连接支架, 暴露会厌, 查见会厌舌面有乳头状新生物, 大小约1.0*0.6* 0.6cm, 表浅, 广基, 分次钳除尽新生物, 棉球压迫止血, 查无病变残留, 无活动。
16、性出血。 退出 喉镜。 术毕。 标本留送病检。 手术顺利, 麻醉满意, 术中出血少, 病人*后安返病房。 0029 S102: 根据所述待结构化的医疗数据、 预设的关键实体和关键实体关系, 生成以所 述关键实体的个数为维度数的实体向量, 以对所述待结构化的医疗数据进行结构化; 其中, 所述实体向量的每个维度分别与不同的关键实体具有对应关系。 0030 本申请实施例中, 可以根据对医疗数据的应用需求, 预先设置关键实体。 其中, 关 键实体是指与应用需求强相关的名词。 例如, 假设对医疗数据的应用需求为向癌症研究提 供病历文本的样本, 则可以将关键实体设置为癌症、 化疗、 手术等与应用需求强相关。
17、的名 词。 另外, 也可以通过遍历医疗数据的方式设置满足应用需求的关键实体。 具体的, 本申请 说明书 2/8 页 5 CN 111190902 A 5 实施例对于设置关键实体的方法不做限定。 0031 以上述医疗数据1为例, 假设对医疗数据1的应用需求为某种疾病方向的医学研 究, 则可以为上述医疗数据1设置关键实体为:“支撑喉镜” 、“会厌” 、“新生物” 、“钳除” 和 “病 检” 等与医学研究方向相关的医学名词。 0032 另外, 本申请实施例在设置关键实体之后, 基于关键实体预先设置关键实体关系。 其中, 关键实体关系用于表示任意两个或多个关键实体具有特定关系。 实际应用中, 可以将 。
18、医疗数据中属于同一个句子的关键实体确定为关键实体关系, 或者可以将医疗数据中属于 同一个段落的关键实体确定为关键实体关系。 具体的, 本申请实施例对于设置关键实体关 系的方法不做限制。 0033 以上述医疗数据1为例, 可以将上述医疗数据1中的 “支撑喉镜” 和 “新生物” 两个关 键实体确定为一个关键实体关系。 0034 本申请实施例中, 在确定关键实体之后, 为了实现对医疗数据的结构化, 可以基于 关键实体, 生成以关键实体的个数为维度数的实体向量, 用于表示对应的医疗数据, 实现对 该医疗数据的结构化。 具体的, 生成的实体向量的每个维度分别与不同的关键实体具有对 应关系。 0035 以。
19、上述医疗数据1为例, 由于预设的关键实体包括:“支撑喉镜” 、“会厌” 、“新生 物” 、“钳除” 和 “病检” , 共5个医学名词, 因此, 可以为上述医疗数据1建立一个5维向量, 初始 值为0, 0, 0, 0, 0。 其中, 5维向量的每个维度分别与 “支撑喉镜” 、“会厌” 、“新生物” 、“钳除” 和 “病检” 具有对应关系。 0036 实际应用中, 实体向量中每个维度的数值是根据待结构化的医疗数据中关键实体 和关键实体关系的出现情况生成。 0037 一种可选的实施方式中, 首先, 识别待结构化的医疗数据中的关键实体, 并统计各 个关键实体在待结构化的医疗数据中的出现次数。 然后, 。
20、识别待结构化的医疗数据中是否 存在关键实体关系, 并得到各个关键实体关系的识别结果。 最终, 基于各个关键实体在待结 构化的医疗数据中的出现次数, 以及各个关键实体关系的识别结果, 生成待结构化的医疗 数据对应的实体向量中各个维度的数值。 0038 具体的, 利用各个关键实体在待结构化的医疗数据中的出现次数, 生成待结构化 的医疗数据对应的实体向量中对应维度的数值。 将识别结果为存在于待结构化的医疗数据 中的关键实体关系包括的关键实体, 在该实体向量中对应维度的数值乘以预设倍数, 以更 新该实体向量中对应维度的数值。 0039 以上述医疗数据1为例, 通过遍历上述医疗数据1的方式, 可以确定关。
21、键实体 “会 厌” 出现的次数为3次,“新生物” 出现的次数为2次,“支撑喉镜” 、“钳除” 和 “病检” 各出现的 次数为1次, 则可以基于各个关键实体的出现次数, 对上述医疗数据1对应的向量0, 0, 0, 0, 0中对应维度的数值进行更新, 得到实体向量3, 2, 1, 1, 1, 其中, 该实体向量的各个维度 依次与关键实体 “会厌” 、“新生物” 、“支撑喉镜” 、“钳除” 和 “病检” 具有一对一的对应关系, 并且对应维度的数值分别为对应的关键实体在上述医疗数据1中出现的次数。 0040 另外, 对于关键实体关系 “支撑喉镜” 和 “新生物” , 由于该关键实体关系的识别结 果为存。
22、在于上述医疗数据1中, 因此, 将该关键实体关系中包括的关键实体 “支撑喉镜” 和 “新生物” 分别在实体向量中的对应维度的数值乘以预设倍数, 如预设倍数为2, 则得到实体 说明书 3/8 页 6 CN 111190902 A 6 向量3, 4, 2, 1, 1。 0041 由于不同的关键实体对于不同的应用需求的重要性可能不同, 因此, 本申请实施 例可以基于应用需求为各个关键实体设置优先级关系, 然后为属于不同优先等级的关键实 体分别设置权值。 其中, 优先级较高的关键实体的权值高于优先级较低的关键实体, 从而增 加优先级较高的关键实体在多维向量中的特征体现。 0042 一种可选的实施方式中。
23、, 利用各个关键实体在待结构化的医疗数据中的出现次数 与所属优先等级对应的权值之间的乘积, 生成待结构化的医疗数据的实体向量中对应维度 的数值。 0043 以上述医疗数据1为例, 假设各个关键实体的优先级关系为 “支撑喉镜” “会厌” “新生物” “钳除” “病检” , 则为关键实体 “会厌” 、“新生物” 、“支撑喉镜” 、“钳除” 和 “病 检” 分别设置的权值为 “0.5” 、“0.4” 、“0.3” 、“0.2” 和 “0.1” 。 假设关键实体 “会厌” 出现的次 数为3次,“新生物” 出现的次数为2次,“支撑喉镜” 、“钳除” 和 “病检” 各出现的次数为1次, 则 将各个关键实体。
24、的出现次数与对应的权值之间的乘积, 生成待结构化的医疗数据的实体向 量中对应维度的数值, 即得到实体向量3*0.5, 2*0.4, 1*0.3, 1*0.2, 1*0.1。 0044 一种可选的实施方式中, 本申请实施例可以统计各个关键实体关系在待结构化的 医疗数据中的出现次数, 在待结构化的医疗数据中出现的次数越多的关键实体关系的重要 程度越高。 因此, 本申请实施例还可以基于各个关键实体关系在待结构化的医疗数据中出 现的次数, 对待结构化的医疗数据中对应的实体向量中的数值进行更新。 以关键实体1与关 键实体2构成具有预设关系的关键实体关系1, 以及关键实体3与关键实体4构成具有预设关 系的。
25、关键实体关系2为例, 假设关键实体关系1出现的次数10大于关键实体关系2出现的次 数3, 则可以为实体向量中关键实体关系1包括的关键实体1和2分别对应的维度的数值乘以 10, 而为关键实体关系2包括的关键实体3和4分别对应的维度的数值乘以3。 0045 本申请实施例提供的医疗数据的结构化方法中, 基于预设的关键实体和关键实体 关系在待结构化的医疗数据中的出现情况, 生成待结构化的医疗数据对应的实体向量, 实 现医疗数据的结构化, 能够满足各个行业对医疗数据的应用需求。 0046 实际应用中, 对医疗数据的应用通常是基于医疗样本数据实现的, 因此, 在应用医 疗数据之前, 需要从海量的医疗数据中。
26、获取样本数据。 通常, 在病历库的个体特征分布比较 均匀时, 随机抽样一般能够获得良好代表性的研究样本。 但是, 在实际应用中, 往往某一重 要研究因素在病历库中分布相当不均匀, 随机抽样很容易导致选择偏倚, 遗漏一些比较重 要但是占比又比较少的个体, 并且有效代表性样本偏少, 最终影响样本抽取结果的准确性。 0047 为此, 本申请可以基于医疗数据的应用需求, 利用上述医疗数据的结构化方法对 医疗数据进行结构化, 得到医疗数据的实体向量。 由于实体向量能够对医疗数据的特征进 行表示, 因此, 本申请实施例可以基于医疗数据的实体向量进行样本数据的获取, 使得获取 到的样本数据能够满足医疗数据的。
27、应用需求。 0048 为此, 本申请实施例在上述医疗数据的结构化方法的基础上, 提供了一种样本数 据的获取方法, 参考图2, 为本申请实施例提供的一种样本数据的获取方法流程图, 该方法 包括: 0049 S201: 获取待结构化的医疗数据。 0050 其中, 待结构化的医疗数据可以为从病历库中抽取的多个样本; 如, 可以为不同种 说明书 4/8 页 7 CN 111190902 A 7 类的病中抽取的多个病历本, 将多个不同种类病种的多个病历作为都待结构化的医疗数 据, 从而根据本发明提供的方法将从中抽取高质量有代表性的样本。 0051 S202: 根据所述待结构化的医疗数据、 预设的关键实体。
28、和关键实体关系, 生成以所 述关键实体的个数为维度数的实体向量, 以对所述待结构化的医疗数据进行结构化; 其中, 所述实体向量的每个维度分别与不同的关键实体具有对应关系。 0052 其中, 预设的关键实体和关键实体关系可以为根据研究方向, 研究员预先定义的 关键实体和关键实体关系。 0053 对于S201和S202可参考上述实施例中的S101和S102进行理解, 相同之处在此不再 赘述。 0054 S203: 对结构化的医疗数据进行聚类处理, 得到划分为多个类别的聚类结果。 0055 本申请实施例中, 在对各个医疗数据进行结构化之后, 得到各个医疗数据的实体 向量, 为了实现样本数据的获取, 。
29、首先, 对各个医疗数据的实体向量进行聚类处理, 以便将 各个医疗数据的实体向量划分为多个类别, 其中, 属于同一个类别的实体向量对应的医疗 数据之间具有较高的相似度, 相反的, 属于不同类别的实体向量对应的医疗数据之间具有 较大的差异性。 0056 具体的, 目前的聚类方法较多, 如层次聚类法、 DBSCAN密度法等, 本申请对具体的 聚类方式不做限定。 0057 一种可选的实施方式中, 由于K-Means划分法可以通过定义其中的参数K的方式, 指定将医疗数据划分成的类别个数。 例如定义参数K为30, 则说明指定医疗数据划分成30个 类别。 因此, 本申请实施例可以利用K-Means划分法, 。
30、对医疗数据的实体向量进行聚类处理, 得到划分为K个类别的实体向量。 0058 S204: 将每个聚类结果中质心对应的医疗数据, 作为样本数据。 0059 由于属于同一个类别的实体向量对应的医疗数据之间具有较高的相似度, 而属于 不同类别的实体向量对应的医疗数据之间具有较大的差异性。 为了保证样本数据获取的多 样性, 本申请实施例可以从不同的类别中分别抽取到对应的样本数据。 0060 一种可选的实施方式中, 利用K-Means划分法得到划分为K个类别的实体向量之 后, 由于每个类别的质心对应的实体向量为对应类别中最能够代表该类别的实体向量, 因 此, 本申请实施例可以确定划分为K个类别的实体向量。
31、中每个类别的质心对应的实体向量, 并将该实体向量确定为对应类型的样本数据, 能够让每个类别的样本都出现, 避免出现由 于样本分布不均而遗漏有效样本的情况, 同时避免了大量无效样本的出现, 以提高后续对 获取的样本数据应用的准确性, 提高基于提取的样本进行疾病研究的效率。 0061 本申请实施例提供的样本数据获取方法中, 基于对医疗数据进行结构化得到的实 体向量, 对医疗数据进行聚类处理, 然后从聚类处理后得到的各个类别中分别确定样本数 据, 完成样本数据的获取。 本申请实施例能够保证的样本数据获取的多样性, 避免遗漏一些 比较重要但占比又较少的个体。 0062 应理解, 上述实施例中各步骤的序。
32、号的大小并不意味着执行顺序的先后, 各过程 的执行顺序应以其功能和内在逻辑确定, 而不应对本发明实施例的实施过程构成任何限 定。 0063 基于上述方法实施例, 本申请还提供了一种医疗数据的结构化装置, 参考图3, 为 说明书 5/8 页 8 CN 111190902 A 8 本申请实施例提供的一种医疗数据的结构化装置的结构示意图, 所述装置包括: 0064 获取模块301, 用于获取待结构化的医疗数据; 0065 生成模块302, 用于根据所述待结构化的医疗数据、 预设的关键实体和关键实体关 系, 生成以所述关键实体的个数为维度数的实体向量, 以对所述待结构化的医疗数据进行 结构化; 其中,。
33、 所述实体向量的每个维度分别与不同的关键实体具有对应关系。 0066 一种可选的实施方式中, 所述生成模块, 包括: 0067 第一识别子模块, 用于识别所述待结构化的医疗数据中的所述关键实体, 并统计 各个关键实体在所述待结构化的医疗数据中的出现次数; 0068 第二识别子模块, 用于识别所述待结构化的医疗数据中是否存在预设至少两个关 键实体的关键实体关系, 并得到各个关键实体关系的识别结果; 0069 第一生成子模块, 用于基于各个关键实体在所述待结构化的医疗数据中的出现次 数, 以及各个关键实体关系的识别结果, 生成所述实体向量中各个维度的数值。 0070 另一种可选的实施方式中, 所述。
34、第一生成子模块, 包括: 0071 第二生成子模块, 用于利用各个关键实体在所述待结构化的医疗数据中的出现次 数, 生成所述实体向量中对应维度的数值; 0072 更新子模块, 用于将识别结果为存在于所述待结构化的医疗数据中的关键实体关 系包括的关键实体, 在所述实体向量中对应维度的数值乘以预设倍数, 以更新所述实体向 量中对应维度的数值。 0073 本申请实施例提供的医疗数据的结构化装置, 基于预设的关键实体和关键实体关 系在待结构化的医疗数据中的出现情况, 生成待结构化的医疗数据对应的实体向量, 实现 医疗数据的结构化, 能够满足各个行业对医疗数据的应用需求。 0074 基于上述实施例, 本。
35、申请还提供了一种医疗数据的结构化设备, 参考图4, 为本申 请实施例提供的一种医疗数据的结构化终端设备的示意图。 如图4所示, 该实施例的终端设 备4包括: 处理器40、 存储器41以及存储在存储器41中并可在处理器40上运行的计算机程序 42。 处理器40执行计算机程序42时实现上述各个医疗数据的结构化方法实施例中的步骤, 例如图1所示的步骤S101至步骤S102。 0075 示例性的, 计算机程序42可以被分割成一个或多个模块/单元, 一个或者多个模 块/单元被存储在存储器41中, 并由处理器40执行, 以完成本发明。 一个或多个模块/单元可 以是能够完成特定功能的一系列计算机程序指令段,。
36、 该指令段用于描述计算机程序42在终 端设备4中的执行过程。 0076 终端设备4可以是桌上型计算机、 笔记本、 掌上电脑及云端服务器等计算设备。 终 端设备4可包括, 但不仅限于, 处理器40、 存储器41。 本领域技术人员可以理解, 图4仅仅是终 端设备4的示例, 并不构成对终端设备4的限定, 可以包括比图示更多或更少的部件, 或者组 合某些部件, 或者不同的部件, 例如终端设备4还可以包括输入输出设备、 网络接入设备、 总 线等。 0077 处理器40可以是中央处理单元(Central Processing Unit, CPU), 还可以是其它 通用处理器、 数字信号处理器(Digita。
37、l Signal Processor, DSP)、 专用集成电路 (Application Specific Integrated Circuit, ASIC)、 现场可编程门阵列(Field- Programmable Gate Array, FPGA)或者其它可编程逻辑器件、 分立门或者晶体管逻辑器件、 说明书 6/8 页 9 CN 111190902 A 9 分立硬件组件等。 通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器 等。 0078 存储器41可以是终端设备4的内部存储单元, 例如终端设备4的硬盘或内存。 存储 器41也可以是终端设备4的外部存储设备, 例如终端设备4。
38、上配备的插接式硬盘, 智能存储 卡(Smart Media Card,SMC), 安全数字(Secure Digital,SD)卡, 闪存卡(Flash Card)等。 进一步地, 存储器41还可以既包括终端设备4的内部存储单元也包括外部存储设备。 存储器 41用于存储计算机程序以及终端设备4所需的其它程序和数据。 存储器41还可以用于暂时 地存储已经输出或者将要输出的数据。 0079 所属领域的技术人员可以清楚地了解到, 为了描述的方便和简洁, 仅以上述各功 能单元、 模块的划分进行举例说明, 实际应用中, 可以根据需要而将上述功能分配由不同的 功能单元、 模块完成, 即将装置的内部结构划分。
39、成不同的功能单元或模块, 以完成以上描述 的全部或者部分功能。 实施例中的各功能单元、 模块可以集成在一个处理单元中, 也可以是 各个单元单独物理存在, 也可以两个或两个以上单元集成在一个单元中, 上述集成的单元 既可以采用硬件的形式实现, 也可以采用软件功能单元的形式实现。 另外, 各功能单元、 模 块的具体名称也只是为了便于相互区分, 并不用于限制本申请的保护范围。 上述系统中单 元、 模块的具体工作过程, 可以参考前述方法实施例中的对应过程, 在此不再赘述。 0080 在上述实施例中, 对各个实施例的描述都各有侧重, 某个实施例中没有详述或记 载的部分, 可以参见其它实施例的相关描述。 。
40、0081 本领域普通技术人员可以意识到, 结合本文中所公开的实施例描述的各示例的单 元及算法步骤, 能够以电子硬件、 或者计算机软件和电子硬件的结合来实现。 这些功能究竟 以硬件还是软件方式来执行, 取决于技术方案的特定应用和设计约束条件。 专业技术人员 可以对每个特定的应用来使用不同方法来实现所描述的功能, 但是这种实现不应认为超出 本发明的范围。 0082 在本发明所提供的实施例中, 应该理解到, 所揭露的装置/终端设备和方法, 可以 通过其它的方式实现。 例如, 以上所描述的装置/终端设备实施例仅仅是示意性的, 例如, 模 块或单元的划分, 仅仅为一种逻辑功能划分, 实际实现时可以有另外。
41、的划分方式, 例如多个 单元或组件可以结合或者可以集成到另一个系统, 或一些特征可以忽略, 或不执行。 另一 点, 所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口, 装置或 单元的间接耦合或通讯连接, 可以是电性, 机械或其它的形式。 0083 作为分离部件说明的单元可以是或者也可以不是物理上分开的, 作为单元显示的 部件可以是或者也可以不是物理单元, 即可以位于一个地方, 或者也可以分布到多个网络 单元上。 可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。 0084 另外, 在本发明各个实施例中的各功能单元可以集成在一个处理单元中, 也可以 是各个单。
42、元单独物理存在, 也可以两个或两个以上单元集成在一个单元中。 上述集成的单 元既可以采用硬件的形式实现, 也可以采用软件功能单元的形式实现。 0085 集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用 时, 可以存储在一个计算机可读取存储介质中。 基于这样的理解, 本发明实现上述实施例方 法中的全部或部分流程, 也可以通过计算机程序来指令相关的硬件来完成, 计算机程序可 存储于一计算机可读存储介质中, 该计算机程序在被处理器执行时, 可实现上述各个方法 说明书 7/8 页 10 CN 111190902 A 10 实施例的步骤。 其中, 计算机程序包括计算机程序代码, 计。
43、算机程序代码可以为源代码形 式、 对象代码形式、 可执行文件或某些中间形式等。 计算机可读介质可以包括: 能够携带计 算机程序代码的任何实体或装置、 记录介质、 U盘、 移动硬盘、 磁碟、 光盘、 计算机存储器、 只 读存储器(ROM, Read-Only Memory)、 随机存取存储器(RAM, Random Access Memory)、 电载 波信号、 电信信号以及软件分发介质等。 需要说明的是, 计算机可读介质包含的内容可以根 据司法管辖区内立法和专利实践的要求进行适当的增减, 例如在某些司法管辖区, 根据立 法和专利实践, 计算机可读介质不包括电载波信号和电信信号。 0086 以上所述实施例仅用以说明本发明的技术方案, 而非对其限制; 尽管参照前述实 施例对本发明进行了详细的说明, 本领域的普通技术人员应当理解: 其依然可以对前述各 实施例所记载的技术方案进行修改, 或者对其中部分技术特征进行等同替换; 而这些修改 或者替换, 并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围, 均应 包含在本发明的保护范围之内。 说明书 8/8 页 11 CN 111190902 A 11 图1 图2 说明书附图 1/2 页 12 CN 111190902 A 12 图3 图4 说明书附图 2/2 页 13 CN 111190902 A 13 。
- 内容关键字: 医疗 数据 结构 方法 装置 设备 存储 介质
废弃物焚烧装置.pdf
板框过滤器.pdf
建筑外立面绿化安装架.pdf
防反抽气动快速接头.pdf
适用于线末自动装框的上下料运输系统.pdf
地下水灌溉农业深度节水装置.pdf
耐磨板堆焊冷却平台装置.pdf
晶圆承载装置.pdf
预应力混凝土管桩模具用打磨装置.pdf
煤粉制备系统.pdf
适用不同飞机机型的垂尾维修平台.pdf
散热器侧板的管孔冲压机.pdf
风力输送撒盐系统.pdf
高效率的清废装置及专用吸头组件.pdf
化工污水处理装置.pdf
各向异性微滤膜及其制备方法和应用.pdf
稳定面可调的盾构管片拼装方位检测装置.pdf
异构双模冗余定时器、芯片以及车辆.pdf
静轴肩穿透焊搅拌头.pdf
颈动脉斑块易损性分级方法、装置、电子设备及存储介质.pdf
基于计算机视觉的自动化点云定向方法、设备及存储介质.pdf
婴童奶制品核心营养成分的膜分离重组方法及其应用.pdf
安全生产的双重预防管理方法、系统、设备及存储介质.pdf
用于滤波器的浮点数据处理系统.pdf
易调平的冲压设备工作台及冲压设备.pdf
车辆的相机位姿确定方法、装置、计算机设备和存储介质.pdf
钢厂板坯智能倒垛方法与系统.pdf
纱线捻线机.pdf
用于配电柜的操作机器人的分体式地刀结构.pdf
双核设备的数据处理方法和双核设备.pdf
氮化硼钝化增强的砷化镓基半导体器件及其制备方法.pdf
网络模型的转换方法、装置、终端及计算机可读存储介质.pdf
空调器室内机.pdf
空调器的控制方法、空调器的控制装置和空调器.pdf
对扣式智能全自动除垢器及除垢方法.pdf
搜索结果的展现方法和装置.pdf
空调器室内机.pdf
防油烟机油烟氧化结垢的方法.pdf
机载惯性/卫星组合导航系统的自适应滤波方法与滤波器.pdf
一种低背压的滚动活塞类制冷压缩机.pdf
屏幕升降结构.pdf
换热器及其连接方法.pdf
一种获取虚拟机USB存储设备使用情况的方法.pdf
终端的唤醒装置、唤醒方法及终端.pdf
一种显示处理方法及终端.pdf
空调器室内机.pdf
一种身份和证明文件的综合验证系统及方法.pdf
一种基于X86平台VXWORKS操作系统的快速启动优化方法.pdf
一种应用混合现实技术的多人合作训练系统.pdf
一种运用M_BUS总线进行模块程序烧录的方法及装置.pdf
一种多用途步进式驱动装置.pdf