药品的归类方法、装置以及计算机设备.pdf

上传人:刘** 文档编号:10211364 上传时间:2021-06-11 格式:PDF 页数:19 大小:645.95KB
收藏 版权申诉 举报 下载
药品的归类方法、装置以及计算机设备.pdf_第1页
第1页 / 共19页
药品的归类方法、装置以及计算机设备.pdf_第2页
第2页 / 共19页
药品的归类方法、装置以及计算机设备.pdf_第3页
第3页 / 共19页
文档描述:

《药品的归类方法、装置以及计算机设备.pdf》由会员分享,可在线阅读,更多相关《药品的归类方法、装置以及计算机设备.pdf(19页完成版)》请在专利查询网上搜索。

1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202010888451.9 (22)申请日 2020.08.28 (71)申请人 平安医疗健康管理股份有限公司 地址 200000 上海市黄浦区北京东路666号 H区 (东座) 12G室 (72)发明人 操文彬 (74)专利代理机构 深圳市明日今典知识产权代 理事务所(普通合伙) 44343 代理人 王杰辉曹勇 (51)Int.Cl. G06F 16/35(2019.01) G06K 9/62(2006.01) (54)发明名称 药品的归类方法、 装置以及计算机设备 (57)摘。

2、要 本发明提供了一种药品的归类方法、 装置以 及计算机设备, 其中方法, 包括: 获取医院的数据 库内各药品的数据信息; 根据所述药品的数据信 息对所述药品进行预分类; 将所述药品的数据信 息依次发送给对应的标准化处理模型进行标准 化处理, 得到各个药品经标准化处理后的药品信 息; 根据所述标准化处理后的药品信息, 在所述 标准数据库中将各药品进行归类处理。 本发明的 有益效果: 通过上述的药品归类方法, 可以完成 自纠自查的前期准备工作, 使每个药品的药品信 息都进行了标准化, 减少了自纠自查的工作中, 要对医院数据库中的各个药品进行重新编码比 对的大量人力投入, 降低了对码工作的耗时, 以。

3、 及人为对码所产生的误差。 权利要求书3页 说明书12页 附图3页 CN 112035664 A 2020.12.04 CN 112035664 A 1.一种药品的归类方法, 其特征在于, 包括: 获取医院的数据库内各药品的数据信息; 根据所述药品的数据信息对所述药品进行预分类; 根据预分类结果将所述药品的数据信息, 编入至对应类别的消息队列中; 按照所述消息队列的类别, 将所述消息队列上的所述药品的数据信息依次发送给对应 的标准化处理模型进行标准化处理, 得到各个药品经标准化处理后的药品信息; 其中, 所述 标准化处理模型基于在各个医院预先采集各药品的数据信息, 以及与所述药品数据信息相 关。

4、联的标准化药品信息组成的样本数据训练而成; 根据所述标准化处理后的药品信息, 在所述标准数据库中将各药品进行归类处理。 2.如权利要求1所述的药品的归类方法, 其特征在于, 所述按照所述消息队列的类别, 将所述消息队列上的所述药品的数据信息依次发送给对应的标准化处理模型进行标准化 处理, 得到各个药品经标准化处理后的药品信息的步骤, 包括: 根据所述消息队列中所携带的每个所述药品的数据信息, 获取每个药品对应的属性, 并将所述属性进行向量化, 得到属性特征向量的多维坐标X(x1, x2, , xi, , xn); 根据公式计算所述属性特征向量与每个预存向 量之间的匹配度; 其中, 所述Y是预存。

5、数据库中各预存向量的多维坐标, Y(y1, y2, , yi, , yn), xi表示属性特征向量中第i个属性所对应的坐标, yi表示预存向量中第i个属性 所对应的坐标, si为第i个属性所对应的系数; 根据与每个预存向量的匹配度, 得到各个药品所对应的目标预存向量, 将所述目标预 存向量所对应的药品信息赋予至对应的所述药品上。 3.如权利要求1所述的药品的归类方法, 其特征在于, 所述按照所述消息队列的类别, 将所述消息队列上的所述药品的数据信息依次发送给对应的标准化处理模型进行标准化 处理, 得到各个药品经标准化处理后的药品信息的步骤, 包括: 获取所述医院数据库内的第一药品数目, 以及获。

6、取各消息队列中所包含的第二药品数 目; 计算各第二药品数目所占第一药品数目的比例值; 判断各比例值中是否具有小于预设比例值的目标比例值; 若具有, 则将所述目标比例值所对应的标准化处理模型, 在处理完毕对应的消息队列 上的药品的数据信息后, 获取目标标准化处理模型的处理参数数据; 其中所述目标标准化 处理模型为除目标比例值所对应的标准化处理模型之外的其他标准化处理模型中的一种; 根据获取所述目标标准化处理模型的处理参数数据, 接收所述目标标准化处理模型对 应的消息队列中未处理的药品的数据信息并进行处理。 4.如权利要求1所述的药品的归类方法, 其特征在于, 所述根据所述药品的数据信息对 所述药。

7、品进行预分类的步骤, 包括: 获取所述药品的类别信息, 并将所述类别信息进行向量化, 得到对应所述药品的第一 向量; 根据公式计算所述第一向量与各消息 权利要求书 1/3 页 2 CN 112035664 A 2 队列对应的第二向量的相似度; 其中, 所述表示第一向量, 所述表示第二向量; 根据所述相似度与各个消息队列预设的相似度阈值进行比较; 根据比较结果将所述药品以及所述药品的数据信息编入对应的所述消息队列。 5.如权利要求4所述的药品的归类方法, 其特征在于, 所述获取所述药品的类别信息, 并将所述类别信息进行向量化, 得到对应所述药品的第一向量的步骤, 包括: 对所述药品的数据信息进行。

8、预处理; 所述预处理包括根据所述特殊字符标识库剔除所 述问题中的标点符号、 统一语种、 删除不相关词句, 所述不相关词句包括问候语和形容词; 根据BERT中文训练模型读取数据集的文本数据, 并通过fine-tuning的方式对所述文 本数据进行分词; 通过语义识别技术对分词后的所述文本数据进行识别, 并提取其中的类别关键词, 将 所述类别关键词作为所述类别信息进行获取。 6.如权利要求1所述的药品的归类方法, 其特征在于, 所述根据所述标准化处理后的药 品信息, 在所述标准数据库中将各药品进行归类处理的步骤, 包括: 建立TOKEN列表, 并为每个所述药品赋予一个TOKEN标签; 获取每个所述。

9、药品的所述标准化处理后的药品信息, 并将所述标准化处理后的药品信 息附着于对应的所述TOKEN标签上, 形成药品标签; 将所述药品标签输入至标准数据库中, 并根据所述药品标签进行归类处理。 7.如权利要求1所述的药品的归类方法, 其特征在于, 所述按照所述消息队列的类别, 将所述消息队列上的所述药品的数据信息依次发送给对应的标准化处理模型进行标准化 处理, 得到各个药品经标准化处理后的药品信息的步骤之前, 还包括: 获取各个医院的各药品的数据信息, 以及与各药品相关联的标准化药品信息的样本数 据; 根据所述消息队列的类别信息, 将各药品对应的样本数据划分为多个不同类别的样本 数据; 基于不同类。

10、别的样本数据训练对应的标准化处理模型。 8.一种药品归类装置, 其特征在于, 包括: 数据信息获取模块, 用于获取医院的数据库内各药品的数据信息; 药品预分类模块, 用于根据所述药品的数据信息对所述药品进行预分类; 药品编入模块, 用于根据预分类结果将所述药品的数据信息, 编入至对应类别的消息 队列中; 标准化处理模块, 用于按照所述消息队列的类别, 将所述消息队列上的所述药品的数 据信息依次发送给对应的标准化处理模型进行标准化处理, 得到各个药品经标准化处理后 的药品信息; 其中, 所述标准化处理模型基于在各个医院预先采集各药品的数据信息, 以及 与所述药品数据信息相关联的标准化药品信息组成。

11、的样本数据训练而成; 归类模块, 用于根据所述标准化处理后的药品信息, 在所述标准数据库中将各药品进 行归类处理。 9.一种计算机设备, 包括存储器和处理器, 所述存储器存储有计算机程序, 其特征在 于, 所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。 10.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机程序 权利要求书 2/3 页 3 CN 112035664 A 3 被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。 权利要求书 3/3 页 4 CN 112035664 A 4 药品的归类方法、 装置以及计算机设备 技术领域 0。

12、001 本发明涉及医疗科技领域, 特别涉及一种药品的归类方法、 装置以及计算机设备。 背景技术 0002 在自纠自查的工作过程中, 由于各地医保局或医院的信息化程度良莠不齐, 导致 药品的三目录编码混乱, 且不易管理和维护。 由于自查自纠工作的周期短、 任务重、 工作量 大, 如果耗费过多的时间在对药品进行人工对码的工作上, 会耗费大量的时间。 因此, 亟需 一种药品的归类方法来实现对药品的自动对码。 发明内容 0003 本发明的主要目的为提供一种药品的归类方法、 装置以及计算机设备, 旨在解决 对药品进行人工对码需要耗费大量时间的问题。 0004 本发明提供了一种药品的归类方法, 包括: 0。

13、005 获取医院的数据库内各药品的数据信息; 0006 根据所述药品的数据信息对所述药品进行预分类; 0007 根据预分类结果将所述药品的数据信息, 编入至对应类别的消息队列中; 0008 按照所述消息队列的类别, 将所述消息队列上的所述药品的数据信息依次发送给 对应的标准化处理模型进行标准化处理, 得到各个药品经标准化处理后的药品信息; 其中, 所述标准化处理模型基于在各个医院预先采集各药品的数据信息, 以及与所述药品数据信 息相关联的标准化药品信息组成的样本数据训练而成; 0009 根据所述标准化处理后的药品信息, 在所述标准数据库中将各药品进行归类处 理。 0010 进一步地, 所述按照。

14、所述消息队列的类别, 将所述消息队列上的所述药品的数据 信息依次发送给对应的标准化处理模型进行标准化处理, 得到各个药品经标准化处理后的 药品信息的步骤, 包括: 0011 根据所述消息队列中所携带的每个所述药品的数据信息, 获取每个药品对应的属 性, 并将所述属性进行向量化, 得到属性特征向量的多维坐标X(x1, x2, , xi, , xn); 0012根据公式计算所述属性特征向量与每个预 存向量之间的匹配度; 其中, 所述Y是预存数据库中各预存向量的多维坐标, Y(y1, y2, , yi, , yn), xi表示属性特征向量中第i个属性所对应的坐标, yi表示预存向量中第i个属性 所对。

15、应的坐标, si为第i个属性所对应的系数; 0013 根据与每个预存向量的匹配度, 得到各个药品所对应的目标预存向量, 将所述目 标预存向量所对应的药品信息赋予至对应的所述药品上。 0014 进一步地, 所述按照所述消息队列的类别, 将所述消息队列上的所述药品的数据 信息依次发送给对应的标准化处理模型进行标准化处理, 得到各个药品经标准化处理后的 说明书 1/12 页 5 CN 112035664 A 5 药品信息的步骤, 包括: 0015 获取所述医院数据库内的第一药品数目, 以及获取各消息队列中所包含的第二药 品数目; 0016 计算各第二药品数目所占第一药品数目的比例值; 0017 判断。

16、各比例值中是否具有小于预设比例值的目标比例值; 0018 若具有, 则将所述目标比例值所对应的标准化处理模型, 在处理完毕对应的消息 队列上的药品的数据信息后, 获取目标标准化处理模型的处理参数数据; 其中所述目标标 准化处理模型为除目标比例值所对应的标准化处理模型之外的其他标准化处理模型中的 一种; 0019 根据获取所述目标标准化处理模型的处理参数数据, 接收所述目标标准化处理模 型对应的消息队列中未处理的药品的数据信息并进行处理。 0020 进一步地, 所述根据所述药品的数据信息对所述药品进行预分类的步骤, 包括: 0021 获取所述药品的类别信息, 并将所述类别信息进行向量化, 得到对。

17、应所述药品的 第一向量; 0022根据公式计算所述第一向量与各 消息队列对应的第二向量的相似度; 其中, 所述表示第一向量, 所述表示第二向量; 0023 根据所述相似度与各个消息队列预设的相似度阈值进行比较; 0024 根据比较结果将所述药品以及所述药品的数据信息编入对应的所述消息队列。 0025 进一步地, 所述获取所述药品的类别信息, 并将所述类别信息进行向量化, 得到对 应所述药品的第一向量的步骤, 包括: 0026 对所述药品的数据信息进行预处理; 所述预处理包括根据所述特殊字符标识库剔 除所述问题中的标点符号、 统一语种、 删除不相关词句, 所述不相关词句包括问候语和形容 词; 0。

18、027 根据BERT中文训练模型读取数据集的文本数据, 并通过fine-tuning的方式对所 述文本数据进行分词; 0028 通过语义识别技术对分词后的所述文本数据进行识别, 并提取其中的类别关键 词, 将所述类别关键词作为所述类别信息进行获取。 0029 进一步地, 所述根据所述标准化处理后的药品信息, 在所述标准数据库中将各药 品进行归类处理的步骤, 包括: 0030 建立TOKEN列表, 并为每个所述药品赋予一个TOKEN标签; 0031 获取每个所述药品的所述标准化处理后的药品信息, 并将所述标准化处理后的药 品信息附着于对应的所述TOKEN标签上, 形成药品标签; 0032 将所述。

19、药品标签输入至标准数据库中, 并根据所述药品标签进行归类处理。 0033 进一步地, 所述按照所述消息队列的类别, 将所述消息队列上的所述药品的数据 信息依次发送给对应的标准化处理模型进行标准化处理, 得到各个药品经标准化处理后的 药品信息的步骤之前, 还包括: 0034 获取各个医院的各药品的数据信息, 以及与各药品相关联的标准化药品信息的样 说明书 2/12 页 6 CN 112035664 A 6 本数据; 0035 根据所述消息队列的类别信息, 将各药品对应的样本数据划分为多个不同类别的 样本数据; 0036 基于不同类别的样本数据训练对应的标准化处理模型。 0037 本发明还提供了一。

20、种药品归类装置, 包括: 0038 数据信息获取模块, 用于获取医院的数据库内各药品的数据信息; 0039 药品预分类模块, 用于根据所述药品的数据信息对所述药品进行预分类; 0040 药品编入模块, 用于根据预分类结果将所述药品的数据信息, 编入至对应类别的 消息队列中; 0041 标准化处理模块, 用于按照所述消息队列的类别, 将所述消息队列上的所述药品 的数据信息依次发送给对应的标准化处理模型进行标准化处理, 得到各个药品经标准化处 理后的药品信息; 其中, 所述标准化处理模型基于在各个医院预先采集各药品的数据信息, 以及与所述药品数据信息相关联的标准化药品信息组成的样本数据训练而成; 。

21、0042 归类模块, 用于根据所述标准化处理后的药品信息, 在所述标准数据库中将各药 品进行归类处理。 0043 本发明还提供了一种计算机设备, 包括存储器和处理器, 所述存储器存储有计算 机程序, 所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。 0044 本发明还提供了一种计算机可读存储介质, 其上存储有计算机程序, 所述计算机 程序被处理器执行时实现上述任一项所述的方法的步骤。 0045 本发明的有益效果: 通过上述的药品归类方法, 可以完成自纠自查的前期准备工 作, 使每个药品的药品信息都进行了标准化, 减少了自纠自查的工作中, 要对医院数据库中 的各个药品进行重新编码比对。

22、的大量人力投入, 降低了对码工作的耗时, 以及人为对码所 产生的误差。 附图说明 0046 图1是本发明一实施例的一种药品的归类方法的流程示意图; 0047 图2是本发明一实施例的一种药品的归类装置的结构示意框图; 0048 图3为本申请一实施例的计算机设备的结构示意框图。 0049 本发明目的的实现、 功能特点及优点将结合实施例, 参照附图做进一步说明。 具体实施方式 0050 下面将结合本发明实施例中的附图, 对本发明实施例中的技术方案进行清楚、 完 整地描述, 显然, 所描述的实施例仅仅是本发明的一部分实施例, 而不是全部的实施例。 基 于本发明中的实施例, 本领域普通技术人员在没有作出。

23、创造性劳动前提下所获得的所有其 他实施例, 都属于本发明保护的范围。 0051 需要说明, 本发明实施例中所有方向性指示(诸如上、 下、 左、 右、 前、 后等)仅用于 解释在某一特定姿态(如附图所示)下各部件之间的相对位置关系、 运动情况等, 如果该特 定姿态发生改变时, 则该方向性指示也相应地随之改变, 所述的连接可以是直接连接, 也可 以是间接连接。 说明书 3/12 页 7 CN 112035664 A 7 0052 本文中术语 “和/或” , 仅仅是一种描述关联对象的关联关系, 表示可以存在三种关 系, 例如, A和B, 可以表示: 单独存在A, 同时存在A和B, 单独存在B这三种情。

24、况。 0053 另外, 在本发明中如涉及 “第一” 、“第二” 等的描述仅用于描述目的, 而不能理解为 指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。 由此, 限定有 “第一” 、 “第二” 的特征可以明示或者隐含地包括至少一个该特征。 另外, 各个实施例之间的技术方 案可以相互结合, 但是必须是以本领域普通技术人员能够实现为基础, 当技术方案的结合 出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在, 也不在本发明要求的保 护范围之内。 0054 参照图1, 本发明提出一种药品的归类方法, 包括: 0055 S1: 获取医院的数据库内各药品的数据信息; 0056 S2: 根。

25、据所述药品的数据信息对所述药品进行预分类; 0057 S3: 根据预分类结果将所述药品的数据信息, 编入至对应类别的消息队列中; 0058 S4: 按照所述消息队列的类别, 将所述消息队列上的所述药品的数据信息依次发 送给对应的标准化处理模型进行标准化处理, 得到各个药品经标准化处理后的药品信息; 其中, 所述标准化处理模型基于在各个医院预先采集各药品的数据信息, 以及与所述药品 数据信息相关联的标准化药品信息组成的样本数据训练而成; 0059 S5: 根据所述标准化处理后的药品信息, 在所述标准数据库中将各药品进行归类 处理。 0060 如上述步骤S1所述, 获取医院的数据库中各药品的数据信。

26、息, 由于没有设立固定 的标准, 每个医院可能有不同的数据记录体系, 不同的记录体系都具有不同的药品数据信 息, 针对这些不同的药品数据信息进行进一步处理, 获取的方式可以是直接将医院的数据 库中所包含的全部药品的数据信息进行提取。 将获取到的药品数据信息录入到缓存数据库 中, 例如为REDIS数据库中, 录入的方式可以是通过KAFKA进行录入, KAFKA是一款分布式消 息发布和订阅的系统, 具有高性能和高吞吐率。 因此可以实现将医院庞大的数据库中各药 品的数据信息快速录入。 0061 如上述步骤S2所述, 可以根据所述药品的数据信息, 例如其中的数据信息中包含 的类别信息, 或者是用途信息。

27、对各药品进行预分类; 预分类可以是分为几个大类别, 例如, 可以是处方药、 非处方药以及管制药品等, 还可以是中药、 西药等。 0062 如上述步骤S3所述, 可以根据预分类结果将对应的药品和所述药品的数据信息编 入至对应的类别消息队列中, 其中不同的类别的消息队列用于发送至对应的程序中进行处 理, 其中实现编入的场所可以依然在REDIS数据库中实现。 0063 如上述步骤S4所述, 按照消息队列的类别, 将消息队列上的所述药品的数据信息 依次发送给对应的标准化处理模型中, 发送的方式也可以通过KAFKA进行发送, 按照消息队 列的类别将消息队列上的所述药品的数据信息依次发送给对应的标准化处理。

28、模型, 其中需 要说明的是各自对应的标准化处理模型也是根据对应类别的样本数据训练而得, 以使得对 应的标准化处理模型在保证具有相同的处理效果的同时, 简化了模型的复杂程度, 降低了 模型大小, 使运算效率更快。 0064 如上述步骤S5所述, 根据得到的标准化处理后的药品信息, 对各个药品进行归类 处理, 以完成药品的标准化处理, 使后续在进行自查自纠的工作过程中, 建立了一个标准数 说明书 4/12 页 8 CN 112035664 A 8 据库, 使每一个药品的药品信息都具有一个具体的标准, 便于后续的纠察工作, 也便于药品 信息的统一记录。 0065 在一个实施例中, 所述按照所述消息队。

29、列的类别, 将所述消息队列上的所述药品 的数据信息依次发送给对应的标准化处理模型进行标准化处理, 得到各个药品经标准化处 理后的药品信息的步骤S4, 包括: 0066 S401: 根据所述消息队列中所携带的每个所述药品的数据信息, 获取每个所述药 品对应的属性并进行向量化, 得到属性特征向量的多维坐标X(x1, x2, , xi, , xn); 0067S402: 根据公式计算所述属性特征向量与每 个预存向量之间的匹配度; 其中, 所述Y是预存数据库中各预存向量的多维坐标, Y(y1, y2, , yi, , yn), xi表示属性特征向量中第i个属性所对应的坐标, yi表示预存向量中第i个 。

30、属性所对应的坐标, si为第i个属性所对应的系数; 0068 S403: 根据与每个预存向量的匹配度, 得到各个药品所对应的目标预存向量, 将所 述目标预存向量所对应的药品信息赋予至对应的所述药品上。 0069 如上述步骤S401-S403所述, 将各消息队列中携带的各药品对应的数据信息提取 出来, 以获取每个药品对应的属性, 并将对应的属性向量化, 其中, 属性可以是药品的名称, 类别, 用途等属性, 然后得到关于该药品的属性特征向量的多维坐标。 根据公式计算与每个 预存向量的匹配度, 需要说明的是, 每个预存向量中的yi与xi对应的是同一属性, 当然每个 属性的权重占比也应当是不同的, 因。

31、此引入了参数si, 其中参数si是通过实现训练得到的, 根据i的不同, 其参数si的值也不同, 需要解释的是i与参数si之间并没有函数对应关系, 参 数si与第i个属性相关, 例如药品的形状这一属性相关性会弱一些, 其参数si相应的也会小 一些, 而对于用途这一属性的相关性强一些, 其参数si相应的也会大一些。 然后再根据与每 个预存向量的匹配度将各药品对应的目标预存向量, 然后将目标预存向量所对应的药品信 息赋予至对应的所述药品上。 0070 在一个实施例中, 所述按照所述消息队列的类别, 将所述消息队列上的所述药品 的数据信息依次发送给对应的标准化处理模型进行标准化处理, 得到各个药品经标。

32、准化处 理后的药品信息的步骤S4, 包括: 0071 S411: 获取所述医院数据库内的第一药品数目, 以及获取各消息队列中所包含的 第二药品数目; 0072 S412: 计算各第二药品数目所占第一药品数目的比例值; 0073 S413: 判断各比例值中是否具有小于预设比例值的目标比例值; 0074 S414: 若具有, 则将所述目标比例值所对应的标准化处理模型, 在处理完毕对应的 消息队列上的药品的数据信息后, 获取目标标准化处理模型的处理参数数据; 其中所述目 标标准化处理模型为除目标比例值所对应的标准化处理模型之外的其他标准化处理模型 中的一种; 0075 S415: 根据获取所述目标标。

33、准化处理模型的处理参数数据, 接收所述目标标准化 处理模型对应的消息队列中未处理的药品的数据信息并进行处理。 0076 如上述步骤S411-S415所述, 可以获取医院数据库内第一药品数目, 即总数目, 然 后各消息队列中的第二药品数目, 即分数目, 在药品的预分类过程中, 类别可能会划分不合 说明书 5/12 页 9 CN 112035664 A 9 理, 导致有的消息队列中的药品数目特别多, 而有的消息队列中的药品数目特别少, 因此, 在计算过程中, 会导致一部分标准化处理模型闲置, 没有充分利用程序的运算能力, 故而可 以通过各消息队列中的第二药品数目将小于预设比例值的目标比例值所对应的。

34、标准化处 理模型提取出来, 再其完成了其对应的消息队列上的药品处理后, 可以获取目标标准化处 理模型的处理参数数据, 帮助目标标准化处理模型处理其未处理的消息队列中的药品的数 据信息, 处理的方式可以是, 目标标准化处理模型为顺序接收并处理消息队列中的药品的 数据信息, 而提取出来的标准化处理模型可以逆序接收并处理消息队列中的药品的数据信 息, 直至所有的药品的数据信息处理完毕, 目标标准化处理模型可以是其他任意一个非小 于预设比例值的目标比例值的标准化处理模型, 后续也可以将闲置的标准化处理模型获取 正在处理消息队列中药品的数据信息的标准化处理模型的处理参数, 然后帮助其将剩余的 药品的数据。

35、信息进行处理, 加快处理效率。 0077 在一个实施例中, 所述根据所述药品的数据信息对所述药品进行预分类的步骤 S2, 包括: 0078 S201: 获取所述药品的类别信息, 并将所述类别信息进行向量化, 得到对应所述药 品的第一向量; 0079S202: 根据公式计算所述第一向 量与各消息队列对应的第二向量的相似度; 其中, 所述表示第一向量, 所述表示第二向 量; 0080 S203: 根据所述相似度与各个消息队列预设的相似度阈值进行比较; 0081 S204: 根据比较结果将所述药品以及所述药品的数据信息编入对应的所述消息队 列。 0082 如上述步骤S201-S204所述, 进行预分。

36、类的方式可以是现货去各药品的类别信息, 由于类别信息的描述可能会不完全一致, 因此可以将类别信息进行向量化, 然后通过公式 计算与每个消息队列对应的第二向量的相似度, 然后根据相似度计算与各个消息队列的相 似度阈值进行比较, 由于划分类别不是很细, 所以很难出现同一药品与两个消息队列的相 似度都达到对应的相似度阈值, 故而可以不用考虑同一药品符合两个消息队列, 即使有, 也 可以选择一个相似度更高的消息队列。 然后将根据比较结果将所述药品以及所述药品的数 据信息编入对应的所述消息队列, 完成编入处理。 0083 在一个实施例中, 所述获取所述药品的类别信息, 并将所述类别信息进行向量化, 得到。

37、对应所述药品的第一向量的步骤S201, 包括: 0084 S2011: 对所述药品的数据信息进行预处理; 所述预处理包括根据所述特殊字符标 识库剔除所述问题中的标点符号、 统一语种、 删除不相关词句, 所述不相关词句包括问候语 和形容词; 0085 S2012: 根据BERT中文训练模型读取数据集的文本数据, 并通过fine-tuning的方 式对所述文本数据进行分词; 0086 S2013: 通过语义识别技术对分词后的所述文本数据进行识别, 并提取其中的类别 关键词, 将所述类别关键词作为所述类别信息进行获取。 0087 如上述步骤S2011-S2013所述, 先对数据信息进行预处理, 减少。

38、后续通过生成的向 说明书 6/12 页 10 CN 112035664 A 10 量进行计算的误差, 然后通过BERT中文训练模型读取数据集的文本数据, 并通过fine- tuning的方式对所述文本数据进行分词, 其中BERT中文训练模型基于所述专业词库训练而 成, 该所述专业词库也可以是生成的数据集。 然后通过语义识别技术识别所述文本数据, 提 取其中的类别关键词, 将类别关键词作为类别信息进行获取, 基于类别关键词可以对药品 的类别进行分析计算。 0088 在一个实施例中, 所述根据所述标准化处理后的药品信息, 在所述标准数据库中 将各药品进行归类处理的步骤S5, 包括: 0089 S5。

39、01: 建立TOKEN列表, 并为每个所述药品赋予一个TOKEN标签; 0090 S502: 获取每个所述药品的所述标准化处理后的药品信息, 并将所述标准化处理 后的药品信息附着于对应的所述TOKEN标签上, 形成药品标签; 0091 S503: 将所述药品标签输入至标准数据库中, 并根据所述药品标签进行归类处理。 0092 如上述步骤S501-S503所述, 为了更方便后续对各个药品进行划分, 可以建立 TOKEN列表, 然后基于该TOKEN列表为每个药品都赋予一个TOKEN标签, 由于TOKEN标签具有 唯一性, 且难以被仿制, 所以用TOKEN标签来对每个药品进行标记, 然后将获取到的药。

40、品信 息附着在TOKEN标签上, 以建立药品-TOKEN标签-药品信息三者的对应关系, 后续可以直接 根据药品的TOKEN标签进行分类, 需要说明的是, 药品信息虽然附着在TOKEN标签上, 但是进 行验证时只通过TOKEN标签的原有部分进行验证。 0093 在一个实施例中, 所述按照所述消息队列的类别, 将所述消息队列上的所述药品 的数据信息依次发送给对应的标准化处理模型进行标准化处理, 得到各个药品经标准化处 理后的药品信息的步骤S4之前, 还包括: 0094 S301: 获取各个医院的各药品的数据信息, 以及与各药品相关联的标准化药品信 息的样本数据; 0095 S302: 根据所述消息。

41、队列的类别信息, 将各药品对应的样本数据划分为多个不同 类别的样本数据; 0096 S303: 基于不同类别的样本数据训练对应的标准化处理模型。 0097 如上述步骤S301-S303所述, 将获取各个医院的各药品的数据信息和对应的标准 化药品信息的样本数据, 然后根据消息队列的类别信息将各药品对应的样本数据划分为多 个不同类别的样本数据, 使不同的标准化处理模型基于不同类别的样本数据进行训练, 使 标准化处理模型训练的更加贴合各个类别, 然后将标准化处理模型分别进行训练, 得到训 练后的不同类别的标准化处理模型。 0098 参照图2, 本发明提出一种药品的归类装置, 包括: 0099 数据信。

42、息获取模块10, 用于获取医院的数据库内各药品的数据信息; 0100 药品预分类模块20, 用于根据所述药品的数据信息对所述药品进行预分类; 0101 药品编入模块30, 用于根据预分类结果将所述药品的数据信息, 编入至对应类别 的消息队列中; 0102 标准化处理模块40, 用于按照所述消息队列的类别, 将所述消息队列上的所述药 品的数据信息依次发送给对应的标准化处理模型进行标准化处理, 得到各个药品经标准化 处理后的药品信息; 其中, 所述标准化处理模型基于在各个医院预先采集各药品的数据信 息, 以及与所述药品数据信息相关联的标准化药品信息组成的样本数据训练而成; 说明书 7/12 页 1。

43、1 CN 112035664 A 11 0103 归类模块50, 用于根据所述标准化处理后的药品信息, 在所述标准数据库中将各 药品进行归类处理。 0104 获取医院的数据库中各药品的数据信息, 由于没有设立固定的标准, 每个医院可 能有不同的数据记录体系, 不同的记录体系都具有不同的药品数据信息, 针对这些不同的 药品数据信息进行进一步处理, 获取的方式可以是直接将医院的数据库中所包含的全部药 品的数据信息进行提取。 将获取到的药品数据信息录入到缓存数据库中, 例如为REDIS数据 库中, 录入的方式可以是通过KAFKA进行录入, KAFKA是一款分布式消息发布和订阅的系统, 具有高性能和高。

44、吞吐率。 因此可以实现将医院庞大的数据库中各药品的数据信息快速录 入。 0105 可以根据所述药品的数据信息, 例如其中的数据信息中包含的类别信息, 或者是 用途信息对各药品进行预分类; 预分类可以是分为几个大类别, 例如, 可以是处方药、 非处 方药以及管制药品等, 还可以是中药、 西药等。 0106 可以根据预分类结果将对应的药品和所述药品的数据信息编入至对应的类别消 息队列中, 其中不同的类别的消息队列用于发送至对应的程序中进行处理, 其中实现编入 的场所可以依然在REDIS数据库中实现。 0107 按照消息队列的类别, 将消息队列上的所述药品的数据信息依次发送给对应的标 准化处理模型中。

45、, 发送的方式也可以通过KAFKA进行发送, 按照消息队列的类别将消息队列 上的所述药品的数据信息依次发送给对应的标准化处理模型, 其中需要说明的是各自对应 的标准化处理模型也是根据对应类别的样本数据训练而得, 以使得对应的标准化处理模型 在保证具有相同的处理效果的同时, 简化了模型的复杂程度, 降低了模型大小, 使运算效率 更快。 0108 根据得到的标准化处理后的药品信息, 对各个药品进行归类处理, 以完成药品的 标准化处理, 使后续在进行自查自纠的工作过程中, 建立了一个标准数据库, 使每一个药品 的药品信息都具有一个具体的标准, 便于后续的纠察工作, 也便于药品信息的统一记录。 010。

46、9 在一个实施例中, 标准化处理模块40, 包括: 0110 属性向量化子模块, 用于根据所述消息队列中所携带的每个所述药品的数据信 息, 获取每个所述药品对应的属性并进行向量化, 得到属性特征向量的多维坐标X(x1, x2, , xi, , xn); 0111匹配度计算模块, 用于根据公式计算所述属 性特征向量与每个预存向量之间的匹配度; 其中, 所述Y是预存数据库中各预存向量的多维 坐标, Y(y1, y2, , yi, , yn), xi表示属性特征向量中第i个属性所对应的坐标, yi表示预 存向量中第i个属性所对应的坐标, si为第i个属性所对应的系数; 0112 目标预存向量赋予模块。

47、, 用于根据与每个预存向量的匹配度, 得到各个药品所对 应的目标预存向量, 将所述目标预存向量所对应的药品信息赋予至对应的所述药品上。 0113 将各消息队列中携带的各药品对应的数据信息提取出来, 以获取每个药品对应的 属性, 并将对应的属性向量化, 其中, 属性可以是药品的名称, 类别, 用途等属性, 然后得到 关于该药品的属性特征向量的多维坐标。 根据公式计算与每个预存向量的匹配度, 需要说 明的是, 每个预存向量中的yi与xi对应的是同一属性, 当然每个属性的权重占比也应当是不 说明书 8/12 页 12 CN 112035664 A 12 同的, 因此引入了参数si, 其中参数si是通。

48、过实现训练得到的, 根据i的不同, 其参数si的值 也不同, 需要解释的是i与参数si之间并没有函数对应关系, 参数si与第i个属性相关, 例如 药品的形状这一属性相关性会弱一些, 其参数si相应的也会小一些, 而对于用途这一属性 的相关性强一些, 其参数si相应的也会大一些。 然后再根据与每个预存向量的匹配度将各 药品对应的目标预存向量, 然后将目标预存向量所对应的药品信息赋予至对应的所述药品 上。 0114 在一个实施例中, 标准化处理模块40, 包括: 0115 药品数目获取子模块, 用于获取所述医院数据库内的第一药品数目, 以及获取各 消息队列中所包含的第二药品数目; 0116 比例值。

49、计算子模块, 用于计算各第二药品数目所占第一药品数目的比例值; 0117 目标比例值判断子模块, 用于判断各比例值中是否具有小于预设比例值的目标比 例值; 0118 处理参数数据获取子模块, 用于若具有小于预设比例值的目标比例值, 则将所述 目标比例值所对应的标准化处理模型, 在处理完毕对应的消息队列上的药品的数据信息 后, 获取目标标准化处理模型的处理参数数据; 其中所述目标标准化处理模型为除目标比 例值所对应的标准化处理模型之外的其他标准化处理模型中的一种; 0119 处理子模块, 用于根据获取所述目标标准化处理模型的处理参数数据, 接收所述 目标标准化处理模型对应的消息队列中未处理的药品。

50、的数据信息并进行处理。 0120 可以获取医院数据库内第一药品数目, 即总数目, 然后各消息队列中的第二药品 数目, 即分数目, 在药品的预分类过程中, 类别可能会划分不合理, 导致有的消息队列中的 药品数目特别多, 而有的消息队列中的药品数目特别少, 因此, 在计算过程中, 会导致一部 分标准化处理模型闲置, 没有充分利用程序的运算能力, 故而可以通过各消息队列中的第 二药品数目将小于预设比例值的目标比例值所对应的标准化处理模型提取出来, 再其完成 了其对应的消息队列上的药品处理后, 可以获取目标标准化处理模型的处理参数数据, 帮 助目标标准化处理模型处理其未处理的消息队列中的药品的数据信息。

展开阅读全文
内容关键字: 药品 归类 方法 装置 以及 计算机 设备
关于本文
本文标题:药品的归类方法、装置以及计算机设备.pdf
链接地址:https://www.zhuanlichaxun.net/pdf/10211364.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1