1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202010899845.4 (22)申请日 2020.08.31 (71)申请人 康键信息技术 (深圳) 有限公司 地址 518052 广东省深圳市前海深港合作 区前湾一路1号A栋201室 (72)发明人 皮怀雨柳恭 (74)专利代理机构 广州华进联合专利商标代理 有限公司 44224 代理人 毛丹 (51)Int.Cl. G16H 40/67(2018.01) G06F 16/332(2019.01) G06F 40/211(2020.01) G06F 40/295(2020
2、.01) G06F 40/30(2020.01) G06K 9/62(2006.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 在线诊疗数据处理方法、 装置、 计算机设备 和存储介质 (57)摘要 本申请涉及一种基于深度学习的在线诊疗 数据处理方法、 装置、 计算机设备和存储介质。 该 方法包括: 当接收到患者在互联网诊疗平台的在 线会话内容时, 若满足辅助诊疗条件, 则根据历 史会话内容, 获取场景特征和症状描述; 当识别 在线会话内容的语句类型为疑问句时, 提取在线 会话内容的意图和医疗实体; 从候选问题库中匹 配满足意图和医疗实体的相
3、关问题; 获取相关问 题的候选答案, 从候选答案中确定与症状描述相 关的匹配答案, 输出作为在线会话内容的辅助诊 疗回复。 由于在线诊疗回复综合考虑了会话内容 的意图、 医疗实体以及症状描述, 使得输出的答 案非千片一律, 而是符合会话内容的, 能够提高 自动回复内容与患者需求匹配度。 权利要求书2页 说明书11页 附图3页 CN 112037904 A 2020.12.04 CN 112037904 A 1.一种在线诊疗数据处理方法, 所述方法包括: 当接收到患者在互联网诊疗平台的在线会话内容时, 若满足辅助诊疗条件, 则根据历 史会话内容, 获取场景特征和症状描述; 当识别所述在线会话内容
4、的语句类型为疑问句时, 提取所述在线会话内容的意图和医 疗实体; 从候选问题库中匹配满足所述意图和医疗实体的相关问题; 获取所述相关问题的候选答案, 从所述候选答案中确定与所述症状描述相关的匹配答 案, 输出作为所述在线会话内容的辅助诊疗回复。 2.根据权利要求1所述的方法, 其特征在于, 所述获取所述相关问题的候选答案, 从所 述候选答案中确定与所述症状描述相关的匹配答案, 输出作为所述在线会话内容的辅助诊 疗回复, 包括: 获取所述相关问题的候选答案, 根据所述症状描述从所述候选答案中确定匹配答案; 根据所述场景特征, 确定所述匹配答案对应的话术转换匹配答案, 将所述话术转换匹 配答案输出
5、作为所述在线会话内容的辅助诊疗回复。 3.根据权利要求1所述的方法, 其特征在于, 当会话内容的语句类型为陈述句时, 识别 所述在线会话内容的会话类型, 获取会话类型对应的回复作为所述在线会话内容的辅助诊 疗回复。 4.根据权利要求1所述的方法, 其特征在于, 所述从候选问题库中匹配满足所述意图和 医疗实体的相关问题, 包括: 获取所述候选库中各候选问题的意图标签和医疗实体标签; 根据所述意图标签和所述医疗实体标签, 确定与所述在线会话内容的意图和医疗实体 匹配的相关问题。 5.根据权利要求2所述的方法, 其特征在于, 所述获取所述相关问题的候选答案, 根据 所述症状描述从所述候选答案中确定匹
6、配答案, 包括: 获取所述相关问题的候选答案, 以及所述候选答案的症状特征; 将所述症状描述与所述候选答案的症状特征进行匹配, 从所述候选答案中确定符合所 述症状描述的匹配答案。 6.根据权利要求1所述的方法, 其特征在于, 获取所述获取场景特征和症状描述的方 式, 包括: 获取医生与所述患者对话的历史会话记录, 所述历史会话记录包括医生历史记录和患 者历史记录; 获取诊疗的时序特征以及最近一条医生历史记录的内容特征; 根据所述时序特征和所述内容特征确定所述场景特征; 从所述患者历史记录中获取症状描述。 7.根据权利要求1至6任意一项所述的方法, 其特征在于, 所述辅助诊疗条件包括以下 至少一
7、种: 医生与患者的互动停止时长超过预设时长; 医生已退出登录互联网诊疗平台; 及 医生启用了辅助诊疗。 8.一种在线诊疗数据处理装置, 其特征在于, 所述装置包括: 获取模块, 用于当接收到患者在互联网诊疗平台的在线会话内容时, 若满足辅助诊疗 权利要求书 1/2 页 2 CN 112037904 A 2 条件, 则根据历史会话内容, 获取场景特征和症状描述; 提取模块, 用于当识别所述在线会话内容的语句类型为疑问句时, 提取所述在线会话 内容的意图和医疗实体; 问题匹配模块, 用于从候选问题库中匹配满足所述意图和医疗实体的相关问题; 输出模块, 用于获取所述相关问题的候选答案, 从所述候选答
8、案中确定与所述症状描 述相关的匹配答案, 输出作为所述在线会话内容的辅助诊疗回复。 9.一种计算机设备, 包括存储器和处理器, 所述存储器存储有计算机程序, 其特征在 于, 所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。 10.一种计算机存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机程序被处 理器执行时实现权利要求1至7中任一项所述的方法的步骤。 权利要求书 2/2 页 3 CN 112037904 A 3 在线诊疗数据处理方法、 装置、 计算机设备和存储介质 技术领域 0001 本申请涉及人工智能和医疗技术领域, 特别是涉及一种在线诊疗数据处理方法、
9、装置、 计算机设备和存储介质。 背景技术 0002 传统在线诊疗提供了平台, 能够实现基于互联网的医患沟通。 0003 而传统的互联网诊疗平台的功能是提供医患沟通的平台, 当医生有事离开时不能 及时回复患者的问题时, 患者只能等待。 为提高用户体验, 部分互联网诊疗平台设置通过设 置自动回复, 能够在一些特殊时候对患者的提问进行自动回复。 而自动回复的内容通常是 由医生设置的, 或是基于规则设置的简单回复。 例如, 医生有事离开时, 可设置自动回复 “有 事离开, 稍后回复” 。 当接收到患者在医生设置自动回复发送问题时, 自动向患者发送该自 动回复内容, 患者则可获知这个消息, 了解医生暂时
10、不能回复的情况。 0004 然而在实际应用中, 患者往往较急于了解自己的病情, 在这种背景下, 简单的自动 回复与患者需求匹配度低, 不能满足人们的需求。 发明内容 0005 基于此, 有必要针对上述技术问题, 提供一种能够提高自动回复内容与患者需求 匹配度的基于深度学习的在线诊疗数据处理方法、 装置、 计算机设备和存储介质。 0006 一种在线诊疗数据处理方法, 所述方法包括: 0007 当接收到患者在互联网诊疗平台的在线会话内容时, 若满足辅助诊疗条件, 则根 据历史会话内容, 获取场景特征和症状描述; 0008 当识别所述在线会话内容的语句类型为疑问句时, 提取所述在线会话内容的意图 和
11、医疗实体; 0009 从候选问题库中匹配满足所述意图和医疗实体的相关问题; 0010 获取所述相关问题的候选答案, 从所述候选答案中确定与所述症状描述相关的匹 配答案, 输出作为所述在线会话内容的辅助诊疗回复。 0011 在其中一个实施例中, 所述获取所述相关问题的候选答案, 从所述候选答案中确 定与所述症状描述相关的匹配答案, 输出作为所述在线会话内容的辅助诊疗回复, 包括: 0012 获取所述相关问题的候选答案, 根据所述症状描述从所述候选答案中确定匹配答 案; 0013 根据所述场景特征, 确定所述匹配答案对应的话术转换匹配答案, 将所述话术转 换匹配答案输出作为所述在线会话内容的辅助诊
12、疗回复。 0014 在其中一个实施例中, 当会话内容的语句类型为陈述句时, 识别所述在线会话内 容的会话类型, 获取会话类型对应的回复作为所述在线会话内容的辅助诊疗回复。 0015 在其中一个实施例中, 所述从候选问题库中匹配满足所述意图和医疗实体的相关 问题, 包括: 说明书 1/11 页 4 CN 112037904 A 4 0016 获取所述候选库中各候选问题的意图标签和医疗实体标签; 0017 根据所述意图标签和所述医疗实体标签, 确定与所述在线会话内容的意图和医疗 实体匹配的相关问题。 0018 在其中一个实施例中, 所述获取所述相关问题的候选答案, 根据所述症状描述从 所述候选答案
13、中确定匹配答案, 包括: 0019 获取所述相关问题的候选答案, 以及所述候选答案的症状特征; 0020 将所述症状描述与所述候选答案的症状特征进行匹配, 从所述候选答案中确定符 合所述症状描述的匹配答案。 0021 在其中一个实施例中, 获取所述获取场景特征和症状描述的方式, 包括: 0022 获取医生与所述患者对话的历史会话记录, 所述历史会话记录包括医生历史记录 和患者历史记录; 0023 根据所述医生历史记录获取诊疗的时序特征以及最近一条回复记录的内容特征; 0024 根据所述时序特征和所述内容特征确定所述场景特征; 0025 从所述患者历史记录中获取症状描述。 0026 在其中一个实
14、施例中, 所述辅助诊疗条件包括以下至少一种: 医生与患者的互动 停止时长超过预设时长; 医生已退出登录互联网诊疗平台; 及医生启用了辅助诊疗。 0027 一种在线诊疗数据处理装置, 所述装置包括: 0028 获取模块, 用于当接收到患者在互联网诊疗平台的在线会话内容时, 若满足辅助 诊疗条件, 则根据历史会话内容, 获取场景特征和症状描述; 0029 提取模块, 用于当识别所述在线会话内容的语句类型为疑问句时, 提取所述在线 会话内容的意图和医疗实体; 0030 问题匹配模块, 用于从候选问题库中匹配满足所述意图和医疗实体的相关问题; 0031 输出模块, 用于获取所述相关问题的候选答案, 从
15、所述候选答案中确定与所述症 状描述相关的匹配答案, 输出作为所述在线会话内容的辅助诊疗回复。 0032 一种计算机设备, 包括存储器和处理器, 所述存储器存储有计算机程序, 所述处理 器执行所述计算机程序时实现以下步骤: 0033 当接收到患者在互联网诊疗平台的在线会话内容时, 若满足辅助诊疗条件, 则根 据历史会话内容, 获取场景特征和症状描述; 0034 当识别所述在线会话内容的语句类型为疑问句时, 提取所述在线会话内容的意图 和医疗实体; 0035 从候选问题库中匹配满足所述意图和医疗实体的相关问题; 0036 获取所述相关问题的候选答案, 从所述候选答案中确定与所述症状描述相关的匹 配
16、答案, 输出作为所述在线会话内容的辅助诊疗回复。 0037 一种计算机存储介质, 其上存储有计算机程序, 所述计算机程序被处理器执行时 实现以下步骤: 0038 当接收到患者在互联网诊疗平台的在线会话内容时, 若满足辅助诊疗条件, 则根 据历史会话内容, 获取场景特征和症状描述; 0039 当识别所述在线会话内容的语句类型为疑问句时, 提取所述在线会话内容的意图 和医疗实体; 说明书 2/11 页 5 CN 112037904 A 5 0040 从候选问题库中匹配满足所述意图和医疗实体的相关问题; 0041 获取所述相关问题的候选答案, 从所述候选答案中确定与所述症状描述相关的匹 配答案, 输
17、出作为所述在线会话内容的辅助诊疗回复。 0042 上述在线诊疗数据处理方法、 装置、 计算机设备和存储介质, 能够实现在线诊疗 中, 医生不能及时回复时, 启用辅助医疗进行辅助的场景, 通过采集问诊过程中用户和医生 的在线会话内容, 提取在线会话内容的意图的医疗实体, 从候选问题库中匹配相关问题, 进 而确定候选问题答案中与症状描述相关的候选答案作为辅助诊疗回复。 由于在线诊疗回复 综合考虑了会话内容的意图、 医疗实体以及症状描述, 使得输出的答案非千片一律, 而是符 合会话内容的, 能够提高自动回复内容与患者需求匹配度。 附图说明 0043 图1为一个实施例中在线诊疗数据处理方法的应用场景图
18、; 0044 图2为一个实施例中在线诊疗数据处理方法的流程示意图; 0045 图3为一个实施例中一种深度学习模型的结构示意图; 0046 图4为一个实施例中在线诊疗数据处理装置的结构框图; 0047 图5为一个实施例中计算机设备的内部结构图。 具体实施方式 0048 为了使本申请的目的、 技术方案及优点更加清楚明白, 以下结合附图及实施例, 对 本申请进行进一步详细说明。 应当理解, 此处描述的具体实施例仅仅用以解释本申请, 并不 用于限定本申请。 0049 本申请提供的在线诊疗数据处理方法, 可以应用于如图1所示的应用环境中, 第一 终端102和第二终端106分别通过网络与服务器104通过网
19、络进行通信。 患者用户通过第一 终端102, 医生用户通过第二终端106进行输入交流内容并通过服务器发送至对方, 服务器 当接收到患者在互联网诊疗平台的在线会话内容时, 若满足辅助诊疗条件, 则根据历史会 话内容, 获取场景特征和症状描述; 当识别所述在线会话内容的语句类型为疑问句时, 提取 所述在线会话内容的意图和医疗实体; 从候选问题库中匹配满足所述意图和医疗实体的相 关问题; 获取所述相关问题的候选答案, 从所述候选答案中确定与所述症状描述相关的匹 配答案, 输出作为所述在线会话内容的辅助诊疗回复。 其中, 第一终端102和第二终端106可 以但不限于是各种个人计算机、 笔记本电脑、 智
20、能手机、 平板电脑和便携式可穿戴设备, 服 务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。 0050 在一个实施例中, 如图2所示, 提供了一种基于深度学习的在线诊疗数据处理方 法, 以该方法应用于图1中的服务器为例进行说明, 包括以下步骤: 0051 步骤202, 当接收到患者在互联网诊疗平台的在线会话内容时, 若满足辅助诊疗条 件, 则根据历史会话内容, 获取场景特征和症状描述。 0052 互联网诊疗平台是以互联网为基础构建的医患沟通平台。 医生和患者通过登录互 联网诊疗平台即可实现问诊, 节约了用户去医院排队挂号等待就诊的时间。 0053 在线会话内容是在互联网诊疗
21、平台线上患者与医生的会话内容。 当接收到患者在 互联网诊疗平台的在线会话内容时, 服务器将在线会话内容发送至第二终端。 当服务器检 说明书 3/11 页 6 CN 112037904 A 6 测到互动情况满足辅助诊疗条件时, 实施本申请的方法进行自动回复。 0054 其中, 辅助诊疗指的是在互联网诊疗平台辅助医生进行诊疗。 辅助诊疗的一种实 现方式是在医生不能及时回复患者问题的情况下, 输出对患者在线会话内容的回复, 以避 免患者长时间等待。 是否触发辅助诊疗, 可根据互动情况进行判断, 也可根据系统设置进行 判断。 具体地, 辅助诊疗条件包括以下至少一种: 医生与患者的互动停止时长超过预设时
22、 长; 医生已退出登录互联网诊疗平台; 及医生启用了辅助诊疗。 0055 其中, 针对条件 “医生与患者的互动停止时长超过预设时长” , 可是以医生与该患 者的互动停止时长超过预设时长, 也可以是医生与接诊的所有患者的互动停止时长超过预 设时长。 当接收到患者在互联网诊疗平台的在线会话内容时, 若检测到医生与患者的互动 停止时长超过预设时长, 则触发辅助诊疗。 0056 针对条件 “医生已退出登录互联网诊疗平台” , 是指医生在互联网诊疗平台退出登 录, 当接收到患者在互联网诊疗平台的在线会话内容时, 若检测到医生在互联网诊疗平台 退出登录, 则触发辅助诊疗。 0057 针对条件 “医生启用了
23、辅助诊疗” , 指的是医生设置了启用了辅助诊疗。 如, 互联网 诊疗平台的医生客户端有辅助诊疗设置的快捷键, 触发该快捷键即可设置启用辅助诊疗。 0058 具体地, 在线诊疗包括了两个阶段, 分别为导诊阶段和问诊阶段。 在导诊阶段, 用 户输入主诉后, 系统根据用户主诉中提及的疾病和症状划分科室, 并进行补充问询。 0059 根据用户输入的主诉使用深度模型进行分类, 得到用户问题所属科室。 然后根据 用户提及的疾病和症状等关键信息, 抛出模板进行补充询问, 进一步确定用户的病症。 对于 常见的简单病症, 直接给用户对应回答。 如果用户得到回答后没有进一步问题, 则结束问 诊。 若用户还有疑问,
24、 则继续进入到医生诊室。 0060 在问诊阶段, 患者以线与医生进行沟通, 沟通形式可以为文字、 语音或视频。 在患 者与医生进行会话时, 若互动情况满足辅助诊疗条件时, 根据历史会话内容, 获取场景特征 和症状描述。 0061 其中, 历史会话内容包括了导论阶段的会话内容。 场景特征具体是指当前会话所 处的场景, 通常将医生问诊根据诊疗程序, 分为问诊场景、 诊断场景和开药场景。 症状描述 是患者对自身疾病的症状描述, 包括了在导诊阶段以及问诊阶段的相关描述。 0062 步骤204, 当识别所述在线会话内容的语句类型为疑问句时, 提取所述在线会话内 容的意图和医疗实体。 0063 在问诊阶段
25、, 对会话内容分为陈述和疑问分别进行处理。 0064 疑问句是按照句子的语气分出来的一个类, 它与陈述句、 感叹句、 祈使句的最大区 别就是它的疑问语气; 是问一些事情的, 表达的内容并不是陈述, 所以是不确定的, 往往希 望得到相关解答。 0065 一种实施方式中, 会话内容的语句类型可通过关键字符进行判断。 关键字符包括 关键字和标点符号。 以疑问句为例, 通常采用标点符号 “? ” 结尾, 或包含关键字 “吗” 。 预先根 据每个语句类型的常用方式, 设置用于区分语句类型的关键字符。 当在线会话内容包括关 键字符时, 确定为对应的语句类型。 0066 一种实施方式中, 调用模型对在线会话
26、内容的语句类型进行分类, 其中, 模型是预 先经过深度学习训练得到的。 说明书 4/11 页 7 CN 112037904 A 7 0067 若在线会话内容的语句类型为疑问句, 则提取在线会话内容的意图和医疗实体。 0068 具体地, 意图是指一句话用户所想达到的目标。 根据医学场景, 将患者会话内容的 意图预先划分为几种, 分别为: 对某个事项进行确认, 询问注意事项等, 如, 确认病情, 又如 询问保养方式。 0069 实体是指具有意义能够独立存在的事物, 在诊疗问答场景, 医疗实体如疾病类型, 药物名称等。 0070 具体地, 在线会话内容的意图和医疗实体可采用基于深度学习预先训练的模型
27、提 取得到。 0071 步骤206, 从候选问题库中匹配满足所述意图和医疗实体的相关问题。 0072 候选问题库是预先列出的常见问题库, 并为问题库中的每个问题设置了标准回复 答案。 同时, 还设置了每个候选问题的意图和医疗实体。 当触发辅助医疗时, 从候选问题库 中满足该在线会话内容的意图和医疗实体的相关问题。 可以理解为, 根据意图和医疗实体, 从候选问题库中找出与在线会话问题相匹配的问题。 0073 具体地, 所述从候选问题库中匹配满足所述意图和医疗实体的相关问题, 包括: 获 取所述候选库中各候选问题的意图标签和医疗实体标签; 根据所述意图标签和所述医疗实 体标签, 确定与所述在线会话
28、内容的意图和医疗实体匹配的相关问题。 0074 具体地, 预先为候选问题库中的每个问题打上意图标签和实体标签, 通过匹配的 方式获取满足意图和实体的相关问题。 其中, 可采用基于深度学习预先训练的模型预先为 每个问题打上意图标签和实体标签。 0075 以 “我想知道怀孕了吗” , 确定意图为确认病情, 实体为怀孕。 根据匹配, 确定候选 问题库匹配的问题为 “这是怀孕的表现吗? ” 0076 其中, 可先使用相似度计算方法, 计算会话内容与候选问题库中与具有该实体标 签的各问题的相似度, 初步确定候选问题, 再从候选问题中选择具有该意图标签中相似度 前十的问题作为相关问题。 0077 步骤20
29、8, 获取所述相关问题的候选答案, 从所述候选答案中确定与所述症状描述 相关的匹配答案, 输出作为所述在线会话内容的辅助诊疗回复。 0078 候选问题库中的每个候选问题已预先设置了标准答案, 而一个问题有多个标准候 选答案, 通常至少包括是、 否和不确定三种答案。 需要从三候选答案中匹配与症状描述最相 关的候选答案。 0079 具体地, 每个候选答案预先设置了症状特别, 根据症状特点, 确定症状描述符合候 选答案的症状特点。 如, 候选答案包括: 1、 是的, 恭喜你, 你怀孕了; 2、 现在还不太清楚, 你需 要做*检查; 3、 怀孕的症状是, 你不符合这些症状, 没有怀孕; 4, 是的,
30、回去要注意休息, *; 0080 以候选答案1为例, 候选答案的条件包括: 症状为*, 检查结果为*。 根据症状描 述的图像特征和文本特征, 图像特征为检查结果, 文本特征为关键词, 如月经推迟等。 将图 像特征、 文本特征以及候选答案的条件输入了模型, 确认是否匹配, 若是, 则确定1为候选答 案。 0081 上述基于深度学习的在线诊疗数据处理方法, 能够实现在线诊疗中, 医生不能及 时回复时, 启用辅助医疗进行辅助的场景, 通过采集问诊过程中用户和医生的在线会话内 容, 提取在线会话内容的意图的医疗实体, 从候选问题库中匹配相关问题, 进而确定候选问 说明书 5/11 页 8 CN 112
31、037904 A 8 题答案中与症状描述相关的候选答案作为辅助诊疗回复。 由于在线诊疗回复综合考虑了会 话内容的意图、 医疗实体以及症状描述, 使得输出的答案非千片一律, 而是符合会话内容 的, 能够提高自动回复内容与患者需求匹配度。 0082 在其中一个实施例中, 所述获取所述相关问题的候选答案, 从所述候选答案中确 定与所述症状描述相关的匹配答案, 输出作为所述在线会话内容的辅助诊疗回复, 包括: 获 取所述相关问题的候选答案, 根据所述症状描述从所述候选答案中确定匹配答案; 根据所 述场景特征, 确定所述匹配答案对应的话术转换匹配答案, 将所述话术转换匹配答案输出 作为所述在线会话内容的
32、辅助诊疗回复。 0083 具体地, 每个问题都预先设置了候选答案, 一个问题有多个候选答案, 通常至少包 括是, 否, 不确定等三种答案。 每种答案设置了相应的症状特点。 以怀孕为例, 候选答案包 括: 1、 是的; 2、 现在还不太清楚; 3、 怀孕的症状是, 你不符合这些症状, 没有怀孕。 对应的, 答 案1的症状特点包括: B超结果确诊为怀孕, 抽血HCG结果显示为怀孕。 答案二, 语文描述有呕 吐、 月经推迟等症状。 答案3, B超结果未显示怀孕, 抽血HCG结果未显示为怀孕。 若患者仅症 状描述有呕吐、 月经推迟, 未提供相关检查结果, 则匹配答案为答案2。 0084 场景特征具体是
33、指当前会话所处的场景, 通常将医生问诊根据诊疗程序, 分为问 诊场景、 诊断场景和开药场景。 即使是同一问题的同一答案, 在不同阶段需要采用不同的话 术进行回复。 0085 进一步地, 对于每一个答案均设置了不同场景下的话术转换匹配答案, 以适用于 不同的场景。 每个话术转换匹配答案设置有场景标签, 在确定了匹配答案后, 从候选答案中 选择场景标签符合当前场景特征的话术转换匹配答案输出作为在线会话内容的回复。 0086 以答案1 “是的” 为例, 在问诊场景, 话术转换匹配答案 “是的, 恭喜你, 你怀孕了” 。 在开药场景, 话术转换匹配答案 “是的, 回去要注意休息, 等下会有一些补充剂开
34、等你, 要按 时吃。 ” 0087 由于匹配答案是根据场景特征进行话术转换过的特征, 能够符合场景, 可以使辅 助诊疗回复灵活, 贴合场景。 0088 其中, 所述获取所述相关问题的候选答案, 根据所述症状描述从所述候选答案中 确定匹配答案, 包括: 获取所述相关问题的候选答案, 以及所述候选答案的症状特征; 将所 述症状描述与所述候选答案的症状特征进行匹配, 从所述候选答案中确定符合所述症状描 述的匹配答案。 即将症状描述和候选答案的症状特征匹配, 确定匹配答案。 0089 在另一个实施例中, 获取所述获取场景特征和症状描述的方式, 包括: 获取医生与 所述患者对话的历史会话记录, 所述历史
35、会话记录包括医生历史记录和患者历史记录; 获 取诊疗的时序特征以及最近一条医生历史记录的内容特征; 根据所述时序特征和所述内容 特征确定所述场景特征; 从所述患者历史记录中获取症状描述。 0090 诊疗过程的特点是, 前期医生通过询问问题了解患者的病情, 在确定病情后, 有比 较长篇幅的回复患者的疑问, 或是对患者解释病情相关内容。 比如, 在病情了解阶段, 通常 的问题是 “哪里不舒服” , 在了解病史阶段, 通常的问题是 “以前得过什么病吗? ” 在开药阶 段, 通常的问题是 “对什么药过敏” 。 而患者在前期有较长篇幅回答, 进行病情陈述, 后期关 心病情, 提出一些疑问, 如如何护理,
36、 如何吃药等等。 基于诊疗过程的特点, 确定诊疗的时序 特征为: 问诊-诊断-开药。 说明书 6/11 页 9 CN 112037904 A 9 0091 在此基础上, 结合历史会话记录中的医生历史记录, 可以窥见场景特征。 具体地, 获取最近一条回复医生历史记录的内容特征; 根据所述时序特征和所述内容特征确定所述 场景特征。 其中, 医生历史记录获取回复的时序特征经历了询问症状、 了解病史、 查看报告 到给出确诊, 但最后一条回复记录是关于如何护理的注意事项时, 则可推测已确诊完毕, 诊 断处于开药场景。 0092 而患者的病情症状均是由患者在诊疗沟通过程中向医生描述的, 因此, 通过患者
37、历史记录可获取症状描述。 0093 在辅助诊疗的实现中, 核心算法是使用如图3所示的Tensorflow框架。 基于 Tensorflow API预定义的计算图, 该框架可以自动对常见的深度网络进行优化求解。 问答 引擎的核心算法模块基于Albert预训练模型, 构建了可支持意图识别、 句式判定、 命名实体 识别和语义相似度排序的多任务深度学习模型。 0094 Albert预训练模型是基于大规模语料训练得出的, 具有较好的泛化性。 该发明取 出模型输出的CLS向量C, 定义权重为W, 然后使用log-softmax多分类函数log(softmax (CWT)进行分类预测。 除此之外, 将Alb
38、ert模型输出的字向量特征表示平均就能得到句子 的表示。 0095 以在线会话内容为 “我想知道怀孕了吗” 为例, 将话内容输入预先训练好的Albert 预训练模型, 通过模型分类, 可确定语句内容为疑问句, 并提取这句话的意图和医疗实体, 进而通过DNN模型, 从候选库中匹配满足意图和医疗实体的相关问题。 从所述候选答案中确 定与所述症状描述相关的匹配答案, 输出作为所述在线会话内容的辅助诊疗回复。 0096 其中, DNN模型是用来抽取结构化文字的特征, 然后和已经抽取好的图像特征面向 同样的特征进行优化, 得到图一中蓝色的特征。 该特征向量代表了图像和语义的共同特征, 也就是多模态检索向
39、量D, 用于下一步的相似答案检索。 相似度计算的公式为余弦相似度 其中V为答案的特征向量, 从候选答案中取相似度最高的TopN即可得到结果。 0097 具体地, 先找到与在线会话内容相似度最高的TOPN个候选问题, 再在这TOPN个候 选问题找到意图和医疗实体匹配的相关问题。 获取所述相关问题的候选答案, 根据所述症 状描述从所述候选答案中确定匹配答案; 0098 根据所述场景特征, 确定所述匹配答案对应的话术转换匹配答案, 将所述话术转 换匹配答案输出作为所述在线会话内容的辅助诊疗回复。 0099 应该理解的是, 虽然图2的流程图中的各个步骤按照箭头的指示依次显示, 但是这 些步骤并不是必然
40、按照箭头指示的顺序依次执行。 除非本文中有明确的说明, 这些步骤的 执行并没有严格的顺序限制, 这些步骤可以以其它的顺序执行。 而且, 图2中的至少一部分 步骤可以包括多个子步骤或者多个阶段, 这些子步骤或者阶段并不必然是在同一时刻执行 完成, 而是可以在不同的时刻执行, 这些子步骤或者阶段的执行顺序也不必然是依次进行, 而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。 0100 在一个实施例中, 如图4所示, 提供了一种在线诊疗数据处理装置, 包括: 0101 获取模块402, 用于当接收到患者在互联网诊疗平台的在线会话内容时, 若满足辅 助诊疗条件, 则根据历
41、史会话内容, 获取场景特征和症状描述; 0102 提取模块404, 用于当识别所述在线会话内容的语句类型为疑问句时, 提取所述在 说明书 7/11 页 10 CN 112037904 A 10 线会话内容的意图和医疗实体; 0103 问题匹配模块406, 用于从候选问题库中匹配满足所述意图和医疗实体的相关问 题; 0104 输出模块408, 用于获取所述相关问题的候选答案, 从所述候选答案中确定与所述 症状描述相关的匹配答案, 输出作为所述在线会话内容的辅助诊疗回复。 0105 上述在线诊疗数据处理装置, 能够实现在线诊疗中, 医生不能及时回复时, 启用辅 助医疗进行辅助的场景, 通过采集问诊
42、过程中用户和医生的在线会话内容, 提取在线会话 内容的意图的医疗实体, 从候选问题库中匹配相关问题, 进而确定候选问题答案中与症状 描述相关的候选答案作为辅助诊疗回复。 由于在线诊疗回复综合考虑了会话内容的意图、 医疗实体以及症状描述, 使得输出的答案非千片一律, 而是符合会话内容的, 能够提高自动 回复内容与患者需求匹配度。 0106 在其中一个实施例中, 输出模块, 包括: 0107 匹配答案模块, 用于获取所述相关问题的候选答案, 根据所述症状描述从所述候 选答案中确定匹配答案。 0108 转换模块, 用于根据所述场景特征, 确定所述匹配答案对应的话术转换匹配答案, 将所述话术转换匹配答
43、案输出作为所述在线会话内容的辅助诊疗回复。 0109 在另一个实施例中, 输出模块, 还用于当会话内容的语句类型为陈述句时, 识别所 述在线会话内容的会话类型, 获取会话类型对应的回复作为所述在线会话内容的辅助诊疗 回复。 0110 在另一个实施例中, 匹配模块, 包括: 0111 标签获取模块, 获取所述候选库中各候选问题的意图标签和医疗实体标签。 0112 标签匹配模块, 用于根据所述意图标签和所述医疗实体标签, 确定与所述在线会 话内容的意图和医疗实体匹配的相关问题。 0113 在另一个实施例中, 匹配答案模块, 包括: 0114 症状特征获取模块, 用于获取所述相关问题的候选答案, 以
44、及所述候选答案的症 状特征。 0115 症状匹配模块, 用于将所述症状描述与所述候选答案的症状特征进行匹配, 从所 述候选答案中确定符合所述症状描述的匹配答案。 0116 在另一个实施例中, 获取模块, 包括: 0117 记录获取模块, 用于获取医生与所述患者对话的历史会话记录, 所述历史会话记 录包括医生历史记录和患者历史记录。 0118 内容特征获取模块, 用于获取诊疗的时序特征以及最近一条医生历史记录的内容 特征; 0119 场景特征获取模块, 用于根据所述时序特征和所述内容特征确定所述场景特征; 0120 症状描述获取模块, 用于从所述患者历史记录中获取症状描述。 0121 在另一个实
45、施例中, 所述辅助诊疗条件包括以下至少一种: 医生与患者的互动停 止时长超过预设时长; 医生已退出登录互联网诊疗平台; 及医生启用了辅助诊疗。 0122 关于在线诊疗数据处理装置的具体限定可以参见上文中对于在线诊疗数据处理 方法的限定, 在此不再赘述。 上述在线诊疗数据处理装置中的各个模块可全部或部分通过 说明书 8/11 页 11 CN 112037904 A 11 软件、 硬件及其组合来实现。 上述各模块可以硬件形式内嵌于或独立于计算机设备中的处 理器中, 也可以以软件形式存储于计算机设备中的存储器中, 以便于处理器调用执行以上 各个模块对应的操作。 0123 在一个实施例中, 提供了一种
46、计算机设备, 该计算机设备可以是服务器, 其内部结 构图可以如图5所示。 该计算机设备包括通过系统总线连接的处理器、 存储器、 网络接口和 数据库。 其中, 该计算机设备的处理器用于提供计算和控制能力。 该计算机设备的存储器包 括非易失性存储介质、 内存储器。 该非易失性存储介质存储有操作系统、 计算机程序和数据 库。 该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。 该计算 机设备的数据库用于存储会话内容数据。 该计算机设备的网络接口用于与外部的终端通过 网络连接通信。 该计算机程序被处理器执行时以实现一种在线诊疗数据处理方法。 0124 本领域技术人员可以理解, 图5中
47、示出的结构, 仅仅是与本申请方案相关的部分结 构的框图, 并不构成对本申请方案所应用于其上的计算机设备的限定, 具体的计算机设备 可以包括比图中所示更多或更少的部件, 或者组合某些部件, 或者具有不同的部件布置。 0125 在一个实施例中, 提供了一种计算机设备, 包括存储器和处理器, 该存储器存储有 计算机程序, 该处理器执行计算机程序时实现以下步骤: 0126 当接收到患者在互联网诊疗平台的在线会话内容时, 若满足辅助诊疗条件, 则根 据历史会话内容, 获取场景特征和症状描述; 0127 当识别所述在线会话内容的语句类型为疑问句时, 提取所述在线会话内容的意图 和医疗实体; 0128 从候
48、选问题库中匹配满足所述意图和医疗实体的相关问题; 0129 获取所述相关问题的候选答案, 从所述候选答案中确定与所述症状描述相关的匹 配答案, 输出作为所述在线会话内容的辅助诊疗回复。 0130 在一个实施例中, 所述获取所述相关问题的候选答案, 从所述候选答案中确定与 所述症状描述相关的匹配答案, 输出作为所述在线会话内容的辅助诊疗回复, 包括: 0131 获取所述相关问题的候选答案, 根据所述症状描述从所述候选答案中确定匹配答 案; 0132 根据所述场景特征, 确定所述匹配答案对应的话术转换匹配答案, 将所述话术转 换匹配答案输出作为所述在线会话内容的辅助诊疗回复。 0133 在一个实施
49、例中, 当会话内容的语句类型为陈述句时, 识别所述在线会话内容的 会话类型, 获取会话类型对应的回复作为所述在线会话内容的辅助诊疗回复。 0134 在一个实施例中, 所述从候选问题库中匹配满足所述意图和医疗实体的相关问 题, 包括: 0135 获取所述候选库中各候选问题的意图标签和医疗实体标签; 0136 根据所述意图标签和所述医疗实体标签, 确定与所述在线会话内容的意图和医疗 实体匹配的相关问题。 0137 在一个实施例中, 所述获取所述相关问题的候选答案, 根据所述症状描述从所述 候选答案中确定匹配答案, 包括: 0138 获取所述相关问题的候选答案, 以及所述候选答案的症状特征; 013
50、9 将所述症状描述与所述候选答案的症状特征进行匹配, 从所述候选答案中确定符 说明书 9/11 页 12 CN 112037904 A 12 合所述症状描述的匹配答案。 0140 在一个实施例中, 获取所述获取场景特征和症状描述的方式, 包括: 0141 获取医生与所述患者对话的历史会话记录, 所述历史会话记录包括医生历史记录 和患者历史记录; 0142 获取诊疗的时序特征以及最近一条医生历史记录的内容特征; 0143 根据所述时序特征和所述内容特征确定所述场景特征; 0144 从所述患者历史记录中获取症状描述。 0145 在一个实施例中, 所述辅助诊疗条件包括以下至少一种: 医生与患者的互动