客票规则解析方法、装置、电子设备及计算机可读介质.pdf
《客票规则解析方法、装置、电子设备及计算机可读介质.pdf》由会员分享,可在线阅读,更多相关《客票规则解析方法、装置、电子设备及计算机可读介质.pdf(16页完成版)》请在专利查询网上搜索。
1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 201911158284.6 (22)申请日 2019.11.22 (71)申请人 深圳马可孛罗科技有限公司 地址 518000 广东省深圳市南山区粤海街 道科技南十二路迈瑞大厦D座6C01 (72)发明人 刘倩云 (74)专利代理机构 深圳智汇远见知识产权代理 有限公司 44481 代理人 沈园园田俊峰 (51)Int.Cl. G06F 16/35(2019.01) G06F 40/289(2020.01) (54)发明名称 客票规则解析方法、 装置、 电子设备及计算 机可读介。
2、质 (57)摘要 本发明涉及一种客票规则解析方法, 所述方 法包括: 获取待处理的客票规则文本; 将所述客 票规则文本进行词向量化处理, 得到所述客票规 则文本对应的第一向量; 将所述第一向量输入至 预先训练的深度神经网络, 得到与所述第一向量 对应的预设标注字段的数据; 反馈所述预设标注 字段的数据。 本发明的优点在于: 预设标注字段 的数据反映了客票规则文本中的有关退改票的 信息, 用户可以直接在查询或购票界面看到退改 票信息, 提升了用户体验。 权利要求书2页 说明书11页 附图2页 CN 110941717 A 2020.03.31 CN 110941717 A 1.一种客票规则解析方。
3、法, 其特征在于, 所述方法包括: 获取待处理的客票规则文本; 将所述客票规则文本进行词向量化处理, 得到所述客票规则文本对应的第一向量; 将所述第一向量输入至预先训练的深度神经网络, 得到与所述第一向量对应的预设标 注字段的数据; 反馈所述预设标注字段的数据。 2.根据权利要求1所述的方法, 其特征在于, 在获取待处理的客票规则文本之前, 还包 括: 获取样本客票规则文本和所述样本客票规则文本对应的样本标注数据, 其中, 所述样 本标注数据为用于标注所述样本客票规则文本中的预设标注字段的数据; 将所述样本客票规则文本进行词向量化处理, 得到所述样本客票规则文本对应的第二 向量; 通过所述第二。
4、向量、 所述样本标注数据和预设的训练算法, 对初始深度神经网络进行 训练, 得到训练后的深度神经网络。 3.根据权利要求2所述的方法, 其特征在于, 通过所述第二向量、 所述样本标注数据和 预设的训练算法, 对初始深度神经网络进行训练, 得到训练后的深度神经网络, 包括: 针对每个预设标注字段, 建立该预设标注字段对应的初始深度神经网络; 通过所述第二向量、 该样本标注字段对应的样本标注数据和预设的训练算法, 对该预 设标注字段对应的初始深度神经网络进行训练, 得到训练后的深度神经网络。 4.根据权利要求1所述的方法, 其特征在于, 所述将所述客票规则文本进行词向量化处 理, 包括: 将所述客。
5、票规则文本进行分词处理; 将分词处理后的客票规则文本进行词向量化处理。 5.根据权利要求1所述的方法, 其特征在于, 所述将所述第一向量输入至预先训练的深 度神经网络, 包括: 将所述第一向量进行类聚处理; 将类聚处理后的第一向量输入至预先训练的深度神经网络。 6.根据权利要求1所述的方法, 其特征在于, 所述将所述客票规则文本进行词向量化处 理, 包括: 对所述客票规则文本进行语料清洗; 将语料清洗后的客票规则文本进行词向量化处理。 7.一种客票规则解析装置, 其特征在于, 所述装置包括: 确定模块, 用于确定客票规则文本; 第一词向量化模块, 用于将所述客票规则文本进行词向量化处理, 得到。
6、所述客票规则 文本对应的第一向量; 输入输出模块, 用于将所述第一向量输入至预先训练的深度神经网络, 得到与所述第 一向量对应的预设标注字段的数据; 反馈模块, 用于反馈所述预设标注字段的数据。 8.根据权利要求7所述的装置, 其特征在于, 所述装置还包括: 权利要求书 1/2 页 2 CN 110941717 A 2 获取模块, 用于获取样本客票规则文本和所述样本客票规则文本对应的样本标注数 据, 其中, 所述样本标注数据为用于标注所述样本客票规则文本中的预设标注字段的数据; 第二词向量化模块, 用于将所述样本客票规则文本进行词向量化处理, 得到所述样本 客票规则文本对应的第二向量; 训练模。
7、块, 用于通过所述第二向量、 所述样本标注数据和预设的训练算法, 对初始深度 神经网络进行训练, 得到训练后的深度神经网络。 9.一种电子设备, 包括存储器、 处理器, 所述存储器中存储有可在所述处理器上运行的 计算机程序, 其特征在于, 所述处理器执行所述计算机程序时实现上述权利要求1至6任一 项所述的方法的步骤。 10.一种具有处理器可执行的非易失的程序代码的计算机可读介质, 其特征在于, 所述 程序代码使所述处理器执行上述权利要求1-6任一项所述的方法。 权利要求书 2/2 页 3 CN 110941717 A 3 客票规则解析方法、 装置、 电子设备及计算机可读介质 技术领域 0001。
8、 本发明涉及互联网技术领域, 尤其涉及一种客票规则解析方法、 装置、 电子设备及 计算机可读介质。 背景技术 0002 用户在购票结束后经常会由于种种原因需要退改票, 根据客票规则, 用户购买的 票的种类不同, 客票是否允许退改也不同, 或用户退改票时间不同, 用户得到的退改票金额 也是不同的。 在这种情况下, 用户发出退改票请求后, 一般需要客服人工解读客票规则, 然 后将是否允许退改票, 和退改票金额通知用户, 增加了客服工作量, 也不方便用户在购买初 期知晓是否允许退改票和退改票价格, 给用户带来了不便。 发明内容 0003 为了解决上述技术问题或者至少部分地解决上述技术问题, 本发明提。
9、供了一种客 票规则解析方法、 装置、 电子设备及计算机可读介质。 0004 为解决上述技术问题, 本发明采用的技术方案是: 0005 第一方面, 一种客票规则解析方法, 所述方法包括: 0006 获取待处理的客票规则文本; 0007 将所述客票规则文本进行词向量化处理, 得到所述客票规则文本对应的第一向 量; 0008 将所述第一向量输入至预先训练的深度神经网络, 得到与所述第一向量对应的预 设标注字段的数据; 0009 反馈所述预设标注字段的数据。 0010 可选的, 在获取待处理的客票规则文本之前, 还包括: 0011 获取样本客票规则文本和所述样本客票规则文本对应的样本标注数据, 其中,。
10、 所 述样本标注数据为用于标注所述样本客票规则文本中的预设标注字段的数据; 0012 将所述样本客票规则文本进行词向量化处理, 得到所述样本客票规则文本对应的 第二向量; 0013 通过所述第二向量、 所述样本标注数据和预设的训练算法, 对初始深度神经网络 进行训练, 得到训练后的深度神经网络。 0014 可选的, 通过所述第二向量、 所述样本标注数据和预设的训练算法, 对初始深度神 经网络进行训练, 得到训练后的深度神经网络, 包括: 0015 针对每个预设标注字段, 建立该预设标注字段对应的初始深度神经网络; 0016 通过所述第二向量、 该样本标注字段对应的样本标注数据和预设的训练算法,。
11、 对 该预设标注字段对应的初始深度神经网络进行训练, 得到训练后的深度神经网络。 0017 可选的, 所述将所述客票规则文本进行词向量化处理, 包括: 0018 将所述客票规则文本进行分词处理; 说明书 1/11 页 4 CN 110941717 A 4 0019 将分词处理后的客票规则文本进行词向量化处理。 0020 可选的, 所述将所述第一向量输入至预先训练的深度神经网络, 包括: 0021 将所述第一向量进行类聚处理; 0022 将类聚处理后的第一向量输入至预先训练的深度神经网络。 0023 可选的, 所述将所述客票规则文本进行词向量化处理, 包括: 0024 对所述客票规则文本进行语料。
12、清洗; 0025 将语料清洗后的客票规则文本进行词向量化处理。 0026 第二方面, 一种客票规则解析装置, 其特征在于, 所述装置包括: 0027 确定模块, 用于确定客票规则文本; 0028 第一词向量化模块, 用于将所述客票规则文本进行词向量化处理, 得到所述客票 规则文本对应的第一向量; 0029 输入输出模块, 用于将所述第一向量输入至预先训练的深度神经网络, 得到与所 述第一向量对应的预设标注字段的数据; 0030 反馈模块, 用于反馈所述预设标注字段的数据。 0031 可选的, 所述装置还包括: 0032 获取模块, 用于获取样本客票规则文本和所述样本客票规则文本对应的样本标注 。
13、数据, 其中, 所述样本标注数据为用于标注所述样本客票规则文本中的预设标注字段的数 据; 0033 第二词向量化模块, 用于将所述样本客票规则文本进行词向量化处理, 得到所述 样本客票规则文本对应的第二向量; 0034 训练模块, 用于通过所述第二向量、 所述样本标注数据和预设的训练算法, 对初始 深度神经网络进行训练, 得到训练后的深度神经网络。 0035 第三方面, 一种电子设备, 包括存储器、 处理器, 所述存储器中存储有可在所述处 理器上运行的计算机程序, 其特征在于, 所述处理器执行所述计算机程序时实现上述任一 项所述的方法的步骤。 0036 第四方面, 一种具有处理器可执行的非易失。
14、的程序代码的计算机可读介质, 其特 征在于, 所述程序代码使所述处理器执行上述任一项所述的方法。 0037 本发明实施例提供的上述技术方案与现有技术相比具有如下优点: 0038 本发明将客票规则文本输入至预先训练的深度神经网络, 得到预设标注字段的数 据并反馈至终端, 预设标注字段的数据反映了客票规则文本中的有关退改票的信息, 用户 可以直接在查询或购票界面看到退改票信息, 提升了用户体验, 也减少了客服的工作量。 附图说明 0039 此处的附图被并入说明书中并构成本说明书的一部分, 示出了符合本发明的实施 例, 并与说明书一起用于解释本发明的原理。 0040 为了更清楚地说明本发明实施例或现。
15、有技术中的技术方案, 下面将对实施例或现 有技术描述中所需要使用的附图作简单地介绍, 显而易见地, 对于本领域普通技术人员而 言, 在不付出创造性劳动性的前提下, 还可以根据这些附图获得其他的附图。 0041 图1为本发明一个实施例提供的一种客票规则解析方法的流程图; 说明书 2/11 页 5 CN 110941717 A 5 0042 图2为本发明一个实施例提供的一种深度神经网络训练的方法的流程图; 0043 图3为本发明的一实施例提供的一种客票规则解析设备的结构示意图; 0044 图4为本发明一个实施例提供的一种终端的结构图。 具体实施方式 0045 为使本发明实施例的目的、 技术方案和优。
16、点更加清楚, 下面将结合本发明实施例 中的附图, 对本发明实施例中的技术方案进行清楚、 完整地描述, 显然, 所描述的实施例是 本发明的一部分实施例, 而不是全部的实施例。 基于本发明中的实施例, 本领域普通技术人 员在没有做出创造性劳动的前提下所获得的所有其他实施例, 都属于本发明保护的范围。 0046 本发明提供了一种客票规则解析方法, 可以应用于服务器, 也可以应用于终端设 备, 终端设备可以用于解析客票规则, 并将解析后得到的退改票信息反馈至终端。 0047 下面将以服务器为例, 结合具体实施方式, 对本申请实施例提供的一种客票规则 解析方法进行详细的说明, 如图1所示, 具体步骤如下。
17、: 0048 步骤101: 获取待处理的客票规则文本。 0049 在某些情况下, 用户在购票时无法看到客票规则文本, 或客票规则文本过长导致 用户没有耐心或时间看完, 用户在进行退改票时经常会咨询客服人员, 客服人员从客票规 则文本中找寻退改票相关的信息, 然后再反馈给用户, 这样就增加了客服人员的工作量, 而 且, 用户在购票时无法查看到简洁的退改票信息, 可能会给用户带来不便。 0050 在本发明实施例中, 用户进入到票价查询或票价购买界面时, 服务器检测到用户 进入的界面, 并根据界面中的票价信息, 确定与该票价信息对应的客票规则文本。 在本发明 实施例中, 客票规则文本为用户在查票或购。
18、票过程中, 与用户查询或购买的客票的相对应 的相关规则信息, 如行李托运费用、 该客票是否允许退票或改签, 在取票前后的退改费用分 别为多少等信息。 0051 例如: 用户想要查询2019年11月5日从天津飞往昆明的机票, 那么用户在进入机票 查询界面后, 界面显示出两条航班信息, 服务器根据界面中的两条航班信息, 分别确定与每 条航班信息对应的客票规则文本。 0052 步骤102: 将客票规则文本进行词向量化处理, 得到客票规则文本对应的第一向 量。 0053 在本发明实施例中, 服务器将客票规则文本进行词向量处理, 服务器将客票规则 文本输入词向量化神经网络, 并输出向量化的结果, 该结果。
19、即客票规则文本对应的第一向 量, 第一向量可以表达客票规则文本的含义, 以便于深度神经网络能够输入该第一向量。 本 申请实施例中, 可以采用word2vec模型将客票规则文本进行词向量化处理, 并得到客票规 则文本对应的第一向量。 0054 步骤103: 将第一向量输入至预先训练的深度神经网络, 得到与第一向量对应的预 设标注字段的数据。 0055 在本发明实施例中, 服务器将第一向量输入至预先训练的深度神经网络, 得到与 第一向量对应的预设标注字段的数据。 由于第一向量可以表达客票规则文本的含义, 则相 当于预设标注字段的数据与客票规则文本对应, 预设标注字段的数据可以将客票规则文本 中的客。
20、票信息简洁的反映出来。 说明书 3/11 页 6 CN 110941717 A 6 0056 举例来说, 预设标注字段的数据为预设标注字段在客票规则文本中的具体数据, 比如订单编号为7250365554、 允许改期、 不允许退票、 按照航段收费、 付款币种为人民币等。 0057 步骤104: 反馈预设标注字段的数据。 0058 在本发明实施例中, 服务器通过深度神经网络输出预设标注字段的数据后, 服务 器将预设标注字段的数据反馈至终端, 并显示在终端的查询或购票界面, 以使用户能够看 到该预设标注字段的数据, 得知所查询或购买的客票的退改详情。 0059 例如, 客票规则文本部分内容为: CH。
21、ARGES 0060 BEFORE DAPARTURE 0061 CHARGE VND 300000 0062 在客票规则文本中, 预设标注字段包含两类, 分别为before_departure_amount (行程开始前的金额)和currency_code(付款币种), 结合预设标注字段数值, 服务器反馈至 终端的结果为: 行程开始前改期金额为30000越南盾。 0063 可选的, 如图2所示, 本申请实施例还提供了深度神经网络的训练过程, 具体包括 以下步骤: 0064 步骤201: 获取样本客票规则文本和样本客票规则文本对应的样本标注数据, 其 中, 样本标注数据为用于标注样本客票规则文。
22、本中的预设标注字段的数据。 0065 在本发明实施例中, 服务器获取样本客票规则文本, 其中样本客票规则文本为, 对 深度神经网络进行训练学习时所采用的客票规则文本, 客票规则文本为客票的相关规则信 息, 如订单号为1225724737、 该客票不允许改签, 行程开始前改期金额为750元等信息。 0066 在本发明实施例中, 针对每个样本客票规则文本, 服务器还可以获取样本标注数 据, 其中, 样本标注数据为事先对该样本客票规则文本中的预设标注字段标注完善的数据。 以用户购买机票为例, 表一为对应的样本标注数据的表格, 从表格中可以看出, 表格中每行 都包括一个等式, 样本标注数据包括预设标注。
23、字段和预设标注字段数值, 其中, 等式前面的 内容为预设标注字段, 等式后面的内容为预设标注字段数值, 即预设标注字段在样本客票 规则文本中对应的具体数值。 预设标注字段分为五类: order-num(订单号),is_permitted (是否允许改期)currency_code(罚金币种), applies_per(罚金粒度/收费标准) departure_amount(行程的改期金额), 其他标注字段则是具体解释, 如: 第4-7行的标注字 段分别为对应currency_code的解释, 第10-13行标注字段分别为对应before_departure_ amount的解释, 15-18行。
24、标注字段分别为对应after_departure_amount的解释。 0067 表一 0068 order-num1225724737 is_permitted1 currency_codeVND currency_start_row16 currency_start_col8 currency_end_row16 currency_end_col11 applies_per不填 before_departure_amount300000 说明书 4/11 页 7 CN 110941717 A 7 before_departure_amount_start_row16 before_depa。
25、rture_amount_start_col12 before_departure_amount_end_row16 before_departure_amount_end_col18 after_departure_amount600000 after_departure_amount_start_row22 after_departure_amount_start_col11 after_departure_amount_end_row22 after_departure_amount_end_col18 0069 在本发明实施例中, 在样本标注数据中, 其中一部分预设标注字段及其预设标注。
26、 字段数值是直接从样本客票规则文本中获得的, 如order-num(订单号)1225724737, currency_codeVND, before_departure_amount30000和after_departure_amount(行 程开始后的金额)60000, applies_per(罚金粒度)不填(文段中没有出现per, 所以不 填), 而is_permitted(是否允许)1是根据before_departure_amount30000和after_ departure_amount60000推论得到的。 0070 样本标注数据对预设标注字段进行标注, 如before_depa。
27、rture_amount_start_ row(行程开始前改期金额开始的光标位置的行数)16, before_departure_amount 30000,currency_codeVND,currency_start_row(币种开始的光标位置的行数)16,等。 0071 预设标注字段的解释如表二所示, 表二中, 第一列为预设标注字段的名称, 第二列 为对预设标注字段名称的解释, 及其预设标注字段数值的说明。 以is_permitted为例进行 解释: 表格第一列中有预设标注字段的名称: is_permitted, 第二列中包括对预设标注字段 名称的解释, is_permitted解释为是否。
28、允许改期; 还包括预设标注字段数值的说明, 1表示 允许, 0表示不允许, is_permitted的数值由before_departure_amount和after_ departure_amount决定, 如果before_departure_amount和after_departure_amount数值 不一致, 按before_departure_amount的数值标注。 0072 表二 说明书 5/11 页 8 CN 110941717 A 8 0073 0074 表三为对样本标注数据的解释, 第一列为样本标注数据, 第二列为样本标注数据 的释义, 如, before_departu。
29、re_amoun_start_row16,表示形成开始前的改期金额开始的 光标位置的行数为16。 0075 表三 0076 0077 具体来说, 反馈至终端的预设标注字段的数据包括两部分: 预设标注字段和预设 标注字段数值。 举例来说, 预设标注字段为order-num(订单号), 预设标注字段数值为 1225724737, 则预设标注字段的数据为: 订单号为1225724737。 预设标注字段为is_ permitted(是否允许改期), 预设标注字段数值为1, 则预设标注字段的数据为: 允许改期。 (1表示允许改期, 0表示不允许改期)。 0078 步骤202: 将样本客票规则文本进行词向。
30、量化处理, 得到样本客票规则文本对应的 第二向量。 0079 在本发明实施例中, 服务器将样本客票规则文本进行词向量处理, 服务器将客票 规则文本输入词向量化神经网络, 并输出向量化的数字, 量化后的数字即客票规则文本对 应的第二向量, 本申请实施例中, 采用word2vec模型将客票规则文本进行词向量化处理, 并 得到客票规则文本对应的第二向量。 0080 步骤203: 通过第二向量、 样本标注数据和预设的训练算法, 对初始深度神经网络 说明书 6/11 页 9 CN 110941717 A 9 进行训练, 得到训练后的深度神经网络。 0081 在本发明实施例中, 服务器将第二向量输入初始深。
31、度神经网络, 初始深度神经网 络输出与第二向量对应的预设标注字段的数据, 服务器判断输出的预设标注字段的数据和 样本标注数据否满足预设条件, 若不满足预设条件, 则重新训练初始深度神经网络直至满 足预设条件。 0082 由于事先对样本客票规则文本做了样本标注数据, 因此样本客票规则文本和样本 标注数据之间是存在对应关系的, 即第二向量和样本标注数据之间存在对应关系, 服务器 将第二向量输入初始深度神经网络, 初始深度神经网络根据第二向量和样本标注数据之间 的对应关系以及预设的训练算法, 输出与第二向量对应的预设标注字段的数据。 其中, 该预 设标注字段的数据包括多个, 在本发明实施例中, 输出。
32、的预设标注字段的数据为五个, 分别 对应样本标注数据中的: order-num1225724737, is_permitted1, currency_code VND, applies_per不填, before_departure_amount30000和after_departure_amount 60000。 0083 可选的, 通过第二向量、 样本标注数据和预设的训练算法, 对初始深度神经网络进 行训练, 得到训练后的深度神经网络, 包括: 0084 针对每个预设标注字段, 建立该预设标注字段对应的初始深度神经网络; 通过第 二向量、 该样本标注字段对应的样本标注数据和预设的训练算法,。
33、 对该预设标注字段对应 的初始深度神经网络进行训练, 得到训练后的深度神经网络。 0085 在本发明实施例中, 样本标注数据包括多个预设标注字段, 针对每个预设标注字 段, 分别建立该预设标注字段对应的初始深度神经网络, 避免预设标注字段之间相互干扰, 影响整体的通用型和鲁棒性, 可以提高深度神经网络的精度。 0086 在本发明实施例中, 第二向量包括第二分向量和第三分向量, 服务器将第二分向 量和与第二分向量对应的标准标注数据输入初始深度神经网络, 初始深度神经网络输出第 二向量与预设标注字段的数据的对应关系, 其中, 在本发明实施例中, 第二分向量的数量为 多个, 不同的第二分向量所对应的。
34、标准标注数据也不同。 初始深度神经网络得到第二向量 与预设标注字段的数据的对应关系后, 服务器将第三分向量输入初始深度神经网络, 并根 据得到的对应关系输出与第三分向量对应的预设标注字段的数据, 服务器判断初始深度神 经网络输出的第三分向量对应的预设标注字段的数据, 与第三分向量对应的样本标注数据 的差别是否在预设范围内, 若在预设范围内, 则停止对初始深度神经网络的训练, 若不在预 设范围内, 则重新训练初始深度神经网络, 直至第三分向量对应的预设标注字段的数据, 与 第三分向量对应的样本标注数据的差别在预设范围内。 0087 举例来说, 第二向量包括一百个向量, 其中第二分向量为七十个, 。
35、第三分向量为三 十个, 服务器将其中一个第二分向量和与第二分向量对应的标准标注数据输入初始深度神 经网络, 初始深度神经网络输出第二向量与预设标注字段的数据的对应关系; 然后服务器 将第二个第二分向量和与第二分向量对应的标准标注数据输入初始深度神经网络, 初始深 度神经网络调整并输出输出第二向量与预设标注字段的数据的对应关系, 服务器循环该输 入输出过程, 直至服务器将七十个第二分向量全部输入初始深度神经网络, 初始深度神经 网络不断调整上述对应关系, 然后服务器依次将三十个第三分向量输入初始深度神经网 络, 初始深度神经网络分别输出与三十个第三分向量对应的三十个预设标注字段的数据, 说明书 。
36、7/11 页 10 CN 110941717 A 10 服务器判断输出的三十个预设标注字段的数据与第三分向量对应的三十个样本标注数据 的差别是否在预设范围内, 若在预设范围内, 则表示该初始深度神经网络训练结束; 若不在 预设范围内, 则重新将第二向量输入初始深度神经网络, 直至第三分向量对应的预设标注 字段的数据与第三分向量对应的样本标注数据的差别在预设范围内。 0088 可选的, 将所述客票规则文本进行词向量化处理, 包括: 0089 将所述客票规则文本进行分词处理; 将分词处理后的客票规则文本进行词向量化 处理。 0090 在本发明实施例中, 将所述客票规则文本进行分词处理, 具体的, 。
37、可以定位到关键 的段落或把不同关键词的段落做拆分, 将拆分后的文本再进行词向量化处理, 可以提高词 向量化处理的精度, 其中, 关键的段落是指包含预设标注字段的段落。 在本发明实施例中, 关键词包括但不限于: charges(收费), refund(退款金额), before departure(行程开始 前), after departure(行程开始后)。 0091 可选的, 将第一向量进行类聚处理包括: 0092 计算第一向量的相似性; 根据第一向量的相似性对第一向量做类聚处理。 0093 在本发明实施例中, 服务器计算第一向量的相似性, 其中向量的相似度的算法为 皮尔逊相关系数。 00。
38、94 皮尔逊相关系数一般用于计算两个定距变量间联系的紧密程度, 它的取值在-1, +1之间。 其中, -1,1, 绝对值越大, 说明相关性越强。 0095 在计算相似性结束后, 服务器根据第一向量的相似性对第一向量做类聚处理。 由 于第一向量由数字字符串组成, 每组字符串之间可以计算两个向量的相似度, 当两个向量 的距离越近或者方向越相近时, 可认为这两个向量相似度很高, 同样的, 相似度高的向量背 后的客票规则文本的语义也更相近。 0096 可选的, 将第一向量输入至预先训练的深度神经网络, 包括: 0097 将第一向量进行类聚处理; 将类聚处理后的第一向量输入至预先训练的深度神经 网络。 。
39、0098 在本发明实施例中, 服务器将第一向量进行类聚处理, 将类聚处理后的第一向量 输入至预先训练的深度神经网络。 其中, 第一向量与多个客票规则文本相对应, 采用分类模 型将第一向量进行类聚处理, 可以将第一向量分成相似的多个向量, 其中, 相似度高的向量 背后的客票规则文本的语义也更相近, 将同类的向量输入至深度神经网络, 可以提高第一 向量的训练精度。 本发明实施例中, 分类模型为k-means, (k-means clustering algorithm, k均值聚类算法)是一种迭代求解的聚类分析算法, 给定一个数据点集合和需要 的聚类数目k, k由用户指定, k均值算法根据某个距离。
40、函数反复把数据分入k个聚类中。 将类 聚处理后的第一向量输入至预先训练的深度神经网络。 0099 可选的, 将客票规则文本进行词向量化处理, 包括: 0100 对客票规则文本进行语料清洗; 将语料清洗后的客票规则文本进行词向量化处 理。 0101 在本发明实施例中, 服务器对客票规则文本进行语料清洗, 语料清洗可以过滤掉 文本中的特殊字符, 以便于提高分词效率, 其中, 特殊字符包括但不限于any(任何)、 be (是)、 every(每个)等第一停用词。 说明书 8/11 页 11 CN 110941717 A 11 0102 服务器对客票规则文本进行语料清洗后, 对客票规则文本进行分词处理。
41、, 然后要 过滤掉客票规则文本中的第二停用词, 如标点符号、 语气词、 人称等, 其中第二停用词在分 词处理过程可以作为分词处理的标准, 例如, 标点符号中的句号用作分词的标准。 所以在分 词处理之后将第二停用词过滤掉, 提高词向量化效率。 服务器将第二停用词过滤掉之后, 将 语料清洗后的客票规则文本进行词向量化处理。 0103 本发明将客票规则文本输入至预先训练的深度神经网络, 得到预设标注字段的数 据并反馈至终端, 预设标注字段的数据反映了客票规则文本中的有关退改票的信息, 用户 可以直接在查询或购票界面看到退改票信息, 提升了用户体验, 也减少了客服的工作量。 0104 基于同一构思, 。
42、本申请实施例中还提供了一种客票规则解析装置, 如图3所示, 包 括: 0105 确定模块301, 用于确定客票规则文本; 0106 第一向量化模块302, 用于将客票规则文本进行词向量化处理, 得到客票规则文本 对应的第一向量; 0107 输入输出模块303, 将第一向量输入至预先训练的深度神经网络, 得到与第一向量 对应的预设标注字段的数据; 0108 反馈模块304, 用于反馈预设标注字段的数据。 0109 可选的, 所示装置还包括: 0110 获取模块, 用于获取样本客票规则文本和样本客票规则文本对应的样本标注数 据, 其中, 样本标注数据为用于标注样本客票规则文本中的预设标注字段的数据。
43、; 0111 第二向量化模块, 将样本客票规则文本进行词向量化处理, 得到样本客票规则文 本对应的第二向量; 0112 训练模块, 用于通过第二向量、 样本标注数据和预设的训练算法, 对初始深度神经 网络进行训练, 得到训练后的深度神经网络。 0113 可选的, 训练模块包括: 0114 建立单元, 用于针对每个预设标注字段, 建立该预设标注字段对应的初始深度神 经网络; 0115 训练单元, 用于通过第二向量、 该样本标注字段对应的样本标注数据和预设的训 练算法, 对该预设标注字段对应的初始深度神经网络进行训练, 得到训练后的深度神经网 络。 0116 可选的, 第一向量化模块302包括: 。
44、0117 分词单元, 用于将客票规则文本进行分词处理; 0118 词向量单元, 用于将分词处理后的客票规则文本进行词向量化处理。 0119 可选的, 输入输出模块303包括: 0120 类聚单元, 用于将第一向量进行类聚处理; 0121 输入单元, 用于将类聚处理后的第一向量输入至预先训练的深度神经网络。 0122 可选的, 类聚单元包括: 0123 计算子单元, 用于计算第一向量的相似性; 0124 类聚子单元, 用于根据第一向量的相似性对第一向量做类聚处理。 0125 可选的, 第一向量化模块302包括: 说明书 9/11 页 12 CN 110941717 A 12 0126 语料清洗单。
45、元, 用于对客票规则文本进行语料清洗; 0127 词向量化单元, 用于将语料清洗后的客票规则文本进行词向量化处理。 0128 基于同一构思, 本申请实施例中还提供了一种电子设备, 包括存储器、 处理器, 存 储器中存储有可在处理器上运行的计算机程序, 处理器执行计算机程序时实现上述的控制 方法。 0129 基于同一构思, 本申请实施例中还提供了一种电子设备, 如图4所示, 该电子设备 主要包括: 处理器401、 通信接口402、 存储器403和通信总线404, 其中, 处理器401、 通信接口 402和存储器403通过通信总线404完成相互间的通信。 其中, 通信接口402用于上述电子设 备与。
46、其他设备之间的通信。 存储器403中存储有可被处理器401执行的程序, 处理器401通过 执行存储器403上所存放的程序, 执行计算机程序时实现上述的控制方法。 0130 上述电子设备中提到的通信总线404可以时外设部件互连标准(Peripheral Component Interconnect, 简称PCI)总线或扩展工业标准结构(Extended Industry Standard Architecture, 简称EISA)总线等。 该通信总线404可以分为地址总线、 数据总线、 控制总线等。 为便于表示, 图4中仅用一条粗线表示, 但并不表示仅有一根总线或一种类型 的总线。 0131 存。
47、储器403可以包括随机存取存储器(RandomAccessMemory, 简称RAM), 也可以包 括非易失性存储器(non-volatilememory), 例如至少一个磁盘存储器。 可选的, 存储器还可 以是至少一个位于远离前述处理器的存储装置。 0132 上述的处理器401可以是通用处理器, 包括中央处理器(CentralProcessingUnit, 简称CPU)、 网络处理器(NetworkProcessor, 简称NP)等; 还可以是数字信号处理器 (DigitalSignalProcessing, 简称DSP)、 专用集成电路(ApplicationSpecificIntegra。
48、ted Circuit, 简称ASIC)、 现场可编程门阵列(Field-ProgrammableGateArray, 简称FPGA)或者 其他可编程逻辑器件、 分立门或者晶体管逻辑器件、 分立硬件组件。 0133 在本申请的又一实施例中, 还提供了一种具有处理器可执行的非易失的程序代码 的计算机可读介质, 程序代码使处理器执行上述控制方法。 0134 在上述实施例中, 可以全部或部分地通过软件、 硬件、 固件或者其任意组合来实 现。 当使用软件实现时, 可以全部或部分地以计算机程序产品的形式实现。 该计算机程序产 品包括一个或多个计算机指令。 在计算机上加载和执行该计算机指令时, 全部或部分。
49、地产 生按照本申请实施例所述的流程或功能。 该计算机可以时通用计算机、 专用计算机、 计算机 网络或者其他可编程装置。 该计算机指令可以存储在计算机可读存储介质中, 或者从一个 计算机可读存储介质向另一个计算机可读存储介质传输, 例如, 计算机指令从一个网站站 点、 计算机、 服务器或者数据中心通过有线(例如同轴电缆、 光纤、 数字用户线(DSL)或无线 (例如红外、 微波等)方式向另外一个网站站点、 计算机、 服务器或数据中心进行传输。 该计 算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介 质集成的服务器、 数据中心等数据存储设备。 该可用介质可以是磁性介质(例。
50、如软盘、 硬盘、 磁带等)、 光介质(例如DVD)或者半导体介质(例如固态硬盘)等。 0135 需要说明的是, 在本文中, 诸如 “第一” 和 “第二” 等之类的关系术语仅仅用来将一 个实体或者操作与另一个实体或操作区分开来, 而不一定要求或者暗示这些实体或操作之 间存在任何这种实际的关系或者顺序。 而且, 术语 “包括” 、“包含” 或者其任何其他变体意在 说明书 10/11 页 13 CN 110941717 A 13 涵盖非排他性的包含, 从而使得包括一系列要素的过程、 方法、 物品或者设备不仅包括那些 要素, 而且还包括没有明确列出的其他要素, 或者是还包括为这种过程、 方法、 物品或。
- 内容关键字: 客票 规则 解析 方法 装置 电子设备 计算机 可读 介质
焙烧台车储罐定位装置.pdf
具有松紧器的裤子.pdf
风电叶片铣削设备.pdf
用于高性能混凝土节水降耗装置.pdf
物流运输用包装箱.pdf
化工安全管理用防爆检查装置.pdf
支架产品的高效焊接工装.pdf
超导磁体组装定位结构.pdf
车用尿素溶液生产的液体浓缩装置.pdf
中频加热炉自动化出料装置.pdf
异形件钻孔固定装置.pdf
用于金属丝管的加工工装.pdf
肉苁蓉播种匀种施肥一体机装置.pdf
伸缩隐形折叠晾晒架.pdf
岩土破碎采样装置.pdf
高效混凝土搅拌装置.pdf
电池箱体组合结构.pdf
水利工程用河水取样设备.pdf
防堵塞的煤矿瓦斯抽采用气水渣分离装置.pdf
移动式储能电源的可靠性诊断系统.pdf
基于多模态特征融合的Web API推荐方法和系统.pdf
用于机械零部件生产的开孔装置.pdf
保温墙板多腔体模型成型装置及其使用方法.pdf
洗碗机水量检测方法、装置、洗碗机和存储介质.pdf
磷修饰氮化碳阻燃改性BOPET薄膜的制备方法.pdf
磁存储器及其制备方法、电子设备.pdf
具备预警保护功能的直线模组.pdf
面向遥感解译应用的训练推理一体机.pdf
促伤口愈合、减缓瘢痕形成的水凝胶及制备方法与应用.pdf
制备咪唑乙醇的方法.pdf
桥梁施工用桥墩围堰装置及使用方法.pdf
平板电脑的使用时间警示系统及方法.pdf