模型训练的方法、时长预测的方法、系统、设备及介质.pdf

上传人:GAME****980 文档编号:10437805 上传时间:2021-06-21 格式:PDF 页数:21 大小:912.56KB
收藏 版权申诉 举报 下载
模型训练的方法、时长预测的方法、系统、设备及介质.pdf_第1页
第1页 / 共21页
模型训练的方法、时长预测的方法、系统、设备及介质.pdf_第2页
第2页 / 共21页
模型训练的方法、时长预测的方法、系统、设备及介质.pdf_第3页
第3页 / 共21页
文档描述:

《模型训练的方法、时长预测的方法、系统、设备及介质.pdf》由会员分享,可在线阅读,更多相关《模型训练的方法、时长预测的方法、系统、设备及介质.pdf(21页完成版)》请在专利查询网上搜索。

1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202010473630.6 (22)申请日 2020.05.29 (71)申请人 携程计算机技术 (上海) 有限公司 地址 200335 上海市长宁区福泉路99号携 程网络技术大楼 (72)发明人 黎建辉邹亚鹏胡泓 (74)专利代理机构 上海弼兴律师事务所 31283 代理人 薛琦张冉 (51)Int.Cl. G06Q 10/04(2012.01) G06K 9/62(2006.01) G06Q 50/12(2012.01) G06Q 30/06(2012.01) (54)发明。

2、名称 模型训练的方法、 时长预测的方法、 系统、 设 备及介质 (57)摘要 本发明公开了一种模型训练的方法、 时长预 测的方法、 系统、 设备及介质, 其中模型训练的方 法, 包括以下步骤: 获取多个酒店订单的历史数 据; 从所述历史数据中提取特征数据, 将获取到 的所述特征数据输入xgboost模型进行训练, 当 所述历史数据中订单回复时长的真实值与所述 xgboost模型输出的预测值之间误差的绝对值最 小时, 生成订单回复时长预测模型。 本发明提供 的模型训练的方法和订单回复时长预测的方法 解决了业务人员根据业务经验判断酒店订单的 催单时间, 预测准确率低的缺陷; 提高了酒店订 单的回复。

3、时长预测的准确性, 最终降低了催单 率。 权利要求书3页 说明书11页 附图6页 CN 111639807 A 2020.09.08 CN 111639807 A 1.一种模型训练的方法, 其特征在于, 所述方法包括: 获取多个酒店订单的历史数据; 从所述历史数据中提取特征数据, 其中, 所述特征数据包括用户下单时间点信息、 订单 类型信息、 酒店静态属性信息、 节假日信息以及酒店供应商的渠道信息, 所述用户下单时间 点信息用于表征下单时间点处于工作时段或非工作时段; 将获取到的所述特征数据输入xgboost模型进行训练, 当所述历史数据中订单回复时 长的真实值与所述xgboost模型输出的预。

4、测值之间误差的绝对值最小时, 生成订单回复时 长预测模型; 其中, 所述xgboost模型为根据所述特征数据构造的多棵串行的树结构模型。 2.如权利要求1所述的模型训练的方法, 其特征在于, 所述将获取到的所述特征数据输 入xgboost模型进行训练的步骤, 包括: 获取所述xgboost模型以及损失函数的初始超参数值; 基于所述损失函数的初始超参数值对所述xgboost模型进行初始化; 根据所述特征数据以及所述损失函数, 对初始化后的所述xgboost模型的初始超参数 值进行参数调整以使得对应的损失函数减小; 当每次调整后的所述xgboost模型对应的损失函数不再继续减小时, 则将调整后的所。

5、 述xgboost模型的超参数值确定为目标参数值, 所述目标参数值对应的损失函数为目标损 失函数; 调整所述目标损失函数的叶子节点权重使得所述xgboost模型输出的预测值更接近所 述真实值。 3.如权利要求2所述的模型训练的方法, 其特征在于, 所述xgboost模型的损失函数是 通过以下公式获得: 其中, L表示所述损失函数,T表示当前所述树结构 模型中叶子节点的数量, ft(xi)表示当前所述树结构模型的函数表示, 表示控制叶子数量 的超参数, 表示控制叶子权重的L2超参数, w表示叶子权重, yi表示当前所述树结构模型的 真实值,表示前t-1棵所述树结构模型的预测值,表示偏导数, l表。

6、示残差方程, n表示 酒店订单的历史数据总数。 4.如权利要求1所述的模型训练的方法, 其特征在于, 所述方法还包括: 获取所述多个酒店订单对应的所述历史数据之后, 对所述历史数据进行预处理操作, 其中, 所述预处理操作包括剔除订单回复时长大于预设时长的所述酒店订单。 5.一种模型训练的系统, 其特征在于, 所述系统包括: 获取模块, 用于获取多个酒店订单的历史数据; 提取模块, 用于从所述历史数据中提取特征数据, 其中, 所述特征数据包括用户下单时 间点信息、 订单类型信息、 酒店静态属性信息、 节假日信息以及酒店供应商的渠道信息, 所 述用户下单时间点信息用于表征下单时间点处于工作时段或非。

7、工作时段; 权利要求书 1/3 页 2 CN 111639807 A 2 训练模块, 用于将获取到的所述特征数据输入xgboost模型进行训练, 当所述历史数据 中订单回复时长的真实值与所述xgboost模型输出的预测值之间误差的绝对值最小时, 生 成订单回复时长预测模型; 其中, 所述xgboost模型为根据所述特征数据构造的多棵串行的 树结构模型。 6.如权利要求5所述的模型训练的系统, 其特征在于, 所述训练模块, 包括: 获取单元, 用于获取所述xgboost模型以及损失函数的初始超参数值; 初始化单元, 用于基于所述损失函数的初始超参数值对所述xgboost模型进行初始化; 第一调整。

8、单元, 用于根据所述特征数据以及所述损失函数, 对初始化后的所述xgboost 模型的初始超参数值进行参数调整以使得对应的损失函数减小; 确定单元, 用于当每次调整后的所述xgboost模型对应的损失函数不再继续减小时, 则 将调整后的所述xgboost模型的超参数值确定为目标参数值, 所述目标参数值对应的损失 函数为目标损失函数; 第二调整单元, 用于调整所述目标损失函数的叶子节点权重使得所述xgboost模型输 出的预测值更接近所述真实值。 7.如权利要求6所述的模型训练的系统, 其特征在于, 所述xgboost模型的损失函数是 通过以下公式获得: 其中, L表示所述损失函数,T表示当前所。

9、述树结 构模型中叶子节点的数量, ft(xi)表示当前所述树结构模型的函数表示, 表示控制叶子数 量的超参数, 表示控制叶子权重的L2超参数, w表示叶子权重, yi表示当前所述树结构模型 的真实值,表示前t-1棵所述树结构模型的预测值, 表示偏导数, l表示残差方程, n表 示酒店订单的历史数据总量。 8.如权利要求5所述的模型训练的系统, 其特征在于, 所述系统还包括: 预处理模块, 用于获取所述多个酒店订单对应的所述历史数据之后, 对所述历史数据 进行预处理操作, 其中, 所述预处理操作包括剔除订单回复时长大于预设时长的所述酒店 订单。 9.一种订单回复时长预测的方法, 其特征在于, 所。

10、述方法包括: 实时接收待预测的目标酒店订单; 将所述目标酒店订单输入利用如权利要求1-4中任一项所述的方法训练出的所述订单 回复时长预测模型中, 得到回复时长值。 10.如权利要求9所述的订单回复时长预测的方法, 其特征在于, 所述方法还包括: 获取所述目标酒店订单的订单类型和用户下单时间点; 根据所述订单类型、 所述用户下单时间点以及所述回复时长值确定催单时间; 基于所述催单时间发送所述目标酒店订单对应的催单信息。 11.一种订单回复时长预测的系统, 其特征在于, 所述系统包括: 接收模块, 用于实时接收待预测的目标酒店订单; 权利要求书 2/3 页 3 CN 111639807 A 3 输。

11、入模块, 用于将所述目标酒店订单输入利用如权利要求5-8中任一项所述的系统训 练出的所述订单回复时长预测模型中, 得到回复时长值。 12.如权利要求11所述的订单回复时长预测的系统, 其特征在于, 所述系统还包括: 获取模块, 用于获取所述目标酒店订单的订单类型和用户下单时间点; 确定模块, 用于根据所述订单类型、 所述用户下单时间点以及所述回复时长值确定催 单时间; 发送模块, 用于基于所述催单时间发送所述目标酒店订单对应的催单信息。 13.一种电子设备, 其特征在于, 包括处理器、 存储器及存储在所述存储器上并可在所 述处理器上运行的计算机程序, 所述计算机程序被所述处理器执行时实现如权利。

12、要求1-4 中的任一项所述的模型训练的方法, 或执行如权利要求9或10所述的订单回复时长预测的 方法。 14.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质上存储计算机程 序, 所述计算机程序被处理器执行时实现如权利要求1-4中任一项所述的模型训练的方法, 或者执行如权利要求9或10所述的订单回复时长预测的方法的步骤。 权利要求书 3/3 页 4 CN 111639807 A 4 模型训练的方法、 时长预测的方法、 系统、 设备及介质 技术领域 0001 本发明涉及模型训练技术, 尤其涉及一种模型训练的方法、 时长预测的方法、 系 统、 设备及介质。 背景技术 0002 大型的。

13、互联网公司针对部分供应商称之为代理通, 例如, 华闽和大都市为酒店业 务最常见的供应商。 每个酒店下可对应多家子酒店, 该子酒店可以分别由多家不同的旅行 社代理销售, 因而上述旅行社也称之为代理通。 用户在互联网客户端上下单代理通订单时, 需要等供应商确认该订单中酒店房间的库存情况后, 互联网公司才能最后确认给用户该订 单中的酒店商品是否真实可订。 此过程中用户存在等候时间差, 称之为确认时长, 该确认时 长的开始时间点为用户下单时间点, 截止时间点是供应商回复时间点。 若确认时长过长, 则 会影响用户体验。 因此, 互联网公司针对该问题采取了人工催单的方式, 根据酒店订单类型 以及下单时间点。

14、来预测该酒店订单所需的等候时间。 0003 现有技术中该等候时间完全由业务人员根据业务经验制定, 大量不必要的催单会 造成人力成本的升高, 并且完全由业务人员根据业务经验判断催单时间, 预测准确率低。 发明内容 0004 本发明要解决的技术问题是为了克服现有技术中业务人员根据业务经验判断酒 店订单的催单时间, 预测准确率低的缺陷, 提供一种模型训练的方法、 时长预测的方法、 系 统、 设备及介质。 0005 本发明是通过下述技术方案来解决上述技术问题: 0006 第一方面, 本发明提供一种模型训练的方法, 所述方法包括: 0007 获取多个酒店订单的历史数据; 0008 从所述历史数据中提取特。

15、征数据, 其中, 所述特征数据包括用户下单时间点信息、 订单类型信息、 酒店静态属性信息、 节假日信息以及酒店供应商的渠道信息, 所述用户下单 时间点信息用于表征下单时间点处于工作时段或非工作时段; 0009 将获取到的所述特征数据输入xgboost模型进行训练, 当所述历史数据中订单回 复时长的真实值与所述xgboost模型输出的预测值之间误差的绝对值最小时, 生成订单回 复时长预测模型; 其中, 所述xgboost模型为根据所述特征数据构造的多棵串行的树结构模 型。 0010 较佳地, 所述将获取到的所述特征数据输入xgboost模型进行训练的步骤, 包括: 0011 获取所述xgboos。

16、t模型以及损失函数的初始超参数值; 0012 基于所述损失函数的初始超参数值对所述xgboost模型进行初始化; 0013 根据所述特征数据以及所述损失函数, 对初始化后的所述xgboost模型的初始超 参数值进行参数调整以使得对应的损失函数减小; 0014 当每次调整后的所述xgboost模型对应的损失函数不再继续减小时, 则将调整后 说明书 1/11 页 5 CN 111639807 A 5 的所述xgboost模型的超参数值确定为目标参数值, 所述目标参数值对应的损失函数为目 标损失函数; 0015 调整所述目标损失函数的叶子节点权重使得所述xgboost模型输出的预测值更接 近所述真实。

17、值。 0016 较佳地, 所述xgboost模型的损失函数是通过以下公式获得: 0017 0018其中, L表示所述损失函数,T表示当前所述 树结构模型中叶子节点的数量, ft(xi)表示当前所述树结构模型的函数表示, 表示控制叶 子数量的超参数, 表示控制叶子权重的L2超参数, w表示叶子权重, yi表示当前所述树结构 模型的真实值,表示前t-1棵所述树结构模型的预测值, 表示偏导数, l表示残差方 程, n表示酒店订单的历史数据总数。 0019 较佳地, 所述方法还包括: 0020 获取所述多个酒店订单对应的所述历史数据之后, 对所述历史数据进行预处理操 作, 其中, 所述预处理操作包括剔。

18、除订单回复时长大于预设时长的所述酒店订单。 0021 第二方面, 本发明提供一种模型训练的系统, 所述系统包括: 0022 获取模块, 用于获取多个酒店订单的历史数据; 0023 提取模块, 用于从所述历史数据中提取特征数据, 其中, 所述特征数据包括用户下 单时间点信息、 订单类型信息、 酒店静态属性信息、 节假日信息以及酒店供应商的渠道信 息, 所述用户下单时间点信息用于表征下单时间点处于工作时段或非工作时段; 0024 训练模块, 用于将获取到的所述特征数据输入xgboost模型进行训练, 当所述历史 数据中订单回复时长的真实值与所述xgboost模型输出的预测值之间误差的绝对值最小 时。

19、, 生成订单回复时长预测模型; 其中, 所述xgboost模型为根据所述特征数据构造的多棵 串行的树结构模型。 0025 较佳地, 所述训练模块, 包括: 0026 获取单元, 用于获取所述xgboost模型以及损失函数的初始超参数值; 0027 初始化单元, 用于基于所述损失函数的初始超参数值对所述xgboost模型进行初 始化; 0028 第一调整单元, 用于根据所述特征数据以及所述损失函数, 对初始化后的所述 xgboost模型的初始超参数值进行参数调整以使得对应的损失函数减小; 0029 确定单元, 用于当每次调整后的所述xgboost模型对应的损失函数不再继续减小 时, 则将调整后的。

20、所述xgboost模型的超参数值确定为目标参数值, 所述目标参数值对应的 损失函数为目标损失函数; 0030 第二调整单元, 用于调整所述目标损失函数的叶子节点权重使得所述xgboost模 型输出的预测值更接近所述真实值。 0031 较佳地, 所述xgboost模型的损失函数是通过以下公式获得: 说明书 2/11 页 6 CN 111639807 A 6 0032 0033其中, L表示所述损失函数,T表示当前所述 树结构模型中叶子节点的数量, ft(xi)表示当前所述树结构模型的函数表示, 表示控制叶 子数量的超参数, 表示控制叶子权重的L2超参数, w表示叶子权重, yi表示当前所述树结构。

21、 模型的真实值,表示前t-1棵所述树结构模型的预测值, 表示偏导数, l表示残差方 程, n表示酒店订单的历史数据总量。 0034 较佳地, 所述系统还包括: 0035 预处理模块, 用于获取所述多个酒店订单对应的所述历史数据之后, 对所述历史 数据进行预处理操作, 其中, 所述预处理操作包括剔除订单回复时长大于预设时长的所述 酒店订单。 0036 第三方面, 本发明提供一种订单回复时长预测的方法, 所述方法包括: 0037 实时接收待预测的目标酒店订单; 0038 将所述目标酒店订单输入利用如上述的方法训练出的所述订单回复时长预测模 型中, 得到回复时长值。 0039 较佳地, 所述方法还包。

22、括: 0040 获取所述目标酒店订单的订单类型和用户下单时间点; 0041 根据所述订单类型、 所述用户下单时间点以及所述回复时长值确定催单时间; 0042 基于所述催单时间发送所述目标酒店订单对应的催单信息。 0043 第四方面, 本发明提供一种订单回复时长预测的系统, 所述系统包括: 0044 接收模块, 用于实时接收待预测的目标酒店订单; 0045 输入模块, 用于将所述目标酒店订单输入利用如上述的系统训练出的所述订单回 复时长预测模型中, 得到回复时长值。 0046 较佳地, 所述系统还包括: 0047 获取模块, 用于获取所述目标酒店订单的订单类型和用户下单时间点; 0048 确定模。

23、块, 用于根据所述订单类型、 所述用户下单时间点以及所述回复时长值确 定催单时间; 0049 发送模块, 用于基于所述催单时间发送所述目标酒店订单对应的催单信息。 0050 第五方面, 本发明还提供一种电子设备, 包括处理器、 存储器及存储在所述存储器 上并可在所述处理器上运行的计算机程序, 所述计算机程序被所述处理器执行时实现第一 方面所述的模型训练的方法, 或者执行第三方面所述的订单回复时长预测的方法。 0051 第六方面, 本发明还提供一种计算机可读存储介质, 所述计算机可读存储介质上 存储计算机程序, 所述计算机程序被处理器执行时实现上述第一方面所述的模型训练的方 法, 或者执行第三方。

24、面所述的订单回复时长预测的方法的步骤。 0052 本发明的积极进步效果在于: 提供一种模型训练的方法、 时长预测的方法、 系统、 设备及介质。 本发明提供的模型训练的方法和订单回复时长预测的方法, 通过训练订单回 说明书 3/11 页 7 CN 111639807 A 7 复时长预测模型来提高预测的准确度, 再利用订单回复时长预测的方法解决了只是单纯基 于人工预测订单回复时长时, 人力成本高, 准确性差的问题, 最终提高了预测酒店订单的催 单时间的准确率的同时降低了人力成本。 附图说明 0053 图1为本发明实施例1的模型训练的方法的流程图。 0054 图2为本发明实施例1的模型训练的方法的步。

25、骤S14的流程图。 0055 图3为本发明实施例2的模型训练的系统的模块示意图。 0056 图4为本发明实施例3的订单回复时长预测的方法的流程图。 0057 图5为本发明实施例4的订单回复时长预测的系统的模块示意图。 0058 图6为本发明实施例5的电子设备的硬件结构示意图。 具体实施方式 0059 下面通过实施例的方式进一步说明本发明, 但并不因此将本发明限制在所述的实 施例范围之中。 下列实施例中未注明具体条件的实验方法, 按照常规方法和条件, 或按照商 品说明书选择。 0060 实施例1 0061 本实施例提供一种模型训练的方法, 参照图1, 该方法包括以下步骤: 0062 步骤S11、。

26、 获取多个酒店订单的历史数据。 0063 接收到多个酒店订单的历史数据, 该历史数据中包括酒店的下单时间点、 酒店名 称、 酒店所在的城市、 酒店的催单信息以及酒店的回复时长。 该酒店订单的历史数据的时段 可以为7天、 30天、 90天以及180天。 0064 步骤S12、 对历史数据进行预处理操作, 其中, 预处理操作包括剔除订单回复时长 大于预设时长的酒店订单。 0065 将获取到多个酒店订单对应的历史数据之后, 从酒店代理商业务方了解到小酒店 的确认方式是只要是到店存在房源, 就会及时的对该订单信息进行回复确认是否为可订购 的酒店订单。 但是也存在一系列订单的回复时长长达20多个小时, 。

27、有的酒店订单的历史数 据中回复时长甚至为几天。 因此, 本实施例中, 过滤掉酒店订单信息中回复时长大于预设时 长的酒店订单, 该预设时长可以为3个小时、 6个小时或者10个小时, 此处不作具体限制。 0066 步骤S13、 从历史数据中提取特征数据, 其中, 特征数据包括用户下单时点信息、 订 单类型信息、 酒店静态属性信息、 节假日信息以及酒店供应商的渠道信息, 用户下单时间点 信息用于表征下单时间点处于工作时段或非工作时段。 0067 本实施例中, 下单时间点信息表示处于酒店客房代理商的工作时段或者非工作时 段, 该工作时段可以指早上9: 00至下午17: 00, 非工作时段可以指早上9:。

28、 00至下午17: 00之 外的时间。 订单类型信息表示是当日的酒店订单还是隔日的酒店订单; 酒店静态属性信息 可以包括酒店的星级、 酒店所在的城市、 酒店所在的商圈、 酒店所在的国家; 节假日信息可 以包括国庆、 元旦、 中秋或者端午; 供应商渠道信息包括旅行社A、 旅行社B以及旅行社C的信 息。 0068 步骤S14、 将获取到的特征数据输入xgboost模型进行训练, 当历史数据中订单回 说明书 4/11 页 8 CN 111639807 A 8 复时长的真实值与xgboost模型输出的预测值之间误差的绝对值最小时, 生成订单回复时 长预测模型, 其中, 该xgboost模型为根据特征数。

29、据构造的多棵串行的树结构模型。 0069 本申请实施例中, 通过从酒店订单的历史数据的中获取该订单在用户下单后, 被 确定该订单可以订购或者因为库存不够而不能被订购的时间段, 该时间段为订单回复时长 的真实值。 0070 将所有特征数据输入xgboost模型进行训练后, 通过调整损失函数的超参数值并 且结合特征数据判断, 每次进行超参数的调整后xgboost模型的树结构中当前节点分裂是 否会导致损失函数减小, 如果继续减小, 则继续进行分裂, 若不减小, 则该节点为xgboost模 型的树结构中的叶子节点, 该超参数的大小决定了xgboost模型的树结构中叶子节点的数 量。 0071 进一步的。

30、, 通过多次的循环迭代, 根据每个酒店订单的历史数据, 利用该xgboost 模型输出的预测值与历史数据中包含的真实值之间的误差达到预设阈值时, 则生成订单回 复时长预测模型, 该预设阈值为真实值与xgboost模型输出的预测值之间误差的绝对值最 小值。 0072 本实施中, 一种模型训练的方法, 参照图2, 步骤S14包括以下: 0073 步骤S141、 获取xgboost模型以及损失函数的初始超参数值。 0074 步骤S142、 基于损失函数的初始超参数值对xgboost模型进行初始化。 0075 步骤S143、 根据特征数据以及损失函数, 对初始化后的xgboost模型的初始超参数 值进。

31、行参数调整以使得对应的损失函数减小。 0076 步骤S144、 当每次调整后的xgboost模型对应的损失函数不再继续减小时, 则将调 整后的xgboost模型的超参数值确定为目标参数值, 目标参数值对应的损失函数为目标损 失函数。 0077 每次对损失函数中的初始超参数值进行调整时, 损失函数继续减少, 则代表 xgboost模型继续分裂, 因此, 调整初始超参数值使得损失函数减小到最小值, 即不再继续 减小时, 该状态的下的损失函数下xgboost模型的预测值与真实值较为接近。 0078 步骤S145、 调整目标损失函数的叶子节点权重使得xgboost模型输出的预测值更 接近真实值。 00。

32、79 具体的, 目标损失函数的叶子节点权重的调整是为了确保利用xgboost模型输出 的预测值与真实值的差值的绝对值在预设阈值范围内, 该预测值阈值通过为10或者5。 通过叶子节点权重的调节, 确保了xgboost模型预测的准确度。 0080 其中, 该xgboost模型的损失函数是通过以下公式获得: 0081 0082其中, L表示损失函数,T表示当前树结构模 型中叶子节点的数量, ft(xi)表示当前树结构模型的函数表示, 表示控制叶子数量的超参 数, 表示控制叶子权重的L2超参数, w表示叶子权重, yi表示当前树结构模型的真实值, 说明书 5/11 页 9 CN 111639807 A。

33、 9 表示前t-1棵树结构模型的预测值,表示偏导数, l表示残差方程, n表示酒店订单的 历史数据总数。 0083本实施例中, 叶子节点的权重其中k表示训练阶段落入该叶子 节点的样本数据, j表示这个叶子在这棵树的索引, 通过多次类似循环迭代即完成了 xgboost模型的训练, 在整个过程中可以通过调节丰富的超参数来实现模型效果最优化。 0084 待模型利用训练数据训练完成之后, 再利用测试数据对模型进行测试。 可以利用 回归问题的思路, 使用模型对酒店订单历史数据中的订单回复时长的预测值与该酒店订单 的真实值进行对比, 计算两者的绝对平均误差, 作为该模型训练的优劣判别的标准。 0085 本。

34、发明实施例中, 提供一种模型训练的方法, 通过获取历史数据中的特征数据, 调 整多课串行的树结构xgboost模型中的超参数, 当每次调整后的xgboost模型对应的损失函 数不再继续减小时, 则将调整后的xgboost模型的超参数值确定为目标参数值, 调整目标损 失函数的叶子节点权重, 提高利用xgboost模型预测酒店订单的回复时长的准确度。 0086 实施例2 0087 本实施例提供一种模型训练的系统, 参照图3, 包括: 获取模块110、 预处理模块 120、 提取模块130以及训练模块140。 0088 其中, 获取模块110, 用于获取多个酒店订单的历史数据。 0089 获取模块1。

35、10接收到多个酒店订单的历史数据, 该历史数据中包括酒店的下单时 间点、 酒店名称、 酒店所在的城市、 酒店的催单信息以及酒店的回复时长。 该酒店订单的历 史数据的时段可以为7天、 30天、 90天以及180天。 0090 预处理模块120, 用于获取多个酒店订单对应的历史数据之后, 对历史数据进行预 处理操作, 其中, 预处理操作包括剔除订单回复时长大于预设时长的酒店订单。 0091 预处理模块120将获取到多个酒店订单对应的历史数据之后, 从酒店代理商业务 方了解到小酒店的确认方式是只要是到店存在房源, 就会及时的对该订单信息进行回复确 认是否为可订购的酒店订单。 但是也存在一系列订单的回。

36、复时长长达20多个小时, 有的酒 店订单的历史数据中回复时长甚至为几天。 因此, 本实施例中, 过滤掉酒店订单信息中回复 时长大于预设时长的酒店订单, 该预设时长可以为3个小时、 6个小时或者10个小时, 此处不 作具体限制。 0092 提取模块130, 用于从历史数据中提取特征数据, 其中, 特征数据包括用户下单时 间点信息、 订单类型信息、 酒店静态属性信息、 节假日信息以及酒店供应商的渠道信息, 用 户下单时间点信息用于表征下单时间点处于工作时段或非工作时段。 0093 本实施例中, 提取模块130提取的特征数据中下单时间点信息表示处于酒店客房 代理商的工作时段或者非工作时段, 该工作时。

37、段可以指早上9: 00至下午17: 00, 非工作时段 可以指早上9: 00至下午17: 00之外的时间。 订单类型信息表示是当日的酒店订单还是隔日 的酒店订单; 酒店静态属性信息可以包括酒店的星级、 酒店所在的城市、 酒店所在的商圈、 酒店所在的国家; 节假日信息可以包括国庆、 元旦、 中秋或者端午; 供应商渠道信息包括旅 行社A、 旅行社B以及旅行社C的信息。 0094 训练模块140, 用于将获取到的特征数据输入xgboost模型进行训练, 当历史数据 说明书 6/11 页 10 CN 111639807 A 10 中订单回复时长的真实值与xgboost模型输出的预测值之间误差的绝对值最。

38、小时, 生成订 单回复时长预测模型; 其中, 该xgboost模型为根据特征数据构造的多棵串行的树结构模 型。 0095 本申请实施例中, 通过从酒店订单的历史数据的中获取该订单在用户下单后, 被 确定该订单可以订购或者因为库存不够而不能被订购的时间段, 该时间段为订单回复时长 的真实值。 0096 将所有特征数据输入xgboost模型进行训练后, 通过调整损失函数的超参数值并 且结合特征数据判断, 每次进行超参数的调整后xgboost模型的树结构中当前节点分裂是 否会导致损失函数减小, 如果继续减小, 则继续进行分裂, 若不减小, 则该节点为xgboost模 型的树结构中的叶子节点, 该超参。

39、数的大小决定了xgboost模型的树结构中叶子节点的数 量。 0097 进一步的, 通过多次的循环迭代, 根据每个酒店订单的历史数据, 利用该xgboost 模型输出的预测值与历史数据中包含的真实值之间的误差达到预设阈值时, 则生成订单回 复时长预测模型, 该预设阈值为真实值与xgboost模型输出的预测值之间误差的绝对值最 小值 0098 本实施例中, 该训练模块140, 还包括: 0099 获取单元141, 用于获取xgboost模型以及损失函数的初始超参数值。 0100 初始化单元142, 用于基于损失函数的初始超参数值对xgboost模型进行初始化。 0101 第一调整单元143, 用。

40、于根据特征数据以及损失函数, 对初始化后的xgboost模型 的初始超参数值进行参数调整以使得对应的损失函数减小。 0102 确定单元144, 用于当每次调整后的xgboost模型对应的损失函数不再继续减小 时, 则将调整后的xgboost模型的超参数值确定为目标参数值, 目标参数值对应的损失函数 为目标损失函数。 0103 每次对损失函数中的初始超参数值进行调整时, 损失函数继续减少, 则代表 xgboost模型继续分裂, 因此, 调整初始超参数值使得损失函数减小到最小值, 即不再继续 减小时, 该状态的下的损失函数下xgboost模型的预测值与真实值较为接近。 0104 第二调整单元145。

41、, 用于调整目标损失函数的叶子节点权重使得xgboost模型输出 的预测值更接近真实值。 0105 具体的, 目标损失函数的叶子节点权重的调整是为了确保利用xgboost模型输出 的预测值与真实值的差值的绝对值在预设阈值范围内, 该预测值阈值通过为10或者5。 通过叶子节点权重的调节, 确保了xgboost模型预测的准确度。 0106 其中, 该xgboost模型的损失函数是通过以下公式获得: 0107 0108其中, L表示损失函数,T表示当前树结构模 型中叶子节点的数量, ft(xi)表示当前树结构模型的函数表示, 表示控制叶子数量的超参 数, 表示控制叶子权重的L2超参数, w表示叶子权。

42、重, yi表示当前树结构模型的真实值, 说明书 7/11 页 11 CN 111639807 A 11 表示前t-1棵树结构模型的预测值,表示偏导数, l表示残差方程, n表示酒店订单的 历史数据总数。 0109本实施例中, 叶子节点的权重其中k表示训练阶段落入该叶子 节点的样本数据, j表示这个叶子在这棵树的索引, 通过多次类似循环迭代即完成了 xgboost模型的训练, 在整个过程中可以通过调节丰富的超参数来实现模型效果最优化。 0110 待模型利用训练数据训练完成之后, 再利用测试数据对模型进行测试。 可以利用 回归问题的思路, 使用模型对酒店订单历史数据中的订单回复时长的预测值与该酒店。

43、订单 的真实值进行对比, 计算两者的绝对平均误差, 作为该模型训练的优劣判别的标准。 0111 本发明实施例中, 提供一种模型训练的系统, 提取模块通过获取历史数据中的特 征数据, 训练模块调整多课串行的树结构xgboost模型中的超参数, 当每次调整后的 xgboost模型对应的损失函数不再继续减小时, 则将调整后的xgboost模型的超参数值确定 为目标参数值, 调整目标损失函数的叶子节点权重, 提高利用xgboost模型预测酒店订单的 回复时长的准确度。 0112 实施例3 0113 本实施例提供一种订单回复时长预测的方法, 参照图4, 该方法包括: 0114 步骤S21、 实时接收待预。

44、测的目标酒店订单。 0115 在OTA(Online Travel Agency, 在线旅游)行业中, 由于一家酒店中不同的客房会 由互联网公司A、 互联网公司B、 互联网公司C、 旅行社A、 旅行社B以及旅行社C代理销售。 若客 户在互联网公司A的客户端上对某家酒店进行下单操作, 但是下单的酒店中该客房是由旅 行社A代理销售的, 所以当用户在互联网公司A的客户端下单时, 需要向旅行社A的供应商确 认库存后, 才能确认给客户该订单是否真实可订。 该过程存在用户等待的时间差, 即确认时 长。 0116 目前代理商的订单数据都存储在云端服务器的数据库中, 使用开发工具将云端服 务器数据库中, 代理。

45、商的酒店订单数据同步截取到互联网公司A的服务器数据库中。 0117 互联网公司的服务器每天同步实时接收待预测的酒店订单信息, 该酒店订单信息 包括酒店名称、 酒店地址、 酒店星级、 供应商渠道信息等。 0118 步骤S22、 将目标酒店订单输入利用如实施例1的方法训练出的订单回复时长预测 模型中, 得到回复时长值。 0119 将目标酒店订单的数据输入利用xgboost模型训练后生成的订单回复时长预测模 型中, 该订单回复时长会从目标酒店订单数据中提取特征数据, 利用该特征数据进行分析 预测。 0120 步骤S23、 获取目标酒店订单的订单类型和用户下单时间点。 0121 从目标酒店订单中获取订。

46、单类型, 即为当天入住酒店的订单还是次日入住酒店的 订单; 用户下单时间点为工作时段还是非工作时段。 0122 步骤S24、 根据订单类型、 用户下单时间点以及回复时长值确定催单时间。 0123 本实施例中, 利用xgboost模型对未来每个由不同旅行社代理的酒店订单进行预 测, 确定酒店订单的回复时长。 互联网公司的业务方根据该回复时长值, 结合其他相关的信 说明书 8/11 页 12 CN 111639807 A 12 息指定一个适合的催单时间。 例如: 原本4分钟可以回复的紧急订单, 但是只要等到3分钟就 要催, 即节省了不必要的催单人力, 降低了催单的成本。 0124 步骤S25、 基。

47、于催单时间发送目标酒店订单对应的催单信息。 0125 本实施例中, 基于该催单时间向酒店订单的不同的旅行社发送相应的催单信息。 当互联网公式的业务方向酒店订单的旅行社代理商可以每次连续发送一条催单信息, 也可 以在第一次催单信息发送完成后, 设置每隔1分钟、 或者每隔2分钟发送一次催单信息。 直到 旅行社的代理商接收到催单信息, 并返回确认订单可订或者不可订为止。 0126 本发明实施例中, 提供一种订单回复时长预测的方法, 利用通过训练生成的订单 预测模型, 结合下单时间点以及订单类型确定该订单有无必要发起催单, 该模型通过尽可 能准确的预测每个酒店订单的回复时长为业务方决策提供可靠的支持,。

48、 从而实现降低催单 率的目的。 0127 实施例4 0128 本实施例提供一种订单回复时长预测的系统, 参照图5, 该系统包括: 接收模块 210、 输入模块220、 获取模块230、 确定模块240以及发送模块250。 0129 其中, 接收模块210, 用于实时接收待预测的目标酒店订单。 0130 在OTA(Online Travel Agency, 在线旅游)行业中, 由于一家酒店中不同的客房会 由互联网公司A、 互联网公司B、 互联网公司C、 旅行社A、 旅行社B以及旅行社C代理销售。 若客 户在互联网公司A的客户端上对某家酒店进行下单操作, 但是下单的酒店中该客房是由旅 行社A代理销。

49、售的, 所以当用户在互联网公司A的客户端下单时, 需要向旅行社A的供应商确 认库存后, 才能确认给客户该订单是否真实可订。 该过程存在用户等待的时间差, 即确认时 长。 0131 目前代理商的订单数据都存储在云端服务器的数据库中, 使用开发工具将云端服 务器数据库中, 代理商的酒店订单数据同步截取到互联网公司A的服务器数据库中。 0132 接收模块210每天同步实时接收待预测的酒店订单信息, 该酒店订单信息包括酒 店名称、 酒店地址、 酒店星级、 供应商渠道信息等。 0133 输入模块220, 用于将目标酒店订单输入利用实施例2的系统训练出的订单回复时 长预测模型中, 得到回复时长值。 013。

50、4 输入模块220将目标酒店订单的数据输入利用xgboost模型训练后生成的订单回 复时长预测模型中, 该订单回复时长会从目标酒店订单数据中提取特征数据, 利用该特征 数据进行分析预测。 0135 获取模块230, 用于获取目标酒店订单的订单类型和用户下单时间点。 0136 获取模块230从目标酒店订单中获取订单类型, 即为当天入住酒店的订单还是次 日入住酒店的订单; 用户下单时间点为工作时段还是非工作时段。 0137 确定模块240, 用于根据订单类型、 用户下单时间点以及回复时长值确定催单时 间。 0138 本实施例中, 利用xgboost模型对未来每个由不同旅行社代理的酒店订单进行预 测。

展开阅读全文
内容关键字: 模型 训练 方法 预测 系统 设备 介质
关于本文
本文标题:模型训练的方法、时长预测的方法、系统、设备及介质.pdf
链接地址:https://www.zhuanlichaxun.net/pdf/10437805.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1