基于各门店商品相似度聚类的区域商品生产计划方法.pdf

上传人:倪** 文档编号:10262784 上传时间:2021-06-16 格式:PDF 页数:11 大小:658.49KB
收藏 版权申诉 举报 下载
基于各门店商品相似度聚类的区域商品生产计划方法.pdf_第1页
第1页 / 共11页
基于各门店商品相似度聚类的区域商品生产计划方法.pdf_第2页
第2页 / 共11页
基于各门店商品相似度聚类的区域商品生产计划方法.pdf_第3页
第3页 / 共11页
文档描述:

《基于各门店商品相似度聚类的区域商品生产计划方法.pdf》由会员分享,可在线阅读,更多相关《基于各门店商品相似度聚类的区域商品生产计划方法.pdf(11页完成版)》请在专利查询网上搜索。

1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202010467295.9 (22)申请日 2020.05.28 (71)申请人 杭州览众数据科技有限公司 地址 310000 浙江省杭州市滨江区西兴街 道物联网街451号芯图大厦17层 (72)发明人 王一君陈灿黄国安吴珊珊 (74)专利代理机构 杭州君度专利代理事务所 (特殊普通合伙) 33240 代理人 朱月芬 (51)Int.Cl. G06Q 30/02(2012.01) G06K 9/62(2006.01) (54)发明名称 一种基于各门店商品相似度聚类的区域商 品生。

2、产计划方法 (57)摘要 本发明公开了一种基于各门店商品相似度 聚类的区域商品生产计划方法。 本发明具体包括 以下步骤: 首先根据该地区各门店所有商品每天 的历史销售记录数据,计算各商品在时序周期性 上的相似度矩阵; 然后根据外部因素在不同状态 下计算出商品销量的变化量, 得到各商品之间的 敏感程度距离矩阵; 再基于聚类算法, 结合时序 周期相似度和敏感程度距离矩阵将各商品在门 店级别进行聚类, 根据手肘法则与轮廓系数选出 最优K类, 并在在该聚类后的级别上对未来销量 做预测, 最后将K类需求进行汇总, 给出区域的生 产计划。 本发明有利于降低缺货损失以及积压报 损风险, 提升区域生产计划精准。

3、度有重要作用。 权利要求书3页 说明书6页 附图1页 CN 111815348 A 2020.10.23 CN 111815348 A 1.一种基于各门店商品相似度聚类的区域商品生产计划方法,其特征在于包括以下步 骤: 步骤1: 首先获取所有门店商品历史指定时间段内的交易明细数据集D, 且去除交易明 细数据集D中的活动信息和节假日信息, 然后按天为颗粒度统计得到各门店商品的日销售 数量集S; 步骤2: 基于商品的日销售数量集S, 计算得到各商品在周期性上的时间需求模式T: 其中, 为商品在周i的平均销量, ni表示指定时间段内周i的天数; d1,ni; 步骤3: 根据指定时间段内的日销售数据集。

4、S和天气因素数据集X, 将天气因素数据集X 作为模型输入x, 日销售数据集作为模型输出y, 训练一个线性回归模型; 然后基于每个外部 天气因素数据集X的变化, 得到归回系数即日销量的变化率矩阵E; 步骤4: 基于历史门店日销售数据集S, 从日销售数据集S中临近一个月内的销售数据, 计算得到同商品门店之间的时间需求模式距离, 公式如下: 其中, i,j代表两个不同的门店,Tik表示门店i时间需求模式T中的第k个元素; 步骤5: 基于各门店各商品的变化率矩阵E,计算得到各门店级别之间外部因素变化率 距离, 公式如下: 其中, i,j代表两个不同的门店,表示门店i外部因素变化率矩阵E中的第k个元素;。

5、 步骤6: 基于时间需求模式距离DisT和外部因素变化率距离DisE, 计算得到商品在门店 级别的距离计算方法, 公式如下: DIS(i, j)DisT(i, j)+DisE(i, j)(5) DisT(i, j)表示门店i,j在时间需求模式上的距离, DisE(i, j)表示门店i,j在外部因素 变化率上的距离, DIS(i, j)表示门店i,j之间的整体距离; 步骤7: 根据定义的门店间的距离公式(5), 将相似门店聚类; 所述的相似门店即定义的门店间的距离; 步骤8: 根据最小类内距离和轮廓系数得出最优类评估Score, 根据最优类评估Score结 合选出最优分类个数k; 步骤9: 根据。

6、Score得到最优类别数k后, 将销量在该类级别中汇总; 步骤10: 使用ARIMA模型预测未来销量yt; 步骤11: 对各类别的未来销量yt进行汇总, 得到的总体预测需求量即为该区域商品生产 计划。 2.根据权利要求1所述的一种基于各门店商品相似度聚类的区域商品生产计划方法, 权利要求书 1/3 页 2 CN 111815348 A 2 其特征在于步骤7所述的聚类采用k均值聚类, 实现如下: 输入: 数据集 输出: 类中心点各点的标签C 初始化: 随机从数据集S中选择k个中心点 1, ,k 首先初始化随机选取k个类中心点, 对每个样本s(i), 将其分到距离 j最近的类别标记为 c(j), 。

7、根据c(j)更新每个类别中心点 j的值, 重复迭代, 直到类中心不发生变化或变化量小于 某个阈值; 得到的c即为各门店所在的类,以及类内相似的门店。 3.根据权利要求1或2所述的一种基于各门店商品相似度聚类的区域商品生产计划方 法,其特征在于步骤8具体实现如下: 类内距离SSE: 通过选择使总体距离最小的方式来选择类个数k; 轮廓系数SC: a(i)为样本i到类内其他样本的平均距离, b(i)为样本i到其他类的所有样本的平均距 离, 选择类内距离越小, 类间距离越大的类中心k个数; 最优类评估Score: 将类内距离与轮廓系数相结合的方法, 在合理类中心数范围内, 使类内距离越小, 类间 权利。

8、要求书 2/3 页 3 CN 111815348 A 3 距离越大的k个数。 4.根据权利要求3所述的一种基于各门店商品相似度聚类的区域商品生产计划方法, 其特征在于步骤9所述的根据Score得到最优类别数k后, 将销量在该类级别中汇总, 获得汇 总后的销售数据, 具体实现如下: 将属于c(k)这一类的门店样本商品销量s(i)进行一个汇总。 5.根据权利要求4所述的一种基于各门店商品相似度聚类的区域商品生产计划方法, 其特征在于步骤10所述的使用ARIMA模型预测未来销量,具体实现如下: 将汇总后的销售数据X作为模型输入x: 是常数项, t是误差项, i是自相关系数, i是误差项系数。 权利要。

9、求书 3/3 页 4 CN 111815348 A 4 一种基于各门店商品相似度聚类的区域商品生产计划方法 技术领域 0001 本发明属于信息技术领域, 具体涉及一种基于各门店商品相似度聚类的区域商品 生产计划方法。 背景技术 0002 随着计算机技术的发展, 计算机网络和管理系统几乎应用到零售业各个方面, 区 域的工厂生产对于零售企业是机器重要的。 企业在对区域商品的生产计划中, 涉及到各门 店各单品销售情况不同, 对外部因素变化程度不同, 商品的生产周期不用, 各门店店长对商 品的把握程度差异, 依靠决策者很难对区域商品的生产计划做出最优的预估和决策。 很多 行业往往对整个区域做一个总量预。

10、估以及依靠各店长经验提出需求量后汇总到区域这两 种方式来给出区域的生产计划量, 但由于门店商品外部变化程度不同, 店长水平存在差异, 很难做出一个好的生产计划; 因此, 将相似的门店进行一个聚合, 然后在聚合后的类别上做 销量的预测再给出区域总体的生产计划是更优的一种方式。 0003 近年越来越多的行业关注到区域生产预测问题的重要性, 大部分行业的预测方法 都是基于单店单品的移动平均模型, 然后根据决策者的业务经验调整, 但是这样还是会存 在预估不准确从而导致需求损失以及商品积压报损等现象。 因此, 本发明针对这一情况, 提 出了一种基于各门店商品相似度聚类的区域商品生产计划方法, 从而指导企。

11、业更合理的做 出区域商品生产计划的决策。 发明内容 0004 本发明的目的在于现有区域商品生产计划中存在的不足, 提出了一种基于各门店 商品相似度聚类的区域商品生产计划方法。 0005 本发明包括以下步骤: 0006 步骤1: 首先获取所有门店商品历史指定时间段内的交易明细数据集D, 且去除交 易明细数据集D中的活动信息和节假日信息, 然后按天为颗粒度统计得到各门店商品的日 销售数量集S; 0007 步骤2: 基于商品的日销售数量集S, 计算得到各商品在周期性上的时间需求模式 T: 0008 0009 0010其中, 为商品在周i的平均销量, ni表示指定时间段内周i的天数; d1,ni; 0。

12、011 步骤3: 根据指定时间段内的日销售数据集S和天气因素数据集X, 将天气因素数据 集X作为模型输入x, 日销售数据集作为模型输出y, 训练一个线性回归模型; 然后基于每个 外部天气因素数据集X的变化, 得到归回系数即日销量的变化率矩阵E; 说明书 1/6 页 5 CN 111815348 A 5 0012 步骤4: 基于历史门店日销售数据集S, 从日销售数据集S中临近一个月内的销售数 据, 计算得到同商品门店之间的时间需求模式距离, 公式如下: 0013 0014 其中, i,j代表两个不同的门店,Tik表示门店i时间需求模式T中的第k个元素; 0015 步骤5: 基于各门店各商品的变化。

13、率矩阵E,计算得到各门店级别之间外部因素变 化率距离, 公式如下: 0016 0017其中, i,j代表两个不同的门店,表示门店i外部因素变化率矩阵E中的第k个元 素; 0018 步骤6: 基于时间需求模式距离DisT和外部因素变化率距离DisE, 计算得到商品在 门店级别的距离计算方法, 公式如下: 0019 DIS(i, j)DisT(i, j)+DisE(i, j) (5) 0020 DisT(i, j)表示门店i,j在时间需求模式上的距离, DisE(i, j)表示门店i,j在外部 因素变化率上的距离, DIS(i, j)表示门店i,j之间的整体距离; 0021 步骤7: 根据定义的门。

14、店间的距离公式(5), 将相似门店聚类; 0022 所述的相似门店即定义的门店间的距离; 0023 步骤8: 根据最小类内距离和轮廓系数得出最优类评估Score, 根据最优类评估 Score结合选出最优分类个数k; 0024 步骤9: 根据Score得到最优类别数k后, 将销量在该类级别中汇总; 0025 步骤10: 使用ARIMA模型预测未来销量yt; 0026 步骤11: 对各类别的未来销量yt进行汇总, 得到的总体预测需求量即为该区域商 品生产计划。 0027 进一步的, 步骤7所述的聚类采用k均值聚类, 实现如下: 0028 输入: 0029数据集 0030 输出: 0031类中心点各。

15、点的标签C 0032 初始化: 0033 随机从数据集S中选择k个中心点 1, ,k 说明书 2/6 页 6 CN 111815348 A 6 0034 0035 首先初始化随机选取k个类中心点, 对每个样本s(i), 将其分到距离 j最近的类别 标记为c(j), 根据c(j)更新每个类别中心点 j的值, 重复迭代, 直到类中心不发生变化或变化 量小于某个阈值; 得到的c即为各门店所在的类,以及类内相似的门店。 0036 进一步的, 步骤8具体实现如下: 0037 类内距离SSE: 0038 0039 通过选择使总体距离最小的方式来选择类个数k; 0040 轮廓系数SC: 0041 0042 。

16、a(i)为样本i到类内其他样本的平均距离, b(i)为样本i到其他类的所有样本的平 均距离, 选择类内距离越小, 类间距离越大的类中心k个数; 0043 最优类评估Score: 0044 0045 将类内距离与轮廓系数相结合的方法, 在合理类中心数范围内, 使类内距离越小, 类间距离越大的k个数。 0046 进一步的, 步骤9所述的根据Score得到最优类别数k后, 将销量在该类级别中汇 总, 获得汇总后的销售数据, 具体实现如下: 0047 0048 将属于c(k)这一类的门店样本商品销量s(i)进行一个汇总; 0049 进一步的, 步骤10所述的使用ARIMA模型预测未来销量,具体实现如下。

17、: 0050 将汇总后的销售数据X作为模型输入x: 0051 说明书 3/6 页 7 CN 111815348 A 7 0052 是常数项, t是误差项, i是自相关系数, i是误差项系数。 0053 本发明有益效果: 0054 本发明通过商品的日销售数据以及敏感程度, 计算出商品在门店级别的相似度, 再根据ARIMA模型对区域生产计划进行一个预测,为区域提供了科学的可参考的预测结果, 有利于企业和区域进行生产计划的决策以及进行更合理的管理库存情况, 对于降低缺货损 失以及积压报损风险, 提升区域生产计划精准度有重要作用。 附图说明 0055 图1是本发明实施例采用该方法的具体流程图。 005。

18、6 图2是本发明实施例采用该方法的结果展示图。 具体实施方式 0057 下面结合附图、 附表详细描述本发明, 本发明的目的和效果将变得更加明显。 本发 明考虑到实际情况, 根据门店历史销售数据, 采用商品时间序列模式以及外部因素敏感程 度的距离矩阵, 用类内距离以及轮廓系数选出最优类中心K数, 用K均值算法对各商品在门 店级别进行聚类, 再根据ARIMA模型对未来的销量进行销量预测, 实现对区域商品的一个生 产计划决策。 0058 一种基于各门店商品相似度聚类的区域商品生产计划方法。 0059 本发明包括以下步骤: 0060 步骤1: 首先获取所有门店商品历史指定时间段内的交易明细数据集D, 。

19、且去除交 易明细数据集D中的活动信息和节假日信息, 然后按天为颗粒度统计得到各门店商品的日 销售数量集S; 0061 步骤2: 基于商品的日销售数量集S, 计算得到各商品在周期性上的时间需求模式 T: 0062 0063 0064其中, 为商品在周i的平均销量, ni表示指定时间段内周i的天数; d1,ni; 0065 步骤3: 根据指定时间段内的日销售数据集S和天气因素数据集X, 将天气因素数据 集X作为模型输入x, 日销售数据集作为模型输出y, 训练一个线性回归模型; 然后基于每个 外部天气因素数据集X的变化, 得到归回系数即日销量的变化率矩阵E; 0066 步骤4: 基于历史门店日销售数。

20、据集S, 从日销售数据集S中临近一个月内的销售数 据, 计算得到同商品门店之间的时间需求模式距离, 公式如下: 0067 0068 其中, i,j代表两个不同的门店,Tik表示门店i时间需求模式T中的第k个元素; 0069 步骤5: 基于各门店各商品的变化率矩阵E,计算得到各门店级别之间外部因素变 化率距离, 公式如下: 说明书 4/6 页 8 CN 111815348 A 8 0070 0071其中, i,j代表两个不同的门店,表示门店i外部因素变化率矩阵E中的第k个元 素; 0072 步骤6: 基于时间需求模式距离DisT和外部因素变化率距离DisE, 计算得到商品在 门店级别的距离计算方。

21、法, 公式如下: 0073 DiS(i, j)DisT(i, j)+DisE(i, j) (5) 0074 DisT(i, j)表示门店i,j在时间需求模式上的距离, DisE(i, j)表示门店i,j在外部 因素变化率上的距离, DiS(i, j)表示门店i,j之间的整体距离; 0075 步骤7: 根据定义的门店间的距离公式(5), 将相似门店聚类; 0076 所述的相似门店即定义的门店间的距离; 0077 步骤8: 根据最小类内距离和轮廓系数得出最优类评估Score, 根据最优类评估 Score结合选出最优分类个数k; 0078 步骤9: 根据Score得到最优类别数k后, 将销量在该类级。

22、别中汇总; 0079 步骤10: 使用ARIMA模型预测未来销量yt; 0080 步骤11: 对各类别的未来销量yt进行汇总, 得到的总体预测需求量即为该区域商 品生产计划。 0081 进一步的, 步骤7所述的聚类采用k均值聚类, 实现如下: 0082 输入: 0083数据集 0084 输出: 0085类中心点各点的标签C 0086 初始化: 0087 随机从数据集S中选择k个中心点 1, ,k 0088 说明书 5/6 页 9 CN 111815348 A 9 0089 首先初始化随机选取k个类中心点, 对每个样本s(i), 将其分到距离 j最近的类别 标记为c(j), 根据c(j)更新每个。

23、类别中心点 j的值, 重复迭代, 直到类中心不发生变化或变化 量小于某个阈值; 得到的c即为各门店所在的类,以及类内相似的门店。 0090 进一步的, 步骤8具体实现如下: 0091 类内距离SSE: 0092 0093 通过选择使总体距离最小的方式来选择类个数k; 0094 轮廓系数SC: 0095 0096 a(i)为样本i到类内其他样本的平均距离, b(i)为样本i到其他类的所有样本的平 均距离, 选择类内距离越小, 类间距离越大的类中心k个数; 0097 最优类评估Score: 0098 0099 将类内距离与轮廓系数相结合的方法, 在合理类中心数范围内, 使类内距离越小, 类间距离越。

24、大的k个数。 0100 进一步的, 步骤9所述的根据Score得到最优类别数k后, 将销量在该类级别中汇 总, 获得汇总后的销售数据, 具体实现如下: 0101 0102 将属于c(k)这一类的门店样本商品销量s(i)进行一个汇总; 0103 进一步的, 步骤10所述的使用ARIMA模型预测未来销量,具体实现如下: 0104 将汇总后的销售数据X作为模型输入x: 0105 0106 是常数项, t是误差项, i是自相关系数, i是误差项系数。 0107 图2是根据本发明获取得到的目标商品的区域生产计划未来3天的结果示例, 展示 了预测的生产量和真实销量的一个对比。 0108 本发明不仅局限于上述具体实施方式, 本领域一般技术人员根据本发明公开的内 容, 可以采用其它多种具体实施方案实施本发明。 因此, 凡是采用本发明的设计结构和思 路, 做一些简单的变化或更改的设计, 都落入本发明保护范围。 说明书 6/6 页 10 CN 111815348 A 10 图1 图2 说明书附图 1/1 页 11 CN 111815348 A 11 。

展开阅读全文
内容关键字: 基于 各门 商品 相似 度聚类 区域 商品生产 计划 方法
关于本文
本文标题:基于各门店商品相似度聚类的区域商品生产计划方法.pdf
链接地址:https://www.zhuanlichaxun.net/pdf/10262784.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1