刷单识别方法.pdf

上传人:zhu****69 文档编号:10473667 上传时间:2021-06-21 格式:PDF 页数:11 大小:384.28KB
收藏 版权申诉 举报 下载
刷单识别方法.pdf_第1页
第1页 / 共11页
刷单识别方法.pdf_第2页
第2页 / 共11页
刷单识别方法.pdf_第3页
第3页 / 共11页
文档描述:

《刷单识别方法.pdf》由会员分享,可在线阅读,更多相关《刷单识别方法.pdf(11页完成版)》请在专利查询网上搜索。

1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202010428470.3 (22)申请日 2020.05.20 (71)申请人 广州鹄志信息咨询有限公司 地址 510000 广东省广州市天河区中山大 道中38号909之五房 (仅限办公) (72)发明人 马喜萍 (74)专利代理机构 北京广技专利代理事务所 (特殊普通合伙) 11842 代理人 崔征 (51)Int.Cl. G06Q 30/00(2012.01) G06Q 30/06(2012.01) G06Q 30/02(2012.01) (54)发明名称 一种刷单识别方。

2、法 (57)摘要 本发明公开了一种刷单识别方法, 包括: 获 取商户的销售记录并判断所述销售记录是否异 常; 在确定所述销售记录异常时, 获取用户的行 为特征信息并判断所述用户的行为特征信息是 否异常; 在确定用户的行为特征信息异常时, 判 断该商户存在刷单行为。 有益效果: 可以提高对 刷单行为的识别准确率, 让用户获取最真实的产 品评价信息, 做出正确的抉择, 提高用户体验。 权利要求书2页 说明书7页 附图1页 CN 111598588 A 2020.08.28 CN 111598588 A 1.一种刷单识别方法, 其特征在于, 包括: 获取商户的销售记录并判断所述销售记录是否异常; 在。

3、确定所述销售记录异常时, 获取用户的行为特征信息并判断所述用户的行为特征信 息是否异常; 在确定用户的行为特征信息异常时, 判断该商户存在刷单行为。 2.如权利要求1所述的方法, 其特征在于, 所述获取商户的销售记录并判断所述销售记 录是否异常, 包括: 获取商户在第一时间段内的第一销量; 获取商户在第二时间段内的第二销量; 其中, 所述第一时间段与所述第二时间段的时 长相等; 在判断所述第二销量与第一销量的第一销量比不在第一预设销量比范围内时, 判断所 述销售记录异常。 3.如权利要求1所述的方法, 其特征在于, 所述获取商户的销售记录并判断所述销售记 录是否异常, 包括: 获取商户在黄金时。

4、间段内的第三销量; 获取商户在低谷时间段内的第四销量; 在判断所述第四销量与第三销量的第二销量比大于第二预设销量比时, 判断所述销售 记录异常。 4.如权利要求1所述的方法, 其特征在于, 所述行为特征信息包括用户的爱好产品信 息; 获取用户的行为特征信息并判断所述用户的行为特征信息是否异常, 包括: 获取用户的爱好产品信息; 获取用户购买所述商户的产品信息; 根据所述用户的爱好产品信息判断用户对所述商户的产品爱好值; 在判断所述爱好值低于预设爱好值时, 判定所述用户对所述商户的产品不喜欢, 判定 所述用户的行为特征信息异常。 5.如权利要求4所述的方法, 其特征在于, 所述获取用户的爱好产品。

5、信息, 包括: 获取每个用户的基本数据及历史行为数据; 对所述基本数据及历史行为数据进行预处理; 所述预处理包括数据清洗、 数据编解码; 获取预处理后得到的基本数据及历史行为数据, 进行特征提取, 获取特征值输入预先 训练好的用户爱好模型中, 输出用户对各类产品的爱好值, 得到用户的爱好产品信息。 6.如权利要求1所述的方法, 其特征在于, 所述行为特征信息包括用户的当次浏览产品 的信息; 获取用户的行为特征信息并判断所述用户的行为特征信息是否异常, 包括: 获取用户的当次浏览产品的信息; 获取用户的历史浏览产品的信息; 根据用户的历史浏览产品的信息按照预设规则判断用户的当次浏览产品的信息是否。

6、 异常; 所述预设规则包括: 用户的翻页数和/或用户的翻页时间; 在确定用户的当次浏览产品的信息异常时, 判定用户的行为特征信息异常。 7.如权利要求1所述的方法, 其特征在于, 所述行为特征信息包括用户的评价信息; 获 取用户的行为特征信息并判断所述用户的行为特征信息是否异常, 包括: 权利要求书 1/2 页 2 CN 111598588 A 2 获取各个用户对于商户产品的评价信息; 对所述评价信息进行筛选处理得到有效评价信息; 对每个有效评价信息进行特征提取, 获取评价特征值输入预先训练好的评价相似度模 型中, 聚合所述评价相似度模型的输出结果, 得到所述有效评价信息与其他有效评价信息 的。

7、多个相似度值; 在所述相似度值大于预设相似度阈值时, 将所述相似度值对应的两个有效评价信息的 作为同一用户的评价信息, 判定两个有效评价信息为同一人所写。 8.如权利要求7所述的方法, 其特征在于, 训练评价相似度模型, 包括: 获取样本评价信息; 对样本评价信息进行进行特征提取, 得到评价特征值; 所述评价特征值包括词向量; 对样本信息进行多次筛选处理, 将每次筛选的两个样本评价信息作为一个样本组; 基于神经网络模型, 将两个样本评价信息的各自的评价特征值输入神经网络模型进行 训练, 输出该两个样本评价信息的相似度, 反复循环的迭代更新神经网络模型的网络参数, 直至模型收敛, 得到评价相似度。

8、模型。 9.如权利要求6所述的方法, 其特征在于, 获取用户的行为特征信息并判断所述用户的 行为特征信息是否异常, 算法包括: 计算用户的当次浏览产品的信息的第一特征向量X与用户的历史浏览产品的信息的第 二特征向量Y的相似度: 其中, Xi为第一特征向量X的分量; Yi为第二特征向量Y的分量; n为特征向量的分量的个 数; k为修正系数; sim(X, Y)(0,1), 在sim(X, Y)越接近0时, 表示相似度越低; 在sim(X, Y) 越接近1时, 表示相似度越高; 其中, P1为根据历史浏览产品的信息确定的第一爱好值; P2为根据当次浏览产品的信息 确定的第二爱好值; C为当次浏览产。

9、品的种类系数; 基于同一种类物品, 在|P1-P2|越大时, 表 示第一爱好值与第二爱好值的差值越大, 修正系数k越小; 在|P1-P2|越小时, 表示第一爱好 值与第二爱好值的差值越小, 修正系数k越大; 在sim(X, Y)小于预设相似度阈值时, 表示用户的行为特征信息异常。 权利要求书 2/2 页 3 CN 111598588 A 3 一种刷单识别方法 技术领域 0001 本发明涉及互联网技术领域, 特别涉及一种刷单识别方法。 背景技术 0002 目前, 随着电商行业的蓬勃发展, 人们越来越享受网络购物的带来的便利, 在网络 购物中, 大多数消费者会去看买过的用户留下来的评论, 给消费者。

10、带来了一定的参考价值, 但是对于商家来讲, 针对买家普遍的这种心理, 商家会采取一定的措施去提高自己的营业 额, 常见的就是刷单, 刷单是商户付款请人假扮顾客或商户自己, 用以假乱真的购物方式提 高网店的排名和销量获取销量及好评吸引顾客的一种方法, 商户的刷单行为会使普通用户 获取到的商户信息不真实, 影响用户的消费体验。 现有技术中对刷单行为的识别准确度较 差, 不能准确识别出该商户是否存在刷单行为。 发明内容 0003 本发明旨在至少一定程度上解决上述技术中的技术问题之一。 为此, 本发明的目 的在于提出一种刷单识别方法, 可以提高对刷单行为的识别准确率, 让用户获取最真实的 产品评价信息。

11、, 做出正确的抉择, 提高用户体验。 0004 为达到上述目的, 本发明实施例提出了一种刷单识别方法, 包括: 0005 获取商户的销售记录并判断所述销售记录是否异常; 0006 在确定所述销售记录异常时, 获取用户的行为特征信息并判断所述用户的行为特 征信息是否异常; 0007 在确定用户的行为特征信息异常时, 判断该商户存在刷单行为。 0008 根据本发明实施例提出了一种刷单识别方法, 可以提高对商户刷单的识别准确 性, 为用户在进行购买时, 提供一定的参考, 提高用户的体验。 0009 根据本发明的一些实施例, 所述获取商户的销售记录并判断所述销售记录是否异 常, 包括: 0010 获取。

12、商户在第一时间段内的第一销量; 0011 获取商户在第二时间段内的第二销量; 其中, 所述第一时间段与所述第二时间段 的时长相等; 0012 在判断所述第二销量与第一销量的第一销量比不在第一预设销量比范围内时, 判 断所述销售记录异常。 0013 根据本发明的一些实施例, 所述获取商户的销售记录并判断所述销售记录是否异 常, 包括: 0014 获取商户在黄金时间段内的第三销量; 0015 获取商户在低谷时间段内的第四销量; 0016 在判断所述第四销量与第三销量的第二销量比大于第二预设销量比时, 判断所述 销售记录异常。 说明书 1/7 页 4 CN 111598588 A 4 0017 根据。

13、本发明的一些实施例, 所述行为特征信息包括用户的爱好产品信息; 获取用 户的行为特征信息并判断所述用户的行为特征信息是否异常, 包括: 0018 获取用户的爱好产品信息; 0019 获取用户购买所述商户的产品信息; 0020 根据所述用户的爱好产品信息判断用户对所述商户的产品爱好值; 0021 在判断所述爱好值低于预设爱好值时, 判定所述用户对所述商户的产品不喜欢, 判定所述用户的行为特征信息异常。 0022 根据本发明的一些实施例, 所述获取用户的爱好产品信息, 包括: 0023 获取每个用户的基本数据及历史行为数据; 0024 对所述基本数据及历史行为数据进行预处理; 所述预处理包括数据清。

14、洗、 数据编 解码; 0025 获取预处理后得到的基本数据及历史行为数据, 进行特征提取, 获取特征值输入 预先训练好的用户爱好模型中, 输出用户对各类产品的爱好值, 得到用户的爱好产品信息。 0026 根据本发明的一些实施例, 所述行为特征信息包括用户的当次浏览产品的信息; 获取用户的行为特征信息并判断所述用户的行为特征信息是否异常, 包括: 0027 获取用户的当次浏览产品的信息; 0028 获取用户的历史浏览产品的信息; 0029 根据用户的历史浏览产品的信息按照预设规则判断用户的当次浏览产品的信息 是否异常; 所述预设规则包括: 用户的翻页数和/或用户的翻页时间; 0030 在确定用户。

15、的当次浏览产品的信息异常时, 判定用户的行为特征信息异常。 0031 根据本发明的一些实施例, 所述行为特征信息包括用户的评价信息; 获取用户的 行为特征信息并判断所述用户的行为特征信息是否异常, 包括: 0032 获取各个用户对于商户产品的评价信息; 0033 对所述评价信息进行筛选处理得到有效评价信息; 0034 对每个有效评价信息进行特征提取, 获取评价特征值输入预先训练好的评价相似 度模型中, 聚合所述评价相似度模型的输出结果, 得到所述有效评价信息与其他有效评价 信息的多个相似度值; 0035 在所述相似度值大于预设相似度阈值时, 将所述相似度值对应的两个有效评价信 息的作为同一用户。

16、的评价信息, 判定两个有效评价信息为同一人所写。 0036 根据本发明的一些实施例, 训练评价相似度模型, 包括: 0037 获取样本评价信息; 0038 对样本评价信息进行进行特征提取, 得到评价特征值; 所述评价特征值包括词向 量; 0039 对样本信息进行多次筛选处理, 将每次筛选的两个样本评价信息作为一个样本 组; 0040 基于神经网络模型, 将两个样本评价信息的各自的评价特征值输入神经网络模型 进行训练, 输出该两个样本评价信息的相似度, 反复循环的迭代更新神经网络模型的网络 参数, 直至模型收敛, 得到评价相似度模型。 0041 在一实施例中, 获取用户的行为特征信息并判断所述用。

17、户的行为特征信息是否异 说明书 2/7 页 5 CN 111598588 A 5 常, 算法包括: 0042 计算用户的当次浏览产品的信息的第一特征向量X与用户的历史浏览产品的信息 的第二特征向量Y的相似度: 0043 0044 其中, Xi为第一特征向量X的分量; Yi为第二特征向量Y的分量; n为特征向量的分量 的个数; k为修正系数; sim(X, Y)(0,1), 在sim(X, Y)越接近0时, 表示相似度越低; 在sim (X, Y)越接近1时, 表示相似度越高; 0045 0046 其中, P1为根据历史浏览产品的信息确定的第一爱好值; P2为根据当次浏览产品的 信息确定的第二爱。

18、好值; C为当次浏览产品的种类系数; 基于同一种类物品, 在|P1-P2|越大 时, 表示第一爱好值与第二爱好值的差值越大, 修正系数k越小; 在|P1-P2|越小时, 表示第一 爱好值与第二爱好值的差值越小, 修正系数k越大; 0047 在sim(X, Y)小于预设相似度阈值时, 表示用户的行为特征信息异常。 0048 本发明的其它特征和优点将在随后的说明书中阐述, 并且, 部分地从说明书中变 得显而易见, 或者通过实施本发明而了解。 本发明的目的和其他优点可通过在所写的说明 书以及附图中所特别指出的结构来实现和获得。 0049 下面通过附图和实施例, 对本发明的技术方案做进一步的详细描述。。

19、 附图说明 0050 附图用来提供对本发明的进一步理解, 并且构成说明书的一部分, 与本发明的实 施例一起用于解释本发明, 并不构成对本发明的限制。 在附图中: 0051 图1是根据本发明一个实施例的一种刷单识别方法。 具体实施方式 0052 以下结合附图对本发明的优选实施例进行说明, 应当理解, 此处所描述的优选实 施例仅用于说明和解释本发明, 并不用于限定本发明。 0053 图1是根据本发明一个实施例的一种刷单识别方法; 如图1所示, 本发明实施例提 出了一种刷单识别方法, 包括步骤S1-S3: 0054 S1、 获取商户的销售记录并判断所述销售记录是否异常; 0055 S2、 在确定所述。

20、销售记录异常时, 获取用户的行为特征信息并判断所述用户的行 为特征信息是否异常; 0056 S3、 在确定用户的行为特征信息异常时, 判断该商户存在刷单行为。 0057 上述技术方案的工作原理: 获取商户的某一产品的销售记录, 并销售记录是否异 常, 示例的, 在商户的某一产品的销售量出现暴增时, 可能因为商户进行促销活动导致销售 量大大增加, 不能断定该商户存在刷单行为, 进而判断购买该产品的用户的行为特征信息 是否异常, 在确定用户的行为特征信息异常时, 判断该商户存在刷单行为。 说明书 3/7 页 6 CN 111598588 A 6 0058 上述技术方案的有益效果: 可以提高对商户刷。

21、单的识别准确性, 为用户在进行购 买时, 提供一定的参考, 提高用户的体验。 0059 根据本发明的一些实施例, 所述获取商户的销售记录并判断所述销售记录是否异 常, 包括: 0060 获取商户在第一时间段内的第一销量; 0061 获取商户在第二时间段内的第二销量; 其中, 所述第一时间段与所述第二时间段 的时长相等; 0062 在判断所述第二销量与第一销量的第一销量比不在第一预设销量比范围内时, 判 断所述销售记录异常。 0063 上述技术方案的工作原理: 获取商户在第一时间段内的第一销量, 第一时间段可 以是以天或周或月为单位; 获取商户在第二时间段内的第二销量, 第二时间段可以是以天 或。

22、周或月为单位, 具体的, 统计商户在第一周的第一销量, 统计商户在第二周的第二销量, 在判断第二销量与第一销量的第一销量比不在第一预设销量比范围内时, 判断销售记录异 常。 在判断第二销量与第一销量的第一销量比大于第一预设销量比范围的最大值时, 表示 商户的销售量暴增, 出现销售记录异常。 在判断第二销量与第一销量的第一销量比小于第 一预设销量比范围的最小值时, 表示商户的销售量暴减, 出现销售记录异常。 0064 上述技术方案的有益效果: 在用户销售量暴增及暴减时, 判断该商户的销售记录 异常, 有利于对刷单行为进行准确识别。 0065 根据本发明的一些实施例, 所述获取商户的销售记录并判断。

23、所述销售记录是否异 常, 包括: 0066 获取商户在黄金时间段内的第三销量; 0067 获取商户在低谷时间段内的第四销量; 0068 在判断所述第四销量与第三销量的第二销量比大于第二预设销量比时, 判断所述 销售记录异常。 0069 上述技术方案的工作原理: 黄金时间段为该商户的某一产品根据历史销售记录确 定在某一时间段的销量最高, 示例的, 黄金时间段可以是14:00-17:00; 低谷时间段为该商 户的某一产品根据历史销售记录确定在某一时间段的销量最低, 示例的, 低谷时间段可以 是2:00-5:00; 获取商户在黄金时间段内的第三销量; 获取商户在低谷时间段内的第四销 量; 在确定第四。

24、销量与第三销量的第二销量比大于第二预设销量比时, 判断所述销售记录 异常。 具体的, 可以是在低谷时间段, 该商户的产品出现大量用户进行浏览并购买, 认定该 销售记录异常。 0070 上述技术方案的有益效果: 在低谷时间段出现销量暴增时, 判断该销售记录异常, 有利于对刷单行为进行准确识别。 0071 根据本发明的一些实施例, 所述行为特征信息包括用户的爱好产品信息; 获取用 户的行为特征信息并判断所述用户的行为特征信息是否异常, 包括: 0072 获取用户的爱好产品信息; 0073 获取用户购买所述商户的产品信息; 0074 根据所述用户的爱好产品信息判断用户对所述商户的产品爱好值; 007。

25、5 在判断所述爱好值低于预设爱好值时, 判定所述用户对所述商户的产品不喜欢, 说明书 4/7 页 7 CN 111598588 A 7 判定所述用户的行为特征信息异常。 0076 上述技术方案的工作原理: 爱好产品信息为表示用户对产品的喜好程度, 示例的, 用户对A公司的B产品的爱好值为10分, 用户对C公司的与B产品作为同一类产品的D产品的 爱好值为5分, 则说明用户更喜欢A公司的B产品。 获取用户购买所述商户的产品信息, 根据 所述用户的爱好产品信息判断用户对所述商户的产品爱好值; 具体的, 可以将商户的产品 信息输入预先训练好的用户爱好模型中, 输出用户对商户的产品的爱好值。 在判断所述。

26、爱 好值低于预设爱好值时, 即输出用户对商户的产品的爱好值为4分, 预设爱好值为6分, 判定 所述用户对所述商户的产品不喜欢, 但是用户购买该产品, 则判定所述用户的行为特征信 息异常。 0077 上述技术方案的有益效果: 根据用户每个人的爱好产品的信息, 在判断用户购买 了自己不喜欢的产品时, 判断用户的行为特征异常, 判定用户为商户进行刷单行为, 有利于 提高对刷单行为的识别准确率, 提高用户体验。 0078 根据本发明的一些实施例, 所述获取用户的爱好产品信息, 包括: 0079 获取每个用户的基本数据及历史行为数据; 0080 对所述基本数据及历史行为数据进行预处理; 所述预处理包括数。

27、据清洗、 数据编 解码; 0081 获取预处理后得到的基本数据及历史行为数据, 进行特征提取, 获取特征值输入 预先训练好的用户爱好模型中, 输出用户对各类产品的爱好值, 得到用户的爱好产品信息。 0082 上述技术方案的工作原理: 基本数据包括姓名、 年龄、 性别等基本信息, 历史行为 数据包括用户在电商平台上的购买产品的行为记录、 浏览产品的行为记录等。 对基本数据 及历史行为数据进行预处理; 预处理包括数据清洗、 数据编解码; 数据清洗, 包括填充缺失 数据、 消除噪声数据等, 主要是通过分析 “脏数据” 的产生原因和存在形式, 利用现有的数据 挖掘手段和方法去清洗 “脏数据” , 将 。

28、“脏数据” 转化为满足数据质量要求或应用要求的数 据, 从而提高数据集的质量, 满足现阶段数据分析的需求。 数据编解码, 用于降低数据维度, 降低计算量及计算复杂度。 获取预处理后得到的基本数据及历史行为数据, 进行特征提取, 获取特征值输入预先训练好的用户爱好模型中, 输出用户对各类产品的爱好值, 得到用户 的爱好产品信息。 用户爱好模型可以是深度学习模型, 用户爱好模型的训练方法, 包括: 获 取样本数据, 样本数据包括用户的基本数据及历史行为数据, 及用户给各类产品打出的爱 好值, 将用户的基本数据及历史行为数据输入至深度学习模型进行训练, 判断深度学习模 型输入的预测用户对产品的爱好值。

29、与实际的爱好值是否匹配, 若匹配, 则得到用户爱好模 型; 反之, 不断进行训练, 更新模型参数, 直至模型收敛。 0083 上述技术方案的有益效果: 可以准确的得到用户的爱好产品信息, 提高判断用户 对商户产品的喜好程度的准确性, 进而提高判断用户的行为特征信息是否异常的准确性。 0084 根据本发明的一些实施例, 所述行为特征信息包括用户的当次浏览产品的信息; 获取用户的行为特征信息并判断所述用户的行为特征信息是否异常, 包括: 0085 获取用户的当次浏览产品的信息; 0086 获取用户的历史浏览产品的信息; 0087 根据用户的历史浏览产品的信息按照预设规则判断用户的当次浏览产品的信息。

30、 是否异常; 所述预设规则包括: 用户的翻页数和/或用户的翻页时间; 说明书 5/7 页 8 CN 111598588 A 8 0088 在确定用户的当次浏览产品的信息异常时, 判定用户的行为特征信息异常。 0089 上述技术方案的工作原理: 获取用户的当次浏览产品的信息, 包括用户的访问产 品请求信息、 用户浏览产品的时长信息、 用户浏览产品的翻页信息等。 还获取用户的历史浏 览产品的信息, 根据用户的历史浏览产品的信息按照预设规则判断用户的当次浏览产品的 信息是否异常。 具体的, 在一实施例中, 用户在历史浏览产品时, 会用20分钟进行浏览, 最后 选取目标产品进行购买, 在用户当次购买产。

31、品时, 用户花费30s, 甚至更短的时间, 直接进行 下单购买, 判断用户的行为特征信息异常。 在一实施例中, 用户在历史浏览产品时, 会进行 翻页查看多个产品信息, 对比之后, 选定目标产品进行购买, 在用户当次购买产品时, 翻看 更多页, 选取销量低的产品进行购买, 判断用户的行为特征信息异常。 0090 上述技术方案的有益效果: 根据用户当次浏览产品的信息, 根据用户历史浏览产 品的信息, 能准确识别用户的行为特征信息是否异常。 0091 根据本发明的一些实施例, 所述行为特征信息包括用户的评价信息; 获取用户的 行为特征信息并判断所述用户的行为特征信息是否异常, 包括: 0092 获取。

32、各个用户对于商户产品的评价信息; 0093 对所述评价信息进行筛选处理得到有效评价信息; 0094 对每个有效评价信息进行特征提取, 获取评价特征值输入预先训练好的评价相似 度模型中, 聚合所述评价相似度模型的输出结果, 得到所述有效评价信息与其他有效评价 信息的多个相似度值; 0095 在所述相似度值大于预设相似度阈值时, 将所述相似度值对应的两个有效评价信 息的作为同一用户的评价信息, 判定两个有效评价信息为同一人所写。 0096 上述技术方案的工作原理: 获取各个用户对于商户产品的评价信息, 对评价信息 进行筛选处理得到有效评价信息, 有效评价信息为除去空评价、 系统默认评价、 用户与产。

33、品 信息无关的无用评价等。 对每个有效评价信息进行特征提取, 获取评价特征值输入预先训 练好的评价相似度模型中, 聚合所述评价相似度模型的输出结果, 根据用户的语言习惯很 难改变的特点, 将对该产品的有效评价信息进行两两组合, 获取每条有效评价信息与其他 有效评价信息之间的多个相似度值, 在所述相似度值大于预设相似度阈值时, 将所述相似 度值对应的两个有效评价信息的作为同一用户的评价信息, 判定两个有效评价信息为同一 人所写, 判断商户具有刷单行为。 0097 上述技术方案的有益效果: 可以准确识别同一用户利用多个账号为商户进行刷单 的行为, 提高了识别准确性。 0098 根据本发明的一些实施。

34、例, 训练评价相似度模型, 包括: 0099 获取样本评价信息; 0100 对样本评价信息进行进行特征提取, 得到评价特征值; 所述评价特征值包括词向 量; 0101 对样本信息进行多次筛选处理, 将每次筛选的两个样本评价信息作为一个样本 组; 0102 基于神经网络模型, 将两个样本评价信息的各自的评价特征值输入神经网络模型 进行训练, 输出该两个样本评价信息的相似度, 反复循环的迭代更新神经网络模型的网络 参数, 直至模型收敛, 得到评价相似度模型。 说明书 6/7 页 9 CN 111598588 A 9 0103 上述技术方案的工作原理: 获取样本评价信息; 对样本评价信息进行进行特征。

35、提 取, 得到评价特征值; 评价特征值包括词向量; 对样本信息进行多次筛选处理, 将每次筛选 的两个样本评价信息作为一个样本组; 基于神经网络模型, 将两个样本评价信息的各自的 评价特征值输入神经网络模型进行训练, 输出该两个样本评价信息的相似度, 反复循环的 迭代更新神经网络模型的网络参数, 直至模型收敛, 得到评价相似度模型。 0104 上述技术方案的有益效果: 得到评价相似度模型, 将评价信息输入评价相似度模 型, 可以输出评价信息之间的相似度, 有利于判断是否有同一个撰写多个评价信息, 判断是 否有刷单行为, 可以提高对刷单行为的识别准确率, 让用户获取最真实的产品评价信息, 做 出正。

36、确的抉择, 提高用户体验。 0105 在一实施例中, 获取用户的行为特征信息并判断所述用户的行为特征信息是否异 常, 算法包括: 0106 计算用户的当次浏览产品的信息的第一特征向量X与用户的历史浏览产品的信息 的第二特征向量Y的相似度: 0107 0108 其中, Xi为第一特征向量X的分量; Yi为第二特征向量Y的分量; n为特征向量的分量 的个数; k为修正系数; sim(X, Y)(0,1), 在sim(X, Y)越接近0时, 表示相似度越低; 在sim (X, Y)越接近1时, 表示相似度越高; 0109 0110 其中, P1为根据历史浏览产品的信息确定的第一爱好值; P2为根据当。

37、次浏览产品的 信息确定的第二爱好值; C为当次浏览产品的种类系数; 基于同一种类物品, 在|P1-P2|越大 时, 表示第一爱好值与第二爱好值的差值越大, 修正系数k越小; 在|P1-P2|越小时, 表示第一 爱好值与第二爱好值的差值越小, 修正系数k越大; 0111 在sim(X, Y)小于预设相似度阈值时, 表示用户的行为特征信息异常。 0112 上述技术方案的工作原理及有益效果: 具体的, 特征向量的分量的个数为2, 特征 向量的分量包括翻页数和翻页时间, 计算用户的当次浏览产品的信息的第一特征向量X与 用户的历史浏览产品的信息的第二特征向量Y的相似度, 在sim(X, Y)小于预设相似。

38、度阈值 时, 表示用户的行为特征信息异常。 预设相似度阈值可以是0.6, 即在sim(X, Y)小于0.6时, 表示用户的行为特征信息异常。 考虑产品种类、 根据历史浏览产品的信息确定的第一爱好 值及当次浏览产品的信息确定的第二爱好值的影响, 确定修正系数, 使得计算出的相似度 准确性更高, 有利于提高判断对用户的特征行为信息是否异常的准确性, 进而提高判断对 用户是否进行刷单行为的准确性。 0113 显然, 本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精 神和范围。 这样, 倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围 之内, 则本发明也意图包含这些改动和变型在内。 说明书 7/7 页 10 CN 111598588 A 10 图1 说明书附图 1/1 页 11 CN 111598588 A 11 。

展开阅读全文
内容关键字: 识别 方法
关于本文
本文标题:刷单识别方法.pdf
链接地址:https://www.zhuanlichaxun.net/pdf/10473667.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1