《一种商品搜索及提供方法及装置.pdf》由会员分享,可在线阅读,更多相关《一种商品搜索及提供方法及装置.pdf(16页完整版)》请在专利查询网上搜索。
1、(10)申请公布号 CN 103593426 A (43)申请公布日 2014.02.19 CN 103593426 A (21)申请号 201310549923.8 (22)申请日 2013.11.07 G06F 17/30(2006.01) G06Q 30/00(2012.01) (71)申请人 北京奇虎科技有限公司 地址 100088 北京市西城区新街口外大街 28 号 D 座 112 室 (德胜园区) 申请人 奇智软件 ( 北京 ) 有限公司 (72)发明人 周雷 高扬 姜鑫 曹晴 牛杏媛 (74)专利代理机构 北京中强智尚知识产权代理 有限公司 11448 代理人 姜精斌 (54) 。
2、发明名称 一种商品搜索及提供方法及装置 (57) 摘要 本发明实施例提供一种商品搜索及提供方法 及装置, 用以减少用户搜索商品的时间, 提高电商 网站的点击量及访问量。该方法中搜索引擎在每 个采集时间点, 在每个网页获取用户对该商品进 行评论的评论数量信息, 采用最小二乘法, 确定该 商品的拟合曲线, 在接收到用户的搜索请求后, 根 据拟合曲线确定接收到该搜索请求的时间对应的 该商品的评论数量信息, 根据确定的该评论数量 信息, 向用户提供该搜索请求对应的商品的信息。 由于在本发明实施例中确定的拟合曲线可以在一 定程度上反应用户对该商品的点击量, 因此根据 该拟合曲线确定的评论数量信息向用户提。
3、供搜索 请求对应的产品信息时, 可以减少用户搜索商品 的时间, 提高电商网站的点击量及访问量。 (51)Int.Cl. 权利要求书 2 页 说明书 9 页 附图 4 页 (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书2页 说明书9页 附图4页 (10)申请公布号 CN 103593426 A CN 103593426 A 1/2 页 2 1. 一种商品搜索及提供方法, 其特征在于, 该方法包括 : 搜索引擎根据设置的每个采样时间点, 针对每个商品所在的网页, 在每个采样时间点 获取用户对该商品进行评论的评论数量信息 ; 针对每个商品, 根据至少两个采样时间点及在该采样时。
4、间点获取的评论数量信息, 采 用最小二乘法, 确定该商品的采样时间点和评论数量信息的拟合曲线 ; 当接收到用户的搜索请求后, 确定该搜索请求对应的每个商品 ; 针对确定的所述每个商品的采样时间点和评论数量信息的拟合曲线, 确定接收该搜索 请求的时间对应的该商品的评论数量信息 ; 根据确定的评论数量信息, 向所述用户提供该搜索请求对应的商品的信息。 2. 如权利要求 1 所述的方法, 其特征在于, 所述在每个采样时间点获取用户对该商品 进行评论的评论数量信息包括 : 根据设置的商品点评模版, 针对每个网页在每个采样时间点获取用户对该商品进行评 论的评论数量信息。 3. 如权利要求 1 所述的方法。
5、, 其特征在于, 所述确定该商品的采样时间点和评论数量 信息的拟合曲线包括 : 针对该商品在每个采样时间点获取的评论数量信息, 模拟直线 y=a0+a1x, 其中 x 为采 样时间点, y 为在该采样时间点获取的评论数量信息 ; 根据最小二乘法, 确定模拟直线中的参数 a0 和 a1, 确定该商品的采样时间点和评论数 量信息的拟合曲线。 4.如权利要求1或3所述的方法, 其特征在于, 所述确定该商品的采样时间点和评论数 量信息的拟合曲线还包括 : 采用相关系数R、 统计量F、 剩余标准差S中的至少一个参数, 对拟合的所述曲线进行评 价 ; 当评价结果不满足相应参数对应的评价阈值时, 根据其他的。
6、采样时间点及评论数量信 息, 重新确定该商品的采样时间点和评论数量信息的拟合曲线。 5. 如权利要求 1 所述的方法, 其特征在于, 所述确定该商品的采样时间点和评论数量 信息的拟合曲线包括 : 根据当前时间及设定的拟合时间间隔, 获取以该当前时间为时间终点, 该拟合时间间 隔为长度的时间段内的每个采样时间点及在该采样时间点获取的评论数量信息 ; 根据获取的该每个采样时间点和每个评论数量信息, 确定该商品的采样时间点和评论 数量信息的拟合曲线。 6. 一种商品搜索及提供装置, 其特征在于, 所述装置包括 : 获取模块, 用于根据设置的每个采样时间点, 针对每个商品所在的网页, 在每个采样时 间。
7、点获取用户对该商品进行评论的评论数量信息 ; 拟合模块, 用于针对每个商品, 根据至少两个采样时间点及在该采样时间点获取的评 论数量信息, 采用最小二乘法, 确定该商品的采样时间点和评论数量信息的拟合曲线 ; 搜索模块, 用于当接收到用户的搜索请求后, 确定该搜索请求对应的每个商品 ; 确定模块, 用于针对确定的所述每个商品的采样时间点和评论数量信息的拟合曲线, 确定接收该搜索请求的时间对应的该商品的评论数量信息 ; 权 利 要 求 书 CN 103593426 A 2 2/2 页 3 提供模块, 用于根据确定的评论数量信息, 向所述用户提供该搜索请求对应的商品的 信息。 7. 如权利要求 6。
8、 所述的装置, 其特征在于, 所述获取模块, 具体用于根据设置的商品点 评模版, 针对每个网页在每个采样时间点获取用户对该商品进行评论的评论数量信息。 8. 如权利要求 6 所述的装置, 其特征在于, 所述拟合模块, 具体用于针对该商品在每个 采样时间点获取的评论数量信息, 模拟直线 y=a0+a1x, 其中 x 为采样时间点, y 为在该采样 时间点获取的评论数量信息 ; 根据最小二乘法, 确定模拟直线中的参数 a0 和 a1, 确定该商 品的采样时间点和评论数量信息的拟合曲线。 9. 如权利要求 6 或 8 所述的装置, 其特征在于, 所述拟合模块, 具体用于采用相关系数 R、 统计量 F。
9、、 剩余标准差 S 中的至少一个参数, 对拟合的所述曲线进行评价 ; 当评价结果不 满足相应参数对应的评价阈值时, 根据其他的采样时间点及评论数量信息, 重新确定该商 品的采样时间点和评论数量信息的拟合曲线。 10. 如权利要求 6 所述的装置, 其特征在于, 所述拟合模块, 具体用于根据当前时间及 设定的拟合时间间隔, 获取以该当前时间为时间终点, 该拟合时间间隔为长度的时间段内 的每个采样时间点及在该采样时间点获取的评论数量信息 ; 根据获取的该每个采样时间点 和每个评论数量信息, 确定该商品的采样时间点和评论数量信息的拟合曲线。 权 利 要 求 书 CN 103593426 A 3 1/。
10、9 页 4 一种商品搜索及提供方法及装置 技术领域 0001 本发明涉及电子商务技术领域, 尤其涉及一种商品搜索及提供方法及装置。 背景技术 0002 随着电商网站的不断发展, 网络上充斥着海量的商品。 目前, 电商搜索网站的搜索 引擎对于某一商家的商品的搜索覆盖率可以达到 90% 以上, 但是该覆盖率下的搜索结果都 是来自于爬虫的搜录, 或者是商家对用户 (Business to Customer, B2C) 模式中, 采用合作 的形式, 由商家提供给电商网站的。对于爬虫而言, 其看到的商品的权重都是相同的, 无法 识别出哪些商品可能会使网站的点击率升高, 哪些商品不会给网站的点击率带来变化。
11、 ; 而 对于采用 B2C 模式提供的商品的信息, 商家也不会提供哪些商品会升高点击量的信息。 0003 即使一些网站可以提供能够提高点击率的商品的信息, 但是维护这个接口却是非 常不容易的。这是因为能够提高点击率的商品一般都是热销商品, 该商品在网站上的销量 比较大, 很多商品都会很快卖完, 商品卖完后网站还要更新这些商品的信息, 并在商品有货 供应时再重新推送, 因此导致网站的频繁推送, 维护起来非常的不方便。 0004 因此, 电商网站以及电商搜索网站如何针对每个用户, 从海量的商品中搜索出可 能会带来点击率升高的商品并提供给每个用户, 减少用户搜索商品的时间, 并提高网站的 点击量及访。
12、问量是现有技术亟待解决的问题。 发明内容 0005 本发明实施例提供一种商品搜索及提供方法及装置, 用以减少用户搜索商品的时 间, 并提高网站的点击量及访问量。 0006 本发明实施例提供一种商品搜索及提供方法, 该方法包括 : 0007 搜索引擎根据设置的每个采样时间点, 针对每个商品所在的网页, 在每个采样时 间点获取用户对该商品进行评论的评论数量信息 ; 0008 针对每个商品, 根据至少两个采样时间点及在该采样时间点获取的评论数量信 息, 采用最小二乘法, 确定该商品的采样时间点和评论数量信息的拟合曲线 ; 0009 当接收到用户的搜索请求后, 确定该搜索请求对应的每个商品 ; 001。
13、0 针对确定的所述每个商品的采样时间点和评论数量信息的拟合曲线, 确定接收该 搜索请求的时间对应的该商品的评论数量信息 ; 0011 根据确定的评论数量信息, 向所述用户提供该搜索请求对应的商品的信息。 0012 较佳地, 为了提高本方法中商品提供的效率及准确性, 所述在每个采样时间点获 取用户对该商品进行评论的评论数量信息包括 : 0013 根据设置的商品点评模版, 针对每个网页在每个采样时间点获取用户对该商品进 行评论的评论数量信息。 0014 较佳地, 为了减少用户搜索商品的时间, 并提高电商网站的点击量及访问量, 所述 确定该商品的采样时间点和评论数量信息的拟合曲线包括 : 说 明 书。
14、 CN 103593426 A 4 2/9 页 5 0015 针对该商品在每个采样时间点获取的评论数量信息, 模拟直线 y=a0+a1x, 其中 x 为采样时间点, y 为在该采样时间点获取的评论数量信息 ; 0016 根据最小二乘法, 确定模拟直线中的参数 a0 和 a1, 确定该商品的采样时间点和评 论数量信息的拟合曲线。 0017 较佳地, 为了保证拟合曲线的正确性, 保证向用户提供的产品的准确率, 进一步提 高电商网站的点击量及访问量, 所述确定该商品的采样时间点和评论数量信息的拟合曲线 还包括 : 0018 采用相关系数R、 统计量F、 剩余标准差S中的至少一个参数, 对拟合的所述曲。
15、线进 行评价 ; 0019 当评价结果不满足相应参数对应的评价阈值时, 根据其他的采样时间点及评论数 量信息, 重新确定该商品的采样时间点和评论数量信息的拟合曲线。 0020 较佳地, 为了保证拟合曲线的正确性, 保证向用户提供的产品的准确率, 进一步提 高电商网站的点击量及访问量, 所述确定该商品的采样时间点和评论数量信息的拟合曲线 包括 : 0021 根据当前时间及设定的拟合时间间隔, 获取以该当前时间为时间终点, 该拟合时 间间隔为长度的时间段内的每个采样时间点及在该采样时间点获取的评论数量信息 ; 0022 根据获取的该每个采样时间点和每个评论数量信息, 确定该商品的采样时间点和 评论。
16、数量信息的拟合曲线。 0023 本发明实施例提供了一种商品搜索及提供装置, 所述装置包括 : 0024 获取模块, 用于根据设置的每个采样时间点, 针对每个商品所在的网页, 在每个采 样时间点获取用户对该商品进行评论的评论数量信息 ; 0025 拟合模块, 用于针对每个商品, 根据至少两个采样时间点及在该采样时间点获取 的评论数量信息, 采用最小二乘法, 确定该商品的采样时间点和评论数量信息的拟合曲 线 ; 0026 搜索模块, 用于当接收到用户的搜索请求后, 确定该搜索请求对应的每个商品 ; 0027 确定模块, 用于针对确定的所述每个商品的采样时间点和评论数量信息的拟合曲 线, 确定接收该。
17、搜索请求的时间对应的该商品的评论数量信息 ; 0028 提供模块, 用于根据确定的评论数量信息, 向所述用户提供该搜索请求对应的商 品的信息。 0029 较佳地, 为了提高本方法中商品提供的效率及准确性, 所述获取模块, 具体用于根 据设置的商品点评模版, 针对每个网页在每个采样时间点获取用户对该商品进行评论的评 论数量信息。 0030 较佳地, 为了减少用户搜索商品的时间, 并提高电商网站的点击量及访问量, 所述拟合模块, 具体用于针对该商品在每个采样时间点获取的评论数量信息, 模拟直线 y=a0+a1x, 其中 x 为采样时间点, y 为在该采样时间点获取的评论数量信息 ; 根据最小二乘 。
18、法, 确定模拟直线中的参数 a0 和 a1, 确定该商品的采样时间点和评论数量信息的拟合曲 线。 0031 较佳地, 为了保证拟合曲线的正确性, 保证向用户提供的产品的准确率, 进一步提 高电商网站的点击量及访问量, 所述拟合模块, 具体用于采用相关系数 R、 统计量 F、 剩余标 说 明 书 CN 103593426 A 5 3/9 页 6 准差 S 中的至少一个参数, 对拟合的所述曲线进行评价 ; 当评价结果不满足相应参数对应 的评价阈值时, 根据其他的采样时间点及评论数量信息, 重新确定该商品的采样时间点和 评论数量信息的拟合曲线。 0032 较佳地, 为了保证拟合曲线的正确性, 保证向。
19、用户提供的产品的准确率, 进一步提 高电商网站的点击量及访问量, 所述拟合模块, 具体用于根据当前时间及设定的拟合时间 间隔, 获取以该当前时间为时间终点, 该拟合时间间隔为长度的时间段内的每个采样时间 点及在该采样时间点获取的评论数量信息 ; 根据获取的该每个采样时间点和每个评论数量 信息, 确定该商品的采样时间点和评论数量信息的拟合曲线。 0033 本发明实施例提供了一种商品搜索及提供方法及装置, 该方法中搜索引擎在每个 采集时间点, 在每个网页获取用户对该商品进行评论的评论数量信息, 根据至少两个采样 时间点及对应的在该采样时间点获取的评论数量信息, 采用最小二乘法, 确定该商品采样 时。
20、间点和评论数量信息的拟合曲线, 在接收到用户的搜索请求后, 根据该搜索请求对应的 每个商品, 及对应每个商品的拟合曲线, 确定接收到该搜索请求的时间对应的该商品的评 论数量信息, 根据确定的该评论数量信息, 向用户提供该搜索请求对应的商品的信息。 由于 在本发明实施例中根据每个采样时间点及在每个采样时间点采集到的用户对商品的评论 数量信息, 确定了商品对应的拟合曲线, 该拟合曲线可以在一定程度上根据先前的数据拟 合出当前与该商品相关的关键数据, 从而对于该商品的关注程度进行了一定程度的预测, 进一步地该数据反应用户对该商品的点击量, 因此当在接收到用户的搜索请求, 并根据该 拟合曲线确定的评论。
21、数量信息向用户提供搜索请求对应的产品信息时, 可以减少用户搜索 商品的时间, 并提高电商网站的点击量及访问量。 附图说明 0034 图 1 为本发明实施例提供的该商品搜索及提供过程的示意图 ; 0035 图 2 为本发明实施例提供的该商品搜索及提供的一详细实施过程示意图 ; 0036 图 3 为本发明实施例提供的商品搜索及提供的另一具体实施过程示意图 ; 0037 图 4 为本发明实施例提供的一种商品搜索及提供装置结构示意图。 具体实施方式 0038 为了减少用户搜索商品的时间, 并提高电商网站的点击量及访问量, 本发明实施 例提供了一种商品搜索及提供方法及装置。 0039 下面结合说明书附图。
22、, 对本发明实施例进行详细说明。 0040 图 1 为本发明实施例提供的该商品搜索及提供过程的示意图, 该过程包括以下步 骤 : 0041 S101 : 搜索引擎根据设置的每个采样时间点, 针对每个商品所在的网页, 在每个采 样时间点获取用户对该商品进行评论的评论数量信息。 0042 在本发明实施例中可以按照设定的时间间隔设置每个采样时间点, 也可以按照任 意的时间间隔设置采样时间点。在每个采样时间点, 搜索引擎针对每个商品获取用户对商 品进行评论的评论数量信息。该采样时间点可以是以分钟、 小时、 天、 周为间隔设置。 0043 另外, 搜索引擎在获取用户对每个商品进行评论的评论数量信息时, 。
23、可以在每个 说 明 书 CN 103593426 A 6 4/9 页 7 采样时间点, 针对每个商品都获取用户对该商品进行评论的评论数量信息。例如采样时间 点分别为 1、 2、 3、 4, 5, 在每个采样时间点, 针对每个商品, 搜索引擎都获取用户对该商品进 行评论的评论数量信息。 0044 或者为了减少信息采集量, 并且后续在进行曲线拟合时, 需要的信息也不是特别 的多, 搜索引擎在获取用户对每个商品进行评论的评论数量信息时, 针对每个商品, 可以在 有限个采样时间点, 获取用户对该商品进行评论的评论数量信息。例如采样时间点分别为 1、 2、 3、 4、 5, 在每个采样时间点 1、 3、。
24、 5, 针对第一商品, 搜索引擎都获取用户对该第一商品进 行评论的评论数量信息。 0045 S102 : 针对每个商品, 根据至少两个采样时间点及在该采样时间点获取的评论数 量信息, 采用最小二乘法, 确定该商品的采样时间点和评论数量信息的拟合曲线。 0046 当针对每个商品, 在每个采样时间点, 获取了用户针对该商品进行评论的评论数 量信息后, 搜索引擎针对每个商品, 获取了该商品的多个二维值 (采样时间点, 评论数量信 息) 。在这些二维值中任意选择至少两组, 即至少两个采样时间点及在该采样时间点获取的 评论数量信息, 根据该至少两组二维值, 确定该商品的采样时间点和评论数量信息的拟合 曲。
25、线。 0047 S103 : 当接收到用户的搜索请求后, 确定该搜索请求对应的每个商品。 0048 S104 : 针对确定的所述每个商品的采样时间点和评论数量信息的拟合曲线, 确定 接收该搜索请求的时间对应的该商品的评论数量信息。 0049 在搜索引擎接收用户的搜索请求之前, 搜索引擎已经针对每个商品, 确定了该商 品的采样时间点和评论数量信息的拟合曲线。 因此当搜索引擎根据搜索请求确定了对应的 每个商品后, 搜索引擎在向用户提供这些商品的信息时, 哪些商品的信息在第一时间提供, 哪些商品的信息可以稍后提供, 在本发明实施例中搜索引擎根据针对每个商品拟合的曲线 确定。 0050 S105 : 。
26、根据确定的评论数量信息, 向所述用户提供该搜索请求对应的商品的信息。 0051 具体的, 由于搜索引擎已经针对每个商品, 确定了该商品对应的拟合曲线, 在向用 户提供商品的信息之前, 确定向用户提供的商品的顺序。在本发明实施例中搜索引擎针对 该搜索请求对应的商品, 及针对每个商品确定的拟合曲线, 确定每个商品在接收该搜索请 求的时间对应的该商品的评论数量信息, 根据该评论数量信息确定每个商品的提供顺序, 从而按照该顺序向用户提供对应的商品的信息。 0052 由于在本发明实施例中根据每个采样时间点及在每个采样时间点采集到的用户 对商品的评论数量信息, 确定了商品对应的拟合曲线, 该拟合曲线可以在。
27、一定程度上反应 用户对该商品的点击量, 因此当在接收到用户的搜索请求, 并根据该拟合曲线确定的评论 数量信息向用户提供搜索请求对应的产品信息时, 可以减少用户搜索商品的时间, 并提高 电商网站的点击量及访问量。 0053 通过观察在 B2C 模式中, 商家在将商品出售后, 一般会邀请用户对所购买的商品 进行点评, 而用户对商品的评论数量, 从一定程度上可以反映用户对该商品的点击率及访 问量, 并且还能从一定程度上反映用户对该商品的喜欢程度, 购买程度。因此, 在本发明实 施例中为了提高网站的点击量及访问量, 并减少用户搜索商品的时间, 搜索引擎在根据搜 索请求, 向用户提供商品的信息时, 按照。
28、商品的评论数量信息来提供。 说 明 书 CN 103593426 A 7 5/9 页 8 0054 为了准确、 高效的获取用户对商品的评论数量信息, 并且在搜索引擎向用户提供 搜索结果时, 能够及时的预知每个商品的评论数量信息, 在本发明实施例中搜索引擎需要 针对每个商品, 确定该商品的采样时间点和评论数量信息的拟合曲线。 0055 具体的, 在确定每个商品的拟合曲线时, 针对每个商品, 搜索引擎需要在每个采样 时间点, 搜索该商品所在网页, 从而在每个采样时间点获取用户对该商品进行评论的评论 数量信息。具体的在获取用户对商品进行评论的评论数量信息时, 可以额外的解析一个字 段, 即该商品对应。
29、的点评数量信息, 从而获取具体的点评数量信息。 0056 较佳地, 为了提高本方法中商品提供的效率及准确性, 所述在每个采样时间点获 取用户对该商品进行评论的评论数量信息包括 : 根据设置的商品点评模版, 针对每个网页 在每个采样时间点获取用户对该商品进行评论的评论数量信息。 0057 针对每个商品, 在每个采样时间点, 获取了用户对该商品进行评论的评论数量信 息后, 搜索引擎可以将获取的每个 (采样时间点, 评论数量信息) 的成对的二维数据保存起 来, 从而针对该商品得到一系列的成对数据。例如, 用 ti 来表示采样时间点, 用 ni 来表示 在该采样时间点获取的评论数量信息, 则根据每个采。
30、样时间点获取的信息, 可以得到 (t1, n1), (t2, n2),(tm, nm)。 0058 搜索引擎针对每个商品, 在每个采样时间点, 获取了用户对该商品进行评论的评 论数量信息后, 可以采用最小二乘法, 确定该商品的采样时间点和评论数量信息的拟合曲 线。最小二乘法是一种数学优化技术。它通过最小化误差的平方和寻找数据的最佳函数匹 配。利用最小二乘法可以简便地求得未知的数据, 并使得这些求得的数据与实际数据之间 误差的平方和为最小。 0059 在本发明实施例中, 采用最小二乘法, 确定该商品的采样时间点和评论数量信息 的拟合曲线包括 : 0060 针对该商品在每个采样时间点获取的评论数量。
31、信息, 模拟直线 y=a0+a1x, 其中 x 为采样时间点, y 为在该采样时间点获取的评论数量信息 ; 0061 根据最小二乘法, 确定模拟直线中的参数 a0 和 a1, 确定该商品的采样时间点和评 论数量信息的拟合曲线。 0062 当确定了模拟直线 yi=a0+a1xi 后, 并且参数 x、 y 对应的信息搜索引擎已经采集 到, 只要确定了该模拟直线中的 a0 和 a1 后, 该模拟直线就确定了。 0063 具体的在根据最小二乘法模拟曲线时, 根据上述公式 yi=a0+a1xi, 将每个 xi 代入 上述公式可以得到对应的计算值 yi, 而该采样时间点获取的实际的评论数量信息 yi 已 。
32、知。因此将实测值 yi 与利用上述公式计算的 (yi=a0+a1xi) 的离差 (yi -yi) 的平方和 (yi -yi) 2 最小为 “优化判据” 。 0064 令 :将 yi=a0+a1xi 的公式带入该式中, 得到 : 0065 0066 当 (yi -yi) 2 最小时, 可用函数对 a0、 a1 求偏导数, 令这两个偏导数等于零。 从而得到关于 a0、 a1 为未知数的两个方程组, 0067 a0=( yi ) /n-a1( xi) /n, n 为采样时间点的数量 ; 0068 a1=n xiyi -( xi yi ) /n xi2-( xi)2) ; 说 明 书 CN 10359。
33、3426 A 8 6/9 页 9 0069 将上述确定的 a0 和 a1 的表示公式代入 yi=a0+a1xi, 从而得到拟合曲线。 0070 本发明实施例给出了采用最小二乘法进行曲线拟合的简单的实施方式, 相信本领 域技术人员根据本发明实施例的描述, 可以采用相应的方式进行曲线模拟。 0071 在采用最小二乘法进行曲线拟合时, 只要根据至少两个采样时间点及在该采样时 间点获取的评论数量信息即可确定, 但是当拟合相应的曲线后, 可以直接根据该曲线进行 后续搜索结果的提供。在本发明实施例中为了保证拟合曲线的正确性, 保证向用户提供的 产品的准确率, 进一步提高网站的点击量及访问量, 所述确定该商。
34、品的采样时间点和评论 数量信息的拟合曲线后还包括 : 0072 采用相关系数R、 统计量F、 剩余标准差S中的至少一个参数, 对拟合的所述曲线进 行评价 ; 0073 当评价结果不满足相应参数对应的评价阈值时, 根据其他的采样时间点及评论数 量信息, 重新确定该商品的采样时间点和评论数量信息的拟合曲线。 0074 即当确定了该拟合曲线后, 根据该拟合曲线可以确定相应的每个采样时间点对应 的评论数量信息, 而每个采样时间点实际采集到的评论数量信息也是已知的, 因此根据该 两种方式确定的评论数量信息确定相关系数 R(Correlation coefficient), 相关系数 R 越 趋近于 1 。
35、说明曲线拟合的越准确。当两种方式确定的评论数量信息对应的相关系数 R 小于 设定的评价阈值时, 则认为该拟合曲线不够准确, 根据其他的采样时间点及评论数量信息, 重新确定该商品的采样时间点和评论数量信息的拟合曲线。 0075 相应由于统计量 F 是统计理论中用来对数据进行分析、 检验的变量, 是统计平均 值, 在进行样本统计时, 统计量 F 越大说明曲线拟合的越好。采用统计量 F 对拟合曲线进 行评价时, 得到的统计量 F 小于设定的对应评价阈值时, 确定该拟合曲线不够准确, 根据其 他的采样时间点及评论数量信息, 重新确定该商品的采样时间点和评论数量信息的拟合曲 线。 0076 剩余标准差 。
36、S 也称均方差, 在线性回归分析中, 真实值和估计值之间的差成为残 差 (或者剩余量) , 所有预测值的残差平方和 (或者剩余平方和) , 剩余标准差就是剩余平方 和的开平方。在具体计算时, 计算的是两种方式确定的评论数量信息的方差, 剩余标准差 S 越接近零, 说明曲线拟合的越好。因此在采用剩余标准差 S 进行评价时, 判断得到的剩余标 准差S是否大于设定的对应评价阈值, 当得到的剩余标准差S大于设定的对应评价阈值, 确 定该拟合曲线不够准确, 根据其他的采样时间点及评论数量信息, 重新确定该商品的采样 时间点和评论数量信息的拟合曲线。 0077 在根据上述参数对拟合曲线进行评价时, 可以任。
37、意选择, 可以选择一个、 两个或三 个进行评价, 只要存在相应参数不满足设定的评价阈值, 即可确定曲线拟合的不够准确, 重 新拟合曲线, 直到拟合出准确的曲线为止。 0078 图 2 为本发明实施例提供的该商品搜索及提供的一详细实施过程示意图, 该过程 包括以下步骤 : 0079 S201 : 搜索引擎根据设置的每个采样时间点, 针对每个商品所在的网页, 在每个采 样时间点获取用户对该商品进行评论的评论数量信息。 0080 S202 : 针对每个商品, 根据至少两个采样时间点及在该采样时间点获取的评论数 量信息, 采用最小二乘法, 确定该商品的采样时间点和评论数量信息的拟合曲线。 说 明 书 。
38、CN 103593426 A 9 7/9 页 10 0081 S203 : 采用相关系数 R、 统计量 F、 剩余标准差 S 中的至少一个参数, 对拟合的所述 曲线进行评价。 0082 S204 : 判断评价结果是否满足相应参数对应的评价阈值, 当满足时, 进行步骤 S205, 否则, 进行步骤 S202。 0083 S205 : 在接收到用户的搜索请求时, 根据拟合的所述曲线确定每个商品的评论数 量信息, 并根据确定的评论数量信息向用户提供相应的商品。 0084 另外, 在本发明实施例中为了保证拟合曲线的正确性, 保证向用户提供的产品的 准确率, 进一步提高电商网站的点击量及访问量, 所述确。
39、定该商品的采样时间点和评论数 量信息的拟合曲线包括 : 0085 根据当前时间及设定的拟合时间间隔, 获取以该当前时间为时间终点, 该拟合时 间间隔为长度的时间段内的每个采样时间点及在该采样时间点获取的评论数量信息 ; 0086 根据获取的该每个采样时间点和每个评论数量信息, 确定该商品的采样时间点和 评论数量信息的拟合曲线。 0087 即位于最近几周内的采样时间点, 及每个采样时间点获取的商品的评论数量信 息, 进行曲线的拟合。 该方法拟合出的曲线可以在一定程度上反映近期用户的访问量, 也能 在一定程度上反映出商品在最近受欢迎的程度。 0088 图 3 为本发明实施例提供的商品搜索及提供的另。
40、一具体实施过程示意图, 该过程 包括以下步骤 : 0089 S301 : 搜索引擎根据设置的每个采样时间点, 针对每个商品所在的网页, 在每个采 样时间点获取用户对该商品进行评论的评论数量信息。 0090 S302 : 针对每个商品, 根据当前时间及设定的拟合时间间隔, 获取以该当前时间为 时间终点, 该拟合时间间隔为长度的时间段内的每个采样时间点及在该采样时间点获取的 评论数量信息。 0091 S303 : 根据获取的该每个采样时间点和每个评论数量信息, 确定该商品的采样时 间点和评论数量信息的拟合曲线。 0092 S304 : 采用相关系数 R、 统计量 F、 剩余标准差 S 中的至少一个。
41、参数, 对拟合的所 述曲线进行评价。判断评价结果是否满足相应参数对应的评价阈值, 当满足时, 进行步骤 S305, 否则, 进行步骤 S302。 0093 S305 : 当接收到用户的搜索请求后, 确定该搜索请求对应的每个商品。 0094 S306 : 针对确定的所述每个商品的采样时间点和评论数量信息的拟合曲线, 确定 接收该搜索请求的时间对应的该商品的评论数量信息。 0095 S307 : 根据确定的评论数量信息, 向所述用户提供该搜索请求对应的商品的信息。 0096 由于在本发明实施例中根据每个采样时间点及在每个采样时间点采集到的用户 对商品的评论数量信息, 确定了商品对应的拟合曲线, 该。
42、拟合曲线可以在一定程度上反应 用户对该商品的点击量, 因此当在接收到用户的搜索请求, 并根据该拟合曲线确定的评论 数量信息向用户提供搜索请求对应的产品信息时, 可以减少用户搜索商品的时间, 并提高 电商网站的点击量及访问量。 0097 图 4 为本发明实施例提供的一种商品搜索及提供装置结构示意图, 所述装置包 括 : 说 明 书 CN 103593426 A 10 8/9 页 11 0098 获取模块 41, 用于根据设置的每个采样时间点, 针对每个商品所在的网页, 在每个 采样时间点获取用户对该商品进行评论的评论数量信息 ; 0099 拟合模块 42, 用于针对每个商品, 根据至少两个采样时。
43、间点及在该采样时间点获 取的评论数量信息, 采用最小二乘法, 确定该商品的采样时间点和评论数量信息的拟合曲 线 ; 0100 搜索模块 43, 用于当接收到用户的搜索请求后, 确定该搜索请求对应的每个商 品 ; 0101 确定模块 44, 用于针对确定的所述每个商品的采样时间点和评论数量信息的拟合 曲线, 确定接收该搜索请求的时间对应的该商品的评论数量信息 ; 0102 提供模块 45, 用于根据确定的评论数量信息, 向所述用户提供该搜索请求对应的 商品的信息。 0103 较佳地, 为了提高本方法中商品提供的效率及准确性, 所述获取模块 41, 具体用于 根据设置的商品点评模版, 针对每个网页。
44、在每个采样时间点获取用户对该商品进行评论的 评论数量信息。 0104 较佳地, 为了减少用户搜索商品的时间, 并提高电商网站的点击量及访问量, 所 述拟合模块 42, 具体用于针对该商品在每个采样时间点获取的评论数量信息, 模拟直线 y=a0+a1x, 其中 x 为采样时间点, y 为在该采样时间点获取的评论数量信息 ; 根据最小二乘 法, 确定模拟直线中的参数 a0 和 a1, 确定该商品的采样时间点和评论数量信息的拟合曲 线。 0105 较佳地, 为了保证拟合曲线的正确性, 保证向用户提供的产品的准确率, 进一步提 高电商网站的点击量及访问量, 所述拟合模块 42, 具体用于采用相关系数 。
45、R、 统计量 F、 剩余 标准差 S 中的至少一个参数, 对拟合的所述曲线进行评价 ; 当评价结果不满足相应参数对 应的评价阈值时, 根据其他的采样时间点及评论数量信息, 重新确定该商品的采样时间点 和评论数量信息的拟合曲线。 0106 较佳地, 为了保证拟合曲线的正确性, 保证向用户提供的产品的准确率, 进一步提 高电商网站的点击量及访问量, 所述拟合模块 42, 具体用于根据当前时间及设定的拟合时 间间隔, 获取以该当前时间为时间终点, 该拟合时间间隔为长度的时间段内的每个采样时 间点及在该采样时间点获取的评论数量信息 ; 根据获取的该每个采样时间点和每个评论数 量信息, 确定该商品的采样。
46、时间点和评论数量信息的拟合曲线。 0107 本发明实施例提供了一种商品搜索及提供方法及装置, 该方法中搜索引擎在每个 采集时间点, 在每个网页获取用户对该商品进行评论的评论数量信息, 根据至少两个采样 时间点及对应的在该采样时间点获取的评论数量信息, 采用最小二乘法, 确定该商品采样 时间点和评论数量信息的拟合曲线, 在接收到用户的搜索请求后, 根据该搜索请求对应的 每个商品, 及对应每个商品的拟合曲线, 确定接收到该搜索请求的时间对应的该商品的评 论数量信息, 根据确定的该评论数量信息, 向用户提供该搜索请求对应的商品的信息。 由于 在本发明实施例中根据每个采样时间点及在每个采样时间点采集到。
47、的用户对商品的评论 数量信息, 确定了商品对应的拟合曲线, 该拟合曲线可以在一定程度上反应用户对该商品 的点击量, 因此当在接收到用户的搜索请求, 并根据该拟合曲线确定的评论数量信息向用 户提供搜索请求对应的产品信息时, 可以减少用户搜索商品的时间, 并提高网站的点击量 说 明 书 CN 103593426 A 11 9/9 页 12 及访问量。 0108 本领域技术人员应明白, 本发明提供的方法和装置可以用于特定电商网站中, 也 可以用于对各电商网站中的商品进行搜索的搜索网站中。 本发明的方法和装置也可以不限 于电商应用领域, 而是可以适用于任何提供多种结合有评论信息的项目的网站以及对其进 。
48、行搜索的网站中。 0109 本领域内的技术人员应明白, 本申请的实施例可提供为方法、 系统、 或计算机程序 产品。因此, 本申请可采用完全硬件实施例、 完全软件实施例、 或结合软件和硬件方面的实 施例的形式。而且, 本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机 可用存储介质 (包括但不限于磁盘存储器、 CD-ROM、 光学存储器等) 上实施的计算机程序产 品的形式。 0110 本申请是参照根据本申请实施例的方法、 设备 (系统) 、 和计算机程序产品的流程 图和或方框图来描述的。 应理解可由计算机程序指令实现流程图和或方框图中的每一 流程和或方框、 以及流程图和或方框图中的流程。
49、和或方框的结合。可提供这些计算 机程序指令到通用计算机、 专用计算机、 嵌入式处理机或其他可编程数据处理设备的处理 器以产生一个机器, 使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生 用于实现在流程图一个流程或多个流程和或方框图一个方框或多个方框中指定的功能 的装置。 0111 这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特 定方式工作的计算机可读存储器中, 使得存储在该计算机可读存储器中的指令产生包括指 令装置的制造品, 该指令装置实现在流程图一个流程或多个流程和或方框图一个方框或 多个方框中指定的功能。 0112 这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上, 使得在计 算机或其他可编程设备上执行一系列操作步骤以产。