物品信息显示方法、装置、终端、服务器及可读存储介质.pdf
《物品信息显示方法、装置、终端、服务器及可读存储介质.pdf》由会员分享,可在线阅读,更多相关《物品信息显示方法、装置、终端、服务器及可读存储介质.pdf(33页完成版)》请在专利查询网上搜索。
1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202010460986.6 (22)申请日 2020.05.27 (71)申请人 腾讯科技 (深圳) 有限公司 地址 518057 广东省深圳市南山区高新区 科技中一路腾讯大厦35层 (72)发明人 杨琳陈春勇 (74)专利代理机构 北京三高永信知识产权代理 有限责任公司 11138 代理人 张所明 (51)Int.Cl. G06Q 30/06(2012.01) G06K 9/00(2006.01) G06K 9/32(2006.01) H04N 21/2187(2011.01。
2、) H04N 21/478(2011.01) (54)发明名称 物品信息显示方法、 装置、 终端、 服务器及可 读存储介质 (57)摘要 本申请提供了一种物品信息显示方法、 装 置、 终端、 服务器及可读存储介质, 属于计算机技 术领域。 该方法包括: 响应于对直播界面中所显 示的物品进行识别的物品识别指令, 获取直播界 面的画面图像, 基于画面图像, 获取用于指示画 面图像中物品的位置和物品关键字的至少一个 物品信息, 在直播界面中物品的对应位置上, 基 于至少一个物品信息所指示的物品关键字, 分别 显示对应的物品标签, 通过对物品关键字进行处 理得到物品标签, 以便通过物品标签来向用户展 。
3、示直播间中所包括的物品的物品信息, 使得用户 可以直接了解到这些物品的信息, 提高直播间的 信息交互效率, 进而提高用户体验。 权利要求书3页 说明书19页 附图10页 CN 111652678 A 2020.09.11 CN 111652678 A 1.一种物品信息显示方法, 其特征在于, 所述方法包括: 响应于物品识别指令, 获取直播界面的画面图像, 所述物品识别指令用于对所述直播 界面中所显示的物品进行识别; 基于所述画面图像, 获取至少一个物品信息, 所述物品信息用于指示所述画面图像中 物品的位置和物品关键字; 在所述直播界面中物品的对应位置上, 基于所述至少一个物品信息所指示的物品关。
4、键 字, 分别显示对应的物品标签, 所述物品标签用于在检测到触发操作时展示对应物品的物 品链接。 2.根据权利要求1所述的方法, 其特征在于, 所述基于所述画面图像, 获取至少一个物 品信息包括下述任一项: 向服务器发送物品识别请求, 所述物品识别请求携带所述画面图像, 接收所述服务器 基于所述画面图像返回的至少一个物品信息; 对所述画面图像进行图像识别, 得到所述至少一个物品信息。 3.根据权利要求1所述的方法, 其特征在于, 所述在所述直播界面中物品的对应位置 上, 基于所述至少一个物品信息所指示的物品关键字, 分别显示对应的物品标签之后, 所述 方法还包括: 响应于对所述至少一个物品标签。
5、中目标物品标签的查看指令, 向服务器发送物品链接 获取请求; 接收所述服务器返回的所述目标物品标签对应的至少一个物品链接; 对所述至少一个物品链接进行显示。 4.根据权利要求3所述的方法, 其特征在于, 所述对所述至少一个物品链接进行显示包 括: 在所述直播界面中显示物品链接展示区域, 所述物品链接展示区域部分覆盖所述直播 界面的画面图像; 在所述物品链接展示区域中, 显示至少一个物品条目, 一个物品条目对应于一个物品 链接。 5.根据权利要求1所述的方法, 其特征在于, 所述在所述直播界面中物品的对应位置 上, 基于所述至少一个物品信息所指示的物品关键字, 分别显示对应的物品标签之后, 所述。
6、 方法还包括: 确定所述画面图像中的人脸区域; 响应于对所述至少一个物品标签中目标物品标签的查看指令, 在所述直播界面中所述 人脸区域以外的区域, 对所述目标物品标签对应的至少一个物品链接进行显示。 6.根据权利要求1所述的方法, 其特征在于, 所述响应于物品识别指令, 获取直播界面 的画面图像之前, 所述方法还包括: 显示所述直播界面, 所述直播界面中包括物品识别按钮; 响应于检测到对所述物品识别按钮的触发操作, 生成所述物品识别指令。 7.一种物品信息显示方法, 其特征在于, 所述方法包括: 接收终端的物品识别请求, 所述物品识别请求携带直播界面的画面图像; 对所述画面图像进行识别, 得到。
7、所述画面图像中的至少一个物品信息, 所述物品信息 权利要求书 1/3 页 2 CN 111652678 A 2 用于指示所述画面图像中物品的位置和物品关键字; 将所述至少一个物品信息发送给所述终端。 8.根据权利要求7所述的方法, 其特征在于, 所述将所述至少一个物品信息发送给所述 终端之后, 所述方法还包括: 接收所述终端发送的物品链接获取请求, 所述物品链接获取请求携带物品关键字; 根据所述物品关键字, 获取至少一个物品链接; 将所述至少一个物品链接发送给所述终端。 9.根据权利要求7所述的方法, 其特征在于, 所述对所述画面图像进行识别, 得到所述 画面图像中的至少一个物品信息包括: 将。
8、所述画面图像输入第一图像识别模型, 通过所述第一图像识别模型对所述画面图像 进行识别, 得到所述画面图像中至少一个物品的物品位置和对应的第一物品关键字; 根据所述画面图像中至少一个物品的物品位置, 从所述画面图像中获取至少一个物品 图像; 将所述至少一个物品图像和对应的第一物品关键字输入第二图像识别模型, 通过所述 第二图像识别模型对所述至少一个物品图像进行识别, 得到所述至少一个物品图像对应的 第二物品关键字, 基于所述至少一个物品图像对应的第一物品关键字和所述至少一个物品 图像对应的第二物品关键字, 确定所述画面图像中至少一个物品的物品关键字; 结合所述至少一个物品的物品关键字和所述至少一。
9、个物品的物品位置, 确定所述画面 图像中的至少一个物品信息。 10.根据权利要求7所述的方法, 其特征在于, 所述将所述至少一个物品信息发送给所 述终端之后, 所述方法还包括: 接收所述终端发送的物品链接获取请求, 所述物品链接获取请求携带物品关键字; 根据所述物品关键字, 获取所述物品关键字对应的物品图像; 分别根据所述物品关键字和所述物品图像, 获取至少一个第一物品链接和至少一个第 二物品链接; 确定所述至少一个第一物品链接和所述至少一个第二物品链接中的至少一个重合物 品链接, 作为所述物品链接获取请求对应的至少一个物品链接; 将所述至少一个物品链接发送给所述终端。 11.一种物品信息显示。
10、装置, 其特征在于, 所述装置包括: 图像获取模块, 用于响应于物品识别指令, 获取直播界面的画面图像, 所述物品识别指 令用于对所述直播界面中所显示的物品进行识别; 信息获取模块, 用于基于所述画面图像, 获取至少一个物品信息, 所述物品信息用于指 示所述画面图像中物品的位置和物品关键字; 第一显示模块, 用于在所述直播界面中物品的对应位置上, 基于所述至少一个物品信 息所指示的物品关键字, 分别显示对应的物品标签, 所述物品标签用于在检测到触发操作 时展示对应物品的物品链接。 12.一种物品信息显示装置, 其特征在于, 所述装置包括: 接收模块, 用于接收终端的物品识别请求, 所述物品识别。
11、请求携带直播界面的画面图 像; 权利要求书 2/3 页 3 CN 111652678 A 3 识别模块, 用于对所述画面图像进行识别, 得到所述画面图像中的至少一个物品信息, 所述物品信息用于指示所述画面图像中物品的位置和物品关键字; 发送模块, 用于将所述至少一个物品信息发送给所述终端。 13.一种终端, 其特征在于, 所述终端包括一个或多个处理器和一个或多个存储器, 所 述一个或多个存储器中存储有至少一条程序代码, 所述程序代码由所述一个或多个处理器 加载并执行以实现如权利要求1至权利要求6任一项所述的物品信息显示方法所执行的操 作。 14.一种计算机设备, 其特征在于, 所述计算机设备包。
12、括一个或多个处理器和一个或多 个存储器, 所述一个或多个存储器中存储有至少一条程序代码, 所述程序代码由所述一个 或多个处理器加载并执行以实现如权利要求7至权利要求10任一项所述的物品信息显示方 法所执行的操作。 15.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质中存储有至少一 条程序代码, 所述程序代码由处理器加载并执行以实现如权利要求1至权利要求10任一项 所述的物品信息显示方法所执行的操作。 权利要求书 3/3 页 4 CN 111652678 A 4 物品信息显示方法、 装置、 终端、 服务器及可读存储介质 技术领域 0001 本申请涉及计算机技术领域, 特别涉及一种。
13、物品信息显示方法、 装置、 终端、 服务 器及可读存储介质。 背景技术 0002 随着直播行业的蓬勃发展, 直播行业在电子商务领域得到了较为广泛的应用。 主 播可以在开始直播前, 将要出售的商品的商品链接添加到直播间, 以便在直播界面中对该 商品链接进行显示。 在直播过程中, 主播可以对要出售的商品进行介绍, 该直播界面中显示 有该商品的商品链接, 观看直播的用户可以在想要购买该商品时, 点击直播界面中的商品 链接, 来触发商品购买请求, 终端可以响应于该商品购买请求, 执行相应的购买流程。 0003 在上述实现过程中, 主播进行直播时, 直播间里除了要出售商品外, 还会有其他的 东西展示在直。
14、播间里, 观看直播的用户有时候会关注到这些东西, 并且很想了解到这些东 西的信息, 但这些东西的信息只能通过询问主播来获取, 而无法直接获取, 导致信息交互效 率较低, 用户体验较差。 发明内容 0004 本申请实施例提供了一种物品信息显示方法、 装置、 终端、 服务器及可读存储介 质, 可以提高直播间的信息交互效率, 进而提高用户体验。 该技术方案如下: 0005 一方面, 提供了一种物品信息显示方法, 该方法包括: 0006 响应于物品识别指令, 获取直播界面的画面图像, 该物品识别指令用于对该直播 界面中所显示的物品进行识别; 0007 基于该画面图像, 获取至少一个物品信息, 该物品信。
15、息用于指示该画面图像中物 品的位置和物品关键字; 0008 在该直播界面中物品的对应位置上, 基于该至少一个物品信息所指示的物品关键 字, 分别显示对应的物品标签, 该物品标签用于在检测到触发操作时展示对应物品的物品 链接。 0009 一方面, 提供了一种物品信息显示方法, 该方法包括: 0010 接收终端的物品识别请求, 该物品识别请求携带直播界面的画面图像; 0011 对该画面图像进行识别, 得到该画面图像中的至少一个物品信息, 该物品信息用 于指示该画面图像中物品的位置和物品关键字; 0012 将该至少一个物品信息发送给该终端。 0013 在一种可能的实现方式中, 该基于该至少一个物品图。
16、像对应的第一物品关键字和 该至少一个物品图像对应的第二物品关键字, 确定该画面图像中至少一个物品的物品关键 字包括: 0014 在至少一个第二物品关键字中, 确定与至少一个第一物品关键字的相似度满足预 设条件的目标第二物品关键字, 将该目标第二物品关键字作为该画面图像中至少一个物品 说明书 1/19 页 5 CN 111652678 A 5 的物品关键字。 0015 在一种可能的实现方式中, 该确定该至少一个第一物品链接和该至少一个第二物 品链接中的至少一个重合物品链接, 作为该物品链接获取请求对应的至少一个物品链接之 后, 该方法还包括: 0016 按照该至少一个物品链接对应的推荐指数从大到。
17、小的顺序, 对该至少一个物品链 接进行排序; 0017 获取排序位于目标位置之前的至少一个物品链接。 0018 在一种可能的实现方式中, 该推荐指数包括价格推荐指数、 销量推荐指数、 好评推 荐指数和物流推荐指数中至少一项。 0019 在一种可能的实现方式中, 该对该画面图像进行识别, 得到该画面图像中的至少 一个物品信息之后, 该方法还包括: 0020 获取该直播界面对应的直播间的直播物品信息; 0021 从识别得到的至少一个物品信息中删除该直播物品信息, 得到该画面图像中的至 少一个物品信息。 0022 一方面, 提供了一种物品信息显示装置, 该装置包括: 0023 图像获取模块, 用于响。
18、应于物品识别指令, 获取直播界面的画面图像, 该物品识别 指令用于对该直播界面中所显示的物品进行识别; 0024 信息获取模块, 用于基于该画面图像, 获取至少一个物品信息, 该物品信息用于指 示该画面图像中物品的位置和物品关键字; 0025 第一显示模块, 用于在该直播界面中物品的对应位置上, 基于该至少一个物品信 息所指示的物品关键字, 分别显示对应的物品标签, 该物品标签用于在检测到触发操作时 展示对应物品的物品链接。 0026 在一种可能的实现方式中, 该信息获取模块用于下述任一项: 0027 向服务器发送物品识别请求, 该物品识别请求携带该画面图像, 接收该服务器基 于该画面图像返回。
19、的至少一个物品信息; 0028 对该画面图像进行图像识别, 得到该至少一个物品信息。 0029 在一种可能的实现方式中, 该装置还包括: 0030 发送模块, 用于响应于对该至少一个物品标签中目标物品标签的查看指令, 向服 务器发送物品链接获取请求; 0031 接收模块, 用于接收该服务器返回的该目标物品标签对应的至少一个物品链接; 0032 第二显示模块, 用于对该至少一个物品链接进行显示。 0033 在一种可能的实现方式中, 该第二显示模块, 用于在该直播界面中显示物品链接 展示区域, 该物品链接展示区域部分覆盖该直播界面的画面图像, 在该物品链接展示区域 中, 显示至少一个物品条目, 一。
20、个物品条目对应于一个物品链接。 0034 在一种可能的实现方式中, 该装置还包括: 0035 确定模块, 用于确定该画面图像中的人脸区域; 0036 第三显示模块, 用于响应于对该至少一个物品标签中目标物品标签的查看指令, 在该直播界面中该人脸区域以外的区域, 对该目标物品标签对应的至少一个物品链接进行 显示。 说明书 2/19 页 6 CN 111652678 A 6 0037 在一种可能的实现方式中, 该装置还包括: 0038 第四显示模块, 用于显示该直播界面, 该直播界面中包括物品识别按钮; 0039 生成模块, 用于响应于检测到对该物品识别按钮的触发操作, 生成该物品识别指 令。 0。
21、040 一方面, 提供了一种物品信息显示装置, 该装置包括: 0041 第一接收模块, 用于接收终端的物品识别请求, 该物品识别请求携带直播界面的 画面图像; 0042 识别模块, 用于对该画面图像进行识别, 得到该画面图像中的至少一个物品信息, 该物品信息用于指示该画面图像中物品的位置和物品关键字; 0043 第一发送模块, 用于将该至少一个物品信息发送给该终端。 0044 在一种可能的实现方式中, 该装置还包括: 0045 第二接收模块, 用于接收该终端发送的物品链接获取请求, 该物品链接获取请求 携带物品关键字; 0046 第一链接获取模块, 用于根据该物品关键字, 获取至少一个物品链接。
22、; 0047 第二发送模块, 用于将该至少一个物品链接发送给该终端。 0048 在一种可能的实现方式中, 该识别模块包括第一识别单元、 获取单元、 第二识别单 元和确定单元; 0049 该第一识别单元, 用于将该画面图像输入第一图像识别模型, 通过该第一图像识 别模型对该画面图像进行识别, 得到该画面图像中至少一个物品的物品位置和对应的第一 物品关键字; 0050 该获取单元, 用于根据该画面图像中至少一个物品的物品位置, 从该画面图像中 获取至少一个物品图像; 0051 该第二识别单元包括第二识别子单元和确认子单元; 0052 该第二识别子单元, 用于将该至少一个物品图像和对应的第一物品关键。
23、字输入第 二图像识别模型, 通过该第二图像识别模型对该至少一个物品图像进行识别, 得到该至少 一个物品图像对应的第二物品关键字; 0053 该确定子单元, 用于基于该至少一个物品图像对应的第一物品关键字和该至少一 个物品图像对应的第二物品关键字, 确定该画面图像中至少一个物品的物品关键字; 0054 该确定单元, 用于结合该至少一个物品的物品关键字和该至少一个物品的物品位 置, 确定该画面图像中的至少一个物品信息。 0055 在一种可能的实现方式中, 该确定子单元, 用于在至少一个第二物品关键字中, 确 定与至少一个第一物品关键字的相似度满足预设条件的目标第二物品关键字, 将该目标第 二物品关。
24、键字作为该画面图像中至少一个物品的物品关键字。 0056 在一种可能的实现方式中, 该装置还包括: 0057 第三接收模块, 用于接收该终端发送的物品链接获取请求, 该物品链接获取请求 携带物品关键字; 0058 图像获取模块, 用于根据该物品关键字, 获取该物品关键字对应的物品图像; 0059 第二链接获取模块, 用于分别根据该物品关键字和该物品图像, 获取至少一个第 一物品链接和至少一个第二物品链接; 说明书 3/19 页 7 CN 111652678 A 7 0060 确定模块, 用于确定该至少一个第一物品链接和该至少一个第二物品链接中的至 少一个重合物品链接, 作为该物品链接获取请求对。
25、应的至少一个物品链接; 0061 第三发送模块, 用于将该至少一个物品链接发送给该终端。 0062 在一种可能的实现方式中, 该装置还包括: 0063 排序模块, 用于按照该至少一个物品链接对应的推荐指数从大到小的顺序, 对该 至少一个物品链接进行排序; 0064 第三链接获取模块, 用于获取排序位于目标位置之前的至少一个物品链接。 0065 在一种可能的实现方式中, 该推荐指数包括价格推荐指数、 销量推荐指数、 好评推 荐指数和物流推荐指数中至少一项。 0066 在一种可能的实现方式中, 该装置还包括: 0067 信息获取模块, 用于获取该直播界面对应的直播间的直播物品信息; 0068 删除。
26、模块, 用于从识别得到的至少一个物品信息中删除该直播物品信息, 得到该 画面图像中的至少一个物品信息。 0069 一方面, 提供了一种终端, 该终端包括一个或多个处理器和一个或多个存储器, 该 一个或多个存储器中存储有至少一条程序代码, 该程序代码由该一个或多个处理器加载并 执行以实现该物品信息显示方法所执行的操作。 0070 一方面, 提供了一种服务器, 该服务器包括一个或多个处理器和一个或多个存储 器, 该一个或多个存储器中存储有至少一条程序代码, 该程序代码由该一个或多个处理器 加载并执行以实现该物品信息显示方法所执行的操作。 0071 一方面, 提供了一种计算机可读存储介质, 该计算机。
27、可读存储介质中存储有至少 一条程序代码, 该程序代码由处理器加载并执行以实现该物品信息显示方法所执行的操 作。 0072 一方面, 提供了一种应用程序产品, 该应用程序产品存储有至少一条程序代码, 该 至少一条程序代码由终端的处理器加载并执行, 以实现上述物品信息显示方法所执行的操 作。 0073 通过响应于对直播界面中所显示的物品进行识别的物品识别指令, 获取直播界面 的画面图像, 基于画面图像, 获取用于指示画面图像中物品的位置和物品关键字的至少一 个物品信息, 在直播界面中物品的对应位置上, 基于至少一个物品信息所指示的物品关键 字, 分别显示对应的用于在检测到触发操作时展示对应物品的物。
28、品链接的物品标签, 通过 对物品关键字进行处理得到物品标签, 以便通过物品标签来向用户展示直播间所包括的物 品的物品信息, 使得用户可以直接了解到这些物品的信息, 提高直播间的信息交互效率, 进 而提高用户体验。 附图说明 0074 为了更清楚地说明本申请实施例中的技术方案, 下面将对实施例描述中所需要使 用的附图作简单地介绍, 显而易见地, 下面描述中的附图仅仅是本申请的一些实施例, 对于 本领域普通技术人员来讲, 在不付出创造性劳动的前提下, 还可以根据这些附图获得其他 的附图。 0075 图1是本申请实施例提供的一种物品信息显示方法的实施环境示意图; 说明书 4/19 页 8 CN 11。
29、1652678 A 8 0076 图2是本申请实施例提供的一种物品信息显示方法的流程图; 0077 图3是本申请实施例提供的一种物品信息显示方法的流程图; 0078 图4是本申请实施例提供的一种物品信息显示方法的流程图; 0079 图5是本申请实施例提供的一种直播界面的示意图; 0080 图6是本申请实施例提供的一种直播界面的示意图; 0081 图7是本申请实施例提供的一种物品标签显示界面的示意图; 0082 图8是本申请实施例提供的一种物品链接展示界面的示意图; 0083 图9是本申请实施例提供的一种物品信息显示方法的流程图; 0084 图10是本申请实施例提供的一种物品信息显示装置的结构图。
30、; 0085 图11是本申请实施例提供的一种物品信息显示装置的结构图; 0086 图12是本申请实施例提供的一种终端的结构示意图; 0087 图13是本申请实施例提供的一种服务器的结构示意图。 具体实施方式 0088 为使本申请的目的、 技术方案和优点更加清楚, 下面将结合附图对本申请实施方 式作进一步地详细描述。 0089 人工智能(Artificial Intelligence, AI)是利用数字计算机或者数字计算机控 制的机器模拟、 延伸和扩展人的智能, 感知环境、 获取知识并使用知识获得最佳结果的理 论、 方法、 技术及应用系统。 换句话说, 人工智能是计算机科学的一个综合技术, 它企。
31、图了解 智能的实质, 并生产出一种新的能以人类智能相似的方式做出反应的智能机器。 人工智能 也就是研究各种智能机器的设计原理与实现方法, 使机器具有感知、 推理与决策的功能。 0090 人工智能技术是一门综合学科, 涉及领域广泛, 既有硬件层面的技术也有软件层 面的技术。 人工智能基础技术一般包括如传感器、 专用人工智能芯片、 云计算、 分布式存储、 大数据处理技术、 操作/交互系统、 机电一体化等技术。 人工智能软件技术主要包括计算机 视觉技术、 语音处理技术、 自然语言处理技术以及机器学习/深度学习等几大方向。 0091 机器学习(Machine Learning, ML)是一门多领域交叉。
32、学科, 涉及概率论、 统计学、 逼近论、 凸分析、 算法复杂度理论等多门学科。 专门研究计算机怎样模拟或实现人类的学习 行为, 以获取新的知识或技能, 重新组织已有的知识结构使之不断改善自身的性能。 机器学 习是人工智能的核心, 是使计算机具有智能的根本途径, 其应用遍及人工智能的各个领域。 机器学习和深度学习通常包括人工神经网络、 置信网络、 强化学习、 迁移学习、 归纳学习、 示 教学习等技术。 0092 计算机视觉技术(Computer Vision, CV)计算机视觉是一门研究如何使机器 “看” 的科学, 更进一步的说, 就是指用摄影机和电脑代替人眼对目标进行识别、 跟踪和测量等机 器。
33、视觉, 并进一步做图形处理, 使电脑处理成为更适合人眼观察或传送给仪器检测的图像。 作为一个科学学科, 计算机视觉研究相关的理论和技术, 试图建立能够从图像或者多维数 据中获取信息的人工智能系统。 计算机视觉技术通常包括图像处理、 图像识别、 图像语义理 解、 图像检索、 光学字符识别(Optical Character Recognition, OCR)、 视频处理、 视频语义 理解、 视频内容/行为识别、 三维物体重建、 三维(Three-Dimensional, 3D)技术、 虚拟现实、 增强现实、 同步定位与地图构建等技术, 还包括常见的人脸识别、 指纹识别等生物特征识别 说明书 5/。
34、19 页 9 CN 111652678 A 9 技术。 0093 所谓人工智能云服务 , 一般也被称作是人工智能即服务 (Artificial Intelligence as a Service, AIaaS)。 这是目前主流的一种人工智能平台的服务方式, 具 体来说AIaaS平台会把几类常见的人工智能(Artificial Intelligence, AI)服务进行拆 分, 并在云端提供独立或者打包的服务。 这种服务模式类似于开了一个AI主题商城: 所有的 开发者都可以通过应用程序编程接口(Application Programming Interface, API)的方式 来接入使用平台提。
35、供的一种或者是多种人工智能服务, 部分资深的开发者还可以使用平台 提供的AI框架和AI基础设施来部署和运维自已专属的云人工智能服务。 0094 随着人工智能技术研究和进步, 人工智能技术在多个领域展开研究和应用, 例如 常见的智能家居、 智能穿戴设备、 虚拟助理、 智能音箱、 智能营销、 无人驾驶、 自动驾驶、 无人 机、 机器人、 智能医疗、 智能客服等, 相信随着技术的发展, 人工智能技术将在更多的领域得 到应用, 并发挥越来越重要的价值。 0095 本申请实施例提供的方案涉及人工智能服务的图像处理, 例如, 人工智能云服务 的图像处理等技术, 具体通过如下实施例进行说明: 0096 图1。
36、是本申请实施例提供的一种物品信息显示方法的实施环境示意图, 参见图1, 该实施环境包括: 终端101和服务器102。 0097 终端101可以是智能手机、 平板电脑、 笔记本电脑、 台式计算机、 智能音箱、 智能手 表等, 但并不局限于此。 终端101上可以安装并运行有直播类应用程序, 终端101可以对直播 界面进行显示, 以便用户通过终端101来观看直播。 用户可以通过在终端101的可视化界面 上触发观看直播按钮, 终端响应于该触发操作, 可以生成直播数据获取指令, 来获取直播数 据。 终端101以及服务器102可以通过有线或无线通信方式进行直接或间接地连接, 本申请 在此不做限制。 终端1。
37、01可以将该直播数据获取指令发送给服务器102, 并接收服务器102返 回的直播数据, 进而对接收到的直播数据进行解码, 得到音频帧和视频帧, 并基于解码得到 的音频帧和视频帧进行直播。 0098 终端101可以泛指多个终端中的一个, 本实施例以终端101来举例说明。 本领域技 术人员可以知晓, 上述终端的数量可以更多或更少。 比如上述终端可以仅为一个, 或者上述 终端为几十个或几百个, 或者更多数量, 本申请实施例对终端的数量和设备类型不加以限 定。 0099 服务器102可以是独立的物理服务器, 也可以是多个物理服务器构成的服务器集 群或者分布式系统, 还可以是提供云服务、 云数据库、 云。
38、计算、 云函数、 云存储、 网络服务、 云 通信、 中间件服务、 域名服务、 安全服务、 内容分发网络(Content Delivery Network, CDN)、 以及大数据和人工智能平台等基础云计算服务的云服务器。 服务器102以及终端101可以通 过有线或无线通信方式进行直接或间接地连接, 本申请在此不做限制。 服务器102可以接收 各个终端发送的直播数据获取请求, 并基于主播终端上传的音频帧和视频帧进行编码, 得 到直播数据, 进而将该直播数据分发给各个终端, 以便各个终端基于接收到的直播数据进 行直播。 可选地, 上述服务器的数量可以更多或更少, 本申请实施例对此不加以限定。 当然。
39、, 服务器102还可以包括其他功能服务器, 以便提供更全面且多样化的服务。 0100 图2是本申请实施例提供的一种物品信息显示方法的流程图, 参见图2, 应用于终 端, 该方法包括: 说明书 6/19 页 10 CN 111652678 A 10 0101 201、 响应于物品识别指令, 获取直播界面的画面图像, 该物品识别指令用于对该 直播界面中所显示的物品进行识别。 0102 需要说明的是, 终端在对直播界面的画面图像进行获取时, 可以基于该物品识别 指令, 对当前显示的直播界面进行截屏, 得到直播画面的画面图像。 可选地, 终端可以基于 直播过程中各个画面图像对应的播放时间, 对多个画面。
40、图像进行缓存, 进而可以响应于物 品识别指令, 基于该物品识别指令的接收时间, 从缓存中获取播放时间与物品识别指令的 接收时间对应的画面图像。 本申请实施例对具体采用哪种方式获取直播界面的画面图像不 加以限定。 0103 202、 基于该画面图像, 获取至少一个物品信息, 该物品信息用于指示该画面图像 中物品的位置和物品关键字。 0104 需要说明的是, 该物品信息所指示的物品的位置用于对该物品在画面图像中的位 置进行标识, 该物品信息所指示的物品关键字用于对该物品的类别进行标识, 如 “跳绳” 、 “耳机” 等。 0105 203、 在该直播界面中物品的对应位置上, 基于该至少一个物品信息所。
41、指示的物品 关键字, 分别显示对应的物品标签, 该物品标签用于在检测到触发操作时展示对应物品的 物品链接。 0106 需要说明的是, 通过该物品信息所指示的物品的位置, 终端可以在相应的位置对 物品标签进行显示, 该物品标签中显示的内容即为物品信息所指示的物品关键字。 0107 本申请实施例提供的方案, 通过获取直播界面的画面图像中的至少一个物品信 息, 并在直播界面中物品的对应位置上, 基于至少一个物品信息所指示的物品关键字, 分别 显示对应的物品标签, 来向用户展示直播间所包括的物品的物品信息, 使得用户可以直接 了解到这些物品的信息, 无需向主播进行询问, 提高直播间的信息交互效率, 进。
42、而提高用户 体验。 0108 图3是本申请实施例提供的一种物品信息显示方法的流程图, 参见图2, 应用于服 务器, 该方法包括: 0109 301、 接收终端的物品识别请求, 该物品识别请求携带直播界面的画面图像。 0110 302、 对该画面图像进行识别, 得到该画面图像中的至少一个物品信息, 该物品信 息用于指示该画面图像中物品的位置和物品关键字。 0111 需要说明的是, 服务器可以通过预先训练好的第一图像识别模型和第二图像识别 模型, 来对画面图像进行识别。 可选地, 还可以采用其他方式来对画面图像进行识别, 本申 请实施例对此不加以限定。 0112 303、 将该至少一个物品信息发送。
43、给该终端。 0113 本申请实施例提供的方案, 通过对接收到的直播界面的画面图像进行识别, 进而 将识别得到的至少一个物品信息发送给终端, 以便终端可以在直播界面中物品的对应位置 上, 基于至少一个物品信息所指示的物品关键字, 分别显示对应的物品标签, 来向用户展示 直播间所包括的物品的物品信息, 使得用户可以直接了解到这些物品的信息, 无需向主播 进行询问, 提高直播间的信息交互效率, 进而提高用户体验。 0114 图4是本申请实施例提供的一种物品信息显示方法的流程图, 参见图4, 该方法包 括: 说明书 7/19 页 11 CN 111652678 A 11 0115 401、 终端显示该。
44、直播界面, 该直播界面中包括物品识别按钮。 0116 需要说明的是, 终端上可以安装并运行有直播类应用程序或具有直播功能的应用 程序, 用户可以通过这类应用程序, 来对直播进行观看。 0117 其中, 该直播界面可以参见图5, 图5是本申请实施例提供的一种直播界面的示意 图, 该直播界面中可以设置有菜单按钮501、 转发按钮502和点赞按钮503三个按钮, 用户可 以在该直播界面中对菜单按钮501进行触发, 终端可以响应于用户的触发操作, 在如图6所 示的界面中, 对菜单按钮对应的功能按钮进行展示, 参见图6, 图6是本申请实施例提供的一 种直播界面的示意图, 终端可以在该界面中提供优惠券获取。
45、按钮601、 清晰度选择按钮602 和物品识别按钮603三种功能按钮。 其中, 该物品识别按钮用于对直播界面的画面图像中的 物品进行识别。 0118 402、 终端响应于检测到对该物品识别按钮的触发操作, 生成物品识别指令, 该物 品识别指令用于对该直播界面中所显示的物品进行识别。 0119 在一种可能的实现方式中, 用户可以在如图6所示的界面中, 对物品识别按钮603 进行触发, 终端在检测到该触发操作时, 可以生成物品识别指令。 0120 403、 终端响应于该物品识别指令, 获取直播界面的画面图像。 0121 在一种可能的实现方式中, 终端可以响应于该物品识别指令, 调用操作系统中的 截。
46、屏工具, 来对当前显示的直播界面进行截屏, 得到直播界面的画面图像。 0122 在另一种可能的实现方式中, 终端可以基于直播过程中各个画面图像对应的播放 时间, 对多个画面图像进行缓存, 进而可以响应于物品识别指令, 基于该物品识别指令的接 收时间, 从缓存中获取播放时间与物品识别指令的接收时间对应的画面图像, 也即是, 物品 识别指令对应的画面图像。 0123 404、 终端向服务器发送物品识别请求, 该物品识别请求携带该画面图像。 0124 需要说明的是, 该画面图像可以携带有用户标识, 以便服务器可以对用户标识与 对应的画面图像进行存储, 方便后续需要进行图像的获取时, 可以直接基于用户。
47、标识进行 获取。 0125 405、 服务器响应于接收到的物品识别请求, 将该画面图像输入第一图像识别模 型, 通过该第一图像识别模型对该画面图像进行识别, 得到该画面图像中至少一个物品的 物品位置和对应的第一物品关键字。 0126 需要说明的是, 服务器在对画面图像进行识别得到至少一个物品信息所指示的物 品关键字时, 其过程大致可以分为以下几步: 信息的获取、 预处理、 特征抽取和选择、 分类器 设计和分类决策。 下面基于步骤408至步骤408的过程来对识别得到物品关键字的过程进行 进一步描述。 0127 其中, 该第一图像识别模型可以为卷积神经网络, 卷积神经网络可以基于同一图 像中相邻像。
48、素的强关联性和强相似性, 来对图像进行识别。 由于在一张图像中的两个相邻 像素, 比图像中两个分开的像素更具有关联性, 因而采用这种卷积神经网络进行识别, 可以 提高识别结果的准确性。 可选地, 该第一图像识别模型还可以为其他类型的网络模型, 本申 请实施例对此不加以限定。 0128 以该第一图像识别模型为卷积神经网络为例, 该第一图像识别模型可以包括卷积 层、 汇聚层和分类器。 在一种可能的实现方式中, 服务器可以将物品识别请求携带的画面图 说明书 8/19 页 12 CN 111652678 A 12 像输入第一图像识别模型, 通过该第一图像识别模型的卷积层, 将该画面图像分成多个像 素块。
49、, 用数字对各个像素块的高度、 宽度和颜色分别进行表示, 得到各个像素块的三维数值 表达, 再通过该第一图像识别模型的汇聚层, 结合采样函数来对各个像素块的三维数值表 达进行采样, 得到一个联合数组, 该联合数组中仅包含该画面图像中相对重要的部分, 进而 通过该第一图像识别模型的分类器, 根据该联合数组, 得到该画面图像中至少一个物品的 物品位置和对应的第一物品关键字。 0129 其中, 在将该画面图像分成多个像素块时, 服务器可以将该画面图像分成3*3或5* 5的像素块。 可选地, 该像素块还可以为其他大小, 本申请实施例对此不加以限定。 此外, 除 对各个像素块的高度、 宽度和颜色分别进行。
50、表示, 得到各个像素块的三维数值表达外, 还可 以对各个像素块的其他内容进行表示, 得到更高维度的数值表达, 如四维数值表达等, 本申 请实施例对此不加以限定。 0130 需要说明的是, 该第一图像识别模型可以基于下述训练过程预先训练得到: 服务 器可以获取多个样本画面图像以及每个样本画面图像中至少一个样本物品的样本物品位 置和对应的第一样本物品关键字, 服务器可以将该多个样本画面图像逐个输入初始第一图 像识别模型, 通过初始第一图像识别模型的卷积层, 将该样本画面图像分成多个样本像素 块, 用数字对各个样本像素块的高度、 宽度和颜色分别进行表示, 得到各个样本像素块的三 维数值表达, 再通过。
- 内容关键字: 物品 信息 显示 方法 装置 终端 服务器 可读 存储 介质
显示装置.pdf
电子机芯生产用配件装配设备.pdf
玻璃制品生产原料除铁设备.pdf
电路板点焊设备.pdf
茶叶分选用过滤装置.pdf
用于茶叶的储存罐结构.pdf
基于压感自调张力的化纤面料圆筒针织机牵拉结构.pdf
多功能小车移动防护结构.pdf
可拆卸式的灌装装置.pdf
输配电线路无线通信型激光雷达.pdf
炼厂货用升降机轿厢制停测距装置.pdf
文档扫描仪的纸张对齐机构.pdf
测量斜绕螺线管磁场强度的实验装置.pdf
通电检测夹具.pdf
用于丁基胶灌装机的压盘结构.pdf
真空绝热外墙复合一体板.pdf
提高丰年虫孵化率的孵化装置.pdf
陶瓷加工用球磨机.pdf
快速调节间隙的悬挂端梁.pdf
洁净室恒温恒湿空气处理组合风柜.pdf
汽车管柱筒生产用下料设备.pdf
裤耳机的裤耳定位装置.pdf
建筑设施抗震性能的评估方法、装置、设备及存储介质.pdf
基于牵引振动落饵料的导料槽结构及灭蚁毒饵撒料机.pdf
高通量高分辨率静态傅里叶变换光谱测量方法.pdf
智能计量包装方法及装置.pdf
RNA疫苗递送制剂及其制备方法.pdf
基于点云与有限元分析的飞机蒙皮修配方法.pdf
检测番鸭查帕马病毒的引物和探针、病毒分离培养方法.pdf
长效保湿乳液及其制备方法.pdf
水泥碎渣废料清理装置.pdf
基于病患信息的全病程管理平台的应用方法及系统.pdf
一种升降式旋转室外消火栓.pdf
框架结构T型连接柱.pdf
防静电地板吸板器.pdf
一种建筑用箱体或井口预留孔洞活动模具.pdf
速成拉建房屋.pdf
预制桥面板精轧螺纹钢筋弧形连接构造.pdf
一种内固定式伸缩门滑行导轨及伸缩门.pdf
多用途封井器.pdf
一种新型圆弧建筑模板紧固件.pdf
一种超实木防水组合踢脚线.pdf
电气柜前门板门锁装置.pdf
双人正杆器.pdf
一种纳米铝塑复合板.pdf
强磁打捞器.pdf
一种基于无刷直流电机的环卫车电动扫盘系统.pdf
一种可调节型门铰链.pdf
一种用于基桩竖向抗压静载试验的船筏式试验装置.pdf
免贴墙砖.pdf
一种聚氨酯仿石材防火保温装饰复合板.pdf