基于注意力机制的手势位置预估方法及相关装置.pdf

上传人:奶盖 文档编号:10168138 上传时间:2021-06-09 格式:PDF 页数:12 大小:466.23KB
收藏 版权申诉 举报 下载
基于注意力机制的手势位置预估方法及相关装置.pdf_第1页
第1页 / 共12页
基于注意力机制的手势位置预估方法及相关装置.pdf_第2页
第2页 / 共12页
基于注意力机制的手势位置预估方法及相关装置.pdf_第3页
第3页 / 共12页
文档描述:

《基于注意力机制的手势位置预估方法及相关装置.pdf》由会员分享,可在线阅读,更多相关《基于注意力机制的手势位置预估方法及相关装置.pdf(12页完成版)》请在专利查询网上搜索。

1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202010995310.7 (22)申请日 2020.09.21 (71)申请人 广东工业大学 地址 510060 广东省广州市越秀区东风东 路729号大院 (72)发明人 房小兆韩娜周郭许谢胜利 滕少华 (74)专利代理机构 北京集佳知识产权代理有限 公司 11227 代理人 杨小红 (51)Int.Cl. G06K 9/00(2006.01) G06K 9/62(2006.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 。

2、一种基于注意力机制的手势位置预估方法 及相关装置 (57)摘要 本申请公开了一种基于注意力机制的手势 位置预估方法及相关装置, 方法包括: 获取第一 时间的第一手势图像; 采用预置RNN隐含层处理 第一手势图像, 得到隐含向量, 并根据隐含向量 和预置初始位置计算得到注意力分配系数; 根据 隐含向量和注意力分配系数计算手势隐含状态 分布规律; 采用预置全连接层处理手势隐含状态 分布规律, 得到手势预估位置; 获取第二时间的 第二手势图像, 将第二手势图像代替第一手势图 像, 将手势预估位置代替预置初始位置, 返回采 用预置RNN隐含层处理第一手势图像的步骤, 直 至得到所有手势预估位置。 本申。

3、请能够解决现有 技术存在大量白噪声, 导致手势位置显示效果较 差的技术问题。 权利要求书2页 说明书7页 附图2页 CN 112084995 A 2020.12.15 CN 112084995 A 1.一种基于注意力机制的手势位置预估方法, 其特征在于, 包括: 获取第一时间的第一手势图像, 所述第一时间包括连续的多个时刻; 采用预置RNN隐含层处理所述第一手势图像, 得到隐含向量, 并根据所述隐含向量和预 置初始位置计算得到注意力分配系数; 根据所述隐含向量和所述注意力分配系数计算手势隐含状态分布规律; 采用预置全连接层处理所述手势隐含状态分布规律, 得到手势预估位置; 获取第二时间的第二手。

4、势图像, 将所述第二手势图像代替所述第一手势图像, 将所述 手势预估位置代替所述预置初始位置, 返回所述采用预置RNN隐含层处理所述第一手势图 像的步骤, 直至得到所有所述手势预估位置。 2.根据权利要求1所述的基于注意力机制的手势位置预估方法, 其特征在于, 所述获取 第一时间的第一手势图像, 所述第一时间包括连续的多个时刻, 包括: 在预置视频素材的每一秒处获取预置数量的初始手势图像; 从所述初始手势图像中选取一张最优手势图像作为对应时刻的预置手势图像; 获取连续预置秒对应的所述预置手势图像作为所述第一手势图像, 所述预置秒为所述 第一时间, 其中一秒为一个时刻。 3.根据权利要求1所述的。

5、基于注意力机制的手势位置预估方法, 其特征在于, 所述根据 所述隐含向量和所述注意力分配系数计算手势隐含状态分布规律, 包括: 采用预置公式根据所述隐含向量和所述注意力分配系数计算手势隐含状态分布规律, 所述预置公式为: 其中, ct为t时刻的手势隐含状态分布规律, Tx为选取手势图像的数量, t,i为t时刻第i 张图像对应的注意力分配系数, 为第i张图像对应的隐含向量。 4.根据权利要求1所述的基于注意力机制的手势位置预估方法, 其特征在于, 所述获取 第二时间的第二手势图像, 将所述第二手势图像代替所述第一手势图像, 将所述手势预估 位置代替所述预置初始位置, 返回所述采用预置RNN隐含层。

6、处理所述第一手势图像的步骤, 直至得到所有所述手势预估位置, 之后还包括: 根据所述手势预估位置在显示器上进行预估手势位置显示操作。 5.一种基于注意力机制的手势位置预估装置, 其特征在于, 包括: 获取模块, 用于获取第一时间的第一手势图像, 所述第一时间包括连续的多个时刻; 隐含处理模块, 用于采用预置RNN隐含层处理所述第一手势图像, 得到隐含向量, 并根 据所述隐含向量和预置初始位置计算得到注意力分配系数; 状态计算模块, 用于根据所述隐含向量和所述注意力分配系数计算手势隐含状态分布 规律; 预估模块, 用于采用预置全连接层处理所述手势隐含状态分布规律, 得到手势预估位 置; 迭代模块。

7、, 用于获取第二时间的第二手势图像, 将所述第二手势图像代替所述第一手 势图像, 将所述手势预估位置代替所述预置初始位置, 返回所述采用预置RNN隐含层处理所 权利要求书 1/2 页 2 CN 112084995 A 2 述第一手势图像的步骤, 直至得到所有所述手势预估位置。 6.根据权利要求5所述的基于注意力机制的手势位置预估装置, 其特征在于, 所述获取 模块具体用于: 在预置视频素材的每一秒处获取预置数量的初始手势图像; 从所述初始手势图像中选取一张最优手势图像作为对应时刻的预置手势图像; 获取连续预置秒对应的所述预置手势图像作为所述第一手势图像, 所述预置秒为所述 第一时间, 其中一秒。

8、为一个时刻。 7.根据权利要求5所述的基于注意力机制的手势位置预估装置, 其特征在于, 所述状态 计算模块具体用于: 采用预置公式根据所述隐含向量和所述注意力分配系数计算手势隐含状态分布规律, 所述预置公式为: 其中, ct为t时刻的手势隐含状态分布规律, Tx为选取手势图像的数量, t,i为t时刻第i 张图像对应的注意力分配系数, 为第i张图像对应的隐含向量。 8.根据权利要求5所述的基于注意力机制的手势位置预估装置, 其特征在于, 还包括: 显示模块, 用于根据所述手势预估位置在显示器上进行预估手势位置显示操作。 9.一种基于注意力机制的手势位置预估设备, 其特征在于, 所述设备包括处理器。

9、以及 存储器: 所述存储器用于存储程序代码, 并将所述程序代码传输给所述处理器; 所述处理器用于根据所述程序代码中的指令执行权利要求1-4任一项所述的基于注意 力机制的手势位置预估方法。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质用于存储程序代 码, 所述程序代码用于执行权利要求1-4任一项所述的基于注意力机制的手势位置预估方 法。 权利要求书 2/2 页 3 CN 112084995 A 3 一种基于注意力机制的手势位置预估方法及相关装置 技术领域 0001 本申请涉及图像处理技术领域, 尤其涉及一种基于注意力机制的手势位置预估方 法及相关装置。 背景技术 0002。

10、 在远程维修中经常需要对工人的手部动作进行实时跟踪, 从而确保维修操作动作 的准确性, 而手势动作的实时跟踪对图像的处理和手势的预估要求较高, 由于人眼在屏幕 上不同区域的注视特性不同, 因此, 不能用简单的映射关系来描述屏幕上的位置与人眼位 置的关系, 一般采用的是将笛卡尔坐标系转化为世界坐标系来实现位置的映射, 但是该方 法的映射过程会存在大量白噪声, 影响实际效果。 发明内容 0003 本申请提供了一种基于注意力机制的手势位置预估方法及相关装置, 用于解决现 有技术存在大量白噪声, 导致手势位置显示效果较差的技术问题。 0004 有鉴于此, 本申请第一方面提供了一种基于注意力机制的手势位。

11、置预估方法, 包 括: 0005 获取第一时间的第一手势图像, 所述第一时间包括连续的多个时刻; 0006 采用预置RNN隐含层处理所述第一手势图像, 得到隐含向量, 并根据所述隐含向量 和预置初始位置计算得到注意力分配系数; 0007 根据所述隐含向量和所述注意力分配系数计算手势隐含状态分布规律; 0008 采用预置全连接层处理所述手势隐含状态分布规律, 得到手势预估位置; 0009 获取第二时间的第二手势图像, 将所述第二手势图像代替所述第一手势图像, 将 所述手势预估位置代替所述预置初始位置, 返回所述采用预置RNN隐含层处理所述第一手 势图像的步骤, 直至得到所有所述手势预估位置。 0。

12、010 可选的, 所述获取第一时间的第一手势图像, 所述第一时间包括连续的多个时刻, 包括: 0011 在预置视频素材的每一秒处获取预置数量的初始手势图像; 0012 从所述初始手势图像中选取一张最优手势图像作为对应时刻的预置手势图像; 0013 获取连续预置秒对应的所述预置手势图像作为所述第一手势图像, 所述预置秒为 所述第一时间, 其中一秒为一个时刻。 0014 可选的, 所述根据所述隐含向量和所述注意力分配系数计算手势隐含状态分布规 律, 包括: 0015 采用预置公式根据所述隐含向量和所述注意力分配系数计算手势隐含状态分布 规律, 所述预置公式为: 0016 说明书 1/7 页 4 C。

13、N 112084995 A 4 0017 其中, ct为t时刻的手势隐含状态分布规律, Tx为选取手势图像的数量, t,i为t时刻 第i张图像对应的注意力分配系数, 为第i张图像对应的隐含向量。 0018 可选的, 所述获取第二时间的第二手势图像, 将所述第二手势图像代替所述第一 手势图像, 将所述手势预估位置代替所述预置初始位置, 返回所述采用预置RNN隐含层处理 所述第一手势图像的步骤, 直至得到所有所述手势预估位置, 之后还包括: 0019 根据所述手势预估位置在显示器上进行预估手势位置显示操作。 0020 本申请第二方面提供了一种基于注意力机制的手势位置预估装置, 包括: 0021 获。

14、取模块, 用于获取第一时间的第一手势图像, 所述第一时间包括连续的多个时 刻; 0022 隐含处理模块, 用于采用预置RNN隐含层处理所述第一手势图像, 得到隐含向量, 并根据所述隐含向量和预置初始位置计算得到注意力分配系数; 0023 状态计算模块, 用于根据所述隐含向量和所述注意力分配系数计算手势隐含状态 分布规律; 0024 预估模块, 用于采用预置全连接层处理所述手势隐含状态分布规律, 得到手势预 估位置; 0025 迭代模块, 用于获取第二时间的第二手势图像, 将所述第二手势图像代替所述第 一手势图像, 将所述手势预估位置代替所述预置初始位置, 返回所述采用预置RNN隐含层处 理所述。

15、第一手势图像的步骤, 直至得到所有所述手势预估位置。 0026 可选的, 所述获取模块具体用于: 0027 在预置视频素材的每一秒处获取预置数量的初始手势图像; 0028 从所述初始手势图像中选取一张最优手势图像作为对应时刻的预置手势图像; 0029 获取连续预置秒对应的所述预置手势图像作为所述第一手势图像, 所述预置秒为 所述第一时间, 其中一秒为一个时刻。 0030 可选的, 所述状态计算模块具体用于: 0031 采用预置公式根据所述隐含向量和所述注意力分配系数计算手势隐含状态分布 规律, 所述预置公式为: 0032 0033 其中, ct为t时刻的手势隐含状态分布规律, Tx为选取手势图。

16、像的数量, t,i为t时刻 第i张图像对应的注意力分配系数, 为第i张图像对应的隐含向量。 0034 可选的, 还包括: 0035 显示模块, 用于根据所述手势预估位置在显示器上进行预估手势位置显示操作。 0036 本申请第三方面提供了一种基于注意力机制的手势位置预估设备, 所述设备包括 处理器以及存储器: 0037 所述存储器用于存储程序代码, 并将所述程序代码传输给所述处理器; 0038 所述处理器用于根据所述程序代码中的指令执行第一方面的基于注意力机制的 手势位置预估方法。 0039 本申请第四方面提供了一种计算机可读存储介质, 所述计算机可读存储介质用于 说明书 2/7 页 5 CN 。

17、112084995 A 5 存储程序代码, 所述程序代码用于执行第一方面的基于注意力机制的手势位置预估方法。 0040 从以上技术方案可以看出, 本申请实施例具有以下优点: 0041 本申请中, 提供了一种基于注意力机制的手势位置预估方法, 包括: 获取第一时间 的第一手势图像, 第一时间包括连续的多个时刻; 采用预置RNN隐含层处理第一手势图像, 得到隐含向量, 并根据隐含向量和预置初始位置计算得到注意力分配系数; 根据隐含向量 和注意力分配系数计算手势隐含状态分布规律; 采用预置全连接层处理手势隐含状态分布 规律, 得到手势预估位置; 获取第二时间的第二手势图像, 将第二手势图像代替第一手。

18、势图 像, 将手势预估位置代替预置初始位置, 返回采用预置RNN隐含层处理第一手势图像的步 骤, 直至得到所有手势预估位置。 0042 本申请提供的基于注意力机制的手势位置预估方法, 通过在RNN网络中加入注意 力机制对手势位置进行预估, 得到更加准确的估计结果, 由于实际情况下的手势是动态的, 也就是说, 手势具有时间关联性, 获取单个时刻的图像进行位置估计会带来大量的白噪声, 所以选取多个时刻的手势图像进行手势位置的预估操作, 使得每个时刻的手势预估结果都 受到前后时刻的牵制, 不会出现较大误差的情况。 因此, 本申请能够解决现有技术存在大量 白噪声, 导致手势位置显示效果较差的技术问题。。

19、 附图说明 0043 图1为本申请实施例提供的一种基于注意力机制的手势位置预估方法的流程示意 图; 0044 图2为本申请实施例提供的一种基于注意力机制的手势位置预估装置的结构示意 图。 具体实施方式 0045 为了使本技术领域的人员更好地理解本申请方案, 下面将结合本申请实施例中的 附图, 对本申请实施例中的技术方案进行清楚、 完整地描述, 显然, 所描述的实施例仅是本 申请一部分实施例, 而不是全部的实施例。 基于本申请中的实施例, 本领域普通技术人员在 没有做出创造性劳动前提下所获得的所有其他实施例, 都属于本申请保护的范围。 0046 为了便于理解, 请参阅图1, 本申请提供的一种基于。

20、注意力机制的手势位置预估方 法的实施例, 包括: 0047 步骤101、 获取第一时间的第一手势图像, 第一时间包括连续的多个时刻。 0048 需要说明的是, 第一时间是以秒为单位的时间段, 一秒为一个时刻, 因此, 第一时 间由多个时刻构成, 且为连续的时刻, 每个时刻对应一个高质量的手势图像, 共同构成了第 一手势图像。 0049 进一步地, 获取第一手势图像的具体过程为: 在预置视频素材的每一秒处获取预 置数量的初始手势图像; 从初始手势图像中选取一张最优手势图像作为对应时刻的预置手 势图像; 获取连续预置秒对应的预置手势图像作为第一手势图像, 预置秒为第一时间, 其中 一秒为一个时刻。。

21、 例如, 可以设定预置数量为30, 即每一秒获取30张初始手势图像, 从30张 初始手势图像中选择清晰度最高的图像作为此时刻的预置手势图像, 而单个时刻的图像进 行手势估计容易带来大量白噪声, 因此, 需要获取连续几秒的预置手势图像, 假设, 连续获 说明书 3/7 页 6 CN 112084995 A 6 取前4秒的预置手势图像, 可以得到4张不同时刻的手势图像, 构成第一手势图像, 4秒即为 第一时间, 如果视频是从0时刻开始计时, 那么这4秒就是开始的第一个4秒。 0050 步骤102、 采用预置RNN隐含层处理第一手势图像, 得到隐含向量, 并根据隐含向量 和预置初始位置计算得到注意力。

22、分配系数。 0051 需要说明的是, 循环神经网络(Recurrent Neural Network,RNN)是一类以序列数 据为输入, 在序列的演进方向进行递归且所有循环单元按链式连接的递归神经网络; 循环 神经网络具有记忆性、 参数共享并且图灵完备。 本实施例中采用RNN对手势的位置进行基于 时间关联的预估, 使得预估结果更加准确可靠, 且不易产生白噪声。 RNN处理第一手势图像 后得到的不是直接的预估结果, 而是手势图像对应的隐含向量ht, 而根据隐含向量和预置 初始位置可以计算得到引入的注意力机制中的注意力分配系数。 注意力机制(Attention Mechanism)源于对人类视觉的。

23、研究, 人类视网膜不同的部位具有不同程度的信息处理能 力, 即敏锐度, 只有视网膜中央凹部位具有最强的敏锐度; 为了合理利用有限的视觉信息处 理资源, 人类需要选择视觉区域中的特定部分, 然后集中关注它。 本实施例中引入注意力机 制就是使得图像处理过程中加强对手势重要信息的关注, 并将计算资源分配给更重要的任 务。 0052 注意力分配系数的计算方法为: 0053 0054 其中, ht为t时刻的隐含向量(i个隐含向量组合), W为注意力机制网络层的训练参 数, Pt-1为相对于t时刻的前一时刻的手势预估位置, 若是t时刻为初始时刻, 那么Pt-1几位预 置初始位置。 可以发现注意力分配系数充。

24、分考虑了手势动作在时间轴上的上下位置关联 性, 通过注意力机制关注前一时刻的位置, 提升下一时刻的位置生成准确率。 0055 步骤103、 根据隐含向量和注意力分配系数计算手势隐含状态分布规律。 0056 需要说明的是, 手势隐含状态分布规律是进行手势预估的重要因素, 具体的分析 计算过程为: 采用预置公式根据隐含向量和注意力分配系数计算手势隐含状态分布规律, 预置公式为: 0057 0058 其中, ct为t时刻的手势隐含状态分布规律, Tx为选取手势图像的数量, t,i为t时刻 第i张图像对应的注意力分配系数, 为第i张图像对应的隐含向量。 ct可以看作是所有编 码的隐藏状态的分布规律, 。

25、每个状态的概率处于0,1之间, 且总和为1。 0059 步骤104、 采用预置全连接层处理手势隐含状态分布规律, 得到手势预估位置。 0060 需要说明的是, 获得手势隐含状态分布规律后, 还需要计算最后一层的隐含向量: 0061 0062其中, 为聚焦化处理之前的隐含向量, 为通过注意力机制聚焦化后的隐含向 量。 然后通过全连接层处理最后一层的隐含向量, 就可以得到第一手势图像每一步生成的 真实位置yt, 也就是手势预估位置: 0063 说明书 4/7 页 7 CN 112084995 A 7 0064 其中, Pyt|y1,.,yt-1,ct为手势处于不同位置yt的概率值, 取最大值对应 。

26、的位置为预估位置即可; Ws为网络训练参数。 0065 步骤105、 获取第二时间的第二手势图像, 将第二手势图像代替第一手势图像, 将 手势预估位置代替预置初始位置, 返回采用预置RNN隐含层处理第一手势图像的步骤, 直至 得到所有手势预估位置。 0066 需要说明的是, 以上为一个位置的手势图像预估, 需要在获取同样数量的图像重 复上述操作, 得到下一时刻的手势预估图像, 本次获取的4秒对应的4张不同时刻的图像可 以与第一时间中的第一手势图像存在时刻位置重叠, 例如, 若是第一时间选取的是x1,x2, x3,x4四个时刻的手势图像, 那么本次可以选取x4,x5,x6,x7四个时刻的图像, 。

27、或者重叠更多, 加强手势图像的时间关联性, 确保预估结果的准确性, 直至获取到全部时刻的手势预估位 置。 0067 进一步地, 根据手势预估位置在显示器上进行预估手势位置显示操作。 显示器上 每个时刻显示的手势图像均为预估图像, 也是更加接近真实位置的手势图像, 所有时刻的 手势位置均已经获取, 那么就可以根据时间进度在显示器上进行实时显示。 0068 为了便于理解, 提供一个远程维修手势的动态数据分析的应用例, 假设远程维修 界面可以划分为33的9个网格, 在计算中, 可以将9个网格组合的数据看作一个矩阵, 而前 一时刻的手势位置到下一时刻的手势位置中间通过一个转移矩阵连接。 转移矩阵中的数。

28、据 即为手势到达下一个位置的概率值, 也是手势下一步的 “偏好” , 如果是9个网格, 那么手势 移动偏好可以表示为表1: 0069 表1 9个网格手势移动偏好表 0070 网格1网格2网格3网格4网格5网格6网格7网格8网格9 网格10.80.120.020.010.010.010.010.010.01 网格20.010.80.120.020.010.010.010.010.01 网格30.010.010.80.120.020.010.010.010.01 网格40.010.010.010.80.120.020.010.010.01 网格50.010.010.010.010.80.120.0。

29、20.010.01 网格60.010.010.010.010.010.80.120.020.01 网格70.010.010.010.010.010.010.80.120.02 网格80.010.010.010.010.010.010.80.120.02 网格90.010.010.010.010.010.020.010.120.8 0071 表中概率较高的位置即为手势移动最有可能的位置, 通过概率准确跟踪手势的移 动过程。 0072 本申请提供的基于注意力机制的手势位置预估方法, 通过在RNN网络中加入注意 力机制对手势位置进行预估, 得到更加准确的估计结果, 由于实际情况下的手势是动态的, 也。

30、就是说, 手势具有时间关联性, 获取单个时刻的图像进行位置估计会带来大量的白噪声, 所以选取多个时刻的手势图像进行手势位置的预估操作, 使得每个时刻的手势预估结果都 受到前后时刻的牵制, 不会出现较大误差的情况。 因此, 本申请能够解决现有技术存在大量 白噪声, 导致手势位置显示效果较差的技术问题。 0073 为了便于理解, 请参阅图2, 本申请提供了一种基于注意力机制的手势位置预估装 说明书 5/7 页 8 CN 112084995 A 8 置的实施例, 包括: 0074 获取模块201, 用于获取第一时间的第一手势图像, 第一时间包括连续的多个时 刻; 0075 隐含处理模块202, 用于。

31、采用预置RNN隐含层处理第一手势图像, 得到隐含向量, 并 根据隐含向量和预置初始位置计算得到注意力分配系数; 0076 状态计算模块203, 用于根据隐含向量和注意力分配系数计算手势隐含状态分布 规律; 0077 预估模块204, 用于采用预置全连接层处理手势隐含状态分布规律, 得到手势预估 位置; 0078 迭代模块205, 用于获取第二时间的第二手势图像, 将第二手势图像代替第一手势 图像, 将手势预估位置代替预置初始位置, 返回采用预置RNN隐含层处理第一手势图像的步 骤, 直至得到所有手势预估位置。 0079 进一步地, 获取模块201具体用于: 0080 在预置视频素材的每一秒处获。

32、取预置数量的初始手势图像; 0081 从初始手势图像中选取一张最优手势图像作为对应时刻的预置手势图像; 0082 获取连续预置秒对应的预置手势图像作为第一手势图像, 预置秒为第一时间, 其 中一秒为一个时刻。 0083 进一步地, 状态计算模块203具体用于: 0084 采用预置公式根据隐含向量和注意力分配系数计算手势隐含状态分布规律, 预置 公式为: 0085 0086 其中, ct为t时刻的手势隐含状态分布规律, Tx为选取手势图像的数量, t,i为t时刻 第i张图像对应的注意力分配系数, 为第i张图像对应的隐含向量。 0087 进一步地, 还包括: 0088 显示模块206, 用于根据手。

33、势预估位置在显示器上进行预估手势位置显示操作。 0089 本申请还提供了一种基于注意力机制的手势位置预估设备, 设备包括处理器以及 存储器: 0090 存储器用于存储程序代码, 并将程序代码传输给处理器; 0091 处理器用于根据程序代码中的指令执行上述方法实施例中的基于注意力机制的 手势位置预估方法。 0092 本申请还提供了一种计算机可读存储介质, 计算机可读存储介质用于存储程序代 码, 程序代码用于执行上述方法实施例中的基于注意力机制的手势位置预估方法。 0093 在本申请所提供的几个实施例中, 应该理解到, 所揭露的装置和方法, 可以通过其 它的方式实现。 例如, 以上所描述的装置实施。

34、例仅仅是示意性的, 例如, 所述单元的划分, 仅 仅为一种逻辑功能划分, 实际实现时可以有另外的划分方式, 例如多个单元或组件可以结 合或者可以集成到另一个系统, 或一些特征可以忽略, 或不执行。 另一点, 所显示或讨论的 相互之间的耦合或直接耦合或通信连接可以是通过一些接口, 装置或单元的间接耦合或通 说明书 6/7 页 9 CN 112084995 A 9 信连接, 可以是电性, 机械或其它的形式。 0094 所述作为分离部件说明的单元可以是或者也可以不是物理上分开的, 作为单元显 示的部件可以是或者也可以不是物理单元, 即可以位于一个地方, 或者也可以分布到多个 网络单元上。 可以根据实。

35、际的需要选择其中的部分或者全部单元来实现本实施例方案的目 的。 0095 另外, 在本申请各个实施例中的各功能单元可以集成在一个处理单元中, 也可以 是各个单元单独物理存在, 也可以两个或两个以上单元集成在一个单元中。 上述集成的单 元既可以采用硬件的形式实现, 也可以采用软件功能单元的形式实现。 0096 所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用 时, 可以存储在一个计算机可读取存储介质中。 基于这样的理解, 本申请的技术方案本质上 或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式 体现出来, 该计算机软件产品存储在一个存储介质中, 包。

36、括若干指令用以通过一台计算机 设备(可以是个人计算机, 服务器, 或者网络设备等)执行本申请各个实施例所述方法的全 部或部分步骤。 而前述的存储介质包括: U盘、 移动硬盘、 只读存储器(英文全称: Read-Only Memory, 英文缩写: ROM)、 随机存取存储器(英文全称: Random Access Memory, 英文缩写: RAM)、 磁碟或者光盘等各种可以存储程序代码的介质。 0097 以上所述, 以上实施例仅用以说明本申请的技术方案, 而非对其限制; 尽管参照前 述实施例对本申请进行了详细的说明, 本领域的普通技术人员应当理解: 其依然可以对前 述各实施例所记载的技术方案进行修改, 或者对其中部分技术特征进行等同替换; 而这些 修改或者替换, 并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。 说明书 7/7 页 10 CN 112084995 A 10 图1 说明书附图 1/2 页 11 CN 112084995 A 11 图2 说明书附图 2/2 页 12 CN 112084995 A 12 。

展开阅读全文
内容关键字: 基于 注意力 机制 手势 位置 预估 方法 相关 装置
关于本文
本文标题:基于注意力机制的手势位置预估方法及相关装置.pdf
链接地址:https://www.zhuanlichaxun.net/pdf/10168138.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1