终端喇叭的控制方法、设备及计算机可读存储介质.pdf
《终端喇叭的控制方法、设备及计算机可读存储介质.pdf》由会员分享,可在线阅读,更多相关《终端喇叭的控制方法、设备及计算机可读存储介质.pdf(17页完成版)》请在专利查询网上搜索。
1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 201910230077.0 (22)申请日 2019.03.25 (71)申请人 深圳创维-RGB电子有限公司 地址 518057 广东省深圳市南山区深南大 道创维大厦A座13-16楼 (72)发明人 李坚余明火洪文生王德闯 万乔 (74)专利代理机构 深圳市世纪恒程知识产权代 理事务所 44287 代理人 胡海国 (51)Int.Cl. H04N 5/60(2006.01) H04N 21/44(2011.01) H04N 21/439(2011.01) H04N 21/46。
2、2(2011.01) (54)发明名称 终端喇叭的控制方法、 设备及计算机可读存 储介质 (57)摘要 本发明公开了一种终端喇叭的控制方法、 设 备及计算机可读存储介质, 所述终端的显示屏至 少划分成两个显示区域, 每个显示区域至少对应 着一个喇叭, 该方法包括步骤: 当接收到服务器 发送的待播放视频后, 检测所述待播放视频是否 是经过人工智能学习后的视频; 若检测到所述待 播放视频是经过人工智能学习后的视频, 则获取 所述待播放视频中的帧识别码; 若所述终端当前 播放的帧画面为与所述帧识别码对应的目标帧 画面, 则根据所述目标帧画面对应的帧识别码确 定目标声音源位置信息; 控制所述目标声音源。
3、位 置信息对应显示区域的喇叭输出所述目标帧画 面对应的声音。 本发明实现了终端输出声音的位 置随着播放画面中声音源的变化而变化。 权利要求书2页 说明书11页 附图3页 CN 109862293 A 2019.06.07 CN 109862293 A 1.一种终端喇叭的控制方法, 其特征在于, 所述终端的显示屏至少划分成两个显示区 域, 每个显示区域至少对应着一个喇叭, 所述终端喇叭的控制方法包括以下步骤: 当接收到服务器发送的待播放视频后, 检测所述待播放视频是否是经过人工智能学习 后的视频; 若检测到所述待播放视频是经过人工智能学习后的视频, 则获取所述待播放视频中的 帧识别码; 若所述终。
4、端当前播放的帧画面为与所述帧识别码对应的目标帧画面, 则根据所述目标 帧画面对应的帧识别码确定目标声音源位置信息; 控制所述目标声音源位置信息对应显示区域的喇叭输出所述目标帧画面对应的声音。 2.如权利要求1所述的终端喇叭的控制方法, 其特征在于, 所述控制所述目标声音源位 置信息对应显示区域的喇叭输出所述目标帧画面对应的声音的步骤包括: 若检测到目标声音源位置信息对应两个显示区域, 则确定所述目标声音源位置信息对 应两个显示区域中的前显示区域和后显示区域; 控制所述前显示区域对应喇叭的音量从大到小输出所述目标帧画面对应的声音, 以及 控制所述后显示区域对应喇叭的音量从小到大输出所述目标帧画面。
5、对应的声音。 3.如权利要求2所述的终端喇叭的控制方法, 其特征在于, 所述若检测到目标声音源位 置信息对应两个显示区域, 则确定所述目标声音源位置信息对应两个显示区域中的前显示 区域和后显示区域的步骤之后, 还包括: 控制所述前显示区域对应喇叭以第一音量输出所述目标帧画面对应的声音, 以及控制 所述后显示区域对应喇叭以第二音量输出所述目标帧画面对应的声音, 其中, 所述第一音 量小于所述第二音量。 4.如权利要求1所述的终端喇叭的控制方法, 其特征在于, 所述若检测到所述待播放视 频是经过人工智能学习后的视频, 则获取所述待播放视频中的帧识别码的步骤包括: 若检测到所述待播放视频是经过人工智。
6、能学习后的视频, 则从所述待播放视频的头文 件中获取帧识别码。 5.如权利要求1所述的终端喇叭的控制方法, 其特征在于, 所述当接收到服务器发送的 待播放视频后, 检测所述待播放视频是否是经过人工智能学习后的视频的步骤之后, 还包 括: 若检测到所述待播放视频是未经过人工智能学习后的视频, 则采用预设的人工智能学 习算法识别出所述待播放视频中存在声音的帧画面对应的声音源位置信息; 为存在声音的帧画面添加帧识别码, 并将各个帧识别码和对应的声音源位置信息关联 编写至所述待播放视频中, 以得到经过人工智能学习的待播放视频。 6.如权利要求5所述的终端喇叭的控制方法, 其特征在于, 所述将各个帧识别。
7、码和对应 的声音源位置信息关联编写至所述待播放视频中, 以得到经过人工智能学习的待播放视频 的步骤包括: 按照预设的编码规则将各个帧识别码和与各个帧识别码对应的声音源位置信息编码 成字符串; 在所述字符串的末尾添加结束标识, 将携带所述结束标识的字符串编写至所述待播放 视频的头文件中, 得到经过人工智能学习的待播放视频。 权利要求书 1/2 页 2 CN 109862293 A 2 7.如权利要求1所述的终端喇叭的控制方法, 其特征在于, 所述当接收到服务器发送的 待播放视频后, 检测所述待播放视频是否是经过人工智能学习后的视频的步骤之后, 还包 括: 若检测到所述待播放视频是未经过人工智能学。
8、习后的视频, 则确定所述终端中已启动 的喇叭; 控制所述已启动的喇叭输出所述待播放视频中的声音。 8.如权利要求1至7任一项所述的终端喇叭的控制方法, 其特征在于, 所述当接收到服 务器发送的待播放视频后, 检测所述待播放视频是否是经过人工智能学习后的视频的步骤 包括: 当接收到服务器发送的待播放视频后, 检测所述待播放视频中是否存在人工智能学习 的特征码; 若所述待播放视频中存在所述特征码, 则确定所述待播放视频是经过人工智能学习后 的视频。 9.一种终端喇叭的控制设备, 其特征在于, 所述终端喇叭的控制设备包括存储器、 处理 器和存储在所述存储器上并可在所述处理器上运行的终端喇叭的控制程序。
9、, 所述终端喇叭 的控制程序被所述处理器执行时实现如权利要求1至8中任一项所述的终端喇叭的控制方 法的步骤。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质上存储有终端喇 叭的控制程序, 所述终端喇叭的控制程序被处理器执行时实现如权利要求1至8中任一项所 述的终端喇叭的控制方法的步骤。 权利要求书 2/2 页 3 CN 109862293 A 3 终端喇叭的控制方法、 设备及计算机可读存储介质 技术领域 0001 本发明涉及终端技术领域, 尤其涉及一种终端喇叭的控制方法、 设备及计算机可 读存储介质。 背景技术 0002 随着科学技术的发展, 出现了屏幕发声电视。 屏幕发。
10、声提升了电视的临场体验。 但 是目前的电视还是左边一个喇叭, 右边一个喇叭, 电视声音的控制主要是左右声道平衡控 制, 并不能做到电视输出声音的位置随着电视播放画面中声音源的移动而移动, 如电视输 出的声音是由人发出的, 由于电视中喇叭的位置固定, 该声音的输出位置并不能随着电视 播放画面中人位置的变动而变动。 发明内容 0003 本发明的主要目的在于提供一种终端喇叭的控制方法、 设备及计算机可读存储介 质, 旨在解决现有的终端输出声音的位置无法随着其播放画面中声音源的变化而变化的技 术问题。 0004 为实现上述目的, 本发明提供一种终端喇叭的控制方法, 所述终端的显示屏至少 划分成两个显示。
11、区域, 每个显示区域至少对应着一个喇叭, 所述终端喇叭的控制方法包括 步骤: 0005 当接收到服务器发送的待播放视频后, 检测所述待播放视频是否是经过人工智能 学习后的视频; 0006 若检测到所述待播放视频是经过人工智能学习后的视频, 则获取所述待播放视频 中的帧识别码; 0007 若所述终端当前播放的帧画面为与所述帧识别码对应的目标帧画面, 则根据所述 目标帧画面对应的帧识别码确定目标声音源位置信息; 0008 控制所述目标声音源位置信息对应显示区域的喇叭输出所述目标帧画面对应的 声音。 0009 优选地, 所述控制所述目标声音源位置信息对应显示区域的喇叭输出所述目标帧 画面对应的声音的。
12、步骤包括: 0010 若检测到目标声音源位置信息对应两个显示区域, 则确定所述目标声音源位置信 息对应两个显示区域中的前显示区域和后显示区域; 0011 控制所述前显示区域对应喇叭的音量从大到小输出所述目标帧画面对应的声音, 以及控制所述后显示区域对应喇叭的音量从小到大输出所述目标帧画面对应的声音。 0012 优选地, 所述若检测到目标声音源位置信息对应两个显示区域, 则确定所述目标 声音源位置信息对应两个显示区域中的前显示区域和后显示区域的步骤之后, 还包括: 0013 控制所述前显示区域对应喇叭以第一音量输出所述目标帧画面对应的声音, 以及 控制所述后显示区域对应喇叭以第二音量输出所述目标。
13、帧画面对应的声音, 其中, 所述第 说明书 1/11 页 4 CN 109862293 A 4 一音量小于所述第二音量。 0014 优选地, 所述若检测到所述待播放视频是经过人工智能学习后的视频, 则获取所 述待播放视频中的帧识别码的步骤包括: 0015 若检测到所述待播放视频是经过人工智能学习后的视频, 则从所述待播放视频的 头文件中获取帧识别码。 0016 优选地, 所述当接收到服务器发送的待播放视频后, 检测所述待播放视频是否是 经过人工智能学习后的视频的步骤之后, 还包括: 0017 若检测到所述待播放视频是未经过人工智能学习后的视频, 则采用预设的人工智 能学习算法识别出所述待播放视。
14、频中存在声音的帧画面对应的声音源位置信息; 0018 为存在声音的帧画面添加帧识别码, 并将各个帧识别码和对应的声音源位置信息 关联编写至所述待播放视频中, 以得到经过人工智能学习的待播放视频。 0019 优选地, 所述将各个帧识别码和对应的声音源位置信息关联编写至所述待播放视 频中, 以得到经过人工智能学习的待播放视频的步骤包括: 0020 按照预设的编码规则将各个帧识别码和与各个帧识别码对应的声音源位置信息 编码成字符串; 0021 在所述字符串的末尾添加结束标识, 将携带所述结束标识的字符串编写至所述待 播放视频的头文件中, 得到经过人工智能学习的待播放视频。 0022 优选地, 所述当。
15、接收到服务器发送的待播放视频后, 检测所述待播放视频是否是 经过人工智能学习后的视频的步骤之后, 还包括: 0023 若检测到所述待播放视频是未经过人工智能学习后的视频, 则确定所述终端中已 启动的喇叭; 0024 控制所述已启动的喇叭输出所述待播放视频中的声音。 0025 优选地, 所述当接收到服务器发送的待播放视频后, 检测所述待播放视频是否是 经过人工智能学习后的视频的步骤包括: 0026 当接收到服务器发送的待播放视频后, 检测所述待播放视频中是否存在人工智能 学习的特征码; 0027 若所述待播放视频中存在所述特征码, 则确定所述待播放视频是经过人工智能学 习后的视频。 0028 此。
16、外, 为实现上述目的, 本发明还提供终端喇叭的控制设备, 所述终端喇叭的控制 设备包括存储器、 处理器和存储在所述存储器上并可在所述处理器上运行的终端喇叭的控 制程序, 所述终端喇叭的控制程序被所述处理器执行时实现如上所述的终端喇叭的控制方 法的步骤。 0029 此外, 为实现上述目的, 本发明还提供一种计算机可读存储介质, 所述计算机可读 存储介质上存储有终端喇叭的控制程序, 所述终端喇叭的控制程序被处理器执行时实现如 上所述的终端喇叭的控制方法的步骤。 0030 本发明通过在终端接收到经过人工智能学习后的待播放视频时, 获取待播放视频 中的帧识别码; 若终端当前播放的帧画面为与帧识别码对应。
17、的目标帧画面, 则根据目标帧 画面对应的帧识别码确定目标声音源位置信息, 并控制目标声音源位置信息对应显示区域 的喇叭输出目标帧画面对应的声音, 实现了终端输出声音的位置随着播放画面中声音源的 说明书 2/11 页 5 CN 109862293 A 5 变化而变化。 附图说明 0031 图1是本发明实施例方案涉及的硬件运行环境的结构示意图; 0032 图2是本发明终端喇叭的控制方法第一实施例的流程示意图; 0033 图3是本发明实施例中终端显示屏坐标的一种示意图; 0034 图4是本发明实施例中终端控制目标声音源位置信息对应显示区域的喇叭输出目 标帧画面对应的声音的一种示意图; 0035 图5。
18、是本发明终端喇叭的控制方法第三实施例的流程示意图; 0036 图6是本发明实施例中帧识别码、 声音源位置信息和特征码对应字符串的一种示 意图; 0037 图7是本发明实施例中帧识别码、 声音源位置信息和特征码对应字符串的另一种 示意图; 0038 图8是本发明终端喇叭的控制方法第四实施例的流程示意图。 0039 本发明目的的实现、 功能特点及优点将结合实施例, 参照附图做进一步说明。 具体实施方式 0040 应当理解, 此处所描述的具体实施例仅仅用以解释本发明, 并不用于限定本发明。 0041 如图1所示, 图1是本发明实施例方案涉及的硬件运行环境的结构示意图。 0042 需要说明的是, 图1。
19、即可为终端喇叭的控制设备的硬件运行环境的结构示意图。 本 发明实施例终端喇叭的控制设备可以是PC, 便携计算机等终端设备。 0043 如图1所示, 该终端喇叭的控制设备可以包括: 处理器1001, 例如CPU, 用户接口 1003, 网络接口1004, 存储器1005, 通信总线1002。 其中, 通信总线1002用于实现这些组件之 间的连接通信。 用户接口1003可以包括显示屏(Display)、 输入单元比如键盘(Keyboard), 可选用户接口1003还可以包括标准的有线接口、 无线接口。 网络接口1004可选的可以包括 标准的有线接口、 无线接口(如WI-FI接口)。 存储器1005。
20、可以是高速RAM存储器, 也可以是稳 定的存储器(non-volatile memory), 例如磁盘存储器。 存储器1005可选的还可以是独立于 前述处理器1001的存储装置。 0044 本领域技术人员可以理解, 图1中示出的终端喇叭的控制设备结构并不构成对终 端喇叭的控制设备的限定, 可以包括比图示更多或更少的部件, 或者组合某些部件, 或者不 同的部件布置。 0045 如图1所示, 作为一种计算机存储介质的存储器1005中可以包括操作系统、 网络通 信模块、 用户接口模块以及终端喇叭的控制程序。 其中, 操作系统是管理和控制终端喇叭的 控制设备硬件和软件资源的程序, 支持终端喇叭的控制程。
21、序以及其它软件或程序的运行。 0046 在图1所示的终端喇叭的控制设备中, 用户接口1003主要用于连接服务器, 与服务 器进行数据通信; 网络接口1004主要用于连接后台服务器, 与后台服务器进行数据通信; 可 以理解的是, 该终端喇叭的控制设备可为喇叭所在终端。 所述终端的显示屏至少划分成两 个显示区域, 每个显示区域至少对应着一个喇叭, 而处理器1001可以用于调用存储器1005 中存储的终端喇叭的控制程序, 并执行以下操作: 说明书 3/11 页 6 CN 109862293 A 6 0047 当接收到服务器发送的待播放视频后, 检测所述待播放视频是否是经过人工智能 学习后的视频; 0。
22、048 若检测到所述待播放视频是经过人工智能学习后的视频, 则获取所述待播放视频 中的帧识别码; 0049 若所述终端当前播放的帧画面为与所述帧识别码对应的目标帧画面, 则根据所述 目标帧画面对应的帧识别码确定目标声音源位置信息; 0050 控制所述目标声音源位置信息对应显示区域的喇叭输出所述目标帧画面对应的 声音。 0051 进一步地, 所述控制所述目标声音源位置信息对应显示区域的喇叭输出所述目标 帧画面对应的声音的步骤包括: 0052 若检测到目标声音源位置信息对应两个显示区域, 则确定所述目标声音源位置信 息对应两个显示区域中的前显示区域和后显示区域; 0053 控制所述前显示区域对应喇。
23、叭的音量从大到小输出所述目标帧画面对应的声音, 以及控制所述后显示区域对应喇叭的音量从小到大输出所述目标帧画面对应的声音。 0054 进一步地, 所述若检测到目标声音源位置信息对应两个显示区域, 则确定所述目 标声音源位置信息对应两个显示区域中的前显示区域和后显示区域的步骤之后, 处理器 1001还可以用于调用存储器1005中存储的基于区块链的终端喇叭的控制程序, 并执行以下 步骤: 0055 控制所述前显示区域对应喇叭以第一音量输出所述目标帧画面对应的声音, 以及 控制所述后显示区域对应喇叭以第二音量输出所述目标帧画面对应的声音, 其中, 所述第 一音量小于所述第二音量。 0056 进一步地。
24、, 所述若检测到所述待播放视频是经过人工智能学习后的视频, 则获取 所述待播放视频中的帧识别码的步骤包括: 0057 若检测到所述待播放视频是经过人工智能学习后的视频, 则从所述待播放视频的 头文件中获取帧识别码。 0058 进一步地, 所述当接收到服务器发送的待播放视频后, 检测所述待播放视频是否 是经过人工智能学习后的视频的步骤之后, 处理器1001还可以用于调用存储器1005中存储 的基于区块链的终端喇叭的控制程序, 并执行以下步骤: 0059 若检测到所述待播放视频是未经过人工智能学习后的视频, 则采用预设的人工智 能学习算法识别出所述待播放视频中存在声音的帧画面对应的声音源位置信息;。
25、 0060 为存在声音的帧画面添加帧识别码, 并将各个帧识别码和对应的声音源位置信息 关联编写至所述待播放视频中, 以得到经过人工智能学习的待播放视频。 0061 进一步地, 所述将各个帧识别码和对应的声音源位置信息关联编写至所述待播放 视频中, 以得到经过人工智能学习的待播放视频的步骤包括: 0062 按照预设的编码规则将各个帧识别码和与各个帧识别码对应的声音源位置信息 编码成字符串; 0063 在所述字符串的末尾添加结束标识, 将携带所述结束标识的字符串编写至所述待 播放视频的头文件中, 得到经过人工智能学习的待播放视频。 0064 进一步地, 所述当接收到服务器发送的待播放视频后, 检测。
26、所述待播放视频是否 说明书 4/11 页 7 CN 109862293 A 7 是经过人工智能学习后的视频的步骤之后, 处理器1001还可以用于调用存储器1005中存储 的基于区块链的终端喇叭的控制程序, 并执行以下步骤: 0065 若检测到所述待播放视频是未经过人工智能学习后的视频, 则确定所述终端中已 启动的喇叭; 0066 控制所述已启动的喇叭输出所述待播放视频中的声音。 0067 进一步地, 所述当接收到服务器发送的待播放视频后, 检测所述待播放视频是否 是经过人工智能学习后的视频的步骤包括: 0068 当接收到服务器发送的待播放视频后, 检测所述待播放视频中是否存在人工智能 学习的特。
27、征码; 0069 若所述待播放视频中存在所述特征码, 则确定所述待播放视频是经过人工智能学 习后的视频。 0070 本发明终端喇叭的控制设备具体实施方式与下述终端喇叭的控制方法各实施例 基本相同, 在此不再赘述。 0071 基于上述的结构, 提出终端喇叭的控制方法的各个实施例。 0072 参照图2, 图2为本发明终端喇叭的控制方法第一实施例的流程示意图。 0073 本发明实施例提供了终端喇叭的控制方法的实施例, 需要说明的是, 虽然在流程 图中示出了逻辑顺序, 但是在某些情况下, 可以以不同于此处的顺序执行所示出或描述的 步骤。 0074 终端喇叭的控制方法包括: 0075 步骤S10, 当接。
28、收到服务器发送的待播放视频后, 检测所述待播放视频是否是经过 人工智能学习后的视频。 0076 在本发明实施例中, 终端包括但不限于电视和个人计算机等具有视频播放功能的 设备。 终端的显示屏至少划分成两个显示区域, 每个显示区域至少对应着一个喇叭。 当终端 接收到服务器发送的待播放视频后, 终端检测待播放视频是否为经过人工智能(AI, Artificial Intelligence)学习后的视频。 具体地, 服务器可预先和终端协商好, 对哪些待 播放视频进行人工智能学习, 如服务器可预先和终端协商好对视频播放时长大于预设时长 的视频进行人工智能学习, 或者对特定类型的待播放视频进行人工智能学习。
29、, 如对电视剧 视频或者音乐视频进行人工智能学习, 此时, 终端在接收到服务器发送的待播放视频后, 只 要对应检测待播放视频的播放时长, 或者确定待播放视频的类型即可知道待播放视频是否 为经过人工智能学习后的视频。 0077 需要说明的是, 若待播放视频经过人工智能学习, 则该视频中包含了视频声音源 位置信息和对应的帧识别码, 即经过人工智能学习, 可知道待播放视频中哪一帧画面存在 声音, 且该声音对应声音源在该帧画面中的位置; 帧识别码用于表示存在声音的帧画面, 声 音源位置信息用于表示对应帧画面中声音源的位置。 0078 进一步地, 步骤S10包括: 0079 步骤a, 当接收到服务器发送。
30、的待播放视频后, 检测所述待播放视频中是否存在人 工智能学习的特征码。 0080 步骤b, 若所述待播放视频中存在所述特征码, 则确定所述待播放视频是经过人工 智能学习后的视频。 说明书 5/11 页 8 CN 109862293 A 8 0081 进一步地, 服务器可根据具体情况对待播放视频进行人工智能学习, 当服务器对 某个待播放视频进行人工智能学习后, 服务器会为该经过人工智能学习的待播放视频添加 一个特征码, 以根据该特征码告知终端该待播放视频已经过人工智能学习。 其中, 在本发明 实施例中, 不限制特征码的表现形式, 特征码可用数字、 字母或者数字与字母的结合形式表 示。 0082 。
31、当终端接收到服务器发送的待播放视频后, 检测待播放视频中是否存在人工智能 学习的特征码。 若检测到待播放视频中存在该特征码, 终端则确定待播放视频为经过人工 智能学习后的视频; 若检测到待播放视频中未存在该特征码, 终端则确定待播放视频是未 经过人工智能学习后的视频。 其中, 为了提高终端检测待播放视频是否为经过人工智能学 习后的视频的检测效率, 服务器可将特征码编写在待播放视频的头文件中。 可以理解的是, 服务器也可将特征码编写在待播放视频的尾部, 本实施例可不对特征码在待播放视频中的 位置做具体限制。 0083 步骤S20, 若检测到所述待播放视频是经过人工智能学习后的视频, 则获取所述待。
32、 播放视频中的帧识别码。 0084 若终端检测到待播放视频是经过人工智能学习后的视频, 终端则获取待播放视频 中的帧识别码。 其中, 通过该帧识别码可确定待播放视频中存在声音的帧画面。 具体地, 服 务器可只对存在声音的帧画面设置帧识别码, 此时, 每一帧识别码都存在对应的声音源位 置信息; 若服务器为待播放视频的每一帧画面都设置帧识别码, 则只有存在声音的帧画面 对应的帧识别码才会存在对应的声音源位置信息, 不存在声音的帧画面的帧识别码不存在 对应的声音源位置信息。 为了便于描述, 以下内容以只对存在声音的帧画面设置帧识别码 为例进行说明。 在本发明实施例中, 不对帧识别码的表现形式做具体限。
33、制, 通过帧识别码可 以识别出是待播放视频中的第几帧画面存在声音。 0085 进一步地, 步骤S20包括: 0086 步骤c, 若检测到所述待播放视频是经过人工智能学习后的视频, 则从所述待播放 视频的头文件中获取帧识别码。 0087 进一步地, 为了提高终端获取帧识别码的获取效率, 服务器在通过人工智能学习 识别出待播放视频中存在声音的帧画面后, 为存在声音的帧画面设置对应的帧识别码, 并 将该帧识别码编写至待播放视频的头文件中。 因此, 当终端检测到待播放视频是经过人工 智能学习后的视频时, 终端从待播放视频的头文件中获取帧识别码。 进一步地, 服务器也可 将帧识别码和特征码编写至待播放视。
34、频对应音频文件的头文件中。 0088 步骤S30, 若所述终端当前播放的帧画面为与所述帧识别码对应的目标帧画面, 则 根据所述目标帧画面对应的帧识别码确定目标声音源位置信息。 0089 在终端播放待播放视频过程中, 终端检测其当前播放的帧画面是否为与帧识别码 对应的帧画面, 在本发明实施例中, 将终端当前播放的与帧识别码对应的帧画面记为目标 帧画面。 若终端检测到其当前播放的帧画面为目标帧画面, 终端则根据目标帧画面对应的 帧识别码确定声音源位置信息, 并将目标帧画面的帧识别码对应的声音源位置信息记为目 标声音源位置信息。 需要说明的是, 本发明实施例中的一帧画面的大小可根据具体需要而 设置。。
35、 具体地, 声音源位置信息可用坐标来表示, 此时, 可将终端的显示屏的左下角作为原 点, 原点往右边为横轴的正方向(x轴), 原点往上为纵轴(y轴)的正方向, 具体地, 如图3所 说明书 6/11 页 9 CN 109862293 A 9 示。 需要说明的是, 也可以采用终端显示屏的中间位置作为原点, 即本实施例不限制坐标的 建立形式。 0090 进一步地, 若终端检测到其当前播放的帧画面不是目标帧画面, 终端则继续播放 待播放视频, 并继续检测其当前播放的帧画面是否为目标帧画面。 可以理解的是, 在终端播 放待播放视频过程中, 会对待播放视频进行图像处理和音频处理, 以正常播放待播放视频。 。
36、0091 步骤S40, 控制所述目标声音源位置信息对应显示区域的喇叭输出所述目标帧画 面对应的声音。 0092 当终端根据目标帧画面对应的帧识别码确定目标声音源位置信息后, 终端控制目 标声音源位置信息对应显示区域的喇叭输出目标帧画面对应的声音。 其中, 目标声音源位 置信息可对应一个坐标, 也可对应多个坐标, 因此, 目标声音源位置信息对应的显示区域可 为一个, 也可为多个。 可以理解的是, 若帧画面中的声音源为人发出的, 则在人工智能学习 过程中, 是通过智能学习人的嘴型变化来确定该人是否有发出声音, 若该人发出声音, 则声 音源位置信息应该对应人嘴巴所在位置, 此时, 目标声音源位置信息。
37、可对应多个坐标, 即目 标声音源位置信息对应着一个坐标群。 0093 具体地, 参照图3, 在图3中, 将终端的显示屏划分成4个面积相等的显示区域, 分别 为A显示区域, B显示区域, C显示区域和D显示区域, 每个显示区域设置了一个喇叭, 若该显 示屏的分辨率为38402160, 则可用根据像素建立坐标系, 通过像素代表声音所对应的坐 标点, 此时, 这个4个显示区域的分辨率分别为19201080。 若将喇叭都设在各个显示区域 的中心位置, 则这4个喇叭的坐标分别是a, b, c和d, 其中a的坐标为(960, 540), b的坐标为 (2880, 1620), c的坐标为(2880, 54。
38、0), d的坐标为(960, 1620)。 当终端检测到目标声音源位 置信息为坐标(960, 540)时, 终端控制A显示区域的喇叭输出待播放视频的声音; 当终端检 测到目标声音源位置信息为坐标(2000, 900)时, 终端控制C显示区域的喇叭输出待播放视 频的声音; 当终端检测到目标声音源位置信息为坐标(1910, 1000)和(1925, 995)时, 终端控 制A显示区域和C显示区域的喇叭共同输出待播放视频的声音。 0094 本实施例通过在终端接收到经过人工智能学习后的待播放视频时, 获取待播放视 频中的帧识别码; 若终端当前播放的帧画面为与帧识别码对应的目标帧画面, 则根据目标 帧画。
39、面对应的帧识别码确定目标声音源位置信息, 并控制目标声音源位置信息对应显示区 域的喇叭输出目标帧画面对应的声音, 实现了终端输出声音的位置随着播放画面中声音源 的变化而变化, 提高了终端播放视频过程中的临场体验效果。 0095 进一步地, 提出本发明终端喇叭的控制方法第二实施例。 0096 所述终端喇叭的控制方法第二实施例与所述终端喇叭的控制方法第一实施例的 区别在于, 步骤S40包括: 0097 步骤d, 若检测到目标声音源位置信息对应两个显示区域, 则确定所述目标声音源 位置信息对应两个显示区域中的前显示区域和后显示区域。 0098 在终端控制目标声音源位置信息对应显示区域的喇叭输出目标帧。
40、画面对应的声 音过程中, 终端可检测目标声音源位置信息是否对应两个显示区域。 若终端检测到目标声 音源位置信息对应着两个显示区域, 终端则获取与目标帧画面关联的前后帧画面。 需要说 明的是, 终端可获取目标帧画面的前一帧画面和后一帧画面, 也可获取目标帧画面的前两 帧画面和后一帧画面, 或者获取目标帧画面的前三帧画面和后三帧画面等。 具体地, 终端通 说明书 7/11 页 10 CN 109862293 A 10 过目标声音源位置信息中的坐标即可确定目标声音源位置信息是否对应两个显示区域。 0099 当终端获取到与目标帧画面关联的前后帧画面时, 终端根据该前后帧画面即可确 定目标声音源位置信息。
41、对应两个显示区域中的前显示区域和后显示区域。 其中, 前显示区 域为该帧画面中先出现的区域, 后显示区域为该帧画面中后出现的区域, 即发出声音的物 体是从前显示区域往后显示区域移动。 0100 进一步地, 若终端检测到目标声音源位置对应着一个显示区域, 终端则控制该显 示区域对应喇叭输出该目标帧画面的声音。 具体地, 可参照图4, 若将终端的显示屏划分成 A、 B、 C、 D、 E和F这6个显示区域, 若待播放视频中的小鸟在飞行过程都在鸣叫, 当小鸟在A显 示区域飞行时, 终端控制A显示区域对应喇叭输出小鸟的鸣叫声; 当小鸟在B显示区域飞行 时, 终端控制B显示区域对应喇叭输出小鸟的鸣叫声; 。
42、当小鸟在C显示区域飞行时, 终端控制 C显示区域对应喇叭输出小鸟的鸣叫声。 0101 步骤e, 控制所述前显示区域对应喇叭的音量从大到小输出所述目标帧画面对应 的声音, 以及控制所述后显示区域对应喇叭的音量从小到大输出所述目标帧画面对应的声 音。 0102 当终端确定目标声音源位置信息对应两个显示区域中的前显示区域和后显示区 域后, 终端控制前显示区域对应喇叭的音量从大到小输出目标帧画面对应的声音, 以及控 制后显示区域对应喇叭的音量从小到大输出目标帧画面对应的声音。 0103 进一步地, 所述终端喇叭的控制方法还包括: 0104 步骤f, 控制所述前显示区域对应喇叭以第一音量输出所述目标帧画。
43、面对应的声 音, 以及控制所述后显示区域对应喇叭以第二音量输出所述目标帧画面对应的声音, 其中, 所述第一音量小于所述第二音量。 0105 进一步地, 终端在确定前显示区域和后显示区域后, 终端控制前显示区域对应喇 叭以第一音量输出目标帧画面对应的声音, 并控制后显示区域对应喇叭以第二音量输出目 标帧画面对应的声音, 其中, 第一音量小于第二音量, 第一音量和第二音量的大小可根据具 体需要而设置, 在本实施例对第一音量和第二音量的大小不做具体限制。 0106 进一步地, 终端在检测到目标声音源位置信息对应两个显示区域时, 终端可确定 声音源对应发声物体在两个显示区域中的面积, 将面积大的记为第。
44、一显示区域, 将面积小 的记为第二显示区域, 并控制第一显示区域对应喇叭以第三音量输出帧画面对应的声音, 以及控制第二显示区域对应喇叭以第四音量输出帧画面对应的声音, 其中, 第三音量大于 第四音量, 在本实施例中对第三音量和第四音量的大小不做具体限制。 此时, 发声物体可为 人, 动物等的嘴巴, 或者乐器等。 可以理解的是, 终端也可以控制这两个显示区域对应喇叭 以相同的音量输出帧画面对应的声音。 0107 需要说明的是, 当终端检测到目标声音源位置信息对应三个或者四个显示区域 时, 对应的喇叭控制规则目标声音源位置信息对应两个显示区域的控制规则类似, 在此不 再详细赘述。 0108 本实施。
45、例通过在检测到目标声音源位置信息对应两个显示区域, 则确定目标声音 源位置信息对应两个显示区域中的前显示区域和后显示区域, 控制前显示区域对应喇叭的 音量从大到小输出目标帧画面对应的声音, 以及控制后显示区域对应喇叭的音量从小到大 输出目标帧画面对应的声音, 或者控制面积大的第一显示区域对应喇叭以第三音量输出帧 说明书 8/11 页 11 CN 109862293 A 11 画面对应的声音, 控制面积小的第二显示区域对应喇叭以第四音量输出帧画面对应的声 音, 其中, 第三音量大于第四音量, 提高了终端输出声音的位置随着播放画面中声音源的变 化而变化的准确度, 进一步地提高了终端输出声音的智能性。
46、。 0109 进一步地, 提出本发明终端喇叭的控制方法第三实施例。 0110 所述终端喇叭的控制方法第三实施例与所述终端喇叭的控制方法第一或第二实 施例的区别在于, 参照图5, 终端喇叭的控制方法还包括: 0111 步骤S50, 若检测到所述待播放视频是未经过人工智能学习后的视频, 则采用预设 的人工智能学习算法识别出所述待播放视频中存在声音的帧画面对应的声音源位置信息。 0112 当终端检测到待播放视频是未经过人工智能学习后的视频时, 终端采用预设的人 工智能学习算法识别出待播放视频中存在声音的帧画面对应的声音源位置信息。 人工智能 学习算法包括但不限于机器学习算法和深度学习算法, 机器学习。
47、算法包括但不限于支持向 量机(SVM, Support Vector Machine)、 朴素贝叶斯(NB, Naive Bayesian)、 k最邻近分类算 法(KNN, k-NearestNeighbor)、 决策树(DT, Decision Tree)和集成模型(RF(Random Forest, 随机森林)/GDBT(Gradient Boosting Decision Tree); 深度学习算法包括但不限 于卷积神经网络(CNN, Convolutional Neural Network)、 循环神经网络(Recurrent Neural Networks)和递归神经网络(Recur。
48、sive Neural Networks)。 可以理解的是, 通过视 频中人嘴巴的嘴型或者动物的嘴型可对应确定人或者动物是否有发出声音, 从而将嘴型变 动的位置标上坐标, 输入到人工智能学习算法进行训练, 以得到训练后的人工智能学习算 法, 然后将待播放视频输入到训练后的人工智能学习算法中, 即可识别出待播放视频中存 在声音的帧画面对应的声音源位置信息。 0113 步骤S60, 为存在声音的帧画面添加帧识别码, 并将各个帧识别码和对应的声音源 位置信息关联编写至所述待播放视频中, 以得到经过人工智能学习的待播放视频。 0114 终端为待播放视频中存在声音的帧画面添加帧识别码, 并各个帧识别码和。
49、对应的 声音源位置信息关联编写至待播放视频中, 以得到经过人工智能学习的待播放视频。 0115 需要说明的是, 服务器对待播放视频进行人工智能学习的过程与终端对待播放视 频进行人工智能学习的过程一致, 因此在本发明实施例中不再详细赘述服务器对待播放视 频进行人工智能学习的过程。 0116 本实施例通过终端在检测到待播放视频是未经过人工智能学习后的视频时, 采用 预设的人工智能学习算法识别出待播放视频中存在声音的帧画面对应的声音源位置信息, 并为存在声音的帧画面添加帧识别码, 并将各个帧识别码和对应的声音源位置信息关联编 写至待播放视频中, 以得到经过人工智能学习的待播放视频, 提高了终端输出声。
50、音的位置 随着播放画面中声音源的变化而变化的成功率。 0117 进一步地, 所述将各个帧识别码和对应的声音源位置信息关联编写至所述待播放 视频中, 以得到经过人工智能学习的待播放视频的步骤包括: 0118 步骤h, 按照预设的编码规则将各个帧识别码和与各个帧识别码对应的声音源位 置信息编码成字符串。 0119 进一步地, 当终端为存在声音的帧画面添加帧识别码之后, 终端按照预设的编码 规则将各个帧识别码和与各个帧识别码对应的声音源位置信息编码至待播放视频的头文 件中。 编码规则可为将帧识别码与该帧识别码对应的声音源位置信息拼接成一个字符串, 说明书 9/11 页 12 CN 109862293。
- 内容关键字: 终端 喇叭 控制 方法 设备 计算机 可读 存储 介质
活性炭吸附印刷废气净化设备.pdf
园林绿化植物可调式保护支架.pdf
烟气脱硫塔的除尘装置.pdf
石材仿形切割装置.pdf
茶叶加工用上料装置.pdf
藻类培养容器的自动清洗装置.pdf
轨道车用液压马达与扇叶的连接装置.pdf
布卷抽布装置.pdf
双电源切换装置.pdf
应用于综合配电箱风冷却的降温装置.pdf
电力电缆安装用张紧装置.pdf
用于兽药残留检测的样品预处理装置.pdf
矿用可移动终端的模块电路.pdf
净水剂检测用取样装置.pdf
汽车双发电机双蓄电池并联电路.pdf
防火型电气控制柜.pdf
便携式食品样品取样装置.pdf
电缆铺设夹持组件.pdf
柜体装配检验装置.pdf
用于按摩椅的柔性按摩机构.pdf
硬炭及其制备方法、二次电池.pdf
汽车左悬置支架焊接设备.pdf
路面摊铺器.pdf
滤波器腔体生产装置.pdf
带漏电的保护插线板.pdf
电动轮椅安全阈值控制方法.pdf
重点管控一般工业固体废物筛查方法及系统.pdf
用于小型渠道整型施工装置及施工方法.pdf
miRNA标志物组合在制备预测年龄产品中的应用.pdf
水质检测方法及其系统.pdf
防误插的圆形电连接器.pdf
用于新能源汽车零件的皮碗压装装置.pdf
直流电源装置、LED驱动用电源装置及电源驱动用半导体集成电路.pdf
直流电源装置、LED驱动用电源装置及电源控制用半导体集成电路.pdf
具有带所属洗涤装置的网纹辊输墨装置的印刷机.pdf
焊接电源的输出控制方法.pdf
减少依赖软衬层的用于垂直记录介质的单极尖写磁头设计.pdf
应用可见光及红外光的光空间传输系统.pdf
具有高制动能力的贷运轨道车轮.pdf
防止电梯对重产生的干扰噪音的方法和装置.pdf
螺丝、螺栓或锁紧环螺栓.pdf
粘接剂组合物和电路部件的连接结构.pdf
光学部件成形用金属模及光学部件制造方法.pdf
电力系统及在该电力系统中管理充电状态的方法.pdf
具有防止干燥装置的滑动式书写工具.pdf
同步信号的产生和检测.pdf
用于制造特别包括一个具有聚氨酯涂层的注塑成型件的复合构件的方法和装置.pdf
往复式压缩机或泵及包括有往复式压缩机的为便携式工具提供动力的系统.pdf
一种多用户干扰抵消的RAKE接收机装置及其工作方法.pdf
低折射率组合物.pdf
具有可变放大倍率的望远镜.pdf