音视频信息控制方法、装置、智能设备和计算机可读存储介质.pdf

上传人:七月 文档编号:10832197 上传时间:2021-08-23 格式:PDF 页数:18 大小:782.93KB
收藏 版权申诉 举报 下载
音视频信息控制方法、装置、智能设备和计算机可读存储介质.pdf_第1页
第1页 / 共18页
音视频信息控制方法、装置、智能设备和计算机可读存储介质.pdf_第2页
第2页 / 共18页
音视频信息控制方法、装置、智能设备和计算机可读存储介质.pdf_第3页
第3页 / 共18页
文档描述:

《音视频信息控制方法、装置、智能设备和计算机可读存储介质.pdf》由会员分享,可在线阅读,更多相关《音视频信息控制方法、装置、智能设备和计算机可读存储介质.pdf(18页完成版)》请在专利查询网上搜索。

1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 201911291448.2 (22)申请日 2019.12.16 (71)申请人 北京明略软件系统有限公司 地址 100000 北京市海淀区东北旺西路8号 院4号楼310号 申请人 北京航空航天大学 (72)发明人 赵梓宏周荣刚谭北平 (74)专利代理机构 北京超成律师事务所 11646 代理人 孔默 (51)Int.Cl. G06F 3/16(2006.01) G06F 3/147(2006.01) G06K 9/00(2006.01) H04N 21/41(2011.01)。

2、 H04R 1/02(2006.01) (54)发明名称 音视频信息控制方法、 装置、 智能设备和计 算机可读存储介质 (57)摘要 本申请实施例提供一种音视频信息控制方 法、 装置、 智能设备和计算机可读存储介质, 通过 智能设备的图像采集设备采集图像, 并检测图像 中是否包含目标对象, 再根据检测结果分别对智 能设备的音频输出信息和视频输出信息进行控 制。 如此, 可根据用户相对于智能设备的实际使 用情况, 相应地控制智能设备的音频输出信息和 视频输出信息, 使音频输出信息和视频输出信息 更加符合用户实际所需。 权利要求书2页 说明书10页 附图5页 CN 111078183 A 2020。

3、.04.28 CN 111078183 A 1.一种音视频信息控制方法, 其特征在于, 应用于智能设备, 所述智能设备包括图像采 集设备, 所述方法包括: 获取所述图像采集设备采集到的图像; 检测所述图像中是否包含目标对象, 获取检测结果; 根据所述检测结果分别对所述智能设备的音频输出信息和视频输出信息进行控制。 2.根据权利要求1所述的音视频信息控制方法, 其特征在于, 所述根据所述检测结果分 别对所述智能设备的音频输出信息和视频输出信息进行控制的步骤, 包括: 若所述检测结果表明未识别到所述目标对象, 则按第一音频输出策略对所述智能设备 的音频输出信息进行控制, 并按第一视频输出策略对视频。

4、输出信息进行控制; 若所述检测结果表明识别到所述目标对象, 则按第二音频输出策略对所述智能设备的 音频输出信息进行控制, 并获得所述目标对象与所述智能设备之间的距离值, 根据所述距 离值按第二视频输出策略对视频输出信息进行控制。 3.根据权利要求2所述的音视频信息控制方法, 其特征在于, 所述智能设备还包括音频 输出设备, 所述按第一音频输出策略对所述智能设备的音频输出信息进行控制, 并按第一 视频输出策略对视频输出信息进行控制的步骤, 包括: 关闭所述智能设备的显示屏幕, 以停止视频输出信息的输出; 在获取查询信息后, 获得所述查询信息对应的输出内容; 将所述输出内容对应的音频输出信息, 通。

5、过所述智能设备的音频输出设备进行音频输 出。 4.根据权利要求2所述的音视频信息控制方法, 其特征在于, 所述智能设备还包括音频 输出设备, 所述按第二音频输出策略对所述智能设备的音频输出信息进行控制的步骤, 包 括: 在获取查询信息后, 获得所述查询信息对应的输出内容; 获得所述输出内容中部分内容对应的音频输出信息, 将获得的音频输出信息通过所述 智能设备的音频输出设备进行音频输出。 5.根据权利要求2所述的音视频信息控制方法, 其特征在于, 所述根据所述距离值按第 二视频输出策略对视频输出信息进行控制的步骤, 包括: 在获取查询信息后, 获得所述查询信息对应的输出内容; 在所述距离值小于第。

6、一预设阈值时, 将所述输出内容对应的视频输出信息通过所述智 能设备的显示屏幕进行输出; 在所述距离值大于所述第一预设阈值且小于第二预设阈值时, 将所述输出内容对应的 视频输出信息通过所述智能设备的显示屏幕进行输出, 并对所述显示屏幕上的视频输出信 息进行简化设置; 在所述距离值大于所述第二预设阈值时, 关闭所述智能设备的显示屏幕, 以停止所述 视频输出信息的输出。 6.根据权利要求5所述的音视频信息控制方法, 其特征在于, 所述对所述显示屏幕上的 视频输出信息进行简化设置的步骤, 包括: 将所述显示屏幕上视频输出信息中的触控按键进行隐藏; 增大所述视频输出信息包含的文字信息的字体大小。 权利要。

7、求书 1/2 页 2 CN 111078183 A 2 7.根据权利要求2所述的音视频信息控制方法, 其特征在于, 所述图像采集设备包括红 外设备, 所述获得所述目标对象与所述智能设备之间的距离值的步骤, 包括: 通过所述红外设备发出红外发射光, 并获取经由所述目标对象反射后的红外接收光; 根据所述红外发射光的发射时间点以及接收所述红外接收光的接收时间点, 计算获得 所述目标对象与所述智能设备之间的距离值。 8.一种音视频信息控制装置, 其特征在于, 应用于智能设备, 所述智能设备包括图像采 集设备, 所述装置包括: 获取模块, 用于获取所述图像采集设备采集到的图像; 检测模块, 用于检测所述。

8、图像中是否包含目标对象, 获取检测结果; 控制模块, 用于根据所述检测结果分别对所述智能设备的音频输出信息和视频输出信 息进行控制。 9.一种智能设备, 包括存储器、 处理器及存储在存储器上并可在处理器上运行的计算 机程序, 其特征在于, 所述处理器执行所述程序时实现权利要求1-7任意一项所述的音视频 信息控制方法。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质存储有指令, 当 所述指令被执行时, 实现权利要求1-7中任意一项所述的音视频信息控制方法。 权利要求书 2/2 页 3 CN 111078183 A 3 音视频信息控制方法、 装置、 智能设备和计算机可读存储介。

9、质 技术领域 0001 本申请涉及智能设备技术领域, 具体而言, 涉及一种音视频信息控制方法、 装置、 智能设备和计算机可读存储介质。 背景技术 0002 智能音箱, 是一种音箱升级的产物, 是家庭消费者用语音进行上网的一个工具, 例 如实现点播歌曲、 上网购物, 或者了解天气预报等。 此外, 通过智能音箱还可以对智能家居 设备进行控制, 例如打开窗帘、 设置冰箱温度、 提前让热水器升温等。 由于交互上的便捷性, 智能音箱已越来越受到消费者的喜爱。 一般地, 智能音箱可结合视频输出和音频输出的方 式进行信息展示, 但是, 目前的智能音箱中, 无论用户相对于智能音响是何种状态, 视频输 出和音频。

10、输出都按固定的预设模式进行信息输出, 在视频输出和音频输出的方式上缺乏灵 活性, 不能根据用户的实际使用情况进行调整, 难以实现合理化的信息展示。 发明内容 0003 本申请的目的包括, 例如, 提供了一种音视频信息控制方法、 装置、 智能设备和计 算机可读存储介质, 其根据用户实际使用情况对音视频信息进行控制。 0004 本申请的实施例可以这样实现: 0005 第一方面, 本申请实施例提供一种音视频信息控制方法, 应用于智能设备, 所述智 能设备包括图像采集设备, 所述方法包括: 0006 获取所述图像采集设备采集到的图像; 0007 检测所述图像中是否包含目标对象, 获取检测结果; 000。

11、8 根据所述检测结果分别对所述智能设备的音频输出信息和视频输出信息进行控 制。 0009 在可选的实施方式中, 所述根据检测结果分别对所述智能设备的音频输出信息和 视频输出信息进行控制的步骤, 包括: 0010 若所述检测结果表明未识别到所述目标对象, 则按第一音频输出策略对所述智能 设备的音频输出信息进行控制, 并按第一视频输出策略对视频输出信息进行控制; 0011 若所述检测结果表明识别到所述目标对象, 则按第二音频输出策略对所述智能设 备的音频输出信息进行控制, 并获得所述目标对象与所述智能设备之间的距离值, 根据所 述距离值按第二视频输出策略对视频输出信息进行控制。 0012 在可选的。

12、实施方式中, 所述智能设备还包括音频输出设备, 所述按第一音频输出 策略对所述智能设备的音频输出信息进行控制, 并按第一视频输出策略对视频输出信息进 行控制的步骤, 包括: 0013 关闭所述智能设备的显示屏幕, 以停止视频输出信息的输出; 0014 在获取查询信息后, 获得所述查询信息对应的输出内容; 0015 将所述输出内容对应的音频输出信息, 通过所述智能设备的音频输出设备进行音 说明书 1/10 页 4 CN 111078183 A 4 频输出。 0016 在可选的实施方式中, 所述智能设备还包括音频输出设备, 所述按第二音频输出 策略对所述智能设备的音频输出信息进行控制的步骤, 包括。

13、: 0017 在获取查询信息后, 获得所述查询信息对应的输出内容; 0018 获得所述输出内容中部分内容对应的音频输出信息, 将获得的音频输出信息通过 所述智能设备的音频输出设备进行音频输出。 0019 在可选的实施方式中, 所述根据所述距离值按第二视频输出策略对视频输出信息 进行控制的步骤, 包括: 0020 在获取查询信息后, 获得所述查询信息对应的输出内容; 0021 在所述距离值小于第一预设阈值时, 将所述输出内容对应的视频输出信息通过所 述智能设备的显示屏幕进行输出; 0022 在所述距离值大于所述第一预设阈值且小于第二预设阈值时, 将所述输出内容对 应的视频输出信息通过所述智能设备。

14、的显示屏幕进行输出, 并对所述显示屏幕上的视频输 出信息进行简化设置; 0023 在所述距离值大于所述第二预设阈值时, 关闭所述智能设备的显示屏幕, 以停止 所述视频输出信息的输出。 0024 在可选的实施方式中, 所述对所述显示屏幕上的视频输出信息进行简化设置的步 骤, 包括: 0025 将所述显示屏幕上视频输出信息中的触控按键进行隐藏; 0026 增大所述视频输出信息包含的文字信息的字体大小。 0027 在可选的实施方式中, 所述图像采集设备包括红外设备, 所述获得所述目标对象 与所述智能设备之间的距离值的步骤, 包括: 0028 通过所述红外设备发出红外发射光, 并获取经由所述目标对象反。

15、射后的红外接收 光; 0029 根据所述红外发射光的发射时间点以及接收所述红外接收光的接收时间点, 计算 获得所述目标对象与所述智能设备之间的距离值。 0030 第二方面, 本申请实施例提供一种音视频信息控制装置, 应用于智能设备, 所述智 能设备包括图像采集设备, 所述装置包括: 0031 获取模块, 用于获取所述图像采集设备采集到的图像; 0032 检测模块, 用于检测所述图像中是否包含目标对象, 获取检测结果; 0033 控制模块, 用于根据所述检测结果分别对所述智能设备的音频输出信息和视频输 出信息进行控制。 0034 第三方面, 本申请实施例提供一种智能设备, 包括存储器、 处理器及。

16、存储在存储器 上并可在处理器上运行的计算机程序, 所述处理器执行所述程序时实现上述任意一项所述 的音视频信息控制方法。 0035 第四方面, 本申请实施例提供一种计算机可读存储介质, 所述计算机可读存储介 质存储有指令, 当所述指令被执行时, 实现上述任意一项所述的音视频信息控制方法。 0036 本申请实施例的有益效果包括, 例如: 0037 本申请实施例提供的音视频信息控制方法、 装置、 智能设备和计算机可读存储介 说明书 2/10 页 5 CN 111078183 A 5 质, 通过智能设备的图像采集设备采集图像, 并检测图像中是否包含目标对象, 再根据检测 结果分别对智能设备的音频输出信。

17、息和视频输出信息进行控制。 如此, 可根据用户相对于 智能设备的实际使用情况, 相应地控制智能设备的音频输出信息和视频输出信息, 使音频 输出信息和视频输出信息更加符合用户实际所需。 附图说明 0038 为了更清楚地说明本申请实施例的技术方案, 下面将对实施例中所需要使用的附 图作简单地介绍, 应当理解, 以下附图仅示出了本申请的某些实施例, 因此不应被看作是对 范围的限定, 对于本领域普通技术人员来讲, 在不付出创造性劳动的前提下, 还可以根据这 些附图获得其他相关的附图。 0039 图1为本申请实施例提供的智能设备的结构框图; 0040 图2为本申请实施例提供的音视频信息控制方法的流程示意。

18、图; 0041 图3为图2中步骤S220的子步骤的流程图; 0042 图4为图3中步骤S231的子步骤的流程图; 0043 图5为图3中步骤S232的子步骤的流程图; 0044 图6为图3中步骤S232的子步骤的另一流程图; 0045 图7为本申请实施例提供的完整视频输出信息展示的示意图; 0046 图8为本申请实施例提供的简化设置的视频输出信息展示的示意图; 0047 图9为本申请实施例提供的音视频信息控制方法的另一流程示意图; 0048 图10为本申请实施例提供的音视频信息控制装置的功能模块框图。 0049 图标: 100-智能设备; 110-处理器; 120-存储器; 130-通信模块;。

19、 140-显示屏幕; 150-音频采集设备; 160-音频输出设备; 170-图像采集设备; 180-音视频信息控制装置; 181-获取模块; 182-检测模块; 183-控制模块。 具体实施方式 0050 为使本申请实施例的目的、 技术方案和优点更加清楚, 下面将结合本申请实施例 中的附图, 对本申请实施例中的技术方案进行清楚、 完整地描述, 显然, 所描述的实施例是 本申请一部分实施例, 而不是全部的实施例。 通常在此处附图中描述和示出的本申请实施 例的组件可以以各种不同的配置来布置和设计。 0051 因此, 以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护 的本申请的范围。

20、, 而是仅仅表示本申请的选定实施例。 基于本申请中的实施例, 本领域普通 技术人员在没有作出创造性劳动前提下所获得的所有其他实施例, 都属于本申请保护的范 围。 0052 应注意到: 相似的标号和字母在下面的附图中表示类似项, 因此, 一旦某一项在一 个附图中被定义, 则在随后的附图中不需要对其进行进一步定义和解释。 0053 此外, 若出现术语 “第一” 、“第二” 等仅用于区分描述, 而不能理解为指示或暗示相 对重要性。 0054 需要说明的是, 在不冲突的情况下, 本申请的实施例中的特征可以相互结合。 0055 请参考图1, 本申请实施例提供一种智能设备100, 该智能设备100可以是配。

21、置有显 说明书 3/10 页 6 CN 111078183 A 6 示屏幕140、 音频输出设备160、 音频采集设备150、 图像采集设备170等的电子设备, 例如智 能音箱。 0056 此外, 所述智能设备100还可包括存储器120、 处理器110及通信模块130。 所述音频 输出设备160、 音频采集设备150、 显示屏幕140、 存储器120、 处理器110以及通信模块130各 元件相互之间直接或间接地电性连接, 以实现数据的传输或交互。 例如, 这些元件相互之间 可通过一条或多条通讯总线或信号线实现电性连接。 0057 其中, 存储器120用于存储程序或者数据。 所述存储器120可以。

22、是, 但不限于, 随机 存取存储器(Random Access Memory, RAM), 只读存储器120(Read Only Memory, ROM), 可编 程只读存储器(Programmable Read-Only Memory, PROM), 可擦除只读存储器(Erasable Programmable Read-Only Memory, EPROM), 电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory, EEPROM)等。 0058 处理器110用于读/写存储器120中存储的数据或程序, 并执行本申请任意实施例 提供。

23、的音视频信息控制方法。 0059 通信模块130用于通过网络建立智能设备100与其它通信终端之间的通信连接, 并 用于通过网络收发数据。 0060 显示屏幕140在终端设备与用户之间同时提供一个输出及输入界面。 具体地, 该屏 幕可以向用户显示页面及视频输出, 这些输出的内容可包括文字、 图形、 视频、 及其任意组 合。 一些输出结果是对应于一些用户界面对象。 该显示屏幕140可以为触控屏幕, 用于接收 用户的输入, 例如用户的点击、 滑动等手势操作, 以便用户界面对象对这些用户的输入做出 响应。 检测用户输入的技术可以是基于电阻式、 电容式或者其他任意可能的触控检测技术。 屏幕的显示单元的具。

24、体实例包括但并不限于液晶显示器或发光聚合物显示器。 0061 应当理解的是, 图1所示的结构仅为智能设备100的结构示意图, 所述智能设备100 还可包括比图1中所示更多或者更少的组件, 或者具有与图1所示不同的配置。 图1中所示的 各组件可以采用硬件、 软件或其组合实现。 0062 请参阅图2, 图2示出了本申请实施例提供的音视频信息控制方法的流程示意图, 该音视频信息控制方法可由图1中所示的智能设备100执行。 应当理解, 在其它实施例中, 本 实施例的音视频信息控制方法其中部分步骤的顺序可以根据实际需要相互交换, 或者其中 的部分步骤也可以省略或删除。 该音视频信息控制方法的详细步骤介绍。

25、如下。 0063 步骤S210, 获取所述图像采集设备170采集到的图像。 0064 步骤S220, 检测所述图像中是否包含目标对象, 获取检测结果。 0065 步骤S230, 根据所述检测结果分别对所述智能设备100的音频输出信息和视频输 出信息进行控制。 0066 传统的智能设备100中, 在具有视频通道和语音通道的情况下, 一般采用的方式 是, 同时通过屏幕展示信息和并将展示信息通过语音通道进行语音输出。 用户在与智能设 备100交互时, 语音会实时反馈信息, 同时屏幕信息会作出相应的展示。 无论用户距离智能 设备100的位置有多远、 能否看见显示屏幕140, 视觉交互与语音交互的方式都。

26、会存在, 同时 屏幕信息的展示方式始终不会改变。 0067 传统的智能设备100中, 这种生硬地将视觉和语音两种方式结合在一起, 不分场合 的使用, 往往会造成用户的认知负担, 而产生烦躁的使用感受。 并且, 在不区分使用场景下, 说明书 4/10 页 7 CN 111078183 A 7 屏幕无法被很好的利用以展示合适信息量的信息。 0068 基于上述现有技术中存在的缺陷, 在本实施例中, 在开启智能设备100时, 同时开 启智能设备100的图像采集设备170。 其中, 该图像采集设备170可以包括摄像设备以采集图 像, 还可以包括红外设备, 以通过红外探测的方式探测与物体之间的相对距离。 。

27、0069 图像采集设备170在开启后, 将采集智能设备100附近的、 可视范围内的图像, 对图 像采集设备170采集到的图像进行识别, 以检测是否能够识别到目标对象。 其中, 该目标对 象可以是人体的各个部位, 例如面部、 头部、 身体等。 0070 本实施例中, 可以通过对采集到的图像进行运动检测, 从而确定图像中是否存在 目标对象, 或者可以对采集到的图像进行面部识别, 以确定是否采集到人脸图像, 或者也可 以采用其他的可实现人体检测或人脸检测的方式, 本实施例对此不作具体限制。 0071 根据检测的结果来相应地对智能设备100的视频输出信息和音频输出信息进行控 制。 也就是说, 可根据智。

28、能设备100附近是否有用户、 或者是用户相对于智能设备100的位置 情况, 以相应控制智能设备100的视频输出信息和音频输出信息。 根据用户的实际使用情况 合理地对视频输出信息和音频输出信息进行控制。 0072 本实施例中, 智能设备100的信息输出通道包括音频输出通道和视频输出通道, 其 中, 音频输出通道通过音频输出设备160实现音频信息输出, 该音频输出设备160可以是例 如喇叭等。 而视频输出通道通过显示屏幕140实现视频信息输出, 该视频信息可以是静态页 面, 也可以是视频流, 本实施例对此不作具体限制。 0073 请参阅图3, 上述根据检测结果分别对智能设备100的音频输出信息和视。

29、频输出信 息进行控制的步骤, 可以包括以下过程: 0074 步骤S231, 若所述检测结果表明未识别到所述目标对象, 则按第一音频输出策略 对所述智能设备100的音频输出信息进行控制, 并按第一视频输出策略对视频输出信息进 行控制。 0075 步骤S232, 若所述检测结果表明识别到所述目标对象, 则按第二音频输出策略对 所述智能设备100的音频输出信息进行控制, 并获得所述目标对象与所述智能设备100之间 的距离值, 根据所述距离值按第二视频输出策略对视频输出信息进行控制。 0076 在本实施中, 若检测结果表明未识别到目标对象, 说明在相对于智能设备100的图 像采集设备170的可视范围内。

30、没有用户。 此种情形下, 表明用户无法与智能设备100之间实 现视觉交互, 即智能设备100的显示屏幕140输出的内容此时无实际意义。 此时, 应当重点采 用音频输出的方式, 以向用户播放相关信息。 0077 可选地, 此时可按第一音频输出策略对智能设备100的音频输出信息进行控制, 并 按第一视频输出策略对视频输出信息进行控制, 具体地, 请参阅图4, 可采用以下方式: 0078 步骤S2311, 关闭所述智能设备100的显示屏幕140, 以停止视频输出信息的输出。 0079 步骤S2312, 在获取查询信息后, 获得所述查询信息对应的输出内容。 0080 步骤S2313, 将所述输出内容对。

31、应的音频输出信息, 通过所述智能设备100的音频 输出设备160进行音频输出。 0081 在图像采集设备170采集到的图像中未识别到目标对象时, 表明用户并未在智能 设备100的显示屏幕140前方, 若此时还通过显示屏幕140进行信息展示, 则无实际意义。 因 此, 为了节省设备的功耗, 可关闭智能设备100的显示屏幕140, 以停止视频输出信息的输 说明书 5/10 页 8 CN 111078183 A 8 出。 0082 同时, 在这种情况下, 应着重进行语音输出, 用户可通过语音输入的方式与智能设 备100实现交互。 例如, 用户可输入查询信息, 该查询信息可以是语音信息, 智能设备10。

32、0的 音频采集设备150可获取用户的查询信息。 其中, 音频采集设备150可以是麦克风等。 音频采 集设备150将获得的查询信息传输至处理设备, 通过处理设备的分析可获得该查询信息对 应的输出内容。 0083 需要将该输出内容通过语音通道输出给用户时, 可获得该输出内容对应的音频输 出信息, 并通过智能设备100的音频输出设备160进行音频输出。 0084 在这种情况下, 由于显示屏幕140已关闭, 因此, 在进行音频输出时, 应尽量将完整 的信息进行输出, 即将全部的输出内容所对应的音频输出信息输出。 以使用户在无法看到 显示屏幕140的情况下, 可根据智能设备100输出的音频输出信息获得完。

33、整的查询内容。 0085 此外, 若图像采集设备170采集到的图像中检测到目标对象, 则表明当前有用户位 于智能设备100的前方, 此时, 应结合视频通道和音频通道向用户展示相关信息。 0086 为了避免视频通道和音频通道两种交互方式共存而对用户造成认知负荷, 因合理 地对视频通道和音频通道的输出信息进行设置, 合理化展示信息。 0087 在这种情况下, 可按第二音频输出策略对智能设备100的音频输出信息进行控制, 而对于视频输出, 则可根据目标对象与智能设备100之间的距离值, 并按第二视频输出策略 对视频输出信息进行控制。 0088 可选地, 请参阅图5, 按第二音频输出策略对智能设备10。

34、0的音频输出信息进行控 制时, 可通过以下方式实现: 0089 步骤S2321, 在获取查询信息后, 获得所述查询信息对应的输出内容。 0090 步骤S2322, 获得所述输出内容中部分内容对应的音频输出信息, 将获得的音频输 出信息通过所述智能设备100的音频输出设备160进行音频输出。 0091 在能够识别到目标对象的情况下, 在用户需要查询获得相应内容时, 智能设备100 的显示屏幕140会进行内容展示, 因此, 为了避免同时进行视频输出和音频输出时, 过多输 出信息对用户造成负担, 音频输出通道可不必将所有的输出内容对应的音频输出信息进行 输出。 0092 可获得输出内容中部分内容对应。

35、的音频输出信息, 例如, 获取输出内容中包含的 部分较为重要的内容, 或者是挑选输出内容中与用户关联度较高的部分内容。 如在输出内 容为餐厅排名时, 则可挑选出分析获得的餐厅中与用户当前位置较近的部分餐厅。 0093 然后, 将该部分内容对应的音频输出信息通过智能设备100的音频输出设备160进 行音频输出。 0094 本实施例中, 在能够识别到目标对象的情况下, 由于目标对象相对于智能设备100 之间的距离的远近影响到目标对象对智能设备100的操控, 以及目标对象对于智能设备100 的显示屏幕140上所展示信息的观看体验, 因此, 可基于目标对象与智能设备100之间的距 离值, 并按第二视频。

36、输出策略对视频输出信息进行控制。 0095 在本实施例中, 图像采集设备170包括红外设备, 该红外设备可为红外激光摄像 头。 可通过红外设备对目标对象的探测以获得目标对象与智能设备100之间的距离值。 0096 可选地, 在图像采集设备170采集到的图像中检测识别到目标对象时, 可利用红外 说明书 6/10 页 9 CN 111078183 A 9 设备发出红外发射光, 红外发射光在遇到目标对象时, 将被目标对象反射回来, 因此, 可通 过红外设备获取经由目标对象反射后的红外接收光。 再根据红外发射光的发射时间点以及 接收红外接收光的接收时间点, 计算获得目标对象与智能设备100之间的距离值。

37、。 0097 可选地, 可根据红外光线在空气中的传输速度, 以及发射时间点和接收时间点之 间的时间差值, 计算得到目标对象与智能设备100之间的距离值。 0098 请参阅图6, 本实施例中, 在根据目标对象与智能设备100之间的距离值对视频输 出信息进行控制时, 可通过以下方式实现: 0099 步骤S2323, 在获取查询信息后, 获得所述查询信息对应的输出内容。 0100 步骤S2324, 在所述距离值小于第一预设阈值时, 将所述输出内容对应的视频输出 信息通过所述智能设备100的显示屏幕140进行输出。 0101 步骤S2325, 在所述距离值大于所述第一预设阈值且小于第二预设阈值时, 将。

38、所述 输出内容对应的视频输出信息通过所述智能设备100的显示屏幕140进行输出, 并对所述显 示屏幕140上的视频输出信息进行简化设置。 0102 步骤S2326, 在所述距离值大于所述第二预设阈值时, 则关闭所述智能设备100的 显示屏幕140, 以停止所述视频输出信息的输出。 0103 在这种情况下, 同样地, 用户可通过语音输入的方式进行信息查询, 智能设备100 在对查询信息进行分析处理之后, 获得查询信息对应的输出内容。 0104 在图像采集设备170能够识别到目标对象时, 若目标对象距离智能设备100较近, 例如小于第一预设阈值, 其中, 该第一预设阈值可为人体手臂最大作业范围。 。

39、即在目标对象 与智能设备100之间的距离小于第一预设阈值的情况下, 用户可对智能设备100的显示屏幕 140上的内容进行操控。 因此, 在这种情形下, 可将输出内容对应的视频输出信息完整的输 出显示在显示屏幕140上。 如包括视频输出信息中的主要展示信息、 一些添加的附加信息、 一些链接入口、 信息按钮等。 如此, 以便于用户在有需求时, 可对显示屏幕140上的相关内容 进行操作, 以满足用户所需。 0105 而若目标对象距离智能设备100的距离较远时, 例如大于第一预设阈值且小于第 二预设阈值, 其中, 该第二预设阈值可为人眼正常可视距离(例如, 视力1.0时可视距离为5 米)。 在目标对象。

40、与智能设备100之间的距离大于人体手臂最大作业范围但小于人眼正常可 视距离时, 表明此时用户无法对智能设备100的显示屏幕140上的显示内容进行操控, 但可 观看到显示屏幕140上的显示内容。 0106 此时, 显示屏幕140上的例如按钮、 链接等操作内容对于用户而言无实际意义, 反 而造成用户观看上的障碍。 并且, 在这种情况下, 由于用户与智能设备100之间的距离较远, 因此, 为了便于用户能够更好地观看展示内容, 可相应地对显示屏幕140上的视频输出信息 进行简化设置。 0107 可选地, 可对显示屏幕140上视频输出信息中的触控按键进行隐藏, 例如上述的按 钮、 链接等操作内容。 并且。

41、, 可将视频输出信息中的主要输出信息放大, 将一些不重要的信 息隐藏。 此外, 还可增大视频输出信息包含的文字信息的字体大小。 如此, 在用户无法操控 显示屏幕140但可观看到显示内容的情况下, 将一些不必要的操作内容隐藏, 着重显示出重 要的显示内容, 并且增大显示字体, 以便于更好地满足用户所需, 图7和图8分别示意性示出 了显示屏幕140进行完整视频输出信息展示和简化设置后的视频输出信息的展示效果。 说明书 7/10 页 10 CN 111078183 A 10 0108 此外, 若图像采集设备170能够识别到目标对象, 而目标对象与智能设备100之间 的距离大于第二预设阈值时, 即虽然。

42、用户在智能设备100附近, 但是用户所处的位置基本无 法观看到显示屏幕140上的显示内容。 此种情形下, 显示屏幕140上的显示信息对于用户而 言无实际意义, 此时, 为了降低设备的功耗, 可关闭智能设备100的显示屏幕140, 以停止视 频输出信息的输出。 这种情况下, 通过语音通道, 利用音频输出信息与用户实现信息交互即 可。 0109 在实施时, 例如, 智能设备100接收到用户输入的如 “给我推荐附近的餐厅” 的查询 信息时, 通过智能设备100的分析处理后, 可获得对应的例如排名前10的餐厅信息。 0110 在能够识别到目标对象的情况下, 若用户与智能设备100之间的距离小于人体手 。

43、臂最大作业范围, 即小于第一预设阈值, 则可将该排名前10的餐厅信息完整显示在显示屏 幕140上。 并且可在每个餐厅的显示内容旁增加查看更详细的相关信息的按键(例如商家评 价、 商家菜品等入口按键), 如此, 在用户可观看且可操控的情况下, 以满足用户的观看和操 控所需。 同时, 在显示屏幕140已完整显示相关的查询内容的情况下, 语音通道不必将该排 名前10的餐厅信息全部语音输出, 例如, 可只语音输出排名前3的餐厅信息即可, 以避免造 成语音输出、 视频输出共存时, 过多输出信息对用户造成的负担。 0111 而若此时, 用户与智能设备100之间的距离大于人体手臂最大作业范围但小于人 眼正常。

44、可视范围时, 即大于第一预设阈值且小于第二预设阈值时, 则可将上述显示屏幕140 上的例如按键等信息隐藏, 仅将排名前10的餐厅信息进行展示即可, 并且, 可将显示屏幕 140上的字体大小增大。 以便于用户在距离智能设备100较远时, 也能看清显示屏幕140上的 显示内容。 0112 若不能识别到目标对象, 或者目标对象与智能设备100之间的距离值大于人眼正 常可视距离, 即大于第二预设阈值时。 则可将智能设备100的显示屏幕140关闭, 以停止视频 输出信息的输出。 此时, 可将获得的排名前10的餐厅信息通过语音通道, 以完整地利用语音 输出信息进行输出。 以便于用户在无法观看到显示屏幕14。

45、0的情况下, 可通过语音信息将查 询内容反馈给用户。 0113 又如, 在另一种场景下, 智能设备100在获得用户输入的 “如何做宫保鸡丁” 的查询 信息时, 智能设备100对该查询信息进行分析处理后, 获得对应的输出内容。 0114 若此时能够识别到目标对象且目标对象与智能设备100之间的距离小于人眼正常 可视距离, 即用户可观看到显示屏幕140上的内容。 此时, 可将获得的宫保鸡丁的具体做法 通过显示屏幕140展示给用户, 语音通道可简单输出 “为您搜到宫保鸡丁的做法如下” , 而无 需将宫保鸡丁的具体做法转换为语音输出。 0115 若此时不能识别到目标对象或者目标对象与智能设备100之间。

46、的距离大于人眼正 常可视距离时, 则可关闭显示屏幕140, 并通过音频输出设备160将宫保鸡丁的详细做法通 过语音输出。 0116 请参阅图9, 以下将对本实施例提供的音视频信息控制方法的整体流程进行介绍。 0117 步骤S901, 开启智能设备100; 0118 步骤S902, 开启摄像设备, 以进行目标对象检测; 0119 步骤S903, 开启红外设备, 以探测目标对象与智能设备100之间的距离值; 0120 步骤S904, 检测摄像设备采集到的图像中是否识别到目标对象, 若识别到, 则执行 说明书 8/10 页 11 CN 111078183 A 11 步骤S905, 若未识别到, 则执。

47、行步骤S909; 0121 步骤S905, 根据目标对象与智能设备100之间的距离值, 确定采用步骤S906、 步骤 S907或步骤S908对音频输出信息和视频输出信息进行控制; 0122 步骤S906, 在目标对象与智能设备100之间的距离值小于第一预设阈值时, 通过显 示屏幕140将视频输出信息完整输出, 通过音频输出设备160将部分音频输出信息输出; 0123 步骤S907, 在目标对象与智能设备100之间的距离值大于第一预设阈值且小于第 二预设阈值时, 通过显示屏幕140将简化设置后的视频输出信息输出, 通过音频输出设备 160将完整音频输出信息输出; 0124 步骤S908, 在目标。

48、对象与智能设备100之间的距离值大于第二预设阈值时, 执行步 骤S909; 0125 步骤S909, 关闭显示屏幕140, 并通过音频输出设备160将完整音频输出信息输出。 0126 综上, 本实施例中, 考虑到用户在与多通道的智能设备100交互进行任务交互过程 时, 对通道的选择与用户和智能设备100之间的距离是强相关的。 当用户与智能设备100之 间的距离处于可触及的范围时, 用户通常会使用图像交互(Graphical User Interface, GUI), 而不是语音交互(Voice User Interface, VUI)。 当用户与智能设备100之间的距离较 远时, 通过GUI来。

49、展示任务结果也是不合理的。 因此, 基于用户位置来选择交互通道的输出 方式, 可以有效避免任务失败场景、 通道展示过度带来的用户使用认知负荷。 0127 因此, 本实施例中, 采用了视频输出、 音频输出以及音视频结合输出的方式来适应 实际情况下用户的不同状态。 通过检测用户与智能设备100之间的距离, 可以有效避免由于 用户距离过远, 而不适用于屏幕交互而导致的任务失败。 且在显示屏幕140完整显示视频输 出信息时, 通过简化音频输出信息, 以避免两种通道公共展示时, 造成用户使用认知负荷, 甚至使用户产生负面情绪的问题。 并且, 在对于用户无法与屏幕操作而在可观看的距离内 的情况, 通过隐藏。

50、显示屏幕140上的例如按键等操作内容, 以更好的进行信息展示, 减少用 户对显示屏幕140上的复杂功能认知带来的负荷。 0128 如此, 本实施例结合图像识别与红外距离探测的方式, 判断用户与智能设备100之 间的交互距离, 基于该交互距离的差异从而改进智能识别的交互通道输出策略, 能够有效 减轻用户的认知负担, 带来更好的使用体验。 0129 请参阅图10, 为了执行上述实施例及各个可能的方式中的相应步骤, 下面给出一 种音视频信息控制装置180的实现方式, 可选地, 该音视频信息控制装置180可以采用上述 图1所示的电子设备的器件结构。 进一步地, 图10为本申请实施例提供的一种音视频信息。

展开阅读全文
内容关键字: 视频 信息 控制 方法 装置 智能 设备 计算机 可读 存储 介质
关于本文
本文标题:音视频信息控制方法、装置、智能设备和计算机可读存储介质.pdf
链接地址:https://www.zhuanlichaxun.net/pdf/10832197.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1