书签 分享 收藏 举报 版权申诉 / 18

一种拾音方法.pdf

  • 上传人:a****
  • 文档编号:4745947
  • 上传时间:2018-11-05
  • 格式:PDF
  • 页数:18
  • 大小:1.67MB
  • 摘要
    申请专利号:

    CN201410528682.3

    申请日:

    2014.10.09

    公开号:

    CN104320729A

    公开日:

    2015.01.28

    当前法律状态:

    实审

    有效性:

    审中

    法律详情:

    实质审查的生效IPC(主分类):H04R 1/08申请日:20141009|||公开

    IPC分类号:

    H04R1/08; G06F3/01

    主分类号:

    H04R1/08

    申请人:

    深圳市金立通信设备有限公司

    发明人:

    尚岸奇

    地址:

    518040 广东省深圳市福田区深南大道7028号时代科技大厦东座21楼

    优先权:

    专利代理机构:

    广州三环专利代理有限公司 44202

    代理人:

    郝传鑫;熊永强

    PDF完整版下载: PDF下载
    内容摘要

    本发明实施例公开了一种拾音方法,包括:获取终端捕捉到的图像信息;在图像信息中获取目标人物头像;根据目标人物头像在图像信息中的位置,对拾音装置进行拾音控制;获取通过拾音控制后的拾音装置拾音得到的音频信号。采用本发明实施例,可根据目标人物头像在图像信息中的位置,对拾音装置进行拾音控制,可提高拾音的效果,并提升用户体验。

    权利要求书

    权利要求书
    1.  一种拾音方法,其特征在于,所述方法包括:
    获取终端捕捉到的图像信息;
    在所述图像信息中获取目标人物头像;
    根据所述目标人物头像在所述图像信息中的位置,对拾音装置进行拾音控制;
    获取通过拾音控制后的拾音装置拾音得到的音频信号。

    2.  如权利要求1所述的方法,其特征在于,所述获取终端捕捉到的图像信息之后,还包括:
    获取用户设置的配置信息,所述配置信息用于指示是否对所述拾音装置进行拾音控制;
    若检测到所述配置信息用于指示对所述拾音装置进行拾音控制,则触发在所述图像信息中获取目标人物头像。

    3.  如权利要求1所述的方法,其特征在于,所述图像信息包括一个人物头像;
    所述在所述图像信息中获取目标人物头像包括:
    识别所述图像信息中的人物头像;
    将所述识别到的人物头像设定为目标人物头像。

    4.  如权利要求1所述的方法,其特征在于,所述图像信息包括至少两个人物头像;
    所述在所述图像信息中获取目标人物头像包括:
    接收用户对所述图像信息提交的目标人物头像确认指令;
    根据所述目标人物头像确认指令,识别所述图像信息中的目标人物头像。

    5.  如权利要求1所述的方法,其特征在于,所述根据所述目标人物头像在所述图像信息中的位置,对拾音装置进行拾音控制包括:
    根据所述目标人物头像在所述图像信息中的位置,确定目标拾音装置;
    对所述确定的目标拾音装置进行拾音控制。

    6.  如权利要求5所述的方法,其特征在于,所述对所述确定的目标拾音装置进行拾音控制包括:
    控制所述目标拾音装置中的至少一个拾音装置对所述目标人物头像进行拾音;
    控制所述目标拾音装置中的其它拾音装置对所述目标人物头像对应的目标音源以外的其它音源进行噪声抑制。

    7.  如权利要求1所述的方法,其特征在于,所述根据所述目标人物头像在所述图像信息中的位置,对拾音装置进行拾音控制包括:
    根据所述目标人物头像在所述图像信息中的位置,调整所述拾音装置的音频参数。

    8.  如权利要求7所述的方法,其特征在于,所述音频参数包括所述拾音装置的幅度,所述拾音装置包括第一拾音装置和第二拾音装置;
    所述根据所述目标人物头像在所述图像信息中的位置,调整所述拾音装置的音频参数包括:
    根据所述目标人物头像在所述图像信息中的位置,确定与所述目标人物头像匹配的第一拾音装置;
    增大所述第一拾音装置的幅度,并减小所述第二拾音装置的幅度。

    9.  如权利要求1所述的方法,其特征在于,所述获取通过拾音控制后的拾音装置拾音得到的音频信号包括:
    通过所述拾音控制后的拾音装置拾取所述目标人物头像对应的目标音源发送的音频信号,并滤除所述目标音源以外的其他音源发送的音频信号。

    说明书

    说明书一种拾音方法
    技术领域
    本发明涉及电子技术领域,尤其涉及一种拾音方法。
    背景技术
    拾音就是收集声音的过程,而在拾音过程中麦克风通常收集到不必要的声音,以摄影拾音为例,终端捕捉图像信息过程中通常会出现目标音源对应的用户以外的陌生人说话的声音,或者所处环境中噪声源发出的干扰声等等,将弱化目标音源发送的声音,导致摄影效果较差,现有技术无法在拾音的过程中避开噪声源,则拾取的音频信号的音质较低。
    发明内容
    本发明实施例提供一种拾音方法,可提高拾音的效果,并提升用户体验。
    本发明实施例提供了一种拾音方法,包括:
    获取终端捕捉的图像信息;
    在所述图像信息中获取目标人物头像;
    根据所述目标人物头像在所述图像信息中的位置,对拾音装置进行拾音控制;
    获取通过拾音控制后的拾音装置拾音得到的音频信号。
    实施本发明实施例,终端可获取图像信息,在图像信息中获取目标人物头像,根据目标人物头像在图像信息中的位置,对拾音装置进行拾音控制,获取通过拾音控制后的拾音装置拾音得到的音频信号,现有技术中终端不能对拾音装置进行拾音控制,则终端在拾音过程中会接收到目标音源以外的其他音源发送的音频信号,音频信号的音质较差,本发明实施例可根据目标人物头像在图像信息中的位置,对拾音装置进行拾音控制,可提高拾音的效果,并提升用户体验。
    附图说明
    为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
    图1是本发明第一实施例中提供的一种拾音方法的流程示意图;
    图2是本发明第二实施例中提供的一种拾音方法的流程示意图;
    图3是本发明第三实施例中提供的一种拾音方法的流程示意图;
    图4是本发明第一实施例中提供的一种终端的结构示意图;
    图5是本发明实施例中图4的一种人物头像获取单元的结构示意图;
    图6是本发明实施例中图4的另一种人物头像获取单元的结构示意图;
    图7是本发明实施例中图4的一种拾音控制单元的结构示意图;
    图8是本发明实施例中图4的另一种拾音控制单元的结构示意图;
    图9是本发明第二实施例中提供的一种终端的结构示意图;
    图10是本发明实施例中提供的一种控制拾音装置进行拾音的效果示意图。
    具体实施方式
    下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
    本发明实施例提供了一种拾音方法,拾音即采集声音的过程,终端可以获取捕捉到的图像信息,在图像信息中获取目标人物头像,根据目标人物头像在图像信息中的位置,对拾音装置进行拾音控制,获取通过拾音控制后的拾音装置拾音得到的音频信号,本发明实施例可提高拾音的效果,并提升用户体验。
    本发明实施例提及到的终端可以包括手机、平板电脑、PC(personal computer,个人计算机)或者佩戴式智能设备等具有拾音功能的终端。拾音装置可以包括麦克风或者话筒等,其中麦克风可以内置放大器。
    请参见图1,图1是本发明实施例中提供的一种拾音方法的流程示意图,如图所示本发明实施例中的拾音方法可以包括:
    S101,获取终端捕捉到的图像信息。
    终端可以获取捕捉到的图像信息,以图10所示的控制拾音装置进行拾音的效果示意图为例,终端可以通过摄像头获取捕捉到的图像信息,其中图像信息可以包括至少一个人物头像。
    在可选实施例中,终端获取到图像信息之后,可以获取用户设置的配置信息,检测该配置信息是否用于指示对拾音装置进行拾音控制,若该配置信息用于指示对拾音装置进行拾音控制,则进一步执行S102;若该配置信息用于指示不对拾音装置进行拾音控制,则对获取到的图像信息不进行处理。例如,用户需要对拾音装置进行拾音控制,则可以预先设置用于指示对拾音装置进行拾音控制的配置信息,终端获取到图像信息后,若检测到用户设置的配置信息用于指示对拾音装置进行拾音控制,则可以在图像信息中获取目标人物头像。其中配置信息用于指示是否对拾音装置进行拾音控制。
    S102,在图像信息中获取目标人物头像。
    终端获取到图像信息之后,可以在图像信息中获取目标人物头像。
    在可选实施例中,若图像信息包括一个人物头像,则终端可以识别图像信息中的人物头像,并将识别到的人物头像设定为目标人物头像。
    在可选实施例中,若图像信息包括至少两个人物头像,则终端可以接收用户对图像信息提交的目标人物头像确认指令,根据目标人物头像确认指令识别图像信息中的目标人物头像,其中目标人物头像可以包括图像信息中的部分或全部人物头像。例如,终端检测到图像信息包括至少两个人物头像时,可以生成人物头像提示信息,并在终端的显示界面中显示该人物头像提示信息,用户可以根据该人物头像提示信息向终端提交目标人物头像确认指令,终端根据目标人物头像确认指令识别图像信息中的目标人物头像。
    S103,根据目标人物头像在图像信息中的位置,对拾音装置进行拾音控制。
    终端可以根据目标人物头像在图像信息中的位置,对拾音装置进行拾音控制。以图10所示的控制拾音装置进行拾音的效果示意图为例,若检测到目标人物头像在图像信息中的位置位于右方,则终端可以对至少一个拾音装置进行拾音控制,示例性的,终端可以根据目标人物头像在图像信息中的位置,对拾音装置C进行拾音控制。
    在可选实施例中,终端可以根据目标人物头像在图像信息中的位置,确定目标拾音装置,并对确定的目标拾音装置进行拾音控制。确定目标拾音装置可 以是在终端已有的拾音装置中选择其中一个拾音装置进行拾音操作,也可以是选择其中几个(至少两个)的组合。另一种可选的方案,确定目标拾音装置,可以是调整终端已有的拾音装置的功能。进一步可选的,终端可以控制目标拾音装置中的至少一个拾音装置对目标人物头像进行拾音,并控制目标拾音装置中的其它拾音装置对目标人物头像对应的目标音源以外的其它音源进行噪声抑制。以图10为例,终端可以根据目标人物头像在图像信息中的位置,确定目标拾音装置,以调整终端已有的拾音装置的功能为例:其中目标拾音装置可以包括拾音装置A、拾音装置B以及拾音装置C,控制拾音装置C对目标人物头像进行拾音,并控制拾音装置A和拾音装置B对目标人物头像对应的目标音源以外的其它音源进行噪声抑制(拾音装置A和拾音装置B的功能调整为对目标人物头像对应的目标音源以外的其它音源进行噪声抑制)。
    在可选实施例中,终端可以根据目标人物头像在图像信息中的位置,调整拾音装置的音频参数,进一步可选的,拾音装置的音频参数可以包括拾音装置的幅度,拾音装置可以包括第一拾音装置和第二拾音装置,则终端可以根据目标人物头像在图像信息中的位置,确定与目标人物头像匹配的第一拾音装置,并增大第一拾音装置的幅度,减小第二拾音装置的幅度。以图10为例,终端中的拾音装置包括拾音装置A、拾音装置B和拾音装置C,目标人物头像在图像信息中的位置位于右方,则终端可以确定与目标人物头像匹配的第一拾音装置为拾音装置C,进而增大拾音装置C的幅度,减小拾音装置A和拾音装置B的幅度,本发明实施例可增强目标人物头像对应的目标音源发送的音频信号,并抑制目标音源以外的其他音源发送的音频信号。
    需要指出的是,本发明实施例中的拾音装置包含但不局限于第一拾音装置和第二拾音装置,还可以包括其他拾音装置,其中第一拾音装置可以包括至少一个拾音装置,第二拾音装置可以包括至少一个拾音装置,本发明实施例中的音频参数包含但不局限于幅度,还可以包括频率或者相位等,具体不受本发明实施例限制。
    S104,获取通过拾音控制后的拾音装置拾音得到的音频信号。
    终端对拾音装置进行拾音控制后,可以获取通过拾音控制后的拾音装置拾音得到的音频信号,具体的,若终端对目标拾音装置进行拾音控制,则可以获取通过拾音控制后的目标拾音装置拾音得到的音频信号;若终端对拾音装置的 音频参数进行调整,则可以获取通过音频参数调整后的拾音装置拾音得到的音频信号。
    在可选实施例中,终端可以通过所述拾音控制后的拾音装置拾取所述目标人物头像对应的目标音源发送的音频信号,并滤除所述目标音源以外的其他音源发送的音频信号,以图10所示的控制拾音装置进行拾音的效果示意图为例,目标人物头像在图像信息中的位置位于右方,目标人物头像与拾音装置C之间的距离较短,则终端可以对拾音装置A、拾音装置B以及拾音装置C进行拾音控制,获取分别通过拾音装置A、拾音装置B以及拾音装置C拾音得到的音频信号,将拾音装置C拾音得到的音频信号减去拾音装置A拾音得到的音频信号,进而减去拾音装置B拾音得到的音频信号,以获取目标人物头像对应的目标音源发送的音频信号,并滤除目标音源以外的其他音源发送的音频信号。
    在图1所示的拾音方法中,终端获取捕捉到的图像信息,在图像信息中获取目标人物头像,根据目标人物头像在图像信息中的位置,对拾音装置进行拾音控制,获取通过拾音控制后的拾音装置拾音得到的音频信号,本发明实施例可提高拾音的效果,并提升用户体验。
    请参见图2,图2是本发明第二实施例中提供的一种拾音方法的流程示意图,如图所示本发明实施例中的拾音方法可以包括:
    S201,获取终端捕捉到的图像信息,其中图像信息包括一个人物头像。
    终端可以获取捕捉到的图像信息,例如终端可以通过摄像头获取捕捉到的图像信息,其中图像信息可以包括一个人物头像。
    在可选实施例中,终端获取到图像信息之后,可以获取用户设置的配置信息,检测该配置信息是否用于指示对拾音装置进行拾音控制,若该配置信息用于指示对拾音装置进行拾音控制,则进一步执行S202;若该配置信息用于指示不对拾音装置进行拾音控制,则对获取到的图像信息不进行处理。例如,用户需要对拾音装置进行拾音控制,则可以预先设置用于指示对拾音装置进行拾音控制的配置信息,终端获取到图像信息后,若检测到用户设置的配置信息用于指示对拾音装置进行拾音控制,则可以识别图像信息中的人物头像。其中配置信息用于指示是否对拾音装置进行拾音控制。
    S202,识别图像信息中的人物头像。
    终端获取到图像信息后,可以识别图像信息中的人物头像。以图10所示的控制拾音装置进行拾音的效果示意图为例,终端可以通过图像处理技术对图像信息进行分析,进而识别图像信息中的人物头像。
    S203,将识别到的人物头像设定为目标人物头像。
    终端识别到图像信息中的人物头像后,可以将识别到的人物头像设定为目标人物头像。
    S204,根据目标人物头像在图像信息中的位置,确定目标拾音装置。
    终端识别到目标人物头像后,可以根据目标人物头像在图像信息中的位置,确定目标拾音装置。确定目标拾音装置可以是在终端已有的拾音装置中选择其中一个拾音装置进行拾音操作,也可以是选择其中几个(至少两个)的组合。以图10为例,若终端检测到目标人物头像在图像信息中的位置位于右方,则可以根据目标人物头像在图像信息中的位置,确定目标拾音装置,其中目标拾音装置可以包括拾音装置C。
    S205,对目标拾音装置进行拾音控制。
    终端可以对确定的目标拾音装置进行拾音控制,具体的,终端可以控制目标拾音装置中的至少一个拾音装置对目标人物头像进行拾音,例如终端确定的目标拾音装置包括拾音装置C时,可以控制拾音装置C对目标人物头像进行拾音。
    S206,获取通过拾音控制后的目标拾音装置拾音得到的音频信号。
    终端对目标拾音装置进行拾音控制后,可以获取通过拾音控制后的目标拾音装置拾音得到的音频信号,具体的,终端可以获取通过拾音控制后的拾音装置C拾音得到的音频信号。
    在图2所示的拾音方法中,终端将识别到的图像信息中的人物头像设定为目标人物头像,根据目标人物头像在图像信息中的位置确定目标拾音装置,对确定的目标拾音装置进行拾音控制,并获取通过拾音控制后的目标拾音装置拾音得到的音频信号,可提高拾音的效果,并提升用户体验。
    请参见图3,图3是本发明第三实施例中提供的一种拾音方法的流程示意图,如图所示本发明实施例中的拾音方法可以包括:
    S301,获取终端捕捉到的图像信息,其中图像信息包括至少两个人物头像。
    终端可以获取捕捉到的图像信息,例如终端可以通过摄像头获取捕捉到的图像信息,其中图像信息可以包括至少两个人物头像。
    在可选实施例中,终端获取到图像信息之后,可以获取用户设置的配置信息,检测该配置信息是否用于指示对拾音装置进行拾音控制,若该配置信息用于指示对拾音装置进行拾音控制,则进一步执行S302;若该配置信息用于指示不对拾音装置进行拾音控制,则对获取到的图像信息不进行处理。例如,用户需要对拾音装置进行拾音控制,则可以预先设置用于指示对拾音装置进行拾音控制的配置信息,终端获取到图像信息后,若检测到用户设置的配置信息用于指示对拾音装置进行拾音控制,则可以接收用户对图像信息提交的目标人物头像确认指令。其中配置信息用于指示是否对拾音装置进行拾音控制。
    S302,接收用户对图像信息提交的目标人物头像确认指令。
    终端获取到的图像信息包括至少两个人物头像时,可以接收用户对图像信息提交的目标人物头像确认指令,其中目标人物头像可以包括图像信息中的部分或全部人物头像。例如,终端检测到图像信息包括至少两个人物头像时,可以生成人物头像提示信息,并在终端的显示界面中显示该人物头像提示信息,用户可以根据该人物头像提示信息向终端提交目标人物头像确认指令。
    S303,根据目标人物头像确认指令,识别图像信息中的目标人物头像。
    S304,根据目标人物头像在图像信息中的位置,调整拾音装置的音频参数。
    终端识别到目标人物头像后,可以根据目标人物头像在图像信息中的位置,调整拾音装置的音频参数。可选的,拾音装置的音频参数可以包括拾音装置的幅度,拾音装置可以包括第一拾音装置和第二拾音装置,则终端可以根据目标人物头像在图像信息中的位置,确定与目标人物头像匹配的第一拾音装置,并增大第一拾音装置的幅度,减小第二拾音装置的幅度。以图10为例,终端中的拾音装置包括拾音装置A和拾音装置C,目标人物头像在图像信息中的位置位于右方,则终端可以确定与目标人物头像匹配的第一拾音装置为拾音装置C,进而增大拾音装置C的幅度,减小拾音装置A的幅度,本发明实施例可增强目标人物头像对应的目标音源发送的音频信号,并抑制目标音源以外的其他音源发送的音频信号。
    需要指出的是,本发明实施例中的拾音装置包含但不局限于第一拾音装置和第二拾音装置,还可以包括其他拾音装置,例如拾音装置B,本发明实施例中 的音频参数包含但不局限于幅度,还可以包括频率或者相位等,具体不受本发明实施例限制。
    S305,获取通过音频参数调整后的拾音装置拾音得到的音频信号。
    终端对拾音装置进行音频参数调整后,可以获取通过音频参数调整后的拾音装置拾音得到的音频信号,具体的,终端可以获取通过音频参数调整后的第一拾音装置拾音得到的音频信号,并获取通过音频参数调整后的第二拾音装置拾音得到的音频信号。
    在可选实施例中,终端可以通过所述拾音控制后的拾音装置拾取所述目标人物头像对应的目标音源发送的音频信号,并滤除所述目标音源以外的其他音源发送的音频信号,以图10所示的控制拾音装置进行拾音的效果示意图为例,目标人物头像在图像信息中的位置位于右方,目标人物头像与拾音装置C之间的距离较短,则终端可以对拾音装置A、拾音装置B以及拾音装置C进行拾音控制,获取分别通过拾音装置A、拾音装置B以及拾音装置C拾音得到的音频信号,将拾音装置C拾音得到的音频信号减去拾音装置A拾音得到的音频信号,进而减去拾音装置B拾音得到的音频信号,以获取目标人物头像对应的目标音源发送的音频信号,并滤除目标音源以外的其他音源发送的音频信号。
    在图3所示的拾音方法中,终端根据用户对图像信息提交的目标人物头像确认指令,识别图像信息中的目标人物头像,根据目标人物头像在图像信息中的位置,调整拾音装置的音频参数,获取通过音频参数调整后的拾音装置拾音得到的音频信号,可提高拾音的效果,并提升用户体验。
    请参见图4,图4是本发明第一实施例中提供的一种终端的结构示意图,如图所示本发明实施例中的终端400至少可以包括信息获取单元410、人物头像获取单元420、拾音控制单元430以及音频信号获取单元440,其中:
    信息获取单元410,用于获取捕捉到的图像信息,以图10所示的控制拾音装置进行拾音的效果示意图为例,信息获取单元410可以通过摄像头获取捕捉到的图像信息,其中图像信息可以包括至少一个人物头像。
    人物头像获取单元420,用于在所述图像信息中获取目标人物头像。
    拾音控制单元430,用于根据所述目标人物头像在所述图像信息中的位置,对拾音装置进行拾音控制。以图10所示的控制拾音装置进行拾音的效果示意图 为例,若检测到目标人物头像在图像信息中的位置位于右方,则拾音控制单元430可以对至少一个拾音装置进行拾音控制,示例性的,终端可以根据目标人物头像在图像信息中的位置,对拾音装置C进行拾音控制。
    音频信号获取单元440,用于获取拾音控制后的拾音装置拾音得到的音频信号。
    作为一种可选的实施方式,信息获取单元410,还用于获取到所述图像信息之后,获取用户设置的配置信息,所述配置信息用于指示是否对所述拾音装置进行拾音控制,若检测到所述配置信息用于指示对所述拾音装置进行拾音控制,则触发所述人物头像获取单元420在所述图像信息中获取目标人物头像。例如,用户需要对拾音装置进行拾音控制,则可以预先设置用于指示对拾音装置进行拾音控制的配置信息,信息获取单元410获取到图像信息后,若检测到用户设置的配置信息用于指示对拾音装置进行拾音控制,则人物头像获取单元420可以在图像信息中获取目标人物头像。其中配置信息用于指示是否对拾音装置进行拾音控制。
    作为一种可选的实施方式,图像信息可以包括一个人物头像,则本发明实施例中的人物头像获取单元420可以如图5所示,进一步包括:
    第一识别单元510,用于识别所述图像信息中的人物头像。
    设定单元520,用于将所述识别到的人物头像设定为目标人物头像。
    作为一种可选的实施方式,图像信息可以包括至少两个人物头像,则本发明实施例中的人物头像获取单元420可以如图6所示,进一步包括:
    指令接收单元610,用于接收用户对所述图像信息提交的目标人物头像确认指令。
    第二识别单元620,用于根据所述目标人物头像确认指令,识别所述图像信息中的目标人物头像,其中目标人物头像可以包括图像信息中的部分或全部人物头像。
    作为一种可选的实施方式,本发明实施例中的拾音控制单元430可以如图7所示,进一步包括:
    第一确定单元710,用于根据所述目标人物头像在所述图像信息中的位置,确定目标拾音装置。第一确定单元710可以在终端已有的拾音装置中选择其中一个拾音装置进行拾音操作,也可以是选择其中几个(至少两个)的组合。另 一种可选的方案,第一确定单元710可以调整终端已有的拾音装置的功能。
    第一控制单元720,用于对所述第一确定单元710确定的目标拾音装置进行拾音控制。
    进一步可选的,第一控制单元720,用于控制所述目标拾音装置中的至少一个拾音装置对所述目标人物头像进行拾音。
    第一控制单元720,还用于控制所述目标拾音装置中的其它拾音装置对所述目标人物头像对应的目标音源以外的其它音源进行噪声抑制。
    以图10为例,第一确定单元710可以根据目标人物头像在图像信息中的位置,确定目标拾音装置,以调整终端已有的拾音装置的功能为例:其中目标拾音装置可以包括拾音装置A、拾音装置B以及拾音装置C,第一控制单元720可以控制拾音装置C对目标人物头像进行拾音,并控制拾音装置A和拾音装置B对目标人物头像对应的目标音源以外的其它音源进行噪声抑制(拾音装置A和拾音装置B的功能调整为对目标人物头像对应的目标音源以外的其它音源进行噪声抑制)。
    作为一种可选的实施方式,拾音控制单元430,用于根据所述目标人物头像在所述图像信息中的位置,调整所述拾音装置的音频参数。
    进一步可选的,音频参数可以包括拾音装置的幅度,拾音装置可以包括第一拾音装置和第二拾音装置,则本发明实施例中的拾音控制单元430可以如图8所示,进一步包括:
    第二确定单元810,用于根据所述目标人物头像在所述图像信息中的位置,确定与所述目标人物头像匹配的第一拾音装置。
    第二控制单元820,用于增大所述第一拾音装置的幅度,并减小所述第二拾音装置的幅度。
    以图10为例,拾音装置包括拾音装置A和拾音装置C,目标人物头像在图像信息中的位置位于右方,则第二确定单元810可以确定与目标人物头像匹配的第一拾音装置为拾音装置C,第二控制单元820增大拾音装置C的幅度,减小拾音装置A的幅度。
    需要指出的是,本发明实施例中的拾音装置包含但不局限于第一拾音装置和第二拾音装置,还可以包括其他拾音装置,例如拾音装置B,本发明实施例中的音频参数包含但不局限于幅度,还可以包括频率或者相位等,具体不受本发 明实施例限制。
    作为一种可选的实施方式,音频信号获取单元440,用于通过所述拾音控制后的拾音装置拾取所述目标人物头像对应的目标音源发送的音频信号,并滤除所述目标音源以外的其他音源发送的音频信号。
    以图10所示的控制拾音装置进行拾音的效果示意图为例,目标人物头像在图像信息中的位置位于右方,目标人物头像与拾音装置C之间的距离较短,则拾音控制单元430可以对拾音装置A、拾音装置B以及拾音装置C进行拾音控制,音频信号获取单元440获取分别通过拾音装置A、拾音装置B以及拾音装置C拾音得到的音频信号,并将拾音装置C拾音得到的音频信号减去拾音装置A拾音得到的音频信号,进而减去拾音装置B拾音得到的音频信号,以获取目标人物头像对应的目标音源发送的音频信号,并滤除目标音源以外的其他音源发送的音频信号。
    在图4所示的终端中,人物头像获取单元420在信息获取单元410获取到的图像信息中获取目标人物头像,拾音控制单元430根据目标人物头像在图像信息中的位置,对拾音装置进行拾音控制,音频信号获取单元440获取通过拾音控制后的拾音装置拾音得到的音频信号,可提高拾音的效果,并提升用户体验。
    请参见图9,图9是本发明第二实施例中提供的一种终端的结构示意图,如图9所示,该终端900包括:至少一个处理器910,例如CPU,至少一个输入装置930,至少一个输出装置940,存储器950,至少一个总线920。其中,通信总线920用于实现这些组件之间的连接通信。例如,输入装置930可以包括触控板或者摄像头等,输出装置940可以包括显示屏。存储器950可以是高速RAM存储器,也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。存储器950可选的还可以是至少一个位于远离前述处理器910的存储终端。其中处理器910可以结合图4~图8所示的终端,其中:
    输入装置930,用于获取捕捉到的图像信息,以图10所示的控制拾音装置进行拾音的效果示意图为例,输入装置930可以通过摄像头获取捕捉到的图像信息,其中图像信息可以包括至少一个人物头像。
    存储器950中存储一组程序代码,且处理器910调用存储器950中存储的 程序代码,用于执行以下操作:
    在所述图像信息中获取目标人物头像。
    根据所述目标人物头像在所述图像信息中的位置,对拾音装置进行拾音控制。以图10所示的控制拾音装置进行拾音的效果示意图为例,若检测到目标人物头像在图像信息中的位置位于右方,则处理器910可以对至少一个拾音装置进行拾音控制,示例性的,终端可以根据目标人物头像在图像信息中的位置,对拾音装置C进行拾音控制。
    获取通过拾音控制后的拾音装置拾音得到的音频信号。
    作为一种可选的实施方式,输入装置930获取到所述图像信息之后,处理器910可以获取用户设置的配置信息,所述配置信息用于指示是否对所述拾音装置进行拾音控制,若检测到所述配置信息用于指示对所述拾音装置进行拾音控制,则触发处理器910在所述图像信息中获取目标人物头像。例如,用户需要对拾音装置进行拾音控制,则可以预先设置用于指示对拾音装置进行拾音控制的配置信息,获取到图像信息后,若检测到用户设置的配置信息用于指示对拾音装置进行拾音控制,则处理器910可以在图像信息中获取目标人物头像。其中配置信息用于指示是否对拾音装置进行拾音控制。
    作为一种可选的实施方式,图像信息可以包括一个人物头像,则处理器910获取图像信息中的目标人物头像具体可以为:
    识别所述图像信息中的人物头像。
    将所述识别到的人物头像设定为目标人物头像。
    作为一种可选的实施方式,图像信息可以包括至少两个人物头像,则处理器910获取图像信息中的目标人物头像具体可以为:
    接收用户对所述图像信息提交的目标人物头像确认指令。
    根据所述目标人物头像确认指令,识别所述图像信息中的目标人物头像,其中目标人物头像可以包括图像信息中的部分或全部人物头像。
    作为一种可选的实施方式,处理器910根据目标人物头像在所述图像信息中的位置,对拾音装置进行拾音控制具体可以为:
    根据所述目标人物头像在所述图像信息中的位置,确定目标拾音装置。确定的目标拾音装置可以是在终端已有的拾音装置中选择其中一个拾音装置进行拾音操作,也可以是选择其中几个(至少两个)的组合。另一种可选的方案, 确定目标拾音装置,可以是调整终端已有的拾音装置的功能。
    对所述确定的目标拾音装置进行拾音控制。
    进一步可选的,处理器910对所述确定的目标拾音装置进行拾音控制具体可以为:
    控制所述目标拾音装置中的至少一个拾音装置对所述目标人物头像进行拾音。
    控制所述目标拾音装置中的其它拾音装置对所述目标人物头像对应的目标音源以外的其它音源进行噪声抑制。
    以图10为例,可以根据目标人物头像在图像信息中的位置,确定目标拾音装置,以调整终端已有的拾音装置的功能为例:其中目标拾音装置可以包括拾音装置A、拾音装置B以及拾音装置C,处理器910可以控制拾音装置C对目标人物头像进行拾音,并控制拾音装置A和拾音装置B对目标人物头像对应的目标音源以外的其它音源进行噪声抑制(拾音装置A和拾音装置B的功能调整为对目标人物头像对应的目标音源以外的其它音源进行噪声抑制)。
    作为一种可选的实施方式,处理器910根据目标人物头像在所述图像信息中的位置,对拾音装置进行拾音控制具体可以为:
    根据所述目标人物头像在所述图像信息中的位置,调整所述拾音装置的音频参数。
    进一步可选的,音频参数可以包括拾音装置的幅度,拾音装置可以包括第一拾音装置和第二拾音装置,则处理器910根据所述目标人物头像在所述图像信息中的位置,调整所述拾音装置的音频参数具体可以为:
    根据所述目标人物头像在所述图像信息中的位置,确定与所述目标人物头像匹配的第一拾音装置。
    增大所述第一拾音装置的幅度,并减小所述第二拾音装置的幅度。
    以图10为例,拾音装置包括拾音装置A和拾音装置C,目标人物头像在图像信息中的位置位于右方,则处理器910可以确定与目标人物头像匹配的第一拾音装置为拾音装置C,增大拾音装置C的幅度,减小拾音装置A的幅度,本发明实施例可增强目标人物头像对应的目标音源发送的音频信号,并抑制目标音源以外的其他音源发送的音频信号。
    需要指出的是,本发明实施例中的拾音装置包含但不局限于第一拾音装置 和第二拾音装置,还可以包括其他拾音装置,例如拾音装置B,本发明实施例中的音频参数包含但不局限于幅度,还可以包括频率或者相位等,具体不受本发明实施例限制。
    作为一种可选的实施方式,处理器910获取通过拾音控制后的拾音装置拾音得到的音频信号具体可以为:
    通过所述拾音控制后的拾音装置拾取所述目标人物头像对应的目标音源发送的音频信号,并滤除所述目标音源以外的其他音源发送的音频信号。以图10所示的控制拾音装置进行拾音的效果示意图为例,目标人物头像在图像信息中的位置位于右方,目标人物头像与拾音装置C之间的距离较短,则处理器910可以对拾音装置A、拾音装置B以及拾音装置C进行拾音控制,获取分别通过拾音装置A、拾音装置B以及拾音装置C拾音得到的音频信号,将拾音装置C拾音得到的音频信号减去拾音装置A拾音得到的音频信号,进而减去拾音装置B拾音得到的音频信号,以获取目标人物头像对应的目标音源发送的音频信号,并滤除目标音源以外的其他音源发送的音频信号。
    具体的,本发明实施例中介绍的终端900可以用以实施本发明结合图1、图2或者图3介绍的拾音方法实施例中的部分或全部流程。
    本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。
    需要说明的是,在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详细描述的部分,可以参见其他实施例的相关描述。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明实施例所必须的。
    本发明实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。
    本发明实施例终端中的单元可以根据实际需要进行合并、划分和删减。
    本发明实施例中所述单元,可以通过通用集成电路,例如CPU(Central Processing Unit,中央处理器),或通过ASIC(Application Specific Integrated Circuit,专用集成电路)来实现。
    以上对本发明实施例所提供的拾音方法进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

    关 键  词:
    一种 方法
      专利查询网所有文档均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    0条评论

    还可以输入200字符

    暂无评论,赶快抢占沙发吧。

    关于本文
    本文标题:一种拾音方法.pdf
    链接地址:https://www.zhuanlichaxun.net/p-4745947.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
    经营许可证编号:粤ICP备2021068784号-1