说话人核实装置.pdf

上传人：000****221

文档编号：299512

上传时间：2018-02-07

格式：PDF

页数：17

大小：788.23KB

《说话人核实装置.pdf》由会员分享，可在线阅读，更多相关《说话人核实装置.pdf（17页完整版）》请在专利查询网上搜索。

本发明提供一种说话人核实装置。当注册或核实说话人时，供给部件(5)输出一个干扰声音信号，使扬声器(8)发出干扰声音。在输入到送话器(1)的声音中，消除部件(3，9)消除反馈到送话器(1)的干扰声音所对应的分量。核对部件(4)使用已消除了干扰声音所对应分量的声音，注册或核实说话人。。

摘要
申请专利号：	CN03121473.8	申请日：	2003.03.28
公开号：	CN1521730A	公开日：	2004.08.18
当前法律状态：	终止	有效性：	无权
法律详情：	专利权的终止(未缴年费专利权终止)授权公告日：2006.3.15\|\|\|授权\|\|\|实质审查的生效\|\|\|公开
IPC分类号：	G10L17/00; G09C1/00	主分类号：	G10L17/00; G09C1/00
申请人：	株式会社东芝;
发明人：	井阪岳彦; 三关公生
地址：	日本东京都
优先权：	2003.02.10 JP 032034/2003
专利代理机构：	北京市中咨律师事务所	代理人：	于静;李峥
PDF完整版下载：	PDF下载

内容摘要

本发明提供一种说话人核实装置。当注册或核实说话人时，供给部件(5)输出一个干扰声音信号，使扬声器(8)发出干扰声音。在输入到送话器(1)的声音中，消除部件(3，9)消除反馈到送话器(1)的干扰声音所对应的分量。核对部件(4)使用已消除了干扰声音所对应分量的声音，注册或核实说话人。

权利要求书

1：一种说话人核实装置，其特点在于它包含：送话器(1)；扬声器(8)，其安排方式使扬声器(8)发出的声音反馈给送话器(1)；消除部件(3，9)，配置成在送话器(1)的输出信号中消除由扬声器(8)发出并反馈给送话器(1)的声音所对应的分量；注册部件(4)，配置成在注册方式下记录消除部件(3，9) 的输出信号；核对部件(4)，配置成在核实方式下将消除部件(3，9)的输出信号与注册部件(4)中注册的信号进行核对；以及供给部件(5)，配置成在注册方式或核实方式下向扬声器(8) 供给一个干扰声音信号。
2：根据权利要求1的说话人核实装置，其特点在于供给部件 (5)向扬声器(8)供给一个信号作为干扰声音信号，以使扬声器(8)输出连续声音。
3：根据权利要求1的说话人核实装置，其特点在于供给部件 (5)改变作为干扰声音信号输出的信号。
4：根据权利要求1的说话人核实装置，其特点在于进一步包含一个停止部件(12，13)，配置成当扬声器(8)发出的声音满足特定停止条件时停止注册部件(4)的操作和核对部件(4)的操作。
5：根据权利要求4的说话人核实装置，其特点在于：当输入到扬声器(8)的信号和从送话器(1)输出的信号之间的水平差等于或大于特定值时，停止部件(12)停止注册部件(4)的操作和核对部件(4)的操作。
6：根据权利要求4的说话人核实装置，其特点在于：当由消除部件(3，9)产生的消除量等于或小于特定量时，停止部件(13) 停止注册部件(4)的操作和核对部件(4)的操作。
7：一种说话人核实装置(100)，其特点在于它包含：接收部件(14)，配置成接收话音通信终端(300)经由通信信道(200)传送的信号；注册部件(4)，配置成在注册方式下注册从接收部件(14) 接收的信号中提取出的特征量；核对部件(4)，配置成在核实方式下将从接收部件(14)接收的信号中提取的特征量与在注册部件(4)中注册的特征量进行核对；以及发送部件(14)，配置成在注册方式或核实方式下经由通信信道(200)向话音通信终端(300)发送干扰声音信号。
8：根据权利要求7的说话人核实装置(100)，其特点在于发送部件(14)发送一个信号作为干扰声音信号，以使扬声器(8) 输出连续声音。
9：根据权利要求7的说话人核实装置(100)，其特点在于发送部件(14)改变作为干扰声音信号发送的信号。
10：根据权利要求7的说话人核实装置(100)，其特点在于进一步包含一个停止部件(12，13)，配置成当涉及话音通信终端(300)中所接收声音的输出状态的特定停止条件被满足时停止注册部件(4)的操作和核对部件(4)的操作。
11：一种说话人核实装置，其特点在于它包含：送话器(1)；扬声器(8)，其安排方式使扬声器(8)发出的声音反馈给送话器(1)；消除部件(3，9)，配置成在送话器(1)的输出信号中消除由扬声器(8)发出并反馈给送话器(1)的声音所对应的分量；注册部件(4)，配置成在注册方式下注册从消除部件(3，9) 的输出信号中提取的特征量；核对部件(4)，配置成在核实方式下将从消除部件(3，9) 的输出信号中提取的特征量与注册部件(4)中注册的特征量进行核对；以及供给部件(5)，配置成在注册方式或核实方式下向扬声器(8) 供给一个干扰声音信号。

说明书

说话人核实装置
    【技术领域】

    本发明涉及一种说话人核实装置，它根据说话人的话音将说话人与注册的说话人进行核对。

    背景技术

    将先前注册的话音信号与新输入的话音信号进行核对已在日本专利申请公开出版物2000-59501号中公开说明。

    然而，利用这种技术，当以某种方式把已证实的说话人的话音记录下来之后，有可能由另一个人使用所记录的话音进行诈称。

    使用具有代表出现日期等的特殊频谱的话音频带信号以防止窃听者进行非法活动的技术已在日本专利申请公开出版物10-107790号中公开说明。

    然而，利用这种技术，必须产生复杂的话音频带信号，它包括关于出现日期等信息并且被加密以免被非法解码。再有，必须根据这样的话音频带信号进行复杂的处理以确定是否错误地使用了窃听到的话音信号。结果，使用这种技术的装置有很多复杂的结构配置。

    【发明内容】

    因此，本发明的一个目的是提供一种简单的结构配置，它有可能降低使用窃听的或记录的话音进行诈称的可能性。

    根据本发明的一个方面，提供了一种说话人核实装置，包含：送话器；扬声器，其中安排方式使扬声器发出的声音反馈给送话器；消除部件，配置成在送话器输出信号中消除由扬声器发出并反馈给送话器的声音所对应的分量；注册部件，配置成在注册方式下记录消除部件地输出信号；核对部件，配置成在核实方式下将消除部件的输出信号与注册部件中记录的信号进行核对；以及供给部件，配置成在记录方式或核实方式下向扬声器供给一个干扰声音信号。

    根据本发明的另一方面，提供了一种说话人核实装置，包含：接收部件，配置成接收话音通信终端经由通信信道传送的信号；注册部件，配置成在注册方式下注册由接收部件接收的信号；核对部件，配置成在核实方式下将接收部件接收的信号与在注册部件中注册的信号进行核对；以及发送部件，配置成在注册方式或核实方式下经通信信道向话音通信终端发送干扰声音信号。

    在下文的描述中将列出本发明的其他目的和优点，这些目的和优点可部分地从本描述中看出，或可通过本发明的实践学习到。本发明的目的和优点可以借助下文中具体指出的手段和组合来实现。

    【附图说明】

    附图在这里被纳入作为本说明的一部分，说明本发明的实施例，并与上文给出的一般描述和下文给出的实施例详细描述一起用于解释本发明的原理。

    图1是方框图，显示根据本发明第一实施例的说话人核实装置的配置；

    图2是流程图，显示图1的控制部分中进行的过程；

    图3是方框图，显示根据本发明第二实施例的说话人核实装置的配置；

    图4是流程图，显示图3的控制部分12中进行的过程；

    图5是方框图，显示根据本发明第三实施例的说话人核实装置的配置；

    图6是流程图，显示图5的控制部分13中进行的过程；以及

    图7是方框图，显示根据本发明第四实施例的说话人核实装置的配置。

    【具体实施方式】

    下文中将参考附图解释本发明的实施例。

    (第一实施例)

    图1是根据本发明第一实施例的说话人核实装置的配置方框图。

    如图1中所示，根据本发明第一实施例的说话人核实装置包含送话器1、A/D转换器2、减法器3、说话人核实部分4、声音源部分5、加法器6、D/A转换器7、扬声器8、回声消除器(EC)9以及控制部分10。

    送话器1输出与围围声音，如说话人给出的话音相对应的音频信号。A/D转换器2数字化由送话器1输出的音频信号。由A/D转换器2输出的音频信号输入到减法器3。

    从回声消除器9输出的抑制信号也被输入到减法器3。减法器3从A/D转换器2输出的音频信号中减掉此抑制信号。

    说话人核实部分4有注册方式和核实方式。在注册方式下，说话人核实部分4从减法器3输出的音频信号中提取一个代表个性的特征量并注册该特征量。在核实方式下，说话人核实部分4从减法器3输出的音频信号中提取一个代表个性的特征量并根据提取出的特征量和已经注册的特征量对说话人进行核实。对说话人进行核实的详细技术已在例如Furui的“数字话音处理”第9章扬声器识别(Tokai大学出版社，1985)中描述。

    声音源部分5输出干扰声音信息。干扰声音信息被输入到加法器6。一个音频信号也被输入到加法器6。该音频信号是经由例如通信信道到达的。另一种作法是，该音频信号是由说话人核实装置内置的或外部提供的声音源(未画出)输出的。加法器6把输入的音频信号与干扰声音信息相加。

    D/A转换器7把加法器6输出的音频信号转换成模拟信号。扬声器8根据D/A转换器7输出的音频信号发出声音。扬声器8被安排成使发出的声音反馈给送话器1。

    回声消除器9根据减法器3输出的音频信号和加法器6输出的音频信号学习扬声器8与送话器1的声耦合特性。回声消除器3将根据声耦合特性确定的系数与加法器6输出的音频信号进行卷积处理，从而产生抑制信号。

    控制部分10包括例如一台计算机，控制部分10控制说话人核实部分4、声源部分5和回声消除器9的操作。

    接下来将解释如上述配置的说话人核实部分的操作。

    图2是控制部分10的处理过程流程图。

    当从例如一个输入部分(未画出)输入说话人注册开始指令或说话人核实开始指令时，控制部分10开始进行图2中所示过程。然后，在步骤ST1中控制部分10启动声源部分5。然后，声源部分5开始输出干扰声音信息。在加法器6处该干扰声音信息与另一音频信号叠加。所造成的信号在D/A转换器7处转换成模拟信号。该模拟信号被输入扬声器8。结果，从扬声器8发出加上干扰声音的信号。

    从扬声器8发出的干扰声音的内容可以是任意的。希望扬声器8会连续发出干扰声音，其声音水平要允许干扰声音可靠地反馈给送话器1。例如，可以使用音乐作为干扰声音。为防止干扰声音被记录、分析和确定，希望声源部分5能以指定计时间隔改变干扰声音。指定计时可以是控制部分10启动声源部分5的各时刻或者是规则时间间隔。

    然后，在步骤ST2中，控制部分10启动说话人核实部分4。在这时，如果说话人得要被注册，则说话人核这部分4被设置成注册方式。如果说话人得要被核实，则说话人核实部分4被设置成核实方式。

    然后，说话人在送话器1上说出一个词供注册或核实。在此时，由于扬声器8发出的干扰声音被反馈给送话器1，所以在送话器1输出的音频信号中包括对应于干扰声音的分量。从送话器1输出的模拟音频信号在A/D转换器2处转换成数字信号。该数字信号被输入到减法器3。减法器3和回声消除器9工作以抵消A/D转换器2输出的音频信号中的干扰信号分量。

    当说话人核实部分4被启动并被设置成注册方式时，它从减法器3输出的音频信号中提取代表个性的特征量并注册该特征量。结果，说话人的特征量被注册在说话人核实部分4中。在注册的特征量中，干扰声音已如上述被消除了。

    当说话人核实部分4被启动并被设置成核实方式时，它从减法器3输出的音频信号中提取代表个性的特征量并将该特征量与已经被注册的特征量进行比较，从而将现在的说话人与注册的说话人进行核对。

    当控制部分10启动说话人核实部分4之后，在步骤ST3中控制部分10等待完成说话人注册或说话人核实。在说话人注册或说话人核实已经完成之后，在步骤ST4控制部分10停止说话人核实部分4。然后，在步骤ST5中控制部分10停止声源部分5。

    说话人核实装置可以提供于移动电话终端中。在这种情况中，在移动电话终端中提供的回声消除器可以用做回声消除器9。然而，在移动电话终端中，回声消除器可以被设计成允许用户确定是否启动该回声消除器。如果该回声消除器被禁止，则说话人核实装置不能适当地操作。万一发生这种情况，控制部分10在说话人注册或说话人核实的时候迫使回声消除器9启动。

    如上所述，在第一实施例中当说话人说出一个词供说话人注册或说话人核实时，从扬声器8发出干扰声音。所以，即使在说话人附近的某人窃听或记录由说话人给出的话音，干扰声音也与说话人的话音一起被记录下来。在说话人核实部分4中，从消除干扰声音后的话音中提取出的特征量被注册。如果在说话人核实时向送话器1输入窃听或记录到的话音，减法器3消除的仅是在那个时候由扬声器8新发出的干扰声音，不是与该话音一起记录的干扰声音。结果，从减法器3的输出信号中提取出的特征量与说话人核实部分4中注册的特征量不符合。

    由于使用回声消除器9消除干扰声音，所以干扰声音不需要是特殊的声音。说话人核实只由比较特征量便能完成，所以是由一个简单过程来实现。

    使用连续的声音作为干扰声音使得更难于把说话人的话音和干扰声音区分开。结果，难于从窃听和记录的话音中提取出说话人的话音，这可以防止这类非法活动。

    再有，以指定时间间隔改变干扰声音的内容使得难于确定干扰声音，即使通过重复窃听和记录来存储音频信号也难于确定干扰声音。结果，难于从窃听和记录的话音中提取出说话人的话音，这可以防止这类非法活动。

    (第二实施例)

    图3是根据本发明第二实施例的说话人核实装置的配置方框图。在图3中，与图1中相同的部件使用相同的参考数字指示，对它们的详细解释将被略去。

    如图3中所示，根据第二实施例的说话人核实装置包含送话器1、A/D转换器2、减法器3、说话人核实部分4、声源部分5、加法器6、D/A转换器7、扬声器8、回声消除器(EC)9、水平差测量部分11以及控制部分12。就是说，第二实施例的说话人核实装置与第一实施例的说话人核实装置的不同之处在于使用控制部分12代替控制部分10并增加了水平差测量部分11。

    水平差测量部分11测量送话器1输出的音频信号与输入到扬声器8的音频信号之间的差值。水平差测量部分11向控制部分12通告测量到的值。由水平差测量部分11测量的水平差可以是A/D转换器2的输出信号与加法器6的输出信号之间的水平差。

    控制部分12包括例如一台计算机，控制部分12控制说话人核实部分4、声源部分5以及回声消除器9的操作，并且在控制中考虑由水平差测量部分11通告的测量值。

    现在将解释如上述配置的说话人核实装置的操作。

    图4是图3中的控制部分12的处理过程流程图。与图2中完成的处理相同的处理用相同的参考数字指示。对它们的详细解释将被略去。

    在第二实施例中，总是由水平差测量部分11测量送话器1输出的音频信号与输入到扬声器8的音频信号之间的水平差。在等待完成说话人注册或说话人核实的同时，在步骤ST11控制部分12确定测量值是否已超过一个特定门限值。如果测量值已超过该特定门限值，则控制部分12把控制传到步骤ST4，即使说话人注册或说话人核实尚未完成也要这样做。在第二实施例的说话人核实装置中的其余操作与第一实施例的说话人核实装置中的操作相同。

    如上所述，第二实施例产生与第一实施例相同的效果。此外，利用第二实施例，当送话器1输出的音频信号和输入到扬声器8的音频信号之间的水平差变得异常大时，说话人注册或说话人核实被强迫停止。就是说，当由于某种故障使得音频信号不能输入扬声器8和干扰信号不能发出时，将不进行说话人注册或说话人核实。这可防止在上述场合说话人的话音被窃听和记录。

    (第三实施例)

    图5是根据本发明第三实施例的说话人核实装置的配置方框图。在图5中，与图1中相同的部件使用相同的参考数字指示，对它们的详细解释将被略去。

    如图5中所示，根据第三实施例的说话人核实装置包含送话器1、A/D转换器2、减法器3、说话人核实部分4、声源部分5、加法器6、D/A转换器7、扬声器8、回声消除器(EC)9以及控制部分13。就是说，第三实施例的说话人核实装置与第一实施例的说话人核实装置的不同之处在于使用控制部分13代替控制部分10。

    控制部分13包括例如一台计算机，控制部分13控制说话人核实部分4、声源部分5以及回声消除器9的操作，并且在控制中考虑回声消除器9输出的抑制信号。

    现在将解释如上述配置的说话人核实装置的操作。

    图6是图5中的控制部分13的处理过程流程图。与图2中完成的处理相同的处理用相同的参考数字指示，对它们的详细解释将被略去。

    在第三实施例中，在等待完成说话人注册或说话人核实的同时，在步骤ST21控制部分13确定在减法器3处减去的消除量是否等于或小于一个特定门限值。控制部分13根据回声消除器9输出的抑制信号确定该消除量。如果消除量变得等于或小于该特定门限值，则控制部分13把控制传到步骤ST4，即使说话人注册或说话人核实尚未完成也要这样做。在第三实施例的说话人核实装置中的其余操作与第一实施例的说话人核实装置中的操作相同。

    消除量可以是加法器6的输出信号与减法器3的输出信号之间的水平差。

    如上所述，第三实施例产生与第一实施例相同的效果。此外，利用第三实施例，当消除量变得异常小时，说话人注册或说话人核实被强迫停止。就是说，当由于某种故障使得扬声器8发出的干扰声音不能足够地反馈给送话器1时，将不进行说话人注册或说话人核实。这可防止在上述场合说话人的话音被窃听和记录。

    (第四实施例)

    图7是根据本发明第四实施例的说话人核实装置的配置方框图。在图7中，与图1中相同的部件使用相同的参考数字指示，对它们的详细解释将被略去。

    在图7中，数字100指示第四实施例的说话人核实装置。说话人核实装置100核实经由通信信道连接的话音通信终端300的说话人。通信信道200可以是专用信道或在公共网络中提供的信道。

    如图7中所示，说话人核实装置100包含说话人核实部分4、声源部分5、加法器6、控制部分10以及通信部分14。

    通信部分14经由通信信道200与话音通信终端300进行通信。

    话音通信终端300包括送话器21、A/D转换器22、减法器23、通信部分24、D/A转换器25、扬声器26、回声消除器(EC)27以及控制部分28。

    送话器21、A/D转换器22、减法器23、D/A转换器25、扬声器26以及回声消除器(EC)27的操作方式分别与第一实施例中的送话器1、A/D转换器2、减法器3、D/A转换器7、扬声器8以及回声消除器9的操作方式相同。

    通信部分24经由通信信道200与说话人核实装置100通信。

    可以向通信部分14、24提供编码和解码部分，用于对音频信号编码和解码。

    控制部分28控制回声消除器27的操作。

    如上所述，在说话人核实装置100中，加法器6把干扰声音加到音频信号上，然后通信部分14把结果音频信号传送给通信信道200，从而使话音通信终端300的扬声器26可以发出音频信号作为所收到的话音。再有，通信部分14接收从话音通信终端300向通信信道200发送的音频信号，这里从扬声器26向送话器21的反馈已被抵消。说话人核实部分4使用由通信部分14接收的音频信号对说话人进行注册或核实。由第一实施例的说话人核实装置进行的各种操作当中，干扰声音发送、说话人话音和干扰声音的输入以及干扰声音的消除都由话音通信终端300进行。

    所以，第四实施例产生与第一实施例相同的效果。此外，第四实施例使得有可能在远处核实说话人。这样，当银行等提供家庭银行服务时，服务中心能核实用户。

    本发明不限于上述实施例。例如，当在第二和第三实施例中说话人注册或说话人核实被强迫停止时，希望能通过在指示器上显示消息或给出有声消息把这一事实通告说话人和装置操作员。通过这样做，使说话人或装置操作员立即认识到这异常现象。结果，说话人能立刻停止说话。再有，装置操作员能采取必要的步骤，如修理该说话人核实装置。

    在第二和第三实施例中，当说话人注册或说话人核实被强迫停止时，控制可自动切换到诸如指纹匹配装置或由操作员证实等个人证实手段。

    在第二和第三实施例中，可以任意地改变强迫停止说话人注册或说话人核实的条件。例如，可由操作员给出一个指令。

    在第四实施例中，可以如在第二和第三实施例中那样监视干扰声音的输出状态，并且当发生异常情况时可以强迫停止说话人注册或说话人核实。

    对于本领域技术人员，可以容易地产生其他好处和修改。所以，本发明在其更广泛的方面不限于这里显示和描述的特定细节和代表性的实施例。因此，可以进行各种修改而不脱离由所附权利要求及其等效物定义的本发明一般要领的精神或范围。