《使用历史数据对联系信息的消歧.pdf》由会员分享,可在线阅读,更多相关《使用历史数据对联系信息的消歧.pdf(23页完整版)》请在专利查询网上搜索。
1、(10)申请公布号 CN 103039064 A (43)申请公布日 2013.04.10 CN 103039064 A *CN103039064A* (21)申请号 201180024739.0 (22)申请日 2011.05.18 12/782,862 2010.05.19 US H04M 1/27(2006.01) (71)申请人 谷歌公司 地址 美国加利福尼亚州 (72)发明人 马修I劳埃德 维拉德范图亚尔鲁施二世 (74)专利代理机构 中原信达知识产权代理有限 责任公司 11219 代理人 周亚荣 安翔 (54) 发明名称 使用历史数据对联系信息的消歧 (57) 摘要 用于对联系信息。
2、进行消歧的方法、 系统和装 置, 包括编码在计算机存储介质上的计算机程序。 方法包括 : 接收音频信号 ; 基于用户先前已与和 联系信息项相关联的联系人通信的频率, 并且进 一步基于在用户和与联系信息项相关联的联系人 之间的一个或多个过去交互的新近性, 生成亲密 度分值 ; 基于为联系信息项生成的亲密度分值来 推断用户意在使用联系信息项来发起通信的概 率 ; 以及生成通信发起语法。基本思想 : 通过在执 行话音识别过程时考虑带有呼叫接收者或呼叫目 的地的呼叫历史的话音识别来发起呼叫的改进的 方法。 (30)优先权数据 (85)PCT申请进入国家阶段日 2012.11.19 (86)PCT申请的。
3、申请数据 PCT/US2011/036984 2011.05.18 (87)PCT申请的公布数据 WO2011/146605 EN 2011.11.24 (51)Int.Cl. 权利要求书 4 页 说明书 15 页 附图 3 页 (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书 4 页 说明书 15 页 附图 3 页 1/4 页 2 1. 一种系统, 包括 : 一个或多个计算机 ; 以及 耦接到所述一个或多个计算机的计算机可读介质, 所述计算机可读介质上存储有指 令, 所述指令当由所述一个或多个计算机执行时促使所述一个或多个计算机执行操作, 所 述操作包括 : 接收音频信。
4、号 ; 对于两个或更多个联系信息项中的每一个, 基于用户先前已与和该联系信息项相关联 的联系人通信的频率, 并且进一步基于在所述用户和与该联系信息项相关联的所述联系人 之间的一个或多个过去交互的新近性, 生成亲密度分值 ; 对于所述联系信息项中的每一个, 基于为该联系信息项生成的亲密度分值推断所述用 户意在使用该联系信息项来发起通信的概率 ; 生成包括与所述联系信息项中的每一个相关联的一个或多个转换的通信发起语法, 其 中, 对于所述联系信息项中的每一个, 根据为该联系信息项推断的概率对与该联系信息项 相关联的所述一个或多个转换赋予权重 ; 使用所述通信发起语法来对所述音频信号执行语音识别以选。
5、择特定联系信息项 ; 以及 使用所述特定联系信息项来发起所述通信。 2. 根据权利要求 1 所述的系统, 其中基于用户先前已与和该联系信息项相关联的联系 人通信的频率来生成亲密度分值进一步包括 : 确定所述用户已接受了已拨打了所述联系人的话音拨打语音识别的结果的频率 ; 以及 基于所述用户已接受了所述话音拨打语音识别的所述结果的所述频率来递增所述亲 密度分值。 3. 根据权利要求 1 所述的系统, 其中基于用户先前已与和该联系信息项相关联的联系 人通信的频率来生成亲密度分值进一步包括 : 确定所述用户已手动拨打了所述联系人的频率 ; 以及 基于所述用户已手动拨打了所述联系人的所述频率来递增所述。
6、亲密度分值。 4. 根据权利要求 1 所述的系统, 其中基于用户先前已与和该联系信息项相关联的联系 人通信的频率来生成亲密度分值进一步包括 : 确定所述用户已向所述联系人发送了短消息服务 (SMS) 消息或已从所述联系人接收了 SMS 消息的频率 ; 以及 基于所述用户已向所述联系人发送了SMS消息或已从所述联系人接收了SMS消息的所 述频率来递增所述亲密度分值。 5. 根据权利要求 1 所述的系统, 其中基于用户先前已与和该联系信息项相关联的联系 人通信的频率来生成亲密度分值进一步包括 : 确定所述用户已向所述联系人发送了电子邮件消息或已从所述联系人接收了电子邮 件消息的频率 ; 以及 基于。
7、所述用户已向所述联系人发送了电子邮件消息或已从所述联系人接收了电子邮 件消息的所述频率来递增所述亲密度分值。 6. 根据权利要求 1 所述的系统, 其中基于在所述用户和与该联系信息项相关联的所述 联系人之间的一个或多个过去交互的新近性来生成亲密度分值进一步包括 : 权 利 要 求 书 CN 103039064 A 2 2/4 页 3 确定所述联系人在预先确定的时段内已被添加到所述用户的地址簿 ; 以及 基于确定所述联系人在预先确定的时段内已被添加到所述用户的所述地址簿来递增 所述亲密度分值。 7. 根据权利要求 1 所述的系统, 其中 : 所述操作进一步包括 : 接收引用与所述用户相关联的当前。
8、语境的数据 ; 对于在所述用户和所述联系人之间的两个或更多个过去交互中的每一个, 接收引用与 该过去交互相关联的语境的数据 ; 将与所述用户相关联的所述当前语境和与所述过去交互相关联的所述语境进行比较 ; 以及 基于将与所述用户相关联的所述当前语境和与所述过去交互相关联的所述语境进行 比较来选择所述两个或更多个过去交互的子集 ; 以及 所述亲密度分值仅使用所述过去交互的所述子集来生成。 8. 根据权利要求 1 所述的系统, 其中, 对于两个或更多个联系信息项中的每一个, 基于 用户先前已与和该联系信息项相关联的联系人通信的频率生成亲密度分值进一步包括 : 基于用户先前使用第一通信信道已与和该联。
9、系信息项相关联的联系人通信的频率来 生成第一部分亲密度分值 ; 基于所述用户先前使用第二通信信道已与和该联系信息项相关联的所述联系人通信 的频率来生成第二部分亲密度分值 ; 为所述第一部分亲密度分值和所述第二部分亲密度分值赋予权重 ; 以及 将赋予权重的所述第一部分亲密度分值与赋予权重的所述第二部分亲密度分值相组 合来生成所述亲密度分值。 9. 根据权利要求 1 所述的系统, 其中, 对于两个或更多个联系信息项中的每一个, 基于 在所述用户和与该联系信息项相关联的所述联系人之间的一个或多个过去交互的新近性 生成亲密度分值进一步包括 : 将指数衰减函数应用到当发生了在所述用户和与该联系信息项相关。
10、联的所述联系人 之间的所述一个或多个过去交互时引用的数据。 10. 根据权利要求 1 所述的系统, 其中, 对于两个或更多个联系信息项中的每一个, 基 于在所述用户和与该联系信息项相关联的所述联系人之间的一个或多个过去交互的新近 性生成亲密度分值进一步包括 : 选择已在预先确定的时段内发生的所述一个或多个过去交互的子集。 11. 一种计算机实现的方法, 包括 : 接收音频信号 ; 对于两个或更多个联系信息项中的每一个, 基于用户先前已与和该联系信息项相关联 的联系人通信的频率, 并且进一步基于在所述用户和与该联系信息项相关联的所述联系人 之间的一个或多个过去交互的新近性, 生成亲密度分值 ; 。
11、对于所述联系信息项中的每一个, 基于为该联系信息项生成的所述亲密度分值推断所 述用户意在使用该联系信息项来发起通信的概率 ; 生成包括与所述联系信息项中的每一个相关联的一个或多个转换的通信发起语法, 其 权 利 要 求 书 CN 103039064 A 3 3/4 页 4 中, 对于所述联系信息项中的每一个, 根据为该联系信息项推断的概率为与该联系信息项 相关联的所述一个或多个转换赋予权重 ; 使用所述通信发起语法来对所述音频信号执行语音识别以选择特定联系信息项 ; 以及 使用所述特定联系信息项来发起所述通信。 12. 一种编码有计算机程序的计算机存储介质, 所述程序包括当由一个或多个计算机 。
12、执行时促使所述一个或多个计算机执行操作的指令, 所述操作包括 : 接收音频信号 ; 对于两个或更多个联系信息项中的每一个, 基于用户先前已与和该联系信息项相关联 的联系人通信的频率, 并且进一步基于在所述用户和与该联系信息项相关联的所述联系人 之间的一个或多个过去交互的新近性, 生成亲密度分值 ; 对于所述联系信息项中的每一个, 基于为该联系信息项生成的所述亲密度分值推断所 述用户意在使用该联系信息项来发起通信的概率 ; 生成包括与所述联系信息项中的每一个相关联的一个或多个转换的通信发起语法, 其 中, 对于所述联系信息项中的每一个, 根据为该联系信息项推断的概率为与该联系信息项 相关联的所述。
13、一个或多个转换赋予权重 ; 使用所述通信发起语法来对所述音频信号执行语音识别以选择特定联系信息项 ; 以及 使用所述特定联系信息项来发起所述通信。 13. 根据权利要求 12 所述的计算机存储介质, 其中基于用户先前已与和该联系信息项 相关联的联系人通信的频率来生成亲密度分值进一步包括 : 确定所述用户已接受了已拨打了所述联系人的话音拨打语音识别的结果的频率 ; 以及 基于所述用户已接受了所述话音拨打语音识别的所述结果的所述频率来递增所述亲 密度分值。 14. 根据权利要求 12 所述的计算机存储介质, 其中基于用户先前已与和该联系信息项 相关联的联系人通信的频率来生成亲密度分值进一步包括 :。
14、 确定所述用户已手动拨打了所述联系人的频率 ; 以及 基于所述用户已手动拨打了所述联系人的所述频率来递增所述亲密度分值。 15. 根据权利要求 12 所述的计算机存储介质, 其中基于用户先前已与和该联系信息项 相关联的联系人通信的频率来生成亲密度分值进一步包括 : 确定所述用户已向所述联系人发送了短消息服务 (SMS) 消息或已从所述联系人接收了 SMS 消息的频率 ; 以及 基于所述用户已向所述联系人发送了SMS消息或已从所述联系人接收了SMS消息的所 述频率来递增所述亲密度分值。 16. 根据权利要求 12 所述的计算机存储介质, 其中基于用户先前已与和该联系信息项 相关联的联系人通信的频。
15、率来生成亲密度分值进一步包括 : 确定所述用户已向所述联系人发送了电子邮件消息或已从所述联系人接收了电子邮 件消息的频率 ; 以及 基于所述用户已向所述联系人发送了电子邮件消息或已从所述联系人接收了电子邮 件消息的所述频率来递增所述亲密度分值。 17. 根据权利要求 12 所述的计算机存储介质, 其中基于在所述用户和与该联系信息 权 利 要 求 书 CN 103039064 A 4 4/4 页 5 项相关联的所述联系人之间的一个或多个过去交互的新近性来生成亲密度分值进一步包 括 : 确定所述联系人在预先确定的时段内已被添加到所述用户的地址簿 ; 以及 基于确定所述联系人在预先确定的时段内已被添。
16、加到所述用户的所述地址簿来递增 所述亲密度分值。 18. 根据权利要求 12 所述的计算机存储介质, 其中 : 所述操作进一步包括 : 接收引用与所述用户相关联的当前语境的数据 ; 对于在所述用户和所述联系人之间的两个或更多个过去交互中的每一个, 接收引用与 该过去交互相关联的语境的数据 ; 将与所述用户相关联的所述当前语境和与所述过去交互相关联的所述语境进行比较 ; 以及 基于将与所述用户相关联的所述当前语境和与所述过去交互相关联的所述语境进行 比较来选择所述两个或更多个过去交互的子集 ; 以及 所述亲密度分值仅使用所述过去交互的所述子集来生成。 19. 根据权利要求 12 所述的计算机存储。
17、介质, 其中, 对于两个或更多个联系信息项中 的每一个, 基于用户先前已与和该联系信息项相关联的联系人通信的频率生成亲密度分值 进一步包括 : 基于用户先前使用第一通信信道已与和该联系信息项相关联的联系人通信的频率来 生成第一部分亲密度分值 ; 基于所述用户先前使用第二通信信道已与和该联系信息项相关联的所述联系人通信 的频率来生成第二部分亲密度分值 ; 为所述第一部分亲密度分值和所述第二部分亲密度分值赋予权重 ; 以及 将赋予权重的所述第一部分亲密度分值与赋予权重的所述第二部分亲密度分值相组 合来生成所述亲密度分值。 20. 根据权利要求 12 所述的计算机存储介质, 其中, 对于两个或更多个。
18、联系信息项中 的每一个, 基于在所述用户和与该联系信息项相关联的所述联系人之间的一个或多个过去 交互的新近性生成亲密度分值进一步包括 : 将指数衰减函数应用到当发生了在所述用户和与该联系信息项相关联的所述联系人 之间的所述一个或多个过去交互时引用的数据。 权 利 要 求 书 CN 103039064 A 5 1/15 页 6 使用历史数据对联系信息的消歧 0001 相关申请的交叉引用 0002 本 申 请 要 求 于 2010 年 5 月 19 日 提 交 的、 题 为 DISAMBIGUATIONOF CONTACT INFORMATION USING HISTORICAL DATA的美国申。
19、请序列号No.12/782,862的优先权, 通过引 用将其公开合并入本文中。 技术领域 0003 本说明书涉及语音识别。 背景技术 0004 移动设备的用户可以通过例如在键盘上打字或对麦克风讲话来提供输入。 当用户 试图使用话音拨号来发起电话呼叫时, 如果不同联系人具有相似发音的名字、 或如果用户 未能指定与联系人相关联的特定地址或位置, 则移动设备可能拨打错误的联系人。 发明内容 0005 当移动设备的用户讲出联系人的名字来发起与另一个人的通信时, 他们的话语一 般必须在至少两个方面被消歧。 在被本说明书称为 “识别质量” 方面的第一方面的消歧涉及 将话语的声音与讲话者可能已讲出的词语进行。
20、匹配。在一个示例中, 在识别质量方面的消 歧可以涉及当讲话者讲出在语音上被转录为 “呼叫 pill” 的话语时, 确定他们意在说出 “呼 叫 Bill(比尔) ” 还是 “呼叫 Phil(菲尔) ” 。 0006 在被本说明书称为 “讲话者意图” 方面的第二方面的消歧涉及当讲话者讲出话语 时确定讲话者可能的意图。例如, 如果假设讲话者已讲出了词语 “呼叫 Bill” , 则在讲话者 意图方面的消歧可以涉及确定用户意在呼叫名为 “Bill” 的多个联系人中的哪个、 或讲话者 可能意在 “呼叫” 在家还是工作中名为 “Bill” 的特定联系人。 0007 自动语音识别 ( “ASR” ) 引擎可以。
21、使用包括在节点之间的赋予权重的转换的语法, 诸如话音拨号语法 (或更一般地,“通信发起语法” ) 来在识别质量方面和讲话者意图方面两 者使话语消歧。对两个上面的示例进行组合, 并且在缺乏其他语境的情况下, 当话语 “呼叫 pill” 被讲出时, ASR 引擎可以使用通信发起语法来确定用户意在 “呼叫在家的 Bill” 还是 “呼叫在他的小区的 Phil” 。 0008 因此, 在本说明书中描述的主题的一个有创新性的方面可以在包括以下动作的方 法中具体化 : 估计用户意在或使用特定联系信息项发起与特定联系人的通信的概率。概率 可以基于以下来估计 : 在用户和特定联系人之间的过去交互 ; 用来发起。
22、与联系人的通信的 特定联系信息项的过去使用。 使用估计的概率来对在通信发起语法中的与特定联系人或与 特定联系信息相关联的转换的权重进行修改。 0009 最初, 如本说明书所使用的,“联系信息” (或 “联系信息项” ) 可以是指通信的接收 者或目的地的任何编码或未编码的表示, 诸如电话号码、 电子邮件地址、 物理或寄件地址、 用户名、 个人名字、 账户名称、 屏幕名称、 即时通讯 (IM) 地址、 网站名称或网络地址。 “通信” 说 明 书 CN 103039064 A 6 2/15 页 7 可以是指在两个人类或非人类实体之间的新闻、 观点或信息的任何同步或异步传递或交 换, 诸如消息 (例如。
23、, 电子邮件消息或即时消息) 、 文档 (例如, 电子文件或物理邮件) 或电话 呼叫。 0010 此外,“发起通信” 是指直接或间接开始、 启动、 引起、 生成或起动通信的动作或操 作。 在各种语境下, 发起通信可以包括拨打电话号码、 打开空白或预先写好地址的电子邮件 消息、 或打开即时通讯会话、 或促使计算机执行这些动作。 例如, 在其他语境下, 发起通信包 括指示软件应用执行操作, 所述操作诸如拨打电话号码、 在空白电子邮件消息上写地址、 或 打开与联系人的即时消息会话。当要使用特定联系信息项来发起通信时, 可以将这样的信 息例如作为元数据与用来执行通信发起操作的指令一起传递给软件应用。 。
24、将联系信息项作 为元数据传递消除了用户手动输入联系信息的需要。 0011 与联系人的 “过去交互” 可以包括过去发起或实现的通信、 或与联系人有关的过去 非通信动作。 例如, 当用户发起或完成与联系人的电话呼叫、 或进行持续多于预先确定的持 续时间的电话呼叫时, 可以发生过去交互。替选地, 当用户将联系人添加到地址簿、 或读取 或访问联系人事先准备好的内容、 与关于联系人的第三方通信、 被分配给包括联系人的用 户群、 或被确定为在联系人的物理接近的地方内时, 可以发生过去交互。 0012 总的来说, 在本说明书中描述的主题的另一个有创新性的方面可以在包括以下动 作的方法中具体化 : 接收音频信。
25、号 ; 基于用户先前已与和联系信息项相关联的联系人通信 的频率, 并且进一步, 对于两个或更多个联系信息项中的每一个, 基于在用户和与该联系信 息项相关联的联系人之间的一个或多个过去交互的新近性生成亲密度分值 ; 基于为联系信 息项生成的亲密度分值为联系信息项中的每一个推断用户意在使用联系信息项来发起通 信的概率 ; 生成包括与联系信息项中的每一个相关联的一个或多个转换的通信发起语法, 其中对于联系信息项中的每一个, 根据为该联系信息项推断的概率为与该联系信息项相关 联的一个或多个转换赋予权重 ; 使用通信发起语法来针对音频信号执行语音识别以选择特 定联系信息项 ; 以及使用特定联系信息项来发。
26、起通信。 0013 该方面的其他实施例包括被配置成执行所述方法的动作、 编码在计算机存储设备 上的对应系统、 装置和计算机程序。 0014 这些和其他实施例每一个可以可选地包括下面特征中的一个或多个。例如, 基于 用户先前已与和联系信息项相关联的联系人通信的频率来生成亲密度分值进一步包括确 定用户已接受了已拨打了联系人的话音拨打语音识别的结果的频率, 并且基于用户已接受 了话音拨打语音识别的结果的频率来递增亲密度分值 ; 基于用户先前已与和联系信息项相 关联的联系人通信的频率来生成亲密度分值进一步包括确定用户已手动拨打了联系人的 频率, 并且基于用户已手动拨打了联系人的频率来递增亲密度分值 ;。
27、 基于用户先前已与和 联系信息项相关联的联系人通信的频率来生成亲密度分值进一步包括确定用户已向联系 人发送了短消息服务 (SMS) 消息或已从联系人接收了 SMS 消息的频率, 并且基于用户已向 联系人发送了 SMS 消息或已从联系人接收了 SMS 消息的频率来递增亲密度分值 ; 基于用户 先前已与和联系信息项相关联的联系人通信的频率来生成亲密度分值进一步是确定用户 已向联系人发送了电子邮件消息或已从联系人接收了电子邮件消息的频率, 并且基于用户 已向联系人发送了电子邮件消息或已从联系人接收了电子邮件消息的频率来递增亲密度 分值 ; 基于在用户和与联系信息项相关联的联系人之间的一个或多个过去交。
28、互的新近性来 说 明 书 CN 103039064 A 7 3/15 页 8 生成亲密度分值进一步包括确定联系人在预先确定的时段内已被添加到用户的地址簿, 并 且基于确定联系人在预先确定的时段内已被添加到用户的地址簿来递增亲密度分值 ; 所述 动作包括 : 接收引用与用户相关联的当前语境的数据 ; 对于在用户和联系人之间的两个或 更多个过去交互中的每一个, 接收引用与过去交互相关联的语境的数据 ; 将与用户相关联 的当前语境和与过去交互相关联的语境进行比较 ; 以及基于将与用户相关联的当前语境和 与过去交互相关联的语境进行比较来选择两个或更多个过去交互的子集 ; 仅使用过去交互 的子集来生成亲。
29、密度分值 ; 对于两个或更多个联系信息项中的每一个, 基于用户先前已与 和该联系信息项相关联的联系人通信的频率生成亲密度分值进一步包括 : 基于用户先前使 用第一通信信道已与和该联系信息项相关联的联系人通信的频率来生成第一部分亲密度 分值 ; 基于用户先前使用第二通信信道已与和该联系信息项相关联的联系人通信的频率来 生成第二部分亲密度分值 ; 为第一部分亲密度分值和第二部分亲密度分值赋予权重 ; 以及 将赋予权重的第一部分亲密度分值与赋予权重的第二部分亲密度分值相组合来生成亲密 度分值 ; 对于两个或更多个联系信息项中的每一个, 基于在用户和与该联系信息项相关联 的联系人之间的一个或多个过去交。
30、互的新近性生成亲密度分值进一步包括将指数衰减函 数应用到当在用户和与该联系信息项相关联的联系人之间的一个或多个过去交互发生了 时引用的数据 ; 对于两个或更多个联系信息项中的每一个, 基于在用户和与该联系信息项 相关联的联系人之间的一个或多个过去交互的新近性生成亲密度分值进一步包括选择已 在预先确定的时段内发生的一个或多个过去交互的子集。 0015 可以实现在本说明书中描述的主题的特定实施例来实现下面优势中的一个或多 个。 可以提高话音发起的通信, 诸如话音拨号的准确性, 增强了用户体验并且增加了用户满 意度。可以使用用户的自身过去动作来推断其未来动作, 从而使预测的动作个性化。可以 在服务器。
31、端而不是在客户端设备执行语音识别和其他复杂任务, 以允许增强的过程最优化 并且增加计算效率。 0016 在附图和下面的描述中阐述了在本说明书中描述的主题的一个或多个实施例的 细节。主题的其他潜在特征、 方面和优势从描述、 附图和权利要求将变得显而易见。 附图说明 0017 图 1 是使用历史数据来对话音输入所引用的联系信息进行消歧的示例系统的图。 0018 图 2 是用于对联系信息进行消歧的示例性过程的流程图。 0019 图 3 示出示例用户界面。 0020 在整个附图中, 相同参考数字表示对应部分。 具体实施方式 0021 图1是使用历史数据113来对联系信息进行消歧的示例系统100的图。 。
32、具体地, 系 统 100 包括通过一个或多个网络 104 连接的移动客户端通信设备 ( “客户端设备” ) 101(例 如, 蜂窝电话、 PDA、 个人计算机、 音乐播放器、 平板计算机、 电子书阅读器或其他处理设备) 和服务器 102(例如, ASR 引擎或与搜索引擎相关联的 “语音识别器” 、 或包括一个或多个处 理器 103 的另一个设备) 。图 1 还描绘了状态 (a) 至 (j) , 其示出了当系统 100 执行示例联 系信息消歧过程时发生的数据流。 说 明 书 CN 103039064 A 8 4/15 页 9 0022 通常, 状态 (a) 至 (e) 涉及估计客户端设备 101。
33、 的用户 105 将发起与其联系人列表 111 中的一个或多个联系人的通信 (例如, 将 “话音拨打” 所述联系人) 的概率, 以及状态 (f) 至 (j) 涉及对语音识别器进行调整以使用这些概率来对联系信息进行更准确地消歧。实际 上, 状态 (a) 至 (j) 可以按照所图示的序列发生、 或它们可以按照不同于所图示的序列的序 列发生。 0023 在状态 (a) 期间, 客户端设备 101 的用户 105( “Bob(鲍勃) ” ) 对客户端设备 101 的麦克风讲出话语 106, 以指示运行于客户端设备 101 上的应用发起与在他的联系人列表 中的联系人的通信。话语 106 在语音上被转录为。
34、 “呼叫 pill” 。 0024 取决于诸如背景噪声或用户 105 的口音的变量, 服务器 102 可以将话语 106 解释 为使用与联系人 “Bill” 相关联的多个电话号码中的一个来发起与名为 “Bill” 的联系人 的电话呼叫的话音命令、 或使用与 “Phil” 相关联的多个电话号码中的一个来发起与名为 “Phil” 的联系人的电话呼叫的命令。由于服务器 102 可以生成话语 106 的多个解释或转 录, 所以在服务器102可以执行话音命令之前, 服务器102必须对联系信息进行消歧来推断 用户 105 的意图。 0025 在状态 (b) 期间, 通过网络 104 将数据 107 从客户。
35、端设备 101 通信到服务器 102。 数据 107 可以包括例如对应于话语 106 的音频信号 108 (或 “音频文件” 、“波形” 或 “样本” ) 。 例如, 客户端设备101可以通过记录话语106来创建声音文件或数据流, 并且可以在客户端 设备 101 和服务器 102 之间建立的通信会话期间通过网络 104 发送声音文件。替代发送音 频信号 108 本身, 客户端设备 101 可以将引用音频信号 108 或话语 106 的信息 (例如, 存储 在服务器 102 上的文件的名称、 超链接或与音频信号 108 相关联的唯一标识符) 包括在数据 107 内。 0026 数据 107 还可。
36、以包括唯一地标识用户 105、 或标识用户 105 被分配给的群、 客户端 设备 101、 与客户端设备 101 相关联的类型或与客户端设备 101 的组件 (即, 音频子系统) 相 关联的类型的标识数据109。 标识数据109可以是例如字母数字用户标识符、 或用户105或 客户端设备 101 的名称。 0027 数据 107 还可以包括描述在话语 106 被讲出时与用户 105 或客户端设备 101 相关 联的当前语境的语境数据110。 语境数据110可以包括音频信号, 诸如周围或环境音频的记 录。在各种示例中, 语境数据 110 可以引用话语 106 被讲出、 由客户端设备 101 接收或。
37、传输 的时间和日期 (即 “星期二中午” ) 、 可以引用话语106被讲出时客户端设备101的位置、 可以 引用客户端设备 101 的类型 (即,“移动” ) 或客户端设备 101 实现的音频子系统的类型、 可 以引用在话语 106 被讲出、 由客户端设备 101 接收或传输时客户端设备 101 被对接 (dock) 还是装入套、 可以引用当自动或使用特定联系信息发起与特定联系人的通信时用户 105 是 发起接受动作还是取消动作、 可以引用用户 105 是否从 m- 最佳列表选择话语 106 的替选识 别、 或可以引用客户端设备 101 是否作为到 WiFi 连接的接入。 0028 在状态 (。
38、c) 期间, 服务器 102 使用唯一地标识用户 105 的数据 109 来选择与用户 105 相关联的联系人列表 111、 亲密度数据 112 以及可选地通信发起语法 118。可以从服务 器 102 所存储的多个联系人列表、 亲密度数据集合以及语法中选择与用户 105 相关联的联 系人列表 111、 亲密度数据 112 和语法 118。 0029 亲密度数据 112 可以包括关于过去交互的历史数据 113(例如, 在用户和存储在 说 明 书 CN 103039064 A 9 5/15 页 10 联系人列表 111 中的一个或多个联系人之间的通信、 或用户 105 用存储在联系人列表 111 。
39、中的一个或多个联系信息项所发起的过去交互的、 或与联系人或联系信息有关的非通信动 作) 。除标识成功和未成功的电话呼叫完成外, 历史数据 113 还可以标识用户 105 经由手动 发起已选择过的联系信息、 用户 105 曾用来交换文本 (SMS) 消息的联系信息、 或用户 105 曾 用来发送电子邮件或其他类型的消息的联系信息。 0030 更详细地, 历史数据 113 可以标识与用户所发起的一个或多个过去交互相关联的 时间和日期、 和 / 或与过去交互相关联的权重和乘法器。可以使用与过去交互相关联的时 间和日期来生成频率和新近性统计, 诸如在指定时段内使用特定联系信息项在用户 105 和 联系。
40、人之间已发生的过去交互的数量的频率计数。 0031 可以基于每一个相应的过去交互的类型或质量来分配或生成与在历史数据 113 中的过去交互相关联的权重。 例如, 较高权重值可以与对联系人的完成的电话呼叫相关联, 以及较低权重值可以与未完成或尝试的电话呼叫相关联。类似地, 较高权重值可以与联系 人在 “至 : ” 字段中列出的电子邮件相关联, 以及较低权重值可以被分配给联系人仅仅是 “cc:ed” 的电子邮件。另外, 更高权重 (例如, 值五) 可以与持续长于预先确定的阈值持续 时间的 IM 会话相关联, 以及更低权重 (例如, 值二) 可以与持续短于预先确定的阈值持续时 间的 IM 会话相关联。
41、。 0032 较高权重值还可以与将新的联系人添加到地址簿的动作相关联, 其反映用户 105 可能发起与他们刚刚添加的联系人的通信的念头。权重可以与历史数据 113 中的过去交 互联合被存储、 或它们可以响应于接收音频信号 108 或当另一个事件发生时即时动态地生 成。 0033 可以使用与过去交互相关联的乘法器来调整频率计数对与过去交互相关联的总 体亲密度分值的影响。例如并且如在下面更详细描述的, 可以为很久以前发生过的一个或 多个过去交互将零值乘法器应用到频率计数, 而可以为新近发生的一个或多个过去交互将 正的、 非零乘法器应用到频率计数。用于非零乘法器的值可以显现出时间衰减影响。 0034。
42、 除基于时间的乘法器外, 可以使用基于语境的乘法器来强调或不再强调频率计数 可以对某些过去交互的总体亲密度分值的影响。例如, 可以为在服务器 102 确定为是与用 户 105 的当前语境不相似或十分不相似的语境下已发生的一个或多个过去交互, 将低值乘 法器 (例如, 10%) 应用到频率计数。相反地, 可以为在服务器 102 确定为是与用户 105 的当 前语境相似或相同的语境下已发生的一个或多个过去交互, 将高值乘法器 (例如, 200%) 应 用到频率计数。与过去交互相关联的乘法器可以与历史数据 113 中的过去交互联合被存 储、 或它们可以响应于接收音频信号 108 或当另一个事件发生时。
43、即时动态地生成。 0035 亲密度数据112还可以包括已为存储在联系人列表111中的联系信息生成的当前 或过去亲密度分值114。 例如, 亲密度数据112可以包括每一个相应联系信息项的 “累积账” 亲密度分值。 0036 表 115 提供了可以被存储在服务器 102 上的亲密度数据 112 中、 并且可以用来生 成亲密度分值 120 和概率 121 的数据的一个示例可视化。具体地, 表 115 引用当用户 105 使用联系人 117( “Bill” ) 的联系信息 116a 至 116c 来发起通信时, 以及当用户 105 使用联 系人 119 ( “Phil” ) 的联系信息 116d 至 。
44、116f 来发起通信时已发生的若干过去交互。表 115 还包括在三个重叠但是不同的时段期间每一个联系信息项 116 的频率计数。 说 明 书 CN 103039064 A 10 6/15 页 11 0037 更详细地, 表 115 示出了联系信息项 116a、 联系人 117 的 “工作” 电子邮件地址在 前一周四十六次、 在前一月九十四次、 以及在上一年一百六十三次被用来发起与联系人 117 的通信。表 115 还示出联系信息项 116b、 联系人 117 的 “住宅” 电话号码在前一周十六次、 在前一月三十五次、 以及在上一年四十次被用来发起与联系人 117 的通信。此外, 表 115 还。
45、 示出联系信息项 116c、 联系人 117 的 “工作” 电话号码在前一周十四次、 在前一月二十四次、 以及在上一年九十次被用来发起与联系人 117 的通信。 0038 表 115 还示出联系信息项 116d、 联系人 119 的 “工作” 电子邮件地址在前一周十 次、 在前一月二十七次、 以及在上一年五十二次被用来发起与联系人 119 的通信。而且, 表 115示出了联系信息项116e、 联系人119的 “住宅” 电话号码在前一周十五次、 在前一月二十 次、 以及在上一年三十四次被用来发起与联系人 119 的通信。此外, 表 115 示出了联系信息 项 116f、 联系人 119 的 “蜂。
46、窝” 电话号码在前一周十八次、 在前一月二十次、 以及在上一年 二十一次被用来发起与联系人 117 的通信。 0039 在状态 (d) 期间, 服务器 102 至少部分基于用户先前已与和联系信息项相关联的 联系人通信的频率以及在用户和与联系信息项相关联的联系人之间的一个或多个过去交 互的新近性, 为联系人列表 111 中的联系信息项生成亲密度分值。通过基于用户先前已与 联系人通信的程度来生成亲密度分值, 服务器 102 更可能偏爱用户与之最频繁通信的联系 人来解决话音拨号歧义, 从而提高了话音拨号的准确性并且增强了用户 105 的体验。 0040 如表 115 中所示, 可以仅使用在固定持续时。
47、间或 “滑动窗口” 内发生的那些过去交 互来生成亲密度分值 120。例如, 亲密度分值可以使用在前一月内的电话联系的赋予权重 的频率计数来生成、 通过在前一周内到同一联系人的电子邮件通信的赋予权重的频率计数 来增大。 通过将没有在固定持续时间内发生的那些过去交互的相应频率计数乘以零值乘法 器, 可以将滑动窗口应用到历史数据 113。如表 115 中所示, 服务器 102 为联系信息 116b 计 算五十八的亲密度分值120b、 为联系信息116c计算四十七的亲密度分值120c、 为联系信息 116e 计算二十五的亲密度分值 120e 以及为联系信息 116f 计算二十五的亲密度分值 120f。。
48、 因此, 联系信息 116b 与最高亲密度分值相关联。 0041 亲密度分值120与用户105在过去使用特定联系信息项来发起与联系人的通信的 程度相互关联。 例如, 联系信息116b的五十八的亲密度分值120b反映用户105先前使用联 系信息 116b 来发起通信的程度比用户 105 先前使用联系信息 116c 来发起通信的程度大, 联系信息116c具有四十七的亲密度分值102c。 在使用不同评分系统的其他实施方式中, 较 高亲密度分值可以反映用户 105 已发起语境的程度比较低亲密度分值的程度小。 0042 在状态 (e) 期间, 服务器 102 推断用户 105 意在使用每一个联系信息项来。
49、发起通 信的概率。在一些实施方式中, 该概率基于为各个联系信息项生成的亲密度分值 120 来推 断。 0043 服务器可以使用任何数量的不同方法来推断概率 121。例如, 通过将所有亲密度 分值 120 乘以常数因子或将所有亲密度分值 120 除以常数因子来生成概率, 使得所有概率 121的总和总共是1.0, 可以将特定联系信息项的概率设置为与亲密度分值120成比例或成 反比例。替选地, 可以通过将特定联系信息项的亲密度分值除以地址簿中的所有联系信息 项的所有概率分值的总和, 来确定特定联系信息项的概率。还可以使用基于狄利克雷分布 的方法。 说 明 书 CN 103039064 A 11 7/15 页 12 0044 如表 115 中所示, 服务器 102 为联系信息 116b 推断 37% 的概率 121b、 为联系信息 116c 推断 30% 的概率 121c、 以及为联系信息 116e 和 116f 中的每一个推断 16% 的概率 121e 和 121f。正如预期的, 联系信息 116b 与最高亲密度分值相关联, 相应地, 与最高概率相关 联。 0045 在状态 (f) 期间, 服务器 。