基于语音识别的点餐方法.pdf

上传人:王** 文档编号:10545535 上传时间:2021-06-23 格式:PDF 页数:12 大小:556.34KB
收藏 版权申诉 举报 下载
基于语音识别的点餐方法.pdf_第1页
第1页 / 共12页
基于语音识别的点餐方法.pdf_第2页
第2页 / 共12页
基于语音识别的点餐方法.pdf_第3页
第3页 / 共12页
文档描述:

《基于语音识别的点餐方法.pdf》由会员分享,可在线阅读,更多相关《基于语音识别的点餐方法.pdf(12页完成版)》请在专利查询网上搜索。

1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202010283850.2 (22)申请日 2020.04.13 (71)申请人 李小强 地址 450000 河南省郑州市金水区文化路 95号 (72)发明人 李小强赵珍 (74)专利代理机构 郑州芝麻绘智知识产权代理 事务所(普通合伙) 41191 代理人 李玲玲 (51)Int.Cl. G06Q 20/32(2012.01) G06Q 50/12(2012.01) G10L 15/26(2006.01) G10L 21/0208(2013.01) G06F 40/232(2。

2、020.01) (54)发明名称 一种基于语音识别的点餐方法 (57)摘要 本发明涉及一种基于语音识别的点餐方法, 终端设备获取用餐者的点餐启动指令, 后台服务 器接收到点餐启动指令后, 将菜品信息和麦克风 开启指令输出给终端设备, 终端设备的麦克风获 取用餐者的点餐语音信号, 后台服务器将点餐语 音信号识别得到文本数据, 结合菜品名字专用词 典对文本数据进行处理, 得到目标文本数据, 后 台服务器接收到点餐结束指令之后, 将目标文本 数据发送至厨房中的显示屏上, 后台服务器将用 餐者所点的各菜品价格以及菜品总价显示在终 端设备的显示屏上。 该点餐方法实现语音点餐, 无需服务员在身旁服务, 不。

3、需要排队点餐, 提高 用餐效率, 节约用餐者的时间, 而且, 根据终端设 备上显示的费用直接付款, 节约了结账时间, 提 高用餐效率。 权利要求书2页 说明书8页 附图1页 CN 111507703 A 2020.08.07 CN 111507703 A 1.一种基于语音识别的点餐方法, 其特征在于, 包括: 通过设置在餐桌上的终端设备获取用餐者的点餐启动指令; 所述终端设备将所述点餐启动指令发送至后台服务器; 所述后台服务器接收到所述点餐启动指令之后, 将菜品信息和麦克风开启指令输出给 所述终端设备, 所述终端设备通过所述终端设备上的显示屏显示所述菜品信息, 所述终端 设备根据所述麦克风开启。

4、指令控制所述终端设备上的麦克风开启; 其中, 所述菜品信息包 括所有菜品的名字以及各个菜品的价格; 通过所述麦克风获取所述用餐者的点餐语音信号; 所述终端设备将所述点餐语音信号发送至后台服务器; 所述后台服务器对所述点餐语音信号进行识别, 得到文本数据; 所述后台服务器将所述文本数据输入到预设的菜品名字专用词典进行比对, 若所述文 本数据属于所述菜品名字专用词典中的词句, 则保留所述文本数据, 得到目标文本数据; 若 所述文本数据不属于所述菜品名字专用词典中的词句, 则根据所述文本数据的拼音, 查找 所述菜品名字专用词典中与所述文本数据的拼音相同的词句, 将查找到的词句替换所述文 本数据, 得。

5、到目标文本数据; 通过所述终端设备获取用餐者的点餐结束指令; 所述终端设备将所述点餐结束指令发送至后台服务器; 所述后台服务器接收到所述点餐结束指令之后, 将获取到的所述目标文本数据发送至 厨房中的显示屏上, 使得所述厨房中的显示屏显示所述目标文本数据; 所述后台服务器根据所述目标文本数据, 获取对应的菜品价格, 以及所点的菜品总价; 所述后台服务器将获取到的所述菜品价格以及所点的菜品总价发送至所述终端设备, 使得所述终端设备上的显示屏显示所述菜品价格以及所点的菜品总价。 2.根据权利要求1所述的基于语音识别的点餐方法, 其特征在于, 所述后台服务器将获 取到的所述菜品价格以及所点的菜品总价发。

6、送至所述终端设备, 使得所述终端设备上的显 示屏显示所述菜品价格以及所点的菜品总价, 包括: 所述后台服务器将获取到的所述菜品价格、 所点的菜品总价以及收款二维码发送至所 述终端设备, 使得所述终端设备上的显示屏显示所述菜品价格、 所点的菜品总价以及收款 二维码。 3.根据权利要求1所述的基于语音识别的点餐方法, 其特征在于, 所述菜品名字专用词 典包括至少两个菜品名字的词句以及各菜品名字的词句的拼音; 所述根据所述文本数据的拼音, 查找所述菜品名字专用词典中与所述文本数据的拼音 相同的词句, 将查找到的词句替换所述文本数据, 得到目标文本数据, 包括: 获取所述文本数据的拼音; 将获取得到的。

7、所述文本数据的拼音输入到所述菜品名字专用词典中, 得到所述菜品名 字专用词典中与所述文本数据的拼音相同的拼音, 并根据得到的拼音得到所述菜品名字专 用词典中对应的词句; 将得到的词句替换所述文本数据, 得到目标文本数据。 4.根据权利要求1所述的基于语音识别的点餐方法, 其特征在于, 所述后台服务器接收 到所述点餐结束指令之后, 将获取到的所述目标文本数据发送至厨房中的显示屏上, 使得 权利要求书 1/2 页 2 CN 111507703 A 2 所述厨房中的显示屏显示所述目标文本数据, 包括: 所述后台服务器接收到所述点餐结束指令之后, 根据所述点餐启动指令或者所述点餐 结束指令确定所述用餐。

8、者所处的餐桌位置; 将所述餐桌位置和获取到的所述目标文本数据发送至厨房中的显示屏上, 使得所述厨 房中的显示屏显示所述餐桌位置和所述目标文本数据。 权利要求书 2/2 页 3 CN 111507703 A 3 一种基于语音识别的点餐方法 技术领域 0001 本发明涉及一种基于语音识别的点餐方法。 背景技术 0002 目前, 常规的点餐方式是: 用餐者查看纸质菜单, 选取自己想要点的菜品, 然后告 诉服务员, 由服务员将用餐者所点的菜品名称记录在纸上或者移动终端上, 形成点餐订单, 随后服务员将纸质点餐订单转交至厨房, 或者, 通过移动终端将电子点餐订单发送至厨房, 由厨师进行烹饪。 这种传统的。

9、点餐方式存在以下问题: 用餐者点餐时, 必须有服务员进行一 对一的服务, 当用餐者比较多时, 经常需要排队点餐, 效率比较低, 严重浪费用餐者的时间。 而且, 在用餐之后, 还需要服务员拿出点餐订单, 并手动计算价钱, 费时费力, 而且也可能会 出现计算错误的情况。 发明内容 0003 本发明的目的在于提供一种基于语音识别的点餐方法, 用于解决传统的点餐方法 的效率比较低的问题。 0004 为了解决上述问题, 本发明采用以下技术方案: 0005 一种基于语音识别的点餐方法, 包括: 0006 通过设置在餐桌上的终端设备获取用餐者的点餐启动指令; 0007 所述终端设备将所述点餐启动指令发送至后。

10、台服务器; 0008 所述后台服务器接收到所述点餐启动指令之后, 将菜品信息和麦克风开启指令输 出给所述终端设备, 所述终端设备通过所述终端设备上的显示屏显示所述菜品信息, 所述 终端设备根据所述麦克风开启指令控制所述终端设备上的麦克风开启; 其中, 所述菜品信 息包括所有菜品的名字以及各个菜品的价格; 0009 通过所述麦克风获取所述用餐者的点餐语音信号; 0010 所述终端设备将所述点餐语音信号发送至后台服务器; 0011 所述后台服务器对所述点餐语音信号进行识别, 得到文本数据; 0012 所述后台服务器将所述文本数据输入到预设的菜品名字专用词典进行比对, 若所 述文本数据属于所述菜品名。

11、字专用词典中的词句, 则保留所述文本数据, 得到目标文本数 据; 若所述文本数据不属于所述菜品名字专用词典中的词句, 则根据所述文本数据的拼音, 查找所述菜品名字专用词典中与所述文本数据的拼音相同的词句, 将查找到的词句替换所 述文本数据, 得到目标文本数据; 0013 通过所述终端设备获取用餐者的点餐结束指令; 0014 所述终端设备将所述点餐结束指令发送至后台服务器; 0015 所述后台服务器接收到所述点餐结束指令之后, 将获取到的所述目标文本数据发 送至厨房中的显示屏上, 使得所述厨房中的显示屏显示所述目标文本数据; 0016 所述后台服务器根据所述目标文本数据, 获取对应的菜品价格, 。

12、以及所点的菜品 说明书 1/8 页 4 CN 111507703 A 4 总价; 0017 所述后台服务器将获取到的所述菜品价格以及所点的菜品总价发送至所述终端 设备, 使得所述终端设备上的显示屏显示所述菜品价格以及所点的菜品总价。 0018 可选地, 所述后台服务器将获取到的所述菜品价格以及所点的菜品总价发送至所 述终端设备, 使得所述终端设备上的显示屏显示所述菜品价格以及所点的菜品总价, 包括: 0019 所述后台服务器将获取到的所述菜品价格、 所点的菜品总价以及收款二维码发送 至所述终端设备, 使得所述终端设备上的显示屏显示所述菜品价格、 所点的菜品总价以及 收款二维码。 0020 可选。

13、地, 所述菜品名字专用词典包括至少两个菜品名字的词句以及各菜品名字的 词句的拼音; 0021 所述根据所述文本数据的拼音, 查找所述菜品名字专用词典中与所述文本数据的 拼音相同的词句, 将查找到的词句替换所述文本数据, 得到目标文本数据, 包括: 0022 获取所述文本数据的拼音; 0023 将获取得到的所述文本数据的拼音输入到所述菜品名字专用词典中, 得到所述菜 品名字专用词典中与所述文本数据的拼音相同的拼音, 并根据得到的拼音得到所述菜品名 字专用词典中对应的词句; 0024 将得到的词句替换所述文本数据, 得到目标文本数据。 0025 可选地, 所述后台服务器接收到所述点餐结束指令之后,。

14、 将获取到的所述目标文 本数据发送至厨房中的显示屏上, 使得所述厨房中的显示屏显示所述目标文本数据, 包括: 0026 所述后台服务器接收到所述点餐结束指令之后, 根据所述点餐启动指令或者所述 点餐结束指令确定所述用餐者所处的餐桌位置; 0027 将所述餐桌位置和获取到的所述目标文本数据发送至厨房中的显示屏上, 使得所 述厨房中的显示屏显示所述餐桌位置和所述目标文本数据。 0028 本发明的有益效果为: 用餐者进行语音点餐之前, 需要操作餐桌上的终端设备, 向 后台服务器发送点餐启动指令, 后台服务器将菜品信息和麦克风开启指令输出给终端设 备, 终端设备上的显示屏就会显示相关的菜品信息, 而且。

15、, 终端设备上的麦克风开启, 避免 麦克风始终处于开启状态而造成后台服务器接收到干扰语音信号, 进而导致误点餐的情 况; 终端设备将点餐语音信号发送至后台服务器, 后台服务器对点餐语音信号进行识别, 得 到对应的文本数据; 由于语音识别算法并非能够绝对准确地对语音信号进行识别, 因此, 识 别得到的文本数据可以有误, 识别得到的文本数据不是点餐时的文本数据, 即文本数据不 是菜品的名字(即菜名), 就无法进行后续处理, 为了解决这个问题, 预设一个菜品名字专用 词典, 该菜品名字专用词典中存储的各个词句(即文本数据)均为各菜名所对应的词句, 即 均为各菜品正确的名字, 那么, 若识别得到的文本。

16、数据属于该菜品名字专用词典中的词句, 表示文本识别正确, 则保留该文本数据, 得到目标文本数据; 若识别得到的文本数据不属于 该菜品名字专用词典中的词句, 表示文本识别错误, 那么, 为了得到准确的菜名, 根据该文 本数据的拼音, 查找该菜品名字专用词典中与该文本数据的拼音相同的词句, 将查找到的 词句替换文本数据, 通过这种根据拼音相同的条件进行文本替换, 就能够得到准确的目标 文本数据; 后台服务器接收到终端设备发送的点餐结束指令之后, 将得到的目标文本数据 发送至厨房中的显示屏上, 厨房中的显示屏就能够显示目标文本数据, 即用餐者所点的菜 说明书 2/8 页 5 CN 111507703。

17、 A 5 品, 厨师就能够烹饪这些菜品; 最后, 后台服务器根据目标文本数据, 获取对应的菜品价格, 以及所点的菜品总价, 并发送至终端设备, 使得终端设备上的显示屏显示菜品价格以及所 点的菜品总价, 便于用餐者在点完餐之后能够立即得到点餐的费用。 因此, 本发明提供的基 于语音识别的点餐方法能够实现语音点餐, 相较于传统的点餐方式, 无需服务员在身旁服 务, 不需要排队点餐, 提高用餐效率, 降低等待时间, 节约了用餐者的时间。 而且, 本发明提 供的基于语音识别的点餐方法中的语音识别过程能够提升语音识别准确率, 防止出现识别 错误的情况。 而且, 在用餐之后, 根据终端设备上的显示屏上显示。

18、的费用, 可以直接进行付 款, 无需服务员专门计算费用, 节约了结账时间, 也不会出现计算错误的情况, 缩短用餐时 间, 提高用餐效率。 附图说明 0029 为了更清楚地说明本发明实施例的技术方案, 下面将对实施例中所需要使用的附 图作简单地介绍: 0030 图1是基于语音识别的点餐方法的流程示意图。 具体实施方式 0031 本实施例提供一种基于语音识别的点餐方法, 该点餐方法适用于各种类型的餐馆 和饭店, 本实施例以餐馆为例。 0032 餐馆的各个餐桌上均设置有一个终端设备, 用于点餐。 终端设备可以固定在餐桌 上, 也可以从餐桌上拿起来。 终端设备包括点餐启动按键、 显示屏、 麦克风和点餐。

19、结束按键。 为了实现数据处理, 终端设备还包括处理器。 其中, 点餐启动按键为一个实体按键, 可以为 常规的实体按键, 通过配置软件程序, 实现按下该实体按键时, 实现点餐启动功能。 而点餐 结束按键的实现方式不唯一, 可以为实体按键, 也可以为显示屏上的虚拟按键, 那么, 显示 屏就是触摸屏。 点餐启动按键、 显示屏、 麦克风和点餐结束按键与处理器电连接。 终端设备 可以连接供电线路, 也可以由蓄电池供电。 因此, 终端设备为一个设置有实体按键、 显示屏、 麦克风和处理器的终端设备, 基于上述组成的终端设备属于常规设备, 现有技术中有很多, 比如授权公告号为CN203840415U的中国实用。

20、新型专利文件中公开了一种智能数字无线终 端设备, 不再赘述。 0033 餐馆还设置有后台服务器, 与各终端设备进行交互, 用于处理终端设备上送的数 据信息, 并向终端设备下送数据信息。 各终端设备与后台服务器之间可以有线通信连接, 也 可以无线通信连接, 若为无线通信连接, 则各终端设备还设置有无线通信模块。 无线通信方 式不唯一, 可以接入到同一个WIFI网络中, 也可以蓝牙连接。 0034 为了将点餐结果发送给厨师, 厨房也设置有显示屏, 后台服务器与该显示屏电连 接, 厨师根据显示屏上的点餐结果进行烹饪。 0035 如图1所示, 该点餐方法包括以下步骤: 0036 通过设置在餐桌上的终端。

21、设备获取用餐者的点餐启动指令: 0037 用餐者就坐某一个餐桌时, 操作(比如按下)该餐桌上的终端设备的点餐启动按 键, 生成点餐启动指令, 终端设备的处理器接收到该点餐启动指令。 应当理解, 此时终端设 备上的麦克风处于关闭状态, 防止在点餐之前, 后台服务器接收到干扰语音信号。 说明书 3/8 页 6 CN 111507703 A 6 0038 所述终端设备将所述点餐启动指令发送至后台服务器: 0039 终端设备将点餐启动指令有线或者无线传输给后台服务器。 0040 所述后台服务器接收到所述点餐启动指令之后, 将菜品信息和麦克风开启指令输 出给所述终端设备, 所述终端设备通过所述终端设备上。

22、的显示屏显示所述菜品信息, 所述 终端设备根据所述麦克风开启指令控制所述终端设备上的麦克风开启; 其中, 所述菜品信 息包括所有菜品的名字以及各个菜品的价格: 0041 后台服务器中预设有菜品信息, 该菜品信息包括餐馆内所有菜品的名字, 以及各 个菜品的价格。 应当理解, 所有菜品的名字, 以及各个菜品的价格均可以根据实际情况进行 调整。 0042 后台服务器接收到点餐启动指令之后, 生成麦克风开启指令, 然后将菜品信息和 麦克风开启指令输出给终端设备。 若同时存在多个餐桌进行点餐, 为了便于后台服务器将 菜品信息和麦克风开启指令输出给对应的终端设备, 该对应的终端设备是指发送该点餐启 动指令。

23、的终端设备, 那么, 点餐启动指令中还可以包含餐桌位置信息, 即餐桌编号信息, 或 者说终端设备编号信息, 后台服务器根据餐桌位置信息将菜品信息和麦克风开启指令输出 给对应的终端设备。 当然, 若餐馆的餐桌比较少, 通常情况下每次只有一个餐桌点餐, 则点 餐启动指令中就可以无需包含餐桌位置信息。 0043 终端设备通过终端设备上的显示屏显示菜品信息, 并且, 终端设备根据得到的麦 克风开启指令控制终端设备上的麦克风开启。 麦克风开启具体可以指: 为麦克风供电(即麦 克风上电), 或者处理器响应麦克风获取到的语音信号。 0044 通过所述麦克风获取所述用餐者的点餐语音信号: 0045 用餐者看到。

24、终端设备的显示屏上显示的菜品信息之后, 根据实际需要选择相关菜 品, 并说出包含选择的菜品名字的点餐语音信号, 麦克风获取到用餐者的点餐语音信号, 并 输出给终端设备的处理器。 0046 所述终端设备将所述点餐语音信号发送至后台服务器: 0047 终端设备将点餐语音信号有线或者无线传输给后台服务器。 0048 所述后台服务器对所述点餐语音信号进行识别, 得到文本数据: 0049 后台服务器获取到点餐语音信号之后, 对该点餐语音信号进行语音识别, 得到文 本数据。 对语音信号进行语音识别, 得到文本数据属于常规技术手段, 本实施例给出一种具 体实现过程, 当然, 除了该具体实现过程之外, 本申请。

25、还可以采用现有的其他实现过程。 本 实施例给出的具体实现过程步骤包括: 0050 (1)在预设的语音坐标系内生成点餐语音信号的语音波形图。 该语音坐标系的纵 坐标可以为语音振幅, 横坐标可以为采集时间, 从而生成一个基于时域的语音波形图。 另 外, 在生成语音波形图之前, 可以对点餐语音信号进行滤波, 过滤得到不包含环境噪声的语 音信号, 并可以对过滤噪声后的语音信号进行平缓处理, 从而可以过滤掉无效的噪声频段。 0051 (2)基于语音活性检测算法, 从语音波形图中划分得到至少两个有效语音段。 其 中, 有效语音段是指包含说话内容的语音段, 相应地, 无效语音段是指不包含说话内容的语 音段。。

26、 可以设置语音启动幅值以及语音结束幅值, 语音启动幅值的数值大于语音结束幅值 的数值, 即有效语音段的启动要求高于有效语音段的结束要求。 根据语音启动幅值以及语 音结束幅值, 对语音波形图进行有效语音识别, 从而划分得到至少两个有效语音段, 其中, 说明书 4/8 页 7 CN 111507703 A 7 该有效语音段的启动时刻对应的幅值大于或等于语音启动幅值, 且结束时刻对应的幅值小 于或等于语音结束幅值。 应当理解, 除了上述有效语音段的划分实现过程之外, 还可以采用 其他的实现过程。 0052 (3)通过语音特征识别算法提取各个有效语音段对应的语音特征曲线。 本实施例 中, 该语音特征识。

27、别算法可以为傅里叶算法, 将有效语音段从时域曲线转换为频域波形, 得 到各个有效语音段对应的语音特征曲线。 另外, 若转换得到的频域波形为离散波形, 则可以 通过线性拟合的方式, 对离散波形进行线性拟合, 输出对应的语音特征曲线。 0053 (4)从预设的语料库内提取各个候选字符关联的标准特征曲线。 预设有一个语料 库, 该语料库内包含有可以识别的所有候选字符, 每个候选字符对应一个关联的标准特征 曲线。 该标准特征曲线具体可以通过至少一种语种的标准读音的语音信号转换得到。 0054 (5)在预设的特征坐标上绘制标准特征曲线以及语音特征曲线, 并计算标准特征 曲线以及语音特征曲线之间相交区域的。

28、差异面积。 本实施例中, 在同一特征坐标系上绘制 标准特征曲线以及语音特征曲线, 从而能够快速比对两个曲线之间的差异度, 其中差异度 的计算主要通过两个曲线之间的相交面积(即相交区域的差异面积)的大小进行判断: 若该 相交面积越大, 则表示两个曲线之间的差异度越大, 则表示该有效语音段内不包含该候选 字符的概率越高; 反之, 若相交面积越小, 则表示两个曲线之间的差异度越小, 则表示该有 效语音段包含该候选字符的概率越高。 进一步地, 为了提高识别的准确率, 对语音特征曲线 进行归一化处理, 根据有效语音段的语音波形图的峰值变化, 将语音波形图划分为多个不 同的字符段, 一个字符段包含至少一个。

29、峰值, 从而能够确保每个字符段对应一个字符。 根据 字符段的长度在时域对字符段进行归一化, 即将该字符段的时长设置为预设的标准时长, 并且根据预设的最大振幅, 等比例调整字符段的振幅值, 并对归一化后的字符段进行标准 特征曲线的转换, 得到归一化后的字符段对应的语音特征曲线。 0055 (6)若任一候选字符的差异面积小于预设面积差异阈值, 则识别候选字符为对应 有效语音段包含的字符信息。 若检测到任一候选字符的标准特征曲线与语音特征曲线之间 相交区域的差异面积小于差异阈值, 则可以识别该有效语音段的说话内容中包含该候选字 符, 并根据各个识别得到的候选字符在有效语音段内出现位置, 确定各个识别。

30、得到的候选 字符的次序, 并基于该次序进行合并, 得到字符信息。 通过将各个候选字符的标准特征曲线 与语音特征曲线进行比对, 从而识别出有效语音段内包含的字符信息, 提高了字符信息生 成的准确性。 0056 (7)基于各个有效语音段在语音波形图的次序, 依次组合各个字符信息, 生成文字 数据。 具体地, 可以根据上一有效语音段的末字符与下一有效语音段的首字符之间的关联 度, 以及两个语音段之间的间隔时长, 确定连接两个字符信息所使用的标点符号, 通过识别 各个字符信息以及连接所用的标点符号, 生成文字信息, 提高了文字信息的可读性。 本实施 例中, 将语音信号划分为多个语音段, 从而能够减少每。

31、次语音识别的数据量, 同时兼顾了语 音识别的准确率以及计算量。 0057 应当理解, 为了方便后续利用文本数据的拼音, 在对点餐语音信号进行识别, 得到 文本数据的同时, 还得到该文本数据的拼音。 0058 所述后台服务器将所述文本数据输入到预设的菜品名字专用词典进行比对, 若所 述文本数据属于所述菜品名字专用词典中的词句, 则保留所述文本数据, 得到目标文本数 说明书 5/8 页 8 CN 111507703 A 8 据; 若所述文本数据不属于所述菜品名字专用词典中的词句, 则根据所述文本数据的拼音, 查找所述菜品名字专用词典中与所述文本数据的拼音相同的词句, 将查找到的词句替换所 述文本数。

32、据, 得到目标文本数据: 0059 语音识别算法的准确率并非绝对100, 而且用餐者可能会用方言进行点餐, 或者 用餐者在点餐时由于出现不必要的说话停顿, 均能够导致语音识别错误。 点餐语音信号识 别为文本数据时, 可能出现识别错误的情况, 识别错误是指识别为相同拼音(即相同读音) 的不同文本, 该得到的文本不是点餐时的名词, 即文本数据不是菜品的名字(即菜名)。 比 如: 点餐语音信号对应的菜名为 “鱼香肉丝” , 但是在说出点餐语音信号时出现了停顿, 那 么, 在识别时将菜名 “鱼香肉丝” 中的 “鱼香” 识别为文本数据 “预想” , 那么,“鱼香肉丝” 识别 成了 “预想肉丝” ; 同理。

33、, 点餐语音信号对应的菜名为 “合川肉片” , 但是在语音识别时, 将菜 名 “合川肉片” 中的 “合川” 识别为文本数据 “河川” , 那么,“合川肉片” 识别成了 “河川肉片” 。 很明显,“预想肉丝” 和 “河川肉片” 不是菜名。 0060 为了避免出现识别错误的情况, 预设有一个菜品名字专用词典, 该菜品名字专用 词典中存储至少两个菜品名字的词句, 菜品名字专用词典中的各个菜品名字的词句为各个 菜品的正确的名字, 即该菜品名字专用词典中存储有各菜品正确的名字, 比如鱼香肉丝、 合 川肉片等等。 应当理解, 该菜品名字专用词典中所包含的菜品名字的词句个数的多少由实 际情况(比如餐馆的菜系。

34、以及餐馆规模)决定, 比如: 若餐馆的菜系是川菜, 则菜品名字专用 词典中所包含的菜品名字的词句均为川菜的词句, 即均为各川菜正确的名字; 若餐馆的菜 系是鲁菜, 则菜品名字专用词典中所包含的菜品名字的词句均为鲁菜的词句, 即均为各鲁 菜正确的名字; 若餐馆规模比较小, 菜品种类通常就比较少, 则菜品名字专用词典中所包含 的菜品名字就比较少。 0061 那么, 将得到的文本数据输入到预设的菜品名字专用词典进行比对, 具体是与该 菜品名字专用词典中的各个词句进行逐一比对, 通过计算机程序自动将该文本数据与菜品 名字专用词典中的各个词句进行逐一比对。 0062 若该文本数据属于菜品名字专用词典中的。

35、词句, 表示没有识别错误, 则保留该文 本数据, 该文本数据为目标文本数据。 0063 若该文本数据不属于菜品名字专用词典中的词句, 那么, 根据该文本数据的拼音, 从菜品名字专用词典中查找到与该文本数据的拼音相同的词句, 将查找到的词句替换该文 本数据, 该查找到的词句为目标文本数据。 为了实现上述替换过程, 菜品名字专用词典包括 各菜品名字的词句以及各菜品名字的词句的拼音(由于不能绝对保证语音音调拼读准确, 因此, 各拼音可以不包含音调), 即除了包括各个词句之外, 还包括各个词句的拼音。 比如: 菜品名字专用词典包括鱼香肉丝、 合川肉片等词句, 相应地, 还包括鱼香肉丝的拼音(即yu x。

36、iang rou si)、 合川肉片的拼音(即he chuan rou pian)。 0064 相应地, 以下给出一种具体实现过程: 0065 首先, 获取该文本数据的拼音, 由于根据文本数据得到对应的拼音属于常规技术, 不再赘述; 0066 然后, 将获取得到的文本数据的拼音输入到菜品名字专用词典中, 得到菜品名字 专用词典中与该文本数据的拼音相同的拼音, 具体地, 将该文本数据的拼音与菜品名字专 用词典中的各个词句的拼音进行逐一比对, 找到菜品名字专用词典中与该文本数据的拼音 说明书 6/8 页 9 CN 111507703 A 9 相同的拼音, 然后, 根据得到的拼音就能够得到与该拼音对。

37、应的菜品名字专用词典中的词 句, 该词句就是所需的词句; 0067 最后, 将得到的词句替换该文本数据, 该查找到的词句为目标文本数据。 比如: 若 识别得到的文本数据为 “预想肉丝” , 不是菜品名字专用词典中的词句, 那么, 获取到文本数 据 “预想肉丝” 的拼音yu xiang rou si, 将该拼音与菜品名字专用词典中的各个词句 的拼音进行逐一比对, 找到菜品名字专用词典中的相同的拼音 “yu xiang rou si” , 进而得 到该拼音 “yu xiang rou si” 对应的词句 “鱼香肉丝” , 将文本数据 “鱼香肉丝” 替换文本数 据 “预想肉丝” , 该文本数据 “鱼。

38、香肉丝” 就是目标文本数据。 0068 那么, 该目标文本数据就是用餐者的点餐结果, 包含所点的各菜品。 应当理解, 目 标文本数据中可以只包括一个菜品的名字, 即只点一个菜, 也可以包括至少两个菜品的名 字, 即至少点两个菜。 其中, 若至少点两个菜, 在点餐时, 各个菜品的名字之间可以有适当的 间隔, 即在点餐语音信号中, 用餐者说完某一个菜品的名字之后, 间隔一定的时间(比如 2s), 再说下一个菜品的名字, 这种操作能够便于后台服务器逐个识别得到各个菜品, 进而 便于对各个菜品的名字进行处理。 0069 通过所述终端设备获取用餐者的点餐结束指令: 0070 用餐者点餐完成之后, 操作点。

39、餐结束按键, 生成点餐结束指令, 终端设备的处理器 接收到该点餐结束指令。 0071 所述终端设备将所述点餐结束指令发送至后台服务器: 0072 终端设备将点餐结束指令有线或者无线传输给后台服务器。 0073 所述后台服务器接收到所述点餐结束指令之后, 将获取到的所述目标文本数据发 送至厨房中的显示屏上, 使得所述厨房中的显示屏显示所述目标文本数据: 0074 后台服务器接收到点餐结束指令之后, 判定点餐结束, 将获取到的目标文本数据, 即点餐结果发送至厨房中的显示屏上, 使得厨房中的显示屏显示该目标文本数据, 厨师就 能够根据目标文本数据对应的点餐结果进行烹饪。 0075 为了便于厨师获知用。

40、餐者的位置, 本实施例中, 后台服务器接收到点餐结束指令 之后, 根据点餐启动指令或者点餐结束指令确定用餐者所处的餐桌位置, 其中, 点餐启动指 令或者点餐结束指令包含餐桌位置信息, 即餐桌编号信息, 或者说终端设备编号信息。 将得 到的餐桌位置和获取到的目标文本数据发送至厨房中的显示屏上, 使得厨房中的显示屏显 示餐桌位置和目标文本数据。 0076 应当理解, 若厨师无需获取用餐者的位置, 厨师烹饪完成之后, 由相关的服务员送 至用餐者, 则只需将获取到的目标文本数据发送至厨房中的显示屏上。 0077 所述后台服务器根据所述目标文本数据, 获取对应的菜品价格, 以及所点的菜品 总价: 007。

41、8 后台服务器根据目标文本数据, 获取用餐者所点的各个菜品的价格, 并且, 通过计 算所有菜品的价格得到所点的菜品总价。 0079 所述后台服务器将获取到的所述菜品价格以及所点的菜品总价发送至所述终端 设备, 使得所述终端设备上的显示屏显示所述菜品价格以及所点的菜品总价: 0080 后台服务器将获取到的用餐者所点的各个菜品价格以及所点的菜品总价发送至 终端设备, 使得终端设备上的显示屏显示各个菜品价格以及所点的菜品总价。 说明书 7/8 页 10 CN 111507703 A 10 0081 进一步地, 为了便于用餐者付款, 后台服务器中预设有一个收款二维码, 那么,“所 述后台服务器将获取到。

42、的所述菜品价格以及所点的菜品总价发送至所述终端设备, 使得所 述终端设备上的显示屏显示所述菜品价格以及所点的菜品总价” 具体的实现过程为: 后台 服务器将获取到的菜品价格、 所点的菜品总价以及收款二维码发送至终端设备, 终端设备 上的显示屏就能够显示菜品价格、 所点的菜品总价以及收款二维码。 用餐者通过手机扫描 该收款二维码, 就可以实现付款, 方便快捷。 0082 上述实施例仅以一种具体的实施方式说明本发明的技术方案, 任何对本发明进行 的等同替换及不脱离本发明精神和范围的修改或局部替换, 其均应涵盖在本发明权利要求 保护的范围之内。 说明书 8/8 页 11 CN 111507703 A 11 图1 说明书附图 1/1 页 12 CN 111507703 A 12 。

展开阅读全文
内容关键字: 基于 语音 识别 方法
关于本文
本文标题:基于语音识别的点餐方法.pdf
链接地址:https://www.zhuanlichaxun.net/pdf/10545535.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1