拼音语音输入的方法 本发明涉及一种语音输入的方法,特别涉及一种拼音语音输入的方法。
信息时代的来临,各种信息产品不断推出,并且朝着简单容易操作等方面研究,利用语音输入的方式来操控电脑、下达指令、输入文字,是一种更具人性化的方法。在一些信息应用(Information Appliance,IA)装置上所需输入的句子并不需太多,而现有的语音输入法多是以一连串句子直接输入,以词作为单位,利用声母、韵母的特征来识别语音,然而以此方式所识别出来的文字的识别率却无法达到100%的识别率,对于无法识别的字或词将耗费更多的时间才可正确地输入,无法达到语音输入法的便利。
请参考图1,所示为习知一种语音输入法的硬件流程图,语音藉由麦克风102到前级放大器104输入,利用数字信号处理板106将语音转换成数字,传入内含处理器的系统108中。
请参考图2,所示为习知一种语音输入法的系统架构图,其步骤如下,首先语音输入,步骤202经过语言端点检测器,将语音切割成音帧,步骤204执行特征参数提取器,经过步骤206声调辨认器及步骤208连续音快速候选音表搜索器,选出数个较适合的候选音,输出候选音表,步骤210利用快速候选词搜索器搜索,步骤212再利用依上下文出现频率的选词器,找出最适合的文字,将文字输出。
但是,一连串的句子经过识别之后,所得的识别率极低,尤其是中文等非英语系国家所使用的语言,以中文为例,中文的词汇有数十万个,光是搜索所需要的词就需要很久时间,而找到地词相近相似的可能会有一堆,最后得到词句的错误率很高,所得到的识别效果并不如预期的好。又由于词汇有很多,再加上词汇的运用有多种意义,要训练电脑自我学习校正的功能难以发挥,因此识别出来的结果可能会一再地发生错误。
综上所述,习知具有下列缺点:
(1)要将连续的句子拆成数个音节,再从音节中一一分辨出声母、韵母等,最后再依据语音特征、常用的词汇、上下文的连贯性来识别语音,如此的识别程序非常麻烦。
(2)语音输入法的词汇很多,有许多词汇并非经常使用,即使使用也因为用法、意义、使用方式不同,难以训练电脑做自动校正的功能。
(3)由于连续的句子并非容易可以将它拆分,即使拆分之后,识别其声母、韵母亦是很难将它识别,虽然识别程序麻烦,识别的能力并不因此提高,再加上电脑的自动校正功能不能很准确地发挥功效,所得的语音输入的识别率低。
有鉴于此,本发明的目的在于提供一种语音输入法,可以容易使用在只需输入简短句子的信息产品上,利用字母拼音的方式,将所需识别文字从数十万个字词简略至仅剩字母等几十个识别单元,并以字母等单一个特殊音或特殊词来发声,并且结合键盘的输入,使得处理器可以容易地识别发出声音为何。
本发明就是在于提供一种拼音语音输入法,其步骤如下:输入数个分解音,以字母等单一特殊音、特殊词的拼音方式来表达;得到数个输入字母;或使用特殊发音,以输入数个特殊符号;识别输入分解音及特殊发音;结合这些输入字母,以得到数个候选文字;选择出至少一正确文字。或从识别输入分解音及特殊发音得到切换输入法,再回到输入数个分解音,以字母等单一特殊音、特殊词的拼音方式来表达。此方法所需的装置包括:一语音信号接收器、一模拟/数字转换器、一处理器、以及一输出设备。
将所要输入的语音拆成字母等单一特殊音或特殊词的分解音,或使用特殊发音,以输入数个特殊符号,通过语音信号接收器,传入模拟/数字转换器,识别分解音成输入字母,再通过处理器将输入字母结合成串,得到多个候选文字,从候选文字中选择出正确文字,最后可通过输出设备将正确文字输出。由于从基本字母来识别并进入如树状的数据库系统,而能达成立即识别立即搜索数据库,除可有效解决识别的问题亦大大地增加识别的速度与搜索的速度。
从拼音或基本组成字母的语音输入法乃是此一发明最大的特色,也将彻底而有效地改善语音输入的识别瓶颈与识别速度。再辅以智能型学习、分类、记录、判断等功能而将效率再与提升。
本发明的步骤亦可为:输入数个分解音,以字母等单一特殊音、特殊词的拼音方式来表达;得到数个输入字母;或使用特殊发音,以输入数个特殊符号;使用特殊按键,以输入数个简单信号;识别输入分解音及特殊发音;结合这些输入字母,以得到数个候选文字;选择出至少一正确文字。或从识别输入分解音及特殊发音得到切换输入法,再回到输入数个分解音,以字母等单一特殊音、特殊词的拼音方式来表达。此方法所需的装置包括:一语音信号接收器、一模拟/数字转换器、一键盘、一处理器、以及一输出设备。
将所要输入的语音拆成字母等单一特殊音或特殊词的分解音,或使用特殊发音,以输入数个特殊符号,通过语音信号接收器,传入模拟/数字转换器,识别分解音成输入字母,并混合键盘使用,输入数个简单信号,再通过处理器将输入字母与简单信号结合,得到多个候选文字,从候选文字中选择出正确文字,最后可通过输出设备将正确文字输出。
为让本发明的上述和其他目的、特征、和优点能更明显易懂,下文特举一较佳实施例,并配合附图,作详细说明如下:
附图的简单说明:
图1是习知一种语音输入法的硬件流程图;
图2是习知一种语音输入法的系统架构图;
图3是本发明的一较佳实施例的一种拼音语音输入的方法的系统架构图;
图4是本发明的一较佳实施例的一种拼音语音输入的方法的硬件流程图;以及
图5是依照本发明的一较佳实施例,在英文模式下语音输入的一种拼音语音输入的方法的使用流程图。
请参照图3,所示的是本发明的一较佳实施例的一种拼音语音输入的方法的系统架构图。
拼音语音输入的方法的步骤如下:首先步骤302为输入数个分解音,以字母等单一特殊音、特殊词的拼音方式来表达;以得到步骤304得到数个输入字母;或步骤308为使用特殊发音,以输入数个特殊符号;接下来是步骤310识别输入分解音及特殊发音,这些自订的特殊发音可增进输入的效率,并可以来判断是否要组合基本字母或音节以完成一标准字;步骤314结合这些输入字母,以得到数个候选文字;最后步骤316选择出至少一正确文字。或这些自订的特殊发音可切换一输入模式,从步骤310得到步骤312切换输入法,再回到步骤302输入数个分解音,以字母等单一特殊音、特殊词的拼音方式来表达。
此外由于不少人名或地名等拼法或拼音已固定,利用丰富的词库而取得正确的词乃是必需的,这也是此一发明利用智能型的数据字库词库再辅以智能型的输入选择判断而达成。
以“台北”为例,台北的标准英文为TAIPEI,若使用中文的汉语拼音,首先将所要输入的语音“台北”拼成以字母等单一特殊音、特殊词的拼音方式来表达的分解音为“T,A,I”代表“台”而“B,E,I”代表“北”;接下来识别这些分解音“T,A,I,B,E,I”成数个输入字母;结合输入字母成“TAI“BEI”,得到候选文字“台”与“北”等多个候选文字,选择出正确文字“台”与“北”。但若使用者输入“T,A,I,P,E,I”接下来识别这些分解音“T,A,I,P,E,I”成数个输入字母;结合输入字母成“TAI”“PEI”,得到候选文字“台”与“陪”等多个候选文字,与使用者预期不合,经由智能型的判断方法将前一字或前数字与当前所输入的字组合成一完整或部分的词句片语而加以判断选择后将列出“台北”等词句供选择,而使用者将可选择出正确文字“台北”。此一混合标准拼音与习惯用法或特殊专有名词的识别亦为此一发明的一大特色。
拼音语音输入的方法的步骤亦可加入键盘使用,使步骤为:首先步骤302为输入数个分解音,以字母等单一特殊音、特殊词的拼音方式来表达;以得到步骤304得到数个输入字母;步骤306为使用特殊按键,以输入数个简单信号;或步骤308为使用特殊发音,以输入数个特殊符号;接下来是步骤310识别输入分解音及特殊发音及特殊按键,这些自订的特殊发音及特殊按键可增进输入的效率,并可以来判断是否要组合基本字母或音节以完成一标准字;步骤314结合这些输入字母,以得到数个候选文字;最后步骤316选择出至少一正确文字。或这些自订的特殊发音及特殊按键可切换一输入模式,从步骤310得到步骤312切换输入法,再回到步骤302输入数个分解音,以字母等单一特殊音、特殊词的拼音方式来表达。
以中文的国字注音拼音为例,首先将所要输入的语音“台北”拼成以字母等单一特殊音、特殊词的拼音方式来表达的分解音为“ㄊ,ㄞ,′,ㄅ,ㄟ,ˇ”;接下来识别这些分解音“ㄊ,ㄞ,′,ㄅ,ㄟ,ˇ”成数个输入字母;步骤中可混合键盘使用,如台北的“台”在注音拼音中为二声,则可使用数字键“2”来替代,而台北的“北”在注音拼音中为三声,则可使用数字键“3”来替代,亦可以别种方式的键盘来运用,将输入字母与按键结合成““ㄊ,ㄞ,2,ㄅ,ㄟ,3”,得到候选文字“台北”等多个候选文字,选择出正确文字“台北”,亦可使用自订或预设的特殊按键或符号来决定字与字的间隔或决定发音的抑扬顿挫,如同以使用数字键“2”表示“台”在注音拼音中为二声。
请参照图4,所示的是本发明的一较佳实施例的一种拼音语音输入的方法的硬件流程图。
将文字拆解成分解音,以字母等单一特殊音、特殊词的拼音方式或是使用特殊发音,或使用特殊发音,以输入数个特殊符号,藉由语音信号接收器402输入,此语音信号接收器402可为麦克风,利用模拟/数字转换器404将语音转换成数字,使得分解音识别成输入字母,如有需要,亦可混合键盘406使用,键入简单信号,将输入字母结合并与键入的简单信号传入处理器408中,其中处理器408可为电脑主机、微控制器等,产生多个候选文字,再选出至少一正确文字,最后可由输出设备410输出,其中输出设备410可为PDA、IA、手机等信息产品。
现今的手机输入的确是一大瓶颈,复杂的输入方式使人不敢恭维,新式的PDA虽有笔式手写输入然书写习惯与简体字、繁体字、及其他字体等等,复杂的情况自不在话下,为求方便使用者,有效的语音输入将是最好的输入方法,而经由此一发明将对输入做革命性的贡献。
请参照图5,所示的是本发明的一较佳实施例的一种拼音语音输入的方法的使用流程图。首先步骤502将第一单字分解成数个字母逐字读出;接下来步骤504输入第一控制指令,使其输出第一空格或第一特殊符号;再下来是步骤506将第二单字分解成数个字母逐字读出;再步骤508为输入第二控制指令,使其输入第二空格或一第二特殊符号;最后步骤510重复上述步骤,直到完成字句的输入。其中第一控制指令与第二控制指令为利用特殊发音与特殊按键其中之一来下达。
另外,虽然英文的语音输入可达80%的识别率,但是仍无法达到百分之百的准确率,像是使用一般的语音输入法时,直接念出“the world”的声音,经过语音识别后,而将结果输出,但可能因为类似音的关系或发声者本身发音不准等问题,而出现“the word”这个字,一但出现错误的文字,则需使用传统的键盘输入的方式来修正错误字,而在通讯产品上往往没有配备包括26个英文字母的键盘,以现在通用的手机为例,26个英文字母全靠重复按压数字键来输入,利用按数字键“8”一下来输入“t”,按数字键“4”两下来输入“h”,再按数字键“3”两下来输入“e”,至此始完成“the”的文字输入,在此可知在使用上有相当程度不便。本发明提供的方法在英文输入模式下,系统仅需要识别26个英文字母,以及/或代表特殊符号的少数几个特殊发音,每个字母间的差异颇大,因此不用担心结果会输出错误的字母,以输入“the world”为例,先分别说出“t”、“h”、“e”,英文单字之间的停顿可以用特殊发音,或配合特殊按键来输入控制指令,之后再分别说出“w”、“o”、“r”、“l”、“d”,如此即可正确无误地识别并组合输出“the world”这个字,重复上述的步骤,便可以完成字句的输入,如此逐字读出英文字母来编辑字句的方法,识别率几乎可达百分之百。然而,本领域的技术人员应知,本发明并不仅限于中文与英文的语音输入,凡是能以拼音方式表达的语言应仍在本发明的精神范围内。
本发明不仅可藉由智能型的字库词库可识别一些特定拼字或拼音的地名,人名等等,并选择该正确文字或词句;也可以进一步藉由自订的特殊按键或特殊发音可增进输入的效率;更可以藉由自订的特殊按键或特殊发音可判断是否要组合基本字母或音节以完成一个标准字,亦有可能仅输入字母如ABC等,毕竟中文与英文字是极可能同时出现的,藉由特殊发音或按键来切换输入法的模式为中文输入或英文输入或是其他文输入。
如此应用本发明具有下列优点:
(1)本发明输入语音时,以使用最简化的拼音,不需复杂的识别技巧与流程,可以缩短其识别时间。
(2)本发明所需识别的识别单元数少,不需高运算功能的处理器,因此即使是较低运算功能的处理器也可以使用。
(3)本发明所需识别的识别单元数少,经常使用下,处理器的自我学习能够校正正确。
由上述优点结合,可使得本发明的识别率大大提高,所输入的语音正确性也大大升高;相较于本发明,习知的语音识别方法虽然输入完整字句的速度较快,但是出现错误时需要利用传统的键盘输入方式以光标回到错误的单字,删除错误字再输入正确的字来修正,如此反复确认修正将会耗费不少时间,而本发明直接以拼音的方式进行语音输入,无须担心识别误差的情形发生,因此应用在IA产品上输入简短消息时,更可以突显其方便性。
虽然本发明已以一较佳实施例公开如上,然其并非用以限定本发明,任何本领域的技术人员,在不脱离本发明的精神和范围内,当可作各种的更动与润饰,因此本发明的保护范围当视所附权利要求书所界定者为准。