书签 分享 收藏 举报 版权申诉 / 17

藏文字检错方法、系统及藏文字串检错方法、系统.pdf

  • 上传人:li****8
  • 文档编号:6096839
  • 上传时间:2019-04-10
  • 格式:PDF
  • 页数:17
  • 大小:1.19MB
  • 摘要
    申请专利号:

    CN201610661485.8

    申请日:

    2016.08.09

    公开号:

    CN106326209A

    公开日:

    2017.01.11

    当前法律状态:

    实审

    有效性:

    审中

    法律详情:

    实质审查的生效IPC(主分类):G06F 17/27申请日:20160809|||公开

    IPC分类号:

    G06F17/27

    主分类号:

    G06F17/27

    申请人:

    青海民族大学

    发明人:

    安见才让; 孙琦龙; 昝风彪; 看不太; 拉毛措

    地址:

    810007 青海省西宁市城东区八一中路3号

    优先权:

    专利代理机构:

    北京酷爱智慧知识产权代理有限公司 11514

    代理人:

    马丽娜

    PDF完整版下载: PDF下载
    内容摘要

    本发明提供一种藏文字检错方法及系统,以及一种藏文字串检错方法及系统。其中所述藏文字检错方法包括:首先,获取待检错的藏文字;然后,将所述待检错藏文字与预设的藏文字检错正则表达式进行匹配;最后,根据匹配是否成功判断所述待检错的藏文字是否有错误。相较于现有技术中利用字典匹配的方式进行藏文字检错的方法,本发明基于现代藏文字的构字规律,利用藏文字检错正则表达式进行藏文字的检错,具有占用处理器资源少、内存占用低、运行负荷小、检错效率高等优点。

    权利要求书

    1.一种藏文字检错方法,其特征在于,包括:
    获取待检错的藏文字;
    将所述待检错藏文字与预设的藏文字检错正则表达式进行匹配;
    根据匹配是否成功判断所述待检错的藏文字是否有错误。
    2.根据权利要求1所述的藏文字检错方法,其特征在于,所述根据匹配结果判断所述待
    检错的藏文字是否有错,包括:
    在匹配成功时,判断所述待检错的藏文字没有错误;
    在匹配不成功时,判断所述待检错的藏文字有错误。
    3.根据权利要求2所述的藏文字检错方法,其特征在于,所述在匹配不成功时,判断所
    述待检错的藏文字有错误,包括:
    在匹配不成功时,将所述待检错藏文字与预设的梵文检错正则表达式进行匹配;
    在与预设的梵文检错正则表达式匹配成功时,判断所述待检错的藏文字没有错误;
    在与预设的梵文检错正则表达式匹配不成功时,判断所述待检错的藏文字有错误。
    4.根据权利要求3所述的藏文字检错方法,其特征在于,所述预设的梵文检错正则表达
    式具体为:

    5.根据权利要求1所述的藏文字检错方法,其特征在于,所述预设的藏文字检错正则表
    达式包括不叠加藏文字中前加字和基字组合的检错正则表达式,单字母藏文字和叠加藏文
    字中前加字、上加字、基字和下加字组合的检错正则表达式,藏文字元音的检错正则表达
    式,藏文字后加字及又后加字组合的检错正则表达式,藏文字后加字及紧缩字的检错正
    则表达式中的任意一种正则表达式或任意多种正则表达式的组合;
    其中,所述不叠加藏文字中前加字和基字组合的检错正则表达式具体为:

    所述单字母藏文字和叠加藏文字中前加字、上加字、基字和下加字组合的检错正则表
    达式具体为:

    所述藏文字元音的检错正则表达式具体为:

    所述藏文字后加字及又后加字组合的检错正则表达式具体为:

    所述藏文字后加字及紧缩字的检错正则表达式具体为:

    6.根据权利要求5所述的藏文字检错方法,其特征在于,所述预设的藏文字检错正则表
    达式包括不叠加藏文字中前加字和基字组合的检错正则表达式,单字母藏文字和叠加藏文
    字中前加字、上加字、基字和下加字组合的检错正则表达式,藏文字元音的检错正则表达
    式,藏文字后加字及又后加字组合的检错正则表达式,藏文字后加字及紧缩字的检错正
    则表达式的组合,其组合形式如下:

    其中,rp表示藏文字检错正则表达式,p表示不叠加藏文字中前加字和基字组合的检错
    正则表达式,q表示单字母藏文字和叠加藏文字中前加字、上加字、基字和下加字组合的检
    错正则表达式,v表示藏文字元音的检错正则表达式,b表示藏文字后加字及又后加字组合
    的检错正则表达式,a表示藏文字后加字及紧缩字的检错正则表达式。
    7.根据权利要求1所述的藏文字检错方法,其特征在于,在根据匹配是否成功判断所述
    待检错的藏文字是否有错误的步骤后,还包括:
    在所述待检错的藏文字有错误时,对所述藏文字做与检错前进行区分的标记。
    8.一种藏文字检错系统,其特征在于,包括:
    藏文字获取模块,用于获取待检错的藏文字;
    藏文字匹配模块,用于将所述待检错藏文字与预设的藏文字检错正则表达式进行匹
    配;
    藏文字判断模块,用于根据匹配是否成功判断所述待检错的藏文字是否有错误。
    9.一种藏文字串检错方法,其特征在于,包括:
    获取待检错的藏文字串;
    按照所述藏文字串的顺序,将所述藏文字串中的每个藏文字依次按照权利要求1至权
    利要求7所述的藏文字检错方法进行检错,获得每个所述藏文字各自的检错结果;
    对所述藏文字串中检错结果为有错误的藏文字,做与没有错误的藏文字进行区分的标
    记。
    10.一种藏文字串检错系统,其特征在于,包括:
    藏文字串获取模块,用于获取待检错的藏文字串;
    藏文字检错模块,用于按照所述藏文字串的顺序,将所述藏文字串中的每个藏文字依
    次按照权利要求1至权利要求7所述的藏文字检错方法进行检错,获得每个所述藏文字各自
    的检错结果;
    错误文字标记模块,用于对所述藏文字串中检错结果为有错误的藏文字,做与没有错
    误的藏文字进行区分的标记。

    说明书

    藏文字检错方法、系统及藏文字串检错方法、系统

    技术领域

    本发明涉及藏文字处理技术领域,具体涉及一种藏文字检错方法及系统,以及一
    种藏文字串检错方法及系统。

    背景技术

    伴随着信息社会的发展,藏文电子文档、报刊、新闻及网页等种类繁多的藏文信息
    日益增多,供人们阅读、学习和使用。这些藏文信息主要是通过键盘人工录入到计算机中
    的,但是,人工输入和校对时无法保证存入和修改的信息准确无误。

    目前,现代藏文字校对的方法主要是采用字典匹配的方法:将藏文字与字库中的
    标准藏文字进行匹配,若匹配成功,则认为正确,否则认为错误。这种方法在运行时需要占
    用大量的处理器资源和内存空间,计算机运行负荷高且运算效率低下。

    发明内容

    针对现有技术中的缺陷,本发明提供一种藏文字检错方法和系统,以及一种藏文
    字串检错方法和系统,以解决目前字典匹配的方法占用处理器资源和内存空间大,计算机
    运行负荷高且运算效率低下的问题。

    第一方面,本发明提供的一种藏文字检错方法,包括:

    获取待检错的藏文字;

    将所述待检错藏文字与预设的藏文字检错正则表达式进行匹配;

    根据匹配是否成功判断所述待检错的藏文字是否有错误。

    可选的,所述根据匹配结果判断所述待检错的藏文字是否有错,包括:

    在匹配成功时,判断所述待检错的藏文字没有错误;

    在匹配不成功时,判断所述待检错的藏文字有错误。

    可选的,所述在匹配不成功时,判断所述待检错的藏文字有错误,包括:

    在匹配不成功时,将所述待检错藏文字与预设的梵文检错正则表达式进行匹配;

    在与预设的梵文检错正则表达式匹配成功时,判断所述待检错的藏文字没有错
    误;

    在与预设的梵文检错正则表达式匹配不成功时,判断所述待检错的藏文字有错
    误。

    可选的,所述预设的梵文检错正则表达式具体为:


    可选的,所述预设的藏文字检错正则表达式包括不叠加藏文字中前加字和基字组
    合的检错正则表达式,单字母藏文字和叠加藏文字中前加字、上加字、基字和下加字组合的
    检错正则表达式,藏文字元音的检错正则表达式,藏文字后加字及又后加字组合的检错正
    则表达式,藏文字后加字及紧缩字的检错正则表达式中的任意一种正则表达式或任意
    多种正则表达式的组合;

    其中,所述不叠加藏文字中前加字和基字组合的检错正则表达式具体为:


    所述单字母藏文字和叠加藏文字中前加字、上加字、基字和下加字组合的检错正
    则表达式具体为:


    所述藏文字元音的检错正则表达式具体为:


    所述藏文字后加字及又后加字组合的检错正则表达式具体为:


    所述藏文字后加字及紧缩字的检错正则表达式具体为:


    可选的,所述预设的藏文字检错正则表达式包括不叠加藏文字中前加字和基字组
    合的检错正则表达式,单字母藏文字和叠加藏文字中前加字、上加字、基字和下加字组合的
    检错正则表达式,藏文字元音的检错正则表达式,藏文字后加字及又后加字组合的检错正
    则表达式,藏文字后加字及紧缩字的检错正则表达式的组合,其组合形式如下:


    其中,rp表示藏文字检错正则表达式,p表示不叠加藏文字中前加字和基字组合的
    检错正则表达式,q表示单字母藏文字和叠加藏文字中前加字、上加字、基字和下加字组合
    的检错正则表达式,v表示藏文字元音的检错正则表达式,b表示藏文字后加字及又后加字
    组合的检错正则表达式,a表示藏文字后加字及紧缩字的检错正则表达式。

    可选的,在根据匹配是否成功判断所述待检错的藏文字是否有错误的步骤后,还
    包括:

    在所述待检错的藏文字有错误时,对所述藏文字做与检错前进行区分的标记。

    第二方面,本发明提供的一种藏文字检错系统,包括:

    藏文字获取模块,用于获取待检错的藏文字;

    藏文字匹配模块,用于将所述待检错藏文字与预设的藏文字检错正则表达式进行
    匹配;

    藏文字判断模块,用于根据匹配是否成功判断所述待检错的藏文字是否有错误。

    可选的,所述藏文字判断模块,包括:

    匹配成功单元,用于在匹配成功时,判断所述待检错的藏文字没有错误;

    匹配不成功单元,用于在匹配不成功时,判断所述待检错的藏文字有错误。

    可选的,所述匹配不成功单元,包括:

    梵文匹配子单元,用于在匹配不成功时,将所述待检错藏文字与预设的梵文检错
    正则表达式进行匹配;

    梵文匹配成功子单元,用于在与预设的梵文检错正则表达式匹配成功时,判断所
    述待检错的藏文字没有错误;

    梵文匹配不成功子单元,用于在与预设的梵文检错正则表达式匹配不成功时,判
    断所述待检错的藏文字有错误。

    可选的,所述预设的梵文检错正则表达式具体为:


    可选的,所述预设的藏文字检错正则表达式包括不叠加藏文字中前加字和基字组
    合的检错正则表达式,单字母藏文字和叠加藏文字中前加字、上加字、基字和下加字组合的
    检错正则表达式,藏文字元音的检错正则表达式,藏文字后加字及又后加字组合的检错正
    则表达式,藏文字后加字及紧缩字的检错正则表达式中的任意一种正则表达式或任意
    多种正则表达式的组合;

    其中,所述不叠加藏文字中前加字和基字组合的检错正则表达式具体为:


    所述单字母藏文字和叠加藏文字中前加字、上加字、基字和下加字组合的检错正
    则表达式具体为:


    所述藏文字元音的检错正则表达式具体为:


    所述藏文字后加字及又后加字组合的检错正则表达式具体为:


    所述藏文字后加字及紧缩字的检错正则表达式具体为:


    可选的,所述预设的藏文字检错正则表达式包括不叠加藏文字中前加字和基字组
    合的检错正则表达式,单字母藏文字和叠加藏文字中前加字、上加字、基字和下加字组合的
    检错正则表达式,藏文字元音的检错正则表达式,藏文字后加字及又后加字组合的检错正
    则表达式,藏文字后加字及紧缩字的检错正则表达式的组合,其组合形式如下:


    其中,rp表示藏文字检错正则表达式,p表示不叠加藏文字中前加字和基字组合的
    检错正则表达式,q表示单字母藏文字和叠加藏文字中前加字、上加字、基字和下加字组合
    的检错正则表达式,v表示藏文字元音的检错正则表达式,b表示藏文字后加字及又后加字
    组合的检错正则表达式,a表示藏文字后加字及紧缩字的检错正则表达式。

    可选的,所述藏文字检错系统,还包括:

    错误标记模块,用于在所述待检错的藏文字有错误时,对所述藏文字做与检错前
    进行区分的标记。

    第三方面,本发明提供的一种藏文字串检错方法,包括:

    获取待检错的藏文字串;

    按照所述藏文字串的顺序,将所述藏文字串中的每个藏文字依次按照本发明提供
    的任一项所述藏文字检错方法进行检错,获得每个所述藏文字各自的检错结果;

    对所述藏文字串中检错结果为有错误的藏文字,做与没有错误的藏文字进行区分
    的标记。

    第四方面,本发明提供的一种藏文字串检错系统,包括:

    藏文字串获取模块,用于获取待检错的藏文字串;

    藏文字检错模块,用于按照所述藏文字串的顺序,将所述藏文字串中的每个藏文
    字依次按照本发明提供的任一项所述藏文字检错方法进行检错,获得每个所述藏文字各自
    的检错结果;

    错误文字标记模块,用于对所述藏文字串中检错结果为有错误的藏文字,做与没
    有错误的藏文字进行区分的标记。

    由上述技术方案可知,本发明提供的一种藏文字检错方法,首先,获取待检错的藏
    文字;然后,将所述待检错藏文字与预设的藏文字检错正则表达式进行匹配;最后,根据匹
    配是否成功判断所述待检错的藏文字是否有错误。相较于现有技术中利用字典匹配的方式
    进行藏文字检错的方法,本发明基于现代藏文字的构字规律,利用藏文字检错正则表达式
    进行藏文字的检错,具有占用处理器资源少、内存占用低、运行负荷小、检错效率高等优点。

    基于相同的发明构思,本发明还提供一种藏文字串检错方法,首先,获取待检错的
    藏文字串;然后,按照所述藏文字串的顺序,将所述藏文字串中的每个藏文字依次按照本发
    明提供的任一项所述藏文字检错方法进行检错,获得每个所述藏文字各自的检错结果;最
    后,对所述藏文字串中检错结果为有错误的藏文字,做与没有错误的藏文字进行区分的标
    记。本藏文字串检错方法基于上述藏文字检错方法实施,同样具有占用处理器资源少、内存
    占用低、运行负荷小、检错效率高等优点,此外,本方法将有错误的藏文字进行与没有错误
    的藏文字进行区分的标记,可以使用户能够在藏文字串中直观、快速的看到错误的藏文字,
    以帮助用户避免输入错误和校正遗漏。

    附图说明

    为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体
    实施方式或现有技术描述中所需要使用的附图作简单地介绍。在所有附图中,类似的元件
    或部分一般由类似的附图标记标识。附图中,各元件或部分并不一定按照实际的比例绘制。

    图1示出了本发明第一实施例所提供的一种藏文字检错方法的流程图;

    图2示出了本发明第二实施例所提供的一种藏文字检错系统的示意图。

    图3示出了本发明第三实施例所提供的一种藏文字串检错方法的流程图;

    图4示出了本发明第四实施例所提供的一种藏文字串检错系统的示意图。

    具体实施方式

    下面将结合附图对本发明技术方案的实施例进行详细的描述。以下实施例仅用于
    更加清楚地说明本发明的技术方案,因此只是作为示例,而不能以此来限制本发明的保护
    范围。

    需要注意的是,除非另有说明,本申请使用的技术术语或者科学术语应当为本发
    明所属领域技术人员所理解的通常意义。

    本发明提供一种藏文字检错方法及系统,以及一种藏文字串检错方法及系统。下
    面结合附图对本发明的实施例进行说明。

    图1示出了本发明第一实施例所提供的一种藏文字检错方法的流程图。如图1所
    示,本发明第一实施例提供的一种藏文字检错方法包括以下步骤:

    步骤S101:获取待检错的藏文字。

    步骤S102:将所述待检错藏文字与预设的藏文字检错正则表达式进行匹配。

    本发明中,发明人根据通过研究现代藏文字的构字规律,建立了与现代藏文字相
    应的藏文字检错正则表达式,通过将待检错的藏文字与该藏文字检错正则表达式进行匹配
    来进行检错,需要说明的是,由于藏文字历史悠久,其字体形式也是经历了漫长的发展、演
    变过程,本发明实施例提供的藏文字检错正则表达式是基于现代藏文字的构字规律提出
    的,因此,本发明实施例所提供的藏文字检错方法主要用于现代藏文字的检错。

    根据藏文字的构字规律,所述预设的藏文字检错正则表达式可以是以下任意一种
    正则表达式或任意多种正则表达式的组合:

    不叠加藏文字中前加字和基字组合的检错正则表达式,单字母藏文字和叠加藏文
    字中前加字、上加字、基字和下加字组合的检错正则表达式,藏文字元音的检错正则表达
    式,藏文字后加字及又后加字组合的检错正则表达式,藏文字后加字及紧缩字的检错正
    则表达式;

    其中,所述不叠加藏文字中前加字和基字组合的检错正则表达式具体为:


    所述单字母藏文字和叠加藏文字中前加字、上加字、基字和下加字组合的检错正
    则表达式具体为:


    所述藏文字元音的检错正则表达式具体为:


    所述藏文字后加字及又后加字组合的检错正则表达式具体为:


    所述藏文字后加字及紧缩字的检错正则表达式具体为:


    其中,上述每个正则表达式都是根据藏文字的构字规律总结形成的,例如:

    根据现代藏文文法,藏文字有五个前加字:每个前加字后可跟随的
    基字是有区别的:后可跟随基字后可跟随基字
    后可跟随基字后
    可跟随基字后可跟随基字

    基于此,可以建立不叠加藏文字中前加字和基字组合的检错正则表达式:


    又如,根据现代藏文文法,30个藏文字母可以在没有前加字、上加字、下加字时可
    以单独拼写现代藏文字,所以,建立检错正则表达式:


    另外,叠加藏文字因字性文法,有以下约束:

    前加字为后可放置的有
    字符串组字时相互独立的,所
    以,检错正则表达式可表示为:


    前加字后可加叠加的有检错正则表达式可表示为:


    前加字后可叠加的有检错正则表达式可表示为:


    前加字后可叠加的有检错正则表达式可表示为:


    无前加字而上加字为可叠加的有
    检错正则表达式可表示为:


    无前加字而上加字为的可叠加字有
    检错正则表达式可表示为:


    无前加字而上加字为的可叠加字有检错正则表
    达式可表示为:


    无前加字和上加字而下加字为的可叠加字有检错正则表
    达式可表示为:


    无前加字和上加字而下加字为的可叠加的字有
    检错正则表达式表示为:


    无前加字和上加字而下加字为的可叠加的字有检错正则表达
    式表示为:


    无前加字和上加字而下加字为的可叠加的字有
    检错正则表达式可表示为:


    基于此,可以建立单字母藏文字和叠加藏文字中前加字、上加字、基字和下加字组
    合的检错正则表达式:


    在本发明提供的一个实施例中,所述预设的藏文字检错正则表达式包括不叠加藏
    文字中前加字和基字组合的检错正则表达式,单字母藏文字和叠加藏文字中前加字、上加
    字、基字和下加字组合的检错正则表达式,藏文字元音的检错正则表达式,藏文字后加字及
    又后加字组合的检错正则表达式,藏文字后加字及紧缩字的检错正则表达式的组合,其
    组合形式如下:


    其中,rp表示藏文字检错正则表达式,p表示不叠加藏文字中前加字和基字组合的
    检错正则表达式,q表示单字母藏文字和叠加藏文字中前加字、上加字、基字和下加字组合
    的检错正则表达式,v表示藏文字元音的检错正则表达式,b表示藏文字后加字及又后加字
    组合的检错正则表达式,a表示藏文字后加字及紧缩字的检错正则表达式。

    对于上述组合的藏文字检错正则表达式的解释如下:

    正则表达式p所生成字串的第二个字符后有元音时,正则表达式b所生成的字串或
    正则表达式a所生成字串可存在也可不存在,如,所以,这时可建立藏文字的
    检错正则表达式:

    (p)v(b|a)?

    正则表达式p所生成字串的第二个字符后没有元音时,正则表达式b所生成的字
    串、正则表达式a生成字串和字符三者之一必需要存在,否则,不符合藏文字文法,如,
    是合法的,但不合法。所以,这时可建立藏文字的检错正则表达式:


    正则表达式q所生成的字串可独立成字,其后元音、正则表达式b所生成的字串、正
    则表达式a所生成字串都可存在也可不存在,如,都合法,但正则表达式b所生
    成的字串和正则表达式a所生成字串只能是二选一,否则如,不合法。所以,这时可建立
    藏文字的检错正则表达式:

    (q)(v)?(b|a)?

    将上述三种情形综合考虑,既可形成组合的藏文字检错正则表达式


    步骤S103:根据匹配是否成功判断所述待检错的藏文字是否有错误。

    本步骤的实施方式可以是:

    在匹配成功时,判断所述待检错的藏文字没有错误;

    在匹配不成功时,判断所述待检错的藏文字有错误。

    由于所述藏文字有可能是梵文字符,因此,在本发明提供的一个实施例中,对于匹
    配不成功的情况,还需要与梵文检错正则表达式进行匹配,以提高判断的准确性:所述在匹
    配不成功时,判断所述待检错的藏文字有错误,包括:

    在匹配不成功时,将所述待检错藏文字与预设的梵文检错正则表达式进行匹配;

    在与预设的梵文检错正则表达式匹配成功时,判断所述待检错的藏文字没有错
    误;

    在与预设的梵文检错正则表达式匹配不成功时,判断所述待检错的藏文字有错
    误。

    其中,所述预设的梵文检错正则表达式具体可以为:


    考虑到在检错完成后,需要将错误的藏文字进行突出显示,以使用户能够直观、快
    速的发现错误的藏文字,因此,在本发明提供的一个实施例中,在根据匹配是否成功判断所
    述待检错的藏文字是否有错误的步骤后,还包括:

    在所述待检错的藏文字有错误时,对所述藏文字做与检错前进行区分的标记。

    其中,做与检错前进行区分的标记,可以通过将有错误的藏文字的字体颜色、底纹
    颜色、下划线颜色进行变更,或者将有错误的藏文字的进行加粗、倾斜等处理,或者在文字
    底部增加下划线、波浪线等方式实现,也可以将以上方式以任意形式组合实现,例如,对有
    错误的藏文字做红色双波浪线下划线标记等等,只要能将有错误的藏文字与检错前进行区
    分,任何现有的标记方式都在本发明的保护范围之内,此处不再一一赘述,其均在本发明的
    保护范围之内。

    至此,通过步骤S101至步骤S103,完成了本发明第一实施例所提供的一种藏文字
    检错方法的流程。相较于现有技术中利用字典匹配的方式进行藏文字检错的方法,本发明
    基于现代藏文字的构字规律,利用藏文字检错正则表达式进行藏文字的检错,具有占用处
    理器资源少、内存占用低、运行负荷小、检错效率高等优点。

    在上述的第一实施例中,提供了一种藏文字检错方法,与之相对应的,本申请还提
    供一种藏文字检错系统。请参考图2,其为本发明第二实施例提供的一种藏文字检错系统的
    示意图。由于系统实施例基本相似于方法实施例,所以描述得比较简单,相关之处参见方法
    实施例的部分说明即可。下述描述的系统实施例仅仅是示意性的。

    本发明第二实施例提供的一种藏文字检错系统,包括:

    藏文字获取模块101,用于获取待检错的藏文字;

    藏文字匹配模块102,用于将所述待检错藏文字与预设的藏文字检错正则表达式
    进行匹配;

    藏文字判断模块103,用于根据匹配是否成功判断所述待检错的藏文字是否有错
    误。

    在本发明提供的一个实施例中,所述藏文字判断模块103,包括:

    匹配成功单元,用于在匹配成功时,判断所述待检错的藏文字没有错误;

    匹配不成功单元,用于在匹配不成功时,判断所述待检错的藏文字有错误。

    在本发明提供的一个实施例中,所述匹配不成功单元,包括:

    梵文匹配子单元,用于在匹配不成功时,将所述待检错藏文字与预设的梵文检错
    正则表达式进行匹配;

    梵文匹配成功子单元,用于在与预设的梵文检错正则表达式匹配成功时,判断所
    述待检错的藏文字没有错误;

    梵文匹配不成功子单元,用于在与预设的梵文检错正则表达式匹配不成功时,判
    断所述待检错的藏文字有错误。

    在本发明提供的一个实施例中,所述预设的梵文检错正则表达式具体为:


    在本发明提供的一个实施例中,所述预设的藏文字检错正则表达式包括不叠加藏
    文字中前加字和基字组合的检错正则表达式,单字母藏文字和叠加藏文字中前加字、上加
    字、基字和下加字组合的检错正则表达式,藏文字元音的检错正则表达式,藏文字后加字及
    又后加字组合的检错正则表达式,藏文字后加字及紧缩字的检错正则表达式中的任意
    一种正则表达式或任意多种正则表达式的组合;

    其中,所述不叠加藏文字中前加字和基字组合的检错正则表达式具体为:


    所述单字母藏文字和叠加藏文字中前加字、上加字、基字和下加字组合的检错正
    则表达式具体为:


    所述藏文字元音的检错正则表达式具体为:


    所述藏文字后加字及又后加字组合的检错正则表达式具体为:


    所述藏文字后加字及紧缩字的检错正则表达式具体为:


    在本发明提供的一个实施例中,所述预设的藏文字检错正则表达式包括不叠加藏
    文字中前加字和基字组合的检错正则表达式,单字母藏文字和叠加藏文字中前加字、上加
    字、基字和下加字组合的检错正则表达式,藏文字元音的检错正则表达式,藏文字后加字及
    又后加字组合的检错正则表达式,藏文字后加字及紧缩字的检错正则表达式的组合,其
    组合形式如下:


    其中,rp表示藏文字检错正则表达式,p表示不叠加藏文字中前加字和基字组合的
    检错正则表达式,q表示单字母藏文字和叠加藏文字中前加字、上加字、基字和下加字组合
    的检错正则表达式,v表示藏文字元音的检错正则表达式,b表示藏文字后加字及又后加字
    组合的检错正则表达式,a表示藏文字后加字及紧缩字的检错正则表达式。

    在本发明提供的一个实施例中,所述藏文字检错系统,还包括:

    错误标记模块,用于在所述待检错的藏文字有错误时,对所述藏文字做与检错前
    进行区分的标记。

    以上,为本发明第二实施例提供的一种藏文字检错系统的实施例说明。

    本发明提供的一种藏文字检错系统与上述藏文字检错方法出于相同的发明构思,
    具有相同的有益效果,此处不再赘述。

    本发明还提供一种藏文字串检错方法,请参考图3,图3示出了本发明第三实施例
    所提供的一种藏文字串检错方法的流程图。如图3所示,本发明第三实施例提供的一种藏文
    字串检错方法包括以下步骤:

    步骤S201:获取待检错的藏文字串。

    步骤S202:按照所述藏文字串的顺序,将所述藏文字串中的每个藏文字依次按照
    本发明提供的任一项所述藏文字检错方法进行检错,获得每个所述藏文字各自的检错结
    果。

    在本发明提供的一个实施例中,对藏文字串中的每个藏文字均通过藏文字检错正
    则表达式和梵文检错正则表达式进行检错,例如,首先将藏文字与藏文字检错正则表达式
    进行匹配,若匹配成功,则输出表示所述藏文字没有错误的检测结果;若匹配不成功,在将
    所述藏文字与梵文检错正则表达式进行匹配,若匹配成功,则输出表示所述藏文字没有错
    误的检测结果,若匹配不成功,则输出表示所述藏文字有错误的检测结果。

    步骤S203:对所述藏文字串中检错结果为有错误的藏文字,做与没有错误的藏文
    字进行区分的标记。

    其中,做与没有错误的藏文字进行区分的标记,可以通过将有错误的藏文字的字
    体颜色、底纹颜色、下划线颜色进行变更,或者将有错误的藏文字的进行加粗、倾斜等处理,
    或者在文字底部增加下划线、波浪线等方式实现,也可以将以上方式以任意形式组合实现,
    例如,对有错误的藏文字做红色双波浪线下划线标记等等,只要能将有错误的藏文字与没
    有错误的藏文字进行区分,任何现有的标记方式都在本发明的保护范围之内,此处不再一
    一赘述,其均在本发明的保护范围之内。

    至此,通过步骤S201至步骤S203,完成了本发明第三实施例所提供的一种藏文字
    串检错方法的流程。本藏文字串检错方法基于上述藏文字检错方法实施,同样具有占用处
    理器资源少、内存占用低、运行负荷小、检错效率高等优点,此外,本方法将有错误的藏文字
    进行与没有错误的藏文字进行区分的标记,可以使用户能够在藏文字串中直观、快速的看
    到错误的藏文字,以帮助用户避免输入错误和校正遗漏。

    在本发明提供的一个优选的实施例中,所述藏文字串检错方法可以通过VB.NET实
    现,具体代码如下:





    在上述的第三实施例中,提供了一种藏文字串检错方法,与之相对应的,本申请还
    提供一种藏文字串检错系统。请参考图4,其为本发明第四实施例提供的一种藏文字串检错
    系统的示意图。由于系统实施例基本相似于方法实施例,所以描述得比较简单,相关之处参
    见方法实施例的部分说明即可。下述描述的系统实施例仅仅是示意性的。

    本发明第四实施例提供的一种藏文字串检错系统,包括:

    藏文字串获取模块201,用于获取待检错的藏文字串;

    藏文字检错模块202,用于按照所述藏文字串的顺序,将所述藏文字串中的每个藏
    文字依次按照本发明提供的任一项所述藏文字检错方法进行检错,获得每个所述藏文字各
    自的检错结果;

    错误文字标记模块203,用于对所述藏文字串中检错结果为有错误的藏文字,做与
    没有错误的藏文字进行区分的标记。

    本发明提供的一种藏文字串检错系统与上述藏文字串检错方法出于相同的发明
    构思,具有相同的有益效果,此处不再赘述。

    在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示
    例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特
    点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不
    必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任
    一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技
    术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结
    合和组合。

    需要说明的是,附图中的流程图和框图显示了根据本发明的多个实施例的系统、
    方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的
    每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包
    含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实
    现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方
    框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而
    定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组
    合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件
    与计算机指令的组合来实现。

    本发明实施例所提供的藏文字检错系统和藏文字串检错系统可以是计算机程序
    产品,包括存储了程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行
    前面方法实施例中所述的方法,具体实现可参见方法实施例,在此不再赘述。

    所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、
    系统和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

    在本申请所提供的几个实施例中,应该理解到,所揭露的系统、系统和方法,可以
    通过其它的方式实现。以上所描述的系统实施例仅仅是示意性的,例如,所述单元的划分,
    仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可
    以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨
    论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,系统或单元的间接
    耦合或通信连接,可以是电性,机械或其它的形式。

    所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显
    示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个
    网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目
    的。

    另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以
    是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。

    所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以
    存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说
    对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计
    算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个
    人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
    而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存
    储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

    最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽
    管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依
    然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进
    行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术
    方案的范围,其均应涵盖在本发明的权利要求和说明书的范围当中。

    关 键  词:
    藏文 检错 方法 系统 字串
      专利查询网所有文档均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    0条评论

    还可以输入200字符

    暂无评论,赶快抢占沙发吧。

    关于本文
    本文标题:藏文字检错方法、系统及藏文字串检错方法、系统.pdf
    链接地址:https://www.zhuanlichaxun.net/p-6096839.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
    经营许可证编号:粤ICP备2021068784号-1