基于神经网络的智能歌词修改方法及辅助系统.pdf

上传人:宁*** 文档编号:9312867 上传时间:2021-05-13 格式:PDF 页数:13 大小:524.86KB
收藏 版权申诉 举报 下载
基于神经网络的智能歌词修改方法及辅助系统.pdf_第1页
第1页 / 共13页
基于神经网络的智能歌词修改方法及辅助系统.pdf_第2页
第2页 / 共13页
基于神经网络的智能歌词修改方法及辅助系统.pdf_第3页
第3页 / 共13页
文档描述:

《基于神经网络的智能歌词修改方法及辅助系统.pdf》由会员分享,可在线阅读,更多相关《基于神经网络的智能歌词修改方法及辅助系统.pdf(13页完成版)》请在专利查询网上搜索。

1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202010036493.X (22)申请日 2020.01.14 (71)申请人 成都嗨翻屋科技有限公司 地址 610041 四川省成都市高新区益州大 道中段722号1幢1单元12层1201号 (72)发明人 尹学渊祁松茂江天宇 (74)专利代理机构 成都睿道专利代理事务所 (普通合伙) 51217 代理人 贺理兴 (51)Int.Cl. G06F 40/289(2020.01) G06F 40/232(2020.01) G06F 16/683(2019.01) (54)发明名。

2、称 一种基于神经网络的智能歌词修改方法及 辅助系统 (57)摘要 本发明公开了一种基于神经网络的智能歌 词修改方法及辅助系统, 该系统应用该方法, 方 法包括歌词预测模型训练, 采用处理好的歌词训 练数据输入基本训练模型进行训练, 得到歌词预 测模型; 获取待修改歌词及歌词修改限定信息; 应用字符映射表将待修改歌词转换为预测模型 的输入数据, 待修改歌词中的欲替换词采用能区 分的标识字符标识; 将输入数据输入歌词预测模 型进行预测, 获取第一个标识字符对应的替换字 的概率分布向量; 根据歌词修改限定信息限定的 歌词修改模式执行修改操作; 输出替换候选歌 词。 能够将完整的或者半成品的歌词中指定。

3、的需 要替换的词进行优选替换, 对指定的韵脚和需要 押韵的句子生成一系列候选押韵词, 对整段歌词 指定段进行仿写。 权利要求书2页 说明书8页 附图2页 CN 111241829 A 2020.06.05 CN 111241829 A 1.一种基于神经网络的智能歌词修改方法, 其特征在于: 包括如下步骤: S1: 歌词预测模型训练, 采用处理好的歌词训练数据输入基本训练模型进行训练, 得到 歌词预测模型; S2: 获取待修改歌词及歌词修改限定信息; S3: 应用字符映射表将待修改歌词转换为预测模型的输入数据, 待修改歌词中的欲替 换词采用能区分的标识字符标识; S4: 将输入数据输入歌词预测模。

4、型进行预测, 获取第一个标识字符对应的替换字的概 率分布向量; S5: 根据歌词修改限定信息限定的歌词修改模式执行修改操作; S6: 输出替换候选歌词。 2.根据权利要求1所述的基于神经网络的智能歌词修改方法, 其特征在于: 所述的歌词 修改模式包括替换词推荐模式、 押韵词推荐模式和段落仿写模式; 所述的替换词推荐模式包括: S511: 根据第一个标识字符对应位置的概率分布向量提 取出概率从大到小排列的前n1个字符的数字编码; S512: 再将得到的数字编码替换预测模 型输入数据中第一个标识字符; 重复步骤S4-S511, 得到第二个标识字符的n2个数字编码; S513: 重复步骤S512, 。

5、直至预测模型输入数据中不存在标识字符,得到n1*n2*.*nm个候选 词, m为标识字符的数量, n1、 n2、 .nm为每个标识字符提取的数字编码的数量; 所述的押韵词推荐模式包括: S521: 根据第一个标识字符对应位置的概率分布向量提 取出概率从大到小排列的前n1个字符的数字编码; S522: 再将得到的数字编码替换预测模 型输入数据中第一个标识字符; 重复步骤S4和S521, 得到第二个标识字符的替换词的数字 编码; S523: 重复步骤S522, 直至预测模型输入数据中不存在标识字符, 得到多个替换词, 然 后筛选出符合押韵规则的押韵替换词; 所述的段落仿写模式包括整段仿写模式和分词。

6、整段仿写模式; 整段仿写模式包括: S5311: 根据第一个标识字符对应位置的概率分布向量提取出概率 从大到小排列的前n个字符的数字编码; S5312: 再将得到的数字编码替换预测模型输入数 据中第一个标识字符; 重复步骤S4和S5311, 得到第二个标识字符的数字编码, 取概率最大 的字符的数字编码; S5313: 重复步骤S5312, 直至预测模型输入数据中不存在标识字符, 得 到n个候选段落; 分词整段仿写模式还包括分词步骤: 将段落中的句进行分词, 应用字符映射表将分词 后的段落转换为预测模型的输入数据, 待修改歌词中的分词后的第一个欲替换词采用能区 分的标识字符标识; S5321: 。

7、将输入数据输入歌词预测模型进行预测, 获取第一个标识字符 对应的替换字的概率分布向量; S5321: 根据第一个标识字符对应位置的概率分布向量提取 出概率从大到小排列的前n1个字符的数字编码; S5322: 再将得到的数字编码替换预测模型 输入数据中第一个标识字符; 重复步骤S4和S5321, 得到第二个标识字符的n2个数字编码; S5323: 重复步骤S5322, 直至预测模型输入数据中不存在标识字符, n1*n2*.*nm个候选 词; S5324: 从候选词中选择n个替换词, 依次使用替换词替换段落中的第一个欲替换词, 将 替换后的段落转换为预测模型的输入数据, 待修改歌词中的分词后的第二。

8、个欲替换词采用 能区分的标识字符标识; S5325: 重复S4和S5321-S5324, 直至段落中不存在未替换的分词, 得到多个候选段落。 权利要求书 1/2 页 2 CN 111241829 A 2 3.根据权利要求1所述的基于神经网络的智能歌词修改方法, 其特征在于: 所述的歌词 修改限定信息包括欲替换词在待修改歌词中的位置、 押韵韵脚、 歌词段落的范围以及具体 的歌词修改模式。 4.根据权利要求1所述的基于神经网络的智能歌词修改方法, 其特征在于: 所述的基本 训练模型为能够根据上下文预测某位置的字符的模型。 5.根据权利要求2所述的基于神经网络的智能歌词修改方法, 其特征在于: 所述。

9、的替换 词推荐模式还包括概率过滤步骤: 根据第一个标识字符对应位置的概率分布向量进行概率 过滤。 6.根据权利要求5所述的基于神经网络的智能歌词修改方法, 其特征在于: 所述的概率 过滤基于概率值的绝对大小选取一个阈值, 筛选保留概率值绝对值大于阈值的对应字符结 果。 7.根据权利要求5所述的基于神经网络的智能歌词修改方法, 其特征在于: 所述的概率 过滤基于每个字符的概率与前几个字符的概率均值的比值作为阈值, 筛选保留比值大于阈 值的对应字符结果。 8.根据权利要求2所述的基于神经网络的智能歌词修改方法, 其特征在于: 所述的段落 仿写模式还包括无具体意义词的候选跳过步骤: 在获取歌词修改限。

10、定信息时限定无具体意 义词不修改。 9.应用权利要求1-8中任意一项所述的基于神经网络的智能歌词修改方法的辅助系 统, 其特征在于: 包括预测模型训练模块、 待预测歌词数据预处理模块、 待修改歌词录入模 块、 限定信息设置模块、 替换候选歌词推荐模块和歌词预测模块; 所述的待预测歌词数据预处理模块应用字符映射表将待修改歌词转换为预测模型的 输入数据, 待修改歌词中的欲替换词采用能区分的标识字符标识; 所述的预测模型训练模块采用处理好的歌词训练数据输入基本训练模型进行训练, 得 到歌词预测模型; 所述的待修改歌词录入模块用于用户录入待修改的歌词; 所述的限定信息设置模块用于用户设置歌词修改限定信。

11、息; 所述的替换候选歌词推荐模块用于展示歌词预测模块预测得到的候选歌词; 所述的歌词预测模块采用歌词预测模型根据限定信息和歌词信息预测候选歌词。 权利要求书 2/2 页 3 CN 111241829 A 3 一种基于神经网络的智能歌词修改方法及辅助系统 技术领域 0001 本发明属于歌词创作方法技术领域, 具体地说, 涉及一种基于神经网络的智能歌 词修改方法及辅助系统。 背景技术 0002 音乐在人们的生活中发挥着不可替代的作用, 不同的音乐能够带给人不同的体 验, 舒缓的音乐有助于睡眠, 快节奏的音乐能够让人兴奋等等。 音乐的组成包括乐曲和歌 词。 在进行音乐创作过程中往往采用的是根据乐曲填。

12、词或者根据歌词谱曲。 随着网络的发 展, 经典乐曲重新填词重新演绎赋予乐曲新的含义在网络上也蓬勃发展。 但是无论是创作 全新的乐曲歌词还是旧曲作词, 旧词谱曲都需要创作人员具有一定的音乐基础, 以达到创 作的音乐能带给人较好的体验。 0003 申请号为201710939775.9的发明专利一种押韵歌词的生成方法和装置提供了一 种押韵歌词的生成方法, 包括: 对终端中已输入的多张图像分别进行场景识别, 生成分别匹 配于所述多张图像对应的场景的描述文字; 从所述每张图像对应的场景匹配出的描述文字 中获取所述描述文字中最后一个词所对应的汉语拼音和韵脚; 根据所述描述文字中最后一 个词所对应的汉语拼音。

13、和韵脚生成对应于所述多张图像的押韵歌词, 其中, 每张图像对应 的押韵歌词与该图像对应场景匹配出的描述文字的最后一个词具有相同的韵脚。 0004 该方案中生成押韵歌词的方式为仅根据描述文字中最后一个词所对应的汉语拼 音和韵脚生成对应于所述多张图像的押韵歌词, 没有结合前后文和上下文进行处理, 也没 有提供押韵词的候选词; 仅对押韵歌词进行生成, 对其他不是一个词的连续字符的生成效 果较差。 发明内容 0005 针对现有技术中上述的不足, 本发明提供一种基于神经网络的智能歌词修改方法 及辅助系统, 该方法能够将完整的或者半成品的歌词中指定的需要替换的词进行优选替 换, 对指定的韵脚和需要押韵的句。

14、子生成一系列候选押韵词, 对整段歌词指定段进行仿写, 降低音乐创作对创作人的音乐基础需求, 降低创作人重复结构写作的难度, 该系统应用该 方法, 用户操作简单, 创作速度快。 0006 为了达到上述目的, 本发明采用的解决方案是: 一种基于神经网络的智能歌词修 改方法, 包括如下步骤: 0007 S1: 歌词预测模型训练, 采用处理好的歌词训练数据输入基本训练模型进行训练, 得到歌词预测模型; 0008 S2: 获取待修改歌词及歌词修改限定信息; 0009 S3: 应用字符映射表将待修改歌词转换为预测模型的输入数据, 待修改歌词中的 欲替换词采用能区分的标识字符标识; 0010 S4: 将输入。

15、数据输入歌词预测模型进行预测, 获取第一个标识字符对应的替换字 说明书 1/8 页 4 CN 111241829 A 4 的概率分布向量; 0011 S5: 根据歌词修改限定信息限定的歌词修改模式执行修改操作; 歌词修改模式包 括替换词推荐模式、 押韵词推荐模式和段落仿写模式; 0012 所述的替换词推荐模式包括: S511: 根据第一个标识字符对应位置的概率分布向 量提取出概率从大到小排列的前n1个字符的数字编码; S512: 再将得到的数字编码替换预 测模型输入数据中第一个标识字符; 重复步骤S4-S511, 得到第二个标识字符的n2个数字编 码; S513: 重复步骤S512, 直至预测。

16、模型输入数据中不存在标识字符,得到n1*n2*.*nm个 候选词, m为标识字符的数量, n1、 n2、 .nm为每个标识字符提取的数字编码的数量; 所述的 押韵词推荐模式包括: S521: 根据第一个标识字符对应位置的概率分布向量提取出概率从 大到小排列的前n1个字符的数字编码; S522: 再将得到的数字编码替换预测模型输入数据 中第一个标识字符; 重复步骤S4和S521, 得到第二个标识字符的替换词的数字编码; S523: 重复步骤S522, 直至预测模型输入数据中不存在标识字符, 得到多个替换词, 然后筛选出符 合押韵规则的押韵替换词; 0013 所述的段落仿写模式包括整段仿写模式和分。

17、词整段仿写模式; 0014 整段仿写模式包括: S5311: 根据第一个标识字符对应位置的概率分布向量提取出 概率从大到小排列的前n个字符的数字编码; S5312: 再将得到的数字编码替换预测模型输 入数据中第一个标识字符; 重复步骤S4和S5311, 得到第二个标识字符的数字编码, 取概率 最大的字符的数字编码; S5313: 重复步骤S5312, 直至预测模型输入数据中不存在标识字 符, 得到n个候选段落; 0015 分词整段仿写模式还包括分词步骤: 将段落中的句进行分词, 应用字符映射表将 分词后的段落转换为预测模型的输入数据, 待修改歌词中的分词后的第一个欲替换词采用 能区分的标识字符。

18、标识; S5321: 将输入数据输入歌词预测模型进行预测, 获取第一个标识 字符对应的替换字的概率分布向量; S5321: 根据第一个标识字符对应位置的概率分布向量 提取出概率从大到小排列的前n1个字符的数字编码; S5322: 再将得到的数字编码替换预测 模型输入数据中第一个标识字符; 重复步骤S4和S5321, 得到第二个标识字符的n2个数字编 码; S5323: 重复步骤S5322, 直至预测模型输入数据中不存在标识字符, n1*n2*.*nm个候 选词; S5324: 从候选词中选择n个替换词, 依次使用替换词替换段落中的第一个欲替换词, 将替换后的段落转换为预测模型的输入数据, 待修。

19、改歌词中的分词后的第二个欲替换词采 用能区分的标识字符标识; S5325: 重复S4和S5321-S5324, 直至段落中不存在未替换的分 词, 得到多个候选段落; 0016 S6: 输出替换候选歌词。 0017 所述的歌词修改限定信息包括欲替换词在待修改歌词中的位置、 押韵韵脚、 歌词 段落的范围以及具体的歌词修改模式。 0018 所述的基本训练模型为能够根据上下文预测某位置的字符的模型。 0019 所述的替换词推荐模式还包括概率过滤步骤: 根据第一个标识字符对应位置的概 率分布向量进行概率过滤, 概率过滤的方式包括两种可选方案, 第一种可选方案为: 基于概 率值的绝对大小选取一个阈值, 筛。

20、选保留概率值绝对值大于阈值的对应字符结果; 第二种 可选方案为: 基于每个字符的概率与前几个字符的概率均值的比值作为阈值, 筛选保留比 值大于阈值的对应字符结果。 说明书 2/8 页 5 CN 111241829 A 5 0020 所述的段落仿写模式还包括无具体意义词的候选跳过步骤: 在获取歌词修改限定 信息时限定无具体意义词不修改。 0021 应用所述的基于神经网络的智能歌词修改方法的辅助系统, 包括预测模型训练模 块、 待预测歌词数据预处理模块、 待修改歌词录入模块、 限定信息设置模块、 替换候选歌词 推荐模块和歌词预测模块; 0022 所述的待预测歌词数据预处理模块应用字符映射表将待修改。

21、歌词转换为预测模 型的输入数据, 待修改歌词中的欲替换词采用能区分的标识字符标识; 0023 所述的预测模型训练模块采用处理好的歌词训练数据输入基本训练模型进行训 练, 得到歌词预测模型; 0024 所述的待修改歌词录入模块用于用户录入待修改的歌词; 0025 所述的限定信息设置模块用于用户设置歌词修改限定信息; 0026 所述的替换候选歌词推荐模块用于展示歌词预测模块预测得到的候选歌词; 0027 所述的歌词预测模块采用歌词预测模型根据限定信息和歌词信息预测候选歌词。 0028 本发明的有益效果是: 0029 (1)该方法能够将完整的或者半成品的歌词中指定的需要替换的词进行优选替 换, 对指。

22、定的韵脚和需要押韵的句子生成一系列候选押韵词, 对整段歌词指定段进行仿写, 降低音乐创作对创作人的音乐基础需求, 降低创作人重复结构写作的难度, 有效提高歌词 创作的质量, 该系统应用该方法, 用户操作简单, 创作速度快。 附图说明 0030 图1为本发明智能歌词修改方法流程图; 0031 图2为本发明智能歌词修改辅助系统框图; 0032 图3为数据预处理流程图。 具体实施方式 0033 以下结合附图对本发明作进一步描述: 0034 如图1所示, 一种基于神经网络的智能歌词修改方法, 包括如下步骤: 0035 S1: 歌词预测模型训练, 采用处理好的歌词训练数据输入基本训练模型进行训练, 得到。

23、歌词预测模型, 基本训练模型采用能够根据上下文预测某位置的字符的模型; 0036 S2: 获取待修改歌词及歌词修改限定信息, 歌词修改限定信息包括欲替换词在待 修改歌词中的位置、 押韵韵脚、 歌词段落的范围以及具体的歌词修改模式; 0037 S3: 应用字符映射表将待修改歌词转换为预测模型的输入数据, 待修改歌词中的 欲替换词采用能区分的标识字符标识; 0038 S4: 将输入数据输入歌词预测模型进行预测, 获取第一个标识字符对应的替换字 的概率分布向量; 0039 S5: 根据歌词修改限定信息限定的歌词修改模式执行修改操作; 歌词修改模式包 括替换词推荐模式、 押韵词推荐模式和段落仿写模式;。

24、 0040 所述的替换词推荐模式包括: S511: 根据第一个标识字符对应位置的概率分布向 量提取出概率从大到小排列的前n1个字符的数字编码; S512: 再将得到的数字编码替换预 说明书 3/8 页 6 CN 111241829 A 6 测模型输入数据中第一个标识字符; 重复步骤S4-S511, 得到第二个标识字符的n2个数字编 码; S513: 重复步骤S512, 直至预测模型输入数据中不存在标识字符,得到n1*n2*.*nm个 候选词, m为标识字符的数量, n1、 n2、 .nm为每个标识字符提取的数字编码的数量; 所述的 押韵词推荐模式包括: S521: 根据第一个标识字符对应位置的。

25、概率分布向量提取出概率从 大到小排列的前n1个字符的数字编码; S522: 再将得到的数字编码替换预测模型输入数据 中第一个标识字符; 重复步骤S4和S521, 得到第二个标识字符的替换词的数字编码; S523: 重复步骤S522, 直至预测模型输入数据中不存在标识字符, 得到多个替换词, 然后筛选出符 合押韵规则的押韵替换词; 0041 所述的段落仿写模式包括整段仿写模式和分词整段仿写模式; 0042 整段仿写模式包括: S5311: 根据第一个标识字符对应位置的概率分布向量提取出 概率从大到小排列的前n个字符的数字编码; S5312: 再将得到的数字编码替换预测模型输 入数据中第一个标识字。

26、符; 重复步骤S4和S5311, 得到第二个标识字符的数字编码, 取概率 最大的字符的数字编码; S5313: 重复步骤S5312, 直至预测模型输入数据中不存在标识字 符, 得到n个候选段落; 0043 分词整段仿写模式还包括分词步骤: 将段落中的句进行分词, 应用字符映射表将 分词后的段落转换为预测模型的输入数据, 待修改歌词中的分词后的第一个欲替换词采用 能区分的标识字符标识; S5321: 将输入数据输入歌词预测模型进行预测, 获取第一个标识 字符对应的替换字的概率分布向量; S5321: 根据第一个标识字符对应位置的概率分布向量 提取出概率从大到小排列的前n1个字符的数字编码; S5。

27、322: 再将得到的数字编码替换预测 模型输入数据中第一个标识字符; 重复步骤S4和S5321, 得到第二个标识字符的n2个数字编 码; S5323: 重复步骤S5322, 直至预测模型输入数据中不存在标识字符, n1*n2*.*nm个候 选词; S5324: 从候选词中选择n个替换词, 依次使用替换词替换段落中的第一个欲替换词, 将替换后的段落转换为预测模型的输入数据, 待修改歌词中的分词后的第二个欲替换词采 用能区分的标识字符标识; S5325: 重复S4和S5321-S5324, 直至段落中不存在未替换的分 词, 得到多个候选段落; 0044 S6: 输出替换候选歌词。 0045 所述的。

28、替换词推荐模式还包括概率过滤步骤: 根据第一个标识字符对应位置的概 率分布向量进行概率过滤, 概率过滤的方式包括两种可选方案, 第一种可选方案为: 基于概 率值的绝对大小选取一个阈值, 筛选保留概率值绝对值大于阈值的对应字符结果; 第二种 可选方案为: 基于每个字符的概率与前几个字符的概率均值的比值作为阈值, 筛选保留比 值大于阈值的对应字符结果。 0046 如图2所示, 应用所述的基于神经网络的智能歌词修改方法的辅助系统, 包括预测 模型训练模块、 待预测歌词数据预处理模块、 待修改歌词录入模块、 限定信息设置模块、 替 换候选歌词推荐模块和歌词预测模块; 0047 所述的待预测歌词数据预处。

29、理模块应用字符映射表将待修改歌词转换为预测模 型的输入数据, 待修改歌词中的欲替换词采用能区分的标识字符标识; 0048 所述的预测模型训练模块采用处理好的歌词训练数据输入基本训练模型进行训 练, 得到歌词预测模型; 0049 所述的待修改歌词录入模块用于用户录入待修改的歌词; 说明书 4/8 页 7 CN 111241829 A 7 0050 所述的限定信息设置模块用于用户设置歌词修改限定信息; 0051 所述的替换候选歌词推荐模块用于展示歌词预测模块预测得到的候选歌词; 0052 所述的歌词预测模块采用歌词预测模型根据限定信息和歌词信息预测候选歌词。 0053 在本发明的一个实施例中, 基。

30、本训练模型采用bert模型, 欲替换词采用掩码字符 标识, bert模型能根据上下文预测某位置字符的或者仅利用上文预测后续字符, 即可以实 现保持原来语句结构的前提下推荐一些替代候选词, 模型中的注意力机制可以使推荐词与 歌词主题密切相关, 在保证段落和句子结构不变的条件下生成结构相仿的段落推荐。 0054 歌词预测模型训练时, 首先进行歌词训练数据预处理, 数据预处理过程如图3所 示: 0055 a.歌词文本(无需分类)数据去除敏感词、 重复句、 重复字构成的句子及非中文字 符和非歌词内容语句, 保留必要的标点符号; 0056 b.将过滤后的歌词文本转换为能在解析时同时区分不同的句和不同歌词。

31、的格式。 例如: 每行一句, 不同歌词用空行隔开。 0057 c.将文本数据分为训练集文本和验证集文本。 0058 d.据使用的字符集, 构建一个字符映射表(字符映射到整数编号)。 为减少字符集 映射表的大小, 可以对英文单词的字符的表示做一定的信息压缩, 例如采用字节对编码 (BPE)对数据进行压缩。 0059 e.将训练数文本和验证文本编码为数字格式, 并根据batchsize的大小将其转换 为TFRecord等便于在硬盘进行序列化读取的格式分别保存下来(训练集和验证集各对应一 个文件)。 0060 (a)训练数据包含了输入数据, 和正确输出数据, 输入数据为编码后的一段文本序 列, 用一。

32、种掩码字符(也需转为数字表示)随机替换一部分输入序列的字符, 并记录被替换 字符的位置信息和被替换的字符表示, 用来作为输出信息指导模型训练。 0061 (b)多任务训练可以有效提升模型的泛化性能及加速训练速度。 若采用多任务训 练的方式, 可以在输入序列中加入特定的任务标识符, 对应的输出信息也可以根据具体任 务添加和改动。 如: 判断是否为上下文的任务。 0062 训练过程直接使用bert模型公开的训练超参数, 对于多任务训练, 每个任务的 loss一般可以直接相加作为总loss。 训练数据处理完成后, 读入用中文维基百科, 新闻等预 料训练的预训练的bert中文模型, 然后在歌词数据上执。

33、行训练过程, 通过正确预测训练数 文本中的输入数据对应的输出结果, 不断调整网络的连接权重, 直到(总)loss不再明显下 降,则为收敛。 导出模型作为歌词预测模型, 供预测使用。 0063 将训练集输入bert模型进行训练后会输出一个和字符映射表相同长度的概率分 布向量, 代表了字符映射表中的每个字符是当前上下文对应的下一个字符的概率。 取概率 按从大到小顺序的前n个字符作为候选字符。 0064 循环的利用每次预测单个字的输出进行组合, 得到词、 句、 段的候选。 0065 Bert的输入为三个向量。 字向量, 文本向量, 位置向量(不需要用户输入, 自动计算 得出)。 向量长度为128(亦。

34、可为256等较大的值) 0066 字向量: 原始的数组每个元素为一个汉字, 除此之外还有三个其他的符号, 位于向 量首位的CLS, 位于向量中部和末尾的SEP(中部的符号位置可以是随机的, 也可以是固 说明书 5/8 页 8 CN 111241829 A 8 定的, 但一般置于一句话之后, 即该符号不能置于一个句子的中部)。 除此之外, 掩码字符 MASK用来替换限定信息指定的位置的字符(CLS,SEP,MASK字符可被替换为任意的 能区分的标识)。 再将该字符表示的数组参照对应字符映射表转换为数字索引表示的向量, 即为字向量。 0067 文本向量: 该向量用来区分不同的段, 主要作用于文本分。

35、类任务。 对于本任务而 言, 随机的或固定的将歌词分为A,B两段后, 对于A段的每个字符位置(包括控制符, 即第一 个SEP符号本身及之前的字符位置)用数字0表示, B段用1来表示(即第一个SEP符号之 后的所有字符位置)。 0068 位置向量: 依据相对编码的正余弦公式计算得到, 为公开的标准操作。 0069 训练获得歌词预测模型后需要获取待修改的歌词及歌词修改限定信息, 待修改的 歌词可以是一整段, 也可以是一句。 歌词修改限定信息包括欲替换词在待修改歌词中的位 置、 押韵韵脚、 歌词段落的范围以及具体的歌词修改模式, 欲替换词的位置可以是任何位 置, 也可以是不属于一个词的连续字符。 押。

36、韵处理的句子可以是单押、 双押甚至是多押, 押 韵替换词一般限定为句末对应的几个字。 具体的歌词修改模式包括替换词推荐模式、 押韵 词推荐模式和段落仿写模式。 0070 在本发明的一个实施例中, 用户选择的歌词修改模式为替换词推荐模式。 在替换 词推荐模式下, 系统获取待修改的歌词后, 应用字符映射表将其转换为预测模型的输入数 据, 欲替换词采用掩码字符标识; 然后将输入数据输入歌词预测模型进行预测, 获取第一个 掩码字符对应的替换字的概率分布向量; 将第一个掩码字符对应位置的概率从大到小排 列, 得到位置索引向量(该向量每个元素表示了在字符引射表中的一个字符), 即通过数字 表示的对应于第一。

37、个掩码字符的单个字符的推荐列表, 提取出概率从大到小排列的前n1个 字符的数字编码, 依次用于替换预测模型输入数据中第一个掩码字符, 得到新的输入数据, 再将新的输入数据输入歌词预测模型进行预测, 获取第二个掩码字符对应的替换字的概率 分布向量, 选择其中的n2个, 得到n2个第二个掩码字符的数字编码, 此时获取的候选推荐为 n1*n2个, 第三个掩码字符的候选数字编码获取方式预第二个掩码字符的方式相同, 其余掩 码字符获取方式依次类推, 直至预测模型输入数据中不存在掩码字符, 得到n1*n2*.*nm 个候选词, m为掩码字符的数量, n1、 n2、 .nm为每个掩码字符提取的数字编码的数量。

38、, n1、 n2、 .nm可以自己设定。 在实际使用中, n1设定为多个, n2一般选择1-3个, n3、 .nm一般仅 选择1个, 以避免产生非常多不合适的替换词。 0071 可选的, 获取对应于第一个掩码字符的单个字符的推荐列表后, 可以根据第一个 标识字符对应位置的概率分布向量进行概率过滤。 0072 第一种概率过滤方式为: 基于概率值的绝对大小选取一个阈值, 筛选保留概率值 绝对值大于阈值的对应字符结果。 0073 第二种概率过滤方式为: 基于每个字符的概率与前几个字符的概率均值的比值作 为阈值, 筛选保留比值大于阈值的对应字符结果。 具体前几个字符根据测试的效果经验获 取。 0074。

39、 在本发明的另一个实施例中, 用户选择的歌词修改模式为押韵词推荐模式。 在押 韵词推荐模式下, 待修改的歌词中的欲修改词的位置限定为句末的两个或多个字, 由押韵 方式决定。 系统获取待修改的歌词后, 应用字符映射表将其转换为预测模型的输入数据, 欲 说明书 6/8 页 9 CN 111241829 A 9 替换词采用掩码字符标识; 然后将输入数据输入歌词预测模型进行预测, 获取第一个掩码 字符对应的替换字的概率分布向量; 将第一个掩码字符对应位置的概率从大到小排列, 得 到位置索引向量(该向量每个元素表示了在字符引射表中的一个字符), 即通过数字表示的 对应于第一个掩码字符的单个字符的推荐列表。

40、, 提取出概率从大到小排列的前n1个字符的 数字编码, 依次用于替换预测模型输入数据中第一个掩码字符, 得到新的输入数据, 再将新 的输入数据输入歌词预测模型进行预测, 获取第二个掩码字符对应的替换字的概率分布向 量, 选择其中的n2个, 得到n2个第二个掩码字符的数字编码, 此时获取的候选推荐为n1*n2 个, 第三个掩码字符的候选数字编码获取方式预第二个掩码字符的方式相同, 其余掩码字 符获取方式依次类推, 直至预测模型输入数据中不存在标识字符, 得到n1*n2*.*nm个候 选词, m为掩码字符的数量, n1、 n2、 .nm为每个掩码字符提取的数字编码的数量, n1、 n2、 .nm可。

41、以自己设定。 采用押韵规则过滤出满足押韵要求的词, 作为押韵替换词输出。 押 韵规则采用十三辙规则。 具体的, 对于单押, 只将韵母相同视为押韵, 即对比候选词与指定 韵脚的韵母是否相同来进行筛选, 将筛选后的结果返回。 对于双押, 则按三个优先级来依次 过滤, 且三个优先级输出的候选项没有交集, 这三个优先级依次是: 同韵母+同声调, 仅同韵 母或仅同声调, 单押。 多押情形与双押大体一致, 只是对于第三优先级则依次降级来输出 (如四押的第三级包括三押, 双押, 单押)。 0075 可选的, 在押韵词推荐模式下, 获取待修改歌词后, 为了确定末尾词, 可以先分词 后再进行候选词推荐, 若是末。

42、尾词的字数少于押韵字的要求, 可以向前以词尾的那位扩展, 形成一个大词再进行替换词推荐计算。 0076 在本发明的另一个实施例中, 用户选择的歌词修改模式为段落仿写模式。 在段落 仿写模式下, 获取待修改的歌词后需要先将段中的句分词, 再应用字符映射表将分词后的 段落转换为预测模型的输入数据, 待修改歌词中的欲替换词采用能区分的标识字符标识。 分词可以采用结巴或者foolnltk等工具。 0077 然后将输入数据输入歌词预测模型进行预测, 获取第一个标识字符对应的替换字 的概率分布向量; 将第一个标识字符对应位置的概率从大到小排列, 得到位置索引向量(该 向量每个元素表示了在字符引射表中的一个。

43、字符), 即通过数字表示的对应于第一个掩码 字符的单个字符的推荐列表, 提取出概率从大到小排列的前n1个字符的数字编码, 依次用 于替换预测模型输入数据中第一个掩码字符, 得到新的输入数据, 再将新的输入数据输入 歌词预测模型进行预测, 获取第二个掩码字符对应的替换字的概率分布向量, 选择其中的 n2个, 得到n2个第二个掩码字符的数字编码, 此时获取的候选推荐为n1*n2个, 第三个掩码 字符的候选数字编码获取方式与第二个掩码字符的方式相同, 其余掩码字符获取方式依次 类推, 直至预测模型输入数据中不存在掩码字符, 得到n1*n2*.*nm个候选词组成的段落。 在实际使用中, n1设定为多个。

44、, n2、 n3、 .nm一般仅选择1个, 以避免产生非常多的改写段 落。 这种方式产生的候选段落多样性好, 但是结构与待替换歌词的结构相似性较差。 0078 段落仿写模式还包括另一种可替换的仿写方式。 首先将段落中的句进行分词, 应 用字符映射表将分词后的段落转换为预测模型的输入数据, 待修改歌词中的分词后的第一 个欲替换词采用掩码标识, 其余欲替换词不使用掩码标识; 将输入数据输入歌词预测模型 进行预测, 获取第一个掩码字符对应的替换字的概率分布向量; 根据第一个掩码字符对应 位置的概率分布向量提取出概率从大到小排列的前n1个字符的数字编码; 再将得到的数字 说明书 7/8 页 10 CN。

45、 111241829 A 10 编码替换预测模型输入数据中第一个掩码字符; 得到新的输入数据, 再将新的输入数据输 入歌词预测模型进行预测, 获取第二个掩码字符对应的替换字的概率分布向量, 选择其中 的n2个字符的数字编码, 第三个掩码字符的候选数字编码获取方式与第二个掩码字符的方 式相同, 其余掩码字符获取方式依次类推, 直至预测模型输入数据中不存在掩码字符; 得到 第一个欲替换词的多个候选词, 从中选择n个替换词, 依次使用替换词替换段落中的第一个 欲替换词, 将替换后的段落转换为预测模型的输入数据, 待修改歌词中的分词后的第二个 欲替换词采用掩码字符标识, 重复第一个欲替换词产生候选词的。

46、过程, 得到不同的第一个 替换词各自对应的第二个欲替换词的多个候选词, 对不同的第一个替换词, 各选择一个第 二个欲替换词的候选词, 得到n个第一个替换词与第二个替换词的组合; 第三个欲替换词的 获取方式与第二个欲替换词方式相同, 依次类推, 直至段落中不存在欲替换词, 生成n个改 写段落。 这种方式生成的改写段落句子结构与改写歌词的句子结构相似性更好, 但是替换 段落的多样性相对较差。 0079 可选的, 段落仿写模式还包括无具体意义词的候选跳过步骤: 在获取歌词修改限 定信息时限定无具体意义词不修改, 直接保留该词到原句, 无具体意义的词包括连词, 介词 等。 0080 可选的, 为了实现。

47、一些特殊需求, 可以对候选词的词性进行过滤(举例来说, 每个 位置可以限定候选词与原词词性相同, 如都是名词, 都是动词等。 0081 在本申请方法的其他实施例中可以采用上下文模型作为基本训练模型, 例如bi- lstm等。 0082 以上所述实施例仅表达了本发明的具体实施方式, 其描述较为具体和详细, 但并 不能因此而理解为对本发明专利范围的限制。 应当指出的是, 对于本领域的普通技术人员 来说, 在不脱离本发明构思的前提下, 还可以做出若干变形和改进, 这些都属于本发明的保 护范围。 说明书 8/8 页 11 CN 111241829 A 11 图1 图2 说明书附图 1/2 页 12 CN 111241829 A 12 图3 说明书附图 2/2 页 13 CN 111241829 A 13 。

展开阅读全文
内容关键字: 基于 神经网络 智能 歌词 修改 方法 辅助 系统
关于本文
本文标题:基于神经网络的智能歌词修改方法及辅助系统.pdf
链接地址:https://www.zhuanlichaxun.net/pdf/9312867.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1