基于自然语言模型的智能匹配系统及方法.pdf

上传人:00062****4422 文档编号:14525562 上传时间:2024-05-19 格式:PDF 页数:20 大小:1.97MB
收藏 版权申诉 举报 下载
基于自然语言模型的智能匹配系统及方法.pdf_第1页
第1页 / 共20页
基于自然语言模型的智能匹配系统及方法.pdf_第2页
第2页 / 共20页
基于自然语言模型的智能匹配系统及方法.pdf_第3页
第3页 / 共20页
文档描述:

《基于自然语言模型的智能匹配系统及方法.pdf》由会员分享,可在线阅读,更多相关《基于自然语言模型的智能匹配系统及方法.pdf(20页完成版)》请在专利查询网上搜索。

1、(19)国家知识产权局(12)发明专利申请(10)申请公布号 (43)申请公布日 (21)申请号 202410014474.5(22)申请日 2024.01.05(71)申请人 一站发展(北京)云计算科技有限公司地址 100192 北京市海淀区西小口路66号中关村东升科技园北领地C-1楼2层209室(72)发明人 杨德川杨海宁张丙锐李龙飞(74)专利代理机构 北京惟专知识产权代理事务所(普通合伙)16074专利代理师 赵星(51)Int.Cl.G06F 40/289(2020.01)G06F 40/30(2020.01)G06N 3/0442(2023.01)(54)发明名称基于自然语言模型的。

2、智能匹配系统及方法(57)摘要本申请涉及自然语言处理技术领域,其具体地公开了一种基于自然语言模型的智能匹配系统及方法,其采用基于深度学习的自然语言处理技术来分析用户输入的剧本需求描述和备选剧本内容的文本描述之间的语义交叉关联特征,进而来判断备选剧本与用户需求的匹配度是否达到预定要求。这样,能够更准确地理解用户需求,提高查询效果,从而提升整体的用户体验和服务质量。权利要求书3页 说明书10页 附图6页CN 117521652 A2024.02.06CN 117521652 A1.一种基于自然语言模型的智能匹配方法,其特征在于,包括:获取用户输入的查询剧本需求描述;获取备选剧本内容的文本描述;对所。

3、述查询剧本需求描述进行语义理解和情感分析以得到包含情感倾向信息的查询剧本需求语义特征向量;对所述备选剧本内容的文本描述进行语义编码和语义分析以得到备选剧本上下文语义特征向量的序列;基于所述包含情感倾向信息的查询剧本需求语义特征向量和所述备选剧本上下文语义特征向量的序列之间的语义度量度,确定所述备选剧本的匹配度是否达到预定要求。2.根据权利要求1所述的基于自然语言模型的智能匹配方法,其特征在于,对所述查询剧本需求描述进行语义理解和情感分析以得到包含情感倾向信息的查询剧本需求语义特征向量,包括:对所述查询剧本需求描述进行语义编码以得到查询剧本需求语义特征向量;抽取所述查询剧本需求描述中的情感倾向词。

4、,并将所述情感倾向词编码为情感倾向编码向量;将所述情感倾向编码向量和所述查询剧本需求语义特征向量进行拼接以得到所述包含情感倾向信息的查询剧本需求语义特征向量。3.根据权利要求2所述的基于自然语言模型的智能匹配方法,其特征在于,对所述查询剧本需求描述进行语义编码以得到查询剧本需求语义特征向量,包括:对所述查询剧本需求描述进行分词处理以得到剧本需求词的序列;分别对所述剧本需求词的序列中各个剧本需求词进行词嵌入编码以得到剧本需求词嵌入向量的序列;将所述剧本需求词嵌入向量的序列输入基于双向长短期记忆神经网络的剧本需求语义编码器以得到所述查询剧本需求语义特征向量。4.根据权利要求3所述的基于自然语言模型。

5、的智能匹配方法,其特征在于,对所述备选剧本内容的文本描述进行语义编码和语义分析以得到备选剧本上下文语义特征向量的序列,包括:对所述备选剧本内容的文本描述通过基于包含分词模块和词嵌入模块的上下文语义编码器以得到所述备选剧本上下文语义特征向量的序列。5.根据权利要求4所述的基于自然语言模型的智能匹配方法,其特征在于,对所述备选剧本内容的文本描述通过基于包含分词模块和词嵌入模块的上下文语义编码器以得到所述备选剧本上下文语义特征向量的序列,包括:使用所述上下文语义编码器的分词模块对所述备选剧本内容的文本描述进行分词处理以得到备选剧本词的序列;使用所述上下文语义编码器的词嵌入模块分别对所述备选剧本词的序。

6、列中各个备选剧本词进行词嵌入编码以得到备选剧本词嵌入向量的序列;使用所述上下文语义编码器的转换器模块对所述备选剧本词嵌入向量的序列进行上下文语义编码以得到所述备选剧本上下文语义特征向量的序列。6.根据权利要求5所述的基于自然语言模型的智能匹配方法,其特征在于,基于所述包权利要求书1/3 页2CN 117521652 A2含情感倾向信息的查询剧本需求语义特征向量和所述备选剧本上下文语义特征向量的序列之间的语义度量度,确定所述备选剧本的匹配度是否达到预定要求,包括:计算所述包含情感倾向信息的查询剧本需求语义特征向量和所述备选剧本上下文语义特征向量的序列中各个备选剧本上下文语义特征向量之间的语义交叉。

7、度量系数以得到语义交叉度量特征向量;将所述语义交叉度量特征向量通过分类器以得到分类结果,所述分类结果用于表示所述备选剧本的匹配度是否达到预定要求。7.根据权利要求6所述的基于自然语言模型的智能匹配方法,其特征在于,计算所述包含情感倾向信息的查询剧本需求语义特征向量和所述备选剧本上下文语义特征向量的序列中各个备选剧本上下文语义特征向量之间的语义交叉度量系数以得到语义交叉度量特征向量,包括:以如下语义交叉度量公式来计算所述包含情感倾向信息的查询剧本需求语义特征向量和所述备选剧本上下文语义特征向量的序列中各个备选剧本上下文语义特征向量之间的语义交叉度量系数以得到由多个所述语义交叉度量系数构成的所述语。

8、义交叉度量特征向量;其中,所述语义交叉度量公式为:;其中,为所述包含情感倾向信息的查询剧本需求语义特征向量,为各个所述备选剧本上下文语义特征向量,N为所述包含情感倾向信息的查询剧本需求语义特征向量的维度,为所述语义交叉度量系数,log表示以2为底的对数函数运算。8.根据权利要求7所述的基于自然语言模型的智能匹配方法,其特征在于,还包括训练步骤:对所述基于双向长短期记忆神经网络的剧本需求语义编码器、所述基于包含分词模块和词嵌入模块的上下文语义编码器和所述分类器进行训练。9.根据权利要求8所述的基于自然语言模型的智能匹配方法,其特征在于,所述训练步骤,包括:获取训练数据,所述训练数据包括用户输入的。

9、训练查询剧本需求描述、备选剧本内容的训练文本描述,以及,所述备选剧本的匹配度是否达到预定要求的真实值;对所述训练查询剧本需求描述进行语义编码以得到训练查询剧本需求语义特征向量;抽取所述训练查询剧本需求描述中的情感倾向词,并将所述情感倾向词编码为训练情感倾向编码向量;将所述训练情感倾向编码向量和所述训练查询剧本需求语义特征向量进行拼接以得到包含情感倾向信息的训练查询剧本需求语义特征向量;对所述备选剧本内容的训练文本描述通过所述基于包含分词模块和词嵌入模块的上下文语义编码器以得到训练备选剧本上下文语义特征向量的序列;计算所述包含情感倾向信息的训练查询剧本需求语义特征向量和所述训练备选剧本上下文语义。

10、特征向量的序列中各个训练备选剧本上下文语义特征向量之间的语义交叉度量系数以得到训练语义交叉度量特征向量;将所述训练语义交叉度量特征向量通过分类器以得到分类损失函数值;计算所述包含情感倾向信息的训练查询剧本需求语义特征向量和所述训练备选剧本权利要求书2/3 页3CN 117521652 A3上下文语义特征向量的序列的特定损失函数值;以所述分类损失函数值和所述特定损失函数值的加权和作为损失函数值,来对所述基于双向长短期记忆神经网络的剧本需求语义编码器、所述基于包含分词模块和词嵌入模块的上下文语义编码器和所述分类器进行训练。10.一种基于自然语言模型的智能匹配系统,其特征在于,包括:用户需求获取模块。

11、,用于获取用户输入的查询剧本需求描述;备选剧本内容获取模块,用于获取备选剧本内容的文本描述;用户需求语义理解模块,用于对所述查询剧本需求描述进行语义理解和情感分析以得到包含情感倾向信息的查询剧本需求语义特征向量;备选剧本内容语义编码模块,用于对所述备选剧本内容的文本描述进行语义编码和语义分析以得到备选剧本上下文语义特征向量的序列;备选剧本匹配度判定模块,用于基于所述包含情感倾向信息的查询剧本需求语义特征向量和所述备选剧本上下文语义特征向量的序列之间的语义度量度,确定所述备选剧本的匹配度是否达到预定要求。权利要求书3/3 页4CN 117521652 A4基于自然语言模型的智能匹配系统及方法技术。

12、领域0001本申请涉及自然语言处理技术领域,且更为具体地,涉及一种基于自然语言模型的智能匹配系统及方法。背景技术0002在影视行业,剧本是影视作品创作的基础,对影视作品的质量和影响力起着至关重要的作用。通过阅读剧本可以帮助编剧、导演、制片人等影视从业者从中了解行业发展趋势,学习创作技巧、人物塑造、情节设计等方面的经验和知识,有助于提升从业者的专业素养和创作水平。0003面对大量杂乱的剧本信息,如何快速、准确地找到符合用户需求的剧本成为了待解决的问题。传统的剧本查询方法通常是通过关键词匹配来实现的。但是,这种方法受限于具体的关键词选择,无法进行深层次的语义理解,导致查询的准确性不高。因此,期待一。

13、种优化的基于自然语言模型的智能匹配系统及方法。发明内容0004为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种基于自然语言模型的智能匹配系统及方法,其采用基于深度学习的自然语言处理技术来分析用户输入的剧本需求描述和备选剧本内容的文本描述之间的语义交叉关联特征,进而来判断备选剧本与用户需求的匹配度是否达到预定要求。这样,能够更准确地理解用户需求,提高查询效果,从而提升整体的用户体验和服务质量。0005相应地,根据本申请的一个方面,提供了一种基于自然语言模型的智能匹配方法,其包括:获取用户输入的查询剧本需求描述;获取备选剧本内容的文本描述;对所述查询剧本需求描述进行语义理解和情感分析以。

14、得到包含情感倾向信息的查询剧本需求语义特征向量;对所述备选剧本内容的文本描述进行语义编码和语义分析以得到备选剧本上下文语义特征向量的序列;基于所述包含情感倾向信息的查询剧本需求语义特征向量和所述备选剧本上下文语义特征向量的序列之间的语义度量度,确定所述备选剧本的匹配度是否达到预定要求。0006在上述基于自然语言模型的智能匹配方法中,对所述查询剧本需求描述进行语义理解和情感分析以得到包含情感倾向信息的查询剧本需求语义特征向量,包括:对所述查询剧本需求描述进行语义编码以得到查询剧本需求语义特征向量;抽取所述查询剧本需求描述中的情感倾向词,并将所述情感倾向词编码为情感倾向编码向量;将所述情感倾向编码。

15、向量和所述查询剧本需求语义特征向量进行拼接以得到所述包含情感倾向信息的查询说明书1/10 页5CN 117521652 A5剧本需求语义特征向量。0007在上述基于自然语言模型的智能匹配方法中,对所述查询剧本需求描述进行语义编码以得到查询剧本需求语义特征向量,包括:对所述查询剧本需求描述进行分词处理以得到剧本需求词的序列;分别对所述剧本需求词的序列中各个剧本需求词进行词嵌入编码以得到剧本需求词嵌入向量的序列;将所述剧本需求词嵌入向量的序列输入基于双向长短期记忆神经网络的剧本需求语义编码器以得到所述查询剧本需求语义特征向量。0008在上述基于自然语言模型的智能匹配方法中,对所述备选剧本内容的文本。

16、描述进行语义编码和语义分析以得到备选剧本上下文语义特征向量的序列,包括:对所述备选剧本内容的文本描述通过基于包含分词模块和词嵌入模块的上下文语义编码器以得到所述备选剧本上下文语义特征向量的序列。0009在上述基于自然语言模型的智能匹配方法中,对所述备选剧本内容的文本描述通过基于包含分词模块和词嵌入模块的上下文语义编码器以得到所述备选剧本上下文语义特征向量的序列,包括:使用所述上下文语义编码器的分词模块对所述备选剧本内容的文本描述进行分词处理以得到备选剧本词的序列;使用所述上下文语义编码器的词嵌入模块分别对所述备选剧本词的序列中各个备选剧本词进行词嵌入编码以得到备选剧本词嵌入向量的序列;使用所述。

17、上下文语义编码器的转换器模块对所述备选剧本词嵌入向量的序列进行上下文语义编码以得到所述备选剧本上下文语义特征向量的序列。0010在上述基于自然语言模型的智能匹配方法中,基于所述包含情感倾向信息的查询剧本需求语义特征向量和所述备选剧本上下文语义特征向量的序列之间的语义度量度,确定所述备选剧本的匹配度是否达到预定要求,包括:计算所述包含情感倾向信息的查询剧本需求语义特征向量和所述备选剧本上下文语义特征向量的序列中各个备选剧本上下文语义特征向量之间的语义交叉度量系数以得到语义交叉度量特征向量;将所述语义交叉度量特征向量通过分类器以得到分类结果,所述分类结果用于表示所述备选剧本的匹配度是否达到预定要求。

18、。0011在上述基于自然语言模型的智能匹配方法中,计算所述包含情感倾向信息的查询剧本需求语义特征向量和所述备选剧本上下文语义特征向量的序列中各个备选剧本上下文语义特征向量之间的语义交叉度量系数以得到语义交叉度量特征向量,包括:以如下语义交叉度量公式来计算所述包含情感倾向信息的查询剧本需求语义特征向量和所述备选剧本上下文语义特征向量的序列中各个备选剧本上下文语义特征向量之间的语义交叉度量系数以得到由多个所述语义交叉度量系数构成的所述语义交叉度量特征向量;其中,所述语义交叉度量公式为:;其中,为所述包含情感倾向信息的查询剧本需求语义特征向量,为各个所述备选剧本上下文语义特征向量,N为所述包含情感倾。

19、向信息的查询剧本需求语义特征向量的维度,为所述语义交叉度量系数,log表示以2为底的对数函数运算。0012在上述基于自然语言模型的智能匹配方法中,还包括训练步骤:对所述基于双向长短期记忆神经网络的剧本需求语义编码器、所述基于包含分词模块和词嵌入模块的上下文语义编码器和所述分类器进行训练。说明书2/10 页6CN 117521652 A60013在上述基于自然语言模型的智能匹配方法中,所述训练步骤,包括:获取训练数据,所述训练数据包括用户输入的训练查询剧本需求描述、备选剧本内容的训练文本描述,以及,所述备选剧本的匹配度是否达到预定要求的真实值;对所述训练查询剧本需求描述进行语义编码以得到训练查询。

20、剧本需求语义特征向量;抽取所述训练查询剧本需求描述中的情感倾向词,并将所述情感倾向词编码为训练情感倾向编码向量;将所述训练情感倾向编码向量和所述训练查询剧本需求语义特征向量进行拼接以得到包含情感倾向信息的训练查询剧本需求语义特征向量;对所述备选剧本内容的训练文本描述通过所述基于包含分词模块和词嵌入模块的上下文语义编码器以得到训练备选剧本上下文语义特征向量的序列;计算所述包含情感倾向信息的训练查询剧本需求语义特征向量和所述训练备选剧本上下文语义特征向量的序列中各个训练备选剧本上下文语义特征向量之间的语义交叉度量系数以得到训练语义交叉度量特征向量;将所述训练语义交叉度量特征向量通过分类器以得到分类。

21、损失函数值;计算所述包含情感倾向信息的训练查询剧本需求语义特征向量和所述训练备选剧本上下文语义特征向量的序列的特定损失函数值;以所述分类损失函数值和所述特定损失函数值的加权和作为损失函数值,来对所述基于双向长短期记忆神经网络的剧本需求语义编码器、所述基于包含分词模块和词嵌入模块的上下文语义编码器和所述分类器进行训练。0014根据本申请的另一个方面,提供了一种基于自然语言模型的智能匹配系统,其包括:用户需求获取模块,用于获取用户输入的查询剧本需求描述;备选剧本内容获取模块,用于获取备选剧本内容的文本描述;用户需求语义理解模块,用于对所述查询剧本需求描述进行语义理解和情感分析以得到包含情感倾向信息。

22、的查询剧本需求语义特征向量;备选剧本内容语义编码模块,用于对所述备选剧本内容的文本描述进行语义编码和语义分析以得到备选剧本上下文语义特征向量的序列;备选剧本匹配度判定模块,用于基于所述包含情感倾向信息的查询剧本需求语义特征向量和所述备选剧本上下文语义特征向量的序列之间的语义度量度,确定所述备选剧本的匹配度是否达到预定要求。0015与现有技术相比,本申请提供的基于自然语言模型的智能匹配系统及方法,其采用基于深度学习的自然语言处理技术来分析用户输入的剧本需求描述和备选剧本内容的文本描述之间的语义交叉关联特征,进而来判断备选剧本与用户需求的匹配度是否达到预定要求。这样,能够更准确地理解用户需求,提高。

23、查询效果,从而提升整体的用户体验和服务质量。附图说明0016通过结合附图对本申请实施例进行更详细的描述,本申请的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本申请实施例的进一步理解,并且构成说明书的一部分,与本申请实施例一起用于解释本申请,并不构成对本申请的限制。在附图中,相同的参考标号通常代表相同部件或步骤。0017图1为根据本申请实施例的基于自然语言模型的智能匹配方法的流程图。说明书3/10 页7CN 117521652 A70018图2为根据本申请实施例的基于自然语言模型的智能匹配方法的架构示意图。0019图3为根据本申请实施例的基于自然语言模型的智能匹配方法中对所述查询剧。

24、本需求描述进行语义理解和情感分析以得到包含情感倾向信息的查询剧本需求语义特征向量的流程图。0020图4为根据本申请实施例的基于自然语言模型的智能匹配方法中对所述查询剧本需求描述进行语义编码以得到查询剧本需求语义特征向量的流程图。0021图5为根据本申请实施例的基于自然语言模型的智能匹配方法中对所述备选剧本内容的文本描述通过基于包含分词模块和词嵌入模块的上下文语义编码器以得到所述备选剧本上下文语义特征向量的序列的流程图。0022图6为根据本申请实施例的基于自然语言模型的智能匹配方法中基于所述包含情感倾向信息的查询剧本需求语义特征向量和所述备选剧本上下文语义特征向量的序列之间的语义度量度,确定所述。

25、备选剧本的匹配度是否达到预定要求的流程图。0023图7为根据本申请实施例的基于自然语言模型的智能匹配方法中训练步骤的流程图。0024图8为根据本申请实施例的基于自然语言模型的智能匹配系统的框图。具体实施方式0025下面,将参考附图详细地描述根据本申请的示例实施例。显然,所描述的实施例仅仅是本申请的一部分实施例,而不是本申请的全部实施例,应理解,本申请不受这里描述的示例实施例的限制。0026图1为根据本申请实施例的基于自然语言模型的智能匹配方法的流程图。图2为根据本申请实施例的基于自然语言模型的智能匹配方法的架构示意图。如图1和图2所示,根据本申请实施例的基于自然语言模型的智能匹配方法,包括步骤。

26、:S110,获取用户输入的查询剧本需求描述;S120,获取备选剧本内容的文本描述;S130,对所述查询剧本需求描述进行语义理解和情感分析以得到包含情感倾向信息的查询剧本需求语义特征向量;S140,对所述备选剧本内容的文本描述进行语义编码和语义分析以得到备选剧本上下文语义特征向量的序列;S150,基于所述包含情感倾向信息的查询剧本需求语义特征向量和所述备选剧本上下文语义特征向量的序列之间的语义度量度,确定所述备选剧本的匹配度是否达到预定要求。0027如上述背景技术所言,剧本是影视作品创作的基础,为导演、演员、制片人等创作人员提供了指导和方向。一个好的剧本不仅能够吸引观众的眼球,还能够深入人心,引。

27、发观众的思考和共鸣。优秀的剧本往往能够成为经典,被观众长久地记忆和传颂。同时,它也能够成为社会文化的一部分,影响人们的价值观和生活方式。因此,在影视行业中,剧本的创作和选择是非常重要的。0028传统的剧本查询方法通常是通过关键词匹配来实现的。但是,这种方法有一些缺陷,例如,有些词语可能有多种含义,可能导致查询结果不准确。并且,当输入的关键词存在同义词和近义词以及错别字等情况时,也可能导致查询结果与用户真实意图存在偏差。也就是说,这种关键词匹配的查询方式受限于具体的关键词选择,无法进行深层次的语义理解,导致查询的准确性不高。因此,期待一种优化的基于自然语言模型的剧本智能匹配方说明书4/10 页8。

28、CN 117521652 A8案。0029针对上述技术问题,本申请的技术构思为:采用基于深度学习的自然语言处理技术来分析用户输入的剧本需求描述和备选剧本内容的文本描述之间的语义交叉关联特征,进而来判断备选剧本与用户需求的匹配度是否达到预定要求。这样,能够更准确地理解用户需求,提高查询效果,从而提升整体的用户体验和服务质量。0030在上述基于自然语言模型的智能匹配方法中,所述步骤S110,获取用户输入的查询剧本需求描述。应可以理解,用户输入的查询剧本需求描述是理解用户需求的基础信息。通过分析和理解用户输入的查询剧本需求描述,可以把握用户的意图,明确用户对剧本的题材、情感倾向、人物性格等方面的具体。

29、要求。0031在上述基于自然语言模型的智能匹配方法中,所述步骤S120,获取备选剧本内容的文本描述。应可以理解,所述备选剧本内容的文本描述是进行匹配的对象之一。通过对所述备选剧本内容的文本描述进行分析,以了解备选剧本的剧情、角色、场景设置、风格等方面的特点,从而与用户需求进行匹配。0032在上述基于自然语言模型的智能匹配方法中,所述步骤S130,对所述查询剧本需求描述进行语义理解和情感分析以得到包含情感倾向信息的查询剧本需求语义特征向量。在本申请的技术方案中,为了更全面地理解用户对剧本的需求,进一步对所述查询剧本需求描述进行语义理解和情感分析。也就是,除了需要了解用户对剧本的具体要求外,还需要。

30、进一步了解用户的情感倾向,从而根据用户的情感偏好进行更精准的匹配,更好地满足用户的期望。0033图3为根据本申请实施例的基于自然语言模型的智能匹配方法中对所述查询剧本需求描述进行语义理解和情感分析以得到包含情感倾向信息的查询剧本需求语义特征向量的流程图。如图3所示,所述步骤S130,包括:S131,对所述查询剧本需求描述进行语义编码以得到查询剧本需求语义特征向量;S132,抽取所述查询剧本需求描述中的情感倾向词,并将所述情感倾向词编码为情感倾向编码向量;S133,将所述情感倾向编码向量和所述查询剧本需求语义特征向量进行拼接以得到所述包含情感倾向信息的查询剧本需求语义特征向量。0034具体地,所。

31、述步骤S131,对所述查询剧本需求描述进行语义编码以得到查询剧本需求语义特征向量。在本申请的一个具体示例中,对所述查询剧本需求描述进行语义编码以得到查询剧本需求语义特征向量的编码方式是使用基于双向长短期记忆神经网络的剧本需求语义编码器对所述查询剧本需求描述进行语义编码以得到所述查询剧本需求语义特征向量。也就是说,利用基于双向长短期记忆神经网络的剧本需求语义编码器来捕捉所述查询剧本需求描述中所蕴含的丰富的语义信息,包括词义、句法结构、逻辑关系等。本领域普通技术人员应知晓,双向长短期记忆神经网络(BiLSTM)是一种能够同时考虑上下文信息的循环神经网络(RNN)变体,它结合了长短期记忆(LSTM)。

32、的能力以及双向信息传递的优势,在自然语言处理任务中具有优异表现。在传统的RNN中,信息只能从前往后传递,而在BiLSTM中,有两个独立的LSTM网络,一个负责正向传播,另一个负责反向传播。在每个时间步,BiLSTM接收当前输入和前一个时间步的隐藏状态作为输入,分别通过正向和反向的LSTM单元进行处理,然后将它们的输出进行拼接,从而得到当前时间步的输出。所以通过所述双向长短期记忆神经网络模型获得的所述查询剧本需求语义特征向量学习到了全局的说明书5/10 页9CN 117521652 A9上下文信息,能够更好地捕捉句子中词语之间的长距离依赖关系。0035图4为根据本申请实施例的基于自然语言模型的智。

33、能匹配方法中对所述查询剧本需求描述进行语义编码以得到查询剧本需求语义特征向量的流程图。如图4所示,所述步骤S131,包括:S1311,对所述查询剧本需求描述进行分词处理以得到剧本需求词的序列;S1312,分别对所述剧本需求词的序列中各个剧本需求词进行词嵌入编码以得到剧本需求词嵌入向量的序列;S1313,将所述剧本需求词嵌入向量的序列输入基于双向长短期记忆神经网络的剧本需求语义编码器以得到所述查询剧本需求语义特征向量。0036具体地,所述步骤S132,抽取所述查询剧本需求描述中的情感倾向词,并将所述情感倾向词编码为情感倾向编码向量。应可以理解,不同用户对剧本情感的偏好有所不同,有些用户可能更倾向。

34、于积极的情感,而另一些用户可能更倾向于消极的情感。而情感倾向词可以帮助分析用户在查询剧本需求描述中所表达的情感态度,进而理解用户对剧本的情感需求,有助于确定用户对于剧本风格的偏好,比如希望剧本具有悬疑、悲剧、喜剧或者其他情感元素,以及剧本具有欢乐、温馨的氛围,或者是紧张、刺激的情节。也就是,通过将所述情感倾向词编码为情感倾向编码向量,进而将情感倾向信息纳入本申请的考虑范围,以实现对用户需求的深层语义理解,从而实现更精准的剧本匹配推荐。0037具体地,所述步骤S133,将所述情感倾向编码向量和所述查询剧本需求语义特征向量进行拼接以得到所述包含情感倾向信息的查询剧本需求语义特征向量。在本申请的技术。

35、方案中,为了综合考虑用户对剧本的具体要求以及其情感偏好信息,进一步融合所述情感倾向编码向量和所述查询剧本需求语义特征向量。应可以理解,通过将所述情感倾向编码向量和所述查询剧本需求语义特征向量进行拼接,能够将所述查询剧本需求描述中情感信息和语义信息结合在一起,以得到所述包含情感倾向信息的查询剧本需求语义特征向量,从而丰富特征表达,减少信息丢失的可能性,更全面地表达用户需求。同时,使得在进行剧本匹配时能够更全面地考虑用户的情感偏好和具体要求,以提高匹配的效果。0038在上述基于自然语言模型的智能匹配方法中,所述步骤S140,对所述备选剧本内容的文本描述进行语义编码和语义分析以得到备选剧本上下文语义。

36、特征向量的序列。在本申请的一个具体示例中,对所述备选剧本内容的文本描述进行语义编码和语义分析以得到备选剧本上下文语义特征向量的序列的编码方式是将所述备选剧本内容的文本描述通过基于包含分词模块和词嵌入模块的上下文语义编码器以得到所述备选剧本上下文语义特征向量的序列。应可以理解,备选剧本内容的文本描述中通常包括剧本情节、角色、情感等方面的描述,通过使用上下文语义编码器对所述备选剧本内容的文本描述进行语义挖掘,进而捕捉到其中的关键信息,例如主题、情感倾向、情节发展等,从而更全面地表达备选剧本的语义信息。具体地,所述上下文语义编码器先将所述备选剧本内容的文本描述进行切分成多个字词,再分别对各个字词进行。

37、嵌入编码,以将各个字词分别映射为嵌入向量,然后基于Transformer结构,对嵌入向量的序列进行并行处理,捕捉全局依赖关系,从而更好地理解备选剧本的内容特征。0039图5为根据本申请实施例的基于自然语言模型的智能匹配方法中对所述备选剧本内容的文本描述通过基于包含分词模块和词嵌入模块的上下文语义编码器以得到所述备选剧本上下文语义特征向量的序列的流程图。如图5所示,所述步骤S140,包括:S141,使用所述上下文语义编码器的分词模块对所述备选剧本内容的文本描述进行分词处理以得到说明书6/10 页10CN 117521652 A10备选剧本词的序列;S142,使用所述上下文语义编码器的词嵌入模块分。

38、别对所述备选剧本词的序列中各个备选剧本词进行词嵌入编码以得到备选剧本词嵌入向量的序列;S143,使用所述上下文语义编码器的转换器模块对所述备选剧本词嵌入向量的序列进行上下文语义编码以得到所述备选剧本上下文语义特征向量的序列。0040在上述基于自然语言模型的智能匹配方法中,所述步骤S150,基于所述包含情感倾向信息的查询剧本需求语义特征向量和所述备选剧本上下文语义特征向量的序列之间的语义度量度,确定所述备选剧本的匹配度是否达到预定要求。应可以理解,所述包含情感倾向信息的查询剧本需求语义特征向量中包含了用户对剧本的需求特征,而备选剧本上下文语义特征向量的序列也充分表达了剧本的内容信息。通过计算所述。

39、包含情感倾向信息的查询剧本需求语义特征向量和所述备选剧本上下文语义特征向量的序列之间的语义度量度,能够得到一个量化的指标,用于衡量备选剧本与用户需求之间的语义相似度,从而确定备选剧本是否与用户的需求相匹配。0041图6为根据本申请实施例的基于自然语言模型的智能匹配方法中基于所述包含情感倾向信息的查询剧本需求语义特征向量和所述备选剧本上下文语义特征向量的序列之间的语义度量度,确定所述备选剧本的匹配度是否达到预定要求的流程图。如图6所示,所述步骤S150,包括:S151,计算所述包含情感倾向信息的查询剧本需求语义特征向量和所述备选剧本上下文语义特征向量的序列中各个备选剧本上下文语义特征向量之间的语。

40、义交叉度量系数以得到语义交叉度量特征向量;S152,将所述语义交叉度量特征向量通过分类器以得到分类结果,所述分类结果用于表示所述备选剧本的匹配度是否达到预定要求。0042具体地,所述步骤S151,计算所述包含情感倾向信息的查询剧本需求语义特征向量和所述备选剧本上下文语义特征向量的序列中各个备选剧本上下文语义特征向量之间的语义交叉度量系数以得到语义交叉度量特征向量。在本申请的技术方案中,通过计算所述包含情感倾向信息的查询剧本需求语义特征向量和所述备选剧本上下文语义特征向量的序列中各个备选剧本上下文语义特征向量之间的语义交叉度量系数来衡量用户输入的查询剧本需求描述和备选剧本内容的文本描述之间的语义。

41、相似性和语义关联关系。例如,如果所述包含情感倾向信息的查询剧本需求语义特征向量和所述各个备选剧本上下文语义特征向量之间的语义交叉度量系数较小,表明两者具有较高的语义相似性,即所述备选剧本和用户需求的匹配度较高。相反,如果所述包含情感倾向信息的查询剧本需求语义特征向量和所述各个备选剧本上下文语义特征向量之间的语义交叉度量系数较大,可能表示两者之间的语义差异性较大,进而表明所述备选剧本和用户需求的匹配度较低。0043在本申请的一个具体示例中,所述步骤S151,包括:以如下语义交叉度量公式来计算所述包含情感倾向信息的查询剧本需求语义特征向量和所述备选剧本上下文语义特征向量的序列中各个备选剧本上下文语。

42、义特征向量之间的语义交叉度量系数以得到由多个所述语义交叉度量系数构成的所述语义交叉度量特征向量;其中,所述语义交叉度量公式为:;其中,为所述包含情感倾向信息的查询剧本需求语义特征向量,为各个所述备选剧本上下文语义特征向量,N为所述包含情感倾向信息的查询剧本需求语义特征向说明书7/10 页11CN 117521652 A11量的维度,为所述语义交叉度量系数,log表示以2为底的对数函数运算。0044这里,通过计算语义交叉度量系数可以体现出所述包含情感倾向信息的查询剧本需求语义特征向量和所述备选剧本上下文语义特征向量之间的交叉性关联关系,即所述包含情感倾向信息的查询剧本需求语义特征向量相对于所述备。

43、选剧本上下文语义特征向量的关联,和所述备选剧本上下文语义特征向量相对于所述包含情感倾向信息的查询剧本需求语义特征向量的关联,而这种交叉性关联关系可以对两者所表达的语义特征进行双向对比,更能表征所述备选剧本和用户需求之间所表达的语义特征的匹配度。0045具体地,所述步骤S152,将所述语义交叉度量特征向量通过分类器以得到分类结果,所述分类结果用于表示所述备选剧本的匹配度是否达到预定要求。应可以理解,分类器是一种机器学习模型,其原理是基于训练数据学习特征与标签之间的映射关系,以便对新的特征进行分类或预测。在本申请的技术方案中,所述语义交叉度量特征向量中包含了复杂的语义关系和交互信息。通过使用分类器。

44、来对所述语义交叉度量特征向量中高维、非线性的特征进行建模,从而更好地捕捉备选剧本与用户需求之间的复杂匹配关系。也就是,使用分类器在特征空间中划分不同类别,进而将所述语义交叉度量特征向量映射到对应的分类标签中,即所述备选剧本的匹配度达到预定要求和所述备选剧本的匹配度未达到预定要求。这样,能够基于分类结果自动筛选备选剧本,从而提高剧本查询效率和查询效果。0046应可以理解,在利用上述神经网络模型之前,需要对所述基于双向长短期记忆神经网络的剧本需求语义编码器、所述基于包含分词模块和词嵌入模块的上下文语义编码器和所述分类器进行训练。也就是说,在本申请的基于自然语言模型的智能匹配方法中,还包括对所述基于。

45、双向长短期记忆神经网络的剧本需求语义编码器、所述基于包含分词模块和词嵌入模块的上下文语义编码器和所述分类器进行训练的训练步骤。0047图7为根据本申请实施例的基于自然语言模型的智能匹配方法中训练步骤的流程图。如图7所示,所述训练步骤,包括:S210,获取训练数据,所述训练数据包括用户输入的训练查询剧本需求描述、备选剧本内容的训练文本描述,以及,所述备选剧本的匹配度是否达到预定要求的真实值;S220,对所述训练查询剧本需求描述进行语义编码以得到训练查询剧本需求语义特征向量;S230,抽取所述训练查询剧本需求描述中的情感倾向词,并将所述情感倾向词编码为训练情感倾向编码向量;S240,将所述训练情感。

46、倾向编码向量和所述训练查询剧本需求语义特征向量进行拼接以得到包含情感倾向信息的训练查询剧本需求语义特征向量;S250,对所述备选剧本内容的训练文本描述通过所述基于包含分词模块和词嵌入模块的上下文语义编码器以得到训练备选剧本上下文语义特征向量的序列;S260,计算所述包含情感倾向信息的训练查询剧本需求语义特征向量和所述训练备选剧本上下文语义特征向量的序列中各个训练备选剧本上下文语义特征向量之间的语义交叉度量系数以得到训练语义交叉度量特征向量;S270,将所述训练语义交叉度量特征向量通过分类器以得到分类损失函数值;S280,计算所述包含情感倾向信息的训练查询剧本需求语义特征向量和所述训练备选剧本上。

47、下文语义特征向量的序列的特定损失函数值;S290,以所述分类损失函数值和所述特定损失函数值的加权和作为损失函数值,来对所述基于双向长短期记忆神经网络的剧本需求语义编码器、所述基于包含分词模块和词嵌入模块的上下文语义编码器和所述分类器进行训练。0048在上述技术方案中,所述包含情感倾向信息的训练查询剧本需求语义特征向量表说明书8/10 页12CN 117521652 A12达情感倾向词强化的所述训练查询剧本需求描述的编码文本语义特征,且所述训练备选剧本上下文语义特征向量的序列表达所述训练备选剧本内容的文本描述的基于词源语义上下文关联的编码文本语义特征,而在计算所述包含情感倾向信息的训练查询剧本需。

48、求语义特征向量和所述训练备选剧本上下文语义特征向量的序列中各个训练备选剧本上下文语义特征向量之间的语义交叉度量系数时,会将所述包含情感倾向信息的训练查询剧本需求语义特征向量和所述训练备选剧本上下文语义特征向量转换为相同长度,从而导致所述包含情感倾向信息的训练查询剧本需求语义特征向量和所述训练备选剧本上下文语义特征向量的序列在整体特征向量分布维度上的不同特征群密度表示。0049但是,在模型训练时,由于是对所述训练查询剧本需求描述和所述训练备选剧本内容的文本描述分别进行语义编码,因此所述包含情感倾向信息的训练查询剧本需求语义特征向量和所述训练备选剧本上下文语义特征向量的序列的不同特征群密度表示会导。

49、致编码分支之间的迭代不均衡,影响模型的整体训练效率。0050因此,在本申请的技术方案中,为了提升所述包含情感倾向信息的训练查询剧本需求语义特征向量和所述训练备选剧本上下文语义特征向量的序列的特征群密度表示一致性,从而进一步引入了针对所述包含情感倾向信息的训练查询剧本需求语义特征向量和所述训练备选剧本上下文语义特征向量的序列的特定损失函数。0051具体地,所述步骤S280,包括:以如下特定损失函数值计算公式来计算所述包含情感倾向信息的训练查询剧本需求语义特征向量和所述训练备选剧本上下文语义特征向量的序列的特定损失函数值;其中,所述特定损失函数值计算公式为:;V1是所述包含情感倾向信息的训练查询剧。

50、本需求语义特征向量通过插值转换为与所述训练备选剧本上下文语义特征向量的序列相同长度得到的第一特征向量,V2是所述训练备选剧本上下文语义特征向量的序列级联得到的第二特征向量,L是特征向量的长度,表示指数函数运算,且表示向量的二范数的平方,和是所述第一特征向量和所述第二特征向量的特征值,表示按位置相减,表示所述特定损失函数值。0052这里,所述损失函数基于特征群密度来进行群计数注意力,其通过将群计数作为输出特征群密度的递归映射,来进行所述包含情感倾向信息的训练查询剧本需求语义特征向量和所述训练备选剧本上下文语义特征向量的序列之间的不同密度表示模式的自适应注意力。通过以其作为损失函数训练模型,可以使。

展开阅读全文
内容关键字: 基于 自然语言 模型 智能 匹配 系统 方法
关于本文
本文标题:基于自然语言模型的智能匹配系统及方法.pdf
链接地址:https://www.zhuanlichaxun.net/pdf/14525562.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1