微信公众号公号主题分类方法及装置.pdf
《微信公众号公号主题分类方法及装置.pdf》由会员分享,可在线阅读,更多相关《微信公众号公号主题分类方法及装置.pdf(7页完成版)》请在专利查询网上搜索。
1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202010114547.X (22)申请日 2020.02.25 (71)申请人 上海昌投网络科技有限公司 地址 200135 上海市浦东新区自由贸易试 验区龙东大道3158弄6号1幢701室、 702室、 703室 (72)发明人 田东坡 (74)专利代理机构 北京力量专利代理事务所 (特殊普通合伙) 11504 代理人 何东明 (51)Int.Cl. G06F 16/33(2019.01) G06F 16/35(2019.01) G06F 40/289(2020.01) G。
2、06F 40/258(2020.01) G06K 9/62(2006.01) (54)发明名称 一种微信公众号公号主题分类方法及装置 (57)摘要 本发明适用于微信公众号广告投放技术领 域, 提供了一种微信公众号公号主题分类方法及 装置, 通过依次提取微信公号的10篇历史文章数 据, 人工标注的基于企业广投放业务划分的文章 主题, 主题为十八个预设主题类型中的一种, 清 洗 文 章 数 据 , 训练 W o r d 2 V e c 模 型 , 获 取 embedding, 最后训练TextCNN深度学习模型以获 得分类模型, 获取待预测的微信公众号的10篇历 史文章数据, 清洗数据, 获取em。
3、bedding, 通过训 练后的分类模型进行主题分类, 输出文章的主题 类型; 根据所得的所有文章的主题类型, 将含有 文章数量比例最大的至少一个主题作为微信公 众号的主题类型并输出, 通过判断微信公众号主 题类型是否符合当前业务下的投放标准, 为广告 投放提供数据上的参考。 权利要求书1页 说明书3页 附图2页 CN 111353019 A 2020.06.30 CN 111353019 A 1.一种微信公众号公号主题分类方法, 其特征在于: 包括以下步骤: S1、 提取微信公号的10篇历史文章数据, 人工标注的基于企业广投放业务划分的文章 主题, 所述主题为十八个预设主题类型中的一种; S。
4、2、 清洗文章数据, 训练Word2Vec模型, 获取embedding, 最后训练TextCNN深度学习模 型以获得分类模型; S3、 获取待预测的微信公众号的10篇历史文章数据, 清洗数据, 获取embedding, 通过训 练后的分类模型进行主题分类, 输出文章的主题类型; S4、 根据步骤S3获得的所有文章的主题类型, 将含有文章数量比例最大的至少一个主 题作为微信公众号的主题类型并输出。 2.如权利要求1所述的一种微信公众号公号主题分类方法, 其特征在于: 所述清洗文章 数据具体为: 对文章数据进行分词处理。 3.如权利要求2所述的一种微信公众号公号主题分类方法, 其特征在于: 所述。
5、训练 Word2Vec模型具体为: 根据Word2Vec算法对所述的分词处理结果进行向量转换, 得到分词 结果向量, 将分词得到的词段映射为第一词向量, 并根据所述第一词向量构建第一初始矩 阵; 根据所述词段在所述训练文本集的初始文本中出现的概率和该词段对应的第一词向量 得到第二初始矩阵。 4.如权利要求3所述的一种微信公众号公号主题分类方法, 其特征在于: 所述训练 TextCNN深度学习模型以获得分类模型具体为: 将第一初始矩阵、 第二初始矩阵分别作为 TextCNN模型两个通道的输入, 对应的文章主题类型作为输出, 利用TextCNN模型对所述训 练文本集进行训练得到分类模型。 5.一种。
6、微信公众号公号主题分类装置, 其特征在于: 包括: 数据采集模块, 用于提取微信公号的10篇历史文章数据, 人工标注的基于企业广投放 业务划分的文章主题, 所述主题为十八个预设主题类型中的一种; 数据处理模块, 用于清洗文章数据, 训练Word2Vec模型, 获取embedding; 分类模型训练模块, 用于训练TextCNN深度学习模型以获得分类模型。 6.如权利要求5所述的一种微信公众号公号主题分类装置, 其特征在于: 所述数据处理 模块还用于: 对文章数据进行分词处理。 7.如权利要求6所述的一种微信公众号公号主题分类装置, 其特征在于: 所述数据处理 模块还用于: 根据Word2Vec。
7、算法对所述的分词处理结果进行向量转换, 得到分词结果向量, 将分词得到的词段映射为第一词向量, 并根据所述第一词向量构建第一初始矩阵; 根据所 述词段在所述训练文本集的初始文本中出现的概率和该词段对应的第一词向量得到第二 初始矩阵。 8.如权利要求7所述的一种微信公众号公号主题分类装置, 其特征在于: 所述分类模型 训练模块还用于: 将第一初始矩阵、 第二初始矩阵分别作为TextCNN模型两个通道的输入, 对应的文章主题类型作为输出, 利用TextCNN模型对所述训练文本集进行训练得到分类模 型。 权利要求书 1/1 页 2 CN 111353019 A 2 一种微信公众号公号主题分类方法及装。
8、置 技术领域 0001 本发明属于微信公众号广告投放领域, 尤其涉及一种微信公众号公号主题分类方 法及装置。 背景技术 0002 微信公众平台主要面向名人、 政府、 媒体、 企业等机构推出的合作推广业务。 在这 里可以通过渠道将品牌推广给线上平台作用。 在微信公众号上进行广告推广是一种常见的 广告推广方式。 0003 但是企业在进行广告投放时需要考虑公众号主题类型是否符合业务场景下的投 放标准, 进而影响投资回报率, 投资回报率是指通过投资而应返回的价值, 即企业从一项投 资活动中得到的经济回报, 因此需要一种能够对微信公众号主题类型进行预测的技术。 发明内容 0004 本发明提供一种微信公众。
9、号公号主题分类方法及装置, 旨在解决不能够对微信公 众号的主题类型进行预测的问题。 0005 本发明是这样实现的, 一种微信公众号公号主题分类方法, 包括以下步骤: 0006 S1、 提取微信公号的10篇历史文章数据, 人工标注的基于企业广投放业务划分的 文章主题, 所述主题为十八个预设主题类型中的一种; 0007 S2、 清洗文章数据, 训练Word2Vec模型, 获取embedding, 最后训练TextCNN深度学 习模型以获得分类模型; 0008 S3、 获取待预测的微信公众号的10篇历史文章数据, 清洗数据, 获取embedding, 通 过训练后的分类模型进行主题分类, 输出文章的。
10、主题类型; 0009 S4、 根据步骤S3获得的所有文章的主题类型, 将含有文章数量比例最大的至少一 个主题作为微信公众号的主题类型并输出。 0010 优选的, 所述清洗文章数据具体为: 对文章数据进行分词处理。 0011 优选的, 所述训练Word2Vec模型具体为: 根据Word2Vec算法对所述的分词处理结 果进行向量转换, 得到分词结果向量, 将分词得到的词段映射为第一词向量, 并根据所述第 一词向量构建第一初始矩阵; 根据所述词段在所述训练文本集的初始文本中出现的概率和 该词段对应的第一词向量得到第二初始矩阵。 0012 优选的, 所述训练TextCNN深度学习模型以获得分类模型具体。
11、为: 将第一初始矩 阵、 第二初始矩阵分别作为TextCNN模型两个通道的输入, 对应的文章主题类型作为输出, 利用TextCNN模型对所述训练文本集进行训练得到分类模型。 0013 本发明还提供一种微信公众号公号主题分类装置, 包括: 0014 数据采集模块, 用于提取微信公号的10篇历史文章数据, 人工标注的基于企业广 投放业务划分的文章主题, 所述主题为十八个预设主题类型中的一种; 0015 数据处理模块, 用于清洗文章数据, 训练Word2Vec模型, 获取embedding; 说明书 1/3 页 3 CN 111353019 A 3 0016 分类模型训练模块, 用于训练TextCN。
12、N深度学习模型以获得分类模型。 0017 优选的, 所述数据处理模块还用于: 对文章数据进行分词处理。 0018 优选的, 所述数据处理模块还用于: 根据Word2Vec算法对所述的分词处理结果进 行向量转换, 得到分词结果向量, 将分词得到的词段映射为第一词向量, 并根据所述第一词 向量构建第一初始矩阵; 根据所述词段在所述训练文本集的初始文本中出现的概率和该词 段对应的第一词向量得到第二初始矩阵。 0019 优选的, 所述分类模型训练模块还用于: 将第一初始矩阵、 第二初始矩阵分别作为 TextCNN模型两个通道的输入, 对应的文章主题类型作为输出, 利用TextCNN模型对所述训 练文本。
13、集进行训练得到分类模型。 0020 与现有技术相比, 本发明的有益效果是: 本发明的一种微信公众号公号主题分类 方法及装置, 通过依次提取微信公号的10篇历史文章数据, 人工标注的基于企业广投放业 务划分的文章主题, 主题为十八个预设主题类型中的一种, 清洗文章数据, 训练Word2Vec模 型, 获取embedding, 最后训练TextCNN深度学习模型以获得分类模型, 获取待预测的微信公 众号的10篇历史文章数据, 清洗数据, 获取embedding, 通过训练后的分类模型进行主题分 类, 输出文章的主题类型; 根据所得的所有文章的主题类型, 将含有文章数量比例最大的至 少一个主题作为微。
14、信公众号的主题类型并输出。 本发明通过判断微信公众号主题类型是否 符合当前业务下的投放标准, 能够为广告投放提供数据上的参考。 附图说明 0021 图1为本发明的一种微信公众号公号主题分类方法的流程示意图。 0022 图2为本发明的一种微信公众号公号主题分类装置的结构示意图。 具体实施方式 0023 为了使本发明的目的、 技术方案及优点更加清楚明白, 以下结合附图及实施例, 对 本发明进行进一步详细说明。 应当理解, 此处所描述的具体实施例仅仅用以解释本发明, 并 不用于限定本发明。 0024 请参阅图1, 本发明提供一种技术方案: 一种微信公众号公号主题分类方法及装 置, 一种微信公众号公号。
15、主题分类方法包括以下步骤: 0025 S1、 在数据库内提取微信公号的10篇历史文章数据, 人工标注的基于企业广投放 业务划分的文章主题, 主题为十八个预设主题类型中的一种。 0026 S2、 清洗文章数据, 训练Word2Vec模型, 获取embedding, 根据Word2Vec算法对的分 词处理结果进行向量转换, 得到分词结果向量, 将分词得到的词段映射为第一词向量, 并根 据第一词向量构建第一初始矩阵; 根据词段在训练文本集的初始文本中出现的概率和该词 段对应的第一词向量得到第二初始矩阵。 最后训练TextCNN深度学习模型以获得分类模型, 将模型参数传输到磁盘内进行存储以便后续使用,。
16、 将第一初始矩阵、 第二初始矩阵分别作 为TextCNN模型两个通道的输入, 对应的文章主题类型作为输出, 利用TextCNN模型对训练 文本集进行训练得到分类模型。 0027 S3、 在数据库内获取待预测的微信公众号的10篇历史文章数据, 清洗文章数据, 对 文章数据进行分词处理, 获取embedding, 根据Word2Vec算法对的分词处理结果进行向量转 说明书 2/3 页 4 CN 111353019 A 4 换, 得到分词结果向量, 将分词得到的词段映射为第一词向量, 并根据第一词向量构建第一 初始矩阵, 根据词段在训练文本集的初始文本中出现的概率和该词段对应的第一词向量得 到第二初。
17、始矩阵。 将第一初始矩阵、 第二初始矩阵分别输入训练后的分类模型进行主题分 类, 输出文章的主题类型。 0028 S4、 根据步骤S3获得的所有文章的主题类型, 将含有文章数量比例最大的至少一 个主题作为微信公众号的主题类型并输出。 0029 请参阅图2, 本发明的一种微信公众号公号主题分类装置, 包括数据采集模块、 数 据处理模块、 分类模型训练模块。 0030 数据采集模块用于提取微信公号的10篇历史文章数据, 人工标注的基于企业广投 放业务划分的文章主题, 主题为十八个预设主题类型中的一种。 0031 数据处理模块用于清洗文章数据, 对文章数据进行分词处理, 训练Word2Vec模型, 。
18、获取embedding, 根据Word2Vec算法对的分词处理结果进行向量转换, 得到分词结果向量, 将分词得到的词段映射为第一词向量, 并根据第一词向量构建第一初始矩阵, 根据词段在 训练文本集的初始文本中出现的概率和该词段对应的第一词向量得到第二初始矩阵。 0032 分类模型训练模块用于训练TextCNN深度学习模型以获得分类模型, 将第一初始 矩阵、 第二初始矩阵分别作为TextCNN模型两个通道的输入, 对应的文本类型作为输出, 利 用TextCNN模型对训练文本集进行训练得到分类模型。 分类模型能够进行主题分类, 输出文 章的主题类型, 根据获得的文章的主题类型, 将含有文章数量比例。
19、最大的至少一个主题作 为微信公众号的主题类型并作为结果输出。 0033 本发明的一种微信公众号公号主题分类方法及装置, 通过依次提取微信公号的10 篇历史文章数据, 人工标注的基于企业广投放业务划分的文章主题, 主题为十八个预设主 题类型中的一种, 清洗文章数据, 训练Word2Vec模型, 获取embedding, 最后训练TextCNN深 度学习模型以获得分类模型, 获取待预测的微信公众号的10篇历史文章数据, 清洗数据, 获 取embedding, 通过训练后的分类模型进行主题分类, 输出文章的主题类型, 根据所得的所 有文章的主题类型, 将含有文章数量比例最大的至少一个主题作为微信公众号的主题类型 并输出。 通过判断微信公众号主题类型是否符合当前业务下的投放标准, 为广告投放提供 数据上的参考。 0034 以上所述仅为本发明的较佳实施例而已, 并不用以限制本发明, 凡在本发明的精 神和原则之内所作的任何修改、 等同替换和改进等, 均应包含在本发明的保护范围之内。 说明书 3/3 页 5 CN 111353019 A 5 图1 说明书附图 1/2 页 6 CN 111353019 A 6 图2 说明书附图 2/2 页 7 CN 111353019 A 7 。
- 内容关键字: 公众 号公号 主题 分类 方法 装置
腰椎牵引床.pdf
纸质文档扫描装置.pdf
具有节能功能的燃气流量控制装置.pdf
新型切料刀具.pdf
高压二极管加工转换组件.pdf
节能防水绝缘分支电缆.pdf
箱包坯体修边机.pdf
绿色节能建筑墙体.pdf
三联体结构金属型模具.pdf
水库坝体除险加固装置.pdf
管柱筒双向镗孔加工工装.pdf
悬挂式振动放矿机.pdf
光伏支架用焊接定位装置.pdf
建筑施工用墙体钻孔装置.pdf
建筑机电安装用电缆架设装置.pdf
建筑构件拆除设备.pdf
自动排气过滤器.pdf
药用空心胶囊生产线输送装置.pdf
用于管道内壁涂层的预处理磨平装置.pdf
图像的处理方法、装置及设备.pdf
矿井水的膜过滤装置.pdf
用于除尘设备的通风调节机构.pdf
混凝土管片抗裂性能试验装置及测试方法.pdf
受电弓滑板及其制作方法.pdf
井口取样放空截止装置及其使用方法.pdf
用于智能网联汽车的测试系统.pdf
通过低温钎焊制作氮化物陶瓷覆铜板的方法.pdf
基于EMPC模式的智能建造方法及系统.pdf
钢铁表面缺陷分割方法、装置、电子设备及存储介质.pdf
自限温电伴热带.pdf
基于WebGL的自动驾驶可视化方法.pdf
生物膜载体及生物膜反应器.pdf
一种一孔两用的隧洞排水孔结构.pdf
钢管桩围堰结构.pdf
一种生态砌块.pdf
一种铁路桥梁用泄水管.pdf
一种卷帘门的抗风装置.pdf
一种掺有非预应力钢筋的管桩钢筋笼.pdf
大型沉管隧道管段基础.pdf
汽车手套箱开启装置.pdf
城市道路上空花园式电动跃层停车商务楼.pdf
蒸压加气砌块砌窗结构.pdf
一种升降式旋转室外消火栓.pdf
框架结构T型连接柱.pdf
防静电地板吸板器.pdf
一种建筑用箱体或井口预留孔洞活动模具.pdf
速成拉建房屋.pdf
预制桥面板精轧螺纹钢筋弧形连接构造.pdf
一种内固定式伸缩门滑行导轨及伸缩门.pdf
多用途封井器.pdf
一种新型圆弧建筑模板紧固件.pdf