网络数据信息处理系统、方法、设备及介质.pdf

上传人:万林****人 文档编号:14522999 上传时间:2024-05-19 格式:PDF 页数:13 大小:897.14KB
收藏 版权申诉 举报 下载
网络数据信息处理系统、方法、设备及介质.pdf_第1页
第1页 / 共13页
网络数据信息处理系统、方法、设备及介质.pdf_第2页
第2页 / 共13页
网络数据信息处理系统、方法、设备及介质.pdf_第3页
第3页 / 共13页
文档描述:

《网络数据信息处理系统、方法、设备及介质.pdf》由会员分享,可在线阅读,更多相关《网络数据信息处理系统、方法、设备及介质.pdf(13页完成版)》请在专利查询网上搜索。

1、(19)国家知识产权局(12)发明专利申请(10)申请公布号 (43)申请公布日 (21)申请号 202410036221.8(22)申请日 2024.01.10(71)申请人 石家庄邮电职业技术学院地址 050021 河北省石家庄市体育南大街318号(72)发明人 赵宝柱吴建民苏艳玲司乐园赵剑伟张蕾于含陈路远(74)专利代理机构 北京驰纳南熙知识产权代理有限公司 11999专利代理师 李佳佳(51)Int.Cl.G06F 16/9535(2019.01)G06F 16/33(2019.01)(54)发明名称一种网络数据信息处理系统、方法、设备及介质(57)摘要本发明公开了一种网络数据信息处理。

2、系统、方法、设备及介质,所述方法,包括以下步骤:定时获取网络环境下单位素材的用户评论数据及用户ID;制定关键词库,并训练AI进行关键词和模糊词筛选;通过AI对用户评论数据进行智能筛选,选取异常评论数据,并对单条评论进行标记,对已标记评论进行二次筛选,判断关键词和模糊词出现次数,并根据出现次数查看所属用户ID,并对用户ID进行标记;对已标记用户ID进行重点筛选,并控制其异常评论数据曝光度。本发明通过对网络用户的评论数据进行多层次筛选以识别恶意污染网络环境的用户,并针对性警告和评论屏蔽,保证了网络数据信息的良性发展。权利要求书2页 说明书6页 附图4页CN 117556146 A2024.02.1。

3、3CN 117556146 A1.一种网络数据信息处理方法,其特征在于,包括以下步骤:定时获取网络环境下单位素材的用户评论数据及用户ID;制定关键词库,并训练AI进行关键词和模糊词筛选;通过AI对用户评论数据进行智能筛选,选取异常评论数据,并对单条评论进行标记;对已标记评论进行二次筛选,判断关键词和模糊词出现次数,并根据出现次数查看所属用户ID,并对用户ID进行标记;对已标记用户ID进行重点筛选,并控制其异常评论数据曝光度;其中,所述通过AI对用户评论数据进行智能筛选,选取异常评论数据,并对单条评论进行标记,包括:通过AI对用户评论数据进行智能筛选,筛选出存在关键词和/或模糊词的评论,并将其选。

4、取为异常评论数据;将选取的异常评论数据,逐一进行单条评论异常标记;所述对已标记评论进行二次筛选,判断关键词和模糊词出现次数,并根据出现次数查看所属用户ID,并对用户ID进行标记,包括:预设恶意评论判定值,通过关键词和模糊词出现次数进行判定,设置判定阈值;对已标记评论进行二次筛选,判断关键词和模糊词出现次数;若关键词和模糊词出现次数超过判定阈值,则判定该评论为恶意评论,反之则仍为异常评论;对恶意评论的用户ID进行标记;所述对已标记用户ID进行重点筛选,并控制其异常评论数据曝光度,包括:选取恶意评论标记的用户ID的所有评论进行重点筛选,查看恶意评论在其ID内所有评论的所占比例,若所占比例超过阈值,。

5、则控制其异常评论数据曝光度,自动屏蔽其异常评论;所述对已标记用户ID进行重点筛选,并控制其异常评论数据曝光度,之前还包括:预设恶意评论标记用户ID的恶意评论在其ID内所有评论的所占比例阈值,且阈值包括警告阈值和屏蔽阈值;警告阈值的比例值小于屏蔽阈值的比例值;在对已标记用户ID进行重点筛选,之后,还包括判断查看恶意评论在其ID内所有评论的所占比例是否超过警告阈值和屏蔽阈值,若只是超过了警告阈值,则直接对用户ID发出警告,若是超过了警告阈值和屏蔽阈值,则在发出警告之后,还对用户的异常评论进行自动屏蔽。2.根据权利要求1所述的网络数据信息处理方法,其特征在于,所述定时获取网络环境下单位素材的用户评论。

6、数据及用户ID,包括:定时读取单位素材的用户评论数据及用户ID,并进行上传至数据库;通过时间戳对用户评论数据进行标记,并跳过相同时间戳内相同用户ID的重复评论数据,只增加新出现的用户评论数据。3.根据权利要求1所述的网络数据信息处理方法,其特征在于,所述制定关键词库,并通过AI训练关键词和模糊词筛选,包括:制定关键词库,并录入关键词,并设置模糊词规则;权利要求书1/2 页2CN 117556146 A2输入用户评论数据,并通过关键词和模糊词规则训练AI进行关键词和模糊词筛选。4.一种网络数据信息处理系统,涉及权利要求13中任一项所述的一种网络数据信息处理方法,其特征在于,包括:数据获取模块,其。

7、用于定时获取网络环境下单位素材的用户评论数据及用户ID;数据训练模块,其用于制定关键词库,并训练AI进行关键词和模糊词筛选;数据筛选模块,其用于通过AI对用户评论数据进行智能筛选,选取异常评论数据,并对单条评论进行标记;数据标记模块,其用于对已标记评论进行二次筛选,判断关键词和模糊词出现次数,并根据出现次数查看所属用户ID,并对用户ID进行标记;曝光度控制模块,其用于对已标记用户ID进行重点筛选,并控制其异常评论数据曝光度。5.一种电子设备,其特征在于,所述电子设备包括:处理器、存储器,所述存储器与处理器进行通信连接;所述存储器用于储存至少一个所述处理器执行的可执行指令,所述处理器用于执行所述。

8、可执行指令以实现如权利要求1至3任一项所述的网络数据信息处理方法。6.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至3任一项所述的网络数据信息处理方法。权利要求书2/2 页3CN 117556146 A3一种网络数据信息处理系统、方法、设备及介质技术领域0001本发明涉及网络数据处理技术领域,具体为一种网络数据信息处理系统、方法、设备及介质。背景技术0002网络群体性事件,简称网群事件,指在互联网上发生的有较多网民参与讨论的事件。网络群体性事件的特点是会在很短时间内造成很严重的影响。0003网络群体性事件狭义上特指在。

9、一定社会背景下形成的网民群体为了共同的利益或其他相关目的,利用网络进行串联、组织、呼应,乃至可能或已经影响社会政治稳定的群体性非正常事件。0004发明内容0005本发明的目的在于提供一种网络数据信息处理系统、方法、设备及介质,以解决上述背景技术中提出的问题。0006为实现上述目的,本发明提供如下技术方案:一种网络数据信息处理方法,包括以下步骤:定时获取网络环境下单位素材的用户评论数据及用户ID;制定关键词库,并训练AI进行关键词和模糊词筛选;通过AI对用户评论数据进行智能筛选,选取异常评论数据,并对单条评论进行标记;对已标记评论进行二次筛选,判断关键词和模糊词出现次数,并根据出现次数查看所属用。

10、户ID,并对用户ID进行标记;对已标记用户ID进行重点筛选,并控制其异常评论数据曝光度。0007优选的,所述定时获取网络环境下单位素材的用户评论数据及用户ID,包括:定时读取单位素材的用户评论数据及用户ID,并进行上传至数据库;通过时间戳对用户评论数据进行标记,并跳过相同时间戳内相同用户ID的重复评论数据,只增加新出现的用户评论数据。0008优选的,所述制定关键词库,并通过AI训练关键词和模糊词筛选,包括:制定关键词库,并录入关键词,并设置模糊词规则;输入用户评论数据,并通过关键词和模糊词规则训练AI进行关键词和模糊词筛选。0009优选的,所述通过AI对用户评论数据进行智能筛选,选取异常评论数。

11、据,并对单条评论进行标记,包括:通过AI对用户评论数据进行智能筛选,筛选出存在关键词和/或模糊词的评论,并将其选取为异常评论数据;说明书1/6 页4CN 117556146 A4将选取的异常评论数据,逐一进行单条评论异常标记。0010优选的,所述对已标记评论进行二次筛选,判断关键词和模糊词出现次数,并根据出现次数查看所属用户ID,并对用户ID进行标记,包括:预设恶意评论判定值,通过关键词和模糊词出现次数进行判定,设置判定阈值;对已标记评论进行二次筛选,判断关键词和模糊词出现次数;若关键词和模糊词出现次数超过判定阈值,则判定该评论为恶意评论,反之则仍为异常评论;对恶意评论的用户ID进行标记。00。

12、11优选的,所述对已标记用户ID进行重点筛选,并控制其异常评论数据曝光度,包括:选取恶意评论标记的用户ID的所有评论进行重点筛选,查看恶意评论在其ID内所有评论的所占比例,若所占比例超过阈值,则控制其异常评论数据曝光度,自动屏蔽其异常评论。0012优选的,所述对已标记用户ID进行重点筛选,并控制其异常评论数据曝光度,之前还包括:预设恶意评论标记用户ID的恶意评论在其ID内所有评论的所占比例阈值,且阈值包括警告阈值和屏蔽阈值;警告阈值的比例值小于屏蔽阈值的比例值;在对已标记用户ID进行重点筛选,之后,还包括判断查看恶意评论在其ID内所有评论的所占比例是否超过警告阈值和屏蔽阈值,若只是超过了警告阈。

13、值,则直接对用户ID发出警告,若是超过了警告阈值和屏蔽阈值,则在发出警告之后,还对用户的异常评论进行自动屏蔽。0013本发明还提供一种网络数据信息处理系统,包括:数据获取模块,其用于定时获取网络环境下单位素材的用户评论数据及用户ID;数据训练模块,其用于制定关键词库,并训练AI进行关键词和模糊词筛选;数据筛选模块,其用于通过AI对用户评论数据进行智能筛选,选取异常评论数据,并对单条评论进行标记;数据标记模块,其用于对已标记评论进行二次筛选,判断关键词和模糊词出现次数,并根据出现次数查看所属用户ID,并对用户ID进行标记;曝光度控制模块,其用于对已标记用户ID进行重点筛选,并控制其异常评论数据曝。

14、光度。0014本发明还提供一种电子设备,所述电子设备为实体设备,所述电子设备包括:处理器、存储器,所述存储器与处理器进行通信连接;所述存储器用于储存至少一个所述处理器执行的可执行指令,所述处理器用于执行所述可执行指令以实现如上述的网络数据信息处理方法。0015本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,所述计算机程序被处理器执行时实现如上述的网络数据信息处理方法。0016与现有技术相比,本发明的有益效果是:本发明通过预设关键词库,并训练AI对用户评论进行筛选,挑选出含有关键词或说明书2/6 页5CN 117556146 A5模糊词的评论为异常评论,若异常评论中。

15、出现的关键词或者模糊词较多,则判定其评论为恶意评论,并对发出恶意评论的用户ID进行标记,进行重点关注,并重点筛选该用户ID的所有评论中,查看恶意评论在其所在比例,并对超过一定比例的用户ID进行警告,或者在警告的同时将其恶意评论进行屏蔽,本发明通过对网络用户的评论数据进行多层次筛选以识别恶意污染网络环境的用户,并针对性警告和评论屏蔽,保证了网络数据信息的良性发展。附图说明0017图1为本发明实施例提供的一种网络数据信息处理方法的主流程图;图2为本发明实施例提供的一种网络数据信息处理方法的具体步骤流程图;图3为本发明实施例提供的一种网络数据信息处理方法的恶意评论重点筛选具体步骤流程图;图4为本发明。

16、实施例提供的一种网络数据信息处理系统的结构框图。具体实施方式0018下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。0019本实施方式的方法的执行主体为终端,所述终端可以为手机、平板电脑、掌上电脑PDA、笔记本或台式机等设备,当然,还可以为其他具有相似功能的设备,本实施方式不加以限制。0020请参阅图1,本发明提供一种网络数据信息处理方法,所述方法应用于网络用户评论数据的异常信息筛选处。

17、理,包括:步骤101,定时获取网络环境下单位素材的用户评论数据及用户ID。0021具体的,所述步骤101还包括:定时读取单位素材的用户评论数据及用户ID,并进行上传至数据库;通过时间戳对用户评论数据进行标记,并跳过相同时间戳内相同用户ID的重复评论数据,只增加新出现的用户评论数据。0022步骤102,制定关键词库,并训练AI进行关键词和模糊词筛选。0023具体的,所述步骤102还包括:制定关键词库,并录入关键词,并设置模糊词规则;输入用户评论数据,并通过关键词和模糊词规则训练AI进行关键词和模糊词筛选。0024步骤103,通过AI对用户评论数据进行智能筛选,选取异常评论数据,并对单条评论进行标。

18、记。0025具体的,所述步骤103还包括:通过AI对用户评论数据进行智能筛选,筛选出存在关键词和/或模糊词的评论,并将其选取为异常评论数据;将选取的异常评论数据,逐一进行单条评论异常标记。说明书3/6 页6CN 117556146 A60026步骤104,对已标记评论进行二次筛选,判断关键词和模糊词出现次数,并根据出现次数查看所属用户ID,并对用户ID进行标记。0027具体的,所述步骤104还包括:预设恶意评论判定值,通过关键词和模糊词出现次数进行判定,设置判定阈值;对已标记评论进行二次筛选,判断关键词和模糊词出现次数;若关键词和模糊词出现次数超过判定阈值,则判定该评论为恶意评论,反之则仍为异。

19、常评论;对恶意评论的用户ID进行标记。0028步骤105,对已标记用户ID进行重点筛选,并控制其异常评论数据曝光度。0029具体的,所述步骤105包括:选取恶意评论标记的用户ID的所有评论进行重点筛选,查看恶意评论在其ID内所有评论的所占比例,若所占比例超过阈值,则控制其异常评论数据曝光度,自动屏蔽其异常评论。0030其中,对已标记用户ID进行重点筛选,并控制其异常评论数据曝光度,之前还包括:预设恶意评论标记用户ID的恶意评论在其ID内所有评论的所占比例阈值,且阈值包括警告阈值和屏蔽阈值;警告阈值的比例值小于屏蔽阈值的比例值;在对已标记用户ID进行重点筛选,之后,还包括判断查看恶意评论在其ID。

20、内所有评论的所占比例是否超过警告阈值和屏蔽阈值,若只是超过了警告阈值,则直接对用户ID发出警告,若是超过了警告阈值和屏蔽阈值,则在发出警告之后,还对用户的异常评论进行自动屏蔽。0031在本实施例中,通过预设关键词库,并训练AI对用户评论进行筛选,挑选出含有关键词或模糊词的评论为异常评论,若异常评论中出现的关键词或者模糊词较多,则判定其评论为恶意评论,并对发出恶意评论的用户ID进行标记,进行重点关注,并重点筛选该用户ID的所有评论中,查看恶意评论在其所在比例,并对超过一定比例的用户ID进行警告,或者在警告的同时将其恶意评论进行屏蔽,本发明通过对网络用户的评论数据进行多层次筛选以识别恶意污染网络环。

21、境的用户,并针对性警告和评论屏蔽,保证了网络数据信息的良性发展。0032为了更好的对上述实施例进行理解,如图2所示,本发明还提供了一种网络数据信息处理方法的具体步骤流程图,方法至少包括:步骤201,定时读取单位素材的用户评论数据及用户ID,并进行上传至数据库;步骤202,输入用户评论数据,并通过关键词和模糊词规则训练AI进行关键词和模糊词筛选;步骤203,通过AI对用户评论数据进行智能筛选,筛选出存在关键词和/或模糊词的评论,并将其选取为异常评论数据;步骤204,将选取的异常评论数据,逐一进行单条评论异常标记;步骤205,对已标记评论进行二次筛选,判断关键词和模糊词出现次数是否超过判定阈值;说。

22、明书4/6 页7CN 117556146 A7步骤206,若关键词和模糊词出现次数超过判定阈值,则判定该评论为恶意评论并对恶意评论的用户ID进行标记,并执行步骤207,反之则仍为异常评论,并回到步骤202,等待新的用户评论数据进行筛选;步骤207,选取恶意评论标记的用户ID的所有评论进行重点筛选,查看恶意评论在其ID内所有评论的所占比例是否超过阈值,若超过,则继续执行步骤208,反之,则回到步骤206,继续等待恶意评论标记的用户ID的新恶意评论刷新,并重新筛选;步骤208,则控制其异常评论数据曝光度,自动屏蔽其异常评论。0033为了更好的对上述实施例进行理解,如图3所示,本发明还提供了一种网络。

23、数据信息处理方法的恶意评论重点筛选具体步骤流程图,方法至少包括:步骤301,选取恶意评论标记的用户ID的所有评论进行重点筛选;步骤302,判断恶意评论标记的用户ID内所有评论的所占比例是否超过警告阈值和屏蔽阈值,若超过警告阈值,则继续执行步骤303;步骤303,对用户ID发出警告,并继续判断是否超过屏蔽阈值,若是,则继续执行步骤304,反之结束;步骤304,对用户的异常评论进行自动屏蔽。0034在上述实施例的基础上,如图4所示,本发明还提供了网络数据信息处理系统,用于支持上述实施例的网络数据信息处理方法,所述网络数据信息处理系统包括:数据获取模块41,其用于定时获取网络环境下单位素材的用户评论。

24、数据及用户ID;数据训练模块42,其用于制定关键词库,并训练AI进行关键词和模糊词筛选;数据筛选模块43,其用于通过AI对用户评论数据进行智能筛选,选取异常评论数据,并对单条评论进行标记;数据标记模块44,其用于对已标记评论进行二次筛选,判断关键词和模糊词出现次数,并根据出现次数查看所属用户ID,并对用户ID进行标记;曝光度控制模块45,其用于对已标记用户ID进行重点筛选,并控制其异常评论数据曝光度。0035进一步的,所述网络数据信息处理系统可运行上述网络数据信息处理方法,具体实现可参见方法实施例,在此不再赘述。0036在上述实施例的基础上,本发明还提供一种电子设备,所述电子设备包括:处理器、。

25、存储器,所述处理器与存储器进行通信连接;在本实施例中,所述存储器可以按任何适当的方式实现,例如:所述存储器可以为只读存储器、机械硬盘、固态硬盘、或U盘等;所述存储器用于储存至少一个所述处理器执行的可执行指令;在本实施例中,所述处理器可以按任何适当的方式实现,例如,处理器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(ApplicationSpecificIntegratedCircuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式等等;所述处理器用于执行所述可执行指令以实现如上述的网络数据信息处。

26、理方法。0037在上述实施例的基础上,本发明还提供一种计算机可读存储介质,所述计算机可说明书5/6 页8CN 117556146 A8读存储介质中存储有计算机程序,所述计算机程序被处理器执行时实现如上述的网络数据信息处理方法。0038本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的模块及方法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。0039所属领域的技术人员可以清楚地了解到,为。

27、描述的方便和简洁,上述描述的装置、设备和模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。0040在本申请所提供的几个实施例中,应该理解到,所揭露的设备、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或单元可以结合或者可以集成到另一个装置,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或设备的间接耦合或通信连接,可以是电性,机械或其它的形式。0041所述作为分离部件说明的模块可以是或者也可。

28、以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。0042另外,在本发明各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。0043所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中。

29、,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储服务器、随机存取存储服务器、磁碟或者光盘等各种可以存储程序指令的介质。0044另外,还需要说明的是,本案中各技术特征的组合方式并不限本案权利要求中所记载的组合方式或是具体实施例所记载的组合方式,本案所记载的所有技术特征可以以任何方式进行自由组合或结合,除非相互之间产生矛盾。0045需要注意的是,以上列举的仅为本发明的具体实施例,显然本发明不限于以上实施例,随之有着许多的类似变化。本领域的技术人员如果从本发明公开的内容直接导出或联想到的所有变形,均应属于本发明的保护范围。0046以上仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。说明书6/6 页9CN 117556146 A9图 1说明书附图1/4 页10CN 117556146 A10图 2说明书附图2/4 页11CN 117556146 A11图 3说明书附图3/4 页12CN 117556146 A12图 4说明书附图4/4 页13CN 117556146 A13。

展开阅读全文
内容关键字: 网络 数据 信息处理 系统 方法 设备 介质
关于本文
本文标题:网络数据信息处理系统、方法、设备及介质.pdf
链接地址:https://www.zhuanlichaxun.net/pdf/14522999.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1