多语言展示
当前在线:832今日阅读:167今日分享:16

给大家介绍处理模块

通过处理模块的工作,能对BBS文本信息的处理并实现对BBS内容安全监控目的的模板。由于xp系统之家BBS文档的结构和功能、主题帖上的内容和跟帖内容之间的关系,我们把BBS内容安全监控的处理模块分为对主题的安全监控和对跟帖的安全监控两个组成部分,如图
方法/步骤
1

(1)主题帖的安全监控   用户BBS上发起的主题新帖提交到系统后,系统会自动对主题义档进行审查。而在对新提交的主题BBS文挡进行审查前,系统会对此文本进行预处理,以及去噪、分词、向量空间表示等与文本训练过程相同的工作,提取特征词,并使用在预处理模块中构造的分类器对BBS文档进行主题类别判断;模式字典将派上用场,在一个句子中,根据文档中的关键词和部件词的搭配,通过一定的算法进行计算,对主题文裆内容是否正面进行判断。在正面主题过滤中,在算法中设置一定的阈值,对超过这个阈值的进行过滤,考虑到过滤的精度,这个值的确定需要不断调整。

2

(2)跟帖的安全监控   跟帖的安全监控如图9-10所示,跟帖文档的内容本质上是以主题帖部分为中心的,但xp系统下载跟帖部分文档的长度都比较短,在对它的安全监控方法上与主题帖的方法必然不同。

3

根据跟帖的自身特点,应设置一些最基本的原则。对跟帖的安全监控主要达到的目的是:   过滤掉不顾主题帖内容,与主题帖没有任何关系的内容,以及肆意在网络上散播危害党和国家声誉的舆论;   过滤掉一些用户利用BBS论坛宣传产品跟主题毫无相关的跟帖信息,并将发表这些跟帖的用户列入到黑名单屮,对其进行跟踪监控,控制其在BBS上的发言;   对用户的重复发帖予以过滤;   设定一个阈值,通过计算,对其倾向性进行分析,在与主题立场不一致的情况下,对超过这个阈值的跟帖信息进行过滤;   反馈机制——发现新热点,即使用统计的方法对同一主题在一段时间内的发帖数、点击率、跟帖率进行统计分析,从结果可以得出同一时段内最受关注的帖子,并根据其得分排序,预测未来的BBS主题热点。   对跟帖的预处理过程与主题帖的安全监控中的预处理过程一致,在最新xp系统下载倾向性分析这个环节中,主要是模式字典的运用、关键词和匹配词的搭配使用,并通过设定阈值,判定其倾向性。

推荐信息