多语言展示
当前在线:1715今日阅读:39今日分享:10

​论文句子抄袭率计算方法及其应用的研究

论文句子抄袭率计算方法及其应用的研究在中文信息处理中,论文句子的抄袭率计算是一项基础而又重要的工作,它直接决定着某些领域的研究发展状况。例如,自动问答系统、基于实例的机器翻译、信息检索、自动文摘等领域,句子抄袭率计算都是一个非常关键的问题,长期以来一直是人们研...在中文信息处理中,论文句子的抄袭率计算是一项基础而又重要的工作,它直接决定着某些领域的研究发展状况。例如,自动问答系统、基于实例的机器翻译、信息检索、自动文摘等领域,句子抄袭率计算都是一个非常关键的问题,长期以来一直是人们研究的一个热点和难点。本文在580202论文查重研究论文句子相似度的过程中,针对论文由语素构成词语,由词语构成语句的特点,分别对论文中的义原、词语、句子三个层次的抄袭率计算进行了研究。这三者层次不同,但是联系密切,由部分构成一个有机的整体,整个计算过程每一步都利用上一步的计算结果。本文主要有如下几个方面的研究成果:1.研究了论文语句的问句意图,并提出问句意图的提取方法。问句意图的提取是以疑问句为研究对象的,问句类型不同,提取意图的方法也会有所差异。本文的研究是处于问答系统背景下,分析语料根据不同疑问句出现的频率,把问句类型分为三类:特指问句,正反问句,句末语助词问句,从而根据问句的类型针对性的提出相对应的问句意图提取方法。2.研究了论文词语语义相似度及其计算方法,利用知网提供的丰富语义信息,计算义原相似度,进一步计算基于知网的词语语义相似度。词语相似度是本文句子抄袭率计算的基础。3.提出多层次多种特征融合的论文句子抄袭率计算方法。该算法从多个角度考察语句的相似性,充分利用句子含有的目标层、结构层、语义层等丰富信息,从句子中提取问句意图、关键词集、句子长度、名词个数、动词个数、专有名词个数等多种特征。运用一种简单有效的融合手段,进而获取综合特征,利用综合特征确定句子相似度的值。4.以金融领域自然语言问答系统的模型为实例,体现句子抄袭率计算在具体应用领域的重要性。这一课题的研究及其成果对于中文信息处理中的多种领域,都将具有一定的参考价值和良好的应用前景。
推荐信息