查看原文
其他

改动文字或句子就能降低文章的重复率?

知网期刊服务窗 广东知网 2020-02-12

       如何降低上传文献的重复率?网上的“破解”方法层出不穷,更是五花八门,有人说增减文字,有人说调换词语、句子或段落的顺序……


       然而这些方法真的有效吗?


       如果用的是知网的学术不端检测系统……


答案是否定的!!!


       这是为什么呢???


       分析原因,就不得不提系统的检测技术原理和方法——

系统检测原理示意图:

1、  多阶自适应指纹分析技术

       AMLC采用CNKI自主研发的自适应多阶指纹(AMFLP)特征检测技术,具有检测速度快,准确率、召回率较高,抗干扰性强等特征。

支持篇章、段落、句子各层级检测;

支持文献改写,多篇文献组合等各种文献变形检测;

支持研究生学位论文、图书专著等超长文献的学术不端检测。


CNKI自适应多阶指纹技术原理如下图所示:

       对任意一篇需要检测的文献,系统首先对其进行分层处理,按照篇章、段落、句子等层级分别创建指纹,而句子级别的指纹,则建立在对句子进行句法分析的基础上,是基于内容理解的句子级索引。而比对资源库中的比对文献,也采取同样技术创建指纹索引。这样的分层多阶指纹结构,不仅可以满足我们对超长文献的快速检测,也满足了系统对检准率和检全率的高要求。以字词、短语或连续N个字为匹配索引的技术会造成大量的误检,N过大则会造成大量的漏检,也无法检测修改过的内容。


2、语义理解技术

      知网成熟的SmartTextMiner知识挖掘技术与国际领先的NLPE自然语言处理技术,为检测系统提供了强有力的技术支持。知网构建了强大的语义分析框架,实现了词语、语句、句群、篇章分层级的语义分析,并已经在词语、语句和句群层面取得了丰硕的成果。

       在以上技术的支持下,检测系统实现了基于内容的信息指纹技术与语义分析技术的有效结合,不仅保证了检测结果的精准性,而且还具备了较强的抗干扰能力,支持文献改写、重组、翻译等多种变换形式的检测。


       综上所述,系统在识别重复和引用内容时,会结合上下文的内容,对达到一定的语义级别的内容进行判定,并不是单纯根据一两个词、字或者单独的句子进行判断。完整内容的重合情况,是由系统根据算法综合得出的,对文献内容的原样抄袭、改写、语句顺序调整等,都能自动检测和识别,且能快速定位和动态标注显示。


       所以说,变换词语、句子的顺序,完全不好使!

       那么问题来了,究竟怎么样才能规避呢???


答案就两个字:原    创


更多知网查重知识,请点:

答疑 | 你真的了解CNKI论文查重吗?



编辑/广东小知

来源/知网期刊服务窗




推荐阅读:


    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存