查看原文
其他

论文深耕 | 论文重复率太高怎么办?7个降重技巧收好了!

Scholar-Land 大学生科研竞赛
2024-08-31

Hello!

这是你与「大学生科研竞赛」的第 25 次相遇。

不知道从什么时候开始,我们的网络社区被各种关于论文降重、论文查重、论文改重的知识所包围。相信每个上了大学的朋友或多或少都会接触到这方面的内容,毕竟在高校大幅度扩招后的现在,科学研究和学术论文再也不是什么奥秘的事情。特别是每年的毕业季前夕,许多将要毕业的孩子都会为他们毕业论文的降重工作而感到焦头烂额,所以今天小竞就带大家仔细聊一聊关于论文降重这一件“大事”。


顾名思义,论文的重复率就是指你所撰写的论文与已经发表出刊的论文、著作、报纸等学术文献相似的比率。这个比率是我们将论文提交到查重系统进行检测后,查重系统会将我们论文的内容与系统数据库中所有的学术资源进行对比,从而计算重复比例得出的。


一般来说,如果一篇论文的重复率高于20%,那么就会被认为重复率过高,超过50%基本就会被判定为抄袭。不过,其实论文飘红率很高也未必就是真的因为作者抄袭了,毕竟全国有上千家高校、近百家研究所和研究中心,这些高校、研究中心都会要求学生的毕业的时候提交专业相关的学术论文。


在全中国这么大的范围内,相同专业的学生研究到同一个课题,并且在结构、语句陈述上有所相似也是非常正常的一件事情。所以不少同学都经常跟小竞吐槽说明明没有抄袭,但是论文飘红率却居高不下,这下明白了吧,都是有缘由的。


论文重复率过高的话对于我们来说显然不是一件好的事情,轻则论文会被退回,重写进而毕业时间延长。尽管不同的学校有不同的规章制度,但是没法按时提交毕业论文的话,那延长毕业时间基本是大概率事件了。大家都知道如果延毕的话可能对后面找工作、考公务员等等产生一定的不利的影响。


如果严重一点的话,比如重复率高达50%的时候会被判定为抄袭。一旦被判定为抄袭,不仅仅不仅会降低你个人的信用度,也会损害学校的形象。如果是管理比较严的学校可能会采取不授予学位等惩罚措施。说通俗点就是你的学位证被吊销了,这个就非常严重了,相当于辛辛苦苦读了四年大学到头来连个学位证都没拿到。


所以,合理对论文进行降重操作就非常重要了,毕竟谁也不想到时候准备毕业了却被毕业论文卡了一手吧。读完这篇文章,小竞保证你不会再被论文降重所困扰!


1影响论文重复率的因素

首先要给各位小伙伴科普一下影响论文重复的因素,毕竟只有了解到是什么让我们的论文重复率过高,之后才能够针对性修改。


1

论文的格式

可能有很多朋友都不知道论文如果排版格式不正确的话,也会影响到查重系统检测的结果,这里指的格式最主要有三个方面的,分别是:

1.  论文目录

撰写论文经验不多的同学可能不知道我们的论文目录应该由word软件或者WPS软件自动生成,而非我们手动去编写排版。因为只有这样,中国知网或者是其他的论文查重检测系统在自动检测时才能够正确识别出论文的目录,接着再根据目录的具体内容来分章节检测。


如果我们论文的目录是手动编写输入或者是自动生成后又进行手动修改操作的话,那么检测系统很有可能无法正常识别,这样以来检测的结果就会有所差异,而且大概率是往更高的重复率上偏离的。


2. 引用内容

如果我们在撰写论文的过程中没有使用正确的格式来引用文献,或者是引用的内容超过了检测系统所设定的引用内容阈值(大多数查重系统所设置的阈值为5%),那样在检测的过程中我们引用的部分也会被标记为红色的重复内容。


一般来说,论文的引用部分内容会包含在参考文献之中,这样检测系统就能够自动识别,从而不把引用的这部分标红。所以我们在引用句子的时候一定要加上双引号“”,只要你引用的这一部分内容已经被中国知网数据库收录了,那就会被自动识别。


并且你的引用内容没有超过阈值,就不会被红标为重复内容了。正确的引用在检测报告中是以灰色字体表示的,而错误的则是红色重复内容标记,大家一定要注意清楚。


3. 参考文献

这部分与上一节的引用内容有很大关系,我们在标注参考文献时需要将其发表时间、作者、文献标题等内容都一一列清楚,并且注明相应的句子,这样才能保证引文和参考文献都被查重系统正确识别。


除了上述几个比较明显的格式错误之外,还有如脚注、文档形式等等格式小细节都有可能影响到查重的结果,毕竟中国知网的查重系统对论文格式非常敏感,这个问题一定要注意的,如果对于自己的论文格式是否足够正确没有把握的话,也可以询问导师、有经验的同学朋友。如果有的话一般他们都能直截了当地指出问题所在之处。


2

论文的原创度

这个是对论文重复率影响最大的因素,可以的话我们尽可能要在文章立意、论文结构、撰写过程等多个方面都有足够的原创性,尽量避免去参考别人的文献内容来修改自己的论文。特别是往届毕业生的毕业论文,这个基本是重灾区,一旦被发现后果也很严重。


一般来说,一个句子里跟查重系统中文献的对比重字数超过了13个的话,就会被定义为重复内容。所以,我们在一开始撰写的时候,就要避免在一个句子中重复字数超过十三个。


3

论文查重系统版本

中国知网的查重系统根据不同的论文类型会分为不同的版本,大概有以下四个版本


1. 针对本科毕业论文的知网查重pmlc版本,该版本拥有独家的“大学生论文联合比对库”,其能够涵盖使用pmlc检测过的所有往届本科毕业生论文。


2. 针对硕士博士研究生毕业论文的知网查重vip5.3/tmlc2版本,这个版本具有独家的“学术论文联合比对库”,覆盖的是使用vip5.3/tmlc检测过的往届研究生毕业论文。


3. 针对学术期刊投稿论文的知网查重AMLC/SMLC版本,是所有数据库中最为基础的数据库。


4.  针对毕业论文初稿查重的知网分解版本,这个版本大多都是毕业生在刚刚完成毕业论文时进行查重,接着修改重复率时使用的,相对来说性价比会比较高。


不同的查重系统对应的查重标准和文献对比数据库也不一样,查重的结果自然也会有所区别,我们查重的时候最好用跟学校一致的查重系统,以免两者结果不一致导致最后毕业的时候出了差错。


2如何降低论文的重复率


接下来要说的就是本篇文章最为重要的内容,小竞将会为大家带来一系列论文降重的“骚操作”,相信各位小伙伴在阅读之后一定能够有所收获。话不多说,就让我们一一介绍吧:

1

了解查重系统的具体规则原理

前面已经提到过了,不同的查重系统的查重数据库和规则要求都是不一样的,们需要确定好自己会使用到的查重系统的具体规则


中国知网针对本科毕业生的论文查重要求为例,其规定了连续13个字类似就会判定为重复,接着被系统软件标红,计算到重复率当中。


中国知网的查重是以章节为基本单元的,换句话说每一章节会出一个查重检测结果标明重复率,最后全文还会统计一个总的重复率。有些比较严谨的学校不仅仅对学生论文的总重复率规定不能超过多少,还会对每章节的重复有所要求。


不知道有同学注意到没有,知网明确规定的是“连续13个字重复”,所以如果你能够把论文改到任何一句都与别的文章连续13个字不重复,知网就查不出来了。


不过,知网服务器如果检测到某一处超过13个字与别的文章重复,会采取模糊搜索识别,这时候我们要是仅仅只添加了一些简单的连词、转折词的话,依旧会被识别出来。这个规则也是我们针对知网查重系统对论文进行降重的基本原理。


另外需要注意的是,中国知网的这套查重系统灵敏度设置了一个5%的阈值,意思是以段落计,低于5%的抄袭或者引用是不会被检测到的。


举个例子就是某个段落有一万字,那么引用单篇文章500字以下是不会被检测到的。所以,我们在引用的时候,尽可能引用多篇文章,一篇截取几句,那被检测出来的概率就会低很多。


2

修改成正确的论文格式、排版

在word格式的论文中,有很多类型的数据查重系统是无法检测出来的,比如图片、表格、代码等等。而在pdf格式中的话,以上提到的数据将会被自动转换成文本的形式,那也就意味着它们能被查重系统识别并检测了。


还有一种情况就是word文档中的尾注和脚注,这两个虽然属于文字类型但是同样不会被检测,但是在pdf中却会被当作正文来检测。所以对于同一篇文章来说,pdf格式的论文的检测重复率一般都会比word格式的高。


排版部分则就是前文提到过的论文目录、引文内容、参考文献的正确排版问题了,错误的排版会白白让你的论文高出好几个甚至十几个百分点的重复率。


所以我们一定要注意这个问题,最好在下载参考文献的时候不仅仅是参考他们的研究思路方法,对他们论文的排版情况也要多加关注。毕竟能收录进数据库中的论文,肯定都是格式排版非常达标的论文了。


3

用自己的话复述引文

相比于别的“花里胡哨”的方法,这个方法是最为朴实无华的,能用自己所组织的语言来重新表述文章的内容,自然被检测识别成重复的内容概率是最低的。这个方法的重点就是我们在阅读参考材料的时候不要去记文章/段落的内容,而是去理解这篇文章或者是你所引用段落的核心要义,产生了自己的理解之后我们才好去重新用自己的话去组织语言。


所以我们最好不要一边写一边查阅资料文献,尽量先读先理解,然后列出大纲将自己所产生的理解和想法记录下来,或者是将准备之后要参考的内容做好标记,写的时候快速查看一下原文怎么写再作适当的改写引用。


4

翻译巧用

这个就是比较“骚”的方法了,具体来说是将所需要引用的内容依靠谷歌、有道、金山等智能翻译工具先翻译成另一种语言,无论是英语、日语还是韩语都行,然后把翻译后的语言再通过另一款翻译软件重新翻译成中文。这样最后得出的句子词语和结构都会发生不少的改变,重复的几率会大大降低。


不过使用这个方法的时候我们需要注意的是,很多时候这些人工智能翻译软件并不够“智能”,最后翻译回来的中文句子未必通顺,就算通顺可能原文中比较专业的词汇也丢失了。


所以我们在翻译软件翻译回来之后一定要重新检查一下句子是否通顺,重要的词汇是否还存在,大概率的情况是我们需要进行二次修改。不过,再怎么说这第二次修改的难度也比没翻译之前的难度要低上不少,毕竟软件都已经给你改过一遍句式了。


5

关键词替换

这个方法也属于论文修改中比较基础的方法,算是最简单的降重技巧之一。使用这个方法的时候我们可以借用一下word或者wps中的一个叫做“替换”的工具,即:

 

这个工具比较适合用在大面积的关键词替换操作当中,如果我们是一句一句话进行修改的话,就不需要用上这个工具了。


在替换关键词的适合我们需要注意的是一定要先弄清楚原词语在原句子中具体要表达的意思,否则替换的关键词可能会使句子想要表达的意思给带偏,这样就得不偿失了。


有同学就要问了,我语文比较差想不到别的关键词怎么办?哎你还别说,还真有办法可以解决。比较笨的办法就是直接复制要更改的关键词到搜索引擎中,然后用搜索引擎来帮我们找同义词


而比较聪明的办法就是我们可以使用到一些网页在线修改工具,其能够帮我们自动生成并替换同义词。有些在线工具甚至能够更改替换六百字左右的大段文字,比如:http://www.xiaofamao.com/。


这个网站是前两次使用是免费的,如果次数够了我们可以通过挂VPN、拔插网线等更改ip地址的办法来重新获得免费次数,当然有觉得麻烦的同学直接注册充钱那也不是不可以。


6

改变句子语序

我们可以根据自己的写作要求对引用过来的文献句子、段落进行语句顺序的更改,方法也非常简单,将一些词语、句子进行前后调整即可。


不过需要注意的是调整的句子最好是具有以下特征的:一句话中词语的前后有分号或者顿号出现、叙述的内容分条目讲解、讲述的内容是并列的,这几类句子、段落非常容易也非常适合我们去调整语序。


不过由于目前中国知网已经开始采取模糊检索的规则,这个办法可能我们取得成效的效率会比较低。有可能出现好几次更改结果重复率也没有下降多少的情况,所以小竞并不是很推荐使用这个办法。


7

使用新的词汇插入到连续的字词当中

前面也提到了,中国知网查重系统对重复的判别标准为“连续13个字重复”,并会对重复字比较多的句子进行模糊匹配。所以我们可以在关键词替换的基础中搭配上这个在连续字词中插入新的词汇的方法。同时由于模糊检索机制的存在,就决定了我们不能只是简单地添加“的得地”这种属性词。


相信有了上述介绍的七种降重技巧你应该也不会再被降重所烦恼,不过小竞在这里要多说一点,技巧终归只是技巧,真正决定我们论文重复率的还是我们自己的原创水平。


学术论文查重绝不仅仅只是为了应付学校所规定的查重考核,在某种意义上来讲,我们撰写的论文的重复率也是我们对于自己大学四年所学知识的体系的评价。它可以体现你所学到的知识,所研究的内容相比于前人到底有没有创新,有多少创新。


对于比较爱好研究的人来说,重复率能够帮助他们避开已经重复研究的领域,从而开辟出属于自己的研究方向。不过,一码归一码,毕业的压力就挡在前面,拥有了技巧我们也能更好地应对这种压力,毕竟延毕也是一件比较难受的事情。


最后祝大家都能够顺利毕业!



推荐阅读


【福利资料】

SCI实验技术资源 | Visio | LaTeX | 海报 | 创业比赛 | NoteExpress Stata | SCI写作模板 R语言 | SPSS MATLAB | 四六级 | 英语竞赛 | 计算机二级 | Python 数学竞赛 | 数学建模 Endnote


【论文干货】

理工小白如何入门科研 |  本科做科研的意义 |  论文如何选题 |  学术期刊分类和质量辨析 |  小白如何开启数模之路 |  北大学长的学术论文写作秘籍 |  本科生如何发表论文 |   如何阅读文献 |  论文写作干货技巧


 【竞赛通知】

大学生英语竞赛 | 大学生数学建模竞赛 | “互联网+”大赛 | 外研社”英语演讲大赛阅读大赛写作大赛 | 外语学科优秀学术论文评选 | 全国法律翻译大赛 | 研究生数学建模竞赛 | 电影海报设计大赛 | 人与环境摄影大赛 | 大学生影评大赛 | 全国运动会主题海报设计大赛 | 诗歌创作与翻译大赛 | 智博会区块链应用创新大赛 | 大学生金融科技创新大赛


- END -

排版:小U

审核:青柠

/戳我投稿/

继续滑动看下一个
大学生科研竞赛
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存