查看原文
其他

论文查重工具、规则和降重方法

分享 语言科学 2022-06-09

自从翟天临事件之后,高校对论文的查重率要求的越来越严格。部分学校的毕业论文“查重率”从原来的30%以内降低到20%,更严格的甚至降到了8%以下。


还有学校增加了重审环节,即对已毕业学生的毕业论文进行质量跟踪监控,一旦被查出高于查重率,将直接取消学位证书与毕业证书。


你是否开始了费钱的查重之旅呢?看到查重结果的那个数字,是否心又凉了一大截?


一、高校常用的查重工具


 1 

知网


检测对比库:

  • 中国学术期刊网络出版总库

  • 中国博士学位论文全文数据库/中国优秀硕士学位论文全文数据库

  • 中国重要会议论文全文数据库

  • 中国重要报纸全文数据库

  • 中国专利全文数据库

  • 个人比对库


其他比对库,部分书籍不在知网库,检测不到。


*图片来源:中国知网


知网论文检测的条件是13字单位以上的相似或抄袭都会被红字标注,但是必须满足前提条件:你所引用或抄袭的A文献文字总和在你的各个检测段落中要达到3%。(3%是知网灵敏度的阈值,以段落计,低于3%的抄袭或引用是检测不出来的,这种情况常见于大段落中的小句或者小概念)。


 2 

万方


与知网数据库绝大多数相同,价格低廉,是一些大专、三表本科、升本二表、部分在职硕士所经常采用的一种查重引擎。相对而言,万方查重是最松的。


*图片来源:万方数据官网


 3 

PaperPass


号称“最变态、最严格”,其实它外强中干。由于其数据库相对知网万方不全,故为了追求所谓“严格性”,经常性的用旁征博引的方法,肆意拉高其抄袭率。比如:


1、一篇关于中外文学英雄人物对比的核心期刊论文,PP显示抄袭了一篇香菇预防黄曲霉菌的论文;2、一篇关于提高广东发展银行支付效率的MBA毕业论文,结果被PP标注抄袭了一篇肌肉运动与康复的论文;3、一篇幼教的硕论,结果PP查重标注抄袭了南京理工大学一篇电磁炮弹道的硕论…


然而一些“特殊学校”,则为PP的宣传所言,要求学生要用PP查重,于是各种扫红、各种悲剧。

*图片来源:PaperPass


最关键的是PP的扫红,往往与知网扫红大相径庭!因为它们数据库不同,PP是靠旁征博引硬拉抄袭率才显得“严格”。就像两个女孩减肥,一个是用健康的有氧训练法,减掉的都是脂肪;另一个是为了追求体重轻而拼命喝泻药,结果减掉的是水分和纤维、肌肉,最后变成了一个满身脂肪和骨头的“怪胎”...


 4 

维普通达检测系统


网址:http://gocheck.cn

原来注册后可以免费使用三次,现在变成了3000字的免费试用。


*图片来源:维普论文


 5 

Turnitin


这是一种专门用于查英文论文的查重引擎,它是以单词为标准,但是并不是机械的查重,而是如果仅仅是人称时态等简单变化的句子,连续8个单词还是会被扫红。


*图片来源:网络


二、查重规则揭秘


“我明明每句话都改动了,为什么还是被扫红?
“我明明每句话都标注引用了,为什么还是被扫红?
“我明明改的非常多了,为什么还是被扫红?
……
这是因为没有了个各个查重引擎的规律。


 1 

知网


早期的知网是每20个字连续相同即判定为抄袭。几次升级后,知网查重已经变得越来越变态,现在不但连续6个字符相同就算是抄袭,哪怕一些句子中的主语和名词出现相同,即使连接词和虚词不同,也一样会被扫红。唯一的好处是:一些数学公式、定理是不会被扫红的,且基本不会对参考文献扫红。

然而知网比较吝啬,证据是它是根据目录进行查重,如果它发现你上传的文档里有一个目录,而后面又出现一个目录,那么就认定是“合并查重”,就只会对第一个目录下的文档查重,后面的不闻不问。


 2 

万方


比较松的一种,基本是每10个字连续相同即为抄袭,且很少出现关键字相同连词不同也被扫红的问题。但是万方有一个问题:喜欢对公式定理与参考文献扫红。因此万方适合论文写作初期、大段大段抄袭并修改时期。


 3 

PP


PaperPass很变态,它不但连续4个字就算抄袭,而且不管是公式定理还是名人名言参考文献,一律标红;只要出现一句话2个关键词相同,或是一句话的语法句式一样,哪怕毫无关系的两个专业的论文也被标红;


像PR、维普等,更为变态,例如它们查数字和外文时,是以字母连续出现,而不是单词连续出现为标准的……


 4 

Turnitin


关于“全文标注引用还是被扫红”这个问题,实际上就是:除了极少数公式、定理(理工类的)之外,哪怕引用名人诗词,99%也是要被扫红的。连参考文献名字都经常被扫红,何况参考文献里的内容?

相对来说,理工科的论文可以通过变换模型、改变数字解决查重问题,但文科生可能就比较难办了。


三、前期查重比较实惠的论文查重工具


 1 

格子论文 


网址:www.gezida.com


*图片来源:格子达首页


首先查重就是两个字“免费”,每个账号天两次免费查重的机会。不是3000字也不是4000字,而是管你多少字!简易报告完全免费,可查看全文检测结果及40%的相似内容,可在线修改40%的内容。


要是你想要详细的pdf版本之类的一般花个5-10块钱就差不多搞定了,通常第一次查重都是重复率稍微高一些的,下个完整的报告对照改一改,然后再检查1-2次确认无误。


检测范围:互联网,中文期刊库(涵盖中国期刊论文网络数据库、中文科技期刊数据库、中文重要学术期刊库、中国重要社科期刊库、中国重要文科期刊库、中国中文报刊报纸数据库等),学位论文库(涵盖中国学位论文数据库、中国优秀硕博论文数据库、部分高校特色论文库、重要外文期刊数据库如Emerald、HeinOnline、JSTOR等)。


结果格式举例:

1、总体结论2、论文字数:65432个3、总相似比:19.22 (%) [即复写率与引用率之和]
4、检测指标:自写率 80.78 (%)    复写率 9.21 (%)    引用率 10.01 (%)
5、相 似 比:互联网资源 3.54(%)    学术期刊 2.77(%)    学位论文 2.90(%)    自建库0.0(%)  
6、检测结果示意图7、详细报告等

 2 

知识产权卫士-拷克网


网址:www.copycheck.com.cn


*图片来源:拷克官网


比对文献资源包括:

  • 期刊论文资源

  • 学位论文资源

  • 会议论文资源

  • 法规资源


每千字符数1元计费,不足一千字符数按一千字符数计;例:5100字符数6元,可以获得详细的检测结果报告。


 3 

写邦WriteHelp


网址:www.writehelp.cn


*图片来源:写邦科技官网


3000字免费试用,然后收费标准是2元/3000字,相对便宜。


四、降低查重率的一些小方法


抄袭率是有规律的,顺着规律来,完全可以让一篇全红的抄袭率100%的文章,变成抄袭率0%的纯原创论文!主要的方法是:插字、变换语法句式、更改关键词、语言、表达方式的语种变化、原意复述、图片替换。


[认真严谨,何惧查重?何来降重?]


 1 

插字


针对各个查重引擎连续X个字相同即抄袭的特点,可以每当其即将满足这个临界的字数时,立刻插入一个或多个文字,打断查重引擎的查重抄袭率检验系统。这么做的后果是:原来3000字的文章,改出来可能是4000,也可能5000、6000…比如:

A组经过早期的肉芽组织形成阶段,在术后第4周完全填充关节软骨缺损区,且与周围组织连接紧密,细胞周围有典型的软骨陷窝及软骨囊,细胞胞突明显,整个细胞被胶原原纤维环绕。


假设为知网查重引擎,即为至多5个字一插字,应用插字法,整个句子就会是改这样:

A组经过了最早期的局部与整体肉芽组织的逐步形成阶段,进而在手术后的第4周就已经完全的填充好了关节软骨的病灶与缺损区,而且与骨膜周围的组织生长完好、连接紧密,在细胞的周围伴生有典型的人体骨骼软骨组织陷窝以及关节软骨囊,且细胞的胞突十分明显,观察细胞后发现整个细胞都被胶原类的原纤维组织所环绕;字数增加了不少,抄袭率问题也迎刃而解。


 2 

变换语法句式


这种方法不可单独使用,应与其他的改重方法结合使用。变换语法句式的核心是:几乎所有的查重引擎都会通过对一个句子主谓宾定状补等语法结构进行对比,如果出现一个句子中,主语、谓语、宾语关键词和排列的顺序相同,就会判定为抄袭!


关键点是排列的顺序。所以在改重时,切记要将句式语法打乱。像陈述句改成疑问句,倒装句修改,实词顺序的打乱等等。


例如这样一句话:

骨表面以下的骨骼实际上有着更多的矿质化,同时显示了较老的及较脆的骨骼的结构特点。


这句话是陈述句,关键词排列顺序为:

骨,表面,骨骼,矿质化,较老,较脆,骨骼,结构,特点。


采用此方法,将陈述句改为疑问句,同时打乱关键词排列顺序:

目前表面的矿质化骨骼真的并不存在?当然存在!骨骼中无论是较脆或是较老的,无一不显示出它矿质化的结构特点。


此方法多与其他方法合并使用,不建议单独使用。


 3 

更改关键字


这是一种有效改重方法。它的原理是:所有查重引擎,都是通过对主谓宾定状补等实词或虚词作为关键词,连续两个(少量较松的为3~4个)关键词相同(哪怕中间有间隔)即为抄袭。

那解决办法就是更改关键词。更改关键词的方法,主要是同义词替换。比如抄袭率100%的原句:

医护人员必须掌握小儿生理解剖特点和生长发育特点,了解小儿生理、心理状态,对小儿骨科手术进行全方位的麻醉护理。


应用更改关键词方法,首先要找出关键词:

救治者(替换医护人员)应该(替换必须)了解(替换掌握)孩子(替换小儿)身体结构(替换生理解剖特点)及成长规律(替换生长发育特点),通晓(替换了解)孩子身心情况(替换生理心理状态),实施全面的(替换全方位)的骨科麻醉手术(组合后替换)。


应用该方法有个要求:尽量不要用原来出现的文字。语言、表达方式的语种变化是一种较为投机取巧的改重方法。即保持原意不变的前提下,采用“英文与汉字互译、数字大小写互换、英文字母大小写或代入字母更替”的方法。比如:

1、将原文中的艾滋病病毒,改成英文描述HIV。
2、将原来的3.1415926,改成汉字大写的三点一四一五九二六。
3、将原来的XYZ坐标轴,改为KBM坐标轴。


 4 

原意复述


这种方法的原则是:原来的字一个不用,原来的句子结构彻底打乱,原来的意思换一种说法说出。可以是正面陈述意思,也可以是反面印证原意。


当你理解了原句意思后,用自己的话陈述出来,这样改重后绝对没有任何问题。

例如:严密观察术后伤口渗血情况及石膏的完整性,避免石膏折断和小便污染。

改为:外科治疗后患者的创口会有流血与石膏脱落问题,应严格的跟踪,防止出现创口处石膏与代谢废物的破坏。

本文来源:“UniCareer”微信公众号

1.工具方法

武大教授:从论文写作、研究方法到答辩

《人文社科论文修改发表例话》重磅上市

一次搞懂十大文献综述是什么体验?

文科生的编程自白

王华树博士团队带你走进人工智能时代的翻译技术

语言科学研究的利器——R


2.公益讲座

香港中文大学中国语言及文学系学术讲座系列

香港城市大学田家炳博士中國文化講座系

浙江大学紫金港跨学科国际讲坛

陕西师范大学海外中国现代文学研究系列讲座

工作坊:学术发表的挑战和策略
厦门大学外文学院学术前沿系列讲座
上外英语学院系列前沿讲座
安徽大学外语学院系列前沿讲座
中国人民大学文学院系列国际讲座
西安外国语大学云端学术周


3.讲座回看

2021年度国社科活页新变化专项解读
立项率超20%的国家项目,了解一下
教育部人文社科项目申报书填写+立项案例
语言文学公益讲座回放集锦(六)
How to get 教育部人文社科基金项目
文献综述如何催生论文、专著和项目
语言文学国社科立项申报书+申报攻略
2022年度国家社科基金项目“语言学”申报指南(内附攻略)
2022年度人文社科纵向项目申报时间表

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存