查看原文
其他

英文论文如何查重,如何理解报告中的相似率

荆木 行上行下 2022-04-26


Hello,

这里是行上行下,我是喵君姐姐~


学术界经常会时不时的曝出一些大消息。比如说前两天南开大学校长曹雪涛论文的事就是一大热门。


学术界的大消息无非是两种,一种是好消息,比如说某个课题组又在Nature上发表了一篇论文,科研工作获得了一个重大的突破。


另一种大消息是坏消息。相比于好消息,坏消息更易于传播,传播的范围更广,速度更快。中国不是有句古话,好事不出门,坏事传千里。比如说03年的汉芯事件和前两年闹得沸沸扬扬的韩春雨事件。


在这些坏消息中,抄袭现象占据了非常大的分量。国内外的各种机构每年都会花大量的精力在阻止和预防学者抄袭这件事情上。


咱们抛开国外不说,光国内的论文查重机构就有很多家。中国知网,万方和维普就不谈了,你在百度中输入论文查重,光广告就20多个,可想而知,有多少机构在做这个事情了。


虽然这些查重的机构有很多,但平心而论,中文论文查重,我只推荐中国知网、万方和维普,因为实力摆在那。其他的一些私人的查重机构和他们的实力差距还是很大的,而且这些私人的传统机构不能保证你论文的安全性。


去年有一篇论文很火:《你在一些网站上查重的论文都被别人卖到国外去了》。所以查重,尽量找一些大型的、专业的和口碑非常不错的机构。


中文查重的东西大家应该都很了解了,我在之前的文章中也写过很多了,如果大家还不清楚的,可以去看我之前写的文章,我就不再过多说了。


今天我想说的内容是英文论文查重。


和中文论文一样,英文论文也是要查重的。前两天我在小木虫论坛上看到一个人发的帖子,说的就是他用心写的一篇他自己觉得质量还是不错的英文论文,投过去之后第2天,期刊那边就给他拒稿了,我截取了编辑发给他的一份邮件中间一部分。


I have reviewed the paper and submitted it for review to ithenticate.com.  Based on the analysis, ithenticate identified multiple examples of improper paraphrases which were verbatim cites.  Likewise, other text strings were uncited entirely.  As a result of the citation issues, I am unable to send the paper for review.  Additionally, I would note the English and grammar also needs to be improved.


大体意思就是,期刊用iThenticate对这位作者的文章进行查重发现不合格,再加上一些语言的问题,所以就给他拒稿了。


针对学术界一直都存在的抄袭的现象,有两家单位CrossRef和iParadigms共同开发出了一个用于帮助学术出版者验证出版文档原创性的最新工具,CrossCheck。经过了这么多年的发展,这个工具已经变成了全球公认的检查原创文章的最佳工具。


这个工具提供两项服务,一个是iThenticate,另一个Turnitin。你可能在很多地方听说过它们,但是我真要问你,它们有什么区别的时候,很多人都回答不上来。它们区别其实有很多,不过我们真正需要知道的只有一个:


Turnitin面向的是教师学生等个体用户,而iThenticate面向的是期刊出版社等单位用户。也就是说,我们写完英文论文之后用Turnitin查重,而出版社在接收到你的文章之后会用iThenticate对你的文章进行查重。


现在市面上有很多英文论文查重的网页都是打着Turnitin的旗号,但是我对绝大多数网页都持有怀疑态度。我建议大家在写完英文论文之后,在Turnitin官网上进行查重,官网的地址我在文稿中附上了:


http://www.ithenticate.com


接下来给大家介绍一下如何理解查重报告中相似率。


首先要给大家灌输了一个概念:


没有任何一个数字能够告诉你一篇文章中是否包含有问题的内容,相似率只是为你提供一个粗略的指标,确保你能够直接注意到那些有大量重复的文章,而快速忽略掉几乎没有重复的文章。


为什么会这样呢,主要有以下两个原因。


第一个原因是,相似率告诉你的是一篇文章中和其他文章相同文字的总量,这个总量可以是由许多较小的匹配组成的。


比如说相似率30%,有可能是指30%匹配同一篇文章,但更有可能的情况是这30%是由许多较小的匹配相加而成的,这些小的匹配最大都不超过4%或5%,但这个只能在详细的查重报告中才能看出来。


这并不是说1篇30%有问题,而5篇6%就没有问题,5篇6%同样可能有问题,只是这个问题你需要在详细的查重报告中才能看出来,最后需要期刊决定怎么处理你的文章。


第二个原因是,有时匹配哪一部分,比到底有多少文字匹配更重要。


比如说某些学科领域的编辑,可能就不大在意方法部分的重复,因为要描述一个动作,也只有这么多种方式。


而一方面在讨论或结论部分的匹配,尽管它可能只占论文的一小部分,如果没有适当的引用,也会引起编辑的怀疑。


而且一篇文章可以接受的最大的相似率与另外一篇可以接受的最大的相似率往往是不一样的,你比如说综述的可以接受的最大相似率通常要比一般的文章高一点。


所以说,基于上面两个原因,比起单单只看查重的相似率,更重要的是学会查看查重报告。


希望今天的内容能让你知道如何去查重,以及更新你关于重复率的认识。


最后,我还是希望你们的英文论文重复率能控制在10%以内,比较安全。


文章转载自公众号:木耶百新 

作者:荆木

版:华华


学术PPT相关书籍推荐
如何做好学术型PPT
论文投稿被拒的常见原因排行榜及改进策略
SCI论文的投稿策略,各类收录期刊精准解读

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存