查看原文
其他

如何既通过查重,也满足学术规范

学位论文写作 学位与写作 2022-07-15


摘要


当前,大部分研究生已经提交了学位论文,甚至完成了答辩,不少本科生正准备提交学位论文和准备答辩。无论是何种情况,应该还有提交最后版本的机会,因此可以参考本文介绍的建议,继续检查是否满足学术规范。掌握本文介绍的相关知识或了解相关建议,也可以在受到误判的情况下,提出抗诉,维护自己的权益。(本文完成日期,2020.5.21)


声明:本文于2019年3月23日首次发布,此次重新发布,以引起近期关注和尚未关注的读者注意,另外,此次对一些内容也有所调整和补充,对前文一些不妥的说法进行了纠正。


01

 引言





位论文包括学士论文(综合论文训练)、硕士论文和博士论文。三种论文的差异主要体现在贡献和知识掌握的程度上,但写作形式和写作质量都有相同的要求,都需要使用严密的逻辑且遵循严格的学术规范【1】。学术规范主要包括三个方面:
  1. 通过恰当引用和引述文献来尊重他人的工作。
  2. 杜绝任何形式的造假。
  3. 通过思路清晰和逻辑严密的写作避免误导读者。
本文只讨论学术规范的第一个方面。对于第一个方面,最重要的是避免有抄袭。人们可能认为,如果论文通过了查重一关,那么就满足了学术规范,就不会被认定有抄袭行为。事实上,这是一种错误认识。通不过查重肯定不满足学术规范。查重率为零也可能不满足学术规范。

于是,不能通过技巧来实现通过查重一关,而应从本质上满足学术规范。为了帮助学位候选人不仅顺利通过查重一关,而且帮助学位候选人确保满足学术规范,本文介绍文献引用的规范、抄袭的定义和自查是否有抄袭的可操作步骤,希望对即将申请学位的准毕业生们有所帮助。

本文余下部分包含六个方面的内容:文献引用的必要性, 什么时候要引述,抄袭的定义,查重的基本知识,一组查重数据分析,如何自查是否有抄袭。




02

主要内容






文献引用的必要性 ●


无论是本科学位论文还是研究生学位论文,对文献的引用和引述规范都有相同的、严格的要求【1】,要求达到期刊学术论文对文献引用的同样标准。

资深专家很容易判断什么情况下需要引用。然而,对于学生,尤其是本科生,习惯了阅读教科书。大部分教科书都在介绍本领域的通用知识,往往不需要逐一引用文献,除非加入了新的知识。人们会依据作者写教科书的风格和清晰度来理解作者的贡献,不会据此认为教科书中介绍的内容是教科书作者的原创。

相反,学位论文是反映学位候选人工作的文章,因此需要通过清晰地引用文献来说明因为别人做了什么才导致你不需要做什么,以及还需要做什么,交代你用了别人什么方法和得到了什么不同的结果或结论。

莱恩社区学院图书馆将为何要引用文献的原因归纳为如下几条【2】:
  1. 为了证明你的研究考虑过别人的研究。
  2. 引导读者了解更多的信息。
  3. 为成为一名细心的研究人员建立信誉。
  4. 展现职业级别的诚实和礼貌。
  5. 为了避免被视为剽窃。


一些常识则不需要引用,如开水沸腾的温度是100摄氏度是常识。一些专业领域的教科书级别的通用知识不需要引用。然而,如果不确定这一点,就引用文献(如教科书),或者询问导师有何建议。使用别人的句型不需要引用,因为句型仅仅是语言结构,不代表观点。但需要在句型中充实自己的内容。


什么时候需要引述 ●


文献引用有常规引用(citation)和引述(quotation)两种。我们熟悉的引用是常规引用,不熟悉的是引述。下面介绍什么是引述。

引述是指直接复制参考文献的一段话此时对引用信息有特别要求

如果引述的一段话较短,应将被引述的话加双引号,同时在引用位置标注引述的内容在原文中所处的页码范围。如果被引述的原话里也有双引号,那么在引述时将原双引号改成单引号。

如果引述的话较长,那么可以将引述的内容单独放在一块之中,通过采用两端缩进的方式或不同字体与其它文字进行区别,并在引述内容的末尾加上在原文中的页码范围【3】。

学位论文查重时,系统无法判断你是否给了恰当引述,而是单纯依据重复字数来计算重复率。 但人工判断会筛查出这不属于重复。如果管理人员人工认定这也属于重复,从而导致通不过查重一关或者要求修改,则可以提出抗诉。需要特别注意的是,这种情况包含对外文资料的使用。代表观点、方法或其它工作的一段话虽然是翻译过来的,直接使用也需要引述,除非对原话进行了逻辑改动(此时需要按常规方式引用)。是不是将原文改个别字就不需要引述,从而可以改用常规引用呢?这也不行,只有按自己的语言逻辑结构改动了原文,才可以改用常规引用。

另外,也应避免过度引述。为此需要搞清楚引述的目的是什么。之所以要引述别人的一段话,目的是想传达别人对某一重要信息是怎样说的。如果不是这种目的,或者别人的那段话代表的观点或信息并不重要,就不能引述,否则就属于过度引述,也会被认定为不妥。


什么是抄袭 ●


抄袭属于一种剽窃行为,是将他人的想法或研究成果当作自己的想法或研究成果的任何行为。抄袭有主动抄袭和被动抄袭两类。

主动抄袭属于主观行为,包括幼稚抄袭和恶意抄袭两种情况。

幼稚抄袭是指直接将其他人的文章的内容复制到自己的文章中。幼稚抄袭者有主观抄袭意愿,但并不认为这种行为有多严重,否则不会整段话直接复制。幼稚抄袭者的内心思维来源于对生活的理解。比如说,模仿歌星唱歌、临摹书法等在生活中并不属于抄袭的行为。

恶意抄袭是指行为人在认识到抄袭属于严重不当行为并且认识到抄袭被查出后会有严重后果的情况下,还是刻意抄袭。恶意抄袭者为了避免抄袭行为暴露,会试图将别人的成果或者观点通过编排、组合等文字技巧或其它技巧窃为己有。

相反,被动抄袭属于非主观行为。这有几种情况。
  • 第一种属于引用不规范,或者无意中混淆了自己的观点和别人的观点。

  • 第二种属于不经意的漏引,例如试图引用,但忘记将文献列入参考文献。

  • 第三种是为了省事,利用了现有文档的一部分(如标准方法的描述,说明书,学长的学位论文模板所带的致谢等)。

  • 第四种是通过阅读、会议和私人交往,掌握了一些观点,但历时太久后产生了属于自己想法的印象,从而当作自己的观点写入了自己的文章中。

抄袭也分为次要抄袭和主要抄袭两类。次要抄袭是指虽然有抄袭现象,但这些抄袭的内容并不构成对你主要贡献的颠覆。主要抄袭是指抄袭的内容构成了你的主要贡献,或者是你主要贡献的基础。

对于本科生,毕业论文是一种综合训练。如果事先没有规定必须带来新知识,那么有的工作可能只是一种对别人工作的重复,从而出现部分结果与现有结果重复的情况。在不知情的情况下,(通过重复性工作)给出相同的结果不应该算作抄袭。在知情情况下,应注明与文献结果一致。如果不确定如何做,应向指导教师说明,询问指导教师的建议。


查重知识 ●


系统查重只能查出一部分被抄袭的文字性内容。在文字层面上,主动抄袭中的幼稚抄袭以及被动抄袭中的省事行为,很容易被系统查重查出来。另一些情况,查重系统则无能为力,如主动抄袭中的恶意抄袭、大部分被动抄袭、抄袭未进入数据库的文章或一些网络文章等。查重系统会将学位论文和数据库中的文献进行对比,能自动查出学位论文有多少比例的局部段落或整句描述与现有文献的文字重复。如果一个仪器的使用方法需要交代,而这个使用方法的介绍已经成为了标准,那么用完全相同的语言交代,就可能被系统判定为与早期文献重复。一些同学可能辩解,某些重复根本不属于本质内容的重复,只是大家使用一些通用知识时,说法完全一样而已,不能谁在先,后面的就算抄吧。但这是学位论文,学位论文最基本的要求是论文有自己的、统一的语言风格。如果从不同的地方将别人的描述性文字拿来进行东凑西拼,就没有达到基本要求。系统查重不仅会给出总的重复率,而且会给出更多信息,包括各章重复率、总的重合字数、有重复的段落数等。不仅如此,重复部分会自动标成别的颜色。管理人员依据有颜色的文字内容的性质,很容易看出是否有整段重复。

文字层面以外的结果抄袭很难通过查重系统判定。特殊系统也可能能查出图像重复和数学公式重复。有的图像或者别人的数学公式可能被引用了,因此人工判断时会排除。有的数学公式可能是不需要引用的通用知识,如果查重和人工均判定为重复从而被要求整改,可以提出抗诉或写出说明。



一组查重数据 ●


图1-3是某工科院系2015至2018年的毕业生学位论文的查重数据,给出了重复率在0-1%区间、1-2%区间、2-3%区间、3-4%区间、4-5%区间和5%以上区间的论文数比例。横坐标为百分比区间,纵坐标为在对应区间段的论文数比例。

数据表明,历届之间的差异性较小。高达50%的学生重复率低于1%。重复率超过5%的论文占比一般低于10%。

图1 学士学位论文查重重复率按区间分布

图2 硕士学位论文查重重复率按区间分布

图3 博士学位论文查重重复率按区间分布


那么,是不是重复率低于1%就一定没有问题呢?以致谢为例,致谢的长度相比于全文,可能不到0.5%。例如,论文是100页,致谢不到半页,那么即使只全部抄袭了致谢,那么重复率也就只有0.5%。但就这0.5%,也会引起极大的不适。这种抄袭往往来源于学生拷贝别人的模板时,忘记替换致谢内容。致谢的重复虽然不会被认定为学术不端,但会让自己在别人认知中留下不好的印象,将使自己与导师的关系处于较为尴尬的状态。

如果单纯看重复率,那么在出现同样多的重复字数的情况下,越短的论文重复率可能越高。图4是前面提到的工科院系2018级的学士论文查重率与论文总字数和页码数的比较。横轴都采用了查重结果由高到低的学生排序。可见,论文页码数最低的10篇学位论文,查重重复率最高。查重率高的论文的字数偏低。

正因为如此,重复率的高低只是一个参考,更多的是应从重复的性质和实质内容来判断是否有抄袭。



图4 查重重复率与论文长度(总字数和总页码数)的直观对比


如何自查是否抄袭 ●


系统查重通过了,是否就意味着没有抄袭呢?不一定。莱恩社区学院图书馆提供了“抄袭”行为自查流程图【2】,可以对照该流程图检查自己是否不小心“抄袭了”。图5是依据文献【2】的原图翻译而成的(点击放大可以看得更清晰)。


图5 莱恩社区学院图书馆抄袭自查流程图,译自文献【2】



以下是对该流程图的解读,我们可以对照这些解读来检查是否不小心"抄袭"了。
  1. 如果使用了别人的信息、主意或工作,需要引用,否则就算抄袭。
  2. 如果使用了自己的一项之前的工作(如论文),那么也需要引用(自引),否则犯了自我抄袭(self-plagiarism)错误。
  3. 如果逐字使用了别人的一行文字,那么需要采用引述的方式引用,否则即使引用了也算抄袭。
  4. 如果将别人的一段话用自己的语言重新组织,那么至少需要用常规方法引用(可以不采用引述的方式),否则算剽窃。
  5. 如果你复制使用了别人的图像、流程图或其它形式的非文字形式的作品,也需要引用(往往需要在图的题注的标题右侧标明引用),否则算抄袭。
  6. 即使你没有上述剽窃现象,也需要将引用的别人的信息与自己的写作与分析相结合,而不能只复制别人的信息。例如,你不能全部使用别人的材料并进行了规范引用和引述,而没有自己的东西。
  7. 即使你在文章中正确引用和引述了,那还不够,所有参考文献必须出现在论文末尾的参考文献列表之中。


可见,虽然系统查重不一定查出了有抄袭现象,但如果不满足以上规范,依然可能会被认定为有剽窃行为,虽然有时这种行为不是刻意的。例如,你不经意使用了别人的图片或者英文文献的翻译内容而不引用,虽然中文系统查重一般查不出来,但会被认定为剽窃行为。

 




03

参考文献






[1] R (Chandra) Chandrasekhar,How to Write a Thesis: A WorkingGuide,M018, Centre for Intelligent InformationProcessing Systems (CIIPS),School of Electrical,Electronic and Computer Engineering,The University ofWestern Australia 24January 2008

[2] Lane Community College. 2019  Citation Guide ((MLA and APA)).  Last Updated:Feb 22, 2019. https://libraryguides.lanecc.edu/citations.

[3] Lane Community College Library. 2019  How tocite-in text. January 2019. https://libraryguides.lanecc.edu/c.php?g=391383&p=2658142





END ●



撰文 | 学位论文写作工作组

排版 | 琳月

校对 | 白博士


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存