“论文写作障碍”的福音:人类做实验,A.I.写文章
图片来源: phys.org
撰文 Daniel Engber
翻译 何伟雄
审校 魏潇
自动化学术写作的未来不远了,这是件好事。
2014 年,法国的一位研究人员透露了一个关于已发表的学术论文的令人不安的事实:根据他的分析,至少有 120 篇电脑撰写的稿子被编入了学术会议论文集。 这些由程序书写的文章几乎是由一些串联在一起的词语堆砌起来的,全部由一个名为 SCIgen 的软件创造——这个软件最初源于 MIT 的三位研究生 2005 年的一次无心之举。但是在那之后, 一些科学家把 SCIgen 当成了丰富学术简历、提升职业地位的工具——这显然是个重大的丑闻。
一篇 SCIgen 生成的论文 来源:betterscience.org
不过,这个丑闻让克勒门•祖潘基奇(Klemen Zupancic)获得了灵感。这个 32 岁的分子生物学家和科技企业家认为:“这提醒了我们。”祖潘基奇是 sciNote 的负责人—— sciNote 是一家科技创业公司,该公司建立的目的是改变科学家从使用笔和纸做实验笔记的现状,推动他们转而应用更高效的在线工具。(该公司声称他们有大约 2 万名用户,其中几乎一半在美国)。当他读到机器撰写的论文混进了学术期刊时,他意识到,这样的方式可以被用于更为正当的目的。如果软件可以发表“八股文”式的文章,那么它也可以写出一篇有效的科学论文。所以他的公司开始着手开发一个能够做到这一点的程序。
他们的努力变为了现实——这个名为“Manuscript Writer”的程序在十一月初面世了。它的工作原理是搜索 sciNote 用户使用的参考文献,数据和实验流程,然后把它们串连起来,形成一篇正式学术论文的草稿。这种草稿非常粗糙:软件甚至写不出讨论部分或者对实验结果的解释; 而且根据笔者所知,软件对文章其他部分的写作并不比 SCIgen 好。Manuscript Writer 能够构建起论文的导论部分,它从一系列开放获取的参考文献中挑出句子,然后将这些句子随机地组合起来,生成所谓的“导论”。
Manuscript Writer的使用网址:https://scinote.net/manuscript-writer/
但是,sciNote 系统是可以改进的。理论上,它的 A.I. 可以通过比较用户已经完成的论文和软件的“试作品”,从错误中学习。鉴于目前自动化新闻报道已经出现,预测出机器撰写论文的质量会越来越好似乎也并不是什么疯狂的想法。也许软件可以达到和人类科学家的平均写作水平一样好(或者一样差)的程度。
我们应该都很期待这一天的到来。当涉及到用理论来阐述结果的部分时,人类智能是必不可少的,但科学写作其余的部分——从论文的导论到实验,方法和结果的描述——都能够受益于自动化。
历史上学术论文的质量可能比今天糟糕得多。顶级科学家们很久之前就已经开始为同行的糟糕写作感到惋惜了。例如,1908 年,弗朗西斯·高尔顿(Francis Galton)向皇家文学学会(Royal Society of Literature)提交了“改善科学回忆录文体的建议”(Suggestions for Improving the Literary Style of Scientific Memoirs)。 他写道:“我在家的时候曾阅读了许多回忆录的手稿,其中没有什么特别深奥的东西,但是这些手稿表意模糊,语法糟糕,而且文章的结构充斥着错误,在第一次读时几乎无法理解。 ......这些手稿的作者可能是成功的研究者,但他们的文笔差劲得令人可悲,以至于难以发现其内容的不足之处。“
在高尔顿的抱怨之后,事态进一步发展。科学家们为了方便他们的工作而决定使用通用语,这就意味着世界各地的研究人员不管水平如何都不得不用英文写作。与此同时,二战后科技事业的发展以及学术学科的日益细分,使得研究论文更加技术化、形式化。大约在 20 世纪中期,一个沉闷枯燥的模板开始在整个科学领域传播:首先是导论(Introduction),然后是实验所用的方法(Method),再然后是结果描述(Result)和讨论部分(Discussion)。到上世纪 70 年代,这种“IMRaD”格式在论文写作中几乎成为了共识。
来源:wedestroydis.co
随着这些变化日益根深蒂固,科学写作不再是一种修辞类型,而是一种传达数据的工具。现在的论文看起来更像网络上的数据包。如果所有这些数据包都是使用相同的算法、不经修饰,这只会使它们更有效率。根据乔纳森•奈特(Jonathan Knight)在《自然》杂志 2003 年的一篇文章中所引用的词汇分析显示:在 1900 年,《科学》与《自然》上的论文就像《纽约时报》(New York Times)上的文章一样容易被大众所接受。但渐渐地,论文的可读性逐渐下降,专业术语也变得越来越多。
“我们现在处于一种鼓励趋同的体系中,”《自然:科学杂志的历史》(Making Nature: The History of a Scientific Journal)一书的作者梅林达·鲍德温(Melinda Baldwin)说。“我们正处于一个不鼓励人们撰写优美科学论文的系统中。”现在独立的研究人员面临需要大量发表论文的压力而不得不放弃个人风格。对他们来说最重要的是尽可能快速、清晰地发布他们的结果。
即使是现在,那些非英语母语的科学家,或者只是想省事一些的科学家,也可以把他们论文写作有偿外包给专业人士。对于那些对自己的语言功底不自信或太过忙碌的人来说,自动写作(automated writing)会更好。A.I. 所生成的每一篇文章可能最终看起来会很相似,但这是一件好事。这缩小了学者语言背景上的差异,他们文章中写作风格上的缺陷也将被减少。高尔顿对于论文写作质量的烦恼——表达模糊、语法不好、错误的文章布局——都可以从文章中剔除,或者通过论文写作软件的一系列更新得以修正。
当然,这种扁平化也会抹去文章可能蕴含的一切魅力或智慧。例如,有史以来最着名的科学论文之一:弗朗西斯·克里克(Francis Crick)和詹姆斯·沃森(James Watson)于 1953 年在《自然》杂志上发表的关于 DNA 结构的文章。即使这篇论文列出了生物学史上最重要的发现之一,它的作者们也只是在文章中对这项让他们名垂青史的成果进行了轻描淡写地阐述:”我们注意到,本文所假设的特定配对表明了遗传物质可能存在的复制机制。”
如果他们的论文是由克勒门•祖潘基奇的软件或类似的东西自动撰写的话会怎么样? 我们可能会错过这二人具有划时代意义的工作。文章《核酸的分子结构》(Molecular Structure of Nucleic Acids)在写作上没有特色,风格枯燥无味,也几乎没有其他论文所具有的的优雅。
但是,这可能也是一件好事。
如果糟糕的文笔干扰了论文阅读——它减慢了实验和数据的共享和传输——那么好的写作就正相反:它可以使论文整洁,逻辑顺畅; 它消除了歧义,帮助读者理清它所描述的发现。根据 FiveThirtyEight 的内特·希尔(Nate Silver)的分析,一篇研究论文写得不好的话人们就很难发现其中的错误,但写得太好也是一样的。他说,在“平均”水平的论文中,发现错误是最容易的,你不会被文笔分散注意力。
心理学实验为这个想法提供了支持。根据被称为“流畅性启发式”(fluency heuristic)的理论,一种表述越容易被人们理解,那么它看起来就越可信。如果这是真的,那么写得不好的论文就会处于不利的地位,它们的可信度会下降——即便支持结果的科学论述是完全合理的。而以简练有趣的风格撰写的论文可能更容易被认为是可信的,哪怕它们基于非实质性的证据。但是,如果 A.I. 为我们写论文,我们就不用担心我们会成为这种偏见的受害者。每一篇文章都会以平均的方式书写:不会太差,也不会太好。
从早期的学术期刊开始,人们就认识到了这个问题,并且感到了科学写作中诡辩式修辞的威胁。1665 年,英国皇家学会(Royal Society of London)出版了第一份专门的科学期刊。在两年后,英国皇家学会出版的传记中,托马斯·斯普拉特(Thomas Sprat)曾自豪地说:“该组织的惯例是拒绝所有的夸大、离题和臃肿的风格,他们要求全体成员用一种紧凑的、朴素的,自然的说话方式:积极地表达、清晰地判断、自然流利、尽量做到“如同数学一般的明确”。
不过,并不是每个科学家都赞同“惯例”。当皇家学会向这个方向努力时,历史上其他的一些学者群体更倾向于花哨的表达。科学传播学者亚历克斯·齐斯扎(Alex Cziszar)引用了博物学家亚历山大·冯·洪堡(Alexander von Humboldt)的言论:与其他浪漫主义科学的支持者一样,洪堡认为“对宇宙中伟大现象的清晰阐述”应该使用“富有创造性的表达”。
齐斯扎说,这一争论与如何评价一篇论文写得“好”有关——科学家们是否应该努力追求清晰、优美、效率或其他行文风格——这个问题长久以来一直存在。从 19 世纪晚期开始,许多科学家都倾向于更简练、平淡的文章。1925 年,两名医学杂志编辑在一篇论文风格指南中写道:“那些绚丽的、浪漫的风格,充满了多音节、隐喻性的词汇,会分散读者的注意力”,以及“在学术写作中,没有必要用非简练的、盎格鲁撒克逊式的术语来表达想法或陈述事实。”
事实上,随着科学研究越来越多地关注数据,会有更多沉闷而公式化的论文出现。 目前,我们在生物医学领域至少有 2400 万份参考文献,1500 万名科学家正在积极地撰写论文。哪怕在一个单一的研究领域,即使这些研究都被写的很清楚,每个研究者依然有太多的知识要吸收。为了更好地处理这些论文,我们将越来越依赖另一种软件——不是 A.I. 写作者,而是一个 A.I. 阅读者。这已经实现了:科学家正在使文献检索过程变得自动化,而 A.I. 可以一次性通过摘要对数以百万计的论文进行分类。这样我们可以从算法中获取最大的益处。如果 A.I. 从一开始就是论文写作者,那它当然也能更好地理解它们。
机器革命还能更进一步吗? 去年,的里雅斯特大学(University of Trieste)的研究人员做出了一些新的东西:A.I. 同行评议。受 SCIgen 的启发,这些科学家着手编写了一个能自动生成评议报告的工具。该方案将根据使用者设定的模式对任意一篇论文进行正面,负面或中立的评估。计算机告诉一位作者:“如果你再讨论一些关于建立起良好的共享基准的重要性,那么论文将会更好。“另一个建议是:“确定模型中的关键假设是很有用的。”当科学家们把机器生成的评论与真人的评论混合在一起给一群人类读者阅读时,计算机生成的评论有四分之一被认为比人类的更有用。
两条由A.I.生成的论文评议,你觉得有道理吗?
来源:machinelearning.inginf.units.it
一旦 A.I. 同行评议得到了充分的升级,它们就可以审阅同样由 A.I. 撰写的论文。 这之后,下一步应该是显而易见的:A.I. 科学记者将为我们呈现出由 A.I. 作者发表的最新研究进展。
原文链接
阅读更多
▽ 故事
· 为了找出被研究次数最多的基因,他和《自然》一起做了个“明星基因”排行榜
▽ 论文推荐
· 研究发现抵制语法变化大约是白费力气 | Nature 论文推荐
· 地球自转谜之变慢:专家预测2018年地震频率将会上升 | Geophys. Res. Lett. 论文推荐
▽ 论文导读
· Nature 一周论文导读 | 2017 年 12 月 21 日
· Science 一周论文导读 | 2017 年 12 月 22 日
内容合作请联系
keyanquan@huanqiukexue.com
点击图片,开始提名