查看原文
其他

创办Sci-Hub、成为学术界“盗版女王”,她选择与出版集团为敌

2018-03-12 李子李子短信 果壳网

在俄罗斯高等经济学院,4个人、一只猫、还有一台由 13 块硬盘组成的服务器,挤在一间狭小的学生宿舍里。这台服务器的主人,是一名来自哈萨克斯坦的女孩,高等经济学院在读研究生、程序员亚历珊德拉•厄巴科扬(Alexandra Elbakyan)。而这台藏在宿舍里的简陋服务器,是一个名叫 Sci-Hub 的网站主机,上面有6千4百万篇供全世界所有人免费下载的学术论文。


2015年6月平常的一天,厄巴科扬打开邮箱,一封邮件跳了出来。“你被起诉了!”

起诉她的,是全球最大的学术出版商,旗下有2500家权威期刊的爱思唯尔(Elsevier)。很显然,厄巴科扬的网站侵犯了他们的著作权。


然而厄巴科扬只是耸耸肩。她人在莫斯科,法院在美国,不能拿她怎么样。她只是一个小研究生、互联网上千万个不知名的“黑客”(如果她算的话)之一。即使她的 Sci-Hub 和这场官司,已经处于整个学术圈的争论中心,也极少有人知道她姓甚名谁。


挡在学术成果之前的“付费墙”


如果你还不知道 Sci-Hub 的话,你可以问问你身边做研究的小伙伴,他们或多或少有着在 Sci-Hub 上搜一篇在犄角旮旯发表过的论文的经验。这是世界上最大的盗版学术论文网站


为什么会有“盗版学术论文”呢?这跟盗版音乐和盗版图书又有什么区别呢?


随便在爱思唯尔旗下的在线期刊打开一篇学术论文,你可以看到,读到一篇论文的花费,在十几到几十美元不等;订阅这些期刊的费用更是高到不可思议——平均需要4000多美元。想要越过挡在研究者和期刊之间的这堵“付费墙”,对于高校和研究机构之外的人来说,几乎不可能。哪怕对于高校的图书馆和数据库而言,每年需要支付的费用也十分巨大,且逐年上涨:一所大学要投入50至200万美元不等,连哈佛大学也曾抱怨。发展中国家的高校或者一些小型研究机构常常无法负担高额的数据库费用;而想要深入学术研究的研究者,却往往面对这堵付费墙发愁。一个研究常常需要参考几十、上百篇文献,而来自著名期刊的论文,往往是最重要的。


即使是高校,也会因为资金问题选择性地购买数据库。图片来源:Pixabay


那么这些高昂的订阅费,是否惠及到了写论文的著作人呢?至少在经济上并没有。著作人是拿不到稿费的,大多数情况下还要付版面费。这些高额的订阅费用,通常用于支撑整个学术出版业界的运作——编辑、同行评审、校稿,有的杂志社还雇有专门的市场营销、公关、新闻发布人员,以及社交媒体运营等。


在科学研究发展的早期,学术期刊是公益性质的存在,通常也非常简陋、缺乏完善的管理。但是二战之后,随着科学技术行业的爆炸性发展,期刊走向了商业化运营,大出版集团把控住了期刊话语权。关键是,在顶级期刊上发表文章,几乎是学术成果被承认、学术机构间正式交流成果的唯一方式;而商人们也清楚,这个需求是无止境的。


学术成果,是否应该标价?


厄巴科扬第一次遭遇付费墙,是 2009 年的事。彼时的她还在哈萨克斯坦阿拉木图做自己的本科研究论文。付费墙让她沮丧的同时,她也意识到,这并不是一件“正常”的事情。


业余时候的厄巴科扬喜欢研读一些神经科学方面的东西。她将科学研究的成果,比作“全人类的智慧网络”。如果神经网络之间互相连接能够让信息传递更高效、能够诞生更为先进的智能,那么人类的智慧成果也不应该被付费墙所阻挡。她认为,历史上伟大的科学成就,都得益于最伟大思想之间的交流和碰撞,以及“站在巨人肩上”往下看;而科学想要生存,必须要科学家向全世界“喊出”他们的研究结果才行。


美国科学社会学家罗伯特•默顿(Robert Merton)曾经提出,科学应该是普遍主义的、利益无涉的,贯彻有组织的怀疑主义(organized skeptism),以及共产主义的。理科出身的厄巴科扬在2016年方才接触了默顿的理论,于她而言是一种顿悟,更是一种不谋而合。“西方的资本主义出版集团”,无疑是横贯在科学和真理之前的一座大山。


学术成果是否该标价,这一点在学术界也颇有争议,相当一部分的学者赞同免费。理论上,各国大学由政府使用纳税人的拨款资助学术工作者的研究,至少本国纳税人有权知晓并查阅学术研究成果,而不是由大的出版公司收买。但是也不得不承认,商业化的运作,支撑了学术出版业的繁荣,以及科学传播事业的进行。


近年来,由研究者们主导的运动,例如开放出版运动(Open Access),得到了越来越多人的支持,其中包括开放出版的期刊 PLOS(科学公共图书馆),以及鼓励研究者们以个人身份上传的 Arxiv(电子预印本文库)。各类学术社交媒体,例如 researchgate 和 Academia 等,也由研究者个人提供非正式版本的论文下载。目前,有大约 28% 的学术论文通过开放出版的方式供分享。开放出版的期刊通常由非盈利机构提供资金资助,有的也会向研究者收取更多的版面费来维生。2013 年,美国政府执行了一项规定,由联邦基金资助的学术成果,必须要以某种方式出现在开放出版领域(比如上传到 Arxiv 等)。


因为论文获利最大的是出版商。图片来源:Pixabay


秉持开放出版的学术界,和坐享巨大利益的出版集团之间,保持着一种微妙的平衡。


出版集团对研究者的“分享”有诸多限制(名曰“负责任的分享”,还专门有一个机构来推行他们认为合适的分享准则),例如不可分享最终修订的正式版本,必须经过一定时间之后才能分享,等等。而在背后,则是强大的游说集团,阻止政府制定有利于开放出版的政策,还迫使 Researchgate 撤下了7百万篇“不符合分享规定的论文”


厄巴科扬是开放出版运动的支持者。她在本科毕业之后,曾经试图在“俄罗斯硅谷”、斯科尔科沃创新中心建立一个俄国版的、类似于 PLOS 的出版项目,但是并没有成功。心灰意冷的她去念了一个科学和宗教史相关的硕士学位,但并没有放弃编程。她觉得,战胜这堵“付费墙”、达成“绝对无阻碍的分享”的唯一办法,就是“盗版”了。


侵犯他人著作权的“盗版”,显然是违法的。然而因特网诞生以来的匿名、公平和免费原则,又一直和用版权盈利这件事本身相抵触。而所谓“黑客”,则绕开规则,用“违法”的激进手段达成这一目标。真正的黑客们大多诞生于资本主义的技术繁荣之下,却从骨子里反资本主义, Sci-Hub 和厄巴科扬“科学共产主义”的无私追求,可以说是黑客的一种诠释。


于是,Sci-Hub 充满争议又多舛的命途,从莫斯科的一间宿舍里开始了。


业余程序员和出版商的“猫捉老鼠”


厄巴科扬从小学的时候就开始接触编程了,做一个准黑客程序对于她来说并不是什么难事。最初,她编写了一个脚本,用 MIT 的学生账号自动登录各大期刊网站,然后下载论文。一开始她也没有全部公开这个脚本,而是在俄罗斯的一个学术交流论坛上分享自己下到的论文。


后来,她把这个搬运的人力活儿,变成了人人可以“一键使用”的 Sci-Hub。Sci-Hub 正式诞生于 2011年,是她的一个业余项目。人们可以在 Sci-Hub 搜索论文,然后通过程序脚本、使用某个大学的登录账号,跳转到论文的下载界面。这是通过大学的服务器完成的,如果一个服务器不行,用户可以换另一个大学的。但所有的论文只能被“借阅”,一定时间之后就无法打开了。


后来,另外一个知名“学术盗版”网站 LibGen(一个存储未授权学术书籍的网站)找到了厄巴科扬,让她可以把下载下来的论文放到 LibGen 的服务器上,这样就可以更容易地多次使用搜索结果。然而 LibGen 遭受了一次变故,服务器数据丢失,厄巴科扬转而求助众筹,为 Sci-Hub 购得了一个服务器。那时候,Sci-Hub 上已经有了 2100 万篇论文。她在网站上挂上了自己的 Paypal,讨得一些资金,然后转而支付一些酬劳给提供大学账号密码的学生们——具体数目有多少,不得而知。


高校学生提供的帮助是Sci-Hub能够壮大的原因之一。图片来源:Pixabay


这样大量的数据,精明的出版商不可能不察觉。2013 年,爱思唯尔发现了这件直接危及他们利益的情况。爱思唯尔发函给 Paypal,厄巴科扬的账号被关停。但这仅仅是漫长斗争的开端。


遭遇了这次小小打击之后的厄巴科扬并没有特别沮丧。她一边开始自己的研究生学习,一边开始重写代码,并把整个数据库做了好几个备份。新的脚本能自动检查各大高校网络代理的运行情况,并在大学账号中切换,而用户可以直接下载到论文,不必一个个大学切换。接着,她把捐助渠道改成了比特币——比特币在之后几年的疯涨,倒是为她带来了一些意外之财。


爱思唯尔随后发现了来自一些大学账号的非正常访问记录。他们联系大学,把这些账号或者代理账号封掉,或者直接从自己的网站上阻止某些 IP 登录。但是厄巴科扬手上的大学账号特别多,根本封不完。当然,她自己也非常小心地控制着访问数,在必要的时候“关掉中国和美国等大宗访问量来源地”,或者只开放给“前苏联各国”。


为了彻底绕开学校这一关,厄巴科扬修改了脚本,不是从学校账号直接获取论文,而是获取文章的密钥,然后再用密钥,从数据库直接下载论文。这个策略沿用到了现在——只要你有论文的 DOI(发表的期刊论文所独有的一个数字编码,在论文网站上都有显示),输入 Sci-Hub 的搜索框,论文就可以在浏览器中以pdf格式显示或下载下来。


这让各大出版商从技术上几乎无计可施。


但这场战争毕竟实力悬殊。出版商擅长的并不是技术,而是强大的法务集团和游说集团,面对侵权者可以在法庭要求互联网供应商掐断盗版网站线路,让搜索引擎不显示搜索结果(尽管谷歌对此并不理会),或者让 DNS 无法解析域名。而面对“合法”的对手,爱思唯尔的游说集团出入政府国会,阻碍学术分享的法案落地——他们曾于2005年让美国卫生研究所公开出版的政策难产,更于之后试图“拦截”3次此类议案。尽管他们因此遭到1万7千名研究者的联名抵制,让他们态度有所软化,但这根本对他们造不成实质性威胁。他们不仅是能“杀死”盗版网站,Researchgate 这样的合法分享网站,也得对他们言听计从。


果然,毫无悬念地,2015 年,爱思唯尔在美国起诉了 Sci-Hub 和厄巴科扬并胜诉,赔偿额为1500万美元;美国化学协会(American Chemistry Society)跟进,同样也胜诉,赔偿额为480万美元。Sci-Hub 先后失去了 .ac, .cc,.io 等域名。


一个孤独的战士


有的人把厄巴科扬比作女版的阿伦•斯瓦茨(Aaron Swartz),后者是 Creative Common 的发起者、著名网站 Reddit 的创始人。斯瓦茨因为使用自己 MIT 的账号自动、大量地下载学术数据库 Jstor 上的论文用作公开分享而被起诉,随后不堪压力而自杀。现在唯一能保护厄巴科扬的,就是她身处俄罗斯这个事实。她偶尔会担心自己出境、进入欧洲或者美国的时候会不会被逮捕。但只要她不离开俄罗斯,美国法院的判决,从现实上无法在她这样一个身处别国的别国公民身上强制执行,民事案件也更不存在引渡一说。俄罗斯薄弱的版权保护也为她提供了方便。
 
“我不会赔付的,我根本没有那么多钱。”她声称网站每个月只能收到区区数千的捐赠,外加在2017年价值大约26万美元的比特币。Sci-Hub 还存在着,拥有自己的 IP 地址和推特账号,告诉用户怎么访问网站。


她在卫报的一个采访中说,“学术应该属于所有科学家,而不是出版商”,并引用了联合国人权宣言的第27条,“……(拥有)分享科学进步及其产生福利(的权益)”。


虽然她的目标,是完全没有边界的、世界范围的信息共享,但是现状却是,作为一个哈萨克斯坦公民、俄罗斯居民,厄巴科扬的自我认同更偏向所谓的“东方”,而对西方的社会和民主抱有疑虑。她坦诚,自己“学术共产主义”的思想来自前苏联,她想为更多第三世界、没有顶级研究条件的人提供方便——比如,来自伊朗的学者,几乎无法访问美国的任何期刊网站。她争辩说,发达国家也有并不富有的学者,而资本主义加剧了这一切的恶化。甚至是在俄罗斯国内,她也和所谓的“自由主义学者”们有过冲突,甚至一气之下拔了 Sci-Hub 的服务器好几天。


不过,Sci-Hub 有1/4的下载来自世界上 34 个最发达的国家,这也成为了 Sci-Hub 被指摘的一个点。《科学》杂志(Science)网站上发布的一篇统计显示,许多下载来自美国东部的精英大学。而下载的理由很简单:方便。只需要一个DOI,不用搞账号、登录等繁琐程序,也不用考虑学校究竟有没有购买某一个数据库。


厄巴科扬是一个孤独的人。在西方,从事开放期刊的人对 Sci-Hub 一直持谨慎态度。哈佛大学开放期刊项目负责人彼得•苏博(Peter Suber)不推荐用户“使用非法方式”获取资源,他也担心,盗版会对整个开放期刊事业带来不好的名声。“其实,现在你只要发邮件给研究者要文献,他们都会给的。”她的名字很少被英文世界提起,虽然Sci-Hub 本身处于争议旋涡之中。


厄巴科扬,正孤独地走在这条“共享”道路上。图片来源:Pixabay


抛开这些争议,Sci-Hub 依然以自己的方式运转着。2017年7月的一项研究表明,Sci-Hub 覆盖了全世界有标识码的在线论文的68.9%。根据谷歌趋势(Google Trend)的统计,每一次主要的法律判决和公开争议过后,Sci-Hub 的访问量都会得到提升。2017 年,光是中国访客就贡献了2400万次下载;有24次下载甚至来自南极洲。


然而更加坚挺的,依然是学术出版巨头。爱思唯尔的母公司励讯集团(RELX Group)的市值估价为350亿美元;旗下的科学出版部门的利润率为令人咋舌的 39%(作为参考,苹果公司去年12月份的利润率为22%)。罗伯特•马克斯韦尔,西方学术出版商业化的第一个巨头,在1988年的时候曾这样预测:未来会有几个最强大的出版公司控制整个学术出版业,然后在电子出版的年代不用承担印刷成本,赚“纯利润”。看起来,他似乎是一语成谶了。(编辑:Ent,锦衣Reload。题图来源:Pixabay)


作者注:

厄巴科扬在英文世界的资料非常稀缺,本文关于厄巴科扬的内容,大部分源于《The Verge》在2018年2月份对厄巴科扬的一次俄语采访,以及一篇长篇报道[1]。随后厄巴科扬在她自己的博客里用很长的篇幅[2-4]对这篇报道做了解释和部分反驳。本文对两方的说法均进行了采纳。


本文不推荐用非法的手段获取内容。对于学术期刊的商业化运行、开放期刊运动和“学术盗版”,作者憾无法于本文有限的篇幅中一一深入探讨,欢迎各方的讨论和观点,若有疏漏或片面之处请不吝赐教。


果壳网

ID:Guokr42

整天不知道在科普些啥玩意儿的果壳

我觉得你应该关注一下


本文来自果壳网,谢绝转载

如有需要请联系sns@guokr.com

(欢迎转发到朋友圈~

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存