查看原文
其他

世界最大盗版论文网站Sci-Hub日益繁忙

2016-05-09 张章 声振之家


世界最大盗版论文网站Sci-Hub日益繁忙:分析表明无论“富国”“穷国”研究人员都在使用Sci-Hub网


一个月前,春天降临伊朗。Meysam Rahimi坐在电脑前,立刻发现一个问题:如何获取需要的科技论文。他需要为自己攻读的德黑兰阿米尔卡比尔理工大学工程学博士学位写一份研究计划。他的研究涉及操作管理和行为经济学,因此,Rahimi需要大量资料。


但每当发现相关论文摘要后,下一步遇到的就是支付页面。尽管阿米尔卡比尔理工大学是伊朗顶尖研究型大学之一,但国际制裁和经济困境使其无法订阅大量期刊。为了阅读一篇发表于2011年的应用数学和计算机学论文,Rahimi必须支付给出版商爱思唯尔28美元。


财大气粗的爱思唯尔出版集团总部

在看了摘要目录并计算过后,Rahimi发现这周仅论文就需要1000美元,几乎与他一个月的生活费相当。而且,他将在未来数年里均以这个速率阅读论文。Rahimi十分恼怒。“出版商并没有给作者任何东西,为何它们要收取运营杂志之外的费用呢?”


许多学术出版商都设置项目,帮助贫困国家研究人员获取论文,但只有一个名为“链接分享”的项目似乎对Rahimi有用。该项目要求他与作者取得个人联系,从而获得链接,而该链接在论文出版50天后失效。


于是,Rahimi似乎只面临两个选择:放弃博士学位或非法获取论文。于是,与其他数百万名研究人员一样,他向全世界最大的盗版论文网站Sci-Hub求助。Rahimi并未感到罪恶。在他看来,高价期刊“可能严重阻碍科学发展”。

Sci-Hub的世界

2011年,哈萨克斯坦神经学家Alexandra Elbakyan创立了Sci-Hub。目前越来越多的研究人员正在使用Sci-Hub,该网站已经包含5000万篇论文。来自伊朗的下载申请已经超过260万,印度340万。论文几乎涉及各个学科,从数十年前发表的物理实验到生物技术的最新突破。一周内,Sci-Hub提供了近50万篇爱思唯尔论文的下载。


这些统计数字都来自Elbakyan提供的详细的服务器日志数据。但它们并未回答一些基本问题:谁是Sci-Hub的使用者、他们在哪里,以及他们需要什么论文。


作为一个被大公司和学术圈谴责为罪犯的人,Elbakyan出人意料地坦诚直接。在《科学》杂志和她通过加密聊天系统取得联系后,双方建立了一个数据集以供公开发表:从2015年9月1日到2016年2月的6个月内Sci-Hub上每一次下载活动的记录,包括每篇文章的数字对象唯一标识符(即DOI)。为了保护Sci-Hub用户的隐私,Elbakyan先将用户的地理位置信息聚集到最近的城市,而且可用于确定用户身份的IP地址也没有被提供。


Elbakyan还回答了几乎每个问题:关于网站的运营,与用户间的互动,甚至关于她的私人生活。但她不愿透露目前的所在地,因为她仍处于破产、引渡和监禁的风险之中——爱思唯尔在去年向她提起了诉讼。


可能让支持者和反对者都感到惊讶的是,Sci-Hub的用户不仅限于发展中国家。Sci-Hub的一些批评者曾抱怨,许多用户本可以通过他们的图书馆获取论文,但还是选择了Sci-Hub——出于方便,而不是出于必需。相关数据显示,美国是Sci-Hub文章的第五大下载国,次于俄罗斯。在Sci-Hub收到的文献下载请求中,1/4来自经合组织的34个成员国——那些理应最易获取文献的富有国家。事实上, Sci-Hub最密集的使用,似乎就发生在美国和欧洲的大学校园里。


去年10月,一位美国纽约法官裁定爱思唯尔胜诉,宣布Sci-Hub侵犯了出版商作为期刊内容知识产权所有人的合法权利,并要求网站下线。服务器数据显示,这一禁令并没有起到多大效果。尽管sci-hub.org的域名在2015年11月被封锁了,但支持Sci-Hub网站的服务器位于俄罗斯,Sci-Hub使用别的域名重新开张,几乎一秒也没耽误。

谁是用户?


实际上,据爱思唯尔一份发布于2010年的报告估计,该年所有学术出版商的下载总数约为10亿次,这意味着Sci-Hub可能只抢去了5%的正常流量。即便如此,许多人仍然担心Sci-Hub会扰乱学术出版行业的秩序。美国哈佛大学学术交流办公室主任Peter Suber说:“我不支持非法做法。”但他也承认:“一场诉讼不会阻止盗版论文的步伐,也没有什么显而易见的技术手段能做到这一点。”


很容易理解为何期刊出版商会把Sci-Hub视为威胁。它像谷歌搜索引擎一样简单,而且,只要你知道文章的DOI或标题,它还更有可能找到全文。Sci-Hub收集了绝大部分曾被发表过的学术文章,并还在不断扩大:当有人搜索一篇还没有录入的文章时,Sci-Hub就会盗版一份,并将其加入自己的文献库中。


Elbakyan拒绝说明她究竟是如何获得这些文章的,但她承认和在线权限有关:可合法获取期刊内容的人或机构的用户名和密码。她说,许多学术界人士自愿将文章捐给他们。但出版商曾声称Sci-Hub会利用钓鱼邮件让研究人员上当。但Elbakyan提到:“我不能确定在线权限的具体来源,但我可以确定的是,我自己并没有发出过钓鱼邮件。”


Sci-Hub的设计决定了其内容是受学者的需求指引的。Sci-Hub还有发表在学术期刊上的新闻文章以及开放获取文章。它几乎有求必应。


该网站的活动流量还反映了研究人员的工作生活,流量在白天持续增多,随着夜幕降临逐渐减少,但从不停止。2月,Sci-Hub上的论文流量上升到了迄今为止的最高水平:每天超过20万个下载请求。


Sci-Hub共有多少用户?下载请求来自300万个独立IP地址,但真实数字还要大得多,因为在大学里,数以千计的人共享同一个IP地址。Sci-Hub下载者生活在除了南极洲以外的每个大洲。在他们聚集的2.4万个城市中,德黑兰以127万个下载请求成为Sci-Hub活动最繁忙的城市。


Sci-Hub使用情况地理分布大体上就像是一张科研生产力地图,但有个别相对富有或贫穷的注重科研的国家位置颠倒了。小国家也各有各的故事。在格陵兰的努克,有人在阅读一篇关于如何最好地为原住民提供癌症治疗的文章。即使内战肆虐,利比亚的研究也没停止:在班加西,有人正在探索在电脑间隔空传输数据的方法;在塞卜哈附近有人正在钻研流体力学。


在美国和欧洲,Sci-Hub用户集中在科研人员工作的地方。在这6个月期间,7.4万个下载请求来自纽约市,这里高校和科研机构云集。1.9万个下载请求来自哥伦布,6.8万个下载请求来自东兰辛,这两个地方分别是俄亥俄州立大学和密歇根州立大学的老家。


弗吉尼亚州阿什本市以约10万个Sci-Hub请求位列美国城市前茅。乔治华盛顿大学的科技校区、珍利亚农场研究园区以及维基媒体基金会都在这里。但后二者的发言人表示,他们的员工不太可能是这些流量的贡献者。乔治华盛顿大学的新闻办公室则做出了自我辩护,该校最近发表了一篇有关期刊订阅价格剧增对其图书馆预算冲击的在线声明。声明中说:“学术资源不是奢侈品,可它们的定价方式却和奢侈品一样。”

盗版还是正版


尽管爱思唯尔发起了针对Elbakyan和Sci-Hub的法律斗争,但许多出版行业的业内人士都认为这一举动是徒劳的。“数量实在太大了。”在了解了Sci-Hub的数据后,一家大型学术出版企业的一位高级管理人员表示。“这意味着对这些研究者来说,提供合法文献获取途径的尝试几乎完全失败了。”


他说,对在无力负担期刊获取费用的机构工作的研究者而言,出版商“需要让订阅或购买价格更合理”。国际科学、技术和医学出版商协会(STM)拓展项目的Richard Gedye不同意这一点。他认为,使用了出版商拓展项目服务的发展中国家学术机构,“有着和北美或欧洲院校近乎等同的获取同行评议科学研究的机会”。


Elbakyan表示,就算被捕,Sci-Hub也不会下线。她已经设置了保证Sci-Hub继续运转的保障机制,而且现在用户捐款已能涵盖服务器成本。数据还显示Sci-Hub爆炸式扩张的阶段已经过去。Elbakyan说,下载请求中,尚未收录到Sci-Hub数据库的文献比例目前稳定在4.3%。


对她来说,未来更不明朗。爱思唯尔不但以侵犯知识产权的罪名起诉了她,还根据美国《计算机欺诈及滥用法》起诉她非法入侵计算机系统和数据库。“我有可能因为黑客活动突然被逮捕。”Elbakyan承认。


但正如科研界的其他人一样,Elbakyan正注视着学术交流的未来在她眼前快速展开。“我会看到事情最终如何发展的。”(张章)

来源:科学网

图片收集自网络



声明:本文由声振论坛会员雪缘转发于声振论坛,资料的分享仅仅出于非商业性的教育和科研目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请立即联系我们,我们会予以更改或删除相关文章,保证您的权利!

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存