查看原文
其他

Sci-Hub 已能免费下载几乎所有论文,“付费读论文”时代也许真会随它终结

2017-08-11 Lindsay McKenzie 科研圈

2月5日,全球访问Sci-Hub的网络用户。


Sci-Hub 上已经涵盖了全部学术论文的 69%,而剩下的 31% 并非是它不能下载,而是没人对网站提出获取它们请求——是人们不需要的内容。


撰文  Lindsay McKenzie

翻译  学术头条


毫无疑问,著名的非法(根据美国法院的判决)盗版论文在线资料库 Sci-Hub是非常受欢迎的。但是它的资源库到底有多大?最近,宾夕法尼亚大学的生物学家丹尼尔·希默斯坦(Daniel Himmelstein和同事开始在科学研究中心的帮助下试图找出这个问题的答案。


他们的发现作为一篇预印本论文发表在7月20日在 Peer J  期刊的网站上。文章认为,通过Sci-Hub 可以立即获取全部学术论文中的三分之二,希默斯坦表示,这一数字比他的预期要高得多。此外,对于受付费墙保护的研究论文,Sci-Hub 的覆盖面更大,可以立即获取在订阅获取期刊上发表的所有论文的 85%。对于一些大型出版商而言(如爱思维尔),其 97%以上的期刊文章目录被存储在 Sci-Hub 的服务器上,也就是说可以免费获取这些文章。


Sci-Hub 几乎可以访问科研人员想要阅读的每一篇文章,并且对于该网站上没有的文章也可以快速获取,那么,这个网站真的可以推翻传统的期刊出版商吗? 希默斯坦接受 ScienceInsider 的采访时推测,他的研究结果表示,这可能标志着付费墙研究论文“终结阶段的开始”。本文是这次访谈的简编。


问:您为什么要研究 Sci-Hub 的覆盖面?


答:这一切开端是,3月19日 Sci-Hub 在推特上发布了其资源库中所有文章的列表。我当时一看:“这下我们可以研究很多之前无法研究的东西了,可以研究这个网站的运营情况和资源的覆盖范围。大多数人都知道 Sci-Hub 提供了一些学术文献的获取权限,但问题是究竟有多少文章。


问:具体的计算过程是怎样的?


答:我们的主要步骤是弄清楚现存的学术论文总数。为此,我们使用了 Crossref 的数据,该数据库具有日志标识符或 DOI(数字对象标识符)数据库。这个数据库不是唯一的,但是迄今为止最常用的学术出版数据库。做了一些排除后,我们编制了一份包括8160万篇文章的清单。这一步很重要,因为这让我们的计算方程有了分母。过去研究 Sci-Hub 覆盖范围的人并没有采取这个正确的步骤,要搞清 Sci-Hub 的文献覆盖比例,需要先弄清文献的总量。


问:您的研究的主要发现是什么?


答:最简单的结论是 Sci-Hub 上涵盖了全部学术论文的69%。我们还发现,该网站会优先涵盖封闭获取期刊出版商和高影响力期刊的文章。我觉得很有意思的一点是,Sci-Hub 对爱斯维尔和美国化学学会的论文覆盖率最高,这正是起诉 Sci-Hub 的两家出版商。也许是因为意识到自己的整个资源库都在 Sci-Hu b的涵盖范围之内。还有很多期刊上每一篇文章都能在 Sci-Hub 上获得。


问:剩下的31%呢?


答:如果只是有一篇文章不在 Sci-Hub 的数据库中,并不等于无法通过 Sci-Hub 获得这篇文章。我们估计 Sci-Hub 能够在99%的情况下完成获取论文的请求,这表明它没有涵盖的31%的文章是人们不需要内容,没有提出获取请求。


问:您是否研究了不同学科领域的涵盖范围变化情况?


答:是的。不同学科领域之间的覆盖率有一些变化,但我认为这个变化幅度可能不像人们过去猜测的那么大。论文覆盖率最高的是化学学科,达到93%,而最低的计算机科学为76%。这个结果可能与这些领域内论文发表活动有关。我们发现,封闭获取期刊的覆盖率比开放获取期刊高。


问:Sci-Hub 面临一些法律上的挑战,你认为这些问题会阻止它的发展吗?


答:我们在这篇论文中绘制了 Sci-Hub 与 Google 趋势图的历史对比,Sci-Hub每次遭遇法律上的挑战,都导致对该网站的谷歌搜索量的飙升,这表明,这些挑战基本上是为 Sci-Hub 做了免费广告。我认为官司纠纷无法阻止 Sci-Hub 的发展。


问:你认为 Sci-Hub 将来会如何发展?


答:在我们的论文中提到,未来的技术可以在不存在中心点故障的情况下为用户提供文件托管服务,所以,通过 Sci-Hub 或与之类似的服务仍然可以访问所有这些论文,但这些服务的背后找不到某个特定的域或个人。而现在,如果 Sci-Hub 的服务器被发现,它们可能会被缉获并销毁。


问:您真的认为,将来会有图书馆员为 Sci-Hub 支付期刊获取的费用吗?


答:由于指示他人做下不法行为会引发法律问题,我认为图书馆员永远不会这样做。但在某种程度上,他们已经在这样做了。现在有很多图书馆不能提供100%的学术文献资料。在全球范围内,能够提供完全访问权限的大学所占的比例很小。


问:出版商要怎么办,才可以阻止新的论文被添加到 Sci-Hub 的资源库中?


答:确实可以采取一些办法,但真的可能伤及自身。问题是,出版商的态度越保守,合法获取论文的难度就越大,而这会促使更多的人去使用 Sci-Hub。


问:您希望这项研究可以造成哪些影响?


答:我认为这项研究展现的大局是,这是订阅获取学术出版走向终结的开端。我认为订阅获取模式将不可避免地走向失败,更多的开放模式的出现将成为必须之事。做这项研究的一个动力是,我想促进这一必须之事更快地成为现实。


原文链接:

http://www.sciencemag.org/news/2017/07/sci-hub-s-cache-pirated-papers-so-big-subscription-journals-are-doomed-data-analyst


本文转载自公众号“学术头条”(SciTouTiao)。


阅读更多


▽ 故事

· 为什么不存在“第三种性别”?数学解答性别进化谜题

· 发一篇 Nature 奖励6万美金:首份中国“有奖科研”调研报告出炉

· 颠覆认知!糖尿病可能像疯牛病一样传播?!

· “我不想拿一千块工资、住多人宿舍,还被海归碾压”

▽ 论文推荐

· 为什么人类的大脑认为数学“美”? |  Front.Hum. Neurosci 论文推荐

· Nature 封面故事:STAR 国际合作组首次在实验中观测到超强涡旋【附专家点评】

· 音乐的历史,即人类的历史 | Frontiers in Sociology 论文推荐

· Science:打破百年设计瓶颈 光存储性能有望提高 40 倍 | 专访论文共同一作、南昌大学沈林放研究员

▽ 论文导读

· Science 一周论文导读 | 2017 年 7 月 28 日

· Nature 一周论文导读 | 2017 年 7 月 27 日



内容合作请联系

keyanquan@huanqiukexue.com

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存