查看原文
其他

一张通往宇宙奥秘的地图

2017-12-10 George、Knegjens 原理

科学家生活在一个快节奏的世界,在这个世界里,每天都有数百篇新的论文出现,每一篇都是数月甚至数年累积的辛勤工作才获得的研究成果。面对如此巨大的论文信息量,如果能发明一种新的组织归类方式,让科研工作者更轻松的发现那些可能错过的好论文、也让刚进入领域的新人找到开始的方向,那可真能算得上是功德无量的好事一件了。


ArXiv是一个几乎每位科研工作者都熟悉的开放式的网站。科学家通过在arXiv发表论文的预印本,能迅速被别人访问阅读。自1991年起,arXiv 已经聚集了物理、数学、计算机科学、统计学、定量生物学和金融学等领域的一百多万篇论文。每个工作日几乎都会增加数百篇新的研究论文,包括从希格斯玻色子到量子隐形传态,再到恒星的形成等各个学科。




尽管大部分学科间的区别都很明显,但还是有许多交叉学科的成果是从完全不同的领域中提取的,因此建立一个能够可视化整个领域的“地图” 应该挺有意思,有点像六度分隔理论,但是是存在于学术论文之间的。


如果你请一位科学家,让他把 arXiv 上自己的研究领域(比如黑洞或者量子隐形传送)的文章归类组合在一起,他很有可能能胜任这项工作并制作出一张非常棒的“地图”,但完成这项任务所需要的时间必定很长。因此,Damien George 和 Rob Knegjens 决定让计算机来完成这个使命。


科学论文有着非常适合自动绘制成地图的内在逻辑结构:在论文的参考文献部分列出的其他论文,一般都有着相同或是相关的主题。因此那些互相引用的论文就可以被放在一起,而缺少这种链接的论文或许就没有被归在一起的必要。George和Knegjens采用了一种平时用来模拟星系形成的算法,来完成这项归类工作,用论文取代模型中的恒星,将引力间的相互吸引转化成一种互相排斥的反重力,让学术论文散布在整个视野中。


这个在线地图被命名为“Paperscape”(点击文末“阅读原文”进入地图链接)。每个圆圈代表一篇科研论文,圆圈的面积与论文被引用的次数成正比。不同类别的论文(如物理学、数学、计算机科学等)有着不同的填充颜色。


○ Paperscape是基于arXiv的论文库绘制的可视化地图,每个圆圈代表一篇论文。截止2017年12月8日,图中包含了1330216篇论文。| 图片来源:Damien George 和 Rob Knegjens


有意思的是,高能理论物理学(hep-th,大片的蓝色区域)位处地图的中央。这一部分的理论物理奠定了许多基础物理学的根基,因此它将许多学科如高能物理现象学(实验结果的预测和研究)、天体物理学凝聚态物理学量子物理学以及数学的部分领域连接到一起。然而,身处地图的中心也伴随着一些缺点。由于理论物理学之间的交织十分紧密,因此不同于其他领域的分类,它很难被分离出单独的子课题。


○ 不同颜色代表不同的领域。中央的蓝色是高能理论物理学(hep-th),它连接了天体物理学(astro-ph)、高能物理现象学(hep-ph)、凝聚态物理(cond-mat)、量子物理学(quant-ph)和数学(math)。| 图片来源:Damien George 和 Rob Knegjens


另一个有趣的点是色块之间的连接区域,也就能找到交叉学科论文的区域。例如,天体物理学(astro-ph)和理论高能物理学(hep-th)之间的联系有着暴胀暗能量等课题的研究。这两个课题都需要天体物理学方面的技术,如宇宙微波背景的测量,配合以详细的理论计算,因此地图中显示出大量的色块重叠。


○ 交叉学科。图中显示了暴胀(Inflation)、暗能量(dark energy)、宇宙微波背景(cosmic microwave background)等领域。| 图片来源:Damien George 和 Rob Knegjens


在天体物理学和高能物理现象学(hep-ph)之间还存在一片暗物质领域。暗物质可以解释为什么宇宙具有我们今天所看到的结构,以及为何星系的旋转速度比预期的要快。它将与星系和宇宙的历史测量相关的天体物理学,以及试图从高能对撞实验(如CERN的大型强子对撞机)中可能检测到新的基本粒子来解释暗物质的高能物理现象学结合到一起。


George 和 Knegjens 还设计了一个替代的着色方案,不按照研究领域分类,而是根据论文已被发表的时长进行描绘。这让人们可以通过寻找明亮的红色区域,轻松地找到特定地区的“热门话题”。


○ 越红代表论文发表的时间越新。| 图片来源:Damien George和Rob Knegjens


能够从一张图中看到整个 arXiv 的感觉很棒,因为这样能让你知道你没有错过任何重要的东西。George 和 Knegjens 希望这张 Paperscape 能使 arXiv 不再那么让人望而却步,尤其是对刚进入研究领域的学生来说;而对于经验丰富的资深学者而言,Paperscape 或许有助于他们在自己领域之外进行更有效的阅读,因为在 Paperscape 上,任何重要论文和热门话题的搜寻都非常容易。


○ 随意点击图中的圆圈就会在右上角显示该论文的信息,包括作者、发表时间、被引用次数等,访问者可以点击pdf进行阅读。| 图片来源:Damien George和Rob Knegjens


Paperscape 还有一些附加功能,例如使用者可以用“标签”来分类 arXiv 的论文,并与其他人分享自己的论文合集。在这几年间,更多方便实用的功能也在不断被更新。2014年,Paperscape 添加了一个弹出框,不仅让论文搜索变得更容易,还能将论文的搜索范围精确到特定的提交日期范围。2015年年初,基于 Paperscape 浏览器的地图客户端的源代码被发布在了Github上。至2016年底,Paperscape 更新了从1991年到2015年年底 arXiv 上的图形数据,在地图客户端添加了“点击搜索作者”功能,并且优化了热图的颜色方案等等。


基于庞大的论文库 arXiv,Paperscape为进入这个奇妙的学术世界提供了一个美丽的窗口,希望透过这个窗口,你也能发现你本不知道的重要论文。


 更多地图 :


《物理学地图》


《数学地图》


《化学地图》


《计算机地图》


撰文:Damien George 和 Rob Knegjens

编译:糖兽

参考链接:

http://paperscape.org

https://www.theguardian.com/science/2013/sep/05/paperscape-universe-scientific-research-arxiv

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存