从提出到看见黑洞,背后是近十代人的努力
By 超神经
场景描述:面对天文学实验产生的海量数据,机器学习和神经网络等 AI 技术可以大大提高数据处理效率,GAN 可以修复已经损坏或丢失像素的图像,或使模糊的照片变得清晰。此外,AI 还能给科学研究提供一些新的思路。
关键词:黑洞,天文学,大数据
2019 年 4 月 10 日晚 9 点,参与 EHT 计划的科学家们,将在全球多地发布黑洞的照片。这个神秘的,充满了幻想的天体,将在今晚露出它的真实面目!
这是历史上首次,碳基生命直接「看到」黑洞。但是你可知道,如果没有 AI 技术助力,这个时刻恐怕还遥遥无期。
模拟的黑洞图片
面对天文学实验所产生的数据大潮(动辄每天产生数 TB 的数据),仅仅依靠人类团队去处理是无法想象的。于是,AI 成为科学家的重要工具。
令人绝望的天文学海量数据需要 AI
天文学已经被大量的数据包围很久了,数据量大到令人绝望。
比如 Square Kilometer Array,一台 20 世纪开始启用的射电望远镜,它现在每年产生的数据,相当于整个互联网的流量。
如果没有超级计算机的助力和智能算法的协助,此次黑洞「照片」的公布时间还会被无限延后。
AI 的介入,让事情变得更加明朗。通过机器学习,神经网络等 AI 技术,能够以最少的人工输入,获得高效可靠的成果。
当前,天文学研究中实际上已经引入了很多人工智能的内容,例如:使用机器学习算法进行天文观测资料的归档、分类;使用机器学习模型进行空间天气预测、太阳活动预报,发现新的天体等。
堪萨斯大学的研究者表示,在过去的五年里,使用机器学习进行研究的天文学论文,数量增加了至少 5 倍。
1
利用 AI 分析数据
早在2007年,科学研究者 Schawinski 曾面临一项艰巨的任务:根据外表面对数千个星系进行分类。
因为在当时,这个任务并没有现成的软件可用,他便想了一个办法:将任务众包给普通网民,让网民帮助标记完成分类,可谓一项大工程。但是到了今天,利用 AI,这项艰巨任务只需要一个下午便可完成。
据纽约大学的天文学家 David Hogg 介绍,自己的工作已离不开 AI,他一直在使用神经网络等技术,从光谱中对星星进行分类,并通过数据驱动的模型,来研究星星一些物理属性。
在去年 12月,发表于 Astronomy & Astrophysics 上的一篇论文中,苏黎世联邦理工学院的一个团队,用生成模型来研究星系在演化过程中所经历的物理变化,他们的模型创建了人工数据集,用来作为模拟测试物理过程的一种方法。例如他们用模型模拟探究了,恒星形成过程中形成速率急剧下降的现象,与星系环境密度的增加有关。
2
利用机器学习算法获得新发现
在海德堡理论研究所,Kai Polsterer 领导着一个天文信息学小组,他们专注于研究以数据为中心的天体物理学方法。最近,他们使用机器学习算法从星系数据集中提取红移信息(一种证明宇宙膨胀的效应),而这在以前是一项艰难的任务。
荷兰莱顿天文台的研究员 Elena Rossi ,在研究极其罕见的超高速恒星时,通过构建神经网络模型,从数据中提取出所需特征,进一步过滤和提取。
该算法在「盖亚」卫星公布的照片中,从 10 亿颗恒星中,筛选出了 80 个候选超高速星。经过科学家的最终分析,确认了 6 颗超高速星。对于首轮搜寻来说,这个数字已经是份不错的收获。
但 Polsterer 也指出, AI 系统还不够完善,算法大多数只能去做训练过的工作。有时候,它会发生一些错误。比如给它一个星系的图片,软件可以估计星系的红移信息以及年龄 ,但是随便给系统提供图片,比如自拍或者一条鱼,它也将输出一个结果。
所以在这个阶段,AI 的使用还离不开人类科学家的监督和训练。
AI 已经成功「狩猎」系外行星
尽管还有些路要走,AI 在天文学上已经有了一些成果。比如寻找系外行星。
从宇宙中「狩猎」系外行星,是一件相当困难的事情。与它们的宿主恒星相比,系外行星不仅不能发热,而且也过于渺小,就像是在几千英里之外,寻找一只在探照灯下飞行的萤火虫。
以往天体物理学家寻找系外行星的方法,主要是通过人工和自动化软件,对 NASA 开普勒项目的大量数据进行分析。
当一颗绕轨道运行的行星挡住了一些光线时,恒星的测量亮度会轻微下降。开普勒太空望远镜观测了 20 万颗恒星的亮度,用了 4 年时间来寻找由行星凌空而产生的特征信号。
这些数据点能组成约 2 千万亿个可能的行星轨道,要在如此庞大的数据库中发现一颗行星,即便是最强大的电脑也需要耗费大量时间。机器学习的出现,有效地缩短了这个时间。
2017 年,一位热衷太空探索的 Google AI 研究员 Chris Shallue 与 UT 奥斯汀(得克萨斯大学奥斯汀分校)的天体物理学家 Andrew Vanderburg 一道,通过 TensorFlow 模型在距地球 2545 光年远的开普勒 90 星系中成功发现两颗新行星:80g 和 90i 。
开普勒 90 星系和太阳系的动态对比
为了提高 TensorFlow 模型识别行星的准确率,避免将其他天体如星斑和双星误认为行星,工程师们使用了超 15,000 个被标记过开普勒信号的数据集来训练该模型。他们的结果也证明,机器学习的准确率超过了 90%,也就是说,AI 用来探索宇宙,发现新天体是可行的。
就在前几天,德克萨斯大学的学生 Anne Dattilo ,借助简单的 AI 算法,从开普勒望远镜的观测数据中,又发现了两颗远在 1300 光年外的系外行星。
当数据形成海洋的时候,人工处理只能是大海捞针,但交给 AI ,也许就是小菜一碟。
为了「看见」黑洞,花了两年来处理数据
回到「看见」黑洞这件事,也许此类发现在很长时间里都不会影响我们的日常。但不要忘了,几千年前的人们开始仰望星空,才有了今天恢宏的航天探索,而 AI 的介入,也许就是给我们的探索加上了翅膀。
长久以来,人们对黑洞的认知,除了理论上的概念描述,就是一些科幻渲染以及艺术想象的图片。
电影星际穿越中,物理大佬 Kip Stephen Thorne 模拟出来的经典黑洞
黑洞的称呼是一个很形象的叫法,说明了它「来者不拒」的特性:具有巨大质量的天体,会形成极强的吸引力,任何经过它的物体都会被吸收进去,甚至连光线都无法摆脱。
准确点说,它具有超强引力,使得光无法逃脱它的势力范围。而这个范围被称为黑洞的「事件视界」。在事件视界之内,光线被「吞噬」,而且黑洞自己不发光,就不能直接观察到它。
那么这一次的新闻发布,又是怎么观察到的呢?
其实这次,还是专注于黑洞所引发的周围效应。有些时候,黑洞周围的气体云会靠的很近,在巨大引力作用下,气体云会围绕黑洞旋转,形成一个物质盘。气体因摩擦而被加热,发出强烈的辐射。而且旋转速度越来越快,最终穿过事件视界,永远地消失在黑洞中。事件视界望远镜要观察的, 正是那围绕着黑洞轮廓的碟形光环。
但要观察到这个现象,除了需要选择距离大小合适的黑洞,还要分辨率足够大的望远镜。
2017 年,来自全球的多个望远镜,通过干涉测量的成像技术,组成了一个强大的观测阵列,称为「事件视界望远镜」 ( EHT ),而观测的对象,则是选择了银河系中心的人马座 A* 黑洞和星系 M87 黑洞。
EHT 的望远镜分布地图
在作出这样的部署后,才刚刚够格拍摄到黑洞。而且,这些射电望远镜也不是直接拍摄得到图片,而是收集到大量的数据,最后再由科学家处理成为图像。
而从「拍摄」完成,到最终的发布,这一等就是漫长的两年。因为数据量高达 PB 量级,除了从各地运输汇总数据以外,最终的分析和计算,也耗费了大量的时间。根据相关报道,在处理中,也用到了「主成分分析」等相关技术。
从 1783 年,科学家首次提出黑洞的概念,到现在距离黑洞真相最近的时刻,已经过去了 230 多年,而我们将有机会成为知晓谜底的第一批观众。
至于具体的细节和最终的成果,就一起期待今晚的发布会吧! EHT 项目组和中国科学院,将在上海天文台发布这一最新成果。
发布会时间为北京时间 2019 年 4 月 10 日 21:00,全球六个地方同时发布,除了上海,还分别有比利时布鲁塞尔(英语)、智利圣地亚哥(西班牙语)、日本东京(日语)、中国台北(中文)和美国华盛顿(英语)。
让我们共同期待这一历史时刻的到来!
超神经小提醒
直播链接:
1. 新华网:
http://www.xinhuanet.com/politics/ksh/zhibo/201904/3731328.html?type=pc?type=mobile
2. 看看新闻:
http://live.kankanews.com/zhibo//6283.html
历史文章(点击图片阅读)
一个宇宙学实验验证,整个宇宙都是高级文明编写的代码?
当人工智能遇见农业,农民伯伯不再「粒粒皆辛苦」
为了这篇文章,他们派 AI 机器人观摩了三天黄色网站
AI 百科
教程
数据集
商店
更多
http://hyper.ai