科学学的价值在于,能够利用引文网络等大数据定量揭示科学研究中违反常规的现象,并用模型解释存在差异的原因。例如科研领域存在的性别、种族、所属国家等各种不平等,不同规模科研团队在产出和创新程度上的显著差异。事实上,这只是“科学学”带给科学界启示的冰山一角,发表于 Nature Human Behaviour 的评论文章《科学学需要扩大研究视野》指出,随着科学学这一领域的成熟,其下一步的发展需要将数据驱动的观察与干预实验结合,扩大研究范围并使数据来源多样化,从而使科学学研究在现实世界留下切实的印记。
本文汇总了集智俱乐部近一年复杂科学「顶刊速递」栏目的科学学相关论文,旨在探讨在这个 AI 技术突飞猛进的时代,如何改善科研领域的不平等,如何形成良好的科研合作模式,如何更有效地推动科学创新,以及 AI 如何促进科学理解、帮助做出科学发现。希望对各位读者有所启发。
关键词:科学学,科学创新,学术不平等,团队创新,科学与AI
郭瑞东 | 作者
梁金 | 审校
1. 如何推动创新?
1.1 扁平化团队更能促进科学创新发表于美国科学院院刊(PNAS)的题为 Flat teams drive scientific innovation 的文章,能根据论文贡献声明文本,推断科研团队中扮演构思、领导角色的作者比例,发现层级化的科研团队给处于领导地位的成员带来了显而易见的好处(层级化团队结构能提高领导型作者的产出效率,最大化短期引用,从而对冲了他们积累学术资历的风险),但不一定能最大化辅助成员的生产力和创新潜力,且通过扩大科研团队的规模来提高其创新能力的做法可能会事与愿违。图1:层级化团队与扁平化团队在科研产出上的差异。1.2 创新更多发生在科研网络的边缘Theory in Biosciences 期刊的集体行为特刊中的论文 Innovations are disproportionately likely in the periphery of a scientific network,通过共引用网络,发现位于共引网络核心的论文,表现出较高的与其他论文的相似性。而位于边缘的论文有更大的灵活性,更有可能产生创新。这一过程(现有观点的重组)与生物体的进化过程(保持核心基因组不变,同时对基因组中现有基因进行重组)极为相似。对于科研人员,这意味着科研中保持一个稳健的中心与一个能促成创新的边缘同等重要。1.3 创新与报道,改变科学影响力的两个因素由王大顺和巴拉巴西合作完成的新书《给科学家的科学思维》第18章,关注创新的涌现和科学影响力的关系,其中指出:科学出版物或者专利发明中不常见的组合,通常意味着论文或发明有更高概率获得高影响力,但它们同样也可能导致较高的不确定性。而相比于一般论文,那些既能推出创新组合,同时又能继承传统研究成果的论文,成功的概率至少高出两倍。1.4 科学“老化”怎么办:加入新机构、与青年合作、拓展新方向集智科学家吴令飞关注科研人员年龄增长对于科学界整体造成的影响,发现随着科学家年龄的增大,其引用的文献也多半是更旧的文献;而当某个领域的科学家年龄增加,该领域发生颠覆性创新的概率也会减小。为了应对科研团队的“衰老”,应当激励老科学家多与青年科学家搭档,或鼓励科学家在机构间流动,以加速创新。图2. 不同类型研究者所处职业生涯阶段和其引用文献的年份改变之间的折线图1.5 混圈子正阻止新想法的诞生发表在 Nature Human Behaviour 的研究,基于语义相似性和多重网络等新方法分析论文引用网络,发现随着科研全球化,不同国家之间的研究正在变得越发不平等,且这样的引用不平等是稳定且持续的。类似个人层面的富者越富,穷者越穷,不同国家的科研团队也存在马太效应。而处在边缘位置的研究不被认同,将会阻碍新想法的诞生。1.6 集智斑图用颠覆性指标盘点复杂科学前沿集智科学家吴令飞在2019年的一期 Nature 封面论文“大团队发展,小团队创新”中,提出 disruption 指标来衡量论文的颠覆性,基于一项工作(论文、专利、软件等)的引用模式(citation pattern)而不是其引用量(citation counts)来标定其颠覆性。集智斑图论文库收录了复杂科学前沿研究,而基于 disruption 指标,的确找出了一些具有颠覆性的复杂科学研究样板。1.7 Barabási算法+Physics Reports精选,网络科学综述10年Top10网络科学具有跨学科性,物理学、计算机科学、数据科学、经济学、生物学、神经科学、科学学等领域,都在吸收网络科学理论和方法以促进自身发展。该文从 Physics Reports 2011-2020年发表的近400篇论文中,使用文本分类方法筛选出所有与网络科学相关的论文27篇,总结最受欢迎的10篇论文,以概述近十年来网络科学的发展趋势。结果发现,这些研究多关注网络结构和动力学的进一步挖掘,包含了高阶网络、多层网络、嵌套网络、时序网络、社团划分等主题,动力学性质如扩散、渗流、同步、演化等主题。那些从理论上挖掘网络性质的文章相对于跨学科应用的文章获得了更大的长期影响力,而侧重于跨学科应用的研究工作受众范围更小,但所有这些研究共同组成了蔚为壮观的网络学科图景,并且足以产生多样化的实践价值。
2. 科研领域的不平等
2.1 全球科学产出的隐藏结构Nature Human Behaviour 的研究根据对国际数据库中被索引的出版物的分析,揭示了支撑国家科学发展和全球科学组织的学科关联网络中的隐藏结构,指出科研产出更多受到经济水平的影响,科学产出多样性、国内生产总值(GDP)以及经济复杂性指数(ECI)与科研产出呈正相关。中低收入国家的科研,更多关注自然,例如动植物或生态研究,而高收入国家的科研产出更加多样化,有更多社会科学的研究。各国优势科研领域的出现和消失,遵循着经济学中的专业分工原则,新生的科研优势领域更容易出现在优势学科已聚集的位置。
2.4 女性在科学上的贡献比男性更少得到承认Nature 特刊“不平等的科学”中的论文 Women are Credited Less in Science than are Men,指出研究团队中,相较于男性,女性被认为是作者的可能性更小,这种差距至少一部分是由于女性的贡献没有得到承认。为此,需要指定更清晰的署名标准以促进性别间的平等。2.5 美国也有“学二代”,且学术不平等在加剧Nature 和 Nature Human Behaviour 发表的两篇论文,探讨了美国各地终身教职教师的社会经济构成和教育背景。这些研究确认了大学教师具有普遍的核心-外围结构,核心大学之间的教师交流适度,大量的教师从核心向外围输出,很少反向输入或从美国以外输入,且大约有9.1%的美国教授受雇于授予他们博士学位的大学,这样的学术近亲繁殖限制了思想和专业知识的传播。研究量化了美国教师聘用和留任的动态,并支持努力改善美国学术人员队伍的组织、组成。
论文题目:Public use and public funding of science论文地址:https://www.nature.com/articles/s41562-022-01397-5
来自 Nature Human Behaviour 的研究,关注科学在公共领域的消费情况,即大众是如何看待并评价科研发现的。该研究通过将来自所有科学领域的数以千万计的科学出版物与它们的上游资金支持和下游公共用途——政府文件、新闻媒体和市场发明这三个公共领域——联系起来,考查科研如何被公共使用。研究发现不同学科的科研成果对公众具有不同的价值,公众倾向于消费来影响相对高的科研成果,这表明公共使用和科学使用之间的一致性,而超越科学的公共用途强烈预测各个领域内每篇论文获得的资助水平。
5.2 AI 科学家帮助发现新的物理学定律机器学习方法已经重新发现了许多已知的基本物理规律,包括对称性、守恒律、经典力学定律等,然而人工智能生成的理论(AI-generated theory)仍很难获得科学界的信任和支持。发表于 Nature Reviews Physics 的一篇文章梳理了近期人工智能对物理规律「新洞察」和「重新发现」。该文指出机器学习算法似乎遵循格式塔心理学的一些规律,例如AI重新发现对称性、守恒律、动力学。目前当人工智能为物理学提供了另类的见解时,我们可能不会立即认识到,且需要时间来充分认可它的重要性。但这还是有希望实现的。5.3 AI 引导人类直觉,帮助发现数学定理DeepMind 团队在 Nature 杂志上发表的一项最新研究中,人们成功让 AI 与人类数学家合作,利用机器学习从大规模数据中探测模式,然后数学家尝试据此提出猜想,精确表述猜想并给出严格证明。这意味着未来机器学习可能会被引入数学家的工作中,不使用机器学习直接生成猜想,而是专注于帮助指导数学家高度专业的直觉,可让AI和数学家的合作产生既有趣又深刻的结果。