当期荐读 2021年第2期 | 卷首语 预见学科之美:学科主题预测研究
Photo by Mitchell Luo on Unsplash.
卷首语
预见学科之美:学科主题预测研究
从科学可知论的角度来说,当掌握足够多的历史和前提信息,就可以大致上进一步去预测未来科学研究的趋势和内容。科学发展过程中有众多有待解决的问题,甚至有许多可能没有发现的问题,但总体上,我们秉持着可知论对科学进行不断的探索。科学预测能力的提升过程,实际上就是对科学发展的认识和探索不断加深的过程。
如果将学者、文献等对象的分析作为科学预测研究的微观维度,整体科学发展作为科学预测研究的宏观维度,学科领域则为我们提供了认识科学发展的中观维度。无论是学者、文献、学科领域还是整个科学的发展,都受到系统内外部学术制度、社会环境变迁的影响。但是,从微观向宏观过渡的过程中,随机因素的影响会逐步降低,系统的稳定性也有所提升,预测结果也会逐渐更加可靠。目前已经出现了许多对科学发展进行总体预测的研究,但是相关成果更多是从统计特征的视角进行预测和规律总结。由于不同学科研究范式的差异,想找到普适的结果解释方案存在许多困难。事实上,无论是采用专家集体智慧方法进行的传统学科主题和发展预测研究,还是本学科领域的计量分析和跨学科问题研究,其隐含的一个重要前提就是定义了较为明确的学科范畴。从学科领域的中观视角,以主题为切入点进行预测,一方面具有相对的系统稳定性和结果的可解释性,另一方面也充分考虑到了不同领域范式的差异,能够为预测研究提供一个相对可靠且准确的抓手。
20世纪以前,基于专家集体智慧的定性预测是进行学科发展和学科主题发展预测的主要途径,预测结果的可靠性完全依赖于专家的视野和科研水平。当代绝大多数学科已经发展成为快速演化与迭代的生态系统,专家预测的及时性和可靠性受到很大的影响。现代学科主题发展的预测,在面对海量数据的同时已经逐步形成了统计回归预测方法和机器学习预测方法两大体系,代表了两种不同的研究思路,即模型驱动式研究和数据驱动式研究。两者的最终目的都是为了对所观察到的科学现象进行相对合理的解释。
基于统计回归的预测方法一般对自变量有较为明确的定义,模型解释简单、直观,具有较强的逻辑合理性;但统计回归方法对高维数据的处理较为乏力,也无法囊括大量自变量,海量数据环境下其预测结果的合理性难以保证。基于机器学习的预测方法强调从学术实体自身及相关信息中提取特征,进而训练相关机器学习模型或者深度学习模型,在特征辅助下进行预测,虽然模型并不一定符合常规的逻辑认知,但预测效果则有目共睹,目前已经逐步得到学术界的重视,成为学科主题预测研究的重要发展方向。
上述两种研究思路的优势和缺陷都比较明显。通过对已有数据、特征、指标进行学科主题发展预测,是一个从现象到本质的探索过程。有许多复杂的因素会影响这一探索过程,并且每一个影响因素都可能成为反驳你研究的理由,但是我们只需要把握住学科主题发展的本质,所提出的预测方案就有其合理性,可以通过进一步的研究不断进行优化和完善。这或许就是相关研究的意义所在。
董 克
武汉大学信息管理学院
*本文原载于《图书情报知识》2021年第2期
版权归《图书情报知识》所有,欢迎转发到朋友圈,转载请联系后台。
制版编辑 | 卢慧质
--END--
当期荐读 2021年第1期 | 学术代表作时间周期、首发载体及题材类型特征研究 ——以图灵奖为例(内含视频摘要)
当期荐读 2021年第1期 | 任务驱动下的学术数据库新手心智模型演进及学习模式研究(内含视频摘要)
当期荐读 2021年第1期 | 图书馆在国际文化交流中的作用与地位
当期荐读 2021年第1期 | 信息疫情:信息科学家的观点与对策
当期荐读 2021年第1期 | iSchools影响下的LIS学科发展—日本筑波大学图书馆信息媒体学院前院长杉本重雄教授学术访谈