数据分类方法的演进对正确使用科研指标非常重要
The following article is from 科睿唯安 Author 科睿唯安
科睿唯安与荷兰莱顿大学科学技术研究中心携手开发了基于引文的动态分类新方法
科睿唯安于日前发布了一份有关数据分类的新报告。报告审视了当前全球科学界的信息组织形式,同时介绍了一种灵活的、利用数据驱动实现的基于引文的全新分类方法。在本报告中,科睿唯安还展示了与荷兰莱顿大学科学技术研究中心(CWTS)领先的科学计量学团队合作开发的新技术。
这份名为《数据分类:理解选择和结果》的报告由科睿唯安旗下科学信息研究所(ISI)完成。报告概括介绍了全球现有科研分类系统,以及将这些分类系统应用于国家和机构数据后的分析结果。基于科睿唯安 Web of Science™ 引文网络中值得信赖的研究数据,报告介绍了一种高度创新的新型数据聚类方法。为提升知识、能力和信心,并确保负责任地使用研究指标,报告还提倡在数据管理中需要引入优秀实践。
ISI 团队研究发现,基于文章元数据所形成的分类体系优于根据人类定义(例如基于期刊、自上而下并利用专家知识将域划分为相关子类别)所确定的分类体系。根据底层数据中的特征,针对研究论文和综述,基于引文的分类方法会逐步将单个元素链接成具有共同特征的较大单元。在 InCites™ Citation Topics(引文主题)中使用的这种创新方法更准确地代表了微观论文簇或专业方向,提供了更统一的内容,并提升了引文的规范化处理。新方法也为新群组的出现提供了机会,而这是之前基于期刊的分类体系所无法实现的。
在大范围数据选择、测试和可视化功能之外,InCites提供了多种自上而下的数据分类方法,现在又增加了另一种自下而上的基于引文的分类方法——引文主题(Citation Topics)。引文主题当前包含10个宏观主题、326个中观主题以及2,444个微观主题,并且内置月度和年度更新,让其可以随着时间推移而不断演进。
报告的共同作者、科睿唯安科学信息研究所首席科学家 Jonathan Adams 表示:“现有的各种分类体系都具有明显的优点和缺点,我们引入引文主题分类方法的目的是推广数据管理中的优秀实践,是负责任使用研究指标的一种做法。”
莱顿大学科学技术研究中心副主任 Ludo Waltman 表示:“基于引文的自下而上的分类方法在我们进行的多项科学计量学分析中发挥着重要作用。很高兴看到InCites用户也将从这些功能强大的分类中受益。”
科睿唯安科学业务战略高级副总裁 Joel Haspel 表示:“新报告凸显了数据分类方法不断演进的特征。报告讨论了我们认识知识和科学研究的自然区划的方式,以及我们如何为了发现、分析、管理和政策目的对出版物进行分类的方法。科研出版物的分类方式有自身特点和局限性,认识到这一点对科研管理非常重要,因为它会影响我们对既有和创新研究课题的思考方式,影响我们分析科研活动和绩效的方式,甚至影响我们建立科研机构进行科学研究的方式。”
点击“阅读原文” 下载英文报告
相关阅读:
谷歌学术指标公布,Nature登顶,PLOS One力压多个顶刊