术业专攻 | 善用Citespace发现前沿热点
Citespace软件以数学模型表达科学知识单元及其关系,以科学知识为计量研究对象,属于科学计量学范畴,其主要功能是发现研究热点和前沿。
5月31日14:00,由东南大学图书馆主办的“事半功倍,善用Citespace发现前沿热点”专题讲座在李文正图书馆未来学习中心讲座空间开展。老师生动地向大家讲解了Citespace软件如何使用。下面,让我们回顾一下讲座的主要内容。
一、知识准备
科学知识图谱是显示科学知识发展进程与结构关系的以可视化形式绘制成的二维或三维图形,研究对象是论文专利和研究报告。构建知识图谱的一般步骤是:
1. 分析要构建的知识图谱的目的和用途
2. 选择合适的数据源,从中抽取数据
3. 去重、勘误等数据清洗
4. 选定要分析的元素对象,例如著者、关键词、机构等
5. 确定数据元素之间的关系,构造数据元素关系短阵
6. 对原始数据进行标准化处理,确定合适的相似度算法
7. 用一定的算法把多维数据在二维或三维空间中聚合并图示出来
8. 对图形进行分析和解释
Citespace就是很重要的一款知识图谱绘制软件,其他常用知识图谱绘制软件还有SPSS、Pajek和VOSViewer等。
二、Citespace软件简介
Citespace是2003年由Drexel大学Chaomei Chen开发的用于分析可视化信息资源关系的原型系统,基于JAVA程序语言编写的专门用于引文分析的信息可视化应用软件。Citespace能够回答以下几个问题:
1. 在某个研究领域中,哪些文献是具有开创性和标志性的?
2. 在某个研究领域的发展历程中,哪些文献起着关键作用?
3. 哪些主题在整个研究领域中占着主流地位?
4. 不同的研究领域之间是如何相互关联的?
5. 基于一定知识基础的研究前沿是如何发生演变的?
Tips:Citespace是开源软件,可以直接进入网址下载。
三、软件使用
首先,老师介绍了Citespace的运行窗口及各部分功能,其中菜单栏中的Data(数据)一栏较为重要,主要是用于数据的过滤和转换,关键要确定想要分析的内容,例如作者、机构、作者国家的合作网络分析、主题、来源以及学科贡献的情况。其次,呈现图谱要展示的节点的数目也很重要,选择指标不同,差异也会比较大,常见的有g—index、Top N 和Top N%等:
1. g—index是软件的知识单元提取方式,该算法是在增加规模因子k的基础上,按照修正后的g指数排名抽取知识单元
2. Top N 的意思是提取每个时间切片内排名N之前的对象。
3. Top N%就是提取每个时间切片中排名前N%的对象。
其后是前期准备工作。Citespace软件的数据来源有Web of Science(数据可直接导入)、Scoups(数据格式转换器)和CNKI/WanFang(数据格式转换器)等,如果下载的数据较多,可以对数据文档进行合并。Citespace提供了WOS等数据库处理功能,同时还提供了对CNKI等其他数据库数据的转换功能。新建项目也非常重要,需要新建两个文件夹,Data用于存放数据,Project用于存放运行过程及结果。
四、Citespace数据分析流程
Citespace的数据分析流程主要有确定数据收集策略、收集数据、提取研究前沿术语、时区分割、阀值选择、显示、可视检测和验证关键点。最关键的是要尽可能制定全面的数据收集策略(如广泛专业术语、重点期刊等)来确定一个知识领域。这是为了确保接下来的分析能涵盖一个知识领域的全部内容。
其次,Citespace提供了三种可视化视图:聚类视图、时间线视图及时区视图,它们多用于文献共被引分析。聚类视图侧重于不同研究领域的知识结构突出关键节点及重要连接,时区视图更着重于描绘各研究主题随时间的演变趋势和相互影响,时间线视图侧重于勾画聚类之间的关系和某个聚类中文献的历史跨度,更便于看出某个研究主题研究基础的时间跨度。默认为聚类视图。
在验证环节,Citespace软件应用的基础文献中,关键点的本质可以通过两条途径来确认:
1、将关键点文章的作者视为该领域的专家;
2、对关键点文章的引用和被引用的段落进行内容分析。
最后,老师总结了Citespace的数据分析主要有历时分析、突变检测、空间分析、网络分析以及地理分布。
总结
历时一个小时的讲座干货满满,同学们全程全神贯注,在讲座结束后积极与老师进行交流,大家纷纷表示受益良多。
善用Citespace发现学界前沿热点,是开始科研工作的关键一步。让我们以理论学习为起点,以实际操作为路线,让Citespace成为我们科研的利器!
文案丨刘妍蔚
排版丨曹婉清
责编丨王 云
来源丨东南大学图书馆
东南大学研究生会 学术交流中心
东南大学研究生会 宣传与新媒体中心