查看原文
其他

文献引文关系分析利器 Histcite Pro 2.1 发布啦!

科袖网 2019-06-30

本文经授权转载自:https://zhuanlan.zhihu.com/p/20902898,欢迎各位前往知乎主页查看。


HistCite 是一款非常强大的 Windows 平台引文分析工具,可以根据 Web of Science (WOS)数据库上导出的数据快速绘制出某个研究领域的发展脉络,快速锁定某个研究方向的重要文献和学术大牛,还可以找到某些具有开创性成果的无指定关键词的论文。


详细的 HistCite 使用教程:

https://zhuanlan.zhihu.com/p/20902898


由于 HistCite 的原开发者已经停止更新了,因此经常会出现各种各样的问题,例如直接导入 WOS 上的数据文件总会出现错误,因此,我之前开发了一款精简易用的免安装版本 Histcite Pro 2.0,但主要的分析功能还是基于 Histcite 内核运行。下载压缩包解压后就可以直接用,不需要安装,同时去掉了很多没用的文件,大大缩小了软件体积。对于从WOS上导出的txt数据文件,不用做任何修改,只要把全部的txt放到 TXT 文件夹里面,然后双击 main.exe 即可一键完成加载,非常方便。



但是,最近有多位用户反馈 Histcite Pro 2.0 出现了打开速度过慢的问题,光标一直在闪烁,但迟迟不出现提示信息,甚至出现了无法正常使用的情况,在这里我向大家致以诚挚的歉意!距离上个版本(2.0)的发布有两年了,在上个版本中,我加入了云端收集用户 IP 地址的功能,主要是了解用户的覆盖情况,不过后来接收信息的服务器接口关闭了,所以该功能其实一直也处于报废状态,而这不怎么影响用户使用,所以也没有进行版本更迭。但是最近由于获取 IP 的 API 频频出现故障,导致软件打开时一直在尝试连接,从而导致程序卡顿。


为了更好的提高用户体验,在 2.1 版本中我彻底删除了这个云端收集信息的功能,因此本软件彻底成了本地程序,不仅体积有所减小,运行速度也得到了提升!大家可以去网盘下载最新版试用,具体的使用方法可以到上面的知乎专栏页面查看。




Histcite Pro 2.1 网盘下载地址:

https://pan.baidu.com/s/1hsIwJzQ



之前小编也推送过教程:快速进入陌生领域: HistCite 使用教程。今天把原作者的教程贴出来给大家看一下,希望对大家有所帮助,感谢原作者的付出!


如果你选修过中国科学技术大学罗昭锋(微博主页:https://weibo.com/science20)老师的《文献管理与信息分析》,那么你一定不会对HistCite 感到陌生,这是一款非常强大的引文分析工具,可以快速绘制出某个研究领域的发展脉络,快速锁定某个研究方向的重要文献和学术大牛,还可以找到某些具有开创性成果的无指定关键词的论文。

如果说一次引用表示给你的文章投一票,那么并不是所有票都有效,只有相同领域文章的引用才能真正体现你在这个领域中的实力。所以在 Web of Science (以下简称 WOS)上按照被引次数倒序排列,越靠前不一定就越重要。还有一种情况,你发明了某种材料,但是后来名字变了,之后的文章使用的关键词都是新名字,别人搜新名字的关键词是搜不到你的开创性文章的,但是很显然你的文章是非常重要的。通过 HistCite 可以直观的看出这个研究领域的论文全部引用了你的文章,可以体现你的文章的重要性。


好了,下面开始使用这个工具。首先要了解一点,HistCite 这款软件是 Thomson Reuters (汤森路透)公司开发的,和 WOS 是一家公司,所以 HistCite 只支持 WOS 数据库,对于 Scopus 等数据库则无能为力,不过 Github 上面有人写了一个可以将 Scopus 导入 Histcite 进行分析的脚本——Scopus2Histcite(https://github.com/leoatchina/Scopus2Histcite),有兴趣的同学可以去试试看。

2016年10月,汤森路透知识产权与科技业务被 Clarivate Analytics (科睿唯安)公司收购了,从此 WOS 也是归该公司所有,因此导出的数据纯文本也发生了些许变化,从而不能直接导入 HistCite 进行分析。不过别担心,HistCite Pro 完全兼容新的文件格式!

打开WOS,注意数据库要选择核心合集(Core Collection)!

例如简单检索一下石墨烯在锂离子电池负极中的应用:

检索结果不是太多,可以全部导出,如果文献太多的话,可以先按照被引频次降序排列,只导出前2000篇就差不多了。


下面开始导出文献信息,点击页面上的【保存至 Endnote Online】按钮右边的下拉按钮,选择【保存为其他文件格式】。


在弹出的菜单中,记录数填写1到500,因为每次最多只能导出500篇文献,所以上面的2819篇文献需要分成6次导出,后面导出的时候依次填写501到1000、1001到1500等等。。。记录内容选择【全记录与引用的参考文献】,文件格式选择【纯文本】,然后点击发送即可得到导出的 txt 文件,类似可以导出其他5个。

注意:含500个记录的txt文档一般是3M左右,如果你的只有几百K,请仔细按照上面这张图进行导出!!!


下面使用 HistCite 来分析这6个txt格式的引文数据文件。由于 HistCite 多年不更新,现在存在各种 Bug,比如直接打开 HistCite,一加载文件就报错:No such file or directory。对于这种情况,你可以选择在 C 盘根目录下新建 fakepath 文件夹,然后将全部的 txt 文档复制到里面,再打开 HistCite 来进行加载,但是仍然会遇到下面 Format Unknown 的问题。

尝试第二种方法。选中所有的 txt 文件,然后拖到 HistCite 的图标上,放开鼠标,果然自动打开了软件。

但是,事情好像并没有那么简单,又出现了一个报错:Format Unknown。

最后,在罗老师的指引下,我将每个 txt 文件的第一行中的 Science 改成了 Knowledge。

然后再将 txt 文件拖放到 HistCite 图标上面打开,终于成功加载了!

可以看到2819篇文献信息全部加载进来了。

在受到这么多折磨之后,我用 Python 开发了一个方便使用的脚步,于是一个以 HistCite 源程序为核心的精简易用免安装版本问世了,就叫 HistCite Pro 吧。

由于 HistCite 源程序只支持 Windows 系统,所以 Pro 版本也只能在 Windows 下使用!

你只需要下载 HistCite Pro 的压缩包(下载链接见文末)并解压(建议解压到 C 盘或者 D 盘的根目录下,保证路径中不含中文),就可以直接用,不需要安装,同时去掉了很多没用的文件,大大缩小了软件体积。对于从WOS上导出的txt数据文件,不用做任何修改,只要把全部的txt放到 TXT 文件夹里面,然后双击 main.exe 即可一键完成加载,非常方便。

好了,数据加载完毕,下面开始分析数据吧,点击 Tools 菜单下的 Graph Maker。


在弹出的页面上点击 Make Graph 即可得到一张引文关系图,包含了最有价值的前 30 篇文章的完整引文关系。

这张图看起来不是很清楚,在左边的Size选项中选择 Full 模式,重新绘制一张高清图,然后右击图片“另存为”一张图片即可。

图上有 30 个圆圈,每个圆圈表示一篇文献,中间的数字是这篇文献在数据库中的序号。圆圈越大,表示被引用次数越多。不同圆圈之间有箭头相连,箭头表示文献之间的引用关系。多数情况下,你会看到最上面有一个圆圈较大,并有很多箭头指向这篇文章。那么这篇文章很可能就是这个领域的开山之作。

通过我绘制出的这张关系图,我们发现标号为29、49、56、60的四个大圆圈非常显眼,可见这四篇文献的被引次数都是非常高的,我们对全部文献进行按照 LCS 排序,发现前四位刚好就是这 4 篇文献。

再回到那张圆圈箭头关系图,可见石墨烯在锂离子电池负极材料中的应用研究主要起源于2008年(29号文献),其通讯作者Honma来自日本,看来日本在石墨烯电池方面的研究开展得相当早。之后,在2010年,很多原创性的成功迸发而出,具有代表性的就是49、56、60、48号文献,非常有趣的是,2010年诺贝尔物理学奖的获奖项目刚好是石墨烯,其中的关联显而易见。之后的几年,石墨烯在锂离子电池负极方面的研究越来越多,方向约越来越细。

好了,前面提到HistCite可以找到某些具有开创性成果的无指定关键词的论文,我们来看看是怎么办到的。点击页面上的【Cited References】,然后就可以看到本地库中文献参考的全部文献信息,后面带有加号的表示本地txt库中没有包含,这些往往就是被遗漏的重要文献。

同样的,我们点击上面的【Authors】按钮,可以找到本领域的一些大牛,具体的操作步骤读者可以自己去摸索。

那么我们怎么把文献记录导出到Endnote呢?首先点击菜单栏中【Tools】下的【Mark&Tag】选项,调出标记选择工具栏。

下图红框内就是标记选择工具栏。左边栏用于指定选择范围,可以选择当前列表中的全部文献,也可以按照序号(#)、LCS、LCR等数值的区间来选择文献,还可以手动勾选需要的文献。中间栏表示的是需要导出的信息范围,可以只导出记录本身,也可以选择导出引用的文献或者被引的文献。右边栏的【Mark】按钮就是确认选择按钮。

所以,我们选择好了需要导出的文献记录,点击【Mark】按钮。

然后,我们就会发现上面出现了一个新的标签【Marks】,后面的数字就是我们选中的记录条数,如果发现这个数字不正确,点击【Mark】按钮旁边的【Unmark】来重新选择。确认无误之后,点击图示的【Marks】标签链接,即可显示全部被选的文献记录。

好的,下面依次点击【File】、【Export】、【Records...】来导出选中的文献记录。

成功导出后得到一个 .hci 格式的文本文件,直接修改后缀为 txt。如果导出不成功,一般多尝试几次就可以。

好的,现在我们打开Endnote,依次点击【File】、【Import】、【File...】按钮。

在弹出的对话框中通过【Choose...】找到刚才的txt文件,【Import Option】选择 Multi-Filter (Special),【Duplicates】选择 Import All,然后点击【Import】按钮即可导入。

评论中沈曦同学提到了将 HistCite 选好的文献导入到 Noteexpress 软件里的方法,具体操作是在导入时将过滤器选择为 web of science。

最后附上HistCite里面几个重要的英文缩写(感谢Dingledodies同学):

GCS(global citation score), 某一文献在WOS数据库中的总被引用次数。有些引用这篇参考文献的文章可能和你的研究方向毫无关系,但GCS还是会把这个引用数据记录下来。

LCS(local citation score),某一文献在本地数据集中的被引用次数。因为你导入Histcite的文章都是和你检索词有关系的,可以认为这些文章是你的研究同行,因此如果某一篇文献的LCS值很高,就意味着它是你研究领域内的重要文献,很有可能是你领域内的开创性文章,注意LCS高的文献和GCS高的文献不一定是同一篇!

LCR(local cited references), 某一文献引用本地数据集中参考文献的数目。根据LCR值的排序,可以快速定位近期关注该领域的重要文献,因为某一篇文献引用当前数据集中的文献数越多,说明它非常关注你检索的这个研究方向的文献,和你的研究肯定有相似或者可参考之处,可以从该文章中发现新动向。

CR(cited references), 某一文献引用WOS数据库中参考文献的数目。这个值越高,说明这篇文献很可能是综述性文献,可根据该值的排序,也可快速定位综述文献。

关于软件的使用问题,欢迎去作者的微信公众号留言讨论,下面是公众号的二维码,感谢原作者的付出。


更多精彩请点击下方阅读原文,下载科袖APP。

推荐阅读

浙大原副校长褚健出狱后获国家重点研发计划支持

国际著名材料类期刊Advanced Materials(先进材料)为同济大学111周年校庆出版专刊

这几个文献检索神器,你都知道吗?

这些超级好用的画图软件!拿好!

仅 467K 大小,秒下文献!SciHub Desktop 3.2 发布!

北航程群峰教授《PNAS》:有序交联的超强韧高导电石墨烯薄膜


自公众号开通以来,得到很多老师和同学的支持,经各位建议,近期陆续建立了微信群,汇集了各大高校的老师及硕博士生,如有需要进群,可加小编微信:186 0082 6589,并注明单位及研究方向,小编会拉各位入群。进群后请看群公告,资料下载等事项,都在其中。各课题组有招生招聘需求的也可加小编微信,免费帮您在科袖网(www.ekexiu.com)发布相关信息。


    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存