其他
R语言文献计量之TOP5发文国家时间序列变化
R语言文献计量之TOP5发文国家时间序列变化
前面简介了使用bibliometrix
包进行文献计量,由于R语言是一个开放的编程环境,借助bibliometrix
包,再自己写一些代码,可以很方便的进行自定义的深入文献信息挖掘。
在看文献的过程中,看到了下面的一个图,TOP5国家论文发布趋势,那么怎么能借助bibliometrix
包和R语言把这个图做出来呢?
制图思路
在bibliometrix
包试验过程中,我知道它可以统计各国的文献发文数量。
既然上面的图可以做出来,bibliometrix
一定是可以获取文献作者的国家信息的。
我的思路
获取发文作者国家 国家和时间合并 各国发文量排序,获取TOP5发文国家 TOP5发文国家分年份统计 ggplot2出图
实施过程
biblioshiny()
是一个可视化界面,运行过程中Rstudio看不出数据处理过程,那么为了能够获取国家信息,必须使用bibliometrix
分步处理数据。
为此我查看了bibliometrix
的帮助,以及Github源代码,找到了国家信息提取有关的代码。
然后根据上面的思路进行了代码的编写,实现了TOP5发文国家时间变化的分析。
绘图代码
绘图结果如下,代码如下,欢迎规范转载,不要盗图!
library(bibliometrix)
library(tidyverse)
biblioshiny()
SAdata <- load("Bibliometrix-Export-File-2021-03-21.RData")
SA_badata <- biblioAnalysis(M)
couplingMap(M)
# Countries
data("countries",envir=environment())
countries=as.character(countries[[1]])
sep=";"
### new code{
if (!("AU1_CO" %in% names(M))){
M=metaTagExtraction(M,Field="AU1_CO",sep)}
CO=M$AU1_CO
PY=M$PY
#国家发文分年统计
CO_PY = as.data.frame(cbind(CO,PY)) %>%
group_by(CO, PY)%>%
summarise(n())
#国家发文统计
CO_PY2 = as.data.frame(cbind(CO,PY)) %>%
group_by(CO)%>%
summarise(n())
#获取TOP5发文国家
TOP_CO= CO_PY2[order(CO_PY2$`n()`, decreasing=T),]
TOP5_CO = TOP_CO[1:5, 1]
TOP5_CO_PY = inner_join(TOP5_CO, CO_PY, key="CO")
TOP5_CO_PY$PY = paste0(TOP5_CO_PY$PY,"-01-01")%>%
as.Date(PY,format="%Y-%m-%d") #生成一个时间序列,保证ggplot2时间轴正确
# ggplot2绘图
p1 <- ggplot(TOP5_CO_PY, aes(PY, `n()`, color=CO))+
labs(x="年份", y="发文数量")+
guides(color=guide_legend(title = "文献作者国籍"))+
theme_bw()+
theme(title = element_text(size = 22),
axis.title = element_text(size = 20), #调整标题大小
axis.text.x = element_text(size = 18), #x轴标签大小
axis.text.y = element_text(size = 18),
legend.title = element_blank(),
legend.position = "bottom")+ #y轴标签大小
geom_line()+
geom_point()
p1
拜托大家不要只收藏,好东西还请分享啊
点击阅读原文跳转bibliometrix
GitHub,围观代码
参考文献
R语言文献计量分析初探 Aria M, Cuccurullo C. bibliometrix: An R-tool for comprehensive science mapping analysis[J]. Journal of Informetrics, 2017, 11(4): 959–975. http://www.bibliometrix.org/documents/Field_Tags_bibliometrix.pdf R语言安装部署基础 https://www.bibliometrix.org/index.html https://github.com/massimoaria/bibliometrix GIMMS NDVI数据ENVI裁剪和R语言时间序列处理分析 0基础学习GIS和R语言