查看原文
其他

利用gganimate可视化全球范围R-Ladies(R社区性别多样性组织)发展情况

tyan 生信宝典 2022-03-28

作者:严涛 浙江大学作物遗传育种在读研究生(生物信息学方向)伪码农,R语言爱好者,爱开源。生信宝典对代码进行了系统测试和解释。

简介

R-Ladies是一个世界性的促进R语言社区性别多样性的组织,本文分析了这个组织的粉丝成员分布信息。

这篇文章主要基于d4tagirl,稍微有所修改。原文链接:https://d4tagirl.com/2017/05/how-to-plot-animated-maps-with-gganimate

小编是用3.5.1版本的R重现以下过程的,gganimate包不能通过Tools——Install Pakages来安装,而需要从github直接安装,下面的命令适用于我所遇到的问题。(gganimate有两个包,本文用到的是老的版本。2018美日科学家因免疫治疗得诺贝尔生理医学奖|动图展示历年生理学奖中用到的是新版本,用法不太一致,还请注意。)

devtools::install_github("dgrtwo/gganimate", ref = "v0.1.1”)

另外一个依赖的软件是imageMagick软件,这是一个需要单独下载并安装在PC或服务器端的图形编辑软件,下载地址:https://imagemagick.org/script/index.php,选择适合自己电脑系统的一个版本进行安装。推荐ImageMagick-6.9.10版本,最新版存在与此R包的兼容性问题。gganimate的新版本不依赖于该软件。

注意:安装路径不要有中文和空格。

数据加载

# 加载包,若缺失则安装。
library(pacman) p_load(tidyverse, gganimate, maps, ggthemes)
rladies <- read_csv(url("https://raw.githubusercontent.com/d4tagirl/R-Ladies-growth-maps/master/rladies.csv"))%>%  select(-1) head(rladies) ## # A tibble: 6 x 7 ##   screen_name     location     created_at followers age_days     lon   lat ##   <chr>           <chr>        <date>         <int>    <dbl>   <dbl> <dbl> ## 1 RLadiesSF       San Francis~ 2012-10-15       916     1673 -122     37.8 ## 2 RLadiesNYC      New York     2016-09-01       309      256 - 74.0   40.7 ## 3 RLadiesIstanbul <U+0130>stanbul, T~ 2016-09-06       436      251   29.0   41.0 ## 4 RLadiesBCN      Barcelona, ~ 2016-10-11       377      216    2.17  41.4 ## 5 RLadiesColumbus Columbus, OH 2016-10-04       179      223 - 83.0   40.0 ## 6 RLadiesBoston   Boston, MA   2016-09-06       259      251 - 71.1   42.4

可视化

主要是根据地理位置信息映射到地图上

# borders是map包中的函数,作用是获取地图信息和绘制地图
# 其它部分都是ggplot2的操作了
ggplot()+  borders("world", color="gray85", fill="grey80")+  geom_point(data = rladies, aes(lon, lat, size=followers), color="purple", alpha=0.5)+  scale_size_continuous(range = c(8, 24), breaks = c(250, 500, 750, 1000))+  labs(size="Followers", title="                                             The development of R-Ladies’ Twitter accounts",x=NULL,y=NULL)+  theme(text = element_text(family = "Times New Roman", color = "#EEEEEE"), #这部分主题修改,自己尝试,应该有更简单的办法        plot.title = element_text(size=40,color = "#f9ba00"),        plot.subtitle = element_text(size=14),        axis.ticks = element_blank(),        axis.text = element_blank(),        panel.grid = element_blank(),        panel.background = element_rect(fill="#333333"),        plot.background = element_rect(fill = "#333333"),        legend.position = c(0.18,0.36),        legend.background = element_blank(),        legend.key = element_blank(),        legend.text = element_text(size = 28),        legend.title = element_text(size=28, color = "#f9ba00"))+  annotate(geom = "text",           label="Made by Logos ytlogos.github.io\nOriginally from d4tagirl https://d4tagirl.com",           x=70, y=-55, size=10, family="Helvetica Black", color="#f9ba00", hjust="left")

动画展示

为了利用gganimate进行动态展示,需要构建一个映射变量:时间 (后面中的frame)。同时为了使得可视化开始呈现的是空白,结尾能继续保留展示一段时间,又构建了两个空白图层,就是下面2个数据表。

这里用的日期做的时间轴,其它数值变量或因子变量也都可以,注意根据需要修改。如果不是日期变量,不需要as.Date函数转换。

# 注意起始时间一定要早于、晚于真实数据中的时间。
# 每个时间生成一张图片,若有重名,会出现图片丢失,拼合出错。
ghost_points_ini <- tibble(created_at=as.Date("2011-09-01"), followers=0, lon=0, lat=0) ghost_points_fin <- tibble(created_at=seq(as.Date("2017-05-16"), as.Date("2017-05-30"),by="days"), followers=0, lon=0,lat=0)


添加frame映射, aes中的frame和cumulative不是ggplot2的标准美学参数,不被识别,会弹出warning,忽略就好。gganimate可以识别这两个,frame指定用哪一列做时间轴,每个时间轴会生成1张图片; cumulative表示累加,新的时间轴包含之前的数据。


注意下面3个geom_point用到的数据表不同。


map <- ggplot()+  borders("world", color="gray85", fill="grey80")+
 # aes中的frame和cumulative不是ggplot2的标准美学参数,不被识别,会弹出warning,忽略就好
 # gganimate可以识别这两个,frame指定用哪一列做时间轴,每个时间轴会生成1张图片;
 #  cumulative表示累加,新的时间轴包含之前的数据  geom_point(data = rladies, aes(lon, lat, size=followers, frame=created_at, cumulative=TRUE), color="purple", alpha=0.5)+  scale_size_continuous(range = c(4, 16), breaks = c(250, 500, 750, 1000))+  # aes中的frame和cumulative不是ggplot2的标准美学参数,不被识别,会弹出warning,忽略就好
 # gganimate可以识别这两个,frame指定用哪一列做时间轴,每个时间轴会生成1张图片;
 #  cumulative表示累加,新的时间轴包含之前的数据
 geom_point(data = ghost_points_ini, aes(lon, lat, size=followers, frame=created_at, cumulative=TRUE), alpha=0)+  geom_point(data = ghost_points_fin, aes(lon, lat, size=followers, frame=created_at, cumulative=TRUE), alpha=0)+  labs(size="Followers", title="The development of R-Ladies’ Twitter accounts",x=NULL,y=NULL)+  theme(text = element_text(family = "Times New Roman", color = "#EEEEEE"),        plot.title = element_text(size=28, color = "#f9ba00"),        plot.subtitle = element_text(size=14),        axis.ticks = element_blank(),        axis.text = element_blank(),        panel.grid = element_blank(),        panel.background = element_rect(fill="#333333"),        plot.background = element_rect(fill = "#333333"),        legend.position = c(0.18,0.36),        legend.background = element_blank(),        legend.key = element_blank(),        legend.text = element_text(size = 18),        legend.title = element_text(size=24, color = "#f9ba00"))+  annotate(geom = "text",           label="Made by Logos ytlogos.github.io\nOriginally from d4tagirl https://d4tagirl.com",           x=70, y=-55, size=6, family="Helvetica Black", color="#f9ba00", hjust="left") animation::ani.options(interval=0.15, ani.width=1500, ani.height=800, units="in") gganimate::gganimate(map, filename = "d4tagirlmap.gif")

SessionInfo

sessionInfo() ## R version 3.4.3 (2017-11-30) ## Platform: x86_64-w64-mingw32/x64 (64-bit) ## Running under: Windows 10 x64 (build 16299) ## ## Matrix products: default ## ## locale: ## [1] LC_COLLATE=Chinese (Simplified)_China.936 ## [2] LC_CTYPE=Chinese (Simplified)_China.936   ## [3] LC_MONETARY=Chinese (Simplified)_China.936 ## [4] LC_NUMERIC=C                               ## [5] LC_TIME=Chinese (Simplified)_China.936     ## ## attached base packages: ## [1] stats     graphics  grDevices utils     datasets  methods   base     ## ## other attached packages: ##  [1] ggthemes_3.4.0       maps_3.2.0           BiocInstaller_1.28.0 ##  [4] forcats_0.2.0        stringr_1.2.0        dplyr_0.7.4         ##  [7] purrr_0.2.4          readr_1.1.1          tidyr_0.8.0         ## [10] tibble_1.4.2         ggplot2_2.2.1.9000   tidyverse_1.2.1     ## [13] pacman_0.4.6         ## ## loaded via a namespace (and not attached): ##  [1] reshape2_1.4.3    haven_1.1.1       lattice_0.20-35   ##  [4] colorspace_1.3-2  htmltools_0.3.6   yaml_2.1.16       ##  [7] utf8_1.1.3        rlang_0.1.6       pillar_1.1.0     ## [10] foreign_0.8-69    glue_1.2.0        modelr_0.1.1     ## [13] readxl_1.0.0      bindrcpp_0.2      bindr_0.1         ## [16] plyr_1.8.4        munsell_0.4.3     gtable_0.2.0     ## [19] cellranger_1.1.0  rvest_0.3.2       psych_1.7.8       ## [22] evaluate_0.10.1   labeling_0.3      knitr_1.19       ## [25] parallel_3.4.3    broom_0.4.3       Rcpp_0.12.15     ## [28] scales_0.5.0.9000 backports_1.1.2   jsonlite_1.5     ## [31] mnormt_1.5-5      hms_0.4.1         digest_0.6.15     ## [34] stringi_1.1.6     grid_3.4.3        rprojroot_1.3-2   ## [37] cli_1.0.0         tools_3.4.3       magrittr_1.5     ## [40] lazyeval_0.2.1    crayon_1.3.4      pkgconfig_2.0.1   ## [43] xml2_1.2.0        lubridate_1.7.1   assertthat_0.2.0 ## [46] rmarkdown_1.8     httr_1.3.1        rstudioapi_0.7   ## [49] R6_2.2.2          nlme_3.1-131      compiler_3.4.3

R统计和作图

系列教程

更多阅读

画图三字经 生信视频 生信系列教程 

心得体会 癌症数据库 Linux Python 

高通量分析 在线画图 测序历史 超级增强子

培训视频 PPT EXCEL 文章写作 ggplot2

海哥组学 可视化套路 基因组浏览器

色彩搭配 图形排版 互作网络

后台回复“生信宝典福利第一波”获取教程合集

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存