查看原文
其他

代码海洋-你想模仿的这里都有啊

生信技能树 生信技能树 2022-06-07

最近看文献:Integrative Pharmacogenomics Analysis of Patient Derived Xenografts  又一次遇到了codeocean ,算是生物信息学数据分析者的一个福音,因为大量的好文章都是把绘图数据及代码一股脑的打包上去了,关键是都是可以重复出来的!(https://codeocean.com/)

每个文章的代码都是一个独立的环境

如下所示,code及其配套的data都是独立的文件夹,而且是可以查看的。

 

可以从中学到其他人的代码技巧,比如判断哪些包没有安装,甚至批量安装R包

cat(sprintf("\n\n##=========== checking if required packages are installed ======\n\n"))

packagesReq <- c("BBmisc""doParallel""foreach""ggplot2""ggpubr"
                 "methods""psych""reshape2""Rtsne""scales""snow"
                 "Biobase""circlize""ComplexHeatmap""piano""PharmacoGx")

packToInst <- setdiff(packagesReq, installed.packages())

if(length(packToInst)>0)
{
  cat(sprintf("\nInstalling required packages:\n%s\n", paste0(packToInst, collapse = "\n")))

}

实际上就是一个个独立的docker

docker我们讲解很多次了,具体大家可以浏览我在在生信技能树上面写过部分docker教程, 目录如下:

再复习几个docker指令:

docker
docker info ## 可以查看目前机器上面的docker里面有多少容器或者镜像。
docker version
sudo docker search ubuntu
sudo docker run hello-world 
## 上面代码下载了一个镜像,启动了一个容器,下面就可以查看它们
sudo docker run ubuntu  ## 默认下载最新版docker
docker ps -a  ## 查看目前所有没有被销毁的容器进程。
docker images -a ## 查看目前所有的本地镜像 
docker volume ls  
docker network ls 

打开这个codeocean的dockerfile,可以很清楚的看到,就是基于codeocean的r-base:3.4.4-ubuntu16.04这个初始化的空白电脑系统,然后安装几个这篇文章绘图需要的R包,就可以啦!

FROM registry.codeocean.com/codeocean/r-base:3.4.4-ubuntu16.04

ARG DEBIAN_FRONTEND=noninteractive

RUN Rscript -e 'devtools::install_version("BBmisc", \
      version = "1.11", \
      dependencies = TRUE)'

RUN Rscript -e 'devtools::install_version("Rtsne", \
      version = "0.13", \
      dependencies = TRUE)'

RUN Rscript -e 'devtools::install_version("doParallel", \
      version = "1.0.11", \
      dependencies = TRUE)'

RUN Rscript -e 'devtools::install_version("doSNOW", \
      version = "1.0.16", \
      dependencies = TRUE)'

RUN Rscript -e 'devtools::install_version("foreach", \
      version = "1.4.4", \
      dependencies = TRUE)'

RUN Rscript -e 'devtools::install_version("ggpubr", \
      version = "0.1.7", \
      dependencies = TRUE)'


RUN Rscript -e ' \
      source("http://bioconductor.org/biocLite.R"); \
      biocLite(c( \
        "Biobase", \
        "ComplexHeatmap", \
        "PharmacoGx", \
        "piano" \
      ), suppressUpdates = TRUE)'


RUN Rscript -e 'devtools::install_github("bhklab/Xeva", \
      dependencies = TRUE, \
      upgrade_dependencies = FALSE, \
      ref = "v1.0.0")'

docker的好处就是,随时启动,任意销毁,不需要有任何的心理负担,哪怕你有心理洁癖!

圈圈图

这篇文章展示了一个药物靶点以及其对应的通路关系的圈圈图,如下:

 

假如你感兴趣绘制这个图的代码,就可以点开看具体的代码实现,如下:

suppressMessages(library(circlize))
library(BBmisc)
library(reshape2)
plot_figure <- function(mat, cirOrd, gap.after, grid.col, colorMat, names2show,
                        txtCol)
{
  paraText <- function(txt, width = 50)
  { paste( strwrap(txt, width = width), collapse = "\n") }

  circos.clear()
  circos.par(gap.after = gap.after, start.degree = -100,
             track.margin = c(0.0010.002))

  chordDiagram(mat, order = cirOrd, grid.col = grid.col, col=colorMat,
               annotationTrack = "grid",
               preAllocateTracks = list(track.height= 0.50),
               transparency = 0.25)

  circos.trackPlotRegion(track.index = 1, panel.fun = function(x, y)
  {
    xlim = get.cell.meta.data("xlim")
    ylim = get.cell.meta.data("ylim")
    sector.name = get.cell.meta.data("sector.index")
    if(sector.name %in% names2show)
    {
      circos.text(mean(xlim), ylim[1], sector.name, facing = "clockwise",
                  niceFacing = TRUE,  adj = c(00.5),
                  col = txtCol[sector.name],cex = 1.5)
    }
  }, bg.border = NA)
  circos.clear()
}

主要是 chordDiagram 和 circos.trackPlotRegion两个函数,来自于circlize这个R包。

还有更多更新更好玩的代码,你们自己去探索吧:

你可能会需要:广州专场(全年无休)GEO数据挖掘课,带你飞(1.11-1.12)和 生信入门课全国巡讲2019收官--长沙站 

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存