Bioconductor注释专题:MeSHDb
MeSH(Medical Subject Headings)是一个生命科学领域综合的vocabulary,美国国家图书馆用来手动索引MEDLINE/PubMed文章,一共包含了19个目录,MeSH.db包含了其中的16个,详细信息见下图。
Mesh term通过三种方式与Entrez Gene ID相互关联:
MeSH.db提供了MeSH ID 和 Entrez Gene ID两者之间的联系
安装MeSH.db包
## try http:// if https:// URLs are not supported
source("https://bioconductor.org/biocLite.R")
biocLite("MeSH.db")
library(MeSH.db)
调用查看MeSH.db包
library(MeSH.db)
dbInfo(MeSH.db)
这里告诉了我们包的时间和来源等信息
在bioconductor搜索包MeSHDbi,可以看到MeSH.db类型的包有80个,每一个都代表MeSH.xxx.eg.db都代表一个物种的Mesh包,对应的物种和缩写可以查阅:http://www.genome.jp/kegg/catalog/org_list.html
MeSH.db用法
MeSH.db主要包含了四个函数 : columns, keytypes, keys 和 select .
columns,keytypes可以查看列名:
cls <- columns(MeSH.db)
kts <- keytypes(MeSH.db)
下面会介绍每列代表的含义。
keys用来提取MESH中某一列的信息:
kt <- kts[2]
kt
ks <- head(keys(MeSH.db, keytype=kts[2]))
select可以查看所有列
res <- select(MeSH.db, keys=ks, columns=cls, keytype=kt)
head(res)
这里显示了MESH.db每一列的内容,我们可以看看MESH.db中包含了哪16类CATEGORY,可以查询第一张图,比如“D”就表示
Chemicals and Drugs
MeSH中MeSHID和qualifierID转换
假设我现在有100个MESHID如下,要转换为 qualifierID
ks$QUALIFIERID <- res[match(ks$MESHID,res$MESHID),"QUALIFIERID"]
head(ks)
参考资料:
http://www.bioconductor.org/packages/release/data/annotation/manuals/MeSH.Hsa.eg.db/man/MeSH.Hsa.eg.db.pdf
http://mp.weixin.qq.com/s/NzXxCZBYXuZm7eEC_QRJyQ
猜你喜欢
生信菜鸟团-专题学习目录(6)
还有更多文章,请移步公众号阅读
▼ 如果你生信基本技能已经入门,需要提高自己,请关注下面的生信技能树,看我们是如何完善生信技能,成为一个生信全栈工程师。
▼ 如果你是初学者,请关注下面的生信菜鸟团,了解生信基础名词,概念,扎实的打好基础,争取早日入门。