查看原文
其他

ExoBCD:一个乳腺癌外泌体相关生物标志物的综合数据库

丫丫 科研讲坛 2021-02-21
今天给大家分享一个最新的乳腺癌外泌体标记物数据库:ExoBCD。研究乳腺癌外泌体相关的小伙伴们可以一起来围观围观。现在我们来看看数据库构建的整体思路和所包含的哪些信息。ExoBCD数据库链接:https://exobcd.liumwei.org.


1. 简介
肿瘤标记物的准确应用是提高肿瘤患者治疗有效性和安全性的关键,外泌体作为“液体活检”和生物标记物的新来源,为肿瘤患者的诊断和治疗提供了一条更有前景的途径。尽管目前已经存在一些收录癌症外泌体相关标记物的数据库,但是ExoBCD相对于其他数据库而言,收录的乳腺癌外泌体标记物更为全面,且方法也较为经典。作者将研究成果于2020年6月26号发表在Brief Bioinform杂志中。
因此,给大家介绍该数据库及构建的流程不仅为正在研究乳腺癌外泌体相关课题的伙伴们提供资源共享,也为大家提供一个构建数据库的流程,为有能力和精力的科研爱好者们提供经典思路。


2. 方法
1)人工文献查找和收集乳腺癌外泌体相关标记物的研究成果
根据关键词搜索的方式通过 PubMed (http://www.ncbi.nlm.nih.gov/pubmed)数据库和 Web of Science (https://www.webofknowledge.com)数据库对乳腺癌外泌体相关的信息进行搜索和整理,并对数据信息进行分类等。
2)高通量数据的检索和分析
通过数据库Gene ExpressionOmnibus (GEO, http://www. ncbi.nlm.nih.gov/geo) 、 ArrayExpress (https://www.ebi.ac. uk/arrayexpress) 、Expression Atlas (https://www.ebi.ac.uk/ gxa) 和Genomic Expression Archive (GEA, https://www.ddbj.nig.ac.jp/gea)、 cBioPortal (http://www. cbioportal.org), EurOPDX Data Portal (https://dataportal. europdx.eu), Xena browser (https://xenabrowser.net),OmicsDI  (http://www.omicsdi.org), DataMed (https://datamed.org) and Google Dataset Search (https://datasetsearch.research. google.com) 等收集乳腺癌外泌体相关的高通量测序数据及芯片数据等。并通过R差异分析包limma和edgeR包做差异分析,其中以FDR<0.05和|log2(FC)|>1.5作为筛选的临界值。
3)BIM(biologically interesting molecules)和PBs(potential biomarkers)的鉴定
mRNA: 针对芯片数据中筛选到的差异表达mRNA,首先在Cancer RNA-Seq Nexus (CRN, http://syslab4.nchu.edu.tw) (P<0.01)中也是差异基因;接着通过cytoHubba及NetworkAnalyst分别筛选hub基因及功能富集分析;最后通过VarElect数据库分析hub基因与疾病表型的关系,具有高度相关的hub基因则认为BIMs。
miRNA: 通过Wilcoxon signed-rank 检验筛选bim(miRNA靶基因中,乳腺癌相关基因占总基因百分比),当BCGP(乳腺癌基因百分比)小于0.05,则为BIMs。
LncRNA: 根据筛选到的差异表达基因(mRNA和LncRNA)与乳腺癌相关的miRNA(文献中查找)构建ceRNA网络,网络中的LncRNA则为BIMs。并通过RNA-Binding Protein DataBase (RBPDB, http://rbpdb.ccbr.utoronto.ca)预测LncRNA潜在的靶基因和 NetworkAnalyst分析其生物学功能。最后通过最新文献检索,确定分子的功能及机制,根据文献中的描述将其标记为PBs或BIMs。
4) 功能分析及生存预后分析
通过 Ensembl BioMart ,miRBase , KEGG, GEPIA, Kaplan-Meier Plotter (http:// kmplot.com/analysis)等网站对目标基因进行功能分析及生存预后分析。
5)数据库构建
根据文献中搜索到的和差异分析结果,利用Drupal开发web界面,命名为ExoBCD。数据库中提供了导航和搜索引擎等功能,同时还为大家提供了下载数据的链接。
6)ExoBCD数据库中外泌体相关基因功能验证
通过NetworkAnalyst和miEAA对基因进行功能注释,揭示乳腺癌外泌体相关基因的功能。
 
3. 数据库收录的数据情况
一共有306(49PBs和257BIMs)个乳腺癌外泌体相关分子,其中121个mRNAs, 172个miRNAs, 13个LncRNA。收录的基本情况如下表所示:


4. 结果展示
1)乳腺癌外泌体相关基因功能富集结果及潜在靶标分析


2)乳腺癌外泌体相关miRNA-mRNA互作网络 


5. 数据库界面及介绍
1)在数据库主页(Home)上,显示了一个导航菜单栏(HOME,BROWSE,SUMMARY,VALIDATION 和DOWNLOAD)和数据摘要,数据汇总块显示了所有已识别的306个分子的信息,包括三种分子类型和15种注释类型(超过20900个条目)。如下所示: 


2)在浏览页面(Browse) 中,创建了“基本信息”和“证据信息”选项。在基本信息选项中,整合了基因名称、类型、来源和细胞来源等分子信息。


在搜索框中,用户还可以通过过滤选项的结果来搜索感兴趣的基因。所有内容包括与外显体和乳腺癌(以及其他癌症类型)相关的公共文献的实验证据、不同细胞系的高通量表达谱、预后影响和功能富集结果。


3)在验证(Validation)页面,在文献回顾的基础上,整合了详细的实验信息,包括病例对照、细胞系、外显体分离和验证方法以及功能、肿瘤分期和亚型、临床应用等条件信息。


4)在summary页面中,提供了数据结果可视化,包括总生存率的Kaplan-Meier图、KEGG路径的气泡图和GO-term富集分析、ceRNAs的调控网络和功能注释图(图6C)。在ceRNAs的调控网络中,用户可以通过鼠标移动点击或拖动一个节点来探索lncRNA-miRNA之间的相关性。此外,通过ceRNA网络可以获得lncRNAs在乳腺癌发生发展过程中的调控信息,这也有助于外泌体生物标志物的预测。


5)在下载(Download)页面中,可以以CSV、文本或XML格式下载相应的文献信息,生存预后,基因列表和功能注释信息。


6. 总结
ExoBCD旨在为研究人员提供一个关于乳腺癌外泌体的PBs或bim的快速检索功能。科研伙伴们,有兴趣的赶快收藏;有条件的可以构建一个属于自己的数据库。今天就介绍到这,下期再见啦!!!

注:此推文未经许可禁止转载!

阅读推荐:
 

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存