查看原文
其他

研究生物多样性,CNGBdb这5大数据库千万别错过 | 国际生物多样性日

深圳国家基因库 华大科技BGITech 2019-06-02

“我们的生物多样性、我们的粮食、我们的健康”,是今年国际生物多样性日的主题。地球的生物多样性,为75.8亿人提供了生存的物质基础。但你知道吗:

过去100年内,

超过90%的农作物品种从农田消失;

全球约200种作物,

多用于粮食生产的仅小麦、甘蔗、油棕果等9种;

全球17个主要渔区,

均在进行捕捞或者已超出可持续发展限度;

2000-2018年间,

150种牲畜走向灭绝……

生物多样性是粮食和健康的基础,同时也是改变粮食系统、改善人类健康的关键。保护生物多样性的重要性不言而喻。


图片来源:2019年国际生物多样性日官网

国库长期关注生物多样性保育,参与和支撑了地球生物基因组计划(EBP)等多个国际、国内重大科研项目。在农作物多样性资源保护利用方面,国库与国际半干旱热带作物研究所(ICRISAT)、国际水稻研究所(IRRI)等国际组织密切开展合作,并与联合国粮农组织(FAO)结下了深厚的友谊。

去年9月,FAO作物生产与保护司倪葭博士造访国库。今年3 月,FAO《粮食和农业植物遗传资源国际条约》(ITPGRFA)秘书长 Kent Nnadozie 与全球信息系统高级顾问 Marco Marsella 也做客国库,与国库理事汪建、主任王韧就ITPGRFA现状、农作物多样性资源利用等进行友好洽谈。

此外,国家基因库生命大数据平台(CNGBdb)基于自身支撑的重大科研项目及现有资源,为生物多样性领域建立了五大专有数据库,提供优质数据及专用分析工具,供科研人员挖掘和使用。


01

1KP千种植物数据库


植物是人类和动物或直接、或间接的食物来源。说起植物研究,就不得不提千种植物项目(1KP)。它由加拿大科学家于2008年发起,对绿色植物(Viridiplantae)的转录组进行大规模测序和组装,在系统发育/分类水平上几乎包含所有已知的1000多个物种,极大地丰富了公共数据库中植物的转录本资源。

按物种分类查看植物信息

深圳华大生命科学研究院是项目的主要成员之一。国库为项目提供了重要支撑,并建立了1KP千种植物数据库,方便国内科研人员获取和利用项目产出的数据资源。自上线以来,1KP数据库访问量已超过7万次,完成逾1.8万次BLAST任务。除了查询、下载和BLAST之外,如果你在1KP数据库中发现了感兴趣的样本资源,还可以申请使用、寻求合作,将它用于自己的项目。


02

B10K:万种鸟基因组数据库


地球上存活着约10,500种鸟类,它们不仅为人类的饮食和经济做出了重大贡献,还是生命科学发展史上的一大功臣——1835年,加拉帕戈斯群岛上的莺雀多样性启发了26岁的达尔文,在他脑海中埋下了进化论的种子。从那时起,鸟类研究便不断为生命科学带来开创性的发现。

2015年6月,由华大集团、哥本哈根大学、杜克大学等主导的国际鸟类基因组联盟正式启动万种鸟类基因组(B10K)项目,来自20多个国家的研究人员参与,计划在2020年之前对所有现存鸟类中具有代表性的鸟类基因组进行测序分析,从基因组水平构建鸟类物种的生命之树,解读遗传变异与表型变异之间的联系,评估各种生态因素和人类影响对物种进化的影响,揭示其种群进化历史。

CNGBdb B10K数据库

CNGBdb的B10K万种鸟基因组数据库在此基础上组建而成,供用户查询和下载项目相关数据,使用参考数据集进行BLAST比对分析。


03

Fish T1K千种鱼转录组数据库


鱼类肉质鲜美、营养丰富,是人类重要的动物蛋白质来源。作为进化地位古老且物种多样性丰富的脊椎动物类群,其物种数量占所有脊椎动物的一半以上。

2018年5月14日,迄今最可靠的鱼类系统演化树在《美国科学院院刊》(PNAS)上发表,解决了许多饱受争议的鱼类分类单元进化问题。这正是“千种鱼类转录组计划”(Fish T1K)的重要成果之一。2013年,Fish T1K项目由国库和深圳华大生命科学研究院参与联合发起,计划对约1,000种鱼类的转录组进行测序和组装,吸引了美国乔治华盛顿大学、史密森尼博物院、新加坡科技研究局等多家科研机构的共同参与。

CNGBdb Fish T1K数据库

在CNGBdb的Fish T1K千种鱼转录组数据库,可以查看项目进展,获取转录组数据和样本信息,进行BLAST比对分析。此外,它还分享了鱼类转录组样本制备的方法和标准。库中的数据将随着项目的持续推进不断充实。


04

MilletDB谷子数据库


粟(Setaria italica),北方统称“谷子”,去皮后称“小米”。中国是世界上种植谷子最大的起源中心,古代曾将谷子南传印度、巴基斯坦,西传俄国、奥地利,乃至整个欧洲,东传朝鲜、日本,乃至全世界。它是“五谷”之首,是中华民族的哺育作物之一。

2012年5月,由深圳华大生命科学研究院、张家口市农业科学院等单位合作完成的谷子基因组研究成果,发表于《自然-生物技术》(Nature Biotechnology),成功构建了谷子全基因组序列图谱。

CNGBdb MilletDB数据库

CNGBdb将已有研究成果进行整合,筹建了MilletDB谷子数据库,将谷子的表型和基因型贯穿起来,实现两者的交叉查询。同时,数据库利用逾2000份谷子材料、约40种谷子的表型信息,通过机器学习的方法,针对基因型和表型数据建立模型,最终实现从品种的基因型来预测表型,助力智能分子育种。


05

MDB:微生物组数据库


与前几个基于单个重大项目建成的数据库不同,MDB微生物组数据库是多个项目数据的融合体。CNGBdb对递交到CNSA(国家基因库核酸序列归档系统)并对外公开的大量微生物数据进行了审编,进而构建了MDB。它汇集微生物生态群落样本的测序资源和元数据,既有与宿主共生微生物,也包括环境微生物。

CNGBdb MDB数据库:样本类型及数量

在这里,可以查询基因、样本和项目信息、下载不同物种肠道微生物的数据,进行BLAST比对分析,相关微生物分类信息也进行了展示,同时还提供宿主相关微生物组的基因目录。如果你正从事相关研究,希望这些资源能助你一臂之力,也欢迎你在CNSA上共享自己的数据,与业内同仁互助共赢。

想试试能不能从这五大数据库中挖到宝?请果断扫描上文各数据库“名片”中的二维码,或者戳底部“阅读原文”,即刻体验。下一期,小编还将为你推荐CNGBdb在其他研究领域的更多专有数据库。

如果使用过程中遇到问题,或者有任何意见、建议,请留言告诉小编,或者通过以下方式联系我们:

📧 CNGBdb@cngb.org

 0755-33945586

汇集海量生命科学数据资源的国家基因库生命大数据平台(CNGBdb),期待以大数据的力量,通过助力相关科研,为生物多样性保护贡献一份力量。希望知识的累积和科技的进步帮助我们找到科学有效、可持续的方法,实现人与自然的和谐共处,让其他物种和人类一起,继续多姿多彩、生生不息。


参考资料:

  • 联合国《生物多样性公约》-2019年国际生物多样性日 

    https://www.cbd.int/idb/2019/

  • 联合国粮食及农业组织-生物多样性

    http://www.fao.org/biodiversity

  • Hughes LC, Orti G, Huang Y, et al. Comprehensive phylogeny of ray-finned fishes (Actinopterygii) based on transcriptomic and genomic data. Proceedings of the National Academy of Sciences of the United States of America, 2018, https://doi.org/10.1073/pnas.1719358115.

  • Zhang, G., et al. Genome sequence of foxtail millet (Setaria italica) provides insights into grass evolution and biofuel potential." Nature Biotechnology30.6(2012), https://www.nature.com/articles/nbt.2195.



本文转载自公众号“深圳国家基因库”。



请继续关注“华大科技BGITech”,

科技君将一如既往为您提供精彩内容!

如有相关问题,欢迎后台留言~~

关注华大科技,尽享精彩科研!



    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存