点赞!全球最大规模中国人基因组学研究成果深圳发布 ,首次揭开中国人基因秘密!
前两天
一条新闻先后
低调登上了人民日报头版和新闻联播
10月11日
再度登上央视新闻
这次说了啥?
报道时长1分53秒
北京时间10月4日,华大在国际顶级学术期刊《细胞》上发表了迄今为止最大规模的中国人基因组学大数据研究成果。这是由中国科学家主导,历时两年对14余万中国人无创产前基因检测数据进行深入研究的成果。昨天下午,这一成果在深圳国家基因库正式对外发布!
这项研究的对象是14余万怀孕12周至22周的妇女。在充分尊重知情同意和隐私保护下,华大研究团队选取了他们无创产前基因检测的数据展开研究,揭示了包括31个省市自治区36个少数民族及汉族的中国人群精细遗传结构,揭示了中国人群中病毒序列分布特征。这一成果填补了大规模中国人基因组学研究领域的众多空白,揭示了一系列中国人群特有的遗传特征,有助于推动我国精准医学事业的发展,加速基因科技在出生缺陷、癌症、感染等领域的应用。
发布会现场,深圳国家基因库执行主任、华大生命科学研究院院长徐讯接受央视记者访问时表示:“我们打破了原有的这个人类遗传和疾病研究依赖于白种人参考序列的问题,比如说,我们原来去做乳腺癌的诊断,是基于在西方人里面找到的两个基因,BRAC1、BRAC2基因里面常见突变,有了中国人参考序列之后。这个开发可以更有针对性。”
丹麦皇家科学院院士、中国科学院外籍院士弗莱明·贝森巴赫作为嘉宾出席了发布会,充分肯定了基因组学大数据研究成果的意义:“因为人和人之间的基因是有差异的,要根据具体的基因突变热点,来定制诊断和治疗的方法,所以未来基于基因组数据的个性化医疗是重要的发展方向。”
研究团队主要成员,左起:刘斯洋博士(第一作者),徐讯博士(通讯作者),陈芳博士(共同第一作者),金鑫博士(共同通讯作者), 黄树嘉博士(共同第一作者)
全球最大规模中国人基因组学研究成果发布
首次揭秘中国人基因大数据
来源:南方科技大学产学研
2018年10月10日,华大基因在深圳国家基因库正式对外发布一项迄今为止最大规模的中国人基因组学大数据研究成果。这是由中国科学家主导,历时两年,对14余万中国人的无创产前基因检测数据进行深入研究后,首次揭秘中国人群基因遗传特征的科研成果,也是由华大主导的“百万人群基因大数据研究”项目的首秀。
对此,深圳国家基因库执行主任、华大生命科学研究院院长、文章通讯作者徐讯博士表示,本次研究成果有两个重要意义:首先,这标志着生命科学产业已经从单个样本的检测和诊断,正式进入了基因大数据时代;其次,也验证了基于大人群的精准医学研究已成为新的科研模式,对基因组学大数据研究具有开创性价值。
▲ 全球最大规模中国人基因组学研究成果发布会现场
深圳市人民政府副秘书长吴优,深圳市卫生和计划生育委员会副主任孙美华,华南理工大学副校长吴业春,丹麦皇家科学院院士、中国科学院外籍院士Flemming Besenbacher,深圳市公立医院管理中心运行部副部长庄展辉,深圳市人民医院产前诊断中心主任任景慧,深圳市妇幼保健院产前诊断中心主任谢建生,广州市番禺区何贤纪念医院副院长朱斌,佛山市妇幼保健院产前诊断中心主任黄以宁,华大基因理事长杨焕明,深圳国家基因库执行主任、华大生命科学研究院院长、文章通讯作者徐讯,华大集团执行副总裁朱岩梅,华大基因首席市场官赵立见,华大生命科学研究院母婴研究所所长、文章共同第一作者陈芳,华大生命科学研究院母婴研究所副所长、文章共同通讯作者金鑫,华大研究员、文章第一作者刘斯洋等出席了本次发布会。
▲ 10月4日,华大基因在国际顶级学术期刊《细胞》上发表了全球最大规模中国人基因组学研究成果。
虽然我国人口众多,历史悠久,但长久以来,由于实验研究抽样不充分,导致我们对自身的遗传特征认识不多。
在严格遵从《人类遗传资源管理暂行办法》和生命伦理原则的规范下,以及充分重视知情同意和隐私保护的前提下,华大研究团队选取了14余万无创产前基因检测数据展开了群体水平的研究,开发了一系列适用于此类数据的分析方法,揭示了包括31个省、36个少数民族与汉族在内的中国人群精细的遗传结构,实现了多种表型的全基因组关联研究,揭示了中国人群中病毒序列分布特征,构建了包含约904万个多态性位点的炎黄中国人群基因频率数据库 (CMDB),其中约有20万个多态性位点属于首次发现,这是目前正式发表的最大规模的中国人群基因频率数据库。
值得一提的是,研究小组确定了6个在地区纬度方向上受到强烈自然选择的基因,它们在基因频率上呈现明显的南北差异,充分展现了饮食、气候、病原体等环境因素对中国人群的演化所起到的选择作用。
▲ 6个在中国受到显著自然选择的基因位点
比如,由于古代在北方、西北等地区如新疆、青海和内蒙古等省份可能由于蔬菜获取比较困难,导致生活在这些地区的人们肉类摄入比例较大,因此,促进脂肪代谢率的等位基因在这些地区有明显富集的趋势。
与机体免疫功能相关的编码了红细胞补体受体I的基因CR1呈现了南方富集的现象。古代中国南方被称为南蛮瘴气之地,自然环境恶劣,病原微生物尤其是疟疾盛行,因此对于生存于该地区的人在免疫力方面有较高的要求。
此外,与耳垢干湿、体味(如狐臭)、大汗腺分泌等相关的ABCC11基因,也呈现了明显的南北方选择差异。除了部分广西、广东和海南的中国人没有这个基因突变之外。绝大部分的生活在北方温带气候地区的人们都有这个基因突变,突结果表现为干性耳垢、体味较小、大汗腺分泌较少,这样可能更有利于北方的生存环境。而在炎/闷热的南方,则没有这方面的自然选择压力,从而使野生型基因在南方长久地流传下来。
同时,研究小组通过分析人群遗传距离的变化和基因流方向,揭示了汉族与少数民族群体的遗传结构特点及中国各省与欧洲、南亚、东亚人群的基因交流程度(或者说是通婚程度),发现当今中国人的遗传特点同时受到丝绸之路及近代人口大规模迁徙等因素的多重影响。
本次研究发现,甘肃以及靠近甘肃省的宁夏和青海省的汉族人群体中所含有的欧洲人成分高于其它省份,为全国平均水平的1.7倍,达到0.115%。这个地区在古代恰巧是丝绸之路的必经之地——河西走廊的所在之处,是中西方人群汇聚的地方,很可能由此导致该地区汉族人有较高的欧洲血统。
▲ 四个重要表型的GWAS研究
通过数据分析,研究小组一次性发现并且验证了48个与身高以及13个与BMI显著相关的基因位点,包括这些位点在内的常见突变位点分别解释了48%的身高遗传率以及10%的BMI遗传率。随着研究的进一步深入,科学家和算法工程师有可能可以利用这些信息构建适合于中国人的身高预测模型,通过基因数据推断个人的身高情况。
另外,研究小组对怀孕年龄和双胎怀孕两个表型进行了深入分析,发现了两个与怀孕年龄显著相关的基因位点,暗示着这两个位点的突变与生育力密切关联;与此同时,还在NRG1基因中发现了一个和双胞胎妊娠显著相关的突变位点,也就是说携带NRG1基因的突变,有更高的几率怀上双胞胎。
研究小组还首次全面揭示了全国31个省级行政单位的人群病毒感染发生率以及病毒在血浆中丰度的分布。
研究发现,中国人血浆的病毒组与欧洲人存在比较大的差异,比如,在欧洲人群中排名前两位的分别是与皮肤急疹相关的疱疹病毒7型及与鼻咽癌相关的疱疹病毒4型,而在我国人群中排在首位的则是乙肝病毒,其感染发生率大约为2.5%。
此外,在分析病毒易感性和基因型之间的关系时,在MOV10L1与MLC的基因区域首次发现了一个与疱疹病毒6型易感性极显著相关的基因突变。疱疹病毒6型可引发幼儿丘疹,另外也可导致中枢神经系统症状,最新的研究还发现疱疹病毒6型的感染与阿兹海默症(老年痴呆症)显著相关。如果这个研究能够进一步得到证实,未来就有可能通过基因检测一个人是否容易感染疱疹病毒6型,从而间接推断其易感阿兹海默的几率。因此,这项结果对阿兹海默症的研究也有重要的参考价值。
▲ 血浆病毒谱分析
华大生命科学研究院院长、文章第一通讯作者徐讯介绍,华大在2016年正式发起“百万人群基因大数据研究”项目,此次“万分之一”(14万是中国人口近14亿的万分之一)的研究项目是第一期成果。
“万分之一”意味着什么?徐讯在接受记者采访时表示,在“国际千人组基因计划”中,项目三期完成对2504人进行基因测序,但仅有301名中国人参与其中,目前药物开发研究、诊断研究,大部分是基于白种人的数据,这是为什么中国的医药和健康领域长期依赖进口的技术,以及发现很多药到中国不见得那么管用的原因。
“此次研究成果填补了大规模中国人基因组学研究领域的众多空白,是实现未来产业突破迈出的第一步。”徐迅认为研究成果还将助力精准医学,为出生缺陷、肿瘤诊治、传染病防控研究提供基础数据。
文章的共同通讯作者金鑫博士指出,这是高水平国际学术期刊首次认同在其发表基因组学文章所使用的数据仅需保存于深圳国家基因库,而无需向国际三大数据库备份。“数据在中国,接触数据的团队都是中国的科学团队。”
徐讯和金鑫表示,目前中国大规模人类基因组研究水平可以与国际比肩,欧美国家稍微领先。他们相信,未来三年,研究小组将迈向“千分之一”,做到100万人群基因大数据研究,那时将会达到国际领先水平。
内容来源:央视、华大基因、深圳商报
整合编辑 | 南方科技大学技术转移中心
一图了解
全球最大规模的中国人基因组学大数据研究成果
关于深圳的一切,关注深圳城市、精神生长!
我们的使命是:星辰大海,只与梦想者同行!
拥有深圳梦,请关注(微信号ID:SZeverything)
欢迎来稿,合作,畅谈深圳梦,邮箱至:SZeverything@qq.com