十年后最贵的奢侈品
帮您先一步看见未来
基因慧
关键词/群体基因组 文/Haya@基因慧
图1:人(来源/UK Biobank)
十年后的最贵奢侈品是什么?有人可能会猜健康。这里我们谈每个人现在就拥有的。为了这样奢侈品,英国今天宣布投入2亿英镑,50万志愿者参与,加工这样奢侈品的工具等价劳斯莱斯。是什么样的奢侈品,和我有什么关系?基因慧邀请英特尔医疗、中科院北京基因组所、神州医疗、Congenica和GeneDock的行家们一起和你聊聊。
一、存储最贵奢侈品的生物银行
故事开始于14年前(2005年)。
Rory Collins教授对大规模人群的常见病预防和治疗颇有研究,在牛津大学临床实验中心和流行病学研究中心(CTSU)做联席主任,有一天被英国卫生部叫去,说:
有一个新项目,你去当负责人(PI),启动资金6200万英镑。
Rory Collins教授就从牛津搬到大曼彻斯特,一年后成立了一家有限公司(慈善机构)。这家公司在英格兰、威尔士和苏格兰三地注册。从此,Rory Collins教授的人生轨迹改变了,这家机构不止影响着他一个人,包括后来的50万人、未来的50亿人以及不计其数的生物。
它的名字是:英国生物银行(UK Biobank)。
图2:Rory Collins(来源/Science)
英国生物银行的成立
英国生物银行(UK Biobank,简称UKB)是英国的一家慈善机构,从事大型、长期的生物库研究,主要研究遗传易感性和环境因素对疾病发展的影响。 它始于2006年,由英国卫生部、医学研究委员会、苏格兰执行委员会和Wellcome Trust医学研究慈善机构和西北地区发展局共同创立。UKB由国家健康服务中心(NHS)提供支持,接受包括威尔士政府、英国心脏基金会、英国癌症研究、英国糖尿病协会的基金支持,以及药企支持(见下文)。
招募志愿者
从2006年起,英国生物银行通过英国国民健康服务中心招募志愿者,工作人员被要求邀请“任何你能说服的人”参与,包括富有和贫困人口、多种族多地区人口等。截止2010年,共有503,316位、年龄范围为40至69岁、居住在各地评估中心的25英里范围的志愿者参与。
生物银行存什么?
研究人员抽取志愿者的血液和尿液,调查他们的生活习惯,并通过仪器等检查2400多种不同的特征或表型,包括身体体能、医学影像、饮食等生活方式、认知状态、社交等方面数据。通过平行进行的不同队列研究,截止2010年一共获得486,019人的生物样本数据。
有什么用?
来自牛津大学的项目首席流行病学家Naomi Allen表示,“我们希望给研究者创造一个公平的竞争环境”。比如,他们给出3周时间让研究人员来下载数据加密文件。然后在同一天(2017年7月19日)发布最终加密密钥。
在发布数据后的很短时间内,一个美国小组分析出超过120,000种遗传标记与超过2000种疾病和特征关联,Broad研究所的总裁兼主任、人类遗传学家Eric Lander说,以前只有60,000个标记与疾病有关,在一周内翻了一番。
除了情怀和科研,在实际生产中如何?我们听听全球前三的药企葛兰素史克(GSK)的数据:2016年,GSK的新药靶点有超过60%包含遗传标记的证据支持。
这只是故事的开始。
二、2亿英镑,50万人参与,4大药厂注资
如果说以上信息可能因为饱含情怀、生涩的术语和看似夸大的机构名称,让人感觉不接地气。那么,经过13年积累后的今天(北京时间2019年9月12日),英国生物银行宣布获得2亿英镑投资,50万人全基因组测序,四大药厂参与,连为此项目做基因测序服务的公司股价上涨4个百分点(市值增加11亿美元),可以让工业界以及投资界对这个项目以及所在的行业重新认识:
2亿英镑的投入到英国生物银行
英国政府主管研究与创新的职能机构UKRI和Wellcome Trust信托基金会分别注入5000万英镑。安进(Amgen)、阿斯利康(AstraZeneca)、葛兰素史克(GSK)以及强生(J&J)四家制药公司共投入1亿英镑。
2亿英镑用于做什么?
对英国生物银行的50万名参与者进行全基因组测序。之前项目有对部分参与者进行局部测序或基因位点芯片分析,而全基因组测序是对30亿个位点,约25000多个基因全部测序(截止到2019年9月4日,共测得820,967个位点)。
项目的参与服务机构
1)测序生产平台:Illumina(Nasdq:ILMN)
(注:按照公布的投入金额及人数,平均每个参与者的测序费用是3140元,这低于目前全基因组测序的成本,但仍高于我国2016年启动的精准医学队列研究的平均每人的测序费用。二者均需以其他方式筹措资金)
2)测序服务机构:Wellcome Sanger Institute 以及deCODE Genetics。
(注:前者是英国乃至全球最知名的遗传学中心,负责22.5万例样本测序,后者是为冰岛全国人口进行测序的老牌基因公司,后来被分拆卖给Amgen,详情见历史文章)
项目计划
1)试点:Wellcome Sanger Institute率先完成了10%,即50,000人的全基因组测序的试点项目。
2)分批完成:剩下90%,分两批完成,第一批12.5万人全基因组信息预计在2021年春季供所有研究人员访问,届时试点项目的5万人数据也将同步开放。第二批预计将于2021年夏天完成。
3)数据开放:整个英国生物样本库志愿者的全基因组测序数据预计将在2023年初全部开放。值得注意的是,该项目的产业合作伙伴将在前9个月的时间内优先获取数据资源,之后的数据申请需通过相关准入委员会的协议进行。此外,基因分型数据和外显子数据分别在2015年3月和2019年3月陆续开放。
项目整体时间表见图2。
图3:英国生物银行的路线图(来源/Science)
三、英国生物银行对我们的启示
在长达20余年的规划里,生物银行的意义,除了“存数据”,更多地是为了实现精准医学。其中的价值衡量,可以看下面一组数据。
2016年,英国医学研究委员会(MRC)、Wellcome Trust和英国心脏基金会(BHF)合作耗资4300万英镑对英国生物银行的100,000名参与者的大脑,心脏,骨骼,颈动脉和腹部脂肪进行成像。
2018年,研究人员通过来自英国生物银行的脑图像以及基因组数据,发现与精神分裂症、抑郁症等精神障碍有关,以及与帕金森病或阿尔茨海默病等神经退行性疾病有关的基因,有望未来它可以帮助早期诊断[11]。
直接面向消费者的基因检测公司23andMe与14家公司签署了合作协议。其中包括与药企Genentech合作,允许其对帕金森病患者的基因组测序数据进行分析,合作金额为6000万美元。
正如英特尔医疗与生命科学事业部负责人李健接受基因慧采访表示,四大医药巨头参与到国家级精准医学研究中来,无疑证明了精准医疗方向的准确性和前瞻性。
在商业层面,生物银行的价值核心是形成医疗健康的循证证据链。从科研转化应用,药厂的参与很重要,前阿里巴巴友盟首席数据科学家、GeneDock创始人李厦戎认为,能够让项目设计以终为始,从数据在临床、药物研发转化价值的角度,去探索大型队列的组织和执行方式,让数据大而有用。Congenica 中国总经理李辉辉补充到,历史上像PCSK9这样的药物靶点的发现也都得益于基因组方面的投入。首个PCSK9降脂新药Repatha的2018年收入增长率超过72%,已在中国获批上市。
从询证的角度,用于靶点发现的数据需要保持完整性,包括同一类型数据的密度、多组学及多维数据(基因组、表型组、真实世界大数据等)的整合,这点比数据量的大小更重要。同时,由罕见病的单基因致病模式逐渐过渡到多基因累积致病模式,也反映了现在基因组学研究的一个方向,由诊断逐渐过渡到预防。李健补充道。
同时,这类长周期、大投入的基础研究,需要技术、产业和金融的协作,通过产业链整合形成产业集群才能可持续实现转化。在投资方面,李健认为,未来10年基因组研究将会由国家主导投资基础研究为主,逐步走向企业以应用价值(例如疾病诊疗、农业育种、传染病防治、肿瘤治疗等)为导向来主导,政府和资本更多起支持作用。李辉辉表示赞同,英国政府在临床基因组应用及生物样本库方面的投资也得到了很好的回报,英国在基因行业的地位逐渐凸显,这不仅促进了研究转化应用的进程,而且吸引了全球的注意力及对英投资。
在行业层面,生物银行的字面意思是生命信息存储,而前端的生命精细采集(测序、生物芯片、质谱、PCR等技术获得)、之后的生物信息数据分析解读以及终端的转化应用都缺一不可,因此转化的前提是完整产业链。而当前产业链雏形初备但类似我国仍缺乏类似完整和开放的体系(目前类似的包括深圳国家基因库、中科院北京基因组所GSA等)的原因是,缺乏重资产建立区域中心的产业集群,从而整合样本、数据、解读、转化等软硬件综合庞大的资源。此外,其中数据安全和隐私(本文限于篇幅未作展开)是大众及监管层敏感、技术尚不能完成解决的关键,因此有通过权威、务实的学会及联盟建立信用体系,协助监管层平衡发展及风险,赋能大众科学认知的必要性。
神州医疗联合创始人兼首席医学信息官弓孟春博士表示,由具有公信力的机构主导大规模临床表型及生物组学信息的汇交平台,是有效保障。特别是通过信息技术的创新和实践,对多组学数据汇交后脱敏与再识别风险的量化评价建立公认的技术体系、对联盟运算、差分隐私等新技术的应用。我国生物银行平台建设,关键在于高质量、全面、标准化的表型数据的采集系统,以及基因组学测序数据的高标准的质控系统。
在监管层面,在药厂基于基因群体数据挖掘新药靶点等商业价值基础上,群体基因数据构成的生物银行,对于公共卫生安全的监测、出生缺陷的防控、重大疾病的预防和治疗等在时间节点迁移、成本控制等不言而喻。同时,也包括司法安全等。
1997年开始的人类遗传资源管理条例在2019年以国务院名义颁布后,重申了其国家战略资源的意义,而同时也需意识到,数据只有在开放共享中形成标准以及转化,因此平衡数据利用和数据安全的监管政策,是当务之急。否则将面临投入数十亿元换来囤积的“大数据”,离产业转化还有“大距离”。
这些医药巨头在处理基因组数据和病患隐私方面,有着多年医药行业的积累和最佳实践,英特尔医疗与生命科学事业部负责人李健表示,这些是传统的高校、研究机构或者大多数互联网、云计算公司所不具备的。HIPAA和 GDPR等法规的严格约束,更能确保这些项目安全隐私方面的监管和有效控制。我们已经见证了先知先觉的IT巨头如亚马逊、谷歌、阿里云、英特尔、IBM、Dell、浪潮等在这个领域的持续大量投入;我们也相信传统医药巨头以及投资机构等的大举投入,无疑会带来精准医疗行业新一轮的创新和应用浪潮。避免出现基因组领域基础研究火热,而转化应用冷冷清清的局面。
同时,基因慧认为,在权威机构和巨额投资金额面前,仍需要保持客观、全面的认知。
例如英国生物银行的焦点是北欧人群,这也成为它最大的弊端之一,因为其中只有4%(2万人)的人口是亚洲人或有亚洲血统。曾经轰动一时的胚胎基因编辑事件,正是与UK Biobank报道了关于CCR5基因的研究成果有关,美国国立研究所的分子免疫学家Philip Murphy后来指出这项研究是有局限的,因为他只包括了年龄在41岁以上的人,也排除了早年逝世或生病的人。
除此之外,在上文提到的生物数据隐私同时,整个人群的生物数据安全,是双刃剑,需要开发利用同时进行有序的保护。类似于互联网,已经影响到我们的方方面面,在发生问题时,不因噎废食,在头部机构、行业学会联盟、大众及监管机构的推动下,学习类似HIPAAA、GDPR相关数据保护条例,同时学习“Blue Button”计划等的有序共享。
面向未来,学习国际经验,我国在基因及生命健康领域有着极佳的从并跑到领跑的窗口期。
Congenica 中国总经理李辉辉认为,通过国家政府主导建立相应的人群参考基因组及人群基因频率数据库是很有必要的一项基础工作。同时这些群体基因组研究大都围绕罕见病及癌症等两方面展开,也是作为全基因组检测进入临床应用及卫生体系的一个概念验证和机制建设。英国十万人基因组计划逐渐进入尾声,但是围绕十万人基因变异数据库的商业化开发和应用才刚刚开始不断加强和产业的合作,最大化项目所积累的数据资源及价值。
在我国的基因等前沿生物技术领域,诞生了类似华大智造自主研发基因信息上游设备机构,走向英国的迈瑞等知名第三方检测机构,以及吸引到回国创业的基因编辑优质创新团队启菡生物等,也可以看到基因级生命健康大数据的采集、分析、解读和应用的产业链雏形初备,而各地方产业园的产业集群建设正吸引相应人才和资本。而且,在当前科技创新、产业升级以及民生大健康需求下,长周期、大投入的基础研究正在积累。
例如,我国自2016年也启动了为其3-5年“精准医学研究”国家重点专项,包括近百万人口的包括基因、专病及地区的人群队列研究。谈到这个系列项目时,中国科学院北京基因组研究所研究员方向东对基因表示,目前百万自然队列建立基本完成,2-3年一次、随访2次以上的超过3/4 ,有基因信息的20%。包括食管癌、肺癌、慢阻肺、心血管病等队列超过50万人口,而包含基因数据的样本量不多。
除了“精准医学研究”等国家重点专项,我国十万人基因组计划也正在进行,并且以此和产业园等实体结合,未来仍需至少长期基础研究和转化投入,而无论民生健康还是新药生产,都留给生物大数据产学研协作者广袤的空间,在云计算和5G等大数据技术加持下,至少有10年的黄金时期。
参考资料:
1)http://www.ukbiobank.ac.uk/about-biobank-uk
2)https://www.sanger.ac.uk/news/view/500000-whole-human-genomes-will-be-game-changer-research-human-diseases
3) http://sitn.hms.harvard.edu/flash/2019/from-genes-to-disease-the-release-of-the-uk-biobank
4) https://www.ukbiobank.ac.uk/2019/09/uk-biobank-leads-the-way-in-genetics-research-to-tackle-chronic-diseases-2
5) http://www.nealelab.is/uk-biobank
6) https://www.maelstrom-research.org/mica/individual-study/ukb
7) https://www.sciencemag.org/news/2019/01/huge-trove-british-biodata-unlocking-secrets-depression-sexual-orientation-and-more?et_cid=2581485&et_rid=396464808
8)https://www.ukbiobank.ac.uk/rory-collins
9)https://www.nature.com/articles/d41586-019-01739-w
10)https://www.marketwatch.com/press-release/uk-biobank-regeneron-and-gsk-announce-largest-gene-sequencing-initiative-on-worlds-most-detailed-health-database-to-improve-drug-discovery-and-disease-diagnosis-2017-03-22
11) https://www.nature.com/articles/s41586-018-0571-7#Sec7
(封面图来源:UK Biobank)
声明:以上行业资讯或分析文章,仅代表个人观点,仅供研究参考,不作为投融资及医疗等决策依据;知识版权属于基因慧,机构转载请征得基因慧书面同意后,在文章首行署名转载出处及作者,欢迎个人转发至朋友圈及群分享。
拓展阅读
加入基因慧读者群或合作
添加微信 jiyinhui_1
口令:单位-职位-姓名(通过后赐名片)
【关于基因慧】
基因慧是一家基因和数字生命健康产业咨询机构,基于十年产业实践,建立了行业智库和企业库YourMap以及传媒平台,提供专业的咨询、品牌及信息服务,帮助合作伙伴洞察市场,先一步看见未来。
【行业认可】
☆ 国家发改委《2019年战略性新兴产业发展及展望》编委
☆ 全国卫生产业企业管理协会精准医疗分会理事单位
☆ 中国遗传学会生物产业促进委员会委员
☆ 广东省精准医疗应用学会政策研究应用分会、遗传病分会常委单位
☆ 参与组织并发布《基因检测报告标准和规范共识》及团体标准
☆ 发布业内首份权威的《基因行业报告》
☆ 第九届中国深圳创新创业大赛盐田区决策评委
☆ 基因检测联盟(筹)创始发起单位,组织第一届、第二届联盟会议
☆ 建立了国内首个基因和数字生命健康行业数据库YourMap
☆ 主办首届数字健康私董会、首届粤港澳大湾区生命健康创新论坛
☆ “十三五”重点出版工程图书《临床生物样本库的探索与实践》编委
☆ 上海交通大学精准医疗EMBA协作单位
☆ 2018深圳国际生物/生命健康产业展览会协办单位(深圳市政府主办)
欢迎行业学会联盟、园区、金融以及产业等机构合作。赋能产业价值创造和跨界融合发展。
▼ 点击”阅读原文“,查看基因慧的精选产业研究。