查看原文
其他

测得了万年化石,又何惧陈年FFPE

郑小乐 华大科技BGITech 2019-05-10

从化石样本中获取的古DNA由于经历了长时间的水解、氧化作用及环境微生物降解作用等而严重破坏[1],其核DNA片段一般不超过150bp[2]。而残存的片段内部还有许多单链缺口、碱基转换和碱基脱落等各种问题[3][4]使得化石测序成为一大难题。


华大基因联合丹麦哥本哈根大学、丹麦技术大学等开展了一项在BGISEQ-500和市面上其他测序平台间进行14000年前的古基因组比较研究,结果表明BGISEQ-500具有更高的文库复杂度,在古DNA的测序准确性上略胜一筹[5]


FFPE(福尔马林固定石蜡包埋,Formalin-Fixed and Paraffin-Embedded)样本虽然远不像化石样本那样经历过沧海桑田,但也存在类似古DNA研究的问题:


1. DNA质量差[6][8],测序Reads比对质量较低;


2. 福尔马林固定剂使得磷酸二酯键水解,导致不同程度的DNA断裂[7],文库片段偏小[8]


3. 比现代样本具有更高的duplicates,测序深度低且覆盖度低[8]


4. 福尔马林与任一链上的胞嘧啶核苷酸交联可导致腺嘌呤取代鸟嘌呤,导致人为引入C> T或G> A突变[7][9]


尽管如此,FFPE样本仍是目前医学领域和疾病诊断中的重要样本来源,能够为医学及药物研究提供精确和有效的病理信息。该类保存多年的疾病样本大多时候也无法进行重新采样,所以十分珍贵。华大BGISEQ平台测得了万年化石,又何惧陈年FFPE?快来看下FFPE在BGISEQ测序平台上的数据表现!


建库成功率高


从万例BGISEQ平台人全基因组重测序(WGS)测序数据中,随机统计了1,355个样本的下机数据,其中包含FFPE、血液、唾液等样本。常规基因组建库测序成功率为99%, FFPE样本建库测序成功率也在90%以上。


图1 BGISEQ WGS不同类型样品交付成功率


Duplicate比率低


为了便于评估,选用Horizon FFPE标准品GM24385样本对BGISEQ平台不同起始量200ng、500ng、1000ng及X测序平台起始量1000ng的样本平行测序,并进行重复。结果显示BGISEQ平台的duplicates仅为3%左右,而对于X测序平台来说,需要多测将近20%的数据量,来得到相同的有效测序深度(过滤、比对去重后)。


图2 主流二代测序平台上不同起始量的同一FFPE标准品duplicate比率


覆盖度高


在相同的有效测序深度下,BGISEQ平台不同起始量(200ng、500ng、1000ng)的10X以上覆盖率远远高于某测序平台的1000ng起始量的结果。


图3 主流二代测序平台上不同起始量的同一FFPE标准品覆盖度


覆盖均一性好


单碱基测序深度分布图和累积测序深度分布图显示,BGISEQ平台的FFPE样本测序深度均一性好,且不同梯度的起始量和重复均有较好的一致性。


图4 主流二代测序平台上不同起始量的同一FFPE标准品单碱基测序深度分布

单碱基测序深度分布图:可以从两点来看,第一、分布图符合正态分布;第二、峰越高越集中越好,峰值代表平均测序深度,越高越集中代表接近平均测序深度的碱基越多,测序均一性越好。 X轴表示测序深度,Y轴表示具有对应测序深度的目标区域的比例。


图5 主流二代测序平台上不同起始量的同一FFPE标准品累积测序深度分布

累计测序深度分布图:是单碱基测序深度分布的另一种展现形式,展示基因组上的覆盖率。X轴表示测序深度,Y轴表示达到对应测序深度及以上的基因组区域比例,峰下降的越平缓,代表基因组上覆盖的均一性越好。


变异精准度和敏感度高


FFPE标准品的SNP和InDel的精准度(Precision)和敏感度(Sensitivity)高,意味着BGISEQ平台检测发现变异的能力更强,并且结果中为真的突变的概率也高。


图6 主流二代测序平台上不同起始量的同一FFPE标准品SNP精准度和敏感度


图7 主流二代测序平台上不同起始量的同一FFPE标准品InDel精准度和敏感度


Sensitivity:灵敏度,又叫真阳性率(TPR),计算公式:灵敏度=真阳性/(真阳性+假阴性)。是指实际为阳性的样本中,判断为阳性的比例。例如,真正突变中,被判断为有突变的比例,它反映筛检发现变异的能力,灵敏度越高,假阴性越低。


Precision:精准度,也叫阳性预测值(PPV),计算公式:精准度=真阳性/(真阳性+假阳性),指筛检试验检出的全部阳性变异中,真正“变异”的例数(真阳性)所占的比例,反映筛检变异结果阳性中为真的突变的可能性,精准度越高,假阳性越低。


GC bias小


数据以100个碱基的大小为窗口,作GC含量分布图,结果越接近中间1.0的横线,表明覆盖深度越均一,GC bias越小。从下图5可以看到,BGISEQ平台的GC含量偏向性较小。


图8 8个FFPE测试样品GC含量分布图


*上述分析结果由华大信息分析流程所得,本结果不代表交付指标,最终解释权归深圳华大基因股份有限公司所有


FFPE样本的质量情况跟样本的年限,降解程度息息相关,并且不同的样本的情况也是千差万别,如此变化莫测的珍贵样本,且测且珍惜,华大BGISEQ测序平台给您不二的选择!



参考文献

1. Wandeler P, Smith S, Morin PA, Pettifor RA, Funk SM (2003) Patterns of nuclear DNA Degeneration over time-a case study in historic teeth samples. Mol Ecol 12:1087-1093.


2. Pääbo S, Higuchi RG, Wilson AC (1989) Aneient DNA and the polymerase chain reaction. The emerging field of molecular archaeology. J Biol Chem 264:9709-9712.


3. Greer S, Zamenhof S (1962) Studies on depurination of DNA by heat. J Mol Biol 4:123-141.


4. Poinar HN (2002) The genetic secrets some fossils hold. Acc Chem Res 35:676-684.


5. Mak S S T, Gopalakrishnan S, Carøe C, et al. Comparative performance of the BGISEQ-500 vs Illumina HiSeq2500 sequencing platforms for palaeogenomic sequencing[J]. GigaScience, 2017, 6(8):1.


6. Bonfiglio S, Vanni I, Rossella V, et al. Performance comparison of two commercial human whole-exome capture systems on formalin-fixed paraffin-embedded lung adenocarcinoma samples[J]. Bmc Cancer, 2016, 16(1):692.


7. Srinivasan M, Sedmak D, Jewell S. Effect of fixatives and tissue processing on the content and integrity of nucleic acids. The American journal of pathology. 2002;161:1961–1971.


8. Carrick D M, Mehaffey M G, Sachs M C, et al. Robustness of Next Generation Sequencing on Older Formalin-Fixed Paraffin-Embedded Tissue[J]. Plos One, 2015, 10(7):e0127353.


9. Williams C, Ponten F, Moberg C, Soderkvist P, Uhlen M, Ponten J, Sitbon G, Lundeberg J. A high frequency of sequence alterations is due to formalin fixation of archival specimens. The American journal of pathology. 1999;155:1467–1471. 


撰稿:郑小乐

编辑:市场部



猜你喜欢

玩转14000年前古基因组 | BGISEQ-500 WGS版盗墓笔记


近期热文

星光熠熠!诺奖得主、华人神探、知名教授都来为“她”庆生!

华大携手美三大顶尖机构,将有啥大动作?

分析+案例,免疫组库发高分!

动植物重测序40元/G,大样本不犯愁




请继续关注“华大科技BGITech”公众号,

科技君将一如既往地为您提供精彩内容!

如有相关问题,欢迎后台留言~~

关注华大科技,尽享精彩科研!

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存