人肿瘤外显子测序常见的样本类型有新鲜组织、FFPE样本、血液等,目前国际上推荐肿瘤组织样本与正常细胞样本(实体瘤可选择外周血,血液系统肿瘤可选择唾液、口腔脱落细胞或皮肤组织等)配对检测,以排除遗传背景干扰,识别体细胞突变。
DNA的提取主要是将DNA与蛋白质、多糖、脂肪等生物大分子物质分开,在提取DNA是应遵循以下原则:保证DNA分子以及结构的完整性,去除其他分子污染。DNA提取一般包括细胞裂解、酶处理、核酸与其他生物大分子物质分离、核酸纯化等几个主要步骤。其中FFPE样本因经过甲醛固定、石蜡包埋处理,长时间存储等,提取出来的DNA片段常降解比较严重,DNA总量和纯度也比较低。
影响FFPE样本中DNA质量的因素有:
(1)甲醛使核酸与蛋白发生交联,影响核酸质量;
(2)甲醛可诱发DNA加合物的形成,导致氨基间形成亚甲基桥,抑制双链DNA变性,影响PCR扩增效率;
(3)可能出现脱氨基和脱嘧啶的位点(无碱基位点),模板链断裂,PCR扩增过程中碱基无法引入;
(4)磷酸二酯键水解(链断裂),DNA降解;
(5)胞嘧啶脱氨基,人工引入C>T和G>A变异,导致假阳性。
肿瘤全外显子检测测序中,文库构建应具有以下特点:高片段转化效率;低背景噪音;低污染水平;低偏好性。
片段转化效率是指最终能测到的文库片段数(不含PCR重复)占起始样本中DNA片段数的比例。文库是否理想的标准就是文库复杂度。文库复杂度越高,代表样本文库包含更多的样本原始信息,最终靶区域会获得更有效的测序数据覆盖。文库复杂度也称为文库丰度,由起始DNA量、DNA质量和片段转化效率决定。当起始DNA量相同,DNA质量接近时,片段转化效率越高意味着文库复杂度越高。所以在建库体系建立过程中应进行多个环节的评估和测试优化,保障较高的片段转化效率。
NGS检测过程中或多或少会引入碱基错误,如PCR过程错误碱基引入,测序仪不同碱基信号干扰带来碱基读取错误、高GC区域、同源或低复杂度的区域等。这些会给真实的低频突变检出带来很大的背景噪声干扰。文库构建过程中,通过对DNA片段两端加入独特的分子标签,保证来源于每一条原始DNA模板正反链的扩增片段都可以被标记,最大限度地过滤背景噪声。
文库构建过程中,通过PCR或接头给样本片段引入标签,如果检测过程中发生标签错配,或在生物信息分析过程中将一份样本数据拆分至另一样本中,都会造成样本交叉污染。在低频突变检测中,对样本交叉污染的控制显得尤为为重要。目前illumina测序平台采用的是ExAmp扩增方式,加上多样本混合上机很容易带来标签跳跃(index hopping),造成样本间交叉污染。建议使用双端index进行文库构建。通过双标签识别一个样本,降低样本交叉污染发生率。
选择合适的高保真酶并调整至合适的PCR扩增循环数,降低扩增偏好性。
在设计肿瘤相关的基因检测探针时,一般考虑检验项目的目的、检测成本、靶区域序列特点、临床意义等。捕获区域越大,意味着需要越大的数据量和越高的检测成本。目前Agilent、Roche、Twist等芯片厂家都推出了多个版本的全外显子检测芯片,比如只包含核心外显子区域30M左右的芯片,也有包含外显子区域及侧翼区域的60M左右的芯片,可根据检验目的及检测成本进行选择。此外,在探针设计时,一般会加入几十个不等的人群中杂合度较高的单核苷酸(SNP)位点作为后续实验中避免样本之间混淆的质控点。
作者:oct
编辑:angelica
往期精彩回顾
ATAC-seq / ChIP-seq问题盘点
生信人员怎么能让代码维护性更强呢?
三分钟看懂TMT技术 之实验篇
深入浅出介绍聚类分析
单细胞转录组测序知识一隅