肿瘤与循环中的细胞异质性研究以改善预后
本研究来自于新加坡国立大学综合科学与工程研究所。
意义
肿瘤内异质性(ITH)用来确定和追踪癌症一直是人们越来越感兴趣的话题。然而,ITH对风险预测的临床后果仍不清楚。在这里,我们展示了ITH导致的患者分类差异,并认为在非小细胞肺癌(NSCLC)中进行单个组织的预后多基因检测(MGTs)时, 应考虑单个基因的ITH水平。对富集的患者循环肿瘤细胞(CTCs)的单细胞分子分析进一步揭示了转移风险预测的生物标志物。通过对转移谱的多个步骤所涉及的基因的系统分析,我们证明了改进的生物标志物在识别NSCLC高危复发的早期疾病患者方面达到了更高的准确性。
背景
新兴的多区域测序数据贡献了大量吸烟白种人肺癌基因组,为瘤内异质性(ITH)提供了明确的证据。最近,我们观察到一个带有拷贝数多变和早期多样的复杂的亚洲非小细胞肺癌(NSCLC)基因组,尽管肿瘤突变负荷比较低。这种ITH在多分子水平上的临床反应在其他癌症类型中也比较明显,表明ITH导致的差异可能导致患者的错误分类。然而,目前的多基因检测 (MGT)没有考虑到ITH的特征,包括2个基于基因表达的肺癌患者的多基因测试(MGTs)方法也是一样。
通过将多基因分类器应用于多区域数据分析,我们首先描述了转录ITH,并检查了NSCLC患者因ITH被错误分类的程度。该分类器被称为肿瘤母细胞瘤指数(TMI),其在2000多例早期NSCLC患者的预后和辅助化疗反应中的预测价值是已被证实的。从本质上讲,TMI是根据29个母细胞瘤基因的表达水平计算的,主要编码非核心母细胞瘤蛋白, 包括细胞外基质(ECM) 调节因子(MMP12 、MMP1 、ADAMTS5) 、 ECM 关联蛋白(GREM1 、 SFTPC 、 SFTPA2 、 SFTPD 、FCN3)、分泌因子(S100A2 、CXCL13 、WIF1 、CHRDL1 、CXCL2 、IL6、HHIP,和其他与ECM相关的成分(LPL、CPB2、MAMDC2、CD36)以及核心基质分子, 包括胶原(COL11A1 、COL10A1 、COL6A6) 和ECM糖蛋白(SPP1、CTHRC1、TNNC1、ABI3BP、PCOLCE2),所有与配对的非癌组织相比,NSCLC中的差异表达更多。这里我们发现,尽管TMI仍然是一个有效的预后预测因子,但大量TMI基因显示出非常多的ITH,并导致同一肿瘤内不一致的分类(同时有TMI低 和 TMI高的扇区),表明需要根据ITH 和患者间异质性(IPH)的水平重建实际基因本身的基因标志物,如最近提出的乳腺癌MGTs。我们假设在原发肿瘤侵袭过程中观察到的伴肿瘤进展的异常母细胞瘤表达模式也可能被证明是有用的,可以反映在后期的转移步骤中,如在循环过程中。因此,除了多区域原发肿瘤组织,我们评估了循环肿瘤细胞(CTCs),以获得这项工作中预后TMI标志物的肿瘤内表型变异。
这种方法被最近比较热门的单细胞测序研究进一步推进,表明时空异质CTCs可以为各种恶性肿瘤的转移疾病在基因组和转录水平提供一个全面的切入面。虽然单个肿瘤活检可能并不总是代表含有空间分离克隆的整个肿瘤,但CTCs的空间和时间变异可能会再现原发性和转移性癌症中的基因表达和通路。我们进一步使用单细胞,而不是一群细胞,分析排除可能的白细胞污染,这在转录研究时是特别明显的,激活的白细胞同时过度表达癌症相关基因,以及上皮-间充质转化(EMT)和干细胞的标志物,给与他们间叶细胞样和造血性质,CTC特异性转录本表达分析复杂化。单细胞分析可以进一步评估表达预后的MAT-MAD标志物在细胞间的变异是否会在患者中根据临床特征和疾病状况而有所不同。虽然大规模CTC分析有明显的局限性,单个CTC进行分离和分子表征的通用工作流程是非常缺乏的,因为可检测和完整的CTC非常少,而且存在相关的技术挑战。我们小组最近开发了一个集成的ClearCellFX和微流控平台工作流程,以便1) 测量来自单个患者来源的CTCs全长mRNA转录组,2)检测在匹配的原发肿瘤中发现的显性突变。在这两项研究中,高质量的测序性能指标证明了ClearCellFX富集CTCs保持了遗传完整性,证明了将无标签、不依赖标记的微流控技术用于下游分子分析和功能研究的可行性。最近在不同的外部实验室进行的单细胞测序研究进一步证实,从DEPArray技术或微操作器分离的ClearCellFX富集CTCs中提取的DNA经过全基因组扩增(WGA)是高质量的,适合测序的,显示ClearCellFXFX系统的稳定性。
在这里,我们使用同样的微流控方法来开发一个综合工作流程,用于患者来源的CTCs的单细胞基因表达分析。对61个循环肿瘤细胞(CTCs)的单细胞转录分析确定了转移性NSCLC和非转移性NSCLC的特异基因,提供了可能作为预测癌症复发的转移相关生物标志物。通过系统的计算机验证,在总共2748个病人来源的样本,我们开发了一个新的专门针对单个CTC衍生标志物ITH水平的风险模型,在预测基于组织的无复发生存时间(RFS)方面具有强大的预后能力,并认为这种方法可能取代以前确定早期疾病患者中高复发风险的NSCLC的那些尝试。
结果
为了研究ITH对风险预测的影响,我们使用预后TMI基因panel分析了来自外科标本(每个肿瘤3或4个区域)的多区域基因表达谱,这些多区域基因表达谱来自最近发表的2项研究(方法),我们称之为研究1和2。由于样本分别在研究1和研究2中注明疾病状态(肿瘤或正常)和无复发生存率,我们首先检查了TMI的诊断和预后准确性。在研究1中,TMI在鉴别正常和肿瘤样本方面取得了非常好的诊断准确性,该区域由20个早期NSCLC肿瘤和20 个配对的正常肺组织组成(图1A),其中灵敏度、特异性和受试者操作特征(ROC)曲线(AUC)下的面积均100%(图1B)。为了测试TMI的预后表现,基于最优界限指数(图1C),我们接下来在研究2 中将10例NSCLC患者的35个扇区分成TMI低 和TMI高两组,用于无复发生存时间(RFS)分析(图1D)。在这个小的患者队列中,模型预测的复发肿瘤的生存结果明显恶化,表明TMI对RFS预测具有稳健的预测价值(图1D)。尽管样本量很小,但我们利用每个患者的最高指数进一步评估了患者水平的TMI,并观察到6个中的1个 (16.7%) TMi低的病人以及4个中2 个 (50%) TMi 高病的人有复发,表明评分较差的部分足以造成不利的结果。
在验证了TMI在肿瘤区水平上的临床应用后,我们通过拟合线性混合效应模型(29)来计算每个MATI(matrisome)基因的ITH水平。在这两项研究中,在29个TMI基因中发现了明显的ITH表达,其中7 个基因(ADAMTS8、CD36、COL6A6、FCN3、IL6、SFTPD和WIF1)和8 个基因(ABI3BP、ADAMTS8、COL6A6,CPB2、FCN3、HHIP、LPL和OGN)在研究1和研究2中,分别都显示出ITH比IPH (interpatient heterogeneity,患者间的异质性)更大。 根据ITH的水平对基因进行分组,我们发现,高比例的基因(34.5%和41.4%)表现出中度(0.4至0.6)至高度的(0.6至1.0)ITH。事实上,当我们根据TMI对每个肿瘤区进行评分时,并应用通用界限指数对AffymetrixGPL570的风险分级,研究1中,35%的患者(20人中的7人)显示TMI低和TMI高的不一致的肿瘤样本。同样, 研究2中,如果早些时候 预后应用界限指数22.56 ,患者表现出明显的高方差TMI(σ2), 与 20%的病人 (2 的 10) 可能是错误分类的。值得注意的是,在研究2中使用最优的,而不是最普遍的界限指数,因为样品用非GPL570平台进行检测。虽然这些母细胞瘤基因的表达值在同一肿瘤内的不同区域之间普遍相关,但相关性在一些病人中比较弱, 包括研究2中的病人3 ,显示肿瘤微环境中显著高水平的ITH。参照有些早期的乳腺癌受试者,强调需要将ITH视为构建肺癌预后基因特征的决定因素。
图I. ITH驱动的肺癌患者分类错误。研究1中,非小细胞肺癌中TMI的密度分布(n=80),正常肺(n=20)。使用最佳TMI截止值的ROC曲线。(C)研究2中,肿瘤区TMI的高斯核密度分布(n=35)。(D)Kaplan-Meier生存曲线采用最佳截止值(95%CI= 1.4至22.7;log-rank P = 0.00628)。(E)TMI分布和TMI的方差(σ2)。研究1(Top)和研究2(Bottom)分别采用通用截止值和最优截止值进行患者分层。红色盒虚线代表与TMI不一致的肿瘤样本TMI低 和TMI高 区域。患者是通过平均TMI增序排列的。
接下来,我们检查了选择用于远处转移的原发肿瘤中的癌细胞是否进一步需要在循环过程中不同模式的MAT基因表达,从而可以作为转移或复发的预测因子。使用基于细胞力学的微流控装置,我们以前证明了一种基于大小的单肺CTCs分离,代表在匹配的块状NSCLC肿瘤中发现T790M/L858R突变,CD45+ 消减法到100%纯度。验证了设备性能(图2)之后,并用1%多聚甲醛(PFA)固定 A549 肺癌症细胞的mRNA转录本的完整性, 我们从20例亚洲NSCLC患者中分离和评估了61个CTCs,其中每个人7.5ml外周血分析的CTCs 数量小于5 个。如此低的CTC产量归因于单细胞基因组分析所需的高纯度分离,这与以前的研究 QC通过的肺 CTCs类似。
图2. 用于单细胞分析的微流体富集。惯性聚焦,无标签捕获单个癌细胞使用微流控装置。鞘流(甘油)对细胞流(A549肺腺癌)的水动力聚焦)。( 底部) 单个A549 细胞的亮场和免疫荧光图像。( 标尺, 100μm。)
初步筛选14个患者来源的CTCs中的3个候选管家基因,显示ACTB的异质性表达,因此被排除在随后的归一化之外。在被分析的29 个TMI基因中, 15 个(51.7%)可检测到表达,由此建立了最终的多基因panel。通过溶解曲线分析,开发并使用高灵敏多重PCR验证。为了探讨CTC群体内的异质性,我们进一步分离和分析了7个不同肺癌细胞系的24个单细胞。与正常肺组织相比,在原发性NSCLC肿瘤中上调的3个MAT基因的表达水平变化最大,而在肿瘤中下调基因的表达水平与癌细胞株相比,CTCs的变异性最小。
由于从两个不同的实验室收集和处理样品,观察到批次效应,使用信息学方法进行去除。批效应不应仅限于高通量组学数据,也存在于低维Q PCR。在处理了CTCs的表达数据后,我们接下来计算了每个患者TMI基因表达水平之间的Pearson相关系数(R),以评估细胞间异质性的程度(图3A)。有趣的是,我们发现非转移性疾病CTCs中TMI表达与转移性(M)疾病相比有一个显著较高的方差(σr2)(图3B)。这与我们早期在NSCLC肿瘤标本(研究1)中的观察一致,其中高危患者(最高四分位数)表现出明显低于其他患者的患者内TMI差异程度(图3C)。最近的一项研究实际上观察到,在EMT评分较低的NSCLC患者的EMT评分中,ITH水平相当高。总之,这些数据表明,在晚期癌症中稳定EMT相关的过程,可能有一个环境触发。我们假设,Matrisomal ITH的定量可能预测手术切除后的早期转移。
单个CTCs的转录特征鉴定了具有不同转移潜能的NSCLC中不同的基质蛋白谱, 提示了最近提出的CTC-自主ECM基因表达对癌症转移的潜在贡献。大多数CTCs表达高水平的肺泡II型上皮细胞标记物(SFTPC),反映了NSCLC常见的组织特异性起源。在先前在原发肿瘤中上调的9个基因中,与无肿瘤组织相比,4个基因(MMP1、MMP12、GREM1、CXCL13) 在转移性NSCLC的CTCs中高表达。在肿瘤标本和液体活检之间表现出保守的表达模式。因此,我们假设这些基因涉及多个步骤的转移表达谱可能作为临床上适用的生物标志物,以改善预后复发风险。考虑多区域分析数据和单CTC基因表达数据, 我们建议一种适合ITH水平的预后指标,称为MMPI指数(MMPI),由2-基因MMP标志物组成(方法)。
通过使用早期的多区域分析数据(研究1 和研究2),我们首先计算了TMI先前确定的具有不一致肿瘤区的患者样本指数的变异系数(CV),以评估改进的度量是否会解决ITH导致的肿瘤分类中不一致的问题。初始(TMi)和精制(MMPi)模型的平均CV为分别为0.115和0.081,这意味着这些样本中的CV减少了30%(图1. 4a)。
图3. 远距离转移或复发的潜在预测因素。Het-用平均Pearson相关系数(R)测量的15基因MATAL表达(±SD)在同一例有蓝色或无红色远距离转移(DM)的CTCs中的异质性。每个聚集条(右)表示分析的CTCs的数量。垂直红色虚线表示分析的CTCs的平均数量。(B和C) 在 (B) 液 体 活 检 和 (C) 肿 瘤 组 织 中 mat 基 因 表 达 的 内 在 变 异 性(***P<0.001和**P<0.01, Wilcoxon秩和检验)。(D)热图比较DM和非DM 患者组间选择的MAT基因的表达谱(***P<0.001 ,**P<0.01 , *P<0.05 , Wilcoxon秩和检验)。
虽然通用的截止值是用AffymetrixGPL570鉴定的,但我们最终将其应用于早期的研究2队列,该队列用Affymetrix基因芯片人类基因1.0ST阵列检测基因,以评估其在不同分析平台中的临床适用性。卡普兰-梅耶生存分析显示,21例中的2例(9.5%)MMPi低组、还有14例中的7例 (50%) MMPi高组已经复发了, 没有MMPi低 与 6例中的3例 (50%) MMPi高病人在患者水平上有复发,普遍临界值为1.441。总之,这些数据加强和强调了目前评分的广泛临床适用性指标和预定义的截止值,以更好地预测NSCLC复发风险。
讨论
对CTCs的单细胞分析揭示了临床上有用的拷贝数变异和点突变,同时解决了肺癌的异质性程度。不过,这些结果仅与上皮标记表达的CTCs相关,在去分化的EpCAM− 或间充质/EMT样CTCs,所有这些都与疾病进展和治疗反应密切相关。依靠无标签方法,我们找到了那个 转移性潜力的非小细胞肺癌肿瘤的异质性在于其在基质表达中的异质性,这反过来又反映在CTCs的群体中。与支持EMT对CTC表型的贡献的非排他性假设的结果一致,TMI高原发肿瘤中的细胞在功能上可能具有其在血流和转移灶形成中生存所需的关键特性,特别是考虑到MAT和EMT之间的密切联系。在最近的临床中,转移灶CTCs表达间充质属性、相关的观察研究重复出现及其异质性在器官特异性中的作用转移,进一步确定这些侵袭性细胞作为假定的转移性原癌的主要成分。
然而,现在很明显,未来转移到的器官,称为前转移灶(PMNs),不仅是CTCs的被动接收器,而且受到转移发生前肿瘤分泌或肿瘤脱落的细胞外囊泡(如外泌体)的主动调节。
图4. MMPi对NSCLC患者预后的改善。(A)在先前与TMI鉴定的不一致样本中指数的CV。病人ID和每个预后指标的平均CV。(B)MMPi在肿瘤区的高斯核密度分布(n=35。使用最佳截止值(95%CI=2.0至46.8;log-rank P=0.00062)的Kaplan-Meier生存曲线)。(D) 用相同的分析平台和通用截止值( 蓝色虚线) 检测数据集中描述MMPi分布的小提琴图)。(E-G)Kaplan- Meier 生存曲线采 用(E)GSE50081(95%CI=0.99 至 3.3 ;log-rank P=0.049 ;n=177),(F)GSE30219 (95%CI=1.0至2.4;log-rank P=0.0345;n=278)和(G)GSE31210(95% CI=1.3-4.3;log-rank P=0.00343;n=226)。
这种逐步进展的PMN的成熟调节因子是由原发肿瘤和非驻留细胞(如骨髓来源细胞[BMDC]、基质成纤维细胞和内皮细胞) 在局部PMN部位中释放的MMPs。基质金属蛋白酶的酶活性确实对血管完整性有直接的功能影响,其中在ECM降解过程中释放的生物活性ECM片段(例如趋化胶原IV肽)促进BMDC和CTCs向PMN 位点的募集。在这里,我们观察到细胞自主表达的ECM调节基因,特别是MMP1和MMP12,在转移性CTCs,提供了一个潜在的新的细胞参与重塑ECM在PMN位点。总的来说,我们的实验数据表明MMPi高 CTCs可能是携带自身“土壤”的PMN形成的积极来源, 突出了肿瘤基质信号在PMN 进化过程中的意义。
母细胞瘤异常是预测和预测免疫治疗反应的一个很有前途的生物标志物。TMI简介进一步反映了性别,但不反映种族差异。以前与NSCLC的患病率和预后有关。考虑到这些混杂因素的存在,对多元回归模型进行了拟合,并将TMI和MMPi作为复发和死亡率的独立预测因子。我们进一步认为,其他体液,如上皮衬液(ELF)可以作为替代术前来源的组织活检,提供了一个无创微采样探针,以检查预后TMI的标志物。我们的初步数据证实了TMI 在用ELF样本鉴别良性结节和恶性肿瘤方面所取得的高分类精度。支持在ELF中越来越公认的生化物质的临床价值,包括肿瘤标志物和肿瘤来源的核酸,作为原发性肺腺癌的诊断生物标志物。即使在慢性阻塞性肺疾病(COPD)和间质性肺病(ILD)等其他肺部疾病的分类中,良性结节也仍然是一个不可混淆的变量,验证了TMI性能的稳定性。然而,与TMI指标不同,TMI指标具有临床应用价值。对于少数基因中缺少表达数据的样本,MMPI将需要整个基因集, 因为用于构建检测的基因数量很少。未来的评估,建议的指标是否可以直接应用于FFPE标本后,手术切除后FFPE标本,定量与常规RT-qPCR 是必要的,以促进其纳入常规临床实践。
方法
研究1(GSE33532)的多个区域的基因表达谱的原始数据是通过R 中的GEO查询包从国家生物技术信息中心(NCBI)基因表达总括(GEO)存储 库 获 得 的 。数据的 预处理,如背景校正和调整, 是用RobustMultiArrayAverage(RMA)通过affy包进行的。在样本中具有较高平均表达的探针被比对到基因上。详细的描述,包括数据预处理技术和临床信息,研究2分析数据可以在开始的工作中找到。对于TCGA数据处理,使用R中的 TCGA-AssemblerR包进行后续处理,并使用Trimmed Mean of M-values (TMM)方法进行归一化。GEO数据集是为先前描述表达谱数据获取的,或者直接从NCBI GEO中处理(归一化)数据。
利用R中的lme4包通过线性计算每个mat基因的ITH水平混合效应分析如前所述。每个患者的TMI是通过使用29个MATI基因计算的, 如前面所描述的。用相同的Cox 回归系数计算MMPi :MMPi=(0.1102*MMP12 表达)+(0.07096*MMP1 表达)。生存分析的最优截止指数被定义为使用log-rank检验的最显著差异,并使用基于Web的截止查找算法(http://molpath.charite.de/cutoff)如上文所述。
本文中使用血液样本进行CTC分析的知情同意是通过Sing健康集中机构审查委员会批准的协议获得的。从招募的NSCLC患者中采集的全血样本(7.5mL)根据制造商手册(Biolidics)使用ClearCell FX System富集)。在用抗人CD45-PE(eBioscience)和Hoechst33342、三盐酸盐和三水合物(Life Technologies)染色前,用1%PFA固定富集样品)。样品的制备包括将富集的染色细胞添加到1mL注射器中,并将其耦合到微流控装置。该装置安装在显微镜(Olympus BX61)上,根据免疫荧光(CD45) 的检测由用户选择CTCs−。同样的原则被用来在capture chambers敲低WBCs(CD45+)。细胞流向鞘流率分别设定在10μL/min和30μL/min的恒定条件下,用2个注射器泵(ChemyxFusion200经典)实现)。相同参数用于肺癌细胞系。微流控装置通过使用高速相机(Photron Fastcam1024PC I)进行校准,确保细胞流动宽度在主通道中达到最大25μm,以方便细胞在单个槽中使用水动力聚焦推进。甘油65%(ThermoFisher Scientific)用于鞘缓冲液。微通道装置的基本设计由10个腔室组成,这些腔室阻止额外的细胞进入,一旦被占据,允许捕获和分离通道中的10个单个细胞。
回收的单个CTCs或癌细胞系被转移到0.2mLPC R管中, 并根据制造商的规格(Life Technologies) 使用Ambion单细胞裂解试剂盒进行RNA提取。在每个裂解样品中加入2.5μM寡聚(DT) 引物和0.5mMdNTP混合(Life Technologies),在65℃下孵育5m in,随后在冰上冷却至少1m in。Firststrand buffer(1×),5mM DTT,10U RNaseOutRecombinant RNase Inhibitor,50 U SuperScript III RT (Life Technologies) 加入最终体积20μL。将以下热设置应用于Veriti 96-well thermal cycler(Applied Biosystems) 的最终RT 产物:25℃ 5min , 55℃ 60min,85℃ 5min。在−20℃处储存cDNA。
将下列组分加入到不含核酸酶(NF水)0.2-mL离心管中制备多μM引物混合物(1μM:100μM正向基因引物1μL,100μM反向基因引物1个, NF水最多100μL。从单个细胞产生的cDNA模板(10μL)在20μL的总体积中预先扩增,其中含有1×PCRBIOUltra Mix (PCR Biosystems),、每个引物100nm和NF水。将以下热设置应用于PCR循环器:95℃ 10 分钟, 然后进行25 次扩增(95℃ 20s, 60℃ 1min,72℃ 20s),最后在72℃ 下进行7min的额外孵育。靶标扩增产物在使用AgencourtAMPure XP珠进行纯化之前被纯化,其比例为1:1.5,遵循制造商手册(BeckmanCoulter),在定量在60μL NF水中进行最终洗脱。
采用SYBR green I法在 Bio-Rad CFX96 实时PCR检测系统(BioRad Laboratories)实时进行qPCR。稀释后的RT产品(1μL)被添加到最终体积为10μL,包含每个引物( Integrated DNA Technologies)300nm,1×FastStart SYBR Green Master mix (Roche) 和NF水。进行溶解曲线分析,以确定单一峰的引物特异性。在RT-qPCR 循环器上应用以下热设置:95℃ 10min , 然后 40 个循环扩增(95℃ 20s, 55 ℃或60 ℃ 30s , 72℃ 20s), 最后在72℃下孵育7min。表达数据归一化为2 个管家基因(GADPH 和UBB) , 公式如下:相对表达=2−(Cq[感兴趣的基因]−平均Cq[管家基因])。每个实验都设置了重复。
本研究中使用的验证数据集可在NCBI GEO获得登录代码 GSE31210 、 GSE42127 、 GSE30219 、 GSE11969 、 GSE50081 、 GSE3141 、GSE37745、GSE41271、GSE68465、GSE26939,和GSE19188。我们的单细胞表达数据和执行PCA的R脚本可以在Figshare (https://doi.org/10.6084/m9.figshare.9202241.v1)。有关细胞培养、引物设计、多重基因面板和生物信息学的详细信息载于SI Appendix, SI Materials and Methods。
相关阅读
点击下方图片进入云平台资料汇总:
所见即所得,figure有bi格
联川云平台,让科研更自由