查看原文
其他

血小板:功夫在生信之外

青山 生信人 2022-06-21
身边人在议论,为什么有的生信分析加了湿实验还是不被期刊认可,有的纯生信如今仍然可以在CNS占据一席之地?首先科学研究的意义就是解决科学问题,所以,提出的科学问题的水准,决定了研究的最终归宿,生信分析同理。本篇文献作者就具备发现和提出科研问题的能力,小编相信,该作者未来也会挖掘更多具有临床意义的生信文章。

下面让我们一起来看看这篇文献,文章名“A panel of platelet-associated circulating long non-coding RNAs as potential biomarkers for colorectal cancer“,10月投稿,12月发表在《Genomics》,影响因子5+。全文分析的数据来源,分别是利用高通量公开数据库测序数据,以及作者医院收治的结直肠癌患者的低通量PCR所检测的血液样本的血小板来源的lncRNA的表达数据。


作者提出的问题:
 目前,液体活检的生物标志物主要包括循环肿瘤细胞(CTC)、循环肿瘤DNA(ctDNA)、细胞外囊泡(EVs,主要是外泌体)、循环无细胞RNA(cfRNA)、miRNA(和cfRNA共同构成了循环肿瘤RNA,ctRNA)。ctDNA主要被应用于指导晚期肿瘤患者选择药物,更多被应用于非小细胞肺癌和结直肠癌的用药伴随诊断。循环miRNA及lnRNA作为肿瘤标志物的综述[1, 2]之前也有发表。结直肠癌早期诊断的检查主要是结肠镜,目前来看,无论镜检的系统如何升级换代,仍然是有创操作,存在一系列的风险。作者结合液体活检的背景,提出利用病人血液样本中血小板来源的lncRNA,作为诊断结直肠癌患者的生物标志物,接下来,我们一起看看作者都做了哪些分析。

结果1:Identification of dysregulated lncRNAs in tumor-educated platelets

作者下载GEO数据库中研究结直肠癌患者循环血小板的lncRNA谱,数据集GSE68086共纳入了54例血液样本, 27 结直肠癌患者以及27例正常人。首先第一步是差异分析,常见的生信文章在差异分析这一步通常会和研究热点的基因集取交集,比如免疫、凋亡、自噬和铁死亡等等,目的是为病人群体区分亚群,更好的进行靶向治疗。本篇测序样本为血液,目的是鉴定出具有诊断疾病能力的基因,并不需要引入靶向治疗的背景(tips:时刻谨记生信分析是一件工具,而工具的好坏,并不是判断分析结果的唯一标准。随处可得的树枝,在杨过手里也一样可以和利刃交锋!)。

主成分分析首先得出实验组和对照组的血液样本中,血小板来源的lncRNA表达存在差异。绘制火山图并计算实验组与对照之间的差异基因,取得109个显著高表达的lncRNA,19个显著低表达的lncRNA。借MA图的算法,计算差异基因的表达倍数,最后分别取上调和下调差异基因中的4个进行后续的研究。(LNCAROD, SNHG20, LINC00534, TSPOAP-AS1, GAS5, DANCR, CCDC18-AS1, and LINC00926) 图1

 LncRNA expression profiles in platelets of CRC patients and healthy controls.


结果2:个人病人群体临床表征,Characteristics of study populations
得到8个关键的血小板来源的lncRNA,作者接下来选择直接构建诊断模型,临床样本验证。也是临床研究的常见设计流程。这里可以看见,验证生信结果的方式并不是也做一次高通量测序,只要和演技目的嵌合,低通量的PCR同样适用。作者将医院收治的45例结直肠癌患者及45例正常人的血液样本纳入训练集,将105例结直肠癌患者及105例正常人血液样本纳入验证集。表格1 展示患者及正常对照组人群的基线资料,及肿瘤学特征。通过统计学检验,结直肠癌组与正常对照组之间,年龄、性别、吸烟史均无显著差异,具有可比性。训练集和验证集中结直肠癌患者的基线资料及肿瘤学也正也不显著统计学差异。表1

Characteristics of the study population.

结果3:Modeling and evaluation of the diagnostic circulating lncRNAs
作者对纳入研究的验证集的血液样本,进行定量PCR检测。结果提示,结直肠癌患者血清中4种lncrna (LNCAROD、SNHG20、LINC00534和TSPOAP-AS1)显著上调。在作者自己的临床样本检测中,发现基于数据库数据筛选的循环lncRNA中有4个是同样高表达的。作者继续探索这4个lncRNA区分正常和肿瘤患者的诊断效能,构建基于lncRNA的诊断模型。LNCAROD、SNHG20、LINC00534和TSPOAP-AS1组成模型,公式:Logit (P) = 3.84 + 0.77 LNCAROD +0.94 SNHG20 + 0.28 TSPOAP-AS1 + 0.15 LINC00534。作者比较了4种lncRNA单一作为分类标准和包含4种lncRNA的模型的诊断效能,ROC曲线显示,与单个lncRNA相比,模型在识别结直肠癌患者方面具有更高的AUC值(0.90)。LNCAROD、SNHG20、LINC00534和TSPOAP-AS1对应的AUC分别为0.85、0.85、0.82和0.76。图2

 Expression levels and diagnostic values of 4 lncRNAs in serum samples of CRC patients and healthy controls in the training set.

结果4:Validation of the 4-lncRNAs-based model
进一步评价基于4个lncRNA构建的结直肠癌患者诊断模型的效能。在作者的验证集中,对每个信息lncRNA的进一步评估表明,CRC患者血清中LNCAROD、SNHG20、LINC00534和TSPOAP-AS1的上调与之前的训练集中的结果一致。结果表明该模型具有较高的性能(AUC = 0.78)。LNCAROD、SNHG20、LINC00534和TSPOAP- AS1的AUCs分别为0.74 、0.73、0.73和0.63。此处,除了验证生信分析结果,还进一步推广了基于生信分析得到的模型临床作用,这点体现了验证层次,拔高了临床意义。图3

Diagnostic performance of 4-lncRNAs-based model in serum samples of CRC patients and healthy controls in the validation set.

结果5:Correlation between lncRNAs and clinicopathological characteristics
除了诊断效能,该模型最终的目的是为了早期诊断结直肠癌。为了探索候选循环lncRNA与癌症特征之间的关联,作者将来自训练集和验证集的结直肠癌患者组合并到一个验证集,并进行后续的相关性分析。结果显示,这些循环lncRNA的表达水平与性别、肿瘤大小、淋巴结转移、远处转移和分化无显著相关性 (P>0.05)。高表达的循环LNCAROD与分期(III/IV期) 存在相关 (P<0.05)。此外,TSPOAP-AS1在结肠癌循环中为高表达水平(P<0.05)。到此,作者基于简单的生信分析,得到了具有诊断结直肠癌的血小板来源lncRNA,并且与肿瘤的分期具备相关性,临床价值不可谓不重要。表2

Association of LNCAROD, SNHG20, LINC00534 and TSPOAP-AS1 expression levels with clinicopathological features.


总结:肿瘤学的诊断以影像,活检为金标准。但是诊断时效存在一定的滞后性,往往有影像学表现的时候,患者的分期已经进展。结直肠癌的早期诊断仍然是体检,结肠镜为主,而结直肠镜也是有创操作,存在麻醉、机械损伤的风险。本文作者鉴定的lncRNA综合诊断效能高,单一的lncRNA在晚期和总体结直肠癌都有高表达的表现。具有显著的临床价值。如果能鉴定出与术后治疗相关的循环lncRNA,结合CEA等肿瘤标志物,将会大大提高对患者预后预测的能力。

回顾全文,作者生信分析部分只包括了差异分析,绘制了火山图,热图,后文都是扎扎实实的临床研究思路。不知道读者平时读生信文章有没有这样的感觉,开篇都是差异分析,一点阅读的兴趣就没有,但是本篇的差异分析却十分的吸引球,让读者十分想了解作者得到差异分析后又做了哪些研究,读完一个结果就会感叹一次作者所分析的内容之重要。

生信分析的本质是通过转录组学,来研究疾病发生、发展、预后、治疗的工具。本文作者的使用的是生信分析中最基础的方法,解决的却是重要的临床问题。所以,小编也引以为戒,不要被热点所迷惑,多立足于你所研究的疾病的全方位考虑,能提出怎么样的科学问题,哪些可以通过生信分析这个工具解决,修炼的是发现临床问题的能力,而不是修炼使用工具的能力。

参考文献
[1]. Tsutomu, K., et al., Circulating MicroRNAs: A Next-Generation Clinical Biomarker for Digestive System Cancers. International Journal of Molecular Sciences, 2016. 17(9).
[2]. 江楠, et al., 循环长链非编码RNA作为生物标志物在肿瘤分子诊断中的应用. 生物工程学报, 2017. 33(6): p. 13.

团队介绍

北京概普生物(生信人)团队成立于2014 年6 月份。主要业务为医学科研服务,个性化生信分析,软件开发和台构建。团队主创人员均为一线科研工作者,有着丰富的从业经验。
2020年,团队完成项目300+,累计影响因子700+,开发生信工具140+,软著等知识产权申请30+,服务客户达220+。
公司深耕生信个性化分析数载,有一套有效的管理方案帮助大家缩短科研最后一公里的时间。从研究方向选择,方案设定,数据选择,售后处理,个性化修改,每一个环节都深深参与其中,真正的做到客户需要的按需定制。
生 信人团队致力于打造新型的科研服务的模式,以技术服务为基础, 以技术培训和数据库平台开发为优势,专注服务医学科研用户, 让你笑对科研,轻松科研。


生信相关问题也可直接联系:18501230653(微信同号)



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存