菜鸟团一周文献推荐(No.24)
供稿人:曾健明
一句话评价
玉米种子发育过程的转录调控和肺癌不同进展期的免疫调控数据分析的比较
文章信息
其实是两篇文献,虽然是截然不同的研究领域,但是我看到他们实验设计和数据分析的共性,希望可以对植物学背景的朋友转疾病研究提供一定参考和帮助。
题目:Immune evasion before tumour invasion in early lung squamous carcinogenesis
杂志:nature
时间:2018-11
链接:
https://doi.org/10.1038/s41586-019-1330-0
题目:High-temporal-resolution Transcriptome Landscape of Early Maize Seed Development
杂志:Plant Cell
文章介绍:
可以看到玉米种子发育早期的31个时间点,可以清晰的分成4个发育阶段:
双受精(double fertilization)
多核形成(coenocyte formation)
细胞化(cellularization)
分化(differentiation)
不同阶段特有基因表达的生物学功能不一样,动态展现了种子发育过程的转录调控。
然后,肺癌进展的9个stage,也是可以划分为4个阶段:Normal ,Low grade, High grade ,SCC,同样的,基因表达变化pattern也可以把基因划分为不同模块,进行GO/KEGG数据库注释,来说明疾病进展过程的肿瘤调控和免疫细胞比例的变化,这个就属于人类疾病特有的分析元素。
供稿人:鲍志炜
一句话评价
一套快速高效的宏基因组分析流程。
文章信息
题目:NG-meta-profiler: fast processing of metagenomes using NGLess, a domainspecific language
杂志:Microbiome
时间:03 June 2019
链接:
https://doi.org/10.1186/s40168-019-0684-8
figure
文章介绍:
宏基因组包含了环境中所有的基因组信息,为了理解这些生物群落,一套高效的生物信息学方法至关重要。典型的宏基因组处理工作流程可分为两个不同的阶段:第一阶段,处理原始数据以生成特征丰度表。包括菌群分类或功能注释。第二阶段就是,使用一些统计学方法或 R 包进行差异分析寻找菌群与疾病之间的联系,比如 phyloseq,vegan 或 LEfSe 等等。在这篇文章中,作者针对第一阶段,即从原始宏基因组 reads 中获取功能和分类谱,提出了 NG-meta-profiler。一个基于 NGLess 框架的宏基因组的快速分析流程,它包括序列预处理,比对到注释数据库,过滤比对结果和注释(分类和功能)。在测试中,其快于 MOCAT2 或 htseq-count 流程,NGLess 可通过 bioconda 安装。网址:https://ngless.embl.de
供稿人:Lakeseafly
一句话评价
在多个物种中比较短序列RNA-seq的组装工具
文章信息
题目:De novo transcriptome assembly: A comprehensive cross-species comparison of short-read RNA-Seq assemblers
杂志:Giga Science
时间:May 2019
链接:
https://doi.org/10.1093/gigascience/giz039
figure
文章介绍:
背景:
近年来,大规模的RNA测序(RNA-seq)已成为以各种方式研究整个转录组的快速,节约成本有效且稳健的技术。特别是,对于非模式生物,在没有合适的参考基因组的情况下,RNA-Seq用于从头重建转录组。虽然近年来非模型生物的从头转录组装的研究一直在增加,并且新工具一直在进一步发展,但是关于应该使用哪种组装软件来构建从头组装仍然存在认知上的差距。
结果:
在这里,研究者提出了一项大规模的转录组重头组装比较研究,测试了10个从头组装工具(应用于跨越不同生命王国的9个RNA-Seq数据集)。研究者基于生物量和无参考度量的指标评估了这些工具的组装的性能。最后作者发现了 Trinity,SPAdes和Trans-ABySS,其次是Bridger和SOAPdenovo-Trans,通常表现优于其它工具。此外,研究者观察到每个组装程序的性能在不同的物种组装中都有特定差异,并没有工具能为所有数据集提供最佳结果。
个人体会
改文章还是蛮有趣的一篇,总结常见的RNA-seq重头组装的工具,其中最值得我个人学习的地方是他们如何选择对应的指标去评估每个工具所对应的RNA-seq组装,这些指标(或者经过细小的modify)也可以应用于对应参考序列组装的评估中。
一句话评价:
用Charlson合并症指数强化机器学习(预测局部前列腺癌复发关联的死亡)模型。
文章信息
题目:Prediction of Recurrence-associated Death from Localized Prostate Cancer with a Charlson Comorbidity Index-reinforced Machine Learning Model.
杂志:Open Medicine
时间:2019年8月14日
链接:
https://www.ncbi.nlm.nih.gov/pubmed/31428684
Figure
文章介绍
研究未能解决局部前列腺癌患者所面临的困境,这些患者必须在根治性前列腺切除术(RP)和外照射放疗(RT)之间进行选择。由于Charlson合并症指数(CCI)是影响生存事件的可测量因素,因此本研究旨在验证CCI在提高各种预测模型准确性方面的潜力。因此,作者们采用Cox比例风险模型和机器学习方法,包括随机森林(RF)和支持向量机(SVM),对国家健康保险研究数据库(NHIRD)中的医疗记录数据进行建模。总共招募了8581人,其中4879人接受了RP,3702人接受了RP。RT组中的患者年龄较大并且表现出较高的CCI评分和一些CCI项目的较高发生率。中度至重度肝病,痴呆,充血性心力衰竭,慢性肺病和脑血管疾病都会增加Cox危害模型中总体死亡的风险。CCI增强的SVM和RF模型分别准确率为85.18%和81.76%,而不使用CCI的SVM和RF模型相对不太准确,分别为75.81%和74.83%。因此,CCI及其一些项目是整体和前列腺癌特异性生存的有用预测因子,并且可以构成机器学习建模的有价值的特征。