菜鸟团一周文献推荐(No.29)
文章介绍:
随着癌症免疫治疗的大获成功,肿瘤与免疫细胞间的相互作用机制成为了研究热点。早在2016年,本文作者就述过基于bulk-sequencing的基因组、转录组、表观组数据进行肿瘤免疫推断的方法(doi:10.1038/nrg.2016.67)。目前癌症免疫研究中使用新方法主要有单细胞测序、质谱流式细胞技术、基于成像技术的细胞空间表型分析,3种技术各有优势,最好是能够联合使用。本文综述了分析这些新一代数据所用到的软件工具,并给出了一些使用建议。推荐理由:这篇文章内容没有非常深入难懂,而且图表清晰地展示了文章的主要内容,不想看全文看看图也行,很适合大致了解这个领域。
供稿人:Lakeseafly
一句话评价
新一代的变异发现工具
文章信息
题目:MapCaller – An integrated and efficient tool for short-read mapping and variant calling using high-throughput sequenced data
杂志:Biorxiv
时间:Sep 2019
链接:
https://www.biorxiv.org/content/10.1101/783605v2
Figure
不同工具之间的variant calling的比较:
文章介绍:
背景介绍
随着下一代测序(NGS)技术的发展,越来越多的医学和其它生物学研究采用NGS技术来表征个体之间的遗传变异。使用NGS技术鉴定个人的基因组变异体是临床基因组学研究成功的关键因素。这时候需要一个准确且一致的分析程序,以将功能或疾病相关变体与由于测序错误或错位导致的错误发现区分开来。
在这项研究中,研究者集成了用于read比对和变量调用的算法,开发了一种高效且通用的NGS的变异分析工具,称为MapCaller。它不仅将每个短reads比对到参考基因组上,而且还可以同时检测单核苷酸变体,插入缺失,倒位和易位。研究者使用三个模拟数据集和四个实际数据集,通过现有的变量调用流程评估MapCaller的性能。结果表明,MapCaller可以准确识别变异。而且,MapCaller的运行速度比现有方法快得多。最后他们得出了MapCaller能在NGS数据分析上既准确又节省时间和空间的结论。
个人体会
Calling SNP 可能是咱们每个生信工作者都离开的事情,目前我们用的最多的应该就是GATK的标准流程,可是这个流程虽然比较准确,但其耗时确实相当的长,受到大家的诟病。刚好这篇文章为我提供了新一代的SNP calling的工具,非常推荐大家去使用并且测试自己的数据。该工具的下载链接为:
https://github.com/hsinnan75/MapCaller.
供稿人:六六
一句话评价
scATAC-seq和深度学习联合揭示2型糖尿病的调控特征
文章信息
题目:Single cell ATAC-seq in human pancreatic islets and deep learning upscaling of rare cells reveals cell-specific type 2 diabetes regulatory signature
杂志:bioRxiv
时间:Sep. 7, 2019
链接:
DOI: http://dx.doi.org/10.1101/749283
figure
文章介绍:
II型糖尿病(T2D)是一种以胰岛功能障碍、胰岛素抵抗和血糖紊乱为特征的复杂疾病。全基因组关联研究(GWAS)已经鉴定出超过400个编码遗传倾向的独立信号。超过90%相关的单核苷酸多态性(SNP)定位于非编码区,并富集在染色质定义的胰岛增强子元件中。另外胰岛包含不同的细胞类型,每种细胞类型都有可能参与T2D的转录调控,bulk-seq的方法会掩盖了细胞异质性的特点。所以这里文章采取sci-ATAC-seq (single-cell-combinatorial-indexing ATAC-seq) 的方法,观察到α、β和δ细胞群并识别T2D的细胞特异性的调控信号;另外,他们发现T2D GWAS SNPs显著富集在β细胞,和α或δ细胞与其他细胞类型跨细胞型差异的开放染色质。此外,他们基于U-Net架构还开发了一个深度学习模型用于准确地预测在稀有细胞群体中的开放染色质峰值。
深度学习的代码:
https://github.com/ParkerLab/PillowNet.
其他代码在:
https://github.com/ParkerLab/islet_sci-AT AC-seq_2019
这篇文章结合scATAC-seq和深度学习的方法探究疾病的转录调控特征的思路和以及文章用到的方法值得学习。
供稿人:ryx
一句话评价
快速的单细胞数据搜索引擎
文章信息
题目:Fast searches of large collections of single cell data using scfind
杂志:bioRxiv
时间:Oct. 1, 2019
链接:
DOI:http://dx.doi.org/10.1101/788596
figure
文章介绍:
随着单细胞技术的快速发展和普及,数据资源不断增多,快速方便的查询和访问单细胞数据资源将使其发挥更多用途。hemberg实验室基于此开发了scfind,这是一种用于细胞图集的搜索引擎。scfind可以用于评估标记基因,以及鉴定细胞类型特异性基因和管家基因。此外,他们也开发了子查询优化例程,以确保冗长而复杂的查询返回有意义的结果。为了使scfind更加易于使用和访问,他们使用PubMed摘要的索引和自然语言处理技术来允许任意查询。还可以将单细胞ATAC-seq数据与转录组数据相结合,用于多组学分析。
目前还没有完全公开发布,需要使用MIT的权限才可以,感兴趣的可以结合github代码体验一下
包括9个数据集的交互网站:https://scfind.sanger.ac.uk
代码:https://github.com/hemberg-lab/scfind
Windows用户