一文带你探索单细胞ATAC分析思路
中文题目:单细胞ATAC和深度学习在人胰岛中揭示2型糖尿病调节特征
英文题目:Single-cell ATAC-Seq in human pancreatic islets and deep learning upscaling of rare cells reveals cell-specific type 2 diabetes regulatory signatures
研究目的和方法
研究目的:找与胰岛基因表达相关的特定变异及其在T2D病理生理学中的作用
材料:一个43岁女尸的胰岛组织
方法:单细胞ATAC-seq, GWAS,peak calling, Cicero
研究思路
单细胞ATAC-seq是否可以代替非单细胞ATAC-seq分析?先来看看单细胞ATAC-seq和非单细胞ATAC-seq 分析比较。
01
单细胞ATAC-seq与Bulk-ATAC-seq比较
1)相关性比较
2)ATAC信号轨迹比较
3)捕获特异性调控区比较
02
Sci-ATAC-seq分析
1、Sci-ATAC-seq细胞分群
2、 Sci-ATAC-seq细胞分群验证
03
染色质可及性分析(peak calling)
MACS2 call peak
MACS2确定了Alpha细胞的129,046个peak和β细胞的120,116个。但是,因为delta聚类只有28个细胞,我们推断MACS2不会在如此低深度的数据上执行理想的操作。事实上,我们在delta上使用MACS2只识别了49,293个peak聚合reads。
此时需找别的办法,即引入了深度学习。
深度学习 call peak
A:深度学习模型,两个模型:训练,验证,预测。
B:查准率-查全率曲线用于评估模型,可以从图中直接观察,外面的曲线比里面的曲线效果要好。表明U-Net模型可用。
C:位点验证,模型可以预测在28个细胞稀少的数据里面是缺乏的,却出现在600个细胞里面的细胞类型。
D:正交策略验证:每个细胞类型的scRSG在预测peak中的富集程度始终高于来自相同28个细胞数据的MACS2 peak。
最终用alpha训练模型得出的结果和beta训练模型得出的结果的交集作为delta的最终结果。
最终我们获得了高质量的1,456个单细胞ATAC数据,和106,460个染色质peaks。
04
T2D GWAS SNPs富集分析
05
peak和靶基因联合分析
总结
本文研究列举了C2CD4A/B和ANK1位点的具体例子,在这些位点中,我们能够指定与胰岛基因表达相关的特定变异及其在T2D病理生理学中的作用,这将是未来一个可信的研究目标。未来的一个重要主题将是多元组合分析多个胰岛单细胞ATAC-seq数据集。这需要提高统计能力,以检测染色质特征区域,并最终进行单细胞分辨率的染色质QTL研究,这将有助于进一步关注功能SNP。
文献下载:
https://international.biocloud.net/zh/article/detail/32029221
(复制链接到浏览器获取原文,如果没有云平台账号需要先注册)
推荐阅读
干货|百迈客单细胞 & 空间转录组专题系列
百迈客生物基于高通量测序技术、生物信息分析技术和生物云计算技术,为广大科研工作者提供以综合技术服务、生物云分析、三代高通量测序以及试剂、仪器等科研周边业务。
公司拥有Nanopore、PacBio、Illumina、Waters、10XGenomics等主流服务平台,以及基于云架构的生物云计算平台—百迈客云,提供涵盖人重外显子、三维基因组、单细胞与空间转录组、基因组组装、转录调控、微生物、群体遗传、质谱及表观遗传等研究方向的技术服务。目前百迈客云平台拥有200多款基因分析工具,分析结果可直接用于文章发表,更有近百部科研相关视频和8大基因数据库助力科研工作者深度数据挖掘。
自公司成立起先后在《Cell》、《Nature》、《Nature Genetics》、《Nature Communications》、《Plant Cell》等学术刊物发表论文数千篇,拥有国家发明专利技术40余项,软件著作权近200余项。
我们一直秉承”生物科技创新,服务社会,造福人民”的企业使命,致力于打造“生物科技创新中心”的发展愿景,让生物科技更快,更好的提高人类生活质量。