查看原文
其他

菜鸟团一周文献推荐(No.26)

生信菜鸟团 生信菜鸟团 2022-06-07


写在前面:
我们的「每周文献推荐」栏目已经来到了第 26 期。上期精彩文献回顾
菜鸟团一周文献推荐(No.25)
本周我们为大家推荐两篇文献,虽然数量不多但是质量很高,推荐阅读。


供稿人:思考问题的熊
一句话评价
Cell 发文 pan-cancer 转录组研究揭示可变启动子的重要调控功能
文章信息
题目:A Pan-cancer Transcriptome Analysis Reveals Pervasive Regulation through Alternative Promoters
杂志:Cell
时间:5 September 2019
链接: 
https://doi.org/10.1016/j.cell.2019.08.018
figure
文章介绍:
如今,如果一个转录组数据主导的文章,既没有单细胞也没有湿实验,想要发一个高分文章有多难?如果要发到 Cell 呢?这篇文章给出了一种可能。
本文作者团队作者分析了涵盖 42 种癌症类型的 18,468 个 RNA-seq 样品中的启动子活性。首先这些样本包括:
  • PanCancer Analysis of Whole Genomes (PCAWG) cohort of 1,188 patient samples with matched whole-genome sequencing data
  • the Pan-Cancer Atlas (TCGA) cohort of 11,251 samples with exome sequencing data
  • 6,674 normal samples from the GTEx project
其主要结论:可变启动子显示出组织特异性调节和影响转录本的多样性;癌症相关启动子不依赖于基因表达的情况下改变转录组;可变启动子的患者与患者之间的差异与存活率相关。
全文共有 11 个 figure,每个 figure 都有大量子图。从分析层面来说,主要包括这样几个内容:
  • 18,468个RNA-Seq样品中的活性启动子鉴定
  • 可变启动子活性的分析
  • 鉴定组织特异可变启动子
  • 癌症相关可变启动子鉴定
当然,其中还穿插了大量的各种转录组相关分析以及和表观基因组学数据的联合分析,是一篇值得深入研究和学习的好文章。
值得一提的是,这篇文章最早的版本于 2017 年 8 月发表于预印本,那个时候和现在的题目和内容都有不小的差别。
到了 2018 年的 5 月,作者又在预印本上更新了一个版本,题目才和现在发表的文章保持一致。但是这里的预印版文章用到的细胞数量比现在发表的要少,整体的丰富度也要相差很多。
那作者是什么时间投稿的呢?Cell官网的记录显示如下
  • Published: September 5, 2019
  • Accepted: August 7, 2019
  • Received in revised form: December 13, 2018
  • Received: October 15, 2018
也就是说从18年的10月开始投稿一直到今年8月接收,再算上17年的第一版预印本文章。仅仅是这个时间已经经历了2年。这里还不知道在发表预印本之前分析了多长时间。
如果你是一个有心人,不妨看看从第一版预印本到第二版预印本再到如今发表到Cell,这篇文章从内容和写法上都经历了哪些变化。仔细研究一番,相信对你发 Cell 一定是有帮助的,加油!




供稿人:Lakeseafly
一句话评价
藏人基因组组装
文章信息
题目:De novo assembly of a Tibetan genome and identification of novel structural variants associated with high altitude adaptation
杂志:BioRxiv
时间:Sep 2019
链接: 
https://www.biorxiv.org/content/10.1101/753186v1.full
figure
藏人基因组与人参考基因组GRCh38对比


文章介绍:
结构变体(SV)可能在人类适应极端环境(如高海拔)方面发挥重要作用,但目前这方面的研究还是严重不足。
在这里,结合长读序列和多种scaffolding的技术,研究者组装了一个高质量的藏基因组(ZF1),contigs的N50长度为24.57Mb和scaffolding的N50长度为58.80 Mb。
对比人类参考基因组(GRCh38),ZF1组装填充了其80个剩余的N-间隙(总长度为0.25Mb)。另外研究者检测到17,900个SV,其中ZF1特异性SV富含激活缺氧途径所需的GTP酶活性。进一步的群体分析揭示了MKL1中 163-bp的内含子缺失基因显示高地藏族与低地汉族之间存在较大差异。这种缺失与较低的收缩期肺动脉压显着相关,这是藏人重要的适应性生理特征之一。
此外,通过使用高质量的从头组装,研究者观察到与其他东亚地区相比,ZF1(1.32%-1.53%)的全基因组古代原始人类(Altai Neanderthal和Denisovan)共享非参考序列的比率更高(0.70%-0.98%),反映了西藏人独特的基因组成。
一个这样的古老原始人共享序列中SCUBE2中的662-bp内含插入基因,在西藏人中富集并与更好的肺功能(FEV1 / FVC比率)相关。总的来说,研究者生成了第一个高分辨率的西藏人参考基因组,并且鉴定的SV可以作为未来人类进化和医学研究的宝贵资源。
另外个人觉得这比较感兴趣的点有:
  1. 10X 技术或 Bionano技术同时支持至少75%的长序列比对检测到的SV(大小为50bp-20Mb)
  2. 70%的SV含有重复序列
  3. 所有缺氧和选择相关的SV的区域都是基因间或者内含子区域


因为文章数量较少,本期内容就不设置投票啦。
不妨分享在看,对我们的两位推荐人表示感谢和支持。下周再见~

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存