其他

这篇science文献让我想起了被考研英语支配的恐惧

2018-01-22 徐洲更 生信媛


昨天看简书上一篇文章【基因组共线性工具MCScanX使用说明】,里面推荐了两篇文章

Tang H, Bowers J E, Wang X, et al. Synteny and Collinearity in Plant Genomes[J]. Science, 2008, 320(5875):486-488.

Wang Y, Tang H, DeBarry JD, Tan X, Li J, Wang X, Lee TH, Jin H, Marler B, Guo H, Kissinger JC, Paterson AH. (2012) MCScanX: a toolkit for detection and evolutionary analysis of gene synteny and collinearity. Nucleic Acids Res, 40(7): e49.

而我今天看的这篇,发表在【科学】期刊上的Synteny and Collinearity in Plant Genomes. 不得不说【科学】的版面宝贵,估计里面的一句话等于普通期刊的3句了。为了理解这些长难句,我不得不拿出了我当年学习理解考研英语的架势来。

Accordingly, accurate identification of orthologs across eutherian taxa is relatively routine, and deduction of synteny and collinearity is often straightforward with best-in-genome criteria (4), identifying one-to-one best matching chromosomal regions in pairwise genome comparisons

Angiosperm (flowering plant) genomes fluctuate remarkably in size and arrangement even within close relatives, with recurring wholegenome duplications occurring over the past ~200 million years accompanied by wholesale gene loss that has fractionated ancestral gene linkages across multiple chromosomes (5).

但是所有长难句都是纸老虎,只要你学会如何切分句子。首先是对第一个句子的切分


Accordingly, (1)accurate identification of orthologs across eutherian taxa is relatively routine, / and (2) deduction of synteny and collinearity is often straightforward with best-in-genome criteria , identifying one-to-one best matching chromosomal regions in pairwise genome comparisons


第一个句子先分为两个部分(1)和(2),这两个部分用and连接,所以句型是相同的,都是主谓补结构(S+V+C)。 然后第(2)部分中,还有一个黄色部分比较烦人,这是一个减化形容词从句,具体一点就是现代分词词组,形容前面的best-in-genome criteria.


整句话就可以简单的翻译为:因此,准确地识别出不同哺乳动物分类的同源基因是比较常规的套路,并且有了最佳位置基因组标准,推导共线性和共线性也比较直接。其中这套基因组配对比较然后找到染色体区域间一对一的最佳匹配。


(1)Angiosperm (flowering plant) genomes fluctuate remarkably in size and arrangement even / within close relatives, (2) / with recurring wholegenome duplications occurring over the past ~200 million years (3)/ accompanied by wholesale gene loss(4)/ that has fractionated ancestral gene linkages across multiple chromosomes


第二个句子看起来更加凶狠,但其实可以分为四个部分分别进行翻译。

(1). 被子植物基因组在大小上变化非常显著,并且即便在较近的物种中也有重排现象。

(2). 这是在过去2亿年间不断发生的全基因组重复

(3). 这伴随着大规模基因组丢失

(4). 这种基因组丢失使得同一个祖先的基因谱系分散在不同的染色体上。


合并起来就可以这样子翻译:

由于被子植物在过去2亿年间不断发生的全基因组重复,同时还有大规模基因组丢失,这使得同一个祖先的基因谱系分散到了不同的染色体上,从而导致了基因组在大小上显著差别,以及即便是近缘物种上也有重排现象发生。


吐槽完毕,继续看文献去。如果对这篇文章感兴趣,欢迎阅读原文看我的简书的每日文献专栏,今天应该会更新出来。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存