查看原文
其他

生物信息之独孤九剑——sort

2016-10-08 风清扬 基因学苑


编者按:

  在金庸武学体系的众多武功之中,独孤九剑并不是最强劲的武功,它与其他武林绝学有很大的不同,可以说是鹤立鸡群。比如乔峰的降龙十八掌,段誉的六脉神剑,张无忌的九阳神功,石破天的罗汉伏魔神功,这些神功都需要强大的内力支撑,而独孤九剑则不同,不需要内力,这点其实可以从华山派气宗与剑宗的分歧就可以看出来。独孤九剑传人风清扬属于剑宗,更注重招式,而不是像剑宗注重练气。独孤九剑分为总诀式,破剑式,破刀式,破枪式,破鞭式,破索式,破箭式,破掌式,破气式,遇到不同的场景使用关不同的招式,因此,独孤九剑更加注重问题的解决,本质上就是就是通过工具来解决问题。只要学会这九剑,就可以处理很多的问题。学习生物信息也是同样的道理,当然练好内功,掌握很好的基础是非常必要的,但是也可以学习一些小工具,解决一些实际问题。那么从这次内容开始,我们就来给大家介绍生物信息之独孤九剑。


文本排序是计算机编程中非常重要的一项工作,排序之后的数据更加具有规律,并且更方便处理。在生物信息分析中排序也是非常重要的工作,我们常常需要根据基因组的坐标位置进行排序,例如在利用短序列比对进行变异检测的过程中, 首先就需要进行排序,例如bwa比对之后,利用samtools对bam结果进行排序,然后才能进行后续的分析。在Linux系统中,可以使用sort工具对文本文件内的内容进行排序


排序主要可以分为三种情况:

第一种:根据数字大小进行排序,例如根据坐标位置大小进行排序,根据比对的分值大小排序结果;

第二种:根据根据字符大小进行排序,比如abcdef这种顺序;

第三种:给定一个文件,里面包含了指定的顺序。

https://v.qq.com/txp/iframe/player.html?vid=o0334c0r8bz&width=500&height=375&auto=0

案例一:直接排序;

sort  


案例二:按相反顺序进行排序;

sort -r  


案例三:根据数字大小进行排序;

sort -n


案例四:排序去除重复;

sort -u


案例五:多条件排序;

sort -nrk3 -k2   #首先按照第三列进行排序,然后按照第2列进行排序;


案例六:统计blast比对上的序列数目;

awk '{print $1} ' blast.out  |  sort -n | uniq | wc


更多内容,请点击链接:

https://item.taobao.com/item.htm?spm=a1z10.3-c.w4002-10284985292.19.ODeefi&id=535825901642


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存