其他
生物信息学技能面试题(第3题)-探索人类基因组注释文件
前面标题编号错了,所以重新发一下,欢迎大家转发这个系列,总共两百个题目,考一下你的同事,你的下属,你的老板!
注释文件一般以gtf/gff格式记录着!
每条染色体基因个数的分布?
所有基因平均有多少个转录本?
所有转录本平均有多个exon和intron?
或者其它一系列你想统计的,你想了解的!
或者其它一系列你想统计的,你想了解的!
或者其它一系列你想统计的,你想了解的!
你知道如何统计吗?需要用到哪些生信技能?
我想看到下面这样的图片
PS:有同学反映这个图比较随性,哈哈,你说的对,这就是我!
用perl和python,R,shell均可以完成!
基础作业,就是对这个文件 进行统计,普通人只需要关心第1,3列就好了。
我写过一个R完成的版本:R的bioconductor包TxDb.Hsapiens.UCSC.hg19.knownGene详解
见 :
人类的基因组注释文件,一般是gtf/gff格式的。
参考:
微信里面无法发链接,点击阅读原文可以查看具体信息!
也可以查看历史题目:
生物信息学技能面试题(第1题)-人类基因组的外显子区域到底有多长