基因的生物信息学分析

其他

一文搞定细菌基因组De Novo测序分析

SRA数据库的文件。关于如何提交请参考生信入门:如何将测序原始数据上传NCBI。数据质控使用fastqc软件对原始测序reads进行质控,生成网页统计报告,快速获得数据质量的好坏。!fastqc
2021年2月16日
其他

太可怕了!健康人体肠道菌群中竟然有...

“HIV”、“埃博拉病毒”、“禽流感病毒”、“病毒性肝炎”,人们闻之色变。我们都知道人体肠道内有不计其数的细菌,但是你知道吗?人体内病毒数量是肠道细菌的十倍还多!肠道微生物群包括细菌、真菌、病毒、古细菌等。虽然对肠道菌群的研究热火朝天,但科学家们经常忽视肠道内的病毒之一噬菌体的作用。一方面原因是没有比较理想的手段去研究这些噬菌体,另一方面是由于这些噬菌体主要感染细菌,似乎对人体不会产生太大影响。近来研究发现,肠道内细菌感染的噬菌体对人体健康也具有重要价值。病毒侵入宿主细胞进行增殖扩散,一方面通过基因转移和宿主细胞的降解引起细菌群落结构和功能的改变,另一方面通过toll样受体信号通路,引起机体免疫应答,在清除病毒的同时可能造成免疫病理性损伤。肠道中的病毒、细菌、真菌等微生物相互作用引起炎症性疾病、免疫系统疾病、增加疾病易感性等。相对于肠道细菌,病毒组则更加难以检测和测序。病毒按遗传物质,主要可以分为RNA病毒和DNA病毒。相对于RNA测序,目前大规模的DNA测序更加普遍。所以,目前测到的病毒组还是以DNA病毒为主。什么是人体肠道病毒组人体肠道病毒组(human
其他

肠道菌群:宏转录组测序分析

在“核心”转录组之外,还鉴定出了宏转录组中的“可变”部分,包括长链脂肪酸、萜类化合物、多胺等。Nature子刊:老年男性肠道菌群的稳定性Nature
其他

生信入门:序列比对之diamond

宏基因组分析当中得到基因集之后,需要知道这些基因的功能,才能分析样品表型与基因之间的关系,这就需要对基因进行功能注释;无参转录组分析软件得到unigene文件,也需要对转录本进行功能注释。基因功能注释是将基因序列比对回数据库,根据序列相似性预测基因功能。为什么不用blast(生信入门:序列比对之blast在线和本地使用)?太慢。。。2015年nature
其他

生信入门:蛋白数据库UniProt介绍

今天给大家介绍一下UniProt这个全面的,高质量的,免费使用的蛋白质序列与功能信息数据库。下面我分五部分给大家介绍一下:蛋白质知识库(UniProtKB)包含蛋白质序列、功能注释、分类、各种数据库交叉引用等信息知识库,记录包含两个部分,其中swiss-Prot是经过人工筛选和注释的,具有很高的准确性和可靠性;
其他

肠道菌群:宏基因组测序分析流程解读(上)

)菌株水平的指纹使用实例定量物种谱一条命令就可以从原始数据得到物种的相对丰度!!最常用的是使用双端压缩fastq文件,参数--nproc调用多个线程,并输出比较结果metaphlan2.py
其他

生信入门:如何远程登陆linux服务器

服务器买回来放机房了,帐号密码也有了,那么问题来了,如何通过自己的电脑远程登陆linux服务器呢?windows如何远程登录linux服务器从Windows系统远程登录服务器,本人用过多款远程登录Linux服务器的终端软件,例如Putty、SSH
其他

肠道菌群:16S测序分析流程解读

-Q33嵌合体序列检测嵌合体在遗传学上用以指不同遗传性状嵌合或混杂表现的个体。嵌合体序列的出现会导致测序结果中产生一些实际并不存在的核酸序列,影响结果的可靠性。因此,可以用usearch
其他

生信入门:序列比对之blast在线和本地使用

分别对应不同的数据比对方式-e:指定一个实数,过滤掉期望值大于这个数的比对结果,默认为10,建议蛋白比对设置为1E-5,核酸比对设为1E-10-F:用来屏蔽简单重复和低复杂度序列(
其他

病毒基因组:流感病毒为何这么强?

近来有幸拜读了高福院士的新书《流感病毒——躲也躲不过的敌人》,受益匪浅!该书既是对1918年全球大流感一百年的铭记,又是对新时代科技创新的瞭望。看完这本书的时候,使我重新思考这样一个问题:流感病毒基因组只有十几kb,而人的基因组有~3Gb,流感病毒为何这么强,如此的让人类猝不及防?内容1
其他

一文搞定细菌基因组De Novo测序分析

SRA数据库的文件。关于如何提交请参考生信入门:如何将测序原始数据上传NCBI。数据质控使用fastqc软件对原始测序reads进行质控,生成网页统计报告,快速获得数据质量的好坏。!fastqc
其他

生信入门:如何将测序原始数据上传NCBI

是最常用的存储高通量测序数据的数据库。大家可能觉得数据上传很困难,实际上并不复杂。除了先注册一个NCBI帐号(https://submit.ncbi.nlm.nih.gov/),只需以下三步:1.
其他

生信入门:Fasta与Fastq格式文件详解

获得的结果竟然不一样!!!为什么呢?这是由于在质量文件中也会出现以@开头的情况。如果fastq文件第三行只有‘+’,那么可以通过统计‘+’的个数来获得正确的序列数目python