查看原文
其他

生信初学者基础知识资源推荐

阿越就是我 医学和生信笔记 2023-06-15
关注公众号,发送R语言python,可获取资料

💡专注R语言在🩺生物医学中的使用


如果你是一个生信初学者,又或者你是一个学临床的,为了发文章开始学生信,学了点数据挖掘,GEO,TCGA什么的,但是对很多专有名词不理解,对很多流程或者步骤云里雾里,那我强烈推荐你看看这本书:生物信息学最佳实践-基础篇[1]

这本书的作者:曾健明,是中文生物信息学知识分享领域的大佬,他创办的生信技能树、生信菜鸟团、单细胞天地等,已带领数十万人成功进入生信领域。

对于很多半路学生信的朋友,或者就是为了发文章而学的人,在初学时都会被庞杂的生物学知识+计算机知识难倒!对于有生物医学背景的来说,计算机知识是最薄弱的地方。

本书则很好的补全了这方面的知识,既然是基础篇,那内容都是生物信息学中最重要的地基部分!学会了这些基础知识,你会发现你的生信数据挖掘豁然开朗,很多不理解的地方都通了。

全书图文并茂,完全免费,电脑手机直接访问即可:http://www.biotrainee.com/jmzeng/book/basic/ 。

虽然成书于2017年,但是对于初学者来说是很好的学习资料。

下面是一些内容简介

生物信息学的重头戏就是处理各种各样的数据,第1章介绍了生物信息学主流数据产生方法,包括多种多样的芯片技术,二代测序技术和三代测序技术。

image-20220802185053581

既然数据的来源是如此的丰富多样,而且指定标准的单位比较多,就必然会产生各种各样的数据存储形式来规范化交流,第2章会详细介绍fastq,fasta,sam,bam,vcf,gff,gtf,bed,MAF等,理解了它们才能真正的入门生物信息学。

image-20220802185435724

了解了生物信息学领域的常见数据的产生和数据规范还不够,非常高频的需求是跟已有的各种数据库资源做比较,包括与参考基因组比对,基因结构以及功能的注释等等。第3章会详细介绍生信工作者必须了解的主流数据库,包括NCBI,UCSC,ENSEMBL,以及GO,KEGG,GENCODE,SRTINGDB,还有TCGA,ENCODE,1000GENOMES等等。

image-20220802185638607

前3章我觉得是最重要的~

第4章会罗列一些统计学常识以及高频统计学分析方法。当然,也会推荐一些好的学习资源供大家深入学习提高自己。

第5章主要介绍计算机资源及编程。

第6章是生物学基础。

觉得自己基础知识这一块薄弱的快去学起来~

网址:http://www.biotrainee.com/jmzeng/book/basic/

参考资料

[1]

观看网址: http://www.biotrainee.com/jmzeng/book/basic/





获取更多信息,欢迎加入🐧QQ交流群:613637742


医学和生信笔记,专注R语言在临床医学中的使用、R语言数据分析和可视化。主要分享R语言做医学统计学、meta分析、网络药理学、临床预测模型、机器学习、生物信息学等。


往期回顾




新版TCGAbiolinks包学习:批量下载数据


微软官方的PowerPoint插件来了!!!


dplyr中的across操作


初学者使用R语言读取、写出文件(csv/txt/excel/rdata等)的注意事项


可能是最好用的R包安装教程


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存