查看原文
其他

思考问题的熊 2018-06-06

前段时间接二连三带了不少实习生和轮转生,发现有些内容总需要重复的说,一件事情连续说三遍就效率太低了,还是把一些东西写下来,以后直接丢过去一个链接和微笑就好。

这一篇内容列举几个入门生物信息的角度可以让想要入门的伙伴知道门在什么地方。另一篇文章会相对全面的列举生物信息学常用软件和方法。需要说明的是,文章本身不会涉及太多细节。你既可以把它当成一个入门学习清单,也可以用来对照查找自己的知识盲区。

无论是入门生物信息还是学习其他技能,其实关键就在于掌握自主学习的工具和方法。

学会学习再去学习,学什么都不是问题。

生存必备基本技能

学会Google

学会如何正确搜索,接下来的内容就全都不愁了。但如何使用Google也许并非像大部分人想的那么简单。

学会Google的前提是能用上Google,这里点到为止,开源软件可以用XXnet https://github.com/XX-net/XX-Net,如果有条件也可以使用微屁恩。

如何搜索日常遇到的bug

入门生物信息初期最大的困惑就是每跑一个软件没运行一个命令都会遇见各种各样的问题,好像我们天生就是来和bug相遇的。但是没关系,你遇到的绝大多数问题早就有人遇到而且已经解决了。

利用Google搜索bug的时候,基本的搜索内容只要包括你的报错简单信息加上所用软件再加上版本,就能找到解决办法了。如果要在相关社区提问,附上你的源代码和几行有问题的原始文件是基本的礼貌和要求。

习惯用英文来搜索

如果一个问题用中文搜不出来你想要的答案,还是用英文来搜索吧。

简单常用技巧

  • 用双引号“搜索内容”进行精确搜索

    很多时候,我们需要使用精确搜索,比如在进行一些常用软件安装或者使用的过程中会出现各种各样的报错,这时你把软件的报错信息用双引号括封装,后面再加上软件的名字和版本,Google就会进行精确的匹配搜索。很可能第一条搜索结果就是你要的。

  • -搜索内容进行排除搜索

    在一些情况下,一个主题词往往会和若干个内容关系密切。这时候我们希望明确排除某个我们不想要的内容。

  • 具体文档类型搜索

    这个技巧当你在想要查找具体类型文档的时候非常有用。如你想要pdf版本的只需要在搜索内容的最后加上 filetype:pdf

  • 指定网站搜索

    对于码农而言 stackoverflow.com 是一个常用的网站,对于生物信息工作者来说biostar是一个非常好的论坛。如果我们想在某个特定的网站进行搜索的话,你可以在搜索内容之后加上site:*.com*,你得到的答案就全部来自这个网站了。

学会记录

可能会用到的工具

作为一个很爱丢笔记本的人,实在是不敢把什么都写在本子上了,其实主要原因是字太丑。

印象笔记是我用了多年的云笔记,配合vs code 的印象笔记插件可以方便的使用Markdown来书写并进行保存。当然,其他云笔记只要你用的惯都可以。

我的印象笔记已经有两千多条各种各样的笔记了,印象笔记里的东西越来越多,如果需要纯粹理思路的时候会显得臃肿。

思维整理,大纲类笔记我一直使用幕布(类似于 WorkFlowy 的国产应用),比如这篇文章的大纲就是在幕布中完成的,你可以复制链接https://mubu.com/doc/5MGyymO3J 或者点击阅读原文查看。

这类笔记工具非常轻量,各种端秒同步;而且你只需要也只能写一个个的list,每个list逻辑很清晰,先是什么再是什么一目了然。还能一键生成思维导图分享给别人。如果你总是需要做presentation,或者总是做事情没有头绪,可以尝试一下这个工具。

markdown

学会了markdown 你就再也不想用office word,再学一些LaTeX 基本语法就更好了。使用markdown进行写作目前来看也算是一个生物信息入门者必备技能了,相关介绍可以查看博客 http://kaopubear.top/2017-02-04/2017-02-04-trymarkdown/

基本语法学习地址 http://wowubuntu.com/markdown/

关于markdown编辑器的选择有很多,这里推荐且及推荐 typora https://typora.io/ ,当然,使用各种编程常用编辑器再配合插件也是可以的。

文献管理

读研究生少不了看文献,关键是怎么快速找到自己曾经度过的内容。

推荐使用Mendeley https://www.mendeley.com,基础版本不收费且颜值高同步快上手简单。也可以直接使用 Google学术,打造自己的线上图书馆。其实就是类似与收藏网页一样把看过的文献收藏在谷歌学术里。

另外F1000 http://f1000.com/prime 是个不错的网站,文献下载如果实在有困难可以考虑sci-hub http://sci-hub.cc/

包含有生物信息相关文章的常用期刊,CNS和PNAS就不多说了。其它还有:

  • Nature Genetics/Biotechnology

  • Genome Biology/Research

  • Plos Genatics

  • Nucleic Acids Research

  • Bioinformatics

学会收集信息

这里想强调的一点就是学会使用RSS,目前生物信息相关的博客有不少,很多优秀的博客其实都支持RSS订阅,另外常见的网站如biostar和学术期刊也都支持RSS定于,让他们更新的内容每天自动来你的RSS阅读器中报道,方便快捷。我目前在用的RSS阅读器是inoreader。


下面是真正和生物信息紧密相关的内容,注意,这些只是门,不会具体写每个门怎么进去。

服务器使用

软件如果是windows系统,首先要让自己的电脑连上服务器。

  • Xshell https://www.netsarang.com/products/xsh_overview.html

  • winscp https://winscp.net/eng/docs/lang:chs

操作系统

  • linux

  • ubuntu http://cn.ubuntu.com/download/

  • 双系统管理工具 vmware workstation

    下载地址 https://www.vmware.com/products/workstation.html

参考学习资料推荐

  • 鸟哥的linux私房菜 (入门重点看4-12章即可)

  • 在线查询linux命令

    • http://man.linuxde.net/

    • https://jaywcjlove.github.io/linux-command/

  • 在线学习网站

    • https://www.shiyanlou.com/courses/1

    • http://www.imooc.com/learn/175

    • http://www.runoob.com/linux/linux-tutorial.html

生物信息入门基本知识

数据产生

  • 产生方式

    • arrary

    • genome tiling arrary

    • high throughput sequencing

    • snp arrary

    • protein arrary

  • 数据种类

    • expression profiling

    • genome binding/occupancy profiling

    • genome variation profiling

    • methylation profiling

    • non coding rna profiling

    • protein profiling

    • snp genotyping

  • 二代测序

    • 454

    • SOLiD

    • illumina https://www.illumina.com.cn/给出illumina官网的地址是因为里面资料很多。

  • 三代测序

    • PacBio RS

    • Nanopore MinlON

数据存储类型

  • 学习网址 https://genome.ucsc.edu/FAQ/FAQformat.html

  • FASTA

  • FASTQ

  • GFF/GTF

  • SAM

  • BAM

  • CRAM

  • VCF

  • 其他

数据库资源

  • 拟南芥

    • TAIR https://www.arabidopsis.org/

    • araport https://www.araport.org/

  • 水稻

    • rapdb http://rapdb.dna.affrc.go.jp/

    • msu http://rice.plantbiology.msu.edu/

    • ricexpro http://ricexpro.dna.affrc.go.jp/

  • 其他物种

    • JGI https://phytozome.jgi.doe.gov/pz/portal.html#

  • NCBI

    • GEO https://www.ncbi.nlm.nih.gov/geo/

    • SRA https://www.ncbi.nlm.nih.gov/sra

    • 其他

  • ENSEMBL

    • 在线学习 https://www.ebi.ac.uk/training/online/

    • EnsemblPlants http://plants.ensembl.org/index.htmls

  • 蛋白

    • EBI http://www.ebi.ac.uk/services/proteins

    • pfam http://pfam.xfam.org/

    • uniprot http://www.uniprot.org/

    • GPOFILER http://biit.cs.ut.ee/gprofiler/index.cgi

    • GO http://www.geneontology.org/

  • 生物信息工具查询网站

    • https://bioinformatics.ca/links_directory/

    • https://omictools.com/

    • https://www.atum.bio/resources/bioinformatics-tools

    • https://wiki2.org/en/List_of_RNA-Seq_bioinformatics_tools

生物信息统计入门基础

  • 基本概念

  • 统计方法

  • 实现方法

  • 结果可视化

  • 相关软件算法实现

编程基础

  • Linux shell

  • R http://www.sthda.com/english/

  • Python

  • 机器学习

  • 在线课程

    • 生信编程题目练习 http://rosalind.info/problems/locations/

    • 慕课网 http://www.imooc.com/

生物学基础知识

  • 基因组相关

  • 转录组相关

  • 表观组相关

  • 在线课程网站

    • coursera https://www.coursera.org/

    • edX https://courses.edx.org/


其他推荐:师妹 你要的都在这里了
点击阅读原文,即可到达作者的博客。

还有更多文章,请移步公众号阅读

如果你生信基本技能已经入门,需要提高自己,请关注上面的生信技能树,看我们是如何完善生信技能,成为一个生信全栈工程师。

如果你是初学者,请关注下面的生信菜鸟团,了解生信基础名词,概念,扎实的打好基础,争取早日入门。

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存