Quantcast

袁伟时:中国的奴性和戾气从哪里来?

“芯片大学”虚晃一枪,人才断层问题不能跑步解决

两大中国首富双双被重挫-释放信号强烈

民间帝王赖小民和性感女星舒淇与许晴

女性最喜欢的五种性爱姿势(图)

Facebook Twitter RSS

分享到微信朋友圈

点击图标下载本文截图到手机
即可分享到朋友圈。如何使用?

自由微信安卓APP发布,立即下载!

生信媛

这篇science文献让我想起了被考研英语支配的恐惧

由于被子植物在过去2亿年间不断发生的全基因组重复,同时还有大规模基因组丢失,这使得同一个祖先的基因谱系分散到了不同的染色体上,从而导致了基因组在大小上显著差别,以及即便是近缘物种上也有重排现象发生。
2018年1月22日

TCGA大作战——初步分析RNA-seq数据03

首先,通过测序,每个实验组的基因表达都会以数值来计量,软件得知道你的表达数值才能计算差异(根据软件的不同,可以是原始数值(raw_counts),也可以是标准化后的数据),这个信息俗称表达矩阵
2017年12月31日

ATAC-Seq 数据分析一文就够(上)

转座酶切割,普通的ATAC-Seq的read就会有大量是细胞器的DNA,这就是为啥需要用INTACT技术。此外如果不是PCR-free的建库方法,会有大量重复的read,也就需要标记或去除重复。
2017年12月18日

整个世界都是你的已知条件(生信学习心得)

要想成为音乐家,你必然要掌握一门乐器。但是掌握一门乐器是不够的,你还得继续深入,学习理论知识。只有这样子,当你进入一个酒吧,听到别人弹吉他的时候,你能够熟练用任何一门乐器和他进行配合。
2017年11月29日

数据挖掘干货分享(1)

接下来我们将利用Google的sklearn对Adaboost进行测试,代码是我搬运的(略有改动,更简单),毕竟是经典的东西,怕我自己的代码丑到大家,注释是自己写的,爱你是亘古不变的
2017年10月20日

从零开始学统计——第一期答疑篇

好的,现在我们再比较上例身高和体重两个指标的变异度,就要分别把它们的方差处理一下,让它们的量纲都为1,应该怎么做?是不是要选用各自的标准差,再分别除以各自的均值就可以了?这就是变异系数CV的意义了。
2017年10月16日

数据挖掘干货分享

Databases的一个步骤,一般意义上的数据挖掘就是从海量的数据中,通过一定的支持算法,搜索隐藏在数据之间的关系。现代数据挖掘依赖于计算科学、统计学、情报检索、机器学习、专家智库等因素。
2017年10月13日

生信小白,我是其中之一

。在如此多的积累之下,终于有一天我感觉自己迈过了生信初学者的门槛,不再像以前那么迷茫了。为了让自己的知识能够沉淀下来,于是我跟着转录组继续从RNA-Seq数据分析开始,传到这里便于自己不断修改。
2017年10月11日

生信媛建群了。

后来,媛也想过要不要建立一个讨论群,毕竟大家还是很爱媛的。但自己一无足够的积累,而已有各类Q群,是否有必要再多一个,一直耽搁至今。
2017年10月8日

写给生信公众号运营者的排版指南

机械键盘不是必须的,但是当你用过机械键盘打字之后,每次打字那种“啪啪啪”的感觉,总是会让你沉浸在这种写作的快感之中。当然买机械键盘的话,还是去店里面实际感受一下“啪啪啪”的效果,我目前用的是茶轴。
2017年10月6日

生信软件安装神器

Anaconda是Python的科学发行版,它将各种科学计算工具整合到一个安装包之中,从而使得Python变得无比的强大,就像Linux本身也只是内核,通过整合不同的软件之后才会变得如何的实用。
2017年10月6日

Bin, Bin, Bin!Map, Map, Map Now!(一)

还有,如果你对文章有什么不懂,并且留言难以表达的话,我们还准备了微信交流群哦。扫下面微信二维码添加好友,拉你入群,请注明姓名+生信媛+研究方向。备注不全,我们可能就不能通过好友申请了。
2017年10月3日

进阶的生信媛

后来,媛也想过要不要建立一个讨论群,毕竟大家还是很爱媛的。但自己一无足够的积累,而已有各类Q群,是否有必要再多一个,一直耽搁至今。
2017年10月2日

我在生信媛的200天里

biobabble(每次打这个单词,我都是要小心半天)的Y叔,他推荐的三本关于R语言绘图的叔,让打开新世界的大门,而且帅气得不像实力派,9个R包作者。
2017年10月1日

生信媛养成记—实验汪自学生信之路-biostar handbook

虽然其中大部分人知道生信有用,有心想学,但每天实验到半夜累成狗,那有心情和时间自学编程,基本都没有读我推荐的书超过三页。此外,我要反思的是我推荐教材并不适多数人,反而把大家吓到了,不敢再学生信了。
2017年9月28日

生信媛公众号文章目录

《课程21、22-使用samtools和FreeBayes进行变异的calling并用snpEff注释》
2017年9月26日

生信蓝领,一个不舍得分享的高通量数据分析框架

snp-calling等都已经实现了自动化,这些部分如果再自己一行一行输命令,不但浪费时间,而且缺少重复性。因此,我希望有那么一个框架,能够帮我完成所有的上游分析,从而集中精力解决生物学问题。
2017年9月24日

Biostar(大结局):课程29、30

ftp://ftp.ensembl.org/pub/release-77/fasta/homo_sapiens/cdna/Homo_sapiens.GRCh38.cdna.all.fa.gz #
2017年9月24日

pandas包里面的一个bug

前几天进城碰到了生信媛,媛问:有朋自乡下来,能复写乎。猿答:大丈夫死且不避,区区公众号安足辞乎,待余文章接收,余定笔耕不辍,徐徐周更。生信媛白了猿一眼:不想写直接说,还说啥子文言文。
2017年9月23日

听说你想学Python

也就是说当你理解了编程语言无非就是一门和计算机交流的工具,你就应该本着学习任何一门工具的态度,挖掘这个工具的本质。比如说Perl一行流处理数据。
2017年9月20日

我的R包:zgtools使用指北

这个必须装,感谢Y叔提醒install.package("devtools")source("https://bioconductor.org/biocLite.R")#
2017年9月16日

所有人问生信媛

open("C:/Users/DELL/Desktop/请教徐老师关于python的问题/blastx_getorf_xiaomi_candidate_lncRNA",'r') seq_len
2017年9月15日

Biostar:课程27、28

http://cole-trapnell-lab.github.io/cufflinks/assets/downloads/cufflinks-2.1.1.OSX_x86_64.tar.gz tar
2017年9月14日

比对软件STAR的使用—高通量测序数据处理学习记录(一)

1000000STAR的输出STAR可以根据你的参数设定输出多个结果文件,包含各种信息,下面对默认参数情况下的输出文件做了一个详细的展示,有些不好翻译的地方我选择使用原汁原味的manual
2017年9月13日

Read Counts的提取—高通量测序数据处理学习记录(二)

https://github.com/arq5x/bedtools2/releases/download/v2.26.0/bedtools-2.26.0.tar.gz tar
2017年9月11日

Biostar:课程25、26

https://github.com/arq5x/bedtools2/releases/download/v2.22.0/bedtools-2.22.0.tar.gz tar
2017年9月9日

RNA-Seq选择参考基因组

qulity的设定,要知道RNAseq是反转录的数据,不可能没错误的;并且选择基因组参考序列时,要知道你要干嘛?只是想看个基因的表达,外显子表达,还是想发现新的转录本之类的。
2017年9月8日

要来杯RNA鸡尾酒吗?

但这里,我们采用的是conda进行软件管理,为了保证环境的一致性和稳定性,我重新建立一个虚拟环境,国内用户可以需要添加清华镜像源提高下载速度(后面提到的配置文件里设置了清华镜像源)。
2017年9月8日

编程语言 | R代码风格

千万不要,记住千万不要。因为不同系统对Tab所占空白区域是不同的,对于Python而言,混用直接出错。至于每一行缩进多少就按照你自己喜欢的来,Rstuido默认是2个空格,我觉得挺好看的。
2017年9月6日

祝我生日快乐

当然我现在也想明白了,坚持不过也是一种矫情。刚好,这一年或许是我生长最多的一年,或许是我高中毕业后打字最多的一年了,记录了大量文字在我的简书,公众号,为知笔记,GitHub
2017年9月4日

从NCBI下载测序数据 | 也许是目前最详细的版本

https://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/2.8.2/sratoolkit.2.8.2-ubuntu64.tar.gz tar
2017年9月1日

Biostar:课程23、24

如果大家了解fastq的格式的话,一个spot就是指一条完整的测序信息,包含四个组成:名字、序列、+号(+号后面可以加别的说明信息)和测序质量信息。
2017年9月1日

编程语言 | JavaScript 学习(一)

null}ES6规范Map和Set尽管‘对象’长的其他语言的字典很像,但是它不能将除字符串的数据类型当作key。因此,ES6规范引入的两类数据结构,Map和Set。Map就是字典,存储键值对。
2017年8月31日

算法导论 | 循环不变式与插入排序

保持意味着每次循环开始,循环不变式成立,结束后循环不变式也成立。在这里为每抽一张牌之前,左手的牌都是排序的,并且在抽下一张牌前,左手的牌也经过了排序。
2017年8月30日

友军生信技能树居然要进军婚恋市场

我们会提供符合你标签的1~5人的联系邮箱,那些人的性别目前都是和你不一样的。虽然同性之间也有真爱,但是万一对方只对异性有感觉,那就尴尬了,所以就放弃这一想法。
2017年8月28日

七夕快到了,我们做题目吧

一枚做工良好,重量分布均匀,一枚则不是。做工良好的那粒硬币出现正反面的概率都是相同的,而做工不好的那枚硬币则容易出现正面,概率约为3/4.
2017年8月27日

如何用好MacOS(一)

caskroom/cask/electronic-wechat这是由网页版开源制作的macOS微信,Linux下也有。macOS还可以在App
2017年8月26日

我想买一台Mac

曾在大三下半学期投入数据分析潮流学习之中,也在网易云课堂上参加过Python入门课程。结果Python未必打下基础,却喜欢上MacOS系统,因它UI设计和unix-like系统。
2017年8月25日

Lecture 21 - 使用samtools进行变异的calling

#*这是一个python编写的程序,python用缩进来标明成块的代码,如果缩进有问题,程序也会出错。而微信公众号排版有时候会有一些问题,故建议查看原英文网站,确认自己的这个python脚本没问题。
2017年8月24日

R:关系型数据库管理

21.1')一般而言,增查改删操作最好能够有反悔药。dbBegin(con)会记录一系列操作,直到你呈交修改,dbCommit(con)或
2017年8月23日

科学网:如何姿势正确的抄袭他人代码?

Y叔的回应是:而ppiPre之所以可恶,就是因为违背了开源精神,改函数名、删注释等各种试图去抹除原作者的痕迹,并试图把代码当成是自己的,所以说啊,开源要说人抄袭也很困难,但ppiPre明显就是.
2017年8月21日

一文学会ChIP-Seq数据分析(想想也不可能)

ftp://ftp.ncbi.nlm.nih.gov/geo/series/GSE42nnn/GSE42466/suppl/GSE42466_Suz12_peaks_10.txt.gz gzip
2017年8月18日

Biostar:课程19、20

http://sourceforge.net/projects/samtools/files/samtools/1.1/bcftools-1.1.tar.bz2
2017年8月17日

课题做不下去怎么办(植物篇)?

当你遇到一扇锁住的大门的时候,你该如何打开它。你肯定不会盯着锁孔看,因为如果锁上插着钥匙,这一扇门早就可以打开了。你肯定是需要去其他地方找钥匙。
2017年8月16日

Python数据分析之分组运算

grouped['C'] df.groupby('A').C.agg([np.sum,np.mean,np.std])或者是不同列使用不同函数,比如说对D列计算标准差,对列求平均
2017年8月13日

你有没有说话的资格

他们说的未必有道理,刘强东不知道他媳妇到底漂不漂亮,马云后悔创建阿里巴巴,王健林定了一个小目标。但是他们说的话却被我们所知道,成为谈资,称为传销组织洗脑的语录。
2017年8月13日

像学R一样学Python(高级数据管理)

如下介绍的函数大部分在Python自带库如math,内置函数都有,但是都不是元素级别的,也就是必须要写一个显性的循环函数,和numpy,pandas提供的相比效率相差10~1000倍以上。
2017年8月12日

Biostar:课程17、18

ftp://ftp.arabidopsis.org/home/tair/Genes/TAIR10_genome_release/TAIR10_gff3/TAIR10_GFF3_genes.gff
2017年8月10日

像学R一样学Python数据分析

axis=1)变量重编码重编码涉及到同一变量和/或其他变量的现有值创建新值的过程。比如说,将一个连续性变量修改为一组类别值;将误编码的值替换成正确值;基于一组分数线创建一个表示及格/不及格的变量。
2017年8月9日

水稻如何做KEGG富集分析

Os06t0664200-01,Os02t0534400-01,Os06t0185100-00,Os07t0691100-01,Os04t0485300-01,Os03t0330200-00 -->
2017年8月8日

利用Python进行数据分析笔记(一)

arr[c(4,3,1,6)]注意,如果一次性传入多个索引数据,Numpy会返回一维数组,但是R依旧会返回多维。这是目前第一个与R不太一样,当然和预想的结果也不同。
2017年8月5日

如何“开始”学Python

因此,Python就是一类翻译器,你可以把他看成XX词霸(欢迎植入广告),你查一句,他翻译一句。即便你把全文都打好,他也是一句一句翻译(此处不严谨,只是方便理解而已,因为涉及到字节码)
2017年8月4日

速度是70迈,心情是自由自在

所以在练车的时候,因为教练在旁边,我也就能够放弃了我的一部分安全感,我相信教练能够及时处理紧急情况。所以我就尽力将练习保持在“学习区”,让教练不断发现我的问题,同时锻炼我的心态。
2017年8月4日

如何成为一名合格的司机

practice)是不太耳闻能详的概念,但是你一定听过“一万小时定律”,就是练习一万小时成为专家。这当然是不可能的,必须是刻意练习,才能算是练习。路边下棋的,下的再多也不一定有受过训练的厉害。
2017年8月3日

​什么,你嫌bioconda下载速度太慢?

info文件夹,而不是通常的abyss文件。这表明conda的软件管理方式其实和apt/yum是一致的。如果是自己安装,建议单独建立一个文件夹,便于后续删除。
2017年7月29日

Biostar:课程15、16

http://sourceforge.net/projects/samtools/files/samtools/1.1/samtools-1.1.tar.bz2
2017年7月28日

你知道什么叫做BLAST吗

我第一次听说BLAST是在大二的结束的那个暑假。我不知道BLAST是干嘛的,但是当自己在NCBI上输入一些序列之后,点击确定,过了几分钟跳出一页常常的结果时,感觉自己突然就很厉害了。
2017年7月27日

如何得到贵人相助

那你有没有想过,为什么别人就能遇到贵人,而你却遇不到呢?是不是有一种玄机法门的存在。这的却是存在的,李笑来根据自己的过去的几辈子(七年就是一辈子)得到经验总结了12条原则。其中我认为最重要的原则就是
2017年7月27日

写了100多个shell脚本的老司机的翻车之旅

Windows和Linux交互的时候一定要注意换行符!!!Windows和Linux交互的时候一定要注意换行符!!!Windows和Linux交互的时候一定要注意换行符!!!
2017年7月26日

(伪)从零开始学转录组(8):富集分析

无论是ORA还是FCS都对背景(也就是这个物种一共有多少基因)有要求,但是随着我们的研究深入,基因数量会改变。有些软件会直接设置一个很大的背景数,从而让p值很显著,然后我们就开心地用他们的结果。
2017年7月25日

(伪)从零开始学转录组(7):差异基因表达分析

基本上,统计课都会介绍如何使用t检验用来比较两个样本之间的差异,然后在样本比较多的时候使用方差分析确定样本间是否有差异。当然前是样本来自于正态分布的群体,或者随机独立大量抽样。
2017年7月24日

转录组入门(6): reads计数

这个时候就有一个经常被问到的问题:不同来源的RNA-Seq数据能够直接比较吗?甚至说如果不同来源的RNA-seq数据的构建文库都不一样该如何比较?不同来源的RNA-Seq结果之间比较需要考虑
2017年7月23日

(伪)从零开始学转录组:了解参考基因组及基因注释

然而参考基因组是一部无字天书,要想解读书中的内容,需要额外的注释信息协助。因此第二步,就是去gencode数据库(http://www.gencodegenes.org/)下载基因组注释文件。
2017年7月21日

(伪)从零开始学转录组(5) 序列比对

document.write("昨天在生信技能书树上发的,是我的良心之作。但是不要以为看了就能掌握了,没那么简单的事情。".replace(/\r/g,"").replace(/\n/g,"").replace(/\s/g,"
2017年7月21日

Biostar:课程13、14

从SourceForge获取的URL是比较复杂的,因为SourceForge希望你去访问网址并从网址上下载,这样你可以看到网页投放的广告。
2017年7月20日

我的转录组学习小书

有一天,当我继续把自己的学习笔记抢鲜版的PDF发到我的转录组密友辅导群(我的小密圈好多小伙伴都在学习RNA-Seq,为了感谢他们的支持,所以就专门建立了这个群)时,Y叔说我可以建立一个GitHub
2017年7月19日

利用Docker搭建Galaxy

https://docs.docker.com/docker-for-windows/https://hub.docker.com/r/bgruening/galaxy-stable/
2017年7月15日

转录组入门(3):了解fastq测序数据

在测序过程中,机器会对每次读取的结果赋予一个值,用于表明它有多大把握结果是对的。从理论上都是前面质量好,后面质量差。并且在某些GC比例高的区域,测序质量会大幅度降低。
2017年7月14日

世上没有白走的路,每一步都算数

后来学习生物信息学,也就是去年的事情,在安装生信软件折腾中被bioconda解救。当时发现,只要在conda中添加如下channel,就能非常便捷的安装生物信息软件了。之前还专门写了一篇文章介绍:
2017年7月13日

(伪)从零开始学转录组:读文章拿到测序数据

FTP网址ftp://ftp-trace.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByStudy/sra/SRP/SRP075/SRP075747
2017年7月12日

(伪)从零开始学转录组:软件安装

https://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/2.8.2-1/sratoolkit.2.8.2-1-ubuntu64.tar.gz tar
2017年7月11日

深入学习ggtree: read.tree()是如何解析newick数据格式

tmp) }character用于创建空字符串所组成的向量。接着用for循环,根据之前的位置信息,把数据读入到STRING中。R里面用paste组合多个字符。gsub("\\[[^]]*\\]",
2017年7月9日

Python如何解析fasta格式,并储存为字典?

>seq1 ATGGGTGTGTGTGTG >seq2 ATGTGTTTGTGTGCTCCTCCTC >seq3 AACGTCGTGACGGGTGCGTGGTGTGTGTCCAA>
2017年7月6日

D2多巴胺受体和王者荣耀

因此,当大家玩游戏的时候,大脑就会产生一定量的多巴胺。尤其当你看到victory的时候,你会更加开心。于是你就不停的玩,产生多巴胺,让大脑开心。
2017年7月5日

新司机带你学RNA-Seq数据分析

错误率T1复杂度最低,T3最高。随后使用了目前主流的比对工具进行了比对。因为RNA-Seq测序的特性,天然的会有一部分数据延伸到内含子区,这部分跨越外显子和内含子的reads就称为『junction
2017年7月3日

落入窠(ke)臼(jiu):GATK best practice每个步骤都是必须的吗?

region(困难的区域,会蹦英语就是开心),是二代测序难以覆盖的,金标准费了好大的力气,都没能把这个地方覆盖上。所以那些地方根本不是二代测序能够分析的,96%约等于100%.
2017年7月2日

你还在用韦恩图可视化集合么?

基本上我不用过多和你解释图示,你也能很快的找到答案。图中黑色表示该位置有数据,灰色的点表示没有。不同点连线表示存在交集。具体数据可以看上面的条形图。不同类型的数据的总量看左边的条形图。
2017年6月30日

关于序列联配的清单

alignment)。无论是寻找同源基因,构建系统发生树,还是高通量数据分析,都依赖于最基础的序列联配知识。因此,当夸夸其谈高通量测序数据分析的时候,你可能需要了解一些关于序列联配的基础知识。
2017年6月29日

3步搭建个人博客

http://www.liaoxuefeng.com/wiki/0013739516305929606dd18361248578c67b8067c8c017b000还有GitHub
2017年6月25日

和我一起搭建个人博客吧(二)

比较重要的概念是外键(ForeignKey)和多对多(ManyToManyField)的关联关系。所谓的外键就是一对多,也就是说一个分类可以对应多个文章,但是文章只能对应一个分类。效果如下:
2017年6月24日

和我一起搭建个人博客吧(一)

再次读以前写的教程,同样的文字,却读出了不同的感觉,或许自己的能力的确有所提高吧。目前为了全面的学习Python,我决定从三个方向:爬虫,Django建立博客,
2017年6月23日

单细胞测序数据分析:软件安装篇

supported source("https://bioconductor.org/biocLite.R") biocLite("RUVSeq")聚类pcaReduce
2017年6月22日

Y叔的新玩意--yyplot

devtools::install_github("GuangchuangYu/yyplot")如何使用首先你需要加载一些必须包,比如说绘图所需要的ggplot2,
2017年6月21日

用Python做爬虫:基础知识篇

在了解爬虫的定义之后,那么再来看看爬虫是如何工作的吧。第一步:发起请求。一般是通过HTTP库,对目标站点进行请求。等同于自己打开浏览器,输入网址。第二步:
2017年6月20日

如何用bioconductor进行注释

对于一个或几个基因而言,NCBI,EBI,TAIR等网站够用了,但是对于高通量数据分析的结果,你还要一个一个查的话,那就是有点费劲了。(尴尬的是,我第一次寻找突变位点就是靠我手工注释结果)。
2017年6月18日

perl模块异常symbol lookup error的解决方式

结果:刚开始看着好像能用了,的确能用了,但由于很多软件依赖的perl脚本起头就是/usr/bin/perl,管理员给我用的测试脚本改成了/usr/bin/env
2017年6月16日

我是如何做生统作业的-答案修正版

p.value<-apply(data2,1,function(x)wilcox.test(x[seq(1,11,2)],x[seq(2,12,2)],paired=TRUE,alternative
2017年6月15日

我就是Super Star——基因定位之BSA

https://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/2.8.2-1/sratoolkit.2.8.2-1-centos_linux64.tar.gz
2017年6月14日

我是如何做生统作业的-2015年试题

p.value<-apply(data2,1,function(x)wilcox.test(x[seq(1,11,2)],x[seq(2,12,2)],paired=TRUE,alternative
2017年6月9日

我是如何做生统作业的-2014试题

1.298421各种统计函数,数学函数请翻到R语言实战的高级数据管理。这里划重点,我觉得apply是必考的内容,具体说明点传送门,不懂好好去看,看了还是觉得不懂的,你只能请我喝咖啡了。
2017年6月8日

是时候来一波RNA-Seq差异表达分析实操了

unique(c(rownames(res1SigDown),rownames(res2SigDown),rownames(res3SigDown))) length(sigDownGene) #
2017年6月5日

基因表达分析(前传)-准备count矩阵

http://www.ebi.ac.uk/arrayexpress/files/E-MTAB-5130/E-MTAB-5130.sdrf.txt然后根据数据说明文件提供的FTP链接下载
2017年6月3日

有了它,再也不怕斗图了

其实这个功能对我而言,没有多大意义,所以我一直是没有打开的。直到今天我无聊逛表情市场发现居然可以用搜一搜找表情了。感觉自己发现了一个新大陆,抑制不住自己愉悦的兴趣想和大家说说。
2017年6月2日

基因表达分析(中)-富集分析

无论是ORA还是FCS都对背景(也就是这个物种一共有多少基因)有要求,但是随着我们的研究深入,基因数量会改变。有些软件会直接设置一个很大的背景数,从而让p值很显著,然后我们就开心地用他们的结果。
2017年5月30日

基因查找者v1.5

经过几天的努力,我之前不完善的小功能现在升级到1.5版本。由于微信公众号在开发模式下折腾下面的选项栏特别费劲,于是把这个功能放到很久之前注册的公众号了。所以想继续玩的小伙伴,只能麻烦大家关注下了。
2017年5月27日

差异基因表达分析(上)

被评为1998年度自然科学领域十大进展之一。他的基本原理通过设计专门的短核苷酸作为探针,把这些探针固定在专门的基片表面,然后用样本的cDNA进行杂交,根据杂交信号的强弱来判断基因表达的程序。
2017年5月26日

我开发了一个不完善的功能

功能很不完善,因为我想知道你们还有什么需求,请在留言区留言,我会努力实现。此外,功能在这一个月内不会有太多改善,因为要忙着准备PPT,准备期末考试。所以求谅解。
2017年5月24日

系统进化树构建的简单实践

含gap多的位点和对齐不好的位点切掉,再构树。构树不同的方法和不同的软件对gap的处理也不一样,可以选择有gap的位点不用,也可以选择部分包括或完全包括gap,看看构树的结果是否合理,支持率够不够高
2017年5月20日

我的一些胡思乱想

那么最后有人会问:“如果你不相信因果律,你该如何过日子呀”。很简单,在没有出现更好的解释前,我姑且认为因果律能够解决一定问题,先用着。但是我依旧会对它保留怀疑,对那么看起来必然的事情保留自己的观点。
2017年5月19日

eval--一层一层剥开我的心

$0为该脚本的名称,$1是传递给脚本的第一个参数;$2是传递给脚本的第二个参数;$#是传递给脚本的参数总个数,我们也可以通过\$$#拿到这个脚本最后一个参数的内容。运行一下这个脚本并传递参数a,
2017年5月16日

ANNOVAR的使用

AC=6;AF=1.00;AN=6;DP=31;ExcessHet=3.0103;FS=0.000;MLEAC=2;MLEAF=1.00;set=variant-variant2-variant3
2017年5月15日

Linux修改目录颜色

生信媛,从1人分享,到多人同行。坚持分享生信入门方法与课程,持续记录生信相关的分析pipeline,
2017年5月7日

GATK之SelectHeaders和RandomlySplitVariants

VCF文件通常是拥有许多header信息的,但是实际上某些步骤不需要那么多信息,所以我们需要利用SelectHeaders进行选择。
2017年5月5日

GATK之FastaStats和CountReads

使用的时候记住,对于XXXXFilter,你需要点每个过滤选项进去看下具体用法,比如说我需要过滤比对质量低于20的,我发现MappingQualityFilter的用法解释是
2017年5月4日

GATK之HaplotypeCaller

practice写在2015年,现在是2017年,GATK的版本到3.7,下一个版本就是4.0了,所以很多工具都不能想当然的用了。比如说之前写的BQSR,有一篇文献就说已经没有必要了,文献名见下:《
2017年5月3日

GATK之BaseRecalibrator

document.getElementById('js_content').addEventListener("selectstart",function(e){
2017年5月2日

如何使用R的apply

是一个数组(array),也就是说输入必须都是相同类型的数据,要么都是数值型,要么都是字符型。如果是一个混合数据类型的data.frame,那么就会尝试用as.matrix强制转换数据
2017年5月1日

快速入门GATK

tools的MarkDuplicates.jar去重。这是因为二代测序有一部桥式PCR扩增底物的过程,在100x以上出现reads重复,很大可能是PCR扩增重复了,所以可以直接去掉。
2017年4月29日

方差分析

进一步,假设志愿者使用了抑郁症的自我评价报告,比如XX,记录了他们的抑郁水平,那么你可以在评价疗法类型的影响前,对任何影响抑郁水平的组内差异进行统计学调整。XX为协变量,该设计为协变量方差分析
2017年4月28日

基因能告诉我什么

喝酒不脸红,都不知道如何跟别人说我喝多了呢。深度睡眠长真的是一件好事呀,感觉自己的睡眠质量优点高呢。血型也和我大学献血的结果一样。当时和我同学一起献血,检测出两个B,简称2B。
2017年4月25日

来一张微信好友头像全家福吧

pillow原理使用itchat访问微信网页客户端,接着爬通讯录好友的头像的图片,之后使用PIL对图片进行拼接,最后用itchat把结果发送到文件助手。
2017年4月24日

Biostar: 课程11、12

ftp://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/ncbi-blast-2.6.0+-x64-macosx.tar.gz
2017年4月22日

我的Linux学习笔记·用户和组(2)

上周提到用户管理的两个重要文件:/etc/passwd和/etc/shadow。用户组也有重要的配置文件,即/etc/group,文件的内容是用户组的相关信息。
2017年4月18日

我是如何做生物统计作业的

题目a要求是对每一个基因进行t.test,并且要根据方差是否相等,设置参数。显然不能简单的使用apply(x,FUN=t.test())。因此需要自己提供FUN
2017年4月17日

Biostar: 课程9、10

http://www.amazon.com/Understanding-Bioinformatics-Marketa-Zvelebil/dp/0815340249
2017年4月13日

Bioconductor序列数据介绍

import(test_bed,format="bed") testAnnotationHub同样包括多种基因组注释文件(BED,GTF,BigWig),使用rtracklayer
2017年4月11日

R语言的数据管理

data.frame(manager,date,country,gender,age,q1,q2,q3,q4,q5,stringAsFactors=FALSE)实际操作1.创建新变量
2017年4月10日

我的Linux学习笔记·用户和组(1)

用户的默认shell。CentOS发行版的默认shell是bash,此处root和sxy等用户的默认shell是/bin/bash,而系统用户的是/sbin/nologin,这代表该用户无法登录。
2017年4月9日

由两类错误所带来思考

我们生长的环境,成长的经历会让自己不可避免的带上偏见,或者叫先验概率。所以每当做出一个选择都不可避免都会犯错,所谓的成长就是不断犯错,修正自己先验概率,而认知升级就是抛弃固有的模型,使用更好的模型。
2017年4月7日

Biostar:课程7、8

详情参见Linux安装指南:http://www.personal.psu.edu/iua1/courses/code-repository-2014.html#chromebook
2017年4月6日

生信人修炼手册

上周的投票中,有42%的人表示自己对生物信息学有很大的兴趣,想成为一名bioinformatician,虽然就52个人参加。所以本周的文章主要是讲如何成为一名bioinformatician.
2017年4月3日

我的Linux学习笔记·文件权限

我们新建一个文件b,它的权限是-rw-rw-r--.,我们想让a的权限变得和b一样,可以使用--reference选项:
2017年4月2日

Biostar课程:5、6

document.getElementById('js_content').addEventListener("selectstart",function(e){
2017年3月30日

生信软件的好帮手-bioconda

https://repo.continuum.io/miniconda/Miniconda3-latest-Linux-x86_64.sh wget
2017年3月28日

欲用神器,必练内功

new_test.gff管道:优美且强大Unix的一个设计哲学就是整合小程序完成大任务。Linux作为一个类Unix系统,也继承这个思想。管道|就是负责一种整合多个单任务的小程序来完成复杂的任务.
2017年3月27日

生信数据预处理的Linux三大神器

awk擅长处理表格形式的数据。它逐行从文本中读取数据,将整行数据(record)定义为$0,然后根据指定的分隔符,将各列数据(record)分别定义为$1,$2,$3
2017年3月27日

我的Linux学习笔记·Bash特性和文件名通配

Tab具有命令补全功能,比如我们要输入一个命令history来查看命令历史,我们只需要输入hist,然后摁tab键,系统就会自动帮我们补全成history.
2017年3月26日

小明的GWAS情劫

大家想想,如果小红的出勤率和玻璃被砸率不是百分百吻合,或者小红处的对象不止小明一个,同时班上其他同学也有在玻璃被砸的时候缺席呢?再或者小明是团伙作案,不止一人呢?是不是情况变得复杂多了?
2017年3月24日

Biostar:课程3、4

http://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/2.3.5-2/sratoolkit.2.3.5-2-ubuntu64.tar.gz
2017年3月23日

生信分析中基本Linux命令的使用

在拿到一个纯文本文件后,第一步肯定是想看下这个文件的大致内容。但是如果在文件特别大的时候直接用cat,结果就是瞬间爆炸,啥都看不清,比较好的命令就是head,tail,less。
2017年3月21日

我的Linux学习笔记·Linux操作系统基础

通过上面我们了解了什么是linux系统以及它的根文件系统,基本都是一些理论知识,但是个人觉得了解这些知识还是挺有必要的。后面,如果我们要想真正开始使用linux系统,首先还要学会一些基本的命令,如:
2017年3月19日

Biostar:课程1、2

http://downloads.yeastgenome.org/curation/chromosomal_feature/saccharomyces_cerevisiae.gff
2017年3月16日

我的Linux学习笔记·序

我是一只科研狗,乳名阿现。今天是植树节,祝大家植树快乐。鉴于我的蚂蚁森林已经养成了一棵树,以及周围好像没有地方给我种树,我就在实验室浇了浇花,也算是为祖国的绿化大业添砖加瓦。
2017年3月12日

生信交流QQ群

(TCGA,CCLE,GTEx,IMGT,TIGR,ICGC,GWAS,COSMIC,ExAC,1000genome,hapmap,ENCODE,OMIN,uniprot,proteinatlas)
2017年3月3日

小白生信学习记5:HTseq的安装

https://sourceforge.net/projects/numpy/files/NumPy/1.11.2/numpy-1.11.2.tar.gz
2017年3月2日

【课程预告】手把手教你入门生信——The Biostar Handbook

另外,他是生信方面有名的网站Biostar(https://www.biostars.org/)的创始人。我曾在这个网站上发过帖子提问,很快就得到了非常专业的回答。
2017年2月27日

小白生信学习记4:Linux系统下,RNAseq分析软件的安装

过一小段时间,会出现2个文件。SRR1553610_1_fastqc.html和SRR1553610_1_fastqc.zip。这两个文件可以导出到本地电脑去打开查看。
2017年2月23日

find和xargs连用虽好,但用起来要小心哦~

BlaBla等等。因为个人喜好缘故,他喜欢用空格来分隔文件名里的字符串。然后你点进去一看,全部是perl(破)代码。作为python爱好者的你,决定将它弃之如敝履。
2017年2月19日

小白生信学习记(三)转录组分析流程

在拿到这些质控后的数据后,我们也可以自己亲自用软件(如:Fastqc)查看一下数据是否符合要求。如果感觉还不满意,也可以自己使用软件进行质控(比如:trimmomatic,Trim
2017年2月16日

基因组分析:共线性作图

大家好,新的一年开始了,我们又见面了。不知道在过去的一年里你们有哪些成长和进步呢?从我毕业到工作这半年来,收获了很多,也经历了很多。希望在新的一年里,我能够陪伴大家一起成长,一起进步!
2017年2月15日

我谨慎地使用了rm -fr,为什么还是导致了灾难?

没过多久,这件事就发生在了自己的身上,囧。事情是酱紫的,实验室的二师兄向来神通广大,以收集各种难找的参考基因组,注释文件闻名,有一天我找他要一个物种的参考基因组。师兄直接给我ln
2017年2月14日

linux shell tricks for bioinformatics系列文章之三: 内附部分sRNAs分析pipeline

拿到上述代码的输入文件之后,用excel打开,一步操作就可以出来如下的长度分布图。虽然图片不好看,但是却能清楚地表达数据本身的信息,即sRNAs的长度分布图的峰值是21nt左右。
2017年2月9日

用python爬取一个网站的所有生物信息学习资料,附代码

明天就要回家,今天还要熬夜赶合作者的分析报告,但是答应了姊如同学的每周写一篇公众号又不能轻易违背,所以翻出了我以前写的一个python脚本来作为本周的推送内容(求原谅)。
2017年1月20日

基因组分析:Circos作图基础(三)

大家好,很高兴又跟大家见面了,上一周我们画出了一个看起来还不错的基因组圈图,但是跟我们的目标还是有一些差距,所以今天我将把该图的终极画法写出来,供大家参考。
2017年1月17日

小白生信学习记(二):服务器及其使用介绍

但使用者众多,就会带来一些问题:如果每个人都可以任意在服务器上修改存删,服务器很快就乱七八糟了。如若不小心误删关键文件,后果更是不堪设想。所以,就有了专门的管理员。管理员拥有最高的权限去删改与安装。
2017年1月12日

基因组分析:Circos作图基础(二)

我们把这个信息单独放在一个文件里面,例如sensegene.gff(正义链),然后再建立一个文件,存放antisensegene.gff(反义链),接着在配置文件circos.conf写下列代码:
2017年1月10日

用python制作抽奖券,附全部代码

然后将这些数字对应的图片依次粘贴到一起,最后添加上二维码。再说通俗一点,就是先用PIL准备一块合适大小的画布,然后将图片依次画上去。
2017年1月9日

小白生信学习记(一)· 转录组基本知识及简单的linux命令入门

dT),把它一头固定在某种基质上,他就可以通过亲和能力(想象它像一个磁铁),把含有polyA的这部分mRNA给拉取得到。这样,我们就能富集到mRNA了。
2017年1月5日

用Rodeo----python里面的rstudio,打造数据分析和可视化的利器

因为墙的缘故,有些读者可能上不去redeo和anaconda的官网,没关系,我将redeo的软件和anaconda软件(windows版本)传到了百度云,有需要自己下,链接见文末。
2017年1月4日

基因组分析·Circos作图基础(一)

接下来就是一个最重要的文件,核型文件karyotype的配置,这个文件是圈图的基础,它定义了每个染色体的大小。我们再次打开VIM编辑器,新建karyotype.txt文件,填写下列信息:
2017年1月3日

生信媛全家福

同时,由精于基因组和比较基因组分析的三土主笔的《基因组分析》系列文章也将在明年推出,敬请期待。欲知详情,请移步基因组分析之预告篇。
2016年12月31日

预告:基因组分析

我主要的研究方向是基因组学和比较基因组学,所以今后我主要为负责这一块的内容。基因组学的知识非常多非常复杂,所以今后哪里有说得不对的地方,请大家多多指教。
2016年12月31日

linux shell tricks for bioinformatics系列文章之二

本来准备把这种解法也算一个,但是这种方法依然有一个问题,那就是质量行是有可能是以@开头的,这样做就会导致有点点误差,虽然也不会差太大。
2016年12月28日

Linux shell trick for bioinformatics 系列文章之一

用Trinity坐组装的之后得到的fasta格式的转录组文件,我们要做注释的话,有些header可能过长,所以我们要将header给截短些,仅保留最关键的信息。
2016年12月25日

绕过root权限,如何使用GFOLD进行差异表达分析一:GFOLD的安装

等号后边换成你自己的安装路径,之后同样的字符也请自行替换。如果不指定会默认装到系统目录,因为没有写入权限,肯定会出现令人痛苦的Error,
2016年12月25日

从入门到走火入魔,一个做湿实验的生物汪自学生物信息嬗变为生信媛的故事

然余求学植生所,多可喜,亦多可悲。日日筛突种苗,学程日久,心智渐钝,气色亦日渐消沉,难有喜色。一日师姐赠余一课题,余自是大喜,寻导师而告之。师沉吟良久,曰:如,汝至吾课题组久矣。焉有课题结题乎?
2016年12月24日