基因编辑技术CRISPR的设计软件和分析软件选择精选
来源:生物通、奥维森基因科技
近年来科学界最热门的话题莫过CRISPR,有人说,CRISPR是一把“分子剪刀”,是个基因组编辑的小工具,也有人说,CRISPR是一把“万能钥匙”,能打开人体基因组的万千宝藏。
什么是CRISPR?
CRISPR ( Clustered Regularly Interspaced Short Palindromic Repeats )是生命进化历史上,细菌和病毒进行斗争产生的免疫武器,简单说就是病毒能把自己的基因整合到细菌,利用细菌的细胞工具为自己的基因复制服务,细菌为了将病毒的外来入侵基因清除,进化出CRISPR系统,利用这个系统,细菌可以不动声色地把病毒基因从自己的染色体上切除,这是细菌特有的免疫系统。
微生物学家10年前就掌握了细菌拥有多种切除外来病毒基因的免疫功能,其中比较典型的模式是依靠一个复合物,该复合物能在一段RNA指导下,定向寻找目标DNA序列,然后将该序列进行切除。
许多细菌免疫复合物都相对复杂,其中科学家掌握了对一种蛋白Cas9的操作技术,并先后对多种目标细胞DNA进行切除。这种技术被称为 CRISPR / Cas9 基因编辑系统,迅速成为生命科学最热门的技术。
CRISPR / Cas9基因编辑会导致基因组产生一系列突变包括插入、缺失、碱基替换。高深度的目标区域扩增测序或全基因组测序(WGS)都可以精确的检测出靶向基因突变。
图1 CRISPR原理图
CRISPR设计软件介绍
CRISPR技术的广泛应用也带动了软件开发的热潮。自2013年1月以来,如今已有33个CRISPR软件工具发表。工具多本是好事,只是对于新手而言,到底该使用哪个软件,似乎很难决定。巴斯德研究所的专家Cameron MacPherson对此给出了一些建议。
MacPherson比较了多个sgRNA设计软件,并设计出一款名为CRISPR Software Matchmaker的工具,让你可根据项目需求来选择出最佳的CRISPR软件。这个工具比较了各个软件的8大类特征,从基本功能到高级功能,以及用户交互等。
MacPherson认为,基本功能体现了软件的主要目标,应该放在首位来考虑。这类功能包括“单一靶点设计”、“多个靶点设计”、“脱靶察觉”、“近似设计”、“经验设计”等。之前,这些工具只能针对NGG PAM靶点来设计,但到了2014年年底,它们允许PAM的任意定义。
高级功能包括“SNP察觉”、“二级结构察觉”等。这些并不是必要的,但可能非常有用,这要取决于设计目标。目前比较少的工具带有这些高级功能。此外,还有一些实用功能,如“多重设计”、“多方法设计”等,有望加速sgRNA的设计过程。当然,用户交互的特征也决定了软件是否好用。
说了这么多,你可能还是一头雾水。那么,到底该用哪个软件呢?
MacPherson认为,对于那些之前开展过CRISPR实验的实验室,他们最好将过去的结果与软件的设计进行比较,以评估每个软件的预测能力。对于那些刚刚踏入sgRNA设计领域的新手,最好是根据当下的需求来选择,并在几次实验后重新评估。不过,MacPherson也给了一些建议。
新手的最佳工具:初来乍到,你需要熟悉一下语言,并了解各个参数代表什么。
MacPherson认为最好的边做边学工具是E-CRISP。作者在设计时花了很多工夫,能够提供详细的参数解析。E-CRISP分析假定设计的靶点特异性,并评估它们的基因组背景(如外显子、转录本、CpG岛)。
生物学信息学家的最佳工具:也许你更在意分析的灵活性,你需要访问原始数据、靶位点、脱靶位点以及各种统计参数。对此,MacPherson建议你使用Cas-OFFinder。它能够提供所有字符串的数据转储。你可以在线使用,也可以下载软件,在任一台启用OpenCL硬件的计算机上使用。
对于那些希望将CRISPR技术转移到一个新物种的研究人员而言,MacPherson建议使用ProtospacerWB。它就是为新物种的应用而开发的,是个离线工具,但带有图形用户界面。
MacPherson认为,实验室应事先确定需要软件工具做什么,才去选择。大家可以利用CRISPR Software Matchmaker来根据需求选择软件工具。不断优化你的标准,直到你找到最佳的工具。然后,开展几次实验,并根据结果来重新评估工具。这样才能确保好的结果。
CRISPR分析软件介绍
CRISPResso是一套用于定性和定量评价基因组编辑技术的计算工具,它提供了一个集成的、友好的用户界面,在这里,生物学家可以和生物信息学家一样进行操作。
图2 执行流程
安装说明
最新版本:CRISPResso-1.0.3
运行环境
1. python 2.7 Anaconda: http://continuum.io/downloads
2. Java: http://java.com/download
3. C compiler / make.
安装方法
1. 使用pip命令安装:
pip install CRISPResso --no-use-wheel --verbose
2. 官网下载安装:
下载后放到Linux目录下,解压后执行:
python setup.py install
3. 其他安装方式,可参考官网链接:
https://github.com/lucapinello/CRISPResso
使用指南
常用软件参数
-r1 or --fastq_r1 reads1.fq文件
-r2 or --fastq_r2 FASTQ_R2 reads2.fq文件(双端测序)
-a or --amplicon_seq 扩增序列
上面介绍的是软件最为常用的参数,掌握这些参数基本能满足日常的分析需求。如需高大上的参数,就接着往下看~
-q, or --min_average_read_quality 过滤低质量reads
-s or —min_single_bp_quality 过滤包含低质量碱基reads
--min_identity_score 过滤比对质量
--trim_sequences 使用Trimmomatic cut接头序列
--min_paired_end_reads_overlap reads1和reads2的overlap的长度
--ignore_substitutions 不检测SNP
--ignore_insertions 不检测插入
--ignore_deletions 不检测缺失
操作案例
为方便大家进一步理解原理,小编专门为大家准备了一些应用案例。下面就随小编一起操练起来吧。
命令行:
CRISPResso -r1 reads1.fastq.gz -r2 reads2.fastq.gz -a GCTTACACTTGCTTCTGACACAACTGTGTTCACGAGCAACCTCAAACAGACACCATGGTGCATCTGACTCCTGAGGAGAAGAATGCCGTCACCACCCTGTGGGGCAAGGTGAACGTGGATGAAGTTGGTGGTGAGGCCCTGGGCAGGTTGGTATCAAGGTTACAAGA
结果解读
• CRISPResso_RUNNING_LOG.txt: 软件执行日志;
• Mapping_statistics.txt: 统计输入和预处理后及比对上的reads数.
• Quantification_of_editing_frequency.txt: 统计基因编辑情况,及reads支持变异情况.
• effect_vector_combined.txt: 变异位置;
• effect_vector_deletion.txt : 缺失位置;
• effect_vector_insertion.txt: 插入位置;
• effect_vector_substitution.txt: 替换位置.
• position_dependent_vector_avg_insertion_size.txt: 插入长度.
• position_dependent_vector_avg_deletion_size.txt: 缺失长度.
• indel_histogram.txt: 画图3的中间文件
图3 Indel的分布情况
• insertion_histogram.txt,deletion_histogram.txt,substitution_histogram.txt: 画图4的中间文件
图4 变异分布情况
其他功能
CRISPResso工具不仅可以分析单个样本数据、多个样本混池数据、WGS 数据,还可以做样本间比较分析。 CRISPResso四大工具功能如下:
1. CRISPRessoPooled: 主要是用来分析混池数据
2. CRISPRessoWGS: 分析全基因组数据
3. CRISPRessoCompare:比较两个样本的CRISPResso分析
4. CRISPRessoPooledCompare: 比较两个样本的CRISPRessoPooled 或CRISPRessoWGS分析
图5 CRISPResso工具.
参考文献:
Pinello L, Canver M C, Hoban M D, et al. Analyzing CRISPR genome-editing experiments with CRISPResso.[J]. Nature Biotechnology, 2016, 34(7): 695-697.
相关文章推荐: