USEARCH11发布,新功能简介
USEARCH是继Mothur、QIIME后的第三大流行扩增子分析流程,目前引用7296次。由Robert Edgar大神独立编写。官方网址:http://www.drive5.com/usearch/
详细介绍,请参阅
软件优缺点
优点
跨平台
体积小巧
易用
缺点
软件64位版收费
代码不开源
v11新功能
就在2018年7月末,USEARCH(Ultra-fast sequence analysis)扩增子分析神器迎来了其第11个大版本,
具体有哪些新功能呢?
详见此页:
http://www.drive5.com/usearch/manual/whatsnewv11.html
主要新增了6大新功能,21个新命令,下面进行简介。
新特征
机器学习:主要包括随机森林、多次交叉验证、OTU分类重要性,包括的命令有森林训练、森林分类和森林交叉验证
改进嵌合体检测
新增了两种Alpha多样性指数: Mirror estimator、 Singleton-free (FE) estimator
Octave plot(八度图)展示Alpha多样性,方便观察样本品中真实序列、测序错误和嵌合体数量
样品组间多样性比较
同一性交驻验证特征预测的准确率
新命令
calc_lcr_probs: Calculate lowest common rank probabilities 计算序列物种分类各级概率
cluster_tree: Construct clusters from tree using distance cutoff 基于树文件聚类
distmx_split_identity: Split distance matrix into test/training pair for CVI 拆分距离矩阵为测试和训练集
fastx_syncpairs: Sort forward and reverse reads into the same order 双端序列找成队并排序
fastx_trim_primer: Remove primer-binding sequence from FASTx file 引物匹配并切除
forest_classify: Classify data using random forest 随机森林分类预测
forest_train: Train random forest classifier 随机森林分类器建立
nbc_tax: Predict taxonomy using RDP Naive Bayesian Classifier algorithm 采用RDP算法预测分类学物种注释
otutab_binary: Convert OTU table with counts to presence(1) / absence(0) 转换OTU表为二元(有、无)形式
otutab_forest_classify: Classify samples using random forest 样品随机森林分类
otutab_core: Identify core microbiome in OTU table 鉴定OTU表中核心微生物组
otutab_forest_train: Train random forest classifier on OTU table 基于OTU表的随机森林训练
otutab_otus: Extract OTU labels from OTU table 提取OTU表中的OTUs
otutab_rare: Sub-sample OTU table to same number of reads per sample 抽样标准化OTU表
otutab_samples: Extract sample labels from OTU table 提取OTUs表中样品名
otutab_select: Identify OTUs which are informative (correlate with metadata) 鉴定更有信息的OTUs,,即组间差异OTUs
otutab_xtalk: Identify cross-talk using improved algorithm (UNCROSS2) 改进算法鉴定嵌合
search_pcr2: In-silico PCR, search for matches to primer pair 电子PCR,基于引物匹配扩增区
subtree: Extracts subtree under given node 提取树中指定结点的子树
tabbed2otutab: Convert read mapping file (read+OTU) to OTU table 单行表格转换为OTU表
tree_subset: Extract subset of tree for given set of leaf labels 根据树叶标签提取子集
猜你喜欢
10000+:菌群分析 宝宝与猫狗 梅毒狂想曲 提DNA发Nature Cell专刊 肠道指挥大脑
文献阅读 热心肠 SemanticScholar Geenmedical
16S功能预测 PICRUSt FAPROTAX Bugbase Tax4Fun
生物科普: 肠道细菌 人体上的生命 生命大跃进 细胞暗战 人体奥秘
写在后面
为鼓励读者交流、快速解决科研困难,我们建立了“宏基因组”专业讨论群,目前己有国内外1800+ 一线科研人员加入。参与讨论,获得专业解答,欢迎分享此文至朋友圈,并扫码加主编好友带你入群,务必备注“姓名-单位-研究方向-职称/年级”。技术问题寻求帮助,首先阅读《如何优雅的提问》学习解决问题思路,仍末解决群内讨论,问题不私聊,帮助同行。
学习16S扩增子、宏基因组科研思路和分析实战,关注“宏基因组”
点击阅读原文,跳转最新文章目录阅读