首页
下载应用
提交文章
关于我们
🔥 热搜 🔥
1
1
2
李思坤
3
朱胄
4
继续者张付
5
胡长白
6
继续者 佛教
7
004
8
bxss.me
9
百度
10
今日热点
分类
社会
娱乐
国际
人权
科技
经济
其它
首页
下载应用
提交文章
关于我们
🔥
热搜
🔥
1
1
2
李思坤
3
朱胄
4
继续者张付
5
胡长白
6
继续者 佛教
7
004
8
bxss.me
9
百度
10
今日热点
分类
社会
娱乐
国际
人权
科技
经济
其它
震撼!上海开放Google、Meta等国际平台,中国数字化迈出历史性一步!
战争烈度再升级,特朗普加征10%对华关税
特朗普称计划对中国商品征收25%的关税,外交部回应
从地方目标看全国!今年经济增长还是有很高要求
二姐李思林早知道李玟有轻生的念头,居然没一点防备措施!
小白鱼的生统笔记
筛选:
全部
仅被删
排序:
热门
实时
其他
分子生态网络分析(MENA)构建微生物网络示例
dataset”上传OTU表。该界面中红字部分即为上述提到的注意事项,对上传数据的基本要求。蓝字部分是对可能的提交错误的解释,如果出现错误,请首先检查格式是否有误。
小白鱼的生统笔记 -
2020年3月5日
其他
CoNet的关联网络推断过程演示
CoNet的关联网络推断方法演示CoNet是一个关联网络推断工具,作为Cytoscape的一个插件来使用。CoNet的设计具有通用性,广泛用于检测生物实体(例如基因、代谢物或物种)的任何数据集中的潜在关联(Faust
小白鱼的生统笔记 -
2020年3月2日
其他
微生物共发生网络中节点度的幂律分布和在R中拟合(更正)
微生物共发生网络中节点度的幂律分布和在R中拟合非常抱歉先前的文档出了计算错误,修改后重新发送下,还望大家见谅。(感谢大佬指出问题,先前错在置换检验那一步中,以此篇为准)在提到微生物共发生网络分析的文献中,通常会在附录中出现类似这样的图,绘制了网络节点度的频数分布,并拟合了幂律分布,告知大家网络图的节点度具有这种分布特征。
小白鱼的生统笔记 -
2020年3月2日
其他
微生物关联网络推断及一个简单的相关网络示例
微生物关联网络推断及一个简单的相关网络示例生物系统通常表示为复杂的二元相互作用集或不同实体之间的关系。系统生物学的目的是在系统层面理解生物实体,除了在单组件(individual
小白鱼的生统笔记 -
2020年3月1日
其他
网络模块内连通度(Zi)和模块间连通度(Pi)及在R中计算
模块内连通度(Zi)和模块间连通度(Pi)的定义有关网络模块的定义可参考前文“网络图的凝聚性特征”,在网络模块的基础上衍生出了两个重要的节点特征,模块内连通度(Within-module
小白鱼的生统笔记 -
2020年2月29日
其他
网络拓扑结构-网络图的凝聚性特征和R计算
网络拓扑结构-网络图的凝聚性特征前述网络基础概述中提到,在数学中,“网络”(networks)通常被称为“图”(graphs),一个图G=(V,E)是一种包含“节点”集合V与“边”集合E的数学结构,其中E的元素是不同节点的无序组合{u,v},u,v∈V。同时,对网络的基础要点做了简介。关于网络节点和边的特征,已在上篇作了简介,本篇继续在网络整体或局部水平上描述网络图结构,以及关注用于描述网络图凝聚性的特征。几种特殊的图类型图有各种的“形状和尺寸”,以下简介几种特殊类型的图。“完全图”(complete
小白鱼的生统笔记 -
2020年2月27日
其他
网络拓扑结构-节点和边特征的简介和R计算
网络拓扑结构-节点和边特征前述网络基础概述中提到,在数学中,“网络”(networks)通常被称为“图”(graphs),一个图G=(V,E)是一种包含“节点”集合V与“边”集合E的数学结构,其中E的元素是不同节点的无序组合{u,v},u,v∈V。同时,对网络的基础要点做了简介。网络图中的基本元素是节点和边。当元素存在于网络结构中时,会被赋予一些重要的“节点特征”或“边特征”,可帮助进一步分析网络的拓扑结构。识别网络拓扑结构是网络分析的要点,本篇就一些重要的节点或边特征作简介。
小白鱼的生统笔记 -
2020年2月25日
其他
网络分析概述之网络基础简介
网络分析概述之网络基础简介从本节开始介绍网络分析。本篇暂且对网络概念作个初步简介,随后的章节再一一展示怎样分析数据。根据白鱼同学目前比较熟悉的领域,今后的章节主要以“微生物互作网络”、“基因共表达网络”为例作阐述。注:该“网络”是指数学中分析数据的一种方法,不是“互联网”,也不是“神经网络”之类的。网络基础概述
小白鱼的生统笔记 -
2020年2月23日
其他
R语言绘制相关图的几种常用方法及R包
简介相关矩阵可视化的几种基础R包前文对Pearson、Spearman、Kendall、Polychoric、Tetrachoric、Polyserial、Biserial等相关系数的基本概念及其在R中的计算方法作了简介,本篇继续展示相关矩阵(记录了两两变量间的相关系数)的可视化方法,相关图的一些绘制示例。本篇选择了一些简单易上手的R包作展示,包括corrplot包、corrgram包、GGally包、ggcorrplot包等,大部分情况下足以满足需求。复杂的可视化方法(例如ggcor包,http://houyun.xyz/post/2019/10/26/ggcor/,绝对惊艳),以后再慢慢分享。##计算相关矩阵,以变量间
小白鱼的生统笔记 -
2020年2月23日
其他
简介一些蜘蛛布局标签的饼图的绘制方法
简介一些蜘蛛布局标签的饼图的绘制方法N个月前摸索了这种饼图的绘制方法。就是元素比较多,不显示标签的话仅靠图例的颜色标注就会很难分辨图中的区块所指示的元素;但是显示标签的话,直接显示在饼图上或外周又会导致很大的重叠。如果指示标签的连线能拐弯,就很清晰了,例如这样。这类的饼图标签形似蜘蛛,也俗称蜘蛛布局标签的饼图。找了几种可以实现这种风格饼图的方法。
小白鱼的生统笔记 -
2020年2月23日
其他
Pearson、Spearman、Kendall、Polychoric、Polyserial相关系数简介及R计算
变量间Pearson、Spearman、Kendall、Polychoric、Tetrachoric、Polyserial、Biserial相关系数简介及R计算对于给定数据集中,变量之间的关联程度以及关系的方向,常通过相关系数衡量。就关系的强度而言,相关系数的值在+1和-1之间变化,值±1表示变量之间存在完美关联程度,即完全相关时绝对值为1;随着相关系数值趋于0,意味着变量之间的关系将减弱,完全不相关时为0。关系的方向由系数的符号表示;+号表示正向关系,-号表示负向关系。图示两个变量之间的相关系数,正相关意味着图表从左到右具有向上的斜率:随着x值的增加,y值会变大;负相关性意味着图表从左到右具有向下的斜率:随着x值的增加,y值会变小;零(不相关)表示y不随x的变化而变化。
小白鱼的生统笔记 -
2020年2月22日
其他
R语言绘制雷达图的示例
fmsb包的雷达图fmsb包是常用的绘制雷达图的包。library(fmsb)
小白鱼的生统笔记 -
2020年2月19日
其他
R语言绘制旭日图(嵌套多层的饼图或圆环图)
层的圆环状结构,参考自#https://stackoverflow.com/questions/26748069/ggplot2-pie-and-donut-chart-on-same-plot
小白鱼的生统笔记 -
2020年2月19日
自由知乎
自由微博
其他
基于16S的细菌群落功能预测工具-PICRUSt
首先根据获得的OTU的代表序列,通过GreenGene注释,并将注释结果添加到不带注释但已聚类好的OTU丰度表中。随后再根据注释概要,映射GreenGene
小白鱼的生统笔记 -
2020年2月13日
其他
基于16S的细菌群落功能预测工具-Tax4Fun
rRNA基因序列与原核生物基因组功能注释的连接。OTU丰度表必须来自SILVA特定版本的注释,随后Tax4Fun将OTU物种丰度转换为功能配置文件,该过程分为三个步骤。首先,将基于SILVA的16S
小白鱼的生统笔记 -
2020年2月13日
其他
约束聚类-多元回归树及重要判别变量识别及R操作
约束聚类-多元回归树及重要判别变量识别及R操作前文已简介了决策树,其基本思想是对预测变量进行二元分离,从而构造一棵可用于预测新样本单元所属类别的树。常规的决策树中,响应变量只包含单变量的分类或定量变量,因此也称为一元回归树。多元回归树(multivariate
小白鱼的生统笔记 -
2020年2月10日
其他
几种常见的判别分析分类方法在R中实现
anlysis,RDA),在预测变量数量大于训练集对象数量的情况下,正则化可改进协方差矩阵的估计。(注意其与冗余分析(Redundancy
小白鱼的生统笔记 -
2020年2月7日
其他
支持向量机分类及在R中实现
margin);(2)将最大间距分成两部分,获得超平面(hyperplane),超平面是N-1维的;超平面与两个最接近的类间向量等距,这些向量称为支持向量(support
小白鱼的生统笔记 -
2020年2月6日
其他
R包randomForest的随机森林分类模型以及对重要变量的选择
R包randomForest的随机森林分类模型以及对重要变量的选择随机森林(random
小白鱼的生统笔记 -
2020年2月5日
其他
决策树的分类模型及对重要变量的选择及R操作
决策树的分类模型以及对重要变量的选择及R操作何为决策树,比方说下面这种。当然这个判断依据是我瞎画的,真实情况可能不是这样,看看就好别较真……总之在这个非常时期,好好听党和政府的话,尽可能不要外出就可以了。尽管内心OS:
小白鱼的生统笔记 -
2020年2月4日
其他
聚类树和PCA等排序图的组合绘制
聚类树和PCA等排序图的组合绘制聚类分析和排序分析(降维分析)都是用于探索多元数据结构的常用方法,二者的结果也可以结合在一起通过一张图呈现,本篇展示一些常见的示例。示例文件、R脚本等的百度盘链接:https://pan.baidu.com/s/1dQxyRcBuGDoec9ZKm77Y6w示例数据包含15个样本(对象),20个变量,下文对它执行聚类和降维,并作图展示。
小白鱼的生统笔记 -
2020年2月1日
其他
R语言绘制带聚类树的堆叠柱形图
R语言绘制带聚类树的堆叠柱形图聚类树与柱形图结合,即可反映样本或分组间的相似性,又能展示样本内的元素组成信息。例如下图是一个在扩增子测序微生物群落分析中常见的统计图类型,在测序公司给的报告中通常都有这么一张图。聚类树表示了各样本或分组之间,物种丰度组成的相似性或相异程度;柱形图就是常见的物种堆叠柱形图,常用于表示代表性的门纲目科属等丰度,如下图中即展示了各样本中丰度排名前10的细菌门的丰度信息。很容易看出,该图主体由两部分组成,聚类树+堆叠柱形图。本篇分享怎样在R语言中绘制。示例数据,R代码等的百度盘链接:https://pan.baidu.com/s/1mcn3XCma9_0C2LpDVytYsg
小白鱼的生统笔记 -
2020年2月1日
其他
R语言绘制聚类树示例
层次聚类示例数据为来自16S测序所得的15个样本的细菌OTU丰度表,首先执行层次聚类识别样本归类。#读取
小白鱼的生统笔记 -
2020年1月31日
其他
避免聚类中错误识别的不存在的类
避免聚类中错误识别的不存在的类聚类分析是一种旨在识别数据集子组的方法,它甚至能发现不存在的类。这种不存在的类在这里不是指潜类别,而是错误识别的那种,来看下面这个示例。
小白鱼的生统笔记 -
2020年1月31日
其他
模糊c均值聚类(FCM)及其在R中实现
模糊c均值聚类(FCM)及其在R中实现先前所简介的层次聚类、划分聚类等,所产生的聚类簇都是非重叠的实体,即对于每个对象而言只有一个确定的分类,这种聚类方法也成硬聚类(hard-clustering)。相比之下,模糊聚类(fuzzy
小白鱼的生统笔记 -
2020年1月31日
其他
划分聚类—k均值划分和围绕中心点划分及R操作
划分聚类—k均值划分(k-means)和围绕中心点划分(PAM)及R操作在层次聚类中,无论“自底向上”的聚合策略(层次聚合),或
小白鱼的生统笔记 -
2020年1月30日
其他
层次分划—双向指示种分析(TWINSPAN)及其在R中的计算
1992)。(1)以排序轴为基础进行预分类。首先对样方-物种组成矩阵执行CA或DCA,并根据第一排序主轴中的得分值(坐标)将对象分为两组(并不一定从0点进行划分),称为初级分类(primary
小白鱼的生统笔记 -
2020年1月29日
其他
层次聚类结果的比较和评估及R操作
层次聚类结果的比较和评估及R操作层次聚类是探索性分析,而非统计检验的过程。通过前文对层次聚类的简介,可知数据集的预处理方式、关联系数或距离测度的选择以及聚类方法的选择等将直接影响聚类结果。因此,选择与分析目标一致的方法非常重要。本篇简介一些用于比较和评估层次聚类结果的方法,以帮助理解关联测度或聚类方法等是否合适。下文的示例数据和R代码的获取链接:https://pan.baidu.com/s/17Vcjhf5n6IGiyODn1eloMA
小白鱼的生统笔记 -
2020年1月29日
其他
层次聚合分类分析及其在R中的计算
sorting),允许一个对象(或一个组)与另一个组聚合的依据是最远距离对,即一个组吸纳一个新成员的依据是比较该组内所有成员与备选新成员的最远距离(Lance
小白鱼的生统笔记 -
2020年1月28日
其他
自助法(bootstrap)在统计检验中的应用及R语言实现过程
自助法(bootstrap)在统计检验中的应用及R语言实现Bootstrap(自助法、自举法)是非参数统计中一种重要的估计统计量方差进而进行区间估计的统计方法。Bootstrap通过对给定数据集进行有放回的重抽样以创建多个模拟数据集,生成一系列待检验统计量的经验分布,可以计算标准误差、构建置信区间并对多种类型的样本统计信息进行假设检验。Bootstrap无需假设一个特定的理论分布,便可生成统计量的置信区间并能检验统计假设,更易于理解以及适用于更多条件,因此常作为传统假设检验的替代方法。
小白鱼的生统笔记 -
2020年1月20日
其他
置换检验概述及其在R中的实现
置换检验及其在R中的实现某些差异分析方法建立在观测数据服从较好的特定理论分布的基础上,如常见的参数检验T检验、方差分析等,假定观测数据抽样自正态分布;再如分析差异表达基因时最常用的负二项分布模型,假定整体基因表达具有负二项分布特征。在这些情况下,根据数据的理论分布,即可比较容易建立假设检验和总体参数的置信区间估计。但在许多情况中,统计检验并不一定满足,比如数据抽样于未知或混合分布、样本量过小、存在离群点、基于理论分布设计合适的统计检验过于复杂且数学上难以处理等情况,这时基于随机化的统计方法就可以派上用场。
小白鱼的生统笔记 -
2020年1月18日
其他
R包npmc的非参数多重比较
第一版》(154页)提到了一个R包,npmc,提供了一种非参数多组比较程序npmc(),可在控制I类错误的前提下,进行所有组之间的成对比较。注:《R语言实战
小白鱼的生统笔记 -
2020年1月17日
其他
Koeken——使LEfSe分析更便捷
Koeken——使LEfSe分析更便捷上一篇为LEfSe分析写了教程,包括LEfSe计算原理概述、输入文件如何准备、在线Galaxy平台运行LEfSe、本地LEfSe工具的安装使用以及对结果的说明等。因此,对LEfSe的基础部分可参考前文。特别提到了如何由OTU丰度表转换获得LEfSe的输入文件,并提供了转换的代码。转换过程中借助QIIME工具实现各分类水平的统计,需要事先将txt格式的OTU丰度表转换为biom格式以方便使QIIME识别。既然已经将OTU表转换为biom格式,并也已安装了QIIME和LEfSe程序,那就继续延伸一个工具,Koeken,是为LEfSe分析提供的包装器。Koeken将QIIME和LEfSe结合在一起,为从QIIME
小白鱼的生统笔记 -
2020年1月14日
其他
LEfSe分析的在线+本地运行的超详细教程
Size)一种广泛用于宏基因组生物高维数据的biomaker鉴别和解释的工具,通过分类比较、生物学一致性测试和效应大小估计,描述和验证两个或多个微生物群落之间的差异物种、基因或途径(Segata
小白鱼的生统笔记 -
2020年1月13日
其他
二次判别分析(QDA)及其在R中实现
尽管看起来很直观,QDA通常优于LDA,这种优势主要体现在训练集数据量较大、或者观测类别较多时的情况,此时等协方差矩阵的假设经常被拒绝。当训练集数据较少时,LDA往往比QDA更好。
小白鱼的生统笔记 -
2020年1月12日
其他
线性判别分析(LDA)及其在R中实现
Fisher(1936)提出,也称为Fisher判别式。最初的LDA只能处理两种分类问题,Rao(1948)拓展了“多类别线性判别分析”或称“多元判别分析”,将LDA推广至适用于多分类的情形。
小白鱼的生统笔记 -
2020年1月11日
其他
R包ropls的偏最小二乘判别分析(PLS-DA)和正交偏最小二乘判别分析(OPLS-DA)
R包ropls的PCA、PLS-DA和OPLS-DA在代谢组学分析中经常可以见到主成分分析(PCA)、偏最小二乘判别分析(partial
小白鱼的生统笔记 -
2020年1月8日
其他
R包tidyLPA的潜剖面分析(LPA)
然后期望根据这些指示值,寻找潜在特征解释指示值之间的潜在结构,并通过LPA对学生个体进行分层,以及探究变量对学生分层的贡献。library(dplyr)
小白鱼的生统笔记 -
2020年1月7日
其他
R包poLCA的潜类别分析(LCA)
名受访者对四个问题(A、B、C、D)的认同倾向,“1”代表不认同,“2”代表认同#注:poLCA
小白鱼的生统笔记 -
2020年1月5日
其他
R包piecewiseSEM的分段结构方程建模
R包piecewiseSEM的分段结构方程建模常规的结构方程模型(SEM)局限性较大,如要求数据尽量服从多元正态性等,限制了SEM的使用。分段结构方程模型(分段SEM,或称验证路径分析)通过引入灵活的数学框架扩展了SEM的适用范围。该数学框架允许合并各种模型结构、分布和假设,例如交互作用和非正态响应、随机效应和层次模型以及其它相关结构(包括系统发育、空间和时间)等。因此与常规的SEM相比,更多的变量间关系在分段SEM中更容易估计。关于常规SEM和分段SEM的基本概念描述,可参考前文。本篇简介R包piecewiseSEM的分段SEM方法。
小白鱼的生统笔记 -
2020年1月2日
其他
R包lavaan的结构方程建模-潜变量结构模型
R包lavaan的潜变量结构模型前文已经分别简介了使用lavaan包执行验证性因子分析(CFA)、路径分析的过程,它们均为结构方程模型(SEM)的不同建模方法。本篇继续展示潜变量结构模型(Latent
小白鱼的生统笔记 -
2020年1月2日
其他
R包lavaan的结构方程建模-路径分析
R包lavaan的路径分析前文已经简介了使用lavaan包执行验证性因子分析(CFA)的过程,CFA可视为结构方程模型(SEM)的一种建模方法,CFA在SEM中也称为测量模型。本篇继续展示lavaan包的另一种SEM建模方法,路径分析(Path
小白鱼的生统笔记 -
2020年1月1日
其他
结构方程模型(SEM)和分段结构方程模型
结构方程模型(SEM)简介自然或社会现象是复杂的,但在研究中经常将其简化为简单的模型,类似y~x这样的形式。当然并不是说这种简单模型有什么问题,只是有些情况下y实际上并非x的直接作用结果,y通常受到许多直接和间接因素的影响,这些因素之间也存在广泛的相互作用。毫无疑问,如果有某种方法可以将这种相互作用的因素网络转化为一个统计框架,可以帮助我们在系统层面上更好地理解问题。结构方程模型(Structural
小白鱼的生统笔记 -
2019年12月31日
其他
R包lavaan的验证性因子分析(CFA)
R包lavaan的验证性因子分析(CFA)因子分析是一个统称,表示一类主要用于数据精简和汇总的过程。研究中经常涉及多元变量,这些变量间具有广泛的相关性,需将其减少到易于观测的水平。因子分析通过检查多变量相关性的关系集合,确定一组基本元素(称为因子)代表变量间关系的潜在底层结构。图注:常见精神疾病的因子结构示例,似乎可以归纳为两个潜在的维度,即内在性和外在性疾病。
小白鱼的生统笔记 -
2019年12月30日
其他
探索性因子分析(EFA)及其在R中实现
PCA和EFAPCA中,通过对多元数据进行降维,将大量相关变量转化为一组很少的不相关变量,这些无关变量称为主成分(Principal
小白鱼的生统笔记 -
2019年12月29日
其他
多元因子分析(MFA)及其在R中实现
shaking);第21-29列,共9列,包括酸度等属性,该变量集代表葡萄酒“味觉属性”(taste);第30-31列,共2列,包括质量等属性,该变量集代表葡萄酒“质量属性”(quality)。
小白鱼的生统笔记 -
2019年12月26日
其他
R语言绘制密度提琴图
没错,就是这样。然后改改颜色、背景、图例啥的,组合在一起,就可以了。#“密度提琴图”library(ggplot2)library(ggridges)library(grid)
小白鱼的生统笔记 -
2019年12月24日
其他
处理同时含有定量和分类变量的数据集的PCA方法
R包ade4处理包含定量和分类变量数据集的PCA方法常规的主成分分析(PCA)中,数据集所涉及的变量通常全部为定量变量。对于定性变量而言,通常将它们转化为0-1类型的二元数据后,作为PCA的输入(尽管效果可能不是很好)。如果是变量全部为分类变量,则可以通过多重对应分析(MCA)实现,其相当于处理分类变量的PCA。那么,对于混合有定量和分类变量的数据集,则该如何实现PCA呢?Hill和Smith(1976)提出了适用于多状态离散特征分类数据的主成分分析,用于实现这种需求。ade4包中提供了该方法的实现函数。例如,数据集aravo中记录了75个观测样方的环境特征,现在期望通过PCA探索这些样方之间环境组成的相似性。library(ade4)
小白鱼的生统笔记 -
2019年12月22日
其他
R包cocorresp的协对应分析(CoCA)
R包cocorresp的协对应分析(CoCA)在协惯量分析(CoIA)分析中,要求输入的两个数据集的行权重必须相等,在某种程度上限制了基于单峰响应的对应分析(CA)方法的在CoIA中的使用。因此,CoIA大多用于表征两数据集之间的线性相关。协对应分析(co-correspondence
小白鱼的生统笔记 -
2019年12月22日
其他
R语言执行RLQ分析和第四角分析
R包ade4的RLQ分析和第四角分析在使用降维排序的方法,探索物种响应环境的关系中,常见的约束排序类型,如冗余分析(RDA)、典范对应分析(CCA)等,通过回归实现环境梯度对物种丰度建模;非模型的排序类型,如典范相关分析(CCorA)、协惯量分析(CoIA)等,则通过某种方式的相关性确立;还有像在物种多度的非约束排序中,被动拟合环境梯度等。这些分析中通常考虑两种类型的数据,样方-物种丰度矩阵和样方-环境变量矩阵。通过使用物种功能代替其种类属性,更有助于提高对生态群落结构的见解。物种性状通常是适应环境的产物,同时也可反作用于环境,进而可能影响群落结构和生态系统功能。因此,识别物种性状与环境的关系是功能生态学的一个关键问题。这种情况下,在对群落的测量中将得到三个矩阵,R、Q、L,分别对应了三种不同类型的数据集:样方-环境矩阵R(n×m),记录样方n中环境变量m的测量值,用于描述样方的环境特征;物种-性状矩阵Q(p×s),记录物种p的性状,用于描述物种特征;样方-物种矩阵L(n×p),记录样方n中物种p的丰度,用于描述样方之间的物种分布。(Dolédec
小白鱼的生统笔记 -
2019年12月21日
{{{deleted_alert}}}
{{classification}}
{{{title}}}
{{{preview}}}
{{nickname}}
{{ct}}
更多