16s分析之网络分析一(MENA)
网站地址:http://ieg4.rccc.ou.edu/MENA/main.cgi
上传数据:
注意这里上传相对丰度的表格,网站上没有标准化的步骤:
出现如下错误,我中间尝试过更换很多浏览器,但是都不好用
有一天我使用手机浏览器,上传成功,我也不懂网站,就这样了,大家如果遇到相同的问题,欢迎留言:
回到主页,点击构建网络,我就看到了刚才我上传的文件:
接下来选中我们要构建的网络文件:需要设置一些参数,这里我逐条说明
如果otu在6个样品中都未检测到,则去除这些otu
缺失值处理,四种方法可选:
数据转换方式,我就不转化了’
选择相关关系计算方法,这里选择pearson相关:皮尔森就时间序列而言的两种方法计算相关暂时我还用不到
计算顺序和模型选择,这里用来挑选阈值使用,相关原理参考RMT理论:
RMT理论:
计算那种分布,我们需要计算得到阈值符合泊松分布但是不符合goe分布才是合理的阈值
一会就跑完了:
就下来我点击进去,开始寻找阈值建立网络:
选择阈值越高,网络会相对小一些,这里可以按照自己需要选择:
我选择了0.9的阈值:可以看到R方值很大,这个网络还是很好的
现在我们开始分析网络:
到网络整体的参数:这里先不分析参数,仅仅展示
Network globalproperties
Network Indexes | tometo_norm(0.9) |
Total nodes | 350 |
Total links | 1799 |
R square of power-law | 0.777 |
Average degree (avgK) | 10.280 |
Average clustering coefficient (avgCC) | 0.280 |
Average path distance (GD) | 2.924 |
Geodesic efficiency (E) | 0.377 |
Harmonic geodesic distance (HD) | 2.655 |
Maximal degree | 50 |
Nodes with max degree | OTU_444 |
Centralization of degree (CD) | 0.114 |
Maximal betweenness | 4287.735 |
Nodes with max betweenness | OTU_620 |
Centralization of betweenness (CB) | 0.065 |
Maximal stress centrality | 20684 |
Nodes with max stress centrality | OTU_620 |
Centralization of stress centrality (CS) | 0.302 |
Maximal eigenvector centrality | 0.244 |
Nodes with max eigenvector centrality | OTU_444 |
Centralization of eigenvector centrality (CE) | 0.213 |
Density (D) | 0.029 |
Reciprocity | 1 |
Transitivity (Trans) | 0.202 |
Connectedness (Con) | 1 |
Efficiency | 0.973 |
Hierarchy | 0 |
Lubness | 1 |
这是一些定义,大家随便看看!
节点数量:反应网络的大小
边的数量:
R方:幂律分布指数,靠近1,就接近无尺度网络(无标度网络),含义就是:
大部分节点链接少量的边,少量的节点链接大多数的边:参考wgcna;Barab和Albert发现很多实际网络的节点的度k 满足无标度的幂分布p(k)~k-γ,其中γ为常数,因此命名为无标度网络。这种节点的度分布的特点表明大量的节点只有少数的边,然而由少数节点有大量的边。通过简单的推导可以得到对于随机的同样尺度的网络服从Poisson 分布。
平均度(Average degree (avgK)):
平均聚类系数(Average clustering coefficient (avgCC)):
平均路径长度(Average path distance (GD)):
(Geodesic efficiency (E)):?????
网络节点集中性:每个节点的性质网络属性:
度:
节点介数:定义为网络中所有最短路径中经过该节点的路径的数目占最短路径总数的比例
边介数:定义为网络中所有最短路径中经过该边的路径的数目占最短路径总数的比例。
下面分析节点参数:每一个节点的网络参数,这里有很多
接下来对模块进行分析:有四种方法和两个参数
一般认为模块性达到0.4以上才具有模块性,这里正好没有达到,凑活一下:
可视化我选择cytoscape,下载相关文件:
MENA网络定义:
z:衡量一个点在所有模块中的作用,值越高,表明在模块中的作用越大
p:衡量一个节点参与其他模块的程度,值越高,表明和其他模块关系越密切
基于以上连个值对模块进行分类:
z大于等于2.5,p小于等于0.62:模块核心
z大于等于2.5,p大于0.62:网络核心
z小于2.5,p小于等于0.62:外围节点
z小于2.5,p大于0.62:连接节点
接下来我们进入cytoscape进行可视化展示:
首先打开我们的网络:
我们将点设置为圆形,颜色根据模块上色:
按照模块展示:Group Attributes Layout
按照点的度来做一个排序展示
我将otu不同等级注释数据导入,按照们水平分组展示:
还是那句话:
学习永无止境,分享永不停歇!