查看原文
其他

蛋白质组学第8期 文章复现之数据处理

生信技能树 生信技能树 2022-06-06

上个月我们公布了,蛋白质组学习小组起飞啦!  短短几天就获得了几百小伙伴的支持,让我们也更有信心的带领大家掌握一个蛋白质组学数据处理的实战,前面我们分享的是:


第七期内容我们介绍了使用Perseus 进行数据预处理,这期接着上期预处理的内容,开始数据分析。

1.聚类热图

1)Z-score normalized

 Z-score 归一化

img
img
Z-Score 讲解

引用自(https://blog.csdn.net/Orange_Spotty_Cat/article/details/80312154)

Z-Score的目的:Z-Score的主要目的就是将不同量级的数据统一转化为同一个量级,统一用计算出的Z-Score值衡量,以保证数据之间的可比性。

实例:

A班级的平均分是80,标准差是10,A考了90分;B班的平均分是400,标准差是100,B考了600分。我们可以计算得出,A的Z-Score是1((90-80)/10),B的Z-Socre是2((600-400)/100)。因此B的成绩更为优异。反之,若A考了60分,B考了300分,A的Z-Score是-2,B的Z-Score是-1。因此A的成绩更差。

优缺点:

  • 优点:

Z-Score最大的优点就是简单,容易计算,在R中,不需要加载包,仅仅凭借最简单的数学公式就能够计算出Z-Score并进行比较。此外,Z-Score能够应用于数值型的数据,并且不受数据量级的影响,因为它本身的作用就是消除量级给分析带来的不便。

  • 缺点

但是Z-Score应用也有风险。首先,估算Z-Score需要总体的平均值与方差,但是这一值在真实的分析与挖掘中很难得到,大多数情况下是用样本的均值与标准差替代。其次,Z-Score对于数据的分布有一定的要求,正态分布是最有利于Z-Score计算的。最后,Z-Score消除了数据具有的实际意义,A的Z-Score与B的Z-Score与他们各自的分数不再有关系,因此Z-Score的结果只能用于比较数据间的结果,数据的真实意义还需要还原原值。

2) 热图

2.火山图

1) 注释数据

2)火山图

3)图片保存

修改成你想要的图片之后,点击

3.本期任务

将两种细胞的数据进行预处理,并制作热图和火山图。

全国巡讲约你


第1-11站北上广深杭,西安,郑州, 吉林,武汉,成都,港珠澳(全部结束)

一年一度的生信技能树单细胞线下培训班(已结束)

全国巡讲第13站-杭州(生信技能树爆款入门课)(下一站甘肃兰州,火热报名)


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存