蛋白质组学第8期 文章复现之数据处理
上个月我们公布了,蛋白质组学习小组起飞啦! 短短几天就获得了几百小伙伴的支持,让我们也更有信心的带领大家掌握一个蛋白质组学数据处理的实战,前面我们分享的是:
第七期内容我们介绍了使用Perseus 进行数据预处理,这期接着上期预处理的内容,开始数据分析。
1.聚类热图
1)Z-score normalized
Z-score 归一化
Z-Score 讲解
引用自(https://blog.csdn.net/Orange_Spotty_Cat/article/details/80312154)
Z-Score的目的:Z-Score的主要目的就是将不同量级的数据统一转化为同一个量级,统一用计算出的Z-Score值衡量,以保证数据之间的可比性。
实例:
A班级的平均分是80,标准差是10,A考了90分;B班的平均分是400,标准差是100,B考了600分。我们可以计算得出,A的Z-Score是1((90-80)/10),B的Z-Socre是2((600-400)/100)。因此B的成绩更为优异。反之,若A考了60分,B考了300分,A的Z-Score是-2,B的Z-Score是-1。因此A的成绩更差。
优缺点:
优点:
Z-Score最大的优点就是简单,容易计算,在R中,不需要加载包,仅仅凭借最简单的数学公式就能够计算出Z-Score并进行比较。此外,Z-Score能够应用于数值型的数据,并且不受数据量级的影响,因为它本身的作用就是消除量级给分析带来的不便。
缺点
但是Z-Score应用也有风险。首先,估算Z-Score需要总体的平均值与方差,但是这一值在真实的分析与挖掘中很难得到,大多数情况下是用样本的均值与标准差替代。其次,Z-Score对于数据的分布有一定的要求,正态分布是最有利于Z-Score计算的。最后,Z-Score消除了数据具有的实际意义,A的Z-Score与B的Z-Score与他们各自的分数不再有关系,因此Z-Score的结果只能用于比较数据间的结果,数据的真实意义还需要还原原值。
2) 热图
2.火山图
1) 注释数据
2)火山图
3)图片保存
修改成你想要的图片之后,点击
3.本期任务
将两种细胞的数据进行预处理,并制作热图和火山图。
全国巡讲约你
第1-11站北上广深杭,西安,郑州, 吉林,武汉,成都,港珠澳(全部结束)
一年一度的生信技能树单细胞线下培训班(已结束)