生信分析平台搭建(十五):RAID
编者按
经常有人问我自己的个人电脑是否能用来分析,有些配置已经很高,内存可以达到16G。其实服务器并不是一个配置更好的个人电脑,它与普通电脑之间有很多差别,其中最大的一点不同我想应该是服务器使用RAID。
接前面:
二十:RAID
1、raid简介
磁盘阵列,英文为Redundant Arrays of Independent Disks,简称为RAID,有“独立磁盘构成的具有冗余能力的阵列”之意。现在的服务器上都是用了RAID技术,可以解决硬盘IO性能弱,稳定性差的问题。
图1-多块磁盘构成磁盘阵列
2、raid读写文件
个人PC一份数据写到一块硬盘上,采用RAID技术之后,可以一块数据写到多块磁盘上,这样速度就变成原来n分之一。读一块数据并行从多块磁盘读取,这样读速度就变成原来的n倍。
3、RAID级别
现在的RAID级别从raid0到raid10,raid50等很多种,每一种都有特定的使用范围,raid级别不同,主要是利用率与读写速度和冗余性的平衡。
RAID 0
RAID 1
RAID0+1
RAID: LSI MegaRAID、Nytro和Syncro带海明码校验
RAID3:带奇偶校验码的并行传送
RAID4:带奇偶校验码的独立磁盘结构
RAID5:分布式奇偶校验的独立磁盘结构
RAID6:带有两种分布存储的奇偶校验码的独立磁盘结构
RAID7:优化的高速数据传送磁盘结构
RAID10:高可靠性与高效磁盘结构
RAID53:高效数据传送磁盘结构
4、raid 0
raid 0是最早的raid形式,它是磁盘利用率的极端,利用效率最高,同一份数据分开写入多块磁盘,因此读写速度最快。但是没有提供冗余或错误修复能力,任何一块磁盘坏掉,整个数据就无法恢复。
5、raid 1
raid1也称为磁盘镜像,冗余性的极端,将同一份数据同时写入多块磁盘,非常浪费磁盘,因此,冗余性最高,读数据时一次从多块磁盘读取,因此读数据速度很快。raid 0主要用于重要数据的读写,例如银行账户。任何一块磁盘坏了,还有多份备份。
6、raid 5
raid 0和1都是极端情况,raid 5保持利用率,冗余性,读写速度一个平衡,raid5最少使用3块硬盘,注意不是要求至少5块硬盘,raid5与raid0类似,读写数据的时候,会将数据分布式的读写到所有硬盘上,但是多了一步操作,在写数据的时候,会对数据进行奇偶校验运算,将校验信息同时保存在硬盘上,这个校验信息要比实际数据小很多,比如现在有4块磁盘构建的raid5,每个磁盘4T,那么浪费掉1块用于校验,实际磁盘可用大小应该是12T。
7、raid制作,在购买服务器的时候,有些设备提供方已经做好了raid,这样拿回来之后就会当成一块硬盘来使用(不要去争辩为什么少了一块磁盘的容量)。如果钱没到位,就需要自己手动制作,也并不是很难。不同品牌会有一些差别。下面是一个示意图,实际操作中有很多步骤。
Tips:1、除了raid5 还有其他很多raid级别,都有各自的使用范围。
2、制作raid最好选择同一品牌磁盘,并且同样大小,这样性能和稳定性更好。
---------- END ----------
(可添加作者本人微信,备注好单位+姓名)