查看原文
其他

生信分析平台搭建(十五):RAID

2018-01-22 基因学院 基因学苑

编者按

经常有人问我自己的个人电脑是否能用来分析,有些配置已经很高,内存可以达到16G。其实服务器并不是一个配置更好的个人电脑,它与普通电脑之间有很多差别,其中最大的一点不同我想应该是服务器使用RAID。

接前面:

手把手教你生信分析平台搭建(一)

生信分析平台搭建(二):安装Linux系统

生信分析平台搭建(三):系统设置

生信分析平台搭建(四):共享文件夹

生信分析平台搭建(五):个性化设置

生信分析平台搭建(六):系统配置

生信分析平台搭建(七):bioconda

生信分析平台搭建(八):利用Synaptic安装生物软件

生信分析平台搭建(九):Aspera

生信分析平台搭建(十):Rstudio-server

生信分析平台搭建(十一):制作安装盘

生信分析平台搭建(十二):添加磁盘

生信分析平台搭建(十三):安装GNOME桌面

生信分析平台搭建(十四):用户管理


二十:RAID

1、raid简介

磁盘阵列,英文为Redundant Arrays of Independent Disks,简称为RAID,有“独立磁盘构成的具有冗余能力的阵列”之意。现在的服务器上都是用了RAID技术,可以解决硬盘IO性能弱,稳定性差的问题。

图1-多块磁盘构成磁盘阵列


2、raid读写文件

个人PC一份数据写到一块硬盘上,采用RAID技术之后,可以一块数据写到多块磁盘上,这样速度就变成原来n分之一。读一块数据并行从多块磁盘读取,这样读速度就变成原来的n倍。


3、RAID级别

现在的RAID级别从raid0到raid10,raid50等很多种,每一种都有特定的使用范围,raid级别不同,主要是利用率与读写速度和冗余性的平衡。

  • RAID 0

  • RAID 1

  • RAID0+1

  • RAID: LSI MegaRAID、Nytro和Syncro带海明码校验

  • RAID3:带奇偶校验码的并行传送

  • RAID4:带奇偶校验码的独立磁盘结构

  • RAID5:分布式奇偶校验的独立磁盘结构

  • RAID6:带有两种分布存储的奇偶校验码的独立磁盘结构

  • RAID7:优化的高速数据传送磁盘结构

  • RAID10:高可靠性与高效磁盘结构

  • RAID53:高效数据传送磁盘结构


4、raid 0

raid 0是最早的raid形式,它是磁盘利用率的极端,利用效率最高,同一份数据分开写入多块磁盘,因此读写速度最快。但是没有提供冗余或错误修复能力,任何一块磁盘坏掉,整个数据就无法恢复。

5、raid 1

raid1也称为磁盘镜像,冗余性的极端,将同一份数据同时写入多块磁盘,非常浪费磁盘,因此,冗余性最高,读数据时一次从多块磁盘读取,因此读数据速度很快。raid 0主要用于重要数据的读写,例如银行账户。任何一块磁盘坏了,还有多份备份。

6、raid 5

raid 0和1都是极端情况,raid 5保持利用率,冗余性,读写速度一个平衡,raid5最少使用3块硬盘,注意不是要求至少5块硬盘,raid5与raid0类似,读写数据的时候,会将数据分布式的读写到所有硬盘上,但是多了一步操作,在写数据的时候,会对数据进行奇偶校验运算,将校验信息同时保存在硬盘上,这个校验信息要比实际数据小很多,比如现在有4块磁盘构建的raid5,每个磁盘4T,那么浪费掉1块用于校验,实际磁盘可用大小应该是12T。


7、raid制作,在购买服务器的时候,有些设备提供方已经做好了raid,这样拿回来之后就会当成一块硬盘来使用(不要去争辩为什么少了一块磁盘的容量)。如果钱没到位,就需要自己手动制作,也并不是很难。不同品牌会有一些差别。下面是一个示意图,实际操作中有很多步骤。

Tips:1、除了raid5 还有其他很多raid级别,都有各自的使用范围。

2、制作raid最好选择同一品牌磁盘,并且同样大小,这样性能和稳定性更好。



---------- END ----------

(可添加作者本人微信,备注好单位+姓名)


您可能还会感兴趣的

如何在Linux下优雅的装X

利用R绘制GO条目图

CNV-seq分析介绍

生物学才是终极学科

如何搭建生物信息分析平台

为什么生物信息分析难学?

DNA告诉你,你从哪里来?


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存