查看原文
其他

超实用,物理服务器RAID扩容详解

杨俊俊 新钛云服 2022-01-05

服务器RAID卡,也称阵列卡,用于将多块物理硬盘组建成逻辑的卷,RAID卡是一个硬件,上面通常会配置Cache和电池,用于提升RAID性能和保护在断电情况下避免未落盘的数据丢失。


配置RAID卡,通常有二种方式,第一种是在服务器启动的时候进入RAID卡图形配置界面;第二种是通过服务器远程控制卡。


对RAID的一些普通操作,使用图形和web,比如新建raid,删除raid,添加热备盘,清除foreign信息,但是RAID扩容的操作,都做不了。那么这时就需要通过系统内部经常配置,本篇将进行详细的介绍。


本手册使用场景与限制:

  • 仅适用于Dell的MegaRaid型号的RAID。

  • 服务器操作系统为CentOS6 或以上


添加硬盘并动态扩容空间

通常的物理服务器会有多块硬盘,最常见的如8个,12个,16个盘位的服务器。最好的情况当然是我们在采购和业务上线的时候就按需求采购合适服务器,配满硬盘。但是,在实际的场景中,我们的规划没有做的那么好,这也就出现了标题所指的问题,当一台在运行的服务器硬盘容量不够了,但是还有空的硬盘槽位,那这个时候应该怎么办呢?业务不能停,数据没地方移,怎么办?


加盘,在线扩容,这是最好的办法。能做到吗?

目前来看,不行。

那有退一步的方案吗?停一下业务,实现扩容的方案?

这个可以有,继续往下看吧。


在一台有空余硬盘插槽的物理服务器上,新加两块硬盘,然后再将新添加的这部分硬盘容量添加到一个现有的RAID中,并且将系统分区空间扩容。



注意:操作过程,需要服务器重启一次。


操作方法:

在系统内部使用MegaCli工具直接操作硬盘和修改raid卡配置。


操作步骤:

1. 服务器中添加硬盘,开机Ctrl+R 进入RAID卡配置界面,如图1-1,配置了两个RAID,一个RAID1容量111.250G,一个RAID10容量4.364T

图1-1 RAID卡配置界面


2. 查看新加的硬盘是否有Foreign信息,如图1-2,在Foreign View标签下,看到有两条正常的Disk Group信息,一条Disk Group:2 Raid10(Foreign)信息,这条信表示目前接在Raid卡上的硬盘中所包含的RAID信息与RAID卡上存储的RAID信息不一致,需要做同步,同步的方式有两种,Import和Clear,如图1-3

图1-2 Foreign View

图1-3  RAID信息同步方式Import或者Clear

3. Import表示将硬盘中的RAID信息同步到RAID卡上,Clear表示将硬盘中的RAID信息清除掉。如果是更换备机的场景,需要将硬盘中的RAID信息Import到RAID卡中。此场景,是要讲新添加的硬盘,加到现有的RAID组中,所以需要Clear,硬盘中的Foreign信息。


4. 清除之后,再RAID开配置页面,Foreign View标签就会消失,如图1-4,此时出现了3块没有配置的物理磁盘,这3块就是我们新加的硬盘。

图1-4  清除Foreign信息之后的状态

5. 在RAID卡配置界面无法完成在现有RAID中添加新硬盘的功能,所以只能在系统内部通过MagaCli工具来做接下来的操作。图1-4,界面,按esc,保存退出,重启服务器进入系统。


6. 在系统内安装Megacli工具

[root@kvmhost  ~]# yum install MegaCli    

<-- 在IDC自建的yum源中已添加rpm包,如果没有自建源,可以使用rpm安装以下rpm包 -->

[root@kvmhost  ~]#rpm –ivh MegaCli-8.04.07-1.noarch.rpm Lib_Utils-1.00-09.noarch.rpm

[root@kvmhost  ~]# ln -s /opt/MegaRAID/MegaCli/MegaCli64 /bin/MegaCli64  

<-- 添加软连接 -->


注意:

以上1-5步执行的操作就是清除硬盘中的Foreign信息,通过Megacli也同样可以做


[root@kvmhost ~]# MegaCli64 -PDlist -aALL | grep "Foreign State"


查看硬盘的Foreign信息,不是None的表示存在Foreign信息


Foreign State: None

<-- ….  省略多行相同的输出 -->

Foreign State: None

Foreign State: Foreign    

Foreign State: Foreign

Foreign State: Foreign                             //三个硬盘都有foreign信息

[root@kvmhost ~]# MegaCli64 -CfgForeign -Scan -a0     // 扫描RAID上硬盘的Foreign信息

There are 3 foreign configuration(s) on controller 0.

Exit Code: 0x00

[root@kvmhost ~]# MegaCli64 -CfgForeign -Clear -a0     //清空Foreign信息

Foreign configuration 0 is cleared on controller 0.

Foreign configuration 1 is cleared on controller 0.

Foreign configuration 2 is cleared on controller 0.

Exit Code: 0x00

[root@kvmhost ~]# MegaCli64 -PDlist -aALL | grep "Foreign State"

<-- 检查Foreign信息,刚才三块有Foreign信息的三块硬盘中Foreign信息已清除 -->

Foreign State: None

<-- ….  省略多行相同的输出 -->

Foreign State: None



7. 查看当前服务器上的硬盘数量

[root@kvmhost  ~]# MegaCli64 –adpCount    //当前服务器上有一个RAID卡

Controller Count: 1.

[root@kvmhost  ~]# MegaCli64 -PDGetNum -a0  //在raid卡0 上有13块硬盘

Number of Physical Drives on Adapter 0: 13


8. 查看当前服务器上的逻辑卷个数

[root@kvmhost  ~]# MegaCli64 -LDGetNum -a0   //查看逻辑卷个数,如下有两个逻辑卷

Number of Virtual Drives Configured on Adapter 0: 2

Exit Code: 0x02


9. 查看两个逻辑卷的信息

[root@kvmhost  ~]#  MegaCli64 -LDInfo -L0  -a0      //查看第一个逻辑卷信息

Adapter 0 -- Virtual Drive Information:

Virtual Drive: 0 (Target Id: 0)

Name                :ssd

RAID Level          : Primary-1, Secondary-0, RAID Level Qualifier-0       //RAID级别为RAID1

Size                : 111.25 GB                                    //逻辑卷容量111.25G

Is VD emulated      : Yes

Mirror Data         : 111.25 GB

State               : Optimal

Strip Size          : 64 KB

Number Of Drives    : 2                                            //包含2块硬盘

Span Depth          : 1

Default Cache Policy: WriteBack, ReadAhead, Direct, No Write Cache if Bad BBU   //当前逻辑卷的缓存策略

Current Cache Policy: WriteBack, ReadAhead, Direct, No Write Cache if Bad BBU

Default Access Policy: Read/Write

Current Access Policy: Read/Write

Disk Cache Policy   : Disk's Default

Encryption Type     : None

Default Power Savings Policy: Controller Defined

Current Power Savings Policy: None

Can spin up in 1 minute: No

LD has drives that support T10 power conditions: No

LD's IO profile supports MAX power savings with cached writes: No

Bad Blocks Exist: No

Is VD Cached: No

Exit Code: 0x00


[root@kvmhost  ~]# MegaCli64 -LDInfo -L1  -a0   //查看第二个逻辑卷信息

Adapter 0 -- Virtual Drive Information:

Virtual Drive: 1 (Target Id: 1)

Name                :hdd     //表示普通的非ssd卷

RAID Level          : Primary-1, Secondary-0, RAID Level Qualifier-0   //RAID级别为RAID10

Size                : 4.364 TB

Is VD emulated      : No

Mirror Data         : 4.364 TB

State               : Optimal

Strip Size          : 64 KB

Number Of Drives    : 8                                        //包含8块硬盘

Span Depth          : 1

Default Cache Policy: WriteBack, ReadAhead, Direct, No Write Cache if Bad BBU

Current Cache Policy: WriteBack, ReadAhead, Direct, No Write Cache if Bad BBU

Default Access Policy: Read/Write

Current Access Policy: Read/Write

Disk Cache Policy   : Disk's Default

Encryption Type     : None

Default Power Savings Policy: Controller Defined

Current Power Savings Policy: None

Can spin up in 1 minute: Yes

LD has drives that support T10 power conditions: Yes

LD's IO profile supports MAX power savings with cached writes: No

Bad Blocks Exist: No

Is VD Cached: No

Exit Code: 0x00


10. 查看每个逻辑卷,包含的具体硬盘槽位信息

[root@kvmhost  ~]# MegaCli64 -LdPdInfo  a0|grep -E "RAID Level|Number of PDs|Slot Number"

RAID Level          : Primary-1, Secondary-0, RAID Level Qualifier-0

Span: 0 - Number of PDs: 2

Slot Number: 0

Slot Number: 1

RAID Level          : Primary-1, Secondary-0, RAID Level Qualifier-0

Span: 0 - Number of PDs: 8

Slot Number: 2

Slot Number: 3

Slot Number: 4

Slot Number: 5

Slot Number: 6

Slot Number: 7

Slot Number: 8

Slot Number: 9


11. 查看RAID卡上所有的硬盘,及其槽位信息,并与上面已经被现有逻辑卷使用的槽位,找出空的硬盘所在的槽位

[root@kvmhost  ~]# MegaCli64 -PDlist -aALL -NoLog| grep -E "Enclosure Device ID|Slot|Firmware state"

Enclosure Device ID: 32   // Enclosure Device ID用于在指定硬盘的时候使用

Slot Number: 0          //硬盘的槽位信息

Firmware state: Online, Spun Up  //硬盘的状态,Online表示使用状态

<-- ….  省略多行类似的输出 -->

Enclosure Device ID: 32

Slot Number: 9

Firmware state: Online, Spun Up

Enclosure Device ID: 32   //附件ID这个值在定位硬盘时使用

Slot Number: 10      //第10个槽位

Firmware state: Unconfigured(good), Spun Up   //状态未unconfigured表示,当前状态未使用

Enclosure Device ID: 32

Slot Number: 11

Firmware state: Unconfigured(good), Spun Up

Enclosure Device ID: 32

Slot Number: 12

Firmware state: Unconfigured(good), Spun Up


12. 将第10,11槽位的硬盘添加到第二个逻辑卷中,也就是sas那个卷

[root@kvmhost  ~]# MegaCli64 -LDRecon -Start -r1 -Add -Physdrv[32:10,32:11] -L1 -a0

<r1 表示要加入的原raid级别是raid10,-Physdrv[32:10,32:11]要添加进入的硬盘,L1,是指逻辑卷是第二个卷,-a0表示第一个raid卡 >

Start Reconstruction of Virtual Drive Success.      //返回成功

Exit Code: 0x00


13. 确认步骤一,查看第二个逻辑卷当前的信息

[root@kvmhost  ~]# MegaCli64 -LDInfo -L1  -a0

Adapter 0 -- Virtual Drive Information:

Virtual Drive: 1 (Target Id: 1)

Name                :hdd

RAID Level          : Primary-1, Secondary-0, RAID Level Qualifier-0

Size                : 4.364 TB      //空间不会马上变大,需要等重建完成才会变大

Is VD emulated      : No

Mirror Data         : 4.364 TB

State               : Optimal

Strip Size          : 64 KB

Number Of Drives    : 8

Span Depth          : 1

Default Cache Policy: WriteBack, ReadAhead, Direct, No Write Cache if Bad BBU

Current Cache Policy: WriteThrough, ReadAheadNone, Cached, No Write Cache if Bad BBU

Default Access Policy: Read/Write

Current Access Policy: Read/Write

Disk Cache Policy   : Disk's Default

Ongoing Progresses:

Reconstruction           : Completed 0%, Taken 1 min.  //逻辑卷正在重建,到100%之后完成,需要重启服务器,逻辑卷的空间才会被拉伸

Encryption Type     : None

Default Power Savings Policy: Controller Defined

Current Power Savings Policy: None

Can spin up in 1 minute: Yes

LD has drives that support T10 power conditions: Yes

LD's IO profile supports MAX power savings with cached writes: No

Bad Blocks Exist: No

Is VD Cached: No


14. 确认步骤二,查看硬盘的状态信息

[root@kvmhost  ~]# MegaCli64 -PDlist -aALL -NoLog| grep -E "Firmware state"

Firmware state: Online, Spun Up

….  省略多行相同输出

Firmware state: Online, Spun Up       //状态已经是online了,表示硬盘状态已正常

Firmware state: Unconfigured(good), Spun Up  //刚才用了两块盘,还剩下一块盘,未操作所以还是未配置


15. 待重构完毕,重启系统之后,再次查看逻辑卷的大小

[root@kvmhost-10-30-11-32 ~]# MegaCli64 -LDInfo -L1  -a0

Adapter 0 -- Virtual Drive Information:

Virtual Drive: 1 (Target Id: 1)

Name                :hhd

RAID Level          : Primary-1, Secondary-0, RAID Level Qualifier-0

Size                : 5.455 TB                         //容量拉伸到5.455T

Is VD emulated      : No

Mirror Data         : 5.455 TB

State               : Optimal

Strip Size          : 64 KB

Number Of Drives    : 10

Span Depth          : 1

Default Cache Policy: WriteBack, ReadAhead, Direct, No Write Cache if Bad BBU

Current Cache Policy: WriteBack, ReadAhead, Direct, No Write Cache if Bad BBU

Default Access Policy: Read/Write

Current Access Policy: Read/Write

Disk Cache Policy   : Disk's Default

Encryption Type     : None

Default Power Savings Policy: Controller Defined

Current Power Savings Policy: None

Can spin up in 1 minute: Yes

LD has drives that support T10 power conditions: Yes

LD's IO profile supports MAX power savings with cached writes: No

Bad Blocks Exist: No

Is VD Cached: No

Number of Dedicated Hot Spares: 1

   0 : EnclId - 32 SlotId - 12

Exit Code: 0x00

[root@kvmhost datapool]# fdisk –l  

//使用fdisk查看,硬盘sdb的大小,发现还是之前的4798.6G,并没有变成5.455 TB,所以需要重启一下服务器

… 省略多行无用的输出

Disk /dev/sdb: 4798.6 GB, 4798552211456 bytes

255 heads, 63 sectors/track, 583390 cylinders

Units = cylinders of 16065 * 512 = 8225280 bytes

Sector size (logical/physical): 512 bytes / 512 bytes

I/O size (minimum/optimal): 512 bytes / 512 bytes

Disk identifier: 0x00000000


  Device Boot      Start         End      Blocks   Id  System

/dev/sdb1               1      267350  2147483647+  ee  GPT

… 省略多行无用的输出


16. 重启服务器,查看硬盘空间

[root@kvmhost ~]# fdisk -l

<省略多行无用输出>

WARNING: GPT (GUID Partition Table) detected on '/dev/sdb'! The util fdisk doesn't support GPT. Use GNU Parted.

Disk /dev/sdb: 5998.2 GB, 5998190264320 bytes     //sdb已经被扩大了

255 heads, 63 sectors/track, 729238 cylinders

Units = cylinders of 16065 * 512 = 8225280 bytes

Sector size (logical/physical): 512 bytes / 512 bytes

I/O size (minimum/optimal): 512 bytes / 512 bytes

Disk identifier: 0x00000000


  Device Boot      Start         End      Blocks   Id  System

/dev/sdb1               1      267350  2147483647+  ee  GPT

<省略多行无用输出>


17. 查看当前系统的分区,分为两种情况

a) 如果系统使用了LVM

[root@kvmhost ~]# df –Th   //查看分区情况,发现/datapool属于lvm的逻辑卷

Filesystem           Type   Size  Used Avail Use% Mounted on

/dev/mapper/kvmvg-root

                    ext4    94G  1.6G   88G   2% /

tmpfs                tmpfs  127G     0  127G   0% /dev/shm

/dev/sda1            ext3   248M   51M  185M  22% /boot

/dev/mapper/datavg-datapool

                    xfs    4.4T  3.9G  4.4T   1% /datapool

[root@kvmhost ~]# lvs      //查看逻辑卷名称

 LV       VG     Attr       LSize  Pool Origin Data%  Meta%  Move Log Cpy%Sync Convert

 datapool datavg -wi-ao----  4.36t

 root     kvmvg  -wi-ao---- 94.97g

 swap     kvmvg  -wi-ao---- 16.00g

[root@kvmhost ~]# vgs      //查看卷组信息

 VG     #PV #LV #SN Attr   VSize   VFree

 datavg   1   1   0 wz--n-   4.36t    0

 kvmvg    1   2   0 wz--n- 110.97g    0

[root@kvmhost ~]# pvs      //查看物理卷信息

 PV         VG     Fmt  Attr PSize   PFree

 /dev/sda2  kvmvg  lvm2 a--u 110.97g    0

 /dev/sdb1  datavg lvm2 a--u   4.36t    0

    需要将多出的空间使用parted创建一个新的分区,再将分区创建为pv,添加到vg,再拉伸lv

[root@kvmhost ~]# parted /dev/sdb

GNU Parted 2.1

Using /dev/sdb

Welcome to GNU Parted! Type 'help' to view a list of commands.

(parted) print //查看分区情况

Warning: Not all of the space available to /dev/sdb appears to be used, you can fix the GPT to use all of the space (an extra 2343043072 blocks) or continue with the current setting?

Fix/Ignore? Fix     //使用parted操作sdb,会提示有空余的空间,是否更新配置,输入fix

Model: DELL PERC H730P Mini (scsi)

Disk /dev/sdb: 5998GB

Sector size (logical/physical): 512B/512B

Partition Table: gpt

Number  Start   End     Size    File system  Name  Flags

1      1049kB  4799GB  4799GB                     lvm


(parted) mkpart primary 4799GB -1 创建分区,分区类型为主分区,起点是4799GB, -1表示剩余所有容量

Warning: WARNING: the kernel failed to re-read the partition table on /dev/sdb (Device or resource busy).  As a result, it may not reflect all of your changes until after reboot.    提示,需要重启系统才能识别

(parted) print    //再次查看当前分区

Model: DELL PERC H730P Mini (scsi)

Disk /dev/sdb: 5998GB

Sector size (logical/physical): 512B/512B

Partition Table: gpt


Number  Start   End     Size    File system  Name     Flags

1      1049kB  4799GB  4799GB                        lvm

2      4799GB  5998GB  1200GB               primary

重启系统之后

[root@kvmhost ~]# pvcreate  /dev/sdb2  //创建PV

[root@kvmhost ~]# pvs

 PV         VG     Fmt  Attr PSize   PFree

 /dev/sda2  kvmvg  lvm2 a--u 110.97g    0

 /dev/sdb1  datavg lvm2 a--u   4.36t    0

 /dev/sdb2         lvm2 ----   1.09t 1.09t

[root@kvmhost ~]# vgextend datavg /dev/sdb2   //拉伸VG

[root@kvmhost ~]# vgs

 VG     #PV #LV #SN Attr   VSize   VFree

 datavg   2   1   0 wz--n-   5.46t 1.09t

 kvmvg    1   2   0 wz--n- 110.97g    0

[root@kvmhost ~]# df –Th     //查看当前分区

Filesystem           Type   Size  Used Avail Use% Mounted on

/dev/mapper/kvmvg-root

                    ext4    94G  2.0G   87G   3% /

tmpfs                tmpfs  127G     0  127G   0% /dev/shm

/dev/sda1            ext3   248M   51M  185M  22% /boot

/dev/mapper/datavg-datapool

                    xfs    4.4T  132G  4.3T   3% /datapool

[root@kvmhost ~]# lvextend -l +100%FREE /dev/mapper/datavg-datapool  //拉伸LV

[root@kvmhost ~]# xfs_growfs /dev/mapper/datavg-datapool     //拉伸文件系统

meta-data=/dev/mapper/datavg-datapool isize=256    agcount=5, agsize=268435455 blks

        =                       sectsz=512   attr=2, projid32bit=0

data     =                       bsize=4096   blocks=1171513344, imaxpct=5

        =                       sunit=0      swidth=0 blks

naming   =version 2              bsize=4096   ascii-ci=0

log      =internal               bsize=4096   blocks=521728, version=2

        =                       sectsz=512   sunit=0 blks, lazy-count=1

realtime =none                   extsz=4096   blocks=0, rtextents=0

data blocks changed from 1171513344 to 1464385536

[root@kvmhost ~]# df –Th   //验证分区容量是否扩大

Filesystem           Type   Size  Used Avail Use% Mounted on

/dev/mapper/kvmvg-root

                    ext4    94G  2.0G   87G   3% /

tmpfs                tmpfs  127G     0  127G   0% /dev/shm

/dev/sda1            ext3   248M   51M  185M  22% /boot

/dev/mapper/datavg-datapool

                    xfs    5.5T  132G  5.4T   3% /datapool  拉伸成功

b)     如果系统直接将sdb格式化挂载使用

[root@kvmhost ~]# df -Th

Filesystem           Type   Size  Used Avail Use% Mounted on

/dev/mapper/kvmvg-root

                    ext4    94G  1.6G   88G   2% /

tmpfs                tmpfs  190G     0  190G   0% /dev/shm

/dev/sda1            ext3   248M   51M  185M  22% /boot

/dev/sdb             xfs    4.4T  2.4G  4.4T   1% /datapool

[root@kvmhost ~]# fdisk -l

< 省略多行无用的输出>

WARNING: GPT (GUID Partition Table) detected on '/dev/sdb'! The util fdisk doesn't support GPT. Use GNU Parted.

Disk /dev/sdb: 5998.2 GB, 5998190264320 bytes

255 heads, 63 sectors/track, 729238 cylinders

Units = cylinders of 16065 * 512 = 8225280 bytes

Sector size (logical/physical): 512 bytes / 512 bytes

I/O size (minimum/optimal): 512 bytes / 512 bytes

Disk identifier: 0x00000000

< 省略多行无用的输出>

[root@kvmhost ~]# xfs_growfs /dev/sdb    //拉伸xfs分区

[root@kvmhost ~]# df –Th  

Filesystem           Type   Size  Used Avail Use% Mounted on

/dev/mapper/kvmvg-root

                    ext4    94G  1.6G   88G   2% /

tmpfs                tmpfs  190G     0  190G   0% /dev/shm

/dev/sda1            ext3   248M   51M  185M  22% /boot

/dev/sdb             xfs    5.5T  2.4G  5.5T   1% /datapool

验证,容量已经扩充到5.5T


18. 上面两个情况,都可以实现分区拉伸,不过可以发现,非lvm的模式更加简单。


作者介绍

杨俊俊 新钛云服运维架构师

十年运维经验,曾任盛大游戏资深云工程师,前隆科技系统运维主管。《深度实践KVM》,《Linux运维最佳实践》作者。精通KVM,VMWare,Docker等虚拟化相关技术。在基础架构、虚拟化和自动化运维方面具有丰富的实战经验,主导实施过上万台服务器上云迁移。


版权声明:本文为新钛云服原创编译,谢绝转载,否则将追究法律责任!

 

精品好文:

OpenStack Rocky:专注于裸机云管理,快速升级以及硬件加速

Chef进行自动化和编排的优缺点分析

高效的容器使用需要软件定义的数据中心

Ceph BlueStore 与 FileStore:利用 Micron NVMe SSD 进行性能比较

django快速上手指南

OpenStack与ZStack深度对比:架构、部署、计算存储与网络、运维监控等

清单管理在运维服务中的实践

从盛大游戏G云COO到独自创业!2018中国财经峰会专访新钛云服CEO冯祯旺

刚刚,新钛云服荣获中国财经峰会2018最具投资价值奖!

什么是云原生?

孩子通CTO李文杰:孩子通运维2.0的升级之路。

IT混合云战略:是什么、为什么,如何构建?

王者归来,Linux运维专家胥峰加入新钛云服!

运行Docker:物理机vs虚拟机,五方面详细对比!

新钛云服,打造最专业的Cloud MSP+,做企业业务和云之间的桥梁

: . Video Mini Program Like ,轻点两下取消赞 Wow ,轻点两下取消在看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存