查看原文
其他

AIX UNIX 下 HACMP/POWERHA 高可用集群的配置与搭建

准备工作

系统环境

1.从官网或前辈那里获取到HA的安装镜像和补丁,放在/tmp目录下

官网地址:https://www-945.ibm.com/support/fixcentral

2.两台小机上的系统版本、HA版本、补丁版本

系统版本

HA版本

补丁版本

AIX  6106SP1

PowerHA6.1  SP17

PowerHA6.1  SP17

3.共享磁盘为hdisk2、hdisk3

IP规划

节点名称

集群网络

网络设备名

IP

a01

a011_boot1

en0

192.168.1.33

a011_boot2

en1

192.168.2.33

Psersistent_IP

      NULL

192.168.3.33

a02

a02_boot1

en0

192.168.1.34

a02_boot2

en1

192.168.2.34

persistent_IP

NULL

192.168.3.34


Service_IP

NULL

192.168.3.134


网络配置

在两台主机上均做如下修改

1.根据IP规划,修改/etc/hosts文件内容

2.添加文件/usr/es/sbin/cluster/etc/rhosts

添加完成后,检测是否配置成功

#ping host1/2_boot1/2

若能相互ping通,表示配置成功,可进行下面操作


安装HACMP

1.安装镜像为 PowerHAv61.iso 补丁压缩包为PowerHa6.1sp17.zip

2.挂载安装镜像到/mnt目录下

  #loopmount -i POwerHAv61.iso -o “-V cdrfs -o ro” -m /mnt

3.进入/mnt/installp/ppc下 #cd /mnt/installp/ppc

执行#smit install_all  安装源选择当前目录


更新HA补丁

1.切换到目录/mnt,解压补丁包到当前目录

#jar -xvf PowerHa6.1sp17.zip

2.解压完成后,建立索引

    #inutoc .

3.建立完索引后,进行更新(打补丁)

    #smit update_all 更新源选择当前目录

更新中.....

4.更新成功后,查看版本信息如下


配置PowerHA

PowerHA的配置分为拓扑和资源组两部分

首先配置网络拓扑结构

执行#smit hacmp,选择扩展配置

选择扩展的拓扑配置

选择配置hacmp Cluster

选择增加一个Cluster

输入Cluster名称后,回车

添加节点

进入下面菜单

#smit hacmp

——Extended Configration

——Extended Topology Configuration

选择hacmp节点

Nodename处填写几点名,communication path to node处按F4,选择a01_boot1(此时在b03上),然后回车添加成功

同样的方法添加节点2,添加成功后如下

添加网络

进入下面菜单

#smit hacmp

——Extended Configuration

选择自动发现

自动发现过程如下:

执行发现成功后,如下:

进入如下菜单:

#smit hacmp

——Extended Configuration

——Extended Topology Configuration

选择配置hacmp网络

选择添加一个网络,选择ether

默认即可,确认后回车即可添加

添加通讯接口

进入如下界面

smit hacmp

  --Extended Configuration

   --Extended Topology Configuration

选择配置通讯接口

选择增加通讯接口,并选择已发现的接口

选择通讯接口

选择之前配置好的网络名称

选择对应的网络接口

添加磁盘心跳

注意:这部分内容是后添加的,操作环境有变化,节点名称为a03和a04,注意区别即可

进入如下菜单:

smit hacmp

  --Extended Configuration

   --Extended Topology Configuration

选择添加网络

选择管理多节点磁盘心跳

选择创建1个磁盘心跳vg,并且选择hdisk2

确认信息后,回车添加

添加成功

查看磁盘心跳

进入如下菜单:

smit hacmp

  --Extended Configuration

   --Extended Topology Configuration

    --Configure HACMP Networks

     --Manage concurrentaccessvolumegroupsformulti-nodediskheartbeat

选择查看

选中后回车,出现下图字样,表示成功。

添加永久管理IP

进入如下菜单:

smit hacmp

  --Extended Configuration

   --Extended Topology Configuration

选择配置永久ip

选择添加永久ip,选择节点a01

在nodeiplabel那里,按f4选择a01_per标签

同样的方法添加a02的永久ip

创建applicationserver

进入如下菜单

smit hacmp

  --Extended Configuration

选择扩展的资源配置

选择hacmp扩展的资源配置

选择配置hacmp的applicationserver

选择增加1个applicationserver

创建集群启停脚本

两个节点都执行如下命令

分别填写servername和启停脚本

配置服务IP

进入如下界面

smit hacmp

  --Extended Configuration

   --Extended Resource Configuration

--HACMP Extend Resource configuration

选择配置hacmp服务ip

选择增加1个serviceip

选择之前配置好的网络

选择填写好serviceip的label后回车确认即可。

创建资源组

进入如下菜单

smit hacmp

  --Extended Configuration

   --Extended Resource Configuration

选择hacmp扩展的资源组配置

选择增加1个资源组

输入资源组的名称,选择资源组的候选节点,按照下图配置资源组的切换行为。

关联资源到资源组

进入如下菜单

smit hacmp

  --Extended Configuration

   --Extended Resource Configuration

--HACMP Extend Resource configuration

选择更改资源组属性,选择appgrp

在appgrp的属性菜单关联serviceip和appserver

注意:这部分内容是后添加的,操作环境有变化,节点名称为a03和a04,注意区别即可

创建共享卷组

进入菜单

smit hacmp

  --System Management (C-SPOC)

   ---Storage

    --volume groups

选择创建vg,同时选中a01和a02节点

选择hdisk3

选择scalablevg

选择关联的资源组,并填写卷组名称

创建成功

同步集群配置

进入菜单

smit hacmp

  --Extended Configuration

选择同步验证配置

选择自动更正错误和强制同步为yes,回车同步

同步过程如下

同步结果如下

同步完成后,hacmp配置完成。


PowerHA集群管理

PowerHA服务的查看及启停

进入菜单

smit hacmp

  --System Management (C-SPOC)

选择hacmp服务

选择showclusterservice表示查看hacmp的服务状态

当前状态为未启动

进入菜单

smit hacmp

  --System Management (C-SPOC)

   --HACMP Services

选择启动hacmp服务,可以启动

在启动节点的选项处选择两个节点,可以同时启动a01和a02

回车,启动hacmp

查看及切换资源组

进入菜单

smit hacmp

  --System Management (C-SPOC)

选择资源组和应用选项

选择查看当前资源组的状态可以查看

结果表示资源组在a01上

进入菜单

smit hacmp

  --System Management (C-SPOC)

   --Resource Group and applications

选择移动资源组到另一个节点

选择移动到另一个节点,会弹出备选的资源组供选择

选择目标资源组

确认资源组及移动的目标节点

回车后即可移动成功。

扩展

说明:下图为典型HA两节点高可用环境结构图

HA三要素:

1. IP

2. 存储Storage

3. 服务的起停脚本Script

集群中的心跳检测:心跳检测用于监视网络接口、通信设备和IP标签(服务、非服务和持久IP标签)的可用性,从而监视节点的可用性。

在AIX环境下,心跳检测由AIX的RSCT子系统完成,方式是让每个通信接口或设备在集群的节点间交换持续有效的数据包。

几种心跳手段的使用

a. 串口心跳的使用

HACMP目前支持通过串口网络(RS232)来进行集群节点间的非TCP/IP心跳信号交换。串口RS232需要每个集群节点至少有一个可用的串行端口,通过串行连接建立节点来完成心跳信号的传递。其结构图如上图所示。

串行端口的查询命令

   #lsdev–Cc tty

tty0 Available 01-S1-00-00 Asynchronous Terminal

b.磁盘心跳的使用(本例使用的心跳模式)

通过磁盘交换信息,也是一种防止集群分割的非IP网络配置方案。该方案要求必须存在某种共享的存储系统(FC阵列、SSA阵列或SCSI阵列)。通过使用共享磁盘来构建HACMP下的増强型并发卷组,以HACMP使用该卷组来传递持续有效的消息。其结构如上图所示。

优点:使用共享磁盘来执行心跳信号交换,可以屏蔽网络故障带来的误报,且对硬件没有特殊要求。

缺点:串口心跳拥有距离上的优势(使用PPP协议在电话网络上通信),而磁盘心跳会受光纤长度的限制(一根光纤最长距离是140m)。

磁盘心跳的使用需要遵循以下技术规范:

1.一组磁盘心跳网络只可以用在两个节点的集群中,多节点集群需要使用由若干磁盘创建的若干心跳网络

2.  必须将磁盘设置成增强并发vg,但不一定要将该vg激活,或者归属于资源组管理

c. TCP/IP网络心跳

HACMP为IP网络定制了对应的心跳检测能力,在不改变集群节点IP设置的情况下,通过让HACMP自动设置IP别名来执行心跳信息检测。这个功能的实现上无需配置,它会随HACMP的启动而启动。启用的IP地址别名与现有的IP地址处于不同的子网中,并且不会在/etc/hosts文件、DNS服务器中定义。

执行心跳检测任务的AIX子系统是RSCT,RSCT会使用HACMP为节点定义的IP别名来建立检测信号环,完成心跳检测。其结构如上图所示。上图所示的两节点集群中,两个节点都有两个通信接口,因此需要两个不可路由的子网用于心跳检测。


社区会员黄健亮分享


长按二维码关注“AIX专家俱乐部”公众号

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存