查看原文
其他

【模板参考】 Linux 系统巡检报告 / AIX 系统巡检报告


Linux 系统巡检报告


硬件检测

硬件机型


是否集群


系统实际用户数




Alert

电源情况

电源指示灯:绿色

运行情况

报警指示灯:绿色

FreeDisk

本地磁盘

位置:

命令:df -m

结果:

 

存储磁盘

 

 

查看使用率过高的磁盘

 

 

CPU

使用情况

命令:top,sar  110

结果:


CPU100%空闲

CPU使用率0%

运行情况

1%-50%(正常),51%-90%(正常),90%-98%(过高),98%-100%(故障)

消耗CPU进程

 

Memory

使用情况

命令:Free -m

运行情况


第一部分Mem行:
 total 内存总数: 7931M
 used 已经使用的内存数: 7902M
 free 空闲的内存数: 28M
 shared 当前已经废弃不用,总是0
 buffers Buffer 缓存内存数: 232M
 cached Page 缓存内存数:6351M

关系:total(7931M) = used(7902M) + free(28M)

第二部分(-/+ buffers/cache):
 (-buffers/cache) used内存数:1354M (指的第一部分Mem行中的used - buffers - cached)
 (+buffers/cache) free内存数: 6576M (指的第一部分Mem行中的free +  buffers + cached)

-buffers/cache反映的是被程序实实在在吃掉的内存,而+buffers/cache反映的是可以挪用的内存总数

 

使用率

17%

swap

使用情况

命令:free

正常

 

 

运行情况

正常

 

使用率

0%

 




系统检测


诊断结果及建议

NetWork



配置情况

Netstat

Netstat | grep  80

ioscan –nfClan

lanscan

ifconfig  lanX

 

运行情况

正常

 

结果


IO

状态

命令:iostat

 

Cluster

状态

命令:clustat

 

Syslog

系统日志

 

/var/log/messages     一般系统日志      

 

日志情况

正常

错误信息

用户日志

/var/log/secure        用户登录信息         用last命令查看

 

日志情况

正常

错误信息


服务器分析日志

由厂商工程师负责文件清理

日志情况




R6K系统检查报告


系统名称

系统用途

hostname

IP

物理机序列号







检查结果汇总:


序号

检查项目

检查结果

后续措施

1

CPU\内存状态



2

逻辑磁盘状态



3

系统启动列表



4

交换空间使用率



5

VG状态



6

文件系统使用率



7

系统错误日志(errpt)



8

HDS存储状态



9

系统CPU性能



10

系统内存性能



11

系统I/O性能



12

HA状态



13

备份状态




一、 系统部分


1、序列号uname -uM

XXXXXX


2、系统启动列表bootlist -m normal -o

hd5 hdisk0

hd5 hdisk1


3、检查CPU个数及状态

lsdev -Cc processor


4、内存状态

lsdev -Ccmemory


5、检查逻辑磁盘个数及状态

lsdev -Ccdisk


6、卡工作状态

lsdev -Ccadapter


7、检查交换空间状态

lsps -a


8、检查VG情况

lsvg -o

appvg

backvg

rootvg


lsvg `lsvg -o`

主要检查参数 STALE PVs: QUORUM: STALE PPs:


lsvg -p `lsvg -o`


lsvg -l `lsvg -o`

注意lv state 是否均为open/syncd


9、检查文件系统

df –g

注意检查Inode的使用率


10、系统错误日志

errpt 

检查最近一个星期的errpt,确认所有报错都已经有解决方案cover


11、网络信息

ifconfig -a

entstat  ent0 | grep Error   {网卡物理线路Error计数要为0}


二、存储部分


$ sudo ./sys


$ sudo ./lu


$ sudo ./path


fcstat   fcs0 | grep Error   {光纤卡物理线路Error计数要为0}


三、HACMP


1) /usr/es/sbin/cluster/utilities/clRGinfo -m     {资源组和位置显示要正常}


2) /usr/es/sbin/cluster/utilities/clshowsrv -v     {HA相关的daemon正常}


四、备份检查


最近一次OS APP DB的备份结果及备份完成时间是否有变化


五、系统性能



vmstat 1 10


iostat 1 10


由社区会员heyxdongzhiwen、ws187131593分享

word文档下载:

http://www.talkwithtrend.com/Document/detail/tid/152241

http://www.talkwithtrend.com/Document/detail/tid/98133



点击阅读原文,社区资料库6万份资料供您搜索


长按二维码关注公众号

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存