简介
如果你们公司使用的Dell服务器,当管理人员在IDC机房现场巡检时,一般通过服务器上的提升灯来判读服务器是否有故障。但是不能一直守在机房巡检,我们如何做到在线查看Dell服务器的硬件状态呢?
下面我们就来介绍两种在线方式查看Dell服务器的硬件状态,通过这两种方式再配合第三方工具可以做到故障告警及通知。
iDRAC远程控制卡(iDRAC),是附加在服务器上的一台小计算机,通过与服务器主板上的管理芯片BMC进行通信,监控与管理服务器的硬件状态信息,是最常用的监控方式。
iDRAC提供单独网卡供我们配置,这样做的好处是不会影响服务器操作系统层面的网络接口,接入网络后,可以通过https://ip即可进行远程访问和管理。
另外通过Dell服务器前面板的LCD可以查看iDRAC的网卡配置信息及服务器告警信息。
OMSA
通过Dell服务的OpenManage Server Administrator (简称omsa)监控服务器的各个硬盘设备的运行情况,如电压,温度,内存以及硬盘,raid信息等等。
OMSA旨在让系统管理员即能够在本地管理服务器系统,也能够通过网络远程管理服务器系统。通过两种方式提供全面的、一对一的系统管理解决方案:
- 集成基于 Web 浏览器的图形用户界面 (GUI)
- 通过操作系统显示的命令行界面 (CLI)
OMSA支持的操作系统如下:
- Red Hat Enterprise Linux 5 server Update 9 (both x86 and x86_64)
- Red Hat Enterprise Linux 6 server Update 5 (x86_64)
- Red Hat Enterprise Linux 7 server (x86_64)
- SUSE Linux Enterprise Server 11SP3 (x86_64)
1.完全安装
wget -q -O - http://linux.dell.com/repo/hardware/latest/bootstrap.cgi | bash
yum install srvadmin-all
我们使用的完全安装,其中还支持:
- srvadmin-base:安装omsa基础组件,不包含webserver
- srvadmin-webserver:安装web界面
- srvadmin-storageservices:安装raid管理界面
- srvadmin-rac4:安装dell远程管理组件-4
- srvadmin-rac5:安装dell远程管理组件-5
2.启动
/opt/dell/srvadmin/sbin/srvadmin-services.sh start或者service dataeng start
#加入开机启动
chkconfig dataeng on
#启动端口
netstat -ntlp |grep :1311
3.使用
(1)图形化界面
OMSA启动后,可通过https://ip:port登陆web界面,账号密码和服务器的root账户信息一致。
在图形化界面中,我们可以查看服务器固件、电池、内存、网络、电源等各种信息。
(2)命令行界面
当OMSA安装后会生成omreport命令,用于在命令行界面进行管理。可以通过如下命令查看服务器的硬件状态:
#CMOS电池状态
omreport chassis batteries
#风扇状态
omreport chassis fans
#内存状态
omreport chassis memory
#网卡状态
omreport chassis nics
#CPU状态
omreport chassis processors
#电源状态
omreport chassis pwrsupplies
#温度状态
omreport chassis temps
#硬盘状态
omreport storage pdisk controller=0
#raid状态
omreport storage vdisk controller=0
通过命令行界面,运维管理人员可以很灵活的查看服务器的硬件状态。
应用场景虽然iDRAC和OMSA是解决了管理人员在线巡检的需求,但是还无法做到故障告警并发送通知。通过对以上两种方式的了解,我们可以结合其他第三方工具来实现我们需求。
1.iDRAC SNMP Zabbix,Zabbix通过SNMP协议实现对服务器硬件信息的收集。
2.OMSA Zabbix,Zabbix通过OMSA 的omreport自定义脚本实现对服务器硬件信息的收集。
以上两种方式可以根据实际的网络环境按需选择。
,