明白监控的重要性以及使用监控要实现的业务目标,下面我们就来聊聊关于运维监控数据?接下来我们就一起去了解一下吧!

运维监控数据(一文说尽运维监控)

运维监控数据

监控目标

明白监控的重要性以及使用监控要实现的业务目标

通常包括以下三点:

监控方法监控核心监控工具监控流程

通过SNMP、Agent、ICMP、SSH、IPMI等对系统进行数据采集

各类数据库服务,MySQL、PostgreSQL

提供图形及时间线情况信息,方便我们定位故障所在

指标信息、指标趋势展示

电话、邮件、微信、短信、报警升级机制

故障级别判定,找响应人员进行快速处理

监控指标硬件监控系统监控应用监控

MySQL

Redis、Redis Cluster

Nginx

网络监控流量分析日志监控安全监控性能监控(APM)java|php|go|nodejs|分布式链路追踪业务监控

电商业务为例:

其他监控报警报警处理

故障自愈: 服务器宕机自动启动。利用软件机制supervisor,systemd或者自定义脚本实现

综合监控硬件监控

通过SNMP来进行路由器交换机的监控、其他内容使用IPMI实现。如果都是公有云,可以忽略这部分内容。案例:Open-Falcon监控H3C-ER3260G2路由器

系统监控服务监控监控总结

完整的监控系统,需要对业务有详尽的了解,软件只是手段。

,