搭建Nagios core+SNMP监控平台

公司目前的监控预警体系主要靠自己编写Python脚本,读取各种性能指标,并判断是否超过阀值;每一台被监控机器上都部署该脚本;中央监视平台定期访问每个被监控端获取超越阀值的预警信息,如果有预警则发送邮件。在服务器数量少的情况下运维压力不大,而如今服务器数量增长到几十台,分布在阿里云和自有机房,所以需要寻求一种更加可靠的统一的监控预警体系。于是我们将目光落在Nagios上~~ Nagios简介 Nagios core本身是一个开源框架,它可以注册需要监控的主机和服务,周期性调用插件去检测主机和服务的状态,并提供web界面来查看这些状态信息,同时支持email等方式发送预警。与被监控主机间的通信和监控内容则是通过各种插件来实现的。官方提供了一些插件,通过安装Nagios Plugins即可,如果想要使用snmp插件还需要预先安装