网站首页 > 开源技术 正文
从0开始解决线上Zabbix监控平台故障
(1)学习Linux技术,后期从事Linux运维方面的工作,作为运维人员最主要的工作职责之一:保障企业门户网站、业务系统、数据库、服务器高效稳定的运行,一旦有异常或者故障能够第一时间去解决。
(2)作为运维人员是如何第一时间去获取门户网站、业务系统、数据库、服务器等运行状态呢?是通过手工7x24x365去刷新和访问吗?可以通过开源的监控软件平台7x24x365实时自动的去检测其运行的状态。
(3)互联网IT企业中,主流的开源监控软件有哪些种类呢?
MRTG;
Cacti;
Nagios;
Ganglia;
Zabbix;
Prometheus;
(4)通过线上云服务器构建了一套Zabbix监控平台,发现监控平台无法运行了,而且报错信息如图所示:
Zabbix server is running No localhost:10051
#根据上图的提示,表示Zabbix Server的运行状态是:No,没有监听本地localhost主机地址+10051端口,解决方法:
检测一下Zabbix Server服务进程和端口是否存在;
ps -ef|grep zabbix_server
netstat -tnlp|grep -w 10051
通过手工方式启动一下Zabbix server独立服务即可;
/etc/init.d/zabbix_server start
(5)启动Zabbix Server服务时,报错信息二如下所示:
Can't find file /usr/local/sbin/zabbix_server.
Zabbix server NOT started.
#根据如上的错误提示,表示启动Zabbix Server服务时,启动脚本文件会读取Zabbix Server主程序文件:/usr/local/sbin/zabbix_server,该文件提示不能找到,所以Zabbix Server服务不能启动。
解决方法:
检测Zabbix Server主程序文件/usr/local/sbin/zabbix_server是否存在;
if [ -f /usr/local/sbin/zabbix_server ];then echo ok ;fi
ls -l /usr/local/sbin/zabbix_server
可以通过find|locate工具查找zabbix_server主程序文件的路径;
find / -name "zabbix_server"
find / -name "zabbix_server"|grep -vE "init|bak"
ln -s /usr/local/zabbix/sbin/zabbix_server /usr/local/sbin/
find / -name "zabbix_server"|grep -vE "init|bak" -exec ln -s {} /usr/local/sbin/ \;
(6)启动Zabbix Server服务时,报错信息三如下所示:
Zabbix_server [10775]: user zabbix does not exist
Zabbix_server [10775]: cannot run as root!
#根据如上的错误提示,表示启动Zabbix Server服务时,需要使用zabbix用户去启动,而Linux系统没有检测到该用户,该用户是不存在的,不能使用root用户直接启动。
解决方法:
检测一下Linux系统是否存在zabbix用户;
id zabbix
grep -w zabbix /etc/passwd
通过手工useradd命令创建zabbix用户即可;
useradd -s /sbin/nologin zabbix -M
(7)启动Zabbix Server服务时,报错信息四如下所示:
Connection to database 'zabbix' failed: [1045] Access denied for user 'zabbix'@'localhost' (using password: NO)
#根据如上的错误提示,表示启动Zabbix Server服务时,Zabbix Sever服务组件需要连接后端MYSQL数据库服务,要往数据库中持久化存储客户端监控数据,错误提示使用zabbix用户和空密码,通过localhost登陆数据库服务,访问zabbix库被拒绝。
解决方法:
检测一下后端MYSQL数据库是否授权&创建zabbix库;
show databases;
select user,host,password from mysql.user;
检测zabbix server配置文件,数据库连接信息是否填写密码或者密码是否正确;
基于Zabbix监控线上阿里云服务器
(1)根据如上的Zabbix故障排错,Zabbix监控平台可以正常使用了,作为运维人员能够利用Zabbix监控平台去监控哪些数据呢?监控哪些指标呢?能够给企业带来哪些好处呢?
(2)在企业中,可以使用Zabbix来监控四个层面的数据指标,哪四个层面呢?
硬件层面
Zabbix可以监控硬件服务器设备,例如监控硬件设备的CPU温度、硬盘异常情况、风扇转速、电源异常情况、机箱是否被黑客入侵等。
软件层面
Zabbix可以监控软件服务,例如监控Nginx、Tomcat、MQ、ZK、ELK、Redis、MYSQL、LVS、Keepalived等服务的运行状态、PID、端口号,可以监控服务的返回值、状态码等。
系统层面
Zabbix可以监控Windows/Linux操作系统,监控指标:CPU、MEM、DISK、NET、I/O、Open files、Process、User、Port等。
网络层面
Zabbix可以监控网络设备,例如监控交换机、路由器、防火墙设备,监控其出口和入口的带宽,监控设备之间的网络连通性等。
往期文章精选:
欢迎大家关注我的头条号,私信“python",学习资料包免费分享给需要的朋友,另有python学习交流群,可以交流学习拓展人脉。
- 上一篇: Linux运维工程师必知的29个监控工具
- 下一篇: 时下最IN的时髦单品,居然是军事背心?!
猜你喜欢
- 2024-10-08 时下最IN的时髦单品,居然是军事背心?!
- 2024-10-08 Linux运维需要懂的开源运维工具(?晓桂科技温馨提醒)
- 2024-10-08 Linux运维工程师必知的29个监控工具
- 2024-10-08 超越可观测性三大支柱(可观测性是什么意思)
- 2024-06-30 「使命召唤手游」武器大师必看04!霰弹狙M1887全面评测
- 2024-06-30 FANUC常用PMC信号表(fanuc的pmc)
- 2024-06-30 AMD来帮忙!英特尔两款独显新品被曝光
- 2024-06-30 三一海工携手福建融港码头,首批9台RTG成功发运
- 2024-06-30 监控软件怎少得了Zabbix?一份超详细文档让你全面掌握,建议收藏
- 2024-06-30 Linux机架-Nagios监控与Cacti趋势分析-D9-趋势分析
你 发表评论:
欢迎- 最近发表
- 标签列表
-
- jdk (81)
- putty (66)
- rufus (78)
- 内网穿透 (89)
- okhttp (70)
- powertoys (74)
- windowsterminal (81)
- netcat (65)
- ghostscript (65)
- veracrypt (65)
- asp.netcore (70)
- wrk (67)
- aspose.words (80)
- itk (80)
- ajaxfileupload.js (66)
- sqlhelper (67)
- express.js (67)
- phpmailer (67)
- xjar (70)
- redisclient (78)
- wakeonlan (66)
- tinygo (85)
- startbbs (72)
- webftp (82)
- vsvim (79)
本文暂时没有评论,来添加一个吧(●'◡'●)