温馨提示:要看高清无码套图,请使用手机打开并单击图片放大查看。
Fayson的github:https://github.com/fayson/cdhproject
提示:代码块部分可以左右滑动查看噢
1.文档编写目的
在CDH集群中告警是一个很重要的信息,最直观的衡量一个集群的健康状况,那么我们如何来管理集群的告警信息?通过Cloudera Manager来管理的CDH集群,提供了多种告警管理方式(如:邮件、SNMP及自定义告警脚本),本篇文章主要介绍如何通过Cloudera Manager配置使用SNMP方式转发告警。
- 内容概述
1.准备SNMP NMS告警接收服务器
2.CM配置SNMP及验证
3.CM告警的MIB文件查找
- 测试环境
1.CM和CDH版本为5.14.3
- 前置条件
1.CDH集群使用Cloudera Manager管理
2.准备SNMP告警接收服务器
在这里Fayson选择集群的一台服务器作为集群的SNMP告警的接收服务器,需要先安装SNMP告警接收服务,用于模拟Cloudera Manager向SNMP服务器发送告警。
1.在选择的服务器上执行如下命令安装SNMP告警接收服务
[root@ip-172-31-5-171 ~]# yum -y install net-snmp net-snmp-devel net-snmp-utils
2.修改/etc/snmp/snmptrapd.conf配置文件,在配置文件中增加如下内容
[root@ip-172-31-5-171 log]# vim /etc/snmp/snmptrapd.conf # Example configuration file for snmptrapd # # No traps are handled by default, you must edit this file! # authCommunity log,execute,net public # traphandle SNMPv2-MIB::coldStart /usr/bin/bin/my_great_script cold
3.启动snmptrapd服务并检查
[root@ip-172-31-5-171 static]# snmptrapd -C -c /etc/snmp/snmptrapd.conf -df -Lo
启动参数说明:
-C :表示不使用net-snmp默认路径下的配置文件snmptrapd.conf;
-c :指定snmptrapd.conf文件;
-d :显示收到和发送的数据报,通过这个选项可以看到数据报文;
-f :默认情况下,snmptrapd是在后台中运行的,加上这个选项,表示在前台运行;
-L :指定日志记录在哪里,后面的o表示直接输出到屏幕上,如果是跟着f表示日志记录到指定的文件中;
使用如上命令主要是用于方便的显示出接收到的SNMP告警信息。
3.Cloudera Manager配置SNMP服务
1.使用管理员登录Cloudera Manager
进入Cloudera Management Service服务
2.点击“配置”,进入配置页面并搜索“SNMP”
配置SNMP NMS服务的主机名称及SNMPv2团体字符串,完成如上配置后,点击“保存更改”,回到CM主页根据提示重启相应服务。
重启Cloudera Management Service服务即可。
4.验证SNMP服务是否正常接收告警
1.登录集群任意节点,手动的将HRegionServer服务杀掉
使用java的jps命令查看运行的Java服务
执行kill命令将HRegionServer服务杀掉
2.在CM界面上显示HBase服务的告警信息如下
3.在SNMP服务器上查看接收到的告警信息
到此已完成通过CM使用SNMP方式转发告警的测试。
5.SNMP告警的MIB
通过如上方式的配置我们可以通过SNMP的方式接收到CM的告警信息,那么我们再自己的告警平台如何解析CM发送过来的告警呢?我们都知道SNMP存取的变量是以阶层的方式结合,这些分层和其它元数据管理信息库(MIBs)的方式描述,要解析CM发送的告警则需要相应的MIB文件才能解析,CM的MIB文件在通过如下方式可以查看到。
1.登录CM进入Cloudera Management Service服务
2.进入“配置”页面
根据上图进行筛选,点击箭头所指的地址即可查看CM告警的MIB描述文件,内容如下:
6.总结
- 通过CM配置SNMP告警转发只需要配置SNMP NMS地址及Community即可
- 服务出现异常到收到告警信息约有20s左右的延迟
提示:代码块部分可以左右滑动查看噢
为天地立心,为生民立命,为往圣继绝学,为万世开太平。
温馨提示:要看高清无码套图,请使用手机打开并单击图片放大查看。
推荐关注Hadoop实操,第一时间,分享更多Hadoop干货,欢迎转发和分享。
原创文章,欢迎转载,转载请注明:转载自微信公众号Hadoop实操
本文暂时没有评论,来添加一个吧(●'◡'●)