编程开源技术交流,分享技术与知识

网站首页 > 开源技术 正文

Linux机架-使用Nagios进行监控和使用Cacti进行趋势分析-D1

wxchong 2024-09-30 04:21:52 开源技术 292 ℃ 0 评论

使用Nagios进行监控和使用Cacti进行趋势分析

监控可能是最重要的基础架构管理之一。当系统出现故障时,监控应提醒站点可靠性工程师(SRE),以便他们调查受影响的服务并尝试将系统重新联机。之后,应进行根本原因分析,并采取措施防止将来出现类似问题。理想情况下,监控会在问题导致服务中断之前发出警报。

趋势分析能够查看给定应用程序或系统的历史和当前指标。趋势分析有助于故障排除和容量规划。查看一周或更长时间的内存使用情况有助于分析应用程序并规划未来的升级和性能增强。

本章介绍如何监控以及如何使用开源软件(特别是Nagios)监控基础架构。它还包括使用另一种名为Cacti的开源软件进行趋势分析。

要监控什么

监控内容是运营团队提出的永久性问题。 为帮助确定要监控的内容,请考虑以下问题:

  • 批判性的应用程序
  • 服务水平协议
  • 需要监控的资源

应该监控生产应用程序,即产生收入的应用程序,以确保最大化的正常运行时间。 如果应用程序具有服务级别协议,则监视应有助于维护协议。 此外,请记住监控基础架构所需的资源,因为在整个地方弹出警报但没有足够的工程师响应会导致工程师的寻呼机疲劳。

系统监视器

关于Linux系统,可以监控许多服务以及可以跟踪的许多指标。 其中一些列在这里:

  • CPU忙/空闲:如果CPU接近100%忙,可能是时候为系统增加更多处理能力了。 通常的做法是为80%CPU忙碌设置警告,为100%CPU忙碌百分比设置严重警报。
  • 无内存/已使用:应监视物理内存和交换空间。 内存使用的一个可能阈值是:如果内存使用率超过80%,则发送警告警报; 如果以100%使用,则发送严重警报。
  • 磁盘使用/免费:监控可用磁盘空间有助于防止文件系统变满。 可以使用类似于CPU /内存的阈值,分别为警告和严重警报的80%和95%。
  • 网络使用:根据网络带宽,您可能需要设置警告/严重阈值警报。 使用80%/ 100%规则是标准做法。

应用程序监视器

与系统监视器一起,应用程序监视器可以帮助检测应用程序的故障点应将监控和指标纳入应用程序设计本身;他们不应该是事后的想法。如果您正在构建Web应用程序,请让Web应用程序跟踪其关键指标并将其输出到日志文件,或者通过API帮助监视和跟踪应用程序。 Apache的状态页面包含可用于监控Apache的有用指标。示例页面位于https://www.apache.org/server-status。这里列出了一些可以监控Apache的指标:

正在运行的Apache进程数:如果使用prefork.c模块,此数字应至少与MinSpareServers匹配,而不应超过ServerLimit。

连接的客户端数量:此数字应小于MaxClients。如果等于MaxClients,则可能会触发警告警报,以便可以旋转其他Apache实例。

URL:此度量标准通过Apache访问网页,并确保在预期的时间范围内提供页面。

如何监控

在确定了“监控内容”后,下一步就是弄清楚如何监控。 “如何”至少可以通过三种不同方式完成:

  • 主动检查
  • 被动检查
  • 基于SNMP

主动检查是由监控平台启动的检查。 如果您有一个Nagios服务器并且它到达客户端以执行测试,则将其视为活动检查。 主动检查的优点如下:

易于管理:由于所有检查都集中在服务器上,因此升级很容易。 此外,设置监控相对容易,因为您只需配置服务器。

帮助简化防火墙规则:受监控的客户端必须信任单个服务器或服务器群集,并允许传入检查,从而减少防火墙规则的数量。

集中主动检查的缺点如下:

  • 随着客户端数量的增长,它们会给集中式服务器带来很大的负担。
  • 除非通过网络公开,否则主动检查可能无法监视客户端上的非基于网络的进程。

被动检查是监视代理程序提交给监视服务器的检查。 服务器没有联系客户端; 相反,客户端定期检查服务器。 被动检查的优点是:

  • 比活动检查更容易扩展,因为客户端将检查提交给服务器
  • 更安全,因为非网络进程不会暴露给网络,并且可以将其状态提交给服务器。

被动检查的缺点包括

无法从服务器控制客户端,因为服务器无法启动任何检查

随着客户端数量的增加,泛洪服务器也会增加。

SNMP(https://en.wikipedia.org/wiki/Simple_Network_Management_Protocol)或简单网络管理协议是监控基础架构的另一种方法。 SNMP可以执行主动和被动检查,详细内容将在下一节中介绍。

Tags:

本文暂时没有评论,来添加一个吧(●'◡'●)

欢迎 发表评论:

最近发表
标签列表