蓝鲸监控社区版5.0已发布,让我们一起来探索这一版本如何解决用户关注的告警风暴、zookeeper/kafka这类二进制名相同的进程监控、在设置全局策略后如何为单台机器设置策略以及在windows下如何进行进程端口监控等问题。

1
告警恢复检测机制:告警不再喧嚣
“告警未恢复,持续告警”、“稍微抖动就告警,无法抑制”,这些问题导致系统难以使用...
在本次更新中,我们引入了告警恢复检测机制(下一版本将增加一个告警状态:已恢复),如果告警未恢复,将被抑制,不再产生新的告警。
此外,关于检测算法,小编有以下建议:
对于抖动类指标,如CPU总使用率,N可设为3,以消除抖动;对于非抖动类指标,如磁盘使用率,N可设为1。
2
ZooKeeper/Kafka这类二进制名相同的进程监控
ZooKeeper和Kafka的二进制名称都是java,如何监控?
这次更新增加了一个识别进程的新维度:启动参数。
操作如下,在CMDB中添加进程时填写启动参数的匹配规则。

此外,进程端口监控不再需要用户手动下发采集任务,因为注册进程会自动将进程信息发送至Agent上的/etc/gse/host/hostid目录,监控进程端口的采集器会捕获文件变化,做告警检测,预计延时2分钟。
3
设置了全局策略,但想为单台主机设置策略怎么办?
场景:有一个全局策略,但某台主机非常敏感,想降低其阈值。
告警策略关联特性:监控范围的粒度越细,告警策略的优先级越高,优先生效,其余抑制。
案例:全局CPU使用率阈值为>=95%,windows-agent模块的阈值为>=85%,某一台敏感主机(属于windows-agent模块)的阈值为>=75%。
当CPU使用率为75%时,只有>=75%的策略生效;当CPU使用率为85%时,只有>=85%的策略生效。

4
进程端口监控现在支持Windows了
终于支持Windows下的进程端口监控了,不再展示图片。
以上就是蓝鲸监控社区版5.0:终结满屏告警的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号