首页 > 运维 > linux运维 > 正文

如何在Linux中监控心跳 Linux systemd看门狗配置

P粉602998670
发布: 2025-08-29 11:36:01
原创
948人浏览过
使用systemd看门狗可实现Linux心跳监控,通过服务定期调用sd_notify("WATCHDOG=1")发送心跳,若在WatchdogSec指定时间内未收到信号,systemd将重启服务;2. 需在代码中集成libsystemd,发送READY和WATCHDOG通知,并在systemd单元文件中配置WatchdogSec、Restart和NotifyAccess;3. 无法修改代码时可用“看门狗伴侣”进程模拟心跳;4. WatchdogSec应略大于实际心跳间隔以避免误触发。

如何在linux中监控心跳 linux systemd看门狗配置

在Linux中监控心跳,你可以使用多种方法,systemd看门狗是一种相对简单且可靠的方案。它允许你在用户空间程序出现问题时,自动重启服务。

解决方案

Systemd看门狗通过预期服务定期调用

sd_notify()
登录后复制
函数来工作。如果systemd在配置的时间间隔内没有收到此信号,它会认为服务已失败并采取配置的操作(通常是重启服务)。

如何配置systemd看门狗

  1. 代码集成:

    首先,你的应用程序需要包含对

    libsystemd
    登录后复制
    的调用。这通常涉及包含头文件
    <systemd/sd-daemon.h>
    登录后复制
    并调用
    sd_notify(0, "READY=1")
    登录后复制
    来指示服务已启动完成。然后,定期调用
    sd_notify(0, "WATCHDOG=1")
    登录后复制
    以保持看门狗的活跃状态。

    #include <systemd/sd-daemon.h>
    #include <stdio.h>
    #include <unistd.h>
    
    int main() {
        // 初始化和启动服务...
    
        sd_notify(0, "READY=1"); // 通知 systemd 服务已准备好
    
        while (1) {
            // 执行服务的主要逻辑...
    
            // 定期发送心跳信号
            sd_notify(0, "WATCHDOG=1");
            sleep(10); // 例如,每10秒发送一次
        }
    
        return 0;
    }
    登录后复制
  2. Systemd单元文件配置:

    编辑你的服务的systemd单元文件(通常位于

    /etc/systemd/system/
    登录后复制
    目录下,例如
    your_service.service
    登录后复制
    ),添加或修改以下选项:

    [Service]
    WatchdogSec=30  ; 设置看门狗超时时间为30秒
    Restart=on-failure ; 服务失败时重启
    NotifyAccess=all ; 允许服务通知systemd
    登录后复制
    • WatchdogSec
      登录后复制
      :指定systemd在多长时间内没有收到心跳信号时认为服务失败。
    • Restart
      登录后复制
      :指定在服务失败时采取的措施。
      on-failure
      登录后复制
      是一个常见的选择。
    • NotifyAccess=all
      登录后复制
      :允许所有用户访问通知套接字,这对于非root用户运行的服务很重要。
  3. 重新加载Systemd配置并重启服务:

    百度文心百中
    百度文心百中

    百度大模型语义搜索体验中心

    百度文心百中 22
    查看详情 百度文心百中
    sudo systemctl daemon-reload
    sudo systemctl restart your_service.service
    登录后复制

如何确定看门狗是否正常工作?

你可以通过查看systemd日志来确认看门狗是否正常工作。使用

journalctl -u your_service.service
登录后复制
命令,你应该能看到周期性的 "WATCHDOG=1" 日志消息。如果服务崩溃或停止发送心跳,你应该会看到 systemd 尝试重启服务的日志。

Systemd看门狗与其他监控方案相比有什么优势?

Systemd看门狗与传统的监控脚本相比,优势在于它与systemd紧密集成,配置简单,并且能够提供更快的故障检测和恢复。传统的监控脚本可能需要更复杂的配置和维护,并且可能无法像systemd那样快速地响应服务故障。此外,systemd看门狗可以利用 systemd 的依赖关系管理,确保在服务重启之前,所有必要的依赖项都已启动。

如果我的服务无法修改代码,如何使用systemd看门狗?

如果无法修改服务的源代码来集成

sd_notify()
登录后复制
,你可以使用一个“看门狗伴侣”进程。这个进程可以定期检查服务的状态(例如,通过检查进程是否存在、监听端口等),并在服务无响应时调用
sd_notify()
登录后复制
。然后,将这个伴侣进程配置为systemd服务,并使用
WatchdogSec
登录后复制
Restart
登录后复制
选项来监控主服务。

如何调整WatchdogSec的值?

WatchdogSec
登录后复制
的值应该根据你的服务的正常运行情况进行调整。设置得太短可能会导致误报,而设置得太长可能会延迟故障检测。一个好的经验法则是将
WatchdogSec
登录后复制
设置为比服务正常心跳间隔稍长的时间,以允许一些波动。例如,如果你的服务每 10 秒发送一次心跳,你可以将
WatchdogSec
登录后复制
设置为 30 秒。

以上就是如何在Linux中监控心跳 Linux systemd看门狗配置的详细内容,更多请关注php中文网其它相关文章!

相关标签:
最佳 Windows 性能的顶级免费优化软件
最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。

下载
来源:php中文网
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
最新问题
开源免费商场系统广告
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 意见反馈 讲师合作 广告合作 最新更新 English
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号