Prometheus 是主流开源监控系统,通过拉取方式采集指标,含时序数据库、PromQL、告警和可视化能力;安装后配置抓取目标,结合 node_exporter 暴露主机指标,用 PromQL 查询如 up 和 rate(),再通过 Alertmanager 实现 CPU 过载告警。

Prometheus 是目前最主流的开源监控系统,特别适合云原生和容器环境。它通过拉取(pull)方式采集指标,自带时序数据库、强大查询语言(PromQL)、告警规则和可视化能力,入门门槛不高,但需理清核心组件关系。
最简单的方式是下载二进制包直接运行:
scrape_configs:
- job_name: 'prometheus'
static_configs:
- targets: ['localhost:9090']保存后执行 ./prometheus --config.file=prometheus.yml,服务即启动,默认监听 http://localhost:9090
Prometheus 不直接监控应用,而是通过“Exporter”把各类数据转成标准格式供其拉取。常见用法:
- job_name: 'node'
static_configs:
- targets: ['localhost:9100']重启 Prometheus 或触发热重载(curl -X POST http://localhost:9090/-/reload),稍等片刻即可在 Web 界面 Targets 页面看到状态变为 UP。
打开 http://localhost:9090/graph,尝试输入:
点击 Execute,切换到 Graph 标签即可看到折线图。注意:Prometheus 自带图表较基础,生产中常搭配 Grafana 做可视化。
告警需两部分:规则定义 + 告警路由。先启用 Alertmanager:
alerting:
alertmanagers:
- static_configs:
- targets: ['localhost:9093']
rule_files:
- 'alerts.yml'新建 alerts.yml,写一条 CPU 过载告警:
groups:
- name: example
rules:
- alert: HighCPU
expr: 100 - (avg by(instance) (rate(node_cpu_seconds_total{mode="idle"}[5m])) * 100) > 80
for: 2m
labels:
severity: warning
annotations:
summary: "High CPU on {{ $labels.instance }}"重启 Prometheus,访问 http://localhost:9090/alerts 即可看到告警状态。
以上就是Linux监控系统怎么搭建_prometheus入门指导【指导】的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号