要监控Linux服务的运行时间和负载,需选择合适的工具并配置监控与告警。首先明确监控目标如Web或数据库服务,然后选用top、ps、sar等命令行工具或Prometheus、Grafana、Nagios等系统级方案。使用top可实时查看CPU和内存占用;ps结合grep和STIME可查进程启动时间;sar能周期性收集CPU、内存、I/O数据并分析历史趋势;systemd-analyze用于查看systemd服务启动耗时。对于高级监控,部署Prometheus配合Node Exporter采集指标,Grafana实现可视化,并配置告警规则以及时响应异常。最终通过数据分析识别性能瓶颈,保障服务稳定运行。

要监控Linux服务的运行时间和负载,可以使用多种工具和方法,从简单的命令行工具到更复杂的监控系统。核心在于收集关键指标,并根据这些指标进行分析和告警。
监控Linux服务的运行时间和负载,可以采取以下步骤:
确定需要监控的服务: 明确需要监控哪些服务,例如 Web 服务器(如 Apache 或 Nginx)、数据库服务器(如 MySQL 或 PostgreSQL)等。
选择监控工具: 根据需求选择合适的监控工具。常用的工具有:
top
htop
uptime
ps
vmstat
iostat
sar
systemd-analyze
配置监控: 根据选择的工具,配置相应的监控参数。例如,使用
sar
分析数据: 收集到的数据需要进行分析,以了解服务的运行状况。例如,查看 CPU 使用率是否过高,内存使用量是否接近上限,磁盘 I/O 是否频繁。
设置告警: 根据分析结果,设置告警阈值。当某个指标超过阈值时,发送告警通知。例如,当 CPU 使用率超过 90% 时,发送邮件或短信告警。

top
top
top
运行 top
top
观察输出:
top
查找目标服务: 在进程列表中查找你需要监控的服务。你可以使用
grep
top
top | grep nginx
分析资源占用: 观察目标服务的 CPU 使用率(%CPU)和内存使用率(%MEM)。如果 CPU 使用率过高,可能表明服务正在处理大量的请求或存在性能问题。如果内存使用率过高,可能表明服务存在内存泄漏或需要更多的内存。
使用 top
top
M
P
k
q
top

ps
ps
ps
运行 ps
ps -ef | grep <service_name>
将
<service_name>
ps -ef | grep nginx
观察输出:
ps
UID
PID
PPID
C
STIME
TTY
TIME
CMD
分析运行时间:
STIME
STIME
TIME
计算运行总时间: 要计算进程的运行总时间,可以使用以下方法:
STIME
date
date
start_time=$(ps -eo lstart | grep <service_name> | head -n 1) current_time=$(date) echo "Start Time: $start_time" echo "Current Time: $current_time"
然后手动计算时间差。或者,你可以使用
date
-d
+%s

sar
sar
sar
安装 sar
sar
sysstat
sysstat
sudo apt-get update sudo apt-get install sysstat
或者,在 CentOS/RHEL 上:
sudo yum install sysstat
配置 sar
sar
/etc/default/sysstat
sar
ENABLED="true"
sar
SADC_OPTIONS="-S ALL"
HISTORY=28
运行 sar
sar
sar [options] [interval] [count]
options
interval
count
一些常用的
sar
查看 CPU 使用率:
sar -u 1 5
每 1 秒收集一次 CPU 使用率数据,共收集 5 次。
查看内存使用情况:
sar -r 1 5
每 1 秒收集一次内存使用情况数据,共收集 5 次。
查看磁盘 I/O 情况:
sar -d 1 5
每 1 秒收集一次磁盘 I/O 情况数据,共收集 5 次。
查看网络流量:
sar -n DEV 1 5
每 1 秒收集一次网络流量数据,共收集 5 次。
分析数据:
sar
CPU 使用率 (sar -u
%user
%system
%iowait
%idle
如果
%user
%system
%iowait
内存使用情况 (sar -r
kbmemfree
kbmemused
%memused
kbbuffers
kbcached
如果
%memused
磁盘 I/O 情况 (sar -d
tps
rd_sec/s
wr_sec/s
await
svctm
%util
如果
await
%util
使用 sadc
sar
sadc
sadc
sar
sar -f /var/log/sysstat/saXX
将
XX
sar -f /var/log/sysstat/sa27
Prometheus 和 Grafana 是一个强大的监控解决方案,特别适用于大规模系统。Prometheus 用于收集和存储指标数据,Grafana 用于可视化这些数据。
安装 Prometheus: 从 Prometheus 官网下载最新版本的 Prometheus,并解压到指定目录。
wget https://github.com/prometheus/prometheus/releases/download/v2.47.0/prometheus-2.47.0.linux-amd64.tar.gz tar -xzf prometheus-2.47.0.linux-amd64.tar.gz cd prometheus-2.47.0.linux-amd64
配置 Prometheus: 编辑
prometheus.yml
global:
scrape_interval: 15s
evaluation_interval: 15s
scrape_configs:
- job_name: 'linux'
static_configs:
- targets: ['localhost:9100']
- job_name: 'prometheus'
static_configs:
- targets: ['localhost:9090']这个配置文件定义了两个监控目标:
linux
prometheus
linux
localhost:9100
prometheus
localhost:9090
安装 Node Exporter: Node Exporter 用于暴露 Linux 系统的各种指标,例如 CPU 使用率、内存使用率、磁盘 I/O 等。从 Prometheus 官网下载最新版本的 Node Exporter,并解压到指定目录。
wget https://github.com/prometheus/node_exporter/releases/download/v1.6.1/node_exporter-1.6.1.linux-amd64.tar.gz tar -xzf node_exporter-1.6.1.linux-amd64.tar.gz cd node_exporter-1.6.1.linux-amd64
启动 Prometheus 和 Node Exporter: 分别启动 Prometheus 和 Node Exporter。
./prometheus --config.file=prometheus.yml ./node_exporter
安装 Grafana: 从 Grafana 官网下载最新版本的 Grafana,并安装到指定目录。
wget https://dl.grafana.com/oss/release/grafana_10.1.5_amd64.deb sudo dpkg -i grafana_10.1.5_amd64.deb sudo systemctl start grafana-server
配置 Grafana: 打开 Grafana 的 Web 界面(默认端口为 3000),并添加 Prometheus 数据源。
http://localhost:9090
创建 Grafana 仪表盘: 创建 Grafana 仪表盘,并添加各种图表来可视化 Prometheus 收集的指标数据。你可以使用现有的仪表盘模板,也可以自定义仪表盘。
1860
配置服务 Exporter: 对于需要监控的服务,你需要安装相应的 Exporter 来暴露服务的指标。例如,对于 MySQL,你可以使用 MySQL Exporter。对于 Nginx,你可以使用 Nginx Exporter。
prometheus.yml
如果服务由 systemd 管理,可以使用
systemd-analyze
查看服务启动时间:
systemd-analyze blame
这个命令会列出所有 systemd 单元的启动时间,并按启动时间排序。
查看指定服务的启动时间:
systemd-analyze blame <service_name>
将
<service_name>
systemd-analyze blame nginx.service
查看服务启动过程的详细信息:
systemd-analyze critical-chain <service_name>
这个命令会显示服务启动过程中各个步骤的依赖关系和耗时。
查看服务的状态:
systemctl status <service_name>
这个命令会显示服务的状态信息,包括启动时间、运行时间、进程 ID 等。
通过结合使用这些工具和方法,你可以全面地监控 Linux 服务的运行时间和负载,及时发现和解决性能问题。
以上就是Linux如何监控服务的运行时间和负载的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号