Ansible 是轻量级 agentless 运维工具,依赖 SSH 和 Python,通过 playbook(YAML)、inventory 分组与变量管理实现批量部署、配置同步等;需按角色环境分组、用 vault 加密敏感变量、聚焦单一职责编写 playbook、善用模板与条件判断,并严格验证语法、模拟执行及小范围试跑。

Ansible 是 Linux 自动化运维中最轻量、最易上手的配置管理工具之一,无需在被控节点安装客户端(agentless),仅靠 SSH 和 Python 就能完成批量部署、配置同步、服务启停等任务。关键在于写好 playbook(YAML 格式脚本),并合理组织 inventory(主机清单)和变量。
Inventory 主机分组与动态管理
Inventory 是 Ansible 的“目标清单”,可静态定义(INI 或 YAML 格式),也可通过脚本动态生成(如从 CMDB 或云平台拉取)。生产环境推荐按角色+环境分组,例如:
-
web_servers:包含所有 Nginx/HTTPD 节点,附带
http_port: 8080变量 -
db_masters:主数据库节点,启用
mysql_root_password等敏感变量(建议用 ansible-vault 加密) -
monitoring:Prometheus、Grafana 所在节点,统一打上
role: monitor标签便于条件执行
使用 ansible-inventory --graph 可快速查看分组结构;配合 --limit 参数(如 --limit 'web_servers:&staging')可精准控制执行范围。
Playbook 编写要点与复用技巧
一个清晰的 playbook 应聚焦单一职责(如 “部署 Java 应用” 或 “加固 SSH 配置”),避免大而全。常用结构包括:
- 用
vars_files拆分变量,按环境(dev.yml / prod.yml)或模块(nginx_vars.yml / jdk_vars.yml)存放 - 用
include_tasks或import_role复用逻辑,比如把用户创建、sudo 权限、SSH 密钥分发封装成独立 role - 关键步骤加
when判断(如when: ansible_distribution == "CentOS")适配多发行版 - 敏感操作前加
check_mode: no或用changed_when明确标记状态,方便后续幂等判断
常见批量任务实战示例
以下命令级操作均可转为 playbook 实现,且支持回滚与验证:
-
批量安装软件包:用
yum或apt模块,指定state: latest并设update_cache: yes(Debian 系需先更新源) -
同步配置文件:用
template模块渲染 Jinja2 模板(如/etc/nginx/nginx.conf.j2),自动注入 IP、端口、证书路径等变量 -
滚动重启服务:结合
serial: 2和wait_for模块,确保每批两台节点服务就绪后再继续 -
日志清理与磁盘检查:用
shell模块执行find /var/log -name "*.log" -mtime +30 -delete,再用assert校验/分区使用率是否低于 85%
调试与上线前必做事项
Ansible 执行速度快但容错低,上线前务必验证:
- 用
ansible-playbook --syntax-check检查 YAML 语法 - 用
--check --diff模拟运行,观察哪些文件将被修改(尤其 template 和 lineinfile) - 小范围试跑(
--limit @site.yml中指定测试组),确认无误再全量执行 - 记录每次变更:
ansible-playbook deploy.yml --extra-vars "deploy_version=2.3.1 deploy_by=ops",便于审计追踪
不复杂但容易忽略。










