Operator 是基于 CRD 和控制器模式实现的有状态应用运维自动化工具,CRD 定义自定义资源,Operator 实现其管理逻辑;kubebuilder 用于初始化项目并生成 CRD 与控制器骨架,Reconcile 函数负责对齐期望与实际状态,本地用 make run 调试,需注意 RBAC、CRD 安装及 status 更新等细节。

Operator 是什么,和 CRD 有什么关系
Operator 不是 Kubernetes 内置组件,而是基于 CustomResourceDefinition(CRD)和控制器模式实现的“有状态应用运维自动化工具”。它本质是一段 Go 程序,监听你定义的自定义资源(如 MyDatabase),再调用 client-go 对集群执行增删改查。CRD 是声明“我想管什么资源”,Operator 是“我怎么管它”——没 CRD,Operator 就没东西可监听。
用 kubebuilder 初始化 Operator 项目
kubebuilder 是目前最主流的 Operator 开发脚手架,它生成符合 controller-runtime 规范的目录结构和基础代码,避免手动拼接 scheme、client、reconcile 循环等易错环节。
确保已安装 kubebuilder(v3.x)、controller-gen 和 kubectl。运行:
mkdir myoperator && cd myoperator kubebuilder init --domain example.com --repo example.com/myoperator kubebuilder create api --group database --version v1alpha1 --kind MyDatabase
这会生成 CRD 定义(api/v1alpha1/mydatabase_types.go)、控制器骨架(controllers/mydatabase_controller.go)和 Makefile。关键点:
立即学习“go语言免费学习笔记(深入)”;
-
Makefile中的make manifests调用controller-gen从 Go 注释生成 YAML CRD;必须保持//+kubebuilder:*注释完整,否则 CRD 缺字段 - 生成的
MyDatabasestruct 默认不含Spec和Status字段,需手动补全并加json:tag,否则 client-go 序列化失败 - 不要直接修改
config/crd/bases/下的 YAML——它由make manifests覆盖,所有定义逻辑写在 Go 类型里
编写核心 Reconcile 逻辑:不是 CRUD,而是“期望状态对齐”
Reconcile 函数不是“收到事件就创建 Pod”,而是“读取当前 MyDatabase 实例,检查集群中实际状态(Pod/Service/Secret 是否存在、版本是否匹配),再调用 client-go 打补丁使其趋近 Spec 描述的期望状态”。典型错误是忽略 Status 更新或忘记处理删除事件。
Android高手进阶教程(八)之----Android Widget开发案例(世界杯倒计时!),主要向大家讲解使用Android Widget如何编写出一款世界杯风格的倒计时程序,教程说出了制作步骤和代码。
在 controllers/mydatabase_controller.go 的 Reconcile 方法中:
- 先用
r.Get(ctx, req.NamespacedName, &mydb)拿到最新自定义资源对象 - 检查
mydb.DeletionTimestamp != nil,若为 true,说明用户执行了kubectl delete mydatabase xxx,应进入清理流程(如删掉关联的 StatefulSet) - 用
client.List()查当前命名空间下是否存在对应StatefulSet,再比对mydb.Spec.Replicas和sts.Spec.Replicas,不一致才 Patch - 每次成功同步后,必须调用
r.Status().Update(ctx, &mydb)更新Status.Conditions或Status.ObservedGeneration,否则下一次 reconcile 无法判断是否需要重试
本地调试与部署:跳过 Docker 构建直接跑控制器
开发阶段不需要打包镜像、推仓库、部署 Deployment。kubebuilder 提供 make run 直接以进程方式运行控制器,连接本地 kubectl config 当前上下文的集群。
但要注意:
- 确保当前 kubeconfig 有足够 RBAC 权限:至少包含
get/list/watch对mydatabases.database.example.com的权限,以及对pods/services等内置资源的操作权 - 首次运行前执行
make install把 CRD 安装进集群,否则r.Get会报no matches for kind "MyDatabase" - 如果遇到
webhook server not ready,检查是否启用了 cert-manager 或手动禁用 webhook(删掉config/default/kustomization.yaml中的webhook行)
真正上线时才走 make docker-build docker-push IMG=xxx + make deploy IMG=xxx。本地验证逻辑正确性,远比早早在集群里跑一个半成品重要。
CRD 的 validation schema、subresource(如 status)、finalizer 清理、ownerReference 设置——这些细节一旦漏掉,Operator 在真实场景中就会静默失败或残留资源。别指望 kubebuilder 自动生成全部健壮逻辑。









