重度使用 opencode 后引发的一些关于 agent 的感想

心靈之曲

发布时间：2026-01-05 19:19:02

900人浏览过

来源于php中文网

原创

重度使用 opencode 后引发的一些关于 agent 的感想

转载自：https://www.php.cn/link/62b395526e160d2e25c4b910ea419a90 作者：PingCAP 联合创始人兼 CTO 黄东旭

最近高强度使用了 opencode 与 oh-my-opencode，在一个并不简单的实际任务中，我对 Agent 系统的认知经历了一次显著的跃迁。

任务目标非常明确：

为 TiKV 重新构建一层兼容 PostgreSQL 协议的 SQL 接口层，需至少能通过基础测试，包括 dvdrental 兼容性测试和 TPCC 简化版。

这相当于重写 TiDB 的 SQL 层——我清楚这项工作的难度。即便只是让 TPCC 跑通，我们团队当初也耗时约两个月。

最终成果令我震惊：项目地址在此：https://www.php.cn/link/0f3839dc22ff5ad19a6b74203fac591f。

我原本预估它“能做”，但必然需要大量时间投入与反复调试；结果却出乎意料：仅用一个下午，消耗约 100 多万 token（得益于我是多个 Agent 平台的 Pro Max 用户，全程未额外付费）。

这是我第一次真切意识到：编写代码的成本已趋近于零，哪怕面对数据库、操作系统、编译器这类传统意义上的复杂系统（对当前 AI 而言，其实反而是结构清晰的“简单项目”）。

下面分享这段实践过程中的几点体悟。

Context Engineering 并不是堆 Prompt

在转向 opencode 之前，我已长期使用 Claude Code、Gemini Pro、Codex 等工具。

从表象看，它们都具备 agentic loop + tool use 的 CLI 形态。

坦白讲，底层模型能力本身已无本质差异，均属各家顶尖水准。

但在真实交付质量上，体验落差极为明显。

问题根源不在模型，而在 context engineering。不少人误以为“套壳”毫无技术含量，但我的切身体会是：其中门道极深……

真正高效的 context engineering，是将以下要素持续、结构化、稳定地注入系统：

清晰但不过度琐碎的目标定义（由人设定）
可执行、可追踪的分步计划（由 Agent 拆解）
明确的工程边界与硬性约束（由人划定）
历史决策链与潜在假设（由 Agent 维护）
支撑长上下文不发散的中间状态锚点（由 Agent 构建）

例如，当我切换至 opencode + oh-my-opencode 后，所用模型完全一致，行为却天差地别。同样是 agentic loop、同样支持 tool use，但复杂工程的交付质量完全不在同一维度。

oh-my-opencode 中一个让我倍感舒适的设计是：

它并不迷信“单一大模型最强即最优”，而是将多个一线模型有机整合进统一工作流。这个思路其实不难想到——三个臭皮匠胜过一个诸葛亮，更何况是三位顶级诸葛亮？

实际效果远超预期。

未来的能力天花板，未必取决于单个模型规模的继续膨胀，而更可能来自：多模型（顶级档位）协同 + context engineering + 稳健循环机制的整体架构设计。

不中断，比“更聪明”重要

另一个常被忽视却至关重要的维度是：

无缝连续的工作流（non-interruptive flow）。

许多 Agent 系统在 “思考 → 执行 → 报错 → 等待人工确认” 的环节中频繁打断。上下文虽在，但工作流已然断裂。

目前我主要借助 ralph-loop 来缓解这一问题：让 Agent 在一个可控、稳定的闭环中持续推进（持续消耗 token），

phpweb1.0 美化简洁版

phpweb1.0基于php+mysql+smarty开发的企业解决方案,总体感觉简洁快速,适合小型企业的建站方案，也适合初学者学习。之前发布过phpweb1.0的原始版本,仅提供大家交流和学习,但很多的爱好者提出了一些不足和好评,本不想继续开发1.0,因为2.0已经开发完毕而且构架与1.0完全不同,但是有些使用者喜欢这种简洁和简便，应大家的要求,美化和优化了一些不足之处。后台更加简洁美观。

下载

人类只需在关键节点介入（通常是最终验收阶段），而非被迫充当“每一步的指令下达者”。

一旦中断大幅减少，变化立竿见影：工程节奏开始逼近真实开发的连续性，人的认知负荷显著降低。事实上，AI 当前已足够聪明，工具也足够成熟，效率瓶颈早已转移到人侧。