Back to Blog
AI 时代,如何给自己提效?

AI 时代,如何给自己提效?

AI 时代,如何给自己提效?

·Unknown
TL;DR
  • AI 写代码的能力在过去半年发生了跃迁,执行成本正逼近零,真正的瓶颈已经不是代码,而是人的认知。
  • 应对的思路不是"挑一个当下最强的 AI 产品",而是给自己搭一艘能跟着 AI 一起变强的船。
  • 船必须是"自己的" —— 通用产品解决不了个人问题,而自己搭的成本已经低到周末就能跑通。
  • 本文记录我这艘船的第一版样子:编排、信息、接入、沉淀,以及接下来要继续做的事。

一、起点:Coding Agent 的跃迁

1.1 从 3-4 天到一句话 —— 我经历的两次 Helm

体感最强烈的一次冲击,来自两次 Helm 需求的对比。

去年 6 月做 Coze-Studio 开源的时候,项目需要支持 Helm 部署。在我对 Helm 完全不懂的情况下,我用 Gemini 2.5 Pro 一边查一边学,硬是折腾了整整 3-4 天 才勉强搞通。

12 月份又有一个 Helm 相关的需求,我只跟 Claude Code Opus 4.5 说了一句话 —— 它就把整个 Helm Chart 完整写好交给我了,一次跑通,我只改了 2 处配置。

那之后,我反复问自己一个问题:在 AI 这么强的时代,什么样的人还有优势?

我的答案是:AI 时代打工人的核心竞争力,就是把 AI 当成杠杆 —— 用它把自己的效率撬到最大。


1.2 当执行成本逼近零,瓶颈转移到了"认知"

最近我在做一个 ACP 协议 的项目,让 AI Agent 跑了一个超长任务 —— 自主开发、Review、重构,一晚上跑了几十轮循环。

然后问题来了:我花了整整 1-2 天,才把 AI 写的代码读懂,重新想清楚架构该怎么调整,再让 AI 按我的想法重构一遍。

AI 早已不是瓶颈了,瓶颈是人的认知深度。

换个角度想 —— 如果我一开始就对 ACP 协议了如指掌、对架构设计想得足够清楚,我根本不用等 AI 生成完再 review。我可以直接告诉它"应该这样写",让它一次到位。

这也解释了为什么 AI 时代会放大"有经验的人"的优势 —— AI 把"执行"的成本压到了接近零,于是"想清楚"的价值变得前所未有地高。


二、策略:做船,不做柱子

既然人是瓶颈,AI 又在飞速变强 —— 最理性的选择,就是给自己搭一艘能跟着 AI 一起长大的船。

2.1 别给今天的模型做产品,给六个月后的模型做

Claude Code 的产品负责人有一句话我印象很深:

“别给今天的模型做产品,要给六个月后的模型做产品。”

Manus 团队也讲过类似的话:

“如果模型技术的进步是上涨的潮汐,我们希望 Manus 是水面上的船,而不是被固定在海床上的柱子。”

两句话讲的是同一件事:AI 在飞速进步,你要做的是搭一艘船,不是盖一根柱子。

  • 什么是柱子?把今天 AI 的所有限制当成理所当然,围绕"AI 现在还不能做 X"去设计的产品 —— 明年水位一涨,它就沉了。
  • 什么是船?做一个能随着 AI 变强而自动变强的东西 —— 今天它帮你写周报,明天换个更强的模型它就能帮你做决策;今天帮你整理简报,明天帮你做战略分析。

把这个思路翻译到"个人"身上:

你今天要做的,不是挑"现在最强的那个 AI 产品",而是给自己搭一个"会跟着 AI 一起成长的 Agent"。

这艘船一旦搭起来,你就永远是浪头上的人。


2.2 为什么船必须是"自己的"

你可能会问:市面上已经有一堆现成的 Agent 框架了 —— OpenClaw、Hermes …… 为什么还要自己造?

我的答案是一句话:通用产品,解决不了个人问题。

每个人的工作流都不一样,用的工具也不一样。 不同岗位做的事情完全不同、工作流完全不同、使用的工具也千差万别。目前通用 Agent 还处于非常早期的阶段,我相信 1-2 年后肯定会出现一个大而全的平台,能满足 90% 白领的自动化办公需求 —— 但现在我还没看到这样的产品。

题外话:最近我观察了一圈,发现很多 AI 产品都在跟风卷表层的东西 —— “上下文优化”、“产品形态升级” …… 但在模型能力差距已经被拉平的前提下,我觉得一个通用 AI 智能体真正的核心竞争力,是工具池的深度与场景的覆盖度。这才是真正的护城河,其他都是浮在水面上的花。

真正让我下决心"自己造"的,是另一件事 —— AI 时代最大的变化就是软件开发的成本大大降低了。

过去搭一个 AI 工作台,可能要几个全职工程师干半年。现在我一个人加上 Claude Code,晚上和周末拼一拼,两三个星期就能把框架搭起来。既然自己造的成本已经低到这个程度,为什么还要勉强去用一艘"别人定义"的船?


三、实践:我给自己造的 Agent

3.1 架构全景

我的 Agent 目前分成五层能力,每一层对应一类具体的使用场景:

能力对应场景
协议层ACP 接入多 CLI(Claude Code、CodeX、COCO 等)打通"一个大脑 + 多只手"
编排层多 Agent 递归 Review / Refactor让 AI 自己写、自己查、自己改
信息层定时任务 + 主动拉取技术动态、Oncall、发版通知自动送达
接入层飞书 / 微信 / 手机网页躺着也能写代码
沉淀层WIKI + 软链共享上下文让 AI 与我共用同一份知识库

下面每一节挑一个维度详细讲讲。


3.2 编排 · 递归式 Review/Refactor

这个模块最初的动机很简单:Claude Code 自带的 Ralph Loop 满足不了我的需求。我用模型 Review 代码时,真实流程是 “先 Review → Double Check → 修改”,而且跑多轮对话(多 Session)时,每一轮都能发现不同的问题。所以整体流程是:

Code Review → Double Check → Code Refactor → Code Review → Double Check → Code Refactor → …

如果 Code Refactor 也交给模型来改,这个过程其实不需要人介入。于是我做了一个"递归树结构"的循环能力:

两个关键设计:

  • 最大化利用公司 Token 额度:我接入了 ACP 协议,便捷地接入 COCO、Claude Code、CodeX 等 CLI,24 小时不停跑把 Quota 打满,变相解决了限流问题。
  • 跨模型协作节省 SOTA 配额:引入多 Agent 通信能力。先让 GLM 5.1、Kimi 2.6 这些速度快、不限频的模型跑一轮 Review,再把结果自动交给 Claude Code、CodeX 去 Double Check,判断是不是真的问题。最终修改代码的动作,全部收敛到 SOTA 模型上。

这套流程跑下来,Review 和 Refactor 场景体验都不错。一个有意思的副产物:ACP 网络传输链路的参数配置 —— 也就只有 AI 才能把这些细节考虑得这么周全(当然这是多轮迭代的结果,手工写一般不会这么细)。


3.3 信息 · 让技术动态主动找上门

定时任务场景,我主要有三个需求:

  1. 监听 Claude Code 发版通知,自动反编译 cli.js 源码,对比 ChangeLog 生成基于源码的新功能报告。
  2. AI Blog 监听:追踪 Claude、OpenAI、LangChain 的技术 Blog,关注最新技术动态。
  3. Oncall 日报:监听飞书 Oncall 群消息,每天总结都有哪些 Oncall,看看别人都踩过哪些坑。

整体体验挺不错的 —— 新技术动态都能自动收到,还能帮我做摘要总结,不用自己定期去刷网页(忙起来很容易错过消息)。


3.4 接入 · 躺着用手机写代码

既然 Agent 已经能 24 小时不停跑了,用手机随时接入就是顺理成章的需求。所以我接入了飞书和微信 —— 不过由于两者都不支持流式输出,体验不如开 VPN 用网页版。

但能用手机接入以后,真的可以躺在床上写代码了。 上周末我就是躺着让它跑完了一个小功能,体验挺微妙。


3.5 沉淀 · WIKI + 软链共享上下文

我把自己的知识库 WIKI 统一收敛到一个 git 仓库里;再在各个代码仓库中通过软链的方式,链到个人知识库里对应项目的文件夹。这样 AI 做相关任务时,能跟我的 context 保持一致 —— 我读过的资料、做过的决策、踩过的坑,它都能看到。


3.6 踩过的坑 · AI 也会糊弄你

大多数场景下,十几轮重复 Review + 修改之后,基本没什么 Bug。但也遇到过一些 Corner Case:

  • AI 不熟悉的库会出错:让 AI Review N 轮以后,也不能保证一点 Bug 都没有。我就遇到过 AI 使用 Hertz 的 SSE 流式输出出 Bug 的情况。Learning:对一些 AI 不熟悉的库,需要重点提示它 Review 一下库的用法是否正确。
  • 上下文不够会漏改:一个你自己都不熟悉的项目,你也搞不清改动涉及面到哪 —— 简单让它 Review 某一部分代码时,很容易遗漏其他关联逻辑。
  • 警惕 AI 的 “context anxiety”:测试环节需要额外小心。AI 有时会为了让单测通过,用一些欺骗性的手段(比如直接改测试断言),需要人工卡一道。

四、让这艘船继续长大

Anthropic 在 Scaling Managed Agents: Decoupling the brain from the hands 把一个 Agentic System 分成了 5 个部分:

  • Harness:调用 Claude 并路由工具调用的循环组件,相当于 Agent 的"大脑"
  • Session:只追加的事件日志,记录所有发生的内容,相当于 Agent 的"记忆"
  • Sandbox:Claude 运行代码和编辑文件的执行环境,相当于 Agent 的"家"
  • Tools:给模型的工具(内置 Tool、MCP Tool、Skill 等),相当于 Agent 的"手脚"
  • Orchestrator:协调器,负责组件之间的交互,相当于 Agent 的"指挥官"
和我之前做 Coding App 调研时梳理的架构差不多。

顺着这个框架,接下来想做的事:

  • Self-Evolution(自我进化):让 Agent 能自动读取程序运行日志发现问题;并把程序的所有功能暴露给大模型,通过对话来调用。
  • Auto-Memory(自动记忆):OpenClaw 能火,最大的亮点是它的 Soul.md / Identity.md / User.md 记忆系统,能给用户提供情绪价值。单纯从功能看我觉得这个用处不大 —— 比如你知道我是谁,对"实现一个 ACP 协议"这种事并没有太大帮助。但在压力巨大的社会环境下,情绪价值对牛马来说是很珍贵的东西(就像很多人带娃去迪士尼,体验的是服务里的情绪价值,不是项目本身有多好玩)。
  • Tool-Kit(工具包):沉淀自己的工具包、Skill,让船越开越稳。
  • Sandbox(沙箱):安全隔离的运行环境。最早我用的其实是 Sandbox,后面因为 ACP 不支持远程通信协议,全部改用本地环境了 —— 这块后面还想捡回来。

五、结语:做顺势而为的人

软件工程师这个职业不会消失,但岗位结构会发生剧变。真正值得思考的,不是"会不会被淘汰",而是"如何抓住这一轮变革的红利"。

如果你也想搭自己的 Agent,我的建议是 —— 从最小闭环开始:选 1 个你每天都要做的重复任务(写周报、追技术动态、整理会议纪要……),用 ACP / Claude Code 做一个定时任务跑通,然后再迭代。一个能跑的 MVP,比一个完美的架构图更重要。

让每个人都拥有自己的 AI Agent,让个体的生产力被无限放大 —— 这既是这个时代留给我们的礼物,也是留给我们的考题。

最后,借 DeepSeek 论文结尾的一句话共勉:

“不诱于誉,不恐于诽,率道而行,端然正己。”