Simon Willison 说 Vibe Coding 和 Agentic Engineering 正在模糊——这对开发者意味着什么
TL;DR
Simon Willison 在 Heavybit 的播客中做了一个让他自己都"有点不安"的坦白:Vibe Coding 和 Agentic Engineering 这两种他认为泾渭分明的 AI 编码范式,在他的日常工作中正在融合。他甚至发现自己开始不再逐行审查 AI 生成的代码——哪怕那是生产环境的代码。这篇 Hacker News 54 分钟热帖引发了开发社区对 AI 信任边界的新一轮讨论。
背景:两种范式由来
2025 年,Andrej Karpathy 提出了 Vibe Coding 的概念——完全信任 AI,不看代码,只凭"感觉"去迭代提示词,AI 说什么就是什么。Simon Willison 当时就写了一篇 Not all AI-assisted programming is vibe coding 来划清界限。
在他看来:
- Vibe Coding —— 适合个人工具,出 Bug 只影响自己,不用关心代码质量
- Agentic Engineering —— 专业工程师用 AI 辅助,保持代码审查、安全意识和工程质量,目标是"更好更快",而非"更快更糟"
但 2026 年 5 月,他在 Heavybit 的 High Leverage 播客上回顾这个区分时,自己都惊讶了:
"奇怪的是,这些边界已经开始模糊了——这让我有点不安。"
发生了什么?编码 Agent 正在赢得信任
Willison 发现,Claude Code 等 Agent 在写常规代码时的可靠性已经高到让他不知不觉放松了审查:
"如果你让 Claude Code 写一个 JSON API 端点——执行 SQL 查询并返回 JSON 结果——它不会搞砸。它会自动加测试、加文档,你知道结果会很可靠。
但问题是我没有审查那些代码。然后我就有种负罪感:如果我没审查代码,用它跑生产真的没问题吗?"
这里有 2024 年底的 Normalization of Deviance(规范化失范)风险——每次 Agent 写出正确代码而你没检查,你就多了一分"下次也不用检查"的心理惯性。
一个让人不安的对等关系
Willison 用一个类比来解释为什么他仍然接受这种现状:
"在大公司做工程经理的时候,别的团队交付一个图片缩放服务——你不会去读他们写的每一行代码。你会看文档、调用 API、开始发版。只有在出问题时才会挖进他们的 Git 仓库。
我现在对 AI Agent 也是同样的态度。但不同的是,人类团队有专业声誉:一个团队做过好东西,你信任他们。Claude Code 没有专业声誉。
但它一直在证明自己——一遍又一遍地写出正确的代码,而且是我喜欢的那种风格。"
这段话精准地刻画了 2026 年 AI 编码的核心矛盾:AI 工具在技术上的可靠性已经超过了人类对其 accountability 的信任阈值。
三个关键洞察
1. 信任正在从"审查制"变为"抽样制"
过去,负责任地使用 AI 意味着逐行审查输出。现在,Willison 承认自己只是在关键路径上做抽样抽查。这是一种务实的妥协:人的时间是有限的,而 AI 生成的代码中 95%+ 的常规逻辑是可靠的。
关键区别在于,你知道哪些部分是"常规的"——这需要工程经验来判断。这就是 Agentic Engineering 和 Vibe Coding 的本质区别:前者有经验支撑的风险判断,后者没有。
2. Agent 正在形成"风格一致性"
Willison 提到 Agent 写出的代码是"我喜欢的那种风格"。这是被忽略的一点——好的编码 Agent 通过系统提示词和上下文学习,已经能做到比大部分外包工程师更一致的代码风格。这降低了"读陌生代码"的认知成本。
3. "规范化失范"是双向的
一方面,盲目信任 AI 确实危险。但另一方面,如果人类工程师对同类代码的审查率本来就不高(比如跨团队的 API 调用),那么对 AI 采用同等标准其实是一种理性回归。问题在于——AI 不会为 Bug 承担责任。
2026 年 AI 编码的现实处境
Willison 这篇文章的价值不在于给出了答案,而在于诚实地描述了 2026 年专业开发者的真实处境:
- AI 编码工具已经足够可靠,但你仍然应该感到不安
- 不安感本身就是防护机制——它在提醒你在哪些地方需要人工把关
- Vibe Coding 和 Agentic Engineering 的边界模糊不是错误,而是成熟期标志
- 关键在于:你有多少工程经验来判断什么时候可以信任 AI
开发者怎么办?
如果你也在用 Claude Code 或类似工具,Willison 的经历有几个值得采纳的实践:
- 分层审查 —— 常规 CRUD 端点可以抽查(10-20%),涉及认证、权限、数据的代码必须 100% 审查
- 让 AI 给你审查 —— 让 Agent 生成测试 + 安全扫描 + diff 摘要,辅助你而不是替代你
- 保留"不安感" —— 当你觉得"是不是太容易了"的时候,那正是你该仔细看看代码的时候
- 建立 AI 代码的审计流程 —— 定期回滚检查 AI 生成的代码在线上有没有出过问题
原文地址:Vibe coding and agentic engineering are getting closer than I'd like — Simon Willison
如果你对 AI 编码的哲学争论感兴趣,也推荐阅读我们的另一篇文章:Uncle Bob Says "It's Over" — AI Vibe Coding vs 传统软件工程