Simon Willison 说 Vibe Coding 和 Agentic Engineering 正在模糊——这对开发者意味着什么

发布: 2026-05-06 | 阅读: 6 分钟 | 标签: Simon Willison, Vibe Coding, Agentic Engineering, AI 编码, 代码审查, Hacker News

TL;DR

Simon Willison 在 Heavybit 的播客中做了一个让他自己都"有点不安"的坦白：Vibe Coding 和 Agentic Engineering 这两种他认为泾渭分明的 AI 编码范式，在他的日常工作中正在融合。他甚至发现自己开始不再逐行审查 AI 生成的代码——哪怕那是生产环境的代码。这篇 Hacker News 54 分钟热帖引发了开发社区对 AI 信任边界的新一轮讨论。

背景：两种范式由来

2025 年，Andrej Karpathy 提出了 Vibe Coding 的概念——完全信任 AI，不看代码，只凭"感觉"去迭代提示词，AI 说什么就是什么。Simon Willison 当时就写了一篇 Not all AI-assisted programming is vibe coding 来划清界限。

在他看来：

Vibe Coding —— 适合个人工具，出 Bug 只影响自己，不用关心代码质量
Agentic Engineering —— 专业工程师用 AI 辅助，保持代码审查、安全意识和工程质量，目标是"更好更快"，而非"更快更糟"

但 2026 年 5 月，他在 Heavybit 的 High Leverage 播客上回顾这个区分时，自己都惊讶了：

"奇怪的是，这些边界已经开始模糊了——这让我有点不安。"

发生了什么？编码 Agent 正在赢得信任

Willison 发现，Claude Code 等 Agent 在写常规代码时的可靠性已经高到让他不知不觉放松了审查：

"如果你让 Claude Code 写一个 JSON API 端点——执行 SQL 查询并返回 JSON 结果——它不会搞砸。它会自动加测试、加文档，你知道结果会很可靠。

但问题是我没有审查那些代码。然后我就有种负罪感：如果我没审查代码，用它跑生产真的没问题吗？"

这里有 2024 年底的 Normalization of Deviance（规范化失范）风险——每次 Agent 写出正确代码而你没检查，你就多了一分"下次也不用检查"的心理惯性。

一个让人不安的对等关系

Willison 用一个类比来解释为什么他仍然接受这种现状：

"在大公司做工程经理的时候，别的团队交付一个图片缩放服务——你不会去读他们写的每一行代码。你会看文档、调用 API、开始发版。只有在出问题时才会挖进他们的 Git 仓库。

我现在对 AI Agent 也是同样的态度。但不同的是，人类团队有专业声誉：一个团队做过好东西，你信任他们。Claude Code 没有专业声誉。

但它一直在证明自己——一遍又一遍地写出正确的代码，而且是我喜欢的那种风格。"

这段话精准地刻画了 2026 年 AI 编码的核心矛盾：AI 工具在技术上的可靠性已经超过了人类对其 accountability 的信任阈值。

三个关键洞察

1. 信任正在从"审查制"变为"抽样制"

过去，负责任地使用 AI 意味着逐行审查输出。现在，Willison 承认自己只是在关键路径上做抽样抽查。这是一种务实的妥协：人的时间是有限的，而 AI 生成的代码中 95%+ 的常规逻辑是可靠的。

关键区别在于，你知道哪些部分是"常规的"——这需要工程经验来判断。这就是 Agentic Engineering 和 Vibe Coding 的本质区别：前者有经验支撑的风险判断，后者没有。

2. Agent 正在形成"风格一致性"

Willison 提到 Agent 写出的代码是"我喜欢的那种风格"。这是被忽略的一点——好的编码 Agent 通过系统提示词和上下文学习，已经能做到比大部分外包工程师更一致的代码风格。这降低了"读陌生代码"的认知成本。

3. "规范化失范"是双向的

一方面，盲目信任 AI 确实危险。但另一方面，如果人类工程师对同类代码的审查率本来就不高（比如跨团队的 API 调用），那么对 AI 采用同等标准其实是一种理性回归。问题在于——AI 不会为 Bug 承担责任。

2026 年 AI 编码的现实处境

Willison 这篇文章的价值不在于给出了答案，而在于诚实地描述了 2026 年专业开发者的真实处境：

AI 编码工具已经足够可靠，但你仍然应该感到不安
不安感本身就是防护机制——它在提醒你在哪些地方需要人工把关
Vibe Coding 和 Agentic Engineering 的边界模糊不是错误，而是成熟期标志
关键在于：你有多少工程经验来判断什么时候可以信任 AI

开发者怎么办？

如果你也在用 Claude Code 或类似工具，Willison 的经历有几个值得采纳的实践：

分层审查 —— 常规 CRUD 端点可以抽查（10-20%），涉及认证、权限、数据的代码必须 100% 审查
让 AI 给你审查 —— 让 Agent 生成测试 + 安全扫描 + diff 摘要，辅助你而不是替代你
保留"不安感" —— 当你觉得"是不是太容易了"的时候，那正是你该仔细看看代码的时候
建立 AI 代码的审计流程 —— 定期回滚检查 AI 生成的代码在线上有没有出过问题

原文地址：Vibe coding and agentic engineering are getting closer than I'd like — Simon Willison

如果你对 AI 编码的哲学争论感兴趣，也推荐阅读我们的另一篇文章：Uncle Bob Says "It's Over" — AI Vibe Coding vs 传统软件工程