CTF 已死?前沿 AI 如何让网络安全竞赛变成「烧钱游戏」
Hacker News 上一篇 216 分、180 条评论的热帖引发了安全圈的激烈讨论。澳大利亚 CTF 顶级选手 Kabir 写了一篇 The CTF Scene Is Dead,直截了当地宣告:Capture The Flag 网络安全竞赛已经死了。
不是因为没人玩了,而是因为 AI 把这个游戏的本质改掉了。
谁有资格说这话?
Kabir 不是随便一个发牢骚的网友。他 2021 年开始打 CTF,第一次参赛(HCKSYD,48 小时个人赛)就在 2 小时内全解获胜。后来他带领 Blitzkrieg 多次赢得澳大利亚最大的 CTF 赛事 DownUnderCTF,又加入了国际顶级战队 TheHackersCrew,在 CTFTime 全球排名中长期稳居前 10。
他说这些不是因为他讨厌 CTF。恰恰相反——CTF 是让他爱上安全的东西。但他无法忍受大家假装这个赛制还和以前一样。
GPT-4 只是开胃菜
变化从 GPT-4 开始。中等难度的 CTF 题目开始变得「一句话可解」——把密码学题目丢给 ChatGPT,10 分钟后就能拿到 flag。当时大家没太在意:难题还是解不了,省下的时间也不至于破坏比赛。
问题从来不是「AI 能帮忙」。CTF 选手一直用工具。问题是:当模型完成推理、写出解题脚本、人类唯一要做的就是复制粘贴 flag 的时候,比赛还有意义吗?
Claude Opus 4.5 改变了一切
当 Claude Opus 4.5 发布时,气氛彻底变了。几乎所有中等难度挑战,甚至部分难题,都变成了 Agent 可解的。Claude Code 把所有东西打包成了 CLI,轻松连接 MCP 工具。用 CTFd API 给每道题起一个 Claude 实例,这种编排变得简单到令人不安。
你可以让 Agent 跑第一个小时,然后只去啃剩下的硬骨头。
拒绝用 AI 的战队不再只是少了个便利工具——他们在玩一个慢速版本的比赛。开放在线 CTF 变成了「谁能更快地自动化中低难度题目,然后把人类注意力留给最难的题」。CTFTime 排行榜开始衡量 Agent 编排能力和模型选择,而不是纯粹的安全技术。
效果肉眼可见。曾经长期霸榜的传奇战队越来越少出现。出题人花几周精心设计的题目,被 Agent 几分钟吃掉后,他们也失去了继续出题的动力。
GPT-5.5 彻底封死了棺材板
Kabir 在 GPT-5.5 和 GPT-5.5 Pro 发布后深度测试了它们的能力。结论令人沮丧:
- GPT-5.5 的能力接近 Claude Mythos,Pro 版本可能更强
- 它们能一键解 HackTheBox 的 Insane 难度——active leakless heap pwn 挑战
- 小赛事组织者能出的题,大部分已经被前沿模型攻克了
- 用 Pro 版本在 48 小时 CTF 中跑 Agent,很可能在比赛结束前就拿到 flag
这意味着开放 CTF 变成了 pay-to-win。你能在比赛中投入多少 Token、能跑多久的 Agent,决定了你的排名。比赛衡量的不再是安全技能,而是你的预算和编排能力。
「初学者照样能学」?想多了
有一种常见论调:初学者还是能从 CTF 中学到东西。Kabir 认为这种观点忽略了计分板的存在。
CTF 不只是一组谜题,它是一个阶梯。初学者能看到自己进步、解更多题、排名更高、加入更好的战队、逐渐变得更强。这个反馈循环正在被打破:
- 如果排行榜被 AI 战队主导,初学者会在建立直觉之前就被推向使用 AI
- AI 替代的恰恰是「主动挣扎」的部分——而这才是真正教会你的东西
- 认真努力却看不到排名进步,因为上面的阶梯已经被自动化了,这非常打击积极性
- 出题人也会转向 picoGym、HackTheBox 等以教育为目的的平台
「CTF 没死」?DEF CON 不是救命稻草
有人用 DEF CON 等顶级决赛来论证 CTF 还没死。Kabir 认为这是错误的辩护:
- 顶级决赛参与者极少,通常需要通过预选赛晋级
- 如果预选赛被 Agent 攻克,真正有资格的人更难进入决赛
- 少数精英决赛救不了大多数人参与的开放在线赛制
- 核心问题不是「能不能解所有题」,而是「排行榜是否还有意义」
CTF ≠ 国际象棋
有人把 CTF 比作国际象棋——计算机早就能打败人类了,但人类依然享受下棋。Kabir 指出这个类比不成立:
- 国际象棋有人机分离的明确规则,AI 不能替你落子
- CTF 没有这种隔离——你无法区分一个人是自己解的还是 Agent 解的
- 棋手在棋盘上还是自己思考,CTF 选手面对 flag 时可能只是在复制粘贴
安全行业的招聘也该反思了
CTF 成绩长期以来是安全公司招聘的参考指标之一。但当排行榜不再反映人类技能时,这个指标就失去了意义。更讽刺的是,CTF 的 Agent 编排也不太能衡量 AI 技能——大部分编排工作已经开源或者能 vibe code 出来。
Kabir 建议:
- 安全公司应该停止过度依赖 CTF 排名来筛选候选人
- 出题人应该把精力投入教育平台而非竞赛
- 想真正学安全的人应该去 picoGym、HackTheBox 等以学习为目标的平台
这对你意味着什么?
即使你不是 CTF 选手,这个话题也值得关注。它揭示了一个更大的问题:当 AI 能完成大部分中等难度的技术工作时,人类的技能评估体系该怎么办?
编程面试、安全审计、代码评审——所有这些「衡量人类技术能力」的场景,都在面临类似的挑战。CTF 只是第一个倒下的多米诺骨牌。
Hacker News 评论区中有人指出,也许未来安全竞赛的赛制需要像围棋比赛引入 AI 赛道一样,建立「纯人类」和「AI 辅助」两条赛道。但也有人反驳:在实际安全工作中你不可能禁止使用 AI,所以也许该改变的不是赛制,而是我们对「安全技能」的定义本身。
不管怎样,Kabir 的结论很清楚:旧的 CTF 已经死了。问题不是它会不会复活,而是它会以什么形式重生。