什么是 9router
9router 是 decolua/9router 开发的开源 AI 编程路由工具,上线不到一周就在 GitHub 拿下 8.7K+ Stars,日增近千星,直接冲上 Trending 首页
它的核心功能非常简单但极其实用:把你的 AI 编程工具(Claude Code、Codex、Cursor、Cline、Copilot、OpenClaw 等)连到 40+ 个 AI 提供商,按"订阅 → 低价 → 免费"三级自动回退,确保你永不中断也永不超支
为什么 9router 突然爆火
2026 年 AI 编程工具已经全面普及,但开发者的痛点越来越明显
- 订阅浪费:每月 $20-200 的 Claude Code/Codex 订阅,额度经常用不完过期
- 限频卡死:编码到一半突然 hitting rate limit,思路全断
- 工具输出烧 token:git diff、grep、ls、tree 等工具输出动辄几十万 token,钱花得飞快
- 手动切换太麻烦:一个提供商用完了要手动切到另一个
9router 用一个轻量级的本地路由代理解决了以上所有问题,而且完全免费开源
核心架构
9router 在你本地跑一个 HTTP 代理服务(默认端口 20128),所有 AI 编程工具把它设成 OpenAI 兼容接口,路由逻辑完全透明
你的 CLI 工具 (Claude Code / Codex / Cursor / Cline ...)
│
▼ http://localhost:20128/v1
┌─────────────────────────────────────────────┐
│ 9Router (智能路由层) │
│ • RTK 令牌压缩 (压缩工具输出) │
│ • 格式翻译 (OpenAI ↔ Claude ↔ Gemini) │
│ • 额度跟踪 │
│ • 自动 token 刷新 │
└──────┬──────────────────────────────────────┘
│
┌────┼────────────┐
▼ ▼ ▼
订阅 低价 免费
(Claude (GLM $0.6 (Kiro AI 无限免费
Code) /1M) OpenCode Free
Vertex $300额度)
你的工具发送 OpenAI 格式的请求 → 9router 翻译成提供商原生格式 → 拿到结果返回给你。这一切在本地完成,几乎没有延迟开销
三步部署教程
第一步:安装 9router
一行命令全局安装:
npm install -g 9router 9router
仪表盘自动在 http://localhost:20128 打开
第二步:连接免费提供商
进入 Dashboard → Providers,推荐这几个真正免费无限的提供商
| 提供商 | 免费额度 | 支持模型 |
|---|---|---|
| Kiro AI | 无限免费 | Claude Sonnet 4.5、GLM-5、MiniMax |
| OpenCode Free | 无限免费 | 自动获取模型列表 |
| Vertex AI | $300 新用户额度 | Gemini 3 Pro、DeepSeek、GLM-5 |
点击 Connect,不需要注册直接可用
第三步:配置 AI 编程工具
在 Claude Code / Codex / Cursor / Cline / OpenClaw 中设置:
- Endpoint:
http://localhost:20128/v1 - API Key:从 Dashboard 复制
- Model:例如
kr/claude-sonnet-4.5
搞定。就这么简单
RTK 令牌压缩引擎
这是 9router 最实用的功能。AI 编程工具在调用模型时会附带大量工具输出(git diff、grep 结果、文件树、日志),这些内容经常占掉 30-50% 的 prompt 预算
RTK(RTK ⭐40K)会在请求到达 LLM 之前智能压缩这些工具输出
- 自动检测:git-diff、git-status、grep、find、ls、tree、dedup-log、smart-truncate 等过滤器
- 零配置:RTK 自动瞄一眼工具输出的前 1KB,自动选最佳过滤器
- 安全设计:压缩失败或不划算时自动保留原文,不破坏请求
- 全局生效:在格式翻译之前运行,所有提供商都受益
实测效果:一个 47K token 的请求经 RTK 压缩到 28K tokens,节省 40% 输入成本,上下文完全相同
三级智能回退策略
这是 9router 另一个核心功能。你可以创建一个"组合",按优先级配置多级提供商
组合名: "my-coding-stack" Tier 1: cc/claude-opus-4-6 (订阅,你有 Claude Pro) Tier 2: glm/glm-4.7 (低价备份,$0.6/1M) Tier 3: if/kimi-k2-thinking (免费兜底,不限量)
当订阅额度用完后自动切到低价层,低价层超预算后切到免费层。全程零中断,你甚至感觉不到切换发生
更多高级功能
多账户负载均衡
同一个提供商可以添加多个账号,自动轮询或按优先级路由。一个账号限额用完自动切到下一个
格式翻译
OpenAI ↔ Claude ↔ Gemini ↔ Cursor ↔ Kiro ↔ Vertex ↔ Antigravity ↔ Ollama 全系列格式自动互转。你的工具只需要支持 OpenAI 格式,剩下交给 9router
额度跟踪与自动刷新
实时显示每个提供商的 token 消耗、重置倒计时、预估成本。OAuth token 到期前自动刷新,完全无感
云同步
配置文件可以跨设备同步,在家、办公室、笔记本用同一套路由设置
多种部署方式
| 方式 | 适用场景 | 命令 |
|---|---|---|
| 本地 | 个人开发机 | npm install -g 9router && 9router |
| Docker | 服务端/团队共享 | 一行 Docker 命令 |
| VPS | 跨设备访问 | 常规部署 |
| Cloudflare Workers | 全球边缘网络 | Workers 部署 |
最佳实践组合
根据不同的预算和需求,这里推荐几个经典组合
零成本方案
适合不想花钱的开发者
- Kiro AI(免费无限 Claude Sonnet 4.5)
- OpenCode Free(免认证)
- 开启 RTK 压缩(再省 20-40% tokens)
每月花费:$0
订阅最大化方案
已经订阅了 Claude Pro 或 GitHub Copilot
- Tier 1:你的订阅(不浪费已经付的钱)
- Tier 2:GLM-4.7($0.6/1M 极低价)
- Tier 3:Kiro AI 免费(最终兜底)
- 开启 RTK 压缩尽量减少订阅消耗速度
团队共享方案
在 VPS 或 Docker 上部署 9router,团队共用
- 多账户轮询分摊额度
- 云同步统一配置
- 用量分析监控团队消耗
注意事项
- 9router 本身完全免费开源,Dashboard 显示的成本是"节省追踪器"而非实际扣费
- iFlow、Qwen CLI 和 Gemini CLI 的免费层已在 2026 年下线,改用 Kiro / OpenCode Free 替代
- RTK 压缩对工具密集型任务(grep 搜索、大规模重构)效果最明显
- 免费提供商通常在高峰时段有延迟,关键任务建议用订阅层
总结
9router 解决了 2026 年 AI 编程开发者最头疼的问题:订阅浪费、限频卡死、token 烧钱。用一个轻量级本地路由代理 + 40+ 提供商网络 + RTK 智能压缩,让 AI 编程真正变得"便宜到几乎免费"
它的设计理念也很有意思——不是替代现有 AI 编程工具,而是做一个透明的中间层,让你现有的工具用得更好更省。这种务实的方向正是它快速爆火的原因
如果你还在为每月几十美元的 AI 编程订阅费心疼,或者经常被 rate limit 打断节奏,值得花 5 分钟试试 9router