博客首页 / API 稳定性

HTTP 429 Too Many Requests 排查与治理：限流、重试与幂等设计

发布于: 2026-03-21 • 分类: 后端 / API / 稳定性

很多团队遇到 429 的第一反应是“流量太大”，然后粗暴调高限额。结果通常是两周后又爆一次，而且问题更难定位。429 的本质不是错误码，而是系统在告诉你：当前请求分布已经超过了你定义的容量边界。

1. 先搞清楚是哪个维度触发了 429

限流通常按多个维度叠加：用户、IP、Token、接口、租户、区域、设备。你需要先知道是哪一层在拦。最简单做法是在响应里补充可读字段，例如当前命中规则名、窗口大小、剩余令牌与重试时间。

如果响应只返回“Too Many Requests”，前端和调用方就只能盲重试，进一步放大压力。

同样是限流，目标不一样，策略也不同。

实操里建议“全局上限 + 租户配额 + 接口局部限速”三层组合，不要只压某一层。

如果你有 `Retry-After` 却没被客户端消费，这个头就等于没发。对 429 的正确处理顺序是：

同一套 SDK 要覆盖 Web、移动端、服务端调用，避免不同端各自实现导致行为不一致。

429 往往发生在提交高峰，比如下单、支付、批量导入。如果调用方重试而接口不幂等，就会出现重复写入和数据污染。建议关键写接口统一支持幂等键（Idempotency-Key）并明确过期策略。

429 可以接受，重复扣款不可接受。优先保障写操作幂等，再谈重试成功率。

只看 429 数量没有意义，要看结构：

这些指标一起看，才能区分是“阈值配置太保守”还是“系统容量真的到顶”。

把 429 当成容量治理信号，而不是“临时报错”，你的 API 可用性会稳定很多。