GoForum🌐 V2EX

LimitRateAPI,避免 429

adrianzhang · 2026-06-20 14:08 · 0 次点赞 · 2 条回复

由于很多大模型 API 有 requests per second 这类请求速率限制,因此 vibe coding 了一个小代理,设置好模型的 rpm ,它会帮你管理请求,太快的,就排队,这样就不会触发 429 错误。

用的 Python ,应该可以在 Linux/MacOS/Windows 上运行使用。

Open Source repo: https://github.com/adrianzhang/LimitRateAPI

缘由: 使用 Hermes+免费 API ,很频繁遇到 429 ,一个小事情做着做着就断了,非常烦人。有了这个代理,Hermes 可以顺畅运行了。

这是我第一个 vibe coding 项目,希望能帮助有同样需求的人。代码是 GLM5.2 写的,如果有问题,去喷智谱:)

2 条回复
slowman · 2026-06-20 14:33
#1

等待,还不如手动 fallback 到其他可用后端

adrianzhang · 2026-06-20 14:33
#2

@slowman 好主意。但是只有几个免费 API 的时候就经常把全部 API 都超了。Hermes 这类 agent 经常大量发请求。

添加回复
你还需要 登录 后发表回复

登录后可发帖和回复

登录 注册
主题信息
作者: adrianzhang
发布: 2026-06-20
点赞: 0
回复: 0