FreeLLMAPI :1 个端点,16 家免费 AI,每月 17 亿 token

你手上有多少个免费 AI API Key?Google AI Studio 的 Gemini、Groq 的 Llama、GitHub Models 的 GPT-4o、智谱的 GLM——注册一圈下来,少说也有七八个。每个单独拿出来都能用,但都不够用。免费 tier 的 RPM 限制严、模型不稳定、今天能用明天就报 429。结果就是你的 Key 躺在各种 .env 文件里吃灰,真要用的时候还是乖乖去充 OpenAI 的余额。

FreeLLMAPI 做的事听起来像一种古怪的算术:把 16 家 AI 提供商的免费额度捆在一起,算出一个总数——每月约 17 亿 token 的推理能力。然后它给你一个 OpenAI 兼容的本地端点,让你像调 ChatGPT API 一样调这 16 家的免费模型。路由、故障转移、速率追踪,全自动。

这个项目 2026 年 4 月上线,两个月冲到 10.8k Stars(截至 2026 年 6 月)。但 Star 数骗不了长期泡 GitHub 的人。我翻完了它的 README、Issue 区、commit 历史和社区讨论之后,觉得这个故事比”又一个免费薅 AI 的工具”有意思得多。

坦白讲,真正让我愿意写这篇文章的,不是它堆了多少家 provider,而是这个项目的诚实程度——在同类竞品里相当罕见。说清楚一件事就够了:README 打开第一屏,写着”This project is for personal experimentation and learning, not production.”

打动我的几个地方

FreeLLMAPI 的定位策略跟同类项目走了完全不同的路线。大多数”免费 AI 聚合”项目喜欢把数字往大了吹——“无限免费”“白嫖 GPT-4”——然后你装完发现到处是坑。FreeLLMAPI 选择反过来做:先告诉你所有限制,再让你决定用不用。

这种诚实渗透到项目的每个角落。README 带了一份逐家 ToS 审查表,Cohere 标注”⚠️ 谨慎”,部分 provider 标注”❌ 避免”。作者的态度是”我把信息给你,责任你自己负”。在免费薅 AI 这个本来就走在灰色地带的方向上,这种透明度比任何技术亮点都值钱。

真正有区分度的技术设计是它的路由系统。这不是简单的 round-robin 轮询。每次请求进来,Router 同时检查三个维度:模型优先级、密钥健康状态、以及当前 RPM/RPD/TPM/TPD 四维配额是否耗尽。任何一个维度不满足就跳过,沿着预设的回退链往下试,最多重试 20 次。如果所有 provider 都挂了或超额了,才返回错误。这个路由逻辑本质上是在做”免费额度的最优分配”,而不是简单的代理转发。

FreeLLMAPI :1 个端点,16 家免费 AI,每月 17 亿 token

从上图可以看到,整个系统的核心是一个多维度决策引擎。Router 不是简单地把请求丢给第一个可用的 provider,而是在每次请求时实时评估所有 provider 的状态,选出一个最优解。这让它跟市面上大多数 API 代理有了本质区别。

另一个让我觉得项目作者真干过活的功能是粘性会话。多轮对话在 30 分钟内锁定同一个模型。这不是技术炫技,是刚需。你正在跟 DeepSeek V4 聊代码重构,聊到第 5 轮突然路由器把你切到 Gemini Flash,上下文全乱——这种事用其他聚合工具经常发生。粘性会话是那种”用过就回不去”的功能。实现上还带了一个巧思:模型切换时会注入一条系统消息告知新模型当前任务,尽可能减少切换带来的理解偏差。

FreeLLMAPI :1 个端点,16 家免费 AI,每月 17 亿 token

请求链路的每个环节都有对应的保护机制。密钥在 SQLite 里用 AES-256-GCM 静态加密,只在发起请求前在内存里临时解密。客户端只用一个 freellmapi-... 的统一 Bearer Token 认证。你的应用代码里永远不出现原始 Key。对于一个要在本地跑、可能被人看到配置文件的工具来说,这个设计考虑得很细。

工程精度上,75 个 vitest 测试用例、可插拔的 provider 适配器架构(照着 openai-compat.ts 模板复制就能接新 provider)、SQLite 落盘的限额账本、周期健康探针——整套东西空载内存占用约 40MB,能在树莓派上跑。TypeScript monorepo 的代码结构干净,server/client/shared 三层分离,管理和分析面板用 React + Vite + shadcn/ui 搭的,暗色模式也做了。

不过有一件事得说清楚:这些免费 tier 里没有前沿模型。最高到 Llama 3.3 70B、GLM-4.5、Gemini 2.5 Pro 这个级别。GPT-5、Claude Opus 这些你在免费档确实拿不到。而且随着当天高配模型的额度逐步耗尽,Router 会自动降级到更弱的模型,智能度是一个递减曲线,不是恒定值。这是物理限制,不是工程缺陷。

上手什么感觉

安装路径比我想象的简单。

有 Docker 的话一行命令搞定:

curl -fsSL https://freellmapi.co/install.sh | bash

Windows PowerShell 用户走另一条路:

iwr -useb https://freellmapi.co/install.ps1 | iex

不想用安装脚本就手动 git clone:

git clone https://github.com/tashfeenahmed/freellmapi.git
cd freellmapi
npm install
cp .env.example .env
npm run dev

启动后两个端口:后端 API 在 :3001,管理面板在 :5173。打开面板第一件事是去 Keys 页面粘贴你各个平台的免费 Key,然后去 Fallback Chain 页面拖拽调整回退优先级。配置完拿到统一 Token 之后,接入方式就跟调 OpenAI API 一模一样:

from openai import OpenAI

client = OpenAI(
base_url="http://localhost:3001/v1",
api_key="freellmapi-your-unified-key",
)

resp = client.chat.completions.create(
model="auto",
messages=[{"role""user""content""用一句话总结罗马的衰落"}],
)
print(resp.choices[0].message.content)

FreeLLMAPI :1 个端点,16 家免费 AI,每月 17 亿 token

目前支持的 16 家 provider 覆盖了主流免费 tier 的绝大部分:Google Gemini、Groq、Cerebras、OpenCode Zen、Mistral、OpenRouter(21 个免费模型)、GitHub Models、Cloudflare、Cohere、智谱 Z.ai、NVIDIA NIM、HuggingFace、Ollama Cloud、Kilo Gateway、Pollinations、LLM7、OVH AI Endpoints。还支持自己挂 OpenAI 兼容的自定义端点,比如本地的 llama.cpp 或 vLLM。

跑起来的体验比你预期的顺滑。但有两个坑我建议你提前知道。第一个坑:首次添加 Key 后需要等健康检查跑完一轮才能正常路由。刚加完 Key 立刻调 API 可能报无可用模型,等个一两分钟就好,这是设计如此,不是 bug。第二个坑:不同 provider 的延迟差异很大,Gemini Flash 可能 300ms 返回,OpenRouter 上某个冷门模型可能要 5 秒。Router 不会根据延迟选模型,它只看优先级和配额。如果你对延迟敏感,手动把快速 provider 排在回退链前面。

什么时候用,什么时候别用

这个问题我试着用一张表说清楚:

场景 典型用户 优势 局限
AI 应用原型开发 个人开发者、独立黑客 零成本跑通核心逻辑,验证想法可行性 模型智能度有上限,生产化需换付费 API
多模型效果对比 AI 产品经理、研究员 同一接口切换 100+ 模型,快速对比输出质量 部分 provider 延迟不稳,对比需要多次采样
本地 AI 网关常驻 树莓派玩家、Homelab 爱好者 40MB 内存常驻,统一管理全家 AI 调用 单用户设计,不适合多人共享
Agent 开发实验 Agent 框架开发者 完整工具调用加流式支持,MCP 兼容 免费模型工具调用能力参差不齐,如 Google 搜索需 Gemini 专属

不适用的情况也很明确:

  • 你需要生产级 SLA 和前沿模型,比如 GPT-5 或 Claude Opus 级别。直接用付费 API,这不是免费聚合能给的。
  • 你需要多租户、多用户管理。FreeLLMAPI 刻意不做多用户认证,这是单用户工具,不是 API 分发平台。
  • 你的场景对模型一致性要求极高。Router 可能在额度耗尽时切换模型,即使有粘性会话也只能保 30 分钟。
  • 你需要图像生成或音频处理。目前只支持 chat completions 和 embeddings,不支持多模态生成。

但场景归场景,更让人在意的问题是:这个项目能在 GitHub 上活多久?

社区怎么样了

先看数据:

指标 数据(截至 2026 年 6 月) 说明
Stars 10.8k+ 两个月内从 0 到 10k,增速在同类中属第一梯队
Forks 1.7k Fork 活跃度匹配 Star 增速
贡献者 33 位 社区参与度健康,非单人项目
Commits 267 更新频率高,无长期停滞迹象
协议 MIT 商业友好,无 copyleft 顾虑
最新版本 v0.3.0 2026 年 6 月 20 日发布,新增 Premium 实时目录和桌面应用

Issue 区的响应速度值得提。功能请求类 Issue 多数在一周内有实质性回复或关闭。最近关闭的几个关键 Issue 反映了社区的真实需求:Windows .exe 安装包(#250,一个反复出现的呼声,v0.3.0 已解决)、模型目录搜索和筛选(#343)、重复模型合并(#335)、Docker 多架构支持(#44)。

ngjoo.com 的深度分析给这个项目打了 100/100 的质量评分,评价里有一句我比较认同:“和市面上一堆’免费薅 AI’项目最大的不同是诚实。“知乎上用户的典型反馈是”配好之后确实省事,不用在几个平台之间来回切了”,但也有人提到”免费额度不是无限的,重度使用一天就耗完高配模型”——这个观察跟我的判断完全一致。

不过有两个风险点值得关注。

  • 第一,Bus Factor 目前偏低,核心架构决策和大部分代码提交集中在作者一个人身上。33 位贡献者中,超过 80% 的 contributions 来自 tashfeenahmed。
  • 第二,v0.3.0 引入的 Premium 实时目录($19/年或 $49 终身)是一个商业化信号。目前看是合理的——免费版用月度快照,付费版拿实时更新——但这是项目从纯社区驱动走向混合模式的第一个拐点,后续走向值得持续观察。

我的真实看法

跟竞品放在一起看,FreeLLMAPI 的位置会更清楚。

如果你知道 OpenRouter,可能会问:OpenRouter 已经有免费模型路由了,为什么还要自己搭一个?区别在于,OpenRouter 的免费 tier 只是它商业产品的一个引流入口,你能用的模型和额度都受它控制。FreeLLMAPI 把控制权完全交给你——你用你自己的 Key、你自己的回退链、你自己的路由逻辑。你是 owner,不是 user。

跟 LiteLLM(41.8k Stars)比,LiteLLM 是企业级 AI Gateway,面向多团队、预算隔离、成本追踪,需要 Python 环境和一定运维能力。FreeLLMAPI 是个人级、单用户、TypeScript、40MB 内存。两者不是竞争关系,是不同量级的工具,解决不同规模的问题。跟 One API(31.3k Stars)比,One API 定位是”运营一个 API 分发平台”,有用户体系、充值系统、中文管理后台。FreeLLMAPI 完全没有这些东西——它就是个你自己的本地代理,连多用户都不支持。

我花了两小时深挖 Issue 和 commit 历史之后,判断收窄了:这不是一个短期热度的营销项目。作者对边界的诚实、对 ToS 的逐条审查、对安全细节的用心(加密存储、统一 Token、内存解密),这些东西装不出来。但同时要承认,它的天花板就是它的定位——个人实验工具。你不会拿它跑生产,也不该拿。

趋势判断上,有两个信号。正向信号:commit 频率在加速,v0.3.0 从功能完善转向了商业模式探索,说明作者在认真考虑长期维护。风险信号:免费 tier 的可持续性完全不受项目控制。README 自己记录了 HuggingFace、Moonshot、MiniMax 的免费额度已被移除或转付费。你今天能用的 16 家,半年后可能只剩 10 家。这是最大的不可控变量。

还有一个我自己的观察:这个项目最大的价值可能不是聚合免费额度本身,而是它提供了一种思维方式的转变。单独看每个免费 tier 都是玩具,但组合起来能覆盖原型开发 80% 的需求。如果你的 AI 应用在免费聚合网关下跑不通,那大概率不是额度的问题,是你的设计假设有问题——你过度依赖了某个特定模型的能力。

资源地址

资源 地址
GitHub https://github.com/tashfeenahmed/freellmapi
安装脚本 https://freellmapi.co/install.sh

聊完了,你该干嘛

如果你现在手上已经有五六个免费 API Key 在吃灰,今晚花 10 分钟装一个。把 Key 扔进去,把你的 AI 应用的 base_url 改到 localhost:3001,看看效果。大概率比你现在手动切 Key 的体验好。

如果你还在观望,关注两个指标:一是 contributor 数量能不能突破 50(降低 Bus Factor 风险),二是 Premium 商业化的进程会不会影响开源版的更新速度。第二点尤其关键。太多开源项目在加了付费 tier 之后,免费版变成了二等公民。FreeLLMAPI 目前没这个苗头,但值得持续观察。

免费 LLM API 这件事,单独用是鸡肋,堆起来用是杠杆。这个项目帮你把杠杆架好了。

开源项目

装了 RTK 之后我才意识到之前浪费了多少 Token

2026-6-20 15:24:00

开源项目

Anthropic-Cybersecurity:不是安全工具,是 754 个安全专家的脑子

2026-6-21 15:53:59

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧