FreeLLMAPI ：1 个端点，16 家免费 AI，每月 17 亿 token

你手上有多少个免费 AI API Key？Google AI Studio 的 Gemini、Groq 的 Llama、GitHub Models 的 GPT-4o、智谱的 GLM——注册一圈下来，少说也有七八个。每个单独拿出来都能用，但都不够用。免费 tier 的 RPM 限制严、模型不稳定、今天能用明天就报 429。结果就是你的 Key 躺在各种 .env 文件里吃灰，真要用的时候还是乖乖去充 OpenAI 的余额。

FreeLLMAPI 做的事听起来像一种古怪的算术：把 16 家 AI 提供商的免费额度捆在一起，算出一个总数——每月约 17 亿 token 的推理能力。然后它给你一个 OpenAI 兼容的本地端点，让你像调 ChatGPT API 一样调这 16 家的免费模型。路由、故障转移、速率追踪，全自动。

这个项目 2026 年 4 月上线，两个月冲到 10.8k Stars（截至 2026 年 6 月）。但 Star 数骗不了长期泡 GitHub 的人。我翻完了它的 README、Issue 区、commit 历史和社区讨论之后，觉得这个故事比”又一个免费薅 AI 的工具”有意思得多。

坦白讲，真正让我愿意写这篇文章的，不是它堆了多少家 provider，而是这个项目的诚实程度——在同类竞品里相当罕见。说清楚一件事就够了：README 打开第一屏，写着”This project is for personal experimentation and learning, not production.”

打动我的几个地方

FreeLLMAPI 的定位策略跟同类项目走了完全不同的路线。大多数”免费 AI 聚合”项目喜欢把数字往大了吹——“无限免费”“白嫖 GPT-4”——然后你装完发现到处是坑。FreeLLMAPI 选择反过来做：先告诉你所有限制，再让你决定用不用。

这种诚实渗透到项目的每个角落。README 带了一份逐家 ToS 审查表，Cohere 标注”⚠️ 谨慎”，部分 provider 标注”❌ 避免”。作者的态度是”我把信息给你，责任你自己负”。在免费薅 AI 这个本来就走在灰色地带的方向上，这种透明度比任何技术亮点都值钱。

真正有区分度的技术设计是它的路由系统。这不是简单的 round-robin 轮询。每次请求进来，Router 同时检查三个维度：模型优先级、密钥健康状态、以及当前 RPM/RPD/TPM/TPD 四维配额是否耗尽。任何一个维度不满足就跳过，沿着预设的回退链往下试，最多重试 20 次。如果所有 provider 都挂了或超额了，才返回错误。这个路由逻辑本质上是在做”免费额度的最优分配”，而不是简单的代理转发。

FreeLLMAPI ：1 个端点，16 家免费 AI，每月 17 亿 token

从上图可以看到，整个系统的核心是一个多维度决策引擎。Router 不是简单地把请求丢给第一个可用的 provider，而是在每次请求时实时评估所有 provider 的状态，选出一个最优解。这让它跟市面上大多数 API 代理有了本质区别。

另一个让我觉得项目作者真干过活的功能是粘性会话。多轮对话在 30 分钟内锁定同一个模型。这不是技术炫技，是刚需。你正在跟 DeepSeek V4 聊代码重构，聊到第 5 轮突然路由器把你切到 Gemini Flash，上下文全乱——这种事用其他聚合工具经常发生。粘性会话是那种”用过就回不去”的功能。实现上还带了一个巧思：模型切换时会注入一条系统消息告知新模型当前任务，尽可能减少切换带来的理解偏差。

FreeLLMAPI ：1 个端点，16 家免费 AI，每月 17 亿 token

请求链路的每个环节都有对应的保护机制。密钥在 SQLite 里用 AES-256-GCM 静态加密，只在发起请求前在内存里临时解密。客户端只用一个 freellmapi-... 的统一 Bearer Token 认证。你的应用代码里永远不出现原始 Key。对于一个要在本地跑、可能被人看到配置文件的工具来说，这个设计考虑得很细。

工程精度上，75 个 vitest 测试用例、可插拔的 provider 适配器架构（照着 openai-compat.ts 模板复制就能接新 provider）、SQLite 落盘的限额账本、周期健康探针——整套东西空载内存占用约 40MB，能在树莓派上跑。TypeScript monorepo 的代码结构干净，server/client/shared 三层分离，管理和分析面板用 React + Vite + shadcn/ui 搭的，暗色模式也做了。

不过有一件事得说清楚：这些免费 tier 里没有前沿模型。最高到 Llama 3.3 70B、GLM-4.5、Gemini 2.5 Pro 这个级别。GPT-5、Claude Opus 这些你在免费档确实拿不到。而且随着当天高配模型的额度逐步耗尽，Router 会自动降级到更弱的模型，智能度是一个递减曲线，不是恒定值。这是物理限制，不是工程缺陷。

上手什么感觉

安装路径比我想象的简单。

有 Docker 的话一行命令搞定：

curl -fsSL https://freellmapi.co/install.sh | bash

Windows PowerShell 用户走另一条路：

iwr -useb https://freellmapi.co/install.ps1 | iex

不想用安装脚本就手动 git clone：

git clone https://github.com/tashfeenahmed/freellmapi.git
cd freellmapi
npm install
cp .env.example .env
npm run dev

启动后两个端口：后端 API 在 :3001，管理面板在 :5173。打开面板第一件事是去 Keys 页面粘贴你各个平台的免费 Key，然后去 Fallback Chain 页面拖拽调整回退优先级。配置完拿到统一 Token 之后，接入方式就跟调 OpenAI API 一模一样：

from openai import OpenAI

client = OpenAI(
base_url="http://localhost:3001/v1",
api_key="freellmapi-your-unified-key",
)

resp = client.chat.completions.create(
model="auto",
messages=[{"role": "user", "content": "用一句话总结罗马的衰落"}],
)
print(resp.choices[0].message.content)

FreeLLMAPI ：1 个端点，16 家免费 AI，每月 17 亿 token

目前支持的 16 家 provider 覆盖了主流免费 tier 的绝大部分：Google Gemini、Groq、Cerebras、OpenCode Zen、Mistral、OpenRouter（21 个免费模型）、GitHub Models、Cloudflare、Cohere、智谱 Z.ai、NVIDIA NIM、HuggingFace、Ollama Cloud、Kilo Gateway、Pollinations、LLM7、OVH AI Endpoints。还支持自己挂 OpenAI 兼容的自定义端点，比如本地的 llama.cpp 或 vLLM。

跑起来的体验比你预期的顺滑。但有两个坑我建议你提前知道。第一个坑：首次添加 Key 后需要等健康检查跑完一轮才能正常路由。刚加完 Key 立刻调 API 可能报无可用模型，等个一两分钟就好，这是设计如此，不是 bug。第二个坑：不同 provider 的延迟差异很大，Gemini Flash 可能 300ms 返回，OpenRouter 上某个冷门模型可能要 5 秒。Router 不会根据延迟选模型，它只看优先级和配额。如果你对延迟敏感，手动把快速 provider 排在回退链前面。

什么时候用，什么时候别用

这个问题我试着用一张表说清楚：

场景	典型用户	优势	局限
AI 应用原型开发	个人开发者、独立黑客	零成本跑通核心逻辑，验证想法可行性	模型智能度有上限，生产化需换付费 API
多模型效果对比	AI 产品经理、研究员	同一接口切换 100+ 模型，快速对比输出质量	部分 provider 延迟不稳，对比需要多次采样
本地 AI 网关常驻	树莓派玩家、Homelab 爱好者	40MB 内存常驻，统一管理全家 AI 调用	单用户设计，不适合多人共享
Agent 开发实验	Agent 框架开发者	完整工具调用加流式支持，MCP 兼容	免费模型工具调用能力参差不齐，如 Google 搜索需 Gemini 专属

不适用的情况也很明确：

你需要生产级 SLA 和前沿模型，比如 GPT-5 或 Claude Opus 级别。直接用付费 API，这不是免费聚合能给的。
你需要多租户、多用户管理。FreeLLMAPI 刻意不做多用户认证，这是单用户工具，不是 API 分发平台。
你的场景对模型一致性要求极高。Router 可能在额度耗尽时切换模型，即使有粘性会话也只能保 30 分钟。
你需要图像生成或音频处理。目前只支持 chat completions 和 embeddings，不支持多模态生成。

但场景归场景，更让人在意的问题是：这个项目能在 GitHub 上活多久？

社区怎么样了

先看数据：

指标	数据（截至 2026 年 6 月）	说明
Stars	10.8k+	两个月内从 0 到 10k，增速在同类中属第一梯队
Forks	1.7k	Fork 活跃度匹配 Star 增速
贡献者	33 位	社区参与度健康，非单人项目
Commits	267	更新频率高，无长期停滞迹象
协议	MIT	商业友好，无 copyleft 顾虑
最新版本	v0.3.0	2026 年 6 月 20 日发布，新增 Premium 实时目录和桌面应用

Issue 区的响应速度值得提。功能请求类 Issue 多数在一周内有实质性回复或关闭。最近关闭的几个关键 Issue 反映了社区的真实需求：Windows .exe 安装包（#250，一个反复出现的呼声，v0.3.0 已解决）、模型目录搜索和筛选（#343）、重复模型合并（#335）、Docker 多架构支持（#44）。

ngjoo.com 的深度分析给这个项目打了 100/100 的质量评分，评价里有一句我比较认同：“和市面上一堆’免费薅 AI’项目最大的不同是诚实。“知乎上用户的典型反馈是”配好之后确实省事，不用在几个平台之间来回切了”，但也有人提到”免费额度不是无限的，重度使用一天就耗完高配模型”——这个观察跟我的判断完全一致。

不过有两个风险点值得关注。

第一，Bus Factor 目前偏低，核心架构决策和大部分代码提交集中在作者一个人身上。33 位贡献者中，超过 80% 的 contributions 来自 tashfeenahmed。
第二，v0.3.0 引入的 Premium 实时目录（$19/年或 $49 终身）是一个商业化信号。目前看是合理的——免费版用月度快照，付费版拿实时更新——但这是项目从纯社区驱动走向混合模式的第一个拐点，后续走向值得持续观察。

我的真实看法

跟竞品放在一起看，FreeLLMAPI 的位置会更清楚。

如果你知道 OpenRouter，可能会问：OpenRouter 已经有免费模型路由了，为什么还要自己搭一个？区别在于，OpenRouter 的免费 tier 只是它商业产品的一个引流入口，你能用的模型和额度都受它控制。FreeLLMAPI 把控制权完全交给你——你用你自己的 Key、你自己的回退链、你自己的路由逻辑。你是 owner，不是 user。

跟 LiteLLM（41.8k Stars）比，LiteLLM 是企业级 AI Gateway，面向多团队、预算隔离、成本追踪，需要 Python 环境和一定运维能力。FreeLLMAPI 是个人级、单用户、TypeScript、40MB 内存。两者不是竞争关系，是不同量级的工具，解决不同规模的问题。跟 One API（31.3k Stars）比，One API 定位是”运营一个 API 分发平台”，有用户体系、充值系统、中文管理后台。FreeLLMAPI 完全没有这些东西——它就是个你自己的本地代理，连多用户都不支持。

我花了两小时深挖 Issue 和 commit 历史之后，判断收窄了：这不是一个短期热度的营销项目。作者对边界的诚实、对 ToS 的逐条审查、对安全细节的用心（加密存储、统一 Token、内存解密），这些东西装不出来。但同时要承认，它的天花板就是它的定位——个人实验工具。你不会拿它跑生产，也不该拿。

趋势判断上，有两个信号。正向信号：commit 频率在加速，v0.3.0 从功能完善转向了商业模式探索，说明作者在认真考虑长期维护。风险信号：免费 tier 的可持续性完全不受项目控制。README 自己记录了 HuggingFace、Moonshot、MiniMax 的免费额度已被移除或转付费。你今天能用的 16 家，半年后可能只剩 10 家。这是最大的不可控变量。

还有一个我自己的观察：这个项目最大的价值可能不是聚合免费额度本身，而是它提供了一种思维方式的转变。单独看每个免费 tier 都是玩具，但组合起来能覆盖原型开发 80% 的需求。如果你的 AI 应用在免费聚合网关下跑不通，那大概率不是额度的问题，是你的设计假设有问题——你过度依赖了某个特定模型的能力。

资源地址

资源	地址
GitHub	https://github.com/tashfeenahmed/freellmapi
安装脚本	https://freellmapi.co/install.sh

聊完了，你该干嘛

如果你现在手上已经有五六个免费 API Key 在吃灰，今晚花 10 分钟装一个。把 Key 扔进去，把你的 AI 应用的 base_url 改到 localhost:3001，看看效果。大概率比你现在手动切 Key 的体验好。

如果你还在观望，关注两个指标：一是 contributor 数量能不能突破 50（降低 Bus Factor 风险），二是 Premium 商业化的进程会不会影响开源版的更新速度。第二点尤其关键。太多开源项目在加了付费 tier 之后，免费版变成了二等公民。FreeLLMAPI 目前没这个苗头，但值得持续观察。

免费 LLM API 这件事，单独用是鸡肋，堆起来用是杠杆。这个项目帮你把杠杆架好了。

{{userData.name}}已认证

FreeLLMAPI ：1 个端点，16 家免费 AI，每月 17 亿 token

打动我的几个地方

上手什么感觉

什么时候用，什么时候别用

社区怎么样了

我的真实看法

资源地址

聊完了，你该干嘛

装了 RTK 之后我才意识到之前浪费了多少 Token

Anthropic-Cybersecurity：不是安全工具，是 754 个安全专家的脑子

Anthropic-Cybersecurity：不是安全工具，是 754 个安全专家的脑子

OpenClaw 创始人吹的 Loop 工程到底是个撒？不用写提示词了？