Token经济学七问——一份关于AI新经济的入门地图

Token经济学七问——一份关于AI新经济的入门地图

白惠天、袁晓辉 腾讯研究院

 

2026年3月31日,OpenAI宣布完成新一轮融资,同时披露了一个重要数据:用户每分钟调用API接口的Token量超过了150亿,这样计算下来一天是21.6万亿。1
刚好在几天前,中国国家数据局公布,中国日均Token调用量突破140万亿,两年增长1400倍。2
Token是什么?简单说,它是AI处理和生成信息的基本单位——你向AI提一个问题,消耗一些Token;AI给你一个回答,生成一些Token。一个Token大约对应一到两个汉字,具体因模型而异。
为什么要关注Token?因为它让AI变成了一种可以计量、定价和交易的资源——就像“千瓦时”让电力有了价格,“桶”让石油有了期货市场。有了Token,AI经济就有了可以算账的单位。围绕这个单位,目前也正在形成一套全新的经济逻辑:有价格、有供需、有产业链、有国际竞争、有待解决的制度难题。
这就是Token经济学要讨论的事。而以下七个问题,试图为这个正在成型的新经济体系画一张地图。
Token经济学的产业背景
Token经济学不是凭空冒出来的学术概念,它有一个很具体的产业背景。
2026年3月,英伟达CEO黄仁勋在GTC大会前发表了一篇署名文章,标题叫AI Is a Five-Layer Cake(《AI是一个五层蛋糕》)。他把AI产业拆成五层:能源、芯片、基础设施、模型、应用。前三层合起来叫AI工厂,核心功能是制造智能。3后两层中,模型层是智能的载体,应用层让智能发挥价值。
Token经济学七问——一份关于AI新经济的入门地图
 
来源:英伟达官方博客,Jensen Huang署名文章(2026.3.10),笔者翻译绘制。
贯穿五层的统一计量单位就是Token,英伟达对Token的定义是:Token是现代AI(生成式AI)的基本单位,也是AI的语言和货币。4AI工厂的关键经营指标——吞吐量、单位成本、每瓦产出、每兆瓦收入——全部围绕Token展开。
五层蛋糕回答的是在产业链中哪里能赚到钱,Token概念回答的是这个产业用什么单位来计算效率、成本和收入。这些概念合在一起,构成了AI产业经济的分析框架。
需要说明的是,这里说的Token本质是AI计算和服务交付的计量单位,不是指区块链上的可交易资产,所以Token经济也不是加密货币世界的Tokenomics。
Q1. 全球一天消耗多少Token?
我们先看一组数字,建立量级感。
OpenAI的API每分钟处理150亿Token,折算一天约21.6万亿。
谷歌2025年9月披露,Gemini每月处理1300万亿Token,日均约43万亿。
而中国国家数据局2026年3月的数字是:日均140万亿——大致相当于OpenAI和谷歌之和的三倍。
两年前,中国的日均Token调用量还只有1000亿。两年,翻了1400倍。
140万亿Token是什么概念?粗略折算,相当于每天生成约2000亿篇千字文章。全中国14亿人,人均每天”消费”上百篇AI生成的千字内容。当然实际不是这么算的——大量Token消耗来自企业级API调用、智能体运行和模型间交互——但这个量级本身就说明问题。
摩根大通预测,中国AI推理Token消耗将从2025年的约10千万亿增长到2030年的3900千万亿,五年再涨370倍。5
我们现在看到的,可能只是开胃菜。
Q2. 一个Token能创造多大的价值?
并非所有Token生而平等。
同样一个Token,用来闲聊的,百万个值0.01美元,用来写代码值200美元,用来做法律文档审阅的,值1000美元,价值差了十万倍。
Token经济学七问——一份关于AI新经济的入门地图
数据来源:Litowitz et al. (2026);Bergemann et al. (2025);各厂商API定价页。
为什么?因为Token有一种此前生产要素不具备的属性:可编程性。同一个底层模型,接收不同的prompt,可以变成翻译、程序员、律师、科学家——直接产出不同价值的智力成果。钢铁做不到这一点,石油做不到,甚至电力也做不到。没有任何一种传统生产要素,能仅凭”指令不同”就改变自身价值百千倍。
耶鲁大学Cowles基金会的Bergemann等人精确地捕捉到了这个特征:Token是可合同化的计量单位——数量可精确计量,但价值完全取决于它被编程做什么。6这产生了一个反直觉的现象:不到5%的Token消耗,创造了超过80%的可测量价值。
所谓平均Token价格,就像用平均房价来描述一个既有茅草屋又有摩天楼的城市——数字正确,但毫无意义。
这种价值分层已经体现在宏观数据中。Collis和Brynjolfsson(2025)估算,生成式AI在2024年仅为美国消费者创造的消费者剩余就高达约970亿美元——用户从AI中获得的价值,远超过他们实际支付的金额。7而这些剩余价值,绝大部分集中在高价值应用场景。
理解这一点至关重要。Token的价值不取决于它的生产成本,而取决于它被用来做什么。这是理解后面所有问题的前提。
Q3. 生产一个Token要花多少钱?
生产一个Token的价格是不同的,取决于你用什么模型、做什么任务。
用轻量模型处理简单问题,比如GPT-4o-mini回答一句闲聊,消耗掉的电力约为0.03瓦时——比LED灯泡亮一秒钟还少。而用最强的推理模型做深度分析,比如GPT-5处理一个复杂的科学问题,,能耗可以高达18瓦时——是轻量模型的600倍。也就是说,同一家公司的不同模型之间,生产Token的成本就能差出几百倍。
为什么差这么多呢?三个因素:一是模型大小,参数越多,生成每一个Token需要的计算量越大;二是任务复杂度,新一代推理模型在输出每一个可见Token之前,会在内部进行大量隐式推演,相当于想了几十步才说一个字。用户看到一个Token,模型内部可能已经生产了上百个。单个可见Token的成本,被思考过程成倍放大了。也就是说,光是生产端,同一家公司不同模型之间的Token成本,就能差出几百倍。
但总体趋势是清晰的:Token在飞速变便宜。
Token经济学七问——一份关于AI新经济的入门地图
数据来源:Epoch AI (2025);NavyaAI (2026);Tom’s Hardware / 罗德岛大学AI实验室 (2025);各厂商API定价页。
2022年,调用GPT-3级别模型需要60美元/百万Token。到2026年初,同等能力的开源模型只要0.06美元——降了99.9%。驱动降价的是三股力量的相乘效应:硬件效率每年提升2-3倍,算法效率每年提升2-3倍,系统优化每年再提升2-4倍。三者相乘,Token成本每年下降5-10倍。同样规模的模型,从上一代GPU换到新一代,每个Token的能耗就能下降约10倍。
但这里有一个反直觉的事实:Token越便宜,全世界在Token上花的钱反而越多。
2022-2026年间Token单价降了99.9%,但同期全球企业AI云支出从115亿美元涨到了370亿美元,翻了三倍多。为什么降价却没省钱?经济学家对此不会感到意外——这是经典的杰文斯悖论:当一种资源的使用效率大幅提升,总消耗量不降反升,正如蒸汽机效率提升后,煤炭消耗不降反升一样。Token价格的下降,将原本被成本约束抑制的潜在需求大规模释放出来。当Token价格是60美元/百万时,只有金融分析、药物发现这些最高价值的任务用得起。当价格降到0.06美元时,代码审查、实时客服、个性化教育、甚至AI角色扮演都变得经济可行了。每个新场景都是新的Token消耗。
而且故事还有更深一层:单个Token的生产成本在持续下降,但单个答案的成本可能在上升——因为更好的答案需要调用更多Token、更大的模型、更深的推理。用户买的不是Token,是答案。所以更好的答案消耗更多的Token,也消耗更多的电。
Q4. 为什么突然全世界的Token都不够用了?
在第一个问题中我们看到了Token消耗的疯狂增长——中国两年增长1400倍。但增速背后还有一个拐点:就是从人用AI,到AI自己用AI。
过去两年,Token需求增长主要靠两个驱动力:一是C端用户习惯养成,比如ChatGPT和元宝等成为日常工具,二是企业把大模型嵌入业务流程,比如客服、代码审查和数据分析等。但这两个驱动力都有一个共同的天花板——人脑。人一天能读多少字,能处理多少信息是有上限的。无论AI多便宜,人的注意力和带宽是固定的。
2025年底开始,一种叫智能体(Agent)的新东西改变了这个格局。
智能体不是聊天机器人——它是能自主执行任务的AI程序。你给它一个目标,比如帮我订最便宜的机票,它自己去搜索、比较、填表、付款。整个过程中,它在不断调用大模型、消耗Token,完全不需要人类注意力参与。
一个企业部署1000个智能体,每个智能体每天消耗100万Token,一年就是3650亿Token。这相当于一个中等国家所有人类用户的总消耗量。8
Token经济学七问——一份关于AI新经济的入门地图
数据来源:Stanford HAI (2025);Jones, C.I. (2026);Anthropic/OpenAI产品发布。
图中三个阶段:人类用户驱动(注意力为天花板)→ 人+智能体共存 → 智能体主导(机器消费远超人类)。红点为当前位置。
更值得关注的是,智能体不只消耗Token——已经有实验项目让智能体拥有自己的账户,自主接任务、赚收入、再用收入购买更多Token。AI正在从工具变成经济主体。
这带来了全新的问题:智能体的收入算谁的?它签的合同有没有法律效力?它造成的损失谁来承担?9
Token需求的下一波暴涨,不再来自人类用得更多,而来自机器自己开始消费。
这些新的模式其实已经在浮现,智能体越来越多的落地和应用,也解释了为什么突然间全世界的Token都不够用了。
Q5. 中国的Token和美国的有什么不一样?
2026年初,一件事让硅谷措手不及:在OpenRouter上,中国模型的Token调用份额已经超过60%。DeepSeek、Kimi、Qwen系列在性价比排行榜上碾压了大量美国竞品。
Token经济学七问——一份关于AI新经济的入门地图
数据来源:OpenRouter Rankings (2026.3);Artificial Analysis模型基准测试。
核心驱动力是算法创新。DeepSeek V3采用的混合专家架构(MoE)让同等能力的推理成本下降了一个数量级——大模型里有多个专家子模块,每次推理只激活其中一小部分,既保留能力又大幅降低成本。10
有人把这称为“Token出海”。但这里有一个常见的误读需要厘清。
在海外平台上提供服务的中国模型,其推理计算通常部署在海外云节点,如新加坡、美国,而非中国境内的数据中心。所谓Token出海,更准确的说法是中国的AI算法在出海,而不是中国的电力在出海。
中国Token的真正竞争优势在三个方面:第一,算法效率——MoE架构、量化技术等创新让单位算力的Token产出远高于同行;第二,开源策略——DeepSeek、Qwen的开源版本吸引了全球开发者,形成了生态飞轮;第三,极致定价——中国厂商愿意以接近成本价来换市场份额。
对全球Token市场来说,中国模型的加入大幅加速了Token价格的下降。竞争越激烈,Token越便宜,最终受益的是全球所有开发者和用户。
Q6. Token有哪些卖法?
Token经济中已经出现了三种截然不同的商业模式:
第一种:按量计费。用多少Token收多少钱。OpenAI的API、Anthropic的Claude API都是这个模式。好处是简单透明,问题是用户为了省钱会刻意减少调用。11
第二种:包月订阅。ChatGPT Plus每月20美元,不按Token计数。这让用户不再纠结每次调用的成本,使用量通常比按量计费高5-10倍。订阅制的本质是让用户形成习惯——一旦AI成为工作流的一部分,退订的概率就很低。
第三种:按价值收费。不按消耗了多少Token收费,而按创造了多少价值收费。比如AI帮你发现了一个合同漏洞,避免了1000万的损失,收你10万。这种模式的利润率可以高到夸张,但前提是你能可靠地衡量AI创造了多少价值。目前这仍然是最大的难题。
还有一种正在萌芽的模式:Token期货。企业预购未来的Token额度来锁定价格,就像航空公司对冲油价一样。12
当Token可以被期货交易的那一天,它就真正完成了从技术概念到经济基础设施的转变。
Q7. Token经济需要什么新规则?
每一代通用技术都会催生新的制度需求:铁路时代是反垄断法,电力时代是公用事业监管,互联网时代是数据隐私。Token经济也不例外,至少有三个问题需要回答。
第一,能耗治理。Token生产是吃电的。IEA预测,到2030年,全球数据中心用电量将翻倍。13
一次ChatGPT查询的耗电量约是一次搜索引擎查询的10倍。14如果Token消耗按当前速度增长,AI的碳足迹将成为气候谈判的新议题。
第二,跨境流动。上面的第五个问题已经展示了,中国模型通过海外平台服务全球用户。Token作为一种数字化的智力产品,不需要集装箱和海关,直接跨境交付15现有的贸易统计框架还没有一个分类能准确描述这种新型贸易。
第三,统计盲区。你用免费的ChatGPT写了一封完美的求职信,省下了500美元的职业顾问费——这500美元的价值被创造了,但在GDP中消失了。用传统GDP指标衡量Token经济,就像用体重衡量健康——能反映一部分信息,但遗漏了最重要的东西。
这三个问题也只是Token经济带来的众多挑战的代表,它们没有简单答案,但有一点是非常清楚的:制度建设的窗口从来都在技术爆发的早期,而不是在它已经重塑一切之后。移动互联网爆发时,流量计费、网络管理等基础规则,花了近十年才逐步成形,行业为此付出了大量试错成本。Token经济的演进速度远快于移动互联网,留给制度设计者的时间更短。
结语
七个问题,一条线索:Token正在从一个技术术语变成一种经济基础设施。
它的消耗量两年增长了1400倍。它的生产成本每年下降一个数量级,但全球总支出反而翻倍——160年前,杰文斯在煤炭上观察到的同一个悖论。它的需求正在从人类消费者扩展到智能体。它的跨境流动绕过了一切物理运输。
我们今天能观察到的,不过是这场变革的开头几页。
目前有一系列问题亟待研究:当智能体开始自主购买和消耗Token,非人类市场主体需要什么样的法律身份和金融基础设施?Token的跨境流动本质上是算力和智力的跨境流动,现有贸易统计和监管框架尚未覆盖。Token消耗正在成为衡量经济体AI化程度的核心指标——它能否像用电量、货运量一样,成为宏观经济的先行信号?
最后一个问题留给每个人自己:你现在的工作中,有多少环节可以被拆解为”输入信息、处理、输出结果”?凡是符合这个模式的标准化流程,迟早会被Token化。留给人类的,是判断、创意、关系和不确定性——恰恰是单纯依靠Token做不好的事。
腾讯研究院将持续关注Token经济学的前沿议题。欢迎学界、产业界和政策研究机构的同仁交流合作,共同推进这一新兴领域的认知深化。Token经济学七问——一份关于AI新经济的入门地图

参考文献:

[1] OpenAI. (2026.3.31). “Accelerating the Next Phase of AI.” openai.com. API处理量及融资数据
[2]新华网 (2026.3.26). 国家数据局局长刘烈宏在中国发展高层论坛披露
[3]NVIDIA Blog. (2026.3.10). “AI Is a 5-Layer Cake.” Jensen Huang署名文章。
[4]NVIDIA Blog. (2025). “Explaining Tokens — the Language and Currency of AI.”]
[5]OpenAI. (2026.3.31). 同前引。ChatGPT 9亿+周活、5000万+订阅用户。]
[6]同花顺 (2026.3.25). 引用JPMorgan AI推理Token消耗预测。
[7]Bergemann, D., Bonatti, A. & Smolin, A. (2025). “The Economics of Large Language Models.” Cowles Foundation DP 2425.] 
[8]Collis, A. & Brynjolfsson, E. (2025). “Measuring Consumer Surplus from Generative AI.” arXiv:2501.10547.
[9]Stanford HAI. (2025). AI Index Report 2025. Chapter 3: AI Agent发展。
[10]Jones, C.I. (2026). “A.I. and Our Economic Future.” Stanford GSB Working Paper. Section 5.
[11]OpenRouter Rankings (2026). 2026年3月30日数据。中国模型输入定价约0.3美元/百万Token,海外主流约5美元,相差约16倍。
[12]Bergemann, D., Bonatti, A. & Smolin, A. (2025/2026). “Menu Pricing of LLMs.” TSE WP 1670.]
[13]Xing, Y. (2026). “AI Token Futures Market: Commoditization of Compute.” arXiv, March.] 
[14]IEA. (2025). Energy and AI. Flagship Report.] 
[15]Lu, X. et al. (2026). “Empirical Lifecycle Assessment of Generative AI Inference Carbon Emissions.” UJSSH 5(1): 133-144.
[16] Korinek, A. & Vipra, J. (2024). “Concentrating Intelligence.” Economic Policy 40(121): 225-256.]

[17] Bergemann, D., Bonatti, A. & Smolin, A. 2025/2026. “The Economics of Large Language Models.” Cowles Foundation DP 2425; “Menu Pricing of LLMs.” TSE WP 1670.

[18] Collis, A. & Brynjolfsson, E. 2025. “Measuring Consumer Surplus from Generative AI.” arXiv:2501.10547.
[19] Cottier, B. et al. 2025. “LLM Inference Prices Have Fallen Rapidly but Unequally across Tasks.” Epoch AI.
[20] Gogerty, N. 2026. “Wright’s Law Extended: 150 Technologies.” SSRN WP 6198738.
[21] IEA. 2025. Energy and AI. Flagship Report, April.
[22] Jones, C.I. 2026. “A.I. and Our Economic Future.” Stanford GSB Working Paper.
[23] Korinek, A. & Vipra, J. 2024. “Concentrating Intelligence.” Economic Policy 40(121): 225-256.
[24] Litowitz, A., Polson, N. & Sokolov, V. 2026. “Photons = Tokens.” arXiv.
[25] Lu, X. et al. 2026. “Empirical Lifecycle Assessment of Generative AI Inference Carbon Emissions.” UJSSH 5(1): 133-144.
[26] Menlo Ventures. 2025. “The State of Generative AI in the Enterprise.” December.
[27] NavyaAI. 2026. “AI Cost Report: Token Prices vs AI Bill.” February.
[28] NVIDIA Blog. 2026. “AI Is a 5-Layer Cake.” March 10.
[29] NVIDIA Blog. 2025. “Explaining Tokens — the Language and Currency of AI.”
[30] OpenAI. 2026. “Accelerating the Next Phase of AI.” March 31.
[31] OpenRouter Rankings. 2026. openrouter.ai/rankings. Accessed March 30.
[32] Stanford HAI. 2025. AI Index Report 2025.
[33] Xing, Y. 2026. “AI Token Futures Market.” arXiv, March.
 
*本文为腾讯研究院”长文的春天”活动征文

 

推荐阅读

闫德利:《人工智能的生产率悖论》

王鹏:《AI时代,教育何往?》

Token经济学七问——一份关于AI新经济的入门地图

行业动态

Mythos 全面解读:Anthropic 最强模型发布

2026-4-9 11:07:17

行业动态

奥特曼爆冷改口:AGI没用?MIT预测2028年降临,50%概率

2025-8-16 14:46:29

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧