传统数据中心过去主要用于数据的存储、检索与处理。但在生成式 AI 与代理式 AI 时代,这些设施已演变为 AI Token 工厂。随着 AI 推理成为其核心工作负载,它们的主要产出已转变为以 Token 形式制造的智能。
这一转变也需要对包括总体拥有成本(TCO)在内的 AI 基础设施的经济效益评估的方式相应地进行调整。然而,在评估 AI 基础设施时,企业仍过于关注芯片峰值规格、计算成本,或每美元所能获得的浮点运算性能,即每美元 FLOPS。
关键区别在于:
算力成本是企业为 AI 基础设施所支付的费用,无论是从云服务提供商租用,还是在本地自建部署。
每美元 FLOPS 衡量的是企业每投入一美元所获得的原始算力,但原始算力并不等同于现实世界中的 Token 产出。
每 Token 成本指的是企业生成并交付每一个 Token 的综合成本,通常以每百万 Token 成本来表示。
前两者仅是投入指标。但当业务围绕产出运转时,只针对投入优化,本质上是一种根本性的错配。
每 Token 成本决定了企业能否实现 AI 的规模化盈利。它是唯一能够直接综合反映硬件性能、软件优化、生态系统支持以及实际利用率的 TCO 指标,而 NVIDIA 在这一指标上实现了行业最低的每 Token 成本。
能够降低每 Token 成本的因素有哪些?
要理解如何优化每 Token 成本,首先需要了解用于计算“每百万 Token 成本”的计算公式。
在这个公式中,许多评估 AI 基础设施的企业往往只关注分子项,即每 GPU 每小时成本。对于云部署而言,这对应支付给云服务提供商的小时费用;而对于本地部署,则是通过摊销自有基础设施得到的等效小时成本。然而,降低每 Token 成本的关键在于分母,即最大化实际交付的 Token 产出。
这个分母传递了两层商业含义:
最小化每 Token 成本:当 Token 产出增加被代入公式时,将降低每 Token 成本,从而提升每一次交互服务的利润空间。
最大化收入:每秒交付更多 Token,也意味着每兆瓦产出更多的 Token,这将带来更高的智能供给能力,使 AI 驱动的产品与服务能够在相同基础设施投入下创造更高收入。
因此,如果只关注分子,就会忽视真正决定分母的因素。可以将其理解为一个“推理冰山”:分子位于水面之上,直观可见且易于横向比较;而分母则隐藏在水面之下,那才是决定实际 Token 产出的关键因素。对 AI 基础设施的准确评估,应从探究水面之下的部分开始。
表层问题:
每 GPU 小时的成本是多少?
峰值 PetaFLOPS 性能和高带宽内存容量是多少?
每美元可获得多少 FLOPS?
深度成本分析:
每百万 Token 的成本是多少?尤其是针对大规模混合专家(MoE)推理模型(当前部署最广泛的一类 AI 模型),其每百万 Token 成本是多少?
每兆瓦可交付多少 Token 产出?尤其是对本地部署而言,由于在土地、电力与基础设施上的资本投入较大,最大化每兆瓦所产生的智能产出至关重要。
纵向扩展(scale-up)互连是否能够支撑 MoE 模型所需的“all-to-all”通信模式?
是否支持 FP4 精度?推理栈是否能够在保持高精度的同时充分利用 FP4?
推理运行时是否支持投机解码或多 Token 预测,以提升用户交互体验?
服务层是否支持解耦服务、KV 感知路由、KV 缓存卸载以及其他优化?
平台是否支持代理式 AI 的独特工作负载需求,包括超低延迟、高吞吐以及长输入序列长度等?
平台是否支持从训练、后训练到大规模推理的完整生命周期,并覆盖所有模型架构,从而实现基础设施可互换性与高利用率?
这些算法、硬件与软件化中的每一项优化都必须有效并且是可以相互集成的,否则分母项将无法成立。一块看似“更便宜”的 GPU,如果其每秒 Token 产出数量明显更低,反而会导致更高的每 Token 成本。能够做到全栈真正优化的 AI 基础设施,才能够确保每项优化都相互增强,从而持续提升整体效率。
为什么每 Token 成本比每美元 FLOPS 更重要?
以下 DeepSeek-R1 AI 模型的数据展示了理论指标与实际商业结果之间的差异。
仅从算力成本来看,NVIDIA Blackwell 平台的成本似乎约为 NVIDIA Hopper 的 2 倍,但算力成本并不能说明这项投入究竟能带来多少实际产出。如果仅以每美元 FLOPS 进行分析,相较于 NVIDIA Hopper 架构,NVIDIA Blackwell 仅有约 2 倍优势。然而,实际结果却呈现出数量级差异:Blackwell 每瓦的 Token 产出量是 Hopper 的 50 倍以上,每百万 Token 的成本降低至其 1/35 左右。 
注:数据来源于 NVIDIA 分析报道及 SemiAnalysis InferenceX v2 基准测试。
这一悬殊差异表明,相较于上一代 Hopper,NVIDIA Blackwell 在商业价值上实现了巨大的跃迁,其提升幅度远超系统成本的增加。
如何选择合适的 AI 基础设施?
仅凭算力成本或每美元理论 FLOPS 来比较 AI 基础设施,不仅是不充分的,也无法真实反映推理经济学。正如数据所展示的,要准确评估 AI 基础设施的营收潜力与盈利能力,需将衡量维度从输入指标转向每 Token 成本和实际 Token 产出量。
NVIDIA 通过在计算、网络、内存、存储、软件以及合作伙伴技术上的极致协同设计,实现了业内最低的 Token 成本与最高的 Token 吞吐量。此外,诸如 vLLM、SGLang、NVIDIA TensorRT-LLM 以及 NVIDIA Dynamo 等基于 NVIDIA 平台构建的开源推理软件的持续优化,意味着在现有 NVIDIA 基础设施部署后,Token 产出仍可不断提升,每 Token 成本会持续下降。
领先的云服务提供商与 NVIDIA 云合作伙伴,已在规模化部署中充分体现这一优势。包括 CoreWeave、Nebius、Nscale 与 Together AI 在内的合作伙伴,已部署 NVIDIA Blackwell 基础设施,并对其技术栈进行了优化,为企业提供当前最低的 Token 成本,同时充分发挥 NVIDIA 在硬件、软件与生态系统协同设计方面的全部优势,使每一次 AI 交互的处理都建立在这一完整体系之上。
为你推荐
资讯 这家药企停牌,ST,面临退市风险
6月10日晚间,湖南南新制药(688189 SH)发布公告,公司于6月9日收到中国证监会湖南监管局出具的《行政处罚事先告知书》(〔2026〕6号)。公司涉嫌信息披露违法违规行为被依法...
2026-06-10 22:27
资讯 凯思凯迪完成 3.18 亿元 D 轮融资,加码胆汁酸代谢赛道,加速全球首创肝病创新药临床落地
本轮融资由太平医疗健康基金、上海科创集团联合领投,粤开资本、昭德投资、涟邦基金等多家专业医疗投资机构跟投
2026-06-10 18:56
资讯 诺华泰菲乐联合迈吉宁新适应症获批,为BRAF V600E突变阳性RAIR-DTC患者带来精准治疗新选择
用于治疗BRAF V600E突变阳性、放射性碘难治或不适用、且血管内皮生长因子酪氨酸激酶抑制剂(VEGFR-TKI)治疗失败的局部晚期或转移性分化型甲状腺癌成人患者。
2026-06-10 18:08
资讯 3个项目完成首批生物医学新技术临床研究备案
6月8日,中国生物技术发展中心发布生物医学新技术临床研究备案完成项目清单(第1批),自5月1日《生物医学新技术临床研究和临床转化应用管理条例》正式生效以来,5月1日至5月22...
2026-06-10 17:51
资讯 35.7亿元!来凯医药PI3Kα抑制剂达成达成海外BD
来凯医药将授予Vasque Bio LAE118在全球范围内(不含中国大陆、中国香港、中国澳门、中国台湾地区)的独家开发、生产制造及商业化权益,全权负责该药物海外市场的全流程研发与...
2026-06-10 14:28
资讯 腾讯、阿里等入股脑机接口企业阶梯医疗,博睿康完成上市辅导
公开资料显示,近日上海阶梯医疗科技有限公司发生工商变更,新增阿里巴巴关联公司杭州灏月企业管理有限公司、腾讯关联公司上海启善投资有限公司等为股东,同时注册资本由100万元...
2026-06-10 10:06
资讯 药明康德、诺禾致源等被美国列入“中国军工企业”名单
今日,药明康德发布公告称,公司注意到,2026年6月8日(美国时间),美国国防部错误地将药明康德列入其根据1260H条款认定的“中国军工企业”正式更新版名单中。
2026-06-09 21:24
资讯 微眸医疗完成近亿元A轮融资,全国首个眼科手术机器人多中心随机对照注册临床试验同期收官
本轮A轮融资由元航资本领投,老牌投资机构明桂资本持续加码追投,多家行业知名投资机构联合参与投资,伊嘉资本担任本次融资财务战略合作伙伴。
2026-06-09 20:20
资讯 礼来公布口服小分子GLP-1 药物关键研究完整数据,潜在T2D新口服方案表现亮眼
礼来公司在美国糖尿病协会(ADA)第86届科学年会上公布了口服小分子GLP-1受体激动剂orforglipron在ACHIEVE系列三项3期临床研究中的详细数据。
2026-06-09 19:57
资讯 因美纳发布StrataMap Spatial Solution:高性能的端到端空间全转录组研究解决方案
StrataMap Spatial支持研究人员以真正的单细胞分辨率开展空间生物学研究,拓展科学发现的边界
2026-06-09 19:52
资讯 两款IgA肾病新药获批
6月9日,荣昌生物发布公告称,近日,荣昌生物制药(烟台)股份有限公司收到国家药品监督管理局(NMPA)核准签发的《药品注册证书》,泰它西普注射液(代号:RC18)治疗免疫球蛋...
2026-06-09 11:33
资讯 第五年,2026年纠正医药购销领域和医疗服务中不正之风工作要点
《通知》围绕年度重点任务和既往工作中发现的突出问题,聚焦重点领域和关键环节,在坚持党建引领行风、强化医德医风建设、加强正向宣传引导、防范化解风险隐患、严守医疗数据安...
2026-06-09 09:14
资讯 华超神控完成亿元天使系列融资,自研 AI 超声脑机平台开辟无创深脑调控新赛道
本轮融资分为天使轮与天使 + 轮两期,天使轮由经纬创投独家领投,天使 + 轮由德联资本、道远资本联合领投,行业知名机构持续加注,循光资本担任本次系列融资独家财务顾问。
2026-06-08 17:05
资讯 Cytiva与鼎康生物合作GMP-2扩建项目投产, 共筑“中国速度,全球交付”新标杆
GMP-2生产基地专为临床后期及商业化生产打造,可为全球生物药合作伙伴提供灵活且可扩展的生产解决方案,助力加速产品商业化进程并保障全球稳定供应。
2026-06-08 16:41
资讯 默沙东欣瑞来(注射用索特西普)重磅上市,引领肺动脉高压(PAH)迈向“治本” 新里程碑
用于治疗世界卫生组织功能分级(WHO FC)Ⅱ-Ⅲ级的肺动脉高压(PAH,WHO第1组)成年患者
2026-06-08 16:36
资讯 GCP2026修订版发布,2020版废止
6月8日,国家药监局、国家卫生健康委、国家中医药局、国家疾控局联合发布《药物临床试验质量管理规范(2026年修订)》,自2026年9月1日起施行。国家药监局、国家卫生健康委《关...
2026-06-08 16:21
资讯 博腾股份终止斯洛文尼亚研发生产基地建设,保留对诺华子公司主张索赔的权利
近日,博腾股份公告称,鉴于诺华斯洛文尼亚子公司已向博腾股份全资子公司PSI发出解除通知,PSI在该场地内的投资和建设已面临重大不确定性,公司决定终止投资建设斯洛文尼亚研发...
2026-06-08 13:10
资讯 全球首款CD7 CAR-T儿童适应症一期临床启动
据安科生物和博生吉医药消息,安科生物参股公司博生吉医药自主研发的全球首款进入临床阶段的靶向CD7自体CAR-T产品PA3-17儿童适应证临床试验启动会在组长单位中国医学科学院血液...
2026-06-08 10:57






