当 OpenAI 将 2030 年算力支出目标从 1.4 万亿美元下调至 6000 亿美元,当国内头部 AI 公司纷纷削减自有 GPU 采购预算,整个行业正在经历一场悄无声息的算力革命。过去两年间,超过 50% 的 AI 企业选择以租赁方式获取算力,而中信证券预测,未来三年国内 80% 的 AI 公司将彻底放弃 GPU 自主采购,全面转向按需租赁与 Token 调用模式。这场从 "重资产持有" 到 "轻资产使用" 的转变,正在重塑 AI 产业的底层商业逻辑。
弃购背后的多重困境
AI 企业放弃大规模显卡采购,并非一时冲动,而是多重现实压力下的理性选择。
最直接的挑战来自成本结构的失衡。一台搭载 8 张 H100 的服务器采购成本超过 200 万元,加上机房建设、电力消耗和运维团队开支,年运营成本可达数百万元,而设备年折旧率高达 30%。更棘手的是硬件价值的快速贬值,A100 在二级市场的价格一年内下跌近 60%,买断者不得不承担全部技术迭代风险。对于多数 AI 公司而言,这种重资产模式已难以为继,某独角兽企业基础设施负责人坦言:"我们购置的 GPU 集群,有近 40% 的算力在非高峰时段处于闲置状态,这相当于每天白白烧掉数十万元。"
技术迭代的加速进一步放大了持有风险。英伟达每 18 个月推出新一代架构,使得旧卡性能迅速落后,而 AI 模型对算力的需求却在指数级增长。同时,算力需求的波动性让固定采购模式陷入两难:为峰值需求准备的算力在常态下闲置,而突发需求又无法通过自有资源满足。某电商平台在大促期间需临时扩容 200% 的 AI 客服算力,这种弹性需求是自有集群难以匹配的。
更深层的矛盾在于算力使用效率的瓶颈。多数企业自建集群的 GPU 利用率仅维持在 30%-50%,而专业算力服务商通过精细化调度可将利用率提升至 90% 以上,这种效率差距直接转化为 40%-60% 的成本差异。当 AI 竞争从 "算力规模" 转向 "投入产出比",这种资源错配已成为企业发展的沉重负担。
按需 GPU 租赁:从 "持有" 到 "使用" 的范式转换
按需 GPU 租赁模式的崛起,为 AI 企业提供了摆脱硬件束缚的可行路径。这种模式将算力从固定资产转变为弹性服务,企业无需承担采购、部署、运维等重资产投入,只需根据实际需求灵活调用资源。
从成本结构看,租赁模式带来的改变是颠覆性的。单台 A100 40GB 按需租用日均成本约 180 元,较自建集群降低 52%,而 H100 按需计费低至 1 元 / 卡时。某医疗 AI 初创公司通过租赁 10 张 RTX 4090,在 3 个月内完成 3D 医学影像分割模型研发,硬件投入较计划降低 70%。更重要的是,租赁模式将固定成本转化为可变成本,使企业能够根据业务周期灵活调整算力支出,在行业寒冬中保留更多现金流。
灵活性的提升同样显著。专业算力平台可在 15 分钟内完成百卡级集群部署,满足突发算力需求,而自建集群通常需要数周时间。这种即时扩容能力对于大模型训练、自动驾驶仿真、电商大促等场景至关重要。同时,租赁模式让企业能够快速测试不同硬件配置,根据模型特性选择最优算力组合,无需被锁定在单一架构上。
运维压力的释放成为另一个关键优势。AI 算力集群的维护涉及硬件故障处理、驱动更新、散热优化等复杂工作,一个百卡规模的集群通常需要 3-5 人的专业团队。租赁模式将这些工作转移给服务商,使企业能够专注于核心的算法研发和应用创新。
Token 调用:算力服务的精细化升级
如果说按需租赁解决了 "用不用" 的问题,那么 Token 调用模式则回答了 "用多少" 的精确计量难题。这种将底层算力封装为可计量、可定价的智能服务模式,正在成为 AI 算力市场的新主流。
Token 调用的核心是将算力消耗与模型实际使用深度绑定。用户不再需要关心服务器型号、驱动版本或 Docker 命令,只需根据输入输出的 Token 数量支付费用,用多少扣多少,秒级启停,即用即走。一次包含 100 个输入 Token 和 50 个输出 Token 的对话,按 0.001/1K Token 的费率计算,仅需支付 0.00015 元,在低频场景下较固定租赁可节省 90% 以上成本。
这种模式的爆发有其必然性。国家数据局披露,2024 年初我国日均 Token 调用量约 1000 亿,2025 年底跃升至 100 万亿,2026 年 3 月进一步突破 140 万亿,两年间增长超过 1000 倍。当 AI 应用从实验室走向大规模商用,按 Token 计费成为连接算力供给与应用需求的最佳桥梁,它将算力成本精确分摊到每一次模型调用中,使 AI 服务的定价更具弹性和合理性。
Token 调用正在推动算力服务从 "卖硬件" 向 "卖能力" 升级。黄仁勋在 GTC 2026 上将 "Tokenomics" 定为核心主题,按 Token 消耗分成正成为行业新标准。算力平台与 AI 企业不再是简单的租赁关系,而是通过模型调用量分成实现深度绑定,收入与 AI 应用活跃度直接挂钩,从 "一锤子买卖" 变为 "长期现金流"。这种模式下,算力服务商的核心竞争力从硬件资源转向资源整合与生态协同,其长期价值量有望超越传统租赁模式。
行业重构:从算力军备竞赛到效率比拼
算力获取方式的转变正在引发 AI 行业的连锁反应,重塑产业格局与竞争规则。
首先是成本结构的优化带来行业门槛的降低。轻资产模式使更多中小企业能够参与 AI 创新,无需承担巨额硬件投入即可使用顶级算力。某 AI 创业公司创始人表示:"租赁模式让我们能用原本 1/3 的预算完成模型训练,使我们能够将更多资金投入算法优化和市场拓展,这在以前是不可想象的。" 这种普惠效应正在加速 AI 技术的民主化进程,推动创新从头部企业向全行业扩散。
其次是算力市场的专业化分工。随着大型科技公司减少自有算力建设,专业算力服务商迎来发展机遇,市场规模快速扩张。2026 年 AI 算力租赁市场规模预计达 2600 亿元,其中高端 GPU 出租率超过 90%,供需缺口持续存在。同时,算力服务正在从单一硬件租赁向 "算力 + 运维 + 调度 + 技术支持" 的一体化服务升级,盈利模式从硬件租金转向综合服务费,盈利弹性显著提升。
更深层的变化在于行业竞争焦点的转移。过去 AI 行业比拼的是 "谁的 GPU 多",而现在转向 "谁能更低成本、更稳定地生产和调度 Token"。这一转变迫使企业重新审视技术路线,从追求算力规模转向提升算力利用效率、优化模型结构和算法创新。OpenAI 等头部企业已开始通过模型压缩、量化技术和推理优化,在保持性能的同时降低 Token 消耗,这种效率导向的思维正在成为行业共识。
算力租赁直达:GPU算力租赁 - 云擎技术-数据中心,算力租赁,大带宽专线,数据传输,云专线,城域网,算法备案,大模型备案,增值电信许可证