火山引擎在近期一场行业活动中宣布,旗下豆包大模型的日均Token使用量已突破120万亿,较发布初期增长千倍,仅用三个月便实现翻倍。这一数据背后,是企业级客户对AI服务付费意愿的显著提升——累计Token使用量超万亿的企业客户数量在三个月内从约100家增至140家,个人用户Token消耗量近一个月暴增16倍。更值得关注的是,智谱AI在同期发布的财报显示,其2025年全年收入超7.24亿元,MaaSAPI平台年度经常性收入(ARR)突破17亿元,注册用户覆盖全球218个国家和地区,印证了中国AI市场从“免费试用”向“规模化付费”的转型成功。
AI应用场景的爆发是推动Token消耗激增的核心动力。以字节跳动自研的视频生成模型Seedance2.0为例,该模型因承担2026年春晚《贺花神》《驭风歌》的视觉特效制作而广受关注,但其高需求也导致排队时长一度达7小时,高峰期超9万人等待。生成1分钟720p视频需消耗超100万Token,是文本对话的百倍以上,但成本较传统影视制作降低70%,效率提升逾一倍。另一典型场景是智能体技术,升级后的ArkClaw可对接飞书、微信等工具,自主完成跨平台协作,单次企业任务消耗数十万至百万Token。中信证券测算,智能体普及使整体Token消耗提升十倍以上,算力需求增长百倍,形成“应用-Token-模型优化”的良性循环。
中国AI模型的商业化优势源于成本与性能的双重突破。电力成本方面,中国西部绿电价格仅为美国的1/4至1/5,结合MoE架构、极致量化等技术,推理成本被压缩至美国模型的1/6至1/10。以API定价为例,中国头部模型的输入成本普遍在0.11-0.3美元/百万Token,输出成本0.44-2.55美元/百万Token,而美国ClaudeOpus4.6的输入输出成本分别高达5美元和25美元。尽管性能差距已缩小至5%以内,中国模型仍以“够用、好用、便宜”的特点占据全球开发者市场——OpenRouter平台数据显示,中国大模型周Token调用量占比达61%,远超美国开发者占比6.01%的表面数据,全球前九大模型中中国占据五席,包揽前四名。
国际巨头的压力与行业分层格局逐渐显现。OpenAI的ChatGPT网页流量份额从2025年1月的86.7%暴跌至2026年1月的64.5%,月活用户环比下降6.5%,运营亏损扩大至140亿美元;Google的AIStudio开发者流失25%,被迫推出低价版GeminiFlash,成本仍为中国模型的三倍;xAI的Grok虽份额增至3.4%,但性能与成本均缺乏竞争力。市场分析认为,未来全球AI市场将形成“美国守高端、中国占大众”的分层格局:美国模型聚焦专业推理、品牌溢价与企业安全,服务20%高端用户并获取80%收入;中国模型凭借性价比优势覆盖80%大众市场,虽仅分得20%收入,但规模化效应仍能支撑头部企业持续扩张。
算力需求的爆发倒逼技术迭代,硅光子成为关键赛道。传统铜缆互联在万卡集群中损耗70%算力,无法满足视频与智能体的高带宽需求,而硅光子技术可提升带宽10-100倍,降低功耗70%,延迟减半。英伟达近期密集布局:3月初向Lumentum和Coherent投资40亿美元,锁定1.6T/CPO核心原材料;3月底再投20亿美元至Marvell,开放NVLinkFusion互联协议。全球EML光芯片需求预计达3.5亿颗,但2026年产能仅2亿颗,缺口持续至2028年,推动相关企业股价年内数倍增长。这一趋势表明,光通信领域将成为AI竞赛中弹性最大的增量市场。
中国AI的全球化红利期至少可持续3-5年,三大壁垒构成护城河:其一,能源壁垒,“东数西算+西部绿电”体系使中国绿电成本长期低于0.3元/度,美国难以复制;其二,规模壁垒,Token调用量越大单位成本越低,形成“规模-成本-规模”的闭环;其三,生态壁垒,中国开源大模型下载量全球第一,阿里通义千问Qwen累计下载超7亿次,衍生模型超18万个,开发者迁移成本高昂。这些因素将支撑中国大模型在2028年前主导全球普惠AI市场,推动“数字石油”时代全面到来。

