互联网大厂工程师林鸣曾是Cursor的忠实用户。一年多前,他主要用这款AI编程工具补几行代码或调整参数,大模型嵌入编辑器的设计让他能随时调用。如今,他的工具箱已换成Claude Code、Codex和公司自研工具——模型不再只是辅助,而是直接接入研发流程,能自主拆解需求、调用工具、跑测试并交付成果。这种转变让他可以将整块工作交给AI,但代价是token消耗量激增。公司一度提供几乎不限量的额度,随着成本压力显现,工程师们开始自费订阅工具,林鸣便是其中一员。
开发者自掏腰包的背后,是一个已显现规模的市场。Anthropic凭借Claude Code率先抓住机遇:尽管用户量远不及OpenAI,但其估值因开发者付费和企业采购的双重驱动已接近万亿美元。OpenAI迅速调整策略,将Codex的地位提升至核心位置,半年内周活跃用户增长超7倍,突破500万。国内智谱则以低价策略切入,其GLM5.2模型软件工程能力接近Claude Opus 4.8,但定价仅为后者的七分之一。这种“用预期换市场”的打法,让这家2025年净亏损47亿元的公司市值一度突破万亿港元。
大模型商业化正迎来关键转折点:比起用户规模,找到持续付费的开发者和企业成为2026年的核心目标。字节跳动也加入这场变革,其最新发布的豆包2.1 Pro强化了Coding和Agent能力,现场演示中直接对标Claude Opus。火山引擎在发布会上强调,豆包不再满足于用户打开率,而是瞄准开发者、Agent和真实工作流。这一转变对字节意义重大——作为长期依赖C端流量的公司,它首次承认免费聊天模式难以支撑商业闭环。
字节的转向并非偶然。据内部人士透露,高层考察Anthropic后启动AI资源重组,将资源从豆包等大众产品转向企业服务和编程模型。大模型数据审核团队从1500人扩至3000人,专门为编程模型清洗数据;火山引擎MaaS被设定收入翻10倍的目标。这一调整背后是双重压力:企业市场已展现付费意愿,而持续攀升的算力成本迫使公司尽快找到盈利路径。Stack Overflow调查显示,84%的开发者已在开发流程中使用AI工具,Gartner预测到2028年这一比例将达90%。Anthropic的收入曲线更具说服力——Claude Code年化收入在10个月内从零飙升至25亿美元,其中企业客户贡献超一半,大客户数量在两个月内翻倍。
成本压力在字节身上尤为明显。据报道,豆包日活超2亿但日收入不足百万元,主要依赖电商佣金;2026年5月,其每日算力成本达数千万元,多模态功能的成本是纯文本交互的数十倍。企业内部的token使用也经历类似过程:林鸣所在公司最初提供无限额度,发现收益未随成本同步增长后,开始严格控制用量。字节技术副总裁洪定坤公开提到,TRAE团队90%代码由AI生成,但人均需求吞吐率仅提升60%。实验数据显示,AI生成代码的功能正确率超80%,但在UI、可靠性和可维护性等关键维度,得分仅40-60分。“算力烧掉了,产出没跟上”的落差,成为大厂转向B端时必须解决的问题。
字节的AI布局覆盖三层市场:前端用TRAE和插件抢占开发者入口,中间层以CLI和企业版切入研发流程,底层由火山方舟和豆包模型提供算力支持。豆包2.1 Pro的发布标志着其战略重心明确转向Coding和Agent,官方称其在多项测试中接近GPT-5.5水平。支撑这一战略的是字节的企业服务基因:火山引擎拥有完整的云服务链条,飞书沉淀了大量企业客户,Seedance已跑通“模型能力变现”模式,年化收入约143亿元,毛利率达70%。洪定坤提出的“Harness”系统,试图通过上下文工程、架构约束等技术手段,将AI coding从代码生成推向需求完成阶段。
低价策略是字节的核心武器。豆包Coding Plan首月仅需9.9元,Lite套餐后续40元/月,Pro套餐200元/月,远低于海外主流工具20美元起的定价。API侧更直接:Doubao-Seed-Code输入价格每百万tokens最低1.2元,输出8元,配合缓存后综合成本比行业平均低62.7%。该计划还支持Claude Code、Cursor等主流开发环境,开发者无需迁移工作流即可切换模型。这种“低价+兼容”的组合,旨在降低试用门槛,争取进入企业核心工作流。
但B端市场的逻辑与C端截然不同。谷歌的案例具有警示意义:尽管拥有Google Cloud、Android等强大生态,其Gemini Code Assist仍未赢得开发者心智。这表明,生态和价格只是入场券,产品体验、模型能力和任务完成率才是关键。字节的快速试错文化在C端无往不利,但在B端可能成为劣势——程序员可以因低价尝试,但长期留存取决于工具能否稳定处理复杂任务并及时响应问题。目前,字节仅获得了留在牌桌上的资格。
开发者林鸣的模型使用清单反映了市场现实:Claude和ChatGPT占据九成预算,负责最难任务;DeepSeek因性价比高承担日常简单工作。这种“谁好用用谁”的态度在开发者中普遍存在,模型间的能力差距缩小更加剧了竞争。a16z创始人Marc Andreessen指出,GLM-5.2可能成为首个在多数任务上匹敌美国模型的中国产品,标志着大模型格局从单极走向多极化。
当能力差距缩小,定价策略成为关键。当前Coding市场的付费结构分为两部分:个人开发者订阅扩规模,企业客户通过API、席位费或合同贡献利润。Claude的个人订阅分20美元、100美元和200美元三档,但收入受限于月费模式;API则按token计费,高强度Agent任务下企业支出可达个人订阅数十倍。智谱曾因Coding Plan热销被迫限量发售,高峰期按更高倍率扣减额度。Anthropic和OpenAI通过分档限容、峰值扣减等方式平衡成本与收益,但这条路充满挑战。
新玩家持续涌入加剧竞争。6月下旬,DeepSeek高调扩招组建对标Claude Code的团队,Kimi将企业业务提升至战略高度。赛道逐渐分化为两条路线:Anthropic和OpenAI代表的高端路线,通过强模型能力和企业信任构建“AI员工”生态;DeepSeek、智谱等走的低价开放路线,争夺API调用和私有化部署份额。字节卡在中间:既想打造稳定交付的Agent系统,又选择低价兼容策略切入市场。这种打法可能带来双重优势,也可能导致“两头不硬”——开发者心智难敌Claude Code,性价比又面临DeepSeek挤压。随着模型能力趋同,竞争将聚焦于算力账本:谁能撑得更久,谁就能笑到最后。
