马斯克在社交平台X上宣布,xAI公司研发的Grok基础模型V9-Medium(1.5T)已完成核心训练阶段,预计两到三周后正式对外发布。这款新模型在参数规模上达到1.5万亿,是当前支撑Grok生产流量的v8-small模型(0.5T)的三倍,标志着模型在深度推理能力和复杂任务处理方面实现重大突破。
据透露,V9-Medium在补充训练阶段特别引入了海量Cursor数据集。该数据集包含数百万开发者真实工作场景中的需求描述、问题定位、代码修改、错误修复等完整流程记录,旨在提升模型对实际工程问题的理解能力。马斯克特别强调,新模型在编程能力方面取得显著进展,未来将持续通过Cursor数据优化模型表现。
同步推进的还有xAI全新编程工具Grok Build的测试进程。这款基于AI的编程代理工具已进入早期Beta测试阶段,开发者可通过交互式终端界面、无界面模式或Agent Client Protocol三种方式调用。工具支持多子代理并行处理复杂任务,提供计划制定、技能扩展、市场插件集成等功能,并具备图像视频生成、自动化工作流构建等能力。
此次技术突破与xAI近期的人才战略密切相关。公司先后吸纳Cursor核心工程负责人Andrew Milich和Jason Ginsberg,直接领导编码能力重构项目。上月更以600亿美元完成对Cursor公司的收购,该金额较其去年估值翻倍。收购后仅一个月,相关技术整合已显现成效,Grok Build从概念验证迅速推进至大规模测试阶段。
值得关注的是,马斯克在宣布新模型进展时透露,现有0.5T规模的v8-small模型将于年底开源。这一举措被视为xAI构建开发者生态的重要布局,配合新模型发布和编程工具测试,显示出公司在AI代码生成领域的全面发力。目前V9-Medium已完成基础训练,正在进行微调优化,强化学习阶段即将启动。
