特斯拉创始人马斯克近日在社交平台X上透露,其旗下人工智能公司研发的Grok基础模型V9-Medium(1.5T版本)已顺利完成核心训练阶段。该模型在初步评估中展现出优异性能,研发团队随即启动补充训练计划,通过整合海量Cursor数据集持续优化模型表现。据内部人士透露,后续还将分阶段注入更多专业领域数据以提升模型实用性。
当前研发工作已进入微调阶段,工程师团队正针对模型输出质量、逻辑推理能力等关键指标进行精细化调整。按照既定计划,强化学习模块将于数日内正式启动,通过模拟真实场景的交互训练进一步提升模型适应能力。马斯克在动态中明确表示,该模型预计将在2至3周后完成全部优化工作并面向公众发布,届时将支持多模态交互与复杂任务处理。
技术文档显示,V9-Medium版本采用1.5万亿参数架构,在保持高效推理能力的同时,通过创新性的混合精度训练技术将计算资源消耗降低37%。研发团队特别强调,新模型在代码生成、数学推理等领域的表现较前代产品有显著提升,这得益于训练过程中采用的动态数据增强策略与对抗性验证机制。
