月之暗面正式推出并开源了其最新代码模型Kimi K2.6,在代码编写、长程任务执行及多Agent协同能力方面实现全面突破。该模型现已通过官网、Kimi应用、API及编程助手等渠道向全体用户开放,企业和开发者可通过指定模型名称直接调用。
在权威测试中,Kimi K2.6展现出显著优势。该模型在博士级难度的"终极人类考试"、软件工程基准SWE-Bench Pro及深度检索测试DeepSearchQA中,均达到行业领先水平,性能表现与GPT-5.4等闭源模型持平甚至超越。特别在长程编码任务中,K2.6可连续工作13小时,完成超4000行代码的编写与优化,代码质量较前代提升约20%。
实测案例印证了模型的强大能力。在Mac本地部署场景中,K2.6使用小众语言Zig实现Qwen3.5-0.8B模型推理优化,通过4000余次工具调用和14轮迭代,将处理速度提升至193 tokens/s,较LM Studio提升20%。另一个案例中,模型对8年历史的金融撮合引擎进行深度重构,通过12套优化策略和1000余次工具调用,使中位吞吐量增长185%,峰值吞吐量提升133%。
该模型在代码驱动设计领域取得创新突破。基于Agent模式,K2.6可自动生成具有专业设计感的Web应用,从视觉素材生成到交互元素设计实现全流程覆盖。其创建的评测基准Kimi Design Bench显示,在视觉输入处理、全栈应用开发等维度,较Gemini 3模型具有明显优势。模型还支持表单信息收集等后端功能,形成完整的前后端开发能力。
多Agent协同能力实现质的飞跃。K2.6可动态拆解复杂任务,最多调度300个子Agent并行处理4000个协作步骤。在半导体策略设计案例中,集群自动生成麦肯锡风格PPT逻辑,同步输出建模表格和演示文档。另一个天文研究案例中,Agent集群将论文转化为可复用技能,产出7000字研究报告、2万条结构化数据及14张专业图表。
模型在自主运行方面表现突出。与OpenClaw等框架协同工作时,基于K2.6的Agent实现连续5天自主运维,具备持久上下文记忆、多线程处理及故障全流程解决能力。内部测试显示,其在编程任务、信息检索等五大维度的综合性能提升10%,特别在长时间无人干预场景中优势显著。
技能系统与协作生态持续完善。用户可通过简单指令创建和调用上百种官方技能,包括一键生成专业投资研报的投研技能包。新增的"Office文档转技能"功能可自动解析文档结构,生成个性化创作技能。即将启动的"Claw群组"内测将支持多Agent与人类协同工作,K2.6将作为协调者动态分配任务,实现跨框架、跨设备的全天候协作。