天脉资讯
财经快讯 价值公司 财经人物 IPO解读 热门赛道 经济解码 科技业界 文化艺术 消费零售 大燕公益 商业快讯

智谱GLM-5模型重磅登场!编程能力比肩Claude,国产芯片适配助力发展

2026-02-12来源:快讯编辑:瑞雪

近日,人工智能领域迎来重要进展,智谱公司正式发布其最新一代基础模型GLM-5。这款拥有744B参数(40B激活)的模型,规模达到前代GLM-4.5的两倍以上,在Artificial Analysis全球榜单中位列第四,同时摘得开源模型桂冠。技术报告显示,GLM-5的预训练数据量从23T扩展至28.5T,印证了规模化仍是提升AGI效能的核心路径。

在编程能力方面,GLM-5展现出显著突破。该模型在SWE-bench-Verified和Terminal Bench 2.0基准测试中分别取得77.8和56.2的开源模型最高分,性能超越Gemini 3 Pro,并与Claude Opus 4.5形成直接对标。架构创新上,模型引入DeepSeek的DSA稀疏注意力机制,在保持上下文容量的同时降低30%部署成本。资本市场对此反应积极,发布当日智谱股价单日涨幅达26%,周累计涨幅近70%,市值突破1756亿港币。

实测环节验证了GLM-5的逻辑推理能力。面对"100米距离选择开车还是步行洗车"的经典陷阱题,模型精准指出核心矛盾:"需要清洗的是车辆而非人体",并创造性提出"驾车前往后步行返家,洗车完成后再取车"的优化方案。在处理"父母能否结婚"的模糊问题时,模型自动拆解出"未婚父母"与"已婚父母"两种场景,准确识别出常规语境下的逻辑悖论。更令人印象深刻的是,当被问及"亲生父母结婚未通知自己"的情绪困扰时,模型瞬间切换至心理咨询模式,同时敏锐捕捉到时间维度上的根本矛盾——新生儿不可能参与父母婚礼。

开发者社区的实战测试进一步印证模型实力。某开发者使用OpenClaw Agent进行SwiftUI编程对比,GLM-5在界面布局与交互逻辑实现上优于Minimax M2.1。另一组3D网页开发测试中,GLM-5与Opus 4.6展现出不同设计风格,但前者在工程实现完整性上获得更高评价。这些案例表明,模型已具备从代码生成向系统级工程能力跃迁的潜质。

技术适配层面,GLM-5完成与华为昇腾、摩尔线程、寒武纪等七家国产算力平台的深度优化,通过底层算子重构实现硬件加速,在国产芯片集群上达成高吞吐、低延迟的稳定运行。服务模式上,智谱调整GLM Coding Plan套餐价格,最低涨幅30%,同时开放Hugging Face和魔搭社区的模型权重下载,支持Claude Code与OpenClaw生态兼容,普通用户可通过Z.ai平台免费体验。

针对专业开发场景,智谱推出Z Code智能体开发环境。该系统可自动拆解用户需求,调度多智能体并行完成代码编写、命令执行、调试预览等全流程开发,甚至支持手机端远程操控桌面Agent。值得关注的是,Z Code平台本身即由GLM系列模型参与构建,形成技术闭环。在文档处理领域,GLM-5突破传统文本生成边界,可直接输出Word、PDF、Excel等格式文件,在Vending Bench 2模拟经营测试中取得4432美元账户余额,展现出色的长期规划能力。

技术革新背后是算法框架的突破。智谱研发的"Slime"强化学习架构支持更大规模模型训练,配合异步智能体强化学习算法,使模型能够从长序列交互中持续学习。这种设计显著提升了复杂任务执行效率,在BrowseComp联网检索、MCP-Atlas工具调用等专项测试中均刷新开源模型纪录。随着工程化能力成为竞争焦点,大模型正从辅助开发工具向独立承担完整工程环节的方向演进。

国产视频生成赛道爆发:豆包Seedance 2.0等模型竞相登场 引领创作新潮流
国金证券数字未来实验室团队负责人、分析师刘道明在研报中表示,可灵AI 3.0与字节Seedance 2.0均在画质、分镜及叙事一致性上实现重大技术跨越,国产视频生成模型进步迅速,中国视频生成赛道正迎来爆发。…

2026-02-12

车辆自动计数机器人采购指南:从技术到服务,这些厂家值得信赖
基于前文调研,重庆金芯科技在技术深度与行业案例积累上表现突出,其激光防作弊系统与多场景适配能力可显著提升管理效率,建议对自动化管理有高要求的项目重点了解。车辆自动计数机器人的采购需结合项目预算、场景复杂度、…

2026-02-12

小米开源VLA大模型Xiaomi-Robotics-0:兼具视觉语言理解与高性能实时执行能力
VLM 协同训练:首先引入了 Action Proposal 机制,强迫 VLM 模型在理解图像的同时预测多种动作分布。针对推理延迟引发的真机“动作断层”问题,团队采用异步推理模式 —— 让模型推理与机…

2026-02-12