天脉资讯
财经快讯 价值公司 财经人物 IPO解读 热门赛道 经济解码 科技业界 文化艺术 消费零售 大燕公益 商业快讯

上交团队携ML-Master 2.0登顶OpenAI基准测试,国产AI引领科研新范式

2025-12-25来源:快讯编辑:瑞雪

在人工智能与科研深度融合的浪潮中,一款名为ML-Master 2.0的自主智能体系统引发全球关注。由上海交通大学人工智能学院、上海算法创新研究院及深势科技联合研发的这款系统,基于国产开源大模型DeepSeek-V3.2-Speciale,在OpenAI权威评测基准MLE-bench中以56.44%的奖牌率登顶全球榜首,较国际顶尖团队基于闭源模型的方案提升28.3%。这一突破标志着中国团队在AI驱动科研探索领域实现关键范式革新。

区别于传统AI系统聚焦短程任务优化的路径,ML-Master 2.0专为机器学习工程(MLE)的复杂场景设计。真实科研场景中,科研人员常需在数十小时内经历假设验证、代码调试、结果分析的循环迭代,失败率远高于成功率。研发团队突破性地将"认知积累"作为核心架构,通过层次化认知缓存机制(HCC),将探索过程中产生的经验、知识与智慧分层管理:即时经验支撑当前决策,稳定知识服务同一任务,跨任务智慧为新问题提供策略起点。这种设计使系统在长时间运行中既能保持探索方向,又能避免"上下文爆炸"导致的认知混乱。

在MLE-bench的严苛测试中,ML-Master 2.0展现三大核心能力:其一,超长程自主性,可在持续数十小时的科研任务中保持目标聚焦;其二,高效试错机制,能从失败实验中提炼规律而非简单重复尝试;其三,认知迁移能力,能将已验证无效的技术路径主动排除,并将经验转化为可复用的认知资产。测试数据显示,该系统在完全无人工干预条件下,代码生成、调试修正与结果分析的完整闭环执行效率较国际同类产品提升显著。

目前,ML-Master 2.0已进入实际应用阶段,在理论计算物理模拟、具身智能机器人训练等前沿领域发挥关键作用。例如在量子材料研究中,系统通过自主设计实验方案,将传统需要数月的模拟周期压缩至两周;在机器人控制领域,其持续优化能力使机械臂操作精度突破行业基准。这些实践验证了AI科学家在真实科研场景中的可行性。

该系统的技术架构已通过GitHub开源平台向全球研究者开放,核心代码包含认知缓存管理、任务分解策略等创新模块。同时,SciMaster线上平台正式启动体验申请通道,通过"SciMaster的朋友圈"社区,科研人员可提前获取系统使用权。配套的EigenAI基础设施提供稳定算力支持,确保系统在复杂任务中的持续运行能力。

项目地址:
https://github.com/sjtu-sai-agents/ML-Master
SciMaster平台:
https://scimaster.bohrium.com/chat/

百度萝卜快跑迎新突破:速腾聚创助力 或将首次上车千线级激光雷达组合
观点网讯:3月12日,百度旗下无人驾驶出行服务平台萝卜快跑,或将首次实现千线级激光雷达的上车应用,该独家前装定点已由速腾聚创获得。据介绍,速腾聚创将为萝卜快跑新一代前装量产Robotaxi车型提供“千线级EM…

2026-03-13

英伟达豪掷20亿美元牵手Nebius,共筑AI超大规模云服务新未来
【环球网科技综合报道】3月12日消息,据RTTNews报道,英伟达与Nebius集团近日宣布达成深度战略合作,双方将联合开发并部署面向人工智能市场的新一代超大规模云计算服务,精准对接AI原生企业及各类机构的…

2026-03-13

一加15T官宣来袭:全白配色搭配小屏设计,性能续航影像全面升级!
正是因为新技术的应用,促使一加15T这款智能手机不仅实现了玻纤后盖与金属中框在色彩上的高度一体化,还做到了白度和耐用度的完美平衡。 在机身规格上,根据互联网上的最新爆料信息显示,一加15T这款智能手机采用金属…

2026-03-12