天脉资讯
财经快讯 价值公司 财经人物 IPO解读 热门赛道 经济解码 科技业界 文化艺术 消费零售 大燕公益 商业快讯

国际最新AI基准测试SPEC ML首提模算效率,填补大模型计算效率评测空白

2025-01-09来源:美通社编辑:

北京2025年1月8日 /美通社/ -- 日前,国际标准性能评估组织SPEC公布了AI基准测试SPEC ML最新进展,该基准已完成面向不同AI负载下的软硬件系统的性能、扩展性和模算效率三大关键指标构建。其中模算效率首次纳入SPEC ML基准评测,将填补大模型计算效率评测基准领域的研究空白。


随着人工智能更加广泛的应用,为AI/ML建立强大的基准测试比以往任何时候都更加重要。SPEC ML基准委员会主席Arthur Kang表示,统一的基准评测方法不仅有助于简化模型比较,还将为注重效率、准确性和可持续性的创新铺平道路。目前AMD、英特尔、NVIDIA、浪潮信息、NetApp和Red Hat等科技企业正在共同参与开发 SPEC ML基准测试,SPEC呼吁更多伙伴参与到项目中,通过产业上下游的合作,为大模型的开发应用树立新的性能评估标杆,为AI技术的高效、绿色、可持续发展注入新动力,共创更加繁荣与可持续的AI新时代。

近年来,随着预训练模型的快速发展,人工智能领域迎来了显著的技术进步。这些模型通过大规模数据集的预训练,并结合微调技术来适应不同任务,在自然语言处理和计算机视觉等多个领域取得了显著成效。然而,随着模型结构和参数量的日益复杂,其在不同软件框架和硬件平台上的表现存在差异,如何全面、公正地比较模型、算力系统的综合性能变得愈加困难。为了在不增加大规模计算资源投入的情况下提升模型的准确性和效率,建立统一的基准测试体系已成为AI领域的迫切需求,这不仅可以帮助开发者选择最适合的技术方案,还能为优化计算资源利用、降低碳排放提供科学的参考依据。

但当前业界在模型、框架和硬件协同效能评估方面存在显著空白,缺乏统一的评估基准,评估过程难以量化,导致开发者难以做出最优的技术选择。尤其是在大型模型的训练和推理过程中,计算资源和能源的消耗成为行业面临的重要挑战。如何在满足性能需求的同时优化计算资源的利用,降低能源消耗,是当前研究和应用的关键所在。为此,SPEC ML首次提出将模算效率纳入基准评测,模型本身精度越高、在对应软件上对硬件性能利用率越高、推理及训练所需算力越小,模算效率越高。模算效率的评价对象涵盖了AI大模型、运行框架和硬件算力平台的一整套软硬件系统。

模算效率的首次提出,将增强不同预训练模型、软件框架和硬件系统之间的可比性,促进模型与硬件的协同优化,推动AI计算系统的能效提升和技术创新:

中国年|世界窗 2026北京东城区庙会全球发布
——2026中国庙会看地坛,北京庙会看龙潭;在地坛,游逛中国庙会;来龙潭,感受北京年味。2025 年 12 月 30日,北京东城区面向全球发布 2026 年春节庙会总体规划。立足“十四五”文化发展规划,衔接“十五五”时期文化自信建设总体要求,本届春节庙会以“可触摸的历史、可感知的未来”为理念主线,推动前沿科技与中华优秀传统

2025-12-31

让渠道“活起来” 壹玖壹玖荣获茅台先进渠道商奖
12月28日,2026年贵州茅台酒全国经销商联谊会在贵阳召开,1919集团被评为2025年度贵州茅台酒“先进渠道商奖”。此次召开的2026年贵州茅台酒全国经销商联谊会,不仅是一年一度复盘全年市场工作的收官总结会,也是贵州茅台酒全国经销商联谊会自1999年启动召开以来,首次邀请渠道商全员出席,共话友谊、谋改革、求突破、促发展

2025-12-31

AI流量入口争夺战启动:AIRO成破局关键 多数企业仍错失先机
【导语】当70%的消费者在决策前优先向AI助手寻求品牌推荐,当传统营销渠道流量成本攀升300%仍收效甚微,一场围绕AI流量入口的营销革命已全面爆发。记者从多位行业分析师及最新行业报告中获悉,AI结果优化技术(AIRO)正成为企业抢占AI生态红利的核心抓手,其与生成式引擎优化(GEO)的本质差异,正重新划分市场竞争格局,而多数

2025-12-30

AI模型和数据安全?交给至强 6,用TDX技术来控场!
一场成功的CPU发布会应该是怎样的?大家可能会说,规格拉满,性能至上,没有比这个更关键的了。不过反观英特尔过去数代至强处理器的发布会,就会发现一个特别之处,即:它是会谈新产品增加了多少核心、频率如何变化,内存或互连技术的带宽与频率如何演变,甚至又增添了哪些算力上的加速器或扩展指令集,但始终会留出足够的时

2025-12-29