天脉资讯
财经视野 科技数码 探索发现 教育学习 娱乐红人 时尚秘籍 文化艺术 游戏天地 星座解读 宠物小乖 营养美食 大燕公益 商业快讯

超聚变FusionOne AI一体机:DeepSeek大模型吞吐性能飙升新高度!

2025-03-24来源:天脉网编辑:瑞雪

人工智能技术的飞速发展,特别是大模型的出现,正引领着AI领域的革新。然而,随着模型规模的不断扩大,对算力的需求也急剧上升,如何在保持高效的同时降低成本,成为了业界亟待解决的问题。

DeepSeek R1作为一款拥有6710亿参数的大模型,凭借其创新的MLA注意力机制和混合专家(MoE)架构,在推理效能上取得了显著进步。然而,企业在实际应用中,对于大模型的性价比要求极高,如何在不牺牲性能的前提下降低成本,成为了新的挑战。

近期,超聚变推出的FusionOne AI大模型一体机,通过软硬件的深度协同优化,成功打破了H20在运行DeepSeek R1大模型时的性能瓶颈。在模拟的对话场景中,仅需一台FusionServer G8600服务器,配备8张H20硬件,即可流畅运行DeepSeek R1的满血版,支持高达1024的并发访问,总吞吐量达到了6335 token/s,相较于业内其他H20方案,性能提升了60%。

在优化细节方面,超聚变通过内核优化,提升了显存空间的利用率,达到了20%的提升,同时KV cache池的使用率也提高至93%,确保了模型参数和过程数据的高效运行。通过DP数据并行和TP模型张量并行技术,实现了多卡分布式并行计算,进一步提升了token生成的吞吐效率,达到了50%的提升。在推理任务的调度上,采用了切片混合调度策略,通过Prefill阶段的长文本切片,加速了初始内容的生成速度,同时混合调度Decode任务,实现了并行运行,无需串行等待,从而提高了资源利用率,降低了TTFT和TPOT。

超聚变FusionOne AI大模型一体机的推出,不仅实现了成本和性能的双重突破,还大幅降低了DeepSeek-R1 671B模型的部署门槛,使得更多企业和科研机构能够轻松应用这一先进技术。这一普惠形态的出现,无疑将加速AI技术的普及和应用落地。

Humanity Protocol携手ApeChain,PoH技术赋能dApps安全升级
来源:市场资讯 Humanity Protocol 与 ApeChain 宣布达成合作,共同将“Proof ofHumanity(PoH)”技术引入 ApeChain,提升去中心化应用(dApps)的抗 S…

2025-03-24