天脉资讯
财经视野 科技数码 探索发现 教育学习 娱乐红人 时尚秘籍 文化艺术 游戏天地 星座解读 宠物小乖 营养美食 大燕公益 商业快讯

腾讯技术助力,DeepEP通信框架性能大飞跃,DeepSeek致谢!

2025-05-08来源:天脉网编辑:瑞雪

腾讯技术团队近期对DeepSeek开源的DeepEP通信框架实施了深度优化策略,此举显著提升了该框架在多种复杂网络环境下的性能表现。

经过严格测试,优化后的DeepEP通信框架在RoCE网络环境中实现了性能翻倍的壮举,同时在IB(InfiniBand)网络环境下也取得了30%的性能提升。这一突破性进展为企业在AI大模型训练领域提供了更为高效的解决方案。

DeepEP通信库专为专家混合(MoE)和专家并行(EP)设计,旨在提供高吞吐量和低延迟的全对全GPU内核通信能力,这些内核被广泛应用于MoE的派发和组合操作。该库还支持低精度运算,包括FP8格式,进一步拓宽了其应用场景。

腾讯星脉网络团队在DeepEP开源后迅速投入研发,针对双端口网卡带宽利用率不足以及CPU控制面交互时延两大关键瓶颈展开了技术攻关。经过不懈努力,团队成功突破了这些技术障碍。

在腾讯的技术优化下,DeepEP在RoCE网络环境中的性能实现了质的飞跃,同时在IB网络环境中也展现出了更加出色的通信效率。这一优化成果不仅提升了DeepEP的竞争力,更为腾讯自身的AI大模型训练项目如混元大模型等提供了强有力的支持。

该技术已经全面开源,并在腾讯星脉与H20服务器构建的环境中得到了成功应用。实践证明,该方案在训练推理过程中展现出了出色的通用性和稳定性,为AI大模型训练领域注入了新的活力。