腾讯元宝紧抱DeepSeek大腿,AI战略显成效
腾讯元宝,这款集成了腾讯混元大模型的智能助手,近期在AI领域掀起了一股不小的波澜。3月26日,元宝迎来了重大更新,迅速接入了DeepSeek V3的“小版本更新”版本V3-3024,并同步接入了自研的混元T1正式版。这一连串动作,不仅彰显了腾讯对DeepSeek技术的紧跟不舍,更展现了其在AI领域的雄心壮志。
早在今年年初的民企座谈会上,腾讯创始人马化腾与DeepSeek创始人梁文锋并排而坐,这一场景似乎预示着双方的紧密合作。而就在那之后不久,2月13日,腾讯元宝便宣布接入DeepSeek。这一举措,让元宝如同坐上了火箭,用户量激增,一度登顶苹果应用商店中国区免费榜榜首。腾讯总裁刘炽平在财报会上透露,元宝的日活用户数量更是激增超过20倍。
腾讯的AI战略,以“自研+开源”的融合模式为核心,通过与自身丰富产品生态的融合,以及不同模型之间的协同互补,实现了用户侧体验的大幅提升。而此次V3更新和混元T1正式版的上线,更是展现了另一种“融合”的趋势——推理模型和通用模型的互相靠近。
DeepSeek V3-3024的更新,虽然被称为“小版本更新”,但实际上升级幅度并不小。根据DeepSeek的官方技术报告,V3-3024在数学、百科知识、代码任务上的表现都优于前代,尤其是在数学和代码类评测集上得分超过OpenAI的GPT-4.5和Anthropic的Claude-Sonnet-3.7。V3-3024虽然不是推理模型,但却融入了R1推理模型的强化学习训练技术,展现出了推理模型的优势。
而腾讯自研的混元T1模型,同样具备这样的特点。作为推理模型,混元T1在响应速度上更快,这得益于其采用的Hybrid-Mamba-Transformer架构,该架构结合了Transformer的高效上下文捕捉能力和Mamba的高效长序列处理能力,使得模型在快与慢之间找到了平衡。
在实际测试中,混元T1的表现同样令人瞩目。在MMLU-pro、Ceval、AIME、Zebra Logic等中英文知识、竞赛级数学以及逻辑推理公开基准测试中,混元T1的得分比肩DeepSeek R1和OpenAI的o1。混元T1每百万tokens输出价格仅为4元,是DeepSeek R1标准时段输出价格的四分之一,性价比极高。
腾讯元宝的成功,不仅在于其紧跟DeepSeek的技术更新,更在于其“自研+开源”的多模型策略。腾讯方面表示,将继续坚持这一策略,并加大投入。近半个月来,腾讯已经投入了近3个亿用于AI研发。在未来,腾讯计划进一步加大资本支出,预计资本支出将占收入的十几个百分点。
随着AI技术的不断发展,模型生产商们纷纷开始探索融合通用模型和推理模型的新路径。DeepSeek的V3-3024和腾讯的混元T1正式版,都是这一趋势的代表作。未来,AI模型的发展或许将不再局限于单一的路径,而是更加注重效率和用户体验的融合。