腾讯混元在近日举办的媒体沟通会上,正式宣布了两项重大开源成果:MoE模型“混元Large”和3D生成大模型“Hunyuan3D-1.0”。这一举措标志着腾讯在人工智能领域的又一次深入探索和开放共享。
混元Large作为目前开源领域参数规模最大的MoE模型,不仅在长文处理能力和专业度上有了显著提升,更在模型结构和训练策略上进行了全面创新。据悉,该模型总参数量达到389B,激活参数量52B,上下文长度可高达256K,相当于一本《三国演义》的篇幅。这一突破性的进步使得腾讯混元Large在CMMLU、MMLU、Ceval、MATH等多学科综合评测集以及中英文NLP任务、代码和数学等多个维度上均表现出色,超越了Llama3.1、Mixtral等一流开源大模型。
与此同时,腾讯混元3D生成大模型Hunyuan3D-1.0的发布,更是为3D创作领域带来了革命性的变化。这一模型是业界首个同时支持文字和图像生成3D的开源大模型,只需10秒钟即可帮助用户生成高质量的3D资产。其强大的泛化能力和可控性,使得重建各类尺度物体成为可能,无论是宏大的建筑,还是微小的工具花草,都能轻松生成。目前,Hunyuan3D-1.0已经应用于腾讯地图,使得3D生成速度提升了91%,极大地提高了用户体验。
长期以来,3D制作领域面临着多重挑战,包括设计师专业技能要求高、人才需求紧迫、制作周期长、成本高等问题。而腾讯混元3D生成大模型的开源,无疑为这一领域注入了新的活力。首批开源模型包含轻量版和标准版,轻量版更是仅需10秒即可生成高质量3D资产。这一模型不仅包含了模型权重、推理代码、模型算法等完整内容,还可供开发者、研究者等各类用户免费使用,进一步降低了3D创作的门槛。
腾讯混元Hunyuan3D-1.0的应用场景广泛,已经开始在UGC 3D创作、商品素材合成、游戏3D资产生成等腾讯业务中发挥作用。例如,腾讯地图基于混元3D大模型,推出了自定义3D导航车标功能,支持用户创作个性化的3D导航车标,相比传统方案速度提升了91%。腾讯元宝APP也上线了“3D角色梦工厂”玩法,支持个性化的UGC 3D人物生成,进一步丰富了用户的创作体验。
对于此次开源的动机,腾讯专家研究员、混元文生3D研发负责人郭春超表示,腾讯业务丰富,从公司自身业务出发做3D生成是极其有必要的。同时,混元的定位也是回馈社区,因此选择在这个时间段开源。郭春超还提到,目前3D生成还处于发展阶段,需要社区共同努力,释放更好的模型和更强的生成能力,才能进一步推动这一领域的发展。
腾讯混元的这一系列开源举措,不仅展示了其在人工智能领域的深厚积累和创新实力,更为整个行业带来了新的发展机遇。随着越来越多的企业和个人加入到这一领域中来,相信3D创作和生成技术将会迎来更加美好的未来。