在杭州举办的蚂蚁技术开放日上,蚂蚁集团宣布了一项重大技术突破:开源了名为Ming-lite-omni的理解与生成统一多模态大模型。这一创新成果标志着蚂蚁集团在人工智能领域迈出了重要一步,旨在为用户带来更为自然和全面的交互体验。
Ming-lite-omni模型具备独特的技术优势,它将理解和生成功能整合在一个模型中,支持音视频、图文等多种形态的输入和输出,实现了真正的全模态交互。据蚂蚁集团基础智能负责人西亭介绍,这一模型不仅统一了理解和生成的能力,还采用了MoE架构,确保了模型的交互性和灵活性。
西亭进一步表示,团队致力于开发一款接近GPT-4o水平的原生全模态模型,并决定将其彻底开源,以回馈技术社区。他强调,Ming-lite-omni的推出,是团队在探索和实践多模态大模型统一框架过程中的重要成果。
在会上,全球顶尖AI科学家、阿里集团副总裁许主洪也发表了演讲。他指出,当前多模态大模型的发展趋势是用统一的框架来实现理解和生成,而这一领域仍处于初级阶段,需要更多的实践验证。Ming-lite-omni的开源,正是这一趋势下的代表性实践之一。
蚂蚁集团今年在开源方面取得了显著进展,除了Ming-lite-omni外,还推出了Ling-lite-1.5语言大模型、推理模型Ring-lite-1.5和Ring-lite-linear。这些模型在各自的领域都取得了优异的成绩,为蚂蚁集团的技术创新提供了有力支持。
特别是在语言模型方面,Ling-lite-1.5的整体能力已达到同等规模模型的行业领先水平,而Ring-lite-1.5的推理能力也表现出色。这些模型的推出,不仅提升了蚂蚁集团的技术实力,也为行业内的技术创新和发展提供了重要参考。
蚂蚁集团还在行业大模型方面取得了新进展。其AI健康管家即将上线新版本,通过优化模型和数据资源,提供更为专业、个性化和高质量的医疗服务。这一应用将打通个人健康档案,充当用户的健康助理角色,为用户提供更加便捷和高效的健康管理服务。
蚂蚁集团在527技术开放日上公布的一系列大模型新进展,展示了其在AGI时代的决心和实力。通过不断探索和创新,蚂蚁集团正在打造统一多模态的AGI产品,并携手社区力量共同推进大模型产业的发展。