在人工智能大模型领域,众多参与者纷纷调整战略方向,将重心转向更为细分的领域时,阶跃星辰公司却以其坚定的立场脱颖而出,公开宣布将继续深耕基础大模型的研发。
阶跃星辰的创始人兼CEO姜大昕,详细阐述了公司的这一决策背后的逻辑。他提到,尽管AI行业的技术迭代速度惊人,仿佛昨天还被视为顶尖的GPT-4技术,今天就可能面临淘汰,但阶跃星辰不愿错失主流技术发展的浪潮,因此坚持在基础模型研发上持续投入。
姜大昕进一步指出,从应用层面来看,模型与应用之间存在相辅相成的紧密关系。模型为应用设定了潜能的上限,而应用则为模型提供了实际的应用场景和数据反馈。他强调,尽管阶跃星辰的产品形态随着模型的进步不断变化,但这一核心逻辑始终未变。
在过去的一年里,阶跃星辰的产品战略发生了显著变化。其主打的C端助手应用,从“跃问”更名为“阶跃AI”,标志着从类ChatGPT产品向更加综合的Agent平台的转变。尽管阶跃星辰的智能终端Agent主要与头部企业合作,但姜大昕明确表示,这些产品的最终服务对象仍是C端用户,无论是作为助手还是内容提供者,都蕴含着巨大的市场机会。
在谈及大模型领域的未来趋势时,姜大昕指出两大方向:一是从模仿学习到强化学习的技术演进,二是多模态从融合走向理解和生成的一体化。他强调,模型的突破往往先于商业化成功,OpenAI的GPT-3.5便是GPT系列的突破点,随后才有了ChatGPT的商业化成功。因此,阶跃星辰将继续在基座模型上投入,以追求智能的极限。
对于多模态技术,姜大昕表示,这是实现通用人工智能(AGI)的必经之路。阶跃星辰在研发过程中采取了散弹式策略,已发布了22款基座模型,其中16款为多模态模型,覆盖了图像、视频、音乐等多个领域。这一策略使阶跃星辰在多模态领域取得了显著成果,被誉为“多模态卷王”。
在多模态理解和生成一体化方面,姜大昕解释说,这意味着使用一个模型同时完成多模态内容的理解和生成,而非传统的三段式过程。他提到,虽然语言模型已经实现了理解和生成的一体化,但在视觉领域仍面临挑战。阶跃星辰正在探索视觉领域的生成一体化架构,并初步在其图像编辑模型Step1X-Edit上实现了这一目标。
面对量子位关于为何不在单一多模态推理模型上集中精力的提问,姜大昕坦诚表示,理解生成一体化是一项综合素质的考验,需要强大的综合实力。因此,阶跃星辰在多个模态上同时发力,以确保在探索这一路径时具备足够的实力和灵活性。
最后,姜大昕表达了对阶跃星辰未来发展的信心。他强调,公司在多个领域都拥有强大的技术实力,这使得阶跃星辰能够组合这些能力,继续探索人工智能的前沿领域。