第7届北京智源大会上,北京生数科技有限公司CEO骆怡航发表了关于多模态大模型产业应用的精彩演讲,深入探讨了视频生成技术的最新进展及其在各行各业中的应用前景。
骆怡航指出,尽管多模态大模型在语言模型之后迎来爆发,但今年的发展速度却令人瞩目,正处于规模化生产落地的关键转折点。他强调,技术的快速迭代、行业需求的旺盛以及产业落地节奏的加快,共同推动了这一趋势。
在技术方面,骆怡航提到音视频生成模型在效果、速度和成本上的显著提升。他解释说,这些进步为视频生成技术的广泛应用奠定了坚实基础。同时,行业需求的旺盛也是推动多模态大模型发展的重要因素。传统内容生产方式存在的周期长、成本高、创意难等痛点,亟待新的解决方案。
针对这些痛点,骆怡航提出了视频生成技术规模化落地的四个关键条件:内容创意、内容质量、生成效率和生产成本。他认为,只有同时满足这些条件,视频生成技术才能真正在各行各业中发挥作用。
随后,骆怡航详细介绍了生数科技在多模态生成领域的进展和成果。他提到,生数科技目前主要聚焦于视频生成,包括音视频部分,并计划未来扩展到3D叙事空间等领域。公司的Vidu产品已经在多个专业和企业用户场景中得到了广泛应用。
骆怡航强调,Vidu产品的成功得益于其在效果、效率和成本上的不断优化。例如,Vidu 2.0版本在速度上实现了大幅提升,可以达到5秒技术生成。而Vidu Q1版本则进一步提升了高清版本、首尾帧、动漫等方向的能力,并深化了音效和音频的处理。这些进步使得Vidu在多个行业场景中得到了广泛认可。
骆怡航还分享了Vidu在用户侧取得的显著成果。他指出,自Vidu上线以来,专业创作的占比增长了300%,生成量、付费量和使用时长也大幅提升。在开发者和企业客户中,Vidu的应用占比更是高达80%,特别是在互联网广告、动漫、电商等要求严格的场景中。
骆怡航还通过一系列实际案例展示了Vidu在不同行业中的应用。例如,一位柔术特效创作者利用Vidu创作的动漫作品在分发平台上获得了300万人次的观看;一位美国作家通过Vidu将文字作品转化为视频介绍,受到了儿童读者的喜爱;飞书集成Vidu的API后,使得视频生成功能可以开箱即用,提高了工作效率。
在影视行业,Vidu也展现出了强大的应用能力。骆怡航提到,生数科技与索尼电影合作,利用Vidu的全功能制作了一部以中国水墨画风格为特色的毒液电影中国宣传片。这部宣传片在创作周期和总体成本上得到了极大提升,同时保持了高质量的制作水平。
除了影视行业外,Vidu还在广告、动漫、科幻作品等领域展现了广泛应用前景。骆怡航通过一系列实际案例展示了Vidu在这些领域中的创新应用和显著成果。
最后,骆怡航总结了生数科技在多模态生成领域的成功经验,并强调了持续迭代和用户反馈的重要性。他表示,生数科技将继续致力于改变千行百业中的内容制作流程,提高内容生产效率,以用户认可为动力,驱动产业变革。