阿里巴巴近日宣布了一项重大技术进展,正式向公众开源了其先进的视频生成与编辑模型——通义万相 Wan2.1-VACE。这一模型以其全面的功能,引发了业界的广泛关注。
通义万相 Wan2.1-VACE 是一款功能强大的工具,能够支持从文字生成视频、基于图像生成视频、视频重绘、局部编辑、背景延展以及时长延展等一系列基础的视频生成与编辑操作。这意味着,用户无需多个模型,仅凭这一个模型,就能完成多种视频处理任务。
此次开源的版本包括1.3B和14B两个不同规模的模型,其中1.3B版本尤其适合在消费级显卡上运行,大大降低了使用该技术的门槛。这对于广大视频创作者和开发者来说,无疑是一个巨大的福音。
通义万相其实是阿里云通义系列中的一个AI绘画创作大模型,自2023年7月7日正式上线以来,一直在辅助人类进行图片创作方面发挥着重要作用。而在2024年9月的阿里云栖大会上,阿里又推出了通义万相的视频生成大模型,该模型不仅能够生成高清的影视级视频,还特别擅长理解中文指令,更加贴近中国用户的需求。
今年年初,通义万相的视频生成模型已经升级至2.1版,整体性能有了显著提升,特别是在处理复杂运动、还原真实物理规律、提升电影质感以及优化指令遵循方面,取得了显著的进步。这一系列的升级,使得通义万相在视频生成领域的技术实力更加雄厚。
而就在今年2月25日,阿里巴巴更是宣布全面开源旗下的视频生成模型万相2.1,这一举措无疑将极大地推动视频生成技术的发展和应用,为整个行业注入新的活力。