可灵AI近日宣布,其基座模型已全面升级,并正式向全球推出可灵2.0视频生成模型及可图2.0图像生成模型。此次发布标志着可灵AI在动态内容和图像创作领域迈出了重要一步。
可灵AI自问世以来,凭借其强大的生成能力,已吸引了全球超过2200万用户,累计生成了1.68亿个视频和3.44亿张图片素材。在过去10个月内,其月活用户数量更是激增25倍,展现了强大的市场吸引力和用户基础。
在发布会现场,快手高级副总裁盖坤分享了他对可灵AI的期待。他提到,早在去年3、4月,当他首次看到可灵AI的DiT模型产出结果时,就梦想着有一天能用AI来拍摄他心目中的《三体》。这一愿景如今正随着可灵AI的不断升级而逐步成为现实。
针对当前视频生成行业面临的挑战,如语义分析能力不足和动态质量不稳定等问题,可灵AI在2.0版本中提出了全新的交互理念——Multi-modal Visual Language(MVL)。这一理念允许用户通过结合图像参考、视频片段等多模态信息,将复杂的创意直接传达给AI,从而实现更精准和高效的生成。
基于MVL理念,可灵AI推出了多模态编辑功能,不仅支持图片和视频,还引入了声音和运动轨迹等其他模态信息。同时,可灵2.0大师版在语义响应、动态质量和画面美学等方面进行了全面升级,提供了更强大的视频及图像创作可控生成与编辑能力。
在图像生成领域,可图2.0同样展现出了强大的实力。其优势在于复杂语义理解能力、电影级的画面质感以及多条件的可控风格化生成。新升级的可图2.0版本不仅提升了指令遵循能力和电影美学表现力,还支持60多种风格化的效果转绘。
可图2.0还上线了图像可控编辑功能,包括局部重绘和扩图等,支持用户对图片进行增加、修改和修复。这一功能使得用户在创作过程中拥有更多的灵活性和控制权。
除了面向C端订阅用户外,可灵AI还积极拓展B端市场,为商家提供API接入等服务。目前,已有超过1.5万名全球开发者将可灵的API应用于不同行业场景中,累计生成的图像和视频素材数量分别达到了约1200万个和4000万个。
为了进一步激发AI爱好者的创作热情,可灵AI还发布了“可灵AI NextGen新影像创投计划”。该计划将通过千万资金投入、全球宣发、IP打造和保障等合作方式,全资出品、联合出品或提供技术支持,为AIGC创作者提供更多的机会和资源。
随着可灵AI的不断升级和拓展,其在动态内容和图像创作领域的领先地位将进一步巩固。未来,我们有理由期待可灵AI为用户和开发者带来更多惊喜和可能性。