天脉资讯
财经视野 科技数码 探索发现 教育学习 娱乐红人 时尚秘籍 文化艺术 游戏天地 星座解读 宠物小乖 营养美食 大燕公益 商业快讯

快手可灵AI升级,马斯克关注!吉卜力风格轻松转绘,影像创作无界

2025-04-17来源:天脉网编辑:瑞雪

快手发布“史上最强视觉生成模型”可灵AI,两大基础模型重磅升级

在近日的一次发布会上,快手正式推出了其被誉为“史上最强视觉生成模型”的可灵AI,并宣布其两大基础模型——可图与可灵均已完成2.0版本的重大升级。这一消息引起了国内外广泛关注,就连科技巨头特斯拉的CEO马斯克也连夜关注了可灵AI的官方账号。

据快手介绍,可图2.0在语义遵循和美学能力上实现了大幅提升,相较于MidJourney 7.0和FLUX,其胜负比分别超过了300%和150%。同时,可灵2.0在文字生成视频和图片生成视频方面,也展现出了卓越的性能,与Sora和谷歌Veo2的对比中,胜负比分别达到了360%和180%以上。不仅如此,两款模型还新增了图像编辑、风格转绘等一系列实用功能。

在实测中,可图2.0的复杂元素响应、镜头语言设计和画面细节表现都展现出了令人惊叹的精准度。例如,在创作一幅黑白照片时,要求画面中少女照镜子,镜子里映出她老年的样子,且采用写实摄影风格、左右对比、侧面构图和电影光照。可图2.0不仅完美呈现了这一场景,还准确捕捉了提示词中的构图、颜色等要求,而前一代模型则显得力不从心。

可图2.0还具备更强的风格响应能力,支持近百种风格,无论是古典还是现代、写实还是夸张,都能轻松驾驭。在实测中,可图2.0展现出了卓越的电影美学表现,通过高级的色彩和光影运用,使得情绪表达更具感染力。同时,多风格化响应也让可图2.0的创作更加丰富多彩,包括GPT-4带火的吉卜力风等热门风格也能轻松生成。

除了模型升级外,可图2.0还新增了风格转绘和图片编辑两大功能。风格转绘功能可以让用户将同一张图片转换成不同风格的作品,而图片编辑功能则包括局部重绘和扩图两个方面,让用户可以对图片进行更加细致的修改和扩展。

可灵2.0的升级同样令人瞩目。针对之前指令遵循不好、动态效果不佳、美感缺乏的问题,可灵2.0进行了全面优化,显著提升了模型的表现力。现在,用户可以通过更加精准的描述,生成出更加符合期望的视频作品。同时,快手还推出了全新的多模态视觉语言(MVL)交互理念,让用户能够结合图像参考、视频片段等多模态信息,将复杂创意高效地传达给AI。

这一创新交互方式的应用,使得可灵2.0大师版在视频及图像创作可控生成与编辑能力上得到了全面升级,为用户提供了更加丰富的创作工具和更加便捷的创作体验。现在,无论是专业创作者还是普通用户,都可以通过可灵AI轻松实现心中的创意,用AI讲出好故事。