百度在近期举办的AI DAY开放日上,隆重推出了其自主研发的视频生成模型MuseSteamer,这一创新技术为全球视频创作者带来了前所未有的高效与专业的智能化解决方案。MuseSteamer以多样化的版本矩阵,包括Turbo版、Lite版、Pro版及全系列有声版,满足了不同用户的个性化创作需求。
百度商业研发总经理刘林在会上深入阐述了MuseSteamer的核心突破,他强调,指令理解与遵循能力是衡量多模态大模型性能的关键指标。MuseSteamer凭借其卓越的遵循力,真正实现了创作者“所思即所得”的创作自由,重新定义了叙事艺术的边界。
在展示MuseSteamer生成的古装武侠视频时,观众被其高度逼真的动态内容和专业级镜头语言深深吸引。视频中,侠客与巨型怪物的搏斗场景惊心动魄,特写镜头下的面部微表情自然生动,运镜技巧更是堪称电影级别。这一技术的突破,使得普通用户也能轻松创作出具有叙事张力的视频作品。
短片《她总在三点一刻出现》则展示了MuseSteamer在电影级艺术表现力方面的成就。通过10秒超长镜头和1080P高清画质,视频细腻呈现了男女主角之间的互动细节,同时融入了王家卫式的色彩美学,为观众带来了一场视觉盛宴。这一技术的突破,无疑为创作者提供了更广阔的创作空间和表达自由。
MuseSteamer不仅擅长画面生成,还能同步生成音效和人物台词,实现了声音与画面的自然融合。在沙漠越野主题的短片中,系统智能生成了与画面动作相匹配的立体声效,如发动机轰鸣声和轮胎与沙地摩擦的声响,为观众带来了身临其境的视听体验。这一技术的创新,使得MuseSteamer成为全球首个实现中文音视频一体化生成的视频模型。
在技术层面,MuseSteamer的卓越表现得益于百度在数据、算法和审美方面的深厚积累。该模型构建了亿级规模的中文多模态数据库,通过三级优化体系实现了业界领先的语义对齐精度。同时,采用精细化结构设计,支持多模态条件输入,确保了对画面细节和主体运动轨迹的精准遵循。MuseSteamer还能生成高清视频,呈现出电影级流畅转场和逼真的物理运动规律。
随着MuseSteamer的发布,全新AI视频创作平台“绘想”也同步上线。用户可以通过PC端搜索“MuseSteamer”或“绘想”,免费体验Turbo版功能,探索AI视频创作的无限可能。同时,百度还举办了“绘想·跨次元捏合”AI视频创作大赛,鼓励参赛者上传图片,借助MuseSteamer的强大能力生成创意视频作品,进一步激发创作热情。