天脉资讯
财经快讯 价值公司 财经人物 IPO解读 热门赛道 经济解码 科技业界 文化艺术 消费零售 大燕公益 商业快讯

百度自研视频生成模型MuseSteamer:中文音视频一体化,一图秒变电影级有声视频

2025-07-03来源:天脉网编辑:瑞雪

百度商业研发团队近期宣布了一项重大技术突破,正式推出了自研的视频生成模型“MuseSteamer”及其配套的创作平台“绘想”。这一创新之举标志着全球首个能够实现中文音视频一体化生成的视频模型的诞生。

与传统的AIGC视频制作流程相比,MuseSteamer打破了“先画面后配音”的传统模式,实现了画面、音效与人声台词的协同创作,极大地提升了视频制作的效率与创意空间。

MuseSteamer的技术实力不容小觑。该模型支持从一张图片生成长达10秒、分辨率达到1080p的电影级画质视频。更令人惊叹的是,视频中的人物微表情与运镜效果均达到了专业影视制作的水准。这一成就的背后,是百度商业研发团队在亿级中文多模态数据清洗、精细化视频结构化描述语言以及多目标强化学习等关键技术上的深厚积累与优化。

为了满足不同创作者的需求,MuseSteamer模型家族推出了多个版本,包括Turbo、Lite、Pro及全系列有声版。这些版本覆盖了从普通视频创作者到专业影视制作机构的广泛需求。目前,Turbo版已在绘想平台上限时免费开放公测,而其他版本也将在8月陆续与公众见面。

百度商业研发团队的这一创新之举,无疑为视频创作领域带来了新的活力与可能。随着MuseSteamer的广泛应用,我们有理由期待更多富有创意与想象力的视频作品涌现,为观众带来更加丰富的视听盛宴。

江苏浙南装备技术公司申请新专利,全自动视觉点焊机器人提升焊接均匀度
国家知识产权局信息显示,江苏浙南装备技术有限公司申请一项名为“一种全自动视觉点焊机器人”的专利,公开号CN121820857A,申请日期为2026年2月。 专利摘要显示,本发明涉及智能制造技术领域,且公开了一…

2026-04-11

上海朗尚传感技术获新专利:超声环境感知助力微型无人机室内精准定位
国家知识产权局信息显示,上海朗尚传感技术有限公司取得一项名为“一种超声环境感知的微型无人机室内定位方法及系统”的专利,授权公告号CN121498718B,申请日期为2026年1月。 天眼查资料显示,上海朗尚传…

2026-04-11

道氪云申请机器人关节电机专利,提升振动抑制与磨损评估预测能力
国家知识产权局信息显示,道氪云(上海)科技有限公司申请一项名为“一种机器人关节电机同步控制系统”的专利,公开号CN121821404A,申请日期为2026年3月。通过天眼查大数据分析,道氪云(上海)科技有限公…

2026-04-11