天脉资讯
财经快讯 价值公司 财经人物 IPO解读 热门赛道 经济解码 科技业界 文化艺术 消费零售 大燕公益 商业快讯

字节OmniHuman模型上线即梦,AI视频生成将迎新变革?

2025-02-08来源:天脉网编辑:瑞雪

近日,即梦AI在其官方社交媒体平台上发布了一则激动人心的消息,预告了一项名为OmniHuman的全新多模态视频生成模型的上线。这一创新技术允许用户仅通过一张图片和一段音频,就能轻松创建出栩栩如生的AI视频,预示着AI短片制作效率和质量的显著提升。

据即梦AI发布的视频内容显示,OmniHuman模型是由字节跳动自主研发的闭源技术,它能够接收包括肖像、半身及全身等不同规格的图片输入,并根据提供的音频内容,在生成的视频中让人物做出与音频相匹配的动作,无论是演讲、歌唱、乐器演奏还是行走,都能一一呈现。尤为该技术对于人物视频生成中常见的手势失真问题,相较于现有方法有了显著的改善。

OmniHuman还支持非真人图片输入,如动漫、3D卡通等,生成的视频不仅保持了原有的风格和运动模式,而且效果同样出色。从技术主页展示的演示效果来看,OmniHuman所生成的视频已经具备了相当高的自然度,令人赞叹不已。

然而,为了防止这项技术被滥用,字节跳动技术团队明确表示,OmniHuman将不会对外开放下载。这一决定无疑是为了确保技术的安全性和合规性。

即梦AI的相关负责人透露,尽管OmniHuman模型目前的表现已经相当不错,但在生成接近影视真实级别的视频方面,仍有进一步提升的空间。因此,该模型支持的多模态视频生成功能将在即梦平台上以小范围内测的形式进行调优,并逐步向用户开放。同时,为了确保AI技术的正面应用和积极影响,即梦AI将为此功能设置严格的安全审核机制,并对输出的视频添加水印作为提醒。

这一系列的举措不仅展示了即梦AI在技术创新方面的实力,也体现了其对社会责任的担当。相信随着OmniHuman技术的不断优化和推广,将为视频创作者提供更多可能性,帮助他们更好地实现创意和想象力的表达。

国产AI新突破!MiniMax M3模型发布 长上下文与多模态能力再升级
MiniMax披露,在100万上下文规模下,M3单token计算量仅为上一代模型的约1/20,推理效率显著提升。MiniMax披露,在100万上下文规模下,M3单token计算量仅为上一代模型的约1/20,推…

2026-06-01

英伟达推出NVIDIA Isaac GR00T开源人形机器人参考设计,2026年底有望面世
此外,英伟达Isaac GR00T开发者平台还将支持被广泛使用的宇树G1人形机器人,相关的开发工作流预计很快将在GitHub和Hugging Face上开源。根据官方路线图,这款开源人形机器人参考设计将于2…

2026-06-01

星迈创新:以AI技术为翼 引领全球泳池机器人行业开启智慧清洁新篇章
尤其是 AquaSense X的推出,首次将AI环境感知、智能路径规划、全域清洁与自清洁基站整合为完整系统,推动泳池机器人从“自动化工具”迈向具备环境理解与自主清洁能力的“AI智能化清洁伙伴”。 在这一行业…

2026-06-01

OpenAI战略转型:从AI算法到机器人全链条布局,开启具身智能新篇章
人工智能(AI)领域巨头OpenAI发布公告,宣布大力扩张内部机器人事业部,正式全面切入硬件赛道,实现从人工智能算法研发向机器人编程+实体设备制造全链条布局的战略转型。Sora等世界模拟技术让AI理解物理世界…

2026-06-01

美象信息EVR-X平台:以三大优势破局,助力企业数字孪生落地转型
在浙东某三甲医院项目中,孪生系统对接近了4000个物联设备,10多套医疗业务系统,覆盖30余个数据主题,包括门诊管理、住院监护、数字手术室、智慧物流、能耗监控、车库管理、后勤管理、安防管理等多个典型场景,日…

2026-06-01

华为6月1日全场景发布:nova 16系列登场,MatePad Pro Max及鸿蒙智家齐亮相
新京报贝壳财经讯(记者张晓慧)6月1日,“华为nova全场景发布会”上,nova 16系列、华为MatePad ProMax以及华为鸿蒙智家等多款新品亮相。 华为MatePad Pro Max采用华为平板…

2026-06-01