百度发布全球首个中英音视频一体生成模型 MuseSteamer

AI ToolBox
AI ToolBox
2025年7月2日

技术突破:全球首个中英文音视频一体化生成模型诞生

7月2日,百度商业研发团队正式发布革命性视频生成模型 MuseSteamer,并同步上线配套创作平台"绘想"。这一里程碑式的创新标志着全球首款支持中英文音视频一体化生成的模型正式落地,将为内容创作行业带来深远变革。

协同创作新纪元:画面、音效、台词三位一体

MuseSteamer 最引人注目的优势在于其强大的协同创作能力,能够将画面构图、背景音效与人物台词自然融合,输出高质量视频作品。在权威评测榜单 VBench I2V 中,该模型斩获**89.38%**的综合得分,位居全球榜首。这不仅彰显了其领先的技术实力,也为创作者带来了更高效、更智能的工具支持。

一键生成电影级画质视频

借助 MuseSteamer,用户仅需上传一张静态图片,即可快速生成长达10秒、分辨率达1080p的电影级画质视频。更令人惊叹的是,生成视频中的人物微表情细腻自然,镜头调度专业流畅,达到影视制作标准。这项技术的普及,将极大降低视频创作门槛,让更多人轻松产出高品质视听内容。

"绘想"平台上线:让创作更简单直观

为提升用户体验,"绘想"创作平台同步推出,提供简洁友好的操作界面。用户可在此平台上便捷调用 MuseSteamer 的核心功能,享受直观、高效的创作流程,真正实现"灵感即现实"的内容转化。

内容创作新时代:人人皆可成为创作者

在内容驱动的时代背景下,MuseSteamer 的问世不仅是AI技术的重大突破,更是对传统创作模式的颠覆。它赋能非专业人士参与高质量视频制作,释放无限创意潜能,为观众带来更加丰富多元的视听盛宴。

展望未来:AI 创新将持续推动行业发展

随着百度在人工智能领域的持续深耕,未来或将涌现更多类似创新成果。这些技术进步将进一步激发内容生态活力,重塑数字创作格局。