字节最新OmniHuman数字东说念主模子行将上线即梦

发布日期：2025-03-21 15:32 点击次数：76

近期，即梦AI在官方外交媒体上发布了一条新功能上线预报片。视频自满，接管了全新的多模态视频生成模子OmniHuman，用户仅需输入一张图片和一段音频，就不错生成一条活泼的AI视频，有望大幅升迁AI短片的制作效用和质地。

图片来自即梦AI视频号实质截图

OmniHuman本当事人页信息自满，该模子为字节跨越自研的闭源模子，可维持肖像、半身以及全身等不同尺寸的图片输入，并把柄输入的音频，在视频中让东说念主物生成与之匹配的行为，包括演讲、唱歌、乐器演奏以及迁徙。关于东说念主物视频生成中常见的手势崩坏，也比较现存错误赢得了显赫的改善。此外，对动漫、3D卡通等非真东说念主图片输入的维持限制也较为出色，生成的视频能保合手特定作风和原有的畅通模式。

把柄本当事人页展示的演示限制来看，OmniHuman的生成限制还是具有较高的当然度。为防患该项本事被不妥欺骗，字节跨越本事团队在主页中十分标注称，OmniHuman将不会对外提供下载。

即梦AI关连精致东说念主透露，该模子现在已具备较好的发扬，但在生成影视着实级别的视频上仍存在一定的升迁空间。由其维持的多模态视频生得胜能会在即梦上以小限度内测的花样进行调优诊疗，并徐徐灵通。该精致东说念主同期示意，即梦还会对这一功能成就严格的安全审核机制，况兼对输出的视频标注水印以作指示，从而确保AI施展正面、积极的作用，助力视频创作家更好地兑现思象力的抒发。

热点资讯