近日,阿里巴巴(中国)有限公司在视频生成技能限制取得了新进展,一项名为“一种图生视频门径和安设”的专利被崇敬公布。据天眼查常识产权信息显现,这项专利的公布标记着阿里巴巴在智能化视频生成方面迈出了蹙迫一步。
该专利的中枢在于,通过一种翻新的试验例,收场了从静态图像到动态视频的智能化退换。具体而言,该门径最初将包含打算对象的源图像输入到一个全心假想的第一视频生成模子中,从而生成一个基础的素材视频。接下来,字据这个素材视频,系统会自动细目一个帧间变换矩阵序列,这个序列用于形容视频中帧与帧之间的变换联系。
在获得了帧间变换矩阵序列后,系统会进一步从源图像中索求出打算对象对应的对象掩码图像。这个掩码图像极度于一个“模板”,用于在后续技艺中准确地识别和索求打算对象。随后,将帧间变换矩阵序列应用于这个对象掩码图像,生成一系列掩码图像,构成掩码图像序列。同期,将帧间变换矩阵序列也应用于源图像,生成一系列打算对象图像,构成打算对象图像序列。
有了这些基础数据后,系统会字据源图像、掩码图像序列和打算对象图像序列,细目一个打算输入数据。这个数据被输入到一个守旧局部重绘的第二视频生成模子中。这个模子大概应用前边的数据,生成一个与打算对象高度匹配、且领会轨迹各样的打算视频。
这种门径收场了智能化端到端的图生视频生成,无需事前设定领会参数。这意味着,系统大概自动地字据源图像中的打算对象,生成具有丰富领会轨迹的视频,同期保捏打算对象在视频中的明晰度和连贯性,幸免了打算对象的扩散问题。
阿里巴巴的这项专利,无疑为视频生成技能带来了新的冲破。跟着智能化技能的不休发展,这种图生视频门径将在各个限制推崇越来越蹙迫的作用,为东说念主们的活命和职责带来更多便利和乐趣。