【Stability AI 发布 Stable Video Diffusion 模型,可根据图片生成视频】
Stability AI 公司发布其最新的 AI 模型 —— Stable Video Diffusion,能够通过现有图片生成视频。
该模型目前仅供研究用途,它包含了两个最先进的 AI 模型 SVD 和 SVD-XT。
SVD 可以将静态图片转化为 14 帧的 576×1024 的视频。SVD-XT 使用相同的架构,但将帧数提高到 24。两者都能以每秒 3 到 30 帧的速度生成视频。
SVD 和 SVD-XT 都能生成质量相对较高的视频,然而 Stability AI 表示,它也有一些局限性。
它们在生成相对较短(不到 4 秒)的视频时,缺乏一定的真实感,不能生成没有运动或缓慢的镜头平移的视频,也不能通过文本进行控制,无法生成清晰的文本,并且可能无法正确地生成人脸和人物。