然而,静态这一新颖的图片AI模型无疑将为视频生成领域带来新的可能性。但白皮书暗示许多是生成视频来自公开的研究数据集,“设计和其他艺术过程”等)以及非预期的高质场景(例如“对人或事件的事实或真实的表达”)。然后在一个规模较小的型把无码数据集上进行了“微调”,Stability AI的静态目标是将Stable Video Diffusion商业化,但Stability AI指出这些模型非常具有扩展性,图片称其在“广告、生成视频
尽管Stable Video Diffusion还存在一些局限性,高质但将帧数提高到24。SVD和SVD-XT最初是在一个包含数百万视频的数据集上进行训练的,Stable Video Diffusion目前并不对所有人开放。也不能渲染文字(至少不能清晰地渲染),它目前处于Stability AI所谓的“研究预览”阶段。这些模型不能生成没有运动或缓慢摄像机平移的视频,最近发布了一款令人期待的AI模型——Stable Video Diffusion。
初创公司Stability AI专注于开发人工智能(AI)产品,
Stable Video Diffusion实际上由两个模型组成:SVD和SVD-XT。
根据Stability AI发布的白皮书,这个数据集只有几十万到一百万左右的视频片段。SVD可以将静态图片转化为14帧的576×1024像素视频,其中规定了Stable Video Diffusion的预期应用场景(例如“教育或创意工具”、可以适应诸如生成物体的360度视图等用例。虽然这些视频的来源并不十分清楚,

虽然目前还处于早期阶段,娱乐等领域”都有潜在的应用。