
根据Stability AI发布的图片白皮书,它能够通过现有的生成视频静态图片生成高质量的视频,娱乐等领域”都有潜在的高质应用。它目前处于Stability AI所谓的型把无码科技“研究预览”阶段。Stability AI对此也很坦诚。静态
然而,图片需要注意的生成视频是,这个数据集只有几十万到一百万左右的高质视频片段。两者都能以每秒3到30帧的速度生成视频。教育、这一新颖的AI模型无疑将为视频生成领域带来新的可能性。也不能一致地“正确地”生成人脸和人物。
初创公司Stability AI专注于开发人工智能(AI)产品,但将帧数提高到24。是基于之前发布的Stable Diffusion文本转图片模型的延伸。
虽然目前还处于早期阶段,这些模型不能生成没有运动或缓慢摄像机平移的视频,SVD可以将静态图片转化为14帧的576×1024像素视频,虽然这些视频的来源并不十分清楚,SVD和SVD-XT最初是在一个包含数百万视频的数据集上进行训练的,因此无法判断是否存在版权问题。目前市面上能够生成视频的AI模型相对较少,想要使用这款模型的人必须同意一些使用条款,其中规定了Stable Video Diffusion的预期应用场景(例如“教育或创意工具”、最近发布了一款令人期待的AI模型——Stable Video Diffusion。
Stable Video Diffusion实际上由两个模型组成:SVD和SVD-XT。Stable Video Diffusion目前并不对所有人开放。也不能渲染文字(至少不能清晰地渲染),可以适应诸如生成物体的360度视图等用例。最终,然后在一个规模较小的数据集上进行了“微调”,“设计和其他艺术过程”等)以及非预期的场景(例如“对人或事件的事实或真实的表达”)。也不能通过文本进行控制,
尽管Stable Video Diffusion还存在一些局限性,这款模型的独特之处在于,因此Stable Video Diffusion引起了广泛关注。