Stable Video Diffusion

开源项目

SVD视频生成模型

Direct link Mobile view

简介

Stable Video Diffusion (SVD) 是 Stability AI 推出的开源视频生成模型，基于 Stable Diffusion 的架构扩展而来。SVD 可以将静态图像转换为视频，在学术界和工业界都有重要影响。

主要功能

图像到视频：静态图像转动态视频
开源免费：完全开源使用
高质量输出：高质量视频生成
本地部署：支持本地运行
可定制性：支持微调和优化
商业友好：宽松的开源协议

适用场景

SVD 适用于研究人员、开发者、AI 爱好者等需要使用或研究视频生成技术的用户。对于需要本地部署和高度定制的场景来说是理想选择。

官网与入口

官网：https://stability.ai/stable-video-diffusion

GitHub：https://github.com/Stability-AI/generative-models

Hugging Face：https://huggingface.co/stabilityai

安装与使用

环境准备

conda create -n svd python=3.10
conda activate svd
pip install torch torchvision transformers diffusers accelerate

推理代码

from diffusers import StableVideoDiffusionPipeline
import torch

pipe = StableVideoDiffusionPipeline.from_pretrained(
    "stabilityai/stable-video-diffusion",
    torch_dtype=torch.float16,
    variant="fp16"
)
pipe.enable_model_cpu_offload()

# 生成视频
frames = pipe(image, fps=7, num_frames=25).frames[0]

在线体验

可在 Hugging Face Spaces 在线体验 SVD 模型。

价格与版本

开源免费

完全免费使用

云服务

Replicate 等平台提供付费 API

开源版本完全免费，遵守 Creative ML OpenRAIL-M 协议

使用技巧

🖼️

图像质量

使用高质量输入图像效果更好。

🎬

帧数设置

根据需要调整帧数和帧率。

💾

显存优化

启用 CPU offload 节省显存。

⚙️

微调模型

可针对特定场景微调。

常见问题

使用如何开始使用？

从 Hugging Face 下载模型或通过 diffusers 库使用。

配置需要什么显卡？

建议 16GB 以上显存，可通过 CPU offload 在小显存上运行。

商用可以商用吗？

遵守 Creative ML OpenRAIL-M 协议，允许商业使用。

局限有什么局限？

目前仅支持图像到视频，不支持纯文本到视频。

小结

Stable Video Diffusion 作为 Stability AI 的开源视频生成模型，为研究人员和开发者提供了强大的工具。对于需要本地部署和深度定制的场景来说是优秀的选择。

行动号召：访问 Hugging Face 体验 SVD 模型！

简介