Stable Diffusion 是一种潜在的文本到图像扩散模型,能够在给定任何文本输入的情况下生成照片般逼真的图像,培养自主自由以产生令人难以置信的图像,使数十亿人能够在几秒钟内创造出令人惊叹的艺术。
它的代码和模型权重已经公开发布,可以在大多数配备了至少8GB VRAM的适度GPU的消费者硬件上运行。
Stable Diffusion包括3个部分:变分自编码器(VAE)、U-Net和可选的文本编码器。VAE编码器将图像从像素空间压缩到更小维度的潜在空间,捕获图像更基本的语义含义。
您可以在https://stablediffusionweb.com/上免费使用Stable Diffusion在线创建美丽的艺术品。只需输入您的提示并单击生成按钮,无需编写代码即可生成您的图像!
相关导航
暂无评论...