查看原文
其他

免费AI生图,无限、且不要求电脑配置!

李榜主 AIhackathon 2023-12-23

背景介绍


AI绘画发展比较关键的点


  • Disco Diffusion 是发布于Google Colab 平台的一款利用人工智能深度学习进行数字艺术创作的工具,它是基于MIT 许可协议的开源工具,可以在Google Drive 直接运行,也可以部署到本地运行。Disco Diffusion 有一个弊端,就是速度非常慢,动辄 半个小时起步。


  • Midjourney是Disco Diffusion的原作者Somnai所加入的AI艺术项目实验室。Midjourney 对 Disco Diffusion 进行了改进,平均1分钟能出图。
  • OpenAI推出 DALL·E 2, DALL-E 2实现了更高分辨率和更低延迟,而且还包括了新的功能,如编辑现有图像。
  • stability.ai 推出 Stable-Diffusion并且开源了。一经推出就受到广大网友的喜爱,操作简单,出图快,平均10-20秒。Stable-Diffusion 免费、生成速度又快,每一次生成的效果图就像是开盲盒一样,需要不断尝试打磨。

Stable Diffusion
Stable Diffusion 是 Stability AI 推出的一个基于深度学习技术的生成图片AI模型。

Stable Diffusion Web UI 
是一个强大好用的 Stable Diffusion Web 应用,你可以使用它来操作 Stable Diffusion 生成图片。一般用它 GitHub 账号中的 A1111 代称。
要运行 Stable Diffusion,你的电脑需要有一块强大的GPU和较大的运行内存。如果你没有这样的硬件,你仍然可阿里里上免费试用3个月,只要一个支付宝账号扫码即可。

如何在阿里云上搭建 Stable Diffusion Web UI
1、领取2个三个月免费试用的工具
登录阿里云,支付宝扫码登录即可。有个免费试用的入口,先领取免费试用,不先开通,开通以后就没有免费试用了。按照流程操作即可。
  • 函数计算FC
  • 文件存储NAS

2、在函数计算FC里安装Stable Diffusion应用


3、访问Stable Diffusion


点击链接1:访问Stable Diffusion


默认白色主题,跟随系统,强制变成黑色主题,在链接后面加上【 /?__theme=dark】



点击链接2:访问部署Stable Diffusion的具体文件夹,跟你自己的电脑一样,可以浏览文件。模型文件、插件文件等都可以打开这里访问。
上面的是目录,下面三个分别是:嵌入、插件、模型文件夹。建议看一下这些目录,后面提到的模型、插件,如果你是先下载的可以直接放到这些目录里去就算安装好了。
SD的目录:/mnt/auto/sd ,复制粘贴到里面,可以访问打开SD的目录。

4、安装模型
在阿里云安装应用后,会自带 sd-v1-5inpainting的基础模型,其他模型要自己装,不同模型有不同的生图效果。
我们目前使用比较多的主要包括2类模型:大模型、微调模型
大模型常见的大模型一般为Checkpoint(ckpt)和safetensors两种格式,大模型一般是通过Dreambooth训练得到,特点是出图效果好,但是由于训练的是一个完整的新模型,所以训练速度普遍偏慢,生成模型的文件较大,一般都在几个G。
微调模型微调模型需要配合大模型使用,常见包括Embedding模型、Hypernetwork模型、Lora模型、VAE模型(常用的是Embedding和Lora模型)。
  • Embedding模型主要用于定义新关键字来生成新的对象或风格的小文件(图像风格引导)。不会改变模型,只是定义新的关键字来实现某些样式。如果大模型是一本书,那么Embedding模型就是在书本里增加了一些书签,书签上增加了一些新的关键词与对应的图像效果。
  • LoRA模型简单理解就是大模型的补丁,可以用于修改图像风格/增加细节。因为效果很好并且训练较为快速和简单,所以性价比最高,也是目前最常用的微调模型。如果大模型是一本书,那么Embedding模型就是书的一个修补版。

来自civitai对模型的分类


模型下载渠道:模型商店
  • civitai
  • hugging face 

Civitai和Hugging Face都是AI相关的平台,但它们的重点和用途有所不同。
Civitai是一个用于Stable Diffusion AI Art模型的平台。用户可以浏览来自不断增长的创作者数量的模型收藏,加入活跃的社区,共同审查模型并分享带提示的图像,以帮助你开始创建艺术作品1。
Hugging Face,是一家美国公司,开发了用于构建使用机器学习的应用程序的工具。它最为人所知的是其为自然语言处理应用程序构建的transformers库,以及允许用户分享机器学习模型和数据集的平台2。
简而言之,Civitai更侧重于AI艺术模型的创建和分享,而Hugging Face更侧重于为自然语言处理和其他机器学习任务提供工具和平台。
(这一段介绍,来自chatGPT的介绍)
根据你自己的需求,下载不同的模型进行生图。根据Civitai上的模型说明进行安装与使用即可。

5、安装插件
5.1、中文插件
在阿里云上安装应用以后Stable Diffusion Web默认是英文的,如果你不熟悉可以安装中文插件。
方法1:通过后台插件在线安装。1、点击插件;2、点击可用的插件;3、点击load from 可以将后面链接的插件列表加载出来(所有的插件都会注册到这个文件里);4、把隐藏 localization 勾选项去掉,就可以搜索到中文插件了。
方法2:填入插件地址在线安装
插件地址:https://github.com/hanamizuki-ai/stable-diffusion-webui-localization-zh_Hans
方法3:将插件下载了下来,放到插件文件的目录里(如何访问看前文),解压以后的文件全部放到插件目录里即可。
安装完成以后,在setting的user interface 里把本地语言,切换为刚才安装的插件,保存设置,并重新启动UI。
所有的插件安装方式都是这3种,同时大部分插件在安装以后,都可以在设置里找到一些配置选项。

5.2、提示词自动补全插件 Tag autocompletion

Tag autocompletion 帮助你没有写完成的提示词进行快速补全,是基于一个本地词库实现的。通过后台插件搜索在线安装即可。
效果如下:


5.3、提示次反推插件 Tagger


Tagger 将提示词反推出来,并按照它认为最有价值、最接近的词排序,方便你挑选提示词 。通过后台插件搜索在线安装即可。


5.4、图片浏览器
没有装这个插件时,历史生成的文件和信息我们只能通过,文件目录里的output文件去访问。图片浏览器提供在浏览器中浏览创建的图像的界面。需要重启一下SD,才可以在页面上看到该插件。
5.5、其他进阶插件
  • Infinite zoom 无限放大视频制作
  • Cutoff 提示词分割控制,让提示词之间互相不干扰
  • Local latent couple 局部潜空间放大
  • ultimate sd upscale 终极放大脚本

这样就可以无限发挥你的AI生图技能了!
我创建了一个【Stable Diffusion 】交流群,一起交流Stable Diffusion与场景的结合,欢迎SD生图高手,以及利用SD做应用的朋友,后台回复关键词【SD】扫码入群交流。
题图来自civitai官网截图
继续滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存