查看原文
其他

AI绘画:新版Stable Diffusion 2.0生成真实人像技巧!

穿行者2049 今说新语 2024-04-14
前言
重新学习!本文全文3200字,带你一步步学习SD2.0版提示语编写,生成完美人像的技巧。图片较多,方便你观察每一个参数的细节影响。
很多老读者可能会疑惑,这个主题不是写过了吗?对,前面的文章《AI绘画:Stable Diffusion绘制逼真人像的技巧》确实刚发布没几天,但没想到Stable Diffusion 2.0的发布让这篇文章有些尴尬了。如果有朋友用上篇文章中介绍的完美提示语在Stable Diffusion 2.0上测试,会发现效果非常不稳定,成功率很低。网上很多用户也已经发现Stable Diffusion 2.0和原先的1.X版本在提示语方面有了很大的变化。
优点和缺点都有,其中一个是对提示语的理解有了较大的变化,取消了很多艺术家的风格数据,对一些关键词的解释也有了较大的变化,对权重的解释也有不同。原先表现良好的提示语也许会产生非常差的结果,开发者表示大家要开始学习新的提示语技巧了。这也再次提示我们在快速发展的AI行业,只有不断学习,不断实践才能跟上变化。
我花了一些时间测试了新旧版本的不同,找到了比较好的提示语组合。这篇文章就详细介绍一下Stable Diffusion 2.0绘制逼真人像的技巧,算是上一篇文章的升级版。我将抛弃1.X版本的提示语,从最简单的提示词开始,打算用尽量少的关键词实现逼真的人像效果,同时让你可以一步步的了解每个关键词对画面的影响。注意,本文目标不是生成完美无暇、美女、模特、明星风格的人像,而是追求真实性,因此不会用到beautiful、model、smooth等容易产生完美人像的词汇。你将看到的是不同年龄、不同性别、不同种族的各种普通人的肖像。
先展示一些Stable Diffusion 2.0生成的黑白肖像照(提示语在文章末尾可见)。
上面的肖像照使用的是512x512模型,所以清晰度有限。但由于Stable Diffusion V2包含了768x768的模型,所以本文后面所有图片都是用以下参数直接生成,不使用面部修复、不使用Upscale放大。与1.X相比,不仅步数少,单张生成时间大约在20秒,这应该是一个非常大的进步。
尺寸/768x768 steps/30 CFG/7.5
需要指出的是,目前提供了Stable Diffusion 2.0在线服务的有很多,但由于各家使用采样器的不同,默认配置不同,导致结果也各不相同,很多网站提供的V2.0服务生成图像还非常不稳定。所以本文主要以我使用的《这个Stable Diffusion的众包服务,可以免费使用40多个模型!》这里的Stable Diffusion 2.0服务以及下面介绍的在线Colab为例,总结的技巧和经验不一定正确。
如果你只想简单的测试,可以使用官方的Demo版,但需要注意Demo没有负面提示的功能,而Stable Diffusion 2.0对负面提示的重视度非常高。
官方Demo:https://huggingface.co/spaces/stabilityai/stable-diffusion
如果有朋友喜欢Colab形式的,可以使用下面这个Colab,支持Web UI界面的Stable Diffusion V2。
Colab地址:https://colab.research.google.com/github/qunash/stable-diffusion-2-gui/blob/main/stable_diffusion_2_0.ipynb
首先我们使用前面的文章《AI绘画:Stable Diffusion绘制逼真人像的技巧》介绍的V1.X版完美提示语生成人像,下面是生成的结果。

可以看到,虽然只用了30步,每一个画面中的细节都非常逼真了,尤其是第三张中的皮肤毛孔,非常逼真。但最大的问题是表现非常不稳定,不同图片的质量波动非常大,有些画面不完整,有些偏离画面中央。
下面看一下用本文完成后的提示语生成的画面效果。

特别注意,皮肤效果非常好,如果你和原先那篇文章中完美女性肖像对比一下,就会发现2.0版本的真实度更强,皮肤的真实度相当逼真。但并没有使用我们原先提到的皮肤、眼睛、瞳孔、头发等参数。
下面我想先不关注旧版的提示语,完全重新开始介绍一下如何用最简单的关键词生成完美人像。我将在每一步直接给出提示语,并展示效果,一步步演示新版是如何理解关键词,如何逼近完美人像的。
1、提示语:Close up studio portrait,film,detail,studio lighting
从结果上可以看到,尽管画面构图不够稳定,但每一张的细节都相当逼真,真实展现了皮肤、眼睛、毛发的细节,没有过度柔化的效果。
2、提示语:Close up studio portrait of an old chinese grandpa,film,detail,studio lighting
注意老年人特有的老年斑、坚硬毛发、萎缩的皮肤、萎缩的嘴唇。
3、对于Stble Diffusion 2.0来说,强化了对负面提示语的理解,因此负面提示语是改善出图质量的一个必须参数。所以这一步,增加简单的几个负面提示:Disfigured,cartoon,blurry,sadness ,更详细的负面提示语见文章末尾。

4、这步再转向以中国女学生肖像为目标,提示语:Close up studio portrait of a chinese college student college girl,film,detail,studio lighting

注意这一步生成的肖像有两个问题,一个是有时会生成黑白肖像照,如果你希望生成彩色肖像照,跳到下一步。另一个问题是眼睛表现不好,一大一小,解决办法在第7步。

继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存