前言


在上一篇中我们了解了Prompt的基础知识,这篇我们结合文生图模块下的采样器和各种参数对于生成图片的细节做一些讲解,每一个参数都有自己对应的含义,也会对生成的图有一定的影响。


具体

1. 采样方法

采样方式就是指sd用什么算法进行图片生成,影响出图质量以及出图速度。

以下是各种采样方式的出图效果:

  • Euler a速度和质量都非常不错,适合快速出图,但是要注意自己的提示词,因为快也很容易出一些崩坏图;
  • DDIM和Euler则需要一定的好的运气,需要反复抽卡;
  • DPM++2系列算法则以相对步数就可以达到其他算法的质量甚至更高(一般来说带++的都是升级版);
  • LMS、DPMfast、LMSKarras和PLMS这几个算法则不太推荐;
  • 新版UniPC(Unified Predictor-Corrector):2023年新出的算法,统一预测校正器,兼容性很好,收敛10步左右就能生成图片,部分旧模型会崩;
  • 新版Restart:渲染速度较慢,但10步以内就能生成图片,而且图片质量还不错;
  • 新版LCM:需要结合Lora和SDXL。
2. 迭代步数(Steps)

原则上采样迭代步数越高,图片则会越精细,但是需要申明采样迭代步数并不是越高越好,图片的质量是有上限的,过高的采样迭代步数只会增加出图的速度以及增加崩坏的几率,但是也有研究表明,过高的迭代步数有助于手部的生成,不过呢大部分情况下,,高的迭代步数并不会有较大的收益。

对于不同的模型也有各种不同的采样迭代步数:

  • DDIM和EulerA一般为30以上40以下;
  • DPM2A则一般为60以上;
  • DPM系列则一般为20以上30以下;
  • Restart一般10左右;
  • UniPC一般10左右。

但是有个异类DPMadaptive这个采样方式,采样迭代步数对于这个采样方法是不生效的。

当然这个并不是通用的,更多是一种参考值,更加具体的,可以参考模型的推荐步数。

推荐几个组合参数:DPM++2M Karras 26步;Eulera 30步;UniPC 12步。

3. 人物修复(ADetailer插件)

面部修复这个插件能很好的控制了人物的脸型、眼睛、体型、四肢,保证了生成人物时不再扭曲变形。一般三次元图片可以开启面部修复,对于二次元图片并不建议开启修复支持效果不是很好。

基础功能:启用一定要开启;一个单元加载一个AD模型,这些模型需要独立下载,如果要修复一个人物,每个单元分别加载一个不同类别的AD模型,比如脸部 ,眼睛等;这里的提示词功能与主提示词填写区域是一致的,比如,选的是脸部模型,那这里填的提示词可以是”makeup,fundoshi,eyeshadow,lipstick,mascara,long_eyelashes,red_lips_,facepaint,“非必填项。

进阶功能:这一期就不讲了,参数较多,新同学可以跳过这里。

4. 高分辨率修复

这个可是神器之一,可以把模糊的图片变清晰

高分迭代步数:在高分辨率修复阶段的迭代步数,0-10数值,值越高生成的图片细节会更多;

重绘幅度:0-1数值,值越高与原图区别越大,一般0.5-0.7最佳;

放大倍率:进行等比例放大,这样图片的细节会更加清晰,质量更加高,如果放大倍数是2时图片分辨率会从512768变为10241536,高清修复的时候不要直接拉动宽度和高度;

宽度和高度:自定义高宽度,如果这里设置了参数,那么放大倍率则会关闭。

放大算法:在后期处理模块的章节我会把所有放大算法讲一遍,这里就列举几个常用并且效果较好的放大算法,三次元的用R-ESRGAN4x+,二次元用R-ESRGAN4x+Anime6B。

5. 宽度和高度

这个应该很容易理解吧,就是图片的宽度和高度,配置太低的不要调太大,会无法出图,并且如果宽高设置过大,会出现多人,多手,多脚,多头等奇异画风,这个主要是因为模型训练时大多数是使用小图进行训练,当生成图片过大,AI会认为这是多张图合并而成,当需要生成大图时,建议使用高清修复功能。

💡 需注意:SD1.5和2.1模型基础512512分辨率,SDXL和XL_turbo基础10241024分辨率

在我们了解了模型的基础分辨率之后,那么我们为了避免怪图产生,所以我们一般用512*512,当生成的图片内容满意了之后,我们再用高分率修复的功能,把图片放大处理,这样一般就不会生成出怪图。

Tips:512*512(1:1),512*768(3:4),512*848(9:16)按照这个比例去生成图片很大几率不会生成怪图。

6. 生成批次和每批数量

这个需要一起说明,生成批次是指生成多少次,每批数量是指一次生成多少张,生成批次对显存要求不高,但是每批数量对显存的要求较高,一般我们需要出多张图时,只设置生成批次即可,每批数量过多容易导致爆显存,生成批次只会影响出图速度。

7. 提示词引导系数(CFGScale)

就是SD多大程度上会听从你的指令。

1-基本上不理会你的提示;

3-更具创造性;

7-在遵守提示和自由之间取得良好的平衡(默认值);

15-更加遵守提示;

30-严格遵守提示;

8. 随机种子

你可以认为这个就是图片的特征值,当为-1的时候是随机生成。当你生成了一张图之后,你想要固定这张图的风格样式结构等,你可以让AI生成一个固定种子值,那么在下一次生成图的时候用同样提示词、参数以及Seed值生成出的图基本与上次大致是一致的。

9. 模板区域操作

  1. 箭头:读取上一次的提示词模板;
  2. 笔记本:输入大批量提示词用的文本编辑器;
  3. 垃圾桶:删除所有提示词;
  4. 模板:调用已选择模板的所有提示词;
  5. 魔法棒:一键整理提示词区域内的格式;
  6. 多选下拉框:单选多选提示词模板;
  7. 编辑:编辑提示词模板。
    • 1)单选下拉框:选择一套提示词模板或起名保存;
    • 2)刷新:顾名思义;
    • 3)模板:选择一套提示词模板后,导出该模板提示词;
    • 4)小电脑:快速导入webUI端的提示词进入模板;
    • 5)正向提示词:与webUI端一样;
    • 6)反向提示词:与webUI端一样。
    • 另:选中提示词模板后可删除,在下拉框处起名后的提示词模板即保存。

总结


在本章节中,我们深入探讨了采样器和参数调整对生成图像质量与风格的显著影响。这些知识对于追求图像生成精确度和风格一致性的同学们来说,无疑是宝贵的资源。结合上一章节中对提示词的深入讲解,我们得以全面掌握如何通过精确的参数设置和创意的提示词撰写,来创造出既高质量又风格统一的图像作品。希望这些内容能够为各位同学的创作之旅提供有力的支持和启发。