这两天那是各种找资料,各种翻帖子。足足花了两天时间整理了3个优化图片细节的方案,推荐给趣闻屋的朋友们。请大家欣赏:
1.Ultimate SD Upscale 放大图片增加细节算法
2.高清化算法 4x-UltraSharp,可出4k图不失真
3.反向提示词Negative Embeddings微调模型,不再为使用一大串的负面提示词而烦恼了
Ultimate SD Upscale 放大增细算法
Github地址:
https://github.com/Coyote-A/ultimate-upscale-for-automatic1111
它的介绍极其简短,寥寥几句:

重点:不挑显卡!
原理是把图片切块,然后增加放大并细节后再平铺重合。但只在图生图使用(img2img)。
1.安装:

2.重启webUI

3.在图生图的脚本(Script)里能看到 Ultimate SD Upscale,就说明安装成功喽
在图生图(img2img)界面下,下拉网页到最低端,点击【脚本script】:

出现 Ultimate SD Upscale 字样,说明安装成功:

安装成功!
4.使用体验:
正向提示词:
(masterpiece:1.0), (best quality:1.0), (ultra highres:1.0) ,(8k resolution:1.0),(realistic:1.0),(ultra detailed1:0), (sharp focus1:0), (RAW photo:1.0),
1 girl,cute, kind smile, solo, detailed hair, random hair style
反向提示词:
Negative prompt: (easynegative:1.2), (worst quality: 1.2), (low quality: 1.2),
模型和参数:
Steps: 30, Sampler: DPM++ SDE Karras, CFG scale: 7, Seed: 959946334, Size: 1024×1024,
Model: revAnimated_v11-inpainting,
Denoising strength: 0.3, Conditional mask weight: 1.0
官方建议,Denoising strength 参数在0.3-0.5之间,趣闻屋这里使用0.3。

脚本参数只是演示用哈,同学们在实际应用中请自行调节,各有所爱嘛。
512*512原图:

图1
使用图生图原生拉伸放大的2倍的:

图2
使用图生图 Ultimate SD Upscale 脚本放大2倍的效果:

图3
可以看到,脸部和耳朵的细节增多,光影更加明显。当然有的同学可能更喜欢皮肤平滑一点的,那同学们就自行抉择了。哈哈哈!~
高清化算法 4x-UltraSharp
有没有同学被放大后,图像总有种塑胶感所困扰?趣闻屋,之前也总是无可奈何,各种寻找解决办法。终是皇天不负有心人!哈哈哈!
4x-UltraSharp,解决了我放大到4k还能保留和优化细节的愿景。
1.安装
下载地址:
https://mega.nz/folder/qZRBmaIY#nIG8KyWFcGNTuMX_XNbJ_g

下载完成后,放到 webui 的models 的 ESRGAN目录底下:
stable-diffusion-webuimodelsESRGAN

2.重启命令窗口 和 webui
重启后,在【高分辨率修复】下【高清化算法】下拉菜单下,选择【4x-UltraSharp】

就可以使用喽!
来看来一下 4x-UltraSharp 和 R-ESRGAN 4x+ 的对比,使用相同参数
正向提示词:
(masterpiece:1.0), (best quality:1.0), (ultra highres:1.0) ,(8k resolution:1.0),(realistic:1.0),(ultra detailed1:0), (sharp focus1:0), (RAW photo:1.0),1 girl,cute, kind smile, solo, detailed hair, random hair style
反向提示词:
(easynegative:1.2), (worst quality: 1.2), (low quality: 1.2)
参数和模型设置:
Steps: 20, Sampler: DPM++ SDE Karras, CFG scale: 7, Seed: 1556666231,
Face restoration: CodeFormer, Size: 512×512,
Model: revAnimated_v11-inpainting,
Denoising strength: 0.5, Conditional mask weight: 1.0, Hires upscale: 2, Hires steps: 10,
这是使用 R-ESRGAN 4x+:

这是使用 4x-UltraSharp:

如果不太明显,我们放大到4k来看:
R-ESRGAN 4x+:

4x-UltraSharp:

这对比度就很高了吧!
R-ESRGAN 4x+ 在放大到4K分辨率的时候基本就失真了,而4x-UltraSharp依然能很好的保留细节和色彩。
赞一个!
反向提示词Negative Embeddings微调模型
Negative Embeddings,是一组经过训练的Textual Inversion模型。他们分类将常用的反向提示词训练嵌入到一个文件里面,方便使用。
用法这样:

存放目录:
stable-diffusion-webuiembeddings
长这样的:

下载地址:
https://huggingface.co/yesyeahvh/bad-hands-5/tree/main
https://huggingface.co/datasets/Nerfgun3/bad_prompt/tree/main
https://huggingface.co/nick-x-hacker/bad-artist/tree/main