说明文档
名称: 4x-UltraSharp(包含配置和预设!)
许可证: CC BY-NC-SA 4.0
链接: https://mega.nz/folder/qZRBmaIY#nIG8KyWFcGNTuMX_XNbJ_g
模型架构: ESRGAN
放大倍率: 4
用途: 任意,这是一个通用模型。该模型在 JPEG 压缩图像上表现最佳。
迭代次数: 150k
批次大小: 4-8
高清尺寸: 128
训练轮次: ~480
数据集: 非常多。我使用了:我自己拍摄的 RAW 图像、SignatureEdits、AdobeMIT-5K、DIV2K、来自 brucethemoose 的 TLOK、来自 ALSA 的一些岩石/石头图像,以及 @esrgan 提供的许多图像(感谢!)
数据集大小: 呃,忽略这个。整个训练过程中大约在 2k 到 8k 张全尺寸图像之间
OTF 训练: 是(自定义增强预设)
预训练模型 G: 4x-UniScale-Balanced
描述: 这是我目前最好的模型!它能够生成大量细节,并在图像上留下不错的纹理。它适用于大多数图像,无论是否经过压缩。不过它在 JPEG 压缩图像上确实表现最好,因为这主要是它的训练内容。它还能够修复高度压缩的图像!
该模型使用 KernelGAN 进行训练(感谢 musl 提供模糊核)、噪声块、自定义增强预设(随模型一起提供),以及以下损失函数:pixel、feature、cx、ssim、lpips 和 fft。曾经使用过 Mixup,但由于稳定性问题而被放弃。
梯度裁剪对整个训练过程中的模型稳定性帮助极大。
非常感谢 musl 就如何进一步改进模型给出的建议!
Kim2091/UltraSharp
作者 Kim2091
创建时间: 2024-01-03 00:48:17+00:00
更新时间: 2024-08-08 19:06:14+00:00
在 Hugging Face 上查看