cswry / SeeSR

[CVPR2024] SeeSR: Towards Semantics-Aware Real-World Image Super-Resolution
Apache License 2.0
331 stars 14 forks source link

复现训练过程中,训练中间的checkpoint测试发现效果并不好,这正常吗? #43

Open beyondbatman-master opened 1 month ago

heart-du commented 1 month ago

同样的问题,请问你有复现论文里的结果吗

beyondbatman-master commented 1 month ago

同样的问题,请问你有复现论文里的结果吗

我现在还没有训练完,用3/4训练时长的checkpoint和提供的模型文件对比效果,发现还有不小的差距,主要是在细节上差距较大

heart-du commented 1 month ago

可以加联系方式交流一下吗,我这么训完了也没有完整复现,效果上主要是比较容易出现模糊的问题。

Chantec commented 1 month ago

可以加联系方式交流一下吗,我这么训完了也没有完整复现,效果上主要是比较容易出现模糊的问题。

请问您用的几张显卡训练的 得多大显存呢

cswry commented 1 month ago

你好,可以给一下你的训练设置、具体测试的iteration和模型表现吗?

beyondbatman-master commented 1 month ago

你好,可以给一下你的训练设置、具体测试的iteration和模型表现吗? 你好,训练设置如下 CUDA_VISIBLE_DEVICES="0,1,2,3" accelerate launch --main_process_port=9999 train_seesr.py --pretrained_model_name_or_path="preset/models/stable-diffusion-2-base" --ram_ft_path 'preset/models/DAPE.pth' --enable_xformers_memory_efficient_attention --mixed_precision="fp16" --resolution=512 --learning_rate=5e-5 --train_batch_size=3 --gradient_accumulation_steps=2 --null_text_ratio=0.5 --dataloader_num_workers=2 DAPE使用的是提供的模型文件 使用的数据集是文章中的DIV2K, DIV8K, Flickr2K, OST和前10K张FFHQ数据集图像,训练了140k iterations,最后效果是在细节上相比提供的checkpoint差一些,比如 bad good 整体很接近,细节上有些模糊,其它图像也能发现类似的情况