cecret3350 / DEA-Net

[IEEE TIP 2024] DEA-Net: Single image dehazing based on detail-enhanced convolution and content-guided attention
217 stars 10 forks source link

模型训练问题 #17

Open Baekstar opened 7 months ago

Baekstar commented 7 months ago

作者你好,为什么训练HAZE4K数据集时出现这种错误并且不往下执行呢?删除了experiment之后还是会出现 为什么会执行多次option_train中检查文件夹是否存在的语句呢

error
cecret3350 commented 7 months ago

您好,我在ubuntu22.04下并未遇到过这种问题。出现这种问题似乎是因为使用windows导致,可以试试把num_workers改为0

Baekstar commented 7 months ago

您好,我在ubuntu22.04下并未遇到过这种问题。出现这种问题似乎是因为使用windows导致,可以试试把num_workers改为0

感谢回复,换了服务器可以了

ChengchengFU commented 7 months ago

您好,我在ubuntu22.04下并未遇到过这种问题。出现这种问题似乎是因为使用windows导致,可以试试把num_workers改为0

感谢回复,换了服务器可以了

您好,我遇到了和您同样的问题,能麻烦问一下您成功运行的服务器配置吗,感谢!

chenyy521 commented 7 months ago

我的也是这样的问题,换成ubuntu20.04也是这样的问题

tongchangD commented 7 months ago

作者 option_train.py 下的更改如下代码

if not os.path.exists(model_dir):
    os.mkdir(model_dir)
    opt.saved_model_dir = os.path.join(model_dir, 'saved_model')
    opt.saved_data_dir = os.path.join(model_dir, 'saved_data')
    opt.saved_plot_dir = os.path.join(model_dir, 'saved_plot')
    opt.saved_infer_dir = os.path.join(model_dir, 'saved_infer')
    os.mkdir(opt.saved_model_dir)
    os.mkdir(opt.saved_data_dir)
    os.mkdir(opt.saved_plot_dir)
    os.mkdir(opt.saved_infer_dir)
else:
    print(f'{model_dir} has already existed!')
    exit()

替换成

if os.path.exists(model_dir):
    import shutil
    print(f'{model_dir} has already existed!')
    shutil.move(model_dir,model_dir+str(time.time()))
else:
    os.mkdir(model_dir)
    opt.saved_model_dir = os.path.join(model_dir, 'saved_model')
    opt.saved_data_dir = os.path.join(model_dir, 'saved_data')
    opt.saved_plot_dir = os.path.join(model_dir, 'saved_plot')
    opt.saved_infer_dir = os.path.join(model_dir, 'saved_infer')
    os.mkdir(opt.saved_model_dir)
    os.mkdir(opt.saved_data_dir)
    os.mkdir(opt.saved_plot_dir)
    os.mkdir(opt.saved_infer_dir)

作者只是怕覆盖训练好的模型,如此改即可,再者注意windows下的路径问题,相对路径不行就改成绝对路径吧

yanjius123 commented 6 months ago

9cc768135e0f1a54e2e053e3cae539b 大神,一开始训练时,就出现这种情况,这种怎么解决

03191083 commented 1 month ago

您好,用新的数据集训练成功后,如何去测试图像。我直接调用了best.pk文件当作预训练模型,然后报错了。