The-Learning-And-Vision-Atelier-LAVA / DASR

[CVPR 2021] Unsupervised Degradation Representation Learning for Blind Super-Resolution
MIT License
388 stars 50 forks source link

当我训练时发现numpy报错,我是不是应该修改numpy配置文件呢? #24

Open zyf1040895256 opened 3 years ago

zyf1040895256 commented 3 years ago

File "/home/XXX/anaconda3/envs/DASR/lib/python3.6/site-packages/numpy/lib/npyio.py", line 444, in load raise ValueError("Cannot load file containing pickled data " ValueError: Cannot load file containing pickled data when allow_pickle=False

zyf1040895256 commented 3 years ago

emmm 训练时候没有用到gpu怎么回事啊?

LongguangWang commented 3 years ago

Hi @zyf1040895256, 方便再贴一下整体的报错信息么,从这里提供的信息不太能确定是哪里的问题。

zyf1040895256 commented 3 years ago

Hi @zyf1040895256, 方便再贴一下整体的报错信息么,从这里提供的信息不太能确定是哪里的问题。

感谢王博士的回复,我第一个问题通过修改numpy包相关.py文件已经解决了,可是我在训练时候没有用到GPU,用的是CPU训练,怎么回事呢,在代码中添加指定GPU运行代码 显示无效ID。 Invalid device id . 我看您代码中是用的2个2080Ti,我也有空余的显卡,可是用不上。您能回复一下吗?

LongguangWang commented 3 years ago

Hi @zyf1040895256, 请检查下这里是不是设置为了False。另外请检查一下环境设置的可见GPU设备与指定的device id是否匹配。方便的话可以贴一下硬件环境以及具体的报错信息便于分析。

zyf1040895256 commented 3 years ago

Hi @zyf1040895256, 请检查下这里是不是设置为了False。另外请检查一下环境设置的可见GPU设备与指定的device id是否匹配。方便的话可以贴一下硬件环境以及具体的报错信息便于分析。

我在训练代码train.py中 加入了 os.environ["CUDA_DEVICE_ORDER"] = "PCI_BUS_ID" os.environ["CUDA_VISIBLE_DEVICES"] = "2, 3" 运行代码时 发现2 3 GPU 确实用到了,但是用的不是很多,这正常吗? image

LongguangWang commented 3 years ago

你的batch_size有改动么,如果没改动的话这个显存使用确实不太正常。

ruby1ring commented 2 years ago

请问这个 Cannot load file containing pickled data when allow_pickle=False 需要怎么解决呢

zyf1040895256 commented 2 years ago

请问这个 Cannot load file containing pickled data when allow_pickle=False 需要怎么解决呢

在data/multiscalesrdata.py文件,大约157行位置:修改代码:hr = np.load(_f,allow_pickle=True)[0]['image']即可;