zhengchen1999 / CAT

PyTorch code for our NeurIPS 2022 paper "Cross Aggregation Transformer for Image Restoration"
Apache License 2.0
123 stars 8 forks source link

训练一轮之后卡主 #12

Open danganyuan opened 3 months ago

danganyuan commented 3 months ago

用五张图片作为训练集 测试一下是否可以训练 但是训练一轮之后就卡住了 2024-07-17 20:01:34,317 INFO: [train..][epoch: 0, iter: 90, lr:(1.250e-05,)] [eta: 0:00:04, time (data): 8.671 (0.015)] l_pix: 2.8637e-01 2024-07-17 20:01:39,913 INFO: [train..][epoch: 0, iter: 100, lr:(1.250e-05,)] [eta: 0:00:00, time (data): 7.860 (0.013)] l_pix: 2.5679e-01 2024-07-17 20:01:41,117 INFO: End of training. Time consumed: 0:13:07 2024-07-17 20:01:41,117 INFO: Save the latest model. 就一直卡在这 但是 gpu还在运行 并且在测试时 加载也很慢 测试五张图像的超分 需要 半个小时 这正常嘛

zhengchen1999 commented 3 months ago
  1. 输出“2024-07-17 20:01:41,117 INFO: Save the latest model.”后,训练已经结束了。在部分GPU上,可能出现无法退出的情况,手动取消训练即可,没有任何影响。
  2. 不正常。具体慢是在加载数据部分,还是推理部分。如果是加载数据部分,可能是电脑I/O问题;如果是推理部分,检查一下是否使用了GPU,以及测试图片分辨率是多少。