Training error - Githubissues

hhhh0 commented 4 years ago

 0/499      6.3G      2.79     0.299     0.201      3.29         4  1.02e+03: 100%|█| 110/110 [02:37<00:00,  1.43s/it]

Traceback (most recent call last): File "train.py", line 497, in train(hyp) # train normally File "train.py", line 387, in train dataloader=testloader) File "D:\2020\prune0513\YOLOv3-ModelCompression-MultidatasetTraining-Multibackbone\test.py", line 74, in test _ = model(torch.zeros((1, 3, img_size, img_size), device=device)) if device.type != 'cpu' else None # run once File "C:\ProgramData\Anaconda3\lib\site-packages\torch\nn\modules\module.py", line 541, in call result = self.forward(*input, *kwargs) File "D:\2020\prune0513\YOLOv3-ModelCompression-MultidatasetTraining-Multibackbone\models.py", line 306, in forward return self.forward_once(x) File "D:\2020\prune0513\YOLOv3-ModelCompression-MultidatasetTraining-Multibackbone\models.py", line 358, in forward_once yolo_out.append(module(x, out)) File "C:\ProgramData\Anaconda3\lib\site-packages\torch\nn\modules\module.py", line 541, in call result = self.forward(input, **kwargs) File "D:\2020\prune0513\YOLOv3-ModelCompression-MultidatasetTraining-Multibackbone\models.py", line 279, in forward io[..., :2] = torch.sigmoid(io[..., :2]) + self.grid # xy RuntimeError: The size of tensor a (32) must match the size of tensor b (20) at non-singleton dimension 3

SpursLipu commented 4 years ago

你输入的指令是什么？

hhhh0 commented 4 years ago

python train.py --data data/coco_1225_ce.data --batch-size 6 -pt --weights weights/yolov3.weights --cfg cfg/yolov3/yolov3.cfg --img-size 512 --epochs 100 --quantized 1 --qlayers 0

yolunghiu commented 3 years ago

一样的问题，这是啥原因？

yolunghiu commented 3 years ago

@SpursLipu 大佬你这个train.py中test的代码貌似有点问题，我把量化的部分拿到我的yolo代码里能跑起来，用你这个代码跑不起来。另外想请问一下，量化这部分用warmup逐渐降低精度这个策略是咋想到的，绝了。

SpursLipu commented 3 years ago

这个问题我最近的更新会解决，大概原因已经找到了，应该是test图片的原尺寸wh非常相近就会报这个错。

SpursLipu commented 3 years ago

最新的更新已解决这个问题

SpursLipu / YOLOv3v4-ModelCompression-MultidatasetTraining-Multibackbone

Training error #19