Closed weyoung0 closed 2 years ago
@weyoung0 建议用batch=2 用别的话修改这个地方成1张图就行 就行 https://github.com/chenbinghui1/DSL/blob/45ee8fd1bc267f8d9fb1763d4979d7b0a9efc989/mmdet/runner/hooks/semi_epoch_based_runner.py#L193
@chenbinghui1 感谢大佬的快速回复,请问batch为2有什么说法吗?因为我输入尺寸调的512,batch为2只占一丁点显存,浪费好多GPU,事实上我训的时候调成了72。。还有就是监督baseline训出来的指标和我自己的模型差好多,不知道哪里出了问题
@chenbinghui1 因为当前代码只扩增了一张无标注数据,batch太多其他的unlabel数据都没有得到扩增,所以相当于没有怎么用这个Lscale。另外 监督模型那边 那就得对齐你的模型了,监督模型就是普通fcos的resnet50没有别的东西;可能是augmentation不同把。
@chenbinghui1 好的,我再对齐下监督模型试试,非常感谢!
换用自己数据集训练时报错:
batch设为8,输入分辨率设为512x512,debug了一下,发现在semi_epoch_based_runner.py第186行开始, data_batch['img_metas']、data_batch['gt_bboxes']data_batch['gt_labels']添加了一个元素,而data_batch['img'] cat了一个batch-1的图像tensor。导致网络的模型输入tensor维度变成(15,3,512,512),而label相关的信息为9张图像的,进而在计算loss时出现了AssertionError。 请问大佬这里是我代码没理解对还是确实有bug呢?