Open zouhan6806504 opened 1 month ago
请提供你使用的PaddleDetection版本和Paddle版本,以便于我们排查问题。
请提供你使用的PaddleDetection版本和Paddle版本,以便于我们排查问题。
项目“ikcest2024_notebook”共享链接(有效期三天):https://aistudio.baidu.com/studio/project/partial/verify/8294004/4a9858342afa488d8eac9acd98c09667 按序执行即可看见 detection2.7 paddle2.5
可能需要将这两处的x.numpy()[0]
修改为np.array(x.numpy())[0]
:
https://github.com/search?q=repo%3APaddlePaddle%2FPaddleDetection%20%22.numpy()%5B0%5D%22&type=code
可能需要将这两处的
x.numpy()[0]
修改为np.array(x.numpy())[0]
: https://github.com/search?q=repo%3APaddlePaddle%2FPaddleDetection%20%22.numpy()%5B0%5D%22&type=code
这几处改了之后依然会有“0D Tensor cannot be used as 'Tensor.numpy()[0]'” 我尝试着把paddle版本改成2.6的,结果log确实没有了,但是生成的txt文件全部是空的
请问日志里有报错信息吗?
请问日志里有报错信息吗?
改成paddle2.6后,日志没报错
如果没有报错的话,那结果为空会不会是模型效果问题呀?请问是否使用了自己的数据呢,以及模型在验证集上的精度如何?
如果没有报错的话,那结果为空会不会是模型效果问题呀?请问是否使用了自己的数据呢,以及模型在验证集上的精度如何?
训练的数据都是一样的,感觉不是模型的问题,训练的时候--eval和dla34对比过的,loss比dla34低,而且我只是在fairmot_dla34的基础上换了个backbone而已DLA->ResNet101
如果没有报错的话,那结果为空会不会是模型效果问题呀?请问是否使用了自己的数据呢,以及模型在验证集上的精度如何?
dla的loss最少都有4.4左右,resnet101能到4.2 下面是resnet101的训练log
[09/12 09:28:19] ppdet.engine INFO: Epoch: [13] [10500/10687] learning_rate: 0.000174 loss: 4.230835 heatmap_loss: 0.332204 size_loss: 0.522570 offset_loss: 0.156625 det_loss: 0.551854 reid_loss: 1159.913696 eta: 5 days, 7:38:55 batch_cost: 2.6880 data_cost: 0.0003 ips: 1.4881 images/s
[09/12 09:32:47] ppdet.engine INFO: Epoch: [13] [10600/10687] learning_rate: 0.000174 loss: 4.205076 heatmap_loss: 0.312019 size_loss: 0.504238 offset_loss: 0.155205 det_loss: 0.523159 reid_loss: 1159.933716 eta: 5 days, 7:34:25 batch_cost: 2.6793 data_cost: 0.0003 ips: 1.4929 images/s
dla的
[09/10 13:17:44] ppdet.engine INFO: Epoch: [13] [5200/5343] learning_rate: 0.000279 loss: 4.377353 heatmap_loss: 0.517096 size_loss: 0.592028 offset_loss: 0.163601 det_loss: 0.738086 reid_loss: 1160.759399 eta: 4 days, 0:43:39 batch_cost: 2.8901 data_cost: 1.8178 ips: 2.7681 images/s
[09/10 13:22:36] ppdet.engine INFO: Epoch: [13] [5300/5343] learning_rate: 0.000279 loss: 4.386300 heatmap_loss: 0.523919 size_loss: 0.597360 offset_loss: 0.163826 det_loss: 0.752244 reid_loss: 1160.773315 eta: 4 days, 0:26:39 batch_cost: 2.9197 data_cost: 1.8222 ips: 2.7400 images/s
两者的batch因为显存的关系差1倍
请问是在什么数据上测试结果为空呢?
dla输出结果正常嘛
问题确认 Search before asking
请提出你的问题 Please ask your question
配置文件如下
eval的时候会疯狂输出warning
像这种组装配件后还需要注意哪些地方要改动?