Open Alexhk01 opened 1 year ago
首先,我这边在Windows上复现了这个问题,是paddle框架的bug,paddle.masked_select这个算子在gpu下的运算是错误的。附上截图:
ppyoloe模型在计算loss的时候使用到了这个算子,导致了后续结果出nan。
其次,这个问题我是在Python3.7的环境下才能复现,在Python3.9的环境下是正常的,附上截图:
最后,这个问题我已经反馈给了Paddle框架的同学,后续会进行排期修复。为了不影响你使用,建议你试一下在Python3.9环境下安装paddle-develop版本跑ppyoloe模型的训练,给你带来的不便,我们深感抱歉~
Originally posted by @ghostxsl in https://github.com/PaddlePaddle/PaddleDetection/issues/6723#issuecomment-1326083748
———— 遇到相同的问题,请问paddle框架的这个bug解决了么?
https://github.com/PaddlePaddle/Paddle/issues 在这里也提一下吧
ppyoloe模型在计算loss的时候使用到了这个算子,导致了后续结果出nan。
其次,这个问题我是在Python3.7的环境下才能复现,在Python3.9的环境下是正常的,附上截图:
最后,这个问题我已经反馈给了Paddle框架的同学,后续会进行排期修复。为了不影响你使用,建议你试一下在Python3.9环境下安装paddle-develop版本跑ppyoloe模型的训练,给你带来的不便,我们深感抱歉~
Originally posted by @ghostxsl in https://github.com/PaddlePaddle/PaddleDetection/issues/6723#issuecomment-1326083748
———— 遇到相同的问题,请问paddle框架的这个bug解决了么?