Slanet_plus微调后bbox解码有错误

flow3rdown commented 1 week ago

Checklist:

使用原生的Slanet_plus进行推理结果是正确的，但是用自己微调的slanet_plus模型推理时需要将bbox_decode（https://github.com/PaddlePaddle/PaddleX/blob/517200d89719a93bc0cfc14ba9343d4270891beb/paddlex/inference/components/task_related/table_rec.py#L173 ）处的设置改为slanet的形式，是我哪里的配置的有问题吗？

请提供您使用的PaddlePaddle和PaddleX的版本号 paddlefsl 1.1.0 paddlenlp 2.8.0.post0 paddleocr 0.1.0.dev1+geaef336 paddlepaddle-gpu 3.0.0b1 paddlex 3.0.0b1
请提供您使用的操作系统信息，如Linux/Windows/MacOS Linux
请问您使用的Python版本是？ 3.10.6
. 请问您使用的CUDA/cuDNN的版本号是？ 12.1

zhangyubo0722 commented 1 week ago

训练配置使用的是SLANet_plus的config吗，SLANet_plus和SLANet两个模型在预处理部分的padding操作不一样，所以解码操作也是不一样的

flow3rdown commented 1 week ago

训练配置使用的是SLANet_plus的config吗，SLANet_plus和SLANet两个模型在预处理部分的padding操作不一样，所以解码操作也是不一样的

用的是SLANet_plus的config，启动脚本是 python main.py -c paddlex/configs/table_recognition/SLANet_plus.yaml，yaml里面的model的名字就是SLANet_plus

flow3rdown commented 1 week ago

训练配置使用的是SLANet_plus的config吗，SLANet_plus和SLANet两个模型在预处理部分的padding操作不一样，所以解码操作也是不一样的

从yaml文件来看，SLANet_plus和SLANet两者在数据预处理部分好像并没有不同？使用的都是PaddingTableImage

flow3rdown commented 1 week ago

@zhangyubo0722 您好，能帮忙看看吗，怀疑是框架本身的问题

flow3rdown commented 6 days ago

@zhangyubo0722 您好，能帮忙看看吗，怀疑是框架本身的问题

看了一下在ResizeTableImage ops中要指定resize_bboxes为True才会进行bbox的缩放，但是SLANet_plus的配置文件中并没有指定resize_bboxes为True，请问是否要设置为True呢？这一步的作用是什么呀？ @zhangyubo0722

flow3rdown commented 6 days ago

@zhangyubo0722 @jzhang533 @muare 有人能帮忙看一下吗？这应该是PaddleX自身的问题，跟ACC训练一直是0一样，难道都没人发现过吗？

liu-jiaxuan commented 6 days ago

需要在SLANet_plus配置文件中设置resize_bboxes=True，后续我们会修复此问题

flow3rdown commented 5 days ago

只修改resize_bboxes=True是不起作用的，可能要排查一下整个训练逻辑，我很疑惑的是之前都没人训练过SLANet_plus吗？这么明显的错误都没人发现。

liu-jiaxuan commented 5 days ago

后续会排查训练逻辑

flow3rdown commented 21 hours ago

请问大佬，这个问题是已经解决了吗？ @liu-jiaxuan