paddleseg RTFomer运行报错

Tim5Tang commented 1 year ago

RTFomer 运行tensorrt报错，gpu可以正常运行

环境

【FastDeploy版本】：说明具体的版本，如fastdeploy-linux-gpu-1.0.2
【系统平台】: Linux x64(Ubuntu 18.04)
【硬件】：说明具体硬件型号，如 Nvidia GPU 1080TI， CUDA 11.2 CUDNN 8.3
【编译语言】： Python3.7

~/data/deeplearning/program/deploy/FastDeploy/examples/vision/segmentation/paddleseg/python$ python infer.py --model RTFomer/ --image cityscapes_demo.png --device gpu --use_trt True [INFO] fastdeploy/vision/common/processors/transform.cc(93)::FuseNormalizeHWC2CHW Normalize and HWC2CHW are fused to NormalizeAndPermute in preprocessing pipeline. [INFO] fastdeploy/vision/common/processors/transform.cc(159)::FuseNormalizeColorConvert BGR2RGB and NormalizeAndPermute are fused to NormalizeAndPermute with swap_rb=1 [ERROR] fastdeploy/backends/tensorrt/trt_backend.cc(238)::log p2o.Conv.26: two inputs (data and weights) are allowed only in explicit-quantization mode. [ERROR] fastdeploy/backends/tensorrt/trt_backend.cc(637)::CreateTrtEngineFromOnnx Failed to parse ONNX model by TensorRT. [ERROR] fastdeploy/backends/tensorrt/trt_backend.cc(263)::InitFromOnnx Failed to create tensorrt engine. [ERROR] fastdeploy/runtime.cc(864)::CreateTrtBackend Load model from Paddle failed while initliazing TrtBackend. Aborted (core dumped)

felixhjh commented 1 year ago

方便的话可以提供下导出模型的命令，以及使用的模型，这边复现下~，这里用的是slim模型吗？

Tim5Tang commented 1 year ago

前段时间过年了，帮忙看一下这问题模型地址是官网的https://paddleseg.bj.bcebos.com/dygraph/cityscapes/rtformer_slim_cityscapes_1024x512_120k/model.pdparams 导出命令如下 python tools/export.py --config configs/rtformer/rtformer_slim_cityscapes_1024x512_120k.yml --model_path output/rtfomer/model.pdparams --save_dir output/infer_model --output_op argmax --input_shape 1 3 512 1024 我试了使用gpu可以正常推演，trt会报前面的错误

felixhjh commented 1 year ago

您好这边验证了下您提到的问题，首先最重要的问题是模型导出命令出错，这里的-input_shape 必须是1 3 512 2048，参考Paddle Seg的config文档先说下解决方案：

这个模型TRT和Paddle-TRT推理暂时不支持，可以使用Paddle Inference 后端进行GPU推理，CPU推理所有后端全部支持

除此之外，还存在的几个问题

ONNXRuntime GPU 推理报错，原因是ONNXRuntime 在GPU推理过程p2o.Conv.31融合的Pass错误，给ONNXRuntime提的issue
原生TensorRT不支持推理的原因是，RTFormer模型通过Paddle2ONNX转为ONNX模型之后p2o.Conv.26这个op的输入TensorRT不支持，具体可以看下issue，这边会反馈给Paddle Inference进行支持

Tim5Tang commented 1 year ago

好的，我仔细看了下你的回答，非常专业谢谢，等你们解决这问题。

superprogrammai commented 1 year ago

您好，这个p2o.Conv.26: two inputs (data and weights) are allowed only in explicit-quantization mode的问题现在有解决方案了吗？我在转trt的时候也遇到了

PaddlePaddle / FastDeploy

paddleseg RTFomer运行报错 #1150

环境