1、使用paddle2.6环境导出的inference模型和使用paddle2.3环境导出的inference模型，他们在使用trt加速的时候（基于paddleetection2.3代码），性能差异大吗？

PaddlePaddle / PaddleDetection

Object Detection toolkit based on PaddlePaddle. It supports object detection, instance segmentation, multiple object tracking and real-time multi-person keypoint detection.

Apache License 2.0

12.83k stars 2.89k forks source link

1、使用paddle2.6环境导出的inference模型和使用paddle2.3环境导出的inference模型，他们在使用trt加速的时候（基于paddleetection2.3代码），性能差异大吗？ #9210

Open stephen-TT opened 1 week ago

stephen-TT commented 1 week ago

1、使用paddle2.6环境导出的inference模型和使用paddle2.3环境导出的inference模型，他们在使用trt加速的时候（基于paddleetection2.3代码），性能差异大吗？

2、同一个paddle2.3版本的inference模型（paddle2.6训练，paddle2.3导出），在1050ti（CUDA 10.2\CUDNN 7.6.5\trt7.0.0.11）上面和3070（CUDA 11.2\CUDNN 8.2.1\TENSORRT 8.0.1.6）上面使用trt加速（基于paddleetection2.3代码），我测试出加速效果没有明显的差异，这是什么原因。

Originally posted by @stephen-TT in https://github.com/PaddlePaddle/PaddleDetection/issues/9091#issuecomment-2467055027

Bobholamovic commented 1 week ago

推理速度和使用的推理引擎版本（看起来你测试的两种情况都是paddle 2.3？）有很大关系。对于新版本paddle导出的模型，请尝试使用新版本paddle进行推理，以确保最大化性能。

stephen-TT commented 1 week ago

我训练的时候用的是paddle2.6的环境，然后在paddle2.3环境中导出成inference模型，最后我使用paddleDetection2.3 版本的代码来对这个inference模型进行trt加速，我发现在1050ti显卡上和3070显卡上，模型的加速耗时差不多。理论上3070显卡的性能更强，应该比1050ti显卡加速更明显才对吧

Bobholamovic commented 1 week ago

推理时的耗时主要和导出以及推理使用的paddle版本有关。不同显卡上的加速效果，也和使用的CUDA版本等环境因素有关。建议使用更新的paddle版本导出和推理模型，如最新的3.0-beta；对于3070显卡，使用显卡能够支持的最新的CUDA、cuDNN和TensorRT版本。