不使用源码，直接调用paddleocr库识别，单张图片耗时接近3s

PaddlePaddle / PaddleOCR

Awesome multilingual OCR toolkits based on PaddlePaddle (practical ultra lightweight OCR system, support 80+ languages recognition, provide data annotation and synthesis tools, support training and deployment among server, mobile, embedded and IoT devices)

https://paddlepaddle.github.io/PaddleOCR/

Apache License 2.0

42.39k stars 7.65k forks source link

不使用源码，直接调用paddleocr库识别，单张图片耗时接近3s #7477

Closed ybshaw closed 1 year ago

ybshaw commented 2 years ago

如题，在本地机器上(cpu)调用paddleocr库，单张图片耗时3s左右，这个时延太长了无法部署，想问下有什么方法加速吗（基于python + flask的方式部署）

LDOUBLEV commented 2 years ago

第一次预测耗时比较慢，模型初始化需要时间，如果是连续多张图预测，从第二张图预测开始，速度会变快很多

在CPU上加速，可以开启mkldnn，设置参数 --enable_mkldnn=True，并设置合适的线程数

neozhu commented 2 years ago

我使用后台任务的进行识别，然后推送结果

ybshaw commented 1 year ago

我使用后台任务的进行识别，然后推送结果

请问大佬是怎么部署的呢，有想过代码参考吗，我基于python+flask部署每一张都很慢

ybshaw commented 1 year ago

第一次预测耗时比较慢，模型初始化需要时间，如果是连续多张图预测，从第二张图预测开始，速度会变快很多

在CPU上加速，可以开启mkldnn，设置参数 --enable_mkldnn=True，并设置合适的线程数

那请问部署服务之后，客户端调用部署好的对外接口也是这种情况吗（除了第一张慢，其他很快），怎么我在本地模拟客户端请求，每一张图片都是很慢呢，有的还需要五六秒的那种

neozhu commented 1 year ago

这种情况吗（

你可以测试以下 https://mudblazor-s.dotnet6.cn/ 就用提供源代码和hubservice 运行. 当然图片大小也会影响传输的速度。但想要秒出那可能需要对原来的代码重构用grpc提供服务性能会更好