作者您好，请问我用fastapi写了一个paddlers的接口，传入大图像路径开始推理，但是推理比较慢？请问有什么办法提高下推理速度吗

PaddlePaddle / PaddleRS

Awesome Remote Sensing Toolkit based on PaddlePaddle.

Apache License 2.0

365 stars 88 forks source link

Open funny000 opened 1 month ago

funny000 commented 1 month ago

Thanks for your issue. To help us better solve the issue, please provide the following information：

欢迎您的提问。辛苦您提供以下信息，以方便我们快速定位和解决问题：

Bobholamovic commented 1 month ago

你好，请问你是想寻找低并发请求时降低模型推理延时的办法吗？如果是这样的话，我建议首先确认服务使用静态图而非动态图格式的模型，导出静态图模型的方式可以参考这里。对于图像分割和变化检测任务，还可以试试PaddleRS的滑窗推理API（支持动态图和静态图），使用方式可以参考这里。

funny000 commented 1 month ago

谢谢作者，是低并发降低推理延迟的问题，模型已经导出静态图了，用的滑窗推理，就是图像比较大，现在batchsize为1，blocksize512，一张图需要10分钟左右，我再尝试加大batchsize试试，

Bobholamovic commented 1 month ago

嗯嗯，可以尝试调整batch size、窗口大小、滑动步长、重叠部分融合策略，这些参数都会影响推理速度与效果。如果图像实在太大，而部署服务的机器资源充足，也可以考虑对图像进行分块，然后使用多个进程（每个进程分别有一个模型实例，每个模型实例占用一块GPU）对分块进行并行处理，最后融合。