Closed rebornwwp closed 4 years ago
你好,首先你需要定位性能瓶颈在哪:
transform_image
之类的函数,那么你可以使用gunicorn多个web service,readme有写用法可以先试试再留言~
看了下,确实是cpu的瓶颈,我先试试把程序改改。
谢谢了
@rebornwwp 你好,请问解决了吗?我也遇到同样的问题。
初步确认是cpu的瓶颈,数据预处理的时候太消耗cpu了,需要对预处理代码做一些操作。我叫别人做的,自己没时间,不知道做的咋样了
好的,谢啦。我再改改看。
Hi,
我生产环境的架构是nginx + gunicorn + flask + tf-serving,部署在阿里云ECS上,现在想增加并发量。cpu的使用率很低,gpu能达到60-70%,压测用的是locust。我发现加一块gpu之后rps并不会线性增长。单个gpu rps在120左右,latency在300ms左右,加一个gpu rps只能增加到150左右,感觉可能传输是瓶颈,用service-streamer能起作用吗?Thanks.
@pharrellyhy 可以,用多进程模式,一个进程一块gpu,参考example
@Meteorix Thanks. I‘ll give it a try. BTW, service streamer的稳定性如何,我现在大概一天有100多万的请求量,会不会突然挂掉呢?
@Meteorix Thanks. I‘ll give it a try. BTW, service streamer的稳定性如何,我现在大概一天有100多万的请求量,会不会突然挂掉呢?
主要看qps吧,压力测试on your own了,可以另开一个issue讨论
@Meteorix OK, 我先试试. btw,因为我现在已经用了gunicorn + flask了,用service-streamer的话是不是就不用gunicorn了?
还是可以用gunicorn来实现多进程
@Meteorix Got it, thanks!
您好,我最近在用您的开源框架做webservice后端多卡预测的部分,我们做的是目标检测方面的模型,想要增加后端的并发量,但是我用了多卡的时候,发现并不能提高我的并发,我把代码贴出来给您,您来看看是不是哪里有些问题呢。 或者说请问一下在这一块有没有一些改进的方法呢?
希望可以帮忙,谢谢, thanks.