How to use batch? - Githubissues

isarsoft / yolov4-triton-tensorrt

This repository deploys YOLOv4 as an optimized TensorRT engine to Triton Inference Server

http://www.isarsoft.com

Other

276 stars 63 forks source link

Closed dreambit closed 3 years ago

dreambit commented 3 years ago

Hi How to use batch in order to improve inference throughput? Thanks.

philipp-schmidt commented 3 years ago

Hi, you can set your maximum batch size here: