[refactor] consolidate handlers to share llm_handler between python rest api server and grpc server

vectorch-ai / ScaleLLM

A high-performance inference system for large language models, designed for production environments.

https://docs.vectorch.com/

Apache License 2.0

317 stars 24 forks source link

Closed guocuimi closed 2 months ago