[Bug]: vllm:num_requests_waiting is not being published at /metrics endpoint

vllm-project / vllm

A high-throughput and memory-efficient inference and serving engine for LLMs

Apache License 2.0

26.76k stars 3.92k forks source link

🐛 Describe the bug

Data for vllm:num_requests_waiting is missing.

vllm:num_requests_waiting is not being published at /metrics endpoint

docker image for vllm : vllm-openai:v0.5.3.post1

# HELP vllm:num_requests_waiting Number of requests waiting to be processed.
# TYPE vllm:num_requests_waiting gauge
vllm:num_requests_waiting{model_name="/data/models/model-gemma2-a100/experiment-it1"} 0.0

Before submitting a new issue...

[X] Make sure you already searched for relevant issues, and asked the chatbot living at the bottom right corner of the documentation page, which can answer lots of frequently asked questions.

vllm-project / vllm

[Bug]: vllm:num_requests_waiting is not being published at /metrics endpoint #7918

🐛 Describe the bug

Before submitting a new issue...