[BUG] <title>fastchat + vLLM +OpenAI API 调用qwen模型，数据不需要预先处理吗

是否已有关于该错误的issue或讨论？ | Is there an existing issue / discussion for this?

[X] 我已经搜索过已有的issues和讨论 | I have searched the existing issues / discussions

该问题是否在FAQ中有解答？ | Is there an existing answer for this in FAQ?

[X] 我已经搜索过FAQ | I have searched FAQ

当前行为 | Current Behavior

官方给出的调用方式为： openai.ChatCompletion.create( model="Qwen-7b-chat", messages=[ {"role": "user", "content": "你好"} ], ) 但是qwen 模型接收的输入格式不应该是这样吗？ <|im_start|>user\n你好<|im_end|>\n<|im_start|> 请问vllm+openai 自己实现了预处理还是需要自己处理成这样呢？ openai.ChatCompletion.create( model="Qwen-7b-chat", messages=[ {"role": "user", "content": "<|im_start|>user\n你好<|im_end|>\n<|im_start|>"} ], )

期望行为 | Expected Behavior

复现方法 | Steps To Reproduce

运行环境 | Environment

- OS:
- Python:
- Transformers:
- PyTorch:
- CUDA (`python -c 'import torch; print(torch.version.cuda)'`):

QwenLM / Qwen

[BUG] <title>fastchat + vLLM +OpenAI API 调用qwen模型，数据不需要预先处理吗 #1244