[Bug]: got RuntimeError: Triton Error [CUDA]: device kernel image is invalid when running deepseek-v2

Your current environment

The output of `python collect_env.py`

Collecting environment information... WARNING 07-08 14:14:25 _custom_ops.py:14] Failed to import from vllm._C with ModuleNotFoundError("No module named 'vllm._C'") PyTorch version: 2.3.0+cu118 Is debug build: False CUDA used to build PyTorch: 11.8 ROCM used to build PyTorch: N/A

OS: CentOS Linux 7 (Core) (x86_64) GCC version: (GCC) 10.5.0 Clang version: Could not collect CMake version: version 3.29.3 Libc version: glibc-2.17

Python version: 3.9.16 | packaged by conda-forge | (main, Feb 1 2023, 21:39:03) [GCC 11.3.0] (64-bit runtime) Python platform: Linux-4.18.0-147.mt20200626.413.el8_1.x86_64-x86_64-with-glibc2.17 Is CUDA available: True CUDA runtime version: 11.8.89 CUDA_MODULE_LOADING set to: LAZY

🐛 Describe the bug

The code is

from transformers import AutoTokenizer
from vllm import LLM, SamplingParams

model_name = 'deepseek-ai/DeepSeek-Coder-V2-Lite-Instruct'
max_model_len, tp_size = 8192, 1
tokenizer = AutoTokenizer.from_pretrained(model_name)
llm = LLM(model=model_name, tensor_parallel_size=tp_size, max_model_len=max_model_len, trust_remote_code=True,enforce_eager=True)
sampling_params = SamplingParams(temperature=0.3, max_tokens=256, stop_token_ids=[tokenizer.eos_token_id])

messages_list = [
    [{"role": "user", "content": "Who are you?"}],
    [{"role": "user", "content": "write a quick sort algorithm in python."}],
    [{"role": "user", "content": "Write a piece of quicksort code in C++."}],
]

prompt_token_ids = [tokenizer.apply_chat_template(messages, add_generation_prompt=True) for messages in messages_list]

outputs = llm.generate(prompt_token_ids=prompt_token_ids, sampling_params=sampling_params)

generated_text = [output.outputs[0].text for output in outputs]
print(generated_text)

the error is RuntimeError: Triton Error [CUDA]: device kernel image is invalid

vllm-project / vllm

[Bug]: got RuntimeError: Triton Error [CUDA]: device kernel image is invalid when running deepseek-v2 #6204

Your current environment

🐛 Describe the bug