Closed xxg98 closed 7 months ago
在config.ini中修改了use_logn_attn = 1,用api_server启动的时候仍然不生效
启动转换后的模型: lmdeploy serve api_server ./internlm2-chat-7b-turbomind --server-name 0.0.0.0 --server-port 6006 --tp 1 --session-len 210000 --rope-scaling-factor 2 --cache-max-entry-count 0.2
python3.10 cuda11.8 显卡A40 模型:internlm2-chat-7b
No response
这部分有bug。api_server会覆盖config.ini 我们在v0.2.3版本中修复下
好的,谢谢了
Checklist
Describe the bug
在config.ini中修改了use_logn_attn = 1,用api_server启动的时候仍然不生效
Reproduction
启动转换后的模型: lmdeploy serve api_server ./internlm2-chat-7b-turbomind --server-name 0.0.0.0 --server-port 6006 --tp 1 --session-len 210000 --rope-scaling-factor 2 --cache-max-entry-count 0.2
Environment
Error traceback
No response