Closed yejunjin closed 1 month ago
当config.json文件中,.engine_config.engine_max_length = 128, .generation_config.max_length = 64, 输入提问长度80左右,就会复现。
复现日志如下:
原因:主要是https://github.com/modelscope/dash-infer/blob/40cddfd6b4cc0a0c75141c3cf5fd35a572c4d3b9/csrc/core/model/model.cpp#L403 这段代码没有进行status判断,返回了错误状态也继续执行了。
赞
在dashinfer集成进fastchat过程中,
当prompt token超过engine_max_length时当.generation_config.max_length < prompt token < .engine_config.engine_max_length,程序恢复不了。