Open liushiton opened 1 year ago
暂时只支持转换原始模型,不能直接转int4的模型
暂时只支持转换原始模型,不能直接转int4的模型
好的谢谢,之后我试试
我之前也尝试过使用moss原始模型(moss-moon-003-sft-plugin),进行多卡部署(因为单卡放不下),然后再进行转化模型和推理,也未能成功,也不支持转化多卡部署的模型是么。
以及不知道转化moss模型后,停用词列表变量(stopping_criteria_list)如何作为模型推理时的参数。
暂时只支持转换原始模型,不能直接转int4的模型
原始模型也不行呀,fastLLM error:unsupported
请问问题解决了吗
问题未能解决,我理解moss模型,-plugin的版本恐怕都未适配。但是我需要-plugin版本的插件功能。所以我就没再尝试加速moss模型其他版本。
已经尝试过chatglm和chatglm2均成功加速,但是在尝试moss模型时(moss-moon-003-sft-plugin-int4),成功转化模型,但无法推理。同时stopping_criteria_list也不知道应该放哪里。 代码如下
报错信息如下