Open wangjiangyue0226 opened 1 year ago
基于lora的方式finetune模型后,推理时间很长,平均时间要40s,而相同的case直接用chatglm-6b推理平均时间要16s
基于lora的方式finetune模型后,推理时间很长,平均时间要40s,而相同的case直接用chatglm-6b推理平均时间要16s