Closed huia711 closed 2 weeks ago
使用peft包将lora微调权重加载到模型中,实现加载lora微调权重后的推理代码。
基于 Gradio 框架的一个Web demo,支持打断输出、调整模型参数,如温度,最长输出等。
使用peft包将lora微调权重加载到模型中,实现加载lora微调权重后的推理代码。