Open nieallen opened 1 year ago
请问playground每次generate都要加载一次模型?怎么改可以使速度变快一些呢?
Hi,正常来讲当前 playground 应该只会加载一次模型,只有在刷新页面的时候才会重新加载模型。
我在 这里 进行了模型的缓存,只有当刷新页面(清除缓存)后才会重新加载。
生成速度慢可能有两个原因:
感谢,已解决。请问后面会实现一下基于bloom或者glm的sft训练代码吗?
请问playground每次generate都要加载一次模型?怎么改可以使速度变快一些呢?