TextGen: Implementation of Text Generation models, include LLaMA, BLOOM, GPT2, BART, T5, SongNet and so on. 文本生成模型,实现了包括LLaMA,ChatGLM,BLOOM,GPT2,Seq2Seq,BART,T5,UDA等模型的训练和预测,开箱即用。
Apache License 2.0
935
stars
109
forks
source link
NotImplementedError: Cannot copy out of meta tensor; no data! #36
在SFT的模型训练中,报错如下: