yangjianxin1 / GPT2-chitchat

GPT2 for Chinese chitchat/用于中文闲聊的GPT2模型(实现了DialoGPT的MMI思想)
2.99k stars 680 forks source link

训练模型问题 #133

Open AlisonDexter opened 4 months ago

AlisonDexter commented 4 months ago

是不是用新的数据集,通过train.py就能训练出来新的模型

WThirteen commented 4 months ago

是的,但是需要有一定的数据量,否则会出现类似下面的问题 https://github.com/yangjianxin1/GPT2-chitchat/issues/126

AlisonDexter commented 4 months ago

是的,但是需要纯净的数据量,否则会出现类似的问题 #126

我用了20万MB的语料训练,但是还是乱码,除了增加数据量和fine turn,还有什么原因会导致乱码

WThirteen commented 4 months ago

能看一下具体的乱码以及使用的数据集吗?
如果只是出现词不达意,那也不算乱码。