Open AlisonDexter opened 4 months ago
是不是用新的数据集,通过train.py就能训练出来新的模型
是的,但是需要有一定的数据量,否则会出现类似下面的问题 https://github.com/yangjianxin1/GPT2-chitchat/issues/126
是的,但是需要纯净的数据量,否则会出现类似的问题 #126
我用了20万MB的语料训练,但是还是乱码,除了增加数据量和fine turn,还有什么原因会导致乱码
能看一下具体的乱码以及使用的数据集吗? 如果只是出现词不达意,那也不算乱码。
是不是用新的数据集,通过train.py就能训练出来新的模型