IDEA-CCNL / Fengshenbang-LM

Fengshenbang-LM(封神榜大模型)是IDEA研究院认知计算与自然语言研究中心主导的大模型开源体系,成为中文AIGC和认知智能的基础设施。
Apache License 2.0
4.02k stars 377 forks source link

Dreambooth微调问题 #332

Open hjxwhy opened 1 year ago

hjxwhy commented 1 year ago

感谢开源!关于dreambooth微调问题,中文里如果选择触发词(就是论文里那个[V])呢?用中文微调dreambooth效果都很差。

Desein-Yang commented 1 year ago

感谢开源!关于dreambooth微调问题,中文里如果选择触发词(就是论文里那个[V])呢?用中文微调dreambooth效果都很差。

中文也可以用[V],这里[V] 只要是个非常罕见的 token 就行了,选[V]或者自己加一个special token都行。

从之前调的情况来看,如果直接换成中文/中文拼音确实很容易和已存在的语义冲突就效果不好,采用加special token+20张数据训练就能不错。