Open yunhaoli1995 opened 3 years ago
请问一下with_mlm='linear'zhe一行,with_mlm不是布尔型变量吗,为什么要用字符串赋值。
提这个问题是因为我参照autotitle_multigpu.py把苏神代码改成多卡的时候会有问题,loss一直降不下去,生成效果也不好,但是去掉这一行之后loss就能正常下降了。
请问一下with_mlm='linear'zhe一行,with_mlm不是布尔型变量吗,为什么要用字符串赋值。