bojone / SPACES

端到端的长本文摘要模型(法研杯2020司法摘要赛道)
386 stars 91 forks source link

with_mlm='linear'作用 #29

Open yunhaoli1995 opened 3 years ago

yunhaoli1995 commented 3 years ago

请问一下with_mlm='linear'zhe一行,with_mlm不是布尔型变量吗,为什么要用字符串赋值。

yunhaoli1995 commented 3 years ago

提这个问题是因为我参照autotitle_multigpu.py把苏神代码改成多卡的时候会有问题,loss一直降不下去,生成效果也不好,但是去掉这一行之后loss就能正常下降了。