bojone / SimCSE

SimCSE在中文任务上的简单实验
591 stars 83 forks source link

有关MLM+CL做无监督训练的问题 #10

Open joczu opened 3 years ago

joczu commented 3 years ago

请问在做MLM+CL无监督训练的时候是直接用随机mask掉之后的句子做dropout计算CLloss吗?, 例如,先对句子A=[a,b,c,d,e,f]做随机MASK得到B=[a,[MASK],c,[MASK],e,f], 再把句子B两次输入到bert模型中得到dropout之后的两个句子对,然后计算得到CL loss和MLM loss 请问我说的对么?