pengyanhui / LineaRE

23 stars 4 forks source link

您好,请问baselines的超参设置 #1

Open nnnnnzy opened 2 years ago

nnnnnzy commented 2 years ago

您好,看到您论文中transe,distmult,complex等baselines的效果都比原始论文的效果好很多。虽然您论文提到了所有模型超参选择的范围,不知是否方便公布一下各个baselines的最佳超参?十分感谢!

pengyanhui commented 2 years ago

呃!效果好很多要感谢大神 Zhiqing Sun 在 RotatE paper (本项目readme中有引用) 中提出的自对抗负采样方法,显著提升了 Distance-based KGE models 的性能。有三点:(1)损失函数的改进 (margin-based-->logsigmoid); (2)向量维度更高了,有一定提升;(3)就是负采样方法。像诸如 TransE、RotatE 和本文的 LineaRE 都是 Distance-based KGE models,以上三点都可以提升这类模型的效果;像 DistMult 和 ComplEx 这类 Bilinear(或者叫 semantic matching)模型的提升点主要在 (2),负采样方法作用不大,且这类方法不稳定,调参极难,学习率和正则化系数以及训练 epoch 数的略微变化都会导致性能发生巨大变化。而像 TransE 这类方法就比较稳定,你按照 LineaRE 的参数设置就行,顶多改改 gamma,效果差异也不会太大。Bilinear 模型的参数我也忘了,没保存,当初也是调了很久,填上后就继续调其他模型了。我印象中 Bilinear 模型的几个比较重要的参数是学习率(0.0001或0.00001吧),dim=1000,可能是容易过拟合,所以注意early stop,其他参数和 LineaRE 差不多。你先试试,我最近比较忙,等有时间我再调一调把参数放上去。

nnnnnzy commented 2 years ago

感谢感谢!