shun-zheng / Doc2EDAG

MIT License
342 stars 72 forks source link

论文中的实验结果是使用BERT还是仅用Transformer的呢? #17

Open carrie0307 opened 4 years ago

carrie0307 commented 4 years ago

您好!感谢您精彩的论文及分享的代码! 请问论文中报告的实验结果是使用BERT还是仅用Transformer的呢? 期待您的回复!

YuanEric88 commented 3 years ago

@carrie0307 根据reprod_all_exps.sh可以看出用的是transformer得到的结论。不过我这边复现的时候,在相同的参数设置下,获得的结果要高于论文报告的结果,而且提升幅度挺大的,不知道你是否获得相同结论。

wjy3326 commented 2 years ago

@YuanEric88 问下你用的是哪些参数跑的结果比论文中还好啊,是用的这个代码里的数据集吗,batch_size是多少啊,跑了多少个epoch收敛了呢?结果能看下吗?

xnyuwg commented 2 years ago

@YuanEric88

请问一下您是用transformer还是bert跑的?最后获得了多少的结果?感谢