Open carrie0307 opened 4 years ago
@carrie0307 根据reprod_all_exps.sh可以看出用的是transformer得到的结论。不过我这边复现的时候,在相同的参数设置下,获得的结果要高于论文报告的结果,而且提升幅度挺大的,不知道你是否获得相同结论。
@YuanEric88 问下你用的是哪些参数跑的结果比论文中还好啊,是用的这个代码里的数据集吗,batch_size是多少啊,跑了多少个epoch收敛了呢?结果能看下吗?
@YuanEric88
请问一下您是用transformer还是bert跑的?最后获得了多少的结果?感谢
您好!感谢您精彩的论文及分享的代码! 请问论文中报告的实验结果是使用BERT还是仅用Transformer的呢? 期待您的回复!