关于fusion_rep的实现问题

DataTerminatorX / Keyword-BERT

279 stars 55 forks source link

Open a396198172 opened 4 years ago

a396198172 commented 4 years ago

请问目前为止，fusion_rep的实现方式[rep_CLS, rep_a, rep_b, rep_a-rep_b, rep_b-rep_a]和[rep_CLS, dense([rep_a, rep_b)]，还是第一个的效果最好吗？还是说尝试出了更好的实现方式，所以改成第二种了？

DataTerminatorX commented 4 years ago

从理论分析看，第二种会好一些，因为dense所能表达的信息量比简单的fusion trick 要好从指标看，提升细微，反而dense引入额外的参数量对inference 速度有所牺牲，所以综合考虑，在上线时依然用的第一种