关于文章的几点疑问 - Githubissues

yingrliu / TAAN-MTL

Adaptive Activation Network and Functional Regularization for Efficient and Flexible Deep Multi-Task Learning

MIT License

16 stars 4 forks source link

关于文章的几点疑问 #1

Open selous123 opened 3 years ago

selous123 commented 3 years ago

首先非常感谢你的非常优秀的工作。

其次在拜读了你的文章和复线你的代码之后，我有以下几个疑问，希望能得到你的答复。

为什么文章中对比方法中没有mmoe模型呢？我看你的代码中已经实现了mmoe方法（TAAN 结果要明显优于mmoe文章汇报的结果）
我在自己的业务场景下跑了TAAN的网络，在我的数据集场景下，结果震荡比较严重。请问这是正常的么？你之前有遇到过么？对于结果震荡你有什么调参的建议么？

yingrliu commented 3 years ago

您好，感谢您对这个工作的兴趣。关于您问的两个问题：

为什么文章中对比方法中没有mmoe模型呢？我看你的代码中已经实现了mmoe方法（TAAN 结果要明显优于mmoe文章汇报的结果） -- MMOE的结果是论文第一轮review之后根据reviewer的意见加上去的，我们跑了一下发现和hard-sharing的效果差不太多，受文章篇幅的限制没有加进去。
我在自己的业务场景下跑了TAAN的网络，在我的数据集场景下，结果震荡比较严重。请问这是正常的么？你之前有遇到过么？对于结果震荡你有什么调参的建议么？ -- 你有加regularization term吗，如果震荡很厉害，建议调小alpha和奇函数个数，或者先去掉regularization看一下。

selous123 commented 3 years ago

好的，非常感谢您的回复！