Closed fly12357 closed 1 year ago
MGDA原文只使用了HPS结构,对于PLE和MMOE这类型的结构,实现上仍然可以使用representation的梯度,但不能保证这样做是完全有道理的
MGDA原文只使用了HPS结构,对于PLE和MMOE这类型的结构,实现上仍然可以使用representation的梯度,但不能保证这样做是完全有道理的
嗯嗯~多谢回复。 1. 我看到LibMTL是支持不同结构和weighting策略进行组合的。使用LibMTL里面的PLE和WGDA-UB的组合方式的话,是直接采用gate加权求和后的representation? 2. 请问你们有做过PLE和不同的weighting策略的combine的情况下的实验对比?
MGDA-UB原文中求representation的梯度,对于PLE和MMOE这类模型来说,representation是经过gate加权求和后的representation?