Closed youyuge34 closed 2 years ago
esmm.py里L55-65,按照你的写法,两个Tower都是相同的结构,同样的3层linear层。而非论文以及你模型注释里的 : hidden_dim: list of ctr and ctcvr dnn hidden sizes。
正确应该是两个Tower各自两个linear层,且hidden size不同。
你的模型可视化:
应该是我理解错注释了,注释的本身以及模型本身 两个Tower就构造相同hidden size的结构。
esmm.py里L55-65,按照你的写法,两个Tower都是相同的结构,同样的3层linear层。而非论文以及你模型注释里的 : hidden_dim: list of ctr and ctcvr dnn hidden sizes。
正确应该是两个Tower各自两个linear层,且hidden size不同。
你的模型可视化:![image](https://user-images.githubusercontent.com/15784256/131798827-08ed3b0a-62cb-4e6b-960a-2c4e79c4a88b.png)