Open YangGangZhiQi opened 1 year ago
有个小疑问,如果单个模块就能完成推理,为什么训练阶段不直接训练单个模块,而要级联多个模块一起训练?我看到论文中有tSEN实验的说明,认为模型第一、二、三阶段能够收敛到相同的点,既然如此,只采用第一阶段已经能够完成任务,为何还要加第二、三阶段的模型?
您好,邮件已收到,我将尽快处理。
作者您好,我也有相同的问题,期待您的回答
我也有一樣的問題,希望能得到答覆
有个小疑问,如果单个模块就能完成推理,为什么训练阶段不直接训练单个模块,而要级联多个模块一起训练?我看到论文中有tSEN实验的说明,认为模型第一、二、三阶段能够收敛到相同的点,既然如此,只采用第一阶段已经能够完成任务,为何还要加第二、三阶段的模型?