训练stage2的时候，timesteps的设置的问题

exisas / LGC-VD

MIT License

35 stars 2 forks source link

训练stage2的时候，timesteps的设置的问题 #7

Open tangdong1994 opened 4 months ago

tangdong1994 commented 4 months ago

你好，我看你的代码和你的论文中提到的一些细节有些对不上，不知道是不是我理解错了，就是我看论文中提到，用将x0加噪声到592步，然后预测的x0_hat，作为下一段视频生成的last clip；但是我看你的代码里面在训练的时候，好像没有固定为592步去训练stage2，是有什么考量吗？还是实验证明随机步长得到的效果也挺好这种

exisas commented 4 months ago

你好，我看你的代码和你的论文中提到的一些细节有些对不上，不知道是不是我理解错了，就是我看论文中提到，用将x0加噪声到592步，然后预测的x0_hat，作为下一段视频生成的last clip；但是我看你的代码里面在训练的时候，好像没有固定为592步去训练stage2，是有什么考量吗？还是实验证明随机步长得到的效果也挺好这种

训练过程中没有固定为592步去训练stage2，论文中的592是可视化结果的时候随便选的

tangdong1994 commented 4 months ago

好的，谢谢了；就是我还有一个问题，就是关于误差累积的问题，就是我的自回归的推理生成一直有一个问题，就是生成的内容随着推理的内容越长，后面生成的细节会越来越差，就比如我生成一个人站着不动，这个人身上的颜色和细节会越来越差，不知道你有没有遇到过这个问题呢