Open donpromax opened 4 years ago
改进前:train到5W epoch左右就会发生梯度爆炸,导致generator只能产生噪声。 改进后:发挥了WGAN training稳定的特性,目前train了16W个epoch,输出还是可以稳定提升。
其他改进:使用Deconvolution,输出放大仔细看,好像能观察到棋盘状暗纹。可能是Conv_Transpose导致的overlap。如果把discriminator改为upsampling+Conv2D的结构应该可以消除,由于该改进我还在train,具体效果还有待确认
在看源码的过程中发现了一点小问题
2.按照WGAN的要求改完logits作为loss后,我发现train起来不能收敛,经过反复检查,发现是gradient penalty的计算有些问题,将原有函数如下之后可以很好地收敛: