irfanICMLL / colorization

reading note
3 stars 0 forks source link

阅读感受:Image-to-Image with conditional adversarial network #6

Open irfanICMLL opened 7 years ago

irfanICMLL commented 7 years ago

本文致力于找到一个通用网络来避免人为对损失函数的设计,通过image-to-image的形式,使用同一种网络结构对不同问题进行处理。 本文读了最大的收获是发现作者开源了一个框架——cGAN的,本来是基于TORCH写的,不过现在也有具有智慧的大众用tensorflow写的开源版本了。 第二大的收获是,文章还提供了原始训练数据一大堆,比如对我们可能有用的包包鞋子的sketch 和 image

此外: cGAN和GAN的区别在于cGAN是让判别器可以看到真实标签的数据的。并且为了让图片细节更丰富,给生成器加入了L1正则项。 作者也提出了欧氏距离会使生成的图像模糊。因此不采用这种代价函数 通读下来大概scribbler那篇文章可能受这篇的启发。(scribbler那篇文章中也提到了两者是cocurrent work。)以及scribbler作者说自己最大的贡献是提出了一个user可控的图片输入,(就是指可以带颜色训练那个)但是感觉,也没用到新的网络结构,只是训练数据改成了带颜色的输入?可能是我理解还有一定偏差。。。