irfanICMLL / colorization

reading note
3 stars 0 forks source link

阅读感受:其他大概读了读的文章 #7

Open irfanICMLL opened 7 years ago

irfanICMLL commented 7 years ago

Pixel Recurrent Neural Networks: Google deepmind做的一项有趣的工作,把图像的像素当成是一个有时序的序列,然后利用RNN网络的结构来处理!厉害了,我导师之前也提过这个想法,还被我们吐槽说老师总是想用RNN做图像,用CNN做自然语言处理,没想到现在被DeepMind做了!但是这个思路很清奇,应该和咱们的项目不太沾边。

Color Sketch Generation:这是微软研究院做的一项工作,是我导师之前让我读过的一篇文章,但是感觉可以开发一个新功能啊?上传一张照片,自动变成这种带有涂色的非常简单的简笔画,小孩自己就可以照着画了。没用到深度学习,就是传统的图像处理,是06年的一篇文章。

Unsupervised Image-to-Image Translation with Generative Adversarial network:https://github.com/zsdonghao/tensorlayer 一群印度人的工作?做的结果一般,思路是把通过类别信息和噪声Z生成图片,然后生成图片和真实图片进入判别器分类,真实图片属于类1,生成属于类2。通过编码把生成变成噪音,1类真实图片通过该编码器变成噪音,和2类别信息共同通过生成器生成2类别的生成图片。 就是可以把男人变成女人啦之类的。

Pixel-Level Domain Transfer:韩国人的文章- -通过穿着衣服的人生成衣服。有一个点:没有loss function 除了正常的GAN之外 又多加了一个 discriminator来判别生成的穿衣服的人和衣服是否相关。比如现在有一个正样本,一个负样本。生成样本和正样本的差值要小于生成样本和负样本的差值。

Convolutional Sketch Inversion:文中有神经网络搭建的详细参数,降采样部分是scribbler那篇文章使用的,但是本文使用了反卷积层,scribbler那篇文章使用了双线性差值。这里我还是不懂,双线性差值= =怎么学习。。不是个确定输出的吗