Open yuckYew opened 5 years ago
pix2pixないし画像変換系深層学習ベース生成モデルの前準備として、pix2pixのGenerator部で利用されているU-Netの論文を読みGAN沼攻略の長途に就く。
分類タスク等で一般的に使われるCNNだが、biomedical image processingではlocalizationタスクの需要が高い。つまり、分類タスクのような入力画像に対して一つのクラスラベルを出力するのではなく、各ピクセルに対して推論を行いクラスラベルを割り当てるタスクを解くことが好ましい。あとBiomedicalの画像の枚数が単純に入手しづらく足りないぜ。
たらたらと2012年の手法について述べたがここでU-Netがベースとしているfully convolutional network(FCN)が紹介される。
ここで、$a_k(\b{x})$ は位置xにおける特徴チャネルkのmaximum activationを表す。 Kはクラス数をあらわし、$p_k(\mathb{x})$は近似されたmaximum関数である。 例として、発火の最大値を持つkに対して、 $p_k(\mathb{x})\ne{1}$ であり、その他のkに対しては$p_k(\mathb{x})\ne{0}$である。
その後、各画素xの正解ラベルを表す$l$におけるmaximum activationに対して$w(\mathb{x})$とのcross entropyをとる。ここで$w(\mathb{x})$は学習時に特定の画素の重要度を高めるために設けられたweight mapであり、下記式で表される。
[1] Ciresan, D.C., Gambardella, L.M., Giusti, A., Schmidhuber, J.: Deep neural net- works segment neuronal membranes in electron microscopy images. In: NIPS. pp. 2852–2860 (2012) [9] Long, J., Shelhamer, E., Darrell, T.: Fully convolutional networks for semantic segmentation (2014), arXiv:1411.4038 [cs.CV]
チェイナ‐君U-Net実装(in pix2pix example) https://github.com/pfnet-research/chainer-pix2pix/blob/master/net.py Fully-CNNがもたらしてくれたもの - オタクの情弱日記 http://kaidlc.hatenablog.com/entry/2016/12/17/203348
https://arxiv.org/abs/1505.04597
(2/16時点) 4222Citations. ちょお強い