Open agatan opened 5 years ago
教師なし object segmentaion を GAN でやる話。
segmentaion が完璧にできたとしたら、各 region ごとに画像を render して合成することで、元画像と同じようなデータが生成できるはず。 そこで、
Image → F (segment function) → region map → G (generator function) → Generated Image → D (discriminator function)
を end-to-end で学習することで、良い object segmentor F を学習する。
F
↑の構造で単純に学習すると 2 つの理由から trivial な解に陥る可能性が高い。
そこで制約を 2 つ追加する。
実装はかなり複雑に見える。(こんな複雑なもの学習安定しないだろうし、適当な GAN architecture では全然うまくいかないのだろうなという感じ) 「制約を含めてもなお empty mask を生成するようになってしまうことがあるが、そうなったら自動で検知して初期化からやりなおすようにした」と書いてあって壮絶。
教師なし object segmentaion を GAN でやる話。
アイディア
segmentaion が完璧にできたとしたら、各 region ごとに画像を render して合成することで、元画像と同じようなデータが生成できるはず。 そこで、
Image → F (segment function) → region map → G (generator function) → Generated Image → D (discriminator function)
を end-to-end で学習することで、良い object segmentor
F
を学習する。工夫
↑の構造で単純に学習すると 2 つの理由から trivial な解に陥る可能性が高い。
そこで制約を 2 つ追加する。
実装はかなり複雑に見える。(こんな複雑なもの学習安定しないだろうし、適当な GAN architecture では全然うまくいかないのだろうなという感じ) 「制約を含めてもなお empty mask を生成するようになってしまうことがあるが、そうなったら自動で検知して初期化からやりなおすようにした」と書いてあって壮絶。