Open Shaw0202 opened 5 years ago
現在広く使われているCNNを用いた画像セグメンテーション手法。FCNを発展させたようなネットワーク構造になっている。ISBIと呼ばれるチャレンジで従来のsliding window手法を上回った。かつてのslidingwindowによるsegmentationのアプローチよりも高速なネットワーク。
エンコーダ側はconvとpoolingを繰り返すことで、深さ方向(カーネルorフィルタサイズ)が増えていくが局所情報が失われていく。デコーダにおいてup-convを行っている際に、それぞれのエンコーダ側のpooling後の情報を重ね合わせることにより局所的な情報を保っている。up-convは以下が分かりやすい。
バイオメディカル用の画像のために作られたネットワーク。ImageNetのように数千枚の学習画像を用意するのは不可能なので、学習データが少なくても精度が出るように工夫されたネットワーク。
上の図のように、高解像度の画像に対しては、mirror paddingを行って、識別させる方法を取るといいと書かれている。
実装はcaffeでsgdを使っているらしい。softmax関数を使用しているため、損失関数はクロスエントロピー誤差である。
一通りのことを行っているがelastic deformationsが有用だったと述べられている。
5ページ目の中盤のmorphological operationsというのがよくわからなかった。
概要
現在広く使われているCNNを用いた画像セグメンテーション手法。FCNを発展させたようなネットワーク構造になっている。ISBIと呼ばれるチャレンジで従来のsliding window手法を上回った。かつてのslidingwindowによるsegmentationのアプローチよりも高速なネットワーク。
アルゴリズム/実験手法
エンコーダ側はconvとpoolingを繰り返すことで、深さ方向(カーネルorフィルタサイズ)が増えていくが局所情報が失われていく。デコーダにおいてup-convを行っている際に、それぞれのエンコーダ側のpooling後の情報を重ね合わせることにより局所的な情報を保っている。up-convは以下が分かりやすい。
条件,結果
バイオメディカル用の画像のために作られたネットワーク。ImageNetのように数千枚の学習画像を用意するのは不可能なので、学習データが少なくても精度が出るように工夫されたネットワーク。
上の図のように、高解像度の画像に対しては、mirror paddingを行って、識別させる方法を取るといいと書かれている。
実装
実装はcaffeでsgdを使っているらしい。softmax関数を使用しているため、損失関数はクロスエントロピー誤差である。
data augmentation
一通りのことを行っているがelastic deformationsが有用だったと述べられている。
感想,所感
5ページ目の中盤のmorphological operationsというのがよくわからなかった。