DwangoMediaVillage / paper_readings

Dwango Media Village内で行われている論文紹介の資料
58 stars 2 forks source link

Asymmetric Tri-training for Unsupervised Domain Adaption #19

Open gabdro opened 7 years ago

gabdro commented 7 years ago

Asymmetric Tri-training for Unsupervised Domain Adaption

一言

論文本体・著者

https://arxiv.org/pdf/1702.08400.pdf Kuniaki Saito, Yoshitaka Ushiku, Tatsuya Harada スライド

解きたい問題

ターゲットドメインのまったくラベルがないUnsupervised Domain Adaptionを解く

新規性

役割の異なる分類器($F_1,F_2$)をSで訓練. $F_1,F_2$を用いてTに擬似ラベルの付与. 擬似ラベルを使ってTの分類器$F_T$を訓練.

実装

fig2:元論文 共有ネットワークFとF1,F2,Ftの3つのネットワークで構成された構造になっている.

手順

  1. Sで全体のネットワークを学習する
  2. F1とF2は asy07 で最適化される.
    $F_t$はstandard category lossで学習される.
  3. Sで学習後 Tに擬似ラベルを付与するため,$y_1,y_2$の予測を用いる.C1とC2の予測確率が最大となるクラスを示す時に2つの条件に一致したら擬似ラベルを付与する ($X_t$ の擬似ラベル$\hat{y_t}$ = C1)
    1. C1=C2
    2. $y_1,y_2$の最大確率が閾値を超えてること
  4. データ$L=SUT_l$とする.
  5. $F,F_1,F_2$をLで訓練
  6. $F,F_t$を$T_l$で訓練
  7. 擬似ラベル$\hat{y}$の更新し(4)に戻る.

githubのissueは数式表示されないっぽいので論文から手順(アルゴリズム)を掲載

asy06

実験・議論

データセット

(MNIST,MNIST-M),(SYN NUMBERS,SVHN),(SYN SIGNS/GTSRB)

https://arxiv.org/pdf/1409.7495.pdf

ベースライン手法

3つのネットワークのTに対する精度

読んだ中での不明点などの感想

関連論文