soyamash / read_paper

memo for NLP paper
0 stars 0 forks source link

A Review of Generalized Zero-Shot Learning Methods #5

Open soyamash opened 3 years ago

soyamash commented 3 years ago

訓練データに含まれないラベルに対しても、テストデータを振り分けられるようにするGeneralized Zero-Shot Learningタスクのサーベイ論文 https://arxiv.org/abs/2011.08641

soyamash commented 3 years ago

GZSLとZSLの違いは、Seenクラスがテストデータに含まれるか否か。(Seenクラスのほうがマジョリティである場合が多い)。また、ZSLのテクニックがGZSLでは上手くいかないこともわかっている。

スクリーンショット 2020-11-22 16 17 49
soyamash commented 3 years ago

Unseenクラスについては、何かしらのAttributeやWikipediaなどから自動取得した言語情報を入れる。しかし人手の手間や、ノイズの多さが問題として挙げられる。また、transductive設定として、Unseenクラスについてのラベルなしデータや、semantic representationが与えられる場合もある。

soyamash commented 3 years ago

難しさ

hubness problem

kNN系のメソッドにおいてよく知られる、hubness problemがZSL、GZSLでも問題になる。これは共通の特徴を持つある訓練データサンプルがハブのように、どのテストデータサンプルとも近い距離として出てきてしまう問題。

domain shift problem

また、Unseenクラスを考慮せずにSeenクラスについてのみマッピング関数を学習すると、下図のように、Unseenクラスの分布がSeenクラスに比べて上手く学習されない。結果として、UnseenクラスがSeenクラスに分類されやすくなってしまう傾向がある

スクリーンショット 2020-11-22 16 51 08
soyamash commented 3 years ago

解くべきissueは2つある。 (i) Seenクラスに関する知識をどうやってUnseenクラスに転移するか (ii) Unseenクラスの学習データを使用せずに、Seenクラス・Unseenクラス両方の画像を認識するモデルの学習方法

これらのissueへの手法としてembedding-based、generative-basedの2種類に分類できる。

スクリーンショット 2020-11-28 16 01 33

Embedding-based methods

埋め込み表現へと変換する関数を学習し、Seenクラスとの距離などに基づいて、分類を行う。 埋め込み表現の種類によって細分化できる

スクリーンショット 2020-11-28 16 10 19

Generative-based methods

生成モデルを学習する。VAEベースのモデルはEmbedding-basedモデルと似ている

スクリーンショット 2020-11-28 16 43 17