Open Sosuke115 opened 3 years ago
https://www.aclweb.org/anthology/2020.emnlp-main.40.pdf
cross-lingual transfer learningにおいて原言語の検証データでエポック数の調整を行うのが普通だが、 原言語の検証データでの性能と目的言語での性能には相関があまりなく、再現性のない結果になりやすい。(性能がブレる)
以上の問題を解決するために、完全にzero-shotでの性能に加えて、目的言語の検証データを用いてエポック数を言語ごとに選択したモデルの性能をzero-shot cross-lingual transfer learningの上限スコアとして提示することを提案。
MLDoc and XNLIにてdevでの性能の改善・改悪とtestでの改善・改悪の一致度を検証。0.5未満だとランダムにエポック数を決めるより悪い結果と言える
論文リンク
https://www.aclweb.org/anthology/2020.emnlp-main.40.pdf
概要
cross-lingual transfer learningにおいて原言語の検証データでエポック数の調整を行うのが普通だが、 原言語の検証データでの性能と目的言語での性能には相関があまりなく、再現性のない結果になりやすい。(性能がブレる)
以上の問題を解決するために、完全にzero-shotでの性能に加えて、目的言語の検証データを用いてエポック数を言語ごとに選択したモデルの性能をzero-shot cross-lingual transfer learningの上限スコアとして提示することを提案。
手法のキモ・評価方法
MLDoc and XNLIにてdevでの性能の改善・改悪とtestでの改善・改悪の一致度を検証。0.5未満だとランダムにエポック数を決めるより悪い結果と言える