Open tm4roon opened 3 years ago
汎化性能を評価する新たな方法を提案した論文。従来では、訓練データとテストデータを、文の長さやクラスタリングを用いて分割する方法が提案されていた。本研究ではSemantic Parsingを対象とし、文の構造に注目した分割による汎化性能の評価手法を提案している。今回利用するデータは、以下のようにあらかじめ用意したテンプレート(Compounds)を穴埋めする形で生成されたデータである。構成されているCompoundsの類似性で訓練データとテストデータを分割する、というのが提案手法である。
Compound divergenceが低い場合にはすべてのモデルで95%以上の精度を達成するが、Compound divergence高い場合は、すべてのモデルで20%以下の精度となり、訓練データとテストデータの間で利用している単語が類似した大規模な訓練セットであっても、モデルの汎化性能向上に十分ではないことを意味している。
Measuring Compositional Generalization: A Comprehensive Method on Realistic Data
汎化性能を評価する新たな方法を提案した論文。従来では、訓練データとテストデータを、文の長さやクラスタリングを用いて分割する方法が提案されていた。本研究ではSemantic Parsingを対象とし、文の構造に注目した分割による汎化性能の評価手法を提案している。今回利用するデータは、以下のようにあらかじめ用意したテンプレート(Compounds)を穴埋めする形で生成されたデータである。構成されているCompoundsの類似性で訓練データとテストデータを分割する、というのが提案手法である。
Compound divergenceが低い場合にはすべてのモデルで95%以上の精度を達成するが、Compound divergence高い場合は、すべてのモデルで20%以下の精度となり、訓練データとテストデータの間で利用している単語が類似した大規模な訓練セットであっても、モデルの汎化性能向上に十分ではないことを意味している。
文献情報