tm4roon / survey

Survey on machine learning.
14 stars 1 forks source link

Data Noising as Smoothing in Neural Network Language Models #4

Open tm4roon opened 5 years ago

tm4roon commented 5 years ago

Data Noising as Smoothing in Neural Network Language Models

言語モデルを学習させる際に、擬似的に学習データを増やすことで性能向上をはかる試み。データ拡張の方法として、次の2つの手法を提案: (1) 確率γで文中のtokenをplaceholder token "_"に置き換える。 (2) 確率γで文中のtokenを確率分布q(x) (e.g. unigram頻度分布)からサンプリングされたtokenに置き換える。

結果として、bigram Kneser-Ney noisingにより、データ拡張なしの手法に比べ、perplexityを大幅に改善。また、翻訳タスクに利用した際にも、BLEUを1.4pt改善。

文献情報