Open icoxfog417 opened 6 years ago
自然言語におけるData Augmentationに挑戦した研究。具体的には、単語ベクトルにノイズを加えたり、意図的に単語を落とす等の処理を行い、その効果を見ている。結果としては、単語単位でノイズをかけたり落としたりする処理(重みを0にしたり単語を欠損させたり)よりも、ガウシアンノイズなどの連続的なノイズの方が良かったとのこと。
https://arxiv.org/abs/1804.08166
Dongxu Zhang, Zhichao Yang
2018/4/22
解説記事 http://shunk031.me/paper-survey/summary/nlp/Word-Embedding-Perturbation-for-Sentence-Classification
一言でいうと
自然言語におけるData Augmentationに挑戦した研究。具体的には、単語ベクトルにノイズを加えたり、意図的に単語を落とす等の処理を行い、その効果を見ている。結果としては、単語単位でノイズをかけたり落としたりする処理(重みを0にしたり単語を欠損させたり)よりも、ガウシアンノイズなどの連続的なノイズの方が良かったとのこと。
論文リンク
https://arxiv.org/abs/1804.08166
著者/所属機関
Dongxu Zhang, Zhichao Yang
投稿日付(yyyy/MM/dd)
2018/4/22
概要
新規性・差分
手法
結果
コメント