karakuri-ai / paper-readings

repository to research the machine learning papers
2 stars 1 forks source link

[2018] Subword Regularization: Improving Neural Network Translation Models with Multiple Subword Candidates #56

Open IkokObi opened 4 years ago

IkokObi commented 4 years ago

ざっくり言うと

翻訳タスクの目的関数をsubword tokenizationの期待値として定式化し直し,tokenization結果をサンプリングしNMTを学習することで精度を上げた.サンプリングが正則化やdata augementationと似た役割を果たしている.tokenizationをサンプリングするために,決定論的ではなく確率的な扱いが出来るUnigram language modelを提案.

キーワード

1. 情報

論文リンク

https://www.aclweb.org/anthology/P18-1007/

著者

Taku Kudo (Google)

投稿日付

2018/8/29 (ACL 2018)

2. 先行研究と比べてどこがすごい?

3. 技術や手法のキモはどこ?

4. どうやって有効だと検証した?

5. 議論はある?

6. 次に読むべき論文は?

IkokObi commented 4 years ago

7. 実装の詳細

目的関数の再定式化

Unigram language model

decoding時の工夫

IkokObi commented 4 years ago

8. データセット

IkokObi commented 4 years ago

9. 結果の詳細

IkokObi commented 4 years ago

雑感&メモ