knok / arxiv-memo

My arxiv papers memo
0 stars 0 forks source link

Don't Take It Literally: An Edit-Invariant Sequence Loss for Text Generation #135

Open knok opened 3 years ago

knok commented 3 years ago

Guangyi Liu, Zichao Yang, Tianhua Tao, Xiaodan Liang, Zhen Li, Bowen Zhou, Shuguang Cui, Zhiting Hu

https://arxiv.org/abs/2106.15078v1

概要

テキスト生成タスクに置いて、クロスエントロピー損失以外のものとして Edit-Invariant Sequence Loss (EISL)を提案。 画像における Shift-Invariant の概念から着想をえた手法。 image 位置に対して不変な特徴(テキスト系列)をn-gram単位で保持する損失。 image 損失関数 image image クロスエントロピー損失は、EISLの一種(1-gram)とみなせる。

Auto/Non-Auto regressinve モデル両方に適用可能。

コードは今後公開予定