cfiken / paper-reading

34 stars 3 forks source link

[2021] A Recipe For Arbitrary Text Style Transfer with Large Language Models #157

Open cfiken opened 2 years ago

cfiken commented 2 years ago

0. 論文

タイトル A Recipe For Arbitrary Text Style Transfer with Large Language Models
リンク https://arxiv.org/abs/2109.03910
著者 Emily Reif, Daphne Ippolito, Ann Yuan, Andy Coenen, Chris Callison-Burch, Jason Wei (Google Research)
投稿日付 2021/9/8 on arxiv

1. どんなもの?

巨大な言語モデルを用いて zero-shot で文の style transfer を可能にする augmented zero-shot learning という手法を提案。prompting を用いてコントロールするため、fine-tuning は不要で、zero-shot なためラベルデータや exemplar データも不要。

スクリーンショット 2021-10-09 16 29 33 (Fig. 1: (c) が提案手法)

2. 先行研究と比べてどこがすごい?

3. 技術や手法のキモはどこ?

4. どうやって有効だと検証した?

5. 議論はある?

巨大言語モデルの prompting において、ターゲットドメインのラベルデータがなくても学習無しでそこそこの性能が得られることが分かったため、今後別タスクでも同様のことができる可能性あり。

6. 次に読むべき論文は?