Open cfiken opened 2 years ago
巨大な言語モデルを用いて zero-shot で文の style transfer を可能にする augmented zero-shot learning という手法を提案。prompting を用いてコントロールするため、fine-tuning は不要で、zero-shot なためラベルデータや exemplar データも不要。
(Fig. 1: (c) が提案手法)
巨大言語モデルの prompting において、ターゲットドメインのラベルデータがなくても学習無しでそこそこの性能が得られることが分かったため、今後別タスクでも同様のことができる可能性あり。
0. 論文
1. どんなもの?
巨大な言語モデルを用いて zero-shot で文の style transfer を可能にする augmented zero-shot learning という手法を提案。prompting を用いてコントロールするため、fine-tuning は不要で、zero-shot なためラベルデータや exemplar データも不要。
(Fig. 1: (c) が提案手法)
2. 先行研究と比べてどこがすごい?
3. 技術や手法のキモはどこ?
4. どうやって有効だと検証した?
5. 議論はある?
巨大言語モデルの prompting において、ターゲットドメインのラベルデータがなくても学習無しでそこそこの性能が得られることが分かったため、今後別タスクでも同様のことができる可能性あり。
6. 次に読むべき論文は?