Open ymym3412 opened 6 years ago
MojiTalk: Generating Emotional Responses at Scale Xianda Zhou, William Yang Wang
感情の乗った返信を生成する
emojiの入ったTwitterデータを使うことで、大規模データを収集している
感情のアノテーション付きのデータセットを集めることは大変だが、emojiの入ったTwitterに対して頻出のemojiを感情ラベルとしてデータを収集することで解決している。 返信の生成にはConditional VAEを使い、さらに文章から対応するemoji labelを予測するclassifierを事前に学習させておきモデルの出力文章に対するemojiの尤度を報酬として強化学習で学習を行うReinforce CVAEも提案している。
seq2seqをベースラインとしていくつかの指標で比較。 生成モデルの出力文章に対するemoji classifierのAccuracyでみると、提案手法が最も高く生成する文章にemojiに対応する感情情報がよく表れていることがうかがえる。
データセットの中で出現頻度が低いemojiではaccuracyが下がるため、データセット整備は今後の課題
Autoencoding beyond pixels using a learned similarity metric Anders Boesen Lindbo Larsen, Søren Kaae Sønderby, Hugo Larochelle, Ole Winther
MoodSwipe: A Soft Keyboard that Suggests Messages Based on User-Specified Emotions Chieh-Yang Huang, Tristan Labetoulle, Ting-Hao Kenneth Huang, Yi-Pei Chen, Hung-Chen Chen, Vallari Srivastava, Lun-Wei Ku
実装が公開されたようです。 https://github.com/Claude-Zhou/MojiTalk
0. 論文
MojiTalk: Generating Emotional Responses at Scale Xianda Zhou, William Yang Wang
1. どんなもの?
感情の乗った返信を生成する
2. 先行研究と比べてどこがすごい?
emojiの入ったTwitterデータを使うことで、大規模データを収集している
3. 技術や手法のキモはどこ?
感情のアノテーション付きのデータセットを集めることは大変だが、emojiの入ったTwitterに対して頻出のemojiを感情ラベルとしてデータを収集することで解決している。 返信の生成にはConditional VAEを使い、さらに文章から対応するemoji labelを予測するclassifierを事前に学習させておきモデルの出力文章に対するemojiの尤度を報酬として強化学習で学習を行うReinforce CVAEも提案している。
4. どうやって有効だと検証した?
seq2seqをベースラインとしていくつかの指標で比較。 生成モデルの出力文章に対するemoji classifierのAccuracyでみると、提案手法が最も高く生成する文章にemojiに対応する感情情報がよく表れていることがうかがえる。
5. 議論はある?
データセットの中で出現頻度が低いemojiではaccuracyが下がるため、データセット整備は今後の課題
6. 次に読むべき論文は?
Autoencoding beyond pixels using a learned similarity metric Anders Boesen Lindbo Larsen, Søren Kaae Sønderby, Hugo Larochelle, Ole Winther
MoodSwipe: A Soft Keyboard that Suggests Messages Based on User-Specified Emotions Chieh-Yang Huang, Tristan Labetoulle, Ting-Hao Kenneth Huang, Yi-Pei Chen, Hung-Chen Chen, Vallari Srivastava, Lun-Wei Ku