Open cfiken opened 3 years ago
自然言語理解がどの程度普通の会話を理解できるかを定量化するため、人-人と人-bot の、対話内に矛盾を含む発話があるようなデータセット DialoguE COntradition DEtection task (DECODE) を作成。既存の NLI データセットと比較し、矛盾検知に有効であることを実験で確認した。 モデル化も2パターン行い、現在主流の対話履歴をまるごとモデルに入れる Unstructured なアプローチよりも、各発話ごとで比較する手法の方が汎化性能が高いことを実験で示した。 対話生成にも評価指標として一定の効果があることも確認している。
0. 論文
1. どんなもの?
自然言語理解がどの程度普通の会話を理解できるかを定量化するため、人-人と人-bot の、対話内に矛盾を含む発話があるようなデータセット DialoguE COntradition DEtection task (DECODE) を作成。既存の NLI データセットと比較し、矛盾検知に有効であることを実験で確認した。 モデル化も2パターン行い、現在主流の対話履歴をまるごとモデルに入れる Unstructured なアプローチよりも、各発話ごとで比較する手法の方が汎化性能が高いことを実験で示した。 対話生成にも評価指標として一定の効果があることも確認している。
2. 先行研究と比べてどこがすごい?
3. 技術や手法のキモはどこ?
4. どうやって有効だと検証した?
5. 議論はある?
6. 次に読むべき論文は?