Controlled Hallucinations: Learning to Generate Faithfully from Noisy Data

Filippova, Katja. 2020. “Controlled Hallucinations: Learning to Generate Faithfully from Noisy Data.” In Findings of the Association for Computational Linguistics: EMNLP 2020. Stroudsburg, PA, USA: Association for Computational Linguistics. https://doi.org/10.18653/v1/2020.findings-emnlp.76.

解決したい課題

Data-to-Textにおける、入力データ（表）に含まれない情報が出力テキストに出現するHallcinationsの問題を解決したい。

提案手法

Seq2Seqのアーキテクチャを変えずに、先頭にタグを導入する制約付きデコーディングにより、Hallcinationsの問題に取り組む。 [0, 1]のhallcination scoreに基づき、（0.2刻みで）5パターンのタグを作る。 hallcination scoreの算出方法は以下の通り。

word overlapping (WO)
- 入力と出力の単語の重なりに基づく手法。出力に入力の単語が多く含まれていれば、hallcination scoreは低くなる。
language model (LM)
- Conditional LMとLMの単語確率の差に基づく手法。
- Conditional LMは入力xにして、出力yを予測するSeq2seq
- LMは、入力を与えずに出力yを予測するSeq2seq（言語モデル）
- LMによる確率より、Conditional LMの確率の方が低ければ、Conditional LMの予測が怪しい可能性があるため、hallcinationと見做す。

WOで入出力で対応を取る必要が合ったが、LMでは出力だけ使うのであらゆるデータに応用できる。たとえば、入力が動画や画像の場合にでも使えるかも？

結果

PARENTのRecallが改善した。

人手評価により、faithfulnessの向上を確認。 MFはMostly faithfulを表す。

ichiroex / nlp-papers

Controlled Hallucinations: Learning to Generate Faithfully from Noisy Data #5

解決したい課題

提案手法

結果