AkihikoWatanabe / paper_notes

たまに追加される論文メモ
https://AkihikoWatanabe.github.io/paper_notes
15 stars 0 forks source link

Self-RAG: Learning to Retrieve, Generate, and Critique through Self-Reflection, Akari Asai+, N/A, arXiv'23 #1105

Open AkihikoWatanabe opened 8 months ago

AkihikoWatanabe commented 8 months ago

URL

AkihikoWatanabe commented 8 months ago

RAGをする際の言語モデルの回答の質とfactual consistencyを改善せるためのフレームワーク。 reflection tokenと呼ばれる特殊トークンを導入し、言語モデルが生成の過程で必要に応じて情報をretrieveし、自身で生成内容を批評するように学習する。単語ごとに生成するのではなく、セグメント単位で生成する候補を生成し、批評内容に基づいて実際に生成するセグメントを選択する。

image image