AkihikoWatanabe / paper_notes

たまに追加される論文メモ
https://AkihikoWatanabe.github.io/paper_notes
16 stars 0 forks source link

Instruction-Following Evaluation for Large Language Models, Jeffrey Zhou+, N/A, arXiv'23 #1137

Open AkihikoWatanabe opened 10 months ago

AkihikoWatanabe commented 10 months ago

URL

AkihikoWatanabe commented 10 months ago

LLMがinstructionにどれだけ従うかを評価するために、検証可能なプロンプト(400字以上で書きなさいなど)を考案し評価する枠組みを提案。人間が評価すると時間とお金がかかり、LLMを利用した自動評価だと評価を実施するLLMのバイアスがかかるのだ、それら両方のlimitationを克服できるとのこと。

image