AkihikoWatanabe / paper_notes

たまに追加される論文メモ
https://AkihikoWatanabe.github.io/paper_notes
17 stars 0 forks source link

Thinking LLMs: General Instruction Following with Thought Generation, Tianhao Wu+, N/A, arXiv'24 #1456

Open AkihikoWatanabe opened 4 days ago

AkihikoWatanabe commented 4 days ago

URL

AkihikoWatanabe commented 3 days ago

これは後でしっかり読んだほうがいい。 LLMに回答を生成させる前にThinkingさせるように学習させるフレームワークThought Prederence Optimization(TPO)を提案 image