AkihikoWatanabe / paper_notes

たまに追加される論文メモ
https://AkihikoWatanabe.github.io/paper_notes
17 stars 0 forks source link

Large Language Model Alignment: A Survey, Tianhao Shen+, N/A, arXiv'23 #1063

Open AkihikoWatanabe opened 1 year ago

AkihikoWatanabe commented 1 year ago

URL

本調査では、LLMsのアライメントに関する既存の研究とともに、LLMsのアライメントのためのさまざまな手法を包括的に探求します。AIアライメントの観点から、LLMsのアライメントのための既存の手法と新たな提案を外部アライメントと内部アライメントに分類します。また、モデルの解釈可能性や敵対的攻撃への脆弱性など、重要な問題にも探求します。LLMsのアライメントを評価するために、さまざまなベンチマークと評価手法を提案します。LLMsのアライメントの研究の現状を議論した後、将来に向けて有望な研究の方向性を考察します。

この調査の目的は、この領域での研究の関心を喚起するだけでなく、能力の探求に取り組む研究者とAIアライメント研究コミュニティとのギャップを埋めることです。安全で能力のあるLLMsのための研究に取り組む研究者との連携を目指しています。

Summary (by gpt-3.5-turbo)

AkihikoWatanabe commented 1 year ago

LLMのalignmentに関するサーベイ。image