Closed AtsukiOsanai closed 5 months ago
従来手法のVQGANのcodebookはその利用率が低く、codebookの数を増やしても性能が改善しないことの原因になっていると推定(LaMa3ではcodebookを増やすほどに性能が向上)。そこで、新たなcodebook学習のアーキテクチャを提案し、codebookの利用率、上限数を拡大することに成功。様々なダウンストリームタスクで従来のcodebookを上回る性能を達成。
Scaling the Codebook Size of VQGAN to 100,000 with a Utilization Rate of 99%
Information
Summary
サマリ図表
どんな論文か?
従来手法のVQGANのcodebookはその利用率が低く、codebookの数を増やしても性能が改善しないことの原因になっていると推定(LaMa3ではcodebookを増やすほどに性能が向上)。そこで、新たなcodebook学習のアーキテクチャを提案し、codebookの利用率、上限数を拡大することに成功。様々なダウンストリームタスクで従来のcodebookを上回る性能を達成。
新規性
結果
その他(なぜ通ったか?など)