AtsukiOsanai / cv_survey

Personal repository for computer vision survey
2 stars 0 forks source link

Scaling the Codebook Size of VQGAN to 100,000 with a Utilization Rate of 99% #130

Closed AtsukiOsanai closed 5 months ago

AtsukiOsanai commented 5 months ago

Scaling the Codebook Size of VQGAN to 100,000 with a Utilization Rate of 99%

Information

Summary

サマリ図表

スクリーンショット 2024-06-20 9 06 13

どんな論文か?

従来手法のVQGANのcodebookはその利用率が低く、codebookの数を増やしても性能が改善しないことの原因になっていると推定(LaMa3ではcodebookを増やすほどに性能が向上)。そこで、新たなcodebook学習のアーキテクチャを提案し、codebookの利用率、上限数を拡大することに成功。様々なダウンストリームタスクで従来のcodebookを上回る性能を達成。

新規性

結果

その他(なぜ通ったか?など)