AkihikoWatanabe / paper_notes

たまに追加される論文メモ
https://AkihikoWatanabe.github.io/paper_notes
17 stars 0 forks source link

Why Do We Need Weight Decay in Modern Deep Learning?, Maksym Andriushchenko+, N/A, arXiv'23 #1075

Open AkihikoWatanabe opened 12 months ago

AkihikoWatanabe commented 12 months ago

URL

AkihikoWatanabe commented 12 months ago

参考: https://x.com/hillbig/status/1712220940724318657?s=46&t=Y6UuIHB0Lv0IpmFAjlc2-Q

AkihikoWatanabe commented 12 months ago

WeightDecayは目的関数に普通にL2正則化項を加えることによって実現されるが、深掘りするとこんな効果があるのね