AkihikoWatanabe / paper_notes

たまに追加される論文メモ
https://AkihikoWatanabe.github.io/paper_notes
18 stars 0 forks source link

Llemma: An Open Language Model For Mathematics, Zhangir Azerbayev+, N/A, arXiv'23 #1104

Open AkihikoWatanabe opened 1 year ago

AkihikoWatanabe commented 1 year ago

URL

AkihikoWatanabe commented 1 year ago

CodeLLaMAを200B tokenの数学テキスト(proof-pile-2データ;論文、数学を含むウェブテキスト、数学のコードが含まれるデータ)で継続的に事前学習することでfoundation modelを構築 image

約半分のパラメータ数で数学に関する性能でGoogleのMinervaと同等の性能を達成 image

AkihikoWatanabe commented 1 year ago

元ツイート: https://twitter.com/zhangir_azerbay/status/1714098823080063181

AkihikoWatanabe commented 1 year ago

まだ4-shotしてもAcc.50%くらいなのか。