AkihikoWatanabe / paper_notes

たまに追加される論文メモ
https://AkihikoWatanabe.github.io/paper_notes
16 stars 0 forks source link

Gemma: Open Models Based on Gemini Research and Technology, 2024 #1277

Open AkihikoWatanabe opened 5 months ago

AkihikoWatanabe commented 5 months ago

https://storage.googleapis.com/deepmind-media/gemma/gemma-report.pdf

blog: https://blog.google/technology/developers/gemma-open-models/

AkihikoWatanabe commented 3 months ago

アーキテクチャはTransformer Decoderを利用。モデルのサイズは2Bと7B。 オリジナルのTransformer Decoderアーキテクチャから、下記改善を実施している:

image

AkihikoWatanabe commented 3 months ago

Mistral #1309 よりも高い性能を示している: image image