Sunwood-ai-labs / Yukihiko

Fusion of Python and GIMP
MIT License
5 stars 4 forks source link

メルテミ:ギリシャ語初のオープンな大規模言語モデル #65

Open yukihiko-fuyuki opened 1 month ago

yukihiko-fuyuki commented 1 month ago

タイトル: メルテミ:ギリシャ語初のオープンな大規模言語モデル

リンク: https://arxiv.org/abs/2407.20743

概要:

Meltemi 7Bは、ギリシャ語初のオープンな大規模言語モデルであり、その開発と機能について説明します。70億のパラメータを持つMeltemi 7Bは、400億トークンのギリシャ語コーパスでトレーニングされています。Meltemi 7Bの開発では、ギリシャ語コーパスを用いた継続的な事前トレーニングにより、Mistralを適応させました。Meltemi 7Bは、2023年9月までの最新情報を含んでいます。さらに、ギリシャ語の指示コーパスを翻訳およびキュレーションし、Meltemi 7B Instructというチャットモデルの指示チューニングに使用しました。Meltemi 7B Instructでは、アライメントと有害コンテンツの削除に特に注意が払われています。開発されたモデルは、収集された幅広い評価コーパスで評価され、プロンプトと応答の例が示されています。Meltemi 7BとMeltemi 7B Instructはどちらも、Apache 2.0ライセンスの下でhttps://huggingface.co/ilspから入手できます。

yukihiko-fuyuki commented 1 month ago

@yukihiko-fuyuki が以下のラベルを提案し、適用しました:

以下の新しいラベルが作成され、適用されました:

yukihiko-fuyuki commented 1 month ago

論文要約

論文要約: メルテミ:ギリシャ語初のオープンな大規模言語モデル