Open yukihiko-fuyuki opened 1 month ago
Meltemi 7Bは、ギリシャ語初のオープンな大規模言語モデルであり、その開発と機能について説明します。70億のパラメータを持つMeltemi 7Bは、400億トークンのギリシャ語コーパスでトレーニングされています。Meltemi 7Bの開発では、ギリシャ語コーパスを用いた継続的な事前トレーニングにより、Mistralを適応させました。Meltemi 7Bは、2023年9月までの最新情報を含んでいます。さらに、ギリシャ語の指示コーパスを翻訳およびキュレーションし、Meltemi 7B Instructというチャットモデルの指示チューニングに使用しました。Meltemi 7B Instructでは、アライメントと有害コンテンツの削除に特に注意が払われています。開発されたモデルは、収集された幅広い評価コーパスで評価され、プロンプトと応答の例が示されています。Meltemi 7BとMeltemi 7B Instructはどちらも、Apache 2.0ライセンスの下でhttps://huggingface.co/ilspから入手できます。
@yukihiko-fuyuki が以下のラベルを提案し、適用しました:
以下の新しいラベルが作成され、適用されました:
タイトル: メルテミ:ギリシャ語初のオープンな大規模言語モデル
リンク: https://arxiv.org/abs/2407.20743
概要:
Meltemi 7Bは、ギリシャ語初のオープンな大規模言語モデルであり、その開発と機能について説明します。70億のパラメータを持つMeltemi 7Bは、400億トークンのギリシャ語コーパスでトレーニングされています。Meltemi 7Bの開発では、ギリシャ語コーパスを用いた継続的な事前トレーニングにより、Mistralを適応させました。Meltemi 7Bは、2023年9月までの最新情報を含んでいます。さらに、ギリシャ語の指示コーパスを翻訳およびキュレーションし、Meltemi 7B Instructというチャットモデルの指示チューニングに使用しました。Meltemi 7B Instructでは、アライメントと有害コンテンツの削除に特に注意が払われています。開発されたモデルは、収集された幅広い評価コーパスで評価され、プロンプトと応答の例が示されています。Meltemi 7BとMeltemi 7B Instructはどちらも、Apache 2.0ライセンスの下でhttps://huggingface.co/ilspから入手できます。