Closed kaisugi closed 11 months ago
https://ja.stability.ai/blog/japanese-stable-lm-beta のプレスリリースの末尾に以下の文があるため、公式の発表を待ってからの方が良さそう
注意深い皆様はお気付きでしょうが、この例ではGPT-4を使って私たちの言語モデルを評価する手助けをしており、GPT-4 は言語モデルの回答が満足できると考えています。LLM-as-a-Judge の研究を参考に、現在、 Japanese Multi-Turn Bench(JMT-Bench)を開発しています。近い将来に、JMT-Bench を用いたモデルの比較の結果についてお知らせできればと考えています。
https://github.com/Stability-AI/FastChat