jeinlee1991 / chinese-llm-benchmark

中文大模型能力评测榜单:目前已囊括128个大模型,覆盖chatgpt、gpt-4o、谷歌gemini、百度文心一言、阿里通义千问、百川、讯飞星火、商汤senseChat、minimax等商用模型, 以及qwen2.5、llama3.1、glm4、书生internLM2.5、openbuddy、AquilaChat等开源大模型。不仅提供能力评分排行榜,也提供所有模型的原始输出结果!
2.63k stars 123 forks source link

缺少重要的claude系列,申请加入相关测评 #33

Open chiguabaobao opened 6 months ago

chiguabaobao commented 6 months ago

缺少重要的claude系列,申请加入相关测评

YiweiBao commented 6 months ago

同求,希望对最新的三个模型都进行测试

vimbackground commented 5 months ago

还有Llama3和geminipro可以考虑加进去