A Comprehensive Benchmark to Evaluate LLMs as Agents (ICLR'24)
1.99k
stars
135
forks
source link
Would llama3 wizardlm2 and other latest models be tested and published in leaderboard? 请求添加llama3 wizardlm等24年4-5月大模型的测试结果 #136
Open
dercaft opened 1 month ago
请求添加llama3 wizardlm等24年4-5月大模型的测试结果。 当前的leaderboard榜单里的大模型感觉有点过时了,请问贵团队有计划测试24年最新的一批大模型吗?