Open lihua8848 opened 2 hours ago
测试代码都是VLMEvalKit,我只改了api为qwen-vl-max-0809,以及测MME的celebrity,prompt这些都没动,计算scores的方法也没动,为什么和榜单上的差异这么大
第三张图是前几天那个榜单上的,请问1101更新为什么消失了?
测试代码都是VLMEvalKit,我只改了api为qwen-vl-max-0809,以及测MME的celebrity,prompt这些都没动,计算scores的方法也没动,为什么和榜单上的差异这么大