deepvk / arena-hard

Arena-Hard benchmark
Apache License 2.0
0 stars 1 forks source link

gen_judgement model name bug #4

Open greatrobocreator opened 3 months ago

greatrobocreator commented 3 months ago

Здесь должно быть endpoint_info["model_name"] вместо model

https://github.com/deepvk/arena-hard/blob/b07523e7eee428dfb10bb751956c38cc2a28cfe5/gen_judgment.py#L102

В оригинальной lm-sys/arena-hard-auto уже исправили: https://github.com/lm-sys/arena-hard-auto/blob/b00effbe44985651be892b01d765587adc13c888/gen_judgment.py#L98

greatrobocreator commented 3 months ago

Выстреливает, когда model != endpoint_info['model_name'] Например, у меня так случилось, когда поменял judge на Claude