instructkr / LogicKor

한국어 언어모델 다분야 사고력 벤치마크
175 stars 31 forks source link

Create judge_OpenCarrot-Mistral-7B-Instruct-v0.2.jsonl #14

Closed shing100 closed 7 months ago

shing100 commented 7 months ago

직접 해봤는데 리더보드처럼 한번에 결과를 볼 수 있는 기능이 있었으면 좋겠습니다.

모델은 직접 학습한 모델로 평가했습니다.