sangmandu / SangSangPlus

Boostcamp NLP Team
2 stars 5 forks source link

[KLUE 대회] Model Comparison & Applying on Leader Board #115

Open sangmandu opened 2 years ago

sangmandu commented 2 years ago

1. 모델 개요

image

2. 모델 성능

주된 지표 4가지의 그래프는 다음과 같다. image

4개의 그래프 중 F1 Score 그래프를 더 중점적으로 분석한다. 2 epoch 마다의 결과 그래프는 다음과 같다. 그래프는 클릭하면 더 자세히 볼 수 있다.

Model Comparison on 2-epoch

2 epoch

image

4 epoch

image

6 epoch

image

8 epoch

image

10 epoch

image

결론

리더보드 모델 제출 결과

다음과 같은 6개의 모델을 제출했다. 모델 선정 기준은 초반 epoch와 후반 epoch에서 각각 성능이 제일 좋았던(실제로 checkpoint로도 남아있었던) 체크포인트를 선택했다. 모델 - checkpoint F1 Score Auprc
KLUE-RoBERTa-large-checkpoint-2400 61.667 69.615
KLUE-RoBERTa-large-checkpoint-8100 65.157 65.231
KLUE-RoBERTa-base-checkpoint-1600 58.887 63.065
KLUE-RoBERTa-base-checkpoint-8100 63.065 60.843
KLUE-BERT-base-checkpoint-1600 65.767 67.799
KLUE-BERT-base-checkpoint-8100 64.032 63.378

결론

raki-1203 commented 2 years ago

오 정리 잘해주셨네요 감사합니다

whatchang commented 2 years ago

완전 깔끔하게 정리 잘 해주셨네요~~~! 덕분에 여러 좋은 정보를 알 수 있었던 것 같아요!!! 감사하고 고생많으셨어요👍

kimziont commented 2 years ago

RoBERTa를 쓰는게 확실히 좋아 보이네요. 명쾌한 정리 감사합니다. KoELECTRA-base의 리더보드 결과도 궁금하네요🤩

sangmandu commented 2 years ago

RoBERTa를 쓰는게 확실히 좋아 보이네요. 명쾌한 정리 감사합니다. KoELECTRA-base의 리더보드 결과도 궁금하네요🤩

오늘 2개의 기회가 남는다면 해보겠습니다.. ㅎㅎ