boostcampaitech5 / level2_klue-nlp-04

level2_klue-nlp-04 created by GitHub Classroom
1 stars 0 forks source link

[Data] Minority Class 데이터 증강 #23

Closed dbsrlskfdk closed 1 year ago

dbsrlskfdk commented 1 year ago

현재 상황과 문제점

4 EDA결과에 따르면, 특정 Label은 아주 적은 비율을 가지고 있다.

그러므로 학습의 결과는 높은 확률로 가장 큰 비율을 가지고 있는 Label값으로 지정이 될 수 있다.

개선 제안 사항

Minority Class의 데이터 증강이 필요할 것 같다. 증강 방식?

성능 개선 기대점

no-relation 라벨에 과적합 되는 것을 방지하고, 보편적인 성능 향상이 있을 것으로 예상됨.