Closed vgptnv closed 3 years ago
데이터셋에 male->female / normal -> incorrect 등 레이블이 잘못 매칭된 데이터들이 존재합니다 이를 해결하기 위해서, (08/24) peer session 에서 @jinmang2 이 제안해주셨던 아이디어 정리해봤습니다!
5-fold로 train data를 쪼개서, 앞 부분 20%로 모델을 학습 → 이걸 남은 80%의 데이터셋에 대해 mask와 gender를 예측
5-fold 학습이 끝나면 하나의 데이터 마다 4개의 예측값이 생길 것. 이를 앙상블 해서 Voting! => 실제 label 값과 비교해서 틀린 것만 인간이 확인!
(혹시 잘못된 내용이 있다면 comment 주시면 감사하겠습니다:)
정리 감사합니다 혜수님! 오늘 중에 해당 task를 진행하여 교정된 label csv 파일을 공유하겠습니다!
결과 google drive에 공개했고, 해당 이슈는 닫겠습니다.
데이터셋에 male->female / normal -> incorrect 등 레이블이 잘못 매칭된 데이터들이 존재합니다 이를 해결하기 위해서, (08/24) peer session 에서 @jinmang2 이 제안해주셨던 아이디어 정리해봤습니다!
5-fold로 train data를 쪼개서, 앞 부분 20%로 모델을 학습 → 이걸 남은 80%의 데이터셋에 대해 mask와 gender를 예측
5-fold 학습이 끝나면 하나의 데이터 마다 4개의 예측값이 생길 것. 이를 앙상블 해서 Voting! => 실제 label 값과 비교해서 틀린 것만 인간이 확인!
(혹시 잘못된 내용이 있다면 comment 주시면 감사하겠습니다:)