boostcampaitech3 / level2-semantic-segmentation-level2-cv-14

level2-semantic-segmentation-level2-cv-14 created by GitHub Classroom
0 stars 2 forks source link

[제안] EDA #13

Open Devlee247 opened 2 years ago

Devlee247 commented 2 years ago

개요 및 목적

작업 상세 내용

참고 문서

TaehaKim-Kor commented 2 years ago

21 첫 번째 코멘트에 대한 내용 정리

  1. 2등 솔루션 중 데이터 클렌징 적용 방안에 mIoU가 70% 이하인 이미지에 대한 전수조사를 시도해볼만 함.
  2. 1등 솔루션 중 Custom Augmentation 적용 방안에 대한 EDA를 영감받을 수 있음.
TaehaKim-Kor commented 2 years ago

21 세 번째 코멘트까지에 대한 내용 정리

공통적으로 EDA 과정에서 파악하는 것은 지금까지 아래와 같음.

  1. 데이터의 특성은 어떠한가?
  2. Noise가 심한가? 심하다면 어떤 종류의 Noise가 심한가?
  3. 우리가 놓친 데이터가 존재하는가? 또는 라벨링되지 않은 데이터가 존재하는가?

1과 2를 바탕으로 데이터셋 Addition과 Augmentation을 정하고, 3을 바탕으로 데이터 클렌징 여부나 예측 class를 정하는 듯하다. 주최측이 어떤 이유와 규칙으로 라벨링을 했는지 정확히 파악하고, 이를 바탕으로 cutmix나 mixup같은 것을 적용하는 방안을 고려해보면 될 듯 함.