boostcampaitech4lv23cv2 / level2_dataannotation_cv-level2-cv-11

level2_dataannotation_cv-level2-cv-11 created by GitHub Classroom
2 stars 1 forks source link

꼭짓점이 6개 이상인 데이터에 대한 전처리 논의 #8

Closed ta1231 closed 1 year ago

ta1231 commented 1 year ago

Overview

Todo

  1. 6개 이상인 데이터를 직사각형으로 만들기
  2. 6개 이상인 데이터 무시하기
ganghe74 commented 1 year ago

제한된 모델, 데이터 표현방법에서, 상하반전, Curved Text Region, 겹친 영역, 세로 텍스트 등 Corner Case를 잘 다뤄야 고득점을 할 수 있다.

오피스아워에서 준 힌트로는 무시하는 게 무조건 안좋긴 하겠지만, 실제로 리더보드 점수에 얼마나 영향을 미치는지 실험해보는 건 좋을 것 같아.

ta1231 commented 1 year ago

#cb88a0e5c67c977004e97b80ad38313906e0b338 일단은 꼭지점중에서 xmin, ymin, xmax, ymax좌표 이용해서 직사각형 만들어봤는데 내일 이야기해보자

jerry-ryu commented 1 year ago

min max box 제목 없음

jerry-ryu commented 1 year ago

point box 제목 없음2

장점: minmax 방법보다 배경이미지(또는 노이즈)가 적게 들어간다 단점: DetEval은 one-to-many match일 경우 score 값을 감소시키는데, 모델에게 one-to-many인 데이터를 주는 것과 같다

jerry-ryu commented 1 year ago

mini box 제목 없음3 threshold를 정해서 배경이 일정 이상 포함되는 경우 더 작은 박스를 생성하게 한다

장점: minmax 방법보다 배경이미지(또는 노이즈)가 적게 들어가고 pointbox 방법보다 split이 덜 된다. 단점: 구현의 어려움(ex. 배경과 글자의 넓이를 구하는 알고리즘), 실험의 어려움(threshold를 실험으로 찾아내야한다)

ta1231 commented 1 year ago

threshold를 이용하는 것의 구현어려움으로 minmax방법을 이용하는 것으로 마무리