Closed ta1231 closed 1 year ago
제한된 모델, 데이터 표현방법에서, 상하반전, Curved Text Region, 겹친 영역, 세로 텍스트 등 Corner Case를 잘 다뤄야 고득점을 할 수 있다.
오피스아워에서 준 힌트로는 무시하는 게 무조건 안좋긴 하겠지만, 실제로 리더보드 점수에 얼마나 영향을 미치는지 실험해보는 건 좋을 것 같아.
#cb88a0e5c67c977004e97b80ad38313906e0b338 일단은 꼭지점중에서 xmin, ymin, xmax, ymax좌표 이용해서 직사각형 만들어봤는데 내일 이야기해보자
min max box
point box
장점: minmax 방법보다 배경이미지(또는 노이즈)가 적게 들어간다 단점: DetEval은 one-to-many match일 경우 score 값을 감소시키는데, 모델에게 one-to-many인 데이터를 주는 것과 같다
mini box threshold를 정해서 배경이 일정 이상 포함되는 경우 더 작은 박스를 생성하게 한다
장점: minmax 방법보다 배경이미지(또는 노이즈)가 적게 들어가고 pointbox 방법보다 split이 덜 된다. 단점: 구현의 어려움(ex. 배경과 글자의 넓이를 구하는 알고리즘), 실험의 어려움(threshold를 실험으로 찾아내야한다)
threshold를 이용하는 것의 구현어려움으로 minmax방법을 이용하는 것으로 마무리
Overview
Todo