boostcampaitech3 / level2-data-annotation_cv-level2-cv-17

[2022.04.14 ~ 2022.04.21] OCR Text Detection Competition - 부스트캠프 AI Tech 3기
1 stars 1 forks source link

[Augmentation] Data Augmentation for Scene Text Recognition 논문 #9

Closed baekkr95 closed 2 years ago

baekkr95 commented 2 years ago

Background

Augmentation을 통해 모델의 성능을 개선하는게 부캠측에서 말하는 이번 대회의 큰 목적 중 하나이다.

Content

Basecode의 dataset.py에 새로운 Augmentation 기법들을 추가하면 될 것 같습니다.

Details

팀 노션, Reference 테이블에 추가했습니다.

hyoseok1223 commented 2 years ago

실제 OCR데이터셋 구축 자체의 과정에서 산업현장을 고려해서 증간된 데이터를 제공하기도 한다는 것을 확인했습니다. issue의 논문과는 다르지만, 아래와 같이 OCR데이터셋에 대해서 구축에서도 사용되었던 augmentation기법들 자체를 고려해봐도 좋을 것 같습니다. image