boostcampaitech3 / level2-data-annotation_cv-level2-cv-17

[2022.04.14 ~ 2022.04.21] OCR Text Detection Competition - 부스트캠프 AI Tech 3기
1 stars 1 forks source link

[feat] dataset usage & [refactor] usable py #24

Closed hyoseok1223 closed 2 years ago

hyoseok1223 commented 2 years ago

What is this PR?

다른 public dataset을 사용하고, 이에 대한 설명과 코드를 리팩토링한 PR입니다.

  1. AIHUB 데이터셋과 ICDAR 19데이터셋을 사용하기 위한 readme작성과 함께 그걸 돕기위한 shell script 예시가 작성되었습니다.
  2. 이러한 형식에 맞게 코드를 좀 더 general하게일부 refactoring 했습니다.

Changes

aihub_to_ufo.py -> aihub데이터셋 사용을 더 쉽게하고, 구조적으로 일부 refactoring했습니다. ( 거의 그대로입니다. 데이터셋 자체의 형식을 바꾸면서 기존과 거의 유사해졌습니다.) dataset.py -> ICDAR 데이터셋 사용에 좀 더 적합하게 refactoring했습니다. code/dataset : 데이터셋을 다운로드 받는 것과 이전에 정했던 아래와 같은 디렉토리 포맷에 맞추도록 돕기 위한 readme 설명과 shell script를 추가했습니다.

|-datasetname
   |-gt
      |-absdf.json
      |-dfsdf.json
      ...
   |-images
   |-ufo

To reviewers

Dongwoo-Im commented 2 years ago

@hyoseok1223 코드 리뷰는 아직 못했는데, train.py는 지워주시면 제 PR하고 충돌나지는 않을 것 같습니다! 저도 aihub_to_ufo.py 랑 convert_mlt.py 지워둘게요.

Dongwoo-Im commented 2 years ago

전체적으로 문제될 부분은 없는것 같습니다!

baekkr95 commented 2 years ago

확인했습니다

seonahmin commented 2 years ago

확인했습ㄴㅣ다