boostcampaitech3 / final-project-level3-cv-05

부스트캠프 AI Tech 3기 최종프로젝트 _ Post OCR Parsing 명함
1 stars 2 forks source link

[구현] Image Generator #2

Closed heruing closed 2 years ago

heruing commented 2 years ago

학습 데이터 생성을 위한 이미지 생성 프로그램 작성

Prototype 기한: ~ 2022-05-16

heruing commented 2 years ago

Template 미사용 버전 업로드 하였습니다. 크게 2가지 형태에서 이름과 직책(직업)이 고정으로 사용되며 이외의 정보는 사용 여부가 랜덤으로 선택됩니다. 이미지 로고 삽입, 다양성 추가, 안정화 예정입니다.

https://github.com/boostcampaitech3/final-project-level3-cv-05/tree/utils/generator

heruing commented 2 years ago
제목 비고
json annotation encoding 변경 cp494→UTF-8
data/domain.csv 수정 오류 수정
dudskrla commented 2 years ago

Template 사용 버전 업로드 하였습니다. 20가지의 템플릿 중 하나를 선택하여 명함 이미지가 생성됩니다. 템플릿에 따라 사용되는 정보가 선정됩니다. bbox 위치 조정, 다양성 추가 예정입니다.

-> 이후, 세로 명함으로 작업 방향을 변경했습니다.

KyubumShin commented 2 years ago

코드에서 추가적으로 고려 해야할 부분

  1. 코드 확장성을 위한 재설계
  2. output으로 나오는 word bbox point가 int형과 float 형이 혼재되어있으니 통일
  3. 카테고리부분도 bbox 생성
  4. 로고 합성한 이미지 부분도 bbox 생성
heruing commented 2 years ago

요구 사항 반영 현황

version1 추가 수정 내용

dudskrla commented 2 years ago

요구 사항 반영 현황

version3 추가 수정 내용

220518

220519

220520

version4 추가 수정 내용

220523

220524

220530