boostcampaitech3 / final-project-level3-cv-16

👀 너의 알약이 보여 💊 : 알약 이미지 분류 프로젝트
5 stars 6 forks source link

[ML][Experiment] OCR Text BBOX Crop #33

Closed seoulsky-field closed 2 years ago

seoulsky-field commented 2 years ago

What

CRAFT 모델의 결과물인 txt file을 이용하여 BBOX Crop을 진행합니다.

Why

Text만을 Crop하여 deep-text-recognition-benchmark 모델에 돌릴 경우 정확도가 높게 나왔기 때문에 진행합니다.

How

seoulsky-field commented 2 years ago

해당 이슈에 대해서 commit한 code에는 "이미지 저장"을 추가하지 않았습니다.

현재 OCR의 상황은 이미지 -> segmentation 한 후 알약에 대해 crop된 이미지 저장 -> 해당 이미지 로드 -> CRAFT -> CRAFT 결과물 저장 -> 결과물 중 txt 및 crop된 알약 이미지 로드 -> Text Crop -> Crop 된 이미지 저장 -> Text Crop 된 이미지 로드 -> deep-text-recognition-benchmark -> text 결과물 반환의 형태를 가지고 있습니다.

이 때, "이미지 저장 및 로드"가 너무 많고 중복되는 이미지도 존재하기 때문에 이 부분을 팀원들과 이야기해보고 진행하면 좋을 것 같아서 추가하지 않았습니다. 관련하여 논의하고 이미지 저장을 추가하기로 결정하면 관련 코드를 추가하겠습니다.