boostcampaitech3 / final-project-level3-cv-05

부스트캠프 AI Tech 3기 최종프로젝트 _ Post OCR Parsing 명함
1 stars 2 forks source link

[구현][FE] Image input pipeline #8

Closed heruing closed 2 years ago

heruing commented 2 years ago

FE 이미지 전처리

할 일

heruing commented 2 years ago
image

고려사항

  1. 각도 보정

    • 회전각
      • 좌우 각 180도씩 조정할 수 있도록 설정
    • 기울임 보정
      • 수동 보정 값이 너무 많아질 경우 사용성이 오히려 떨어지고 converter에 포함된 내용이므로 생략
      • 너무 기울어진 이미지는 보정과 무관하게 추출이 어려우므로 생략
  2. Threshold

    • Invert
      • 체크 시 cv2.THRESH_BINARY_INV 형태로 binary 이미지 생성
    • Threshold
      • 자동: cv2.THRESH_OTSU
      • 수동: 슬라이더 입력 값
  3. Crop

    • Crop 외부 내부를 구분할 수 있는 FE 출력 제공

FE tool(Streamlit)의 서비스 한계점

  1. Interactive Image의 제한
    • 이미지 상의 터치로 각도나 crop box의 조정을 하기 굉장히 어려움(JavaScript 코드를 string형태 함수 출력으로 넣어야 함)
  2. Camera 접근 제한
    • st.camera_input() 해당 코드는 로컬에서만 사용 가능
    • streamlit-webrtc 라는 확장 프로그램 있으나 단순 촬영에 사용하기 무거움
    • 가능하다면 cv2를 활용한 촬영 기능 구현 예정

→ 실제 서비스가 이루어진다면 FE에서 터치 조작을 통해 간편하게 이미지를 input할 수 있는 형태로 제공 demo 구현 상태는 사용자가 슬라이더를 조정해서 진행