RyanKor / 2021-google-ml-bootcamp

Google Machine Learning Bootcamp 2021
13 stars 0 forks source link

[Pop Idea] 문득 떠오른 만들어 볼 수 있는 머신러닝 프로젝트 아이디어 구조 #27

Closed RyanKor closed 2 years ago

RyanKor commented 3 years ago

서비스 제작에 대한 전반적인 프로세스

  1. Pretrained Model을 사용해서 모델의 학습 효율 & 시간을 개선하고 (즉, 전이 학습을 사용)

  2. 이렇게 만들어진 모델을 GCP Function을 사용해서 serverless로 배포

  3. 만들어진 GCP Function에 배포된 모델은 Django로 서버를 빌드에 연동

  4. Front (아님 그냥 리액트로 빌드하거나) 만들고, 그걸 웹 상에 EB 같은 것을 사용해 배포

(GCP에서도 배포 자동화 툴이 있을텐데 이걸 찾아보면 좋을 것 같다. GCP 가상 인스턴스 이름도 모르고 있다.)

  1. 코드 업데이트할 때마다 github에 CI를 연결해서 배포 자동화 과정 진행 (무중단 배포)

백엔드 애플리케이션에 머신러닝 모델을 함께 얹어서 배포하지 않는 이유?

RyanKor commented 2 years ago

문득 러닝하다가 생각난 머신러닝 프로젝트 : 도시가스 요금 미터기 OCR 스캔 프로젝트

GCP Data Engineer 자격증 취득 준비를 하고 있어서 데이터 파이프라인을 GCP를 이용해 한 번 실습해보고, 구글에 도시가스 계량기 이미지는 널렸으니, 이걸 이용해서 OCR 모델을 만든 후, 배포해서 계량기 숫자를 인식시키는 것이다.

매 달 도시가스 요금 검침을 위해 모바일 또는 집 문 앞에 도시 가스 사용량을 표기하는데, 이걸 굳이 타이핑하거나 문 앞에 번거롭게 나가서 적는 것보다 가스 계량기 사진을 찍고 -> 모바일로 업로드 해서 (주민등록증 인증하는 것처럼) 인증하면 훨씬 쉬울 것 같다.

OCR 기법에 대해 찾아보니 CNN + RNN이 되어야한다고 하는데, 딥러닝으로 해결할 수 있는 문제로 보인다.

지금 NLP 트위터 프로젝트, 추천 시스템 과제를 마무리하고 한 번 OCR 프로젝트 빌드를 해봐야겠다.

구글 이미지 크롤러 모듈로 필요한 이미지는 충분히 긁어올 수 있을 것 같다..?

image