CSID-DGU / 2021-2-OSSP1-Ssaemsung-4

2021-2 공개SW프로젝트 01분반 - 쌤숭 팀
2 stars 2 forks source link

Ssaemsung

음성 기록 및 자동 요약 어플리케이션

GitHub last commit Most used language

Contents

About Team

이름 학과 역할
조현준 컴퓨터공학전공 팀장 / 텍스트 요약 모델 구현 및 서버 배포
조봉민 멀티미디어공학과 안드로이드 App UI 및 기능 개발
박예찬 컴퓨터공학전공 텍스트 요약 모델 구현 및 서버 배포
전휘준 컴퓨터공학전공 STT & 화자구분 서버 배포

개발 환경 및 Dependency

Android


Speech-to-text & 화자구분

텍스트 요약

프로젝트 구조도 및 기능

프로젝트 구조도



Speech-to-text & 화자구분

Stt 프로세스

  1. wav 파일 POST 요청
  2. Google Cloud Storage에 파일 업로드
  3. Speech API 호출하여 STT&화자구분 진행 후 JSON 형식으로 결과 출력
  4. 업로드된 파일 삭제


어플로 전송되는 JSON contents


Text Summarization


APP

메인 화면

실제 구동 캡쳐

녹음기능

녹음파일 불러오기

녹음본 텍스트화

텍스트 요약