gobongbob / Learn-ON

Online Re-Learning assistant "Learn ON"'s repository
http://13.125.220.170:3000/
MIT License
0 stars 3 forks source link

[API] AWS Transcribe & Comprehend #16

Open bobsiunn opened 3 years ago

bobsiunn commented 3 years ago

저희가 사용하게 될 AWS API, Transcribe와 Comprehend에 대해 조사하던 중 여러 가지 정보를 알 수 있었습니다.

물론 현재 저희의 가장 큰 이슈인 AWS API 반환값의 json 형식을 알 수 없어 DB 구축이 불가능한 상황에 대한 답을 얻지는 못했지만, 데이터에 대한 영상 내 시간 매칭 관련 이슈를 해결할 수 있을 것이라는 가능성을 보았습니다.

먼저 저희 Learn ON의 구조는 영상 -> 음성 -> 텍스트 -> 키워드 과정 이후, 입력한 키워드가 가장 많이 분포하는 시점으로 영상 재생 시점을 이동시켜주는 것인데, 이 부분에서 키워드가 가장 많이 분포하는 정확한 시점을 어떻게 찾을 수 있을 것인가에 대한 이슈가 있었습니다.

하지만, 조사 결과 AWS Transcribe(STT 변환) API에서 Time tag 생성 기능을 지원한다는 사실을 알게 되었고, 해당 기능을 이용하면, 키워드와 시점을 매칭하는 절차를 구현함에 있어 큰 이점이 있을 것으로 보입니다.

또한 AWS Comprehend의 json 형식을 모름에도 간접적으로 반환값에 대한 유추가 가능한데, 첨부해드린 링크를 확인하시면, Name Entities(고유 명사), Key Pharses(핵심 어구), Sentiment(감정), Language(언어) 이렇게 반환값이 구성되는 것을 확인할 수 있었습니다.

https://www.slideshare.net/awskorea/aws-ai-aws-aws-innovate-2019 관련 링크입니다. ML 개발 관련 Roll이 아니시더라도 한번씩 확인해주시면 감사하겠습니다

bobsiunn commented 3 years ago

https://aws.amazon.com/ko/blogs/korea/amazon-comprehend-continuously-trained-natural-language-processing/