selebseed / transcript_minutes

音声から議事録をとるWebアプリです
0 stars 1 forks source link

Web Speech APIを調査する #8

Open stat-ki opened 4 years ago

stat-ki commented 4 years ago

調査経過

反復的にリクエストする方法について

文章の区切りについて

どこまでを一つの発言とするかについては、API側で判断する。レスポンスについて、句読点などの処理についても可能であれば対応していきたい。

相槌など文字数の制約について

「あー」や「うん」といった相槌、また発言ではなくとも、文字起こしされてしまったものに関しては記録しないようにする。そのためにひとまず、2〜3字以下のレスポンスについては無視するようにしていく。

マイクアクセスについて

バックグランドでの実行、または別タブでの開いている状態においても認識をする。ただし、ブラウザの問題で、HTTPSでないとマイクアクセスが許可されないため、本番環境はHTTPS化が必須。

サーバーサイドとの連携について

このAPIはクライアントサイドでしか動かすことができないため、DB操作などサーバーサイドとの連携について、検討する必要がある。処理の流れとして、 リクエスト→ユーザー情報やタイムスタンプを付与し、レスポンスを反映→会議終了ボタンをクリック(ここまでクライアント側)→ページ内要素を取得し、DB操作を行う といった流れで考えているが、要検討である。

リファレンス

使用方法(日本語) 仕様書(英語)