Open stat-ki opened 4 years ago
どこまでを一つの発言とするかについては、API側で判断する。レスポンスについて、句読点などの処理についても可能であれば対応していきたい。
「あー」や「うん」といった相槌、また発言ではなくとも、文字起こしされてしまったものに関しては記録しないようにする。そのためにひとまず、2〜3字以下のレスポンスについては無視するようにしていく。
バックグランドでの実行、または別タブでの開いている状態においても認識をする。ただし、ブラウザの問題で、HTTPSでないとマイクアクセスが許可されないため、本番環境はHTTPS化が必須。
このAPIはクライアントサイドでしか動かすことができないため、DB操作などサーバーサイドとの連携について、検討する必要がある。処理の流れとして、 リクエスト→ユーザー情報やタイムスタンプを付与し、レスポンスを反映→会議終了ボタンをクリック(ここまでクライアント側)→ページ内要素を取得し、DB操作を行う といった流れで考えているが、要検討である。
使用方法(日本語) 仕様書(英語)
調査経過
反復的にリクエストする方法について
文章の区切りについて
どこまでを一つの発言とするかについては、API側で判断する。レスポンスについて、句読点などの処理についても可能であれば対応していきたい。
相槌など文字数の制約について
「あー」や「うん」といった相槌、また発言ではなくとも、文字起こしされてしまったものに関しては記録しないようにする。そのためにひとまず、2〜3字以下のレスポンスについては無視するようにしていく。
マイクアクセスについて
バックグランドでの実行、または別タブでの開いている状態においても認識をする。ただし、ブラウザの問題で、HTTPSでないとマイクアクセスが許可されないため、本番環境はHTTPS化が必須。
サーバーサイドとの連携について
このAPIはクライアントサイドでしか動かすことができないため、DB操作などサーバーサイドとの連携について、検討する必要がある。処理の流れとして、 リクエスト→ユーザー情報やタイムスタンプを付与し、レスポンスを反映→会議終了ボタンをクリック(ここまでクライアント側)→ページ内要素を取得し、DB操作を行う といった流れで考えているが、要検討である。
リファレンス
使用方法(日本語) 仕様書(英語)