Display transcription line when new segment is recognized - Githubissues

openly-jp / voiscribe

1 stars 0 forks source link

Display transcription line when new segment is recognized #281

Closed shibukazu closed 1 year ago

shibukazu commented 1 year ago

Related Issue

close https://github.com/openly-jp/voiscribe/issues/206

What

whisper.cppのnew_segment_callbackを利用して、セグメントの認識ごとに認識結果を表示するように変更
録音画面上への表示はセグメントごとに行いますが、Coredataへの保存は30sの塊をすべて認識した後に行います。これは以下の理由によるものです。
- 音声とTranscriptionLineの一貫性を保つためにはセグメントごとに音声を拡張していく必要があるが、セグメントごとに音声を拡張し、新たに保存し直すことはオーバーヘッドが大きい
- 過去30sのものが失われないかどうかはそこまで大きな問題ではない
  Memo

Test

[x] １分程度の音声でセグメントごとに出力される
[x] 2分程度の音声で現在認識中の30sより手前の音声および認識結果が失われない
[x] 2分程度の音声で音と書き起こしのずれが生じない
[x] 認識精度が劣化しない
[x] 異なる録音同士が独立する