issues
search
openly-jp
/
voiscribe
1
stars
0
forks
source link
Display transcription line when new segment is recognized
#281
Closed
shibukazu
closed
1 year ago
shibukazu
commented
1 year ago
Related Issue
close
https://github.com/openly-jp/voiscribe/issues/206
What
whisper.cppのnew_segment_callbackを利用して、セグメントの認識ごとに認識結果を表示するように変更
録音画面上への表示はセグメントごとに行いますが、Coredataへの保存は30sの塊をすべて認識した後に行います。これは以下の理由によるものです。
音声とTranscriptionLineの一貫性を保つためにはセグメントごとに音声を拡張していく必要があるが、セグメントごとに音声を拡張し、新たに保存し直すことはオーバーヘッドが大きい
過去30sのものが失われないかどうかはそこまで大きな問題ではない
Memo
Test
[x] 1分程度の音声でセグメントごとに出力される
[x] 2分程度の音声で現在認識中の30sより手前の音声および認識結果が失われない
[x] 2分程度の音声で音と書き起こしのずれが生じない
[x] 認識精度が劣化しない
[x] 異なる録音同士が独立する
Related Issue
close https://github.com/openly-jp/voiscribe/issues/206
What
Memo
Test