Closed yuta0306 closed 8 months ago
TranscribeResults.segments[...].segment.end_secondsをもとに音声を切り出すと、音声の後ろが途切れる
TranscribeResults.segments[...].segment.end_seconds
https://github.com/yuta0306/ReazonSpeech/blob/cca6b1f67d268048f38cf583d8dd819edbbe544a/pkg/nemo-asr/src/decode.py#L57
end_secondsにSECONDS_PER_STEPを加算して、timestampに対応する区間全体が含まれるように変更
end_seconds
SECONDS_PER_STEP
この対応でも、まだ音声の後ろが途切れることがある
問題
TranscribeResults.segments[...].segment.end_seconds
をもとに音声を切り出すと、音声の後ろが途切れる変更点
https://github.com/yuta0306/ReazonSpeech/blob/cca6b1f67d268048f38cf583d8dd819edbbe544a/pkg/nemo-asr/src/decode.py#L57
end_seconds
にSECONDS_PER_STEP
を加算して、timestampに対応する区間全体が含まれるように変更補足
この対応でも、まだ音声の後ろが途切れることがある