ppasr的VADPredictor，能支持自定义时间长度的切分吗？

yeyupiaoling / PPASR

基于PaddlePaddle实现端到端中文语音识别，从入门到实战，超简单的入门案例，超实用的企业项目。支持当前最流行的DeepSpeech2、Conformer、Squeezeformer模型

Apache License 2.0

797 stars 131 forks source link

ppasr的VADPredictor，能支持自定义时间长度的切分吗？ #160

Closed zouhan6806504 closed 1 year ago

zouhan6806504 commented 1 year ago

from ppasr.infer_utils.vad_predictor import VADPredictor
vad_predictor = VADPredictor()
wav, sr = soundfile.read('E:/audio/113987.wav', dtype='float32')
# print(wav.shape)
speech_timestamps = vad_predictor.get_speech_timestamps(wav, sr)

看示例和接口，没有能传具体切分时间的地方，目前我希望能指定一个切分时间，每段可以有一定偏差，但尽量往这个时间上靠

yeyupiaoling commented 1 year ago

那你可以手动拼接这些