yeyupiaoling / PPASR

基于PaddlePaddle实现端到端中文语音识别,从入门到实战,超简单的入门案例,超实用的企业项目。支持当前最流行的DeepSpeech2、Conformer、Squeezeformer模型
Apache License 2.0
797 stars 131 forks source link

ppasr的VADPredictor,能支持自定义时间长度的切分吗? #160

Closed zouhan6806504 closed 1 year ago

zouhan6806504 commented 1 year ago
from ppasr.infer_utils.vad_predictor import VADPredictor
vad_predictor = VADPredictor()
wav, sr = soundfile.read('E:/audio/113987.wav', dtype='float32')
# print(wav.shape)
speech_timestamps = vad_predictor.get_speech_timestamps(wav, sr)

看示例和接口,没有能传具体切分时间的地方,目前我希望能指定一个切分时间,每段可以有一定偏差,但尽量往这个时间上靠

yeyupiaoling commented 1 year ago

那你可以手动拼接这些