Closed zouhan6806504 closed 1 year ago
from ppasr.infer_utils.vad_predictor import VADPredictor vad_predictor = VADPredictor() wav, sr = soundfile.read('E:/audio/113987.wav', dtype='float32') # print(wav.shape) speech_timestamps = vad_predictor.get_speech_timestamps(wav, sr)
看示例和接口,没有能传具体切分时间的地方,目前我希望能指定一个切分时间,每段可以有一定偏差,但尽量往这个时间上靠
那你可以手动拼接这些
看示例和接口,没有能传具体切分时间的地方,目前我希望能指定一个切分时间,每段可以有一定偏差,但尽量往这个时间上靠