Open FeiGePro opened 4 months ago
我要识别的视频前几秒都会有固定的bgm,这个bgm总会让模型识别生成“请不吝点赞 订阅 转发 打赏支持明镜与点点栏目”,若可以直接跳过前面的几秒,我就可以省去视频剪辑或者音轨分离的时间
可以用avidemux等软件无损分割下音视频,只保留需要的部分。或者uvr5只提取人声后识别效果更好些
可以手动输入全部时间戳,但是会导致 VAD 失效
那种感觉是在徒增烦恼
感谢
我要识别的视频前几秒都会有固定的bgm,这个bgm总会让模型识别生成“请不吝点赞 订阅 转发 打赏支持明镜与点点栏目”,若可以直接跳过前面的几秒,我就可以省去视频剪辑或者音轨分离的时间