Open wntg opened 7 months ago
大佬,我在用whisper推理我业务数据的时候,经常出现连续很长的字或词的问题,有什么好的解决办法吗
如果是那种同一句话的重复,那是 Whisper 的幻觉问题。配合 Voice activity Detection (VAD)可以解决,相关的项目可以看看 whipserX,GUI 的话用 Memo 就行。
如果是转录文本准确,但是没有断句导致这句话很长。Whisper 在 GPU 加速情况下就可能会出这个问题==但也没啥好的方案解决,换模型、换 prompt、修改初始参数==
大佬,我在用whisper推理我业务数据的时候,经常出现连续很长的字或词的问题,有什么好的解决办法吗