zj1123581321 / Adjust_SubTitle

调节 Whisper 转录生成的 srt 文件,避免一句话被分成两行,避免一句话过短。
23 stars 1 forks source link

中文幻觉问题 #1

Open wntg opened 7 months ago

wntg commented 7 months ago

大佬,我在用whisper推理我业务数据的时候,经常出现连续很长的字或词的问题,有什么好的解决办法吗

zj1123581321 commented 7 months ago

如果是那种同一句话的重复,那是 Whisper 的幻觉问题。配合 Voice activity Detection (VAD)可以解决,相关的项目可以看看 whipserX,GUI 的话用 Memo 就行。

如果是转录文本准确,但是没有断句导致这句话很长。Whisper 在 GPU 加速情况下就可能会出这个问题==但也没啥好的方案解决,换模型、换 prompt、修改初始参数==