CheshireCC / faster-whisper-GUI

faster_whisper GUI with PySide6
GNU Affero General Public License v3.0
1.72k stars 104 forks source link

转录时出现单字输出的问题 #153

Closed sonyjams closed 5 months ago

sonyjams commented 5 months ago

Screenshot 2024-06-12 181237 VAD的最小静息时长无论是默认还是1000结果都相同,关闭VAD也会出现该情况,其余参数未变动

nnnnn376 commented 5 months ago

你把单词级时间戳打开,然后再用whisperX时间戳对齐试试,可能有所好转

nnnnn376 commented 5 months ago

你可以把最小静息时长调成100,好像调大了字幕更碎

sonyjams commented 5 months ago

你可以把最小静息时长调成100,好像调大了字幕更碎

这些都调过了,不管用,最后卸载重装解决了

sonyjams commented 5 months ago

屏幕截图 2024-06-17 120202 阴差阳错下发现是这个之前调成了1导致的

nnnnn376 commented 5 months ago

屏幕截图 2024-06-17 120202 阴差阳错下发现是这个之前调成了1导致的

是的,这个调成1的话,如果两句话的开头词语是相同的就会出现这种错误

CheshireCC commented 5 months ago

屏幕截图 2024-06-17 120202 阴差阳错下发现是这个之前调成了1导致的

是的,这个调成1的话,如果两句话的开头词语是相同的就会出现这种错误

屏幕截图 2024-06-17 120202 阴差阳错下发现是这个之前调成了1导致的

是的,这个调成1的话,如果两句话的开头词语是相同的就会出现这种错误

😲😲😲😲 厉害了,这个参数是用来防止 重复 token 输出的,主要是用来抑制空白部分的幻听复读现象。。没想到会造成识别问题