CheshireCC / faster-whisper-GUI

faster_whisper GUI with PySide6
GNU Affero General Public License v3.0
1.69k stars 104 forks source link

希望能开放这些参数的调节 #157

Closed nnnnn376 closed 5 months ago

nnnnn376 commented 5 months ago

max_length: 448 num_samples_per_token: 320 time_precision: 0.02 tokens_per_second: 50 input_stride: 2

这几个参数似乎只能在日志上看到,在界面中没有看到能调的地方,而且我认为和whisperX时间戳对齐失败可能有些关系,如果能采纳,无比感谢

nnnnn376 commented 5 months ago

对齐失败日志.txt

CheshireCC commented 5 months ago

对齐失败日志.txt

当字幕中有大量 短促对话甚至时间戳紧密相连或者相互压盖的情况下,具体体现为 一个人说话的时候被另一个人快速打断,从字母上看就是有很多内容很短、持续时间很短但密集的字幕语句的时候就会出现该错误, 暂时的解决方案,你可以在字幕表格中合并掉内容太短或者持续时间太短的字幕

CheshireCC commented 5 months ago

max_length: 448 num_samples_per_token: 320 time_precision: 0.02 tokens_per_second: 50 input_stride: 2

这几个参数似乎只能在日志上看到,在界面中没有看到能调的地方,而且我认为和whisperX时间戳对齐失败可能有些关系,如果能采纳,无比感谢

目前 fw 后端还只能调整 max_length 参数,在转写参数页面,该参数为最大新令牌数