CheshireCC / faster-whisper-GUI

faster_whisper GUI with PySide6
GNU Affero General Public License v3.0
1.72k stars 104 forks source link

能准确控制断句吗? #214

Open martjay opened 2 months ago

martjay commented 2 months ago

比如说一行字幕多少个标点符号这样分,我感觉识别出来的字幕有的长有的短,如果不是整句的话,翻译起来很麻烦吧

martjay commented 2 months ago

Snipaste_2024-08-31_22-58-34

CheshireCC commented 2 months ago

有手动分割选项可用,但是该功能测试很少,使用之后 VAD 将会失效

martjay commented 2 months ago

有手动分割选项可用,但是该功能测试很少,使用之后 VAD 将会失效

videotrans就能准确对每个断句分割,希望能优化啊,真的很头疼

martjay commented 2 months ago

有手动分割选项可用,但是该功能测试很少,使用之后 VAD 将会失效

还有另外一个实用功能没有实现,distil识别速度很快,我觉得完全可以做实时语音识别+字幕翻译,deeplx项目也能免费使用deepl,google也行,百度,腾讯,阿里

CheshireCC commented 2 months ago

翻译这块儿确实是只能输出英文,然后翻译成其他语言了,但是使用Google翻译或者百度翻译效果还是一般,大模型翻译方面 whisper 也是前沿成果了,虽然仅限英文翻译效果拔群。另外翻译这个功能也受断句制约比较严重