Open martjay opened 2 months ago
有手动分割选项可用,但是该功能测试很少,使用之后 VAD 将会失效
有手动分割选项可用,但是该功能测试很少,使用之后 VAD 将会失效
videotrans就能准确对每个断句分割,希望能优化啊,真的很头疼
有手动分割选项可用,但是该功能测试很少,使用之后 VAD 将会失效
还有另外一个实用功能没有实现,distil识别速度很快,我觉得完全可以做实时语音识别+字幕翻译,deeplx项目也能免费使用deepl,google也行,百度,腾讯,阿里
翻译这块儿确实是只能输出英文,然后翻译成其他语言了,但是使用Google翻译或者百度翻译效果还是一般,大模型翻译方面 whisper 也是前沿成果了,虽然仅限英文翻译效果拔群。另外翻译这个功能也受断句制约比较严重
比如说一行字幕多少个标点符号这样分,我感觉识别出来的字幕有的长有的短,如果不是整句的话,翻译起来很麻烦吧