WEIFENG2333 / VideoCaptioner

🎬 卡卡字幕助手 | VideoCaptioner - 基于 LLM 的智能字幕助手,无需GPU一键高质量字幕视频合成!支持生成、断句、优化、翻译全流程。让视频字幕制作简单高效!
GNU General Public License v3.0
100 stars 7 forks source link

問題&建議 #2

Open cs064857 opened 1 day ago

cs064857 commented 1 day ago

問題: 1、視頻總共8分鐘,使用B接口、J接口轉錄後出來的【原始字幕】B 接口.srt也有8分鐘,但是為何【优化字幕】result.ass、【优化字幕】result_智能断句.srt這兩個只有5分40秒的內容?我試了三次都差不多是這個結果。而用本地Whisper large v2來跑就正常沒這個問題。

建議: 1、若上傳的是mp3等純音頻的話,能將音頻轉為視頻再進行字幕合成嗎?不然最後合成出來的是mp3,看不到字幕

2、請問能提供自定義提示詞嗎,比如說可以設定成翻譯為學術風格或者加入破限提示詞之類的?

WEIFENG2333 commented 1 day ago

1.由于程序设置了缓存,所以说即使你调用了3次后面两次会使用缓存得到一样的结果。目前可以尝试清空目录 AppData\cache来清空缓存。后续会优化相关逻辑。 猜测原因是程序大模型公益接口较多人使用,并不稳定,请求错误然后会有错漏。不过还是建议配置自己的OpenAI接口,使用更强大的模型。

2.转换出来有字幕文件的,直接把字幕文件拖到你的音频播放器就可以查看了。转换成视频其实没有什么必要。

3.自定義提示詞是一个不错的功能,后续会加上的。

谢谢你的建议。