Closed hpp0hpp closed 5 years ago
从进程上来看,格式工厂也是利用了ffmpeg,但不知道为什么效率差那么多。
这个大概是因为转换参数的原因,你可以适当把采样率调低,我这个采样率是按照最高的水准进行的。采样率可以调整,但我不保证调整以后的采样率会被api接受,需要你自己测试。以及禁止音频再处理的选项,我都有提供,readme里面的音频处理选项里对这些选项都有说明,我这里不再赘述。
这确实是个bug,是我的ffmpeg参数有点问题,详见 #66,现在已经修复,尚未发布
正在windows环境下使用您的工具进行批量语音识别,发现: 1.长度较长的视频文件转换成Flac的效率特别低,相较于格式工厂来讲,应该用了十倍以上的转换时长,同时占用了大量CPU。这个可能是ffmpeg的问题,但不知道格式工厂是通过什么技术搞定的。
为API转换为"C:\Users\admin\AppData\Local\Temp\tmp959mywna.flac"。 ffmpeg.exe -hide_banner -y -i "C:\Users\admin\Downloads\Compressed\autosub\S06E09.flac" -ac 1 -ar 44100 "C:\Users\admin\AppData\Local\Temp\tmp959mywna.flac"