k2-fsa / sherpa-ncnn

Real-time speech recognition and voice activity detection (VAD) using next-gen Kaldi with ncnn without Internet connection. Support iOS, Android, Linux, macOS, Windows, Raspberry Pi, VisionFive2, LicheePi4A etc.

https://k2-fsa.github.io/sherpa/ncnn/index.html

Apache License 2.0

996 stars 154 forks source link

ffmpeg编译不了，缺少libcodec #272

Closed timfengzi closed 6 months ago

timfengzi commented 11 months ago

在windows环境下，开启ffmpeg配置编译不了，缺少libcodec

csukuangfj commented 11 months ago

你是ffmpeg5吗？请贴具体的log?

timfengzi commented 11 months ago

csukuangfj commented 11 months ago

问了两个问题。请回答下你是否是 ffmpeg5

timfengzi commented 11 months ago

是这个版本git-2020-03-01-1281399

timfengzi commented 11 months ago

用ffmpeg6也是不行，Mac用6是可以的

timfengzi commented 11 months ago

sherpa-ncnn-ffmpeg是不是不兼容windows，这个没编译出来，sherpa-ncnn是可以的

timfengzi commented 11 months ago

错误 | C2065 | “SIGUSR1”: 未声明的标识符 | C:\msys64\sherpa\sherpa-ncnn\out\build\x64-Debug\sherpa-ncnn | C:\msys64\sherpa\sherpa-ncnn\ffmpeg-examples\sherpa-ncnn-ffmpeg.cc | 612 |

csukuangfj commented 11 months ago

sherpa-ncnn-ffmpeg是不是不兼容windows，这个没编译出来，sherpa-ncnn是可以的

这个只在 linux 和 macos 试过，没有在 windows上试过。应该是有办法支持的。

timfengzi commented 11 months ago

可以了，修改了一些文件，但不知道对不对。

sherp-ncnn-ffmpeg.cc头文件去掉了unistd.h，加上了#include

include

加上了static int32_t SIGUSR1 = 0x10;

sherp-ncnn-ffmpeg cmake文件去掉了pkgconfig相关，加上了ffmpeg编译出来的链接库或把ffmpeg编译出来的链接库复制到windows下也行

csukuangfj commented 11 months ago

可以了，修改了一些文件，但不知道对不对。

sherp-ncnn-ffmpeg.cc头文件去掉了unistd.h，加上了#include #include

加上了static int32_t SIGUSR1 = 0x10;

sherp-ncnn-ffmpeg cmake文件去掉了pkgconfig相关，加上了ffmpeg编译出来的链接库或把ffmpeg编译出来的链接库复制到windows下也行

方便提个 pull-request 吗？

timfengzi commented 11 months ago

windows7，windows10都可以，windows11不行

csukuangfj commented 11 months ago

这个是模型文件不完整。你检查下模型文件大小就知道了。应该是没用 git lfs pull

timfengzi commented 11 months ago

可以了，确实是模型文件不完整。请问有群吗，我发现一段长语音，在sherpa-ncnn准确率很低（用的是sherpa-ncnn-conv-emformer-transducer-2022-12-08-Chinese模型），在腾讯云的语音识别准确率很高，能不能自己训练模型？

csukuangfj commented 11 months ago

有群的, qq 和微信群。

入群方式在我们的文档里，请阅读 https://k2-fsa.github.io/sherpa/social-groups.html

csukuangfj commented 11 months ago

你应该要选 https://k2-fsa.github.io/sherpa/ncnn/pretrained_models/conv-emformer-transducer-models.html#csukuangfj-sherpa-ncnn-conv-emformer-transducer-2022-12-06-chinese-english

这个模型，是 sherpa-ncnn 里面，识别率最好的。你别看它是 chinese + english, 对纯 chinese 支持的也是蛮不错的。

如果你想要更多的模型，请使用 sherpa-onnx.

timfengzi commented 11 months ago

已经申请加群，非常好，准确率很高，但是有些同音的还是有错，比如学情分析变成了学琴分析，说课变成了说客等同音情况。

csukuangfj commented 11 months ago

已经申请加群，非常好，准确率很高，但是有些同音的还是有错，比如学情分析变成了学琴分析，说课变成了说客等同音情况。

你说的对。你对一个人说这些，他也很难知道你说的是什么字。