k2-fsa / sherpa-ncnn

Real-time speech recognition and voice activity detection (VAD) using next-gen Kaldi with ncnn without Internet connection. Support iOS, Android, Linux, macOS, Windows, Raspberry Pi, VisionFive2, LicheePi4A etc.
https://k2-fsa.github.io/sherpa/ncnn/index.html
Apache License 2.0
1.08k stars 160 forks source link

拼音识别 #328

Open mxvc opened 8 months ago

mxvc commented 8 months ago

你好,本人小白。目前我正在做一个背诵相关的app,用到这个很棒的库。其实我只需要识别到拼音就行了,有时候发音准确的(比如莫使金樽空对月),老是识别不了“金樽”,我猜测应该是推理出错。而我其实只需要识别到拼音“ jin zun”即可,就可以判断背诵是否正确。在这种场景下,应该怎么做?

csukuangfj commented 8 months ago

你可以把字,转成拼音,然后看看发音是否相近

pkufool commented 8 months ago

你好,本人小白。目前我正在做一个背诵相关的app,用到这个很棒的库。其实我只需要识别到拼音就行了,有时候发音准确的(比如莫使金樽空对月),老是识别不了“金樽”,我猜测应该是推理出错。而我其实只需要识别到拼音“ jin zun”即可,就可以判断背诵是否正确。在这种场景下,应该怎么做?

我有用拼音建模的模型,你要是需要我可以上传一个。

mxvc commented 8 months ago

你可以把字,转成拼音,然后看看发音是否相近

谢谢,我是通过拼音判断发音是否相同或相近。主要是会存在吞字或者给你换成另外的字。我猜测我需要重新训练下模型。

mxvc commented 8 months ago

你好,本人小白。目前我正在做一个背诵相关的app,用到这个很棒的库。其实我只需要识别到拼音就行了,有时候发音准确的(比如莫使金樽空对月),老是识别不了“金樽”,我猜测应该是推理出错。而我其实只需要识别到拼音“ jin zun”即可,就可以判断背诵是否正确。在这种场景下,应该怎么做?

我有用拼音建模的模型,你要是需要我可以上传一个。

好啊,谢谢。

Hugengrui commented 7 months ago

请问这个模型在哪里可以找到