chenkui164 / FastASR

这是一个用C++实现ASR推理的项目,它依赖很少,安装也很简单,推理速度很快,在树莓派4B等ARM平台也可以流畅的运行。 支持的模型是由Google的Transformer模型中优化而来,数据集是开源wenetspeech(10000+小时)或阿里私有数据集(60000+小时), 所以识别效果也很好,可以媲美许多商用的ASR软件。
Apache License 2.0
472 stars 72 forks source link

parafomer model decoding error #50

Closed v-yunbin closed 1 year ago

v-yunbin commented 1 year ago
Audio time is 201.13125s. len is 3218100.
Model initialization takes 3.3s.
Traceback (most recent call last):
  File "examples/paraformer_cli.py", line 24, in <module>
    result = p.forward(data)
UnicodeDecodeError: 'utf-8' codec can't decode byte 0x82 in position 2: invalid start byte
chenkui164 commented 1 year ago

是这样的Python的里面没有做vad,所以输入太长会导致内存溢出,从而模型崩溃

v-yunbin commented 1 year ago

是这样的Python的里面没有做vad,所以输入太长会导致内存溢出,从而模型崩溃

这块儿我加了VAD依然报那个错。

  File "examples/paraformer_cli.py", line 34, in <module>
    result = p.forward(partdata_numpy)
UnicodeDecodeError: 'utf-8' codec can't decode byte 0x83 in position 2: invalid start byte
chenkui164 commented 1 year ago

把音频提交上,让我debug一下

v-yunbin commented 1 year ago

把音频提交上,让我debug一下 公司电脑限制往上传,上传不上来。。。其实就是一个wav音频30s share.wav: RIFF (little-endian) data, WAVE audio, Microsoft PCM, 16 bit, mono 16000 Hz

chenkui164 commented 1 year ago

是在window下么?

v-yunbin commented 1 year ago

是在window下么?

linux上面,之前在windows试了下没装上,找不到fastasr包。

chenkui164 commented 1 year ago

我这里都是正常的,中文,英文,中英文 image

chenkui164 commented 1 year ago

我win10系统,刚试过我直接pip install fastasr就能用,没有异常

v-yunbin commented 1 year ago

我这里都是正常的,中文,英文,中英文 image

windows刚装上了,是可以的,liunux卸载了重装还不行。。。。。奇怪

chenkui164 commented 1 year ago

试试重新下载模型里面的vocab.txt,我也不知道原因在哪了

v-yunbin commented 1 year ago

试试重新下载模型里面的vocab.txt,我也不知道原因在哪了

是这个问题,用你这个仓库自带的vocab.txt 可以了。modelscpe下载的有问题。