parafomer model decoding error

chenkui164 / FastASR

这是一个用C++实现ASR推理的项目，它依赖很少，安装也很简单，推理速度很快，在树莓派4B等ARM平台也可以流畅的运行。支持的模型是由Google的Transformer模型中优化而来，数据集是开源wenetspeech(10000+小时)或阿里私有数据集(60000+小时)，所以识别效果也很好，可以媲美许多商用的ASR软件。

Apache License 2.0

472 stars 72 forks source link

parafomer model decoding error #50

Closed v-yunbin closed 1 year ago

v-yunbin commented 1 year ago

Audio time is 201.13125s. len is 3218100.
Model initialization takes 3.3s.
Traceback (most recent call last):
  File "examples/paraformer_cli.py", line 24, in <module>
    result = p.forward(data)
UnicodeDecodeError: 'utf-8' codec can't decode byte 0x82 in position 2: invalid start byte

chenkui164 commented 1 year ago

是这样的Python的里面没有做vad，所以输入太长会导致内存溢出，从而模型崩溃

v-yunbin commented 1 year ago

是这样的Python的里面没有做vad，所以输入太长会导致内存溢出，从而模型崩溃

这块儿我加了VAD依然报那个错。

  File "examples/paraformer_cli.py", line 34, in <module>
    result = p.forward(partdata_numpy)
UnicodeDecodeError: 'utf-8' codec can't decode byte 0x83 in position 2: invalid start byte

chenkui164 commented 1 year ago

把音频提交上，让我debug一下

v-yunbin commented 1 year ago

把音频提交上，让我debug一下公司电脑限制往上传，上传不上来。。。其实就是一个wav音频30s share.wav: RIFF (little-endian) data, WAVE audio, Microsoft PCM, 16 bit, mono 16000 Hz

chenkui164 commented 1 year ago

是在window下么？

v-yunbin commented 1 year ago

是在window下么？

linux上面，之前在windows试了下没装上，找不到fastasr包。

chenkui164 commented 1 year ago

我这里都是正常的，中文，英文，中英文

chenkui164 commented 1 year ago

我win10系统，刚试过我直接pip install fastasr就能用，没有异常

v-yunbin commented 1 year ago

我这里都是正常的，中文，英文，中英文

windows刚装上了，是可以的，liunux卸载了重装还不行。。。。。奇怪

chenkui164 commented 1 year ago

试试重新下载模型里面的vocab.txt，我也不知道原因在哪了

v-yunbin commented 1 year ago

试试重新下载模型里面的vocab.txt，我也不知道原因在哪了

是这个问题，用你这个仓库自带的vocab.txt 可以了。modelscpe下载的有问题。