Closed chenqy2018 closed 4 months ago
使用上面python生成的test.wav给python-api-examples/online-decode-files.py测试也是正常识别出文字的;
RTF 是多少?
如果你不知道什么是 RTF, 请跑 ./build/bin/sherpa-onnx
Real time factor (RTF): 12.949/10.053 = 1.288 我使用的是rk3568,cpu处理不行?
你要选一个模型,使得 RTF < 1.
不然处理不过来,肯定 overflow.
好的,谢谢,请问有相关onnx转rknn介绍吗,需要注意哪些算子
好的,谢谢,请问有相关onnx转rknn介绍吗,需要注意哪些算子
我们没有
好的,谢谢,请问有相关onnx转rknn介绍吗,需要注意哪些算子
你实现了吗?需要注意哪些算子
好的,谢谢,请问有相关onnx转rknn介绍吗,需要注意哪些算子
你实现了吗?需要注意哪些算子
qq 群里有人实现了,你可以去问下。没有开源
自己使用python测试usb声卡录音是正常的,部分代码如下: with sd.InputStream(samplerate=sample_rate, channels=channels, device=deviceindex) as stream: print("录音开始...") for in range(int(sample_rate * duration / samples_per_read)): data, overflowed = stream.read(samples_per_read) if overflowed: print("缓冲区溢出!")
将采集的数据转换为 bytes 并写入文件
print("录音结束")
使用上面python生成的test.wav给python-api-examples/online-decode-files.py测试也是正常识别出文字的;
使用speech-recognition-from-microphone.py测试打印Started! Please speak后没有反应;
修改speech-recognition-from-microphone.py如下代码: sample_rate = 16000 samples_per_read = int(0.1 * sample_rate) # 0.1 second = 100 ms last_result = "" stream = recognizer.create_stream() with sd.InputStream(channels=1, dtype="float32", samplerate=sample_rate,device=1) as s: while True: samples, overflowed = s.read(samples_per_read) # a blocking read if overflowed: print("缓冲区溢出!") samples = samples.reshape(-1)
运行代码如下: Started! Please speak 缓冲区溢出! 缓冲区溢出! 缓冲区溢出! 缓冲区溢出! 缓冲区溢出! ...... ^C Caught Ctrl + C. Exiting 请问下如何处理?