-
用demo试了下时间长的语音识别,识别出的文本都没有断句标点,这个怎么实现呢?
-
cuda版本:11.6
cudnn版本:8.5.0.96
GPU:rtx2080
```
(ppasr) PS C:\Users\30380\Desktop\style\PPASR> python .\train.py
C:\Users\30380\MiniConda3\envs\ppasr\lib\site-packages\pydub\utils.py:170: RuntimeWar…
-
我这边想在asr的test_wav下实现多batch推理,然后我就简单的cat了两个相同的输入:(1,590,80)->(2,590,80)送入模型推理,理论上
result_transcripts出来两个推理结果应该是一样的,因为我cat的是两个相同输入。但是现在第一个结果是对的,第二个结果不对很奇怪
![image](https://user-images.githubuserconten…
-
这个问题可能有点过分 想请大佬指点一二。
得分: 82, 消耗时间:4275ms, 识别结果: 嗯哈您好您拨叫的用户暂时无人接听
我想知道对应的文字是录音的哪个时间段的。
-
使用的docker环境,镜像为registry.baidubce.com/paddlepaddle/paddle:2.1.3-gpu-cuda10.2-cudnn7,解决了各种问题后,终于环境编译通过,现在运行tiny/run.sh进行测试,在运行到test.sh时会发生错误,找不到解决方法,请求帮助。以下为报错信息
2021-10-14 08:27:28.545 | INFO | …
-
# ❓ Questions & Help
LexerNoViableAltException 로 인해 dataset.dataset_path를 지정할 수 없습니다.
로그: https://www.toptal.com/developers/hastebin/tavosicufa.sql
## Details
데이터셋의 위치는 환경변수를 거치지 않고 절대 경로를 사용하여 …
-
----------- Configuration Arguments -----------
alpha: 1.2
beam_size: 10
beta: 0.35
cutoff_prob: 1.0
cutoff_top_n: 40
decoder: ctc_beam_search
is_long_audio: False
lang_model_path: D:\dnf\zh…
-
checkpoint name deepspeech2
File "/DeepSpeech/examples/dataset/librispeech/librispeech.py", line 122
print(f"{subset}:", file=f)
^
SyntaxError: invalid syntax
Prepare L…
-
I'm trying to finetune the librispeech model to train a Persian STT.
this is the command :
`CUDA_VISIBLE_DEVICES=1 python train.py data.train_path=/mnt/ssd/masoud_parpanchi/cv-corpus-6.1-2020-12-…
-
```
(asr) D:\ASR>python train.py
----------- Configuration Arguments -----------
alpha: 2.2
augment_conf_path: conf/augmentation.json
batch_size: 32
beam_size: 300
beta: 4.3
cutoff_prob: 0.99…