-
大佬好牛,想问问你这边转onnx的步骤和思路,之前我也尝试过转但是转不成功
-
你好,现有自己的数据集,如何用这些个模型跑自己的数据集?3dspeaker 数据集优的文件自己的数据集并没有,例如trials文件等,求教求教!
-
I ran the exact same script for the EResNet experiment on VoxCeleb. The EER and minDCF I got is 1.0105 and 0.1146, which is not comparable to the paper. The only difference is that I trained the model…
-
## 问题描述
使用 SV 进行声纹验证,一段音频是存在人声的音频,另一段音频几乎没有声音(没有人声)。验证结果应该是低于阈值 0.6,但是结果却是高于0.6。想问下对于模型的识别结果,能获取到判断依据么?另外这个 threshold 一般应该设置多少合适?
## 使用模型
damo/speech_campplus_sv_cn_cnceleb_16k
## 识别结果
{'scor…
-
请问cam++ 适合做文本相关的说话人确认任务吗?
-
1、提出使用200k的说话人进行训练,但是3D-Speaker中只有10000个说话人,请问是还使用了其他数据吗?
2、使用这个模型对CNCeleb的测试集和注册集分别提取embedding,然后再使用项目中的compute_score_metrics.py计算EER,我这边结果是4.08,这样对吗?比给出的结果2.8高出不少呢
-
使用了最新的Funasr==1.0.4,需要补充model_revision和修改vad_pipeline(wpath),但是在执行第六步的时候,会出现这样的报错,换成旧的0.8.8也是无法执行
```
Stage 1: Prepare input wavs...
--2024-01-30 18:07:32-- https://modelscope.cn/api/v1/models/dam…
-
Hello, thank you for the wonderful repository! It really helped.
Currently, our team is trying to fine-tune ERes2Net-200k published in `modelscope` using a large amount of speech data. As I was not …
-
您好,eres2net模型分为两部分,embedding和classifier,但是只提供了提取embedding的预训练模型,是否考虑提供分类器的预训练模型?
-
在用torch.load 载入模型speech_eres2net_sv_zh-cn_16k-common时,报错_pickle.UnpicklingError: invalid load key, '\x08'.。请问下这个有遇到过吗?环境信息:Python 3.10.9、torch 1.12.1。
而用同样的代码载入speech_campplus_sv_zh-cn_16k-common这个模型…