PaddlePaddle / PaddleSpeech

Easy-to-use Speech Toolkit including Self-Supervised Learning model, SOTA/Streaming ASR with punctuation, Streaming TTS with text frontend, Speaker Verification System, End-to-End Speech Translation and Keyword Spotting. Won NAACL2022 Best Demo Award.
https://paddlespeech.readthedocs.io
Apache License 2.0
10.98k stars 1.83k forks source link

关于speaker diarization问题 #3657

Open Heavenbest opened 9 months ago

Heavenbest commented 9 months ago

General Question

/PaddleSpeech/paddlespeech/vector/exps/ecapa_tdnn/ ,想使用这个开源的sv0_ecapa_tdnn_voxceleb12_ckpt_0_1_1模型测试自己的数据,应该怎么实现呢?该工程下只能对下面这个开源的数据集进行测试, image

image

zxcd commented 9 months ago

使用examples/voxceleb/sv0/run.sh,修改stage=2,然后将你的数据的采样率,数据格式与开源数据格式一致后,修改exp_dir为你的数据集,然后运行run.sh即可。

Heavenbest commented 9 months ago

@zxcd 感谢你的回复,你这边给出的是在examples/voxceleb/sv0/run.sh目录下训练自己的数据集,我想问的是如何使用这个sv0_ecapa_tdnn_voxceleb12_ckpt_0_1_1模型测试单个文件,而不是某个数据集合。

zxcd commented 8 months ago

@zxcd 感谢你的回复,你这边给出的是在examples/voxceleb/sv0/run.sh目录下训练自己的数据集,我想问的是如何使用这个sv0_ecapa_tdnn_voxceleb12_ckpt_0_1_1模型测试单个文件,而不是某个数据集合。

单条的话是否考虑使用CLI进行?参考:https://github.com/PaddlePaddle/PaddleSpeech/blob/develop/demos/speaker_verification/README.md