modelscope / 3D-Speaker

A Repository for Single- and Multi-modal Speaker Verification, Speaker Recognition and Speaker Diarization
Apache License 2.0
1.02k stars 89 forks source link

数据集 #103

Closed wangsheng3 closed 3 months ago

wangsheng3 commented 3 months ago

我换成自己的数据集,但是不知道,数据集要做哪些操作,能不能提供一下需要准备关于数据集的准备工作,包括与数据集相关的文件的获得方式什么的?

yfchenlucky commented 3 months ago

需要准备wav.scp, utt2spk等文件,具体细节可以参考代码:https://github.com/alibaba-damo-academy/3D-Speaker/blob/main/egs/3dspeaker/sv-eres2netv2/local/prepare_data.sh

wangsheng3 commented 3 months ago

那wav.scp,utt2spk文件怎么生成的,你指出的代码里面只对这两个文件进行使用,但是没说怎么生成这两文件吧?

yfchenlucky commented 3 months ago

需要你自己准备,wav.scp按 utt path 格式生成; utt2spk按 utt spk格式生成。