Snowdar / asv-subtools

An Open Source Tools for Speaker Recognition
Apache License 2.0
587 stars 135 forks source link

少量数据 #30

Open haojiepan1 opened 3 years ago

haojiepan1 commented 3 years ago

从网上下载数据量过大,复现流程过久,我是做NLP的,最近在弄声纹识别,作为一个新手来说,复现流程不是很友好,有一点费劲,如果能提供一份少量voxceleb数据,能够快速复现整体流程,而不需要去一直等数据下载下来才能复现流程。

haojiepan1 commented 3 years ago

从网上下载数据量过大,复现流程过久,我是做NLP的,最近在弄声纹识别,作为一个新手来说,复现流程不是很友好,有一点费劲,如果能提供一份少量voxceleb数据,能够快速复现整体流程,而不需要去一直等数据下载下来才能复现流程。

Snowdar commented 3 years ago

请查看readme有提供少量数据vox1的的特征(百度盘下载)

在 2021年8月10日,下午12:56,haojiepan @.***> 写道:

 从网上下载数据量过大,复现流程过久,我是做NLP的,最近在弄声纹识别,作为一个新手来说,复现流程不是很友好,有一点费劲,如果能提供一份少量voxceleb数据,能够快速复现整体流程,而不需要去一直等数据下载下来才能复现流程。

— You are receiving this because you are subscribed to this thread. Reply to this email directly, view it on GitHub, or unsubscribe. Triage notifications on the go with GitHub Mobile for iOS or Android.

haojiepan1 commented 3 years ago

那个是转换好的,如果想用在其他领域没有走通整个流程,以及看一下原始的数据样式,感觉用不上,也看了recipe下面的,感觉跑通太难了,FileNotFoundError: [Errno 2] No such file or directory: 'exp/pytorch_xvector_train/config/nnet.config'

haojiepan1 commented 3 years ago

而且原始的数据需要翻墙,我也翻墙了,但是下载的非常慢,感觉如果有少量原始数据到数据转换,模型训练到最后的结果预测,这行对于新手来说友好一些。