小白提问 - Githubissues

yeyupiaoling / VoiceprintRecognition-PaddlePaddle

本项目使用了EcapaTdnn、ResNetSE、ERes2Net、CAM++等多种先进的声纹识别模型，同时本项目也支持了MelSpectrogram、Spectrogram、MFCC、Fbank等多种数据预处理方法

Apache License 2.0

229 stars 44 forks source link

小白提问 #11

Closed pravezhang closed 1 year ago

pravezhang commented 1 year ago

请问各位大佬，我这边有几百条标记好讲话人的语音作为训练集，打算之后用训练好的模型去给更多的语音标记讲话人。

那我是直接拿我的这几百条去训练和使用，还是先用zhvoice 的数据训练完，再用我自己这几百条去训练呢？

yeyupiaoling commented 1 year ago

并不一定要训练呢。你直接可以使用模型来做声纹识别。你非要训练的话，你那点数据也没有用。不过你可以跟那个数据集合，并一起训练。

pravezhang commented 1 year ago

我下载了你的超大数据集训练过的模型，和zhvoice训练的MFCC处理的模型，然后试了几个声纹区分，每个相似度都是0.96+，没办法直接用。。。

pravezhang commented 1 year ago

拿zhvoice 和我这几百条共同训练的话，我这几百条是不是杯水车薪基本不会改变模型的训练结果呀？

pravezhang commented 1 year ago

请问有什么好的解决方案或优化方法吗？

yeyupiaoling commented 1 year ago

你测过项目自带的那两个文件吗？他们相似度是多少？你下载的文件有没有全部复制到项目根目录里面替换掉原来的？

pravezhang commented 1 year ago

试了一下，a_2和b_2也是97%， a_1 和b_2 是99%……

我的目录是这样的，请问有什么地方需要修改参数或者文件没放对地方吗

yeyupiaoling commented 1 year ago

应该是你下载了旧的模型吧。下载最新的模型，然后替换掉项目原来的文件。