说话人分离功能准确率很低，希望有时间尝试下其它3种新模型

CheshireCC / faster-whisper-GUI

faster_whisper GUI with PySide6

GNU Affero General Public License v3.0

1.69k stars 104 forks source link

Open dfrrk opened 1 month ago

dfrrk commented 1 month ago

现在版本所使用的pyannote.audio-2.1.1说话人分离功能准确很率希望博主有时间能尝试下pyannote-audio最新的3.3.1版本

还有就是reverb-diarization-v1和reverb-diarization-v2 这2个模型，看介绍都比pyannote-audio-3.0 要好20%以上 https://huggingface.co/Revai/reverb-diarization-v2

希望博主有时间能测试集成下新模型，看看说话人分离准确度能否大幅提高！

撒花~撒花~撒花~

CheshireCC commented 1 month ago

有空测试吧