CheshireCC / faster-whisper-GUI

faster_whisper GUI with PySide6
GNU Affero General Public License v3.0
1.69k stars 104 forks source link

说话人分离功能准确率很低,希望有时间尝试下其它3种新模型 #236

Open dfrrk opened 1 month ago

dfrrk commented 1 month ago

现在版本所使用的pyannote.audio-2.1.1说话人分离功能准确很率 希望博主有时间能尝试下pyannote-audio最新的3.3.1版本

还有就是reverb-diarization-v1和reverb-diarization-v2 这2个模型,看介绍都比pyannote-audio-3.0 要好20%以上 https://huggingface.co/Revai/reverb-diarization-v2

希望博主有时间能测试集成下新模型,看看说话人分离准确度能否大幅提高!

撒花~撒花~撒花~

CheshireCC commented 1 month ago

有空测试吧