Как добились такого высокого SDR?

Gaivoronsky commented 3 years ago

Здравствуйте, не поделитесь информацией. При обучении вы использовали стандартный конфиг или что-либо меняли. На какой версии torch учили. Очень интересно было бы узнать! На данный момент у вас самая лучшая выложенная в открытый доступ, как вы этого добились?!

alegchenko commented 3 years ago

Здравствуйте! При обучение использовался почти стандартный конфиг предложенный в https://github.com/mindslab-ai/voicefilter, для обучающей выборки использовались все 3 части LibriSpeech (clean100, clean360, other500), примеры были по 4 сек (вместо 3), кол-во примеров было 130к (вместо 100к), для улучшения устойчивости думаю стоит попробовать в качестве фонового голоса в миксе использовать менее качественную речь, например из VoxCeleb, думаю несколько позже проведу эксперимент с более сложным подходом к составлению примеров.

Gaivoronsky commented 3 years ago

Благодарю! Советую еще попробовать Mish функцию активации https://github.com/Edresson/VoiceSplit/blob/master/models/voicesplit/model.py#L19. Говорят дает прирост, сам еще не пробовал. Если интересно могу отписаться по этому поводу как проверю!

alegchenko / VoiceFilter-LibriSPeech

Как добились такого высокого SDR? #1