Add (train) a new language

collabora / WhisperSpeech

An Open Source text-to-speech system built by inverting Whisper.

MIT License

3.54k stars 185 forks source link

Hello, I want to add (train) a new language. But some stages cannot be completed. When I call: *parallel --eta -j16 python3 -m whisperspeech.vad_merge --eqvad {}::: .tar**

I get an error:

File "vad_merge.py", line 29, in split imax = len(s[ikey]) - 1 KeyError: 'vad.npy'

It is not clear what files should be in this directory: Vad or Emb? dev.tar, dev_vad.tar.gz, dev_emb.tar.gz, test.tar, test_vad.tar.gz, test_emb.tar.gz

When I swapped the places and file name. I got the error:

File "vad_merge.py", line 70, in merge_by_src_key ms["spk_emb.npy"].append(s["spk_emb.npy"]) KeyError: 'spk_emb.npy'

I'm confused, please help...

collabora / WhisperSpeech

Add (train) a new language #127