Open ddavout opened 4 months ago
Oui tu peux peux proposer juste le lien. :) Avaec un système automatique qui télécharge tout
Le mar. 7 mai 2024 à 09:37, ddavout @.***> a écrit :
et pas seulement l'adresse The SIWIS French Speech Synthesis Database https://datashare.ed.ac.uk/handle/10283/2353 ?
— Reply to this email directly, view it on GitHub https://github.com/ddavout/theotherway_VOX/issues/1, or unsubscribe https://github.com/notifications/unsubscribe-auth/ADBNBIVC3K7DBW6UC2AZ7YTZBCAFFAVCNFSM6AAAAABHKNQYB6VHI2DSMVQWIX3LMV43ASLTON2WKOZSGI4DENJSGMZDOOI . You are receiving this because you are subscribed to this thread.Message ID: @.***>
Déjà, parce que la base pèse au bas mot quelques 2.671Gb !
De plus, il y a eu quelques erreurs de numérotation si bien que certains *.wav ne correspondent pas aux prompts qui leur sont assignés. c'est moins grave pour une voix statistique que pour une voix clunits, mais quand même ...
certains fichiers audio, tout en étant audibles, conduisent à irrémédiablement à des erreurs. je ne suis pas experte, mais il semblerait qu'on ait appliqué un script pour éliminer les silences initiaux et finaux, disons, inapproprié .
Même si on peut utiliser au final des fichiers wav de la qualité offerte, pour développer on a besoin de fichiers audio mono à 16000Hz.
Les fichiers audio proposés ont été sélectionnés, convertis et testés. Leur nombre est réduit, je dirais même drastiquement réduit, on passe de 9957 prompts à 150.
La voix générée n'a pas une qualité professionnelle ni commerciale, mais est utilisable et peut être utile. Ceci dit, on a plus de 1800 paires prompts-wav à proposer.
qui télécharge tout
et si tout était un peu excessif ?
chacun des prompts que l'on propose s'accompagne de ce qu'on a appelé addenda, une transcription non automatisée du fichier *.wav Mais c'est vrai que si on avait un deuxième avis sur cette transcription, ce serait bien !
Si des volontaires se manifestent, on pourrait mettre la totalité des 1900 prompts pour lesquels on a déjà bossé.
Et même soyons fous, à partir de là, faire une transcription automatisée de tous les waves de Siwis ! dûment testée.
en attendant, je mets les 150 prompts: faut bien commencer :)
et pas seulement l'adresse The SIWIS French Speech Synthesis Database ?