https://voice.mozilla.org/uk/datasets
...багатомовний набір даних із відкритим вихідним кодом, який може використовувати будь-хто для підготовки додатків з підтримкою мовлення.
Ми вважаємо, що великі, загальнодоступні набори голосових даних сприятимуть інноваціям і здоровій комерційній конкуренції в технології мовлення на основі машинного навчання.
Багатомовний набір даних Common Voice вже є найбільшим загальнодоступним набором голосів у своєму роді, але він не єдиний.
Розглядайте цю сторінку як опорний вузол для інших голосових наборів даних з відкритим вихідним кодом і, зі зростанням Common Voice, як домівку для наших оновлень.
Common Voice є частиною ініціативи Mozilla, яка допомагає навчати машини розуміти мову людей. Окрім набору даних Common Voice, ми також створюємо механізм розпізнавання мовлення з відкритим вихідним кодом, який називається Deep Speech.
Обидва ці проєкти є частиною наших зусиль для подолання розбіжностей в цифровому мовленні. Технології розпізнавання голосу дають більше людяності нашим пристроям, але розробникам потрібна велика кількість голосових даних для їх створення. На даний час більшість цих записів є комерційними та дорогими.
Ми хочемо зробити голосові дані вільними та загальнодоступними, і переконатися, що вони представляють різноманітних та реальних людей. Разом ми можемо покращити розпізнавання голосу для усіх.
прохання конкретно для цих проектів написати в копірайтах дозвіл на використання у відповідності до їх ліцензій. https://voice.mozilla.org/uk https://common-voice.github.io/sentence-collector/#/ це дозволить пришвидшити створення відкритих українських TTS/STT та іншик користних технологій :)
https://voice.mozilla.org/uk/datasets ...багатомовний набір даних із відкритим вихідним кодом, який може використовувати будь-хто для підготовки додатків з підтримкою мовлення. Ми вважаємо, що великі, загальнодоступні набори голосових даних сприятимуть інноваціям і здоровій комерційній конкуренції в технології мовлення на основі машинного навчання.
Багатомовний набір даних Common Voice вже є найбільшим загальнодоступним набором голосів у своєму роді, але він не єдиний.
Розглядайте цю сторінку як опорний вузол для інших голосових наборів даних з відкритим вихідним кодом і, зі зростанням Common Voice, як домівку для наших оновлень.
https://voice.mozilla.org/uk/about
Common Voice є частиною ініціативи Mozilla, яка допомагає навчати машини розуміти мову людей. Окрім набору даних Common Voice, ми також створюємо механізм розпізнавання мовлення з відкритим вихідним кодом, який називається Deep Speech. Обидва ці проєкти є частиною наших зусиль для подолання розбіжностей в цифровому мовленні. Технології розпізнавання голосу дають більше людяності нашим пристроям, але розробникам потрібна велика кількість голосових даних для їх створення. На даний час більшість цих записів є комерційними та дорогими. Ми хочемо зробити голосові дані вільними та загальнодоступними, і переконатися, що вони представляють різноманітних та реальних людей. Разом ми можемо покращити розпізнавання голосу для усіх.