Проект распознования русской речи
- распознать текст из файла с предложением
А.Полянский 2019-08-30
Планы
- roadMap - путь чтения для создания словаря
- тест на 440Hz
- записываем разными людьми примеры
- определяем время когда звучит буква (слово)
- записать wav
Что сделано:
2019-09-02
Подробная история изменений ведется в задачах на github
Сильно пострадала структура данных
2019-09-01
- перейти в github
- примеры слова содержащие алфавит
- решение задачи ё по словарям
- при составлении словоря можно добавить взаимосвязь их в предложениях
2019-08-31
- сохранять mp3 c микрофона
- преобразовать файл в wav
- фунция преобразования данных в целые числа для работы с wav
2019-08-30
- выеделны словари для сохранения слов
- прочитаны первые три книги Акунина
- прочитан Гоголь (Детство)
Links:
https://habr.com/ru/post/282922/ - как считать wav файл
https://gist.github.com/mbijon/1332348 - FFT - Быстрое преобразование Фурье на PHP
https://www.youtube.com/watch?v=OUvlamJN3nM - 440Hz - с этого видео записана опорная частота
https://stackoverflow.com/questions/2334712/how-do-i-update-from-a-select-in-sql-server - ссылка на страницу создания временных таблиц
https://blog-en.openalfa.com/how-to-work-with-binary-data-in-php Bin 2 int array
https://www.php.net/manual/ru/function.pack.php
Как делать и полезная информация
- чтение книги - определить кодировку текста, запустить dictionary.php [url]
- временные файлы "tmp/[source_id].tmp"
- запись файла со звуком ffmpeg -f alsa -i hw:1 test1.mp3
- запуск sox с mp3 - dnf install sox-plugins-freeworld
- преобразование mp3 в wav: sox -v 0.9 samples/test1.mp3 -r 22k test1.wav remix 1
- построение спектограммы sox test4.wav -n spectrogram