SergeyShk / Speech-to-Text-Russian

Проект для распознавания речи на русском языке на основе pykaldi.
321 stars 55 forks source link

Дублируются строки при распознавнаии #26

Open egornya opened 3 years ago

egornya commented 3 years ago

При распознавании с помощью start_recognition.py дублируются строки, порой с незначительными изменениями. Пример видео: https://www.youtube.com/watch?v=R1fzIrUUBoM&ab_channel=%D0%9C%D1%8B%D1%81%D0%BB%D0%B8%D0%9F%D0%B0%D0%BF%D0%B8%D1%87%D0%B0 И результат распознавания первых нескольких секунд:

00:00:00: ну шо 00:00:00: ну шо 00:00:01.820000: давай кролика 00:00:01.820000: давай кролика 00:00:07.690000: сама ума 00:00:07.700000: маула 00:00:09.690000: дурно но но но но но но но но но но для часы 00:00:10.830000: но но но но но но но но но но для часы 00:00:14.080000: леонидович снова шеф 00:00:14.150000: оленину 00:00:20.900000: 00:00:21.660000: ср 00:00:23.480000: не накажу по перевезем 00:00:23.520000: не накажу покуда не везёт 00:00:25.190000: это не мне 00:00:25.190000: это не мне 00:00:27.080000: разумею дала претензий не имею слоняюсь по кому-то другому опять разрыв 00:00:27.080000: разумею дала претензий не имею слоняюсь по кому-то другому опять зрозумёв 00:00:38.220000: ай да 00:00:38.230000: ай да 00:00:46.320000: материализовались 00:00:46.330000: материализовались 00:00:51.540000: ха ха ха ха 00:00:51.540000: ага 00:00:58.200000: ба 00:00:58.210000: ба 00:01:05.150000: 00:01:05.870000: 00:01:13.280000: 00:01:29.470000: так какой же 00:01:30.810000: 00:01:38.800000: ты 00:01:39.900000: четыре раза подряд этакого не видел никогда в жизни 00:01:40.350000: сразу подряда такого не видел никогда в жизни 00:01:44.720000: по его ещё мало 00:01:44.720000: по его ещё мало 00:01:48.200000: мало 00:01:48.220000: мало 00:01:53.610000: ха ха ха ха ха ха ха