ggerganov / whisper.cpp

Port of OpenAI's Whisper model in C/C++
MIT License
33.36k stars 3.37k forks source link

talk-llama have a problem with Russian #868

Open sergeykorablin opened 1 year ago

sergeykorablin commented 1 year ago

When i run talk-llama like this:

./talk-llama -t 8 -l ru --person Myname -mw models/ggml-base.bin -ml ../llama.cpp/models/ggml-wizardlm-7b-q5_1.bin --prompt-file examples/talk-llama/prompts/mypromp.txt

and try to speak in Russian it recognize only punctuation: , . ? !

But with -tr option talk-llama recognize my speak and translate it to English.

./main - works well with Russian without any problem.

BPOH commented 1 year ago

When i run talk-llama like this:

Попробуй эту языковую модель, она на русском обучена

sergeykorablin commented 1 year ago

Попробуй эту языковую модель, она на русском обучена

Проверил, результат такой же, распознаёт только знаки препинания в тексте. Дело точно не в модели, whisper.cpp работает и распознает русский, а talk-llama не может. Скорей всего что-то с кодировкой текста не на латинице в talk-llama.