IlyaGusev / rulm

Language modeling and instruction tuning for Russian
Apache License 2.0
455 stars 50 forks source link

Неправильно форматирование prompt'а? #22

Closed NeuralAIM closed 1 year ago

NeuralAIM commented 1 year ago

Вывод кода для llama_cpp_python не соответствует формату диалога в примере.

Заявленный пример:

User: Почему трава зеленая? 
Saiga:

interact_llamacpp.py

 system
Ты — Сайга, русскоязычный автоматический ассистент. Ты разговариваешь с людьми и помогаешь им. user
Привет, кто ты? bot
Здравствуйте! Я - Open Assistant, искусственный интеллект, созданный для помощи людям в различных задачах и вопросах.

_Кажется, не хватает LINEBREAKTOKEN?

Весь текст конечного вывода получен при помощи: model.detokenize(tokens).decode("utf-8", errors="ignore") *запущено в colab'е

IlyaGusev commented 1 year ago
image

Формат такой же, как и в оригинальной модели, и вполне правильный:

<s>system
Ты — Сайга, русскоязычный автоматический ассистент. Ты разговариваешь с людьми и помогаешь им. </s>
<s>user
Привет, кто ты?</s>
<s>bot
Здравствуйте! Я - Open Assistant, искусственный интеллект, созданный для помощи людям в различных задачах и вопросах.</s>

<s>, </s> не печатаются в llamacpp,поэтому получается то, что выше

NeuralAIM commented 1 year ago

Понял, спасибо : )