Open dmitrymailk opened 1 year ago
Тут всё уникально, поэтому мы не стали никак фиксировать на данном этапе.
Надеемся получить различные сабмиты моделей, чтобы далее, учитывая разнообразие, предложить некоторый вариант общий, как это встраивать и логировать. Будем рады вашим pull request.
Можно посмотреть в сторону правок в этой части: https://github.com/ai-forever/MERA/blob/main/lm-evaluation-harness/lm_eval/base.py#L714 (параметр description
).
В экспериментальной ветке https://github.com/ai-forever/MERA/tree/update/new_harness_codebase со свежим кодом из lm-evaluation-harness, вы можете воспользоваться chat template и system instruction для моделей huggingface transformers формата
Как добавить форматирование промпта для модели?
Некоторые модели тренируются с определенным шаблоном промпта. Например возьмем модель Open-Orca/Mistral-7B-OpenOrca.
Данная модель ожидает промпт следующего формата:
Если подать в модель промпт другого формата, ответ будет существенно отличаться. Ниже приведен сниппет кода для воспроизведения.