Closed igroboy closed 1 year ago
Answered here: https://huggingface.co/IlyaGusev/saiga2_7b_lora/discussions/1
Проблемы могут быть только при использовании LLM.int8 (load_in_8bits в transformers). Это никак не связано с обучением.
Цифра посередине - ничьи. При сравнении с gpt-3.5 вторая Сайга лучше первой. В лидерборде её нет без особенных причин.
Why results of Saiga 2 are much worse on V100? I tried inference model on V100, and indeed results sucks. What's the reason? And can I somehow fix it?