-
Due to recent changes in the space we probably need to take a look at adding this similarly to our DPO recipes, Happy to take a stab at it we are in agreement.
bjb19 updated
3 weeks ago
-
请问什么时候计划支持MLLM的KTO训练?
-
Zaczęło się od tego, że ok dwa dni temu, przy okazji update systemu (zwykła aktualizacja paczek), po starcie HA większość encji miała stan nieznany. Pozostały jedynie 2 encje z wartościami.
Próbował…
-
### ⚠️ Please check that this feature request hasn't been suggested before.
- [X] I searched previous [Ideas in Discussions](https://github.com/OpenAccess-AI-Collective/axolotl/discussions/categori…
-
**Describe the solution you'd like**
[KTO](https://arxiv.org/abs/2402.01306) has demonstrated superior performance to DPO in reasoning and is a great alternative to DPO (https://arxiv.org/abs/2404.…
-
# URL
- https://arxiv.org/abs/2402.01306
# Affiliations
- Kawin Ethayarajh, N/A
- Winnie Xu, N/A
- Niklas Muennighoff, N/A
- Dan Jurafsky, N/A
- Douwe Kiela, N/A
# Abstract
- Kahneman & Tv…
-
Ktoś wie co się stało z wtyczką ekino od wczoraj wywala błąd po wybraniu zakładki firmy działa wyszukiwarka strona też działa normalnie.
-
### Reminder
- [X] I have read the README and searched the existing issues.
### System Info
Pytorch 2.3.1, 8XH100, CUDA 12.1, Deepspeed
### Reproduction
I updated my old llamafactory co…
-
### System Info
I've been running some experiments on KTO using LoRA and noticed that there is a large disparity between the peak allocated and reserved memory, which I suspect is a memory leakage pr…
-
Wow man!! Tei Geeky shows ko garna lako ho??