Possible context window problem

galatolofederico / cerbero-7b

Cerbero-7b is the first 100% Free and Open Source Italian Large Language Model (LLM) ready to be used for research or commercial applications.

35 stars 0 forks source link

Ciao, stavo provando il modello su https://cerbero.rocks/? ed è la seconda volta che mi capita che si impalla in un loop infinito nella risposta in cui dice sempre la stessa frase all'infinto, vedi screen:

Inoltre mi sembra che abbia una grossa limitazione sul contesto, sembra basarsi troppo sugli ultimi token e ignorare completamente i precedenti; provando a fargli una domanda su messaggi passati va completamente fuori strada.

Non so se possano essere problemi che hanno a che fare con l'hosting o se avete riscontrato questo tipo di anomalie anche runnandolo in locale.

galatolofederico / cerbero-7b

Possible context window problem #3