Facico / Chinese-Vicuna

Chinese-Vicuna: A Chinese Instruction-following LLaMA-based Model —— 一个中文低资源的llama+lora方案,结构参考alpaca
https://github.com/Facico/Chinese-Vicuna
Apache License 2.0
4.14k stars 421 forks source link

https://chat.lmsys.org/ 問到第三輪會跑超久 #28

Closed iamblue closed 1 year ago

iamblue commented 1 year ago

https://chat.lmsys.org/ 這個同一個對話框問答到第三輪時,似乎時間就會跑超久或無反應?請問這是什麼原因?

Facico commented 1 year ago

@iamblue 這個網站不是我們開發的,不過在對輪對話的時間越來越長可能是拼接的東西(歷史對話)越來越長的原因,我們自己開發的多輪對話為了保證硬件上的效率會可以選擇截斷一定的歷史信息(max memory)