Open kg-nlp opened 1 year ago
Hi,我遇到了相似的问题,我这里的原因是history逐渐增多导致的。我这边在发送请求时将history的长度限定到20条以内就避免了爆显存。供参考。
请问一下,如何限制对history的长度进行限定,第一次用不太会
Hi,我遇到了相似的问题,我这里的原因是history逐渐增多导致的。我这边在发送请求时将history的长度限定到20条以内就避免了爆显存。供参考。
我这里每次访问history都会重置为[];有的时候会出现某次请求显存一直在增加,直到请求完之后,显存会恢复.
Hi,我遇到了相似的问题,我这里的原因是history逐渐增多导致的。我这边在发送请求时将history的长度限定到20条以内就避免了爆显存。供参考。
请问如何限制history
Is there an existing issue for this?
Current Behavior
显存越来越大
Expected Behavior
No response
Steps To Reproduce
官方api示例 https://github.com/THUDM/ChatGLM2-6B/blob/main/api.py 切换成多卡加载
Environment
Anything else?
No response