Closed tq0426w closed 1 year ago
wenda的多用户使用,是说llm(如chatglm-6b)可以同时对10个用户的提问进行答案生成,然后通过websocket接口同时将这10个生成中的答案返回给客户端吗?
还是说同一时间只有一个用户可以接收到答案,其他用户只能等待呢?
如果能同时对10个用户的问题进行生成,虽然每个用户的响应会慢一些,因为有打字机效果,用户基本还是可以接受的,这样的体验会更好一些,就是不知道应该如何实现。
谢谢大佬回答!
同时对10个用户的问题进行生成的话,chatglm-6b因为实现有问题,会乱码
wenda的多用户使用,是说llm(如chatglm-6b)可以同时对10个用户的提问进行答案生成,然后通过websocket接口同时将这10个生成中的答案返回给客户端吗?
还是说同一时间只有一个用户可以接收到答案,其他用户只能等待呢?
如果能同时对10个用户的问题进行生成,虽然每个用户的响应会慢一些,因为有打字机效果,用户基本还是可以接受的,这样的体验会更好一些,就是不知道应该如何实现。
谢谢大佬回答!