Closed caixiongjiang closed 3 months ago
使用hugging-face上的https://huggingface.co/THUDM/chatglm3-6b 参考了chatglm3-6b的fastapi代码,调用结果如下:
提示词输入: <|system|> You are an artificial intelligence assistant. <|user|> 你好,请给我讲一个故事 <|assistant|>
history=[]
response输出为 "1一个人,请注意,请注意,表达式微带状如题当前时间是相关的函数式微带状如题目前所经超时而在��"
可能的原因有什么?
已经解决,发现该模型支持的好像是fp16,所以需要使用.half()而不是.to(bfloat16)
使用hugging-face上的https://huggingface.co/THUDM/chatglm3-6b 参考了chatglm3-6b的fastapi代码,调用结果如下:
提示词输入: <|system|> You are an artificial intelligence assistant. <|user|> 你好,请给我讲一个故事 <|assistant|>
history=[]
response输出为 "1一个人,请注意,请注意,表达式微带状如题当前时间是相关的函数式微带状如题目前所经超时而在��"
可能的原因有什么?