THUDM / ChatGLM3

ChatGLM3 series: Open Bilingual Chat LLMs | 开源双语对话语言模型
Apache License 2.0
13.3k stars 1.54k forks source link

[BUG] RuntimeError: "addmm_impl_cpu_" not implemented for 'Half' #628

Closed CaineLew closed 8 months ago

CaineLew commented 8 months ago

System Info / 系統信息

Ubuntu 23.04, cpu i7-1270p,已安装oneApi环境,已安装intel_extension_for_pytorch 2.0.110+xpu。python版本:3.11.4

Who can help? / 谁可以帮助到您?

No response

Information / 问题信息

Reproduction / 复现过程

1.运行 streamlit run web_damo_streamlit.py 2.在浏览器中打开web页面。 3.输入任意内容并提交。 4.控制台报错: python3.11/site-packages/torch/nn/modules/linear.py", line 114, in forward return F.linear(input, self.weight, self.bias) ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^ RuntimeError: "addmm_implcpu" not implemented for 'Half'

Expected behavior / 期待表现

希望能正常运行。

zRzRzRzRzRzRzR commented 8 months ago

你这是cpu呀,没调用xpu

CaineLew commented 8 months ago

不是,我知道是CPU,重点是不是应该让它能正常运行?

waitkafuka commented 7 months ago

为什么直接关闭了?解决方案是什么?按照官方文档安装完运行就报这个错误 @zRzRzRzRzRzRzR

zRzRzRzRzRzRzR commented 7 months ago

这个错误代表你没有使用xpu进行加速,所以使用的是cpu推理,那么你应该安装cpu的torch并使用.float16精度推理而不是half精度