issues
search
li-plus
/
chatglm.cpp
C++ implementation of ChatGLM-6B & ChatGLM2-6B & ChatGLM3 & GLM4
MIT License
2.84k
stars
327
forks
source link
运行chatglm3-6b-ggml int4量化模型,采用clblast加速反而比cpu加速慢很多,正常吗?
#260
Open
GTJoey
opened
5 months ago
GTJoey
commented
5 months ago
机器配置i7-12700F,3060显卡12GB显存,64GB 内存。
loli0123456789
commented
3 months ago
机器配置i7-12700F,3060显卡12GB显存,64GB 内存。
可以先观察下推理的时候到底用的CPU还是GPU
机器配置i7-12700F,3060显卡12GB显存,64GB 内存。