Closed sammichenVV closed 6 months ago
请问解决了吗
请问解决了吗
没有,你也有遇到么,现在是用不了GPU
嗯嗯,一样
嗯嗯,一样
用这个命令试试 cmake -B build -DGGML_CUBLAS=ON -DCUDA_ARCHITECTURES="89" && cmake --build build -j --config Release 如果报错,指定下nvcc的位置
额,看起来是你忘记在构建ML库的时候,给ML库的构建选项加上"使用CUBLAS"了?
用这个命令编译之后运行模型还是cpu推理的
./build/bin/main -m chatglm2-ggml.bin -p 你好 --top_p 0.8 --temp 0.8