Open zzzcccxx opened 4 months ago
我使用的源模型为hf上下载的Qwen/Qwen-1_8B-Chat,显示模型权重也就不到4g 但为什么我使用python3 qwen_cpp/convert.py -i Qwen/Qwen-1-8B-Chat -t f32 -o qwen1-8b-ggml.bin 生成的权重文件反而增大到了6g多呢?
python3 qwen_cpp/convert.py -i Qwen/Qwen-1-8B-Chat -t f32 -o qwen1-8b-ggml.bin
我使用的源模型为hf上下载的Qwen/Qwen-1_8B-Chat,显示模型权重也就不到4g
但为什么我使用
python3 qwen_cpp/convert.py -i Qwen/Qwen-1-8B-Chat -t f32 -o qwen1-8b-ggml.bin
生成的权重文件反而增大到了6g多呢?