使用qwen.cpp对原模型进行转化为什么文件反而增大了？

QwenLM / qwen.cpp

C++ implementation of Qwen-LM

Other

506 stars 40 forks source link

使用qwen.cpp对原模型进行转化为什么文件反而增大了？ #79

Open zzzcccxx opened 4 months ago

zzzcccxx commented 4 months ago

我使用的源模型为hf上下载的Qwen/Qwen-1_8B-Chat，显示模型权重也就不到4g 但为什么我使用python3 qwen_cpp/convert.py -i Qwen/Qwen-1-8B-Chat -t f32 -o qwen1-8b-ggml.bin 生成的权重文件反而增大到了6g多呢？