Open doctor1984 opened 1 year ago
先转成llama的格式,再用llama.cpp的脚本做量化,可以量化成int4 int5 int8
请问bin文件转成pth的方法有脚本吗?麻烦分享一个呗,十分感谢
可以参考: https://github.com/Tencent/TencentPretrain/blob/main/scripts/convert_tencentpretrain_to_llama.py
P01son/Linly-ChatFlow-13B他这个模型转换int4后依然不能使用
先转成llama的格式,再用llama.cpp的脚本做量化,可以量化成int4 int5 int8