[fix] Fix some gpu dequant function doesn't support multi gpu bug

kvcache-ai / ktransformers

A Flexible Framework for Experiencing Cutting-edge LLM Inference Optimizations

Apache License 2.0

741 stars 39 forks source link

Closed Azure-Tang closed 2 months ago

Azure-Tang commented 2 months ago

Fix some gpu dequant function doesn't support multi gpu bug. #85 Tested on deepseekv2 IQ4_XS quantise type.
Update outdated readme.