ggerganov / llama.cpp

LLM inference in C/C++
MIT License
60.82k stars 8.68k forks source link