UNopenGIS / 7

UN Smart Maps - keep web maps open for a better world
https://unopengis.github.io/smartmaps/
Creative Commons Zero v1.0 Universal
13 stars 2 forks source link

`Distributed Smart Maps Assistant` based on `llama.cpp` #262

Open yuiseki opened 1 year ago

yuiseki commented 1 year ago
hfu commented 1 year ago

From #265

yuiseki commented 1 year ago

Raspberry Pi 4 Model B 8GBで、llama.cpp を使い llama-2-7b.Q4_K_M.gguf を動かしてみました。

結論から言うと メチャクチャ遅い です。 Overpass API Queryを生成するプロンプトの推論に6分間も掛かります。 同じプロンプトをノートPCで試してみましたが、GPUの支援無しだと、やはり1分~2分掛かってしまいます。

ちょっと見込みが甘かったと思います。。

llama.cppのOpenMPI実装も試してみましたが、

という状態です。

GPU付きのマシンでリクエストを捌くような仕組みを作れないと、結局llama.cppをWebアプリケーションの基盤にすることは難しそうだ、という感触です。