AkihikoWatanabe / paper_notes

たまに追加される論文メモ
https://AkihikoWatanabe.github.io/paper_notes
22 stars 0 forks source link

Understanding LLMs: A Comprehensive Overview from Training to Inference, Yiheng Liu+, arXiv'24 #1523

Open AkihikoWatanabe opened 3 days ago

AkihikoWatanabe commented 3 days ago

URL

AkihikoWatanabe commented 3 days ago

Perplexity(参考;Hallucinationに注意)

AkihikoWatanabe commented 2 days ago

単なるLLMの理論的な説明にとどまらず、実用的に必要な各種並列処理技術、Mixed Precision、Offloadingなどのテクニックもまとまっているのがとても良いと思う。

AkihikoWatanabe commented 2 days ago

LLM Frameworkのところに、メジャーなものが網羅されていないように感じる。たとえば、UnslothやLiger-KernelなどはTransformersの部分で言及されてても良いのでは、と感じる。