NascentCore / 3k

3-k platform is for training LLMs
GNU Affero General Public License v3.0
13 stars 3 forks source link

【功能需求】支持LLaMA3-8B #930

Closed sxwl-donggang closed 2 months ago

sxwl-donggang commented 3 months ago

背景

描述系统现有的状况和相关的具体信息

支持LLaMA3-8B模型的微调推理

这个功能需求是解决什么问题?

描述问题的具体场景,以及想要达到的效果

解决方案

列举目前考虑的可选解决方案

sxwl-donggang commented 3 months ago

目前验证最新 llamafactory已支持,遗留:

  1. 验证llamafactory最新的使用方式是否支持目前的模型