Open juncyan opened 2 months ago
PaddleNLP已经支持Mamba
感谢,但是这个怎么用啊
from paddlenlp.transformers import AutoTokenizer, AutoModelForCausalLM
model = AutoModelForCausalLM.from_pretrained("xxx") # mamba模型id
trainer = xxxx # 可以使用paddlenlp的trainer,也可以自行定义trainer进行训练
需求描述 Feature Description
任务目标(请描述你正在做的项目是什么,如模型、论文、项目是什么?);
需求场景(请描述你的项目中为什么需要用此功能);
功能描述(请简单描述或设计这个功能)
替代实现 Alternatives
希望能出一个paddle的Mamba,最近新模型很多都是基于Mamba的,没有Paddle-Mamba,只能用torch,非常不习惯