PaddlePaddle / PaddleNLP

👑 Easy-to-use and powerful NLP and LLM library with 🤗 Awesome model zoo, supporting wide-range of NLP tasks from research to industrial applications, including 🗂Text Classification, 🔍 Neural Search, ❓ Question Answering, ℹ️ Information Extraction, 📄 Document Intelligence, 💌 Sentiment Analysis etc.
https://paddlenlp.readthedocs.io
Apache License 2.0
12.19k stars 2.95k forks source link

[Question]: TrainingArguments 吐槽 #6139

Closed JianhuanZhuo closed 3 months ago

JianhuanZhuo commented 1 year ago

请提出你的问题

Trainer API 这么好的一个东西,为什么多了一个 TrainingArguments 这种败笔,这种设计就无法单独使用 Trainer

ZHUI commented 1 year ago

嗯嗯,你好,可以说一下你这边的需求?

TrainingArguments 这个东西的话,主要是训练的很多参数需要传入,所以做了一些内置。

不通过命令行,直接代码里面初始化 TrainingArguments 也是可以的。

rio5050 commented 1 year ago

嗯嗯,你好,可以说一下你这边的需求?

TrainingArguments 这个东西的话,主要是训练的很多参数需要传入,所以做了一些内置。

不通过命令行,直接代码里面初始化 TrainingArguments 也是可以的。

请问如何在代码里初始化呢 @ZHUI

ZHUI commented 1 year ago

https://github.com/PaddlePaddle/PaddleNLP/blob/develop/llm/llama/run_pretrain.py#L369-L371

参考这里,可以用dict初始化。