THUDM / ChatGLM3

ChatGLM3 series: Open Bilingual Chat LLMs | 开源双语对话语言模型
Apache License 2.0
13.5k stars 1.57k forks source link

TypeError: GenerationMixin._extract_past_from_model_output() got an unexpected keyword argument 'standardize_cache_format' #1321

Open zhoujiaxinii opened 2 months ago

zhoujiaxinii commented 2 months ago

System Info / 系統信息

python3.11 CUDA 12.1

Who can help? / 谁可以帮助到您?

No response

Information / 问题信息

Reproduction / 复现过程

执行官方给的jupyter脚本

Expected behavior / 期待表现

在使用autodl平台上的服务器微调训练,在17次时出现这个问题

Hoyxxx commented 2 months ago

相同的问题 请问解决了吗

zRzRzRzRzRzRzR commented 1 month ago

先用transformers 4.40 老模型维护少,GLM-4会跟进维护到4.45