THUDM / ChatGLM3

ChatGLM3 series: Open Bilingual Chat LLMs | 开源双语对话语言模型
Apache License 2.0
13.37k stars 1.55k forks source link

TypeError: GenerationMixin._extract_past_from_model_output() got an unexpected keyword argument 'standardize_cache_format' #1321

Open zhoujiaxinii opened 3 weeks ago

zhoujiaxinii commented 3 weeks ago

System Info / 系統信息

python3.11 CUDA 12.1

Who can help? / 谁可以帮助到您?

No response

Information / 问题信息

Reproduction / 复现过程

执行官方给的jupyter脚本

Expected behavior / 期待表现

在使用autodl平台上的服务器微调训练,在17次时出现这个问题

Hoyxxx commented 2 weeks ago

相同的问题 请问解决了吗

zRzRzRzRzRzRzR commented 5 days ago

先用transformers 4.40 老模型维护少,GLM-4会跟进维护到4.45