Closed Mewral closed 1 week ago
GLM-4 是BPE的分词方式,你的报错是不是 TypeError: cannot use a string pattern on a bytes-like object
@zRzRzRzRzRzRzR 是的,glm3不是bpe吗? 另外想问一下如何在tokenizer对象里面看他是属于哪种分词模型呢? 感谢
是的,但是文字切分不一样,huggingface有一个相似的issue这里 https://huggingface.co/THUDM/glm-4-9b-chat/discussions/69#66d29c175ae47374c28a17a2
System Info / 系統信息
transformers==4.41.2 outlines==0.0.44 python==3.10.13
Who can help? / 谁可以帮助到您?
No response
Information / 问题信息
Reproduction / 复现过程
Expected behavior / 期待表现
使用chatglm3可以正常输出,但是glm4会报错