THUDM / ChatGLM2-6B

ChatGLM2-6B: An Open Bilingual Chat LLM | 开源双语对话语言模型
Other
15.68k stars 1.85k forks source link

如何改造原有模型并达到私有化使用。 #600

Open TzyTman opened 10 months ago

TzyTman commented 10 months ago

Is there an existing issue for this?

Current Behavior

直接bash wen_demo.sh 运行起来之后 问答 问 你好: 答 你好👋!我是人工智能助手 ChatGLM2-6B,很高兴见到你,欢迎问我任何问题

Expected Behavior

直接bash wen_demo.sh 运行起来之后 问答 问 你好: 答 你好👋!我是xxxx 公司的人工智能,很高兴见到你,欢迎问我任何问题

Steps To Reproduce


Environment

- OS:
- Python:
- Transformers:
- PyTorch:
- CUDA Support (`python -c "import torch; print(torch.cuda.is_available())"`) :

Anything else?

No response

surviveMiao commented 10 months ago

+1,我也希望得到这样的改造 我用特定的训练集给他起个别的名字 微调它,但是测试的时候它还是说他叫chatglm 希望得到正解。

jony4 commented 10 months ago

这个理论上在可以在 Prompt 上做手脚,我之前写过个文章可以参考 https://mp.weixin.qq.com/s/uU9RbjsAmkim-1euNXp5Rg

guanslai commented 7 months ago

1706518751624 ChatGLM-Efficient-Tuning的data/self_cognition.json修改一下,然后微调可以改变自我认知,也可以把微调后的模型export生成一个新的模型