Open 1MLightyears opened 1 year ago
Repetition Penalty是 = 1不惩罚重复,> 1时开始惩罚重复,< 1时鼓励重复。一般不要设置小于0.5,小于0.5极可能出现灾难级的复读。
Repetition Penalty=1.6
Q:晚上好
A:你好,有什么我可以为你效劳的吗?
Q:晚上好
A:同样,祝你晚安!有什么可以在睡前为你效劳的吗?
Q:晚上好
A:你好!有什么我可以帮忙的吗?
Q:晚上好
A:同上,祝你晚安!
Repetition Penalty=1.0
Q:晚上好
A:晚上好!需要什么帮助呢?
Q:晚上好
A:晚上好!需要什么帮助呢?
Q:晚上好
A:晚上好!需要什么帮助呢?
Q:晚上好
A:晚上好!需要什么帮助呢?
Repetition Penalty=0.4
Q:晚上好
A:晚上好!需要帮助什么帮助什么!什么!什么!什么!什么!什么!什么!什么!什么!什么!什么!什么!什么!...(省略几十个什么)...帮助
Q:晚上好
A:晚上好!晚上好!晚上好!晚上好!晚上好!晚上好!晚上好!晚上好!晚上好!晚上好!晚上好!晚上好!晚上好!晚上好!!...(省略几十个晚上好)...晚上好
其余参数为web_demo.py初始值
Is there an existing issue for this?
Current Behavior
我按照
README.md
中的步骤成功部署了ChatGLM2. 然而当我试图测试它的内容生成速度时发现,它倾向于对于同一prompt给出同样的内容。 虽然#43 也提及这一问题,但repetition_penalty
选项并不生效(或者是我填错了地方?但并没有报错)。使用IPython的%timeit
进行测试时,由于每次的prompt均相同,尽管设置了repetition_penalty=0.8
,生成的内容仍然一字不差;如果将其调为较低的值,甚至直接无内容输出(假死并在每次Ctrl+C时停在同一语句上)Expected Behavior
当设置较小的
repetition_penalty
时,给出不同的内容Steps To Reproduce
Environment
Anything else?
No response