Open LeopoldFize opened 3 months ago
max_tokens的作用就是限制生成的回答的长度,到达max_tokens时直接停止响应,表现为截断
max_tokens的作用就是限制生成的回答的长度,到达max_tokens时直接停止响应,表现为截断
那么如何限制回答的长度呢
max_tokens的作用就是限制生成的回答的长度
max_tokens的作用就是限制生成的回答的长度
你好,我的意思是 如何让他将回复的内容控制在50个字内 而不是达到50字时将回答内容截断.
地球上目前没有任何模型能保证准确做到这件事,严格来说 AI 并不会数数
好的 明白了 ,谢谢你的回复
一个可能的方法是,通过prompt要求它生成的回答尽可能简短,限制在XX字数内,然后生成完毕后,通过程序检测字数是否符合要求,如果不符合就重试,AI本身会将文本处理为token,只能二次开发处理字数
好的 我尝试一下 谢谢你
当我将最大响应token设置的较小时(比如200)模型输出的内容会被截断 比如我问 介绍一下XXX 回复应该是500个字 但我将最大token的值设置为最小时 回复还是500个字 不过被截断了 只返回给我了30个(大概)字