FastGPT is a knowledge-based platform built on the LLMs, offers a comprehensive suite of out-of-the-box capabilities such as data processing, RAG retrieval, and visual AI workflow orchestration, letting you easily develop and deploy complex question-answering systems without the need for extensive setup or configuration.
qwen工具调用,回复被异常截断 #1668

JinCheng666 commented 1 month ago


你的版本 v4.8.2

问题描述, 日志截图 使用xinference(0.11.1)框架,vllm加速推理(0.4.1),部署本地Qwen1.5-72B-Chat-GPTQ-Int4模型,接入oneapi供fastgpt调用。 对话功能都正常,但工具调用时,长回复会出现被异常截断的问题。 正常和异常调用的log,看不出区别,异常的调用,大模型也做出完整的回复了,但fastgpt只显示了回复的最后几个token出来。




      "model": "qwen:72b",
      "name": "qwen:72b",
      "maxContext": 32000,
      "avatar": "/imgs/model/qwen.svg",
      "maxResponse": 6000,
      "quoteMaxToken": 13000,
      "maxTemperature": 1.2,
      "charsPointsPrice": 0,
      "censor": false,
      "vision": false,
      "datasetProcess": false,
      "usedInClassify": true,
      "usedInExtractFields": true,
      "usedInToolCall": true,
      "usedInQueryExtension": true,
      "toolChoice": true,
      "functionCall": true,
      "customCQPrompt": "",
      "customExtractPrompt": "",
      "defaultSystemChatPrompt": "",
      "defaultConfig": {}
zhanghx0905 commented 1 month ago

之前xinference在这方面的实现有问题,可以考虑设置 { "toolChoice": false, "functionCall": false } 走fastgpt内置的提示词

JinCheng666 commented 1 month ago

之前xinference在这方面的实现有问题,可以考虑设置 { "toolChoice": false, "functionCall": false } 走fastgpt内置的提示词


zhanghx0905 commented 1 month ago

xinference也是用的提示词,和fastgpt顶多就是提示词内容上有差异。不知道qwen的saas api是如何实现tools call的,也许用的是类似guided grammar的策略

c121914yu commented 1 month ago

可以 log 下 toolChoice 的内容,看看流是否正常。

JinCheng666 commented 1 month ago

可以 log 下 toolChoice 的内容,看看流是否正常。

@c121914yu 抱歉,没明白是查看哪个程序的log?我把fastgpt调试界面中, 查看详情部分贴上来吧,这部分没问题。还有xinference的debug log


  "result": "{\"prompt\":\"The below set forth the Bing search results,you can use this realtime info,answer user's question。the Searchkey: 大语言模型 最新新闻; SearchResult:\\n\\n- Title:[大型语言模型综述全新出炉:从T5到GPT-4最全盘点,国内 ...](\\n  snippet:2023-04-04 11:58. 来源:澎湃新闻·澎湃号·湃客. 字号. 机器之心报道. 机器之心编辑部. 为什么仿佛一夜之间,自然语言处理(NLP)领域就突然突飞猛进,摸到了通用人工智能的门槛? 如今的大语言模型(LLM)发展到了什么程度? 未来短时间内,AGI 的发展路线又将如何? 自 20 世纪 50 年代图灵测试提出以来,人们始终在探索机器处理语言智能的能力。 语言本质上是一个错综复杂的人类表达系统,受到语法规则的约束。 因此,开发能够理解和精通语言的强大 AI 算法面临着巨大挑战。 过去二十年,语言建模方法被广泛用于语言理解和生成,包括统计语言模型和神经语言模型。\\n  Is Navigational Page?:Yes\\n\\n- Title:[大模型年度榜单公布:GPT-4第一,智谱、阿里紧追 - 澎湃新闻](\\n  snippet:对过去一年来主流大模型全面评测诊断后,结果显示,GPT-4-Turbo在各项评测中均获最佳表现,国内厂商近期发布的模型紧随其后,包括智谱清言GLM-4、阿里巴巴Qwen-Max、百度文心一言4.0。 评测是大模型的指挥棒和指南针,OpenCompass为模型提供评测服务,量化模型在知识、语言、理解、推理和考试等五大能力维度的表现。 总体来看,大语言模型整体能力仍有较大提升空间,复杂推理相关能力仍是大模型普遍面临的难题,国内大模型相比于GPT-4还存在差距。 中文场景下国内最新大模型已展现出优势,在部分维度上接近GPT-4-Turbo的水平。 中英双语客观评测:数学、代码仍是短板.\\n  Is Navigational Page?:No\\n\\n- Title:[澎湃新闻 - 开源大模型Llama 3王者归来:最大底牌4000亿 ...](\\n  snippet:本周四,AI 领域迎来重大消息,Meta 正式发布了人们等待已久的开源大模型 Llama 3。 扎克伯格在 Facebook 上发帖:Big AI news today. 与此同时,扎克伯格宣布:基于最新的 Llama 3 模型,Meta 的 AI 助手现在已经覆盖 Instagram、WhatsApp、Facebook 等全系应用,并单独开启了网站。 另外还有一个图像生成器,可根据自然语言提示词生成图片。 Meta AI 网址: 同日,亚马逊云科技也宣布,Meta Llama 3 基础模型已可通过 Amazon SageMaker JumpStart来部署和推理运行。\\n  Is Navigational Page?:No\"}"


  "searchKey": "大语言模型 最新新闻"
  "prompt": "The below set forth the Bing search results,you can use this realtime info,answer user's question。the Searchkey: 大语言模型 最新新闻; SearchResult:\n\n- Title:[大型语言模型综述全新出炉:从T5到GPT-4最全盘点,国内 ...](\n  snippet:2023-04-04 11:58. 来源:澎湃新闻·澎湃号·湃客. 字号. 机器之心报道. 机器之心编辑部. 为什么仿佛一夜之间,自然语言处理(NLP)领域就突然突飞猛进,摸到了通用人工智能的门槛? 如今的大语言模型(LLM)发展到了什么程度? 未来短时间内,AGI 的发展路线又将如何? 自 20 世纪 50 年代图灵测试提出以来,人们始终在探索机器处理语言智能的能力。 语言本质上是一个错综复杂的人类表达系统,受到语法规则的约束。 因此,开发能够理解和精通语言的强大 AI 算法面临着巨大挑战。 过去二十年,语言建模方法被广泛用于语言理解和生成,包括统计语言模型和神经语言模型。\n  Is Navigational Page?:Yes\n\n- Title:[大模型年度榜单公布:GPT-4第一,智谱、阿里紧追 - 澎湃新闻](\n  snippet:对过去一年来主流大模型全面评测诊断后,结果显示,GPT-4-Turbo在各项评测中均获最佳表现,国内厂商近期发布的模型紧随其后,包括智谱清言GLM-4、阿里巴巴Qwen-Max、百度文心一言4.0。 评测是大模型的指挥棒和指南针,OpenCompass为模型提供评测服务,量化模型在知识、语言、理解、推理和考试等五大能力维度的表现。 总体来看,大语言模型整体能力仍有较大提升空间,复杂推理相关能力仍是大模型普遍面临的难题,国内大模型相比于GPT-4还存在差距。 中文场景下国内最新大模型已展现出优势,在部分维度上接近GPT-4-Turbo的水平。 中英双语客观评测:数学、代码仍是短板.\n  Is Navigational Page?:No\n\n- Title:[澎湃新闻 - 开源大模型Llama 3王者归来:最大底牌4000亿 ...](\n  snippet:本周四,AI 领域迎来重大消息,Meta 正式发布了人们等待已久的开源大模型 Llama 3。 扎克伯格在 Facebook 上发帖:Big AI news today. 与此同时,扎克伯格宣布:基于最新的 Llama 3 模型,Meta 的 AI 助手现在已经覆盖 Instagram、WhatsApp、Facebook 等全系应用,并单独开启了网站。 另外还有一个图像生成器,可根据自然语言提示词生成图片。 Meta AI 网址: 同日,亚马逊云科技也宣布,Meta Llama 3 基础模型已可通过 Amazon SageMaker JumpStart来部署和推理运行。\n  Is Navigational Page?:No"

xinference的debug log

c121914yu commented 1 month ago

可以 log 下 toolChoice 的内容,看看流是否正常。

抱歉,没明白是查看哪个程序的log?我把fastgpt调试界面中, 查看详情部分贴上来吧,这部分没问题。还有xinference的debug log


  "result": "{\"prompt\":\"The below set forth the Bing search results,you can use this realtime info,answer user's question。the Searchkey: 大语言模型 最新新闻; SearchResult:\\n\\n- Title:[大型语言模型综述全新出炉:从T5到GPT-4最全盘点,国内 ...](\\n  snippet:2023-04-04 11:58. 来源:澎湃新闻·澎湃号·湃客. 字号. 机器之心报道. 机器之心编辑部. 为什么仿佛一夜之间,自然语言处理(NLP)领域就突然突飞猛进,摸到了通用人工智能的门槛? 如今的大语言模型(LLM)发展到了什么程度? 未来短时间内,AGI 的发展路线又将如何? 自 20 世纪 50 年代图灵测试提出以来,人们始终在探索机器处理语言智能的能力。 语言本质上是一个错综复杂的人类表达系统,受到语法规则的约束。 因此,开发能够理解和精通语言的强大 AI 算法面临着巨大挑战。 过去二十年,语言建模方法被广泛用于语言理解和生成,包括统计语言模型和神经语言模型。\\n  Is Navigational Page?:Yes\\n\\n- Title:[大模型年度榜单公布:GPT-4第一,智谱、阿里紧追 - 澎湃新闻](\\n  snippet:对过去一年来主流大模型全面评测诊断后,结果显示,GPT-4-Turbo在各项评测中均获最佳表现,国内厂商近期发布的模型紧随其后,包括智谱清言GLM-4、阿里巴巴Qwen-Max、百度文心一言4.0。 评测是大模型的指挥棒和指南针,OpenCompass为模型提供评测服务,量化模型在知识、语言、理解、推理和考试等五大能力维度的表现。 总体来看,大语言模型整体能力仍有较大提升空间,复杂推理相关能力仍是大模型普遍面临的难题,国内大模型相比于GPT-4还存在差距。 中文场景下国内最新大模型已展现出优势,在部分维度上接近GPT-4-Turbo的水平。 中英双语客观评测:数学、代码仍是短板.\\n  Is Navigational Page?:No\\n\\n- Title:[澎湃新闻 - 开源大模型Llama 3王者归来:最大底牌4000亿 ...](\\n  snippet:本周四,AI 领域迎来重大消息,Meta 正式发布了人们等待已久的开源大模型 Llama 3。 扎克伯格在 Facebook 上发帖:Big AI news today. 与此同时,扎克伯格宣布:基于最新的 Llama 3 模型,Meta 的 AI 助手现在已经覆盖 Instagram、WhatsApp、Facebook 等全系应用,并单独开启了网站。 另外还有一个图像生成器,可根据自然语言提示词生成图片。 Meta AI 网址: 同日,亚马逊云科技也宣布,Meta Llama 3 基础模型已可通过 Amazon SageMaker JumpStart来部署和推理运行。\\n  Is Navigational Page?:No\"}"


  "searchKey": "大语言模型 最新新闻"
  "prompt": "The below set forth the Bing search results,you can use this realtime info,answer user's question。the Searchkey: 大语言模型 最新新闻; SearchResult:\n\n- Title:[大型语言模型综述全新出炉:从T5到GPT-4最全盘点,国内 ...](\n  snippet:2023-04-04 11:58. 来源:澎湃新闻·澎湃号·湃客. 字号. 机器之心报道. 机器之心编辑部. 为什么仿佛一夜之间,自然语言处理(NLP)领域就突然突飞猛进,摸到了通用人工智能的门槛? 如今的大语言模型(LLM)发展到了什么程度? 未来短时间内,AGI 的发展路线又将如何? 自 20 世纪 50 年代图灵测试提出以来,人们始终在探索机器处理语言智能的能力。 语言本质上是一个错综复杂的人类表达系统,受到语法规则的约束。 因此,开发能够理解和精通语言的强大 AI 算法面临着巨大挑战。 过去二十年,语言建模方法被广泛用于语言理解和生成,包括统计语言模型和神经语言模型。\n  Is Navigational Page?:Yes\n\n- Title:[大模型年度榜单公布:GPT-4第一,智谱、阿里紧追 - 澎湃新闻](\n  snippet:对过去一年来主流大模型全面评测诊断后,结果显示,GPT-4-Turbo在各项评测中均获最佳表现,国内厂商近期发布的模型紧随其后,包括智谱清言GLM-4、阿里巴巴Qwen-Max、百度文心一言4.0。 评测是大模型的指挥棒和指南针,OpenCompass为模型提供评测服务,量化模型在知识、语言、理解、推理和考试等五大能力维度的表现。 总体来看,大语言模型整体能力仍有较大提升空间,复杂推理相关能力仍是大模型普遍面临的难题,国内大模型相比于GPT-4还存在差距。 中文场景下国内最新大模型已展现出优势,在部分维度上接近GPT-4-Turbo的水平。 中英双语客观评测:数学、代码仍是短板.\n  Is Navigational Page?:No\n\n- Title:[澎湃新闻 - 开源大模型Llama 3王者归来:最大底牌4000亿 ...](\n  snippet:本周四,AI 领域迎来重大消息,Meta 正式发布了人们等待已久的开源大模型 Llama 3。 扎克伯格在 Facebook 上发帖:Big AI news today. 与此同时,扎克伯格宣布:基于最新的 Llama 3 模型,Meta 的 AI 助手现在已经覆盖 Instagram、WhatsApp、Facebook 等全系应用,并单独开启了网站。 另外还有一个图像生成器,可根据自然语言提示词生成图片。 Meta AI 网址: 同日,亚马逊云科技也宣布,Meta Llama 3 基础模型已可通过 Amazon SageMaker JumpStart来部署和推理运行。\n  Is Navigational Page?:No"

xinference的debug log

需要修改 fastgpt 代码,打印对应流输出值,看看流是否正常返回,以及是否正常捕获流。

JinCheng666 commented 1 month ago

需要修改 fastgpt 代码,打印对应流输出值,看看流是否正常返回,以及是否正常捕获流。

感谢,我们还没有用代码启动过,暂时没人掌握nextjs技术,可能得先学一下了。 方便的话,能否指示一下具体是改哪个文件?再次感谢 @c121914yu

zhanghx0905 commented 1 month ago

@JinCheng666 请尝试一下 看看能否解决问题

JinCheng666 commented 1 month ago

@JinCheng666 请尝试一下 看看能否解决问题

@zhanghx0905 请问是尝试在这个项目里问一下?我看就是fork了xinference,有什么区别吗?

zhanghx0905 commented 1 month ago


这个branch为解决这个问题打了补丁,下载到本地pip install一下,看看能否满足要求

JinCheng666 commented 2 weeks ago

回复异常截断问题解决了,我关闭此问题。 目前出现的问题是输出了参考过程,我新开了issue