X-PLUG / MobileAgent

Mobile-Agent: The Powerful Mobile Device Operation Assistant Family
https://arxiv.org/abs/2406.01014
MIT License
2.93k stars 271 forks source link

请教大佬,PC-Agent中gpt-4o进行对话的部分,能否换成本地部署的Qwen-VL-Chat? #65

Open shenyugub opened 3 weeks ago

shenyugub commented 3 weeks ago

image 图片中标注的那部分能够换成千问

junyangwang0410 commented 3 weeks ago

可以替换,但是要考虑到被替换的模型是否足以作为Agent,建议选择闭源的、规模较大的模型。

shenyugub commented 3 weeks ago

可以替换,但是要考虑到被替换的模型是否足以作为Agent,建议选择闭源的、规模较大的模型。

我目前想换Qwen-VL-Chat,如果替换的话,关于gpt-4o的API接口相关的参数都有哪些详细的解释吗?具体的数据格式有什么特别的要求?

junyangwang0410 commented 2 weeks ago

可以替换,但是要考虑到被替换的模型是否足以作为Agent,建议选择闭源的、规模较大的模型。

我目前想换Qwen-VL-Chat,如果替换的话,关于gpt-4o的API接口相关的参数都有哪些详细的解释吗?具体的数据格式有什么特别的要求?

Qwen-VL目前支持兼容OpenAI的格式,可以参考通义千问的API文档:https://help.aliyun.com/zh/dashscope/developer-reference/tongyi-qianwen-vl-plus-api#6194b12252urk