QwenLM / Qwen-Agent

Agent framework and applications built upon Qwen2, featuring Function Calling, Code Interpreter, RAG, and Chrome extension.
https://pypi.org/project/qwen-agent/
Other
3.01k stars 293 forks source link

agent微调数据集质量问题 #266

Open ccp123456789 opened 1 month ago

ccp123456789 commented 1 month ago

请问这个数据集是不是质量很差https://modelscope.cn/datasets/iic/MSAgent-Bench。
比如: image 很多都是这种,tools里面没有参数,但是答案里面却有。就像这个artist,前面定义的工具里面压根没有这个参数

JianxinMa commented 1 month ago

这个数据集是modelscope团队制作的,我们这边没有参与。。一般用开源数据都是建议清洗下的

ccp123456789 commented 1 month ago

这个数据集是modelscope团队制作的,我们这边没有参与。。一般用开源数据都是建议清洗下的

请问,如果自己想要微调function call。 那么是不是首先要确定function call的模板格式,然后构建数据集。 最后在推理使用的时候,也按照同样的模板输入。

JianxinMa commented 1 month ago

这个数据集是modelscope团队制作的,我们这边没有参与。。一般用开源数据都是建议清洗下的

请问,如果自己想要微调function call。 那么是不是首先要确定function call的模板格式,然后构建数据集。 最后在推理使用的时候,也按照同样的模板输入。

是的,参考这个讨论贴:https://github.com/QwenLM/Qwen-Agent/issues/112 我一直想弄个便利的格式化脚本方便大家弄微调数据来着(但最近主职工作比较慢。。