THUDM / P-tuning-v2

An optimized deep prompt tuning strategy comparable to fine-tuning across scales and tasks
Apache License 2.0
1.96k stars 198 forks source link

[Help] 如何通过微调提升 text2sql 能力? #52

Open xiaotianhxf opened 1 year ago

xiaotianhxf commented 1 year ago

求助:如何通过微调提升模型的text2sql能力?

  1. 如何给模型注入库表信息、业务知识?
  2. 如何校正模型输出的SQL?

当前给出一个建表语句(比如一张用户登录日志表),再问一个问题(比如 当天的DAU是多少), chatglm会给出错误的sql语句。 比如加了一些无关的字段、sql关键字之间没有空格、用户没有去重等

期望通过微调,提升模型的text2sql能力。

期望注入:

  1. 建库建表语句
  2. 表字段的关联关系: 比如A.a = B.b
  3. 业务知识: 比如投资roi怎么计算

问题:

  1. 今天XX的DAU是多少
  2. 最近7天XX的roi是多少

输出: select count(distinct yourid) from your_table where date = today()

从your_table表查询XX的DAU, 以yourid字段作为用户的唯一标识,以date字段作为过滤时间。通过count(distinct yourid)进行去重统计,date=today() 指定为今天。

highroom commented 1 year ago

我也想知道,有没有大佬指导下

zhanghy-sketchzh commented 1 year ago

可以关注一下DB-GPT-HUB项目,https://github.com/csunny/DB-GPT-Hub