cubenlp / ChatSQL

自然语言转SQL,直接连接数据库查询
Apache License 2.0
365 stars 48 forks source link

训练chatGLM的prompt如何构建 #17

Open nuaabuaa07 opened 1 year ago

nuaabuaa07 commented 1 year ago

我目前使用的prompt的格式类似这样的:

` _我们要将用户的问题翻译为一个mysql的sql语句。 问题涉及的数据表的信息是:

表名:a_activity_instance 表结构: activity_instance_id 活动实例ID activity_type_id 活动类型ID activity_code 活动编码 busi_category 业务类型,参见"活动业务分类"表的配置 用户的问题是:

get all activity_instance_id of activity? 将用户的问题翻译为mysql的sql语句,sql语句是:

`

想请教一下这样正确不? 如果这样的话,pre_seq_len 就要设置的比较大,会不会对最后的效果有影响? 麻烦大佬给一些建议,跪谢。

yysirs commented 1 year ago

输入过长确实目前text-to-sql的问题,如果不能让模型知道表信息和字段信息,输出效果肯定不会理想。 如果表结构比较复杂,可以考虑ChatGLM2-16K的模型,能输入更长的表结构和字段信息。

qiuxia-alone commented 1 year ago

请问下你们是全参数微调还是部分微调(如lora)呢,数据量大概是多少呀

yysirs commented 4 months ago

请问下你们是全参数微调还是部分微调(如lora)呢,数据量大概是多少呀

lora微调的,数据量越大越好吧