Closed Promise-Lv closed 1 year ago
./scripts/train/cspider_text2natsql/generate_text2natsql_dataset.sh 里面存在如下两个问题(相同情况在 cspider_text2sql也有):
因为对于训练数据我们已经知道每条数据的目标SQL,所以我们直接抽取出来目标SQL使用的表和列就行,不需要在训练集上跑schema item classifier。
text2sql_data_generator.py中的generate_train_ranked_dataset函数负责做这件事。
非常感谢您的解答!
./scripts/train/cspider_text2natsql/generate_text2natsql_dataset.sh 里面存在如下两个问题(相同情况在 cspider_text2sql也有):