RUCKBReasoning / RESDSQL

The Pytorch implementation of RESDSQL (AAAI 2023).
https://arxiv.org/abs/2302.05965
MIT License
245 stars 58 forks source link

训练Cross-Encoder的时候为什么24G的显存还不够用? #67

Open Mucalinda2436 opened 9 months ago

Mucalinda2436 commented 9 months ago

是我哪里弄错了吗?还是说就是要这么大的显存?

lihaoyang-ruc commented 9 months ago

在使用schema_item_classifier.py训练cross-encoder的时候,可以尝试减少batch_size,并增大gradient_descent_step以避免显卡OOM的问题。