Training using Nvidia A100 GPU

wenwenyu / PICK-pytorch

Code for the paper "PICK: Processing Key Information Extraction from Documents using Improved Graph Learning-Convolutional Networks" (ICPR 2020)

MIT License

553 stars 191 forks source link

Hi, i'm using one A100 GPU to train PICK and i've set distributed to false.

[2022-06-08 01:41:58,561 - train - INFO] - One GPU or CPU training mode start... [2022-06-08 01:41:58,565 - train - INFO] - Dataloader instances created. Train datasets: 100 samples Validation datasets: 20 samples. [2022-06-08 01:41:59,276 - train - INFO] - Model created, trainable parameters: 68571598. [2022-06-08 01:41:59,277 - train - INFO] - Optimizer and lr_scheduler created. [2022-06-08 01:41:59,277 - train - INFO] - Max_epochs: 35 Log_per_step: 20 Validation_per_step: 100. [2022-06-08 01:41:59,277 - train - INFO] - Training start... [2022-06-08 01:41:59,289 - trainer - WARNING] - Training is using GPU 0!

I've been struck here for so long and after 10-15 mins, it throws CuDNN error. any solution?

cuda version = 10.1 and pythorch = 1.5.1+101

wenwenyu / PICK-pytorch

Training using Nvidia A100 GPU #114