ddp trainer doesn't work for vision transformer models

melihcatal / advsecurenet

Machine Learning Security Library

https://melihcatal.github.io/advsecurenet/

MIT License

4 stars 3 forks source link

Closed melihcatal closed 10 months ago

melihcatal commented 11 months ago

CNN models (i.e., resnet18,50 etc.) work well. vision transformer models (i.e., swin_v2_s) train on a single GPU; however, DDP training fails.