bubbliiiing / yolov4-tiny-pytorch

这是一个YoloV4-tiny-pytorch的源码,可以用于训练自己的模型。
MIT License
787 stars 184 forks source link

DDP init_process_group 配置问题 #102

Open xiaomaofeng opened 1 year ago

xiaomaofeng commented 1 year ago

为什么直接调用不会出问题 RANK,WORLD_SIZE,MASTER_ADDR,MASTER_PORT等值 已经socket的连接没有问题吗

期待回复,谢谢

bubbliiiing commented 1 year ago

额0 0应该没问题吧,问题在哪啊

xiaomaofeng commented 1 year ago

image 图上显示的直接错误就是socket连接失败,然后代码中 我修改过手动设置环境变量,因为如果不设置的话Init_Process_group阶段会抛异常,原因是如果没有传参进去设置RANK,WORLD_SIZE,MASTER_ADDR,MASTER_PORT等值的话,就会读取环境变量。所以很好奇= = 谢谢回复。