Closed jialesmu closed 3 years ago
@jialesmu 你用的是nvidia-docker吗?试试单卡是否正常?如果正常,就要看nccl环境有没有安装了。
@jialesmu 你用的是nvidia-docker吗?试试单卡是否正常?如果正常,就要看nccl环境有没有安装了。
谢谢大佬回复,是的,我pull的nvidia-docker, 我看train的时候 显示 Driver API Version: 11.1, Runtime API Version: 10.2,是不是这个因素呢?
这个应该没关系的。单卡训练正常吗
这个应该没关系的。单卡训练正常吗
稍等,我运行下。。不过我有俩显卡,应该不会吧。。
这个应该没关系的。单卡训练正常吗
大佬,单卡训练还是报了同样的错误
@jialesmu 你可以在本地使用anaconda搭建环境吗?
@jialesmu 你可以在本地使用anaconda搭建环境吗?
我是在服务器上搭建的docker,本地是mac无法使用显卡。。
在服务器,不用docker。
大佬,我试试~
docker~~~CUDA_VISIBLE_DEVICES=0,1 python train.py
请问大佬这个原因是因为显卡驱动吗还是?NVIDIA-SMI 455.28 Driver Version: 455.28 CUDA Version: 11.1 GeForce RTX 3090