sjtuplayer / anomalydiffusion

[AAAI 2024] AnomalyDiffusion: Few-Shot Anomaly Image Generation with Diffusion Model
MIT License
114 stars 14 forks source link

nvcc fatal : Unsupported gpu architecture 'compute_86' #28

Open bat1115 opened 4 months ago

bat1115 commented 4 months ago

在RTX 4090上执行main.py时,遇到nvcc fatal : Unsupported gpu architecture 'compute_86' error,请问如何解决。

bat1115 commented 4 months ago

在RTX 4090上执行main.py时,遇到nvcc fatal : Unsupported gpu architecture 'compute_86' error,请问如何解决。

将pytorch升级到与RTX 4090的8.9算力匹配的版本后,出现了下面的错误,nvcc fatal : Value 'c++17' is not defined for option 'std',不知道您有没有遇到过这个问题?

sjtuplayer commented 4 months ago

you can try using gcc==7

bat1115 commented 4 months ago

you can try using gcc==7 将原本的gcc=9.4降到9.3,并且通过export TORCH_CUDA_ARCH_LIST="7.5"命令将GPU算力降到7.5后,成功在4090上跑起来了,感谢!

lsxwtt commented 3 months ago

you can try using gcc==7 将原本的gcc=9.4降到9.3,并且通过export TORCH_CUDA_ARCH_LIST="7.5"命令将GPU算力降到7.5后,成功在4090上跑起来了,感谢!

您好,我也遇到了这个问题,请问您用的pytorch,cuda,ninja版本是什么呀

bat1115 commented 3 months ago

you can try using gcc==7 将原本的gcc=9.4降到9.3,并且通过export TORCH_CUDA_ARCH_LIST="7.5"命令将GPU算力降到7.5后,成功在4090上跑起来了,感谢!

您好,我也遇到了这个问题,请问您用的pytorch,cuda,ninja版本是什么呀

pytorch=1.12,cuda=11.3,ninja=1.11,把pytorch升级到与RTX 4090的8.9算力匹配的版本后有了新的报错,没能解决。把版本恢复到作者提供的版本后,通过限制4090的算力成功跑了起来。

lsxwtt commented 3 months ago

you can try using gcc==7 将原本的gcc=9.4降到9.3,并且通过export TORCH_CUDA_ARCH_LIST="7.5"命令将GPU算力降到7.5后,成功在4090上跑起来了,感谢!

您好,我也遇到了这个问题,请问您用的pytorch,cuda,ninja版本是什么呀

pytorch=1.12,cuda=11.3,ninja=1.11,把pytorch升级到与RTX 4090的8.9算力匹配的版本后有了新的报错,没能解决。把版本恢复到作者提供的版本后,通过限制4090的算力成功跑了起来。

请问您使用的是ubantu系统吗?系统安装的cuda也是11.3吗

bat1115 commented 3 months ago

you can try using gcc==7 将原本的gcc=9.4降到9.3,并且通过export TORCH_CUDA_ARCH_LIST="7.5"命令将GPU算力降到7.5后,成功在4090上跑起来了,感谢!

您好,我也遇到了这个问题,请问您用的pytorch,cuda,ninja版本是什么呀

pytorch=1.12,cuda=11.3,ninja=1.11,把pytorch升级到与RTX 4090的8.9算力匹配的版本后有了新的报错,没能解决。把版本恢复到作者提供的版本后,通过限制4090的算力成功跑了起来。

请问您使用的是ubantu系统吗?系统安装的cuda也是11.3吗

nvidia-smi显示的版本是12.2,nvcc -V显示的版本是10.1,你可以把nvcc -V的版本升级到和4090匹配试试,也许这样能使用8.9的算力

lsxwtt commented 3 months ago

you can try using gcc==7 将原本的gcc=9.4降到9.3,并且通过export TORCH_CUDA_ARCH_LIST="7.5"命令将GPU算力降到7.5后,成功在4090上跑起来了,感谢!

您好,我也遇到了这个问题,请问您用的pytorch,cuda,ninja版本是什么呀

pytorch=1.12,cuda=11.3,ninja=1.11,把pytorch升级到与RTX 4090的8.9算力匹配的版本后有了新的报错,没能解决。把版本恢复到作者提供的版本后,通过限制4090的算力成功跑了起来。

请问您使用的是ubantu系统吗?系统安装的cuda也是11.3吗

nvidia-smi显示的版本是12.2,nvcc -V显示的版本是10.1,你可以把nvcc -V的版本升级到和4090匹配试试,也许这样能使用8.9的算力

好的,非常感谢,还有个问题想要请教一下,请问推理代码中,embedding.pt和spatial_encoder.pt各自代表什么呀?我直接运行main.py,这两个训练好的模型保存在哪里呀?

bat1115 commented 3 months ago

you can try using gcc==7 将原本的gcc=9.4降到9.3,并且通过export TORCH_CUDA_ARCH_LIST="7.5"命令将GPU算力降到7.5后,成功在4090上跑起来了,感谢!

您好,我也遇到了这个问题,请问您用的pytorch,cuda,ninja版本是什么呀

pytorch=1.12,cuda=11.3,ninja=1.11,把pytorch升级到与RTX 4090的8.9算力匹配的版本后有了新的报错,没能解决。把版本恢复到作者提供的版本后,通过限制4090的算力成功跑了起来。

请问您使用的是ubantu系统吗?系统安装的cuda也是11.3吗

nvidia-smi显示的版本是12.2,nvcc -V显示的版本是10.1,你可以把nvcc -V的版本升级到和4090匹配试试,也许这样能使用8.9的算力

好的,非常感谢,还有个问题想要请教一下,请问推理代码中,embedding.pt和spatial_encoder.pt各自代表什么呀?我直接运行main.py,这两个训练好的模型保存在哪里呀?

embedding.pt可以查看AnomalyDiffusion/ldm/modules/embedding_manager2.py中的save( )函数,spatial_encoder.pt保存的是spatial_encoder_model的参数,这两个权重文件可以在AnomalyDiffusion/logs/anomaly-checkpoints目录下找到。

lsxwtt commented 3 months ago

you can try using gcc==7 将原本的gcc=9.4降到9.3,并且通过export TORCH_CUDA_ARCH_LIST="7.5"命令将GPU算力降到7.5后,成功在4090上跑起来了,感谢!

您好,我也遇到了这个问题,请问您用的pytorch,cuda,ninja版本是什么呀

pytorch=1.12,cuda=11.3,ninja=1.11,把pytorch升级到与RTX 4090的8.9算力匹配的版本后有了新的报错,没能解决。把版本恢复到作者提供的版本后,通过限制4090的算力成功跑了起来。

请问您使用的是ubantu系统吗?系统安装的cuda也是11.3吗

nvidia-smi显示的版本是12.2,nvcc -V显示的版本是10.1,你可以把nvcc -V的版本升级到和4090匹配试试,也许这样能使用8.9的算力

好的,非常感谢,还有个问题想要请教一下,请问推理代码中,embedding.pt和spatial_encoder.pt各自代表什么呀?我直接运行main.py,这两个训练好的模型保存在哪里呀?

embedding.pt可以查看AnomalyDiffusion/ldm/modules/embedding_manager2.py中的save( )函数,spatial_encoder.pt保存的是spatial_encoder_model的参数,这两个权重文件可以在AnomalyDiffusion/logs/anomaly-checkpoints目录下找到。

谢谢,请问这个epoch最大是多少呀?从哪里可以改呀?

bat1115 commented 3 months ago

you can try using gcc==7 将原本的gcc=9.4降到9.3,并且通过export TORCH_CUDA_ARCH_LIST="7.5"命令将GPU算力降到7.5后,成功在4090上跑起来了,感谢!

您好,我也遇到了这个问题,请问您用的pytorch,cuda,ninja版本是什么呀

谢谢,请问这个epoch最大是多少呀?从哪里可以改呀? Reply: image