tianzhipeng-git / tianzhipeng-git.github.io

https://tianzhipeng-git.github.io/
0 stars 0 forks source link

2023/11/21/cuda-version #7

Open utterances-bot opened 4 months ago

utterances-bot commented 4 months ago

cuda模块关系和版本兼容性

cuda兼容性 cuda版本 nvidia-smi nvcc cuda-driver cuda-runtime

https://tianzhipeng-git.github.io/2023/11/21/cuda-version.html

wqdun commented 4 months ago

👍🏻

zephyrluo commented 4 months ago

大佬,问个兼容问题: 我的win10系统有两个显卡,RTX 4070Ti 和 Tesla V100-SXM3-32GB ,驱动用的是官方最新半552, 内核编译CUDA版本是 12.2, 安装的CUDA toolkit 也是12.2.0。 pytorch版本是2.3 版本。 现在遇到很奇怪的问题,在v100上面跑ollama/mistral,正常。 但在v100上面用pytorch跑训练,有的能顺利跑完,有的跑一半报错。 同样的代码,在4070Ti上是可以跑完的。 知道为啥吗?

tianzhipeng-git commented 4 months ago

大佬,问个兼容问题: 我的win10系统有两个显卡,RTX 4070Ti 和 Tesla V100-SXM3-32GB ,驱动用的是官方最新半552, 内核编译CUDA版本是 12.2, 安装的CUDA toolkit 也是12.2.0。 pytorch版本是2.3 版本。 现在遇到很奇怪的问题,在v100上面跑ollama/mistral,正常。 但在v100上面用pytorch跑训练,有的能顺利跑完,有的跑一半报错。 同样的代码,在4070Ti上是可以跑完的。 知道为啥吗?

不好意思我没在win上用过. 我理解RTX系列和V系列的驱动应该是不同的吧, 可以这样同一台机器用两种类型的么

直接搜索报错吧, 这样看不出来原因.

ZDWWWWW commented 1 month ago

感谢,这块的内容真的是太扭曲了

hz9782 commented 2 weeks ago

感谢总结,今天查找了半天这个兼容性问题。总的来说就是两个问题,旧版本的cuda是否能够兼容新的pytorch,答案是可以的,可以参考这几个回答https://stackoverflow.com/questions/75227372/pytorch-vs-tensorflow-cuda-versions https://discuss.pytorch.org/t/cuda-versioning-and-pytorch-compatibility/189777/21 还有就是新版本的cuda能否兼容旧版本的pytorch,答案是一般不可以(需要自己从源代码构建自己的自定义 Pytorch 包,这不是一个简单的过程),可以参考这个回答https://stackoverflow.com/questions/76722974/old-pytorch-version-on-new-gpu

tianzhipeng-git commented 2 weeks ago

感谢总结,今天查找了半天这个兼容性问题。总的来说就是两个问题,旧版本的cuda是否能够兼容新的pytorch,答案是可以的,可以参考这几个回答https://stackoverflow.com/questions/75227372/pytorch-vs-tensorflow-cuda-versions https://discuss.pytorch.org/t/cuda-versioning-and-pytorch-compatibility/189777/21 还有就是新版本的cuda能否兼容旧版本的pytorch,答案是一般不可以(需要自己从源代码构建自己的自定义 Pytorch 包,这不是一个简单的过程),可以参考这个回答https://stackoverflow.com/questions/76722974/old-pytorch-version-on-new-gpu

赞, 我这里没有太深入研究 pytorch和cuda的兼容性