Open Lufffya opened 1 year ago
尝试三:
pip install torch==1.13.1+cu117 torchvision==0.14.1+cu117 torchaudio==0.13.1 --extra-index-url https://download.pytorch.org/whl/cu117
还是出现和上面一样的错误,似乎会检测显卡驱动版本,我这里安装的是12.1.0,有可能更换成11.7就没问题了,但是太麻烦了,放弃了
尝试三:
pip install torch==1.13.1+cu117 torchvision==0.14.1+cu117 torchaudio==0.13.1 --extra-index-url https://download.pytorch.org/whl/cu117
还是出现和上面一样的错误,似乎会检测显卡驱动版本,我这里安装的是12.1.0,有可能更换成11.7就没问题了,但是太麻烦了,放弃了
首先这里是因为Torch编译CUDA插件要求CUDA Toolkit版本和编译TorchCPP插件的cuda版本一致,和驱动没关系,其次装CUDA很难吗?
我是windows 的cuda 117, **** python setup.py install running install D:\ProgramData\anaconda3\envs\cpm\lib\site-packages\setuptools_distutils\cmd.py:66: SetuptoolsDeprecationWarning: setup.py install is deprecated. !!
********************************************************************************
Please avoid running ``setup.py`` directly.
Instead, use pypa/build, pypa/installer, pypa/build or
other standards-based tools.
See https://blog.ganssle.io/articles/2021/10/setup-py-deprecated.html for details.
********************************************************************************
!! self.initialize_options() D:\ProgramData\anaconda3\envs\cpm\lib\site-packages\setuptools_distutils\cmd.py:66: EasyInstallDeprecationWarning: easy_install command is deprecated. !!
********************************************************************************
Please avoid running ``setup.py`` and ``easy_install``.
Instead, use pypa/build, pypa/installer, pypa/build or
other standards-based tools.
See https://github.com/pypa/setuptools/issues/917 for details.
********************************************************************************
!! self.initialize_options() running bdist_egg running egg_info writing bmtrain.egg-info\PKG-INFO writing dependency_links to bmtrain.egg-info\dependency_links.txt writing requirements to bmtrain.egg-info\requires.txt writing top-level names to bmtrain.egg-info\top_level.txt reading manifest file 'bmtrain.egg-info\SOURCES.txt' reading manifest template 'MANIFEST.in' adding license file 'LICENSE' writing manifest file 'bmtrain.egg-info\SOURCES.txt' installing library code to build\bdist.win-amd64\egg running install_lib running build_py running build_ext error: [WinError 2] 系统找不到指定的文件。
用build 安装也报错: python -m build -n -x -w
同问,cuda=12.0 python=3.7 torch=1.13,pip install bmtrain就是报错装不上。
同样报错 安装不上
这是我使用的一个conda环境
conda create --prefix $(pwd)/.conda_env pytorch==1.13.1 pytorch-cuda=11.6 libcusolver-dev -c pytorch -c nvidia
bdist
直接先安装bdist,再安装bmtrain试试呢
win10环境 pip install bmtrain 报错信息 ....... nccl.obj : error LNK2001: 无法解析的外部符号 ncclCommInitRank nccl.obj : error LNK2001: 无法解析的外部符号 ncclReduce nccl.obj : error LNK2001: 无法解析的外部符号 ncclRecv nccl.obj : error LNK2001: 无法解析的外部符号 ncclGroupEnd nccl.obj : error LNK2001: 无法解析的外部符号 ncclSend nccl.obj : error LNK2001: 无法解析的外部符号 ncclCommCount nccl.obj : error LNK2001: 无法解析的外部符号 ncclGetUniqueId nccl.obj : error LNK2001: 无法解析的外部符号 ncclCommDestroy nccl.obj : error LNK2001: 无法解析的外部符号 ncclBroadcast nccl.obj : error LNK2001: 无法解析的外部符号 ncclGroupStart nccl.obj : error LNK2001: 无法解析的外部符号 ncclCommUserRank nccl.obj : error LNK2001: 无法解析的外部符号 ncclReduceScatter nccl.obj : error LNK2001: 无法解析的外部符号 ncclAllGather nccl.obj : error LNK2001: 无法解析的外部符号 ncclAllReduce nccl.obj : error LNK2001: 无法解析的外部符号 ncclGetErrorString build\lib.win-amd64-cpython-38\bmtrain\nccl_C.cp38-win_amd64.pyd : fatal error LNK1120: 15 个无法解析的外部命令 error: command 'D:\Program Files (x86)\Microsoft Visual Studio\2022\BuildTools\VC\Tools\MSVC\14.36.32532\bin\HostX86\x64\link.exe' failed with exit code 1120 [end of output]
note: This error originates from a subprocess, and is likely not a problem with pip. ERROR: Failed building wheel for bmtrain Running setup.py clean for bmtrain Failed to build bmtrain ERROR: Could not build wheels for bmtrain, which is required to install pyproject.toml-based projects 安装bmtrain 一直报这个错 尝试安装了VS2019 与2022 需要怎么安装呢 cuda ==11.7 torch==1.13
环境: ubuntu server 22.04 conda python 3.10.0 nvidia driver 12.1.0
尝试一:
pip install -r requirements.txt
报错:
尝试二: 1,手动安装 cuda 11.8 下的 pytorch 2.0, torch.cuda.is_available() 输出 True 2,手动安装 requirements.txt 下除 torch 外的所有包 例如:
pip install bmtrain>=0.2.1
出现错误:
大概意思就是版本不兼容,所以 bmtrain 要怎么装?