NVIDIA Drivers、CUDA、Pytorch 这三者的版本有着十分紧密的关联,很容易因为版本不对而重复卸载、重装。
这里写个记录,方便查阅。
一、NVIDIA Drivers、CUDA
NVIDIA Drivers、CUDA 的关系可以在这里看到:
CUDA Compatibilityhttps://docs.nvidia.com/deploy/cuda-compatibility/
如下图所示:
上图解释:
- C - 兼容
- X - 不兼容
- 分支 R525、R515、R510、R465、R460、R455、R450、R440、R418、R410、R396、R390 已终止使用,并且不是支持兼容性的目标。
- 新功能分支(例如 495.xx)不是 CUDA 前向兼容性支持的目标。
CUDA 版本的 Release Note 在这里
CUDA 12.5 Update 1 Release NotesThe Release Notes for the CUDA Toolkit.https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html如下图所示:
有时候可以通过上面这个网站了解CUDA新版本的兼容情况。
NVIDIA Drivers、CUDA 的下载方法:
CUDA Toolkithttps://developer.nvidia.com/cuda-downloads如下,选择对就的操作系统、CPU架构、版本等信息
上面给出了对应的 ubuntu 20.04 系统的 runfile 下载方式和安装方式:
wget https://developer.download.nvidia.com/compute/cuda/12.5.1/local_installers/cuda_12.5.1_555.42.06_linux.run
sudo sh cuda_12.5.1_555.42.06_linux.run
解释:
- 这里的 cuda_12.5.1_555.42.06_linux.run 文件有几个G,
- 它包含了 NVIDIA Drivers -555.42.06 和 CUDA - 12.5.1
执行 sudo sh cuda_12.5.1_555.42.06_linux.run 后,根据提示来安装即可。
验证 NVDIA Drivers 是否安装成功的方法:
使用 nvidia-smi,这是 NVIDIA 提供的一个命令行工具,用于管理和监控 NVIDIA GPU。执行以下命令:
nvidia-smi
如果 NVIDIA 驱动成功安装并正确加载,你会看到类似以下的输出,显示 GPU 的详细信息:
Thu Jul 15 13:45:27 2024
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 535.54.06 Driver Version: 535.54.06 CUDA Version: 12.2 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
| | | MIG M. |
|===============================+======================+======================|
| 0 GeForce GTX 1080 Off | 00000000:01:00.0 On | N/A |
| 0% 33C P8 7W / 180W | 205MiB / 8192MiB | 0% Default |
| | | N/A |
+-------------------------------+----------------------+----------------------++-----------------------------------------------------------------------------+
| Processes: |
| GPU GI CI PID Type Process name GPU Memory |
| ID ID Usage |
|=============================================================================|
| 0 N/A N/A 1774 G /usr/lib/xorg/Xorg 160MiB |
| 0 N/A N/A 2023 G /usr/bin/gnome-shell 43MiB |
+-----------------------------------------------------------------------------+
检查 CUDA 是否安装成功的方法是,使用 nvcc 命令来检查 CUDA 编译器的版本。
nvcc --version
如果安装成功,你应该会看到类似以下的输出,显示 CUDA 的版本信息:
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2024 NVIDIA Corporation
Built on Thu_Jul_24_19:09:09_PDT_2024
Cuda compilation tools, release 12.2, V12.2.91
Build cuda_12.2.r12.2/compiler.32484909_64.312
二、Pytorch
Pytorch 的版本与 CUDA 版本有密切的关系。
最新版本的 Pytorch 的安装文件,在这里下载:
Start Locally | PyTorch Start Locallyhttps://pytorch.org/get-started/locally/
如下图所示:
安装方法,拷贝下面命令即可安装与 CUDA 12.4 兼容的最新版本 pytorch :
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu124
注意,这里的 cu124 是指 CUDA 12.4。
历史版本 pytorch 的安装文件和方法在这里
Previous PyTorch Versions | PyTorch Installing previous versions of PyTorchhttps://pytorch.org/get-started/previous-versions/
如下图所示:
拷贝对应的版本来安装即可。
查看 pythorch 安装成功与否的方法是:首先,打开一个 Python 解释器(如 python 或 ipython),然后尝试导入 PyTorch 并检查其版本:
import torch
print(torch.__version__)
如果 PyTorch 安装成功,你会看到类似以下的输出,显示 PyTorch 的版本号:
2.2.0
如果你安装的是支持 CUDA 的 PyTorch 版本,可以检查 CUDA 是否可用:
import torch
print(torch.cuda.is_available())
如果 CUDA 可用,该命令会输出 True,否则输出 False。
三、总结
这三个东西总是容易搞错乱,写下这篇文章,希望可以帮到人。
.