下面是 Ubuntu 22.04 上安装 NVIDIA 驱动 570 和 CUDA 12.8 的详细步骤教程,适合需要深度学习、GPU 加速或科学计算的用户。
目录
- 系统准备与环境检查
- 卸载旧驱动
- 安装 NVIDIA 570 驱动
- 安装 CUDA 12.8 Toolkit
- 配置环境变量
- 验证安装
- 常见问题及解决方案
1️⃣ 系统准备与环境检查
- 确认系统版本
lsb_release -a
确保是 Ubuntu 22.04。
- 更新系统
sudo apt update && sudo apt upgrade -y
sudo reboot
- 禁用 Nouveau 驱动
Nouveau 驱动会与 NVIDIA 驱动冲突,需禁用。
创建或编辑 /etc/modprobe.d/blacklist-nouveau.conf
:
sudo nano /etc/modprobe.d/blacklist-nouveau.conf
写入:
blacklist nouveau
options nouveau modeset=0
更新 initramfs:
sudo update-initramfs -u
sudo reboot
- 验证 Nouveau 驱动已禁用
lsmod | grep nouveau
无输出表示禁用成功。
2️⃣ 卸载旧驱动(如果之前装过)
sudo apt-get purge '^nvidia-.*'
sudo apt autoremove -y
3️⃣ 安装 NVIDIA 驱动 570
- 添加 NVIDIA 官方 PPA
sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt update
- 安装指定版本驱动
sudo apt install nvidia-driver-570 -y
- 重启使驱动生效
sudo reboot
- 验证驱动安装
nvidia-smi
输出显示 NVIDIA 570 驱动信息,说明安装成功。
4️⃣ 安装 CUDA 12.8 Toolkit
4.1 下载 CUDA 12.8
- 访问 NVIDIA CUDA Toolkit 官方下载页(https://developer.nvidia.com/cuda-toolkit-archive)
- 选择 Linux → x86_64 → Ubuntu → 22.04 → deb (local)
- 复制下载链接,使用 wget 下载,例如:
wget https://developer.download.nvidia.com/compute/cuda/12.8.0/local_installers/cuda-repo-ubuntu2204-12-8-local_12.8.0-535.54.03-1_amd64.deb
4.2 安装 CUDA 本地仓库包
sudo dpkg -i cuda-repo-ubuntu2204-12-8-local_12.8.0-535.54.03-1_amd64.deb
sudo cp /var/cuda-repo-ubuntu2204-12-8-local/cuda-*-keyring.gpg /usr/share/keyrings/
4.3 更新 apt 并安装 CUDA
sudo apt-get update
sudo apt-get -y install cuda
4.4 由于 CUDA 默认带自带 NVIDIA 驱动,可能版本较新或冲突,如已安装 570 驱动可选择不安装驱动部分。
5️⃣ 配置环境变量
编辑用户的 .bashrc
文件:
nano ~/.bashrc
在文件末尾添加:
export PATH=/usr/local/cuda-12.8/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-12.8/lib64:$LD_LIBRARY_PATH
使配置立即生效:
source ~/.bashrc
6️⃣ 验证安装
- 验证 CUDA 版本:
nvcc --version
- 运行 NVIDIA 设备查询:
nvidia-smi
- 运行 CUDA 示例程序(如果安装了 samples)
cuda-install-samples-12.8.sh ~/
cd ~/NVIDIA_CUDA-12.8_Samples/1_Utilities/deviceQuery
make
./deviceQuery
结果显示 Result = PASS
说明安装成功且 GPU 可用。
7️⃣ 常见问题及解决方案
问题 | 解决方案 |
---|---|
NVIDIA 驱动安装后黑屏或卡死 | 进入 tty 模式(Ctrl+Alt+F3),卸载驱动重新安装或尝试其他版本 |
CUDA 版本与驱动不兼容 | 驱动版本须支持 CUDA 12.8,570 驱动支持CUDA 12较好,尽量保持驱动和CUDA匹配 |
nvcc 命令找不到 | 确认环境变量配置正确,或使用完整路径 /usr/local/cuda-12.8/bin/nvcc |
安装完 CUDA 后驱动版本被覆盖 | 可以选择只安装 CUDA Toolkit,不安装驱动部分,手动单独安装合适驱动版本 |
如果你需要,我还能帮你写安装脚本,或安装 TensorFlow/PyTorch GPU 版本的完整教程,随时告诉我!
发表回复