下面是 Ubuntu 22.04 上安装 NVIDIA 驱动 570 和 CUDA 12.8 的详细步骤教程,适合需要深度学习、GPU 加速或科学计算的用户。

目录

  1. 系统准备与环境检查
  2. 卸载旧驱动
  3. 安装 NVIDIA 570 驱动
  4. 安装 CUDA 12.8 Toolkit
  5. 配置环境变量
  6. 验证安装
  7. 常见问题及解决方案

1️⃣ 系统准备与环境检查

  • 确认系统版本
lsb_release -a

确保是 Ubuntu 22.04。

  • 更新系统
sudo apt update && sudo apt upgrade -y
sudo reboot
  • 禁用 Nouveau 驱动

Nouveau 驱动会与 NVIDIA 驱动冲突,需禁用。

创建或编辑 /etc/modprobe.d/blacklist-nouveau.conf

sudo nano /etc/modprobe.d/blacklist-nouveau.conf

写入:

blacklist nouveau
options nouveau modeset=0

更新 initramfs:

sudo update-initramfs -u
sudo reboot
  • 验证 Nouveau 驱动已禁用
lsmod | grep nouveau

无输出表示禁用成功。


2️⃣ 卸载旧驱动(如果之前装过)

sudo apt-get purge '^nvidia-.*'
sudo apt autoremove -y

3️⃣ 安装 NVIDIA 驱动 570

  • 添加 NVIDIA 官方 PPA
sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt update
  • 安装指定版本驱动
sudo apt install nvidia-driver-570 -y
  • 重启使驱动生效
sudo reboot
  • 验证驱动安装
nvidia-smi

输出显示 NVIDIA 570 驱动信息,说明安装成功。


4️⃣ 安装 CUDA 12.8 Toolkit

4.1 下载 CUDA 12.8

wget https://developer.download.nvidia.com/compute/cuda/12.8.0/local_installers/cuda-repo-ubuntu2204-12-8-local_12.8.0-535.54.03-1_amd64.deb

4.2 安装 CUDA 本地仓库包

sudo dpkg -i cuda-repo-ubuntu2204-12-8-local_12.8.0-535.54.03-1_amd64.deb
sudo cp /var/cuda-repo-ubuntu2204-12-8-local/cuda-*-keyring.gpg /usr/share/keyrings/

4.3 更新 apt 并安装 CUDA

sudo apt-get update
sudo apt-get -y install cuda

4.4 由于 CUDA 默认带自带 NVIDIA 驱动,可能版本较新或冲突,如已安装 570 驱动可选择不安装驱动部分。


5️⃣ 配置环境变量

编辑用户的 .bashrc 文件:

nano ~/.bashrc

在文件末尾添加:

export PATH=/usr/local/cuda-12.8/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-12.8/lib64:$LD_LIBRARY_PATH

使配置立即生效:

source ~/.bashrc

6️⃣ 验证安装

  • 验证 CUDA 版本:
nvcc --version
  • 运行 NVIDIA 设备查询:
nvidia-smi
  • 运行 CUDA 示例程序(如果安装了 samples)
cuda-install-samples-12.8.sh ~/
cd ~/NVIDIA_CUDA-12.8_Samples/1_Utilities/deviceQuery
make
./deviceQuery

结果显示 Result = PASS 说明安装成功且 GPU 可用。


7️⃣ 常见问题及解决方案

问题解决方案
NVIDIA 驱动安装后黑屏或卡死进入 tty 模式(Ctrl+Alt+F3),卸载驱动重新安装或尝试其他版本
CUDA 版本与驱动不兼容驱动版本须支持 CUDA 12.8,570 驱动支持CUDA 12较好,尽量保持驱动和CUDA匹配
nvcc 命令找不到确认环境变量配置正确,或使用完整路径 /usr/local/cuda-12.8/bin/nvcc
安装完 CUDA 后驱动版本被覆盖可以选择只安装 CUDA Toolkit,不安装驱动部分,手动单独安装合适驱动版本

如果你需要,我还能帮你写安装脚本,或安装 TensorFlow/PyTorch GPU 版本的完整教程,随时告诉我!