RHEL 8.8 安装 NVIDIA 驱动

前提与准备

  • 确认 GPU 型号与支持的驱动版本:到 NVIDIA 官方驱动下载页面确认(例如 GeForce/Quadro/RTX/HPC)。
  • 系统更新
sudo dnf update -y
sudo reboot    # 如内核或关键组件被更新

禁用 Nouveau 驱动(Nouveau 与官方驱动冲突),并安装 EPEL/开发工具与内核头文件。

sudo dnf install -y epel-release
sudo dnf groupinstall -y "Development Tools"
sudo dnf install -y dkms kernel-headers kernel-devel rpm-build make gcc

确保 kernel-devel 与当前运行内核版本匹配:

uname -r
rpm -q kernel-devel --qf '%{VERSION}-%{RELEASE}.%{ARCH}\n'
适合需要特定版本或没有可用仓库时。

步骤:

切换到文本模式(停止图形界面):
bash
sudo systemctl isolate multi-user.target
确认 Nouveau 禁用:
创建或编辑 /etc/modprobe.d/blacklist-nouveau.conf,内容:
ini
blacklist nouveau
options nouveau modeset=0
生成并更新 initramfs:
bash
sudo dracut --force
重启到文本模式或重新引导:
bash
sudo reboot
sudo systemctl isolate multi-user.target
下载 NVIDIA .run(从 NVIDIA 官方),例如:
bash
wget -O NVIDIA-Linux.run "https://us.download.nvidia.com/XFree86/Linux-x86_64/<VERSION>/NVIDIA-Linux-x86_64-<VERSION>.run"
chmod +x NVIDIA-Linux.run
运行安装程序:
bash
sudo ./NVIDIA-Linux.run
在安装过程中如果提示安装 32-bit compatibility libraries、GLX、OpenGL 等,根据需要选择。
若提示编译内核模块失败,需确认 kernel-devel 和编译工具完整。
安装完成后,生成 X 配置(可选):
bash
sudo nvidia-xconfig
启动图形界面:
bash
sudo systemctl isolate graphical.target
验证驱动:
bash
nvidia-smi

bash
lsmod | grep nvidia
注意:

.run 安装不会自动随内核升级重建模块(可使用 DKMS 或每次内核升级后手动重装)。
安装之前务必禁用 Nouveau。

方法二:使用 ELRepo(推荐)或 NVIDIA 官方的 RPM/仓库(更易维护)

ELRepo 提供 kmod-nvidia(预编译的内核模块)与 nvidia 包,安装后在内核升级时更容易管理。NVIDIA 也提供官方的 CUDA / driver RPM repo。

示例:使用 ELRepo(适配 RHEL)

安装 ELRepo:
bash
sudo dnf install -y https://www.elrepo.org/elrepo-release-8.el8.elrepo.noarch.rpm
启用 ELRepo 的 kernel modules 源(通常默认启用),然后安装 kmod-nvidia:
bash
sudo dnf --enablerepo=elrepo-kernel install -y kmod-nvidia
或安装完整 GPU 驱动:
bash
sudo dnf install -y nvidia-x11-drv
具体包名可能随 ELRepo 版本变化,使用 dnf search nvidia 查找。
禁用 Nouveau(同上)并重建 initramfs:
bash
sudo bash -c "echo -e 'blacklist nouveau\noptions nouveau modeset=0' > /etc/modprobe.d/blacklist-nouveau.conf"
sudo dracut --force
sudo reboot
验证驱动:
bash
nvidia-smi
优势:ELRepo 的 kmod 包会为每个内核版本提供对应的内核模块,内核升级后模块通常自动安装,不必手动编译。

使用 NVIDIA 官方 RPM/Repo(NVIDIA CUDA repo)

如果你需要 CUDA,一般使用 NVIDIA 官方的 CUDA/RPM repo:

按照 NVIDIA 官方文档添加 repo(例子,替换为对应版本):
bash
sudo dnf config-manager --add-repo=https://developer.download.nvidia.com/compute/cuda/repos/rhel8/x86_64/cuda-rhel8.repo
sudo dnf clean all
sudo dnf -y module disable nvidia-driver
sudo dnf -y install nvidia-driver cuda
重启并验证 nvidia-smi。
请参考 NVIDIA 官方文档以获取针对 CUDA 版本的精确仓库 URL 与包名。

发表评论