ESXI 8.0直通RTX4090显卡CentOS7.9安装显卡驱动实践指南
  0xKuOxsZ0KlW 2023年11月02日 77 0

案例环境信息

EXSI版本:8.0.1

操作系统版本:CentOS 7.9

显卡型号:NVIDIA GeForce RTX 4090

解决方案

一 物理机BIOS配置

  1. 开启GPU直通 Above 4G decoding设置为Enabled Memory mapped I/O above 4GB设置为Enabled 或 PCI 64-bit resource handing above 4G设置为Enabled
  2. 开启虚拟化功能 Intel Virtualization Technology for Directed I/O (VT-d)设置为Enabled 或 AMD I/O Virtualization Technology (IOMMU)设置为Enabled
  3. 引导模式设置为UEFI (EXSI操作系统需重装)

二 ESXI配置

激活显卡直通

ESXI 8.0直通RTX4090显卡CentOS7.9安装显卡驱动实践指南_nvidia

三 虚拟机配置

  1. 虚拟硬件设置

ESXI 8.0直通RTX4090显卡CentOS7.9安装显卡驱动实践指南_RTX4090_02

  1. 虚拟机选项设置UEFI引导 (CentOS 7.9操作系统需重装)

ESXI 8.0直通RTX4090显卡CentOS7.9安装显卡驱动实践指南_ESXI_03

  1. 虚拟机选项设置高级参数


hypervisor.cpuid.v0

FALSE

pciPassthru.64bitMMIOSizeGB

32

pciPassthru.use64bitMMIO

TRUE

ESXI 8.0直通RTX4090显卡CentOS7.9安装显卡驱动实践指南_ESXI_04

四 CentOS 7.9 配置

  1. 检查显卡是否被系统识别
lspci | grep -i nvidia

ESXI 8.0直通RTX4090显卡CentOS7.9安装显卡驱动实践指南_CentOS_05

  1. 检查操作系统是否开启nouveau
lsmod | grep nouveau

ESXI 8.0直通RTX4090显卡CentOS7.9安装显卡驱动实践指南_显卡直通_06

  1. 禁用内核模块nouveau
vim /etc/modprobe.d/blacklist-nvidia-nouveau.conf

blacklist-nvidia-nouveau.conf文件内容:

blacklist nouveau
options nouveau modeset=0
  1. 新增显卡参数
vim /etc/modprobe.d/nvidia.conf

nvidia.conf文件内容:

options nvidia NVreg_OpenRmEnableUnsupportedGpus=1
  1. 更新内核
dracut /boot/initramfs-$(uname -r).img $(uname -r) --force
  1. 安装依赖
yum install -y vim wget yum-util net-tools epel-release
yum install -y gcc gcc-c++ dkms "kernel-devel-uname-r == $(uname -r)"
  1. 重启系统
reboot
  1. 下载驱动及机器学习套件CUDA
wget https://cn.download.nvidia.cn/XFree86/Linux-x86_64/535.104.05/NVIDIA-Linux-x86_64-535.104.05.run
wget https://developer.download.nvidia.cn/compute/cuda/12.2.2/local_installers/cuda_12.2.2_535.104.05_linux.run
  1. 安装驱动 安装过程中会出现以下几个问题,选择yes 或no Would you like to register the kernel module sources with DKMS? 选yes(服务器选yes,本地选no) Install NVIDIA's 32-bit compatibility libraries? 选no,然后会弹出安装64位的,选yes
sh NVIDIA-Linux-x86_64-535.104.05.run -m=kernel-open
  1. 安装机器学习套件CUDA 安装过程会出现许可协议,需要输入accpet按回车 用空格键取消Driver,因为前面已经完成显卡驱动安装。 然后移动到Install按回车进行CUDA套件安装
sh cuda_12.2.2_535.104.05_linux.run
  1. 配置CUDA环境变量
vim /etc/bashrc

在bashrc文件最后面追加以下内容:

export CUDA_HOME=/usr/local/cuda-12.2
export LD_LIBRARY_PATH=${CUDA_HOME}/lib64:${LD_LIBRARY_PATH}
export PATH=${CUDA_HOME}/bin:${PATH}
  1. 加载CUDA环境变量
source /etc/bashrc
  1. 验证驱动
nvidia-smi

ESXI 8.0直通RTX4090显卡CentOS7.9安装显卡驱动实践指南_CentOS_07

  1. 验证CUDA套件
nvcc -V

ESXI 8.0直通RTX4090显卡CentOS7.9安装显卡驱动实践指南_nvidia_08

五 显卡烤鸡测试

  1. 创建gpu_burn目录并进入
mkdir /root/gpu_burn
cd /root/gpu_burn
  1. 下载gpu_burn源码并解压
wget http://www.wili.cc/blog/entries/gpu-burn/gpu_burn-1.1.tar.gz
tar -zxvf gpu_burn-1.1.tar.gz
  1. 修改代码 修改内容: CUDAPATH=/usr/local/cuda改为CUDAPATH=/usr/local/cuda-12.2 -arch=compute_30改为-arch=compute_60
vim Makefile

Makefile文件内容:

CUDAPATH=/usr/local/cuda-12.2
# Have this point to an old enough gcc (for nvcc)
GCCPATH=/usr
NVCC=${CUDAPATH}/bin/nvcc
CCPATH=${GCCPATH}/bin
drv:
	PATH=${PATH}:.:${CCPATH}:${PATH} ${NVCC} -I${CUDAPATH}/include -arch=compute_60 -ptx compare.cu -o compare.ptx
	g++ -O3 -Wno-unused-result -I${CUDAPATH}/include -c gpu_burn-drv.cpp
	g++ -o gpu_burn gpu_burn-drv.o -O3 -lcuda -L${CUDAPATH}/lib64 -L${CUDAPATH}/lib -Wl,-rpath=${CUDAPATH}/lib64 -Wl,-rpath=${CUDAPATH}/lib -lcublas -lcudart -o gpu_burn
  1. 编译gpu_burn
make
  1. 执行烤鸡 600代表:程序执行600秒
./gpu_burn 600

ESXI 8.0直通RTX4090显卡CentOS7.9安装显卡驱动实践指南_RTX4090_09

  1. 开启新窗口监视显卡工作情况
watch -n 1 -d nvidia-smi

ESXI 8.0直通RTX4090显卡CentOS7.9安装显卡驱动实践指南_RTX4090_10


【版权声明】本文内容来自摩杜云社区用户原创、第三方投稿、转载,内容版权归原作者所有。本网站的目的在于传递更多信息,不拥有版权,亦不承担相应法律责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@moduyun.com

  1. 分享:
最后一次编辑于 2023年11月08日 0

暂无评论

0xKuOxsZ0KlW