ubuntu安装Nvidia驱动和cuda和cudnn
安装Nvidia驱动
官网下载驱动 官方驱动 | NVIDIA
- 根据自己的显卡选择驱动。*注意:下载的驱动文件要放在英语路径中!!!*
更新软件列表和安装必要软件、依赖
sudo apt-get update sudo apt-get install g++ sudo apt-get install gcc sudo apt-get install make
禁用默认驱动
sudo nano /etc/modprobe.d/blacklist.conf
在打开的文件末尾输入并保存:
blacklist nouveau options nouveau modeset=0
- 保存退出
更新一下系统的initramfs镜像文件
sudo update-initramfs -u
- 重启电脑
在终端中输入
lsmod | grep nouveau
- 如果没有输出的话就说明禁用了nouveau。
进入tty模式 (远程SSH可以忽略)
关闭图形界面进入tty模式
终端输入:
sudo telinit 3
输入如下命令可以重新打开图形界面。
sudo telinit 5
- 进入tty以后需要输入用户名和密码登录
禁用X-window服务
sudo service gdm3 stop
安装驱动
- cd进入存放驱动文件的目录中,ls查看目录中的文件
sudo chmod 777 NVIDIA-Linux-x86_64-525.53.run #给下载的驱动赋予可执行权限 sudo ./NVIDIA-Linux-x86_64-525.116.04.run --no-opengl-files #安装
-no-opengl-files:只安装驱动文件,不安装OpenGL文件。
-no-x-check:安装驱动时关闭X服务,不设置可能导致安装失败。
会出现的选项:
选择"继续安装"
Install Nvidia's 32-bit compatibility libraries?
选择 "No"
Would you like to run the nvidia-xconfig utility to automatically update your X configuration file so that the NVIDIA X driver dill be used dhen you restart X? Any pre-existing X configuration file will be backed up.
选择 "No"
安装完成后重新开启显示服务
sudo service gdm3 start
进入系统
nvidia-smi
安装cuda
查看系统需要版本
nvidia-smi
官网下载cuda软件包 CUDA Toolkit Archive | NVIDIA Developer
wget https://developer.download.nvidia.com/compute/cuda/12.0.0/local_installers/cuda_12.0.0_525.60.13_linux.run
安装
sudo sh cuda_12.0.0_525.60.13_linux.run
输入
accept
在Driver这里按ENTER勾掉!
然后选择Install 按ENTER
配置环境变量
sudo nano ~/.bashrc
最后添加:
export PATH=$PATH:/usr/local/cuda-12.0/bin export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-12.0/lib64
- 保存退出
source ~/.bashrc
验证是否成功
nvcc -V
安装cudnn
下载安装文件
打开并登陆 https://developer.nvidia.com/rdp/cudnn-archive#a-collapse805-111
如果登录不上,请将规则改为全局代理
选择下载 cuDNN v8.9.1 (for CUDA 12.x),再选择 Local Installer for Linux x86_64 (Tar),就开始下载了。
解压下载好的tar文件。
tar -xvf cudnn-linux-x86_64-8.9.1.23_cuda12-archive.tar.xz
将相应文件复制到对应cuda的目录:
cd cudnn-linux-x86_64-8.9.1.23_cuda12-archive sudo cp include/cudnn.h /usr/local/cuda-12.0/include sudo cp lib/libcudnn* /usr/local/cuda-12.0/lib64 sudo chmod a+r /usr/local/cuda-12.0/include/cudnn.h /usr/local/cuda-12.0/lib64/libcudnn*
卸载之前的cuda
先执行Ubuntu的卸载删除程序
总共分为三步,如下
sudo apt-get remove cuda
sudo apt autoremove
sudo apt-get remove cuda*
因为还会有一些安装包的剩余,我们需要进入到安装目录下
cd /usr/local/
删除对应的cuda版本文件夹
sudo rm -r cuda-12.1
在这种情况下,还是会有一些剩余的文件,
通过下面命令查看卸载残留和删除,即可正常安装。
查看剩余的残留
sudo dpkg -l | grep cuda
卸载对应的残留
sudo dpkg -p cuda-repo-ubuntu2204-12-1-local
所有的残留都要删除哦,通过删除样式为
sudo dpkg -P 残留文件名
即可完成cuda版本的纯净卸载