​ 今天在重启服务器ubuntu后,发现cuda无法使用,输入nvidia-smi后提示无法与驱动通信,通过搜索网上的解决方案,其中一个能够解决问题方案的是:https://blog.csdn.net/wjinjie/article/details/108997692

​ 但该方案无法解决博主问题,在最后两步,即

sudo apt-get install dkms

sudo dkms install -m nvidia -v 450.57

​ 时,提示无法返回满足内核版本的状态,因此推断是内核版本和驱动不匹配导致,这可能是重启计算机时完成了内核更新,或者其他用户选择更新了内核版本,因此卸载当前驱动,重新安装新版本驱动。

​ 首先在/usr/src/目录下可以看到已安装的nvidia驱动文件和版本

sudo apt-get remove nvidia-*  # 卸载当前驱动

​ 卸载完成后,文件消失

sudo apt update
sudo apt upgrade # 更新系统源

apt search nvidia-driver # 查看可用驱动程序列表

sudo apt install nvidia-driver-550 nvidia-settings nvidia-prime # 安装驱动,其中550为版本,根据情况选择

​ 安装完成后,在/usr/src/目录下可以看到550版本的驱动,等待一段时间后,输入nvidia-smi输出正确,且cuda可用,若不行则重启计算机