2020/1/17

install nvidia driver for pytorch in ubuntu 18.04

最好先去 Pytorch 的網頁看一下支援的版本
像現在只有支援 cuda 9.2 跟 cuda 10.1

所以去 cuda 的頁面,選 舊release.. 選 10.1
有兩個 update.. 看一下,update 1 好像是完整的 deb,所以下載下來,然後 follow instruction:
`sudo dpkg -i cuda-repo-ubuntu1804-10-1-local-10.1.168-418.67_1.0-1_amd64.deb`
`sudo apt-key add /var/cuda-repo-/7fa2af80.pub`
`sudo apt-get update`
`sudo apt-get install cuda`
第二個命令其實在第一個命令完成後會顯示,舊 copy paste and run 舊可以。

cuda 安裝因為加了 apt source,所以 nvidia driver 也會更新,像裝完 cuda10.1 之後,nvidia driver 由 410 更新到 430

20/06/29

Y720 install SSD

這次 follow CUDA Toolkit 10.1 update2 Archive
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/cuda-ubuntu1804.pin
sudo mv cuda-ubuntu1804.pin /etc/apt/preferences.d/cuda-repository-pin-600
sudo apt-key adv --fetch-keys https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/7fa2af80.pub
sudo add-apt-repository "deb http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/ /"
sudo apt-get update
sudo apt-get -y install cuda
結果安自動安裝 driver 450

folloow pytorch gettting start 的 instruction,安裝 miniconda3,create env ,然後run pytorch install command:
conda install pytorch torchvision cudatoolkit=10.1 -c pytorch
會安裝 python 3.8,和 cudatoolkit-10.1
但是因為是再 conda env 內安裝,所以這些 package 只有在 env 李才看得到。


20/08/3

再到 Start Locally | PyTorch 去看, (那個selection table)已經可以選 cuda 10.2 了。

wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/cuda-ubuntu1804.pin
sudo mv cuda-ubuntu1804.pin /etc/apt/preferences.d/cuda-repository-pin-600
wget http://developer.download.nvidia.com/compute/cuda/10.2/Prod/local_installers/cuda-repo-ubuntu1804-10-2-local-10.2.89-440.33.01_1.0-1_amd64.deb
sudo dpkg -i cuda-repo-ubuntu1804-10-2-local-10.2.89-440.33.01_1.0-1_amd64.deb
sudo apt-key add /var/cuda-repo-10-2-local-10.2.89-440.33.01/7fa2af80.pub
sudo apt-get update
sudo apt-get -y install cuda
然後 driver 是 440 了..

follow pytorch install,有安裝 miniconda.

titan rtx 一直有問題,終於,conda install tensorflow-gpu 後,不能動作。
到 nvidia 選 18.04 cuda 11.X 安裝。
結果 driver 要 520
最後一部 apt install cuda 一直 fail,說要nvidia-drvier-520,但是部會裝。
後來,移除 apt.d/sourcelist.d 中 cuda 10.1 的 sources,update 後,purge 完,再做 apt install cuda 才安裝 520 driver....

沒有留言:

張貼留言