トップページ -> インストール,設定,利用 -> Ubuntu ソフトウエア -> NVIDIA ドライバ,NVIDIA CUDA ツールキット 10,NVIDIA cuDNN 7 のインストール(Ubuntu 20.04, Ubuntu 18.04 上)
[サイトマップへ], [サイト内検索へ]

NVIDIA ドライバ,NVIDIA CUDA ツールキット 10,NVIDIA cuDNN 7 のインストール(Ubuntu 20.04, Ubuntu 18.04 上)

Ubuntu での,NVIDIA ドライバ,NVIDIA CUDA ツールキット 10,NVIDIA cuDNN 7,NCCL,TensorRT のインストール手順をスクリーンショット等で説明する.

GPU とは,グラフィックス・プロセッシング・ユニットの略で、コンピュータグラフィックス関連の機能,乗算や加算の並列処理の機能などがある. CUDA とは,NVIDIA社が提供している GPU 用のプラットフォームである. NVIDIA 社のグラフィックスボードが持つ GPU の機能を使うとき,CUDA を利用することができる. cuDNN は,NVIDIA CUDA Deep Neural Network libraryである.

TensorFlow 2.3 や 2.2 が,2020年 7月時点では,10.1 対応10.2 に未対応).

根拠は https://www.tensorflow.org/install/gpu). そこで,CUDA 10.1 をインストールする. (Ubuntu 18.04 では,同様の手順で CUDA 10.0 もインストール可能)

目次

  1. OS のシステム更新
  2. NVIDIA グラフィックスボードの確認
  3. NVIDIA グラフィックスボード・ドライバのインストール
  4. NVIDIA CUDA ツールキットのインストール
  5. NVIDIA cuDNN のインストール
  6. NVIDIA NCCL, TensorRT のインストール

参考Webページ


OS のシステム更新

端末で,次のコマンドを実行.

sudo apt update
sudo apt -yV upgrade
sudo /sbin/shutdown -r now

NVIDIA グラフィックスボードの確認

参考Webページ https://docs.nvidia.com/deploy/cuda-compatibility/index.html

グラフィックスボードの確認

CUDA 対応の GPU であるかを確認のため, 端末で,次のコマンドを実行.

lspci | grep -i nvidia | grep VGA

実行結果の例.(表示が空になるときは,NVIDIAのグラフィックスボードが無い可能性がある).

X.org の設定の確認

  1. まず,mesa-utils をインストール

    sudo apt install mesa-utils
    

  2. 次の2つのコマンドで設定を確認

    glxinfo | grep direct
    

    [image]

    xdriinfo
    

[image]

NVIDIA グラフィックスボード・ドライバのインストール

  1. 端末で,次のコマンドを実行.
    sudo apt -yV install ubuntu-drivers-common
    sudo ubuntu-drivers autoinstall
    

  2. ドライバのインストール後は,システムの再起動
    sudo shutdown -r now
    
  3. NVIDIA ドライバの確認

    システムの再起動後,端末で,次のコマンドを実行し,ドライバ等を確認する

    先頭の「Driver Version」のところに,ドライバのバージョンが表示される.NVIDIA CUDA がインストール済みのときは,CUDA のバージョンも表示される.

    nvidia-smi
    


NVIDIA CUDA ツールキットのインストール

いくつかの前準備ののち, NVIDIA CUDA パッケージレポジトリからダウンロードして,インストールするという手順を説明する.

NVIDIA CUDA パッケージレポジトリの URL: https://developer.download.nvidia.com/compute/cuda/repos/

参考Webページ: https://www.tensorflow.org/install/gpu

※ 但し,Ubuntu 20.04 などは, NVIDIA CUDA パッケージレポジトリでの公開が行われていない(2020/06時点)ので, 前準備ののち,apt コマンドを用いてインストールする.

deb パッケージでインストールされていた旧バージョンの CUDA ツールキットをアンインストールする操作

dpkg -l | grep cuda 
sudo apt --purge remove cuda*
sudo apt autoremove

※ deb パッケージ以外で CUDA をインストールしていた場合には,上の操作ではアンインストールできないことに注意.

カーネルヘッダーと,カーネル開発用パッケージのインストール

sudo apt -yV install linux-headers-$(uname -r)

[image]

Wget のインストール

sudo apt -yV install wget

Ubuntu のバージョンを確認

uname -m
lsb_release -sc
cat /etc/*release

次のようにUbuntu のバージョンが表示されるので確認する.

VERSION_ID の行などで確認できる.

NVIDIA CUDA のインストール

Ubuntu 20.04 の場合

NVIDIA CUDA パッケージレポジトリで,インストールしたいバージョンである CUDA 10.1 が公開されていない(2020/07 時点).

NVIDIA CUDA パッケージレポジトリの URL: https://developer.download.nvidia.com/compute/cuda/repos/

NVIDIA CUDA パッケージレポジトリは使わない. Ubuntu 20.04 では,次のコマンド実行により,NVIDIA CUDA 10.1 をインストールする.

  1. コマンドを実行
    sudo apt -yV install nvidia-cuda-dev nvidia-cuda-toolkit nvidia-cuda-toolkit-gcc
    

  2. 次のコマンドで,CUDA ツールキットのバージョンを確認
    cat /usr/lib/cuda/version.txt
    

Ubuntu 18.04 の場合

  1. NVIDIA CUDA パッケージレポジトリで,ファイル名を確認

    NVIDIA CUDA パッケージレポジトリの URL: https://developer.download.nvidia.com/compute/cuda/repos/

    ※ Linux の種類やバージョンごとに,違うので確認する.NVIDIA CUDA パッケージレポジトリでは, Ubuntu 以外の Linux についてのファイルも公開されている : https://developer.download.nvidia.com/compute/cuda/repos/

    Ubuntu 18.04 の場合は,https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/ で確認.

    スクロールして「cuda-repo・・・」を探す

  2. NVIDIA CUDA パッケージレポジトリを,Ubuntu システムに追加

    いま確認したファイル名のファイルを追加

    TensorFlow 2.3 や 2.2 が,2020年 7月時点では,10.1 対応10.2 に未対応).(根拠は https://www.tensorflow.org/install/gpu)なので,10.1 のファイルを使う.

    cd /tmp
    wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/cuda-repo-ubuntu1804_10.1.243-1_amd64.deb
    sudo dpkg -i cuda-repo-ubuntu1804_10.1.243-1_amd64.deb
    sudo apt-key adv --fetch-keys https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/7fa2af80.pub
    sudo apt-get update
    
  3. NVIDIA CUDA パッケージレポジトリを用いて,NVIDIA CUDA をインストール
    sudo apt -yV install cuda-10.1
    

    [image]
  4. NVIDIA CUDA ツールキットにパスを通す設定

    端末で,次のコマンドを実行.

    export CUDA_PATH=/usr/local/cuda-10.1
    echo 'export CUDA_PATH=/usr/local/cuda-10.1' >> ${HOME}/.bashrc
    export LD_LIBRARY_PATH=/usr/local/cuda-10.1/lib64:${LD_LIBRARY_PATH}
    echo 'export LD_LIBRARY_PATH=/usr/local/cuda-10.1/lib64:${LD_LIBRARY_PATH}' >> ${HOME}/.bashrc
    export PATH=/usr/local/cuda-10.1/bin:${PATH}
    echo 'export PATH=/usr/local/cuda-10.1/bin:${PATH}' >> ${HOME}/.bashrc
    

確認

nvcc 版を動作させてみることで, CUDA ツールキットの動作確認を行う.

  1. 次のコマンドで,NVIDIA ドライバ,mCUDA のバージョン等を確認できる
    nvidia-smi
    
  2. nvcc がインストール済みであることを確認

    which nvcc 
    
  3. nvccの確認のため, https://devblogs.nvidia.com/easy-introduction-cuda-c-and-c/に記載のソースコードを使用.

    エディタで hoge.cuのようなファイル名で保存.

  4. ビルドと実行.

    「nvcc hoge.cu」で a.out というファイルができる. それを実行して, 「Max error: ...」のように表示されればOK.


NVIDIA cuDNN のインストール

NVIDIA 機械学習パッケージレポジトリからダウンロードして,インストールするという手順を説明する.

NVIDIA 機械学習パッケージレポジトリの URL: https://developer.download.nvidia.com/compute/machine-learning/repos/

※ 但し,Ubuntu 20.04 などは, NVIDIA CUDA パッケージレポジトリでの公開が行われていない(2020/06時点)ので, 別の手順でインストールする.

Ubuntu 20.04 の場合

  1. NVidia の cuDNN のウェブページを開く

    https://developer.nvidia.com/cuDNN

  2. ダウンロードしたいので,cuDNNのところにある「Download cuDNN」をクリック.

    [image]
  3. メンバーシップに入る

    [image]
  4. ログインする

    [image]
  5. 調査の画面が出たときは,調査に応じる

    [image]
  6. ライセンス条項の確認

    [image]
  7. ダウンロードしたいバージョンを選ぶ

    ファイルを選ぶときの注意点:

    まず,「Archived cuDNN Releases」をクリック.

    [image]

    先ほど CUDA 10.1 をインストールしたので, CUDA 10.1 に合うものを選ぶ.

    [image]
  8. Linux 版が欲しいので Linux 版を選ぶ

    [image]
  9. ダウンロードした .tgz ファイルを展開(解凍)する.

    次のように操作する.

    cd /usr/local
    sudo tar -xvzof <ダウンロードしたディレクトリ>/cudnn-10.1-linux-x64-v7.6.5.32.tgz 
    
  10. 展開の結果 cuda という名前のディレクトリができる.その中のサブディレクトリを確認しておく.
    ls -al /usr/local/cuda
    

    [image]
  11. /usr/lib64 下にシンボリックリンク

    スーパーユーザで、次のコマンドを実行

    cd /usr/lib64
    for i in /usr/local/cuda/lib64/*; do echo $i; sudo ln -s $i .; done
    
  12. 「sudo /sbin/ldconfig」の実行
    sudo /sbin/ldconfig 
    

Ubuntu 18.04 の場合

  1. NVIDIA 機械学習パッケージレポジトリで,ファイル名を確認

    NVIDIA 機械学習パッケージレポジトリの URL: https://developer.download.nvidia.com/compute/machine-learning/repos/

    Ubuntu 18.04 の場合は,https://developer.download.nvidia.com/compute/machine-learning/repos/ubuntu1804/x86_64/ で確認.

    スクロールして「nvidia-machine-learning-repo ・・・」を探す

  2. NVIDIA 機械学習パッケージレポジトリを,Ubuntu システムに追加する操作

    いま確認したファイル名のファイルを追加

    cd /tmp
    wget https://developer.download.nvidia.com/compute/machine-learning/repos/ubuntu1804/x86_64/nvidia-machine-learning-repo-ubuntu1804_1.0.0-1_amd64.deb
    sudo dpkg -i nvidia-machine-learning-repo-ubuntu1804_1.0.0-1_amd64.deb
    sudo apt-key adv --fetch-keys http://developer.download.nvidia.com/compute/machine-learning/repos/ubuntu1804/x86_64/7fa2af80.pub
    sudo apt-get update
    
  3. パッケージ名の確認
    apt-cache search cudnn
    

  4. いま確認したパッケージ名を追加位,NVIDIA cuDNN のインストール
    sudo apt -yV install libcudnn7 libcudnn7-dev
    
  5. インストールされたパッケージの確認
    dpkg -l | grep cuda 
    

NVIDIA NCCL, TensorRT のインストール

  1. パッケージ名の確認
    apt-cache search nccl 
    apt-cache search tensorrt
    

  2. NVIDIA NCCL, TensorRT のインストール

    端末で,次のコマンドを実行.

    sudo apt -yV install libnccl2 libnccl-dev
    sudo apt -yV install libnvinfer7 python3-libnvinfer
    
  3. インストールされたパッケージの確認
    dpkg -l | grep cuda 
    


本サイトは金子邦彦研究室のWebページです.サイトマップは,サイトマップのページをご覧下さい. 本サイト内の検索は,サイト内検索のページをご利用下さい.

問い合わせ先: 金子邦彦(かねこ くにひこ) [image]