TensorFlow GPU 세팅하기

April 27, 2022 3 분 소요

안녕하세요 마개입니다.
이번에는 NVIDIA 그래픽카드가 달린 PC에 TensorFlow GPU를 세팅해서 사용해 보겠습니다.
업데이트 : 2023.10.09

내 그래픽카드 확인하기

저의 PC 환경은 다음과 같습니다.
OS : Ubuntu 22.04 LTS (Jammy Jellyfish)
그래픽카드 : NVIDIA GeForce RTX 4070 Ti

그래픽카드가 무엇인지 정확하게 모르신다면 아래와 같이 명령어로 확인을 해보시면 됩니다. (Ubuntu 기준입니다.)

$ lspci | grep VGA

저와 같이 위의 명령어를 이용해서 바로 확인이 가능하면 다행인데 만약에 그래픽카드 이름이 잘 안 보이는 경우에는 아래 명령어를 추가로 진행한 후에 다시 명령어를 실행합니다.

$ sudo update-pciids

이렇게 확인이 되면 이제 TensorFlow GPU를 세팅해 보겠습니다.

TensorFlow에서 사용 가능한 디바이스 체크하기

저는 파이썬을 이용해서 머신러닝, 딥러닝을 하는데 파이썬을 이용해서 GPU 세팅이 되어있는지 먼저 확인해 보겠습니다.

from tensorflow.python.client import device_lib

print(device_lib.list_local_devices())

위와 같이 파이썬 코드를 작성하고 실행합니다.

그러면 위와 같은 결과가 나오게 되고 마지막은 다음과 같은 결과를 볼 수 있습니다.

Skipping registering GPU devices...
[name: "/device:CPU:0"
device_type: "CPU"
memory_limit: 268435456
locality {
}
incarnation: 12676874737017668286
xla_global_id: -1
]

이를 통해 아직은 CPU만 사용이 가능한 것을 알 수 있습니다.

NVIDIA GPU 드라이버 설치

위에서 확인했던 나의 NVIDIA 그래픽카드의 종류를 확인하고 NVIDIA 홈페이지에서 드라이버를 다운로드합니다.

NVIDIA 드라이버 다운로드

imagae

각자에 맞는 버전을 세팅하고 검색합니다. 이후에 나오는 결과 파일을 다운로드해서 설치합니다. 설치가 완료되면 다음과 같은 명령어로 설치가 잘 되어있는지 확인합니다.

$ nvidia-smi

위와 같이 잘 뜨는 것을 확인할 수 있습니다. 여기서 봐야 할 것은 CUDA Version인데 저의 경우 12.2로 나와있는 것을 보실 수 있습니다.

CUDA Toolkit 설치

이제 나의 CUDA 버전을 확인하였으니 Toolkit을 설치합시다.

CUDA Toolkit

위의 사이트로 들어가면 굉장히 많은 버전의 CUDA Toolkit이 있는 것을 보실 수 있는데 각자의 CUDA 버전에 맞는 것을 확인하여 다운로드 진행합니다. 저의 경우 12.2.0 버전을 선택하였습니다.

그러면 위와 같이 다음 화면이 나오는데 각자의 환경에 맞게 선택을 합니다. 저의 경우 Ubuntu 22.04를 이용하고 있기 때문에 [Linux] - [x86_64] - [Ubuntu] - [22.04] - [deb(local)] 을 선택하였습니다. 그러면 저의 경우 아래와 같이 명령어 가이드가 나오게 되는데 이를 하나씩 실행하겠습니다.

$ wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/cuda-ubuntu2204.pin
$ sudo mv cuda-ubuntu2204.pin /etc/apt/preferences.d/cuda-repository-pin-600
$ wget https://developer.download.nvidia.com/compute/cuda/12.2.0/local_installers/cuda-repo-ubuntu2204-12-2-local_12.2.0-535.54.03-1_amd64.deb
$ sudo dpkg -i cuda-repo-ubuntu2204-12-2-local_12.2.0-535.54.03-1_amd64.deb
$ sudo cp /var/cuda-repo-ubuntu2204-12-2-local/cuda-*-keyring.gpg /usr/share/keyrings/
$ sudo apt-get update
$ sudo apt-get -y install cuda

설치가 완료되면 다음 단계로 환경 변수를 설정합니다.

CUDA 환경 변수 설정

다음으로는 CUDA에 대한 환경 변수를 설정해야 합니다. 아래와 같이 환경 변수를 설정하도록 합니다.

# sudo vim /etc/profile
$ export PATH=$PATH:/usr/local/cuda-12.2/bin
$ export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-12.2/lib64
$ export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-12.2/include
$ export CUDADIR=/usr/local/cuda-12.2

$ source /etc/profile

다음으로 nvcc 명령어를 통해 CUDA driver 버전을 확인합니다.

$ nvcc -V

cuDNN 설치

CUDA를 설치한 이후에는 cuDNN SDK를 다운로드해야 합니다.

cuDNN SDK 다운로드

위의 사이트로 이동하여 Download cuDNN Library 버튼을 선택합니다.

그러면 위와 같은 화면이 나오는데 회원가입을 합니다. (계정이 이미 있다면 로그인합니다.)

회원가입 후 간단한 설문조사를 한 후 다운로드를 진행합니다. Software License에 대한 동의 여부를 묻는 것에 동의를 체크합니다.

그러면 위와 같이 나오는데 저는 Download cuDNN v8.9.5 [September 12th, 2023], for CUDA 12.x를 선택합니다.

그리고 Local Installer for Linux x86_64 (Tar)를 선택해서 다운로드합니다.

다운로드가 완료되면 압축을 풀고 파일을 복사합니다.

# 압축 해제
$ tar -xf cudnn-linux-x86_64-8.9.5.29_cuda12-archive.tar.xz

# 파일 복사
$ sudo cp cudnn-linux-x86_64-8.9.5.29_cuda12-archive/include/cudnn*.h /usr/local/cuda/include
$ sudo cp cudnn-linux-x86_64-8.9.5.29_cuda12-archive/lib/libcudnn* /usr/local/cuda/lib64

# 권한 변경
$ sudo chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn*

이렇게 파일을 복사했다면 이제 링크를 다시 걸어야 합니다.

$ sudo ln -sf /usr/local/cuda-12.2/targets/x86_64-linux/lib/libcudnn_adv_train.so.8.9.5 /usr/local/cuda-12.2/targets/x86_64-linux/lib/libcudnn_adv_train.so.8
$ sudo ln -sf /usr/local/cuda-12.2/targets/x86_64-linux/lib/libcudnn_ops_infer.so.8.9.5 /usr/local/cuda-12.2/targets/x86_64-linux/lib/libcudnn_ops_infer.so.8
$ sudo ln -sf /usr/local/cuda-12.2/targets/x86_64-linux/lib/libcudnn_cnn_train.so.8.9.5 /usr/local/cuda-12.2/targets/x86_64-linux/lib/libcudnn_cnn_train.so.8
$ sudo ln -sf /usr/local/cuda-12.2/targets/x86_64-linux/lib/libcudnn_adv_infer.so.8.9.5 /usr/local/cuda-12.2/targets/x86_64-linux/lib/libcudnn_adv_infer.so.8
$ sudo ln -sf /usr/local/cuda-12.2/targets/x86_64-linux/lib/libcudnn_ops_train.so.8.9.5 /usr/local/cuda-12.2/targets/x86_64-linux/lib/libcudnn_ops_train.so.8
$ sudo ln -sf /usr/local/cuda-12.2/targets/x86_64-linux/lib/libcudnn_cnn_infer.so.8.9.5 /usr/local/cuda-12.2/targets/x86_64-linux/lib/libcudnn_cnn_infer.so.8
$ sudo ln -sf /usr/local/cuda-12.2/targets/x86_64-linux/lib/libcudnn.so.8.9.5 /usr/local/cuda-12.2/targets/x86_64-linux/lib/libcudnn.so.8
$ sudo ldconfig

디렉터리나 파일명은 각자의 버전에 맞게 변경해서 진행합니다.
제대로 지정이 되었는지 확인해 보겠습니다.

$ ldconfig -N -v $(sed 's/:/ /' <<< $LD_LIBRARY_PATH) 2>/dev/null | grep libcudnn

위와 같이 나왔다면 설정이 된 것입니다.

GPU 확인

이제 다시 처음으로 돌아가 위에서 만들었던 파이썬 코드를 실행해서 결과를 확인해 보겠습니다.

파이썬을 실행하면 위와 같은 화면이 나오고 하단에 다음과 같은 결과가 나온 것을 확인할 수 있습니다.

[name: "/device:CPU:0"
device_type: "CPU"
memory_limit: 268435456
locality {
}
incarnation: 16217097843607302077
xla_global_id: -1
, name: "/device:GPU:0"
device_type: "GPU"
memory_limit: 7994736640
locality {
  bus_id: 1
  links {
  }
}
incarnation: 3263077643678180369
physical_device_desc: "device: 0, name: NVIDIA GeForce RTX 3080, pci bus id: 0000:01:00.0, compute capability: 8.6"
xla_global_id: 416903419
]

이제는 CPU뿐만 아니라 GPU도 정상적으로 나오는 것을 확인할 수 있습니다.

Twitter Facebook LinkedIn

마개

TensorFlow GPU 세팅하기

내 그래픽카드 확인하기

TensorFlow에서 사용 가능한 디바이스 체크하기

NVIDIA GPU 드라이버 설치

CUDA Toolkit 설치

CUDA 환경 변수 설정

cuDNN 설치

GPU 확인

공유하기

참고

[RAG 도전기] RAG 파이프라인 평가 방법

[RAG 도전기] PDF Document Loader 비교해보기

[RAG 도전기] 벡터 데이터베이스란 (Vector Database)

[Airflow] 3.0.0 출시