Linux(Ubuntu/Debian)에 NVIDIA GPU 드라이버 설치

12960 단어 driverlinuxgpunvidia

공식 페이지


  • NVIDIA 드라이버 다운로드: https://www.nvidia.com/Download/Find.aspx?lang=en-us
  • NVIDIA 드라이버 설치: https://docs.nvidia.com/datacenter/tesla/tesla-installation-notes/index.html#runfile
  • NVIDIA 드라이버 구성 지침: https://download.nvidia.com/XFree86/Linux-x86_64/510.47.03/README/installdriver.html
  • NVIDIA 지속성: https://docs.nvidia.com/deploy/driver-persistence/index.html#persistence-daemon
  • NVIDIA 지속형 github: https://github.com/NVIDIA/nvidia-persistenced



  • NVIDIA GPU 드라이버 설치



    Ubuntu/Debian에서 자동 업데이트 비활성화




    # 1. Disable auto-update and auto-upgrade:
    echo 'APT::Periodic::Update-Package-Lists "0";' | sudo tee /etc/apt/apt.conf.d/20auto-upgrades
    echo 'APT::Periodic::Unattended-Upgrade "0";' | sudo tee -a /etc/apt/apt.conf.d/20auto-upgrades
    


    오픈 소스 nouveau 드라이버 비활성화




    # 2. Write blacklist options for the nouveau driver (disable):
    echo "blacklist nouveau" | sudo tee -a /etc/modprobe.d/blacklist-nouveau.conf
    echo "options nouveau modeset=0" | sudo tee -a /etc/modprobe.d/blacklist-nouveau.conf
    
    # 3. Update kernel initramfs for blacklist (modprobe.d) options:
    sudo update-initramfs -u
    


    필수 패키지 설치




    # 4. Clean apt package manager lists and caches:
    sudo rm -vrf /var/lib/apt/lists/* /var/cache/apt/archives/* /tmp/*
    sudo apt-get clean -y
    
    # 5. Updating, indexing, and caching apt package manager app lists:
    sudo apt-get update --fix-missing -o Acquire::CompressionTypes::Order::=gz
    
    # 6. Upgrade and reinstall OS base packages:
    sudo apt-get upgrade -y
    
    # 7. Remove old or unnecessary leftover packages:
    sudo apt-get autoremove -y
    
    # 8. IMPORTANT! Install dkms and base packages:
    sudo apt-get install -y build-essential pkg-config libglvnd-dev mesa-utils wget dkms
    


    현재 NVIDIA GPU 모델에 적합한 Linux 드라이버를 다운로드합니다.


  • 다음 링크에서 확인된 안정적인 최신 NVIDIA GPU 드라이버(NVIDIA-Linux-x86_64-***.run) 설치 프로그램 파일을 검색하고 다운로드합니다. https://www.nvidia.com/Download/Find.aspx?lang=en-us

  • 중요한! .RUN 파일을 다운로드하여 사용하세요! 그것은 정말 중요한 DKMS 모듈과 함께 NVIDIA 드라이버를 설치할 수 있습니다!

  • 중요한! .DEB 파일을 다운로드하거나 사용하지 마십시오! 그것은 특히 커널 헤더/버전/모듈이 업그레이드될 때 결국 커널을 깨뜨릴 것입니다. 따라서 때때로 다른 응용 프로그램 종속성(종속성 지옥)과 충돌합니다...
  • 명령줄 인터페이스를 사용하는 경우 다운로드 링크를 복사하고 wget을 사용하여 다운로드하십시오. 예를 들어:

  • mkdir -v ~/Downloads
    cd ~/Downloads
    
    # 9. (Skip this, if you've already downloaded) Download appropriate Linux driver for current NVIDIA GPU model
    wget https://us.download.nvidia.com/[GPU_MODEL_TYPE_URL]/NVIDIA-Linux-x86_64-[DRIVER_VERSION].run
    # For example:
    wget https://us.download.nvidia.com/XFree86/Linux-x86_64/510.54/NVIDIA-Linux-x86_64-510.54.run
    


    NVIDIA GPU 드라이버를 설치하기 전 준비 단계



    [중요] GUI 환경을 콘솔 환경으로 변경


  • GUI 환경을 사용하지 않고 이미 콘솔 환경 또는 SSH를 사용하고 있는 경우 이 단계를 11로 건너뛰십시오
  • .

  • 팁: 여기에서 콘솔 환경으로 들어가게 되므로 명령줄에서 읽거나 어딘가에 메모하려면 일부 텍스트 파일에 아래 명령을 적어야 합니다!
  • Ctrl + Alt + F1/F3 키보드 버튼을 눌러 GUI 환경을 가상 콘솔 환경으로 변경할 수 있습니다.
  • 또는 다음 Linux 명령을 입력합니다.

  • # 10. IMPORTANT! Entering into virtual console environment:
    sudo chvt 1
    # Or:
    sudo chvt 3
    


  • 콘솔 환경에 로그인하려면 사용자 이름과 암호를 입력하십시오
  • .

    NVIDIA GPU 드라이버 설치를 준비하기 위해 GUI 프로세스를 중지합니다.




    # 11. Stop GUI service (lightdm/gdm/gdm3/kdm/slim/etc..):
    sudo service lightdm stop
    # Or:
    sudo service gdm stop
    # Or:
    sudo service gdm3 stop
    
    # 12. Initialize and refresh console environment without X11 (GUI) processes:
    sudo init 3
    
    # Change directory to NVIDIA-Linux-x86_64-***.run driver downloaded directory. For example:
    cd ~/Downloads
    
    # 13. Change permission of NVIDIA-Linux-x86_64-***.run driver installer file to executable:
    chmod +x ./NVIDIA-Linux-x86_64-[DRIVER_VERSION].run
    # For example:
    chmod +x ./NVIDIA-Linux-x86_64-510.54.run
    


    NVIDIA driver.run 파일 설치



  • 중요한! (--dkms) 향후 커널 업그레이드를 위해 Nvidia 드라이버를 DKMS에 등록합니다.

  • 중요한! (--no-x-check) 드라이버를 설치하는 동안 X11(GUI) 프로세스가 트리거되지 않도록 X11 구성 검사기를 비활성화합니다.

  • 중요한! (--no-cc-version-check) DKMS C/C++ 버전이 현재 설치된 C/C++ 버전과 일치하지 않을 때 설치 오류가 발생하지 않도록 C/C++ 버전 검사기를 비활성화하십시오!

  • # 14. IMPORTANT! Install nvidia driver with appropriate arguments:
    sudo ./NVIDIA-Linux-x86_64-[DRIVER_VERSION].run --no-x-check --no-cc-version-check --dkms
    # For example:
    sudo ./NVIDIA-Linux-x86_64-510.54.run --no-x-check --no-cc-version-check --dkms
    


  • 경고 메시지에서 '설치 계속'을 선택합니다.

  • 중요한! DKMS 커널 모듈의 등록은 '예'를 선택합니다.
  • 32비트 호환성 설치의 경우 '아니요'를 선택하거나 32비트 호환성 오류가 나타나면 '확인'을 선택합니다.

  • 중요한! X 구성 파일을 자동으로 업데이트할지 묻는 메시지가 표시되면 '아니오'를 선택하십시오.

  • # 15. Remove downloaded file:
    rm -vf ./NVIDIA-Linux-x86_64-[DRIVER_VERSION].run
    # For example:
    rm -vf ./NVIDIA-Linux-x86_64-510.54.run
    
    # 16. Reboot system:
    sudo shutdown -r now
    
    # 17. Check nvidia driver is installed:
    nvidia-smi
    


    설치 후



    [ML/DL 서버 전용] nvidia-persistence 모드 데몬 설정



    권장되지 않음: X11/Wayland 프로세스(GUI 렌더링용)에서 사용되는 GPU입니다.

    # Install git to clone:
    sudo apt-get install -y ssh git
    
    # Download nvidia-persistenced source code from github:
    git clone https://github.com/NVIDIA/nvidia-persistenced.git
    
    # Install nvidia-persistenced service daemon:
    cd nvidia-persistenced/init
    sudo ./install.sh
    
    # Remove downloaded files:
    cd ../.. && rm -rf nvidia-persistenced
    
    # Check nvidia-persistence mode is ON:
    nvidia-smi
    # Or check nvidia-persistenced.service is running:
    systemctl status nvidia-persistenced.service
    


    👍 ✨

    설치 완료




    [선택 사항] NVIDIA GPU 모니터링 도구 설치



    🌟📡 엔비탑




    # Install python3 and pip3 packages:
    sudo apt-get install -y python3 python3-pip
    
    # Install nvitop into system python3 packages:
    sudo pip3 install nvitop
    
    # Check nvitop:
    nvitop -m full
    


  • https://pypi.org/project/nvitop
  • https://github.com/XuehaiPan/nvitop

  • 📊 엔비탑




    # Install cmake, ncurses and git:
    sudo apt-get install -y cmake libncurses5-dev libncursesw5-dev
    
    # Download nvtop source code from github:
    git clone https://github.com/Syllo/nvtop.git
    mkdir -vp nvtop/build && cd nvtop/build
    
    cmake ..
    # If it errors with "Could NOT find NVML (missing: NVML_INCLUDE_DIRS)"
    # try the following command instead, otherwise skip to the build with make:
    #cmake .. -DNVML_RETRIEVE_HEADER_ONLINE=True
    
    make
    sudo make install
    
    # Remove downloaded files:
    cd ../.. && rm -rf nvtop
    
    # Check nvtop:
    nvtop
    


  • https://github.com/Syllo/nvtop



  • NVIDIA 드라이버를 최신 버전으로 다시 설치하거나 업그레이드하십시오.



    DKMS NVIDIA 모듈 제거



    DKMS와 함께 NVIDIA 드라이버를 설치하지 않은 경우 이 단계를 건너뜁니다.

    # Check current dkms nvidia modules, versions, and kernels:
    # [TIP]: Use module versions to remove.
    dkms status | grep nvidia
    
    # Remove old dkms nvidia module/version:
    sudo dkms remove nvidia/[DRIVER_VERSION] --all
    # For example:
    sudo dkms remove nvidia/510.54 --all
    


    nvidia-persistenced 서비스 데몬 비활성화



    nvidia-persistenced 데몬을 설정하지 않은 경우 이 단계를 건너뜁니다.

    # Stop and disable nvidia-persistenced service daemon:
    sudo systemctl stop nvidia-persistenced.service
    sudo systemctl disable nvidia-persistenced.service
    


    모든 nvidia-* 패키지 제거




    sudo apt-get remove --purge '^nvidia-.*'
    # Or:
    sudo nvidia-uninstall
    
    # Reboot system:
    sudo shutdown -r now
    


    최신 NVIDIA 드라이버 버전 설치



    NVIDIA 드라이버 다시 설치(처음부터 시작): #install-nvidia-gpu-driver

    좋은 웹페이지 즐겨찾기