「현장에서 사용할 수 있다! TensorFlow 개발 입문」책의 검증용 GCP 환경 구축(병아용)

현장에서 사용할 수 있다! TensorFlow 개발 입문 책을 읽으면서 심층 학습 모델을 만드는 방법을 배우고 있습니다.

보충 자료에 GCP의 환경 구축의 순서와 스크립트가 있습니다만, 이 녀석을 진행해 나가면 nvidia-docker 커멘드로 다음의 에러에 부딪쳐 버렸습니다😭
docker: Error response from daemon: create nvidia_driver_440.33.01: VolumeDriver.Create: internal error, check logs for details.

GCP & Docker 도 아마추어의 나에게는, 무슨 ここです 🙄

하지만 다행히 NVIDIA 속의 사람이 NVIDIA Docker는 지금 어떻게됩니까? 라는 기사를 써 주었던 덕분에 샘플이 동작하는 환경을 구축할 수 있었습니다 🙇‍♂️

똑같이 주저하는 사람도 있을지도 모르기 때문에, 순서의 메모를 남겨 둡니다.

1. 우선 보충 자료에 따라 환경 구축



위의 오류가 발생할 때까지 환경을 구축하십시오.
Docker 19.03이 설치된 상태여야 합니다.

2.Docker 19.03 이후의 환경에서 전만을 보고 살아



NVIDIA의 사람 기사에서 Docker 19.03을 가정한 절차를 수행합니다.

2.1. 최신 NVIDIA 드라이버 설치



아래 링크처에 표시되는 순서를 그대로 실행합니다.

2.2.nvidia-container-toolkit 패키지 설치



아래 링크 섹션QuickStart > Ubuntu 16.04...의 단계를 그대로 수행합니다.

3.Docker 시작



보충 자료에 있는 nvidia-docker run 대신 일반 docker run를 사용합니다. 이 때 옵션 --gpus all을 추가하여 실행합니다.
$ sudo docker run --gpus all --rm --name tfbook -p 80:8888 -p 6006:6006 -v /notebooks:/notebooks tfbook

시도



Chapter.11의 샘플을 움직여 보았습니다.



그래, 차분히 학습이 진행되고있는 것처럼 보인다 ...! !

덤?



GCP에서 GPU가 있는 VM 인스턴스를 만드는 경우 사용 제한을 해제(할당)해야 합니다. .
Quota 'GPUS_ALL_REGIONS' exceeded. Limit: 0.0 globally.

그리고, 책에는 GCP의 GPU 사용은 무료 크레딧의 대상외~같은 것이 써 있었습니다만, 사용할 수 있게 되어 있는 생각이 든다. . .

좋은 웹페이지 즐겨찾기