GPUeater 저렴한 GPU 서버 대여 생활

일상생활에서 Colaboratory와 GPU가 있는 데스크톱은 문제없습니다.
갑자기 서비스를 세상에 내놓으려고 AWS에서 GPU가 있는 서버의 가격을 찾아봤는데 2200달러(약 24만 엔/월)라고 적혀 있었어요. 이렇게 될 거예요.
이들을 위해 GPU가 있는 임대 서버를 저렴한 가격에 제공하는 GPUeater 서비스가 있어 조사를 진행했다.

GPUeater란 무엇입니까?

  • 머신러닝에 가장 적합한 차세대 GPU 클라우드에서 AMD사가 제조한 GPU를 이용하여 GPU 인스턴스를 저렴한 가격에 이용할 수 있음
  • MIOpen이라고 불리는 이 회사가 제조한 라이브러리를 사용하여 TensorFlow를 비롯한 DeepLearning의 주요 라이브러리는 AMD사 소비자를 위한 저렴한 GPU로 처리할 수 있음
  • 가장 싸면 7500엔/월 임대 가능!
  • 비용 체계



    비용도 AWS의 p3.2xlarge(\$2203/m)와 GPUeater의 a1입니다.vegafe(\$443/m)와 비교하면 약 5분의 1은 상당히 실속 있다.
    그리고 디스크 용량과 네트워크 사용도 모두 포함되어 있습니다 (대단합니다!)

    GPUeater의 이점

  • 예전처럼 케라스 등으로 쓴 코드는 그대로 움직인다.
  • 인스턴스를 시작하면 tensorflow와 Keras 등 라이브러리를 즉시 사용할 수 있습니다.
  • 버튼 하나로 실례를 시작할 수 있기 때문에 여러 대의 실험도 간단하다

  • 참고) AMD의 경우 CUDA가 움직이지 않으므로 ROCm, MIOPEN, OpenCL을 대체하여 평소처럼 사용할 수 있습니다.

    인스턴스 사용

  • Name: a1.rx580
  • Device: Radeon RX 580 (8G)
  • Image: AMD-ROCm1.9.224+Tensorflow1.10 Ubuntu 16.04
  • 월액 비용:\$249/m(\$0.3458/h)
  • 실험


    HOME 디렉토리 바로 아래에 샘플이 있는 것 같습니다.
    Keras에서 example의 CIFAR-10을 실행했습니다.
    cd ~/keras_examples
    python3 cifar10_cnn.py # python3で実行することに注意
    
  • 실행 로그
  • Epoch 2/100
    1563/1563 [==============================] - 18s 11ms/step - loss: 1.5784 - acc: 0.4227 - val_loss: 1.3769 - val_acc: 0.5038
    Epoch 3/100
    1563/1563 [==============================] - 18s 11ms/step - loss: 1.4636 - acc: 0.4702 - val_loss: 1.2625 - val_acc: 0.5493
    Epoch 4/100
    1563/1563 [==============================] - 18s 11ms/step - loss: 1.3785 - acc: 0.5021 - val_loss: 1.2003 - val_acc: 0.5728
    Epoch 5/100
    1563/1563 [==============================] - 18s 11ms/step - loss: 1.3043 - acc: 0.5330 - val_loss: 1.2369 - val_acc: 0.5556
    Epoch 6/100
    1563/1563 [==============================] - 18s 11ms/step - loss: 1.2472 - acc: 0.5545 - val_loss: 1.1846 - val_acc: 0.5859
    Epoch 7/100
    
    현재 GPU의 사용 상태를 확인하려면 watch -n 5 rocm-smi 괜찮은 것 같습니다.
    (NVIDIA에서 말한nvidia-smi 명령은 AMD에서rocm-smi
    ====================    ROCm System Management Interface    ====================
    ================================================================================
     GPU  Temp    AvgPwr   SCLK     MCLK     Fan      Perf    SCLK OD    MCLK OD  USED MEM
      0   55c     N/A      1380Mhz  2000Mhz  36.86%   auto      0%         0%       7773MB
    ================================================================================
    ====================           End of ROCm SMI Log          ====================
    

    기준


    Keras에서 구한 CIFAR10의 문제를 바탕으로 각 실례의 성능을 비교하였다.
    Name
    ms/step(DA 포함)
    DA 없음
    NVIDIA GeForce GTX1080Ti(참조)

    130
    AMD Radeon RX 580 (8GB)
    십일
    291
    AMD Radeon RX Vega 56 (8GB)

    195
    AMD Radeon Vega Frontier Edition (16GB)

    190
    ※ DA: Data Augmentation
    역시 NVIDA만이 주요한 부분입니다. 최적화가 진행되고 있습니다. 고속 운행.
    그러나 AMD Radeon RX580(월 27000엔 안팎)이라도 고속 운행으로 성가비가 상당히 높다.

    감상

  • AMD에서 GPU를 사용하여 기계 학습을 하기 위해서는 특수 처리가 필요하다고 생각하지만 적어도 Keras를 사용하는 부분은 의식하지 않아도 된다.
  • GPU 서버를 저렴하게 빌릴 수 있기 때문에 평소 PC로 사용해도 좋다.
  • 인터넷 비용과 디스크 용량은 만화의 가격으로 매우 수지가 맞는다.
  • 좋은 웹페이지 즐겨찾기