[배포] Docker

Achievement Goals

  • 컨테이너 기술이 무엇인지, 도커가 왜 필요한지 알 수 있다.
  • 컨테이너와 이미지, 레지스트리가 무엇인지 이해할 수 있다.
  • 대표적인 레지스트리인 Docker Hub에서 이미지를 검색하고, 사용할 수 있다.
  • 한 개의 이미지를 이용해서 컨테이너를 구축할 수 있다.
  • 두 개 이상의 이미지를 이용해서 컨테이너를 구축하고 서로가 어떻게 연결되는 지 알 수 있다.
  • Docker CLI에서 명령어를 사용해서 이미지를 생성/수정/배포하고, 컨테이너를 생성/삭제할 수 있다.

Docker?


컨테이너

부산항, 인천항과 같은 무역항 근처를 지나가다 보면 가장 흔히 볼 수 있는 풍경 중 하나는, 대형 트럭이 컨테이너를 싣고 부두를 왔다 갔다 하는 장면일 것이다. 이러한 컨테이너는 대형 화물선에 실려서 다른 무역항으로 이동하게 된다.

이 컨테이너라는 게 생긴 뒤로, 물류에는 혁신이 일어나게 되었다. 그럼 컨테이너가 있기 전엔 어떻게 물자를 날랐을까? 컨테이너를 이용하기 전 한국 전쟁 당시의 사진을 한번 보자. 컨테이너의 장점이 보다 뚜렷해진다.

위 사진으로도 짐작할 수 있듯, 컨테이너는 장점이 많다.

  • 물자를 싣고 내릴 때에, 선박이 입항해 있는 시간을 획기적으로 단축시켜준다
  • 물자를 싣고 내릴 때 필요한 인력(분류하는 사람, 짐 옮기는 사람, 감독하는 사람)을 대폭 감소시킨다

개발자들은 이와 같이 물자의 수송에 획기적인 단축을 가져다준 컨테이너 기술을 "소프트웨어 수송, 즉 배포에 사용할 수는 없을까?" 하는 생각을 하기 시작했고, 그 결과로 리눅스 컨테이너(lxc)라는 것을 만들어냈다.

리눅스 컨테이너 기술은 그 자체로 훌륭하고 완성된 기술이었지만, 애플리케이션을 쉽게 컨테이너화할 수 있는 생태계 혹은 커뮤니티가 없었다. 하지만 2013년에 도커(Docker) 가 등장하면서 Docker Hub라는 소프트웨어 저장소와 함께 빠르게 성장했고, 그 결과 개발자들은 쉽게 애플리케이션을 포장하고, 컨테이너 방식으로 실행할 수 있게 되었다.

컨테이너 방식의 장점

컨테이너 기술의 장점은 한마디로 얘기하면 다음과 같다.
실행 환경에 구애받지 않고 애플리케이션을 실행할 수 있다!
이는 달리 얘기하면, 애플리케이션 실행이 어떠한 환경에 구애를 받는다는 말이기도 하다.

① 의존성 충돌 문제를 해결해 준다

어떤 애플리케이션은, 해당 애플리케이션을 실행하기 위해 반드시 어떤 환경이 구축되어 있어야 한다. 예를 들어 윈도우용 프로그램을 실행하려면 윈도우 운영체제가 필요한 상황을 말한다.

윈도우에서 어떤 애플리케이션을 설치하다 보면, .NET Framework를 설치해야 한다는 문구를 종종 볼 수 있다.

우리는 이와 같이 어떤 프로그램(A) 실행에 다른 프로그램(B)이 반드시 필요한 경우, "프로그램 A는 프로그램 B에 의존 관계를 가지고 있다"고 말한다.

또한, 이런 경우도 발생한다.

예를 들어, 워드프레스(wordpress)라는 프로그램이, php라는 프로그램에 대해 의존 관계를 가질 때에, 특정 php 버전을 요구하는 경우가 생길 수 있다.

그런데 동일한 컴퓨터에 php를 반드시 필요로 하는 drupal이라는 프로그램을 실행시켜야 하는데, 만일 drupal이 php 7 버전이 아닌 6 버전을 사용할 때에만 제대로 작동한다고 가정해보자.

일반적으로 한 컴퓨터에 여러 버전의 동일한 애플리케이션이 설치되지 않으므로, 이 경우에는 php의 의존 관계를 가지고 있는 다른 두 애플리케이션 중에 하나는 제대로 된 실행을 보장할 수 없다.

이런 상황을 우리는 "의존성이 충돌한다"라고 말한다

컨테이너 기술은 바로 이 문제를 해결한다. 컨테이너 기술은 애플리케이션을 컨테이너 내에 구성한다. 즉, 컨테이너에서 실행 중인 애플리케이션은 어떠한 의존성도 공유하지 않고, 각자 고유의 의존성을 포함하고 있다는 이야기다.

이는 각 컨테이너가 철저하게 실행 환경이 격리되어 있기 때문에 가능하다.

컨테이너는 무엇을 격리할까?

컨테이너 기술을 바탕으로 한 컴퓨터 안에 여러 대의 컨테이너가 존재하고, 이를 통해 애플리케이션 실행 환경이 격리된다.

하나의 컴퓨터 내에 서로 다른 버전의 php가 설치될 수 있는 것은, 컨테이너 하나하나가 애플리케이션 실행과 관련해서 높은 수준의 격리를 제공하기 때문이다.

그렇다면, 컨테이너는 무엇을 격리하고, 어떤 자원들을 독립적으로 소유할까? 아래 세 가지가 기억해야할 요점이다.

프로세스

  • 특정 컨테이너에서 작동하는 프로세스는 기본적으로 그 컨테이너 안에서만 액세스 할 수 있다.
  • 컨테이너 안에서 실행되는 프로세스는 다른 컨테이너의 프로세스에게 영향을 줄 수 없다.

네트워크

  • 기본으로 컨테이너 하나에 하나의 IP 주소가 할당되어 있다.

파일 시스템

  • 컨테이너 안에서 사용되는 파일 시스템은 구획화되어 있습니다. 그래서 해당 컨테이너에서의 명령이나 파일 등의 액세스를 제한할 수 있다.

② 개발과 배포 환경을 일치시킨다


개발팀의 문제

Node.js나 Python 등을 이용하여 웹 서비스를 개발하는 개발팀을 상상해보자.

특정 버전 이상의 Node.js, 특정 버전의 MySQL 등을 개발자 각자가 본인의 운영체제에 설치하고, 그 후에 개발을 진행하게 되는데, 하지만 보통의 경우 그 과정이 빠르게 진행되지 않는다.

애플리케이션을 실행시키기 위해 OS나 Node.js나 Python과 같은 런타임 환경의 버전을 얼추 비슷하게 맞춰야 하는 것은 물론이고, 시스템 환경 변수를 애플리케이션에 맞게 구성해야 제대로 작동하는 경우도 종종 볼 수 있다.

리눅스만 하더라도, 아래처럼 배포판에 따라 전혀 다른 애플리케이션 설치 과정이 진행된다.


  • Ubuntu PostgreSQL 설치
sudo sh -c 'echo "deb http://apt.postgresql.org/pub/repos/apt $(lsb_release -cs)-pgdg main" > /etc/apt/sources.list.d/pgdg.list'
wget --quiet -O - https://www.postgresql.org/media/keys/ACCC4CF8.asc | sudo apt-key add -
sudo apt-get update
sudo apt-get -y install postgresql
  • Ubuntu PostgreSQL 설치
sudo dnf install -y https://download.postgresql.org/pub/repos/yum/reporpms/EL-8-x86_64/pgdg-redhat-repo-latest.noarch.rpm
sudo dnf -qy module disable postgresql
sudo dnf install -y postgresql14-server
sudo /usr/pgsql-14/bin/postgresql-14-setup initdb
sudo systemctl enable postgresql-14
sudo systemctl start postgresql-14

이러한 과정 중에 발생하는 사소한 실수나 사전 설치 항목의 부재는 문제 해결에 많은 시간을 소모하게 한다. 특히 새로운 프로젝트에 투입되는 개발자의 경우, 그저 애플리케이션을 돌리고 싶었을 뿐인데, 그 길까지 가는 과정이 매우 험난할 수 있다.

하지만 도커가 이러한 문제를 해결해준다. 도커가 실행 중이라면, 어떠한 운영체제든 상관없이 다음 명령어로 즉시 PostgreSQL을 설치하고 실행할 수 있다.

docker run --name postgres -e POSTGRES_PASSWORD=mysecret -d postgres

따라서 도커는 다음 문제를 해결할 수 있다.

  • OS에 상관없이 즉시 애플리케이션 실행 환경을 만들 수 있다.
  • 개발을 컨테이너 위에서 진행할 경우, 모든 개발팀이 동일한 환경 하에 개발을 진행할 수 있다.

배포 시의 문제 해결

실행 및 개발 환경의 일치 이슈는 서비스 배포 환경에서도 동일하게 적용될 수 있다. 웹서비스의 배포란 "어떤 애플리케이션이 특정 런타임 환경 위에서 실행되고, 사용자에게 이를 제공한다." 라는 것인데, 이는 앞서 말한 실행 환경 구성과 본질적으로 다를 것이 없기 때문이다. 서비스를 인터넷 상에 공개적으로 노출하느냐 or 내 컴퓨터 상에서 프라이빗하게 작동하느냐의 차이일 뿐이다.

과거에는 서버에 파일 하나하나를 업로드 하는 방식을 사용했지만, 이제는 서버도 컨테이너에 담긴 애플리케이션을 실행하는 방식으로 서비스를 제공한다.

AWS의 EC2 상에 도커를 설치하거나, 또는 좀 더 편리하게 도커 컨테이너를 EC2 서버에서 실행할 수 있게 하는 서비스인 ECS를 이용하여 보다 쉽게 애플리케이션을 배포할 수 있다.

  • AWS ECS라는 서비스는 애플리케이션을 도커 컨테이너째로 배포할 수 있게 해준다.

③ 수평 확장을 쉽게 해준다, ④ 각 서버에 새로운 내용을 배포하기 쉽게 만들어준다

우리가 매일같이 사용하는 글로벌 웹서비스는 전 세계인들이 사용하므로 트래픽이 어마어마하다. 예를 들어, 지금 이 시간에도 전 세계의 수많은 사람들이 google.com에 접속할 텐데, 과연 수많은 사람들이 검색 서버라는 단 하나의 컴퓨터에 접속하는 걸까?

그렇지 않다. 서비스 제공자들은 이런 트래픽 분산을 위해 프록시 서버를 운영하며, 프록시 서버는 여러 대의 동일한 검색 서버 중 한 군데를 이용할 수 있도록 돕는다.
(이런 서버를 리버스 프록시의 한 종류인 '로드 밸런서'라고 부른다.)

"동일한 서비스가 여러 컴퓨터에서 작동한다"라는 말은 도커의 필요성을 더욱 크게 느끼게 해준다.

컨테이너 기술의 가장 큰 장점은 실행 환경의 일치이다.

더 많은 트래픽으로 인한 서버 증설에 컨테이너 기술은 아주 활발하게 이용되고 있다. 동일한 애플리케이션 구성(이미지)을 바탕으로 새로운 서버에 해당 애플리케이션을 컨테이너로 실행하고, 로드 밸런서에 이 서버를 추가하기만 하면 된다.

이런 기술을 응용해, 새로운 버전의 애플리케이션을 여러 서버 중 몇 대에만 운영해 테스트하는 방법도 가능하다. 이를 통해 새 버전의 애플리케이션에서 발생할 수 있는 문제들을 미리 확인하고, 이런 문제가 사용자 전체에게 영향을 끼치지 않도록 만들 수도 있다.

쿠버네티스와 같이 "오케스트레이션 도구" 라고 부르는 것들이 이러한 일을 해주는 도구이다. 이는 결국 컨테이너 기술 덕분에 가능한 것이다.

Docker 핵심 키워드


컨테이너

  • 컨테이너는 애플리케이션이 의존성, 네트워크 환경, 파일 시스템에 구애받지 않고, 도커라는 기술 위에 실행될 수 있도록 만든 애플리케이션 상자다.

이미지

  • 이미지는 애플리케이션 및 애플리케이션 구성을 함께 담아놓은 템플릿으로, 이를 이용해 즉시 컨테이너를 만들 수 있다.
  • 실행되는 모든 컨테이너는 이미지로부터 생성된다.
  • 이미지를 이용해 여러 개의 컨테이너를 생성할 수 있다. 이를 이용해 애플리케이션의 수평 확장이 가능하다.
  • 이미지는 기본 이미지로부터 (마치 git을 사용하는 것처럼) 변경 사항을 추가/커밋해서 또 다른 이미지를 만들 수도 있다. 예를 들어, node.js로 작성된 애플리케이션을 이미지로 만들고 싶은 경우, node.js 이미지를 기본 이미지로 삼고 내가 만든 애플리케이션을 추가해 넣어서 이미지화할 수 있다.

레지스트리

  • 이미지는 레지스트리에 저장된다.
  • 대표적인 이미지 레지스트리로는 Docker Hub, Amazon ECR이 있다.
  • 도커 CLI에서 이미지를 이용해 컨테이너를 생성할 때, 호스트 컴퓨터에 이미지가 존재하지 않는다면, 기본 레지스트리로부터 다운로드 받게 된다.

좋은 웹페이지 즐겨찾기