Amazon SageMaker RL에 대해 살펴보았습니다.

이 기사는 주식회사 지식 커뮤니케이션이 운영하는 Amazon AI by 날레콤 Advent Calendar 2018의 11일째 기사가 됩니다.

Amazon SageMaker는 AWS에서 제공하는 Machine Learning 모델의 구축, 교육 및 배포를 다루는 완전 관리형 기계 학습 서비스입니다.
이번에는 SageMaker의 새로운 기능인 Amazon SageMaker RL에 대해 소개합니다.
Amazon SageMaker RL은 Reinforcement Learning의 약자로 강화 학습을 의미합니다.



강화 학습이란?



기계 학습은 크게 「교사 있어 학습」 「교사 없음 학습」이라고 이번 소개하는 「강화 학습」의 3개로 분류할 수 있습니다.

「교사 있어 학습」은 예를 들면 일기 예보로 내일의 날씨는 어떻게 될까? 등의 기초가 되는 정보 입력으로부터 「분류」나 「예측」을 하는 방법입니다.
예: 회귀 분석

「교사 없음 학습」은 말 그대로, 정답이 되는 결과가 없는 것을 가리킵니다.
예를 들면 과거의 구입 이력으로부터 구입자의 그룹핑을 할 때에 구입 이력을 정보 입력해, 출력은 그룹핑이 됩니다만 정답이 있는 것은 아니기 때문에 가까운 구입자를 그룹핑 했을 뿐입니다.
예: 클러스터링

「강화학습」은 상기의 2개와는 달리, 행동한 결과를 바탕으로 학습한다는 생각이 됩니다.
명확한 데이터를 바탕으로 한 학습이 아니라 주어진 환경을 관측하고 행동하여 그 결과에 대해 좋고 나쁜 것을 판단합니다.
그 좋고 나쁜 것으로부터 가치가 극대화하는 행동을 선택, 평가를 갱신해 갑니다.
최근에는 장기나 바둑의 세계에서 유명 기사 대 AI 등이 행해지고 있습니다만 여기서 사용되고 있는 기계 학습도 강화 학습입니다.

강화 학습에 대해서는 아래의 사이트를 알기 쉬웠습니다.
【참고 URL】
강화 학습이란? ALPHAGO에서도 사용되는 강화 학습을 정중하게 해설

Amazon SageMaker RL 정보



Amazon SageMaker RL은 Amazon SageMaker와 마찬가지로 Jupyter notebook 컬렉션을 제공하며 Github에서 사용할 수 있습니다.
간단한 examples부터, 보다 고도의 로보틱스, 금융 등 다양한 업종의 것까지 폭넓게 제공되고 있는 것도 특징입니다.

또 강화 학습에서는 시뮬레이션은 CPU, 학습은 GPU라고 하는 사용방법을 하는 경우가 많습니다만, Amazon SageMaker RL에서는 상황에 맞추어 유연하게 스케일 할 수 있는 것도 큰 이점입니다.

Amazon SageMaker RL은 AWS 서비스와도 연계



Amazon SageMaker RL은 AWS RoboMaker(AWS가 제공하는 AI 로봇카 'AWS DeepRacer' 등의 지능 로봇 애플리케이션을 쉽게 개발, 테스트, 배포할 수 있는 서비스)와 Amazon Sumerian(가상 현실(VR), 증강 현실(AR), 그리고 3D 애플리케이션을 신속하게 개발할 수 있는 AWS 서비스) 시뮬레이터와도 연동됩니다.

【참고 URL】
Amazon SageMaker RL – Amazon SageMaker를 사용하여 관리되는 강화 학습

사이고에게



Amazon SageMaker RL은 도쿄 리전에서도 즉시 사용할 수 있습니다.
또한 Amazon SageMaker는 이번에 소개한 강화 학습 이외에도 다양한 업데이트가 되었습니다.
꼭 이것을 기회에 기회 학습을 만져보세요!

좋은 웹페이지 즐겨찾기