DQ응 - 훌륭한 개발자 블로그

LIS ver.2를 넣어 사용해보기

이 정보는 오래되었으므로 현재 LIS ver.2에 적합하지 않을 수 있습니다. 과거 12회로 PC를 자작한 후, Ubuntu 14.04, CUDA, cuDNN, chainer, dqn, LIS, Tensorflow, OpenAIGym을 순차적으로 인스톨 해, 몇개의 모델을 달렸다. 이번은 도완고 씨의 LIS의 버젼 2를 인스톨 해, 사용해 본다. 코드는 이쪽의 pull request에 있다....

DQ응ChainerDeepLearninglis우분투14.04

Model-Free Episodic Control 모델로 학습해보기

과거 11회로 PC를 자작한 후, Ubuntu 14.04, CUDA, cuDNN, chainer, dqn, LIS, Tensorflow, OpenAIGym을 순차적으로 인스톨 해, 몇개의 모델을 달렸다. 특히 전회는 Pseudo-count를 학습시키기 위해 진행했지만, dependencieses의 인스톨에 있어서 opencv3가 잘 인스톨할 수 없어, 좌절하고 있다. Frank He(Shib...

우분투14.04OpenAIDeepLearningDQ응

DQN 학습 속도 향상

이 기사는 의 21 일째 기사입니다. 이 기사에서는 기계 학습에서 사용되는 DQN에 대해 학습 속도 개선 방법을 다루고 싶습니다. 소재로서 에서 다루어지고 있는 카드 편성 문제를 DQN로 해결하는 과제를 고속화해 봅니다. Original에서는 대략 전승하기 위해 20000회 정도의 시도가 필요했습니다. Original에서 어떻게 개선했는지 Original에서는 신경망에 현재 어느 덱을 선택하...

DQ응강화 학습chainerRLMachineLearning기계 학습

기계 학습의 이론을 이해하려고 하고 나서 오셀로 AI 를 만들어 보았다 ~ 재시동! ~

기계 학습의 이론을 이해하려고 하고 나서 오셀로 AI 를 만들어 보았다 ~ 재시동‼ ~ 이 분야에서는 문외한의 내가 '기계학습의 이론'을 전혀 공부하지 않고 오셀로의 AI를 만들어 보았습니다만, 결과 참패였습니다. 당신이 없기 때문에 기계 학습을 공부하려고합니다. 오셀로 AI에 관해 내가 이해할 수 있는 책은 단지 이것뿐이었다. 이 책의 제 6 장 강화 학습 - 세 번째 나란히 강한 컴퓨터를...

DQ응강화 학습파이썬ChainerDeepLearning

Dueling Network 구현 (2)

GPU GTX1070 우분투 14.04 chainer 1.14.0 Deuling Network의 코드를 구현하는 두 번째. 전회는 chainer/functions/connection/bilinear.py를 확인했다. 이번에는 그것을 근거로 forward()와 backward()를 변경해 나간다. 우선 순전파의 계산을 변경한다. 개요는 다음과 같습니다. Numpy의 브로드캐스트라는 구조를 사용...

DQ응ChainerDeepLearningpython2.7numpy

【등단의 고지】iOSDC2018에 「iOS와(심층) 강화 학습」이라고 하는 타이틀로 등단합니다

안녕하세요, 입니다. 2018년 8/30-9/2에 개최되는 에 「iOS와(심층) 강화 학습」이라고 하는 타이틀로 등단하므로, 이쪽에서 고지하겠습니다. 등단은 8/31(금)의 16:00부터 30분간입니다. 장소는 Track B입니다. 이번 발표에는 테마가 있습니다. 그것은, "iOS에 심층 강화 학습은 구현할 수 있을까?" 입니다. Apple이 제공하는 머신러닝 프레임워크는 예측이 가능하지만 ...

iOSDQ응강화 학습Swift심층 강화 학습