AI에게 CartPole 게임을 즐겼다.
AI에게 CartPole 게임을 즐겼다.
배경
FAQ 봇에 관해서, 「유익한가?」의 질문으로, 여러분의 Yes/No의 응답에 의해, 보다 응답의 정밀도를 올리고 싶다.
강화 학습은 상기를 대응할 수 있을 것 같다. 현재는 그 중 하나의 수법(Deep Q-learning)을 공부중.
입문편은 CartPole이라는 게임을 AI가 배우고 한다.
참고 코드를 DL하고 여러가지 Fuck해 보았다.
어떤 게임
AI 학습의 모습
데모
$ python3 dqn.py
실현 방법
의사 코드
ゲーム状態初期化(state)
冒険か・推測かを決める
アクション(action)を選択する
報酬(reward)及び次の状態(new_state)を入手
上記の経験を記憶する
状態を更新(state = new_state)
記憶した経験から訓練用データを抽出
学習(推測精度を高めるようパラメータ更新)
繰り返し(アクション)
繰り返し(ゲーム)
향후 발전
$ python3 dqn.py
ゲーム状態初期化(state)
冒険か・推測かを決める
アクション(action)を選択する
報酬(reward)及び次の状態(new_state)を入手
上記の経験を記憶する
状態を更新(state = new_state)
記憶した経験から訓練用データを抽出
学習(推測精度を高めるようパラメータ更新)
繰り返し(アクション)
繰り返し(ゲーム)
Usage
$ python3 dqn.py
참고
[1] htp : // f ぅ xml. 아이 / 에 x 페리 멘 ts / 카 rt 포 /
[2] htps : // 메이 m. f 레코데카 mp. 오 rg / an-in t rose c chi-on-re-infu r semen t-u r-n g 4339519 419
[3] htps : // 케온. 이오/데에 p-q-ぇあrニンg/
Reference
이 문제에 관하여(AI에게 CartPole 게임을 즐겼다.), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/thunderz99/items/c9f68bc444d25b222773텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)