AI에게 CartPole 게임을 즐겼다.

AI에게 CartPole 게임을 즐겼다.



배경



FAQ 봇에 관해서, 「유익한가?」의 질문으로, 여러분의 Yes/No의 응답에 의해, 보다 응답의 정밀도를 올리고 싶다.

강화 학습은 상기를 대응할 수 있을 것 같다. 현재는 그 중 하나의 수법(Deep Q-learning)을 공부중.

입문편은 CartPole이라는 게임을 AI가 배우고 한다.

참고 코드를 DL하고 여러가지 Fuck해 보았다.



어떤 게임



AI 학습의 모습



데모
$ python3 dqn.py

실현 방법





의사 코드



ゲーム状態初期化(state)

    冒険か・推測かを決める

    アクション(action)を選択する

    報酬(reward)及び次の状態(new_state)を入手

    上記の経験を記憶する

    状態を更新(state = new_state)

    記憶した経験から訓練用データを抽出

    学習(推測精度を高めるようパラメータ更新)

    繰り返し(アクション)

繰り返し(ゲーム)


향후 발전


  • FAQ 봇 개선
  • 게임의 자동 플레이? ?

  • Usage


    $ python3 dqn.py
    

    참고



    [1] htp : // f ぅ xml. 아이 / 에 x 페리 멘 ts / 카 rt 포 /

    [2] htps : // 메이 m. f 레코데카 mp. 오 rg / an-in t rose c chi-on-re-infu r semen t-u r-n g 4339519 419

    [3] htps : // 케온. 이오/데에 p-q-ぇあrニンg/

    좋은 웹페이지 즐겨찾기